CN104662544A - 利用核酸存储信息的方法 - Google Patents
利用核酸存储信息的方法 Download PDFInfo
- Publication number
- CN104662544A CN104662544A CN201380038507.XA CN201380038507A CN104662544A CN 104662544 A CN104662544 A CN 104662544A CN 201380038507 A CN201380038507 A CN 201380038507A CN 104662544 A CN104662544 A CN 104662544A
- Authority
- CN
- China
- Prior art keywords
- sequence
- bit
- oligonucleotide sequence
- oligonucleotide
- information format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 150000007523 nucleic acids Chemical class 0.000 title abstract description 44
- 102000039446 nucleic acids Human genes 0.000 title abstract description 36
- 108020004707 nucleic acids Proteins 0.000 title abstract description 36
- 108091034117 Oligonucleotide Proteins 0.000 claims description 125
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 52
- 230000003321 amplification Effects 0.000 claims description 51
- 125000003729 nucleotide group Chemical group 0.000 claims description 34
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 33
- 239000002773 nucleotide Substances 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 230000000007 visual effect Effects 0.000 claims 2
- 239000003513 alkali Substances 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 53
- 238000012163 sequencing technique Methods 0.000 description 43
- 238000003752 polymerase chain reaction Methods 0.000 description 35
- 238000003860 storage Methods 0.000 description 13
- 238000002493 microarray Methods 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 239000002157 polynucleotide Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- -1 nucleoside triphosphates Chemical class 0.000 description 9
- 238000003753 real-time PCR Methods 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 239000011324 bead Substances 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 108091093088 Amplicon Proteins 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 239000002751 oligonucleotide probe Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 3
- 108091035707 Consensus sequence Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 108091028733 RNTP Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000013412 genome amplification Methods 0.000 description 3
- 238000012268 genome sequencing Methods 0.000 description 3
- 229920001519 homopolymer Polymers 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 238000011065 in-situ storage Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000005096 rolling process Methods 0.000 description 3
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- RFLVMTUMFYRZCB-UHFFFAOYSA-N 1-methylguanine Chemical compound O=C1N(C)C(N)=NC2=C1N=CN2 RFLVMTUMFYRZCB-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- SGSSKEDGVONRGC-UHFFFAOYSA-N N(2)-methylguanine Chemical compound O=C1NC(NC)=NC2=C1N=CN2 SGSSKEDGVONRGC-UHFFFAOYSA-N 0.000 description 2
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical group ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 2
- 108010066717 Q beta Replicase Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- BLRPTPMANUNPDV-UHFFFAOYSA-N Silane Chemical compound [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000007403 mPCR Methods 0.000 description 2
- 238000007857 nested PCR Methods 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- FZHAPNGMFPVSLP-UHFFFAOYSA-N silanamine Chemical group [SiH3]N FZHAPNGMFPVSLP-UHFFFAOYSA-N 0.000 description 2
- 229910000077 silane Inorganic materials 0.000 description 2
- 159000000000 sodium salts Chemical class 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- LZDYZEGISBDSDP-UHFFFAOYSA-N 2-(1-ethylaziridin-1-ium-1-yl)ethanol Chemical compound OCC[N+]1(CC)CC1 LZDYZEGISBDSDP-UHFFFAOYSA-N 0.000 description 1
- SGAKLDIYNFXTCK-UHFFFAOYSA-N 2-[(2,4-dioxo-1h-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=O)NC1=O SGAKLDIYNFXTCK-UHFFFAOYSA-N 0.000 description 1
- RGNOTKMIMZMNRX-XVFCMESISA-N 2-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-4-one Chemical compound NC1=NC(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RGNOTKMIMZMNRX-XVFCMESISA-N 0.000 description 1
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical compound CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 description 1
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 1
- GJAKJCICANKRFD-UHFFFAOYSA-N 4-acetyl-4-amino-1,3-dihydropyrimidin-2-one Chemical compound CC(=O)C1(N)NC(=O)NC=C1 GJAKJCICANKRFD-UHFFFAOYSA-N 0.000 description 1
- WPYRHVXCOQLYLY-UHFFFAOYSA-N 5-[(methoxyamino)methyl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CONCC1=CNC(=S)NC1=O WPYRHVXCOQLYLY-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- VKLFQTYNHLDMDP-PNHWDRBUSA-N 5-carboxymethylaminomethyl-2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C(CNCC(O)=O)=C1 VKLFQTYNHLDMDP-PNHWDRBUSA-N 0.000 description 1
- ZFTBZKVVGZNMJR-UHFFFAOYSA-N 5-chlorouracil Chemical compound ClC1=CNC(=O)NC1=O ZFTBZKVVGZNMJR-UHFFFAOYSA-N 0.000 description 1
- KSNXJLQDQOIRIP-UHFFFAOYSA-N 5-iodouracil Chemical compound IC1=CNC(=O)NC1=O KSNXJLQDQOIRIP-UHFFFAOYSA-N 0.000 description 1
- KELXHQACBIUYSE-UHFFFAOYSA-N 5-methoxy-1h-pyrimidine-2,4-dione Chemical compound COC1=CNC(=O)NC1=O KELXHQACBIUYSE-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- HTTVQUQAOJFACD-UHFFFAOYSA-N 6-amino-1,7-dihydropurin-2-one;2-amino-1h-pyrimidin-6-one Chemical compound NC1=NC=CC(=O)N1.N1C(=O)N=C2N=CNC2=C1N HTTVQUQAOJFACD-UHFFFAOYSA-N 0.000 description 1
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 1
- LZRCZVZMOAAFDC-UHFFFAOYSA-N 6-methyl-5-(methylamino)-1h-pyrimidine-2,4-dione Chemical compound CNC1=C(C)NC(=O)NC1=O LZRCZVZMOAAFDC-UHFFFAOYSA-N 0.000 description 1
- VKKXEIQIGGPMHT-UHFFFAOYSA-N 7h-purine-2,8-diamine Chemical compound NC1=NC=C2NC(N)=NC2=N1 VKKXEIQIGGPMHT-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 101100519158 Arabidopsis thaliana PCR2 gene Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- MIKUYHXYGGJMLM-UUOKFMHZSA-N Crotonoside Chemical compound C1=NC2=C(N)NC(=O)N=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MIKUYHXYGGJMLM-UUOKFMHZSA-N 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- HYVABZIGRDEKCD-UHFFFAOYSA-N N(6)-dimethylallyladenine Chemical compound CC(C)=CCNC1=NC=NC2=C1N=CN2 HYVABZIGRDEKCD-UHFFFAOYSA-N 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 101710124239 Poly(A) polymerase Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 239000012506 Sephacryl® Substances 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 108010059993 Vancomycin Proteins 0.000 description 1
- 229930003779 Vitamin B12 Natural products 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000014102 antigen processing and presentation of exogenous peptide antigen via MHC class I Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000007845 assembly PCR Methods 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- DMLAVOWQYNRWNQ-UHFFFAOYSA-N azobenzene Chemical compound C1=CC=CC=C1N=NC1=CC=CC=C1 DMLAVOWQYNRWNQ-UHFFFAOYSA-N 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- WQZGKKKJIJFFOK-RWOPYEJCSA-N beta-D-mannose Chemical compound OC[C@H]1O[C@@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-RWOPYEJCSA-N 0.000 description 1
- 230000003592 biomimetic effect Effects 0.000 description 1
- 125000004057 biotinyl group Chemical class [H]N1C(=O)N([H])[C@]2([H])[C@@]([H])(SC([H])([H])[C@]12[H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C(*)=O 0.000 description 1
- 231100000481 chemical toxicant Toxicity 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- FDJOLVPMNUYSCM-WZHZPDAFSA-L cobalt(3+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+3].N#[C-].N([C@@H]([C@]1(C)[N-]\C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C(\C)/C1=N/C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C\C1=N\C([C@H](C1(C)C)CCC(N)=O)=C/1C)[C@@H]2CC(N)=O)=C\1[C@]2(C)CCC(=O)NC[C@@H](C)OP([O-])(=O)O[C@H]1[C@@H](O)[C@@H](N2C3=CC(C)=C(C)C=C3N=C2)O[C@@H]1CO FDJOLVPMNUYSCM-WZHZPDAFSA-L 0.000 description 1
- 229910052681 coesite Inorganic materials 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 229910052906 cristobalite Inorganic materials 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 125000002485 formyl group Chemical class [H]C(*)=O 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- WIWYTVIDXZPFDU-UHFFFAOYSA-N methyl 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetate Chemical compound COC(=O)C(O)C1=CNC(=O)NC1=O WIWYTVIDXZPFDU-UHFFFAOYSA-N 0.000 description 1
- 238000012775 microarray technology Methods 0.000 description 1
- 230000001343 mnemonic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 229920001308 poly(aminoacid) Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229930001119 polyketide Natural products 0.000 description 1
- 125000000830 polyketide group Chemical group 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920000128 polypyrrole Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 150000003097 polyterpenes Chemical class 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 235000012239 silicon dioxide Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 229910052682 stishovite Inorganic materials 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940040944 tetracyclines Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 229910052905 tridymite Inorganic materials 0.000 description 1
- MYPYJXKWCTUITO-LYRMYLQWSA-N vancomycin Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=C2C=C3C=C1OC1=CC=C(C=C1Cl)[C@@H](O)[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@H]1C(=O)N[C@H](C(N[C@@H](C3=CC(O)=CC(O)=C3C=3C(O)=CC=C1C=3)C(O)=O)=O)[C@H](O)C1=CC=C(C(=C1)Cl)O2)=O)NC(=O)[C@@H](CC(C)C)NC)[C@H]1C[C@](C)(N)[C@H](O)[C@H](C)O1 MYPYJXKWCTUITO-LYRMYLQWSA-N 0.000 description 1
- 229960003165 vancomycin Drugs 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 239000011715 vitamin B12 Substances 0.000 description 1
- 235000019163 vitamin B12 Nutrition 0.000 description 1
- WCNMEQDMUYVWMJ-JPZHCBQBSA-N wybutoxosine Chemical compound C1=NC=2C(=O)N3C(CC([C@H](NC(=O)OC)C(=O)OC)OO)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WCNMEQDMUYVWMJ-JPZHCBQBSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K19/00—Record carriers for use with machines and with at least a part designed to carry digital markings
- G06K19/02—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the selection of materials, e.g. to avoid wear during transport through the machine
- G06K19/022—Processes or apparatus therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K19/00—Record carriers for use with machines and with at least a part designed to carry digital markings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/123—DNA computing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本发明涉及利用一个或多个核酸存储数据的方法。
Description
相关申请资料
本申请要求于2012年7月19日提交的美国临时申请号61/673,690和于2012年7月26日提交的美国临时申请号61/676,081的优先权,出于所有目的在此通过引用将它们中的每一个以其整体合并于本文中。
政府权益声明
在美国海军研究办公室N000141010144的政府资助下作出本发明。政府对本发明具有一定的权利。
技术领域
本发明总体上涉及利用一个或多个核酸序列存储信息的方法。
背景技术
1.我们的数字总体正在迅速增长。例如,于2011年产生和复制了1.8泽字节(zettabyte)(1021)的信息,并且该量每两年翻一番。参见1.“Extracting Value from Chaos”(IDC,Framingham,MA 2011);环球网站emc.com/collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf。档案数据存储通常是硬盘驱动器、光学介质、和磁带的形式,其提供5-30年的推荐的使用寿命。参见2.J.Rothenberg,Scientific American 272,42-47(1995)。随着数字信息不断积累,需要更高的密度和更长期的存储解决方案。作为用于信息存储的介质,DNA具有许多潜在的优点。参见3.C.Bancroft,T.Bowler,B.Bloom,C.T.Clelland,Science 293,1763-1765(2001)。将一般的数字信息编码成DNA的第一个实例是1988年的35位。参见7.J.Davis,Art Journal 55,70-74(1996)。近期工作涉及将数据压缩和加密成DNA(通常限于大写字母)、以及其在活细胞中的生存力。参见3、8、和9.C.Bancroft,T.Bowler,B.Bloom,C.T.Clelland,Science 293,1763-1765(2001)、C.Gustafsson,Nature 458,703(2009)、和D.G.Gibson etal.,Science 329,52-56(2010)。
发明内容
本公开内容的实施方式涉及利用核酸序列或包括核苷酸的序列作为用于信息存储的介质的方法。常见的核苷酸包括A、C、G、和T。本公开内容的方面涉及利用下一代测序和合成技术耐用、大规模读取和写入数字信息的方法,这样的方法的实例示意性地提供在图1A中。根据一个方面,将文本和/或图像转换成兆位。根据一个方面,转换成兆位的文本和/或图像包含位流(比特流,bit stream)。然后,将兆位编码成寡核苷酸。根据一个方面,寡核苷酸包括数据块序列(data block sequence)。根据一个方面,寡核苷酸包括指明数据块在位流(比特流)中的位置的地址序列(如条码序列)。根据一个方面,寡核苷酸包括在寡核苷酸的每个末端用于扩增和测序的旁侧共同序列(flanking common sequence)。根据一个方面,寡核苷酸包括数据块序列、指明数据块在位流中的位置的地址序列(如条码序列)、和在寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
根据本公开内容的一个方面,编码一位/碱基。根据该方面,可以以多种方式编码单条信息,即,对于零为A或C,对于数字1为G或T。因此,本公开内容的该方面避免难以读取或写入的序列特征如极端的GC含量(内容)、重复、或二级结构。
根据一个方面,将位流分为寻址数据块。根据该方面,可以避免难以组装的长DNA构建物。
根据一个方面,合成、存储和测序了每个单独寡核苷酸的许多拷贝。因为在合成和测序中的误差是很少一致的,所以每个分子拷贝纠正在其他拷贝中的误差。
根据一个方面,体外进行所述方法。根据该方面,体外方法避免体内方法的克隆和稳定性问题。
根据一个方面,高通量、下一代技术用于DNA合成和测序以允许对大量的信息进行编码和解码。
根据一个方面,提供了一种利用核苷酸存储信息的方法,包括:将信息格式转换成位流的多个位序列(比特序列,bit sequence),每个位序列具有对应的位条码(比特条码,bit barcode),利用一个位/碱基编码将多个位序列转换成多个对应的寡核苷酸序列,合成多个对应的寡核苷酸序列,以及存储合成的多个对应的寡核苷酸序列。根据一个方面,寡核苷酸序列包括数据块序列、指明数据块在位流中的位置的地址序列、或在寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
根据一个方面,提供了一种从编码信息格式的位序列的多个合成的寡核苷酸序列检索信息格式的方法,包括:扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,将寡核苷酸序列转换成位序列,以及将位序列转换成信息格式。根据一个方面,寡核苷酸序列包括数据块序列、指明数据块在位流中的位置的地址序列、或在寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
根据一个方面,提供了一种从编码信息格式的位序列的多个合成的寡核苷酸序列存取信息格式的方法,包括:扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,将寡核苷酸序列转换成位序列,将位序列转换成信息格式,以及使信息格式可视化(可见,visualizing)。根据一个方面,寡核苷酸序列包括数据块序列、指明数据块在位流中的位置的地址序列、或在寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
根据一个方面,提供了一种利用核苷酸存储信息的方法,包括:将信息格式转换成位流,将位序列编码成对应的寡核苷酸序列,合成寡核苷酸序列,对寡核苷酸序列进行测序,将寡核苷酸序列解码成位序列,将位序列汇编(组装,assembling)成位流以及将位流转换成信息格式。根据一个方面,寡核苷酸序列包括数据块序列、指明数据块在位流中的位置的地址序列、或在寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
提供了一种利用核苷酸存储信息的方法,包括:将第一信息格式转换成第一位流,将第一位序列编码成对应的寡核苷酸序列,合成寡核苷酸序列,对寡核苷酸序列进行测序,将寡核苷酸序列解码成第二位序列,将第二位序列汇编成第二位流以及将第二位流转换成第二信息格式。根据一个方面,寡核苷酸序列包括数据块序列、指明数据块在位流中的位置的地址序列、或在寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
根据一些方面,使用利用DNA密度的DNA存储信息。根据一些方面,在理论最大值下,在约4克的钠盐中,DNA可以编码2位/核苷酸(nt)或1.8泽字节。参见4。关于材料和方法的信息,可在科学在线(ScienceOnline)上获得。根据一些方面,用商用寡核苷酸大小和本领域技术人员已知的测序技术(48位条码+128位有效负载)可获得毫克的DNA,并且对于100x覆盖,可实现拍字节(petabyte)(1015)。可以将该量存储于1536孔板以提供艾字节(exabyte),其中一千的那些(0.5m,边立方(side cube))构成泽字节(8x 1021位)。可以将存储数据的子集以混合物存储并且通过利用正交(即,最小交叉引发)旁侧引物分别检索。参见Church GM,Kieffer-Higgins S(1988)Multiplex Sequencing;和Kosuri S,Eroshenko N,LeProust E,Super M,Way J,Li JB,Church GM(2010)A Scalable GeneSynthesis Platform Using High-Fidelity DNA Microchips.Nature Biotech.28(12):1295-9。
根据一些方面,DNA不需要用于存储的平坦表面,容易保存,并且在几千年以后已经被恢复。参见5和6。5.J.Bonnet et al.,Nucleic AcidsResearch 38,1531-1546(2010)和6.S.et al.,M.A.Uyterlinde et al.,Eds.Annual Review of Genetics 38,645-679(2004)。根据一些方面,DNA的基本的生物学作用提供进入自然的读取和写入酶,并且对于可预见的未来,确保DNA将保持可读标准。
附图说明
从说明性实施方式的以下详细描述连同附图,将更全面地理解本发明的上述和其他特征和优点,其中:
2.图1(A)是DNA信息存储的示意图。将在编码的html(超文本链接标示语言)书内的句子的12字节部分转换成具有确定编码位在整个书内的位置的19位条码(红色)的位(蓝色)。然后,利用1位/碱基编码(ac=0;TG=1)将位序列编码成DNA,同时还避免4个或更多个核苷酸重复并且平衡GC含量。整个5.27兆位html书使用54,898个寡核苷酸,并且进行合成并从DNA微芯片中洗脱。在扩增(未示出所有寡核苷酸的共同引物序列)之后,利用下一代测序来对寡核苷酸库测序。针对共有序列(consensus)筛选借助于正确的条码和长度进行的单个读取,然后重新转换到位,获得原书。总计,写入、扩增、和读取产生在5.27兆位外的10位误差(比特误差,bit error)。(B)与其他技术的比较。我们绘制了如通过报告或商用装置中编码的log10位测定的信息密度(log10位/mm3)相对于目前的可量测性。参见4。关于材料和方法的信息,可在科学在线上获得。
图2是设计的库的每个成员的观测数目的直方图。
具体实施方式
本发明涉及利用低聚物存储信息的方法。这种低聚物可以由单体形成。示例性单体包括核苷酸。示例性低聚物包括寡核苷酸。根据一个方面,提供了一种编码信息的方法,其中,将位序列转换成核苷酸序列,其中,核苷酸序列是寡核苷酸。根据一个方面,使用核酸合成的商业可获得的方法。根据一个方面,使用核酸扩增的商业可获得的方法。根据一个方面,使用核酸测序的商业可获得的方法。
根据一个方面,将一部分或多部分的信息格式,如html信息格式,如具有文本和/或图像的html书,转换成位,即0和1,并且添加位条码以形成位序列,即,如通常所理解的一系列的0和1。可以被转换成位的信息的其他格式是本领域技术人员已知的。根据一个方面,待转换成位的html信息格式的部分可以被称为字节部分。位条码可以确定编码位在整个html信息格式内的位置。然后,利用1位/碱基编码(ac=0;TG=1),将位序列转换(编码)成核苷酸序列,即寡核苷酸或DNA,以形成对应的编码寡核苷酸序列,即,寡核苷酸序列对应于或编码位序列。根据一个方面,避免了4个或更多个核苷酸重复并且平衡了GC含量。对应于部分的或整个html信息格式,产生了多个位序列。因此,产生多个对应的编码的寡核苷酸序列,其一起可以被称为库。编码的寡核苷酸序列的库表示html信息格式。然后,利用本领域技术人员已知的方法,如利用DNA微芯片,合成编码的寡核苷酸序列。然后,利用本领域技术人员已知的方法扩增合成的寡核苷酸,以形成寡核苷酸的库。然后,利用本领域技术人员已知的方法,如下一代测序方法,对寡核苷酸的库进行测序。然后,将测序的寡核苷酸转换成对应于html信息格式的位序列。利用本领域技术人员已知的方法,可以将位序列转换成信息格式。利用本领域技术人员已知的方法和装置,可以可视化或显示信息格式。
本文中使用的核酸化学、生物化学、遗传学、和分子生物学的术语和符号遵循在本领域中标准专著和文章的那些术语和符号,例如,Kombergand Baker,DNA Replication,Second Edition(W.H.Freeman,New York,1992);Lehninger,Biochemistry,Second Edition(Worth Publishers,New York,1975);Strachan and Read,Human Molecular Genetics,Second Edition(Wiley-Liss,New York,1999);Eckstein,editor,Oligonucleotides and Analogs:A Practical Approach(Oxford University Press,New York,1991);Gait,editor,Oligonucleotide Synthesis:A Practical Approach(IRL Press,Oxford,1984)等。
如在本文中使用的,根据其对于本领域技术人员通常含义理解术语“位(比特)”。术语“位”可以是“二进制数字(binary digit)”的缩写并且可以是指在计算和电信中信息的基本容量。“位”仅表示1或0(1或0)。可以在各种系统中并借助于两状态装置来实施该表示。
如在本文中使用的,术语“核酸分子”、“核酸序列”、“核酸片段”和“低聚物”可互换使用并且旨在包括但不限于可以具有各种长度的核苷酸的聚合物形式,包括脱氧核糖核苷酸或核糖核苷酸、或其类似物。用于本发明中的低聚物可以是完全设计的、部分设计的(即,部分随机的)或完全随机的。在本发明的一些方面,核酸的池包含DNA的单链90聚体。
一般而言,“扩增”包括经由引发的酶促合成的重复循环生产核酸分子的拷贝。“原位”扩增是指借助于定位在支撑物或珠子上而不是溶液中的模板核酸分子进行扩增。美国专利号6,432,360中描述了原位扩增方法。
聚合酶的不同选择与不同性能如温度、链置换、和校对共存。如以上描述的,扩增可以是等温的并且以类似的适应如通过以下描述的多重置换扩增(MDA):Dean et al.,Comprehensive human genome amplification usingmultiple displacement amplification,Proc.Natl.Acad.Sci.U.S.A.,vol.99,p.5261-5266.2002;以及Dean et al.,Rapid amplification of plasmid and phageDNA using phi29DNA polymerase and multiply-primed rolling circleamplification,Genome Res.,vol.11,p.1095-1099.2001;以及Aviel-Ronen etal.,Large fragment Bst DNA polymerase for whole genome amplification ofDNA formalin-fixed paraffin-embedded tissues,BMC Genomics,vol.7,p.312.2006。扩增还可以通过不同的温度控制(temperature regiment)进行循环,如由Mullis et al.,Specific enzymatic amplification of DNA in vitro:Thepolymerase chain reaction.Cold Spring Harbor Symp.Quant.Biol.,vole 51,p.263-273.1986所推广的传统的聚合酶链反应(PCR)。由Zhang et al.,Wholegenome amplification from a single cell:implications for genetic analysis,Proc.Natl.Acad.Sci.U.S.A.,vol.89,p.5847-5851.1992;以及Telenius et al.,Degenerate oligonucleotide-primed PCR:general amplification of target DNAby a single degenerate primer,Genomics,vol.13,p.718-725.1992描述了更适用于基因组扩增的变化。其他方法包括由Mitra and Church,In situlocalized amplification and contact replication of many individual DNAmolecules,Nuc.Acid.Res.,vole 27,pages e34.1999描述的Polony PCR;由Shendure et al.,Accurate multiplex polony sequencing of an evolved bacterialgenome,Science,vol.309,p.1728-32.2005;以及Williams et al.,Amplification of complex gene libraries by emulsion PCR,Nat.Methods,vol.3,p.545-550.2006描述的乳液PCR(ePCR)。任何扩增方法可以先验地与反转录步骤结合,以允许RNA的扩增。根据一些方面,扩增不是绝对必需的,因为探针、报道基因(报道物,reporter)和具有足够的灵敏度的检测系统可以用来允许利用所描述的模板非杂交核酸结构检测单分子。适应系统中的灵敏度的方法包括选择激发源(例如,照明)和检测(例如,光检测器、光电倍增管)。适应信号水平的方法包括允许报道基因的堆积的探针,并且还可以使用高强度报道基因(例如,量子点)。
可用于本公开内容的扩增方法可以包括使核酸与在促进杂交和链延伸的条件下特异性地杂交至核酸的一种或多种引物接触。用于扩增核酸的示例性方法包括聚合酶链反应(PCR)(参见,例如,Mullis et al.(1986)Cold Spring Harb.Symp.Quant.Biol.51Pt 1:263和Cleary et al.(2004)Nature Methods 1:241;以及美国专利号4,683,195和4,683,202),锚定PCR、RACE PCR(cDNA末端快速扩增PCR)、连接链反应(LCR)(参见,例如,Landegran et al.(1988)Science 241:1077-1080;和Nakazawa et al.(1994)Proc.Natl.Acad.Sci.U.S.A.91:360-364),自主序列复制(Guatelli et al.(1990)Proc.Natl.Acad.Sci.U.S.A.87:1874),转录扩增系统(Kwoh et al.(1989)Proc.Natl.Acad.Sci.U.S.A.86:1173),Q-β复制酶(Lizardi et al.(1988)BioTechnology 6:1197),递推PCR(Jaffe et al.(2000)J.Biol.Chem.275:2619;和Williams et al.(2002)J.Biol.Chem.277:7790),美国专利号6,391,544、6,365,375、6,294,323、6,261,797、6,124,090和5,612,199中描述的扩增方法,或利用本领域技术人员众所周知的技术的任何其他核酸扩增方法。在示例性实施方式中,本文中公开的方法采用PCR扩增。
在一些示例性实施方式中,提供了用于扩增核酸序列的方法。用于扩增核酸的示例性方法包括聚合酶链反应(PCR)(参见,例如,Mullis et al.(1986)Cold Spring Harb.Symp.Quant.Biol.51Pt 1:263和Cleary et al.(2004)Nature Methods 1:241;以及美国专利号4,683,195和4,683,202),锚定PCR、RACE PCR、连接链反应(LCR)(参见,例如,Landegran et al.(1988)Science 241:1077-1080;和Nakazawa et al.(1994)Proc.Natl.Acad.Sci.U.S.A.91:360-364),自主序列复制(Guatelli et al.(1990)Proc.Natl.Acad.Sci.U.S.A.87:1874),转录扩增系统(Kwoh et al.(1989)Proc.Natl.Acad.Sci.U.S.A.86:1173),Q-β复制酶(Lizardi et al.(1988)BioTechnology 6:1197),递推PCR(Jaffe et al.(2000)J.Biol.Chem.275:2619;和Williams et al.(2002)J.Biol.Chem.277:7790),美国专利号6,391,544、6,365,375、6,294,323、6,261,797、6,124,090和5,612,199中描述的扩增方法,等温扩增(例如,滚环扩增(RCA)、超支化滚环扩增(HRCA)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、PWGA),或利用本领域技术人员众所周知的技术的任何其他核酸扩增方法。
“聚合酶链反应”或“PCR”是指通过DNA的互补链的同时引物延伸体外扩增特定DNA序列的反应。换言之,PCR是用于制备由引物结合位点旁侧的靶核酸的多个拷贝或复制品的反应,这种反应包括以下步骤的一次或多次重复:(i)使靶核酸变性,(ii)将引物退火至引物结合位点,以及(iii)在三磷酸核苷的存在下,通过核酸聚合酶延伸引物。通常,在热循环仪中,通过对于每个步骤优化的不同的温度循环反应。特定温度、每个步骤下的持续时间、和在步骤之间的变化速率取决于本领域普通技术人员众所周知的许多因素,例如,通过参考文献举例说明:McPherson et al.,editors,PCR:A Practical Approach和PCR2:A Practical Approach(IRLPress,Oxford,分别为1991年和1995年)。例如,在利用Taq DNA聚合酶的常规PCR中,可以在高于90℃的温度下使双链靶核酸变性,在50-75℃范围内的温度下使引物退火,以及在68-78℃的温度下使引物延伸。
术语“PCR”包括反应的衍生形式,包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、装配PCR等。反应容积范围从几百纳升,例如,200nL,至几百微升,例如,200μL。“反转录PCR”或“RT-PCR”是指之前发生将靶RNA转换至随后扩增的互补的单链DNA的反转录反应的PCR,例如,Tecott等人,美国专利号5,168,038。“实时PCR”是指对于其,将反应产物即扩增子的量监测为反应进程的PCR。存在主要不同之处在于用于监测反应产物的检测化学物质的实时PCR的许多形式,例如,Gelfand等人,美国专利号5,210,015(“Taqman”);Wittwer等人,美国专利号6,174,670和6,569,627(嵌入染料(增补燃料));Tyagi等人,美国专利号5,925,517(分子信标)。Mackay et al.,Nucleic Acids Research,30:1292-1305(2002)中综述了用于实时PCR的检测化学物质。“巢式PCR”是指两步PCR,其中,利用其中的至少一种结合至第一扩增子的内部位置的一组新的引物,第一PCR的扩增子变成用于第二PCR的样品。如在本文中使用的,关于巢式扩增反应的“初始引物”是指用于产生第一扩增子的引物,以及“次级引物”是指用于产生第二或巢式扩增子的一种或多种引物。“多重PCR”是指其中在相同的反应混合物中同时进行多种靶序列(或单一靶序列和一种或多种参比序列)的PCR,例如,Bernard et al.(1999)Anal.Biochem.,273:221-228(双色实时PCR)。通常,不同组的引物用于被扩增的每种序列。“定量PCR”是指设计以测量样品或试样中的一种或多种特定靶序列的丰度的PCR。用于定量PCR的技术是本领域普通技术人员众所周知的,如以下参考文献中举例说明的:Freeman et al.,Biotechniques,26:112-126(1999);Becker-Andre et al.,Nucleic AcidsResearch,17:9437-9447(1989);Zimmerman et al.,Biotechniques,21:268-279(1996);Diviacco et al.,Gene,122:3013-3020(1992);Becker-Andre et al.,Nucleic Acids Research,17:9437-9446(1989)等。
可用于本公开内容的测序方法包括Shendure et al.,Accurate multiplexpolony sequencing of an evolved bacterial genome,Science,vol.309,p.1 728-32.2005;Drmanac et al.,Human genome sequencing using unchainedbase reads on self-assembling DNA nanoarrays,Science,vol.327,p.78-81.2009;McKernan et al.,Sequence and structural variation in a human genomeuncovered by short-read,massively parallel ligation sequencing usingtwo-base encoding,Genome Res.,vol.19,p.1527-41.2009;Rodrigue et al.,Unlocking short read sequencing for metagenomics,PLoS One,vol.28,e11840.2010;Rothberg et al.,An integrated semiconductor device enablingnon-optical genome sequencing,Nature,vol.475,p.348-352.2011;Margulieset al.,Genome sequencing in microfabricated high-density picolitre reactors,Nature,vol.437,p.376-380.2005;Rasko et al.Origins of the E.coli straincausing an outbreak of hemolytic-uremic syndrome in Germany,N.Engl.J.Med.,Epub.2011;Hutter et al.,Labeled nucleoside triphosphates withreversibly terminating aminoalkoxyl groups,Nucleos.Nucleot.Nucl.,vol.92,p.879-895.2010;Seo et al.,Four-color DNA sequencing by synthesis on achip using photocleavable fluorescent nucleotides,Proc.Natl.Acad.Sci.USA.,Vol.102,P.5926-5931(2005);Olejnik et al.;Photocleavable biotin derivatives:a versatile approach for the isolation of biomolecules,Proc.Natl.Acad.Sci.U.S.A.,vol.92,p.7590-7594.1995;US 5,750,34;US 2009/0062129和US2009/0191553。
通常,术语“核酸分子”、“核酸序列”、“核酸片段”、“寡核苷酸”和“多核苷酸”可互换使用并且旨在包括但不限于可以具有各种长度的核苷酸的聚合物形式,脱氧核糖核苷酸(DNA)或核糖核苷酸(RNA)、或其类似物。寡核苷酸通常由4个核苷酸碱基:腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、和胸腺嘧啶(T)(当多核苷酸是RNA时,尿嘧啶(U)替换胸腺嘧啶(T))的特定序列组成。因此,术语“寡核苷酸序列”是多核苷酸分子的字母表示;可替换地,术语可以应用于多核苷酸分子本身。可以将这种字母表示输入在具有中央处理单元的计算机中的数据库中并且用于生物信息学应用如功能基因组学和同源性搜索。寡核苷酸可以可选地包括一种或多种非标准的核苷酸、核苷酸类似物和/或经修饰的核苷酸。
本公开内容的实施方式包括本领域技术人员已知的天然存在的或合成的低聚物。这种低聚物包括寡核苷酸或多核苷酸(如DNA或RNA)、多肽(如胶原蛋白和万古霉素)、聚酮化合物(如脂肪和四环素)、多糖(如纤维素和淀粉)、多萜(如胆固醇和橡胶)、聚氨基酸(如木质素和聚生物碱)、多吡咯(如血红素和维生素B12)、以及聚酯(如PHA、PHV)。低聚物包括具有仿生类键的那些。参见US2008/0096253的表1。另外的低聚物包括非生物聚合物,如线性聚合物,包括聚硅氧烷、聚丙烯酰胺等。这种低聚物可以具有足够的热稳定性或易于在纳米孔或其他聚合物测序装置中检测。
经修饰的核苷酸的实例包括但不限于,二氨基嘌呤、S2T、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤(xantine)、4-乙酰胞嘧啶、5-(羧基羟基甲基)尿嘧啶、5-羧基甲基氨基甲基-2-硫代尿苷、5-羧基甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖Q核苷(beta-D-galactosylqueosine)、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫代尿嘧啶、β-D-甘露糖Q核苷、5′-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯基腺嘌呤、尿嘧啶-5-羟乙酸(v)、怀丁苷(wybutoxosine)、假尿嘧啶、Q核苷、2-硫代胞嘧啶、5-甲基-2-硫代尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-羟乙酸甲酯、尿嘧啶-5-羟乙酸(v)、5-甲基-2-硫代尿嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤等。还可以在碱基部分(例如,在通常可用于与互补核苷酸形成氢键的一个或多个原子处和/或在通常不能够与互补核苷酸形成氢键的一个或多个原子处)、糖部分或磷酸酯骨架处,修饰核酸分子。核酸分子还可以包含胺修饰基团,如氨基烯丙基-dUTP(aa-dUTP)和氨基己基丙烯酰胺-dCTP(aha-dCTP),以允许胺活性部分,如N-羟基琥珀酰亚胺酯(NHS)的共价连接。
在本公开内容的寡核苷酸中的标准DNA碱基对或RNA碱基对的替代物可以以位/立方毫米提供较高的密度、更高的安全性(耐天然毒素的偶然或有目的的合成)、更容易辨别光程序性聚合酶(photo-programmedpolymerases)、或较低的二级结构。在Betz K,Malyshev DA,Lavergne T,Welte W,Diederichs K,Dwyer TJ,Ordoukhanian P,Romesberg FE,Marx A(2012)KlenTaq polymerase replicates unnatural base pairs by inducing aWatson-Crick geometry,Nature Chem.Biol.8:612-614;Seo YJ,Malyshev DA,Lavergne T,Ordoukhanian P,Romesberg FE.J Am Chem Soc.2011Dec14;133(49):19878-88,Site-specific labeling of DNA and RNA using anefficiently replicated and transcribed class of unnatural base pairs;Switzer CY,Moroney SE,Benner SA.(1993)Biochemistry.32(39):10489-96.Enzymaticrecognition of the base pair between isocytidine and isoguanosine;YamashigeR,Kimoto M,Takezawa Y,Sato A,Mitsui T,Yokoyama S,Hirao I.NucleicAcids Res.2012Mar;40(6):2793-806.Highly specific unnatural base pairsystems as a third base pair for PCR amplification;以及Yang Z,Chen F,Alvarado JB,Benner SA.J Am Chem Soc.2011Sep 28;133(38):15105-12,Amplification,mutation,and squencing of a six-letter synthetic genetic system中描述了与用于从头和/或扩增合成的天然和突变聚合酶相容的这种替代碱基对。
已经表明以下6对(A-T、G-C、Z-P、Ds-Px、NAM-SSICS、isoC-isoG(异胞嘧啶-异鸟嘌呤))与聚合酶相容并且彼此正交(即,低水平的交叉配对)。
在一些示例性实施方式中,可以利用一种或多种亚磷酰胺连接物和/或通过本领域技术人员已知的连接法测序,制备寡核苷酸序列。还可以通过任何合适的方法制备寡核苷酸序列,例如,标准亚磷酰胺方法如以下本文中描述的那些以及由Beaucage和Carruthers((1981)Tetrahedron Lett.22:1859)描述的那些或根据Matteucci et al.(1981)J.Am.Chem.Soc.103:3185)的三酯方法,或通过本领域中已知的利用商用自动化寡核苷酸合成仪或高通量、高密度阵列方法的其他化学方法(参见美国专利号5,602,244、5,574,146、5,554,744、5,428,148、5,264,566、5,141,813、5,959,463、4,861,571和4,659,774,出于所有目的通过引用将其全部内容结合于本文中)。还可以从多种供应商商业上获得预合成的寡核苷酸。
在一些示例性实施方式中,可以利用本领域中已知的多种微阵技术制备寡核苷酸序列。预合成的寡核苷酸和/或多核苷酸序列可以连接至载体或利用以下参考文献中陈述的光引导方法、流道和点样方法、喷墨方法、基于针的方法和基于珠子的方法原位合成:McGall et al.(1996)Proc.Natl.Acad.Sci.U.S.A.93:13555;Synthetic DNA Arrays In Genetic Engineering,Vol.20:111,Plenum Press(1998);Duggan et al.(1999)Nat.Genet.S21:10;Microarrays:Making Them and Using Them In Microarray Bioinformatics,Cambridge University Press,2003;美国专利申请公开号2003/0068633和2002/0081582;美国专利号6,833,450、6,830,890、6,824,866、6,800,439、6,375,903和5,700,637;以及PCT申请号WO 04/031399、WO 04/031351、WO 04/029586、WO 03/100012、WO 03/066212、WO 03/065038、WO03/064699、WO 03/064027、WO 03/064026、WO 03/046223、WO 03/040410和WO 02/24597。
在一些示例性实施方式中,将本文描述的一种或多种寡核苷酸序列固定在载体(例如,固体和/或半固体载体)上。在一些方面,可以利用本文描述的一种或多种亚磷酰胺连接物将寡核苷酸序列连接至载体。合适的载体包括但不限于,载玻片、珠子、芯片、颗粒、线(strand)、凝胶、片、管、球体、容器、毛细管、垫、薄片、膜、板等。在各种实施方式中,固相载体可以是生物的、非生物的、有机的、无机的、或它们的任何组合。当使用基本上是平面的载体时,载体可以被物理地分成区域,例如,借助于沟、沟槽、孔、或化学障碍物(例如,疏水性涂层等)。在一些示例性实施方式中,载体是微阵列。如在本文中使用的,在一个实施方式中,术语“微阵列”是指包括具有其上存在空间上限定的各自包括固定的杂交探针的非重叠区域或部位的阵列的基本上平坦表面的固相载体的类型的阵列。“基本上平坦”是指表面上的感兴趣的特征或目的,如探针部位,可以占据在表面上方或下方延伸并且其尺寸相对于表面的尺寸较小的体积。例如,设置在光纤束的面上的珠子产生探针部位的基本上平坦的表面,或设置或合成在多孔平坦基底(基质,基板,substrate)上的寡核苷酸产生基本上平坦的表面。空间上限定的部位可以另外地是“可寻址的”,因为其位置和在该位置处固定的探针的识别是已知的或可确定的。
固定在微阵列上的寡核苷酸包括在测定反应中生成或来自测定反应的核酸。通常,在微阵列上的寡核苷酸或多核苷酸是单链的并且通常通过5′-端或3′-端共价连接至固相载体。在一些示例性实施方式中,探针经由本文描述的一种或多种可切割连接物固定。以微阵列包含核酸的非重叠区域的密度通常大于100/cm2,并且更通常地,大于1000/cm2。与核酸探针相关的微阵列技术综述于以下示例性参考文献中:Schena,Editor,Microarrays:A Practical Approach(IRL Press,Oxford,2000);Southern,Current Opin.Chem.Biol.,2:404-410(1998);Nature Genetics Supplement,21:1-60(1999);以及Fodor等人,美国专利号5,424,186、5,445,934、和5,744,305。
将寡核苷酸固定至载体的方法是本领域中已知的(珠子:Dressman etal.(2003)Proc.Natl.Acad.Sci.USA 100:8817,Brenner et al.(2000)Nat.Biotech.18:630,Albretsen et al.(1990)Anal.Biochem.189:40,and Lang et al.Nucleic Acids Res.(1988)16:10861;硝化纤维素:Ranki et al.(1983)Gene21:77;纤维素:Goldkorn(1986)Nucleic Acids Res.14:9171;聚苯乙烯:Ruth et al.(1987)Conference of Therapeutic and Diagnostic Applications ofSynthetic Nucleic Acids,Cambridge U.K.;特氟隆-丙烯酰胺:Duncan et al.(1988)Anal.Biochem.169:104;聚丙烯:Polsky-Cynkin et al.(1985)Clin.Chem.31:1438;尼龙:Van Ness et al.(1991)Nucleic Acids Res.19:3345;琼脂糖:Polsky-Cynkin et al.,Clin.Chem.(1985)31:1438;以及聚丙烯酰胺葡聚糖(sephacryl):Langdale et al.(1985)Gene 36:201;胶乳:Wolf et al.(1987)Nucleic Acids Res.15:2911)。
如在本文中使用的,术语“连接”是指共价相互作用和非共价相互作用两者。共价相互作用是在两个原子或基团之间通过共享一对电子(即,单键)、两对电子(即,双键)或三对电子(即,三键)形成的化学键。共价相互作用在本领域中还称作电子对相互作用或电子对键。非共价相互作用包括但不限于,范德华相互作用、氢键、弱化学键(即,经由短程的非共价力)、疏水相互作用、离子键等。非共价相互作用的综述可以在Alberts et al.,in Molecular Biology of the Cell,3d edition,Garland Publishing,1994中找到。
根据本公开内容的测序引物是能够结合至靶多核苷酸的已知结合区并且促进本公开内容的寡核苷酸探针的连接的那些。可以借助于计算机程序如,例如,DNAWorks、或Gene2Oligo,设计测序引物。结合区的长度可以变化,但其应足够长以杂交测序引物。靶多核苷酸可以具有多个不同的结合区,从而允许对靶多核苷酸的不同部分进行测序。选择测序引物以形成高度稳定的双链体,使得在连接的连续循环中它们保持杂交。可以选择测序引物,使得可以在5′至3′方向或3′至5′方向或在两个方向上进行连接。测序引物可以包含经修饰的核苷酸或键以增强它们的杂交效率,或改善它们的稳定性,或防止自一个末端或另一个末端的延伸。
根据一个方面,通过如以上描述的与测序引物一起使用的RCA制备单链DNA模板(ssDNA)。可替换地,将单链模板连接至乳液中的珠子或纳米颗粒,并且通过ePCR扩增。结果是具有单一扩增的ssDNA模板的克隆珠子。
为了识别多个平行模板核苷酸序列的目的,将模板在pH 7.4的PBS缓冲液中稀释,并且利用多种连接方法,如生物素-链霉亲和素、叠氮化物-烃基化物(azide-alkyle)(例如,点击化学)、NHS-酯或硅烷化(例如醛硅烷、环氧硅烷、氨基硅烷)结合至图案化或非图案化基底。根据一个方面,将克隆(rolonies)连接至图案化表面,如SiO2固体表面,用1%的氨基硅烷(v/v)处理并且允许相互作用一段时间(通常为5分钟至2小时之间)。然后,使用洗涤1缓冲液洗去任何未结合的模板。
接下来,制备测序引物并且杂交至测序引物杂交部位。根据一些方面,可以制备可以杂交至模板的已知序列的测序引物。可替换地,在模板制备期间,根据本领域技术人员已知的并且在本文中描述的方法,通过连接、扩增、转位或重组将具有已知核酸序列的连接物加入至未知的核酸序列。仍然可替换地,具有一定水平的简并的测序引物可以用于沿着模板杂交至一些位置。根据一个方面,引物简并用于允许引物沿着模板半随机地杂交。基于本领域技术人员已知的统计方法选择引物简并以促进引物沿着模板的长度以一定的间隔进行杂交。根据该方面,可以设计具有促进结合每N个碱基,如每100个碱基、每200个碱基、每2000个碱基、每100,000个碱基的一定简并性的引物。引物沿着模板的长度的结合基于引物的设计和引物设计将沿着模板的长度结合约每N个碱基的统计可能性。因为测序引物P1将通过连接延伸,所以通常合成测序引物的末端基团以准备好通过DNA连接酶共价连接至寡核苷酸探针。如果在测序引物的5′端和寡核苷酸探针的3′端之间发生连接,则磷酸基团(5′-PO4)必须存在于测序引物上同时羟基基团(3′-OH)必须存在于寡核苷酸探针上,并且反之亦然。为了将测序引物杂交至测序引物杂交部位,使用稀释在5X SSPE缓冲液中的1uM的测序引物。然后,在室温以上温育混合物几分钟以促进适当退火(在25℃和55℃之间的温度下,通常在1至5分钟之间)。
根据一些方面,可以利用本领域技术人员已知的喷墨技术、本领域技术人员已知的电化学技术、本领域技术人员已知的微流技术、本领域技术人员已知的光生酸、或本领域技术人员已知的光脱保护单体,制备寡核苷酸序列。这种技术具有以下优势:以高速、低成本、更少的有毒化学物质、增强的便携性和交错DNA生物化学(例如修饰、聚合酶、杂交等)与从头(数字或模拟)合成的能力,制备寡核苷酸。例如,直接来自照相机光学或来自数字微镜显示装置(DMD)的空间上图案化的光,可以与水溶液化学物质一起使用。参见US2003/0228611。例如,通过将偶氮苯氨基酸(参见Hoppmann C,Schmieder P,Heinrich N,Beyermann M.(2011)Chembiochem.12(17):2555-9.doi:10.1002/cbic.201100578.Epub 2011Oct13,Photoswitchable click amino acids:light control of conformation andbioactivity)结合在聚合酶或5′→3′外切核酸酶域(如果存在)的活性位点,模板非依赖性聚合酶如末端转脱氧核苷酰酶(TdT)或多(A)聚合酶,可替换地,模板依赖性聚合酶如Taq或Phi29衍生物,可以具有它们的基本聚合酶功能、碱基特异性或通过光可编程的保真度(精确度)。
光敏神经元(光遗传学)可以触发离子敏感聚合酶(参见Zamft B,Marblestone A,Kording K,Schmidt D,Martin-Alarcon D,Tyo K,Boyden E,Church GM(2012)Measuring Cation Dependent DNA Polymerase FidelityLandscapes by Deep Sequencing.PLoS One,出版中),或,对于一些应用,离子流模式本身可以构成存储的数据集。
可以在具有或不具有聚合酶扩增的情况下存储和读取从头聚合物。扩增可以经由热循环或等温循环。由于对目前的化学合成是方便的,所以扩增子可以是短的(100至200聚体),或长达1Mbp,如借助于聚合酶可实现的。
通过以下可以确定结合的核苷酸类型:a)在dNTP溶液的循环模式(图案)中,与在那个时间点下存在的特定dNTP(或rNTP或其他单体类)一致的光脉冲的交叉,b)‘笼中的’(即,可光活化的或可光灭活的)dNTP、rNTP或阳离子,c)碱基特异性、光调节位阻或构象的选择性(参见Hoppmann C,Schmieder P,Heinrich N,Beyermann M.(2011)Chembiochem.12(17):2555-9.doi:10.1002/cbic.201100578.Epub 2011Oct13.Photoswitchable click amino acids:light control of conformation andbioactivity)。多(A)聚合酶是特别有用的,因为相对于其他rNTP,其对于ATp的特异性是由于可以通过光敏氨基酸键(如偶氮苯,具有或不具有交联)模拟的构象变化。
通过不应当解释为限制性的以下实施例进一步说明本发明。出于所有目的,通过参照,将贯穿本申请引用的所有参考文献、专利和公开的专利申请的内容以它们的全部合结合于此。
实施例I
利用DNA存储写入信息
选择由Basic Books(纽约,NY)出版的称作Regenesis(Church GMand Regis E)的草稿书的HTML版本以表明现代格式、图像、和Java脚本。与典型的网页一样,使用了通用字集转换格式、8位(UTF-8)、与用于特殊字符和字体的ASCII和UNICODE向后兼容的可变宽度编码。存在黑白混合的并且JPEG编码的11个图像(在很少的质量损失下,通常为10:1数据压缩)。以base64格式,将这些“内联”嵌入(即,不分开文件)在html中。在任何这些JPEG段的中部的一致的位误差(比特误差)将仅影响在该段内的数据下游。文本中的位误差将最多影响包含误差的寡核苷酸中的12个字符。Java脚本是可以动态弯曲以跟随光标位置的37字节文本字符串(遗传密码的助记符编码)的简单显示。根据本公开内容,DNA(如其他数字媒介)可以编码用于数字计算机的可执行指令。
实施例II
将写入信息编码成DNA
将书转换到html格式(具有嵌入式jpg图像)。以位形式阅读书,并且然后将单个位转换成对于0为A或C以及对于1为T或G。随机选择碱基,同时不允许均聚物运行大于3次。位流的地址是19位长并且连续编号,从0000000000000000001开始。脚本Bits2DNA.pl(参见代码部分)是用于将html文件编码成DNA片段的程序。
实施例III
合成和扩增
在安捷伦寡核苷酸库合成微阵列平台(Agilent Oligo Library Synthesismicroarray platform)上合成了54,898个寡核苷酸。通过安捷伦洗脱DNA以产生100μL TE(10mM Tris-Cl pH 7.5,0.1mM EDTA)中的~10皮摩尔寡核苷酸的池。
如下扩增库。利用BioRad CFX96实时PCR机器中的Sybr Fast MasterMix(Kapa Biosystems),使用各自200nM的引物MD-测试-1F和MD-测试-1R用于6次循环,将1μL(预期~10飞摩尔)的库用于50μL的PCR扩增反应中,并且监测扩增期间的Sybr绿色通道。
95℃,3分钟
95℃,10秒
60℃,30秒
阅读(读取)Sybr绿色通道
转到步骤2,总共10个循环
68℃,30秒
保持在4℃下
根据制造商的说明,利用Qiagen MinElute PCR净化柱将得到的PCR产物纯化进入10μL的缓冲液EB(10mM Tris-Cl,pH 8.5)中。洗脱的DNA产生如通过NanoDrop 2000c(纳米微滴2000c)分光光度计测定的36.8ng/μL(A260/A280=1.85)的浓度。
使用相同条件但这次使用200nM的PE-PCR引物1.0-F和PE-PCR引物2.0-R,扩增两管的1μL的1:11稀释的(在水中)扩增反应9个循环。根据制造商的建议(Agencourt),利用Ampure珠子净化PCR反应以除去残余引物并且再悬浮在50μL的TE中。最终产物是~22ng/μL,如通过纳米微滴和琼脂糖凝胶成像两者所量化的。使用的引物如下,其中*表示硫代磷酸酯键。
>MD测试1-F
ACACTCTTTCCCTACACGACGCTCTTCCGATC*T
>MD测试1-R
CTCGGCATTCCTGCTGAACCGCTCTTCCGATC*T
>PE PCR引物1.0-F
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T
>PE PCR引物2.0-R
CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC*T
实施例IV
测序和处理
使用配对末端100次读数,通过将1mL的14pM库(14飞摩尔;1:1000的扩增库)负载在HiSeq 2000的单泳道上对扩增库进行测序。从泳道,我们得到具有87.14%>=Q30和34.16的平均Q得分的346,151,426百万个配对读数。因为正在对具有配对100bp读数的115bp构建物进行测序,所以SeqPrep,参见11J.St.John,SeqPrep https://github.com/jstjohn/SeqPrep(2011),用于利用以下命令(对于HiSeq泳道的单个板(tile))将重叠读取结合成单个重叠群:SeqPrep-f MTMC2_NoIndex_L006_R1_002.fastq.gz-r MTMC2_NoIndex_L006_R2_002.fastq.gz-1tile2r1.fastq.gz-2tile2r2.fastq.gz-s tile2-merged.fastq.gz-E tile2-align.txt.gz-o 50-m 0.1-n0.8。
在SeqPrep以后,形成292,371,030个重叠群。利用Bowtie2版本2.0.0-β5参见17B.Langmead,S.L.Salzberg,Nature Methods 9,357-360(2012)和SamTools版本0.1.18参见18H.Li et al.,Bioinformatics 25,2078-2079(2009),利用以下命令:zcat*merged*|bowtie2-p 10--end-to-end-x../../../agilentlib-U-|samtools view-bS->alltiles-merged.bam,将重叠群与参比对准(align)。
在对准之后,将267,993,389(92%)对准合成库的一个成员,产生4882±1261的平均覆盖(±1标准偏差)。过滤产生全长115bp重叠群的SeqPrepped重叠群,导致190,284,472个读数和3419±998的平均覆盖。平均而言,对于库的每个成员,~69.5%±0.4的读数具有全长。具有最少读数的构建物是寡核苷酸md-37545,其在115bp过滤前后具有94和9个读数;得到的共有序列对于该寡核苷酸(oligo)仍然是正确的。
图2是设计的库的每个成员的观测数目的直方图。利用箱中的并且绘制的(红色)的Bowtie2,将由SeqPrep形成的重叠群(即,在读取之间具有重叠)的所有读数对准合成的库。仅对于长度为115bp的重叠群,以绿色显示相同的信息。由分布尾来看,插入显示为放大。
实施例V
误差
从共有序列库,在总结在以下表1中的设计和读取序列之间发现差异(偏差)。如示出的,发现22个差异,其中的10个导致位误差(比特误差)(粗体)。大多数的误差(20/22)位于其中在测序期间仅存在单覆盖的序列的最后15个碱基内。此外,大多数的误差(18/22)导致至少3个连续重复核苷酸的运行。筛出4个或更多个重复核苷酸的均聚物读数(灰色框)将导致12个差异,其中7个是位误差。
表1
表1示出在设计和读取库之间的差异。每个误差是一行,显示与误差相关的条码、在寡核苷酸(在115之外)中的位置、误差类型,是否误差导致位变化、初始上下文、和新上下文(误差位置在短线的中部),以及最后是否误差导致可以已经被滤出的4个碱基的运行。导致位误差的线被粗体化,并且基于4个连续碱基的运行的可以已经被过滤的线被阴影化。
实施例VI
关于数据密度的计算
通过利用2位/单链DNA的核苷酸计算理论DNA密度。我们使用的DNA的分子量基于ATGC平衡库的钠盐的无水重量的330.95g/mol/核苷酸的平均值。这导致1位/2.75x 10-22g的重量密度,并且因此可以将1.8x1021字节存储在3.96g中。当然,根据冗余的类型、条形编码、和所期望的编码方案,实际最大值将是较少稠密的多个数量级。这种理论上的最大值计算没有用于图1B中。
图1B上绘制的数据是在非常不同的技术之间的比较。在其中未记录厚度的平面密度计算的情况下,选择100μm作为深度(这比硬驱盘小~10x,并且比目前的闪存堆积小33%)。假定了当前的信息编码密度(96位/159bp)、和在存储器中DNA的100x合成的覆盖。假定了1g/cm3(纯水的密度)的近似体积,其可能是干燥的DNA的轻微低估。
表2
表2示出了在图1B中使用的数据,以将在不同介质中的数据密度进行比较。为了将用于信息编码的截然不同的技术进行比较,通过做出各种假设,将所有数据密度信息转换成体积数据密度。对于商用技术,使用其中可获得的关于基底厚度的可获得信息。在闪存的情况下,使在类数据密度方面最好的与来自不同制造商的芯片堆积厚度结合。为了证明(演示,demonstration)数据存储技术,未报道基底厚度。因此,假定了100μm厚度,其是堆叠闪存技术的目前的厚度的1/3。对于与所有演示在4°K下和在真空中进行一样公布的那些技术,这可能是不切实际的。干燥的DNA的密度接近于水的密度,其可以是低估数据。对于使用克隆的DNA的其他生物演示,单个细胞的体积用作体积。最后,灰色行未示于图1B中,因为它们被其他数据点所遮盖,但为了完整性,包括在此。
实施例VII
代码
实施例VIII
方法总结
根据一个方面,将包括53,426个字、11个JPG图像和1个Java脚本程序的书的html编码的草稿转换成5.27兆位,参见4。关于材料和方法的信息在科学在线上可获得。然后将位编码于54,898159nt寡核苷酸上,其各自编码96位数据块(96nt),指明数据块在位流中的位置的19位地址(19nt),以及用于扩增和测序的旁侧22nt共同序列。通过喷墨印刷、高保真度DNA微芯片合成寡核苷酸库。参见10.E.M.LeProust et al.,NucleicAcids Research 38,2522-2540(2010)。为了阅读编码的书,通过有限循环PCR扩增库,并且然后在Illumina HiSeq的单泳道上测序。连接重叠的配对末端100nt读数以降低测序误差的影响。参见11.J.St.John,SeqPrephttps://github.com/jstjohn/SeqPrep(2011)。然后,仅利用产生预期的115nt长度和完美的条码序列的读数,在每个数据块的每个碱基(base)处以平均约3000倍覆盖生成共有序列。用总计10位误差(在5.27百万之外)恢复所有数据块,其主要位于在寡核苷酸的末端处的均聚物运行内,其中我们仅具有单个序列覆盖,参见4。关于材料和方法的信息在科学在线上可获得。
在100x合成覆盖下,本文公开的实施方式的密度是约5.5拍位/mm3。本文公开的实施方式的尺度是约5.27兆位。利用商业可获得的材料和仪器进行本文描述的方法步骤。图1B是示出了与其他储存介质相比,本公开内容(“本工作”)的实施方式提供了较高的信息密度的信息密度比较。根据一些方面,实施方式包括使用压缩、冗余编码、奇偶检验、和误差校正以改善密度、分布、和误差率。根据一些方面,在不存在物理隔离的情况下,还可以通过使用允许正交扩增的独特的引发位点存储DNA库。参见12.S.Kosuri et al.,Nature Biotechnology 28,1295-1299(2010)。根据一些方面,除了DNA或DNA修饰之外的聚合物也可以用于最大化读取、写入、和存储能力。参见13.S.A.Benner,Z.Yang,F.Chen,Comptes RendusChimie 14,372-387(2011)。根据一个方面,手持式、单分子DNA测序仪可以用于读取DNA编码信息。参见15.E.Pennissi,Science 336,534-537(2012)。根据一个方面,利用与库合成和共有序列测序结合的寻址数据块的一般方法与商业可获得的DNA测序和合成技术兼容。根据一个方面,DNA的可替换的消费级应用如信息存储,可以加快用于改善合成和测序技术的新技术的发展。参见16.S.Kosuri,A.M.Sismour,ACS Synth Biol 1,109-110(2012)。
出于所有目的,通过引用将本文确定的参考文献和以下参考文献以它们的全部内容合并于此,并且在整个本公开内容中通过对应的数字来提及。
3.“Extracting Value from Chaos”(IDC,Framingham,MA 2011);worldwide web site emc.com/collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf.
4.J.Rothenberg,Scientific American 272,42-47(1995).
5.C.Bancroft,T.Bowler,B.Bloom,C.T.Clelland,Science 293,1763-1765(2001).
6.Information on materials and methods is available on Science Online
7.J.Bonnet et al.,Nucleic Acids Research 38,1531-1546(2010).
8.S.et al.,M.A.Uyterlinde et al.,Eds.Annual Review of Genetics38,645-679(2004).
9.J.Davis,Art Journal 55,70-74(1996).
10.C.Gustafsson,Nature 458,703(2009).
11.D.G.Gibson et al.,Science 329,52-56(2010).
12.E.M.LeProust et al.,Nucleic Acids Research 38,2522-2540(2010).
13.J.St.John,SeqPrep https://github.com/jstjohn/SeqPrep(2011)
14.S.Kosuri et al.,Nature Biotechnology 28,1295-1299(2010).
15.S.A.Benner,Z.Yang,F.Chen,Comptes Rendus Chimie 14,372-387(2011).
16.P.A.Carr,G.M.Church,Nature Biotechnology 27,1151-62(2009).
17.E.Pennissi,Science 336,534-537(2012)
18.S.Kosuri,A.M.Sismour,ACS Synth Biol 1,109-110(2012)
19.B.Langmead,S.L.Salzberg,Nature Methods 9,357-360(2012).
20.H.Li et al.,Bioinformatics 25,2078-2079(2009).
21.Ecma International,Data interchange on read-only 120mm opticaldata disks(CD-ROM),(ECMA Standard 130,Geneva,Switzerland 1996,world wide website ecma-international.org/publications/files/ECMA-ST/Ecma-130.pdf.)
22.Ecma International,120 mm DVD-Read-Only Disk,(ECMAStandard 267,Geneva,Switzerland 2001,world wide websiteecma-international.org/publications/files/ECMA-ST/Ecma-267.pdf.)
23.Blu-Ray Disc Association,White Paper-Blu-Ray Disc Format(2ndEdition,Universal City,CA 2010,world wide websiteblu-raydisc.com/Assets/Downloadablefile/general_bluraydiscformat-15263.pdf.)
24.Oracle,StorageTek T10000 Family Tape Cartridge(Oracle,RedwoodShores,CA 2010,world wide website oracle.com/us/products/servers-storage/storage/tape-storage/033617.pdf.)
25.SanDisk,SanDisk Develops Smallest 128Gb NAND Flash MemoryChip(SanDisk,Milipitas,CA 2012,world wide websitewww.sandisk.com/about-sandisk/press-room/press-releases/2012/sandisk-develops-worlds-smallest-128gb-nand-flash-memory-chip.)
26.Toshiba,NAND Flash Memory in Multi Chip Package(Toshiba,Tokyo,Japan,2011,world wide website toshiba-components.com/memory/mcp.html.)
27.Seagate,Seagate Reaches 1Terabit Per Square Inch Milestone InHard Drive Storage With New Technology Demonstration(Seagate,Cupertino,CA 2012,world wide website seagate.com/about/newsroom/press-releases/terabit-milestone-storage-seagate-pr/?paramChannelName=newsroom.)
28.S.Loth et al.,Science 335,196-199(2010).
29.D.M.Eigler,E.K.Schweizer,Nature 344,524-526(1990).
30.C.R.Moon,L.S.Mattos,B.K.Foster,G.Zeltzer,H.C.Manoharan,Nature Nanotechnology 4,167-172(2009).
31.T.Grotjohann et al.,Nature 478,204-208(2011).
32.H.E.Kubitschek,J Bacteriol 172,94-101(1990).
33.“Screening Framework Guidance for Providers of SyntheticDouble-Stranded DNA”Federal Registrar 75,62820-62832(2010)FR DocNo:2010-25728.
等效物
对于本领域技术人员而言,其他实施方式将是显而易见的。应当理解的是,提供上述描述仅为了清楚并且仅是示例性的。本发明的精神和范围并不限于以上实施例,而是由权利要求所涵盖。出于所有目的,通过引用将以上引用的所有出版物、专利和专利申请以它们的整体合并于此,至如同通过引用将每个单独的出版物或专利申请具体指定如此合并的相同的程度。
Claims (16)
1.一种利用核苷酸存储信息的方法,包括:
将信息格式转换成位流的多个位序列,每个位序列具有对应的位条码,
利用一个位/碱基编码将所述多个位序列转换成多个对应的寡核苷酸序列,
合成所述多个对应的寡核苷酸序列,以及
存储合成的所述多个对应的寡核苷酸序列。
2.根据权利要求1所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在所述位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
3.一种从编码信息格式的位序列的多个合成的寡核苷酸序列检索所述信息格式的方法,包括:
扩增多个寡核苷酸序列,
对扩增的所述寡核苷酸序列进行测序,
将所述寡核苷酸序列转换成位序列,以及
将所述位序列转换成所述信息格式。
4.根据权利要求3所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
5.一种从编码信息格式的位序列的多个合成的寡核苷酸序列存取所述信息格式的方法,包括:
扩增多个寡核苷酸序列,
对扩增的所述寡核苷酸序列进行测序,
将所述寡核苷酸序列转换成位序列,
将所述位序列转换成所述信息格式,以及
使所述信息格式可视化。
6.根据权利要求5所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
7.一种利用核苷酸存储信息的方法,包括将信息格式转换成位流,将第一位序列编码成对应的寡核苷酸序列,合成所述寡核苷酸序列,对所述寡核苷酸序列进行测序,将所述寡核苷酸序列解码成位序列,将所述位序列汇编成位流以及将所述位流转换成所述信息格式。
8.根据权利要求7所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在所述位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
9.一种利用核苷酸存储信息的方法,包括将信息格式转换成第一位流,将第一位序列编码成对应的寡核苷酸序列,合成所述寡核苷酸序列,对所述寡核苷酸序列进行测序,将所述寡核苷酸序列解码成第二位序列,将所述第二位序列汇编成第二位流以及将所述第二位流转换成所述信息格式。
10.根据权利要求9所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在所述位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
11.一种利用核苷酸存储信息的方法,包括将第一信息格式转换成第一位流,将第一位序列编码成对应的寡核苷酸序列,合成所述寡核苷酸序列,对所述寡核苷酸序列进行测序,将所述寡核苷酸序列解码成第二位序列,将所述第二位序列汇编成第二位流以及将所述第二位流转换成第二信息格式。
12.根据权利要求11所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在所述位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
13.一种从编码信息格式的位序列的多个合成的寡核苷酸序列检索所述信息格式的方法,包括:
对扩增的所述寡核苷酸序列进行测序,
将所述寡核苷酸序列转换成位序列,以及
将所述位序列转换成所述信息格式。
14.根据权利要求13所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
15.一种从编码信息格式的位序列的多个合成的寡核苷酸序列存取所述信息格式的方法,包括:
对扩增的所述寡核苷酸序列进行测序,
将所述寡核苷酸序列转换成位序列,
将所述位序列转换成所述信息格式,以及
使所述信息格式可视化。
16.根据权利要求15所述的方法,其中,所述寡核苷酸序列包括数据块序列、指明所述数据块在位流中的位置的地址序列、或在所述寡核苷酸的每个末端用于扩增和测序的旁侧共同序列中的一种或多种或全部。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810747946.2A CN108875312A (zh) | 2012-07-19 | 2013-07-17 | 利用核酸存储信息的方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261673690P | 2012-07-19 | 2012-07-19 | |
US61/673,690 | 2012-07-19 | ||
US201261676081P | 2012-07-26 | 2012-07-26 | |
US61/676,081 | 2012-07-26 | ||
PCT/US2013/050815 WO2014014991A2 (en) | 2012-07-19 | 2013-07-17 | Methods of storing information using nucleic acids |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810747946.2A Division CN108875312A (zh) | 2012-07-19 | 2013-07-17 | 利用核酸存储信息的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104662544A true CN104662544A (zh) | 2015-05-27 |
CN104662544B CN104662544B (zh) | 2018-08-03 |
Family
ID=49029160
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810747946.2A Pending CN108875312A (zh) | 2012-07-19 | 2013-07-17 | 利用核酸存储信息的方法 |
CN201380038507.XA Active CN104662544B (zh) | 2012-07-19 | 2013-07-17 | 利用核酸存储信息的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810747946.2A Pending CN108875312A (zh) | 2012-07-19 | 2013-07-17 | 利用核酸存储信息的方法 |
Country Status (10)
Country | Link |
---|---|
US (6) | US9384320B2 (zh) |
EP (1) | EP2875458A2 (zh) |
JP (1) | JP6089106B2 (zh) |
KR (1) | KR101743846B1 (zh) |
CN (2) | CN108875312A (zh) |
AU (1) | AU2013292709B2 (zh) |
CA (1) | CA2878042C (zh) |
HK (1) | HK1210848A1 (zh) |
IN (1) | IN2015DN01001A (zh) |
WO (1) | WO2014014991A2 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798219A (zh) * | 2016-08-30 | 2018-03-13 | 清华大学 | 将数据进行生物存储并还原的方法 |
CN108026557A (zh) * | 2015-07-13 | 2018-05-11 | 哈佛学院董事及会员团体 | 使用核酸用于可检索信息储存的方法 |
WO2018149405A1 (zh) * | 2017-02-17 | 2018-08-23 | 苏州泓迅生物科技股份有限公司 | 信息存储和读取的方法 |
WO2019080653A1 (zh) * | 2017-10-25 | 2019-05-02 | 深圳华大生命科学研究院 | 编码/解码方法、编码/解码器和存储方法、装置 |
WO2019196439A1 (en) * | 2018-04-13 | 2019-10-17 | The Hong Kong Polytechnic University | Data storage using peptides |
CN111489791A (zh) * | 2020-04-07 | 2020-08-04 | 中国科学院重庆绿色智能技术研究院 | 固态纳米孔高密度编码dna数字存储读取方法 |
CN112288089A (zh) * | 2020-09-28 | 2021-01-29 | 清华大学 | 阵列式核酸信息存储方法及装置 |
US11900191B2 (en) | 2012-07-19 | 2024-02-13 | President And Fellows Of Harvard College | Methods of storing information using nucleic acids |
Families Citing this family (89)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013269536B2 (en) | 2012-06-01 | 2018-11-08 | European Molecular Biology Laboratory | High-capacity storage of digital information in DNA |
TWI646230B (zh) | 2013-08-05 | 2019-01-01 | 扭轉生物科技有限公司 | 重新合成之基因庫 |
EP3080300B1 (en) | 2013-12-11 | 2020-09-02 | Genapsys Inc. | Systems and methods for biological analysis and computation |
WO2016126882A1 (en) | 2015-02-04 | 2016-08-11 | Twist Bioscience Corporation | Methods and devices for de novo oligonucleic acid assembly |
US11164661B2 (en) | 2015-04-10 | 2021-11-02 | University Of Washington | Integrated system for nucleic acid-based storage and retrieval of digital data using keys |
US9981239B2 (en) | 2015-04-21 | 2018-05-29 | Twist Bioscience Corporation | Devices and methods for oligonucleic acid library synthesis |
EP3098742A1 (en) * | 2015-05-26 | 2016-11-30 | Thomson Licensing | Method and apparatus for creating a plurality of oligos with a targeted distribution of nucleotide types |
US10423341B1 (en) * | 2015-06-12 | 2019-09-24 | Bahram Ghaffarzadeh Kermani | Accurate and efficient DNA-based storage of electronic data |
CA3176469A1 (en) * | 2015-07-27 | 2017-02-02 | Illumina, Inc. | Spatial mapping of nucleic acid sequence information |
CA2998169A1 (en) | 2015-09-18 | 2017-03-23 | Twist Bioscience Corporation | Oligonucleic acid variant libraries and synthesis thereof |
KR20180058772A (ko) | 2015-09-22 | 2018-06-01 | 트위스트 바이오사이언스 코포레이션 | 핵산 합성을 위한 가요성 기판 |
EP3163512A1 (en) * | 2015-10-30 | 2017-05-03 | Thomson Licensing | Data processing apparatus and method for recovering a correct code symbol sequence from multiple incorrect copies |
US10566077B1 (en) | 2015-11-19 | 2020-02-18 | The Board Of Trustees Of The University Of Illinois | Re-writable DNA-based digital storage with random access |
EP3173961A1 (en) * | 2015-11-27 | 2017-05-31 | Thomson Licensing | Method for storing user data and decoding information in synthesized oligos, apparatus and substance |
WO2017095958A1 (en) | 2015-12-01 | 2017-06-08 | Twist Bioscience Corporation | Functionalized surfaces and preparation thereof |
US10640822B2 (en) | 2016-02-29 | 2020-05-05 | Iridia, Inc. | Systems and methods for writing, reading, and controlling data stored in a polymer |
US10859562B2 (en) | 2016-02-29 | 2020-12-08 | Iridia, Inc. | Methods, compositions, and devices for information storage |
US10438662B2 (en) | 2016-02-29 | 2019-10-08 | Iridia, Inc. | Methods, compositions, and devices for information storage |
US20170253871A1 (en) * | 2016-03-04 | 2017-09-07 | University-Industry Foundation, Yonsei University | Method of preparing oligonucleotide pool using one oligonucleotide |
US20190102515A1 (en) * | 2016-03-08 | 2019-04-04 | Thomson Licensing | Method and device for decoding data segments derived from oligonucleotides and related sequencer |
WO2017184677A1 (en) * | 2016-04-21 | 2017-10-26 | President And Fellows Of Harvard College | Method and system of nanopore-based information encoding |
WO2017189794A1 (en) * | 2016-04-27 | 2017-11-02 | President And Fellows Of Harvard College | Method of secure communication via nucleotide polymers |
US11359234B2 (en) | 2016-07-01 | 2022-06-14 | Microsoft Technology Licensing, Llc | Barcoding sequences for identification of gene expression |
ES2817973T3 (es) | 2016-07-01 | 2021-04-08 | Microsoft Technology Licensing Llc | Almacenamiento a través de la edición iterativa del ADN |
US10892034B2 (en) | 2016-07-01 | 2021-01-12 | Microsoft Technology Licensing, Llc | Use of homology direct repair to record timing of a molecular event |
CA3034769A1 (en) | 2016-08-22 | 2018-03-01 | Twist Bioscience Corporation | De novo synthesized nucleic acid libraries |
US20180068059A1 (en) * | 2016-09-08 | 2018-03-08 | Sap Se | Malicious sequence detection for gene synthesizers |
WO2018057526A2 (en) | 2016-09-21 | 2018-03-29 | Twist Bioscience Corporation | Nucleic acid based data storage |
US10370246B1 (en) * | 2016-10-20 | 2019-08-06 | The Board Of Trustees Of The University Of Illinois | Portable and low-error DNA-based data storage |
IL266197B2 (en) | 2016-10-24 | 2024-03-01 | Geneinfosec Inc | Hiding information contained within nucleic acids |
US10650312B2 (en) | 2016-11-16 | 2020-05-12 | Catalog Technologies, Inc. | Nucleic acid-based data storage |
KR20230074828A (ko) * | 2016-11-16 | 2023-05-31 | 카탈로그 테크놀로지스, 인크. | 핵산-기반 데이터 저장 |
US11783918B2 (en) | 2016-11-30 | 2023-10-10 | Microsoft Technology Licensing, Llc | DNA random access storage system via ligation |
CN110366613A (zh) | 2016-12-16 | 2019-10-22 | 特韦斯特生物科学公司 | 免疫突触的变体文库及其合成 |
US10839948B2 (en) | 2016-12-29 | 2020-11-17 | Intel Corporation | Microfluidic information-encoding polymer data storage |
US10793897B2 (en) | 2017-02-08 | 2020-10-06 | Microsoft Technology Licensing, Llc | Primer and payload design for retrieval of stored polynucleotides |
CN110892485B (zh) * | 2017-02-22 | 2024-03-22 | 特韦斯特生物科学公司 | 基于核酸的数据存储 |
US10894959B2 (en) | 2017-03-15 | 2021-01-19 | Twist Bioscience Corporation | Variant libraries of the immunological synapse and synthesis thereof |
US10774379B2 (en) | 2017-03-15 | 2020-09-15 | Microsoft Technology Licensing, Llc | Random access of data encoded by polynucleotides |
WO2018217689A1 (en) * | 2017-05-22 | 2018-11-29 | The Charles Stark Draper Laboratory, Inc. | Modified template-independent dna polymerase |
KR102583062B1 (ko) * | 2017-05-31 | 2023-09-25 | 몰레큘러 어셈블리즈, 인크. | 동종중합체 인코딩된 핵산 메모리 |
WO2018231864A1 (en) | 2017-06-12 | 2018-12-20 | Twist Bioscience Corporation | Methods for seamless nucleic acid assembly |
GB2578844A (en) | 2017-06-12 | 2020-05-27 | Twist Bioscience Corp | Methods for seamless nucleic acid assembly |
CN109300508B (zh) * | 2017-07-25 | 2020-08-11 | 南京金斯瑞生物科技有限公司 | 一种dna数据存储编码解码方法 |
EA202090562A1 (ru) | 2017-09-11 | 2020-08-10 | Твист Байосайенс Корпорейшн | Связывающие gpcr белки и их синтез |
US11538554B1 (en) | 2017-09-19 | 2022-12-27 | The Board Of Trustees Of The Univ Of Illinois | Nick-based data storage in native nucleic acids |
KR102717872B1 (ko) * | 2017-10-10 | 2024-10-14 | 로스웰 엠이 아이엔씨. | 무증폭 dna 데이터 저장을 위한 방법, 장치 및 시스템 |
KR102637566B1 (ko) | 2017-10-20 | 2024-02-16 | 트위스트 바이오사이언스 코포레이션 | 폴리뉴클레오타이드 합성을 위한 가열된 나노웰 |
EP3682449A1 (en) * | 2017-10-27 | 2020-07-22 | ETH Zurich | Encoding and decoding information in synthetic dna with cryptographic keys generated based on polymorphic features of nucleic acids |
EP3506135A1 (en) | 2017-12-29 | 2019-07-03 | IMEC vzw | Method for writing data |
IL275818B2 (en) | 2018-01-04 | 2024-10-01 | Twist Bioscience Corp | Dna-based digital information storage |
KR20200132921A (ko) | 2018-03-16 | 2020-11-25 | 카탈로그 테크놀로지스, 인크. | 핵산-기반 데이터를 저장하기 위한 화학적 방법들 |
EP3542903A1 (en) | 2018-03-22 | 2019-09-25 | IMEC vzw | Memory writing |
KR102138864B1 (ko) * | 2018-04-11 | 2020-07-28 | 경희대학교 산학협력단 | Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법 |
EP3794598A1 (en) | 2018-05-16 | 2021-03-24 | Catalog Technologies, Inc. | Compositions and methods for nucleic acid-based data storage |
WO2019222650A1 (en) * | 2018-05-17 | 2019-11-21 | The Charles Stark Draper Laboratory, Inc. | Apparatus for high density information storage in molecular chains |
SG11202011467RA (en) | 2018-05-18 | 2020-12-30 | Twist Bioscience Corp | Polynucleotides, reagents, and methods for nucleic acid hybridization |
US11531934B2 (en) * | 2018-05-31 | 2022-12-20 | Kyndryl, Inc. | Machine learning (ML) modeling by DNA computing |
CN112449716A (zh) | 2018-06-07 | 2021-03-05 | 非营利性组织佛兰芒综合大学生物技术研究所 | 一种使用dna分子存储信息的方法 |
US11093547B2 (en) * | 2018-06-19 | 2021-08-17 | Intel Corporation | Data storage based on encoded DNA sequences |
EP3826762A1 (en) * | 2018-07-23 | 2021-06-02 | DNA Script | Massively parallel enzymatic synthesis of nucleic acid strands |
US11854669B1 (en) | 2018-07-30 | 2023-12-26 | National Technology & Engineering Solutions Of Sandia, Llc | Synthetic nucleic acids for information storage and transmission |
US20200063119A1 (en) * | 2018-08-22 | 2020-02-27 | Massachusetts Institute Of Technology | In vitro dna writing for information storage |
US11017170B2 (en) | 2018-09-27 | 2021-05-25 | At&T Intellectual Property I, L.P. | Encoding and storing text using DNA sequences |
CN109460822B (zh) * | 2018-11-19 | 2021-11-12 | 天津大学 | 基于dna的信息存储方法 |
EP3904527A4 (en) * | 2018-12-26 | 2022-08-10 | BGI Shenzhen | METHOD AND DEVICE FOR FIXED POINT EDITING OF A NUCLEO TIDE SEQUENCE STORED WITH DATA |
KR20210143766A (ko) | 2019-02-26 | 2021-11-29 | 트위스트 바이오사이언스 코포레이션 | Glp1 수용체에 대한 변이체 핵산 라이브러리 |
CA3131691A1 (en) | 2019-02-26 | 2020-09-03 | Twist Bioscience Corporation | Variant nucleic acid libraries for antibody optimization |
EP3966823A1 (en) | 2019-05-09 | 2022-03-16 | Catalog Technologies, Inc. | Data structures and operations for searching, computing, and indexing in dna-based data storage |
GB201907460D0 (en) | 2019-05-27 | 2019-07-10 | Vib Vzw | A method of storing information in pools of nucleic acid molecules |
WO2020257612A1 (en) | 2019-06-21 | 2020-12-24 | Twist Bioscience Corporation | Barcode-based nucleic acid sequence assembly |
US11939570B2 (en) | 2019-08-20 | 2024-03-26 | Seagate Technology Llc | Microfluidic lab-on-a-chip for gene synthesis |
EP4022300A1 (en) | 2019-08-27 | 2022-07-06 | President and Fellows of Harvard College | Modifying messages stored in mixtures of molecules using thin-layer chromatography |
US20210074380A1 (en) * | 2019-09-05 | 2021-03-11 | Microsoft Technology Licensing, Llc | Reverse concatenation of error-correcting codes in dna data storage |
AU2020355027A1 (en) | 2019-09-23 | 2022-04-21 | Twist Bioscience Corporation | Antibodies that bind CD3 Epsilon |
AU2020356471A1 (en) | 2019-09-23 | 2022-04-21 | Twist Bioscience Corporation | Variant nucleic acid libraries for CRTH2 |
JP2022549498A (ja) * | 2019-09-27 | 2022-11-25 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 分子の混合物を使用した情報の記憶 |
US11535842B2 (en) | 2019-10-11 | 2022-12-27 | Catalog Technologies, Inc. | Nucleic acid security and authentication |
US11755640B2 (en) * | 2019-12-20 | 2023-09-12 | The Board Of Trustees Of The University Of Illinois | DNA-based image storage and retrieval |
JP2023526017A (ja) | 2020-05-11 | 2023-06-20 | カタログ テクノロジーズ, インコーポレイテッド | Dnaベースのデータ記憶におけるプログラムおよび機能 |
WO2022015513A2 (en) * | 2020-07-13 | 2022-01-20 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods to assess rna stability |
US11837302B1 (en) | 2020-08-07 | 2023-12-05 | Iridia, Inc. | Systems and methods for writing and reading data stored in a polymer using nano-channels |
WO2022047427A2 (en) | 2020-08-31 | 2022-03-03 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for producing rna constructs with increased translation and stability |
CN112079893B (zh) * | 2020-09-23 | 2022-05-03 | 南京原码科技合伙企业(有限合伙) | 一种基于固相化学合成法合成dna存储所需文本的方法 |
US11990184B2 (en) | 2020-09-24 | 2024-05-21 | Seagate Technology Llc | DNA backbone editing for DNA data storage |
US11823065B2 (en) | 2021-05-28 | 2023-11-21 | Bank Of America Corporation | Enterprise market volatility predictions through synthetic DNA and mutant nucleotides |
US11823064B2 (en) | 2021-05-28 | 2023-11-21 | Bank Of America Corporation | Enterprise market volatility prediction through synthetic DNA and mutant nucleotides |
US11823066B2 (en) | 2021-05-28 | 2023-11-21 | Bank Of America Corporation | Enterprise market volatility predictions through synthetic DNA and mutant nucleotides |
WO2024076044A1 (ko) * | 2022-10-06 | 2024-04-11 | 이근우 | Dna 인코딩 및 디코딩 방법 및 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003025123A2 (en) * | 2001-08-28 | 2003-03-27 | Mount Sinai School Of Medecine | Dna: a medium for long-term information storage specification |
CN1526015A (zh) * | 2001-05-11 | 2004-09-01 | ���µ�����ҵ��ʽ���� | 生物分子基底,使用它的检验和诊断方法及装置 |
WO2004088585A2 (en) * | 2003-03-31 | 2004-10-14 | Council Of Scientific And Industrial Research | A method for storing information in dna |
CN101965410A (zh) * | 2008-02-27 | 2011-02-02 | 霍夫曼-拉罗奇有限公司 | 用于产生可测序文库的改进的核酸处理的系统和方法 |
US20110119778A1 (en) * | 2007-11-30 | 2011-05-19 | Michael Liss | Steganographic embedding of information in coding genes |
Family Cites Families (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US575034A (en) | 1897-01-12 | Charles nicolas leroy | ||
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
JPH0672011B2 (ja) | 1985-09-20 | 1994-09-14 | 東ソー株式会社 | 合成モルデナイト成形体の製造方法 |
US4959463A (en) | 1985-10-15 | 1990-09-25 | Genentech, Inc. | Intermediates |
US4659774A (en) | 1985-11-01 | 1987-04-21 | American Hoechst Corporation | Support for solid-phase oligonucleotide synthesis |
US5700637A (en) | 1988-05-03 | 1997-12-23 | Isis Innovation Limited | Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays |
US5602244A (en) | 1988-05-26 | 1997-02-11 | Competitive Technologies, Inc. | Polynucleotide phosphorodithioate compounds |
US5168038A (en) | 1988-06-17 | 1992-12-01 | The Board Of Trustees Of The Leland Stanford Junior University | In situ transcription in cells and tissues |
ATE142272T1 (de) | 1989-01-19 | 1996-09-15 | Behringwerke Ag | Nukleinsäure-amplifikation unter verwendung eines einzelprimers |
US5424186A (en) | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5141813A (en) | 1989-08-28 | 1992-08-25 | Clontech Laboratories, Inc. | Multifunctional controlled pore glass reagent for solid phase oligonucleotide synthesis |
US5210015A (en) | 1990-08-06 | 1993-05-11 | Hoffman-La Roche Inc. | Homogeneous assay system using the nuclease activity of a nucleic acid polymerase |
US5612199A (en) | 1991-10-11 | 1997-03-18 | Behringwerke Ag | Method for producing a polynucleotide for use in single primer amplification |
US5428148A (en) | 1992-04-24 | 1995-06-27 | Beckman Instruments, Inc. | N4 - acylated cytidinyl compounds useful in oligonucleotide synthesis |
US6294323B1 (en) | 1993-04-14 | 2001-09-25 | Behringwerke Ag | Self initiating single primer amplification of nucleic acids |
US5925517A (en) | 1993-11-12 | 1999-07-20 | The Public Health Research Institute Of The City Of New York, Inc. | Detectably labeled dual conformation oligonucleotide probes, assays and kits |
US5574146A (en) | 1994-08-30 | 1996-11-12 | Beckman Instruments, Inc. | Oligonucleotide synthesis with substituted aryl carboxylic acids as activators |
US5554744A (en) | 1994-09-23 | 1996-09-10 | Hybridon, Inc. | Method for loading solid supports for nucleic acid synthesis |
US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
US6261797B1 (en) | 1996-01-29 | 2001-07-17 | Stratagene | Primer-mediated polynucleotide synthesis and manipulation techniques |
US5917031A (en) * | 1996-04-19 | 1999-06-29 | Taiko Pharmaceutical Co., Ltd. | Method of synthesizing polydeoxyribonucleotides |
DE69735313T2 (de) | 1996-06-04 | 2006-11-02 | University Of Utah Research Foundation, Salt Lake City | Fluoreszenz-Donor-Akzeptor Paar |
JPH10253701A (ja) | 1997-03-10 | 1998-09-25 | Mitsubishi Electric Corp | 半導体試験装置 |
JP2001519538A (ja) | 1997-10-10 | 2001-10-23 | プレジデント・アンド・フェローズ・オブ・ハーバード・カレッジ | 核酸アレイのレプリカ増幅 |
US6426184B1 (en) | 1998-02-11 | 2002-07-30 | The Regents Of The University Of Michigan | Method and apparatus for chemical and biochemical reactions using photo-generated reagents |
MXPA00008263A (es) | 1998-02-23 | 2002-04-24 | Wisconsin Alumni Res Found | Sintesis de disposicion de sondas de adn. |
DE19813317A1 (de) | 1998-03-26 | 1999-09-30 | Roche Diagnostics Gmbh | Verbessertes Verfahren zur Primer Extension Präamplifikations-PCR |
US6391544B1 (en) | 1998-05-15 | 2002-05-21 | Abbott Laboratories | Method for using unequal primer concentrations for generating nucleic acid amplification products |
US6824866B1 (en) | 1999-04-08 | 2004-11-30 | Affymetrix, Inc. | Porous silica substrates for polymer synthesis and assays |
DE60032259D1 (de) * | 1999-05-06 | 2007-01-18 | Sinai School Medicine | Steganographie auf DNA basis |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US6800439B1 (en) | 2000-01-06 | 2004-10-05 | Affymetrix, Inc. | Methods for improved array preparation |
US6833450B1 (en) | 2000-03-17 | 2004-12-21 | Affymetrix, Inc. | Phosphite ester oxidation in nucleic acid array preparation |
US6966945B1 (en) | 2000-09-20 | 2005-11-22 | Goodrich Corporation | Inorganic matrix compositions, composites and process of making the same |
IL158487A0 (en) | 2001-05-18 | 2004-05-12 | Wisconsin Alumni Res Found | Method for the synthesis of dna sequences |
WO2003040410A1 (en) | 2001-11-02 | 2003-05-15 | Nimblegen Systems, Inc. | Detection of hybridization oligonucleotide microarray through covalently labeling microarray probe |
US20030099952A1 (en) | 2001-11-26 | 2003-05-29 | Roland Green | Microarrays with visible pattern detection |
GB0201966D0 (en) | 2002-01-29 | 2002-03-13 | Smartwater Ltd | Improvements in or relating to security products |
US7157229B2 (en) | 2002-01-31 | 2007-01-02 | Nimblegen Systems, Inc. | Prepatterned substrate for optical synthesis of DNA probes |
US7037659B2 (en) | 2002-01-31 | 2006-05-02 | Nimblegen Systems Inc. | Apparatus for constructing DNA probes having a prismatic and kaleidoscopic light homogenizer |
US7422851B2 (en) | 2002-01-31 | 2008-09-09 | Nimblegen Systems, Inc. | Correction for illumination non-uniformity during the synthesis of arrays of oligomers |
US20040126757A1 (en) | 2002-01-31 | 2004-07-01 | Francesco Cerrina | Method and apparatus for synthesis of arrays of DNA probes |
US7083975B2 (en) | 2002-02-01 | 2006-08-01 | Roland Green | Microarray synthesis instrument and method |
US20030228611A1 (en) | 2002-05-01 | 2003-12-11 | President And Fellows Of Harvard College | Nucleic acid memory device |
US20040060987A1 (en) * | 2002-05-07 | 2004-04-01 | Green Larry R. | Digital image analysis method for enhanced and optimized signals in fluorophore detection |
WO2003100012A2 (en) | 2002-05-24 | 2003-12-04 | Nimblegen Systems, Inc. | Microarrays and method for running hybridization reaction for multiple samples on a single microarray |
US20040001371A1 (en) | 2002-06-26 | 2004-01-01 | The Arizona Board Of Regents On Behalf Of The University Of Arizona | Information storage and retrieval device using macromolecules as storage media |
US7158892B2 (en) | 2002-06-28 | 2007-01-02 | International Business Machines Corporation | Genomic messaging system |
AU2003270898A1 (en) | 2002-09-27 | 2004-04-19 | Nimblegen Systems, Inc. | Microarray with hydrophobic barriers |
DE10393406T5 (de) | 2002-09-30 | 2005-12-22 | Nimblegen Systems, Inc., Madison | Parallele Beladung von Arrays |
US20040101894A1 (en) | 2002-10-01 | 2004-05-27 | Thomas Albert | Microarrays having multiple oligonucleotides in single array features |
JP4102157B2 (ja) | 2002-10-17 | 2008-06-18 | 正幸 園部 | 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ |
US7628096B2 (en) | 2004-03-25 | 2009-12-08 | Teleflex Corporated | Pedal mount assembly |
CA2570171A1 (en) | 2004-06-09 | 2005-12-29 | Alexander Sunguroff | Methods of making nanotechnological and macromolecular biomimetic structures |
US7874489B2 (en) * | 2005-06-20 | 2011-01-25 | Authentiform Technologies, Llc | Product authentication |
WO2007002009A2 (en) * | 2005-06-20 | 2007-01-04 | Johnson & Johnson | Product authentication |
US20070113137A1 (en) | 2005-10-22 | 2007-05-17 | Ho Seung Ryu | Error Correction in Binary-encoded DNA Using Linear Feedback Shift Registers |
US20090062129A1 (en) | 2006-04-19 | 2009-03-05 | Agencourt Personal Genomics, Inc. | Reagents, methods, and libraries for gel-free bead-based sequencing |
JP5745842B2 (ja) | 2007-06-19 | 2015-07-08 | ストラトス ゲノミクス インコーポレイテッド | 拡張によるハイスループット核酸配列決定 |
WO2009046149A1 (en) | 2007-10-01 | 2009-04-09 | Applied Biosystems Inc. | Chase ligation sequencing |
AU2013269536B2 (en) | 2012-06-01 | 2018-11-08 | European Molecular Biology Laboratory | High-capacity storage of digital information in DNA |
KR101743846B1 (ko) | 2012-07-19 | 2017-06-05 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵산을 이용하여 정보를 저장하는 방법 |
-
2013
- 2013-07-17 KR KR1020157000931A patent/KR101743846B1/ko not_active Application Discontinuation
- 2013-07-17 CN CN201810747946.2A patent/CN108875312A/zh active Pending
- 2013-07-17 CA CA2878042A patent/CA2878042C/en active Active
- 2013-07-17 JP JP2015523204A patent/JP6089106B2/ja active Active
- 2013-07-17 US US14/415,014 patent/US9384320B2/en active Active
- 2013-07-17 AU AU2013292709A patent/AU2013292709B2/en active Active
- 2013-07-17 EP EP13752699.2A patent/EP2875458A2/en not_active Ceased
- 2013-07-17 WO PCT/US2013/050815 patent/WO2014014991A2/en active Application Filing
- 2013-07-17 CN CN201380038507.XA patent/CN104662544B/zh active Active
-
2015
- 2015-02-06 IN IN1001DEN2015 patent/IN2015DN01001A/en unknown
- 2015-11-26 HK HK15111645.9A patent/HK1210848A1/zh unknown
-
2016
- 2016-06-07 US US15/175,430 patent/US9996778B2/en active Active
-
2018
- 2018-05-03 US US15/970,257 patent/US10460220B2/en active Active
-
2019
- 2019-10-02 US US16/590,809 patent/US20200272872A1/en not_active Abandoned
-
2021
- 2021-04-20 US US17/235,196 patent/US11900191B2/en active Active
-
2022
- 2022-10-18 US US18/047,328 patent/US12067434B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1526015A (zh) * | 2001-05-11 | 2004-09-01 | ���µ�����ҵ��ʽ���� | 生物分子基底,使用它的检验和诊断方法及装置 |
WO2003025123A2 (en) * | 2001-08-28 | 2003-03-27 | Mount Sinai School Of Medecine | Dna: a medium for long-term information storage specification |
WO2004088585A2 (en) * | 2003-03-31 | 2004-10-14 | Council Of Scientific And Industrial Research | A method for storing information in dna |
US20110119778A1 (en) * | 2007-11-30 | 2011-05-19 | Michael Liss | Steganographic embedding of information in coding genes |
CN101965410A (zh) * | 2008-02-27 | 2011-02-02 | 霍夫曼-拉罗奇有限公司 | 用于产生可测序文库的改进的核酸处理的系统和方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12067434B2 (en) | 2012-07-19 | 2024-08-20 | President And Fellows Of Harvard College | Methods of storing information using nucleic acids |
US11900191B2 (en) | 2012-07-19 | 2024-02-13 | President And Fellows Of Harvard College | Methods of storing information using nucleic acids |
CN108026557A (zh) * | 2015-07-13 | 2018-05-11 | 哈佛学院董事及会员团体 | 使用核酸用于可检索信息储存的方法 |
US11532380B2 (en) | 2015-07-13 | 2022-12-20 | President And Fellows Of Harvard College | Methods for using nucleic acids to store, retrieve and access information comprising a text, image, video or audio format |
CN107798219B (zh) * | 2016-08-30 | 2021-07-13 | 清华大学 | 将数据进行生物存储并还原的方法 |
CN107798219A (zh) * | 2016-08-30 | 2018-03-13 | 清华大学 | 将数据进行生物存储并还原的方法 |
WO2018149405A1 (zh) * | 2017-02-17 | 2018-08-23 | 苏州泓迅生物科技股份有限公司 | 信息存储和读取的方法 |
WO2019080653A1 (zh) * | 2017-10-25 | 2019-05-02 | 深圳华大生命科学研究院 | 编码/解码方法、编码/解码器和存储方法、装置 |
WO2019196439A1 (en) * | 2018-04-13 | 2019-10-17 | The Hong Kong Polytechnic University | Data storage using peptides |
US11315023B2 (en) | 2018-04-13 | 2022-04-26 | The Hong Kong Polytechnic University | Data storage using peptides |
CN112313749A (zh) * | 2018-04-13 | 2021-02-02 | 香港理工大学 | 使用肽的数据存储 |
CN112313749B (zh) * | 2018-04-13 | 2025-02-07 | 香港理工大学 | 使用肽的数据存储 |
CN111489791B (zh) * | 2020-04-07 | 2023-05-26 | 中国科学院重庆绿色智能技术研究院 | 固态纳米孔高密度编码dna数字存储读取方法 |
CN111489791A (zh) * | 2020-04-07 | 2020-08-04 | 中国科学院重庆绿色智能技术研究院 | 固态纳米孔高密度编码dna数字存储读取方法 |
CN112288089B (zh) * | 2020-09-28 | 2022-12-20 | 清华大学 | 阵列式核酸信息存储方法及装置 |
CN112288089A (zh) * | 2020-09-28 | 2021-01-29 | 清华大学 | 阵列式核酸信息存储方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US9996778B2 (en) | 2018-06-12 |
US20190258909A1 (en) | 2019-08-22 |
CN108875312A (zh) | 2018-11-23 |
US11900191B2 (en) | 2024-02-13 |
EP2875458A2 (en) | 2015-05-27 |
US12067434B2 (en) | 2024-08-20 |
US20240070422A1 (en) | 2024-02-29 |
KR20150037824A (ko) | 2015-04-08 |
US20160358055A1 (en) | 2016-12-08 |
KR101743846B1 (ko) | 2017-06-05 |
AU2013292709B2 (en) | 2017-04-13 |
US20150269313A1 (en) | 2015-09-24 |
US9384320B2 (en) | 2016-07-05 |
US10460220B2 (en) | 2019-10-29 |
CA2878042A1 (en) | 2014-01-23 |
IN2015DN01001A (zh) | 2015-06-12 |
WO2014014991A2 (en) | 2014-01-23 |
AU2013292709A1 (en) | 2015-02-05 |
HK1210848A1 (zh) | 2016-05-06 |
CA2878042C (en) | 2017-11-28 |
US20210241059A1 (en) | 2021-08-05 |
CN104662544B (zh) | 2018-08-03 |
JP2015533077A (ja) | 2015-11-19 |
JP6089106B2 (ja) | 2017-03-01 |
WO2014014991A3 (en) | 2014-03-27 |
US20200272872A1 (en) | 2020-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12067434B2 (en) | Methods of storing information using nucleic acids | |
Lee et al. | Terminator-free template-independent enzymatic DNA synthesis for digital information storage | |
US11532380B2 (en) | Methods for using nucleic acids to store, retrieve and access information comprising a text, image, video or audio format | |
US10364464B2 (en) | Compositions and methods for co-amplifying subsequences of a nucleic acid fragment sequence | |
ES2573277T3 (es) | Métodos, composiciones y kits de generación de muestras empobrecidas en ARNr o de aislamiento del ARNr de las muestras | |
WO2019079802A1 (en) | METHODS OF HIGH-RATE ENCODING AND DECODING OF INFORMATION STORED IN DNA | |
US10385391B2 (en) | Entangled mate sequencing | |
WO2023091592A1 (en) | Dendrimers for genomic analysis methods and compositions | |
US20210142866A1 (en) | Hybridization-based dna information storage to allow rapid and permanent erasure | |
WO2017189794A1 (en) | Method of secure communication via nucleotide polymers | |
JP2024530614A (ja) | 核酸データストレージのための組成物、システム、および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1210848 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |