CN111534504B - 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 - Google Patents
将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 Download PDFInfo
- Publication number
- CN111534504B CN111534504B CN202010095234.4A CN202010095234A CN111534504B CN 111534504 B CN111534504 B CN 111534504B CN 202010095234 A CN202010095234 A CN 202010095234A CN 111534504 B CN111534504 B CN 111534504B
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- leu
- gly
- ala
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 764
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 764
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 760
- 238000000034 method Methods 0.000 title claims abstract description 196
- 102000014914 Carrier Proteins Human genes 0.000 title abstract description 102
- 108091008324 binding proteins Proteins 0.000 title abstract description 101
- 108060004795 Methyltransferase Proteins 0.000 claims description 250
- 239000011148 porous material Substances 0.000 claims description 209
- 125000003729 nucleotide group Chemical group 0.000 claims description 184
- 239000002773 nucleotide Substances 0.000 claims description 179
- 238000011068 loading method Methods 0.000 claims description 159
- 125000006850 spacer group Chemical group 0.000 claims description 118
- 239000012528 membrane Substances 0.000 claims description 113
- 230000027455 binding Effects 0.000 claims description 66
- 150000001413 amino acids Chemical class 0.000 claims description 48
- 238000005259 measurement Methods 0.000 claims description 45
- 108090000623 proteins and genes Proteins 0.000 claims description 45
- 102000004169 proteins and genes Human genes 0.000 claims description 45
- 230000008878 coupling Effects 0.000 claims description 37
- 238000010168 coupling process Methods 0.000 claims description 37
- 238000005859 coupling reaction Methods 0.000 claims description 37
- 102000035160 transmembrane proteins Human genes 0.000 claims description 24
- 108091005703 transmembrane proteins Proteins 0.000 claims description 24
- 102100022536 Helicase POLQ-like Human genes 0.000 claims description 10
- 101000899334 Homo sapiens Helicase POLQ-like Proteins 0.000 claims description 10
- 102000003960 Ligases Human genes 0.000 claims description 10
- 108090000364 Ligases Proteins 0.000 claims description 10
- 241000187480 Mycobacterium smegmatis Species 0.000 claims description 8
- 101710092462 Alpha-hemolysin Proteins 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 239000007787 solid Substances 0.000 claims description 6
- 108010013381 Porins Proteins 0.000 claims description 5
- 101710203389 Outer membrane porin F Proteins 0.000 claims description 4
- 101710203388 Outer membrane porin G Proteins 0.000 claims description 4
- 230000006378 damage Effects 0.000 claims description 4
- 101150065599 mspC gene Proteins 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 4
- 108010006464 Hemolysin Proteins Proteins 0.000 claims description 3
- 239000003228 hemolysin Substances 0.000 claims description 3
- 230000011987 methylation Effects 0.000 claims description 3
- 238000007069 methylation reaction Methods 0.000 claims description 3
- 108090001030 Lipoproteins Proteins 0.000 claims description 2
- 102000004895 Lipoproteins Human genes 0.000 claims description 2
- 101100024453 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) mspB gene Proteins 0.000 claims description 2
- 241000588653 Neisseria Species 0.000 claims description 2
- 238000002847 impedance measurement Methods 0.000 claims description 2
- 108010014203 outer membrane phospholipase A Proteins 0.000 claims description 2
- 230000003647 oxidation Effects 0.000 claims description 2
- 238000007254 oxidation reaction Methods 0.000 claims description 2
- 108010014603 Leukocidins Proteins 0.000 claims 1
- 101100458286 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) mspD gene Proteins 0.000 claims 1
- 108010056995 Perforin Proteins 0.000 claims 1
- 102100028467 Perforin-1 Human genes 0.000 claims 1
- 230000005669 field effect Effects 0.000 claims 1
- 102000007739 porin activity proteins Human genes 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 178
- 102000053602 DNA Human genes 0.000 description 177
- 102000004190 Enzymes Human genes 0.000 description 76
- 108090000790 Enzymes Proteins 0.000 description 76
- 239000000523 sample Substances 0.000 description 66
- 229940024606 amino acid Drugs 0.000 description 50
- 235000001014 amino acid Nutrition 0.000 description 50
- 150000002632 lipids Chemical class 0.000 description 46
- 235000018102 proteins Nutrition 0.000 description 44
- 239000000178 monomer Substances 0.000 description 35
- 239000000872 buffer Substances 0.000 description 34
- 239000000232 Lipid Bilayer Substances 0.000 description 29
- 239000011324 bead Substances 0.000 description 29
- -1 nucleoside monophosphate Chemical class 0.000 description 29
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 28
- 239000012634 fragment Substances 0.000 description 28
- 230000004048 modification Effects 0.000 description 28
- 238000012986 modification Methods 0.000 description 28
- 239000010410 layer Substances 0.000 description 26
- 230000000295 complement effect Effects 0.000 description 25
- 241000894007 species Species 0.000 description 25
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 24
- 230000035772 mutation Effects 0.000 description 24
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 23
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 23
- 108090000765 processed proteins & peptides Proteins 0.000 description 23
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 22
- 102000004196 processed proteins & peptides Human genes 0.000 description 22
- 125000003275 alpha amino acid group Chemical group 0.000 description 21
- 239000000499 gel Substances 0.000 description 20
- 229920001184 polypeptide Polymers 0.000 description 20
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 19
- 230000002209 hydrophobic effect Effects 0.000 description 19
- 239000000203 mixture Substances 0.000 description 19
- 238000012512 characterization method Methods 0.000 description 18
- 150000007523 nucleic acids Chemical class 0.000 description 18
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- 238000000746 purification Methods 0.000 description 17
- 150000003839 salts Chemical class 0.000 description 17
- 241000588724 Escherichia coli Species 0.000 description 16
- 125000003636 chemical group Chemical group 0.000 description 16
- 229920002477 rna polymer Polymers 0.000 description 16
- 108091023037 Aptamer Proteins 0.000 description 15
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 15
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 15
- 239000000463 material Substances 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 239000000758 substrate Substances 0.000 description 15
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 14
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 14
- 239000002777 nucleoside Substances 0.000 description 14
- 229920001400 block copolymer Polymers 0.000 description 13
- 229920000642 polymer Polymers 0.000 description 13
- 239000011780 sodium chloride Substances 0.000 description 13
- 238000007792 addition Methods 0.000 description 12
- 239000002585 base Substances 0.000 description 12
- 235000012000 cholesterol Nutrition 0.000 description 12
- 229940107161 cholesterol Drugs 0.000 description 12
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 108091006146 Channels Proteins 0.000 description 11
- 102000012410 DNA Ligases Human genes 0.000 description 11
- 108010061982 DNA Ligases Proteins 0.000 description 11
- 239000011616 biotin Chemical group 0.000 description 11
- 235000020958 biotin Nutrition 0.000 description 11
- 229960002685 biotin Drugs 0.000 description 11
- 239000005549 deoxyribonucleoside Substances 0.000 description 11
- 229920001223 polyethylene glycol Polymers 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- 229920000428 triblock copolymer Polymers 0.000 description 11
- 208000035657 Abasia Diseases 0.000 description 10
- 239000007983 Tris buffer Substances 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 230000007935 neutral effect Effects 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- 229910019142 PO4 Inorganic materials 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 239000003446 ligand Substances 0.000 description 9
- 239000010452 phosphate Substances 0.000 description 9
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 9
- 239000001103 potassium chloride Substances 0.000 description 9
- 235000011164 potassium chloride Nutrition 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- 235000000346 sugar Nutrition 0.000 description 9
- 150000003573 thiols Chemical group 0.000 description 9
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 8
- 241000589499 Thermus thermophilus Species 0.000 description 8
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 8
- 102000008579 Transposases Human genes 0.000 description 8
- 108010020764 Transposases Proteins 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 235000018417 cysteine Nutrition 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 8
- 239000001257 hydrogen Substances 0.000 description 8
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 150000002500 ions Chemical class 0.000 description 8
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 8
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 8
- 239000011534 wash buffer Substances 0.000 description 8
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 7
- 108060002716 Exonuclease Proteins 0.000 description 7
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 7
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- 108091093037 Peptide nucleic acid Proteins 0.000 description 7
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 7
- 108010090804 Streptavidin Proteins 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000011777 magnesium Substances 0.000 description 7
- 238000006116 polymerization reaction Methods 0.000 description 7
- 239000002243 precursor Substances 0.000 description 7
- 239000002342 ribonucleoside Substances 0.000 description 7
- 239000006228 supernatant Substances 0.000 description 7
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 6
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 6
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 6
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 6
- 241000701959 Escherichia virus Lambda Species 0.000 description 6
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 6
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 239000007864 aqueous solution Substances 0.000 description 6
- 125000003118 aryl group Chemical group 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 6
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 6
- 230000005684 electric field Effects 0.000 description 6
- 239000012149 elution buffer Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 102000013165 exonuclease Human genes 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 6
- 235000013928 guanylic acid Nutrition 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 150000002430 hydrocarbons Chemical class 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 235000018977 lysine Nutrition 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- 102220328483 rs1555593600 Human genes 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 6
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 5
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 5
- 108091093094 Glycol nucleic acid Proteins 0.000 description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 108010052285 Membrane Proteins Proteins 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 5
- 108091046915 Threose nucleic acid Proteins 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 5
- 125000001931 aliphatic group Chemical group 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 230000004888 barrier function Effects 0.000 description 5
- 239000012148 binding buffer Substances 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 230000000903 blocking effect Effects 0.000 description 5
- 102220359631 c.277G>A Human genes 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 5
- JSRLJPSBLDHEIO-SHYZEUOFSA-N dUMP Chemical compound O1[C@H](COP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 JSRLJPSBLDHEIO-SHYZEUOFSA-N 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 239000000543 intermediate Substances 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 229950004354 phosphorylcholine Drugs 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 102200160490 rs1800299 Human genes 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- VLSDXINSOMDCBK-BQYQJAHWSA-N (E)-1,1'-azobis(N,N-dimethylformamide) Chemical compound CN(C)C(=O)\N=N\C(=O)N(C)C VLSDXINSOMDCBK-BQYQJAHWSA-N 0.000 description 4
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 4
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 4
- FSASIHFSFGAIJM-UHFFFAOYSA-N 3-methyladenine Chemical compound CN1C=NC(N)=C2N=CN=C12 FSASIHFSFGAIJM-UHFFFAOYSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 4
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 4
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 4
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 4
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 4
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 4
- 150000008574 D-amino acids Chemical class 0.000 description 4
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 4
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 4
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 4
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 4
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 4
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 4
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- 235000021314 Palmitic acid Nutrition 0.000 description 4
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- 102000017033 Porins Human genes 0.000 description 4
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 4
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 229940106189 ceramide Drugs 0.000 description 4
- 239000002800 charge carrier Substances 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 4
- 229920001577 copolymer Polymers 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 150000001945 cysteines Chemical class 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 229940029575 guanosine Drugs 0.000 description 4
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000003960 organic solvent Substances 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical group CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 4
- 229920003192 poly(bis maleimide) Polymers 0.000 description 4
- 229910052700 potassium Inorganic materials 0.000 description 4
- 239000011591 potassium Substances 0.000 description 4
- 239000013615 primer Substances 0.000 description 4
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 4
- 108700004896 tripeptide FEG Proteins 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 3
- NZJKEQFPRPAEPO-UHFFFAOYSA-N 1h-benzimidazol-4-amine Chemical compound NC1=CC=CC2=C1N=CN2 NZJKEQFPRPAEPO-UHFFFAOYSA-N 0.000 description 3
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 3
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical group OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 3
- YZEUHQHUFTYLPH-UHFFFAOYSA-N 2-nitroimidazole Chemical compound [O-][N+](=O)C1=NC=CN1 YZEUHQHUFTYLPH-UHFFFAOYSA-N 0.000 description 3
- LAVZKLJDKGRZJG-UHFFFAOYSA-N 4-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=CC2=C1C=CN2 LAVZKLJDKGRZJG-UHFFFAOYSA-N 0.000 description 3
- WSGURAYTCUVDQL-UHFFFAOYSA-N 5-nitro-1h-indazole Chemical compound [O-][N+](=O)C1=CC=C2NN=CC2=C1 WSGURAYTCUVDQL-UHFFFAOYSA-N 0.000 description 3
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 3
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 3
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 3
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 3
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 3
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- YDNKGFDKKRUKPY-JHOUSYSJSA-N C16 ceramide Natural products CCCCCCCCCCCCCCCC(=O)N[C@@H](CO)[C@H](O)C=CCCCCCCCCCCCCC YDNKGFDKKRUKPY-JHOUSYSJSA-N 0.000 description 3
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 3
- 229920000858 Cyclodextrin Polymers 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 102100031780 Endonuclease Human genes 0.000 description 3
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 3
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 3
- JLCYOCDGIUZMKQ-JBACZVJFSA-N Glu-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N JLCYOCDGIUZMKQ-JBACZVJFSA-N 0.000 description 3
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 3
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 3
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 3
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 3
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- CRJGESKKUOMBCT-VQTJNVASSA-N N-acetylsphinganine Chemical compound CCCCCCCCCCCCCCC[C@@H](O)[C@H](CO)NC(C)=O CRJGESKKUOMBCT-VQTJNVASSA-N 0.000 description 3
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 3
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 3
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 3
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 3
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 3
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 3
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 3
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 3
- 101710183280 Topoisomerase Proteins 0.000 description 3
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 3
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 3
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000012491 analyte Substances 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 150000001540 azides Chemical class 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- ZVEQCJWYRWKARO-UHFFFAOYSA-N ceramide Natural products CCCCCCCCCCCCCCC(O)C(=O)NC(CO)C(O)C=CCCC=C(C)CCCCCCCCC ZVEQCJWYRWKARO-UHFFFAOYSA-N 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- ZOOGRGPOEVQQDX-KHLHZJAASA-N cyclic guanosine monophosphate Chemical compound C([C@H]1O2)O[P@](O)(=O)O[C@@H]1[C@H](O)[C@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-KHLHZJAASA-N 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N ether Substances CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000013554 lipid monolayer Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 3
- VVGIYYKRAMHVLU-UHFFFAOYSA-N newbouldiamide Natural products CCCCCCCCCCCCCCCCCCCC(O)C(O)C(O)C(CO)NC(=O)CCCCCCCCCCCCCCCCC VVGIYYKRAMHVLU-UHFFFAOYSA-N 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 229910000160 potassium phosphate Inorganic materials 0.000 description 3
- 235000011009 potassium phosphates Nutrition 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 102200037599 rs749038326 Human genes 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 230000002459 sustained effect Effects 0.000 description 3
- 229940104230 thymidine Drugs 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- 229960004441 tyrosine Drugs 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- OILXMJHPFNGGTO-UHFFFAOYSA-N (22E)-(24xi)-24-methylcholesta-5,22-dien-3beta-ol Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)C=CC(C)C(C)C)C1(C)CC2 OILXMJHPFNGGTO-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- QLUTZSRKFWJIGM-QMMMGPOBSA-N (2r)-2-azaniumyl-3-[(2-nitrophenyl)methylsulfanyl]propanoate Chemical compound OC(=O)[C@@H](N)CSCC1=CC=CC=C1[N+]([O-])=O QLUTZSRKFWJIGM-QMMMGPOBSA-N 0.000 description 2
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 description 2
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 2
- TZCPCKNHXULUIY-RGULYWFUSA-N 1,2-distearoyl-sn-glycero-3-phosphoserine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCCCCCCCCCCCC TZCPCKNHXULUIY-RGULYWFUSA-N 0.000 description 2
- RVRLFABOQXZUJX-UHFFFAOYSA-N 1-[1-(2,5-dioxopyrrol-1-yl)ethyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1C(C)N1C(=O)C=CC1=O RVRLFABOQXZUJX-UHFFFAOYSA-N 0.000 description 2
- XQUPVDVFXZDTLT-UHFFFAOYSA-N 1-[4-[[4-(2,5-dioxopyrrol-1-yl)phenyl]methyl]phenyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1C(C=C1)=CC=C1CC1=CC=C(N2C(C=CC2=O)=O)C=C1 XQUPVDVFXZDTLT-UHFFFAOYSA-N 0.000 description 2
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 2
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 2
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 2
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 2
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 description 2
- XORHNJQEWQGXCN-UHFFFAOYSA-N 4-nitro-1h-pyrazole Chemical compound [O-][N+](=O)C=1C=NNC=1 XORHNJQEWQGXCN-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 2
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 2
- WOVKYSAHUYNSMH-RRKCRQDMSA-N 5-bromodeoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-RRKCRQDMSA-N 0.000 description 2
- OFJNVANOCZHTMW-UHFFFAOYSA-N 5-hydroxyuracil Chemical compound OC1=CNC(=O)NC1=O OFJNVANOCZHTMW-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- VYDWQPKRHOGLPA-UHFFFAOYSA-N 5-nitroimidazole Chemical compound [O-][N+](=O)C1=CN=CN1 VYDWQPKRHOGLPA-UHFFFAOYSA-N 0.000 description 2
- PSWCIARYGITEOY-UHFFFAOYSA-N 6-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2C=CNC2=C1 PSWCIARYGITEOY-UHFFFAOYSA-N 0.000 description 2
- OQMZNAMGEHIHNN-UHFFFAOYSA-N 7-Dehydrostigmasterol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)C=CC(CC)C(C)C)CCC33)C)C3=CC=C21 OQMZNAMGEHIHNN-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 2
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 2
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 2
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- WOVKYSAHUYNSMH-UHFFFAOYSA-N BROMODEOXYURIDINE Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-UHFFFAOYSA-N 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- XXFPJPHZDYOGKN-UHFFFAOYSA-N C(=C)=NC1=C2NC=NC2=NC=N1 Chemical compound C(=C)=NC1=C2NC=NC2=NC=N1 XXFPJPHZDYOGKN-UHFFFAOYSA-N 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 description 2
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 2
- 102100029075 Exonuclease 1 Human genes 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 2
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 2
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 2
- ZWZWYGMENQVNFU-UHFFFAOYSA-N Glycerophosphorylserin Natural products OC(=O)C(N)COP(O)(=O)OCC(O)CO ZWZWYGMENQVNFU-UHFFFAOYSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 2
- 101710174798 Lysenin Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 239000005642 Oleic acid Substances 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 108091093078 Pyrimidine dimer Proteins 0.000 description 2
- 101710086015 RNA ligase Proteins 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 2
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 229930182558 Sterol Natural products 0.000 description 2
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 2
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 2
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 2
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 2
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- YTUABZMPYKCWCQ-XQQFMLRXSA-N Val-His-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N YTUABZMPYKCWCQ-XQQFMLRXSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- WREGKURFCTUGRC-POYBYMJQSA-N Zalcitabine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)CC1 WREGKURFCTUGRC-POYBYMJQSA-N 0.000 description 2
- BZDVTEPMYMHZCR-JGVFFNPUSA-N [(2s,5r)-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)CC1 BZDVTEPMYMHZCR-JGVFFNPUSA-N 0.000 description 2
- ATBOMIWRCZXYSZ-XZBBILGWSA-N [1-[2,3-dihydroxypropoxy(hydroxy)phosphoryl]oxy-3-hexadecanoyloxypropan-2-yl] (9e,12e)-octadeca-9,12-dienoate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCC\C=C\C\C=C\CCCCC ATBOMIWRCZXYSZ-XZBBILGWSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000010933 acylation Effects 0.000 description 2
- 238000005917 acylation reaction Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000006154 adenylylation Effects 0.000 description 2
- 229960003767 alanine Drugs 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 229910052783 alkali metal Inorganic materials 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- LGJMUZUPVCAVPU-UHFFFAOYSA-N beta-Sitostanol Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(CC)C(C)C)C1(C)CC2 LGJMUZUPVCAVPU-UHFFFAOYSA-N 0.000 description 2
- 125000004057 biotinyl group Chemical group [H]N1C(=O)N([H])[C@]2([H])[C@@]([H])(SC([H])([H])[C@]12[H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C(*)=O 0.000 description 2
- 229950004398 broxuridine Drugs 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- DAEAPNUQQAICNR-RRKCRQDMSA-K dADP(3-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP([O-])(=O)OP([O-])([O-])=O)O1 DAEAPNUQQAICNR-RRKCRQDMSA-K 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- 230000023753 dehiscence Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 2
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- ZGSPNIOCEDOHGS-UHFFFAOYSA-L disodium [3-[2,3-di(octadeca-9,12-dienoyloxy)propoxy-oxidophosphoryl]oxy-2-hydroxypropyl] 2,3-di(octadeca-9,12-dienoyloxy)propyl phosphate Chemical compound [Na+].[Na+].CCCCCC=CCC=CCCCCCCCC(=O)OCC(OC(=O)CCCCCCCC=CCC=CCCCCC)COP([O-])(=O)OCC(O)COP([O-])(=O)OCC(OC(=O)CCCCCCCC=CCC=CCCCCC)COC(=O)CCCCCCCC=CCC=CCCCCC ZGSPNIOCEDOHGS-UHFFFAOYSA-L 0.000 description 2
- 230000007831 electrophysiology Effects 0.000 description 2
- 238000002001 electrophysiology Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 150000002190 fatty acyls Chemical group 0.000 description 2
- YAGKRVSRTSUGEY-UHFFFAOYSA-N ferricyanide Chemical compound [Fe+3].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] YAGKRVSRTSUGEY-UHFFFAOYSA-N 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 229910021389 graphene Inorganic materials 0.000 description 2
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 2
- ACCCMOQWYVYDOT-UHFFFAOYSA-N hexane-1,1-diol Chemical group CCCCCC(O)O ACCCMOQWYVYDOT-UHFFFAOYSA-N 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000000887 hydrating effect Effects 0.000 description 2
- 238000005470 impregnation Methods 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 150000002669 lysines Chemical class 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 150000002678 macrocyclic compounds Chemical class 0.000 description 2
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000006911 nucleation Effects 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 2
- 150000003905 phosphatidylinositols Chemical class 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 239000000276 potassium ferrocyanide Substances 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 239000013635 pyrimidine dimer Substances 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 101150056906 recJ gene Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 238000005932 reductive alkylation reaction Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 150000003432 sterols Chemical class 0.000 description 2
- 235000003702 sterols Nutrition 0.000 description 2
- 229920001059 synthetic polymer Polymers 0.000 description 2
- 239000012085 test solution Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- HLZKNKRTKFSKGZ-UHFFFAOYSA-N tetradecan-1-ol Chemical compound CCCCCCCCCCCCCCO HLZKNKRTKFSKGZ-UHFFFAOYSA-N 0.000 description 2
- XOGGUFAVLNCTRS-UHFFFAOYSA-N tetrapotassium;iron(2+);hexacyanide Chemical compound [K+].[K+].[K+].[K+].[Fe+2].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] XOGGUFAVLNCTRS-UHFFFAOYSA-N 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 229930003799 tocopherol Natural products 0.000 description 2
- 239000011732 tocopherol Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 2
- MQAYPFVXSPHGJM-UHFFFAOYSA-M trimethyl(phenyl)azanium;chloride Chemical compound [Cl-].C[N+](C)(C)C1=CC=CC=C1 MQAYPFVXSPHGJM-UHFFFAOYSA-M 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 229930195735 unsaturated hydrocarbon Chemical group 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- KZJWDPNRJALLNS-VPUBHVLGSA-N (-)-beta-Sitosterol Natural products O[C@@H]1CC=2[C@@](C)([C@@H]3[C@H]([C@H]4[C@@](C)([C@H]([C@H](CC[C@@H](C(C)C)CC)C)CC4)CC3)CC=2)CC1 KZJWDPNRJALLNS-VPUBHVLGSA-N 0.000 description 1
- BQPPJGMMIYJVBR-UHFFFAOYSA-N (10S)-3c-Acetoxy-4.4.10r.13c.14t-pentamethyl-17c-((R)-1.5-dimethyl-hexen-(4)-yl)-(5tH)-Delta8-tetradecahydro-1H-cyclopenta[a]phenanthren Natural products CC12CCC(OC(C)=O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C BQPPJGMMIYJVBR-UHFFFAOYSA-N 0.000 description 1
- CSVWWLUMXNHWSU-UHFFFAOYSA-N (22E)-(24xi)-24-ethyl-5alpha-cholest-22-en-3beta-ol Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(C)C=CC(CC)C(C)C)C1(C)CC2 CSVWWLUMXNHWSU-UHFFFAOYSA-N 0.000 description 1
- RQOCXCFLRBRBCS-UHFFFAOYSA-N (22E)-cholesta-5,7,22-trien-3beta-ol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)C=CCC(C)C)CCC33)C)C3=CC=C21 RQOCXCFLRBRBCS-UHFFFAOYSA-N 0.000 description 1
- KMIDUNAIKQUUGE-NTZNESFSSA-N (2S)-2-amino-8-[(2R,3S)-3-ethynyloxolan-2-yl]-8-oxooctanoic acid Chemical compound N[C@H](C(=O)O)CCCCCC(=O)[C@@H]1OCC[C@H]1C#C KMIDUNAIKQUUGE-NTZNESFSSA-N 0.000 description 1
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 1
- WETFHJRYOTYZFD-YIZRAAEISA-N (2r,3s,5s)-2-(hydroxymethyl)-5-(3-nitropyrrol-1-yl)oxolan-3-ol Chemical compound C1[C@H](O)[C@@H](CO)O[C@@H]1N1C=C([N+]([O-])=O)C=C1 WETFHJRYOTYZFD-YIZRAAEISA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- JVEUTCWLEJSEDI-PXYINDEMSA-N (2s)-2,6-diamino-7-oxo-7-phenylmethoxyheptanoic acid Chemical compound OC(=O)[C@@H](N)CCCC(N)C(=O)OCC1=CC=CC=C1 JVEUTCWLEJSEDI-PXYINDEMSA-N 0.000 description 1
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 1
- POGSZHUEECCEAP-ZETCQYMHSA-N (2s)-2-amino-3-(3-amino-4-hydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(N)=C1 POGSZHUEECCEAP-ZETCQYMHSA-N 0.000 description 1
- ZHUOMTMPTNZOJE-VIFPVBQESA-N (2s)-2-amino-3-(3-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C#N)=C1 ZHUOMTMPTNZOJE-VIFPVBQESA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- KWIPUXXIFQQMKN-VIFPVBQESA-N (2s)-2-amino-3-(4-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C#N)C=C1 KWIPUXXIFQQMKN-VIFPVBQESA-N 0.000 description 1
- PHUOJEKTSKQBNT-NSHDSACASA-N (2s)-2-amino-3-(4-prop-2-enoxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OCC=C)C=C1 PHUOJEKTSKQBNT-NSHDSACASA-N 0.000 description 1
- RKXGYYMTJRQUQQ-NSHDSACASA-N (2s)-2-amino-3-(4-propan-2-ylsulfanylcarbonylphenyl)propanoic acid Chemical compound CC(C)SC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 RKXGYYMTJRQUQQ-NSHDSACASA-N 0.000 description 1
- HIAVWJOQCVNAQC-LBPRGKRZSA-N (2s)-2-amino-3-(naphthalen-2-ylamino)propanoic acid Chemical compound C1=CC=CC2=CC(NC[C@H](N)C(O)=O)=CC=C21 HIAVWJOQCVNAQC-LBPRGKRZSA-N 0.000 description 1
- VTERJWKRLSSHIC-QMMMGPOBSA-N (2s)-2-amino-3-[(2-nitrophenyl)methoxy]propanoic acid Chemical compound OC(=O)[C@@H](N)COCC1=CC=CC=C1[N+]([O-])=O VTERJWKRLSSHIC-QMMMGPOBSA-N 0.000 description 1
- HYSPNOMZFGNKBR-QMMMGPOBSA-N (2s)-2-amino-3-[(4,5-dimethoxy-2-nitrophenyl)methoxy]propanoic acid Chemical compound COC1=CC(COC[C@H](N)C(O)=O)=C([N+]([O-])=O)C=C1OC HYSPNOMZFGNKBR-QMMMGPOBSA-N 0.000 description 1
- LJHYWUVYIKCPGU-VIFPVBQESA-N (2s)-2-amino-3-[4-(carboxymethyl)phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(CC(O)=O)C=C1 LJHYWUVYIKCPGU-VIFPVBQESA-N 0.000 description 1
- AWYGHHYADLYNRW-RGURZIINSA-N (2s)-2-amino-3-[4-[(2-amino-3-sulfanylpropanoyl)amino]phenyl]propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(NC(=O)C(N)CS)C=C1 AWYGHHYADLYNRW-RGURZIINSA-N 0.000 description 1
- NLFOHNAFILVHGM-AWEZNQCLSA-N (2s)-2-amino-3-[4-[(2-nitrophenyl)methoxy]phenyl]propanoic acid Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1OCC1=CC=CC=C1[N+]([O-])=O NLFOHNAFILVHGM-AWEZNQCLSA-N 0.000 description 1
- QEQAKQQRJFWPOR-JTQLQIEISA-N (2s)-2-amino-4-(7-hydroxy-2-oxochromen-4-yl)butanoic acid Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2CC[C@H](N)C(O)=O QEQAKQQRJFWPOR-JTQLQIEISA-N 0.000 description 1
- FQFIGHYUHCWZRZ-JTQLQIEISA-N (2s)-2-amino-6-(cyclopentanecarbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)C1CCCC1 FQFIGHYUHCWZRZ-JTQLQIEISA-N 0.000 description 1
- KRFMMSZGIQEBIJ-QMMMGPOBSA-N (2s)-2-amino-6-(prop-2-ynoxycarbonylamino)hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)OCC#C KRFMMSZGIQEBIJ-QMMMGPOBSA-N 0.000 description 1
- VVQIIIAZJXTLRE-QMMMGPOBSA-N (2s)-2-amino-6-[(2-methylpropan-2-yl)oxycarbonylamino]hexanoic acid Chemical compound CC(C)(C)OC(=O)NCCCC[C@H](N)C(O)=O VVQIIIAZJXTLRE-QMMMGPOBSA-N 0.000 description 1
- WORDWOPJMYWZSB-NSHDSACASA-N (2s)-2-amino-6-[(2-nitrophenyl)methoxycarbonylamino]hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)OCC1=CC=CC=C1[N+]([O-])=O WORDWOPJMYWZSB-NSHDSACASA-N 0.000 description 1
- LJLCMMNKTZXLLX-DTWKUNHWSA-N (2s)-2-amino-6-[[(2r)-oxolane-2-carbonyl]amino]hexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)[C@H]1CCCO1 LJLCMMNKTZXLLX-DTWKUNHWSA-N 0.000 description 1
- HBMWPJLCTYKAGL-YFKPBYRVSA-N (2s)-2-amino-6-sulfanylhexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCS HBMWPJLCTYKAGL-YFKPBYRVSA-N 0.000 description 1
- SDZGVFSSLGTJAJ-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1[N+]([O-])=O SDZGVFSSLGTJAJ-ZETCQYMHSA-N 0.000 description 1
- GTVVZTAFGPQSPC-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-QMMMGPOBSA-N 0.000 description 1
- CYHRSNOITZHLJN-NSHDSACASA-N (2s)-2-azaniumyl-3-(4-propan-2-ylphenyl)propanoate Chemical compound CC(C)C1=CC=C(C[C@H](N)C(O)=O)C=C1 CYHRSNOITZHLJN-NSHDSACASA-N 0.000 description 1
- NKQWPQYVVKUEPV-QMMMGPOBSA-N (2s)-2-hydroxy-6-[(2-methylpropan-2-yl)oxycarbonylamino]hexanoic acid Chemical compound CC(C)(C)OC(=O)NCCCC[C@H](O)C(O)=O NKQWPQYVVKUEPV-QMMMGPOBSA-N 0.000 description 1
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 description 1
- XKZCXMNMUMGDJG-AWEZNQCLSA-N (2s)-3-[(6-acetylnaphthalen-2-yl)amino]-2-aminopropanoic acid Chemical compound C1=C(NC[C@H](N)C(O)=O)C=CC2=CC(C(=O)C)=CC=C21 XKZCXMNMUMGDJG-AWEZNQCLSA-N 0.000 description 1
- YZJSUQQZGCHHNQ-BYPYZUCNSA-N (2s)-6-amino-2-azaniumyl-6-oxohexanoate Chemical compound OC(=O)[C@@H](N)CCCC(N)=O YZJSUQQZGCHHNQ-BYPYZUCNSA-N 0.000 description 1
- CHGIKSSZNBCNDW-UHFFFAOYSA-N (3beta,5alpha)-4,4-Dimethylcholesta-8,24-dien-3-ol Natural products CC12CCC(O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21 CHGIKSSZNBCNDW-UHFFFAOYSA-N 0.000 description 1
- ALSTYHKOOCGGFT-KTKRTIGZSA-N (9Z)-octadecen-1-ol Chemical compound CCCCCCCC\C=C/CCCCCCCCO ALSTYHKOOCGGFT-KTKRTIGZSA-N 0.000 description 1
- JVGVDSSUAVXRDY-MRVPVSSYSA-N (R)-3-(4-hydroxyphenyl)lactic acid Chemical compound OC(=O)[C@H](O)CC1=CC=C(O)C=C1 JVGVDSSUAVXRDY-MRVPVSSYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- CMUHFUGDYMFHEI-UHFFFAOYSA-N -2-Amino-3-94-aminophenyl)propanoic acid Natural products OC(=O)C(N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-UHFFFAOYSA-N 0.000 description 1
- KILNVBDSWZSGLL-KXQOOQHDSA-N 1,2-dihexadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCC KILNVBDSWZSGLL-KXQOOQHDSA-N 0.000 description 1
- LUTLAXLNPLZCOF-UHFFFAOYSA-N 1-Methylhistidine Natural products OC(=O)C(N)(C)CC1=NC=CN1 LUTLAXLNPLZCOF-UHFFFAOYSA-N 0.000 description 1
- XKKCQTLDIPIRQD-JGVFFNPUSA-N 1-[(2r,5s)-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)CC1 XKKCQTLDIPIRQD-JGVFFNPUSA-N 0.000 description 1
- BMQZYMYBQZGEEY-UHFFFAOYSA-M 1-ethyl-3-methylimidazolium chloride Chemical compound [Cl-].CCN1C=C[N+](C)=C1 BMQZYMYBQZGEEY-UHFFFAOYSA-M 0.000 description 1
- XYTLYKGXLMKYMV-UHFFFAOYSA-N 14alpha-methylzymosterol Natural products CC12CCC(O)CC1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C XYTLYKGXLMKYMV-UHFFFAOYSA-N 0.000 description 1
- SBNOTUDDIXOFSN-UHFFFAOYSA-N 1h-indole-2-carbaldehyde Chemical compound C1=CC=C2NC(C=O)=CC2=C1 SBNOTUDDIXOFSN-UHFFFAOYSA-N 0.000 description 1
- PHNGFPPXDJJADG-RRKCRQDMSA-N 2'-deoxyinosine-5'-monophosphate Chemical compound O1[C@H](COP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 PHNGFPPXDJJADG-RRKCRQDMSA-N 0.000 description 1
- GIMRVVLNBSNCLO-UHFFFAOYSA-N 2,6-diamino-5-formamido-4-hydroxypyrimidine Chemical compound NC1=NC(=O)C(NC=O)C(N)=N1 GIMRVVLNBSNCLO-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- XLOULZPUVVVWES-UHFFFAOYSA-N 2-amino-3-(8-hydroxyquinolin-3-yl)propanoic acid Chemical compound OC1=CC=CC2=CC(CC(N)C(O)=O)=CN=C21 XLOULZPUVVVWES-UHFFFAOYSA-N 0.000 description 1
- RZGAAVNNBWANKD-UHFFFAOYSA-N 2-amino-3-[[5-(dimethylamino)naphthalen-1-yl]sulfonylamino]propanoic acid Chemical compound C1=CC=C2C(N(C)C)=CC=CC2=C1S(=O)(=O)NCC(N)C(O)=O RZGAAVNNBWANKD-UHFFFAOYSA-N 0.000 description 1
- JINGUCXQUOKWKH-UHFFFAOYSA-N 2-aminodecanoic acid Chemical compound CCCCCCCCC(N)C(O)=O JINGUCXQUOKWKH-UHFFFAOYSA-N 0.000 description 1
- DJQYYYCQOZMCRC-UHFFFAOYSA-N 2-aminopropane-1,3-dithiol Chemical group SCC(N)CS DJQYYYCQOZMCRC-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- 150000005019 2-aminopurines Chemical class 0.000 description 1
- YZXUCQCJZKJMIR-UHFFFAOYSA-N 2-azaniumyl-3-[4-(trifluoromethoxy)phenyl]propanoate Chemical compound OC(=O)C(N)CC1=CC=C(OC(F)(F)F)C=C1 YZXUCQCJZKJMIR-UHFFFAOYSA-N 0.000 description 1
- JVPFOKXICYJJSC-UHFFFAOYSA-N 2-azaniumylnonanoate Chemical compound CCCCCCCC(N)C(O)=O JVPFOKXICYJJSC-UHFFFAOYSA-N 0.000 description 1
- TWJNQYPJQDRXPH-UHFFFAOYSA-N 2-cyanobenzohydrazide Chemical compound NNC(=O)C1=CC=CC=C1C#N TWJNQYPJQDRXPH-UHFFFAOYSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical class C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- 125000006321 2-propynyl amino group Chemical group [H]C#CC([H])([H])N([H])* 0.000 description 1
- 125000001494 2-propynyl group Chemical group [H]C#CC([H])([H])* 0.000 description 1
- KLEXDBGYSOIREE-UHFFFAOYSA-N 24xi-n-propylcholesterol Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(CCC)C(C)C)C1(C)CC2 KLEXDBGYSOIREE-UHFFFAOYSA-N 0.000 description 1
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical group C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 1
- ZTLXICJMNFREPA-UHFFFAOYSA-N 3,3,6,6,9,9-hexamethyl-1,2,4,5,7,8-hexaoxonane Chemical compound CC1(C)OOC(C)(C)OOC(C)(C)OO1 ZTLXICJMNFREPA-UHFFFAOYSA-N 0.000 description 1
- CQPBAKFMGYWGND-UHFFFAOYSA-N 3-benzhydrylcyclooctyne Chemical group C(C1=CC=CC=C1)(C1=CC=CC=C1)C1C#CCCCCC1 CQPBAKFMGYWGND-UHFFFAOYSA-N 0.000 description 1
- 125000004080 3-carboxypropanoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C(O[H])=O 0.000 description 1
- UQTZMGFTRHFAAM-ZETCQYMHSA-N 3-iodo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(I)=C1 UQTZMGFTRHFAAM-ZETCQYMHSA-N 0.000 description 1
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 1
- FPTJELQXIUUCEY-UHFFFAOYSA-N 3beta-Hydroxy-lanostan Natural products C1CC2C(C)(C)C(O)CCC2(C)C2C1C1(C)CCC(C(C)CCCC(C)C)C1(C)CC2 FPTJELQXIUUCEY-UHFFFAOYSA-N 0.000 description 1
- QCQCHGYLTSGIGX-GHXANHINSA-N 4-[[(3ar,5ar,5br,7ar,9s,11ar,11br,13as)-5a,5b,8,8,11a-pentamethyl-3a-[(5-methylpyridine-3-carbonyl)amino]-2-oxo-1-propan-2-yl-4,5,6,7,7a,9,10,11,11b,12,13,13a-dodecahydro-3h-cyclopenta[a]chrysen-9-yl]oxy]-2,2-dimethyl-4-oxobutanoic acid Chemical compound N([C@@]12CC[C@@]3(C)[C@]4(C)CC[C@H]5C(C)(C)[C@@H](OC(=O)CC(C)(C)C(O)=O)CC[C@]5(C)[C@H]4CC[C@@H]3C1=C(C(C2)=O)C(C)C)C(=O)C1=CN=CC(C)=C1 QCQCHGYLTSGIGX-GHXANHINSA-N 0.000 description 1
- YUDSCJBUWTYENI-VPCXQMTMSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O YUDSCJBUWTYENI-VPCXQMTMSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- YFQOVSGFCVQZSW-UHFFFAOYSA-N 5,6-dihydroxyuracil Chemical compound OC=1NC(=O)NC(=O)C=1O YFQOVSGFCVQZSW-UHFFFAOYSA-N 0.000 description 1
- OYOGICCULFEYME-UHFFFAOYSA-N 5-(dihydroxymethyl)-1H-pyrimidine-2,4-dione Chemical compound OC(O)c1c[nH]c(=O)[nH]c1=O OYOGICCULFEYME-UHFFFAOYSA-N 0.000 description 1
- OHAMXGZMZZWRCA-UHFFFAOYSA-N 5-formyluracil Chemical compound OC1=NC=C(C=O)C(O)=N1 OHAMXGZMZZWRCA-UHFFFAOYSA-N 0.000 description 1
- QALVYNJUHYOTCW-UHFFFAOYSA-N 5-hydroxy-5-methyl-1,3-diazinane-2,4,6-trione Chemical compound CC1(O)C(=O)NC(=O)N=C1O QALVYNJUHYOTCW-UHFFFAOYSA-N 0.000 description 1
- CNQHZBFQVYOFGD-UHFFFAOYSA-N 5-hydroxy-5-methylimidazolidine-2,4-dione Chemical compound CC1(O)NC(=O)NC1=O CNQHZBFQVYOFGD-UHFFFAOYSA-N 0.000 description 1
- JDBGXEHEIRGOBU-UHFFFAOYSA-N 5-hydroxymethyluracil Chemical compound OCC1=CNC(=O)NC1=O JDBGXEHEIRGOBU-UHFFFAOYSA-N 0.000 description 1
- NLLCDONDZDHLCI-UHFFFAOYSA-N 6-amino-5-hydroxy-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1O NLLCDONDZDHLCI-UHFFFAOYSA-N 0.000 description 1
- CLGFIVUFZRGQRP-UHFFFAOYSA-N 7,8-dihydro-8-oxoguanine Chemical compound O=C1NC(N)=NC2=C1NC(=O)N2 CLGFIVUFZRGQRP-UHFFFAOYSA-N 0.000 description 1
- DPRSKJHWKNHBOW-UHFFFAOYSA-N 7-Deazainosine Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2C=C1 DPRSKJHWKNHBOW-UHFFFAOYSA-N 0.000 description 1
- LSMBOEFDMAIXTM-UUOKFMHZSA-N 7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-imidazo[4,5-d]triazin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NN=NC(O)=C2N=C1 LSMBOEFDMAIXTM-UUOKFMHZSA-N 0.000 description 1
- DPRSKJHWKNHBOW-KCGFPETGSA-N 7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC=NC2=O)=C2C=C1 DPRSKJHWKNHBOW-KCGFPETGSA-N 0.000 description 1
- QFFLRMDXYQOYKO-KVQBGUIXSA-N 7-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-imidazo[4,5-d]triazin-4-one Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NN=NC(O)=C2N=C1 QFFLRMDXYQOYKO-KVQBGUIXSA-N 0.000 description 1
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930195730 Aflatoxin Natural products 0.000 description 1
- XWIYFDMXXLINPU-UHFFFAOYSA-N Aflatoxin G Chemical compound O=C1OCCC2=C1C(=O)OC1=C2C(OC)=CC2=C1C1C=COC1O2 XWIYFDMXXLINPU-UHFFFAOYSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- FCXAUASCMJOFEY-NDKCEZKHSA-N Ala-Leu-Thr-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O FCXAUASCMJOFEY-NDKCEZKHSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 229920000856 Amylose Polymers 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241001120493 Arene Species 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 1
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 1
- NXVGBGZQQFDUTM-XVYDVKMFSA-N Asn-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N NXVGBGZQQFDUTM-XVYDVKMFSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- PBFXCUOEGVJTMV-QXEWZRGKSA-N Asn-Met-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O PBFXCUOEGVJTMV-QXEWZRGKSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 1
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 1
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- MRYDJCIIVRXVGG-QEJZJMRPSA-N Asp-Trp-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O MRYDJCIIVRXVGG-QEJZJMRPSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 241000209763 Avena sativa Species 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000701844 Bacillus virus phi29 Species 0.000 description 1
- 108010071023 Bacterial Outer Membrane Proteins Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 102220484866 C-type lectin domain family 4 member A_W21A_mutation Human genes 0.000 description 1
- ZUHQCDZJPTXVCU-UHFFFAOYSA-N C1#CCCC2=CC=CC=C2C2=CC=CC=C21 Chemical compound C1#CCCC2=CC=CC=C2C2=CC=CC=C21 ZUHQCDZJPTXVCU-UHFFFAOYSA-N 0.000 description 1
- 102220548139 Calpain-2 catalytic subunit_D22E_mutation Human genes 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- LPZCCMIISIBREI-MTFRKTCUSA-N Citrostadienol Natural products CC=C(CC[C@@H](C)[C@H]1CC[C@H]2C3=CC[C@H]4[C@H](C)[C@@H](O)CC[C@]4(C)[C@H]3CC[C@]12C)C(C)C LPZCCMIISIBREI-MTFRKTCUSA-N 0.000 description 1
- 235000016795 Cola Nutrition 0.000 description 1
- 244000228088 Cola acuminata Species 0.000 description 1
- 235000011824 Cola pachycarpa Nutrition 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 1
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 1
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- OUYCCCASQSFEME-MRVPVSSYSA-N D-tyrosine Chemical compound OC(=O)[C@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-MRVPVSSYSA-N 0.000 description 1
- 229930195709 D-tyrosine Natural products 0.000 description 1
- YVGGHNCTFXOJCH-UHFFFAOYSA-N DDT Chemical compound C1=CC(Cl)=CC=C1C(C(Cl)(Cl)Cl)C1=CC=C(Cl)C=C1 YVGGHNCTFXOJCH-UHFFFAOYSA-N 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- ARVGMISWLZPBCH-UHFFFAOYSA-N Dehydro-beta-sitosterol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)CCC(CC)C(C)C)CCC33)C)C3=CC=C21 ARVGMISWLZPBCH-UHFFFAOYSA-N 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 101800001466 Envelope glycoprotein E1 Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- DNVPQKQSNYMLRS-NXVQYWJNSA-N Ergosterol Natural products CC(C)[C@@H](C)C=C[C@H](C)[C@H]1CC[C@H]2C3=CC=C4C[C@@H](O)CC[C@]4(C)[C@@H]3CC[C@]12C DNVPQKQSNYMLRS-NXVQYWJNSA-N 0.000 description 1
- 101100226347 Escherichia phage lambda exo gene Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700042658 GAP-43 Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- DXMPMSWUZVNBSG-QEJZJMRPSA-N Gln-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N DXMPMSWUZVNBSG-QEJZJMRPSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- ZXGLLNZQSBLQLT-SRVKXCTJSA-N Gln-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZXGLLNZQSBLQLT-SRVKXCTJSA-N 0.000 description 1
- GQTNWYFWSUFFRA-KKUMJFAQSA-N Gln-Met-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GQTNWYFWSUFFRA-KKUMJFAQSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- BKLIAINBCQPSOV-UHFFFAOYSA-N Gluanol Natural products CC(C)CC=CC(C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(O)C(C)(C)C4CC3 BKLIAINBCQPSOV-UHFFFAOYSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 1
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 101710091977 Hydrophobin Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical class ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- FFFHZYDWPBMWHY-UHFFFAOYSA-N L-Homocysteine Natural products OC(=O)C(N)CCS FFFHZYDWPBMWHY-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- FBWIRBFZWNIGJC-LURJTMIESA-N L-dihomomethionine zwitterion Chemical compound CSCCCC[C@H](N)C(O)=O FBWIRBFZWNIGJC-LURJTMIESA-N 0.000 description 1
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 1
- SFSJZXMDTNDWIX-YFKPBYRVSA-N L-homomethionine Chemical compound CSCCC[C@H](N)C(O)=O SFSJZXMDTNDWIX-YFKPBYRVSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- LOPKHWOTGJIQLC-UHFFFAOYSA-N Lanosterol Natural products CC(CCC=C(C)C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(C)(O)C(C)(C)C4CC3 LOPKHWOTGJIQLC-UHFFFAOYSA-N 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 244000043158 Lens esculenta Species 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- ZAWOJFFMBANLGE-CIUDSAMLSA-N Lys-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N ZAWOJFFMBANLGE-CIUDSAMLSA-N 0.000 description 1
- KSFQPRLZAUXXPT-GARJFASQSA-N Lys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)C(=O)O KSFQPRLZAUXXPT-GARJFASQSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 1
- BIWVMACFGZFIEB-VFAJRCTISA-N Lys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N)O BIWVMACFGZFIEB-VFAJRCTISA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000220225 Malus Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- UFOWQBYMUILSRK-IHRRRGAJSA-N Met-Lys-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 UFOWQBYMUILSRK-IHRRRGAJSA-N 0.000 description 1
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 1
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 1
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 1
- LLKWSEXLNFBKIF-CYDGBPFRSA-N Met-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCSC LLKWSEXLNFBKIF-CYDGBPFRSA-N 0.000 description 1
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 1
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 1
- 241001148031 Methanococcoides burtonii Species 0.000 description 1
- 241000203353 Methanococcus Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 235000021360 Myristic acid Nutrition 0.000 description 1
- TUNFSRHWOTWDNC-UHFFFAOYSA-N Myristic acid Natural products CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 1
- BRMWTNUJHUMWMS-LURJTMIESA-N N(tele)-methyl-L-histidine Chemical compound CN1C=NC(C[C@H](N)C(O)=O)=C1 BRMWTNUJHUMWMS-LURJTMIESA-N 0.000 description 1
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- VMCWPGMERAIIKT-DEZAYANASA-N N1=C(C=CC(=C1)C[C@@H](N)C(=O)O)C1=NC=CC=C1.[NH3+][C@@H](C(=O)[O-])CCCCCC Chemical compound N1=C(C=CC(=C1)C[C@@H](N)C(=O)O)C1=NC=CC=C1.[NH3+][C@@H](C(=O)[O-])CCCCCC VMCWPGMERAIIKT-DEZAYANASA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- CAHGCLMLTWQZNJ-UHFFFAOYSA-N Nerifoliol Natural products CC12CCC(O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C CAHGCLMLTWQZNJ-UHFFFAOYSA-N 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 description 1
- VIIDDSZOUXRNDY-IUCAKERBSA-N OC(=O)[C@@H](N)CCCCNC(=O)[C@@H]1CCCN1 Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)[C@@H]1CCCN1 VIIDDSZOUXRNDY-IUCAKERBSA-N 0.000 description 1
- OZBFLQITCMCIOY-FOUAGVGXSA-N OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO Chemical compound OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO OZBFLQITCMCIOY-FOUAGVGXSA-N 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- JNRFYJZCMHHGMH-UBHSHLNASA-N Phe-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JNRFYJZCMHHGMH-UBHSHLNASA-N 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- MQWISMJKHOUEMW-ULQDDVLXSA-N Phe-Arg-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 MQWISMJKHOUEMW-ULQDDVLXSA-N 0.000 description 1
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 1
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 1
- NHHZWPNMYQUNEH-ACRUOGEOSA-N Phe-Tyr-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N NHHZWPNMYQUNEH-ACRUOGEOSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 101710124239 Poly(A) polymerase Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- XZGWNSIRZIUHHP-SRVKXCTJSA-N Pro-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 XZGWNSIRZIUHHP-SRVKXCTJSA-N 0.000 description 1
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102220637688 Ras-related protein Rab-33A_D91G_mutation Human genes 0.000 description 1
- 244000299790 Rheum rhabarbarum Species 0.000 description 1
- 235000009411 Rheum rhabarbarum Nutrition 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- JJUNLJTUIKFPRF-BPUTZDHNSA-N Ser-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N JJUNLJTUIKFPRF-BPUTZDHNSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- VBPDMBAFBRDZSK-HOUAVDHOSA-N Thr-Asn-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VBPDMBAFBRDZSK-HOUAVDHOSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 1
- PEYSVKMXSLPQRU-FJHTZYQYSA-N Trp-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PEYSVKMXSLPQRU-FJHTZYQYSA-N 0.000 description 1
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 1
- RYXOUTORDIUWNI-BPUTZDHNSA-N Trp-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RYXOUTORDIUWNI-BPUTZDHNSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- ZJKZLNAECPIUTL-JBACZVJFSA-N Trp-Gln-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ZJKZLNAECPIUTL-JBACZVJFSA-N 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- NLWCSMOXNKBRLC-WDSOQIARSA-N Trp-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLWCSMOXNKBRLC-WDSOQIARSA-N 0.000 description 1
- NESIQDDPEFTWAH-BPUTZDHNSA-N Trp-Met-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O NESIQDDPEFTWAH-BPUTZDHNSA-N 0.000 description 1
- GQEXFCQNAJHJTI-IHPCNDPISA-N Trp-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GQEXFCQNAJHJTI-IHPCNDPISA-N 0.000 description 1
- VUMCLPHXCBIJJB-PMVMPFDFSA-N Trp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N VUMCLPHXCBIJJB-PMVMPFDFSA-N 0.000 description 1
- IVBJBFSWJDNQFW-XIRDDKMYSA-N Trp-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IVBJBFSWJDNQFW-XIRDDKMYSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 1
- ITUAVBRBGKVBLH-BVSLBCMMSA-N Trp-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ITUAVBRBGKVBLH-BVSLBCMMSA-N 0.000 description 1
- UIRVSEPRMWDVEW-RNXOBYDBSA-N Trp-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N UIRVSEPRMWDVEW-RNXOBYDBSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 1
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- HZYXFRGVBOPPNZ-UHFFFAOYSA-N UNPD88870 Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)=CCC(CC)C(C)C)C1(C)CC2 HZYXFRGVBOPPNZ-UHFFFAOYSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 1
- DLMNFMXSNGTSNJ-PYJNHQTQSA-N Val-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N DLMNFMXSNGTSNJ-PYJNHQTQSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- PGNICAOCNIVZRV-NSHDSACASA-N [2-[[(5s)-5-amino-5-carboxypentyl]carbamoyloxymethyl]phenyl]-diazonioazanide Chemical compound OC(=O)[C@@H](N)CCCCNC(=O)OCC1=CC=CC=C1[N-][N+]#N PGNICAOCNIVZRV-NSHDSACASA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ASJWEHCPLGMOJE-LJMGSBPFSA-N ac1l3rvh Chemical class N1C(=O)NC(=O)[C@@]2(C)[C@@]3(C)C(=O)NC(=O)N[C@H]3[C@H]21 ASJWEHCPLGMOJE-LJMGSBPFSA-N 0.000 description 1
- 125000000641 acridinyl group Chemical class C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000023445 activated T cell autonomous cell death Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000013006 addition curing Methods 0.000 description 1
- 239000005409 aflatoxin Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- HAXFWIACAGNFHA-UHFFFAOYSA-N aldrithiol Chemical compound C=1C=CC=NC=1SSC1=CC=CC=N1 HAXFWIACAGNFHA-UHFFFAOYSA-N 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- 125000005336 allyloxy group Chemical group 0.000 description 1
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 150000004945 aromatic hydrocarbons Chemical class 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 229940049706 benzodiazepine Drugs 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- MJVXAPPOFPTTCA-UHFFFAOYSA-N beta-Sistosterol Natural products CCC(CCC(C)C1CCC2C3CC=C4C(C)C(O)CCC4(C)C3CCC12C)C(C)C MJVXAPPOFPTTCA-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- NJKOMDUNNDKEAI-UHFFFAOYSA-N beta-sitosterol Natural products CCC(CCC(C)C1CCC2(C)C3CC=C4CC(O)CCC4C3CCC12C)C(C)C NJKOMDUNNDKEAI-UHFFFAOYSA-N 0.000 description 1
- JCZLABDVDPYLRZ-AWEZNQCLSA-N biphenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C1=CC=CC=C1 JCZLABDVDPYLRZ-AWEZNQCLSA-N 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 125000001626 borono group Chemical group [H]OB([*])O[H] 0.000 description 1
- BTANRVKWQNVYAZ-UHFFFAOYSA-N butan-2-ol Chemical compound CCC(C)O BTANRVKWQNVYAZ-UHFFFAOYSA-N 0.000 description 1
- VTJUKNSKBAOEHE-UHFFFAOYSA-N calixarene Chemical class COC(=O)COC1=C(CC=2C(=C(CC=3C(=C(C4)C=C(C=3)C(C)(C)C)OCC(=O)OC)C=C(C=2)C(C)(C)C)OCC(=O)OC)C=C(C(C)(C)C)C=C1CC1=C(OCC(=O)OC)C4=CC(C(C)(C)C)=C1 VTJUKNSKBAOEHE-UHFFFAOYSA-N 0.000 description 1
- 238000007707 calorimetry Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 229910021393 carbon nanotube Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 150000001783 ceramides Chemical class 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000003508 chemical denaturation Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- UHZZMRAGKVHANO-UHFFFAOYSA-M chlormequat chloride Chemical compound [Cl-].C[N+](C)(C)CCCl UHZZMRAGKVHANO-UHFFFAOYSA-M 0.000 description 1
- BBJQPKLGPMQWBU-JADYGXMDSA-N cholesteryl palmitate Chemical compound C([C@@H]12)C[C@]3(C)[C@@H]([C@H](C)CCCC(C)C)CC[C@H]3[C@@H]1CC=C1[C@]2(C)CC[C@H](OC(=O)CCCCCCCCCCCCCCC)C1 BBJQPKLGPMQWBU-JADYGXMDSA-N 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 229910052593 corundum Inorganic materials 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 150000003983 crown ethers Chemical class 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 229940097362 cyclodextrins Drugs 0.000 description 1
- 125000001887 cyclopentyloxy group Chemical group C1(CCCC1)O* 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 1
- QHWZTVCCBMIIKE-SHYZEUOFSA-N dUDP Chemical compound O1[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 QHWZTVCCBMIIKE-SHYZEUOFSA-N 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 125000003374 diacylglycerol group Chemical group 0.000 description 1
- 150000001982 diacylglycerols Chemical class 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- QBSJHOGDIUQWTH-UHFFFAOYSA-N dihydrolanosterol Natural products CC(C)CCCC(C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(C)(O)C(C)(C)C4CC3 QBSJHOGDIUQWTH-UHFFFAOYSA-N 0.000 description 1
- OGQYPPBGSLZBEG-UHFFFAOYSA-N dimethyl(dioctadecyl)azanium Chemical compound CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC OGQYPPBGSLZBEG-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- WLGSIWNFEGRXDF-UHFFFAOYSA-N dodecanoic acid Chemical group CCCCCCCCCCCC(O)=O.CCCCCCCCCCCC(O)=O WLGSIWNFEGRXDF-UHFFFAOYSA-N 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 238000002848 electrochemical method Methods 0.000 description 1
- 239000008151 electrolyte solution Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- DNVPQKQSNYMLRS-SOWFXMKYSA-N ergosterol Chemical compound C1[C@@H](O)CC[C@]2(C)[C@H](CC[C@]3([C@H]([C@H](C)/C=C/[C@@H](C)C(C)C)CC[C@H]33)C)C3=CC=C21 DNVPQKQSNYMLRS-SOWFXMKYSA-N 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 125000001033 ether group Chemical group 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 125000004705 ethylthio group Chemical group C(C)S* 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 150000002191 fatty alcohols Chemical class 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000198 fluorescence anisotropy Methods 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- KYYWBEYKBLQSFW-UHFFFAOYSA-N hexadecanoic acid Chemical group CCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCC(O)=O KYYWBEYKBLQSFW-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 229920001600 hydrophobic polymer Polymers 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- NHXTZGXYQYMODD-UHFFFAOYSA-N icosanoic acid Chemical group CCCCCCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCCCCCC(O)=O NHXTZGXYQYMODD-UHFFFAOYSA-N 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 229920000592 inorganic polymer Polymers 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000011810 insulating material Substances 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 230000002687 intercalation Effects 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- 239000002608 ionic liquid Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 229940058690 lanosterol Drugs 0.000 description 1
- CAHGCLMLTWQZNJ-RGEKOYMOSA-N lanosterol Chemical compound C([C@]12C)C[C@@H](O)C(C)(C)[C@H]1CCC1=C2CC[C@]2(C)[C@H]([C@H](CCC=C(C)C)C)CC[C@@]21C CAHGCLMLTWQZNJ-RGEKOYMOSA-N 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 230000003489 leucocidal effect Effects 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 229960004502 levodopa Drugs 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- SJFKGZZCMREBQH-UHFFFAOYSA-N methyl ethanimidate Chemical compound COC(C)=N SJFKGZZCMREBQH-UHFFFAOYSA-N 0.000 description 1
- CXKWCBBOMKCUKX-UHFFFAOYSA-M methylene blue Chemical compound [Cl-].C1=CC(N(C)C)=CC2=[S+]C3=CC(N(C)C)=CC=C3N=C21 CXKWCBBOMKCUKX-UHFFFAOYSA-M 0.000 description 1
- 229960000907 methylthioninium chloride Drugs 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 101150060059 mspA gene Proteins 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 229940043348 myristyl alcohol Drugs 0.000 description 1
- DDBRXOJCLVGHLX-UHFFFAOYSA-N n,n-dimethylmethanamine;propane Chemical group CCC.CN(C)C DDBRXOJCLVGHLX-UHFFFAOYSA-N 0.000 description 1
- 238000001426 native polyacrylamide gel electrophoresis Methods 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
- 231100000957 no side effect Toxicity 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- RQFLGKYCYMMRMC-UHFFFAOYSA-N octadecanoic acid Chemical group CCCCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCCCC(O)=O RQFLGKYCYMMRMC-UHFFFAOYSA-N 0.000 description 1
- 235000021313 oleic acid Nutrition 0.000 description 1
- 229940055577 oleyl alcohol Drugs 0.000 description 1
- XMLQWXUVTXCDDL-UHFFFAOYSA-N oleyl alcohol Natural products CCCCCCC=CCCCCCCCCCCO XMLQWXUVTXCDDL-UHFFFAOYSA-N 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 150000002907 osmium Chemical class 0.000 description 1
- 125000004043 oxo group Chemical group O=* 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- TVIDEEHSOPHZBR-AWEZNQCLSA-N para-(benzoyl)-phenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 TVIDEEHSOPHZBR-AWEZNQCLSA-N 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000005453 pelletization Methods 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 229960005190 phenylalanine Drugs 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 1
- 230000036316 preload Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 125000002568 propynyl group Chemical group [*]C#CC([H])([H])[H] 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 102220198221 rs1057519921 Human genes 0.000 description 1
- 102220199485 rs1057524453 Human genes 0.000 description 1
- 102220289580 rs33916541 Human genes 0.000 description 1
- 102220036433 rs35389822 Human genes 0.000 description 1
- 102200076325 rs5658 Human genes 0.000 description 1
- 102200026914 rs730882246 Human genes 0.000 description 1
- 102220188881 rs747642461 Human genes 0.000 description 1
- 102220158369 rs886047453 Human genes 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 101150072534 sbcB gene Proteins 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 229940055619 selenocysteine Drugs 0.000 description 1
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 1
- 235000016491 selenocysteine Nutrition 0.000 description 1
- 229960001153 serine Drugs 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 229920002379 silicone rubber Polymers 0.000 description 1
- 239000004945 silicone rubber Substances 0.000 description 1
- KZJWDPNRJALLNS-VJSFXXLFSA-N sitosterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CC[C@@H](CC)C(C)C)[C@@]1(C)CC2 KZJWDPNRJALLNS-VJSFXXLFSA-N 0.000 description 1
- 229950005143 sitosterol Drugs 0.000 description 1
- 235000015500 sitosterol Nutrition 0.000 description 1
- NLQLSVXGSXCXFE-UHFFFAOYSA-N sitosterol Natural products CC=C(/CCC(C)C1CC2C3=CCC4C(C)C(O)CCC4(C)C3CCC2(C)C1)C(C)C NLQLSVXGSXCXFE-UHFFFAOYSA-N 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 229940032091 stigmasterol Drugs 0.000 description 1
- HCXVJBMSMIARIN-PHZDYDNGSA-N stigmasterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)/C=C/[C@@H](CC)C(C)C)[C@@]1(C)CC2 HCXVJBMSMIARIN-PHZDYDNGSA-N 0.000 description 1
- 235000016831 stigmasterol Nutrition 0.000 description 1
- BFDNMXAIBMJLBB-UHFFFAOYSA-N stigmasterol Natural products CCC(C=CC(C)C1CCCC2C3CC=C4CC(O)CCC4(C)C3CCC12C)C(C)C BFDNMXAIBMJLBB-UHFFFAOYSA-N 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 239000004149 tartrazine Substances 0.000 description 1
- 101150017218 tatD gene Proteins 0.000 description 1
- ZTUXEFFFLOVXQE-UHFFFAOYSA-N tetradecanoic acid Chemical group CCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCC(O)=O ZTUXEFFFLOVXQE-UHFFFAOYSA-N 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 125000000080 threosyl group Chemical group C1([C@@H](O)[C@H](O)CO1)* 0.000 description 1
- XXYIANZGUOSQHY-XLPZGREQSA-N thymidine 3'-monophosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](OP(O)(O)=O)C1 XXYIANZGUOSQHY-XLPZGREQSA-N 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 125000002640 tocopherol group Chemical group 0.000 description 1
- 235000019149 tocopherols Nutrition 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 101150097442 xthA gene Proteins 0.000 description 1
- 229910001845 yogo sapphire Inorganic materials 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
- JPZXHKDZASGCLU-LBPRGKRZSA-N β-(2-naphthyl)-alanine Chemical compound C1=CC=CC2=CC(C[C@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-LBPRGKRZSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y605/00—Ligases forming phosphoric ester bonds (6.5)
- C12Y605/01—Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
- C12Y605/01001—DNA ligase (ATP) (6.5.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/60—Detection means characterised by use of a special device
- C12Q2565/631—Detection means characterised by use of a special device being a biochannel or pore
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Peptides Or Proteins (AREA)
- Saccharide Compounds (AREA)
Abstract
本发明涉及将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的新方法。本发明还涉及表征靶多核苷酸的新方法。
Description
技术领域
本发明涉及将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的新方法。本发明还涉及 表征靶多核苷酸的新方法。
背景技术
目前需要一种具有广泛的应用范围的快速且廉价的多核苷酸(如DNA或RNA)测序和鉴定技术。现有的技术是缓慢的且昂贵的,这主要由于它们依赖于扩增技术来产生大量的多 核苷酸,且需要大量特定的用于信号检测的荧光化学物质。
跨膜孔(纳米孔)作为用于聚合物和各种小分子的直接的、电生物传感器,具有很大的潜力。特别是,目前作为一种有潜力的DNA测序技术的纳米孔得到了许多关注。
当跨纳米孔施加电势时,在,当分析物如核苷酸在桶(barrel)中短暂停留一段时间时,会产生电流的变化。所述核苷酸的纳米孔检测能产生已知特征和持续时间的电流变化。在链测 序方法中,单个多核苷酸链穿过所述孔并实现对核苷酸的鉴定。链测序可包括使用多核苷酸 结合蛋白来控制所述多核苷酸穿过所述孔的移动。
发明内容
令人惊讶地,发明人已经证明可以预装载一个或多个多核苷酸结合蛋白到一个或多个装载部分,然后连接所述一个或多个装载部分到所述靶多核苷酸。令人惊讶的是,所述一个或多个多核苷酸结合蛋白对所述一个或多个装载部分到多核苷酸的连接没有空间位阻。还令人惊讶的是,连接过程不影响所述一个或多个多核苷酸结合蛋白,且所述一个或多个多核酸结合蛋白在连接到靶多核苷酸后仍保留其结合到所述一个或多个装载部分的给功能和能力。
因此,本发明提供了一种用于将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法, 包括:
(a)提供结合到一个或多个装载部分的一个或多个多核苷酸结合蛋白;和
(b)将所述一个或多个装载部分连接到所述靶多核苷酸。
本发明还提供了表征靶多核苷酸的方法,包括:
(a)实施本发明所述的方法;
(b)将在步骤(a)中提供的连接有一个或多个多核苷酸结合蛋白的靶多核苷酸与跨膜孔接触,以使得所述一个或多个多核苷酸结合蛋白控制所述多核苷酸相对于所述孔的移动; 和
(c)随着所述多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代 表所述多核苷酸的一个或多个特征,并由此表征所述靶多核苷酸。
本发明还提供了一种制备用于表征的靶多核苷酸的方法,包括:
(a)实施本发明的方法,其中所述一个或多个多核苷酸结合蛋白包含一个或多个聚合 酶;和
(a)使用所述靶多核苷酸作为模板,使得在步骤(a)中提供的连接到所述靶多核苷酸的所述一个或多个聚合酶形成一个或多个多核苷酸,并由此制备用于表征的所述靶多核苷 酸。
本发明还提供一种表征靶多核苷酸的方法,包括:
(a)实施本发明所述的基于聚合酶的方法;
(b)将在步骤(a)中产生的所述靶多核苷酸及所述一个或多个多核苷酸与跨膜孔接触, 使得所述靶多核苷酸及所述一个或多个多核苷酸相对于所述孔移动;和
(c)随着所述靶多核苷酸和所述一个或多个多核苷酸相对于所述孔移动,获取一个或 多个测量值,其中所述测量值代表所述多核苷酸的一个或多个特征,并由此表征所述靶多核 苷酸。
本发明还提供:
-使用本发明所述的方法修饰的靶多核苷酸;
-具有一个或多个所结合的多核苷酸结合蛋白的装载部分;和
-用于将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的试剂盒,包含(a)结合到一 个或多个装载部分的所述一个或多个多核苷酸结合蛋白;和(b)连接酶。
附图说明
图1示出了使用8mL POROS HQ-10柱将预结合到DNA发夹衔体的TrwC Cba-L376C/Q594A/K762C纯化后的示例性FPLC轨迹。
图2示出了使用5mL Histrap HP柱将预结合到DNA发夹衔体的TrwC Cba-L376C/Q594A/K762C纯化后的示例性FPLC轨迹。
图3示出了TBE(天然的)PAGE凝胶分析(DNA校准带对应在凝胶的顶部示出的DNA浓度),柱1示出了在只有缓冲液中结合到DNA发夹衔体的TrwC Cba-L376C/Q594A/K762C(显示为条带X),柱2示出了添加TRIS缓冲液后结合到DNA发夹衔体的TrwC Cba-L376C/Q594A/K762C,柱3示出了添加双马来酰亚胺基乙烷后结合到DNA发夹衔体的 TrwC Cba-L376C/Q594A/K762C,柱4-6示出了经两次FPLC纯化后结合到DNA发夹衔体的不同稀释浓度的TrwC Cba-L376C/Q594A/K762C。条带X对应结合到DNA的酶。条带Y对 应没有酶结合的DNA。
图4示出了SDS PAGE凝胶分析(DNA校准带对应在凝胶的顶部示出的DNA浓度), 柱1示出了在只有缓冲液中结合到DNA发夹衔体的TrwC Cba-L376C/Q594A/K762C(显示为 条带X),柱2示出了添加TRIS缓冲液后结合到DNA发夹衔体的TrwC Cba-L376C/Q594A/K762C,柱3示出了添加双马来酰亚胺基乙烷后结合到DNA发夹衔体的 TrwC Cba-L376C/Q594A/K762C,柱4-6示出了经两次FPLC纯化后结合到DNA发夹衔体的不同稀释浓度的TrwC Cba-L376C/Q594A/K762C。条带Y对应DNA上没有闭合的酶。条带 X对应由双马来酰亚胺基乙烷连接体结合到DNA上的酶。
图5示出了TBE(天然的)PAGE凝胶分析(DNA校准带对应在凝胶的顶部显示的DNA浓度),柱1示出了在添加TMAD前结合到DNA发夹衔体的T4 Dda- E94C/C109A/C136A/A360C。柱2示出了添加KCl和ATP之后结合到DNA发夹衔体的T4 Dda-E94C/C109A/C136A/A360C,柱3示出了SPRI纯化后结合到DNA发夹衔体的T4Dda–E94C/C109A/C136A/A360C。条带2:1示出了两个结合的酶,条带1:1示出了一个结合的酶。DNA条带对应单独的DNA。
图6示出了当解旋酶T4 Dd-E94C/C109A/C136A/A360C和TrwC Cba-L376C/Q594A/K762C控制DNA构建体(参见上文电流轨迹)移位穿过MspA纳米孔时 的示例电流轨迹。x轴对应时间(秒)以及y轴对应电流(pA)。所述轨迹示出了在所述两种解旋酶控制下单个DNA链移动穿过纳米孔,标记的区域1和2对应DNA构建体的区域1 和2的移位。所述轨迹示出了在解旋酶T4 Dda-E94C/C109A/C136A/A360C和TrwC Cba-L376C/Q594A/K762C二者控制下构建体Y移位穿过纳米孔时观察到的电流轨迹。箭头标记的3示出了当发夹衔体中的间隔器移位穿过纳米孔时电流的尖峰。所述发夹衔体和Y衔体间隔器在电流轨迹上方的DNA构建体的图片中以x示出。
图7示出了Agilent生物分析仪轨迹,表明酶预结合到MuA Y衔体。A)未预结合衔体。 B)预结合衔体。
图8示出了Agilent生物分析仪轨迹,表明当酶预结合到MuA Y衔体时,没有见到对靶 DNA的副作用。A)未预结合衔体。B)预结合衔体。
图9示出了当由解旋酶控制DNA移动穿过使用由MuA标签技术(tagmentation)产生的 DNA制备的纳米孔时的示例电流轨迹。
图10示出了具有预结合的E1(A片段)及E2(END片段)的A片段(见分图A)和 END片段(见分图B)的装载部分。这两个装载部分接合到实施例6中的基因组DNA。所述 A片段具有标记为1的39个SpC3间隔器的区域。SEQ ID NO:32对应标记为2的区域,其为E1结合的区域。标记为3的区域对应4个iSp18间隔器。标记为4的区域对应SEQ ID NO:33。 标记为5的区域对应SEQ ID NO:34。标记为6的区域对应一个iBNA-meC、两个iBNA-A和 两个iBNA-meC。标记为7的区域对应SEQ ID NO:35。END片段中的标记为8的区域对应SEQ ID NO:36。标记为9的区域对应SEQ ID NO:37。标记为11区域对应SEQ ID NO:38。
图11示出了当解旋酶T4 Dda-(H82R/E94C/A360C)(具有突变H82R/E94C/A360C的SEQ ID NO:24,E1)和T4 Dda-E94C/C109A/C136A/A360C(具有突变E94C/C109A/C136A/A360C的SEQ ID NO:24,E2)控制样本4中的DNA构建体图(图顶部示出)移位穿过MspA纳米孔时的示例性图。x轴对应移动指数,而y轴对应电流(pA)。对于移动穿过所述孔的每条DNA链,测量作为时间的函数的电流。移动的DNA导致测得的电流水平的逐步变化。将观察到的电流水平拟合以得到每一步的平均电流并为所述电流水平分配递增的移动指数点数。相对于移动指数的平均电流因此近似于原有的电流信号并且用于表征移位的DNA。该图示出了在所 述两种酶的控制下单个DNA链移动穿过纳米孔,标记的区域1和2对应DNA构建体的区域 1和2的移位。该轨迹示出了在解旋酶T4 Dda-(H82R/E94C/A360C)和T4 Dda-E94C/C109A/C136A/A360C二者控制下当构建体移位穿过孔时所观察到的移动指数。箭头标记的3示出了在发夹衔体中的间隔器移位穿过纳米孔时的电流中的尖峰。所述的发夹衔 体和Y衔体间隔器在所述轨迹上面的DNA构建体图片中以x示出。
图12示出了解旋酶前导复合体(见分图A)、聚合酶链复合体(见分图B)和具有预结合的聚合酶(标记为X1,Phi29-A411C/Q560C(具有突变A411C/Q560C的SEQ ID NO:9))和解旋酶(标记为Y1,T4 Dda-E94C/C109A/C136A/A360C(具有突变E94C/C109A/C136A/A360C的SEQ ID NO:24))二者的解旋酶/聚合酶前导复合体的最终装载 部分(见分图C)。在实施例7中,该最终装载部分被接合到3.6kb DNA链(SEQ ID NO:46)。 标记为1的区域对应30个SpC3间隔器。SEQ ID NO:27对应标记为2的区域,其为T4 Dda-E94C/C109A/C136A/A360C所结合的区域。标记为3的区域对应4个iSp18间隔器。标记为4的区域对应SEQ ID NO:28。标记为5的区域对应SEQ ID NO:43。标记为6的区域对应 SEQ ID NO:44,其3’末端连接到4个iSpC3间隔器,所述间隔器在相对端连接到SEQ ID NO: 45的5’末端。Phi29-A411C/Q560C结合到区域6。
图13示出了在实施例7中在连接步骤之后并且聚合步骤之前产生的DNA构建体。标记 为1的区域对应30个SpC3间隔器。SEQ ID NO:27对应标记为2的区域,其为T4 Dda-E94C/C109A/C136A/A360C所结合的区域。标记为3的区域对应4个iSp18间隔器。标记为4的区域对应SEQ ID NO:28。标记为5的区域对应SEQ ID NO:43。标记为6的区域对应SEQ IDNO:44,其3’末端连接到4个iSpC3间隔器,所述间隔器在相对端连接到SEQ ID NO:45的5’末端。Phi29-A411C/Q560C结合到区域6。标记为7的区域对应SEQ ID NO:46。标记为 8的区域对应SEQ ID NO:47。标记为9的区域对应SEQ ID NO:31。
图14示出了当解旋酶T4 Dda-E94C/C109A/C136A/A360C(标记为Y1)控制样本5中的 DNA构建体(在该图顶部示出)移位穿过MspA纳米孔时的示例性图。x轴对应移动指数,而y轴对应电流(pA)。对于移动穿过所述孔的每条DNA链,测量作为时间函数的电流。移动的DNA导致测得的电流水平的逐步变化。将观察到的电流水平拟合以得到每一步的平均电流并为所述电流水平分配递增的移动指数点数。相对于移动指数的平均电流因此近似于原有电流信号并且用于表征转移的DNA。该图示出了在解旋酶的控制下DNA单链移动穿过纳米孔,标记区域1和2对应原始的3.6kb DNA构建体(SEQ ID NO:46)的区域1和2的移位。标记区域4和5对应使用Phi29-A411C/Q560C经聚合产生的区域1和2的互补链。轨迹示出 了在T4Dda-E94C/C109A/C136A/A360C的控制下当构建体移位穿过孔时观察到的移动指数。 箭头标记的3示出了在最终构建体的发夹中的间隔器(在图14的顶部构建体图表中示为x和 标记为3)移位穿过纳米孔时的电流中的尖峰。所述的发夹衔体和Y衔体间隔器在该图上面 的DNA构建体图片中以x示出。
图15示出了在200V运行60分钟然后使用SYBR染色的4-20%的TBE PAGE。在凝胶上运行的各个样品为400nM(5μL)。列1对应100bp梯子(条带对应的碱基对的数目沿凝胶 的侧部示出)。列2对应在图12A中示出的没有结合解旋酶的解旋酶前导复合体。列3对应在图12A中示出的结合了解旋酶的解旋酶前导复合体。列4对应在图12B中示出的没有结合 聚合酶的聚合酶链复合体。列5对应在图12B中示出的结合了聚合酶的聚合酶链复合体。条 带A对应SEQ ID NO:43。条带B对应在3’端连接到SEQ ID NO:27的5’末端的DNA链X=30 个iSpC3间隔器,SEQ ID NO:27在3’末端连接到4个iSp18间隔器,所述4个iSp18间隔器 在相对端连接到SEQ ID NO:28的5’末端。条带C对应结合到DNA链X的解旋酶(T4Dda-E94C/C109A/C136A/A360C)。条带D对应没有结合酶的聚合酶链复合体(SEQ ID NO:44, 其3’末端连接到4个iSpC3间隔器,所述iSpC3间隔器在相对端连接到SEQ ID NO:45的5’ 末端)。条带E对应结合到所述聚合酶链复合体的Phi29-A411C/Q560C。
图16的A)中示出了在连接前没有将聚合酶(标记为x)预结合到装载部分的双链靶多核 苷酸的衔体连接方法和聚合方法的实例,B)中示出了用预结合的解旋酶(标记为y)和预结合的聚合酶(标记为x)两者连接装载部分,然后聚合所述双链靶多核苷酸的本发明方法的实例。步骤1A显示了将衔体连接到双链靶多核苷酸的任一端。步骤2A示出了聚合酶(标记为 x)的结合。步骤3A示出了双链靶多核苷酸的聚合,使用所述靶作为模板形成的多核苷酸用 虚线示出。步骤4A示出了新的双链构建体的末端修复、构建体的A尾以及用预结合的解旋酶与装载部分的连接(标记为y)。步骤1B示出了含有预结合的解旋酶(标记为y)和预结合的聚合酶(标记为x)二者的装载部分的连接。步骤2B示出了双链靶多核苷酸的聚合。B 中不需要进一步的步骤,因此该方法包括比A中示出的方法明显更少的步骤。
图17示出了包含预结合的解旋酶(标记为y)和预结合的聚合酶(标记为x)的装载部 分,该装载部分随后被连接(步骤1)到双链靶多核苷酸的两条链(一条链标记为T1用于模 板,另一条标记为C1用于互补),该双链靶多核苷酸在一端由桥连部分衔体(标记为z)连接。在装载部分中,解旋酶从与聚合酶结合的链结合到相对的链。所述与聚合酶结合的链含有3’发夹环(标记为v)。在本实施方案中,聚合酶将产生双链构建体(步骤2),其中所述 构建体的两条链在一端由桥连部分(标记为v)连接,而且所述构建体的每条链包含靶多核苷酸的一条链(示为实线,且标记为T1和C1)和由聚合酶形成的互补多核苷酸(示为虚线, 且标记为T2和C2)。
图18示出了包含预结合的聚合酶(标记为x)和预结合的解旋酶(标记为y)的装载部 分,其随后连接(步骤1)到双链靶多核苷酸的两条链的每一端,所述两条链的任一端没有由 桥连部分连接。在装载部分中,解旋酶从与聚合酶结合的链结合到相对的链。所述与聚合酶结合的链含有3’发夹环(标记为v)。在本实施方案中,聚合酶将产生两个双链构建体(步骤 2),其中每个构建体的两条链在一端由桥连部分连接(标记为v1或v2),并且每个构建体包含靶多核苷酸的一条链(示为实线)和由聚合酶形成的互补多核苷酸(示为虚线)。
图19示出了包含预结合的聚合酶(标记为x)和预结合的解旋酶(标记为y)的装载部 分(标记为v的桥连部分衔体和标记为w的杂合前导体),其随后连接(步骤1)到双链靶多核苷酸的每一端,以使它们在两端由装载部分(前述的标记的w和v)连接以形成环形构建体。在本实施例中,所述桥连部分衔体包含预结合了解旋酶(标记为y)的多核苷酸前导体(标记为w),其杂合到所述桥连部分衔体(标记为v)。由该多核苷酸(标记为w)杂合到 所述桥连部分衔体而形成的双链段形成了用于结合聚合酶的引物位点。当聚合酶扩展启动时(步骤2)(例如,通过添加核苷酸和辅因子),用为原始靶DNA的互补拷贝的DNA生成两个构建体,并且取决于聚合酶围绕该环形构建体进行的程度,所述两个构建体将含有T1和 C1的多个拷贝段。
序列表的说明
SEQ ID NO:1示出了编码MS-B1突变体MspA单体的密码子优化的多核苷酸序列。该突 突变缺少信号序列,并包括下列突变:D90N、D91N、D93N、D118R、D134R和E139K。
SEQ ID NO:2示出了MspA单体的MS-B1突变体的成熟形式的氨基酸序列。该突变体缺 少信号序列,并包括下列突变:D90N、D91N、D93N、D118R、D134R和E139K。
SEQ ID NO:3示出了编码α-溶血素-E111N/K147N(α-HL-NN;Stoddart等人,PNAS,2009; 106(19):7702-7707)的一个单体的多核苷酸序列。
SEQ ID NO:4显示了α-HL-NN的一个单体的氨基酸序列。
SEQ ID NO:5至SEQ ID NO:7显示了MspB,C和D的氨基酸序列。
SEQ ID NO:8显示了编码Phi29 DNA聚合酶的多核苷酸序列。
SEQ ID NO:9显示了Phi29 DNA聚合酶的氨基酸序列。
SEQ ID NO:10显示了由大肠杆菌的sbcB基因衍生的密码子优化的多核苷酸序列。它编 码来自大肠杆菌的核酸外切酶I(EcoExoⅠ)。
SEQ ID NO:11显示了来自大肠杆菌的核酸外切酶I酶(EcoExoⅠ)的氨基酸序列。
SEQ ID NO:12显示了从大肠杆菌的xthA基因衍生的密码子优化的多核苷酸序列。其编 码来自大肠杆菌的核酸外切酶III。
SEQ ID NO:13显示了来自大肠杆菌的核酸外切酶III的氨基酸序列。这种酶在3'-5'的方 向对双链DNA(dsDNA)的一条链的5'单磷酸核苷进行分配消化。链上酶的启动需要约4个 核苷酸的5'突出。
SEQ ID NO:14显示了由嗜热栖热菌(T.thermophilus)的recJ基因衍生的密码子优化的多 核苷酸序列。其编码来自嗜热栖热菌的RecJ酶(TthRecJ-cd)。
SEQ ID NO:15显示了来自嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。该酶在 5'-3'的方向对ssDNA的5'单磷酸核苷进行进行性(processive)消化。链上酶的启动需要至少 4个核苷酸。
SEQ ID NO:16显示了由细菌噬菌体λ(redX)核酸外切酶基因衍生的密码子优化的多核 苷酸序列。其编码细菌噬菌体λ核酸外切酶。
SEQ ID NO:17显示了细菌噬菌体λ核酸外切酶的氨基酸序列。该序列是装配成三聚体 的三个相同的亚基之一。该酶在5'-3'方向上对dsDNA的一条链的核苷酸进行高度的进行性消化,(http://www.neb.com/nebecomm/products/productM0262.asp)。链上酶的启动优选需要约 4个具有5'磷酸的核苷酸的5'突出。
SEQ ID NO:18显示了Hel308 Mbu的氨基酸序列。
SEQ ID NO:19显示了Hel308 Csy的氨基酸序列。
SEQ ID NO:20显示了Hel308 Tga的氨基酸序列。
SEQ ID NO:21显示了Hel308 Mhu的氨基酸序列。
SEQ ID NO:22显示了Tral Eco的氨基酸序列。
SEQ ID NO:23显示了XPD Mbu的氨基酸序列。
SEQ ID NO:24显示了Dda 1993的氨基酸序列。
SEQ ID NO:25显示了Trwc Cba的氨基酸序列。
SEQ ID NO:26显示了在实施例1中使用的多核苷酸序列。此序列具有5'磷酸。
SEQ ID NO:27显示了在实施例2和7中使用的多核苷酸序列。
SEQ ID NO:28显示了在实施例2和7中使用的多核苷酸序列。
SEQ ID NO:29显示了在实施例1中使用的多核苷酸序列。此序列具有5'磷酸。
SEQ ID NO:30显示了在实施例1中使用的多核苷酸序列。
SEQ ID NO:31显示了在实施例7中使用的多核苷酸序列。此序列具有5'胆固醇TEG。
SEQ ID NO:32显示了在实施例6中使用的多核苷酸序列。连接到SEQ ID NO:32的5’ 末端的是39个SpC3间隔器。连接到SEQ ID NO:32的3’末端的是在相对端连接到SEQ IDNO: 33的5’末端的4个iSP18间隔器。
SEQ ID NO:33显示了在实施例6中使用的多核苷酸序列。连接到SEQ ID NO:33的5’ 末端的是在相对端连接到SEQ ID NO:32的3’末端的4个iSP18间隔器。
SEQ ID NO:34显示了在实施例6中使用的多核苷酸序列。连接到3’末端的是一个iBNA-meC、两个iBNA-A和两个iBNA-meC,所述两个iBNA-meC在相对端连接到3个iSp18 间隔器,所述3个iSp18间隔器连接到SEQ ID NO:35的5’末端。
SEQ ID NO:35显示了在实施例6中使用的多核苷酸序列。连接到5’末端的是3个iSp18 间隔器,所述间隔器在相对端连接两个iBNA-meC、两个iBNA-A和一个iBNA-meC,所述iBNA-meC在相对端连接到连接SEQ ID NO:34的3’末端。
SEQ ID NO:36显示了在实施例6中使用的多核苷酸序列。连接到SEQ ID NO:36的5’ 末端的是磷酸。连接到SEQ ID NO:36的3’末端的是四个在相对端连接到SEQ ID NO:37的 5’末端的iSp18间隔器。
SEQ ID NO:37显示了在实施例6中使用的多核苷酸序列。连接到SEQ ID NO:37的5’ 末端的是在相对端连接到SEQ ID NO:36的3’末端的4个iSp18间隔器。
SEQ ID NO:38显示了在实施例6中使用的多核苷酸序列。
SEQ ID NO:39显示了在实施例6中使用的多核苷酸序列。连接于SEQ ID NO:39的5’ 末端的是磷酸。连接到SEQ ID NO:39的3’末端的是在相对端连接到SEQ ID NO:40的5’末 端的四个iSpC3间隔器。
SEQ ID NO:40显示了在实施例6中使用的多核苷酸序列。连接到SEQ ID NO:40的5’ 末端的是在相对端连接到SEQ ID NO:39的3’末端的四个iSpC3间隔器。
SEQ ID NO:41显示了在实施例6中使用的多核苷酸序列。SEQ ID NO:41是与SEQID NO:42互补的。
SEQ ID NO:42显示了在实施例6中使用的多核苷酸序列。SEQ ID NO:42是与SEQID NO:41互补的。
SEQ ID NO:43显示了在实施例7中使用的多核苷酸序列。
SEQ ID NO:44显示了在实施例7中使用的多核苷酸序列。该序列具有5'磷酸。SEQID NO:44的3’末端连接到4个iSpC3间隔器,所述4个iSpC3间隔器在相对端连接到SEQ IDNO: 45的5’末端。
SEQ ID NO:45显示了在实施例7中使用的多核苷酸序列。该序列在其5’末端连接到四 个iSpC3间隔器,所述四个iSpC3间隔器在相对端连接到SEQ ID NO:44的3’末端。
SEQ ID NO:46显示了在实施例7中使用的多核苷酸序列。
SEQ ID NO:47显示了在实施例7中使用的多核苷酸序列。该序列具有5'磷酸和在该序 列的3’末端的基于胸腺嘧啶的硫代磷酸酯碱基。
具体实施方式
应该理解的是,所公开的产品和方法的不同应用可以适用于本领域中的特定需要。也应 理解的是,这里使用的术语仅用于描述本发明的具体实施方案,并且不意在限制。
此外,除非内容另外明确指出,否则用于本说明书和所附权利要求书中的单数形式“一”, “一个”,和“所述”包括复数指代。因此,例如,涉及“多核苷酸”时包括两个或多个多核苷酸,涉及“酶”时包括两个或多个酶,涉及“解旋酶”时包括两个或多个解旋酶,涉及“分子制动器(molecular brake)”时指两个或多个分子制动器,涉及“跨膜孔”时包括两 个或多个孔,等。
文本无论在上文还是下文中引用的所有出版物、专利和专利申请,以全文参考的方式引 入本文。
本发明的方法
本发明提供一种将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法。提供了结合 到(或连接到)一个或多个装载部分的所述一个或多个多核苷酸结合蛋白。所述一个或多个装载部分被连接到所述的靶多核苷酸。这将所述一个或多个多核苷酸结合蛋白连接到所述靶多核苷酸。一旦所述一个或多个多核苷酸结合蛋白以此种方式连接,它们可被用于控制所述靶 多核苷酸穿过跨膜孔的移动或使用所述靶多核苷酸作为模板形成一个或多个多核苷酸(例如 修饰所述靶多核苷酸)。这允许对待表征的靶多核苷酸在下文做更具体的讨述。
本发明具有多种优点。
i.将多核苷酸结合蛋白预装载到装载部分上加速了样品制备过程,并且意味着使用更少 的试管。
ii.尽可能接近100%的所得靶多核苷酸的实例具有连接的多核苷酸结合蛋白。这可以改善 后续的必需过程的产率。
iii.如果客户不将一个或多个多核苷酸结合蛋白装载到一个或多个装载部分上,客户错误 减少。
iv.连接后无过量的多核苷酸结合蛋白(其可阻塞所述孔或具有一些其他不需要的活动)残 留。
v.提高了所述一个或多个多核苷酸结合蛋白的稳定性。结合到多核苷酸的蛋白可能更稳 定。
vi.过量的装载部分可作为正确地建立系统的对照(例如在缓冲液中的ATP等)。
vii.用户可控制一个或多个多核苷酸结合蛋白的顺序,以使它们以正确的序列装载在一个 装载部分上。
viii.使用者可控制哪个多核苷酸结合蛋白连接到哪个装载部分,例如Y衔体对桥连部分。
ix.所述一个或多个多核苷酸结合蛋白可用于纯化所述一个或多个装载部分。
x.用户可以对连接到不同的装载部分的多核苷酸结合蛋白做出不同的修饰。
xi.不同的多核苷酸结合蛋白可以优选不同的结合条件,并因此它可有助于能够预装载它 们到不同的装载部分上(而不是一起装载在靶多核苷酸上)。
xii.如果一个或多个多核苷酸结合蛋白被预装载,连接后应该没有任何游离的多核苷酸结 合蛋白存在,并因此所述蛋白可用于纯化构建体。
xiii.本发明最小化的使用所述的一个或多个多核苷酸结合蛋白,因此存在较少浪费。
xiv.用户可以控制所述一个或多个多核苷酸结合蛋白相对于靶多核苷酸结合的位置或不 相对于所述靶多核苷酸结合。通过预装载所述一个或多个多核苷酸结合蛋白到一个或多个装 载部分上,所述一个或多个多核苷酸结合蛋白不直接结合到所述靶多核苷酸。
xv.本发明还提高了序列信息的产率,例如当聚合酶复制靶链时。产率可通过低效的蛋白 结合限制,且还缺乏持续合成能力。预装载克服了装载低效性,且产生了克服持续合成问题 的闭合复合体。
本发明还提供一种表征靶多核苷酸的方法。一旦所述一个或多个多核苷酸结合蛋白已经 被装载到靶多核苷酸上,它们可与跨膜孔接触,以使得所述一个或多个多核苷酸结合蛋白控制多核苷酸相对于所述孔的移动,例如穿过所述孔。该方法还包括当所述多核苷酸相对于所述孔移动时,获取一个或多个测量值。所述测量值表示多核苷酸的一个或多个特征,如序列。
已经表明了可以使用跨膜孔有效地表征双链多核苷酸,如果所述双链多核苷酸被修饰为 包括含有前导序列的Y衔体(双链茎干和两个非互补臂)和桥连部分衔体,如发夹环衔体 (WO2013/014451)。优选为,含有前导序列的Y衔体连接到多核苷酸的一端,而桥连部分衔体连接到另一端。前导序列优选螺入纳米孔,且连接所述多核苷酸的两条链的桥连部分(如 发夹环)使得待测试的作为多核苷酸的两条链解开且使得两条链(经桥连部分连接)相对于 所述孔移动,如穿过所述孔。这是有利的,因为其使从单个双链多核苷酸获得的信息量加倍。另外,因为两条链中的序列是互补的,因此来自两条链中的信息可以进行信息合并。这种机制提供了提供更高的可信观察结果的正交校阅能力。根据本发明使用的一个或多个装载部分 可以是Y衔体和/或桥连部分衔体。这在下文更详细地讨论。
本发明还提供了一种制备用于表征的靶多核苷酸的方法。该方法可用于改进用于表征的 靶多核苷酸。该方法可以用于修饰或扩增靶多核苷酸。一旦一个或多个聚合酶已被装载到靶多核苷酸上,它们可以被允许使用所述靶多核苷酸作为模板以形成一个或多个多核苷酸。如果靶多核苷酸是单链的,则形成另一个互补的多核苷酸。如果所述靶多核苷酸是双链的,则 优选通过所述一个或多个聚合酶将两条链用作模板。因为来自靶多核苷酸的链和由一个或多个聚合酶产生的新的多核苷酸是互补的,来自它们的信息可以如上所述进行信息合并。这种类型的方法也在WO2013/014451中公开。由聚合酶形成的多核苷酸可包含与靶多核苷酸相同 种类的多核苷酸或不同种类的多核苷酸,如下详述。靶多核苷酸可以被修饰,如下文所详述。 所述的一个或多个聚合酶可以使用Y型衔体和/或桥连部分衔体被装载到靶多核苷酸上,如下 文所详述。
多核苷酸
所述靶多核苷酸可以是任何多核苷酸。多核苷酸如核酸是含有两个或更多个核苷酸的大 分子。所述多核苷酸或核酸可包括任何核苷酸的任意组合。核苷酸可以是天然存在的或人工合成的。多核苷酸中的一个或多个核苷酸可以被氧化或甲基化。多核苷酸中的一个或多个核苷酸的可被损坏。例如,多核苷酸可包含嘧啶二聚体。此类二聚体通常与紫外线导致的损坏 相关,且是皮肤黑素瘤的首要原因。多核苷酸中的一个或多个核苷酸可被修饰,例如用标记 物或标签。合适的标记物如下所述。所述多核苷酸可包含一个或多个间隔器。
核苷酸通常含有核碱基、糖和至少一个磷酸基团。所述核碱基和糖形成核苷。核苷酸可 以是天然核苷酸或非天然核苷酸。
核苷碱基通常为杂环的。核碱基包括但不限于:嘌呤和嘧啶,更具体地,腺嘌呤(A)、 鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)和胞嘧啶(C)。
糖通常为戊糖。核苷酸糖包括但不限于,核糖和脱氧核糖。所述糖优选为脱氧核糖。
所述多核苷酸中的核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。所述多核苷酸可包含以 下核苷:腺苷,尿苷,鸟苷和胞苷。核苷酸优选为脱氧核糖核苷酸。所述多核苷酸优选包含 下列核苷:脱氧腺苷(dA)、脱氧尿苷(dU)和/或胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。
所述核苷酸通常含有单磷酸、二磷酸或三磷酸。磷酸酶可以被连接在核苷酸的5'或3'侧。
合适的核苷酸包括但不限于,单磷酸腺苷(AMP)、单磷酸鸟苷(GMP)、单磷酸胸苷(TMP)、单磷酸尿苷(UMP)、单磷酸胞苷(CMP)、环单磷酸腺苷(cAMP)、环单磷 酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、单磷酸脱氧鸟苷(dGMP)、单磷酸脱氧胸苷(dTMP)、单磷酸脱氧尿苷(dUMP)和单磷酸脱氧胞苷(dCMP)。所述核苷酸优选选自 AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP、dCMP和dUMP。核苷酸最优选选自dAMP、dTMP、dGMP、dCMP和dUMP。多核苷酸优选包含下列核苷酸:dAMP、dUMP 和/或dTMP、dGMP和dCMP。
多核苷酸中的核苷酸可以以任何方式彼此连接。如在核酸中一样,核苷酸通常通过它们 的糖和磷酸基团连接。如嘧啶二聚体中一样,所述核苷酸可通过它们的核碱基连接。
所述多核苷酸可以是单链或双链的。至少所述多核苷酸的一部分优选为双链的。
所述多核苷酸可以是核酸。多核苷酸可以是本领域中已知的任何合成核酸,例如肽核酸 (PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)、桥连核酸(BNA)或 其它具有核苷酸侧链的合成聚合物。PNA骨架是由通过肽键连接的N-(2-氨基乙基)甘氨酸重复单元组成。GNA骨架是由通过磷酸二酯键连接的甘油重复单元组成。TNA骨架是由通过 磷酸二酯键连接在一起的苏糖重复单元组成。LNA是由在核糖部分中具有连接2'氧和4'碳的 额外的桥的如上所述的核糖核苷酸形成。桥连核酸(BNA)为经修饰的RNA核苷酸。它们也 可以被称为被约束的或不可接近的RNA。BNA单体可含有具有“固定的”C3'-内糖起褶(C3’-endosugar puckering)的五元的、六元的或甚至七元的桥连结构。所述桥连是在核糖的 2',4'-位置通过合成而引入的,以产生2',4'-BNA单体。
所述多核苷酸最优选为核糖核酸(RNA)或脱氧核糖核酸(DNA)。
所述多核苷酸可以是任何长度。例如,多核苷酸可以是至少10、至少50、至少100、至 少150、至少200、至少250、至少300、至少400或至少500个核苷酸的长度。所述多核苷酸可以是1000或更多个核苷酸、5000或更多个核苷酸,或100000或更多个核苷酸长度。
在本发明的方法中解旋酶可以沿整个多核苷酸或仅多核苷酸的一部分移动。可以使用本 发明的方法来表征所述整个靶多核苷酸或仅靶多核苷酸的一部分。
所述多核苷酸可以是单链的。至少多核苷酸的一部分优选为双链的。解旋酶通常结合到 单链多核苷酸。如果所述多核苷酸的至少一部分为双链的,所述多核苷酸优选包含单链区域或非杂合区域。所述一个或多个解旋酶能够结合到该单链区域或所述的非杂合区域的一条链。所述多核苷酸优选包含一个或多个单链区域或一个或多个非杂合区域。
所述一个或多个间隔器优选包括在多核苷酸的单链区域或非杂合区域中。所述多核苷酸 可包含多于一个的单链区域或多于一个的非杂合区域。所述多核苷酸可在其序列内和/或在其 一端或两端包含单链区域或非杂合区域。所述一个或多个间隔器可以被包括在多核苷酸的双链区域中。
如果在所述方法中使用的一个或多个解旋酶以5'至3'的方向移动,则多核苷酸优选地在其 5'末端包含单链区域或非杂合区域。如果在所述方法中使用的一个或多个解旋酶以3'至5'的方 向移动,则所述多核苷酸优选地在其3'末端包含单链区域或非杂合区域。如果所述一个或多个解旋酶在非激活模式下使用(即作为制动器),则其中单链区域或非杂合区域定位的位置是不重要的。
单链区域优选包含优选螺入所述孔的前导序列。这将在下文详述。
如果所述多核苷酸的至少一部分为双链,则所述双链部分的两条链优选使用桥连部分, 如发夹或发夹环,进行连接。这有助于本发明的表征方法,并在下文详述。
所述多核苷酸存在于任何合适的样本中。本发明通常针对已知含有或怀疑含有所述多核 苷酸的样品实施。可对样品实施本发明,以确认在样品中的存在是已知的或期望的一个或多 个多核苷酸的同一性。
所述样品可以是生物样品。本发明可以针对从任何生物体或微生物中获得或提取的样品 在体外实施。所述生物体或微生物通常是古细菌的(archaeal),原核的或真核的,并且通常属于以下五界中的一个:植物界,动物界,真菌,原核生物和原生生物。本发明针对从任何病毒中获得或提取的样品在体外实施。所述样品优选是液体样品。样品通常包括患者的体液。 所述样品可以是尿液,淋巴液,唾液,粘液或羊水,但优选血液,血浆或血清。通常,所述 样品来源于人,但替代地可以是来自其他哺乳动物,如自商业上养殖的动物如马,牛,绵羊,鱼,鸡或猪,或者替代地可以是宠物如猫或狗。或者,所述样品可以来源于植物,例如从商业作物获得的样品,如谷类,豆类,水果或蔬菜,例如小麦,大麦,燕麦,芸苔,玉米,大豆,水稻,大黄,香蕉,苹果,番茄,土豆,葡萄,烟草,菜豆,小扁豆,甘蔗,可可,棉花。
所述样品可以是非生物样品。所述非生物样品优选为流体样品。非生物样品的实例包括 手术液,水如饮用水、海水或河水,以及用于实验室试验的试剂。
所述样品通常是在本发明中使用前处理,例如通过离心,或通过膜过滤掉不需要的分子 或细胞,例如红细胞。所述样品可在采集后立即测量。样品也可通常在测定前被存储,优选 低于-70℃存储。
多核苷酸结合蛋白
多核苷酸结合蛋白可以是能够结合到多核苷酸且控制其相对于孔移动例如穿过所述孔的 任何蛋白质。现有技术中可直接确定蛋白质是否结合到多核苷酸。所述蛋白质通常与多核苷酸相互作用并修饰多核苷酸的至少一个特性。所述蛋白质可通过裂解多核苷酸以形成单个核苷酸或较短链的核苷酸,如二核苷酸或三核苷酸,来修饰所述多核苷酸。所述部分可以通过 定向多核苷酸或移动多核苷酸到特定的位置例如控制其移动来修饰该多核苷酸。
任何数目的多核苷酸蛋白可以被连接到靶多核苷酸。例如,1、2、3、4、5、6、7、8、9、10或更多个蛋白质可以被连接。
所述一个或多个多核苷酸结合蛋白可以是一个或多个单链结合蛋白(SSB)。所述一个或 多个单链结合蛋白(SSB)可以包含不具有净负电荷的羧基末端(C-末端)的区域或(ii)在 其C-末端区包含一个或多个修饰且可降低C-末端区域的净负电荷的被修饰的SSB。所述一个 或多个多核苷酸结合蛋白可以是在国际申请No.PCT/GB2013/051924中(公开为WO2014/013259)公开的任何SSB。
所述一个或多个多核苷酸结合蛋白优选衍生自多核苷酸处理酶。所述多核苷酸处理酶是 能够与多核苷酸相互作用并修饰多核苷酸的至少一个特性的多肽。所述酶可以通过裂解多核苷酸以形成单个核苷酸或较短链的核苷酸,如二核苷酸或三核苷酸,来修饰多核苷酸。所述酶可以通过定向多核苷酸或将多核苷酸移动到特定的位置而修饰该多核苷酸。只要多核苷酸 处理酶能够结合多核苷酸并控制其相对于孔的移动,例如穿过所述孔,所述多核苷酸处理酶 并不需要显示酶活性。例如,所述酶可被修饰以去除其酶活性或者可在防止其作为酶的条件 下使用。这样的条件将在下文更详细的讨论。
所述一个或多个多核苷酸结合蛋白优选衍生自核酸溶解酶。所述酶更优选衍生自酶分类 (EC)组3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31中的任何成员。所述酶可以是在国际申请No.PCT/GB10/000133(公开为 WO2010/086603)中公开的任何酶。
优选的酶是聚合酶、核酸外切酶、解旋酶和拓扑异构酶如旋转酶和逆转录酶。合适的酶 包括但不限于,来自大肠杆菌的核酸外切酶I(SEQ ID NO:11)、来自大肠杆菌的核酸外切 酶III酶(SEQ ID NO:13)、来自嗜热栖热菌的RecJ(SEQ ID NO:15)和细菌噬菌体λ核酸外切酶(SEQ ID NO:17)、TatD核酸外切酶及其变体。包含SEQ ID NO:15中示出的 序列的三个亚基或其变体相互作用以形成三聚体核酸外切酶。所述聚合酶可以是3173DNA聚合酶(其可商购自/>公司)、SD聚合酶(可商购自/>)、 来自NEB的Klenow或其变体。所述酶优选为Phi29 DNA聚合酶(SEQ ID NO:9)或其变体。 Phi29的优选版本将在下文详述。可以在本发明中使用的Phi29聚合酶的经修饰版本将在下文论述且在美国专利No.5576204中公开。所述拓扑异构酶优选为部分分类(EC)组5.99.1.2和5.99.1.3中的任何成员。逆转录酶是能够催化从RNA模板形成cDNA的酶。它们可商购自例如New/>和/>
所述一个或多个多核苷酸结合蛋白优选衍生自解旋酶。所述解旋酶可以在至少两个激活 操纵模式(当为解旋酶提供有助于移动的所有必要组分例如ATP和镁离子时)和一个未激活操纵模式(当未为解旋酶提供有助于移动的必要组分时,或解旋酶被修饰成能防止或阻碍移动时)下控制多核苷酸的移动。当向解旋酶提供了促进移动的所有必要组分时,解旋酶沿多 核苷酸以5'到3'或3'至5'的方向移动(取决于解旋酶),但多核苷酸在孔中的取向(取决于多 核苷酸的哪一端被孔捕获)意味着解旋酶可用于逆着施加电场将多核苷酸移出孔,或顺着施加电场将多核苷酸移入孔中。当解旋酶朝其移动的多核苷酸的一端被孔捕获时,所述解旋酶 可以逆着施加电势产生的电场的方向工作,并将螺旋的多核苷酸拉出孔,并拉入顺室中。然而,当所述解旋酶远离其而移动的一端在孔中被捕获时,所述解旋酶可以顺着所施加电势而产生的电场的方向工作,并将螺旋的多核苷酸推入孔并进入反式室中。
当未为解旋酶提供有助于移动的必要组分时,在所述解旋酶通过施加的电势产生的场被 拉入孔时,所述解旋酶可以结合到所述多核苷酸,且作为制动器减缓多核苷酸的移动。在非激活模式中,多核苷酸的哪一端被捕获并不重要,是施加的电场将多核苷酸朝着反式侧拉入孔中,所述解旋酶起制动器的作用。当在非激活模式中,解旋酶对多核苷酸的移动控制可以 包括棘轮(ratcheting)、滑动和制动在内的多种方式进行描述。
在本发明的表征方法中,利用施加的电势所产生的电场,所述一个或多个解旋酶优选控 制所述靶多核苷酸相对于所述孔的移动,如穿过所述孔。在一个优选的实施方案中,所述一个或多个解旋酶是以激活模式使用,且所述一个或多个解旋酶远离其而移动的一端被所述孔捕获,使得所述一个或多个解旋酶顺着所施加的电势所产生的电场工作,并且相对于孔推动 多核苷酸,例如穿过所述孔。如果所述一个或多个解旋酶以5'到3'方向移动,所述多核苷酸的5’末端优选被孔捕获。在本实施方案中,所述一个或多个解旋酶以5'到3'方向沿多核苷酸移动。如果所述一个或多个解旋酶以3'到5'方向移动,所述的多核苷酸的3’末端优选被孔捕获。在 这类实施方案中,所述一个或多个解旋酶以3'到5'方向沿多核苷酸移动。
在表征方法的另一个优选实施方案中,所述一个或多个解旋酶以非激活模式使用,使得 所施加的场相对于孔牵拉多核苷酸,如穿过所述孔,并且所述一个或多个解旋酶充当制动器。在另一个优选的实施方案中,所述一个或多个解旋酶被修饰,使得它们保持它们的多核苷酸结合能力,但缺乏解旋酶活性(即主动地沿多核苷酸移动的能力),使得所施加的场相对于孔牵拉多核苷酸,如穿过所述孔,并且所述一个或多个解旋酶充当制动器。在本发明的方法 中,优选所述一个或多个解旋酶利用由所施加的电势产生的场,减缓或制动多核苷酸相对于 孔的移动,如穿过所述孔。在任一情况下,所述的一个或多个解旋酶通常太大而不能相对于孔移动,如穿过所述孔,并且在所施加的电势产生的场下当多核苷酸相对于孔移动,如穿过所述孔时,所述孔沿所述多核苷酸推动所述一个或多个解旋酶。
使用一个或多个解旋酶进行的表征方法的任何步骤通常在游离核苷酸或游离核苷酸类似 物存在下,以及有助于一个或多个解旋酶的作用的酶辅因子的存在下进行。所述游离核苷酸 可以是一个或多个上述的任意单个核苷酸。所述游离核苷酸包括但不限于,单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、 二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、 单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸 脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、 二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸 脱氧胞苷(dCDP)和三磷酸脱氧胞苷(dCTP)。所述游离核苷酸优选选自AMP、TMP、GMP、 CMP、UMP、dAMP、dTMP、dGMP或dCMP。所述游离核苷酸优选为三磷酸腺苷(ATP)。所述酶辅因子是允许构建体起作用的因子。所述酶辅因子优选为二价金属阳离子。所述二价 金属阳离子优选为Mg2+、Mn2+、Ca2+或Co2+。所述酶辅因子最优选Mg2 +。
在本发明中可以使用任何解旋酶。解旋酶可以衍生自Hel308解旋酶、RecD解旋酶,如 TraI解旋酶或TrwC解旋酶,XPD解旋酶或Dda解旋酶。所述的解旋酶可以是在国际申请No.PCT/GB2012/052579(公开为WO2013/057495)、PCT/GB2012/053274(公开为 WO2013/098562)、PCT/GB2012/053273(公开号为WO2013098561)、PCT/GB2013/051925(公开为WO2014/013260)、PCT/GB2013/051924(公开为WO2014/013259)和PCT/ GB2013/051928(公开为WO2014/013262)和在国际申请No.PCT/GB2014/052736中公开的任何的解旋酶、被修饰的解旋酶或解旋酶构建体。
所述一个或多个多核苷酸结合蛋白可衍生自解旋酶,例如Hel308 Mbu(SEQ IDNO:18)、 Hel308 Csy(SEQ ID NO:19)、Hel308 Tga(SEQ ID NO:20)、Hel308 Mhu(SEQ IDNO:21)、TraI Eco(SEQ ID NO:22)、XPD Mbu(SEQ ID NO:23)或其变体。所述一个或多 个多核苷酸结合蛋白优选包含在SEQ ID NO:25(Trwc Cba)中示出的序列或其变体、在SEQ IDNO:18(Hel308 Mbu)中示出的序列(Hel308 Mbu)或其变体,或在SEQ ID NO:24(Dda) 中示出序列或其变体。对解旋酶或跨膜孔,变体可以下面所论述的任何方式不同于天然序列。
SEQ ID NO:24的优选的变体包含(或仅包含)(a)E94C/A360C,(b)E94C/A360C, 然后(ΔM1)G1G2(即M1缺失,然后添加G1和G2),(c)E94C/A360C/C109A/C136A或(d)E94C/A360C/C109A/C136A,然后(ΔM1)G1G2(即M1缺失,然后添加G1和G2)。
SEQ ID NO:24的其它优选的变体包含W378A。SEQ ID NO:24的优选变体包含(或仅包括)(a)E94C/A360C/W378A,(b)E94C/A360C/W378A,然后(ΔM1)G1G2(即M1缺失,然后添加G1和G2),(c)E94C/A360C/C109A/C136A/W378A或(d)E94C/A360C/ C109A/C136A/W378A,然后(ΔM1)G1G2(即M1缺失,然后添加G1和G2)。
SEQ ID NO:25的优选的变体包含(或仅包括)(a)Q594A,(b)L376C/Q594A/K762C,(c)L376C/Q594A/A779C,(d)Q346C/Q594A/A779C,(e)Q346C/Q594A/A783C,(f)D411/Q594A/A783C,(g)Q594A/R353C/E722C,(h)Q594A/Q357C/T720C,(i)Q594A/ R358C/T720C,(j)Q594A/H354C/T720C,(k)Q594A/F374C/E722C或(l)Q594A/S350C/E722C。(a)至(l)中的任一项还可以进一步包含,然后(ΔM1)G1G2(即M1缺失,然后 添加G1和G2)。其它优选的变体如上所述。
所述一个或多个解旋酶优选修饰为减少多核苷酸结合结构域的开口的大小,所述多核苷 酸可以在至少一个构象状态下穿过所述开口从解旋酶上解绑。所述一个或多个解旋酶优选修饰为闭合该多核苷酸结合域的开口,所述多核苷酸可以在至少一个构象状态下穿过所述开口从解旋酶上解绑。这在WO2014/013260和PCT/GB2014/052736中被公开。可以在本发明中使 用在WO2014/013260和PCT/GB2014/052736中所公开的任何修饰。
解旋酶结合到多核苷酸和从多核苷酸解绑的能力可以使用本领域中已知的任何方法来确 定。合适的结合/解绑测定包括但不限于,天然聚丙烯酰胺凝胶电泳(PAGE),荧光各向异性、量热法和表面等离子共振(SPR,如BiacoreTM)。解旋酶从多核苷酸解绑的能力当然可以通 过测量解旋酶可以控制多核苷酸移动的时间来确定。这也可使用本领域中已知的任何方法来确定。解旋酶控制多核苷酸移动的能力通常在纳米孔系统中测定,例如如下所述的那些。解旋酶控制多核苷酸移动的能力可以如实施例中所描述的来确定。
如PCT/GB2014/052736中公开的,本发明中使用的解旋酶可以是Dda解旋酶,所述Dda 中至少一个半胱氨酸残基和/或至少一个非天然的氨基酸已经被引入到钩结构域和/或2A (RecA状电机)结构域,其中所述解旋酶保留其控制多核苷酸移动的能力。任何数量的半胱氨酸残基和/或非天然氨基酸可以被引入到每个结构域。例如,1、2、3、4、5、6、7、8、9、10个或更多个半胱氨酸残基可被引入,和/或1、2、3、4、5、6、7、8、9、10个或更多个非 天然氨基酸可被引入。可以仅一个或多个半胱氨酸残基被引入。可以仅一个或多个非天然氨基酸被引入。一个或多个半胱氨酸残基和一个或多个非天然氨基酸的组合可被引入。优选通过取代引入至少一个半胱氨酸残基和/或至少一个非天然氨基酸。这样做的方法是本领域已知 的。这些Dda修饰不阻止解旋酶结合到多核苷酸。这些修饰降低了多核苷酸从解旋酶上解绑 或分离的能力。换言之,所述一个或多个修饰通过防止Dda解旋酶从多核苷酸链的解离来增 加Dda解旋酶的持续合成能力(processivity)。酶的热稳定性通常也通过一个或多个修饰给予酶在链测序中有利的提高的结构稳定性来增加。非天然氨基酸为不是在Dda解旋酶中天然 发现的氨基酸。非天然氨基酸优选不是组氨酸、丙氨酸、异亮氨酸、精氨酸、亮氨酸、天冬 酰胺、赖氨酸、天冬氨酸、甲硫氨酸、半胱氨酸、苯丙氨酸、谷氨酸、苏氨酸、谷氨酰胺、色氨酸、甘氨酸、缬氨酸、脯氨酸、丝氨酸或酪氨酸。非天然氨基酸更优选不是前句中二十 种氨基酸中的任一种氨基酸或硒代半胱氨酸。
在本发明中使用的优选的非天然氨基酸包括但不限于,4-叠氮基-L-苯丙氨酸(Faz)、4- 乙酰基-L-苯丙氨酸、3-乙酰基-L-苯丙氨酸、4-乙酰乙酰基L-苯丙氨酸、O-烯丙基-L-酪氨酸、3-(苯硒基)-L-丙氨酸、O-2-丙炔-1-基-L-酪氨酸、4-(二羟基硼基)-L-苯丙氨酸、4-[(乙基 硫烷基)羰基]-L-苯丙氨酸、(2S)-2-氨基-3-{4-[(丙烷-2-基硫烷基)羰基]苯基}丙酸、(2S)-2-氨基-3-{4-[(2-氨基-3-硫烷基丙酰基)氨基]苯基}丙酸、O-甲基-L-酪氨酸、4-氨基-L-苯丙 氨酸、4-氰基-L-苯丙氨酸、3-氰基-L-苯丙氨酸、4-氟-L-苯丙氨酸、4-碘-L-苯丙氨酸、4-溴-L-苯丙氨酸、O-(三氟甲基)酪氨酸、4-硝基-L-苯丙氨酸、3-羟基-L-酪氨酸、3-氨基-L-酪氨酸、 3-碘-L-酪氨酸、4-异丙基-L-苯丙氨酸、3-(2-萘基)-L-丙氨酸、4-苯基-L-苯丙氨酸、(2S)-2-氨基-3-(萘-2-基氨基)丙酸、6-(甲基硫烷基)正亮氨酸、6-氧代-L-赖氨酸、D-酪氨酸、 (2R)-2-羟基-3-(4-羟基苯基)丙酸、(2R)-2-铵基辛酸酯3-(2,2'-双吡啶-5-基)-D-丙氨酸、2-氨基-3-(8-羟基-3-喹啉基)丙酸、4-苯甲酰基-L-苯丙氨酸、S-(2-硝基苄基)半胱氨酸、 (2R)-2-氨基-3-[(2-硝基苄基)硫烷基]丙酸、(2S)-2-氨基-3-[(2-硝基苄基)氧基]丙酸、O-(4,5-二甲氧基-2-硝基苄基)-L-丝氨酸、(2S)-2-氨基-6-({[(2-硝基苄基)氧基]羰基}氨基)己酸、O-(2-硝基苄基)-L-酪氨酸、2-硝基苯丙氨酸、4-[(E)-苯二氮烯基]-L-苯丙氨酸、4-[3-(三氟甲基)-3H-双吖丙啶-3-基]-D-苯丙氨酸(4-[3-(Trifluoromethyl)-3H-diaziren-3-yl]-D-phenylalanine)、2-氨基3-[[5-(二甲基氨基)-1-萘基]磺酰基氨基]丙酸、(2S)-2-氨基-4-(7-羟基-2-氧代-2H-色烯-4-基)丁酸、(2S)-3-[(6- 乙酰萘-2-基)氨基]-2-氨基丙酸、4-(羧甲基)苯丙氨酸、3-硝基-L-酪氨酸、O-磺基-L-酪氨 酸、(2R)-6-乙酰胺基-2-铵基己酸酯、1-甲基组氨酸、2-氨基壬酸、2-氨基癸酸、L-高半胱 氨酸、5-硫烷基正缬氨酸、6-硫烷基-L-正亮氨酸、5-(甲基硫烷基)-L-正缬氨酸、N6-{[(2R, 3R)-3-甲基-3,4-二氢-2H-吡咯-2-基]羰基}-L-赖氨酸、N6-[(苄氧基)羰基]赖氨酸、(2S)-2- 氨基-6-[(环戊基羰基)氨基]己酸、N6-[(环戊氧基)羰基]-L-赖氨酸、(2S)-2-氨基-6-{[(2R)-四氢呋喃-2-基羰基]氨基}己酸、(2S)-2-氨基-8-[(2R,3S)-3-乙炔基四氢呋喃-2-基]-8-氧代辛酸,N6-(叔丁氧基羰基)-L-赖氨酸、(2S)-2-羟基-6-({[(2-甲基-2-丙基)氧基]羰基} 氨基)己酸、N6-[(烯丙氧基)羰基]赖氨酸、(2S)-2-氨基-6-({[(2-叠氮基苄基)氧基]羰基}氨基)己酸、N6-L-脯氨酰-L-赖氨酸、(2S)-2-氨基-6-{[(丙-2-炔-1-基氧基)羰基]氨 基}己酸和N6-[(2-叠氮基乙氧基)羰基]-L-赖氨酸。最优选的非天然氨基酸是4-叠氮基-L-苯丙氨酸(Faz)。
本发明中使用的解旋酶优选包含SEQ ID NO:24的变体,其中至少一个半胱氨酸残基和/ 或至少一个非天然氨基酸已经被引入(i)塔域(残基D260-P274和N292-A389),和/或(ii)销域(残基K86-E102),和/或(iii)1A域(残基M1-L85和V103-K177)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基N292-A389中。
如上所述,将至少两个半胱氨酸引入到SEQ ID NO:24和SEQ ID NO25中减小了解旋酶 的多核苷酸结合域中的开口的大小或闭合了所述开口。
在本发明中使用的优选的解旋酶构建体在国际申请No.PCT/GB2013/051925(公开为 WO2014/013260)、PCT/GB2013/051924(公开为WO2014/013259)和PCT/GB2013/051928(公开为WO2014/013262)和于2013年10月18日在英国提交的申请号1318464.3中描述。
SEQ ID NO:9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO18、 SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23、SEQ ID NO24或SEQ ID NO25的变体是具有从SEQ ID NO:9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO18、SEQ ID NO19、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23、SEQ ID NO24或SEQ ID NO25变化而来且保持多核苷酸结合能力的氨基酸序 列的酶。这可以使用任何本领域中已知的方法来测定。例如,可使变体与多核苷酸接触并且 测量其结合到多核苷酸并沿着多核苷酸移动的能力。所述变体可以包括有助于结合多核苷酸的修饰,和/或有助于其在高盐浓度和/或室温下活性的修饰。变体可被修饰,以使得其结合多核苷酸(即保留多核苷酸结合能力),但没有酶的功能。例如,解旋酶的变体可被修饰以使其结合多核苷酸(即保留多核苷酸结合能力),但没有解旋酶的功能(即当提供所有有助于移动的必要组分,例如ATP和Mg2+时,解旋酶不沿多核苷酸移动)。这样的修饰在本领域是 已知的。例如,解旋酶中的Mg2+结合域的修饰通常导致不具有解旋酶功能的变体。这些类型 的变体可以作为分子制动器。优选的分子制动器为TrwC CBA-Q594A(具有突变Q594A的 SEQID NO:25)。其他的参考SEQ ID NO:25在上文进行了论述。该变体不具有解旋酶的功能(即当提供所有有助于移动的必要组分,例如ATP和Mg2+时,结合到多核苷酸,但是并 不沿着多核苷酸移动)。一个或多个分子制动器解旋酶可以上文所述的任何方向和/或模式使 用。
在SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO: 17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:25的氨基酸序列的整个长度上,基于氨基 酸的同一性,变体将优选与所述序列为至少50%的同源性。更优选地,变体多肽可以与SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、 SEQ ID NO:24或SEQ ID NO:25的氨基酸序列在整个序列上基于氨基酸的同一性具有至少 55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选至少95%,97%或99%的同源性。在200或更多,例如230、250、270、280、300、400、 500、600、700、800、900或1000个或更多个连续氨基酸的长度上,可以具有至少80%,例 如至少85%、90%或95%的氨基酸同一性(“严格同源性”)。同源性如上文所描述的确定。关于下文的SEQ ID NO:2和SEQ ID NO:4,所述的变体可以上文所述的任何方式不同于野生型序列。
如果两个或多个多核苷酸结合蛋白被使用,它们可以是相同的或不同的。可使用上述的 蛋白质的任意组合。例如,两个或多个蛋白可以是相同蛋白例如解旋酶的不同变体。所述两 个或多个多核苷酸结合蛋白优选包含一个或多个解旋酶和一个或多个聚合酶。
如果两个或多个多核苷酸结合蛋白被使用,它们可以彼此连接。所述两个或多个多核苷 酸结合蛋白可以共价地彼此连接。多核苷酸结合蛋白可以以任何顺序和使用任何方法连接。 本发明中使用的优选的解旋酶构建体在国际申请No.PCT/GB2013/051925(公开为 WO2014/013260)、PCT/GB2013/051924(公开为WO2014/013259)和PCT/GB2013/051928(公开为WO2014/013262)和于2013年10月18日在英国提交的申请号1318464.3中描述。
如果使用了两个或多个多核苷酸结合蛋白,则除了经由多核苷酸外,它们优选不彼此连 接。所述两个或多个多核苷酸结合蛋白更优选彼此不共价连接。
一个或多个解旋酶和一个或多个分子制动器
在某些情况下,本发明的表征方法可以涉及使用一个或多个解旋酶和一个或多个分子制 动器。当靶多核苷酸与所述孔相接触时,所述一个或多个解旋酶和一个或多个分子制动器聚 集在一起,并且这两者控制多核苷酸相对于所述孔的移动,如穿过所述孔。
所述一个或多个解旋酶可以是任何上述的那些解旋酶。所述一个或多个分子制动器可以 是结合到多核苷酸并减缓多核苷酸相对于孔的移动如穿过所述孔的任何化合物或分子。所述一个或多个分子制动器优选包括结合到多核苷酸的一个或多个化合物。所述一个或多个化合物优选是一个或多个大环化合物。合适的大环化合物包括,但不限于,环糊精、杯芳烃、环 肽、冠醚、瓜环、柱芳烃、其衍生物或其组合。环糊精或其衍生物可以是任何在Eliseev,A.V.,与Schneider,H-J.(1994)J.Am.Chem.Soc.116,6081-6088中公开的那些。所述的试剂更优选 是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧 -6-胍基)-环糊精(gu7-βCD)。
所述一个或多个分子制动器优选为一个或多个单链结合蛋白(SSB)。所述一个或多个分 子制动器更优选为包含不具有净负电荷的羧基末端(C-末端)区域的单链结合蛋白(SSB), 或为(ii)C-末端区域中包含能减少C-末端区域的净负电荷的一个或多个修饰的经修饰SSB。所述一个或多个分子制动器最优选为在国际申请No.PCT/GB2013/051924(公开为WO2014/013259)中公开的任何SSB。
所述一个或多个分子制动器优选为一个或多个多核苷酸结合蛋白。所述多核苷酸结合蛋 白可以是能够结合到多核苷酸并控制其相对于孔的移动,如穿过所述孔的任何蛋白。现有技术中可直接确定蛋白质是否结合到多核苷酸。所述蛋白通常与多核苷酸相互作用并修饰所述多核苷酸的至少一个特性。所述蛋白可通过裂解以形成单个核苷酸或较短链的核苷酸,如二 核苷酸或三核苷酸,来修饰多核苷酸。所述部分可以通过将多核苷酸定向或通过移动多核苷 酸到特定的位置,即控制多核苷酸的移动,修饰多核苷酸。
所述多核苷酸结合蛋白优选衍生自多核苷酸处理酶。所述一个或多个分子制动器可以衍 生自上述的任何多核苷酸处理酶。充当分子制动器的Phi29聚合酶的经修饰的版本(SEQ ID NO:9)在美国专利No.5576204中公开。充当分子制动器的Phi29聚合酶的经修饰的版本(SEQ ID NO:9)在下文中公开。所述一个或多个分子制动器优选衍生自解旋酶。
任何数量的衍生自解旋酶的分子制动器可以被使用。例如,1、2、3、4、5、6、7、8、9、10或更多个解旋酶可被用作分子制动器。如果两个或更多个解旋酶被用作分子制动器,所述 两个或更多个解旋酶通常是相同的解旋酶。所述两个或更多个解旋酶可以是不同的解旋酶。
所述两个或更多个解旋酶可以是上文提到的解旋酶的任意组合。所述两个或更多个解旋 酶可以是两个或更多个Dda解旋酶。所述两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。所述两个或更多个解旋酶可以是相同解旋酶的不同变体。
所述两个或更多个解螺旋酶优选彼此连接。所述两个或更多个解旋酶更优选共价地彼此 连接。所述解旋酶可以以任何顺序和使用任何方法连接。从解旋酶衍生的一个或多个分子制动器优选被修饰以减少多核苷酸结合域中开口的大小,所述多核苷酸可在至少一个构象状态下通过所述开口从解旋酶解绑。这在WO2014/013260中公开。
用于本发明的优选的解旋酶构建体在国际申请No.PCT/GB2013/051925(公开为WO2014/013260)、PCT/GB2013/051924(公开为WO2014/013259)、PCT/GB2013/051928(公开为WO2014/013262)和PCT/GB2014/052736中描述。
如果所述一个或多个解旋酶以激活模式使用(即当为一个或多个解旋酶提供有助于移动 的所有必要组分,例如ATP和Mg2+时),所述一个或多个分子制动器优选(a)在非激活模 式下使用(即在不存在有助于移动的必要组分或没有能力主动移动时),(b)在激活模式下 使用,其中所述一个或多个分子制动器以与所述一个或多个解旋酶相反的方向移动,或(c)在激活模式下使用,其中所述一个或多个分子制动器以与所述一个或多个解旋酶相同的方向 移动,且比所述一个或多个解旋酶移动得更慢。
如果在激活模式下使用所述一个或多个解旋酶(即当未为所述一个或多个解旋酶提供有 助于移动的所有必要组分,例如ATP和Mg2+或不能主动移动时),所述一个或多个分子制动 器优选(a)在非激活模式下使用(即在不存在有助于移动所需的组分时或不能主动移动时) 或(b)在激活模式下使用,其中所述一个或多个分子制动器以与多核苷酸相对于孔的相同方向 沿多核苷酸移动,如穿过所述孔。
所述一个或多个解旋酶和一个或多个分子制动器可以在任何位置被连接到多核苷酸,以 使它们聚集在一起并且这两者控制多核苷酸相对于所述孔的移动,如穿过所述孔。所述一个 或多个解旋酶和一个或多个分子制动器为至少一个核苷酸间隔,例如至少5个、至少10个、至少50个、至少100个、至少500个、至少1000、至少5000、至少10,000、至少50,000个核苷酸间隔或更多个核苷酸间隔。如果该方法涉及用在一端设置的Y衔体和在另一端设置的 桥连部分衔体如发夹环衔体表征双链多核苷酸,则所述一个或多个解旋酶被优选地连接到Y 衔体,而所述一个或多种分子制动器优选被连接到桥连部分衔体。在本实施方案中,所述一个或多个分子制动器优选是经修饰的一个或多个解旋酶,使得它们结合多核苷酸但不具有解 旋酶的功能。连接到Y衔体的一个或多个解旋酶如下文中详述的优选被停滞在间隔器处。连 接到桥连部分衔体的一个或多个分子制动器优选不停滞在间隔器处。当所述一个或多个解旋酶到达桥连部分时,所述一个或多个解旋酶和一个或多个分子制动器优选聚集在一起。所述 一个或多个解旋酶可以在Y衔体被连接到多核苷酸之前或Y衔体被连接到多核苷酸之后,连 接到Y衔体。一个或多个分子制动器可以在所述桥连部分衔体被连接到多核苷酸之前或桥连部分衔体被连接到多核苷酸之后,连接到桥连部分衔体。
所述一个或多个解旋酶和一个或多个分子制动器优选不彼此连接。所述一个或多个解旋 酶和一个或多个分子制动器更优选不共价地彼此连接。所述一个或多个解旋酶和一个或多个 分子制动器优选不连接,如在国际申请No.PCT/GB2013/051925(公开为WO2014/013260)、PCT/GB2013/051924(公开为WO2014/013259)和PCT/GB2013/051928(公开为 WO2014/013262),以及于2013年10月18日在英国提交的申请号为1318464.3中所描述的。
一个或多个聚合酶
本发明的方法优选涉及将一个或多个聚合酶连接到靶多核苷酸。可以使用上文或下文所 述的任何聚合酶。例如,聚合酶可包含上文所述的SEQ ID NO:9或SEQ ID NO:31中所示 的序列或其变体。
SEQ ID NO:9的优选的变体包括,但不限于,包含以下取代物的变体:(a)G410C和P562C、(b)A411C和Q560C、(c)K402C和I94C、(d)A406C和E75C、以及(e)L412C和Q560C。将这些半胱氨酸引入到SEQ ID NO:9中减小了上文针对解旋酶所述的聚合酶的 多核苷酸结合域中的开口的大小,或闭合了该开口。(a)至(e)中的变体可以被用作如上所 述的分子制动器。
一旦一个或多个聚合酶被装载到靶多核苷酸上,它/它们可以使用靶多核苷酸作为模板形 成一个或多个多核苷酸。这通常包括在聚合酶使用靶多核苷酸作为模板形成一个或多个多核 苷酸的条件下,将靶多核苷酸与一个或多个具有一组游离核苷酸的聚合酶接触。合适的条件将在下文论述。任何数量的多核苷酸可以由一个或多个聚合酶形成。优选形成一个或两个多 核苷酸。
所述一组游离核苷酸可以包含上文和下文所述的任何核苷酸。由所述一个或多个聚合酶 形成的一个或多个多核苷酸的性质将取决于该组中的游离核苷酸。所述一个或多个聚合酶可 以形成与靶多核苷酸相同类型的一个或多个多核苷酸。例如,如果靶多核苷酸为DNA,本发明可使用一组游离的DNA核苷酸(即包括脱氧腺苷、脱氧鸟苷、胸苷、脱氧胞苷和脱氧甲基 胞苷的核苷酸),使得所述一个或多个聚合酶使用靶多核苷酸作为模板形成一个或多个DNA 多核苷酸。所述一个或多个聚合酶可以形成与靶多核苷酸不同类型的一个或多个多核苷酸。 例如,如果靶多核苷酸是RNA,本发明可使用一组游离的DNA核苷酸,使得所述一个或多个聚合酶使用靶多核苷酸作为模板形成一个或多个DNA多核苷酸。所述一个或多个聚合酶可 以如下文详述来修饰靶多核苷酸。
引物或3'发夹通常用作用于聚合酶扩展的成核点。所述一个或多个聚合酶可以本文所述 的任何方式连接到靶多核苷酸。所述一个或多个聚合酶通常被提供结合到一个或多个装载部 分,如一个或多个Y衔体和/或一个或多个桥连部分衔体(如一个或多个发夹环衔体)。
本发明的方法优选包括根据本发明将一个或多个聚合酶连接到单链靶多核苷酸,并使一 个或多个聚合酶使用所述靶多核苷酸作为模板形成多核苷酸,并由此产生双链多核苷酸。所 述双链多核苷酸包含靶多核苷酸(模板)和由所述一个或多个聚合酶形成的互补多核苷酸。以这种方式形成的双链多核苷酸的两条链可以与桥连部分衔体如发夹环衔体相连,且该双链多核苷酸的两条链可如下文所述被表征。
本发明提供了制备用于表征的靶多核苷酸的方法。该方法包括使用本发明将一个或多个 聚合酶连接到靶多核苷酸,然后使用所述靶多核苷酸作为模板,用所述一个或多个聚合酶产 生一个或多个额外的多核苷酸。产生与靶多核苷酸互补的多核苷酸有助于其表征,如上所述。
所述方法优选包括根据本发明将一个或多个聚合酶连接到双链靶多核苷酸,并使所述一 个或多个聚合酶使用靶多核苷酸的每条链作为模板形成一个或多个多核苷酸。
在一个优选的实施方案中,双链靶多核苷酸的两条链在一端与桥连部分衔体(如发夹环 衔体)连接,且使用包含另一桥连部分的装载部分将一个或多个聚合酶连接到所述双链靶多 核苷酸的另一端。所述装载部分可以是Y衔体。所述另一桥连部分通常在一个或更多个聚合酶结合的Y衔体的链的末端由发夹环形成。所述装载部分可以包括一个或多个解旋酶,优选 结合到一个或多个聚合酶结合的链的相对链。在本实施方案中,一个或多个聚合酶将产生双链构建体,其中所述构建体的两条链在一端与桥连部分连接,而且所述构建体的每条链包含靶多核苷酸的一条链和由一个或多个聚合酶形成的互补的多核苷酸。这在图17中示出。双链 构建体的两条链可以如下文所述被表征。在本实施方案中,原始靶多核苷酸的每条链被表征 两次。所述一个或多个聚合酶可以用于控制双链构建体相对于孔的移动,如穿过所述孔。所 述一个或多个聚合酶可以是分子制动器。如果装载部分还包括一个或多个解旋酶,所述一个或多个解旋酶可以用于控制双链构建体相对于所述孔的移动,如穿过所述孔。在一些实施方 案中,一个或多个聚合酶和一个或多个解旋酶可以都被用于控制双链构建体相对于所述孔的移动,如穿过所述孔。
在另一个实施方案中,双链靶多核苷酸的两条链的任一端不与桥连部分衔体(如发夹环 衔体)连接。一个或多个聚合酶使用包含桥连部分的装载部分在每一端被连接到双链靶多核 苷酸。在每一端的装载部分可以是相同的或不同的。每个装载部分可以是Y衔体。桥连部分通常在一个或多个聚合酶结合的Y衔体的链的末端由发夹环形成。所述装载部分可包含一个 或多个解旋酶,优选结合到与一个或多个聚合酶结合的链的相对链。在本实施方案中,一个或 多个聚合酶将产生两个双链构建体,其中每个构建体的两条链一端与桥连部分连接,且每个 构建体包含靶多核苷酸的一条链和由所述一个或多个聚合酶形成的互补的多核苷酸。这在图18中示出。所述两个构建体可以如下文论述被表征。在本实施方案中,原始靶多核苷酸的每条链表征两次,每个构建体表征一次。所述一个或多个聚合酶可以控制每个双链构建体相对于所述孔的移动,如穿过所述孔。所述一个或多个聚合酶可以是分子制动器。如果每个装载 部分还包括一个或多个解旋酶,则所述一个或多个解旋酶可被用于控制每个双链构建体相对 于所述孔的移动,如穿过所述孔。在一些实施方案中,所述一个或多个聚合酶和一个或多个解旋酶可都被用于控制每个双链构建体相对于孔的移动,如穿过所述孔。
在另一个实施方案中,双链靶多核苷酸的两条链的两端与桥连部分衔体(如发夹环衔体) 连接,以形成环形构建体,并且一个或多个聚合酶被连接到每个桥连部分衔体。所述的一个 或所述的两个桥连部分衔体可以包含一个或多个解旋酶,优选结合到杂合到桥连部分衔体的多核苷酸。通过杂合该多核苷酸到桥接衔体部分形成的双链多核苷酸可由所述一个或多个聚合酶来成核,用于聚合酶延伸。在本实施方案中,在环形构建体的每一端的一个或多个聚合 酶将使用该环形构建体作为模板,产生包含所述靶多核苷酸的每条链的多个拷贝的构建体。 由于有两组一个或多个聚合酶,两个构建体将从每个靶多核苷酸产生。这在图19中示出。每个构建体可以如下所述被表征。每个构建体将通常包含靶多核苷酸的每条链的多个拷贝。构建体中的拷贝可以杂合在一起形成双链区域。在本实施方案中,原始靶多核苷酸的每条链将 进行与一个或多个聚合酶复制它们时一样多次数的表征。所述一个或多个聚合酶可控制构建 体相对于所述孔的移动,如穿过所述孔。所述一个或多个聚合酶可以是分子制动器。如果每个桥连部分还包括一个或多个解旋酶,所述一个或多个解旋酶可以被用于控制构建体相对于所述孔的移动,如穿过所述孔。在一些实施方案中,所述一个或多个聚合酶和一个或多个解 旋酶可以都被用于控制构建体相对于所述孔的移动,如穿过所述孔。
使用一个或多个聚合酶产生一个或多个多核苷酸之后,该方法优选包括将靶多核苷酸和一个或多个多核苷酸与跨膜孔接触,使得靶多核苷酸和所述一个或多个多核苷酸相对于孔的 移动,如穿过所述孔。该方法优选包括将所述靶多核苷酸和一个或多个多核苷酸与跨膜孔接 触,使得所述一个或多个聚合酶控制靶多核苷酸和一个或多个多核苷酸相对于孔的移动,如穿过所述孔。一个或多个解旋酶也可以用于控制靶多核苷酸和一个或多个多核苷酸相对于孔的移动,如穿过所述孔。所述一个或多个解旋酶可以连接到所述靶多核苷酸和所述一个或多 个多核苷酸,如上所述。
该方法还包含当所述靶多核苷酸和一个或多个多核苷酸相对于所述孔移动时,获取一个 或多个测量值,其中测量值代表多核苷酸的一个或多个特征,并由此表征所述靶多核苷酸。 下文所述的任何实施方案适用于本方法。
装载部分
一个或多个多核苷酸结合蛋白被提供结合到(或连接到)一个或多个装载部分。在一个 优选的实施方案中,该方法还包括结合(或连接)所述一个或多个多核苷酸结合蛋白到所述 一个或多个装载部分。
每个装载部分可以是能够被连接到靶多核苷酸的任何部分。只要多核苷酸结合蛋白可结 合且其能被连接到靶多核苷酸,每个装载部分可以是任何长度。
所述一个或多个装载部分优选是合成的或人工的。所述一个或多个装载部分优选是非天 然的。
合适的装载部分包括,但不限于,聚合连接体、化学连接体、多核苷酸或多肽。所述一 个或多个装载部分优选包含多核苷酸或装载多核苷酸。在此类实施方案中,一个或多个多核 苷酸结合蛋白优选结合到(或连接到)多核苷酸。也可以使用以上所述的任何多核苷酸。优选地,所述一个或多个装载部分包含DNA、RNA、经修饰的DNA(如脱碱基的DNA)、RNA、PNA、LNA、BNA或PEG。所述一个或多个装载部分更优选包含单链或双链DNA或RNA。
所述一个或多个装载部分优选包括所述一个或多个多核苷酸结合蛋白结合的(或连接的) 的单链多核苷酸。
至少一个所述一个或多个装载部分优选为Y衔体。Y衔体在关于双偶联的章节中定义, 并且可以包括前导序列。
至少一个所述一个或多个装载部分优选为桥连部分。所述桥连部分最优选为发夹环或发 夹环衔体。合适的发夹环衔体可以使用本领域中已知的方法来设计。发夹环可以是任何长度。 如果发夹环用作装载部分,其通常为400个或更少个核苷酸,如350个或更少个核苷酸、300个或更少个核苷酸、250个或更少个核苷酸、200个或更少个核苷酸、150个或更少个核苷酸、 100个或更少个核苷酸、90或更少个核苷酸、80个或更少个核苷酸、70个或更少个核苷酸、 60个或更少个核苷酸、50个或更少个核苷酸、40个或更少个核苷酸、30个或更少个核苷酸、 20个或更少个核苷酸、或10个或更少个核苷酸的长度。发夹环优选为从约1个至400个、2个至300个、5个至200、6个至100个核苷酸的长度。当多核苷酸的两个互补部分杂合以形 成双链序列(称为茎干)时,形成发夹环。如果用作装载部分,发夹环的茎干优选200个或 更少个核苷酸对、例如150个或更少个核苷酸对、100个或更少个核苷酸对、90个或更少个 核苷酸对、80个或更少个核苷酸对、70个或更少核苷酸对、60个或更少个核苷酸对、50个或更少个核苷酸对、40个或更少个核苷酸对、30个或更少核苷酸对、20个或更少核苷酸对或 10个或更少核苷酸对的长度。所述一个或多个多核苷酸结合蛋白通常结合到发夹的环,即不 是茎干。
如果靶多核苷酸是双链的,所述一个或多个装载部分优选包含Y衔体和可选地桥连部分, 如发夹环衔体。如果至少一个或多个所述装载部分是Y衔体,它可与不具有任何多核苷酸结 合蛋白结合或连接的桥接衔体组合使用。
如果所述一个或多个多核苷酸结合蛋白衍生自解旋酶,它们可停滞在所述一个或更多个 装载部分上的一个或多个间隔器处。下文进行更详细的讨论。
可以使用任何数量的一个或多个装载部分。本方法可以包括连接两个或多个装载部分,其中每个装载部分具有与其结合(连接)的一个或多个多核苷酸结合蛋白。例如,装载部分可连接到靶多核苷酸的每一端。在此类实施方案中,一个装载部分优选为Y衔体,且另一装 载部分可以是桥连部分,如发夹环衔体。这些将在下文更详细地讨论。
所述一个或多个装载部分可以以任何方式连接到靶多核苷酸。所述一个或多个装载部分 优选共价地连接到靶多核苷酸。
所述一个或多个装载部分最优选接合到靶多核苷酸。所述一个或多个装载部分可以接合 到多核苷酸的任一端,即5'或3'末端。装载部分可被接合到靶多核苷酸的两端。所述一个或多个装载部分可使用本领域中已知的任何方法接合到多核苷酸。所述一个或多个装载部分可在没有ATP存在下或使用γ-S-ATP(ATPγS)代替ATP接合到多核苷酸。
所述一个或多个装载部分可使用连接酶接合,如T4 DNA连接酶、大肠杆菌DNA连接酶、 Taq DNA连接酶、Tma DNA连接酶和9°N DNA连接酶。连接酶优选在实施例3中设定的条件下使用。
该方法优选进一步包括从本方法的条件中去除连接酶。
一旦装载部分已经连接到靶多核苷酸,所述一个或多个多核苷酸结合蛋白优选保持结合 (连接)到所述装载部分。根据本发明所述一个或多个多核苷酸结合蛋白被连接后,可以将 它们从所述一个或多个装载部分解绑。
膜
根据本发明可使用任何膜。合适的膜是本领域公知的。所述膜优选为两亲层。两亲层是 由具有亲水性和亲脂性的两亲分子形成的层,如磷脂。所述两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在本领域中是已知的,且包括,例如,嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中两个或多 个单体亚基一起聚合以生成单个聚合物链的聚合物材料。嵌段共聚物通常具有由每个单体亚基贡献的特性。然而,嵌段共聚物可具有由各个亚基形成的聚合物不具有的独特的特性。嵌段共聚物可以被加工,使得单体亚基中的一个是疏水性的(即亲脂的),而其他亚基在含水 介质中是亲水性的。在这种情况下,该嵌段共聚物可具有两亲特性,并且可以形成模仿生物 膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚基组成),但也可以由多于两个的单体亚基构成以形成充当两亲物的更复杂的排列。所述共聚物可以是三嵌段、四嵌段或五嵌段共 聚物。膜优选为三嵌段共聚物膜。
古细菌双极四醚脂质是天然存在的脂质,其被构造为使得所述脂质形成单层膜。这些脂 质通常在恶劣的生物环境、嗜热菌、嗜盐菌和嗜酸菌中生存的嗜极菌(extremophiles)中被发 现。它们的稳定性被认为是从最终双层的融合性质中衍生的。比较简单的是,通过生成具有亲水性-疏水性-亲水性一般基序的三嵌段聚合物构造模仿这些生物实体的嵌段共聚物材料。所述材料可以形成行为类似于脂质双层且包含从囊泡到层状膜的一系列相行为的单体膜。由这 些三嵌段共聚物形成的膜与生物脂质膜相比持有一些优点。因为三嵌段共聚物是合成的,因 此可以仔细控制其确切构造以提供用于形成膜和与孔及其它蛋白相互作用所需的正确链长度 和特性。
嵌段共聚物也可以从不被分类为脂质子材料的亚基构建;例如疏水性聚合物可从硅氧烷 或其它非基于烃的单体制成。嵌段共聚物的亲水性子段也可具有低的蛋白质结合特性,这使 得当暴露于未处理的生物样品时,其可生成高抗性的膜。该头部基团单元也可以从非经典的脂质头部基团衍生。
三嵌段共聚物膜与生物脂质膜相比,还具有增强的机械稳定性和环境稳定性,例如高得 多的操作温度或pH范围。嵌段共聚物的合成性质为定制用于广泛应用范围的基于聚合物的膜 提供了平台(platform)。
所述膜最优选为在国际申请No.PCT/GB2013/052766或PCT/GB2013/052767中公开的膜 之一。
所述两亲分子可以是经化学修饰的或官能化的以有助于多核苷酸的耦合。
该两亲层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以 被支撑。
两亲膜通常天然是移动的,本质上充当具有约10-8cm s-1的脂质扩散速率的二维流体。这 意味着检测器和耦合的多核苷酸通常在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并充当用于一系列实验研究的优秀的平 台。例如,脂质双层可通过单通道记录用于膜蛋白的体外研究。或者,脂质双层可用作生物传感器以检测一系列物质的存在。脂质双层可以是任何脂质双层。合适的脂质双层包括,但不限于,平面脂双层、支撑双层或脂质体。脂质双层优选平面脂质双层。合适的脂质双层在 国际申请No.PCT/GB08/000563(公开为WO 2008/102121)、国际申请No.PCT/GB08/004127(公开为WO2009/077734)和国际申请No.PCT/GB2006/001057(公开为WO 2006/100484) 中公开。
用于形成脂质双层的方法在本领域中是已知的。合适的方法在实施例中公开。脂质双层 通常由Montal和Mueller的方法(Proc.Natl.Acad.Sci.USA.,1972;69:3561-3566)共同来形成,其中脂质单层是在水溶液/空气界面上进行的,所述水溶液/空气界面穿过垂直于该界面的孔的任一侧。脂质通常通过首先将其在有机溶剂中溶解,然后使得一滴所述溶剂在孔的任一侧上 的水溶液的表面上蒸发,而添加到电解质水溶液的表面。一旦有机溶剂蒸发了,在孔的任一侧上的溶液/空气界面物理地上下移动穿过所述孔,直到双层形成。平面脂质双层可跨越膜中 的孔或跨越开口而形成凹部。
Montal和Mueller的方法是流行的,因为该方法是形成适于蛋白孔插入的良好品质脂质双 层的成本合算和相对简单的方法。双层形成的其它常用方法包括脂质体双层的尖部浸渍,喷 涂双层和膜片钳。
尖部浸渍形成双层必需使孔表面(例如,移液管尖部)接触到承载脂质单层的测试溶液 的表面。另外,首先通过将一滴溶解在有机溶剂中的脂质在溶液表面蒸发而在溶液/空气界面 处产生脂质单层。然后由Langmuir-Schaefer工艺形成所述双层,并且所述双层需要机械自动 化以相对于溶液表面移动所述孔。
对于喷涂双层,将溶解在有机溶剂中的脂质的液滴直接施加到所述孔,该孔浸没在水性 测试溶液中。使用画笔或等效物将脂质溶液薄薄地涂在孔上。溶剂的稀释(thinning)导致脂质双层的形成。然而,从双层完全去除溶剂是困难的,并因此由该方法形成的双层是较不稳定的且在电化学测量过程中更容易有噪声。
膜片钳通常在生物细胞膜的研究中使用。细胞膜通过抽吸被夹到移液管的端部,且膜的 小块贴附到孔上。该方法已被改为用于通过夹住脂质体,然后脂质体爆裂而离开移液管的孔 上的脂质双层密封,而产生脂质双层。该方法需要稳定的、巨大的和单层的脂质体,以及需要在具有玻璃表面的材料中制造小孔。
脂质体可通过超声、挤出或Mozafari法(Colas等人(2007)Micron 38:841–847)来形成。
在优选的实施方案中,脂质双层如在国际申请No.PCT/GB08/004127(公开为WO2009/077734)中描述的来形成。本方法中有利的是,脂质双层是由干燥的脂质形成的。在最优选的实施方案中,脂质双层跨越开口而形成,如在WO2009/077734(PCT/GB08/004127)中描述的。
脂质双层是由脂质的两个相对的层形成的。脂质的两层被排列为使得它们的疏水性尾部 基团面向彼此以形成疏水性内部。脂质的亲水性头部基团面向外朝向该双层的每一侧的含水 环境。该双层可存在于许多脂质相中,所述脂质相包括但不限于,液态无序相(流体层状)、液态有序相、固态有序相(层状凝胶相、相互交叉的凝胶相)和平面双层晶体(层状子凝胶 相、层状结晶相)。
可使用形成脂质双层的任何脂质组合物。脂质组合物被选择为,使得形成的脂双层具有 所需的特性,例如表面电荷、支撑膜蛋白的能力、填充密度或机械特性。脂质组合物可包含 一个或多个不同的脂质。例如,脂质组合物可含有多达100个脂质。脂质组合物优选含有1至10个脂质。脂质组合物可以包括天然存在的脂质和/或人工脂质。
脂质通常包括头部基团、界面部分和可以相同或不同的两个疏水尾基。合适的头部基团 包括,但不限于,中性头部基团,如二酰基甘油酯(DG)和神经酰胺(CM);两性离子头部基团,如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电荷的头部基团,如磷脂酰甘油(PG);磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷酸(PA)和心磷脂(CA); 和带正电荷的头部基团,如三甲基铵-丙烷(TAP)。合适的界面部分包括,但不限于,天然 存在的界面部分,例如基于甘油或基于神经酰胺的部分。合适的疏水性尾部基团包括,但不限于,饱和烃链,如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,如油酸(顺-9-十八烷 酸);和支链烃链,如植烷酰(phytanoyl)。链的长度和不饱和烃链中双键的位置和数量可 以改变。链的长度和在支链烃链中的支链如甲基基团的位置和数目可以改变。疏水性尾部基团可以被连接到作为醚或酯的界面部分。脂质可以是霉菌酸。
脂质也可以是被化学修饰的。脂质的头部基团或尾部基团可以是化学修饰的。头部基团 已被化学修饰的合适的脂质包括,但不限于,PEG修饰的脂质,例如1,2-二酰基-sn-甘油基-3- 磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];官能化的PEG脂质,如1,2-二硬脂酰-sn-甘油基 -3-磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];为共轭而修饰的脂质,如1,2-二油酰-sn-甘油 基-3-磷酸乙醇胺-N-(琥珀酰基)和1,2-二棕榈酰基-sn-甘油基-3-磷酸乙醇胺-N-(生物素基)。 尾部基团已被化学修饰的合适的脂质包括,但不限于,可聚合的脂质,如1,2-双(10,12-二十三二炔酰)-sn甘油基-3-磷酸胆碱;氟化脂质,例如1-棕榈酰基-2-(16-氟代棕榈酰基)-sn 甘油基-3-磷酸胆碱;氘化脂质,如1,2-二棕榈酰基-D62--sn-甘油基-3-磷酸胆碱;和醚连接的 脂质,如1,2-二-O-植烷基-sn-甘油基-3-磷酸胆碱。脂质可以是化学修饰的或官能化的,以有 助于多核苷酸的耦合。
两亲层例如,脂质组合物,通常包含将影响该层的性能的一个或多个添加剂。合适的添 加剂包括,但不限于,脂肪酸,如棕榈酸、肉豆蔻酸和油酸;脂肪醇,如棕榈醇、肉豆蔻醇 和油醇;甾醇,如胆固醇、麦角固醇、羊毛甾醇,谷甾醇和豆甾醇;溶血磷脂,如1-酰基-2-羟基-sn-甘油基-3-磷酸胆碱;和神经酰胺。
在另一个优选的实施方案中,所述膜为固态层。固态层可以由有机和无机材料形成,该 有机和无机材料包括但不限于,微电子材料、绝缘材料,如Si3N4、Al2O3和SiO,有机和无机 聚合物,例如聚酰胺、塑料如或弹性体如双组分加成固化硅橡胶,和玻璃。固态层 可以由石墨烯形成。合适的石墨烯层在国际申请No.PCT/US2008/010637(公开为WO2009/035647)中公开。
该方法通常使用(i)包含孔的人工两亲层,(ⅱ)分离的、包含孔的天然存在的脂质双 层,或(iii)具有嵌入其中的孔的细胞进行。该方法通常使用人工两亲层进行,如人工三嵌段 共聚物层。除了孔以外,所述层可包含其它跨膜和/或膜内蛋白以及其他分子。合适的设备和条件在下面讨论。本发明的方法通常在体外实施。
耦合
所述一个或多个装载部分优选包含一个或多个能够耦合到膜的锚。根据本发明,一旦被 连接,所述一个或多个锚能够将靶多核苷酸耦合到膜。
在本发明的表征方法中,靶多核苷酸优选通过使用一个或多个锚耦合到膜。靶多核苷酸 可以使用任何已知的方法耦合到膜。
每个锚包含耦合(或结合)到所述一个或多个装载部分的基团和耦合(或结合)到膜上 的基团。每个锚可以共价耦合(或结合)到所述部分和/或所述膜。
每个部分可包含任何数量的锚,如2、3、4个或更多个锚。例如,一个靶多核苷酸可以使用两个锚耦合到所述膜,所述两个锚各自经部分和膜单独耦合(或结合)到两个多核苷酸。
如果膜是两亲层,如共聚物膜或脂质双层,则所述一个或多个锚优选地包括在所述膜中 存在的多肽锚和/或在所述膜中存在的疏水锚。所述疏水锚优选是脂质、脂肪酸、甾醇、碳纳 米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸酯或生育酚。在优选的实施方案中,所述一个或多个锚不是检测器。
膜的组分,如两亲分子、共聚物或脂质,可以是化学修饰的或官能化的,以形成一个或 多个锚。合适的化学修饰和合适的官能化膜的组分的方式的实例在下面更详细地讨论。任何 比例的膜组分可以被官能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、 至少50%或100%。
用于耦合多核苷酸到膜的一个或多个锚优选包含连接体。所述一个或多个锚可包含一个 或多个连接体,例如2、3、4或更多个。一个连接体可用于耦合多于1个,例如2、3、4或更多个多核苷酸到膜上。
优选的连接体包括,但不限于,聚合物,如多核苷酸、聚乙二醇(PEG)、多糖和多肽。这些连接体可以是直链的、支链的或环状的。例如,所述连接体可以是环形的多核苷酸。所述多核苷酸可杂合到环状多核苷酸连接体上的互补序列。
所述一个或多个锚或一个或多个连接体可包含可切割或可分解的组分,如限制性位点或 光不稳定基团。
官能化的连接体以及它们耦合分子的方式在本领域中是已知的。例如,用马来酰亚胺基 团官能化的连接体将与蛋白质中的半胱氨酸残基反应并连接到其上。在本发明的上下文中, 该蛋白质可以存在于该膜中,或者可以用来耦合(或结合)到所述一个或多个装载部分。这 在下面更详细地讨论。
可使用“锁和钥匙”排列避免多核苷酸的交联。各连接体仅一端可一起反应以形成更长 的连接体,且连接体的其他端各自分别与装载部分或膜反应。此类连接体在国际申请No. PCT/GB10/000132(公开为WO 2010/086602)中描述。
连接体优选用在下文讨论的测序实施方案中。如果多核苷酸被永久地直接耦合到所述膜, 意义在于当多核苷酸与检测器相互作用时,多核苷酸不解耦(即在步骤(b)或(e)中不解耦),则由于所述膜和检测器之间的距离,当测序运行不能继续至多核苷酸的末端时,一些序列数据将丢失。如果使用连接体,则多核苷酸可以进行到完成为止。
所述耦合可以是永久的或稳定的。换言之,耦合可以是,使得当多核苷酸与所述孔相互 作用时,多核苷酸保持耦合到膜上。
该耦合可以是短暂的。换言之,耦合可以是,使得当多核苷酸与所述孔相互作用时,多 核苷酸可以去耦。
对于某些应用,如适体(aptamer)检测,耦合的短暂性质是优选的。如果永久的或稳定 的连接体直接连接到多核苷酸的5'或3'末端,并且连接体比膜和跨膜孔的通道之间的距离更短,则当测序运行不能继续至多核苷酸的末端,一些序列数据将丢失。如果耦合是短暂的,那么当耦合的末端随机地变得没有膜时,该多核苷酸可以被加工至完成为止。形成永久的/稳 定的或短暂的链接的化学基团在下面更详细地讨论。所述多核苷酸可使用胆固醇或脂肪酰链 短暂地耦合到两亲层或三嵌段共聚物膜。可以使用具有6至30个碳原子的长度的任何脂肪酰 基链,例如十六烷酸。
在优选的实施方案中,一个或多个锚能够被耦合到两亲层,如三嵌段共聚物膜或脂质双 层。将核酸耦合到合成脂双层已经先前用多种不同的拴系策略实施。这些总结于下表1中。
表1
合成的多核苷酸和/或连接体可使用在合成反应中经修饰的亚磷酰胺官能化,所述经修饰 的亚磷酰胺与用于直接加成合适的锚固基团,如胆固醇、生育酚、棕榈酸、硫醇、脂质和生物素基团是容易兼容的。这些不同的连接化学物给出了用于连接装载部分的一套选择。每个不同的修饰基团以略微不同的方式耦合装载部分,并且耦合并不总是永久的,所以给予了连 接到膜的多核苷酸以不同的停留时间(dwell time)。短暂的耦合的优点如上所述。
将多核苷酸耦合到连接体,或将多核苷酸耦合到官能化的膜还可以通过许多其他手段实 现,条件是互补的反应性基团或锚固基团被加成到所述多核苷酸装载部分。将反应性基团加成到多核苷酸的任一端在以前已经有报道。硫醇基团可以使用T4多核苷酸激酶和ATPγS加成到ssDNA或dsDNA的5’末端(Grant,G.P.and P.Z.Qin(2007)."在核酸的5'末端连接硝基 氧自旋标记的简便方法",Nucleic Acids Res 35(10):e77)。叠氮基可以用T4多核苷酸激酶和 γ-[2-叠氮基乙基]-ATP或-γ-〔6-叠氮己基]-ATP加成到ssDNA或dsDNA的5'-磷酸酯。使用硫醇或点击化学(Click chemistry),将含有硫醇、碘乙酰胺OPSS或马来酰亚胺基团(对硫醇具 有反应性)或DIBO(二苯并环辛炔(dibenzocyclooxtyne))或炔基(对叠氮化物具有反应性)的系链共价连接到多核苷酸装载部分。更多样化选择的化学基团,如生物素、硫醇和荧光团,可以使用末端转移酶进行加成,以结合修饰的寡核苷酸到ssDNA的3'末端(Kumar,A.,P.Tchen, et al.(1988).“以末端脱氧核苷酸转移酶非放射性标记合成的寡核苷酸探针”Anal Biochem169(2):376-82)。链霉亲和素/生物素和/或链霉亲和素/脱硫生物素耦合可用于任何其它的多核 苷酸装载部分。也可以将锚使用具有经合适修饰的核苷酸(例如,胆固醇或棕榈酸酯)的末端转移酶直接加成到多核苷酸装载部分。
所述一个或多个锚优选能够将装载部分/多核苷酸经杂合偶联到膜。一个或多个锚中的杂 合可使以如上所述的短暂方式耦合。杂合可以存在于一个或多个锚的任何部分中,例如一个或多个锚与装载部分之间、所述一个或多个锚内或在一个或多个锚和膜之间。例如,连接体可以包含杂合在一起的两个或更多个多核苷酸,如3、4或5个多核苷酸。所述一个或多个锚可以杂合到多核苷酸装载部分。所述一个或多个锚可以直接地杂合到多核苷酸装载部分,如 直接杂合到Y衔体和/或前导序列,或直接杂合到桥连部分衔体,如发夹环衔体(如下面讨论 的)。或者,一个或多个锚可以杂合到一个或多个,例如2或3个中间多核苷酸(或“夹板 体(splint)”),所述中间多核苷酸杂合到多核苷酸装载部分,或杂合到Y衔体和/或前导序列,或杂合到连接到多核苷酸的桥连部分衔体(如下面讨论)。
所述一个或多个锚可包括单链多核苷酸或双链多核苷酸。锚的一部分可以接合到单链或 双链多核苷酸装载部分。使用T4 RNA连接酶I接合ssDNA的短片段已经被报道(Troutt,A.B.,M.G.McHeyzer-Williams等人(1992)."接合-锚定PCR技术:具有单侧特异性的简单扩增技术."Proc Natl Acad Sci U S A 89(20):9823-5)。或者,单链或双链多核苷酸可以接合到双链多核苷酸,然后通过热变性或化学变性分离两条链。对于双链靶多核苷酸,可以将单链多核苷酸的 小段添加到该双链体的一端或两端,或将一双链多核苷酸添加到其一端或两端。对于将单链 多核苷酸添加到双链多核苷酸,可以使用用于连接到单链多核苷酸的其他区域的T4 RNA连接酶I来实现。对于将双链多核苷酸添加到双链多核苷酸随后接合可以用分别在多核苷酸和添 加的多核苷酸上的互补的3'dA/dT尾部(如同常规地对许多样品制备应用所做的,以防止多联 体或者二聚体形成)或使用由多核苷酸的限制消化和相容衔体的接合而产生的“粘性末端”,进 行“钝化终止(blunt-ended)”。然后,当双链体熔化时,每条单链将具有或5'或3'修饰,如果使用单链多核苷酸进行连接或修饰,则在5’末端或3'末端进行修饰,或如果使用双链多核 苷酸进行接合,则在这两端进行修饰。
如果装载部分是合成的,所述一个或多个锚可以在其化学合成过程中并入。例如,多核 苷酸装载部分可以使用具有连接到它的反应性基团的引物来合成。
腺苷酰化的多核苷酸是接合反应中的中间体,其中单磷酸腺苷连接到多核苷酸的5'-磷酸。 多种试剂盒可用于产生该中间体,如来自NEB的5'-DNA腺苷酸化试剂盒。通过在反应中用 ATP替代修饰的核苷酸三磷酸,可以将反应性基团(例如硫醇、胺、生物素、叠氮化物等)加成到多核苷酸的5'。也可以使用具有适当被修饰的核苷酸(例如,胆固醇或棕榈酸酯)的 5'DNA腺苷酰化试剂盒将锚直接加成到多核苷酸装载部分。
用于基因组DNA的片段的扩增的常用技术是使用聚合酶链反应(PCR)。本文中,使用 两个合成寡核苷酸引物可以生成许多DNA的相同片段的拷贝,其中对于每个拷贝,双链体中 每条链的5'将是合成的多核苷酸。单个或多个核苷酸可以通过使用聚合酶被添加到单链或双链的DNA的3'末端。可使用的聚合酶的实例包括,但不限于,末端转移酶、Klenow和大肠 杆菌多(A)聚合酶。通过在反应中用ATP替代被修饰的核苷酸三磷酸,则可将锚,例如胆 固醇、硫醇、胺、叠氮化物、生物素或脂质,结合至双链多核苷酸装载部分中。因此,扩增的多核苷酸装载部分的每个拷贝将包含锚。
理想化的,装载部分/多核苷酸耦合到膜,而无需必须将所述装载部分/多核苷酸官能化。 这可以通过耦合一个或多个锚,如多核苷酸结合蛋白质或化学基团到膜,并使得所述一个或 多个锚与装载部分/多核苷酸相互作用或通过官能化所述膜来实现。所述一个或多个锚可以通过本文所述的任何方法被耦合到膜上。特别地,所述一个或多个锚可以包含一个或多个连接 体,如马来酰亚胺官能化的连接体。
所述一个或多个锚可包含耦合到、结合到下述物质或与之相互作用:单链或双链多核苷 酸、装载部分内特定的核苷酸序列、或装载部分内经修饰核苷酸的模式,或在装载部分上存 在的任何其它配体。
在锚中使用的合适的结合蛋白包括但不限于,大肠杆菌单链结合蛋白、P5单链结合蛋白、 T4 gp32单链结合蛋白、TOPO V dsDNA结合区、人类组蛋白、大肠杆菌HU DNA结合蛋白 和其他古细菌、原核或真核的单链或双链多核苷酸(或核酸)结合蛋白,包括下文列出的那些。
装载部分中的特定的核苷酸序列可以是由转录因子、核糖体、核酸内切酶、拓扑异构酶 或复制起始因子识别的序列。修饰的核苷酸的模式可以是甲基化模式或损伤模式。
所述一个或多个锚可包含耦合到、结合到、嵌入多核苷酸装载部分或与多核苷酸装载部 分相互反应的任何基团。该基团可以通过静电结合、氢键结合或范德华相互作用而嵌入或与多核苷酸相互作用。这类基团包括赖氨酸单体,聚赖氨酸(其将与ssDNA或dsDNA相互作用),溴化乙锭(其将嵌入dsDNA),通用碱基或通用核苷酸(可以与任何多核苷酸杂合)和锇络合物(可以对甲基化碱基反应)。因此多核苷酸装载部分可使用连接到膜的一个或多个通用核苷酸耦合到膜。每个通用核苷酸可以使用一个或多个连接体耦合到膜。通用核苷酸优选包括以下的核碱基中的一个:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基 吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑 或苯基(C 6-芳族环)。通用核苷酸更优选包括下列核苷中的一个:2'-脱氧肌苷,肌苷、7- 脱氮杂-2'-脱氧肌苷、7-脱氮杂-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-O'-甲基肌苷、4-硝基吲哚2'-脱氧核糖核苷、4-硝基吲哚核糖核苷、5-硝基吲哚-2'-脱氧核糖核苷、5-硝基吲哚核糖 核苷、6-硝基吲哚-2'-脱氧核糖核苷、6-硝基吲哚核糖核苷、3-硝基吡咯2'-脱氧核糖核苷、3- 硝基吡咯核糖核苷、次黄嘌呤的无环糖类似物、硝基咪唑2'-脱氧核糖核苷、硝基咪唑核糖核 苷、4-硝基吡唑2'-脱氧核糖核苷、4-硝基吡唑核糖核苷、4-硝基苯并咪唑2'-脱氧核糖核苷、4-硝基苯并咪唑核糖核苷、5-硝基吲唑2'-脱氧核糖核苷、5-硝基吲唑核糖核苷、4-氨基苯并咪 唑2'-脱氧核糖核苷、4-氨基苯并咪唑核糖核苷、苯基C-核糖核苷、苯基C-2'-脱氧核糖基核苷、 2'-脱氧水粉蕈素、2'-脱氧异鸟苷、K-2'-脱氧核糖、P-2'脱氧核糖和吡咯烷。通用核苷酸更优选包含2'-脱氧肌苷。通用核苷酸更优选为IMP或dIMP。通用核苷酸最优选dPMP(2'-脱氧-P-核苷单磷酸)或dKMP(N6-甲氧基-2,6-二氨基嘌呤单磷酸)。
所述一个或多个锚可以通过Hoogsteen氢键(其中两个核碱基通过氢键保持在一起)或反向Hoogsteen氢键(其中一个核碱基相对于另一个核碱基旋转180°)耦合到(或结合到)多 核苷酸装载部分。例如,一个或多个锚可以包含一个或多个核苷酸、一个或多个寡核苷酸, 或与多核苷酸装载部分形成Hoogsteen氢键或反向Hoogsteen氢键的一个或多个多核苷酸。这 种类型的氢键允许第三个多核苷酸链绕双链螺旋卷绕并形成三链体。所述一个或多个锚可以通过用双链二链体形成三链体而耦合到(或结合到)双链多核苷酸装载部分。
在本实施方案中,至少1%、至少10%、至少25%、至少50%或100%的膜组分可以被 官能化。
如果所述一个或多个锚包含蛋白,它们无需进一步官能化,能够直接锚固到膜中,例如, 如果所述蛋白已经具有一个与膜相容的外部疏水区时。这类蛋白的实例包括,但不限于,跨 膜蛋白、膜内蛋白和膜蛋白。或者,所述蛋白可以用与膜相容的遗传融合的疏水区来表达。这种疏水蛋白区在本领域中是公知的。
所述一个或多个锚优选在与膜接触之前,与一个或多个装载部分混合,但是所述一个或 多个锚也可以与膜接触,然后与一个或多个装载部分接触。
在另一个方面,装载部分可使用上述方法官能化,以使其可以被特定的结合基团识别。 具体地,所述装载部分也可以用配体如生物素(用于结合到链霉亲和素)、直链淀粉(用于 结合到麦芽糖结合蛋白或融合蛋白)、Ni-NTA(用于结合到聚组氨酸或聚组氨酸标记的蛋白) 或肽(如抗原)官能化。
根据优选的实施方案,当多核苷酸连接到包含优先螺入孔中的前导序列的装载部分上时, 所述一个或多个锚可用于将多核苷酸耦合到膜上。前导序列是在下面更详细地讨论。优选地, 该多核苷酸被连接到(例如接合到)优先螺入孔中的前导序列。这种前导序列可以包含均聚多核苷酸或脱碱基区。前导序列通常设计为,被直接杂合到或由一个或多个间体多核苷酸(或 夹板体)杂合到所述一个或多个锚。在这种情况下,所述一个或多个锚通常包含与前导序列中的序列或一个或多个中间体多核苷酸(或夹板体)中的序列互补的多核苷酸序列。在这种情况下,所述一个或多个夹板体通常包含与前导序列中的序列互补的多核苷酸序列。
在化学连接中使用的分子的实例是EDC(1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)。反应性基团也可以使用商购的试剂盒(Thermo Pierce,货号No.22980)被加成到多核苷酸的5’ 末端。合适的方法包括,但不限于,使用组氨酸残基和Ni-NTA进行的短暂亲和连接,以及由 反应性半胱氨酸、赖氨酸或非天然氨基酸进行的更牢固的共价连接。
跨膜孔
本发明的表征方法包括当靶多核苷酸相对于孔移动时,获取一个或多个测量值。可使用 孔得到多种不同类型的测量值。这包括但不限于:电测量和光学测量。可能的电测量包括:电流测量、阻抗测量、风洞测量(Ivanov AP et al.,Nano Lett.2011Jan 12;11(1):279-85)以及 FET测量(国际申请号WO 2005/124888)。光学测量可以与电测量组合(Soni GV et al.,Rev Sci Instrum.2010Jan;81(1):014301)。所述测量值可以是跨膜电流测量值,如流经孔的离子电 流的测量值。
电测量值可以使用在Stoddart D et al.,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR et al,J Am Chem Soc.2010;132(50):17961-72,和国际申请WO2000/28312中所描述的标准的单通道记录设备获得。或者,电测量可以使用多通道系统进行,例如国际申请WO 2009/077734 和国际申请号WO 2011/067559中描述的。
本方法优选用跨膜施加发电势实施。所施加的电势可以是电压电势。或者,所施加的电 势可以是化学势。这方面的实例是跨膜,如两亲层,使用盐梯度。盐梯度在Holden etal.,J Am Chem Soc.2007Jul 11;129(27):8650-5中公开。在一些情况下,当多核苷酸相对于孔移动时,使用流经检测器(或孔)的电流来评估或确定多核苷酸的序列。这就是链测序。
该方法包括将靶多核苷酸与跨膜孔接触。跨膜孔是在一定程度上穿过所述膜的结构。其 允许由施加的电势驱动的水合离子流过膜或在膜内流动。跨膜孔通常穿过整个膜,使得水合离子可从膜的一侧流到膜的另一侧。然而,跨膜孔不是必须穿过膜。它可以是一端闭合的。例如,所述孔可以是位于水合离子沿其流动或流入其中的膜中的孔道、间隙、通道、沟槽或 狭缝。
任何跨膜孔可以在本发明中使用。所述孔可以是生物的或人工的。合适的孔包括但不限 于,蛋白孔、多核苷酸孔和固态孔。所述孔可以是DNA折纸(origami)孔(Langeckeret al., Science,2012;338:932-936)。
跨膜孔优选为跨膜蛋白孔。跨膜蛋白孔是允许水合离子如分析物从膜的一侧流向膜的另 一侧的多肽或多肽的集合。在本发明中,跨膜蛋白孔能够形成孔,所述孔允许由施加的电势驱动的水合离子从膜的一侧流到膜的另一侧。跨膜蛋白质孔优选允许分析物如核苷酸从膜如三嵌段共聚物膜的一侧流动到另一侧。跨膜蛋白孔允许多核苷酸如DNA或RNA,相对于孔 移动,如穿过所述孔。
跨膜蛋白质孔可以是单体或低聚物。孔优选由几个重复的亚基,例如至少6个、至少7、 至少8或至少9个亚基组成。孔优选是六聚体的、七聚体的、八聚体的或九聚体的孔。所述 孔可以是同源低聚物或异源低聚物。
跨膜蛋白质孔通常包含该离子可流动通过的桶状体或通道。孔的亚基通常围绕中心轴并 且将链贡献到跨膜β桶状体或通道或跨膜α螺旋束或通道。
跨膜蛋白孔的桶状体或通道通常包含有助于与分析物如核苷酸、多核苷酸或核酸相互作用的氨基酸。这些氨基酸优选定位于靠近桶状体或通道的缢痕(constriction)。跨膜蛋白孔通 常包括一个或多个带正电荷的氨基酸,例如精氨酸、赖氨酸或组氨酸,或芳族氨基酸,例如 酪氨酸或色氨酸。这些氨基酸通常有助于孔和核苷酸、多核苷酸或核酸之间的相互作用。
本发明使用的跨膜蛋白孔可衍生自β-桶状体孔或α-螺旋束孔。β-桶状体孔包含由β-链形 成的桶状体或通道。合适的β-桶状体孔包括,但不限于,β-毒素、如α-溶血素、炭疽毒素和杀 白细胞素,和细菌的外膜蛋白/孔蛋白,如耻垢分枝杆菌(Mycobacteriumsmegmatis)孔蛋白 (Msp),例如MspA、MspB、MspC或MspD、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟球菌属(Neisseria)自转运脂蛋白(NalP)以及其他孔,如胞溶素(lysenin)。 α-螺旋束孔包含由α-螺旋形成的桶状体或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和 α-外膜蛋白,如WZA和ClyA毒素。跨膜孔可以从lysenin衍生。从胞溶素衍生的合适的孔在 国际申请No.PCT/GB2013/050667(公开为WWO 2013/153359)中公开。跨膜孔可以衍生自Msp或α-溶血素(α-HL)。
跨膜蛋白孔优选衍生自Msp,优选MspA。该孔为低聚的且通常包含衍生自Msp的7个, 8个,9个或10个单体。所述孔可以是衍生自含相同单体的MsP的同源寡聚孔。或者,所述孔可以是从含至少一个与其他单体不同的单体的Msp衍生的异源寡聚孔。优选地,所述孔衍生自MspA或其同源物或并系同源物(paralog)。
衍生自Msp的单体通常包含SEQ ID NO:2所示的序列或其变体。SEQ ID NO:2为MspA 单体的MS-(B1)8突变体。其包括以下突变:D90N,D91N,D93N,D118R,D134R和E139K。SEQ ID NO:2的变体是多肽,所述多肽具有从SEQ ID NO:2的氨基酸序列变化而来且保留了其形成孔的能力的氨基酸序列。可以使用本领域已知的任何方法测定变体形成孔的能力。 例如,变体可以连同其他合适的亚基被插入到两亲层中,且可以确定其寡聚形成孔的能力。将亚基插入膜例如两亲膜中的方法是本领域已知的。例如,亚基可以以纯化的形式悬浮在含有三嵌段共聚体膜的溶液中,从而使其扩散到膜并通过结合而插入膜中,并组装成功能状态。 或者,可以使用如M.A.Holden,H.Bayley.J.Am.Chem.Soc.2005,127,6502-6503和国际申请No.PCT/GB2006/001057(公开为WO 2006/100484)中所描述的“拾取和放置”方法将亚基直 接插入膜中。
对于SEQ ID NO:2的氨基酸序列的整个长度,基于氨基酸同一性,变体优选与该序列具 有至少50%的同源性。更优选地,基于氨基酸同一性,变体可与SEQ ID NO:2的氨基酸序 列的整个序列具有至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,更优选至少95%,97%或99%的同源性。在100或更多,例如125,150, 175或200或更多的连续氨基酸长度上,以具有至少为80%,例如至少85%,90%或95%的氨 基酸同一性(严格同源性)。
可使用本领域的标准方法确定同源性。例如,UWGCG软件包提供BESTFIT程序,该程序可以用来计算同源性,例如用于其默认设置(Devereux et al(1984)Nucleic AcidsResearch 12,p387-395)。PILEUP和BLAST算法可以用来计算同源性或比对序列(例如鉴定当量残基或 相应的序列(通常在它们的默认设置下)),如Altschul S.F.(1993)J MolEvol 36:290-300;Altschul,S.F et al(1990)J Mol Biol 215:403-10中所描述的。公众可通过国家生物技术信息中心获得用于进行BLAST分析的软件(http://www.ncbi.nlm.nih.gov/)。
SEQ ID NO:2是MspA单体的MS-(B1)8突变体。该变体与MspA比较,可包含MspB,MspC或MspD单体中的任何突变。MspB,MspC和MspD的成熟形式在SEQ ID NO:5至 SEQ IDNO:7中示出。特别地,所述变体可以包含存在于MspB中的下列取代:A138P。所述变体可以包含存在于MspC中的下列取代中的一个或多个:A96G,N102E和A138P。所述变体 可包含存在于MspD中的下列突变中的一个或多个:G1缺失,L2V,E5Q,L8V,D13G,W21A, D22E,K47T,I49H,I68V,D91G,A96Q,N102D,S103T,V104I,S136K和G141A。所述变体可以包含来自Msp B,Msp C和Msp D的突变体和取代中的一个或多个的组合。所述 变体优选包含突变L88N。SEQID NO:2的变体除了具有MS-B1的所有突变外还具有突变 L88N,并被称为MS-(B2)8。在本发明中使用的孔优选为MS-(B2)8。SEQ ID NO:2的变体除了具有MS-B1的所有突变外,还具有突变G75S/G77S/L88N/Q126R,并被称为MS-B2C。在 本发明使用的孔优选MS-(B2)8或MS-(B2C)8。
除了以上讨论的那些,还可对SEQ ID NO:2的氨基酸序列进行氨基酸取代,例如高达1, 2,3,4,5,10,20或30个取代。保守取代用相似化学结构,相似化学性质或相似侧链体积 的其他氨基酸替代氨基酸。引入的氨基酸可以与它们要替代的氨基酸具有相似的极性,亲水性,疏水性,碱性,酸性,中性或带电性。或者,所述保守取代可在预先存在的芳香族或脂 肪族氨基酸的位置引入其他芳香族或脂肪族氨基酸。保守氨基酸的改变是本领域公知的,并且可以根据下表2中所定义的20种主要氨基酸的特性进行选择。如果氨基酸具有相似极性,这也可以通过参考表3中的氨基酸侧链的亲水性大小而确定。
表2-氨基酸的化学性质
Ala | 脂肪族,疏水,中性 | Met | 疏水,中性 |
Cys | 极性,疏水,中性 | Asn | 极性,亲水,中性 |
Asp | 极性,亲水,带电荷(-) | Pro | 疏水,中性 |
Glu | 极性,亲水,带电荷(-) | Gln | 极性,亲水,中性 |
Phe | 芳香族,疏水,中性 | Arg | 极性,亲水,带电荷(+) |
Gly | 脂肪族,中性 | Ser | 极性,亲水性,中性 |
His | 芳香族,极性,亲水性,带电荷(+) | Thr | 极性,亲水性,中性 |
Ile | 脂肪族,疏水,中性 | Val | 脂肪族,疏水,中性 |
Lys | 极性,亲水,带电荷(+) | Trp | 芳香族,疏水,中性 |
Leu | 脂肪族,疏水,中性 | Tyr | 芳香族,极性,疏水 |
表3-亲水性大小
SEQ ID NO:2的氨基酸序列的一个或多个氨基酸残基可另外从上述多肽中缺失。可缺失 高达1,2,3,4,5,10,20或30个或更多个氨基酸残基。
变体可包括SEQ ID NO:2的片段。这些片段保持孔形成活性。片段可以至少为50,100, 150或200个氨基酸长度。这类片段可用于产生孔。片段优选包含SEQ ID NO:2的孔形成域。 片段必须包含SEQ ID NO:2的残基88、90、91、105、118和134之一。通常,片段包括SEQID NO:2的所有残基88、90、91、105、118和134。
一个或多个氨基酸可以替代地或另外地添加到上述多肽。可在SEQ ID NO:2或多肽变体 或其片段的氨基酸序列的氨基末端或羧基末端提供延伸。所述延伸可以很短,例如,1到10 个氨基酸长度。或者,延伸可以更长,例如长达50或100个氨基酸。载体蛋白可以根据本发明被融合到氨基酸序列。其他融合蛋白在下文中更详细地讨论。
如上所讨论的,变体为多肽,所述多肽具有从SEQ ID NO:2的氨基酸序列变化而来的氨 基酸序列且保留其形成孔能力。变体通常包含负责孔形成的SEQ ID NO:2的区域。包含β- 桶状体的Msp的孔形成能力由每个亚基中的β-片体(β-sheet)提供。SEQ ID NO:2的变体通常包含SEQ ID NO:2中形成β-片体的区域。可对SEQ ID NO:2中形成β-片体的区域进行一 个或多个修饰,只要得到的变体保留了其形成孔的能力即可。SEQ ID NO:2的变体优选地包 括在α-螺旋和/或环状区域内的一个或多个修饰,如取代,添加或缺失。
衍生自Msp的单体可以被修饰以辅助它们的鉴定或纯化,例如通过添加组氨酸残基(hist 标签),天冬氨酸残基(asp标签),链霉亲和素标签或Flag标签,或通过添加信号序列以促 进它们从细胞中分泌,该细胞中的多肽不天然地含有该信号序列。引入遗传标签的一种替代方式是通过化学反应将标签连到孔上天然或工程位点。其例子是将凝胶迁移试剂与工程连接 在孔外的半胱氨酸进行反应。这已被证明是用于分离溶血素异源寡聚物的方法(Chem Biol. 1997Jul;4(7):497-505)。
衍生自Msp的单体可以用可显示标记物(revealing label)进行标记。所述显示标记物可 为任何使孔可被检测的合适的标记物。合适的标记物如下所述。
衍生自Msp的单体也可以使用D-氨基酸生产。例如,衍生自Msp的单体可包含L-氨基 酸和D-氨基酸的混合物。这是本领域中用于生产这类蛋白质或肽常规的。
衍生自Msp的单体含有一个或多个特异性修饰以促进对核苷酸的鉴别。衍生自Msp的单 体也可以含有其它非特异性修饰,只要它们不干扰孔的形成即可。许多非特异性侧链修饰是 本领域已知的,并可以针对衍生自Msp的单体的侧链进行。这种修饰包括,例如,通过与醛 反应然后用NaBH4还原进行氨基酸的还原性烷基化,用甲基乙酰亚胺酯(methylacetimidate) 进行脒基化,或用乙酸酐进行酰化。
衍生自Msp的单体可以使用本领域中已知的标准方法来制备。衍生自Msp的单体可以通 过合成或重组方式制成。例如,所述孔可通过体外翻译和转录(IVTT)合成。制造孔的合适的方法在国际申请No.PCT/GB09/001690(公开为WO 2010/004273),PCT/GB09/001679(公 开为WO 2010/004265)或PCT/GB10/000133(公开为WO 2010/086603)中描述。论述了将孔插入膜的方法。
跨膜蛋白质孔还优选衍生自α-溶血素(α-HL)。野生型α-HL孔由七个相同的单体或亚基 形成(即,其为七聚体)。α-溶血素-NN的一个单体或亚基的序列在SEQ ID NO:4中示出。
在一些实施例中,跨膜蛋白孔是经化学修饰的。所述孔可以任何方式在任何位点进行化 学修饰。所述跨膜蛋白孔优选通过下述进行化学修饰:将分子连接到一个或多个半胱氨酸(半 胱氨酸连接),将分子连接到一个或多个赖氨酸,将分子连接到一个或多个非天然氨基酸, 表位的酶修饰或末端的修饰。适用于进行这些修饰的方法是本领域已知的。跨膜蛋白孔可通过连接任何分子被化学修饰。例如,所述孔可以通过连接染料或荧光团被化学修饰。
可对孔中任何数量的单体进行化学修饰。一个或多个,例如2,3,4,5,6,7,8,9或10个单体优选如上所述进行化学修饰。
半胱氨酸残基的反应性可以通过相邻残基的修饰而增强。例如,侧翼精氨酸、组氨酸或 赖氨酸残基的碱基将使半胱氨酸硫醇基团的pKa变为更大反应性的S-基团的pKa。半胱氨酸 残基的反应性可通过硫醇保护基如dTNB进行保护。所述保护基可在连接体连接之前与孔的 一个或多个半胱氨酸残基反应。
所述分子(使用其对孔进行化学修饰)可以直接地连接到孔或通过连接体连接到孔,如 国际申请No.PCT/GB09/001690(公开为WO 2010/004273),PCT/GB09/001679(公布为WO2010/004265)或PCT/GB10/000133(公开为WO 2010/086603)所公开的。
本文所描述的任何蛋白质,例如跨膜蛋白孔,可以被修饰以有助于它们的鉴定或纯化, 所述修饰为例如通过添加组氨酸残基(his标签),天冬氨酸残基(asp标签),链霉亲和素标签,Flag标签,SUMO标签,GST标签或MBP标签,或通过添加信号序列以促进它们从细胞中分泌,该细胞中的多肽不天然地含有该信号序列。引入遗传标签的另一方式是通过化学 反应将标签连到孔或构建体上的天然或工程位点。其例子是将凝胶迁移试剂与工程连接在所 述孔外的半胱氨酸反应。这已被证明是用于分离溶血素异源寡聚物的方法(ChemBiol.1997Jul;4(7):497-505)。
所述孔可以用显示标记物标记。所述显示标记物可以是使得所述孔被检测的任何合适的 标记物。合适的标记物包括,但不限于,荧光分子,放射性同位素,例如125I,35S,酶,抗体, 抗原,多核苷酸和配体例如生物素。
本文所描述的任何蛋白质,例如跨膜蛋白孔可以通过人工合成或重组手段制备。例如, 所述孔可通过体外翻译和转录(IVTT)合成。该孔的氨基酸序列可以被修饰为包括非天然存在的氨基酸或被修饰为用以提高蛋白质的稳定性。当通过合成手段制备蛋白质时,可以在制备过程中引入这种氨基酸。所述孔也可在合成或重组生产后被改变。
所述孔还可以使用D-氨基酸生产。例如,所述孔或构建体可包含L-氨基酸和D-氨基酸的 混合物。这是本领域中用于生产这类蛋白质或肽常规的。
所述孔还可以包含其他非特异性修饰,只要它们不干扰孔形成或构建体功能即可。许多 非特异性侧链修饰是本领域中已知的,并且可以针对蛋白质的侧链进行。这样的修饰包括, 例如,通过与醛反应然后用NaBH4还原进行氨基酸的还原性烷基化,用甲基乙酰亚胺酯进行 的脒基化,或用乙酸酐进行的酰化。
本文所描述的任何蛋白质例如跨膜蛋白孔可以使用本领域已知的标准方法制备。可以使 用本领域的标准方法衍生和复制编码孔或构建体的多核苷酸序列。可以使用本领域的标准技术在细菌宿主细胞中表达编码孔或构建体的多核苷酸序列。所述孔可在细胞中由重组表达载体原位表达多肽而产生。所述表达载体可选地携带诱导型启动子以控制所述多肽的表达。这 些方法在Sambrook,J.和Russell,D.(2001).分子克隆:实验手册,第3版.冷泉港实验室出版社,冷泉港,纽约(Molecular Cloning:A Laboratory Manual,3rdEdition.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)中描述。
所述孔可以从制备生物体的蛋白质通过任何蛋白质液相色谱系统进行纯化后,或在重组 表达后,而大规模制备。通常的蛋白质液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、 Bio-Rad BioLogic系统和Gilson HPLC的系统。
间隔器
如果所述一个或多个多核苷酸结合蛋白是解旋酶,且所述一个或多个装载部分包含多核 苷酸,则所述一个或多个解旋酶可以停滞在一个或多个间隔器处,如在国际申请No. PCT/GB2014/050175(公开为WO 2014/135838)中描述。在该国际申请中公开的一个或多个解旋酶和一个或多个间隔器的任何构造均可以在本发明中使用。
当部分靶多核苷酸进入所述孔,并相对于所述孔沿着由所施加的电势而产生的场移动如 穿过所述孔时,随着多核苷酸相对于所述孔移动,如穿过所述孔,所述一个或多个解旋酶被 所述孔移动穿过间隔器。这是因为,多核苷酸(包括所述一个或多个间隔器)相对于所述孔移动,如穿过所述孔,并且所述一个或多个解旋酶保留在所述孔的顶部。
所述一个或多个间隔器优选为装载部分多核苷酸的一部分,例如它/它们中断多核苷酸序 列。所述一个或多个间隔器优选不是杂合到多核苷酸的一个或多个阻断分子如减速障(speed bump)的一部分。
装载部分多核苷酸中可以有任何数量的间隔器,如1、2、3、4、5、6、7、8、9、10或 更多个间隔器。多核苷酸中优选有2个、4个或6个间隔器。不同的装载部分多核苷酸中可以 有间隔器,如在前导序列中的间隔器,和在桥连部分或发夹环中的间隔器。
所述一个或多个间隔器其各自提供使一个或多个解旋酶即使在激活模式下也无法克服的 能量屏障。所述一个或多个间隔器可通过减弱解旋酶的牵引(例如通过从多核苷酸中的核苷 酸去除碱基)或物理地阻断所述一个或多个解旋酶的移动(例如使用庞大的化学基团)而使 所述一个或多个解旋酶停滞(stall)。
所述一个或多个间隔器可包含使一个或多个解旋酶停滞的任何分子或分子组合。所述一 个或多个间隔器可包含防止所述一个或多个解旋酶沿着多核苷酸移动的任何分子或分子组合。这可以在不存在跨膜孔和施加的电势的情况下,直接确定所述一个或多个解旋酶是否被停滞在一个或多个间隔器处。例如,其可如实施例中所示被检测,例如可以用PAGE测定解 旋酶移动经过间隔器且置换DNA的互补链的能力。
所述一个或多个间隔器通常包含线性分子,如聚合物。所述一个或多个间隔器通常具有与多核苷酸不同的结构。例如,如果该多核苷酸是DNA时,则所述一个或多个间隔器通常不 是DNA。特别是,如果所述多核苷酸是脱氧核糖核酸(DNA)或核糖核酸(RNA),则所述一个或多个间隔器优选包含肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核 酸(LNA)、桥连核酸(BNA)或具有核苷酸侧链的合成聚合物。所述一个或多个间隔器可以沿与所述多核苷酸相反的方向包含一个或多个核苷酸。例如,当多核苷酸在5'到3'的方向时, 所述一个或多个间隔器可在3'至5'方向包含一个或多个核苷酸。核苷酸可以是上文论述的任何核苷酸。
所述一个或多个间隔器优选包含一个或多个硝基吲哚,例如一个或多个5-硝基吲哚、一 个或多个肌苷、一个或多个吖啶、一个或多个2-氨基嘌呤、一个或多个2-6-二氨基嘌呤、一 个或多个5-溴-脱氧尿苷、一个或多个倒立胸苷(倒立dT)、一个或多个倒立二脱氧胸苷(ddT)、一个或多个二脱氧胞苷(ddC)、一个或多个5-甲基胞苷、一个或多个5-羟甲基胞苷、一个或 多个2'-O-甲基RNA碱基、一个或多个异脱氧胞苷(Iso-dC)、一个或多个异脱氧鸟苷(Iso-dG)、 一个或多个iSpC3基团(即缺乏糖和碱基的核苷酸)、一个或多个光可切割(PC)基团、一 个或多个己二醇基团、一个或多个间隔器9(iSp9)基团、一个或多个间隔器18(iSp18)基团、聚合物或一个或多个硫醇的连接。所述一个或多个间隔器可包含这些基团的任意组合。 这些基团中的许多都是商购自(Integrated DNA />)。
所述一个或多个间隔器可包含任何数量的这些基团。例如,对于2-氨基嘌呤、2-6-二氨基 嘌呤、5-溴-脱氧尿苷、倒立dT、ddT、ddC、5-甲基胞苷、5-羟甲基胞苷、2'-O-甲基RNA碱 基、异-dC、异-dG、iSpC3基团、PC基团、己二醇基团和硫醇的连接,所述一个或多个间隔器优选包含2、3、4、5、6、7、8、9、10、11、12或更多个。所述一个或多个间隔器优选包 含2、3、4、5、6、7、8个或更多个iSp9基团。所述一个或多个间隔器优选包含2、3、4、5 或6个或更多个iSp18基团。最优选的间隔器为四个iSp18基团。
所述聚合物优选为多肽或聚乙二醇(PEG)。所述多肽优选地包含2、3、4、5、6、7、8、9、10、11、12或更多个氨基酸。所述PEG优选包含2、3、4、5、6、7、8、9、10、11、12 或更多个单体单元。
所述一个或多个间隔器优选包含一个或多个脱碱基核苷酸(即缺乏核碱基的核苷酸), 如2、3、4、5、6、7、8、9、10、11、12或更多个脱碱基核苷酸。所述核碱基可以被脱碱基 核苷酸中的-H(idSP)或-OH替代。脱碱基间隔器可以通过从一个或多个相邻的核苷酸中去除核碱基而被嵌入到多核苷酸中。例如,多核苷酸可以被修饰为包括3-甲基腺嘌呤、7-甲基鸟嘌呤、1,N 6-亚乙烯基腺嘌呤肌苷或次黄嘌呤,并且所述核碱基可使用人类烷基腺嘌呤DNA转葡糖基酶(hAAG)从这些核苷酸中去除。或者,多核苷酸可以被修饰为包括尿嘧啶和用尿嘧啶-DNA转葡糖基酶(UDG)去除的核碱基。在一个实施方案中,所述一个或多个间隔器不包含任何脱碱基核苷酸。
所述一个或多个解旋酶可通过每个线性分子间隔器停滞(即停滞在其前面)或在每个线 性分子间隔器上停滞。如果使用线性分子间隔器,则优选所述装载部分多核苷酸优选提供有 与一个或多个解旋酶待移动穿过的每个间隔器的末端相邻近的多核苷酸的双链区。所述双链区通常有助于将一个或多个解旋酶停滞到相邻的间隔器上。如果该方法是在约100mM或更低 的盐浓度下进行的,则存在双链区是特别优选的。每个双链区通常为至少10个,如至少12 个核苷酸的长度。如果本发明中使用的装载部分多核苷酸是单链的,则双链区可以通过将较短的多核苷酸杂合到与间隔器邻近的区域而形成。所述较短的多核苷酸通常由与装载部分多核苷酸相同的核苷酸形成,但也可以由不同的核苷酸形成。例如,所述较短的多核苷酸可由 LNA或BNA形成。
如果使用线性分子间隔器,所述装载部分多核苷酸优选提供有阻断分子,该阻断分子在 每个间隔器的与所述一个或多个解旋酶待移动穿过的末端相对的末端。这有助于确保所述一个或多个解旋酶保持停滞在每个间隔器上。在它/它们在溶液中扩散的情况下,也有助于在多核苷酸上保持一个或多个解旋酶。阻断分子可以是下文所述的能物理地引起一个或多个解旋 酶停滞的任何化学基团。阻断分子可以是多核苷酸的双链区。
所述一个或多个间隔器优选包含物理地引起一个或多个解旋酶停滞的一个或多个化学基 团。所述一个或多个化学基团优选为一个或多个侧挂的化学基团。所述一个或多个化学基团可以被连接到所述多核苷酸中的一个或多个核碱基。所述一个或多个化学基团可以被连接到多核苷酸骨架。可以存在任意数量的这些化学基团,如2、3、4、5、6、7、8、9、10、11、 12或更多个。合适的基团包括,但不限于,荧光团、链霉亲和素和/或生物素、胆固醇、亚甲 蓝、二硝基苯酚(DNP)、地高辛配基和/或抗地高辛配基和二苯甲基环辛炔基团。
装载部分多核苷酸中的不同间隔器可以包含不同的停滞分子。例如,一个间隔器可以包 含上述的线性分子中的一个,而另一个间隔器可以包含物理地引起一个或多个解旋酶停滞的一个或多个化学基团。间隔器可以包含任何上述的线性分子和一个或多个物理地引起一个或多个解旋酶停滞的化学基团,如一个或多个脱碱基体和荧光团。
合适的间隔器可以根据装载部分多核苷酸的类型和本发明的方法实施的条件进行设计。 大多数的解旋酶结合DNA并沿DNA移动,且由此可以使用不为DNA的任何物质使其停滞。 合适的分子如上所述。
本发明的表征方法优选在游离核苷酸存在下和/或在解旋酶辅因子存在下进行。这在下文 更详细地讨论。在跨膜孔和施加电势不存在时,所述一个或多个间隔器优选能够在游离核苷 酸存在下和/或在解旋酶辅因子存在下停滞所述一个或多个解旋酶。
如果本发明的表征方法如下文所述在游离核苷酸和解旋酶辅因子存在下进行(使得一个或更多的解旋酶是在激活模式下),则通常使用一个或多个较长间隔器来确保所述一个或多 个解旋酶是在它们与跨膜孔接触前且电势施加前被停滞在多核苷酸上。在不存在游离核苷酸 和解旋酶辅因子情况下(使得所述一个或多个解旋酶是在非激活模式下),可以使用一个或 多个较短间隔器。
所述盐浓度也影响所述一个或多个间隔器停滞一个或多个解旋酶的能力。在跨膜孔和施 加的电势不存在时,所述一个或多个间隔器优选能够在约100mM或更低的盐浓度下停滞所述 一个或多个解旋酶。本发明的方法中使用的盐浓度越高,通常使用的所述一个或多个间隔器越短,反之亦然。
特征的优选组合在下表4中示出。
所述方法可以涉及,移动两个或更多个解旋酶穿过间隔器。在这种情况下,间隔器的长 度通常是增加的以防止在不存在孔和施加的电势下尾部解旋酶推动前导解旋酶穿过间隔器。如果该方法涉及移动两个或更多个解螺酶穿过一个或多个间隔器,则上文所述的间隔器的长度可以增加至少1.5倍,例如2倍、2.5倍或3倍。例如,如果该方法涉及移动两个或更多个 解螺酶穿过一个或多个间隔器,则在上表4的第三列中的间隔器的长度可以增加1.5倍、2倍、 2.5倍或3倍。
所述两个或更多个解旋酶也可以被分开,使得每个解旋酶具有其自身的一个或多个间隔 器。这在下面更详细地讨论。
双链多核苷酸
靶多核苷酸可以是双链的。如果多核苷酸是双链的,本发明优选包括在多核苷酸的一端 连接桥连部分衔体,如发夹环衔体,以及分离所述多核苷酸的两条链,以形成单链多核苷酸构建体。根据本发明,单链多核苷酸构建体可以随后相对于所述孔移动,如穿过所述孔。以这种方式连接或内接合(interrogating)双链构建体的两条链提高了表征的效率和准确性。
所述桥连部分能够连接多核苷酸的两条链。桥连部分通常共价连接多核苷酸的两条链。 只要桥连部分不干扰所述多核苷酸穿过跨膜孔的移动,桥连部分可以是能够连接多核苷酸的 两条链的任何物质。
桥连部分可通过本领域中已知的任何合适的手段被连接到多核苷酸。桥连部分可以被分 别合成并化学连接或通过酶接合到多核苷酸。或者,桥连部分可以在多核苷酸的加工过程中 生成。
桥连部分在多核苷酸的一端或接近多核苷酸的一端被连接到多核苷酸。桥连部分优选连 接到所述多核苷酸末端的10个核苷酸中的多核苷酸。
尽管桥连部分是优选的装载部分,但是所述桥连部分不是必须具有一个或多个结合的(或 连接的)多核苷酸结合蛋白,只要所述装载部分如Y衔体具有连接到靶多核苷酸的另一端的 一个或多个结合的(或连接的)多核苷酸结合蛋白即可。在一些实施方案中,所述装载部分可以被连接到本发明的多核苷酸的两端,优选其中一个是Y衔体,而另一个是桥连部分,如 发夹环衔体。合适的桥连部分在上文论述,参考装载部分。如果发夹环不被用作装载部分, 发夹环通常是110个或更少个核苷酸,例如100个或更少个核苷酸、90个或更少个核苷酸、80个或更少个核苷酸、70个或更少个核苷酸、60个或更少个核苷酸、50个或更少个核苷酸、40个或更少个核苷酸、30个或更少个核苷酸、20个或更少个核苷酸,或10个或更少个核苷 酸的长度。发夹环优选为约1至110、2到100、5至80、或6到50个核苷酸的长度。如果发 夹环被包含在衔体的差分可选的结合(differential selectable binding)中,优选所述发夹环具有较长的长度,如50到110个核苷酸。类似地,如果发夹环如下文所述不包含在差分可选的结合中,优选所述发夹环具有较短的长度,如1至5个核苷酸。
所述桥连部分衔体或发夹环衔体可以被连接到或接合到靶多核苷酸,如上文所述。
多核苷酸的两条链可以使用本领域中已知的任何方法分离。例如,它们可以由一个或多 个多核苷酸结合蛋白或使用有利于去杂合化的条件进行分离(有利于去杂合化的条件的实例 包括,但不限于高温、高pH值以及添加可以破坏氢键或碱基配对的试剂,如甲酰胺和脲)。如果使用一个或多个多核苷酸结合蛋白来分离链,则所述一个或多个多核苷酸结合蛋白通常在桥连部分的另一端被连接到靶多核苷酸,例如使用Y衔体进行连接。
所述一个或多个装载部分,优选Y衔体和/或桥连部分衔体(如发夹环衔体),优选包含 可选结合部分。这使得多核苷酸被纯化或分离。可选结合部分是在其结合特性的基础上选择出的部分。因此,可选结合部分优选为特异性结合到表面的部分。如果可选结合部分,与本发明中使用的任何其他部分相比,以大得多的程度结合到表面,则可选结合部分特异性结合 到该表面。在优选的实施方案中,所述部分结合到未结合有本发明使用的其他部分的表面。
合适的可选结合部分是本领域已知的。优选的可选结合部分包括,但不限于,生物素、 多核苷酸序列、抗体、抗体片段,如Fab和ScSv,抗原、多核苷酸结合蛋白、聚组氨酸尾部和GST标签。最优选的可选结合部分是生物素和可选的多核苷酸序列。生物素特异性结合到涂覆有抗生物素蛋白的表面。可选的多核苷酸序列特异性结合(即杂合)到涂覆有同源序列的表面。或者,可选的多核苷酸序列特异性结合到涂覆有多聚核苷酸结合蛋白的表面。
所述一个或多个装载部分,优选Y衔体和/或桥连部分衔体(如发夹环衔体)和/或可选的 结合部分,可包含可以被切割的、带缺口的、裂缝的或水解的区域。这种区域可以被设计为 允许第一和/或第二多核苷酸从其所结合的表面移除,随后纯化或分离。合适的区域在本领域中是公知的。合适的区域包括,但不限于,RNA区域、包含脱硫生物素和链霉亲和素的区域、 二硫键以及可光解的区域。
前导序列
所述一个或多个装载部分可提供有优先螺入孔中的前导序列。前导序列有助于本发明的 方法。前导序列被设计为优先螺入跨膜孔中,并由此有助于靶多核苷酸相对于所述孔的移动, 如穿过所述孔。前导序列还可以用于将多核苷酸连接到一个或多个锚,如上文所述。
前导序列通常包含聚合物。所述聚合物优选带负电荷。聚合物优选为多核苷酸,如DNA 或RNA,修饰的核苷酸(如脱碱基的DNA)、PNA、LNA、BNA、聚乙二醇(PEG)或多肽。 所述前导序列优选包含多核苷酸,并且更优选包含单链多核苷酸。前导序列可以包含上述的任何多核苷酸。单链前导序列最优选包含DNA的单链,如聚dT段。前导序列优选地包含所述一个或多个间隔器。
前导序列可以是任意长度,但通常为10至150个核苷酸长度,例如20至150个核苷酸 长度。前导序列的长度通常取决于在本方法中使用的跨膜孔。
双耦合
在优选的实施方案中,本发明包括将一个或多个多核苷酸结合蛋白连接到靶双链多核苷 酸的方法,包括:
(a)提供结合(或连接)有一个或多个多核苷酸结合蛋白并且具有用于将多核苷酸耦合 到膜的一个或多个第一锚的Y衔体,且提供具有一个或多个第二锚的桥连部分衔体,如发夹 环衔体,其中所述桥连部分衔体耦合到膜的强度比Y衔体耦合到膜的强度更大;以及
(b)将所述Y衔体连接到所述靶多核苷酸的一端,并且将所述桥连部分连接到所述靶多 核苷酸的另一端。桥连部分优选具有与其连接的一个或多个多核苷酸结合蛋白,优选一个或 多个分子制动器。
本发明还提供表征靶双链多核苷酸的方法,包括
(c)将在上面步骤(b)中提供的多核苷酸与跨膜孔接触,使得所述一个或多个多核苷 酸结合蛋白控制靶多核苷酸相对于所述孔的移动,如穿过所述孔;和
(d)随着所述多核苷酸相对于所述孔移动,获取一个或多个测量值,其中测量值代表多 核苷酸的一个或多个特征,并由此表征所述靶多核苷酸。
这种类型的方法在英国申请No.1406147.7中被详细讨论。
Y衔体和/或桥连部分衔体通常为多核苷酸衔体。它们可以由上文所述的任何多核苷酸形 成。
Y衔体通常包含(a)双链区域和(b)单链区域或另一端不互补的区域。如果Y衔体包括一个单链区域,则Y衔体可被描述为具有悬突(overhang)。与双链部分不同的是,由于 两条链通常不彼此杂合,因此Y衔体中非互补区域的存在给予该衔体Y形。Y衔体包括一个 或多个第一锚。锚在上文更详细地论述。
Y衔体优选包括优先螺入孔中的前导序列。这是上文进行了论述。
所述桥连部分衔体优选包含如上所述的可选结合部分。所述桥连部分衔体和/或可选结合 部分可包含如上所述的可切割的、带缺口的、裂缝的或水解的区域。
Y衔体和/或桥连部分衔体可以使用本领域中已知的任何方法接合到多核苷酸。所述的一 个或两个衔体可使用连接酶,如T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、 Tma DNA连接酶和9°N DNA连接酶进行接合。
桥连部分衔体耦合(或结合)到膜的强度比Y衔体耦合(或结合)到膜的强度更大。这 可以用任何方式来测定。用于测定耦合(或结合)的强度的合适的方法在英国申请No.1406147.7的实施例中公开。
桥连部分衔体耦合(或结合)的强度优选至少是Y衔体耦合(或结合)的强度的1.5倍, 如是Y衔体耦合(或结合)的强度的至少二倍,至少三倍,至少四倍,至少五倍或至少十倍。 用于膜的桥连部分衔体的亲和常数(Kd)优选为Y衔体的亲和常数的至少1.5倍,如至少二倍,至少三倍,至少四倍,至少五倍或至少十倍。
使桥连部分衔体比Y衔体更牢固地耦合(或结合)到膜的方式有多种。例如,所述桥连 部分衔体可以包含比Y衔体更多的锚。例如,桥连部分衔体可包含2、3或更多个第二锚,而 Y衔体可包含一个第一锚。
一个或多个第二锚耦合(或结合)到膜的强度可以比一个或多个第一锚耦合(或结合) 到膜的强度更大。将一个或多个第二锚耦合(或结合)到桥连部分衔体的强度可以比将一个 或多个第一锚耦合(或结合)到Y衔体的强度更大。所述一个或多个第一锚和所述一个或多个第二锚定可通过杂合被连接到其各自的衔体,且在一个或多个第二锚中杂合的强度比在一个或多个第一锚中更大。这些实施方案的任意组合也可以用于本发明中。耦合(或结合)的 强度可以使用本领域的已知技术来测定。
所述一个或多个第二锚优选包含耦合(或结合)到膜的一个或多个基团,所述一个或多 个基团在一个或多个第一锚中耦合(或结合)到膜的一个或多个基团具有更高的强度。在优 选的实施方案中,使用胆固醇将桥连部分衔体/一个或多个第二锚耦合(或结合)到膜,且使用棕榈酸酯将Y衔体/一个或多个第一锚耦合(或结合)到膜。胆固醇比棕榈酸酯更牢固地结 合到三嵌段共聚物膜和脂质膜。在可替代的实施方案中,使用单酰基物种,如棕榈酸膜,将 桥连部分衔体/一个或多个第二锚耦合(或结合)到膜,并且使用二酰基物种如二棕榈酰磷脂 酰胆碱将Y衔体/一个或多个第一锚耦合(或结合)到膜。
添加发夹环及前导序列
根据本发明,双链多核苷酸可以与MuA转座酶和一组双链MuA底物接触,其中所述组 中的底物的一部分是结合到一个或多个多核苷酸结合蛋白且包含前导序列的Y衔体,且其中 所述组中的底物的一部分是桥连部分衔体,例如结合到一个或多个多核苷酸结合蛋白的发夹环衔体。所述Y衔体和/或桥连部分衔体有所述装载部分的功能。转座酶分裂双链多核苷酸并 且将MuA底物接合到分裂碎片的一端或两端。这产生多个经修饰的双链多核苷酸,所述经修 饰的双链多核苷酸一端含有具有一个或多个多核苷酸结合蛋白和前导序列的Y衔体,且在另 一端含有具有一个或多个多核苷酸结合蛋白的桥连部分(或发夹环)。所述经修饰的双链多 核苷酸随后可以使用本发明的方法进行表征。
所述组中的每个底物优选包含至少一个通用核苷酸的悬突,使得转座酶将模板多核苷酸 分裂且将底物接合到双链分裂碎片的一端或两端,并由此产生多个碎片/底物构建体,并且其中所述方法进一步包括将悬突接合到构建体中的碎片,并由此产生多个经修饰的双链多核苷酸。合适的通用核苷酸如上所述。悬突优选为5个核苷酸的长度。
或者,所述组中的每个底物优选包含(i)至少一个悬突,以及(ii)在与至少一个悬突相 同的链中的至少一个核苷酸,所述悬突包含在模板多核苷酸中不存在的核苷,使得转座酶分 裂所述模板多核苷酸,且将底物接合到双链碎片的一端或两端,并由此产生多个碎片/底物构建体,且其中所述方法进一步包括(a)通过选择性地去除所述至少一个核苷酸而从所述构建 体去除所述悬突,且由此产生多个含有单链间隙的双链构建体,以及(b)修复所述构建体中 的单链间隙,并由此产生多个经修饰的双链多核苷酸。多核苷酸分析物通常包含核苷脱氧腺苷(dA)、脱氧尿苷(dU)和/或脱氧胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。不存在于多核苷酸中的核苷优选是脱碱基的腺苷(A)、尿苷(U)、5-甲基尿苷(m5U)、胞苷(C)或鸟苷(G)或包含脲、5,6-二羟基胸腺嘧啶、胸腺嘧啶二醇、5-羟基-5-甲基乙内酰 脲(5-hydroxy-5methylhydanton)、尿嘧啶二醇、6-羟基-5,6-二氢硫胺、甲基丙醇二酰脲(tartronylurea)、7,8-二氢-8-氧鸟嘌呤(8-氧鸟嘌呤)、8-氧代腺嘌呤、fapy-鸟嘌呤、甲基-fapy-鸟嘌呤、fapy-腺嘌呤、黄曲霉毒素B1-fapy-鸟嘌呤、5-羟基胞嘧啶、5-羟基尿嘧啶、 3-甲基腺嘌呤、7-甲基鸟嘌呤、1,N 6–亚乙烯基腺嘌呤、次黄嘌呤、5-羟基尿嘧啶、5-羟基甲基尿嘧啶、5-甲酰基尿嘧啶或顺式-环丁烷嘧啶二聚体。所述至少一个核苷酸优选为来自悬 突的10个或更少的核苷酸。所述至少一个核苷酸优选为悬突中的第一个核苷酸。悬突中的所 有核苷酸优选包含在模板多核苷酸中不存在的核苷。
这些基于MuA的方法在英国申请No.1314695.6中公开。它们还在英国申请No.1406147.7 中有详细论述。
一个或多个解旋酶可在与双链多核苷酸和MuA转座酶接触之前,连接到MuA底物Y衔 体(即装载部分)。或者,一个或多个解旋酶可在与双链多核苷酸和MuA转座酶接触之后,连接到MuA底物Y衔体(即装载部分)。
一个或多个分子制动器可在与双链多核苷酸和MuA转座接触之前,连接到MuA底物桥 连部分(或发夹环)衔体。或者,一个或多个分子制动器可在与双链多核苷酸和MuA转座酶 接触后,连接到MuA底物桥连部分(或发夹环)衔体。
多核苷酸表征
本发明提供了表征靶多核苷酸的方法。靶多核苷酸也可称为模板多核苷酸或感兴趣的多 核苷酸。
本发明的方法涉及测量所述多核苷酸的一个或多个特征。特别地,上述用于控制多核苷 酸移动穿过跨膜孔的方法中之一按步骤(a)实施,然后在步骤(b)中,当所述多核苷酸相对于所述孔移动时,获取一个或多个测量值,其中测量值代表多核苷酸的一个或多个特征。 合适的测量值如上文所述。
可以测查任意数量的靶多核苷酸。例如,本发明的方法可以涉及表征2、3、4、5、6、7、 8、9、10、20、30、50、100个或更多个靶多核苷酸。所述靶多核苷酸可以是天然存在的或人工的。例如,该方法可以被用于检验所制造的寡核苷酸的序列。该方法一般在体外进行。
该方法可以涉及测量一个,两个,三个,四个或五个或更多个靶多核苷酸的特征。所述 一个或多个特征优选选自(i)所述多核苷酸的长度,(ii)所述多核苷酸的同一性,(iii)所 述多核苷酸的序列,(iv)所述多核苷酸的二级结构,和(v)所述多核苷酸是否被修饰。(i)至(v)的任意组合可以根据本发明进行测量,如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v}, {ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。
对于(i),多核苷酸的长度例如可以通过确定所述多核苷酸和所述孔之间的相互作用次 数,或所述多核苷酸与所述孔之间相互作用的持续时间来测定。
对于(ii),所述多核苷酸的同一性可以通过多种方式测定。所述多核苷酸的同一性可以 联合所述多核苷酸的序列的测定来测定,或不联合多核苷酸的序列的测定进行测定。前者是直接进行的;对所述多核苷酸进行测序,并由此进行鉴定。后者可以以几种方式来完成。例如,可以测定多核苷酸中特定模序的存在(而无需测定该多核苷酸的其余序列)。或者,所 述方法中测定的特定的电和/或光信号可鉴定来自特定来源的多核苷酸。
对于(iii),多核苷酸的序列可以如以前所述确定。合适的测序方法,特别是那些使用电 测量的方法,描述于Stoddart D et al.,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR et al,J Am Chem Soc.2010;132(50):17961-72,和国际申请WO 2000/28312中。
对于(iv),所述二级结构可以以多种方式测量。例如,如果该方法包含电测量,二级结 构可以利用相对于孔流动例如穿过孔时的停留时间的改变或电流变化进行测量。这使得单链 和双链多核苷酸的区域能够得到识别。
对于(v),可以测定任何修饰的存在或不存在。该方法优选包括确定所述多核苷酸是否 通过甲基化、氧化、损伤、用一个或多个蛋白质或一个或多个标记物、标签或间隔器进行了修饰。特异性修饰将导致与孔的特异性相互作用,这可以使用下面描述的方法来测定。例如,甲基胞嘧啶可以基于其与每个核苷酸的相互作用过程中相对于孔流动例如穿过孔时的电流, 与胞嘧啶区别开。
所述方法可以使用任何适于研究膜/孔系统(其中孔存在于膜中)的设备进行实施,该方法 可以使用任何适合于感测跨膜孔的设备实施。例如,所述设备包括一个室,所述室包括水溶 液和将该室分割为两部分的屏障(barrier)。所述屏障通常具有开口,其中在开口中形成包括所 述孔的膜。或者该屏障形成其中存在所述孔的膜。
该方法可以使用在国际申请No.PCT/GB08/000562(WO 2008/102120)中描述的设备实 施。
该方法可以包括随着多核苷酸相对于所述孔移动,测量经过所述孔的电流。因此该装置 也可以包括能够跨所述膜和孔而施加电势并测量电信号的电路。该方法可以使用膜片钳或电 压钳实施。所述方法优选包含使用电压钳。
本发明的方法包括测量当所述多核苷酸相对于所述孔移动时经过所述孔的电流。用于测 量通过跨膜蛋白孔的离子电流的合适的条件是本领域已知的,并且在实施例中公开。该方法 通常用跨所述膜和孔施加的电压进行实施。使用的电压通常为+5V到-5V,例如+4V到-4V,+3V到-3V或+2V到-2V。使用的电压通常为-600mV到+600mV或-400mV到+400mV。所使 用的电压优选在具有以下下限和上限的范围内:所述下限选自-400mV,-300mV,-200mV,-150mV,-100mV,-50mV,-20mV和0mV的范围内,所述上限独立地选自+10mV,+20mV,+50mV,+100mV,+150mV,+200mV,+300mV,和+400mV。所用的电压更优选在100mV 到240mV的范围内并最优选在120mV到220mV的范围内。可通过施加提高的电势通过孔 来提高对不同核苷酸的鉴别力。
该方法通常在任何载荷子,如金属盐,如碱金属盐,卤盐,如盐酸盐,如碱金属盐酸盐 的存在下实施。载荷子可包括离子型液体或有机盐,例如四甲基氯化铵,三甲基苯基氯化铵, 苯基三甲基氯化铵,或1-乙基-3-甲基咪唑鎓氯化物。在上面论述的示例性设备中,所述盐存在于所述室中的水溶液中。通常使用氯化钾(KCl),氯化钠(氯化钠)、氯化铯(CsCl)或亚铁 氰化钾和铁氰化钾的混合物。优选KCl、NaCl,和亚铁氰化钾与铁氰化钾的混合物。所述载 荷子可以不对称的跨所述膜。例如在膜的每侧,所述载荷子的种类和/或浓度可以是不同的
盐浓度可为饱和的。盐浓度可以是3M或更低,通常为0.1M至2.5M,0.3M至1.9M,0.5M 至1.8M,0.7M至1.7M,0.9M至1.6M或1M至1.4M。优选盐浓度为150mM到1M。所述 方法优选使用至少为0.3M,例如至少为0.4M,至少为0.5M,至少为0.6M,至少为0.8M,至少为1.0M,至少为1.5M,至少为2.0M,至少为2.5M,或者至少为3.0M的盐浓度进行实 施。高盐浓度提供了高信噪比,并使得在正常电流波动的背景下,代表核苷酸存在的电流能 被识别。
该方法通常在缓冲剂存在下实施。在上面讨论的示例性设备中,缓冲剂存在于所述室的 水溶液中。本发明的方法可使用任何缓冲剂。通常地,缓冲剂是磷酸缓冲液。另一个合适的缓冲剂是HEPES和Tris-HCl(三羟甲基氨基甲烷-HCl)缓冲剂。该方法通常在pH值为4.0至12.0,4.5至10.0,5.0至9.0,5.5至8.8,6.0至8.7,7.0至8.8,或7.5至8.5下实施。所使用的pH优选约为7.5。
该方法可以通常在0℃到100℃,15℃到95℃,16℃至90℃,17℃至85℃,18℃至80℃, 19℃至70℃,或者从20℃至60℃实施。该方法通常在室温下进行。该方法可选地在支持酶功 能的温度下如约37℃实施。
桥连部分测序
在优选的实施方案中,靶双链多核苷酸在一端设置有桥连部分(或发夹环)衔体,并且 该方法包括将多核苷酸与跨膜孔接触,使得该多核苷酸的两条链相对于孔移动,如穿过所述 孔,并且随着多核苷酸的两条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表多核苷酸的链的一个或多个特征,并由此表征所述靶双链多核苷酸。上述的任何实施方案同样适用于本实施例。
经修饰的多核苷酸
在使用本发明的方法之前,在聚合酶使用多核苷酸作为模板形成经修饰的多核苷酸的条 件下,通过将所述多核苷酸与聚合酶和一组游离核苷酸接触,来修饰所述多核苷酸,其中当形成经修饰的多核苷酸时,所述聚合酶用不同的核苷酸物种来代替所述多核苷酸中的一个或多个核苷酸物种。所述经修饰的多核苷酸随后可以在本发明的方法中使用。这种类型的修饰 在英国申请No.1403096.9中描述。可以使用任何上述的聚合酶。所述聚合酶优选Klenow or 9° North。
在聚合酶使用该多核苷酸作为模板形成经修饰的多核苷酸的条件下,使所述多核苷酸与 聚合酶接触。这种条件在本领域中是已知的。例如,通常在商购的聚合酶缓冲液中如来自New England 的缓冲液中,使所述多核苷酸与聚合酶接触。对于Klenow,温度优选20到 37℃,或对于9° North,温度优选60到75℃。通常使用引物或3'发夹作为聚合酶扩展的成核 点。根据本发明聚合酶可以与靶多核苷酸接触,即通过下述进行接触:(a)提供结合到一个 或多个装载部分的一个或多个聚合酶,及(b)将所述一个或多个装载部分连接到所述靶多核 苷酸。
使用跨膜孔对多核苷酸的表征,如测序,通常包括,分析由k个核苷酸组成的聚合物单 元(即‘k聚体’),其中k是正整数。这在国际申请No.PCT/GB2012/052343(公开为WO2013/041878)中有论述。虽然理想的是在不同k-聚体的电流测量值之间能清楚的分离开,但是通常这些测量中的一些存在重叠。特别是k-聚体中具有大量的聚合物单元时,即具有非 常高的k值时,难以分辨由不同的k-聚体产生的测量值,不利于导出关于多核苷酸的信息,例如估计多核苷酸的基础序列。
通过用所述经修饰的多核苷酸中的不同的核苷酸物种代替所述多核苷酸中的一个或多个 核苷酸物种,所述经修饰的多核苷酸含有的k-聚体不同于所述多核苷酸中的k-聚体。所述经修饰的多核苷酸中的不同k-聚体能够产生与来自所述多核苷酸中的k聚体不同的电流测量值,所以所述经修饰的多核苷酸提供了与所述多核苷酸不同的信息。来自所述经修饰的多核苷酸 的额外信息使得可以更容易表征所述多核苷酸。在一些情况下,所述经修饰的多核苷酸其自身可以更容易表征。例如,所述经修饰的多核苷酸可以被设计为,包括在它们的电流测量值之间具有增强的分离或清楚的分离的k-聚体或具有降低的噪声的k-聚体。
所述聚合酶优选用在形成经修饰的多核苷酸时的不同核苷酸物种代替所述多核苷酸中的两个或多个核苷酸物种。所述聚合酶可以用有区别的核苷酸物种代替所述多核苷酸中的两个 或多个核苷酸物种中的每一个。所述聚合酶可以用相同的核苷酸物种代替所述多核苷酸中的两个或多个核苷酸物种中的每一个。
如果所述多核苷酸为DNA,则所述经修饰的多核苷酸中的不同的核苷酸物种通常包含与 腺嘌呤,鸟嘌呤,胸腺嘧啶,胞嘧啶或甲基胞嘧啶不同的核碱基和/或包含与脱氧腺苷,脱氧 鸟苷,胸苷,脱氧胞苷或脱氧甲基胞苷不同的核苷。如果所述多核苷酸是RNA,则所述经修饰的多核苷酸中不同的核苷酸物种通常包含与腺嘌呤,鸟嘌呤,尿嘧啶,胞嘧啶或甲基胞嘧 啶不同的核碱基,和/或包含与腺苷,鸟苷,尿苷,胞苷或甲基胞苷不同的核苷。所述不同的 核苷酸物种可以是上述的任何通用核苷酸。
所述聚合酶可以用含有在一个或多个核苷酸物种中不存在的化学基团或原子的不同核苷 酸物种代替一个或多个核苷酸物种。所述化学基团可以是丙炔基,硫代基,氧代基,甲基, 羟甲基,甲酰基,羧基,羰基,苄基,炔丙基或炔丙胺基。
所述聚合酶可以用缺少存在于一个或多个核苷酸物种中的化学基团或原子的不同核苷酸 种类来代替一个或多个核苷酸物种。聚合酶可以用具有改变的电负性的不同核苷酸物种来代 替一个或多个核苷酸物种。具有改变的电负性的不同核苷酸物种优选包含卤素原子。
该方法优选进一步包括选择性地从所述经修饰的多核苷酸中的一个或多个不同核苷酸物 种中去除核碱基。
产物
本发明还提供使用本发明修饰的靶多核苷酸。本发明还提供具有一个或多个多核苷酸结 合蛋白结合其上的装载部分。上文针对本发明方法所论述的任何实施方案均适用于本发明的 多核苷酸和部分。
试剂盒
本发明还提供了一种用于将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的试剂盒, 包括:(a)结合到一个或多个装载部分的一个或多个多核苷酸结合蛋白和(b)连接酶。上文所述的任何实施方案均适用于试剂盒。
所述试剂盒优选用于通过跨膜孔的双链多核苷酸,且该试剂盒优选地包括具有一个或多 个解旋酶附连的Y衔体和具有一个或多个分子制动器附连的桥连部分(或发夹环)衔体。所 述Y衔体优选包含一个或多个用于耦合所述多核苷酸到膜的第一锚,所述桥连部分(或发夹环)衔体优选包含一个或多个用于耦合所述多核苷酸到膜的第二锚,并且将桥连部分(或发 夹环)衔体耦合到所述膜的强度优选比将所述Y衔体耦合到所述膜的强度更大。
所述试剂盒优选还包含跨膜孔。任何以上所述的膜和孔均可以在试剂盒中。
上文针对本发明方法所述的任何实施方案同样适用于所述试剂盒。所述试剂盒还可以包 括膜的组分,如两亲层或三嵌段共聚物膜的组分。
本发明的试剂盒可以额外包括一个或多个能使上述任何实施方案实施的其它试剂或仪 器。这类试剂或仪器包括以下中的一个或多个:合适的缓冲液(水性溶液),从受试者获得样品的工具(例如包含针的容器或仪器),扩增和/或表达多核苷酸的工具,或上文定义的膜,或电压或膜片钳装置。试剂可以干燥状态存在于试剂盒中,使得流体样品能重悬所述试剂。 所述试剂盒还可以任选包括能使试剂盒用于本发明方法的介绍,或关于本发明方法可用于哪 种生物的详情。
下列实施例阐明了本发明。
实施例1
本实施例描述了用于将多核苷酸结合蛋白结合到装载部分的样品制备过程。
材料与方法
TrwC Cba-L376C/Q594A/K762C(6.5μM,具有突变L376C/Q594A/K762C的SEQ IDNO: 25)和DNA发夹衔体(4μM,SEQ ID NO:29在3'末端连接到四个iSpC3间隔器,所述四个iSpC3间隔器在相对端连接到SEQ ID NO:30的5'末端)在缓冲液(100mM KCl,100mM CAPS(pH为10)和1mM EDTA)中混合,并培养30分钟。将TRIS(0.1体积的1M TRIS pH 7.0)添加到该DNA/酶混合物中,并将该混合物充分混合。最后,添加0.025体积的DMF中的1.29mM双马来酰亚胺基乙烷,且将混合物进一步培养15分钟。各成分的最终浓度如下:TrwC Cba-L376C/Q594A/K762C(5.8μM),DNA发夹衔体(3.56μM),缓冲液(89mM KCl, 89mM CAPS,pH 10,0.89mM EDTA,89mM Tris(pH 7))和双马来酰亚胺基乙烷(28.7μM), 该混合物被称为样品1。
然后使用8mL POROS HQ-10柱(FPLC)和随后的洗脱缓冲液(缓冲液A——50mM乙醇胺,300mM NaCl,0.1%β-OTG,1mM TCEP,pH 10.0,缓冲液B——50mM乙醇胺,700mM NaCl,0.1%β-OTG,1mM TCEP,p 10.0)使用所述的步骤将预结合到DNA发夹衔体的TrwC CBA-L376C/Q594A/K762C纯化。将样品1装载到柱上,用5柱体积的缓冲液A将没有TrwC CBA-L376C/Q594A/K762C结合的任何DNA或没有结合到DNA的酶洗掉。用11.8柱体积的 0-100%缓冲液B对预结合到DNA发夹衔体的TrwC CBA-L376C/Q594A/K762C进行洗脱, 该样品被称为样品2。示例性FPLC轨迹在图1中示出,标有P1的峰对应预结合到DNA发夹衔体的TrwCCBA-L376C/Q594A/K762C。
然后将样品2使用5mL的Histrap HP柱(FPLC),使用下列洗脱缓冲液(缓冲液C——20mM的Na-CAPS,100mM的NaCl,0.1%β-OTG,1mM TCEP,pH 10.0,缓冲液D——20mM的Na-CAPS,2M NaCl,10%(w/v)甘油,0.1%β-OTG,1mM的TCEP,pH 10.0, 和缓冲剂E——20mM的Na-CAPS,100mM的NaCl,300mM咪唑,0.1%β-OTG,1mM的TCEP,pH 10.0)进一步纯化。将样品2装载到所述柱上,用缓冲液C将没有TrwC CBA-L376C/ Q594A/K762C结合的任何DNA或没有结合到DNA的酶从柱上洗脱掉。然后用缓冲液D洗 涤该柱,然后用缓冲液C再次洗涤。最后用10柱体积的0-100%缓冲液E将预结合到DNA 发夹衔体的TrwC CBA-L376C/Q594A/K762C进行洗脱。然后汇集(pool)主洗脱峰(实例在图2中示出,用P2标记主峰),测量其浓度,并使用TBE(天然的)PAGE和SDS PAGE凝 胶分析DNA样品。TBE(天然的)PAGE为4-20%TBE凝胶,在150V下运行25分钟,然后使用SYBR金染料染色。这种染料使得样品中的任何DNA(有或没有酶结合)均是可见的。 图3显示了这种凝胶。4-6列表明纯化后,DNA仍结合到酶。SDS PAGE为10%Bis-Tris凝胶,XT MOPS,在200V下运行60分钟,然后使用SYPRO红宝石染料染色。这种染料使得样品中的任何酶(结合到或未结合到DNA)均是可见的。图4的4-6列中显示了纯化后,使用双 马来酰亚胺基乙烷连接体将酶闭合到DNA上。
实施例2
本实施例描述了用于将多核苷酸结合蛋白结合到装载部分的样品制备过程。
材料与方法
将T4 Dda–E94C/C109A/C136A/A360C(3μM,具有突变E94C/C109A/C136A/A360C的SEQ ID NO:24)和DNA Y衔体(500nM,SEQ ID NO:26杂合到DNA链X=30个iSpC3间隔器,所述间隔器在其3'末端连接到SEQ ID NO:27的5'末端,SEQ ID NO:27在其3'末端连 接到4个iSp18间隔器,所述4个iSp18间隔器在相对端连接到SEQ ID NO:28的5'末端)在缓冲液(50mM HEPES,100mM KOAc(pH 8))中混合,并添加EDTA(1mM)和TMAD(100 μM),并在室温下培养60分钟。然后将混合物在KCl/ATP溶液中(500mM KCl,1mM ATP 最终浓度)以1:1稀释,并在环境温度下培育25分钟,该混合物被称为样品3。
然后使用SPRI珠粒纯化该样品。使用下面的过程制备SPRI珠粒——
1.使用血清移液管将洗涤缓冲液(30mL,50mMTris pH7.5,2.5M NaCl)转移到50mLFalcon试管中。
2.将速度珠粒羧酸酯修饰的磁性颗粒(Thermo)的存储罐(stock pot)涡旋以重悬所述 珠粒。
3.将珠粒悬浮液(600μL)转移到30mL的洗涤缓冲液中(步骤1)并涡旋以重悬所述珠 粒。
4.然后将Falcon试管放入DynaMag-50磁道中,使得珠粒在所述试管的邻近该磁体的一 侧上积聚,并且使用血清移液管去除上清液。
5.将另外的30mL的洗涤缓冲液添加到所述试管中并将所述试管充分涡旋以重悬所述珠 粒。
6.然后将Falcon试管放回DynaMag-50磁道中,使得所述珠粒在所述试管的邻近该磁体 的一侧上积聚。
7.一旦溶液已经澄清,将上清液从所述试管中去除。
8.依次重复步骤5、6和7三次。
9.将结合缓冲液(30mL,50mM Tris pH7.5,2.5M NaCl,20%PEG8000)添加到来自步 骤8的Falcon试管中,然后将该试管涡旋以重悬所述珠粒。
然后使用前将所述珠粒在4℃下储存,但是所述珠粒在纯化过程中在室温条件下使用。
使用如下所述的方法纯化样品3——
1.将来自上述步骤9的试管涡旋以悬浮珠粒,并将18.5mL(样品3)转移到干净的50mL 的Falcon试管中。
2.然后将Falcon试管放入DynaMag-50磁道中,使得所述珠粒在该试管的邻近该磁体的 一侧上积聚。注意,由于珠粒悬浮于结合缓冲液(50mM的Tris pH7.5,2.5M NaCl,20%PEG8000)中,所述积聚进行超过10分钟。
3.一旦溶液已经澄清,将上清液去除,添加18.5mL的结合缓冲液并将样品彻底涡旋以重 悬所述珠粒。
4.然后将Falcon试管放入DynaMag-50磁道中,使得珠粒在所述试管的邻近该磁体的一 侧上积聚。注意,由于珠粒悬浮于结合缓冲液(50mM Tris pH7.5,2.5M NaCl,20%PEG8000),珠粒积聚进行超过10分钟。
5.然后重复步骤3。
从该时间点起,不对样品进行移液器混合或进行涡旋。
6.将Falcon试管放回DynaMag-50磁道中,使得珠粒在所述试管的邻近该磁体的一侧上 积聚。注意,由于所述缓冲液含有PEG8000,珠粒积聚进行超过10分钟。
7.使用血清吸液管去除上清液,并用足够的结合缓冲液替换所述上清液以覆盖珠粒(~ 25mL)。
8.将Falcon试管留在DynaMag-50磁道中,并将所述试管沿其轴线顺时针旋转90°,使 得积聚的珠粒围绕试管的侧部移动直到它们在邻近该磁体的新位置处沉降。
9.将步骤8重复三次,直至所述的Falcon试管返回到其原始的位置。
10.使用血清移液管去除上清液,然后除去尽可能多的残留上清液。
11.将Falcon试管从DynaMag-50磁道移除,并添加洗脱缓冲液(2.5mL,20mMNaCl,50mMTris,pH7.5)。
12.通过轻弹将试管轻轻搅动以重悬所述珠粒,然后将样品在环境条件下培育5分钟。
13.然后将所述的Falcon试管放回至DynaMag-50磁道,使得珠粒在该试管的邻近该磁体 的一侧上积聚,将上清液转移到5mL的蛋白质LoBind微量离心管。
14.通过添加洗脱缓冲液将来自步骤13的洗脱物质稀释两倍。
15.在将所述材料分装到试管中之前,将所述材料在4℃储存。
然后,如前文在实施例1中所述,使用TBE PAGE凝胶来分析所得结合到DNA的酶,不同在于将凝胶运行45分钟。凝胶在图5中示出,列3示出了SPRI纯化法纯化结合到DNA Y 衔体的单个酶。
实施例3
本实施例描述了用于将预结合到Y衔体的酶和结合到发夹衔体的酶接合到基因组双链 DNA的随机链的样品的制备过程。
材料与方法
使用NEBNext dA-尾部模块(NEB)将随机基因组的双链DNA序列进行dA结尾。无需进一步纯化。将dA结尾的基因组DNA(30μL)与具有T4 Dda-E94C/C109A/C136A/A360C预结合的Y衔体DNA(10μL 200nM)和具有TrwC CBA-L376C/Q594A/K762C预结合的发夹衔体(10μL,1μM)以及Blunt/TA连接酶主要混合物(master mix)(50μL)混合,将样 品倒置10次以混合。然后短暂地将样品在微量离心机中向下旋转。然后,将样品在室温下培 育10分钟。按照制造商的实验手册,使用0.4倍体积的Agencourt AMPure XP珠粒纯化改造的DNA,但使用下列洗涤缓冲液(750mM NaCl,10%PEG8000,50mM Tris.HCl pH 8)和洗脱缓冲液(40mM CAPSpH 10,40mM KCl和适当的DNA系链),如下详述。
在按照制造商的实验手册之后,将丸状珠粒在150μL的洗涤缓冲液中浸浴30秒。然后小 心地吸出洗涤缓冲液,当心不要干扰到丸粒。然后将所述样品在微量离心机中短暂地旋转,以充分地从珠粒排干多余的洗涤缓冲液。然后将试管重置于磁体上将珠粒制成丸状,然后放置约1-2分钟。最后,将剩余的洗涤缓冲液吸出,并将丸状珠粒重悬浮于25μl的洗脱缓冲液 中,并充分混合。然后在丸状化以及除去洗脱液之前将样品放置10分钟。最后,将在一端具 有胆固醇连接的DNA链杂合到样品。这即是随后在实施例4中测试的样品DNA。
实施例4
本实施例说明了上述样品制备过程之后,制备的DNA构建体具有功能预结合酶(T4Dda –E94C/C109A/C136A/A360C and TrwC Cba-L376C/Q594A/K762C),该酶能够控制DNA移动 穿过MspA纳米孔。
材料与方法
将在实施例3中制备的具有两种预结合酶(见图6数据)的DNA构建体(添加到纳米孔 系统中的终浓度为0.1nM)添加到缓冲液中(添加到纳米孔系统中的终浓度是500mMKCl, 25mM的磷酸钾pH 8.0),ATP(添加到纳米孔系统中的终浓度是2mM)和MgCl2(添加到纳米孔系统的终浓度是2mM)中。这是预混合物,然后将其添加到纳米孔系统中(总体积 150μL)。
电测量是在缓冲液中从嵌入到嵌段共聚物的单个MspA纳米孔获得的(25mM磷酸钾, 150mM的亚铁氰化钾(II),150mM铁氰化钾(III),pH 8.0)。在实现单个孔嵌入到嵌段共聚物后,则将缓冲液(2mL,25mM磷酸钾,150mM的亚铁氰化钾(II),150mM铁氰化钾(III),pH 8.0)流经该系统以去除任何过量的MspA纳米孔。然后将预先结合到构建体 Y(有T4Dda-E94C/C109A/C136A/A360C和TrwC Cba-L376C/Q594A/K762C两种预结合酶)的酶和燃料(MgCl2和ATP)的预混合物(总量150μL)流入所述的单个纳米孔实验系统中, 并使实验在-120mV保持电位下运行6小时(电势翻转至+60mV达2秒)并监测解旋酶控制 的DNA移动。
结果
对于使用串联的T4 Dda-E94C/C109A/C136A/A360C和TrwC Cba-L376C/Q594A/K762C的DNA构建体Y,观察解旋酶控制的DNA移动(参照图6)。该图显示了图中标记 的区域1和2的控制移位,所述区域1和2对应随机基因组双链DNA。当在发夹衔体中存在的间隔器移位穿过纳米孔时,可观察到增加的电流,见标记3。因此该样品解旋酶控制的DNA 移动表明,样品的制备过程是成功的,区域1和2在酶的控制下移位穿过纳米孔,并且可使 用所述增加的电流的尖峰清楚地识别所述区域之间的过渡。
实施例5:MuA预装载的酶衔体
在本实施例中,我们发现酶可以预结合到MuA衔体,并且这不影响MuA的功能,即MuA 仍可将衔体连接到DNA。
将T4 Dda-E94C/C109A/C136A/A360C(具有突变4C/C109A/C136A/A360C的SEQ IDNO:24)预结合到MuA Y衔体:如图7所示,衔体峰偏移(A是未预结合的,B是预结合 的)。
标签技术使用转座酶产生片段,并连接衔体到基因组DNA。标签技术的条件如下:用酶 预装载衔体。使用以下来实施标签技术:100nM具有400nM T4 Dda-E94C/C109A/C136A/A360C(具有4C/C109A/C136A/A360C突变的SEQ ID NO:24)预结合衔体的MuA四聚体。25ng ul-1靶λDNA。25mM Tris-HCl pH 8.0,20℃,10mM MgCl2,110mMNaCl,0.05%的Triton X-100,10%甘油,30℃下1小时。
为了在Agilent生物分析仪上可视,将T4 Dda-E94C/C109A/C136A/A360C(具有突变 4C/C109A/C136A/A360C的SEQ ID NO:24)和MuA在75℃热灭活10分钟。如图8所示,没有看到有关靶DNA的标签技术的不利效应。这可通过靶DNA涂迹(smear)这一事实看到(A是未预结合的,B是预结合的)。结果显示出,酶连接与否并不重要,碎片化的基因组 DNA具有相同的碎片尺寸分布。
使用与实施例4中所述仅使用T4 Dda—E94C/C109A/C136A/A360C作为解旋酶类似的 过程,测试之前描述的使用标签技术方案制备的DNA样品。如图9中所示,所得到的样品库可直接添加到芯片(chip)上,并观察解旋酶控制的DNA移动。
实施例6
实施例描述了将两个不同的酶装载到两个DNA组分上,然后将所述两个DNA组分接合 到一起并连接到基因组DNA。下文的实施例描述了两个不同的酶的装载,然而,该过程同样 适用于连接两个相同的酶。
材料与方法
进行与实施例2中所述相同的过程,且将两个酶(E1=T4 Dda-(H82R/E94C/A360C)(具 有突变H82R/E94C/A360C的SEQ ID NO:24)和E2=T4 Dda-E94C/C109A/C136A/A360C(具有突变E94C/C109A/C136A/A360C的SEQ ID NO:24),图10中)分别装载到两个 DNA构建体(图10中的A片段和END片段)上,随后按实施例2中所述纯化。A片段包含 两个杂合在一起的DNA寡核苷酸(参见图10的图解,完整说明了该寡核苷酸)。END片段 包含三个杂合在一起的DNA寡核苷酸(参见图10的图解,完整说明了该寡核苷酸)。
然后将纯化的酶装载的A片段和END片段DNA衔体使用下文描述的过程与发夹衔体3 (具有5'磷酸的SEQ ID NO:39,其在3’末端连接到四个iSpC3间隔器,所述iSpC3间隔器在相对端连接到SEQ ID NO:40的5’末端)一起接合到基因组λdsDNA的3.6kb区段(模板和互补的SEQID)。
将3.6kb基因组DNA(0.34μL,5nM的终浓度,SEQ ID NO:41杂合到SEQ ID NO:42)与A片段E1 DNA(6.25uL,50nM的终浓度)、END片段E2-DNA(3.125uL,25nM的终浓度)、发夹3(1.25uL,25nM的终浓度)用接合缓冲液(5uL,2mMATPγS,4mM MgCl2, 10mm的Hepes pH8.0,6%PEG 8000,10mM NaCl终浓度)、快速T4 DNA连接酶NEB(2.5uL, 200U/μL的终浓度)和无水核酸酶(8uL)混合。将所述样品在室温下培育10分钟。最后, 将在一端连接胆固醇的DNA链杂合到所述样品。样品4可不用进一步纯化而如实施例4中所 述在纳米孔电生理学中使用。
结果
对于样品4中使用串联的T4 Dda-(H82R/E94C/A360C)和T4 Dda-E94C/C109A/C136A/A360C(参见图11)的DNA构建体(参见图11中示出的DNA构建体),观察解旋 酶控制的DNA移动。该图显示了在该图中标记的区域1和2的可控移位,所述区域1和2对应基因组双链DNA。当存在于发夹衔体中的间隔器移位穿过纳米孔时,可观察到增加的电流,见箭标3。因此该样品解旋酶控制的DNA移动表明,该样品制备过程是成功的,区域1和2 在酶的控制下移位穿过纳米孔,并且可使用所述增加的电流的尖峰来清楚地识别所述区域之 间的过渡。
实施例7
本实施例描述了将解旋酶和聚合酶预装载到装载部分上,然后将所述装载部分接合到 DNA的到3.6kB链。然后聚合酶被用于制造DNA的3.6kB链的模板链和互补链二者的拷贝。 接合和聚合步骤的卡通示意图在图17中示出。
材料与方法
如实施例2中所述制备解旋酶前导复合物(在图12的A部分中示出的图),不同在于, 用SEQ ID NO:43代替SEQ ID NO:26。图15泳道3显示了样品在TBE PAGE上的运行, 表明酶已经结合到DNA(标记为C的条带)。
通过将Phi29-A411C/Q560C(具有突变A411C/Q560C的SEQ ID NO:9,标记为X1) 预结合到DNA发夹链(SEQ ID NO:44在其3’末端连接到四个iSpC3间隔器,所述iSpC3 间隔器在相对端连接到SEQ ID NO:45的5’末端)来制备聚合酶链复合物(图12的B部分中示出的图)。Phi29-A411C/Q560C是按照实验手册(https://www.piercenet.com/instructions/2161515.pdf)使用Zeba 0.5mL脱盐柱(89882, Piercenet)交换成下列缓冲液(50mM的TrispH8,20mM(NH 4)2SO4,10mM的MgCl2, 4%甘油)并稀释到400nM的缓冲液。将DNA发夹链(SEQID NO:44在其3’末端连接到4 个iSpC3间隔器,所述4个iSpC3间隔器在其相对端连接到SEQID NO:45的5’末端)添加到phi29-A411C/Q560C,制得phi29-A411C/Q560C:DNA发夹链比例为1:1的样品(400nM) (本样品对应图15中的条带E)。将其在室温下培育15分钟。然后添加TMAD(125uM), 并将样品在室温下进一步培育15分钟。然后,如之前所描述的,将样品再次进行缓冲液交换,不同在于,使用的缓冲液为(10mM HEPES pH8,10mM MgCl2)。然后将样品与解旋酶-前导 复合体(该解旋酶-前导复合体对应图15的条带C)以1:1混合,以产生图12的C部分中所 示的解旋酶/聚合酶前导复合体。
用2:1过量的发夹(SEQ ID NO:47),以2:1过量,将解旋酶/聚合酶前导复合体接合到3.6kb DNA链(SEQ ID NO:46)。所述接合在10%的T4快速连接酶存在下,在5x ATP 接合缓冲液(5x:150mM Tris pH8,50mM MgCl2,5mM ATP,30%PEG 8000)中实施。将 样品在室温下培育15分钟。接合步骤之后产生的构建体在图13中示出。对于聚合酶填充步骤,添加dNTP(0.5mM)。然后在30℃将样品培育1小时。最后,SEQ ID NO:31以5倍过量添加到样品中,并将样品在室温下培育最少15分钟。
最终样品5可不用进一步纯化而如实施例4中所述在纳米孔电生理学中使用。
结果
对于样品5中使用T4 Dda-E94C/C109A/C136A/A360C(参见图14)的DNA构建体(参见图13中示出的DNA构建体),观察解旋酶控制的DNA移动。该图显示了该图中标记的区 域1、2、4和5的可控移位,所述区域对应原始的3.6kB DNA链(区段1和2)和通过聚合酶制备的互补链(区段4和5)。当最终构建体(表示为x,在图14的顶部构件体图中标记为3)的发夹中存在的间隔器移位穿过纳米孔时,可观察到增加的电流,见箭头标记3。因此 该样品由解旋酶控制的DNA移动表明,样品的接合和聚合制备过程是成功的,区域1,2和 聚合区域4和5在酶的控制下移位穿过纳米孔,并且可使用所述增加的电流的尖峰清楚地识别原始链区和聚合链区之间的过渡。
序列表
<110> 牛津纳米孔技术公司
<120> 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法
<130> N403885WO
<140> PCT/GB2014/050175
<141> 2014-01-22
<140> 1406151.9
<141> 2014-04-04
<140> 1406155.0
<141> 2014-04-04
<140> 1416197.0
<141> 2014-09-12
<160> 47
<170> PatentIn 3.5版
<210> 1
<211> 558
<212> DNA
<213> 人工序列
<220>
<223> 耻垢分枝杆菌孔蛋白A突变体
(D90N/D91N/D93N/D118R/D134R/E193K)
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> 人工序列
<220>
<223> 耻垢分枝杆菌孔蛋白A突变体
(D90N/D91N/D93N/D118R/D134R/E139K)
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> 人工序列
<220>
<223> α-溶血素突变体 (E111N/K147N)
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> 人工序列
<220>
<223> α-溶血素突变体 (E111N/K147N)
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> 耻垢分枝杆菌
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> 耻垢分枝杆菌
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> 耻垢分枝杆菌
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 1830
<212> DNA
<213> 枯草芽孢杆菌噬菌体(Bacillus subtilis phage)phi29
<400> 8
atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60
gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120
ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180
cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240
tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300
tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360
gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420
gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480
gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540
tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600
atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660
gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720
gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780
cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840
tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900
accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960
ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020
gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080
aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140
ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200
ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260
acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320
accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380
catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440
ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500
atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560
tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620
gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680
gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740
tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800
tggagccacc cgcagtttga aaaataataa 1830
<210> 9
<211> 608
<212> PRT
<213> 枯草芽孢杆菌噬菌体phi29
<400> 9
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser
565 570 575
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser
580 585 590
Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
595 600 605
<210> 10
<211> 1390
<212> DNA
<213> 大肠杆菌
<400> 10
atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60
acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120
aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180
ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240
gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300
ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360
tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420
atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480
ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540
catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600
cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660
attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720
ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780
atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840
gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900
gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960
gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020
ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080
gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140
aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200
aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260
tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320
cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380
gtggcgctgc 1390
<210> 11
<211> 485
<212> PRT
<213> 大肠杆菌
<400> 11
Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr
1 5 10 15
Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala
20 25 30
Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val
35 40 45
Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val
50 55 60
Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn
65 70 75 80
Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys
85 90 95
Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr
100 105 110
Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp
115 120 125
Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys
130 135 140
Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly
145 150 155 160
Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu
165 170 175
His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala
180 185 190
Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu
195 200 205
Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro
210 215 220
Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg
225 230 235 240
Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg
245 250 255
Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu
260 265 270
Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr
275 280 285
Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn
290 295 300
Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala
305 310 315 320
Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile
325 330 335
Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala
340 345 350
Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr
355 360 365
Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu
370 375 380
Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp
385 390 395 400
Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro
405 410 415
Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg
420 425 430
Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln
435 440 445
Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu
450 455 460
Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His
465 470 475 480
His His His His His
485
<210> 12
<211> 804
<212> DNA
<213> 大肠杆菌
<400> 12
atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60
atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120
atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180
ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240
cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300
ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360
aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420
aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480
atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540
ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600
catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660
gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720
tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780
cccgtctggg cgaccttccg ccgc 804
<210> 13
<211> 268
<212> PRT
<213> 大肠杆菌
<400> 13
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro
245 250 255
Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 14
<211> 1275
<212> DNA
<213> 嗜热栖热菌(Thermus thermophilus)
<400> 14
atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60
cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120
ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180
ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240
atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300
attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360
gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420
ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480
catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540
attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600
cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660
ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720
ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780
ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840
cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900
ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960
gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020
gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080
ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140
gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200
ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260
gaaccgctgt tcctg 1275
<210> 15
<211> 425
<212> PRT
<213> 嗜热栖热菌
<400> 15
Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro
1 5 10 15
Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg
20 25 30
Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu
35 40 45
Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp
50 55 60
Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu
65 70 75 80
Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr
85 90 95
Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu
100 105 110
Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr
115 120 125
Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys
130 135 140
Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu
145 150 155 160
His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala
165 170 175
Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg
180 185 190
Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val
195 200 205
Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val
210 215 220
Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu
225 230 235 240
Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala
245 250 255
Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg
260 265 270
Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp
275 280 285
Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly
290 295 300
Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro
305 310 315 320
Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro
325 330 335
Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg
340 345 350
Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu
355 360 365
Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro
370 375 380
Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly
385 390 395 400
Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly
405 410 415
Glu Gly Asn Pro Glu Pro Leu Phe Leu
420 425
<210> 16
<211> 738
<212> DNA
<213> 细菌噬菌体λ
<400> 16
tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60
gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120
gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180
cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240
ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300
ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360
agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420
aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480
aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540
tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600
cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660
gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720
tccggcagcg gttccgga 738
<210> 17
<211> 226
<212> PRT
<213> 细菌噬菌体λ
<400> 17
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 18
<211> 760
<212> PRT
<213> 拟甲烷球菌属(Methanococcoides burtonii)
<400> 18
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 19
<211> 707
<212> PRT
<213> 共生餐古菌(Cenarchaeum symbiosum)
<400> 19
Met Arg Ile Ser Glu Leu Asp Ile Pro Arg Pro Ala Ile Glu Phe Leu
1 5 10 15
Glu Gly Glu Gly Tyr Lys Lys Leu Tyr Pro Pro Gln Ala Ala Ala Ala
20 25 30
Lys Ala Gly Leu Thr Asp Gly Lys Ser Val Leu Val Ser Ala Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Ala Ile Ala Met Ile Ser His Leu
50 55 60
Ser Arg Asn Arg Gly Lys Ala Val Tyr Leu Ser Pro Leu Arg Ala Leu
65 70 75 80
Ala Ala Glu Lys Phe Ala Glu Phe Gly Lys Ile Gly Gly Ile Pro Leu
85 90 95
Gly Arg Pro Val Arg Val Gly Val Ser Thr Gly Asp Phe Glu Lys Ala
100 105 110
Gly Arg Ser Leu Gly Asn Asn Asp Ile Leu Val Leu Thr Asn Glu Arg
115 120 125
Met Asp Ser Leu Ile Arg Arg Arg Pro Asp Trp Met Asp Glu Val Gly
130 135 140
Leu Val Ile Ala Asp Glu Ile His Leu Ile Gly Asp Arg Ser Arg Gly
145 150 155 160
Pro Thr Leu Glu Met Val Leu Thr Lys Leu Arg Gly Leu Arg Ser Ser
165 170 175
Pro Gln Val Val Ala Leu Ser Ala Thr Ile Ser Asn Ala Asp Glu Ile
180 185 190
Ala Gly Trp Leu Asp Cys Thr Leu Val His Ser Thr Trp Arg Pro Val
195 200 205
Pro Leu Ser Glu Gly Val Tyr Gln Asp Gly Glu Val Ala Met Gly Asp
210 215 220
Gly Ser Arg His Glu Val Ala Ala Thr Gly Gly Gly Pro Ala Val Asp
225 230 235 240
Leu Ala Ala Glu Ser Val Ala Glu Gly Gly Gln Ser Leu Ile Phe Ala
245 250 255
Asp Thr Arg Ala Arg Ser Ala Ser Leu Ala Ala Lys Ala Ser Ala Val
260 265 270
Ile Pro Glu Ala Lys Gly Ala Asp Ala Ala Lys Leu Ala Ala Ala Ala
275 280 285
Lys Lys Ile Ile Ser Ser Gly Gly Glu Thr Lys Leu Ala Lys Thr Leu
290 295 300
Ala Glu Leu Val Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Asn
305 310 315 320
Gln Asp Cys Arg Ser Val Val Glu Glu Glu Phe Arg Ser Gly Arg Ile
325 330 335
Arg Leu Leu Ala Ser Thr Pro Thr Leu Ala Ala Gly Val Asn Leu Pro
340 345 350
Ala Arg Arg Val Val Ile Ser Ser Val Met Arg Tyr Asn Ser Ser Ser
355 360 365
Gly Met Ser Glu Pro Ile Ser Ile Leu Glu Tyr Lys Gln Leu Cys Gly
370 375 380
Arg Ala Gly Arg Pro Gln Tyr Asp Lys Ser Gly Glu Ala Ile Val Val
385 390 395 400
Gly Gly Val Asn Ala Asp Glu Ile Phe Asp Arg Tyr Ile Gly Gly Glu
405 410 415
Pro Glu Pro Ile Arg Ser Ala Met Val Asp Asp Arg Ala Leu Arg Ile
420 425 430
His Val Leu Ser Leu Val Thr Thr Ser Pro Gly Ile Lys Glu Asp Asp
435 440 445
Val Thr Glu Phe Phe Leu Gly Thr Leu Gly Gly Gln Gln Ser Gly Glu
450 455 460
Ser Thr Val Lys Phe Ser Val Ala Val Ala Leu Arg Phe Leu Gln Glu
465 470 475 480
Glu Gly Met Leu Gly Arg Arg Gly Gly Arg Leu Ala Ala Thr Lys Met
485 490 495
Gly Arg Leu Val Ser Arg Leu Tyr Met Asp Pro Met Thr Ala Val Thr
500 505 510
Leu Arg Asp Ala Val Gly Glu Ala Ser Pro Gly Arg Met His Thr Leu
515 520 525
Gly Phe Leu His Leu Val Ser Glu Cys Ser Glu Phe Met Pro Arg Phe
530 535 540
Ala Leu Arg Gln Lys Asp His Glu Val Ala Glu Met Met Leu Glu Ala
545 550 555 560
Gly Arg Gly Glu Leu Leu Arg Pro Val Tyr Ser Tyr Glu Cys Gly Arg
565 570 575
Gly Leu Leu Ala Leu His Arg Trp Ile Gly Glu Ser Pro Glu Ala Lys
580 585 590
Leu Ala Glu Asp Leu Lys Phe Glu Ser Gly Asp Val His Arg Met Val
595 600 605
Glu Ser Ser Gly Trp Leu Leu Arg Cys Ile Trp Glu Ile Ser Lys His
610 615 620
Gln Glu Arg Pro Asp Leu Leu Gly Glu Leu Asp Val Leu Arg Ser Arg
625 630 635 640
Val Ala Tyr Gly Ile Lys Ala Glu Leu Val Pro Leu Val Ser Ile Lys
645 650 655
Gly Ile Gly Arg Val Arg Ser Arg Arg Leu Phe Arg Gly Gly Ile Lys
660 665 670
Gly Pro Gly Asp Leu Ala Ala Val Pro Val Glu Arg Leu Ser Arg Val
675 680 685
Glu Gly Ile Gly Ala Thr Leu Ala Asn Asn Ile Lys Ser Gln Leu Arg
690 695 700
Lys Gly Gly
705
<210> 20
<211> 720
<212> PRT
<213> 抗辐射热球菌(Thermococcus gammatolerans)
<400> 20
Met Lys Val Asp Glu Leu Pro Val Asp Glu Arg Leu Lys Ala Val Leu
1 5 10 15
Lys Glu Arg Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Leu
20 25 30
Lys Ser Gly Ala Leu Glu Gly Arg Asn Leu Val Leu Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Val Ser Glu Ile Val Met Val Asn Lys Leu
50 55 60
Ile Gln Glu Gly Gly Lys Ala Val Tyr Leu Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Glu Glu Lys Tyr Arg Glu Phe Lys Glu Trp Glu Lys Leu Gly Leu
85 90 95
Lys Val Ala Ala Thr Thr Gly Asp Tyr Asp Ser Thr Asp Asp Trp Leu
100 105 110
Gly Arg Tyr Asp Ile Ile Val Ala Thr Ala Glu Lys Phe Asp Ser Leu
115 120 125
Leu Arg His Gly Ala Arg Trp Ile Asn Asp Val Lys Leu Val Val Ala
130 135 140
Asp Glu Val His Leu Ile Gly Ser Tyr Asp Arg Gly Ala Thr Leu Glu
145 150 155 160
Met Ile Leu Thr His Met Leu Gly Arg Ala Gln Ile Leu Ala Leu Ser
165 170 175
Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu Trp Leu Asp Ala Ser
180 185 190
Leu Val Val Ser Asp Trp Arg Pro Val Gln Leu Arg Arg Gly Val Phe
195 200 205
His Leu Gly Thr Leu Ile Trp Glu Asp Gly Lys Val Glu Ser Tyr Pro
210 215 220
Glu Asn Trp Tyr Ser Leu Val Val Asp Ala Val Lys Arg Gly Lys Gly
225 230 235 240
Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala Glu Lys Glu Ala Leu
245 250 255
Ala Leu Ser Lys Leu Val Ser Ser His Leu Thr Lys Pro Glu Lys Arg
260 265 270
Ala Leu Glu Ser Leu Ala Ser Gln Leu Glu Asp Asn Pro Thr Ser Glu
275 280 285
Lys Leu Lys Arg Ala Leu Arg Gly Gly Val Ala Phe His His Ala Gly
290 295 300
Leu Ser Arg Val Glu Arg Thr Leu Ile Glu Asp Ala Phe Arg Glu Gly
305 310 315 320
Leu Ile Lys Val Ile Thr Ala Thr Pro Thr Leu Ser Ala Gly Val Asn
325 330 335
Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr Lys Arg Tyr Ala Gly
340 345 350
Phe Gly Trp Thr Asp Ile Pro Val Leu Glu Ile Gln Gln Met Met Gly
355 360 365
Arg Ala Gly Arg Pro Arg Tyr Asp Lys Tyr Gly Glu Ala Ile Ile Val
370 375 380
Ala Arg Thr Asp Glu Pro Gly Lys Leu Met Glu Arg Tyr Ile Arg Gly
385 390 395 400
Lys Pro Glu Lys Leu Phe Ser Met Leu Ala Asn Glu Gln Ala Phe Arg
405 410 415
Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly Ile Arg Ser Phe Pro
420 425 430
Glu Leu Val Arg Phe Leu Glu Arg Thr Phe Tyr Ala His Gln Arg Lys
435 440 445
Asp Leu Ser Ser Leu Glu Tyr Lys Ala Lys Glu Val Val Tyr Phe Leu
450 455 460
Ile Glu Asn Glu Phe Ile Asp Leu Asp Leu Glu Asp Arg Phe Ile Pro
465 470 475 480
Leu Pro Phe Gly Lys Arg Thr Ser Gln Leu Tyr Ile Asp Pro Leu Thr
485 490 495
Ala Lys Lys Phe Lys Asp Ala Phe Pro Ala Ile Glu Arg Asn Pro Asn
500 505 510
Pro Phe Gly Ile Phe Gln Leu Ile Ala Ser Thr Pro Asp Met Ala Thr
515 520 525
Leu Thr Ala Arg Arg Arg Glu Met Glu Asp Tyr Leu Asp Leu Ala Tyr
530 535 540
Glu Leu Glu Asp Lys Leu Tyr Ala Ser Ile Pro Tyr Tyr Glu Asp Ser
545 550 555 560
Arg Phe Gln Gly Phe Leu Gly Gln Val Lys Thr Ala Lys Val Leu Leu
565 570 575
Asp Trp Ile Asn Glu Val Pro Glu Ala Arg Ile Tyr Glu Thr Tyr Ser
580 585 590
Ile Asp Pro Gly Asp Leu Tyr Arg Leu Leu Glu Leu Ala Asp Trp Leu
595 600 605
Met Tyr Ser Leu Ile Glu Leu Tyr Lys Leu Phe Glu Pro Lys Glu Glu
610 615 620
Ile Leu Asn Tyr Leu Arg Asp Leu His Leu Arg Leu Arg His Gly Val
625 630 635 640
Arg Glu Glu Leu Leu Glu Leu Val Arg Leu Pro Asn Ile Gly Arg Lys
645 650 655
Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Arg Ser Val Glu Ala Ile
660 665 670
Ala Asn Ala Lys Pro Ala Glu Leu Leu Ala Val Glu Gly Ile Gly Ala
675 680 685
Lys Ile Leu Asp Gly Ile Tyr Arg His Leu Gly Ile Glu Lys Arg Val
690 695 700
Thr Glu Glu Lys Pro Lys Arg Lys Gly Thr Leu Glu Asp Phe Leu Arg
705 710 715 720
<210> 21
<211> 799
<212> PRT
<213> 亨氏甲烷螺旋菌(Methanospirillum hungatei)
<400> 21
Met Glu Ile Ala Ser Leu Pro Leu Pro Asp Ser Phe Ile Arg Ala Cys
1 5 10 15
His Ala Lys Gly Ile Arg Ser Leu Tyr Pro Pro Gln Ala Glu Cys Ile
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ile Ser Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Trp Ser Arg Ile
50 55 60
Ala Ala Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Asp Glu Phe Ser Lys Lys Gly Val Ile Arg Val Gly
85 90 95
Ile Ala Thr Gly Asp Leu Asp Arg Thr Asp Ala Tyr Leu Gly Glu Asn
100 105 110
Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu Arg Asn
115 120 125
Arg Thr Pro Trp Leu Ser Gln Ile Thr Cys Ile Val Leu Asp Glu Val
130 135 140
His Leu Ile Gly Ser Glu Asn Arg Gly Ala Thr Leu Glu Met Val Ile
145 150 155 160
Thr Lys Leu Arg Tyr Thr Asn Pro Val Met Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Ala Gln Leu Ala Glu Trp Leu Asp Ala Thr
180 185 190
Leu Ile Thr Ser Thr Trp Arg Pro Val Asp Leu Arg Gln Gly Val Tyr
195 200 205
Tyr Asn Gly Lys Ile Arg Phe Ser Asp Ser Glu Arg Pro Ile Gln Gly
210 215 220
Lys Thr Lys His Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Glu Glu
225 230 235 240
Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly
245 250 255
Phe Ala Lys Lys Ala Ala Gly Ala Leu Lys Ala Gly Ser Pro Asp Ser
260 265 270
Lys Ala Leu Ala Gln Glu Leu Arg Arg Leu Arg Asp Arg Asp Glu Gly
275 280 285
Asn Val Leu Ala Asp Cys Val Glu Arg Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Ile Arg Gln Glu Arg Thr Ile Ile Glu Glu Gly Phe Arg Asn
305 310 315 320
Gly Tyr Ile Glu Val Ile Ala Ala Thr Pro Thr Leu Ala Ala Gly Leu
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Asn Arg Phe Ala
340 345 350
Ser Gly Leu Gly Met Val Pro Ile Pro Val Gly Glu Tyr His Gln Met
355 360 365
Ala Gly Arg Ala Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Val
370 375 380
Leu Leu Ala Lys Asp Ala Pro Ser Val Glu Arg Leu Phe Glu Thr Phe
385 390 395 400
Ile Asp Ala Glu Ala Glu Arg Val Asp Ser Gln Cys Val Asp Asp Ala
405 410 415
Ser Leu Cys Ala His Ile Leu Ser Leu Ile Ala Thr Gly Phe Ala His
420 425 430
Asp Gln Glu Ala Leu Ser Ser Phe Met Glu Arg Thr Phe Tyr Phe Phe
435 440 445
Gln His Pro Lys Thr Arg Ser Leu Pro Arg Leu Val Ala Asp Ala Ile
450 455 460
Arg Phe Leu Thr Thr Ala Gly Met Val Glu Glu Arg Glu Asn Thr Leu
465 470 475 480
Ser Ala Thr Arg Leu Gly Ser Leu Val Ser Arg Leu Tyr Leu Asn Pro
485 490 495
Cys Thr Ala Arg Leu Ile Leu Asp Ser Leu Lys Ser Cys Lys Thr Pro
500 505 510
Thr Leu Ile Gly Leu Leu His Val Ile Cys Val Ser Pro Asp Met Gln
515 520 525
Arg Leu Tyr Leu Lys Ala Ala Asp Thr Gln Leu Leu Arg Thr Phe Leu
530 535 540
Phe Lys His Lys Asp Asp Leu Ile Leu Pro Leu Pro Phe Glu Gln Glu
545 550 555 560
Glu Glu Glu Leu Trp Leu Ser Gly Leu Lys Thr Ala Leu Val Leu Thr
565 570 575
Asp Trp Ala Asp Glu Phe Ser Glu Gly Met Ile Glu Glu Arg Tyr Gly
580 585 590
Ile Gly Ala Gly Asp Leu Tyr Asn Ile Val Asp Ser Gly Lys Trp Leu
595 600 605
Leu His Gly Thr Glu Arg Leu Val Ser Val Glu Met Pro Glu Met Ser
610 615 620
Gln Val Val Lys Thr Leu Ser Val Arg Val His His Gly Val Lys Ser
625 630 635 640
Glu Leu Leu Pro Leu Val Ala Leu Arg Asn Ile Gly Arg Val Arg Ala
645 650 655
Arg Thr Leu Tyr Asn Ala Gly Tyr Pro Asp Pro Glu Ala Val Ala Arg
660 665 670
Ala Gly Leu Ser Thr Ile Ala Arg Ile Ile Gly Glu Gly Ile Ala Arg
675 680 685
Gln Val Ile Asp Glu Ile Thr Gly Val Lys Arg Ser Gly Ile His Ser
690 695 700
Ser Asp Asp Asp Tyr Gln Gln Lys Thr Pro Glu Leu Leu Thr Asp Ile
705 710 715 720
Pro Gly Ile Gly Lys Lys Met Ala Glu Lys Leu Gln Asn Ala Gly Ile
725 730 735
Ile Thr Val Ser Asp Leu Leu Thr Ala Asp Glu Val Leu Leu Ser Asp
740 745 750
Val Leu Gly Ala Ala Arg Ala Arg Lys Val Leu Ala Phe Leu Ser Asn
755 760 765
Ser Glu Lys Glu Asn Ser Ser Ser Asp Lys Thr Glu Glu Ile Pro Asp
770 775 780
Thr Gln Lys Ile Arg Gly Gln Ser Ser Trp Glu Asp Phe Gly Cys
785 790 795
<210> 22
<211> 1756
<212> PRT
<213> 大肠杆菌
<400> 22
Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr
1 5 10 15
Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg
20 25 30
Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp
35 40 45
Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala
50 55 60
Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr
65 70 75 80
Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu
85 90 95
Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe
100 105 110
Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp
115 120 125
Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe
130 135 140
Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala
145 150 155 160
Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser
165 170 175
Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn
180 185 190
Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val
195 200 205
Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp
210 215 220
Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala
225 230 235 240
Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val
245 250 255
Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile
260 265 270
Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile
275 280 285
Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln
290 295 300
Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val
305 310 315 320
Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr
325 330 335
Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly
340 345 350
Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu
355 360 365
Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile
370 375 380
His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met
385 390 395 400
Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr
405 410 415
Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser
420 425 430
Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg
435 440 445
Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln
450 455 460
Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu
465 470 475 480
Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly
485 490 495
Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys
500 505 510
Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His
515 520 525
Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly
530 535 540
Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp
545 550 555 560
Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg
565 570 575
Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys
580 585 590
Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala
595 600 605
Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu
610 615 620
Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp
625 630 635 640
Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met
645 650 655
Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp
660 665 670
Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly
675 680 685
Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu
690 695 700
Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val
705 710 715 720
Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln
725 730 735
Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg
740 745 750
Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu
755 760 765
Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp
770 775 780
Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala
785 790 795 800
Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser
805 810 815
Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser
820 825 830
Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu
835 840 845
Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala
850 855 860
Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu
865 870 875 880
Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala
885 890 895
Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile
900 905 910
Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr
915 920 925
Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu
930 935 940
Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg
945 950 955 960
Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala
965 970 975
Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly
980 985 990
Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala
995 1000 1005
Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu
1010 1015 1020
Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val
1025 1030 1035
Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln
1040 1045 1050
Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu
1055 1060 1065
Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala
1070 1075 1080
Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly
1085 1090 1095
Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg
1100 1105 1110
Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu
1115 1120 1125
Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu
1130 1135 1140
Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val
1145 1150 1155
Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu
1160 1165 1170
His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala
1175 1180 1185
Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp
1190 1195 1200
Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly
1205 1210 1215
Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu
1220 1225 1230
Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg
1235 1240 1245
Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val
1250 1255 1260
Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser
1265 1270 1275
Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val
1280 1285 1290
Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr
1295 1300 1305
Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu
1310 1315 1320
Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg
1325 1330 1335
Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu
1340 1345 1350
Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser
1355 1360 1365
Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile
1370 1375 1380
Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr
1385 1390 1395
Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala
1400 1405 1410
Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly
1415 1420 1425
Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val
1430 1435 1440
Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn
1445 1450 1455
Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys
1460 1465 1470
Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala
1475 1480 1485
Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln
1490 1495 1500
Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro
1505 1510 1515
Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp
1520 1525 1530
Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr
1535 1540 1545
Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val
1550 1555 1560
Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg
1565 1570 1575
Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg
1580 1585 1590
Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala
1595 1600 1605
Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg
1610 1615 1620
Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly
1625 1630 1635
Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala
1640 1645 1650
Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile
1655 1660 1665
Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys
1670 1675 1680
Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg
1685 1690 1695
Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu
1700 1705 1710
Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg
1715 1720 1725
Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met
1730 1735 1740
Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp
1745 1750 1755
<210> 23
<211> 726
<212> PRT
<213> 拟甲烷球菌属
<400> 23
Met Ser Asp Lys Pro Ala Phe Met Lys Tyr Phe Thr Gln Ser Ser Cys
1 5 10 15
Tyr Pro Asn Gln Gln Glu Ala Met Asp Arg Ile His Ser Ala Leu Met
20 25 30
Gln Gln Gln Leu Val Leu Phe Glu Gly Ala Cys Gly Thr Gly Lys Thr
35 40 45
Leu Ser Ala Leu Val Pro Ala Leu His Val Gly Lys Met Leu Gly Lys
50 55 60
Thr Val Ile Ile Ala Thr Asn Val His Gln Gln Met Val Gln Phe Ile
65 70 75 80
Asn Glu Ala Arg Asp Ile Lys Lys Val Gln Asp Val Lys Val Ala Val
85 90 95
Ile Lys Gly Lys Thr Ala Met Cys Pro Gln Glu Ala Asp Tyr Glu Glu
100 105 110
Cys Ser Val Lys Arg Glu Asn Thr Phe Glu Leu Met Glu Thr Glu Arg
115 120 125
Glu Ile Tyr Leu Lys Arg Gln Glu Leu Asn Ser Ala Arg Asp Ser Tyr
130 135 140
Lys Lys Ser His Asp Pro Ala Phe Val Thr Leu Arg Asp Glu Leu Ser
145 150 155 160
Lys Glu Ile Asp Ala Val Glu Glu Lys Ala Arg Gly Leu Arg Asp Arg
165 170 175
Ala Cys Asn Asp Leu Tyr Glu Val Leu Arg Ser Asp Ser Glu Lys Phe
180 185 190
Arg Glu Trp Leu Tyr Lys Glu Val Arg Ser Pro Glu Glu Ile Asn Asp
195 200 205
His Ala Ile Lys Asp Gly Met Cys Gly Tyr Glu Leu Val Lys Arg Glu
210 215 220
Leu Lys His Ala Asp Leu Leu Ile Cys Asn Tyr His His Val Leu Asn
225 230 235 240
Pro Asp Ile Phe Ser Thr Val Leu Gly Trp Ile Glu Lys Glu Pro Gln
245 250 255
Glu Thr Ile Val Ile Phe Asp Glu Ala His Asn Leu Glu Ser Ala Ala
260 265 270
Arg Ser His Ser Ser Leu Ser Leu Thr Glu His Ser Ile Glu Lys Ala
275 280 285
Ile Thr Glu Leu Glu Ala Asn Leu Asp Leu Leu Ala Asp Asp Asn Ile
290 295 300
His Asn Leu Phe Asn Ile Phe Leu Glu Val Ile Ser Asp Thr Tyr Asn
305 310 315 320
Ser Arg Phe Lys Phe Gly Glu Arg Glu Arg Val Arg Lys Asn Trp Tyr
325 330 335
Asp Ile Arg Ile Ser Asp Pro Tyr Glu Arg Asn Asp Ile Val Arg Gly
340 345 350
Lys Phe Leu Arg Gln Ala Lys Gly Asp Phe Gly Glu Lys Asp Asp Ile
355 360 365
Gln Ile Leu Leu Ser Glu Ala Ser Glu Leu Gly Ala Lys Leu Asp Glu
370 375 380
Thr Tyr Arg Asp Gln Tyr Lys Lys Gly Leu Ser Ser Val Met Lys Arg
385 390 395 400
Ser His Ile Arg Tyr Val Ala Asp Phe Met Ser Ala Tyr Ile Glu Leu
405 410 415
Ser His Asn Leu Asn Tyr Tyr Pro Ile Leu Asn Val Arg Arg Asp Met
420 425 430
Asn Asp Glu Ile Tyr Gly Arg Val Glu Leu Phe Thr Cys Ile Pro Lys
435 440 445
Asn Val Thr Glu Pro Leu Phe Asn Ser Leu Phe Ser Val Ile Leu Met
450 455 460
Ser Ala Thr Leu His Pro Phe Glu Met Val Lys Lys Thr Leu Gly Ile
465 470 475 480
Thr Arg Asp Thr Cys Glu Met Ser Tyr Gly Thr Ser Phe Pro Glu Glu
485 490 495
Lys Arg Leu Ser Ile Ala Val Ser Ile Pro Pro Leu Phe Ala Lys Asn
500 505 510
Arg Asp Asp Arg His Val Thr Glu Leu Leu Glu Gln Val Leu Leu Asp
515 520 525
Ser Ile Glu Asn Ser Lys Gly Asn Val Ile Leu Phe Phe Gln Ser Ala
530 535 540
Phe Glu Ala Lys Arg Tyr Tyr Ser Lys Ile Glu Pro Leu Val Asn Val
545 550 555 560
Pro Val Phe Leu Asp Glu Val Gly Ile Ser Ser Gln Asp Val Arg Glu
565 570 575
Glu Phe Phe Ser Ile Gly Glu Glu Asn Gly Lys Ala Val Leu Leu Ser
580 585 590
Tyr Leu Trp Gly Thr Leu Ser Glu Gly Ile Asp Tyr Arg Asp Gly Arg
595 600 605
Gly Arg Thr Val Ile Ile Ile Gly Val Gly Tyr Pro Ala Leu Asn Asp
610 615 620
Arg Met Asn Ala Val Glu Ser Ala Tyr Asp His Val Phe Gly Tyr Gly
625 630 635 640
Ala Gly Trp Glu Phe Ala Ile Gln Val Pro Thr Ile Arg Lys Ile Arg
645 650 655
Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg
660 665 670
Ile Leu Leu Asp Gly Arg Phe Leu Thr Asp Ser Lys Lys Arg Phe Gly
675 680 685
Lys Phe Ser Val Phe Glu Val Phe Pro Pro Ala Glu Arg Ser Glu Phe
690 695 700
Val Asp Val Asp Pro Glu Lys Val Lys Tyr Ser Leu Met Asn Phe Phe
705 710 715 720
Met Asp Asn Asp Glu Gln
725
<210> 24
<211> 439
<212> PRT
<213> 未知
<220>
<223> Dda 1993
<400> 24
Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile
1 5 10 15
Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly
20 25 30
Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala
35 40 45
Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His
50 55 60
Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr
65 70 75 80
Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val
85 90 95
Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu
115 120 125
Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn
130 135 140
Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser
145 150 155 160
Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val
165 170 175
Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn
180 185 190
Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly
195 200 205
Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser
210 215 220
Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe
225 230 235 240
Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile
245 250 255
Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln
260 265 270
Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu
275 280 285
Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr
290 295 300
Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile
305 310 315 320
Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr
325 330 335
Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe
340 345 350
Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys
355 360 365
Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe
370 375 380
Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly
385 390 395 400
Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala
405 410 415
Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly
420 425 430
Arg Tyr Asp Val Phe Tyr Val
435
<210> 25
<211> 970
<212> PRT
<213> 肉毒梭菌(Clostridium botulinum)
<400> 25
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly
115 120 125
Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser
260 265 270
Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro
420 425 430
Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg
450 455 460
Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile
690 695 700
Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr
740 745 750
Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu
915 920 925
Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp
930 935 940
Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 26
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 实施例1中使用的序列
<400> 26
ggttaaacac ccaagcagac gccgcaatat cagcaccaac agaaacaacc tttgaggcga 60
gcggtcaa 68
<210> 27
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 实施例2和7中使用的序列
<400> 27
tttttttttt tt 12
<210> 28
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 实施例2和7中使用的序列
<400> 28
ggttgtttct gttggtgctg atattgcggc gtctgcttgg gtgtttaacc t 51
<210> 29
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 实施例1中使用的序列
<400> 29
cgttctgttt atgtttcttg gacactgatt gacacggttt agtagaac 48
<210> 30
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 实施例1中使用的序列
<400> 30
tttttttttt tttttttttt ttttttttca agaaacataa acagaacgt 49
<210> 31
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 实施例7中使用的序列
<400> 31
Thr Thr Gly Ala Cys Cys Gly Cys Thr Cys Gly Cys Cys Thr Cys
1 5 10 15
<210> 32
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 32
tttttttttt 10
<210> 33
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 33
ggttgtttct gttggtgctg atattgcac 29
<210> 34
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 34
gcaatatcag caccaacaga aa 22
<210> 35
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 35
gaggcgagcg gtcaa 15
<210> 36
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 36
tgagtgacca atcagctacg tttttttttt tt 32
<210> 37
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 37
ggttgtttct gttggtgctg atattgct 28
<210> 38
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 38
cgtagctgat tggtcactca gt 22
<210> 39
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 39
cgtcctgtcg ctgtgtctcg gacactgatt gacacggttt agtagagc 48
<210> 40
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 40
tttttttttt tttttttttt ttttttttcg agacacagcg acaggacgtc ct 52
<210> 41
<211> 3568
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 41
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgcgct aacaacctcc tgccgttttg cccgtgcata tcggtcacga acaaatctga 120
ttactaaaca cagtagcctg gatttgttct atcagtaatc gaccttattc ctaattaaat 180
agagcaaatc cccttattgg gggtaagaca tgaagatgcc agaaaaacat gacctgttgg 240
ccgccattct cgcggcaaag gaacaaggca tcggggcaat ccttgcgttt gcaatggcgt 300
accttcgcgg cagatataat ggcggtgcgt ttacaaaaac agtaatcgac gcaacgatgt 360
gcgccattat cgcctagttc attcgtgacc ttctcgactt cgccggacta agtagcaatc 420
tcgcttatat aacgagcgtg tttatcggct acatcggtac tgactcgatt ggttcgctta 480
tcaaacgctt cgctgctaaa aaagccggag tagaagatgg tagaaatcaa taatcaacgt 540
aaggcgttcc tcgatatgct ggcgtggtcg gagggaactg ataacggacg tcagaaaacc 600
agaaatcatg gttatgacgt cattgtaggc ggagagctat ttactgatta ctccgatcac 660
cctcgcaaac ttgtcacgct aaacccaaaa ctcaaatcaa caggcgccgg acgctaccag 720
cttctttccc gttggtggga tgcctaccgc aagcagcttg gcctgaaaga cttctctccg 780
aaaagtcagg acgctgtggc attgcagcag attaaggagc gtggcgcttt acctatgatt 840
gatcgtggtg atatccgtca ggcaatcgac cgttgcagca atatctgggc ttcactgccg 900
ggcgctggtt atggtcagtt cgagcataag gctgacagcc tgattgcaaa attcaaagaa 960
gcgggcggaa cggtcagaga gattgatgta tgagcagagt caccgcgatt atctccgctc 1020
tggttatctg catcatcgtc tgcctgtcat gggctgttaa tcattaccgt gataacgcca 1080
ttacctacaa agcccagcgc gacaaaaatg ccagagaact gaagctggcg aacgcggcaa 1140
ttactgacat gcagatgcgt cagcgtgatg ttgctgcgct cgatgcaaaa tacacgaagg 1200
agttagctga tgctaaagct gaaaatgatg ctctgcgtga tgatgttgcc gctggtcgtc 1260
gtcggttgca catcaaagca gtctgtcagt cagtgcgtga agccaccacc gcctccggcg 1320
tggataatgc agcctccccc cgactggcag acaccgctga acgggattat ttcaccctca 1380
gagagaggct gatcactatg caaaaacaac tggaaggaac ccagaagtat attaatgagc 1440
agtgcagata gagttgccca tatcgatggg caactcatgc aattattgtg agcaatacac 1500
acgcgcttcc agcggagtat aaatgcctaa agtaataaaa ccgagcaatc catttacgaa 1560
tgtttgctgg gtttctgttt taacaacatt ttctgcgccg ccacaaattt tggctgcatc 1620
gacagttttc ttctgcccaa ttccagaaac gaagaaatga tgggtgatgg tttcctttgg 1680
tgctactgct gccggtttgt tttgaacagt aaacgtctgt tgagcacatc ctgtaataag 1740
cagggccagc gcagtagcga gtagcatttt tttcatggtg ttattcccga tgctttttga 1800
agttcgcaga atcgtatgtg tagaaaatta aacaaaccct aaacaatgag ttgaaatttc 1860
atattgttaa tatttattaa tgtatgtcag gtgcgatgaa tcgtcattgt attcccggat 1920
taactatgtc cacagccctg acggggaact tctctgcggg agtgtccggg aataattaaa 1980
acgatgcaca cagggtttag cgcgtacacg tattgcatta tgccaacgcc ccggtgctga 2040
cacggaagaa accggacgtt atgatttagc gtggaaagat ttgtgtagtg ttctgaatgc 2100
tctcagtaaa tagtaatgaa ttatcaaagg tatagtaata tcttttatgt tcatggatat 2160
ttgtaaccca tcggaaaact cctgctttag caagattttc cctgtattgc tgaaatgtga 2220
tttctcttga tttcaaccta tcataggacg tttctataag atgcgtgttt cttgagaatt 2280
taacatttac aaccttttta agtcctttta ttaacacggt gttatcgttt tctaacacga 2340
tgtgaatatt atctgtggct agatagtaaa tataatgtga gacgttgtga cgttttagtt 2400
cagaataaaa caattcacag tctaaatctt ttcgcacttg atcgaatatt tctttaaaaa 2460
tggcaacctg agccattggt aaaaccttcc atgtgatacg agggcgcgta gtttgcatta 2520
tcgtttttat cgtttcaatc tggtctgacc tccttgtgtt ttgttgatga tttatgtcaa 2580
atattaggaa tgttttcact taatagtatt ggttgcgtaa caaagtgcgg tcctgctggc 2640
attctggagg gaaatacaac cgacagatgt atgtaaggcc aacgtgctca aatcttcata 2700
cagaaagatt tgaagtaata ttttaaccgc tagatgaaga gcaagcgcat ggagcgacaa 2760
aatgaataaa gaacaatctg ctgatgatcc ctccgtggat ctgattcgtg taaaaaatat 2820
gcttaatagc accatttcta tgagttaccc tgatgttgta attgcatgta tagaacataa 2880
ggtgtctctg gaagcattca gagcaattga ggcagcgttg gtgaagcacg ataataatat 2940
gaaggattat tccctggtgg ttgactgatc accataactg ctaatcattc aaactattta 3000
gtctgtgaca gagccaacac gcagtctgtc actgtcagga aagtggtaaa actgcaactc 3060
aattactgca atgccctcgt aattaagtga atttacaata tcgtcctgtt cggagggaag 3120
aacgcgggat gttcattctt catcactttt aattgatgta tatgctctct tttctgacgt 3180
tagtctccga cggcaggctt caatgaccca ggctgagaaa ttcccggacc ctttttgctc 3240
aagagcgatg ttaatttgtt caatcatttg gttaggaaag cggatgttgc gggttgttgt 3300
tctgcgggtt ctgttcttcg ttgacatgag gttgccccgt attcagtgtc gctgatttgt 3360
attgtctgaa gttgttttta cgttaagttg atgcagatca attaatacga tacctgcgtc 3420
ataattgatt atttgacgtg gtttgatggc ctccacgcac gttgtgatat gtagatgata 3480
atcattatca ctttacgggt cctttccggt gaaaaaaaag gtaccaaaaa aaacatcgtc 3540
gtgagtagtg aaccgtaagc atgtagga 3568
<210> 42
<211> 3565
<212> DNA
<213> 人工序列
<220>
<223> 实施例6中使用的序列
<400> 42
acatgcttac ggttcactac tcacgacgat gttttttttg gtaccttttt tttcaccgga 60
aaggacccgt aaagtgataa tgattatcat ctacatatca caacgtgcgt ggaggccatc 120
aaaccacgtc aaataatcaa ttatgacgca ggtatcgtat taattgatct gcatcaactt 180
aacgtaaaaa caacttcaga caatacaaat cagcgacact gaatacgggg caacctcatg 240
tcaacgaaga acagaacccg cagaacaaca acccgcaaca tccgctttcc taaccaaatg 300
attgaacaaa ttaacatcgc tcttgagcaa aaagggtccg ggaatttctc agcctgggtc 360
attgaagcct gccgtcggag actaacgtca gaaaagagag catatacatc aattaaaagt 420
gatgaagaat gaacatcccg cgttcttccc tccgaacagg acgatattgt aaattcactt 480
aattacgagg gcattgcagt aattgagttg cagttttacc actttcctga cagtgacaga 540
ctgcgtgttg gctctgtcac agactaaata gtttgaatga ttagcagtta tggtgatcag 600
tcaaccacca gggaataatc cttcatatta ttatcgtgct tcaccaacgc tgcctcaatt 660
gctctgaatg cttccagaga caccttatgt tctatacatg caattacaac atcagggtaa 720
ctcatagaaa tggtgctatt aagcatattt tttacacgaa tcagatccac ggagggatca 780
tcagcagatt gttctttatt cattttgtcg ctccatgcgc ttgctcttca tctagcggtt 840
aaaatattac ttcaaatctt tctgtatgaa gatttgagca cgttggcctt acatacatct 900
gtcggttgta tttccctcca gaatgccagc aggaccgcac tttgttacgc aaccaatact 960
attaagtgaa aacattccta atatttgaca taaatcatca acaaaacaca aggaggtcag 1020
accagattga aacgataaaa acgataatgc aaactacgcg ccctcgtatc acatggaagg 1080
ttttaccaat ggctcaggtt gccattttta aagaaatatt cgatcaagtg cgaaaagatt 1140
tagactgtga attgttttat tctgaactaa aacgtcacaa cgtctcacat tatatttact 1200
atctagccac agataatatt cacatcgtgt tagaaaacga taacaccgtg ttaataaaag 1260
gacttaaaaa ggttgtaaat gttaaattct caagaaacac gcatcttata gaaacgtcct 1320
atgataggtt gaaatcaaga gaaatcacat ttcagcaata cagggaaaat cttgctaaag 1380
caggagtttt ccgatgggtt acaaatatcc atgaacataa aagatattac tatacctttg 1440
ataattcatt actatttact gagagcattc agaacactac acaaatcttt ccacgctaaa 1500
tcataacgtc cggtttcttc cgtgtcagca ccggggcgtt ggcataatgc aatacgtgta 1560
cgcgctaaac cctgtgtgca tcgttttaat tattcccgga cactcccgca gagaagttcc 1620
ccgtcagggc tgtggacata gttaatccgg gaatacaatg acgattcatc gcacctgaca 1680
tacattaata aatattaaca atatgaaatt tcaactcatt gtttagggtt tgtttaattt 1740
tctacacata cgattctgcg aacttcaaaa agcatcggga ataacaccat gaaaaaaatg 1800
ctactcgcta ctgcgctggc cctgcttatt acaggatgtg ctcaacagac gtttactgtt 1860
caaaacaaac cggcagcagt agcaccaaag gaaaccatca cccatcattt cttcgtttct 1920
ggaattgggc agaagaaaac tgtcgatgca gccaaaattt gtggcggcgc agaaaatgtt 1980
gttaaaacag aaacccagca aacattcgta aatggattgc tcggttttat tactttaggc 2040
atttatactc cgctggaagc gcgtgtgtat tgctcacaat aattgcatga gttgcccatc 2100
gatatgggca actctatctg cactgctcat taatatactt ctgggttcct tccagttgtt 2160
tttgcatagt gatcagcctc tctctgaggg tgaaataatc ccgttcagcg gtgtctgcca 2220
gtcgggggga ggctgcatta tccacgccgg aggcggtggt ggcttcacgc actgactgac 2280
agactgcttt gatgtgcaac cgacgacgac cagcggcaac atcatcacgc agagcatcat 2340
tttcagcttt agcatcagct aactccttcg tgtattttgc atcgagcgca gcaacatcac 2400
gctgacgcat ctgcatgtca gtaattgccg cgttcgccag cttcagttct ctggcatttt 2460
tgtcgcgctg ggctttgtag gtaatggcgt tatcacggta atgattaaca gcccatgaca 2520
ggcagacgat gatgcagata accagagcgg agataatcgc ggtgactctg ctcatacatc 2580
aatctctctg accgttccgc ccgcttcttt gaattttgca atcaggctgt cagccttatg 2640
ctcgaactga ccataaccag cgcccggcag tgaagcccag atattgctgc aacggtcgat 2700
tgcctgacgg atatcaccac gatcaatcat aggtaaagcg ccacgctcct taatctgctg 2760
caatgccaca gcgtcctgac ttttcggaga gaagtctttc aggccaagct gcttgcggta 2820
ggcatcccac caacgggaaa gaagctggta gcgtccggcg cctgttgatt tgagttttgg 2880
gtttagcgtg acaagtttgc gagggtgatc ggagtaatca gtaaatagct ctccgcctac 2940
aatgacgtca taaccatgat ttctggtttt ctgacgtccg ttatcagttc cctccgacca 3000
cgccagcata tcgaggaacg ccttacgttg attattgatt tctaccatct tctactccgg 3060
cttttttagc agcgaagcgt ttgataagcg aaccaatcga gtcagtaccg atgtagccga 3120
taaacacgct cgttatataa gcgagattgc tacttagtcc ggcgaagtcg agaaggtcac 3180
gaatgaacta ggcgataatg gcgcacatcg ttgcgtcgat tactgttttt gtaaacgcac 3240
cgccattata tctgccgcga aggtacgcca ttgcaaacgc aaggattgcc ccgatgcctt 3300
gttcctttgc cgcgagaatg gcggccaaca ggtcatgttt ttctggcatc ttcatgtctt 3360
acccccaata aggggatttg ctctatttaa ttaggaataa ggtcgattac tgatagaaca 3420
aatccaggct actgtgttta gtaatcagat ttgttcgtga ccgatatgca cgggcaaaac 3480
ggcaggaggt tgttagcgca aaaaaaaaat tccaaaaaaa aaattccaaa aaaaaaaagc 3540
gactaacaaa cacaatctga tggca 3565
<210> 43
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 实施例7中使用的序列
<400> 43
gcaatatcag caccaacaga aacaaccttt gaggcgagcg gtcaa 45
<210> 44
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 实施例7中使用的序列
<400> 44
ggttaaacac ccaagcagac gccttttttt tttcgtcctg tcgctgtgtc tcgg 54
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 实施例7中使用的序列
<400> 45
cgagacacag cgacaggacg 20
<210> 46
<211> 3560
<212> DNA
<213> 人工序列
<220>
<223> 实施例7中使用的序列
<400> 46
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgcgct aacaacctcc tgccgttttg cccgtgcata tcggtcacga acaaatctga 120
ttactaaaca cagtagcctg gatttgttct atcagtaatc gaccttattc ctaattaaat 180
agagcaaatc cccttattgg gggtaagaca tgaagatgcc agaaaaacat gacctgttgg 240
ccgccattct cgcggcaaag gaacaaggca tcggggcaat ccttgcgttt gcaatggcgt 300
accttcgcgg cagatataat ggcggtgcgt ttacaaaaac agtaatcgac gcaacgatgt 360
gcgccattat cgcctagttc attcgtgacc ttctcgactt cgccggacta agtagcaatc 420
tcgcttatat aacgagcgtg tttatcggct acatcggtac tgactcgatt ggttcgctta 480
tcaaacgctt cgctgctaaa aaagccggag tagaagatgg tagaaatcaa taatcaacgt 540
aaggcgttcc tcgatatgct ggcgtggtcg gagggaactg ataacggacg tcagaaaacc 600
agaaatcatg gttatgacgt cattgtaggc ggagagctat ttactgatta ctccgatcac 660
cctcgcaaac ttgtcacgct aaacccaaaa ctcaaatcaa caggcgccgg acgctaccag 720
cttctttccc gttggtggga tgcctaccgc aagcagcttg gcctgaaaga cttctctccg 780
aaaagtcagg acgctgtggc attgcagcag attaaggagc gtggcgcttt acctatgatt 840
gatcgtggtg atatccgtca ggcaatcgac cgttgcagca atatctgggc ttcactgccg 900
ggcgctggtt atggtcagtt cgagcataag gctgacagcc tgattgcaaa attcaaagaa 960
gcgggcggaa cggtcagaga gattgatgta tgagcagagt caccgcgatt atctccgctc 1020
tggttatctg catcatcgtc tgcctgtcat gggctgttaa tcattaccgt gataacgcca 1080
ttacctacaa agcccagcgc gacaaaaatg ccagagaact gaagctggcg aacgcggcaa 1140
ttactgacat gcagatgcgt cagcgtgatg ttgctgcgct cgatgcaaaa tacacgaagg 1200
agttagctga tgctaaagct gaaaatgatg ctctgcgtga tgatgttgcc gctggtcgtc 1260
gtcggttgca catcaaagca gtctgtcagt cagtgcgtga agccaccacc gcctccggcg 1320
tggataatgc agcctccccc cgactggcag acaccgctga acgggattat ttcaccctca 1380
gagagaggct gatcactatg caaaaacaac tggaaggaac ccagaagtat attaatgagc 1440
agtgcagata gagttgccca tatcgatggg caactcatgc aattattgtg agcaatacac 1500
acgcgcttcc agcggagtat aaatgcctaa agtaataaaa ccgagcaatc catttacgaa 1560
tgtttgctgg gtttctgttt taacaacatt ttctgcgccg ccacaaattt tggctgcatc 1620
gacagttttc ttctgcccaa ttccagaaac gaagaaatga tgggtgatgg tttcctttgg 1680
tgctactgct gccggtttgt tttgaacagt aaacgtctgt tgagcacatc ctgtaataag 1740
cagggccagc gcagtagcga gtagcatttt tttcatggtg ttattcccga tgctttttga 1800
agttcgcaga atcgtatgtg tagaaaatta aacaaaccct aaacaatgag ttgaaatttc 1860
atattgttaa tatttattaa tgtatgtcag gtgcgatgaa tcgtcattgt attcccggat 1920
taactatgtc cacagccctg acggggaact tctctgcggg agtgtccggg aataattaaa 1980
acgatgcaca cagggtttag cgcgtacacg tattgcatta tgccaacgcc ccggtgctga 2040
cacggaagaa accggacgtt atgatttagc gtggaaagat ttgtgtagtg ttctgaatgc 2100
tctcagtaaa tagtaatgaa ttatcaaagg tatagtaata tcttttatgt tcatggatat 2160
ttgtaaccca tcggaaaact cctgctttag caagattttc cctgtattgc tgaaatgtga 2220
tttctcttga tttcaaccta tcataggacg tttctataag atgcgtgttt cttgagaatt 2280
taacatttac aaccttttta agtcctttta ttaacacggt gttatcgttt tctaacacga 2340
tgtgaatatt atctgtggct agatagtaaa tataatgtga gacgttgtga cgttttagtt 2400
cagaataaaa caattcacag tctaaatctt ttcgcacttg atcgaatatt tctttaaaaa 2460
tggcaacctg agccattggt aaaaccttcc atgtgatacg agggcgcgta gtttgcatta 2520
tcgtttttat cgtttcaatc tggtctgacc tccttgtgtt ttgttgatga tttatgtcaa 2580
atattaggaa tgttttcact taatagtatt ggttgcgtaa caaagtgcgg tcctgctggc 2640
attctggagg gaaatacaac cgacagatgt atgtaaggcc aacgtgctca aatcttcata 2700
cagaaagatt tgaagtaata ttttaaccgc tagatgaaga gcaagcgcat ggagcgacaa 2760
aatgaataaa gaacaatctg ctgatgatcc ctccgtggat ctgattcgtg taaaaaatat 2820
gcttaatagc accatttcta tgagttaccc tgatgttgta attgcatgta tagaacataa 2880
ggtgtctctg gaagcattca gagcaattga ggcagcgttg gtgaagcacg ataataatat 2940
gaaggattat tccctggtgg ttgactgatc accataactg ctaatcattc aaactattta 3000
gtctgtgaca gagccaacac gcagtctgtc actgtcagga aagtggtaaa actgcaactc 3060
aattactgca atgccctcgt aattaagtga atttacaata tcgtcctgtt cggagggaag 3120
aacgcgggat gttcattctt catcactttt aattgatgta tatgctctct tttctgacgt 3180
tagtctccga cggcaggctt caatgaccca ggctgagaaa ttcccggacc ctttttgctc 3240
aagagcgatg ttaatttgtt caatcatttg gttaggaaag cggatgttgc gggttgttgt 3300
tctgcgggtt ctgttcttcg ttgacatgag gttgccccgt attcagtgtc gctgatttgt 3360
attgtctgaa gttgttttta cgttaagttg atgcagatca attaatacga tacctgcgtc 3420
ataattgatt atttgacgtg gtttgatggc ctccacgcac gttgtgatat gtagatgata 3480
atcattatca ctttacgggt cctttccggt gaaaaaaaag gtaccaaaaa aaacatcgtc 3540
gtgagtagtg aaccgtaagc 3560
<210> 47
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 实施例7中使用的序列
<400> 47
cgttctgttt atgtttcttg tttgttagcc ttttggctaa caaacaagaa acataaacag 60
aacg 64
Claims (25)
1.一种用于将一个或多个解旋酶蛋白连接到靶多核苷酸的方法,依次包括:
(a)提供结合到一个或多个装载部分的所述一个或多个解旋酶蛋白,所述一个或多个装载部分包含装载多核苷酸,其中所述一个或多个解旋酶蛋白结合到所述装载多核苷酸;以及
(b)将步骤(a)中所提供的所述一个或多个装载部分连接到所述靶多核苷酸,其中所述一个或多个解旋酶蛋白保持结合到所述一个或多个装载部分。
2.根据权利要求1所述的方法,其中所述方法包括在步骤(a)之前将所述解旋酶蛋白结合到所述一个或多个装载部分。
3.根据权利要求1所述的方法,其中所述一个或多个解旋酶为(A)Hel308解旋酶、RecD解旋酶、XPD解旋酶或Dda解旋酶;(B)衍生自A中的任何解旋酶的解旋酶;或(C)(A)和/或(B)中所述解旋酶的任意组合。
4.根据权利要求3所述的方法,其中所述一个或多个解旋酶被修饰以减小所述解旋酶的多核苷酸结合域中开口的大小,所述多核苷酸在至少一个构象下穿过所述开口从解旋酶上解绑。
5.根据权利要求1所述的方法,其中所述方法涉及连接两个或更多个解旋酶蛋白。
6.根据权利要求5所述的方法,其中所述两个或更多个解旋酶蛋白:
(i)除非由所述一个或多个装载部分连接,否则彼此不连接;和/或
(ii)彼此不同。
7.根据权利要求1所述的方法,其中所述一个或多个装载部分是合成的。
8.根据权利要求1所述的方法,其中所述装载多核苷酸为单链多核苷酸。
9.根据权利要求1所述的方法,其中所述一个或多个装载部分包含一个或多个能够耦合到膜的锚。
10.根据权利要求1所述的方法,其中步骤(b)包含使用连接酶将所述一个或多个装载部分连接到所述靶多核苷酸。
11.根据权利要求10所述的方法,其中所述方法进一步包括(c)从方法条件中去除所述连接酶。
12.根据权利要求10所述的方法,其中步骤(b)是在ATP不存在或使用γ-S-ATP(ATPγS)代替ATP的情况下进行的。
13.根据权利要求1所述的方法,其中所述靶多核苷酸是双链多核苷酸。
14.根据权利要求13所述的方法,其中所述一个或多个装载部分中的至少一个是Y衔体,且所述Y衔体包含螺入孔中的前导序列。
15.根据权利要求14所述的方法,其中所述一个或多个装载部分中的至少一个是桥连部分,其包含发夹环。
16.根据权利要求15所述的方法,其中所述发夹环的茎干为少于200个核苷酸对的长度。
17.一种表征靶多核苷酸的方法,包括:
(a)实施权利要求1所述的方法;
(b)将在步骤(a)中提供的具有所述一个或多个解旋酶蛋白连接的所述靶多核苷酸与跨膜孔接触,使得所述一个或多个解旋酶蛋白控制所述多核苷酸相对于所述孔的移动;以及
(c)随着所述多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述多核苷酸的一个或多个特征,且由此表征所述靶多核苷酸。
18.根据权利要求17所述的方法,其中所述一个或多个特征选自(i)所述靶多核苷酸的长度,(ii)所述靶多核苷酸的同一性,(iii)所述靶多核苷酸的序列,(iv)所述靶多核苷酸的二级结构,以及(v)所述靶多核苷酸是否被修饰。
19.根据权利要求17所述的方法,其中所述孔是跨膜蛋白孔或固态孔。
20.根据权利要求19所述的方法,其中所述跨膜蛋白孔衍生自β-桶状体孔、α-螺旋束孔、溶血素、杀白细胞素、耻垢分枝杆菌孔蛋白A(MspA)、MspB、MspC、MspD、胞溶素、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A、奈瑟球菌属自转运脂蛋白(NalP)和WZA。
21.根据权利要求20所述的方法,其中所述跨膜蛋白孔为:
由8个如SEQ ID NO:2中所示的相同亚基形成的MspA,或MspA的变体,其中基于氨基酸同一性,所述8个亚基中的一个或多个与SEQ ID NO:2在整个序列上具有至少90%同源性且保留了孔活性。
22.根据权利要求20所述的方法,其中所述跨膜蛋白孔为:
由7个如SEQ ID NO:4中所示的相同亚基形成的α-溶血素,或α-溶血素的变体,其中基于氨基酸同一性,所述7个亚基中的一个或多个与SEQ ID NO:4在整个序列上具有至少90%同源性且保留了孔活性。
23.根据权利要求17所述的方法,其中所述靶多核苷酸通过甲基化、氧化、损伤、用一个或多个蛋白或用一个或多个标记物、标签或间隔器进行修饰。
24.根据权利要求17所述的方法,其中所述靶多核苷酸的所述一个或多个特征通过电测量和/或光学测量来测量。
25.根据权利要求17所述的方法,其中所述靶多核苷酸的所述一个或多个特征通过电测量来测量并且所述电测量是电流测量、阻抗测量、风洞测量或场效应晶体管(FET)测量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010095234.4A CN111534504B (zh) | 2014-01-22 | 2015-01-22 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/GB2014/050175 WO2014135838A1 (en) | 2013-03-08 | 2014-01-22 | Enzyme stalling method |
GBPCT/GB2014/050175 | 2014-01-22 | ||
GB1406155.0 | 2014-04-04 | ||
GBGB1406155.0A GB201406155D0 (en) | 2014-04-04 | 2014-04-04 | Method |
GBGB1406151.9A GB201406151D0 (en) | 2014-04-04 | 2014-04-04 | Method |
GB1406151.9 | 2014-04-04 | ||
GB1416197.0 | 2014-09-12 | ||
GB201416197A GB201416197D0 (en) | 2014-09-12 | 2014-09-12 | Method |
CN201580005650.8A CN106103741B (zh) | 2014-01-22 | 2015-01-22 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
PCT/GB2015/050140 WO2015110813A1 (en) | 2014-01-22 | 2015-01-22 | Method for attaching one or more polynucleotide binding proteins to a target polynucleotide |
CN202010095234.4A CN111534504B (zh) | 2014-01-22 | 2015-01-22 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580005650.8A Division CN106103741B (zh) | 2014-01-22 | 2015-01-22 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111534504A CN111534504A (zh) | 2020-08-14 |
CN111534504B true CN111534504B (zh) | 2024-06-21 |
Family
ID=53680879
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010095234.4A Active CN111534504B (zh) | 2014-01-22 | 2015-01-22 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
CN201580005650.8A Active CN106103741B (zh) | 2014-01-22 | 2015-01-22 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580005650.8A Active CN106103741B (zh) | 2014-01-22 | 2015-01-22 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
Country Status (7)
Country | Link |
---|---|
US (3) | US10385389B2 (zh) |
EP (1) | EP3097210B2 (zh) |
JP (1) | JP6749243B2 (zh) |
CN (2) | CN111534504B (zh) |
AU (1) | AU2015208919B9 (zh) |
CA (1) | CA2937411C (zh) |
WO (1) | WO2015110813A1 (zh) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102369298B (zh) | 2009-01-30 | 2017-03-22 | 牛津纳米孔技术有限公司 | 跨膜测序中用于核酸构建体的衔接体 |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
JP6298404B2 (ja) | 2011-07-25 | 2018-03-20 | オックスフォード ナノポール テクノロジーズ リミテッド | 膜貫通ポアを用いる二重鎖ポリヌクレオチド配列決定のためのヘアピンループ方法 |
KR20140090633A (ko) | 2011-10-21 | 2014-07-17 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법 |
KR102083695B1 (ko) | 2012-04-10 | 2020-03-02 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 돌연변이체 리세닌 기공 |
US11155860B2 (en) | 2012-07-19 | 2021-10-26 | Oxford Nanopore Technologies Ltd. | SSB method |
CA2879261C (en) | 2012-07-19 | 2022-12-06 | Oxford Nanopore Technologies Limited | Modified helicases |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
CN105209634B (zh) | 2013-03-08 | 2020-05-12 | 牛津纳米孔技术公司 | 酶停滞方法 |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
EP3058088A2 (en) | 2013-10-18 | 2016-08-24 | Oxford Nanopore Technologies Limited | Modified enzymes |
CN111534504B (zh) | 2014-01-22 | 2024-06-21 | 牛津纳米孔科技公开有限公司 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
EP3137490B1 (en) | 2014-05-02 | 2021-01-27 | Oxford Nanopore Technologies Limited | Mutant pores |
GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
CN117164683A (zh) | 2014-09-01 | 2023-12-05 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
WO2016055778A1 (en) | 2014-10-07 | 2016-04-14 | Oxford Nanopore Technologies Limited | Mutant pores |
GB201418159D0 (en) | 2014-10-14 | 2014-11-26 | Oxford Nanopore Tech Ltd | Method |
GB201502810D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Method |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
EP3283887B1 (en) | 2015-04-14 | 2021-07-21 | Katholieke Universiteit Leuven | Nanopores with internal protein adaptors |
AU2016369071B2 (en) | 2015-12-08 | 2022-05-19 | Katholieke Universiteit Leuven Ku Leuven Research & Development | Modified nanopores, compositions comprising the same, and uses thereof |
CA3016243C (en) | 2016-03-02 | 2023-04-25 | Oxford Nanopore Technologies Limited | Pores comprising mutant csgg monomers |
CN116514944A (zh) | 2016-04-06 | 2023-08-01 | 牛津纳米孔科技公开有限公司 | 突变体孔 |
GB201609221D0 (en) | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
GB201609220D0 (en) * | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
GB201620450D0 (en) | 2016-12-01 | 2017-01-18 | Oxford Nanopore Tech Ltd | Method |
GB2559117B (en) | 2017-01-19 | 2019-11-27 | Oxford Nanopore Tech Ltd | Double stranded polynucleotide synthesis method, kit and system |
JP7383480B2 (ja) * | 2017-02-10 | 2023-11-20 | オックスフォード ナノポール テクノロジーズ ピーエルシー | 修飾ナノポア、それを含む組成物、およびそれらの使用 |
GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
GB201707140D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Method |
KR20200030070A (ko) | 2017-06-30 | 2020-03-19 | 브이아이비 브이지더블유 | 신규한 단백질 포어 |
GB2569977A (en) * | 2018-01-05 | 2019-07-10 | Oxford Nanopore Tech Ltd | Method |
GB201801768D0 (en) * | 2018-02-02 | 2018-03-21 | Oxford Nanopore Tech Ltd | Synthesis method |
GB201807793D0 (en) | 2018-05-14 | 2018-06-27 | Oxford Nanopore Tech Ltd | Method |
GB201809323D0 (en) | 2018-06-06 | 2018-07-25 | Oxford Nanopore Tech Ltd | Method |
GB201811811D0 (en) | 2018-07-19 | 2018-09-05 | Oxford Nanopore Tech Ltd | Method |
JP2020031557A (ja) * | 2018-08-28 | 2020-03-05 | 株式会社日立ハイテクノロジーズ | 生体分子分析装置 |
JP6545888B1 (ja) * | 2018-11-09 | 2019-07-17 | 国立大学法人東北大学 | 情報処理システム、公開鍵の変更方法、およびプログラム |
GB201907244D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
US11926819B2 (en) | 2019-05-28 | 2024-03-12 | The Regents Of The University Of California | Methods of adding polymers to ribonucleic acids |
US20220396829A1 (en) * | 2019-09-18 | 2022-12-15 | Hitachi High-Tech Corporation | Adapter Molecule, Biomolecule-Adapter Molecule Complex in Which Said Adapter Molecule and Biomolecule Are Bound, Biomolecule Analysis Apparatus, and Biomolecule Analysis Method |
WO2021053745A1 (ja) * | 2019-09-18 | 2021-03-25 | 株式会社日立ハイテク | アダプター分子、当該アダプター分子と生体分子とが結合した生体分子-アダプター分子複合体、生体分子分析装置及び生体分子分析方法 |
WO2021056598A1 (zh) | 2019-09-29 | 2021-04-01 | 北京齐碳科技有限公司 | 一种Mmup单体变体及其应用 |
WO2021056599A1 (zh) * | 2019-09-29 | 2021-04-01 | 北京齐碳科技有限公司 | 一种Mnep单体变体及其应用 |
CN115968410A (zh) | 2020-06-18 | 2023-04-14 | 牛津纳米孔科技公开有限公司 | 表征移动穿过纳米孔的多核苷酸的方法 |
WO2021255475A1 (en) * | 2020-06-18 | 2021-12-23 | Oxford Nanopore Technologies Limited | A method of selectively characterising a polynucleotide using a detector |
GB202009349D0 (en) | 2020-06-18 | 2020-08-05 | Oxford Nanopore Tech Ltd | Method |
EP4193363A1 (en) | 2020-08-07 | 2023-06-14 | Oxford Nanopore Technologies plc | Methods of identifying nucleic acid barcodes |
GB202015993D0 (en) | 2020-10-08 | 2020-11-25 | Oxford Nanopore Tech Ltd | Method |
CN112851771A (zh) * | 2021-02-09 | 2021-05-28 | 中国科学院武汉病毒研究所 | 连接核酸与蛋白或肽的方法 |
CN112851765B (zh) * | 2021-02-09 | 2023-02-28 | 中国科学院武汉病毒研究所 | 蛋白或肽与核酸共价连接的方法 |
WO2022243692A1 (en) | 2021-05-19 | 2022-11-24 | Oxford Nanopore Technologies Plc | Methods for complement strand sequencing |
CN114134142B (zh) * | 2021-11-23 | 2024-05-28 | 成都齐碳科技有限公司 | 衔接体、复合物、单链分子、试剂盒、方法和应用 |
CN113862264A (zh) * | 2021-12-03 | 2021-12-31 | 北京齐碳科技有限公司 | 用于靶多核苷酸测序的衔接子、构建体、方法和应用 |
CN114262735A (zh) * | 2021-12-15 | 2022-04-01 | 成都齐碳科技有限公司 | 用于表征多核苷酸的衔接体及其用途 |
GB202118908D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
GB202118906D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
GB202204919D0 (en) | 2022-04-04 | 2022-05-18 | Oxford Nanopore Tech Plc | Method |
GB202205617D0 (en) | 2022-04-14 | 2022-06-01 | Oxford Nanopore Tech Plc | Novel modified protein pores and enzymes |
AU2023270700A1 (en) | 2022-05-17 | 2024-10-31 | Oxford Nanopore Technologies Plc | Method and adaptors |
GB202207267D0 (en) | 2022-05-18 | 2022-06-29 | Oxford Nanopore Tech Plc | Calibration and profiling of a nanopore array device |
WO2023223033A1 (en) | 2022-05-18 | 2023-11-23 | Oxford Nanopore Technologies Plc | Compositions and methods for nucleic acid extraction and purification |
CN114836452B (zh) * | 2022-05-19 | 2023-12-05 | 浙江安诺优达生物科技有限公司 | 一种密码子优化的核酸外切酶ⅲ基因及其表达方法 |
CN116478983B (zh) * | 2022-11-21 | 2023-10-24 | 北京普译生物科技有限公司 | 一种rna-dna嵌合接头及其应用 |
WO2024138320A1 (zh) * | 2022-12-26 | 2024-07-04 | 深圳华大生命科学研究院 | 减少测序文库中游离接头的方法 |
GB202304324D0 (en) | 2023-03-24 | 2023-05-10 | Oxford Nanopore Tech Plc | Method and kits |
GB202307486D0 (en) | 2023-05-18 | 2023-07-05 | Oxford Nanopore Tech Plc | Method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013014451A1 (en) * | 2011-07-25 | 2013-01-31 | Oxford Nanopore Technologies Limited | Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores |
Family Cites Families (113)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5198543A (en) | 1989-03-24 | 1993-03-30 | Consejo Superior Investigaciones Cientificas | PHI29 DNA polymerase |
US6362002B1 (en) | 1995-03-17 | 2002-03-26 | President And Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
US5795782A (en) | 1995-03-17 | 1998-08-18 | President & Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
JP3891620B2 (ja) | 1996-11-14 | 2007-03-14 | 株式会社アイシン・コスモス研究所 | ヘアピン型構造の核酸プローブ分子、及び該核酸プローブ分子を利用した核酸検出方法 |
US20020197614A1 (en) * | 1997-05-16 | 2002-12-26 | Mosaic Technologies, Inc. | Electrophoretic analysis of target molecules using adapter molecules |
AU8586298A (en) | 1997-07-25 | 1999-02-16 | University Of Massachusetts | Designed protein pores as components for biosensors |
US6743605B1 (en) | 1998-06-24 | 2004-06-01 | Enzo Life Sciences, Inc. | Linear amplification of specific nucleic acid sequences |
US6150112A (en) * | 1998-09-18 | 2000-11-21 | Yale University | Methods for identifying DNA sequences for use in comparison of DNA samples by their lack of polymorphism using Y shape adaptors |
US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
US6426231B1 (en) | 1998-11-18 | 2002-07-30 | The Texas A&M University System | Analyte sensing mediated by adapter/carrier molecules |
NO986133D0 (no) | 1998-12-23 | 1998-12-23 | Preben Lexow | FremgangsmÕte for DNA-sekvensering |
US6627067B1 (en) | 1999-06-22 | 2003-09-30 | President And Fellows Of Harvard College | Molecular and atomic scale evaluation of biopolymers |
AU7901300A (en) | 1999-08-31 | 2001-03-26 | Stefan Bossmann | Method for producing a channel-forming protein |
AU2001241474A1 (en) | 2000-02-11 | 2001-08-20 | The Texas A And M University System | Biosensor compositions and methods of use |
WO2001062943A1 (en) * | 2000-02-25 | 2001-08-30 | Invitrogen Corporation | Topoisomerase linker-mediated amplification methods |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
US6936433B2 (en) | 2000-11-27 | 2005-08-30 | The Regents Of The University Of California | Methods and devices for characterizing duplex nucleic acid molecules |
US6863833B1 (en) | 2001-06-29 | 2005-03-08 | The Board Of Trustees Of The Leland Stanford Junior University | Microfabricated apertures for supporting bilayer lipid membranes |
WO2003095669A1 (en) | 2002-05-10 | 2003-11-20 | The Texas A & M University System | Stochastic sensing through covalent interactions |
EP1606417A2 (en) * | 2003-03-07 | 2005-12-21 | Rubicon Genomics Inc. | In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna |
EP1616033B1 (en) * | 2003-03-25 | 2010-03-03 | Stratagene California | Dna polymerase fusions and uses thereof |
US7163658B2 (en) | 2003-04-23 | 2007-01-16 | Rouvain Bension | Rapid sequencing of polymers |
AU2003904237A0 (en) | 2003-08-08 | 2003-08-21 | Garvan Institute Of Medical Research | Novel translocation assay |
US7424370B2 (en) | 2004-02-06 | 2008-09-09 | Council Of Scientific And Industrial Research | Computational method for identifying adhesin and adhesin-like proteins of therapeutic potential |
JP2005253427A (ja) * | 2004-03-15 | 2005-09-22 | Aisin Seiki Co Ltd | 核酸検出方法及び核酸単離方法 |
US7238485B2 (en) | 2004-03-23 | 2007-07-03 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
WO2005124888A1 (en) | 2004-06-08 | 2005-12-29 | President And Fellows Of Harvard College | Suspended carbon nanotube field effect transistor |
US20060105461A1 (en) | 2004-10-22 | 2006-05-18 | May Tom-Moy | Nanopore analysis system |
US7867716B2 (en) | 2004-12-21 | 2011-01-11 | The Texas A&M University System | High temperature ion channels and pores |
GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
KR100730350B1 (ko) | 2005-10-17 | 2007-06-19 | 삼성전자주식회사 | 표면처리된 나노포어를 이용한 dna 검출방법 및검출장치 |
GB0523282D0 (en) | 2005-11-15 | 2005-12-21 | Isis Innovation | Methods using pores |
EP1963530B1 (en) | 2005-12-22 | 2011-07-27 | Pacific Biosciences of California, Inc. | Active surface coupled polymerases |
US7849581B2 (en) | 2006-05-05 | 2010-12-14 | University Of Utah Research Foundation | Nanopore electrode, nanopore membrane, methods of preparation and surface modification, and use thereof |
US7638034B2 (en) | 2006-09-21 | 2009-12-29 | Los Alamos National Security, Llc | Electrochemical detection of single molecules using abiotic nanopores having electrically tunable dimensions |
EP2122344B8 (en) | 2007-02-20 | 2019-08-21 | Oxford Nanopore Technologies Limited | Lipid bilayer sensor system |
JP5646987B2 (ja) | 2007-04-04 | 2014-12-24 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | ナノポアを使用するための組成物、デバイス、システム、及び方法 |
EP2158476B8 (en) | 2007-05-08 | 2019-10-09 | Trustees of Boston University | Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof |
GB0716264D0 (en) | 2007-08-21 | 2007-09-26 | Isis Innovation | Bilayers |
EP2195648B1 (en) | 2007-09-12 | 2019-05-08 | President and Fellows of Harvard College | High-resolution molecular graphene sensor comprising an aperture in the graphene layer |
GB2453377A (en) | 2007-10-05 | 2009-04-08 | Isis Innovation | Transmembrane protein pores and molecular adapters therefore. |
WO2009052214A2 (en) | 2007-10-15 | 2009-04-23 | Complete Genomics, Inc. | Sequence analysis using decorated nucleic acids |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
US8231969B2 (en) | 2008-03-26 | 2012-07-31 | University Of Utah Research Foundation | Asymmetrically functionalized nanoparticles |
EP3170904B1 (en) | 2008-03-28 | 2017-08-16 | Pacific Biosciences Of California, Inc. | Compositions and methods for nucleic acid sequencing |
EP2281062B1 (en) | 2008-04-24 | 2017-11-29 | The Trustees of Columbia University in the City of New York | Geometric patterns and lipid bilayers for dna molecule organization |
EP2293921A4 (en) | 2008-05-22 | 2013-05-22 | Univ California | MEMBRANE PROBLEMS AND MEMBRANES MADE FROM THESE |
US8652771B2 (en) | 2008-05-28 | 2014-02-18 | University of Souther California | Measurement of succinate in urine samples as a biomarker of kidney damage in diabetic subjects |
CN103695530B (zh) | 2008-07-07 | 2016-05-25 | 牛津纳米孔技术有限公司 | 酶-孔构建体 |
CN102144037A (zh) | 2008-07-07 | 2011-08-03 | 牛津纳米孔技术有限公司 | 检测碱基的孔 |
US20100092960A1 (en) | 2008-07-25 | 2010-04-15 | Pacific Biosciences Of California, Inc. | Helicase-assisted sequencing with molecular beacons |
CN104710519B (zh) | 2008-09-22 | 2021-05-28 | 华盛顿大学 | Msp纳米微孔和相关方法 |
US8383369B2 (en) | 2008-09-24 | 2013-02-26 | Pacific Biosciences Of California, Inc. | Intermittent detection during analytical reactions |
US9080211B2 (en) * | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
GB0820927D0 (en) | 2008-11-14 | 2008-12-24 | Isis Innovation | Method |
EP2391639A1 (en) | 2009-01-30 | 2011-12-07 | Oxford Nanopore Technologies Limited | Enzyme mutant |
CN102369298B (zh) | 2009-01-30 | 2017-03-22 | 牛津纳米孔技术有限公司 | 跨膜测序中用于核酸构建体的衔接体 |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
CN102405410B (zh) | 2009-04-20 | 2014-06-25 | 牛津楠路珀尔科技有限公司 | 脂质双层传感器阵列 |
EP2507387B1 (en) | 2009-12-01 | 2017-01-25 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument and method |
CA3211104A1 (en) | 2010-02-23 | 2011-09-01 | University Of Washington | Artificial mycolic acid membranes |
WO2011125015A2 (en) | 2010-04-05 | 2011-10-13 | Bar-Ilan University | Protease-activatable pore-forming polypeptides |
EP2580588B1 (en) | 2010-06-08 | 2014-09-24 | President and Fellows of Harvard College | Nanopore device with graphene supported artificial lipid membrane |
CN103370617B (zh) | 2010-10-01 | 2015-11-25 | 牛津纳米孔技术有限公司 | 生物化学分析设备和旋转阀 |
CN102116783B (zh) | 2010-12-31 | 2013-05-29 | 北京普源精电科技有限公司 | 一种波形显示方法 |
CN102174554A (zh) | 2011-01-24 | 2011-09-07 | 内蒙古民族大学 | 双控双调节原核表达载体系统及其构建方法和用途 |
US20120196279A1 (en) | 2011-02-02 | 2012-08-02 | Pacific Biosciences Of California, Inc. | Methods and compositions for nucleic acid sample preparation |
US9751915B2 (en) | 2011-02-11 | 2017-09-05 | Oxford Nanopore Technologies Ltd. | Mutant pores |
US8980553B2 (en) * | 2011-04-02 | 2015-03-17 | New England Biolabs, Inc. | Methods and compositions for enriching either target polynucleotides or non-target polynucleotides from a mixture of target and non-target polynucleotides |
AU2012264497B2 (en) | 2011-05-27 | 2017-06-15 | Oxford Nanopore Technologies Limited | Coupling method |
US9580480B2 (en) | 2011-05-31 | 2017-02-28 | Massachusetts Institute Of Technology | Cell-directed synthesis of multifunctional nanopatterns and nanomaterials |
EP3663412B1 (en) | 2011-09-23 | 2022-03-09 | Oxford Nanopore Technologies PLC | Analysis of a polymer comprising polymer units by means of translocation through a nanopore |
KR20140090633A (ko) * | 2011-10-21 | 2014-07-17 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법 |
GB201120910D0 (en) | 2011-12-06 | 2012-01-18 | Cambridge Entpr Ltd | Nanopore functionality control |
JP6228128B2 (ja) | 2011-12-29 | 2017-11-08 | オックスフォード ナノポール テクノロジーズ リミテッド | 酵素法 |
CN104136631B (zh) | 2011-12-29 | 2017-03-01 | 牛津纳米孔技术公司 | 使用xpd解旋酶表征多核苷酸的方法 |
CN104254771B (zh) * | 2012-01-20 | 2018-01-12 | 吉尼亚科技公司 | 基于纳米孔的分子检测与测序 |
KR102083695B1 (ko) | 2012-04-10 | 2020-03-02 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 돌연변이체 리세닌 기공 |
TWI655213B (zh) | 2012-07-13 | 2019-04-01 | 目立康股份有限公司 | 自我組織化肽衍生物的製造方法 |
EP2875152B1 (en) | 2012-07-19 | 2019-10-09 | Oxford Nanopore Technologies Limited | Enzyme construct |
CA2879261C (en) | 2012-07-19 | 2022-12-06 | Oxford Nanopore Technologies Limited | Modified helicases |
US11155860B2 (en) | 2012-07-19 | 2021-10-26 | Oxford Nanopore Technologies Ltd. | SSB method |
JP6375301B2 (ja) | 2012-10-26 | 2018-08-15 | オックスフォード ナノポール テクノロジーズ リミテッド | 液滴界面 |
GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
WO2014122654A2 (en) | 2013-02-07 | 2014-08-14 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Hybrid nanopores and uses thereof for detection of analytes |
CN105209634B (zh) | 2013-03-08 | 2020-05-12 | 牛津纳米孔技术公司 | 酶停滞方法 |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
EP3553175B1 (en) | 2013-03-13 | 2021-07-14 | Illumina, Inc. | Method of preparing a nucleic acid sequencing library |
WO2014153047A1 (en) | 2013-03-14 | 2014-09-25 | The Trustees Of Boston University | Optoelectronic control of solid-state nanopores |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
JP6329624B2 (ja) | 2013-05-24 | 2018-05-23 | イルミナ ケンブリッジ リミテッド | 加ピロリン酸分解式配列決定法 |
WO2015051378A1 (en) | 2013-10-04 | 2015-04-09 | University Of Washington Through Its Center For Commercialization | Systems and methods for nanopore-based analysis of nucleic acids |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
EP3058088A2 (en) | 2013-10-18 | 2016-08-24 | Oxford Nanopore Technologies Limited | Modified enzymes |
EP4282983A3 (en) | 2013-11-26 | 2024-02-28 | Illumina, Inc. | Compositions and methods for polynucleotide sequencing |
CN111534504B (zh) | 2014-01-22 | 2024-06-21 | 牛津纳米孔科技公开有限公司 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
GB201406155D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
WO2015150786A1 (en) | 2014-04-04 | 2015-10-08 | Oxford Nanopore Technologies Limited | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
EP3137490B1 (en) | 2014-05-02 | 2021-01-27 | Oxford Nanopore Technologies Limited | Mutant pores |
FR3023394B1 (fr) | 2014-07-02 | 2017-12-29 | Adn Access Data Networks | Dispositif permettant de faciliter l'enseignement de la langue amharique et d'en normaliser l'ecriture |
CN117164683A (zh) | 2014-09-01 | 2023-12-05 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
WO2016055778A1 (en) | 2014-10-07 | 2016-04-14 | Oxford Nanopore Technologies Limited | Mutant pores |
GB201502810D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Method |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
EP3283887B1 (en) | 2015-04-14 | 2021-07-21 | Katholieke Universiteit Leuven | Nanopores with internal protein adaptors |
AU2016369071B2 (en) | 2015-12-08 | 2022-05-19 | Katholieke Universiteit Leuven Ku Leuven Research & Development | Modified nanopores, compositions comprising the same, and uses thereof |
CA3016243C (en) | 2016-03-02 | 2023-04-25 | Oxford Nanopore Technologies Limited | Pores comprising mutant csgg monomers |
CN116514944A (zh) | 2016-04-06 | 2023-08-01 | 牛津纳米孔科技公开有限公司 | 突变体孔 |
GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
KR20200030070A (ko) | 2017-06-30 | 2020-03-19 | 브이아이비 브이지더블유 | 신규한 단백질 포어 |
-
2015
- 2015-01-22 CN CN202010095234.4A patent/CN111534504B/zh active Active
- 2015-01-22 US US15/113,207 patent/US10385389B2/en active Active
- 2015-01-22 CN CN201580005650.8A patent/CN106103741B/zh active Active
- 2015-01-22 EP EP15704360.5A patent/EP3097210B2/en active Active
- 2015-01-22 AU AU2015208919A patent/AU2015208919B9/en active Active
- 2015-01-22 JP JP2016547868A patent/JP6749243B2/ja active Active
- 2015-01-22 WO PCT/GB2015/050140 patent/WO2015110813A1/en active Application Filing
- 2015-01-22 CA CA2937411A patent/CA2937411C/en active Active
-
2019
- 2019-08-14 US US16/540,425 patent/US11725235B2/en active Active
-
2023
- 2023-06-23 US US18/340,823 patent/US20240026441A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013014451A1 (en) * | 2011-07-25 | 2013-01-31 | Oxford Nanopore Technologies Limited | Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores |
Also Published As
Publication number | Publication date |
---|---|
WO2015110813A1 (en) | 2015-07-30 |
US20170107569A1 (en) | 2017-04-20 |
AU2015208919A1 (en) | 2016-07-21 |
CN106103741A (zh) | 2016-11-09 |
US11725235B2 (en) | 2023-08-15 |
JP6749243B2 (ja) | 2020-09-02 |
AU2015208919B2 (en) | 2021-03-11 |
US20240026441A1 (en) | 2024-01-25 |
CA2937411C (en) | 2023-09-26 |
US20200087724A1 (en) | 2020-03-19 |
AU2015208919B9 (en) | 2021-04-01 |
CA2937411A1 (en) | 2015-07-30 |
EP3097210B1 (en) | 2018-11-14 |
EP3097210B2 (en) | 2022-04-20 |
CN111534504A (zh) | 2020-08-14 |
CN106103741B (zh) | 2020-03-13 |
EP3097210A1 (en) | 2016-11-30 |
US10385389B2 (en) | 2019-08-20 |
JP2017503517A (ja) | 2017-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111534504B (zh) | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 | |
US11685949B2 (en) | Mutant pore | |
US20190345550A1 (en) | Method for controlling the movement of a polynucleotide through a transmembrane pore | |
EP3619224B1 (en) | Transmembrane pore consisting of two csgg pores | |
CN107002151B (zh) | 向跨膜孔输送分析物的方法 | |
CN106460061B (zh) | 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法 | |
EP3126516B1 (en) | Method of target molecule characterisation using a molecular pore |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: oxford Applicant after: Oxford nanopore Technology Public Co.,Ltd. Address before: oxford Applicant before: OXFORD NANOPORE TECHNOLOGIES LTD. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |