JP2023527764A - タンパク質シーケンスのための方法及び組成物 - Google Patents
タンパク質シーケンスのための方法及び組成物 Download PDFInfo
- Publication number
- JP2023527764A JP2023527764A JP2022570635A JP2022570635A JP2023527764A JP 2023527764 A JP2023527764 A JP 2023527764A JP 2022570635 A JP2022570635 A JP 2022570635A JP 2022570635 A JP2022570635 A JP 2022570635A JP 2023527764 A JP2023527764 A JP 2023527764A
- Authority
- JP
- Japan
- Prior art keywords
- amino acid
- polypeptide
- protein
- molecule
- binding protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 170
- 239000000203 mixture Substances 0.000 title claims abstract description 63
- 238000000734 protein sequencing Methods 0.000 title description 4
- 150000001413 amino acids Chemical class 0.000 claims abstract description 723
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 585
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 564
- 229920001184 polypeptide Polymers 0.000 claims abstract description 554
- 238000012163 sequencing technique Methods 0.000 claims abstract description 232
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 215
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 215
- 102000021052 amino acid binding proteins Human genes 0.000 claims abstract description 144
- 238000006243 chemical reaction Methods 0.000 claims abstract description 101
- 108091011209 amino acid binding proteins Proteins 0.000 claims abstract description 25
- 229940024606 amino acid Drugs 0.000 claims description 806
- 230000027455 binding Effects 0.000 claims description 140
- 238000009739 binding Methods 0.000 claims description 140
- 238000003776 cleavage reaction Methods 0.000 claims description 123
- 230000007017 scission Effects 0.000 claims description 123
- 101710201712 Amino acid binding protein Proteins 0.000 claims description 119
- 239000011541 reaction mixture Substances 0.000 claims description 117
- 125000005647 linker group Chemical group 0.000 claims description 104
- 239000003153 chemical reaction reagent Substances 0.000 claims description 103
- 150000007523 nucleic acids Chemical class 0.000 claims description 95
- 102000039446 nucleic acids Human genes 0.000 claims description 86
- 108020004707 nucleic acids Proteins 0.000 claims description 86
- 102000018389 Exopeptidases Human genes 0.000 claims description 75
- 108010091443 Exopeptidases Proteins 0.000 claims description 75
- 102000035195 Peptidases Human genes 0.000 claims description 68
- 108091005804 Peptidases Proteins 0.000 claims description 68
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 63
- 101150038575 clpS gene Proteins 0.000 claims description 60
- 235000019833 protease Nutrition 0.000 claims description 59
- 229960002685 biotin Drugs 0.000 claims description 49
- 239000011616 biotin Substances 0.000 claims description 49
- 239000003446 ligand Substances 0.000 claims description 48
- 108090000915 Aminopeptidases Proteins 0.000 claims description 44
- 102000004400 Aminopeptidases Human genes 0.000 claims description 44
- 235000020958 biotin Nutrition 0.000 claims description 43
- 238000006731 degradation reaction Methods 0.000 claims description 37
- 230000003993 interaction Effects 0.000 claims description 34
- 238000002372 labelling Methods 0.000 claims description 33
- 238000001514 detection method Methods 0.000 claims description 27
- 239000012634 fragment Substances 0.000 claims description 23
- 230000015556 catabolic process Effects 0.000 claims description 19
- 150000003077 polyols Chemical group 0.000 claims description 19
- -1 polyoxyethylene Polymers 0.000 claims description 18
- 102000003960 Ligases Human genes 0.000 claims description 17
- 108090000364 Ligases Proteins 0.000 claims description 17
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 16
- 229930182817 methionine Natural products 0.000 claims description 16
- 229920000642 polymer Polymers 0.000 claims description 15
- 239000000758 substrate Substances 0.000 claims description 12
- 102000004190 Enzymes Human genes 0.000 claims description 9
- 108090000790 Enzymes Proteins 0.000 claims description 9
- 230000006287 biotinylation Effects 0.000 claims description 9
- 238000007413 biotinylation Methods 0.000 claims description 9
- 102100024057 Nuclear pore glycoprotein p62 Human genes 0.000 claims description 8
- 101800001821 Precursor of protein E3/E2 Proteins 0.000 claims description 8
- 238000010494 dissociation reaction Methods 0.000 claims description 8
- 230000005593 dissociations Effects 0.000 claims description 8
- 101800002664 p62 Proteins 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 7
- 229920001223 polyethylene glycol Polymers 0.000 claims description 7
- 238000000746 purification Methods 0.000 claims description 7
- 241000588724 Escherichia coli Species 0.000 claims description 6
- 239000002202 Polyethylene glycol Substances 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 6
- 238000005859 coupling reaction Methods 0.000 claims description 6
- 108010017378 prolyl aminopeptidase Proteins 0.000 claims description 6
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 5
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 5
- 102000005720 Glutathione transferase Human genes 0.000 claims description 5
- 108010070675 Glutathione transferase Proteins 0.000 claims description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 5
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 claims description 5
- 102000014400 SH2 domains Human genes 0.000 claims description 5
- 108050003452 SH2 domains Proteins 0.000 claims description 5
- 108091007116 UBR-box proteins Proteins 0.000 claims description 5
- 102000036414 UBR-box proteins Human genes 0.000 claims description 5
- 230000006652 catabolic pathway Effects 0.000 claims description 5
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 3
- 239000005090 green fluorescent protein Substances 0.000 claims description 3
- 229920001451 polypropylene glycol Polymers 0.000 claims description 3
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims description 2
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims description 2
- 102100034560 Cytosol aminopeptidase Human genes 0.000 claims description 2
- 229920002307 Dextran Polymers 0.000 claims description 2
- 241000223960 Plasmodium falciparum Species 0.000 claims description 2
- 229920003171 Poly (ethylene oxide) Polymers 0.000 claims description 2
- 239000004372 Polyvinyl alcohol Substances 0.000 claims description 2
- 108090000340 Transaminases Proteins 0.000 claims description 2
- 102000003929 Transaminases Human genes 0.000 claims description 2
- 101710204001 Zinc metalloprotease Proteins 0.000 claims description 2
- 229940009098 aspartate Drugs 0.000 claims description 2
- 229930195712 glutamate Natural products 0.000 claims description 2
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 claims description 2
- 229920002451 polyvinyl alcohol Polymers 0.000 claims description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 claims description 2
- 239000001267 polyvinylpyrrolidone Substances 0.000 claims description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 claims description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims 2
- 102100030552 Synaptosomal-associated protein 25 Human genes 0.000 claims 2
- 108040000979 soluble NSF attachment protein activity proteins Proteins 0.000 claims 2
- 241000010804 Caulobacter vibrioides Species 0.000 claims 1
- 241000084322 Notoscopelus elongatus Species 0.000 claims 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims 1
- 241000118519 Tenuidactylus elongatus Species 0.000 claims 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 claims 1
- 230000000415 inactivating effect Effects 0.000 claims 1
- 230000004927 fusion Effects 0.000 abstract description 46
- 235000001014 amino acid Nutrition 0.000 description 664
- 235000018102 proteins Nutrition 0.000 description 187
- 125000003275 alpha amino acid group Chemical group 0.000 description 174
- 239000011230 binding agent Substances 0.000 description 67
- 238000002474 experimental method Methods 0.000 description 65
- 108090001008 Avidin Proteins 0.000 description 55
- 108091034117 Oligonucleotide Proteins 0.000 description 39
- 230000000694 effects Effects 0.000 description 38
- 239000000523 sample Substances 0.000 description 35
- 239000000412 dendrimer Substances 0.000 description 30
- 229920000736 dendritic polymer Polymers 0.000 description 29
- 238000004020 luminiscence type Methods 0.000 description 27
- 239000002773 nucleotide Substances 0.000 description 23
- 125000003729 nucleotide group Chemical group 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 22
- 238000003556 assay Methods 0.000 description 22
- 239000000975 dye Substances 0.000 description 22
- 230000008569 process Effects 0.000 description 20
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 16
- 229960004452 methionine Drugs 0.000 description 15
- 229920005862 polyol Polymers 0.000 description 15
- 238000001327 Förster resonance energy transfer Methods 0.000 description 14
- 238000013459 approach Methods 0.000 description 14
- 210000004899 c-terminal region Anatomy 0.000 description 14
- 125000002843 carboxylic acid group Chemical group 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 230000000903 blocking effect Effects 0.000 description 12
- 239000000863 peptide conjugate Substances 0.000 description 12
- QKFJKGMPGYROCL-UHFFFAOYSA-N phenyl isothiocyanate Chemical compound S=C=NC1=CC=CC=C1 QKFJKGMPGYROCL-UHFFFAOYSA-N 0.000 description 12
- 239000000126 substance Substances 0.000 description 12
- 230000008859 change Effects 0.000 description 11
- 108091023037 Aptamer Proteins 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 10
- 230000004481 post-translational protein modification Effects 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 9
- 239000004365 Protease Substances 0.000 description 9
- 238000009396 hybridization Methods 0.000 description 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 8
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 8
- 108010090804 Streptavidin Proteins 0.000 description 8
- 238000007792 addition Methods 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 229960003136 leucine Drugs 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 230000001351 cycling effect Effects 0.000 description 7
- 235000018417 cysteine Nutrition 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- 102000005593 Endopeptidases Human genes 0.000 description 6
- 108010059378 Endopeptidases Proteins 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 6
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 6
- 239000004472 Lysine Substances 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 229960002433 cysteine Drugs 0.000 description 6
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 235000018977 lysine Nutrition 0.000 description 6
- 229960003646 lysine Drugs 0.000 description 6
- 108091008104 nucleic acid aptamers Proteins 0.000 description 6
- 229960005190 phenylalanine Drugs 0.000 description 6
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 6
- 235000008729 phenylalanine Nutrition 0.000 description 6
- 229940117953 phenylisothiocyanate Drugs 0.000 description 6
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 5
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000000562 conjugate Substances 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 230000009149 molecular binding Effects 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 229960002429 proline Drugs 0.000 description 5
- 235000013930 proline Nutrition 0.000 description 5
- 235000019419 proteases Nutrition 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 230000003381 solubilizing effect Effects 0.000 description 5
- 125000003396 thiol group Chemical group [H]S* 0.000 description 5
- 229910052720 vanadium Inorganic materials 0.000 description 5
- 102000005927 Cysteine Proteases Human genes 0.000 description 4
- 108010005843 Cysteine Proteases Proteins 0.000 description 4
- 102100028650 Glucose-induced degradation protein 4 homolog Human genes 0.000 description 4
- 101001058369 Homo sapiens Glucose-induced degradation protein 4 homolog Proteins 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 230000001268 conjugating effect Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- 235000004554 glutamine Nutrition 0.000 description 4
- 229960002743 glutamine Drugs 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 229960004799 tryptophan Drugs 0.000 description 4
- 235000002374 tyrosine Nutrition 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 229960004441 tyrosine Drugs 0.000 description 4
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ZKZBPNGNEQAJSX-REOHCLBHSA-N L-selenocysteine Chemical compound [SeH]C[C@H](N)C(O)=O ZKZBPNGNEQAJSX-REOHCLBHSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 229960003767 alanine Drugs 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 125000001931 aliphatic group Chemical group 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 229960003121 arginine Drugs 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960005261 aspartic acid Drugs 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 239000006172 buffering agent Substances 0.000 description 3
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 3
- 150000001768 cations Chemical class 0.000 description 3
- 150000001944 cysteine derivatives Chemical class 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 229960002449 glycine Drugs 0.000 description 3
- 229960002885 histidine Drugs 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 235000014304 histidine Nutrition 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 150000002540 isothiocyanates Chemical class 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000008832 photodamage Effects 0.000 description 3
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000003642 reactive oxygen metabolite Substances 0.000 description 3
- 229940055619 selenocysteine Drugs 0.000 description 3
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 3
- 235000016491 selenocysteine Nutrition 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 229960002898 threonine Drugs 0.000 description 3
- 235000008521 threonine Nutrition 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 229960004295 valine Drugs 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- LMDZBCPBFSXMTL-UHFFFAOYSA-N 1-ethyl-3-(3-dimethylaminopropyl)carbodiimide Chemical compound CCN=C=NCCCN(C)C LMDZBCPBFSXMTL-UHFFFAOYSA-N 0.000 description 2
- FVKRBXYHROENKF-UHFFFAOYSA-N 2,3,5,6-tetrafluoro-4-hydroxybenzenesulfonic acid Chemical compound OC1=C(F)C(F)=C(S(O)(=O)=O)C(F)=C1F FVKRBXYHROENKF-UHFFFAOYSA-N 0.000 description 2
- PBVAJRFEEOIAGW-UHFFFAOYSA-N 3-[bis(2-carboxyethyl)phosphanyl]propanoic acid;hydrochloride Chemical compound Cl.OC(=O)CCP(CCC(O)=O)CCC(O)=O PBVAJRFEEOIAGW-UHFFFAOYSA-N 0.000 description 2
- 230000005730 ADP ribosylation Effects 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 101100111638 Arabidopsis thaliana BIR2 gene Proteins 0.000 description 2
- 108090000444 Arsenate reductases Proteins 0.000 description 2
- 102000005701 Calcium-Binding Proteins Human genes 0.000 description 2
- 108010045403 Calcium-Binding Proteins Proteins 0.000 description 2
- 102000011727 Caspases Human genes 0.000 description 2
- 108010076667 Caspases Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108010016626 Dipeptides Proteins 0.000 description 2
- 102000003779 Dipeptidyl-peptidases and tripeptidyl-peptidases Human genes 0.000 description 2
- 108090000194 Dipeptidyl-peptidases and tripeptidyl-peptidases Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 230000004988 N-glycosylation Effects 0.000 description 2
- 230000004989 O-glycosylation Effects 0.000 description 2
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 2
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 2
- 230000006295 S-nitrosylation Effects 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- 241001453296 Synechococcus elongatus Species 0.000 description 2
- UWHCKJMYHZGTIT-UHFFFAOYSA-N Tetraethylene glycol, Natural products OCCOCCOCCOCCO UWHCKJMYHZGTIT-UHFFFAOYSA-N 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 241000223109 Trypanosoma cruzi Species 0.000 description 2
- 102000003441 UBR1 Human genes 0.000 description 2
- 101150118716 UBR1 gene Proteins 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 230000002152 alkylating effect Effects 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- PFKFTWBEEFSNDU-UHFFFAOYSA-N carbonyldiimidazole Chemical compound C1=CN=CN1C(=O)N1C=CN=C1 PFKFTWBEEFSNDU-UHFFFAOYSA-N 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 230000006329 citrullination Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 230000006862 enzymatic digestion Effects 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 230000022244 formylation Effects 0.000 description 2
- 238000006170 formylation reaction Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000033444 hydroxylation Effects 0.000 description 2
- 238000005805 hydroxylation reaction Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000012933 kinetic analysis Methods 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 230000007498 myristoylation Effects 0.000 description 2
- 230000009527 neddylation Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000006396 nitration reaction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 230000026792 palmitoylation Effects 0.000 description 2
- 230000006320 pegylation Effects 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 2
- 230000010287 polarization Effects 0.000 description 2
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 2
- 229920000962 poly(amidoamine) Polymers 0.000 description 2
- 229920000333 poly(propyleneimine) Polymers 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 230000013823 prenylation Effects 0.000 description 2
- 238000000575 proteomic method Methods 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 229960001153 serine Drugs 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 230000019635 sulfation Effects 0.000 description 2
- 238000005670 sulfation reaction Methods 0.000 description 2
- 230000010741 sumoylation Effects 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 108010081020 traptavidin Proteins 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 230000034512 ubiquitination Effects 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- MAYFFZZPEREGBQ-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 3-[2-[2-(2-methoxyethoxy)ethoxy]ethoxy]propanoate Chemical compound COCCOCCOCCOCCC(=O)ON1C(=O)CCC1=O MAYFFZZPEREGBQ-UHFFFAOYSA-N 0.000 description 1
- VGLCUHJZKWYDPC-BYPYZUCNSA-N (2s)-2-aminobutane-1,4-dithiol Chemical compound SC[C@@H](N)CCS VGLCUHJZKWYDPC-BYPYZUCNSA-N 0.000 description 1
- KJUGUADJHNHALS-UHFFFAOYSA-N 1H-tetrazole Substances C=1N=NNN=1 KJUGUADJHNHALS-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- TUMCWFMHZOUPDA-UHFFFAOYSA-N 2-ethylsulfanyl-1,3-benzothiazol-6-amine Chemical compound C1=C(N)C=C2SC(SCC)=NC2=C1 TUMCWFMHZOUPDA-UHFFFAOYSA-N 0.000 description 1
- NZGSNQJCTOMELT-UHFFFAOYSA-N 3,5-dimethylorsellinic acid Chemical compound CC1=C(C)C(C(O)=O)=C(O)C(C)=C1O NZGSNQJCTOMELT-UHFFFAOYSA-N 0.000 description 1
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 1
- 125000004042 4-aminobutyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])N([H])[H] 0.000 description 1
- KFDVPJUYSDEJTH-UHFFFAOYSA-N 4-ethenylpyridine Chemical compound C=CC1=CC=NC=C1 KFDVPJUYSDEJTH-UHFFFAOYSA-N 0.000 description 1
- WOJKKJKETHYEAC-UHFFFAOYSA-N 6-Maleimidocaproic acid Chemical compound OC(=O)CCCCCN1C(=O)C=CC1=O WOJKKJKETHYEAC-UHFFFAOYSA-N 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- 101800000263 Acidic protein Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 108010073254 Colicins Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 108091008102 DNA aptamers Proteins 0.000 description 1
- YXHKONLOYHBTNS-UHFFFAOYSA-N Diazomethane Chemical compound C=[N+]=[N-] YXHKONLOYHBTNS-UHFFFAOYSA-N 0.000 description 1
- 102000004860 Dipeptidases Human genes 0.000 description 1
- 108090001081 Dipeptidases Proteins 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 102100037240 E3 ubiquitin-protein ligase UBR2 Human genes 0.000 description 1
- 101710194146 Ecotin Proteins 0.000 description 1
- 241000701832 Enterobacteria phage T3 Species 0.000 description 1
- 101100514572 Escherichia coli (strain K12) msyB gene Proteins 0.000 description 1
- 101900315936 Escherichia coli Leucyl/phenylalanyl-tRNA-protein transferase Proteins 0.000 description 1
- 102100039466 Eukaryotic translation initiation factor 5B Human genes 0.000 description 1
- 241000242711 Fasciola hepatica Species 0.000 description 1
- 238000007309 Fischer-Speier esterification reaction Methods 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102100028085 Glycylpeptide N-tetradecanoyltransferase 1 Human genes 0.000 description 1
- 108091064358 Holliday junction Proteins 0.000 description 1
- 102000039011 Holliday junction Human genes 0.000 description 1
- 101001036496 Homo sapiens Eukaryotic translation initiation factor 5B Proteins 0.000 description 1
- 101000578329 Homo sapiens Glycylpeptide N-tetradecanoyltransferase 1 Proteins 0.000 description 1
- 101100262631 Homo sapiens UBR1 gene Proteins 0.000 description 1
- 101100262636 Homo sapiens UBR2 gene Proteins 0.000 description 1
- 125000002059 L-arginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C([H])([H])N([H])C(=N[H])N([H])[H] 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- ZFOMKMMPBOQKMC-KXUCPTDWSA-N L-pyrrolysine Chemical compound C[C@@H]1CC=N[C@H]1C(=O)NCCCC[C@H]([NH3+])C([O-])=O ZFOMKMMPBOQKMC-KXUCPTDWSA-N 0.000 description 1
- 241000222732 Leishmania major Species 0.000 description 1
- 101710186554 Leucyl/phenylalanyl-tRNA-protein transferase Proteins 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 1
- HDFGOPSGAURCEO-UHFFFAOYSA-N N-ethylmaleimide Chemical compound CCN1C(=O)C=CC1=O HDFGOPSGAURCEO-UHFFFAOYSA-N 0.000 description 1
- 101100091878 Plasmodium falciparum (isolate 3D7) rpoC2 gene Proteins 0.000 description 1
- 239000004721 Polyphenylene oxide Substances 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000522615 Pyrococcus horikoshii Species 0.000 description 1
- 101000889901 Pyrococcus horikoshii (strain ATCC 700860 / DSM 12428 / JCM 9974 / NBRC 100139 / OT-3) Tetrahedral aminopeptidase Proteins 0.000 description 1
- 101800001693 R-peptide Proteins 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101000733770 Schizosaccharomyces pombe (strain 972 / ATCC 24843) Aminopeptidase 1 Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 241001313699 Thermosynechococcus elongatus Species 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- GLEVLJDDWXEYCO-UHFFFAOYSA-N Trolox Chemical compound O1C(C)(C(O)=O)CCC2=C1C(C)=C(C)C(O)=C2C GLEVLJDDWXEYCO-UHFFFAOYSA-N 0.000 description 1
- 229940122618 Trypsin inhibitor Drugs 0.000 description 1
- 101710162629 Trypsin inhibitor Proteins 0.000 description 1
- 101150056689 UBR2 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000607269 Vibrio proteolyticus Species 0.000 description 1
- 101900268431 Vibrio vulnificus Aspartate/glutamate leucyltransferase Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 159000000021 acetate salts Chemical class 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 230000002862 amidating effect Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 229960004405 aprotinin Drugs 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108700021042 biotin binding protein Proteins 0.000 description 1
- 102000043871 biotin binding protein Human genes 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 150000001718 carbodiimides Chemical class 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000004182 chemical digestion Methods 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000012650 click reaction Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 150000001925 cycloalkenes Chemical class 0.000 description 1
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 229940066758 endopeptidases Drugs 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002875 fluorescence polarization Methods 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 102000050966 human UBR1 Human genes 0.000 description 1
- 102000050817 human UBR2 Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- JDNTWHVOXJZDSN-UHFFFAOYSA-N iodoacetic acid Chemical compound OC(=O)CI JDNTWHVOXJZDSN-UHFFFAOYSA-N 0.000 description 1
- 108010050638 leucyltransferase Proteins 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 125000001151 peptidyl group Chemical group 0.000 description 1
- 108700010839 phage proteins Proteins 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920005906 polyester polyol Polymers 0.000 description 1
- 229920000570 polyether Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229940068977 polysorbate 20 Drugs 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 159000000001 potassium salts Chemical class 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- KCXFHTAICRTXLI-UHFFFAOYSA-N propane-1-sulfonic acid Chemical compound CCCS(O)(=O)=O KCXFHTAICRTXLI-UHFFFAOYSA-N 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 150000003214 pyranose derivatives Chemical class 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 150000003254 radicals Chemical class 0.000 description 1
- 230000006950 reactive oxygen species formation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 101150029016 rpo3 gene Proteins 0.000 description 1
- 101150102864 rpoD gene Proteins 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
- 101150117326 sigA gene Proteins 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000008137 solubility enhancer Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 102000009076 src-Family Kinases Human genes 0.000 description 1
- 108010087686 src-Family Kinases Proteins 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000011191 terminal modification Methods 0.000 description 1
- 150000004905 tetrazines Chemical class 0.000 description 1
- 150000003536 tetrazoles Chemical class 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- TUQOTMZNTHZOKS-UHFFFAOYSA-N tributylphosphine Chemical compound CCCCP(CCCC)CCCC TUQOTMZNTHZOKS-UHFFFAOYSA-N 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 125000005500 uronium group Chemical group 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6818—Sequencing of polypeptides
- G01N33/6824—Sequencing of polypeptides involving N-terminal degradation, e.g. Edman degradation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/485—Exopeptidases (3.4.11-3.4.19)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/11—Aminopeptidases (3.4.11)
- C12Y304/11005—Prolyl aminopeptidase (3.4.11.5)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/58—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
- G01N33/582—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/001—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
- C07K14/003—Peptide-nucleic acids (PNAs)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6818—Sequencing of polypeptides
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Hematology (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Urology & Nephrology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Food Science & Technology (AREA)
- Analytical Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Enzymes And Modification Thereof (AREA)
- Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
Abstract
本願の態様は、タンパク質、ポリペプチド、及びアミノ酸を同定及びシーケンスする方法、並びにそれらに有用な組成物を提供する。いくつかの態様では、本願は、アミノ酸結合タンパク質及びそれらの融合ポリペプチドなどのアミノ酸認識分子を提供する。いくつかの態様では、本願は、ポリペプチドシーケンシング反応時の光安定性を増強するシールディングエレメントを含むアミノ酸認識分子を提供する。
Description
プロテオミクスは、生物学的系の研究においてゲノミクス及びトランスクリプトミクスに対する重要且つ必要な補完物として現われた。個別生物のプロテオミック解析は、改善された診断及び療法ストラテジーをもたらす細胞プロセス及び反応パターンについての洞察を提供可能である。タンパク質構造、組成、及び修飾を取り巻く複雑性は、生物学的サンプルに対する大規模タンパク質シーケンシング情報を決定するうえで課題を呈する。
いくつかの態様では、本願は、ポリペプチドからアミノ酸配列情報を決定するための(たとえば、1つ以上のポリペプチドをシーケンスするための)方法及び組成物を提供する。いくつかの実施形態では、アミノ酸配列情報は、単一ポリペプチド分子に対して決定可能である。いくつかの実施形態では、たとえば、単一ポリペプチド分子に対して、ポリペプチドの2つ以上のアミノ酸の相対位置が決定される。いくつかの実施形態では、ポリペプチドの1つ以上のアミノ酸が標識されて(たとえば、直接的又は間接的に)、ポリペプチドの標識付アミノ酸の相対位置が決定される。いくつかの実施形態では、アミノ酸配列情報は、ポリペプチドと1つ以上のアミノ酸認識分子(たとえば、1つ以上のアミノ酸結合タンパク質)との相互作用を検出することによって、決定されうる。
いくつかの態様では、本願は、ポリペプチドからアミノ酸配列情報を決定するための方法において使用されうるアミノ酸結合タンパク質を提供する。いくつかの態様では、本願は、表1又は表2から選択された配列に少なくとも80%同一のアミノ酸配列を有するとともに1つ以上の標識を含む、組換えアミノ酸結合タンパク質を提供する。いくつかの態様では、1つ以上の標識は、発光標識又は伝導率標識を含む。いくつかの実施形態では、1つ以上標識は、タグ配列を含む。いくつかの実施形態では、タグ配列は、精製タグ、切断部位、及びビオチン化配列のうちの1つ以上を含む(たとえば、少なくとも1つのビオチンリガーゼ認識配列)。いくつかの実施形態では、ビオチン化配列は、直列に配向された2つのビオチンリガーゼ認識配列を含む。いくつかの実施形態では、1つ以上標識は、少なくとも1つのビオチン分子を有するビオチン部分を含む(たとえば、ビスビオチン部分)。いくつかの実施形態では、標識は、少なくとも1つのビオチン分子が装着された少なくとも1つのビオチンリガーゼ認識配列を含む。いくつかの実施形態では、1つ以上の標識は、1つ以上のポリオール部分を含む(たとえば、ポリエチレングリコール)。いくつかの実施形態では、組換えアミノ酸結合タンパク質は、1つ以上の標識が装着された1つ以上の非天然アミノ酸を含む。いくつかの態様では、本願は、本明細書に記載の組換えアミノ酸結合タンパク質を含む組成物を提供する。
いくつかの態様では、本願は、2つ以上のアミノ酸認識分子を含むポリペプチドシーケンシング反応組成物であって、2つ以上のアミノ酸認識分子のうちの少なくとも1つは、本明細書に記載の組換えアミノ酸結合タンパク質である、ポリペプチドシーケンシング反応組成物を提供する。いくつかの実施形態では、2つ以上のアミノ酸認識分子は、互いに異なるタイプのアミノ酸認識分子を含む。たとえば、いくつかの実施形態では、1タイプのアミノ酸認識分子は、ポリペプチドシーケンシング反応組成物中の他のタイプのアミノ酸認識分子とは異なる(たとえば、検出できるほどに異なる)方法で対象ポリペプチドと相互作用する。いくつかの実施形態では、ポリペプチドシーケンシング反応組成物は、少なくとも1タイプの切断試薬を含む。いくつかの態様では、本願は、ポリペプチドと本明細書に記載のポリペプチドシーケンシング反応組成物とを接触させることを含む、ポリペプチドシーケンシングの方法を提供する。いくつかの実施形態では、方法は、ポリペプチドが分解されつつある間にポリペプチドと少なくとも1つのアミノ酸認識分子との一連の相互作用を検出することによってポリペプチドをシーケンシングすることをさらに含む。
いくつかの態様では、本願は、アミノ酸結合タンパク質及びペプチダーゼを含むポリペプチドシーケンシング反応混合物を提供する。いくつかの実施形態では、標識付アミノ酸結合タンパク質とペプチダーゼとのモル比は、約1:1,000~約1:1又は約1:1~約100:1である。いくつかの実施形態では、アミノ酸結合タンパク質は、1つ以上の標識を含む。いくつかの実施形態では、アミノ酸結合タンパク質は、ClpSタンパク質である。いくつかの実施形態では、アミノ酸結合タンパク質は、表1又は表2から選択された配列に少なくとも80%、80~90%、90~95%、又は少なくとも95%同一のアミノ酸配列を有するタンパク質である。いくつかの実施形態では、ペプチダーゼは、エキソペプチダーゼである。いくつかの実施形態では、ペプチダーゼは、表4又は表5から選択された配列に少なくとも80%、80~90%、90~95%、又は少なくとも95%同一のアミノ酸配列を有する酵素である。いくつかの実施形態では、反応混合物は、1つ以上のアミノ酸結合タンパク質及び/又は1つ以上のペプチダーゼを含む。いくつかの実施形態では、反応混合物は、表面に固定されたペプチド分子を含む。
いくつかの態様では、本願は、単一ペプチド分子、少なくとも1つのペプチダーゼ分子、及び少なくとも3つのアミノ酸認識分子を含む、ポリペプチドシーケンシング反応混合物を提供する。いくつかの実施形態では、反応混合物は、少なくとも1且つ10までのペプチダーゼ分子(たとえば、少なくとも1つ且つ5つまでのペプチダーゼ分子、少なくとも1つ且つ3つまでのペプチダーゼ分子)を含む。いくつかの実施形態では、反応組成物は、2つ以上のペプチダーゼ分子を含み、各ペプチダーゼ分子は、互いに異なるタイプである。たとえば、いくつかの実施形態では、1タイプのペプチダーゼ分子は、反応混合物中の他のタイプのペプチダーゼ分子のとは異なる切断優先度を有する。いくつかの実施形態では、反応混合物は、少なくとも3つ且つ30までのアミノ酸認識分子を含む(たとえば、20まで、10まで、又は5つまでのアミノ酸認識分子)。いくつかの実施形態では、少なくとも3つのアミノ酸認識分子は、互いに異なるタイプのアミノ酸認識分子を含む。たとえば、いくつかの実施形態では、1タイプのアミノ酸認識分子は、反応混合物中の他のタイプのアミノ酸認識分子とは異なる(たとえば、検出できるほどに異なる)方法で対象ポリペプチドと相互作用する。
いくつかの態様では、本願は、サンプルウェルのアレイを含む基体であって、アレイの少なくとも1つのサンプルウェルは、本明細書に記載のポリペプチドシーケンシング反応混合物を含む、基体を提供する。いくつかの実施形態では、少なくとも1つのサンプルウェルは、ボトム表面を含む。いくつかの実施形態では、単一ポリペプチド分子は、ボトム表面に固定される。
いくつかの態様では、本願は、末端同士で連結した少なくとも第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質を有するポリペプチドを含むアミノ酸認識分子であって、第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質は、少なくとも2つのアミノ酸を含むリンカーによって分離されている、アミノ酸認識分子を提供する。いくつかの実施形態では、第1のアミノ酸結合タンパク質と第2のアミノ酸結合タンパク質とは、同じである。いくつかの実施形態では、第1のアミノ酸結合タンパク質と第2のアミノ酸結合タンパク質とは、互いに異なる。
いくつかの態様では、本願は、式(I):
(Z1-X1)n-Z2
(I)
(式中、Z1及びZ2は、独立したアミノ酸結合タンパク質であり、X1は、少なくとも2つのアミノ酸を含むリンカーであり、アミノ酸結合タンパク質はリンカーによって末端同士で結合されており、且つnは1~5(両端の値を含む)の整数である)
のポリペプチドを含むアミノ酸認識分子を提供する。いくつかの実施形態では、Z1及びZ2は、同じタイプのアミノ酸結合タンパク質を含む。いくつかの実施形態では、Z1及びZ2は、互いに異なるタイプのアミノ酸結合タンパク質を含む。いくつかの実施形態では、Z1及びZ2は、独立して任意選択で、少なくとも1つの検出可能標識を含む標識成分と関連する。いくつかの実施形態では、ポリペプチドは、タグ配列をさらに含む。
(Z1-X1)n-Z2
(I)
(式中、Z1及びZ2は、独立したアミノ酸結合タンパク質であり、X1は、少なくとも2つのアミノ酸を含むリンカーであり、アミノ酸結合タンパク質はリンカーによって末端同士で結合されており、且つnは1~5(両端の値を含む)の整数である)
のポリペプチドを含むアミノ酸認識分子を提供する。いくつかの実施形態では、Z1及びZ2は、同じタイプのアミノ酸結合タンパク質を含む。いくつかの実施形態では、Z1及びZ2は、互いに異なるタイプのアミノ酸結合タンパク質を含む。いくつかの実施形態では、Z1及びZ2は、独立して任意選択で、少なくとも1つの検出可能標識を含む標識成分と関連する。いくつかの実施形態では、ポリペプチドは、タグ配列をさらに含む。
いくつかの態様では、本願は、ポリペプチドシーケンシングの方法を提供する。いくつかの実施形態では、ポリペプチドシーケンシングの方法は、反応混合物中の単一ポリペプチド分子と結合手段及び切断手段を含む組成物とを接触させることを含む。いくつかの実施形態では、結合手段及び切断手段は、結合手段とポリペプチド上の末端アミノ酸との間の少なくとも10の会合イベントを、ペプチドから末端アミノ酸を切断手段によって除去する前に達成するように構成される。いくつかの実施形態では、結合手段及び切断手段は、少なくとも10且つ1,000までの会合イベントを、末端アミノ酸を除去する前に達成するように構成される。いくつかの実施形態では、末端アミノ酸は、少なくとも10の会合イベントの前の切断イベントにてポリペプチドの末端に露出された。いくつかの実施形態では、少なくとも10の会合イベントは、切断イベントの後に起こる。
いくつかの実施形態では、結合手段及び切断手段は、切断イベント間に少なくとも1分の時間インターバルを達成するように構成される(たとえば、約1分~約20分、約5分~約15分、又は約1分~約10分)。いくつかの実施形態では、結合手段は1つ以上のアミノ酸認識分子を含み、切断手段は1つ以上のペプチダーゼ分子を含む。いくつかの実施形態では、アミノ酸認識分子とペプチダーゼ分子とのモル比は、少なくとも10の会合イベントを、末端アミノ酸を除去する前に達成するように構成される。いくつかの実施形態では、アミノ酸認識分子とペプチダーゼ分子とのモル比は、約1:1,000~約1:1又は約1:1~約100:1である。いくつかの実施形態では、アミノ酸認識分子とペプチダーゼ分子とのモル比は、約1:100~約1:1又は約1:1~約10:1である。
いくつかの態様では、本願は、サンプルウェルのアレイを含む基体であって、アレイの少なくとも1つのサンプルウェルは、単一ポリペプチド分子、切断手段、及び結合手段を含む、基体を提供する。いくつかの実施形態では、結合手段及び切断手段は、結合手段とポリペプチド上の末端アミノ酸との間の少なくとも10の会合イベントを、ペプチドから末端アミノ酸を切断手段によって除去する前に達成するように構成される。いくつかの実施形態では、結合手段及び切断手段は、少なくとも10且つ1,000までの会合イベントを、末端アミノ酸を除去する前に達成するように構成される。いくつかの実施形態では、末端アミノ酸は、少なくとも10の会合イベントの前の切断イベントにてポリペプチドに末端に露出された。いくつかの実施形態では、少なくとも10の会合イベントは、切断イベントの後に起こる。
いくつかの態様では、本願は、たとえば、ポリペプチドシーケンシング反応時の光安定性増強のために、シールディング(shielding)エレメントを含むアミノ酸認識分子を提供する。いくつかの態様では、本願は、末端同士で連結したアミノ酸結合タンパク質及び標識付タンパク質を有するポリペプチドを含むアミノ酸認識分子を提供する。いくつかの実施形態では、アミノ酸結合タンパク質及び標識付タンパク質は、少なくとも2つのアミノ酸(たとえば、少なくとも2つ且つ100までのアミノ酸、約5つ~約50のアミノ酸)を含むリンカーによって分離されている。いくつかの実施形態では、標識付タンパク質は、少なくとも10kDa(たとえば、約10kDa~約150kDa、約15kDaから約100kDa)の分子量を有する。いくつかの実施形態では、標識付タンパク質は、少なくとも50のアミノ酸(たとえば、約50~約1,000のアミノ酸、約100から約750のアミノ酸)を含む。いくつかの実施形態では、標識付タンパク質は、発光標識を含む。いくつかの実施形態では、発光標識は、少なくとも1つのフルオロフォア色素分子を含む。いくつかの実施形態では、アミノ酸結合タンパク質は、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、p62タンパク質若しくはそのZZドメイン含有断片、又はClpSタンパク質である。いくつかの実施形態では、アミノ酸結合タンパク質は、表1又は表2から選択されたアミノ酸配列に対して少なくとも80%のアミノ酸配列同一性を有する。
いくつかの態様では、本願は、式(II):
A-(Y)n-D
(II)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり;nは、1~10(両端の値を含む)の整数であり;且つ、Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Aは、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する少なくとも1つのアミノ酸結合タンパク質を含む。いくつかの実施形態では、アミノ酸認識分子は、末端同士で連結したA及びY1を有するポリペプチドを含み、A及びY1は少なくとも2つのアミノ酸を含むリンカーによって分離されている。いくつかの実施形態では、Y1は、少なくとも10kDa(たとえば、約10kDa~約150kDa)の分子量を有するタンパク質である。いくつかの実施形態では、Y1は、少なくとも50のアミノ酸(たとえば、約50~約1,000のアミノ酸)を含むタンパク質である。
A-(Y)n-D
(II)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり;nは、1~10(両端の値を含む)の整数であり;且つ、Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Aは、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する少なくとも1つのアミノ酸結合タンパク質を含む。いくつかの実施形態では、アミノ酸認識分子は、末端同士で連結したA及びY1を有するポリペプチドを含み、A及びY1は少なくとも2つのアミノ酸を含むリンカーによって分離されている。いくつかの実施形態では、Y1は、少なくとも10kDa(たとえば、約10kDa~約150kDa)の分子量を有するタンパク質である。いくつかの実施形態では、Y1は、少なくとも50のアミノ酸(たとえば、約50~約1,000のアミノ酸)を含むタンパク質である。
いくつかの実施形態では、Dは20nm(200Å)未満の直径である。いくつかの実施形態では、-(Y)n-は、少なくとも2nmの長さ(たとえば、少なくとも5nm、少なくとも10nm、少なくとも20nm、少なくとも30nm、少なくとも50nm、又はそれ以上の長さ)である。いくつかの実施形態では、-(Y)n-は、約2nm~約200nmの長さ(たとえば、約2nm~約100nm、約5nm~約50nm、又は約10nm~約100nmの長さ)である。いくつかの実施形態では、Yの各々は、独立して、バイオ分子又はデンドリティックポリマー(たとえば、ポリオール、デンドリマー)である。いくつかの実施形態では、Aは、末端同士で連結した少なくとも第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質を有するポチペプチドを含む(たとえば、融合ポリペプチド)。いくつかの実施形態では、本願は、式(II)のアミノ酸認識分子を含む組成物を提供する。いくつかの実施形態では、アミノ酸認識分子は組成物に可溶である。
いくつかの態様では、本願は、式(III):
A-Y1-D
(III),
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Y1は、核酸又はポリペプチドであり;Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Aは、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する少なくとも1つのアミノ酸結合タンパク質を含む。いくつかの実施形態では、Y1が核酸であるとき、核酸は共有結合性又は非共有結合性連結基を形成する。いくつかの実施形態では、Y1がポリペプチドであるときならば、ポリペプチドは、50×10-9M未満の解離定数(KD)により特徴付けられる非共有結合性連結基を形成する。いくつかの実施形態では、KDは、1×10-9M未満、1×10-10M未満、1×10-11M未満、又は1×10-12M未満である。
A-Y1-D
(III),
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Y1は、核酸又はポリペプチドであり;Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Aは、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する少なくとも1つのアミノ酸結合タンパク質を含む。いくつかの実施形態では、Y1が核酸であるとき、核酸は共有結合性又は非共有結合性連結基を形成する。いくつかの実施形態では、Y1がポリペプチドであるときならば、ポリペプチドは、50×10-9M未満の解離定数(KD)により特徴付けられる非共有結合性連結基を形成する。いくつかの実施形態では、KDは、1×10-9M未満、1×10-10M未満、1×10-11M未満、又は1×10-12M未満である。
いくつかの態様では、本願は、核酸と、核酸上の第1の装着部位に装着された少なくとも1つのアミノ酸認識分子と、核酸上の第2の装着部位に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子であって、核酸が少なくとも1つのアミノ酸認識分子と少なくとも1つの検出可能標識との間に共有結合性又は非共有結合性連結基を形成する、アミノ酸認識分子を提供する。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖をさらに含む。いくつかの実施形態では、少なくとも1つのアミノ酸認識分子は、末端同士で連結した少なくとも第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質を有するポチペプチドを含む(たとえば、融合ポリペプチド)。いくつかの実施形態では、第1のアミノ酸結合タンパク質と第2のアミノ酸結合タンパク質は、少なくとも2つのアミノ酸を含むリンカーによって分離されている。
いくつかの態様では、本願は、少なくとも2つのリガンド結合部位を含む多価タンパク質と、タンパク質上の第1のリガンド結合部位に結合された第1のリガンド部分を介してタンパク質に装着された少なくとも1つのアミノ酸認識分子と、タンパク質上の第2のリガンド結合部位に結合された第2のリガンド部分を介してタンパク質に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子を提供する。いくつかの実施形態では、多価タンパク質はアビジンタンパク質である。いくつかの実施形態では、少なくとも1つのアミノ酸認識分子は、末端同士で連結した少なくとも第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質を有するポチペプチドを含む(たとえば、融合ポリペプチド)。いくつかの実施形態では、第1のアミノ酸結合タンパク質と第2のアミノ酸結合タンパク質は、少なくとも2つのアミノ酸を含むリンカーによって分離されている。
いくつかの実施形態では、シールドアミノ酸認識分子は、本願に係るポリペプチドシーケンシング方法又は当技術分野で公知のいずれかの方法で使用されうる。それゆえ、いくつかの態様では、本願は、ポリペプチド分子と本願の1つ以上のシールドアミノ酸認識分子とを接触させることを含むポリペプチドシーケンシング方法を提供する(たとえば、エドマン型分解反応で、動的シーケンシング反応で、又は当技術分野で公知の他の方法で)。たとえば、いくつかの実施形態では、本方法は、ポリペプチド分子と、本願に係るシールド又はシールディングエレメントを含む少なくとも1つのアミノ酸認識分子と、を接触させることと、少なくとも1つのアミノ酸認識分子とポリペプチド分子との会合を検出することと、を含む。
いくつかの態様では、本願は、ポリペプチドの分解プロセス時のデータを得ることを含む方法を提供する。いくつかの実施形態では、本方法は、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分を決定するようにデータを解析することをさらに含む。いくつかの実施形態では、本方法は、ポリペプチドに相当するアミノ酸配列を出力することをさらに含む。いくつかの実施形態では、データは、分解プロセス時のポリペプチドの末端のアミノ酸アイデンティティー(identity)の指標となる。いくつかの実施形態では、データは、分解プロセス時に末端の異なるタイプの末端アミノ酸に結合する1つ以上のアミノ酸認識分子により生成されるシグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する発光シグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する電気シグナルの指標となる。
いくつかの実施形態では、データを解析することは、一連の切断イベントを検出することと、逐次切断イベント間のデータの部分を決定することと、をさらに含む。いくつかの実施形態では、データを解析することは、個別部分の各々に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、個別部分の各々は、パルスパターン(たとえば特性パターン)を含み、且つデータを解析することは、そのそれぞれのパルスパターンに基づいて1つ以上の部分に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、データが閾値超であるときの部分内の時間量を同定することと、部分に対して時間量と持続時間とを比較することと、をさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス持続時間を同定することをさらに含む。いくつかの実施形態では、パルスパターンは、約1ミリ秒~約10秒の平均パルス持続時間を含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス間持続時間を同定することをさらに含む。いくつかの実施形態では、アミノ酸配列は、部分に対応する一連のアミノ酸を含む。
いくつかの態様では、本願は、単一ポリペプチド分子と1つ以上のアミノ酸認識分子(たとえば、一つ以上の末端アミノ酸認識分子)とを接触させることを含むポリペプチドシーケンシング方法を提供する。いくつかの実施形態では、方法は、1つ以上のアミノ酸認識分子と、単一ポリペプチドが分解されつつある間に単一ポリペプチド分子の末端に露出される逐次アミノ酸との会合の指標となる一連のシグナルパルスを検出することにより、単一ポリペプチド分子についての配列情報を得ることをさらに含む。いくつかの実施形態では、ほとんど又は全ての単一ポリペプチド分子のアミノ酸配列が、決定される。いくつかの実施形態では、一連のシグナルパルスは、一連のリアルタイムシグナルパルスである。
いくつかの実施形態では、1つ以上のアミノ酸認識分子と末端に露出される各タイプのアミノ酸との会合は、末端に露出される他のタイプのアミノ酸とは異なる一連のシグナルパルスの特性パターンを生成する。いくつかの実施形態では、特性パルスのシグナルパルスは、約1ミリ秒~約10秒の平均パルス持続時間を含む。いくつかの実施形態では、特性パターンのシグナルパルスは、アミノ酸認識分子と末端に露出されるアミノ酸との間の個別会合イベントに対応する。いくつかの実施形態では、特性パターンは、単一ポリペプチドの末端に露出されるアミノ酸との一連の可逆アミノ酸認識分子結合相互作用に対応する。いくつかの実施形態では、特性パターンは、単一ポリペプチド分子の末端に露出されるアミノ酸及び連続位置のアミノ酸(たとえば、同じタイプ又は互いに異なるタイプのアミノ酸)の指標となる。
いくつかの実施形態では、単一ポリペプチド分子は、単一ポリペプチド分子の末端から少なくとも1つのアミノ酸を除去する切断試薬によって分解される。いくつかの実施形態では、方法は、切断試薬と末端との会合の指標となるシグナルを検出することをさらに含む。いくつかの実施形態では、切断試薬は、検出可能標識を含む(たとえば、発光標識、伝導率標識)。いくつかの実施形態では、単一ポリペプチド分子は、表面に固定される。いくつかの実施形態では、単一ポリペプチド分子は、1つ以上のアミノ酸認識分子が会合する末端から遠位の末端を介して表面に固定される。いくつかの実施形態では、単一ポリペプチド分子は、リンカー(たとえば、バイオ分子を含む可溶化性リンカー)を介して表面に固定される。
いくつかの態様では、本願は、反応混合物中の単一ポリペプチド分子と1つ以上のアミノ酸認識分子(たとえば、一つ以上の末端アミノ酸認識分子)及び切断試薬を含む組成物とを接触させることを含む、ポリペプチドをシーケンシングする方法を提供する。いくつかの実施形態では、方法は、切断試薬存在下で1つ以上のアミノ酸認識分子と単一ポリペプチド分子の末端との会合の指標となる一連のシグナルパルスを検出することをさらに含む。いくつかの実施形態では、一連のシグナルパルスは、切断試薬による末端アミノ酸切断の結果として、経時的に末端に露出されるの一連のアミノ酸の指標である。
いくつかの態様では、本願は、(a)単一ポリペプチド分子の末端の第1のアミノ酸を同定することと、(b)第1のアミノ酸を除去して単一ポリペプチド分子の末端の第2のアミノ酸を露出させることと、(c)単一ポリペプチド分子の末端の第2のアミノ酸を同定することと、を含む、ポリペプチドをシーケンシングする方法を提供する。いくつかの実施形態では、(a)~(c)は、単一反応混合物中で実施される。いくつかの実施形態では、(a)~(c)は、連続して起こる。いくつかの実施形態では、(c)は、(a)及び(b)の前に起こる。いくつかの実施形態では、単一反応混合物は、1つ以上のアミノ酸認識分子を含む(たとえば、1つ以上の末端アミノ酸認識分子)。いくつかの実施形態では、単一反応混合物は、切断試薬を含む。いくつかの実施形態では、第1のアミノ酸は、切断試薬によって除去される。いくつかの実施形態では、方法は、単一ポリペプチド分子の末端の1つ以上のアミノ酸を除去及び同定する工程を繰り返すことによって、単一ポリペプチド分子の配列(たとえば、部分配列又は完全配列)を同定することをさらに含む。
いくつかの態様では、本願は、単一ポリペプチド分子と単一ポリペプチド分子に結合する1つ以上のアミノ酸認識分子とを接触させることを含む、ポリペプチドのアミノ酸を同定する方法を提供する。いくつかの実施形態では、方法は、1つ以上のアミノ酸認識分子と単一ポリペプチド分子とのポリペプチド分解条件下での会合の指標となる一連のシグナルパルスを検出することをさらに含む。いくつかの実施形態では、方法は、一連のシグナルパルスの第1の特性パターンに基づいて単一ポリペプチド分子の第1のタイプのアミノ酸を同定することをさらに含む。いくつかの実施形態では、特性パルスのシグナルパルスは、約1ミリ秒~約10秒の平均パルス持続時間を含む。
いくつかの態様では、本願は、ポリペプチドの末端アミノ酸(たとえば、N末端又はC末端のアミノ酸)を同定する方法を提供する。いくつかの実施形態では、方法は、ポリペプチドと1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識付認識分子とをポリペプチドの末端で接触させることを含む。いくつかの実施形態では、方法は、ポリペプチドと、1つ以上の標識付認識分子との相互作用を検出することによって、ポリペプチドの末端の末端アミノ酸を同定することをさらに含む。
さらに他の態様では、本願は、エドマン型分解反応によるポリペプチドシーケンスの方法を提供する。いくつかの実施形態では、エドマン型分解反応は、ポリペプチドと様々な反応混合物とを検出又は切断のいずれかの目的で接触させることによって実施されうる(たとえば、単一反応混合物を使用して検出及び切断を含みうる動的シーケンシング反応と比較して)。
それゆえ、いくつかの態様では、本願は、(i)ポリペプチドと、ポリペプチドの末端の1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識付認識分子とを接触させることを含む、ポリペプチドのアミノ酸配列を決定する方法を提供する。いくつかの実施形態では、方法は、(ii)ポリペプチドと1つ以上の標識付認識分子との相互作用を検出することによって、ポリペプチドの末端の末端アミノ酸(たとえば、N末端又はC末端のアミノ酸)を同定することをさらに含む。いくつかの実施形態では、方法は、(iii)末端アミノ酸を除去することをさらに含む。いくつかの実施形態では、方法は、(iv)ポリペプチドの末端で(i)~(iii)を1回以上繰り返してポリペプチドのアミノ酸配列を決定することをさらに含む。
いくつかの実施形態では、方法は、(i)の後且つ(ii)の前に、末端アミノ酸に選択的に結合しない1つ以上の標識付認識分子のいずれも除去することを含む。いくつかの実施形態では、方法は、(ii)の後且つ(iii)の前に、末端アミノ酸に選択的に結合する1つ以上の標識付認識分子のいずれも除去することを含む。
いくつかの実施形態では、末端アミノ酸を除去すること(たとえば、(iii))は、末端アミノ酸とイソチオシアネート(たとえば、フェニルイソチアシアネート)とを接触させることによって末端アミノ酸を修飾すること、及び修飾末端アミノ酸と修飾末端アミノ酸を特異的に結合及び除去するプロテアーゼとを接触させることを含む。いくつかの実施形態では、末端アミノ酸を切断すること(たとえば、(iii))は、末端アミノ酸とイソチオシアネートとを接触させることによって末端アミノ酸を修飾すること、及び修飾末端アミノ酸を、修飾末端アミノ酸を除去するのに十分な酸性条件又は塩基性条件にさらすことを含む。
いくつかの実施形態では、末端アミノ酸を同定することは、1つ以上の標識付認識分子が結合する1タイプ以上の末端アミノ酸のうちの1タイプとして末端アミノ酸を同定することを含む。いくつかの実施形態では、末端アミノ酸を同定することは、1つ以上の標識付認識分子が結合する1タイプ以上の末端アミノ酸以外のタイプとして末端アミノ酸を同定することを含む。
いくつかの態様では、本願は、混合サンプル中の対象タンパク質の同定方法を提供する。いくつかの実施形態では、本方法は、混合タンパク質サンプルを切断して複数のポリペプチド断片を生成することを含む。いくつかの実施形態では、本方法は、本願の方法に係る方法で複数のポリペプチド断片の少なくとも1つのアミノ酸配列を決定することをさらに含む。いくつかの実施形態では、本方法は、アミノ酸配列が対象タンパク質にユニークに同定可能である場合に混合サンプル中の対象タンパク質を同定することをさらに含む。
いくつかの実施形態では、混合サンプル中の対象タンパク質の同定方法は、混合タンパク質サンプルを切断して複数のポリペプチド断片を生成することを含む。いくつかの実施形態では、本方法は、複数のポリペプチド断片中の1タイプ以上のアミノ酸を1つ以上の異なる発光標識で標識することをさらに含む。いくつかの実施形態では、本方法は、複数の標識付ポリペプチドの少なくとも1つについて経時的に発光を測定することをさらに含む。いくつかの実施形態では、本方法は、検出された発光に基づいて少なくとも1つの標識付ポリペプチドのアミノ酸配列を決定することをさらに含む。いくつかの実施形態では、本方法は、アミノ酸配列が対象タンパク質にユニークに同定可能である場合に混合サンプル中の対象タンパク質を同定することをさらに含む。
それゆえ、いくつかの実施形態では、本願に係る分析される対象ポリペプチド分子又はタンパク質は、混合又は精製サンプルでありうる。いくつかの実施形態では、対象ポリペプチド分子又はタンパク質は、生物学的サンプル(たとえば、血液、組織、唾液、尿、又は他の生物源)から得られる。いくつかの実施形態では、対象ポリペプチド分子又はタンパク質は、患者サンプル(たとえばヒトサンプル)から得られる。
いくつかの態様では、本願は、少なくとも1つのハードウェアプロセッサーと、少なくとも1つのハードウェアプロセッサーによって実行されるときに少なくとも1つのハードウェアプロセッサーに明細書に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、を含むシステムを提供する。いくつかの態様では、本願は、少なくとも1つのハードウェアプロセッサーによって実行されるときに少なくとも1つのハードウェアプロセッサーに明細書に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体を提供する。
本発明のある特定の実施形態の詳細は、以下に記載のある特定の実施形態の詳細な説明に示される。本発明の他の特徴、目的、及び利点は、実施例、図面、及び特許請求の範囲から明らかになるであろう。
本明細書の一部を構成する添付の図面は、本発明のいくつかの実施形態を示し、説明とともに、本発明の原理を説明するのに役立つ。
単一分子結合相互作用の検出(図1A)及び解析(図1B)によるポリペプチドシーケンシングの例を示す。
単一分子結合相互作用の検出(図1A)及び解析(図1B)によるポリペプチドシーケンシングの例を示す。
1タイプ以上の末端アミノ酸に選択的に結合する標識付酵素及び標識付アプタマーをはじめとする標識付認識分子の構成例を描く。
シールディングエレメントを介して標識されたアミノ酸認識分子の非限定的例を示す。図3Aは、従来の共有結合性連結を介して標識された認識分子による単一分子ペプチドシーケンシングを例示する。
シールディングエレメントを介して標識されたアミノ酸認識分子の非限定的例を示す。図3Bは、シールディングエレメントを含む認識分子による単一分子ペプチドシーケンシングを例示する。
シールディングエレメントを介して標識されたアミノ酸認識分子の非限定的例を示す。図3C~3Eは、本願に係るシールディングエレメントの各種例を例示する。
シールディングエレメントを介して標識されたアミノ酸認識分子の非限定的例を示す。図3C~3Eは、本願に係るシールディングエレメントの各種例を例示する。
シールディングエレメントを介して標識されたアミノ酸認識分子の非限定的例を示す。図3C~3Eは、本願に係るシールディングエレメントの各種例を例示する。
標識付認識分子を用いたポリペプチドシーケンシングの分解ベースプロセスを一般的に描く。
末端及び/又は内部アミノ酸と標識付認識分子及び標識付切断試薬(たとえば標識付非特異的エキソペプチダーゼ)との結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシングの例を示す。図5は、シグナル出力で一連のパルスを検出することによるリアルタイムシーケンシングの例を示す。
末端及び/又は内部アミノ酸と標識付認識分子及び標識付切断試薬(たとえば標識付非特異的エキソペプチダーゼ)との結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシングの例を示す。図6は、温度依存シーケンシングプロセスを模式的に描く。
末端及び/又は内部アミノ酸と標識付認識分子及び標識付切断試薬(たとえば標識付非特異的エキソペプチダーゼ)との結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシングの例を示す。図7は、末端及び内部アミノ酸と標識付認識分子及び標識付非特異的エキソペプチダーゼとの結合相互作用を評価することによるリアルタイムのポリペプチドシーケンシングの例を示す。
本願に係るポリペプチド及びタンパク質の分析のためのサンプル及びサンプルウェル表面の各種調製例を示す。図8は、タンパク質サンプルから末端修飾ポリペプチドを調製するプロセス例を一般的に描く。
本願に係るポリペプチド及びタンパク質の分析のためのサンプル及びサンプルウェル表面の各種調製例を示す。図9は、可溶化性リンカーをポリペプチドにコンジュゲートするプロセス例を一般的に描く。
本願に係るポリペプチド及びタンパク質の分析のためのサンプル及びサンプルウェル表面の各種調製例を示す。図10は、ボトム表面への単一分子固定を促進するために使用されうる修飾表面を有するサンプルウェルの模式図例を示す。
本明細書に記載の技術のいくつかの実施形態に係るポリペプチド分解プロセス時に得られるデータを解析するための例示的配列データ処理パイプラインの図である。
本明細書に記載の技術のいくつかの実施形態に係るポリペプチド分子のアミノ酸配列を決定するための例示的プロセスのフローチャートである。
本明細書に記載の技術のいくつかの実施形態に係るポリペプチドに相当するアミノ酸配列を決定するための例示的プロセスのフローチャートである。
本明細書に記載の技術のいくつかの実施形態の実現に使用されうる例示的コンピュータシステムのブロック図である。
さまざまな可溶化性リンカーにより提供される溶解性増強のために調製及び評価された選ばれたペプチド-リンカーコンジュゲートの実験データを示す。図15Aは、合成及び評価されたペプチド-リンカーコンジュゲートの構造例を示す。
さまざまな可溶化性リンカーにより提供される溶解性増強のために調製及び評価された選ばれたペプチド-リンカーコンジュゲートの実験データを示す。図15Bは、N末端のペプチド切断を実証するLCMSの結果を示す。
さまざまな可溶化性リンカーにより提供される溶解性増強のために調製及び評価された選ばれたペプチド-リンカーコンジュゲートの実験データを示す。図15Cは、ローディング実験の結果を示す。
同上。
実験結果に基づいて選ばれたエキソペプチダーゼのアミノ酸切断活性の概要を示す。
末端アミノ酸の検出及び切断のための色素/ペプチドコンジュゲートアッセイの実験データを示す。図17Aは、色素/ペプチドコンジュゲートアッセイを実施するために使用されるスキーム例及び構造例を示す。
同上。
末端アミノ酸の検出及び切断のための色素/ペプチドコンジュゲートアッセイの実験データを示す。図17Bは、オンチップアッセイでのサンプルウェル中へのペプチド-リンカーコンジュゲートローディングのイメージング結果を示す。
末端アミノ酸の検出及び切断のための色素/ペプチドコンジュゲートアッセイの実験データを示す。図17Cは、ペプチドコンジュゲートローディング及び末端アミノ酸切断を検出したシグナルトレース例を示す。
末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Aは、FRET色素/ペプチドコンジュゲートアッセイを実施するために使用されるスキーム例及び構造例を示す。
同上。
末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Bは、さまざまな時点のFRETイメージング結果を示す。
末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Cは、さまざまな時点のカッティング効率を示す。
末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Dは、さまざまな時点の各々で表示されるカッティングを示す。
末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Eは、エルシニア・ペスティス(Yersinia pestis)由来のプロリンイミノペプチダーゼ(yPIP)によるさまざまな時点の追加のFRETイメージング結果を示す。
末端アミノ酸の検出及び切断のためのFRET色素/ペプチドコンジュゲートアッセイの実験データを示す。図18Fは、ビブリオ・プロテオリチカス(Vibrio proteolyticus)由来のアミノペプチダーゼ(VPr)によるさまざまな時点のFRETイメージング結果を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Aは、これらの実験のために標識されたClpS2タンパク質の結晶構造を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Bは、標識付ClpS2タンパク質によるN末端アミノ酸識別を例示する単一分子強度トレースを示す。
同上。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Cは、さまざまな末端アミノ酸の平均パルス持続時間を示すプロットである。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Dは、さまざまな末端アミノ酸の平均パルス間持続時間を示すプロットである。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Eは、さまざまな末端アミノ酸間のディスクリミナントパルス持続時間をさらに例示するプロットを示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19F、19G、及び19Hは、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来のClpSタンパク質(teClpS)によるロイシン認識を実証する滞留時間解析の結果例を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19F、19G、及び19Hは、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来のClpSタンパク質(teClpS)によるロイシン認識を実証する滞留時間解析の結果例を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19F、19G、及び19Hは、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来のClpSタンパク質(teClpS)によるロイシン認識を実証する滞留時間解析の結果例を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Iは、A.ツメファシエンス(A.tumefaciens)ClpS1によるフェニルアラニン、ロイシン、トリプトファン、及びチロシンの区別可能認識を実証する滞留時間解析の結果例を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Jは、S.エロンガタス(elongatus)ClpS2によるロイシン認識を実証する滞留時間解析の結果例を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19K~19Lは、GID4によるプロリン認識を実証する滞留時間解析の結果例を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19K~19Lは、GID4によるプロリン認識を実証する滞留時間解析の結果例を示す。
標識付認識分子による末端アミノ酸識別の実験データを示す。図19Mは、さまざまなN末端アミノ酸を有するペプチドを有するatClpS2-V1の模範的な結合曲線を示す。
同一反応混合物中の標識付ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Aは、第1のシーケンシング反応のシグナルトレースデータを示す。
同一反応混合物中の標識付ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Bは、図20Aに示されるシグナルトレースデータのパルス持続時間統計を示す。
同一反応混合物中の標識付ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Cは、第2のシーケンシング反応のシグナルトレースデータを示す。
同一反応混合物中の標識付ClpS2認識タンパク質及びアミノペプチダーゼ切断試薬を用いてリアルタイムで行われたポリペプチドシーケンシング反応の結果例を示す。図20Dは、図20Cに示されるシグナルトレースデータのパルス持続時間統計を示す。
標識付エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Aは、これらの実験のために部位特異的に標識されたプロリンイミノペプチダーゼ(yPIP)の結晶構造を示す。
標識付エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Bは、精製タンパク質産物の標識度を示す。
標識付エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Cは、yPIPの部位特異的標識化を確認するSDS pageの画像である。
標識付エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Dは、部位特異的標識化を確認するSDS pageゲルのオーバー露出画像である。
標識付エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Eは、標識付タンパク質産物の純度を確認するクーマシー染色ゲルの画像である。
標識付エキソペプチダーゼによる末端アミノ酸同定及び切断の実験データを示す。図21Fは、標識付エキソペプチダーゼの切断活性を実証するHPLCトレースである。
特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22Aは、SH2ドメイン含有タンパク質によるホスホチロシン認識を実証した代表的トレースを示す。
特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22Bは、図22Aのトレースに対応するパルス持続時間データを示し、且つ図22Cは、トレースに対して決定された統計を示す。
特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22Bは、図22Aのトレースに対応するパルス持続時間データを示し、且つ図22Cは、トレースに対して決定された統計を示す。
特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22D~22Fは、陰性対照実験の代表的トレースを示す。
特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22D~22Fは、陰性対照実験の代表的トレースを示す。
特異的翻訳後修飾を含有するアミノ酸の認識を評価する実験のデータを示す。図22D~22Fは、陰性対照実験の代表的トレースを示す。
パルス持続時間に及ぼすペナルティメートアミノ酸の影響を評価する実験のパルス持続時間の中央値を示すプロットである。
差次的標識付認識分子による同時アミノ酸認識を評価する実験のデータを示す。図24Aは、代表的トレースを示す。
差次的標識付認識分子による同時アミノ酸認識を評価する実験のデータを示す。図24Bは、各認識分子に対してこれらの実験時に得られたパルス持続時間データを比較するプロットである。
差次的標識付認識分子による同時アミノ酸認識を評価する実験のデータを示す。図24Cは、これらの実験のパルス持続時間統計を示す。
単一分子認識時のペプチドの光安定性を評価する実験のデータを示す。図25Aは、アミノ酸結合部位から約2nmに色素で標識されたatClpS2-V1を用いた認識の代表的トレースを示す。
単一分子認識時のペプチドの光安定性を評価する実験のデータを示す。図25Bは、これらの実験に使用されるClpS2タンパク質の構造の可視化を示す。
単一分子認識時のペプチドの光安定性を評価する実験のデータを示す。図25Cは、DNA/タンパク質リンカーを介してアミノ酸結合部位から>10nmに色素で標識されたClpS2を用いた認識の代表的トレースを示す。
アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。
同上。
アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。
同上。
アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。
同上。
アミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたClpS2認識タンパク質を用いて相補型金属-酸化物-半導体(CMOS)チップ上でリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。
同上。
パイロコッカス・ホリコシイ(Pyrococcus horikoshii)TETアミノペプチダーゼ切断試薬の存在下でDNA/ストレプトアビジンリンカーを介して標識されたatClpS2-V1認識タンパク質を用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Aは、図28Bに示される拡大パルスパターン領域と共にhTETエキソペプチダーゼで実施された反応の代表的トレースを示す。
同上。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Aは、図28Bに示される拡大パルスパターン領域と共にhTETエキソペプチダーゼで実施された反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Cは、図28Dに示される拡大パルスパターン領域及び図28Eに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。
同上。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Cは、図28Dに示される拡大パルスパターン領域及び図28Eに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Cは、図28Dに示される拡大パルスパターン領域及び図28Eに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Fは、図28Gに示される拡大パルスパターン領域及び図28Hに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施されたさらなる反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Fは、図28Gに示される拡大パルスパターン領域及び図28Hに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施されたさらなる反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Fは、図28Gに示される拡大パルスパターン領域及び図28Hに示される追加の代表的トレースと共にhTET及びyPIPの両方のエキソペプチダーゼで実施されたさらなる反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Iは、図28Jに示される拡大パルスパターン領域と共にPfuTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。
差次的切断特異性を有する複数のタイプのエキソペプチダーゼを用いてリアルタイムで行われたポリペプチドシーケンシング反応の代表的トレースデータを示す。図28Iは、図28Jに示される拡大パルスパターン領域と共にPfuTET及びyPIPの両方のエキソペプチダーゼで実施された反応の代表的トレースを示す。
新たに同定されたClpSホモログを評価する実験のデータを示す。図29Aは、精製ClpSタンパク質のSDS-PAGEゲルイメージングを示す。
新たに同定されたClpSホモログを評価する実験のデータを示す。図29Bは、ClpSホモログのバイオレイヤー干渉スクリーニングの結果を示す。
同上。
新たに同定されたClpSホモログを評価する実験のデータを示す。図29Cは、スクリーニングの選択結果を示す。
新たに同定されたClpSホモログを評価する実験のデータを示す。図29Dは、ClpSタンパク質(PS372)と、LA、IA、及びVAペプチドとの反応曲線を示す。
新たに同定されたClpSホモログを評価する実験のデータを示す。図29Eは、PS372及び4つの他のホモログ、並びに無タンパク質対照の偏光反応を示す。
新たに同定されたClpSホモログを評価する実験のデータを示す。図29Fは、IA、IR、IQ、VA、及びVRペプチドのバイオレイヤー干渉反応曲線を示す。
新たに同定されたClpSホモログを評価する実験のデータを示す。図29Gは、IRペプチド(トップパネル)及びLFペプチド(ボトムパネル)を有するPS372のパルス幅ヒストグラム及び代表的トレースを示す。
新たに同定されたClpSホモログによる末端アミノ酸識別を評価する実験のデータを示す。図30Aは、SDS-PAGEによるPS372のin vivoビオチン化を示す。
新たに同定されたClpSホモログによる末端アミノ酸識別を評価する実験のデータを示す。図30Bは、SV-色素にコンジュゲートされたPS372の精製プロファイルを示す。
新たに同定されたClpSホモログによる末端アミノ酸識別を評価する実験のデータを示す。図30Cは、SV-色素コンジュゲートされたPS372の精製後のSDS-PAGEを示す。
新たに同定されたClpSホモログによる末端アミノ酸識別を評価する実験のデータを示す。図30Dは、IからL(a)及びLからI(b)への遷移を示す代表的トレースを示す。
新たに同定されたClpSホモログによる末端アミノ酸識別を評価する実験のデータを示す。図30Eは、色素標識付PS327によるリアルタイム動的ペプチドシーケンシングアッセイの例示データを示す。
メチオニン結合ClpSタンパク質の工学のデータを示す。図31Aは、蛍光活性化セルソーティング(FACS)を介して実施された選択の結果を示す。
メチオニン結合ClpSタンパク質の工学のデータを示す。図31Bは、N末端LAを有するペプチドを有するメチオニン結合ClpSタンパク質の例示的な反応曲線を示す。
メチオニン結合ClpSタンパク質の工学のデータを示す。図31Cは、N末端MAを有するペプチドを有するメチオニン結合ClpSタンパク質の例示的な反応曲線を示す。
メチオニン結合ClpSタンパク質の工学のデータを示す。図31Dは、N末端MRを有するペプチドを有するメチオニン結合ClpSタンパク質の例示的な反応曲線を示す。
メチオニン結合ClpSタンパク質の工学のデータを示す。図31Eは、N末端FAを有するペプチドを有するメチオニン結合ClpSタンパク質の例示的な反応曲線を示す。
メチオニン結合ClpSタンパク質の工学のデータを示す。図31Fは、N末端MQを有するペプチドを有するメチオニン結合ClpSタンパク質の例示的な反応曲線を示す。
UBRボックスドメインホモログを評価する実験のデータを示す。図32A~32Bは、ペナルティメート位置のアミノ酸の前にN末端Rを含有する14のペプチダーゼと結合するUBRボックスホモログPS535(図32A)及びPS522(図32B)の例示的な結合曲線を示す。
UBRボックスドメインホモログを評価する実験のデータを示す。図32A~32Bは、ペナルティメート位置のアミノ酸の前にN末端Rを含有する14のペプチダーゼと結合するUBRボックスホモログPS535(図32A)及びPS522(図32B)の例示的な結合曲線を示す。
UBRボックスドメインホモログを評価する実験のデータを示す。図32Cは、N末端Rペプチドに結合する24のUBRボックスホモログを測定した結果を示すヒートマップである。
UBRボックスドメインホモログを評価する実験のデータを示す。図32Dは、R、K、又はHをN末端位置に含有するポリペプチドと結合する拡大したセットのUBRボックスホモログを測定した結果を示すヒートマップである。
同上。
UBRボックスドメインホモログを評価する実験のデータを示す。図32Eは、ペナルティメート位置の様々なアミノ酸の前にN末端Rを含有する14のポリペプチドと結合する拡大したセットのUBRボックスホモログを測定した結果を示すヒートマップである。
同上。
UBRボックスドメインホモログを評価する実験のデータを示す。図32Fは、単一点蛍光偏光アッセイの結果を示す。
UBRボックスドメインホモログを評価する実験のデータを示す。図32Gは、結合親和性決定の偏光結果の解析を示す。
UBRボックスドメインホモログを評価する実験のデータを示す。図32Hは、認識アッセイにおけるPS621の代表的トレースを示す。
UBRボックスドメインホモログを評価する実験のデータを示す。図32Iは、3バインダー動的シーケンシング反応の例示的なシーケンシングトレースを示す。
P372ホモログタンパク質を評価する実験のデータを示す。図33A~33Eは、さまざまなN末端アミノ酸(I、V、L、F)を含有する4つのポリペプチドと結合するPS372(図33A)及びホモログPS545(図33B)、PS551(図33C)、PS557(図33D)、並びにPS558(図33E)の例示的な結合曲線を示す。
P372ホモログタンパク質を評価する実験のデータを示す。図33A~33Eは、さまざまなN末端アミノ酸(I、V、L、F)を含有する4つのポリペプチドと結合するPS372(図33A)及びホモログPS545(図33B)、PS551(図33C)、PS557(図33D)、並びにPS558(図33E)の例示的な結合曲線を示す。
P372ホモログタンパク質を評価する実験のデータを示す。図33A~33Eは、さまざまなN末端アミノ酸(I、V、L、F)を含有する4つのポリペプチドと結合するPS372(図33A)及びホモログPS545(図33B)、PS551(図33C)、PS557(図33D)、並びにPS558(図33E)の例示的な結合曲線を示す。
P372ホモログタンパク質を評価する実験のデータを示す。図33A~33Eは、さまざまなN末端アミノ酸(I、V、L、F)を含有する4つのポリペプチドと結合するPS372(図33A)及びホモログPS545(図33B)、PS551(図33C)、PS557(図33D)、並びにPS558(図33E)の例示的な結合曲線を示す。
P372ホモログタンパク質を評価する実験のデータを示す。図33A~33Eは、さまざまなN末端アミノ酸(I、V、L、F)を含有する4つのポリペプチドと結合するPS372(図33A)及びホモログPS545(図33B)、PS551(図33C)、PS557(図33D)、並びにPS558(図33E)の例示的な結合曲線を示す。
P372ホモログタンパク質を評価する実験のデータを示す。図33Fは、34のPS372ホモログを測定した結果を示すヒートマップである。
atClpS2-V1の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダー(PS610)を評価する実験のデータを示す。図34Aは、ペプチドオンチップ認識アッセイの代表的トレースデータを示す。
atClpS2-V1の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダー(PS610)を評価する実験のデータを示す。図34Bは、バインダー濃度の関数として平均パルス速度を示すプロットである。
atClpS2-V1の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダー(PS610)を評価する実験のデータを示す。図34Cは、色素標識付P610及びPS327によるリアルタイム動的ペプチドシーケンシングアッセイの例示データを示す。
atClpS2-V1の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダー(PS610)を評価する実験のデータを示す。図34Dは、バインダーオンチップアッセイの代表的トレースデータを示す。
さまざまなリンカーを含有する直列ClpS2構築物を評価する実験のデータを示す。図35Aは、一価バインダーatClpS2-V1の例示的な結合曲線を示す。
さまざまなリンカーを含有する直列ClpS2構築物を評価する実験のデータを示す。図35B~35Dは、リンカー1(図35B)、リンカー2(図35C)、又はリンカー3(図35D)によって分離されるatClpS2-V1の2つのコピーを有する直列構築物の例示的な結合曲線を示す。
さまざまなリンカーを含有する直列ClpS2構築物を評価する実験のデータを示す。図35B~35Dは、リンカー1(図35B)、リンカー2(図35C)、又はリンカー3(図35D)によって分離されるatClpS2-V1の2つのコピーを有する直列構築物の例示的な結合曲線を示す。
さまざまなリンカーを含有する直列ClpS2構築物を評価する実験のデータを示す。図35B~35Dは、リンカー1(図35B)、リンカー2(図35C)、又はリンカー3(図35D)によって分離されるatClpS2-V1の2つのコピーを有する直列構築物の例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36Aは、一価バインダーatClpS2-V1(左側プロット)及び一価バインダーPS372(右側プロット)の例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36Bは、atClpS2-V1及びPS372の直列コピーを有する多価ポリペプチドの例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36Cは、一価バインダーPS372の例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36Dは、S372の2つの直列コピーを有する多価ポリペプチドの例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36Eは、一価バインダーPS557の例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36F~36Hは、リンカー1(図36F)、リンカー2(図36G)、又はリンカー3(図36H)によって分離されるPS557の2つのコピーを有する直列構築物の例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36F~36Hは、リンカー1(図36F)、リンカー2(図36G)、又はリンカー3(図36H)によって分離されるPS557の2つのコピーを有する直列構築物の例示的な結合曲線を示す。
同じClpSタンパク質又は互いに異なるClpSタンパク質の直列コピーを有する単一ポリペプチドとして生成された、工学操作された多価アミノ酸バインダーを評価する実験のデータを示す。図36F~36Hは、リンカー1(図36F)、リンカー2(図36G)、又はリンカー3(図36H)によって分離されるPS557の2つのコピーを有する直列構築物の例示的な結合曲線を示す。
タンパク質シールドのC末端付加によって駆動されるバインダー及び融合タンパク質のkon速度定数及びkoff速度決定のストップトフロー迅速速度論解析のデータを示す。図37Aは、アッセイ設計を例示する模式図(トップパネル)並びに会合速度定数(kon)を決定するための実験結果及び解析を示すプロット(ミドル及びボトムのパネル)を示す。
タンパク質シールドのC末端付加によって駆動されるバインダー及び融合タンパク質のkon速度定数及びkoff速度決定のストップトフロー迅速速度論解析のデータを示す。図37Bは、アッセイ設計を例示する模式図(トップパネル)並びに解離速度(koff)を測定するための実験結果及び解析を示すプロット(ボトムパネル)を示す。
本願の態様は、タンパク質シーケンシング及び同定の方法と、ポリペプチドシーケンシング及び同定の方法と、アミノ酸同定の方法と、かかる方法を実施するための組成物と、に関する。
いくつかの態様では、本願は、デバイス修正をほとんど又はまったく伴うことなく既存の分析機器を用いて実現されうるポリペプチドシーケンシング技術の発見に関する。たとえば、以前のポリペプチドシーケンシングストラテジーは、分析されるポリペプチドを含有する反応ベッセル(vessel)を介するさまざまな試薬混合物の繰返しサイクリングを含んでいた。かかるストラテジーは、試薬サイクリングが可能なフローセルや類似の装置を備えていないこともある核酸シーケンシング機器などの既存の分析機器の修正を必要とすることもある。本願のある特定のポリペプチドシーケンシング技術は繰返し試薬サイクリングを必要としないので、機器サイズを増加させるおそれのある有意な修正を伴うことなく既存の機器の使用を可能にすることを、本発明者らは認識し高く評価した。それゆえ、いくつかの態様では、本願は、より小型のシーケンシング機器の使用を可能にするポリペプチドシーケンシング方法を提供する。いくつかの態様では、本願は、同一シーケンシング機器を用いて実施されるゲノミック解析及びプロテオミック解析の両方を可能にするポリペプチドシーケンシング技術の発見に関する。
差次的結合相互作用(differential binding interactions)はポリペプチドシーケンシングの従来の標識化ストラテジーに対する追加又は代替のアプローチを提供可能であることを、本発明者らはさらに認識し高く評価した。従来のポリペプチドシーケンシングは、各タイプのアミノ酸をユニーク同定可能標識で標識することを含みうる。数多くの翻訳後変異に加えて少なくとも20の異なるタイプの天然に存在するアミノ酸があるので、こうしたプロセスは労力がかかるうえに誤りを起こしやすい可能性がある。いくつかの態様では、本願は、異なるタイプのアミノ酸に差次的に会合してポリペプチドのアミノ酸配列の指標となる検出可能特性シグネチャーを生成するアミノ酸認識分子の使用を含む技術の発見に関する。それゆえ、本願の態様は、ある特定の従来のポリペプチドシーケンシングに使用されるポリペプチド標識化及び/又は強烈な化学試薬を必要としない技術を提供するので、サンプルから得られる配列情報のスループット及び/又は確度を増加させる。
いくつかの態様では、本願は、単一反応混合物のみを用いて(たとえば、反応ベッセルを介する繰返し試薬サイクリングを必要とすることなく)ポリペプチドシーケンシング反応をリアルタイムでモニター可能であるという発見に関する。以上に詳述したように、従来のポリペプチドシーケンシング反応は、アミノ酸検出工程とアミノ酸切断工程との間でサイクルするようにポリペプチドをさまざまな試薬混合物に暴露することを含みうる。それゆえ、いくつかの態様では、本願は、進行中の分解反応全体にわたるリアルタイムのアミノ酸検出によりポリペプチド分析を可能にする次世代シーケンシングの進歩に関する。動的シーケンシングによるかかるポリペプチド分析のアプローチは以下に説明される。
本明細書に記載されるように、いくつかの態様では、本願は、ポリペプチド分解プロセス時のデータを得ることと、データを解析して分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分を決定することと、によるポリペプチドのシーケンシング方法を提供する。いくつかの実施形態では、データの部分は、1つ以上のアミノ酸認識分子とポリペプチドの末端に露出される(たとえば分解時に)逐次アミノ酸との会合の指標となる一連のシグナルパルスを含む。いくつかの実施形態では、一連のシグナルパルスは、分解プロセス時のポリペプチドの末端での一連の可逆単一分子結合相互作用に対応する。
ポリペプチド分解プロセス時の単一分子結合相互作用を検出することによるポリペプチドシーケンシングの非限定的例は、図1Aに模式的に例示される。シグナルトレース例(I)は、シグナルの変化に対応するときのさまざまな会合イベント(association events)を描く一連のパネル(II)で示される。示されるように、アミノ酸認識分子(斑点形状)とポリペプチド(ビーズオンストリング(beads-on-a-string)として示される)の末端のアミノ酸との間の会合イベントは、ある持続時間にわたり持続するシグナルの大きさの変化を生成する。
パネル(A)及び(B)は、アミノ酸認識分子とポリペプチドの末端に露出される第1のアミノ酸(たとえば第1の末端アミノ酸)との間のさまざまな会合イベントを描く。各会合イベントは、会合イベントの持続時間にわたり持続するシグナルの大きさの変化により特徴付けられるシグナルトレース(I)の変化を生成する。それゆえ、パネル(A)及び(B)の会合イベント間の持続時間は、ポリペプチドがアミノ酸認識分子に検出可能に会合されない持続時間に対応する。
パネル(C)及び(D)は、アミノ酸認識分子とポリペプチドの末端に露出される第2のアミノ酸(たとえば第2の末端アミノ酸)との間のさまざまな会合イベントを描く。本明細書に記載されるように、ポリペプチドの末端に「露出」されるアミノ酸は、ポリペプチドに依然として装着されており且つ分解時に先行末端アミノ酸の除去により末端アミノ酸になる(たとえば、単独で又は1つ以上の追加のアミノ酸と共に、のいずれかで)アミノ酸である。それゆえ、一連のパネル(II)の第1及び第2のアミノ酸は、ポリペプチドの末端に露出される逐次アミノ酸の例示的例を提供し、この場合、第2のアミノ酸は、第1のアミノ酸の除去により末端アミノ酸になったものである。
一般的に描かれるように、パネル(C)及び(D)の会合イベントは、パネル(A)及び(B)のものよりも相対的に短い持続時間にわたり持続する大きさの変化により特徴付けられるシグナルトレース(I)の変化を生成し、且つパネル(C)及び(D)の会合イベント間の持続時間は、パネル(A)及び(B)のものよりも相対的に短い。本明細書に記載されるように、いくつかの実施形態では、シグナルのこれらの識別可能な変化の一方又は両方のどちらかは、異なるタイプのアミノ酸間の識別が可能なシグナルトレース(I)の特性パターンを決定するために使用されうる。いくつかの実施形態では、一方の特性パターンから他方の特性パターンへの遷移は、アミノ酸切断の指標となる。本明細書で用いられる場合、いくつかの実施形態では、アミノ酸切断とは、ポリペプチドの末端からの少なくとも1つのアミノ酸の除去(たとえば、ポリペプチドからの少なくとも1つの末端アミノ酸の除去)を意味する。いくつかの実施形態では、アミノ酸切断は、特性パターン間の持続時間に基づく推測により決定される。いくつかの実施形態では、アミノ酸切断は、標識付切断試薬とポリペプチドの末端のアミノ酸との会合により生成されるシグナルの変化を検出することにより決定される。アミノ酸は分解時にポリペプチドの末端から逐次切断されるので、大きさの一連の変化又は一連のシグナルパルスが検出される。いくつかの実施形態では、シグナルパルスデータは、図1Bに例示されるように分析可能である。
いくつかの実施形態では、シグナルデータは、シグナルデータの1つ以上のパラメータに閾値レベルを適用することによりシグナルパルス情報を抽出するように解析可能である。たとえば、パネル(III)は、シグナルトレース例(I)のシグナルデータに適用される閾値大きさレベル(「ML」)を描く。いくつかの実施形態では、MLは、ある時点で検出されるシグナルと所与のデータセットに対して決定されるベースラインとの間の最小差である。いくつかの実施形態では、シグナルパルス(「sp」)は、MLを超える大きさの変化の指標となり且つある持続時間にわたり持続するデータの各部分に割り当てられる。いくつかの実施形態では、閾値持続時間は、MLを満たすデータの部分に適用されてシグナルパルスがその部分に割り当てられるかを決定しうる。たとえば、実験アーチファクトは、所望の信頼性でシグナルパルスを帰属するのに十分な持続時間にわたり持続しないMLを超える大きさの変化を引き起こしうる(たとえば、アミノ酸タイプを識別できない可能性のある一過性会合イベント、観測領域中への拡散や観測領域内に固着する試薬などの非特異的検出イベント)。それゆえ、いくつかの実施形態では、シグナルパルスは、閾値大きさレベル及び閾値持続時間に基づいてシグナルデータから抽出される。
抽出されたシグナルパルス情報は、例示を目的として重ね合わせられたシグナルトレース例(I)と共にパネル(III)に示される。いくつかの実施形態では、シグナルパルスの大きさのピークは、ML超を持続する持続時間にわたり検出された大きさを平均することにより決定される。いくつかの実施形態では、本明細書で用いられる「シグナルパルス」とは、ある持続時間にわたりベースライン超を持続するシグナルデータの変化(たとえば、シグナルトレース例(I)により例示される生のシグナルデータ)又はそれから抽出されたシグナルパルス情報(たとえば、パネル(IV)に例示される処理シグナルデータ)を意味しうることが認識されるべきである。
パネル(IV)は、シグナルトレース例(I)から抽出されたシグナルパルス情報を示す。いくつかの実施形態では、シグナルパルス情報は、一連のシグナルパルス中のさまざまな特性パターンに基づいて異なるタイプのアミノ酸を同定するように解析可能である。たとえば、パネル(IV)に示されるように、シグナルパルス情報は、第1の特性パターン(「CP1」)に基づいて第1のタイプのアミノ酸及び第2の特性パターン(「CP2」)に基づいて第2のタイプのアミノ酸の指標となる。例として、より早い時点で検出された2つのシグナルパルスは、CP1に基づいてポリペプチドの末端の第1のアミノ酸の指標となる情報を提供し、且つより後の時点で検出された2つのシグナルパルスは、CP2に基づいてポリペプチドの末端の第2のアミノ酸の指標となる情報を提供する。
また、パネル(IV)に示されるように、各シグナルパルスは、アミノ酸認識分子と特性パターンのアミノ酸との間の会合イベントに対応するパルス持続時間(「pd」)を含む。いくつかの実施形態では、パルス持続時間は、結合(binding)の解離速度に特有である。また、示されるように、特性パターンの各シグナルパルスは、パルス間持続時間(interpulse duration)(「ipd」)により特性パターンの他のシグナルパルスから分離される。いくつかの実施形態では、パルス間持続時間は、結合の会合速度に特有である。いくつかの実施形態では、大きさの変化(「ΔM」)は、ベースラインとシグナルパルスのピークとの間の差に基づいてシグナルパルスに対して決定可能である。いくつかの実施形態では、特性パターンは、パルス持続時間に基づいて決定される。いくつかの実施形態では、特性パターンは、パルス持続時間及びパルス間持続時間に基づいて決定される。いくつかの実施形態では、特性パターンは、パルス持続時間、パルス間持続時間、及び大きさの変化のいずれか1つ以上に基づいて決定される。
それゆえ、図1A~1Bにより例示されるように、いくつかの実施形態では、ポリペプチドシーケンシングは、1つ以上のアミノ酸認識分子と進行中の分解反応でポリペプチドの末端に露出される逐次アミノ酸との会合の指標となる一連のシグナルパルスを検出することにより実施される。一連のシグナルパルスは、一連のシグナルパルス中の特性パターンを決定するように解析可能であり、且つ特性パターンの経時変化は、ポリペプチドのアミノ酸配列を決定するために使用可能である。
いくつかの実施形態では、一連のシグナルパルスは、経時的に光学シグナルの大きさの一連の変化を含む。いくつかの実施形態では、光学シグナルの一連の変化は、会合イベント時に生成される発光の一連の変化を含む。いくつかの実施形態では、発光は、シーケンシング反応の1つ以上の試薬に関連付けられる検出可能標識により生成される。たとえば、いくつかの実施形態では、1つ以上のアミノ酸認識分子の各々は発光標識を含む。いくつかの実施形態では、切断試薬は発光標識を含む。本願に係る発光標識及びその使用の例は、本明細書の他の箇所に提供される。
いくつかの実施形態では、一連のシグナルパルスは、経時的に電気シグナルの大きさの一連の変化を含む。いくつかの実施形態では、電気シグナルの一連の変化は、会合イベント時に生成されるコンダクタンスの一連の変化を含む。いくつかの実施形態では、伝導率は、シーケンシング反応の1つ以上の試薬に会合される検出可能標識により生成される。たとえば、いくつかの実施形態では、1つ以上のアミノ酸認識分子の各々は伝導率標識を含む。本願に係る伝導率標識及びその使用の例は、本明細書の他の箇所に提供される。伝導率標識を用いた単一分子の同定方法は記載されている(たとえば、米国特許出願公開第2017/0037462号明細書を参照されたい)。
いくつかの実施形態では、コンダクタンスの一連の変化は、ナノポアを介するコンダクタンスの一連の変化を含む。たとえば、ナノポアを用いたレセプター-リガンド相互作用の評価方法は記載されている(たとえば、タークル,A.K.(Thakur,A.K.)及びモビレアヌ,L.(Movileanu,L.)著、2019年、ネイチャー・バイオテクノロジー(Nature Biotechnology)、第37巻、第1号を参照されたい)。かかるナノポアは本願に係るポリペプチドシーケンシング反応をモニターするために使用されうることを、本発明者らは認識し高く評価した。それゆえ、いくつかの実施形態では、本願は、単一ポリペプチド分子と1つ以上のアミノ酸認識分子とを接触させることを含むポリペプチドシーケンシング方法を提供し、この場合、単一ポリペプチド分子はナノポアに固定される。いくつかの実施形態では、本方法は、1つ以上の末端アミノ酸認識分子と、単一ポリペプチドが分解されつつある間に単一ポリペプチドの末端に露出される逐次アミノ酸と、の会合の指標となるナノポアを介するコンダクタンスの一連の変化を検出することにより、単一ポリペプチド分子をシーケンスすることをさらに含む。
いくつかの態様では、本願は、混合物からポリペプチドの1タイプ以上のアミノ酸を同定することによるタンパク質の複合混合物中の個別タンパク質のシーケンシング及び/又は同定の方法を提供する。いくつかの実施形態では、ポリペプチドの1つ以上のアミノ酸(たとえば、末端アミノ酸及び/又は内部アミノ酸)が標識され(たとえば、直接的又は間接的に、たとえば、アミノ酸認識分子などの結合剤を用いて)、且つポリペプチド中の標識付アミノ酸の相対位置が決定される。いくつかの実施形態では、ポリペプチド中のアミノ酸の相対位置は、一連のアミノ酸標識及び切断工程を用いて決定される。しかしながら、いくつかの実施形態では、ポリペプチド中の標識付アミノ酸の相対位置は、ポリペプチドからアミノ酸を除去することなく、ポア(たとえばタンパク質チャネル)を介して標識付ポリペプチドをトランスロケートすることと、ポリペプチド分子中の標識付アミノ酸の相対位置を決定するためにポアを介するトランスロケーション時に標識付アミノ酸からのシグナル(たとえばFRETシグナル)を検出することと、により決定可能である。
いくつかの実施形態では、末端アミノ酸(たとえば、N末端又はC末端アミノ酸)のアイデンティティーが評価され、その後で末端アミノ酸が除去され、そして末端のその次のアミノ酸のアイデンティティーが評価され、このプロセスがポリペプチド中の複数の逐次アミノ酸が評価されるまで繰り返される。いくつかの実施形態では、アミノ酸のアイデンティティーを評価することは、存在するアミノ酸のタイプを決定することを含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、たとえば、天然に存在する20アミノ酸のどれであるかを決定することにより、実際のアミノ酸のアイデンティティーを決定することを含む(たとえば、個別末端アミノ酸に特異的な結合剤を用いて)。いくつかの実施形態では、アミノ酸のタイプは、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セレノシステイン、トレオニン、トリプトファン、チロシン、及びバリンから選択される。
しかしながら、いくつかの実施形態では、末端アミノ酸タイプのアイデンティティーを評価することは、ポリペプチドの末端に存在可能な潜在的アミノ酸のサブセットを決定することを含みうる。いくつかの実施形態では、これは、アミノ酸が1つ以上の特異的アミノ酸でないことを決定することにより達成可能である(したがって、他のアミノ酸のいずれかでありうる)。いくつかの実施形態では、これは、アミノ酸の特定サブセットのどれがポリペプチドの末端にありうるかを決定することにより(たとえば、サイズ、電荷、疎水性、翻訳後修飾、結合性に基づいて)達成可能である(たとえば、2つ以上の末端アミノ酸の特定サブセットに結合する結合剤を用いて)。
いくつかの実施形態では、末端アミノ酸タイプのアイデンティティーを評価することは、アミノ酸が翻訳後修飾を含むことを決定することを含む。翻訳後修飾の非限定的例としては、アセチル化、ADPリボシル化、カスパーゼ切断、シトルリン化、ホルミル化、N連結グリコシル化、O連結グリコシル化、ヒドロキシル化、メチル化、ミリストイル化、NEDD化(neddylation)、ニトロ化、酸化、パルミトイル化、リン酸化、プレニル化、S-ニトロシル化、硫酸化、SUMO化(sumoylation)、及びユビキチン化が挙げられる。
いくつかの実施形態では、末端アミノ酸タイプのアイデンティティーを評価することは、アミノ酸が1つ以上の生化学的性質により特徴付けられる側鎖を含むことを決定することを含む。たとえば、アミノ酸は、非極性脂肪族側鎖、正荷電側鎖、負荷電側鎖、非極性芳香族側鎖、又は極性非荷電側鎖を含みうる。非極性脂肪族側鎖を含むアミノ酸の非限定的例としては、アラニン、グリシン、バリン、ロイシン、メチオニン、及びイソロイシンが挙げられる。正荷電側鎖を含むアミノ酸の非限定的例としては、リシン、アルギニン、及びヒスチジンが挙げられる。負荷電側鎖を含むアミノ酸の非限定的例としては、アスパラギン酸及びグルタミン酸が挙げられる。非極性芳香族側鎖を含むアミノ酸の非限定的例としては、フェニルアラニン、チロシン、及びトリプトファンが挙げられる。極性非荷電側鎖を含むアミノ酸の非限定的例としては、セリン、トレオニン、システイン、プロリン、アスパラギン、及びグルタミンが挙げられる。
いくつかの実施形態では、タンパク質又はポリペプチドは、複数のより小さなポリペプチドに消化可能であり、且つ配列情報は、これらのより小さなポリペプチドの1つ以上から得ることが可能である(たとえば、ポリペプチドの末端アミノ酸を逐次評価することと、そのアミノ酸を除去してその次のアミノ酸を末端に露出することと、を含む方法を用いて)。
いくつかの実施形態では、ポリペプチドは、そのアミノ(N)末端からシーケンスされる。いくつかの実施形態では、ポリペプチドは、そのカルボキシ(C)末端からシーケンスされる。いくつかの実施形態では、ポリペプチドの第1の末端(たとえば、N又はC末端)は固定され、且つ他の末端(たとえば、C又はN末端)は本明細書に記載されるようにシーケンスされる。
本明細書で用いられる場合、ポリペプチドをシーケンスすることは、ポリペプチドの配列情報を決定することを意味する。いくつかの実施形態では、これは、ポリペプチドの一部分(又は全部)の各逐次アミノ酸のアイデンティティーを決定することを含みうる。しかしながら、いくつかの実施形態では、これは、ポリペプチド内のアミノ酸のサブセットのアイデンティティーを評価すること(たとえば、ポリペプチド中の各アミノ酸のアイデンティティーを決定することなく1つ以上のアミノ酸タイプの相対位置を決定すること)を含みうる。しかしながら、いくつかの実施形態では、ポリペプチド中のさまざまなタイプのアミノ酸の相対位置を直接決定することなく、ポリペプチドからアミノ酸含有率情報を得ることが可能である。アミノ酸含有率は単独で、存在するポリペプチドのアイデンティティーを推測するために使用されうる(たとえば、アミノ酸含有率とポリペプチド情報のデータベースとを比較することと、どのポリペプチドが同一アミノ酸含有率を有するかを決定することと、により)。
いくつかの実施形態では、(たとえば、酵素切断及び/又は化学切断を介して)より長いポリペプチド又はタンパク質から得られる複数のポリペプチド産物の配列情報は、より長いポリペプチド又はタンパク質の配列を再構築又は推測するように解析可能である。
それゆえ、いくつかの実施形態では、1タイプ以上のアミノ酸は、1タイプ以上のアミノ酸に選択的に結合する1つ以上の標識付認識分子の発光を検出することにより同定される。いくつかの実施形態では、1タイプ以上のアミノ酸は、標識付ポリペプチドの発光を検出することにより同定される。
本明細書に記載のポリペプチドシーケンシング技術は、とくに従来のポリペプチドシーケンシング技術とは対照的に、新規なポリペプチドシーケンシングデータを発生することを含みうることを、本発明者らはさらに認識し高く評価した。そのため、ポリペプチドシーケンシングデータを解析する従来の技術は、本明細書に記載のポリペプチドシーケンシング技術を用いて発生されるデータに適用されるとき十分でないおそれがある。
たとえば、繰返し試薬サイクリングを含む従来のポリペプチドシーケンシング技術は、シーケンスされるポリペプチドの個別アミノ酸に関連付けられるデータを発生しうる。かかる場合には、検出されるデータが1つのアミノ酸のみに対応するので、発生されるデータを解析することは、特定時間でどのアミノ酸が検出されているかを決定することを単に含むにすぎないであろう。これとは対照的に、本明細書に記載のポリペプチドシーケンシング技術は、ポリペプチド分子の複数のアミノ酸が検出されている間にポリペプチド分解プロセス時のデータを発生しうるので、ポリペプチドのさまざまなアミノ酸に対応するデータのセクションを見分けることが困難なおそれのあるデータをもたらしうる。それゆえ、本発明者らは、個別アミノ酸に対応するデータのセクションを決定することを含む本明細書に記載のポリペプチドシーケンシング技術により、たとえば、それぞれのアミノ酸会合イベントに対応する部分にデータをセグメント化することにより、発生されるかかるデータを解析する新しい計算技術を開発した。次いで、それらのセクションは、それらの個別セクション時に検出されるアミノ酸を同定するようにさらに解析されうる。
他の一例として、各タイプのアミノ酸に対してユニーク同定可能標識を使用することを含む従来のシーケンシング技術は、どのように個別アミノ酸が他の分子と相互作用するかの動力学をなんら考慮することなくどの標識が特定時間に検出されているかを単に解析することを含みうるにすぎない。これとは対照的に、本明細書に記載のポリペプチドシーケンシング技術は、どのようにアミノ酸が認識分子と相互作用するかの指標となるデータを発生する。以上で考察されるように、データは、アミノ酸とそのそれぞれの認識分子との間の会合イベントに対応する一連の特性パターンを含みうる。それゆえ、本発明者らは、データのその部分に対応するアミノ酸のタイプを決定するように特性パターンを解析する新しい計算技術を開発し、一連のさまざまな特性パターンを解析することによりポリペプチドのアミノ酸配列の決定を可能にした。
いくつかの態様では、本明細書に記載のポリペプチドシーケンシング技術は、ポリペプチドが切断手段によって分解されつつある間に、どのようにポリペプチドが結合手段と相互作用するかの指標となるデータを発生する。以上で考察されるように、データは、末端の切断手段間におけるポリペプチドの末端の会合イベントに対応する一連の特性パターンを含みうる。いくつかの実施形態では、本明細書に記載のシーケンシングの方法は、単一ポリペプチド分子と、結合手段及び切断手段とを接触させることを含み、結合手段及び切断手段は、少なくとも10の会合イベントを、切断イベントの前に達成するように構成される。いくつかの実施形態では、手段は、少なくとも10の会合イベントを、2つの切断イベントの間に達成するように構成される。
本明細書に記載されるように、いくつかの実施形態では、複数の単一分子シーケンシング反応がサンプルウェルのアレイでパラレルに実施される。いくつかの実施形態では、アレイは、約10,000~約1,000,000のサンプルウェルを含む。いくつかの実現形態では、サンプルウェルの容積は、約10-21リットル~約10-15リットルでありうる。サンプルウェルは小さな容積を有するので、任意の所与の時間にサンプルウェル内に約1つのみのポリペプチドが存在しうるため、単一分子イベントの検出が可能でありうる。統計的に、いくつかのサンプルウェルは単一分子シーケンシング反応を含まないことがあり、いくつかは1つより多くの単一ポリペプチド分子を含むことがある。しかしながら、相当数のサンプルウェルは、各々に単一分子反応を含みうる(たとえば、いくつかの実施形態では少なくとも30%)ため、単一分子解析は、多数のサンプルウェルでパラレルに行うことが可能である。いくつかの実施形態では、結合手段及び切断手段は、少なくとも10の会合イベントを、単一分子反応が起こるサンプルウェルの少なくとも10%(たとえば、10~50%、50%より多く、25~75%、少なくとも80%、又はそれ以上)における切断イベントの前に達成するように構成される。いくつかの実施形態では、結合手段及び切断手段は、少なくとも10の会合イベントを、単一分子反応においてポリペプチドのアミノ酸の少なくとも50%(たとえば、50%より多く、少なくとも80%、又はそれ以上)への切断イベントの前に達成するように構成される。
アミノ酸認識分子
いくつかの実施形態では、本明細書に提供される方法は、ポリペプチドと、少なくとも1タイプの末端アミノ酸に選択的に結合する標識を含んでいても含んでいなくてもよいアミノ酸認識分子と、を接触させることを含む。本明細書で用いられる場合、いくつかの実施形態では、末端アミノ酸とは、ポリペプチドのアミノ末端アミノ酸又はポリペプチドのカルボキシ末端アミノ酸を意味しうる。いくつかの実施形態では、標識付認識分子は、他のタイプの末端アミノ酸よりも1タイプの末端アミノ酸に選択的に結合する。いくつかの実施形態では、標識付認識分子は、同一タイプの内部アミノ酸よりも1タイプの末端アミノ酸に選択的に結合する。さらに他の実施形態では、標識付認識分子は、ポリペプチドのいずれかの位置の1タイプのアミノ酸、たとえば、末端アミノ酸や内部アミノ酸と同一タイプのアミノ酸に選択的に結合する。
いくつかの実施形態では、本明細書に提供される方法は、ポリペプチドと、少なくとも1タイプの末端アミノ酸に選択的に結合する標識を含んでいても含んでいなくてもよいアミノ酸認識分子と、を接触させることを含む。本明細書で用いられる場合、いくつかの実施形態では、末端アミノ酸とは、ポリペプチドのアミノ末端アミノ酸又はポリペプチドのカルボキシ末端アミノ酸を意味しうる。いくつかの実施形態では、標識付認識分子は、他のタイプの末端アミノ酸よりも1タイプの末端アミノ酸に選択的に結合する。いくつかの実施形態では、標識付認識分子は、同一タイプの内部アミノ酸よりも1タイプの末端アミノ酸に選択的に結合する。さらに他の実施形態では、標識付認識分子は、ポリペプチドのいずれかの位置の1タイプのアミノ酸、たとえば、末端アミノ酸や内部アミノ酸と同一タイプのアミノ酸に選択的に結合する。
本明細書で用いられる場合、いくつかの実施形態では、アミノ酸のタイプとは、20の天然に存在するアミノ酸の1つ又はそのタイプのサブセットを意味する。いくつかの実施形態では、アミノ酸のタイプとは、20の天然に存在するアミノ酸の1つの修飾変異体又はその非修飾及び/若しくは修飾変異体のサブセットを意味する。修飾アミノ酸変異体の例としては、限定されるものではないが、翻訳後修飾変異体(たとえば、アセチル化、ADPリボシル化、カスパーゼ切断、シトルリン化、ホルミル化、N連結グリコシル化、O連結グリコシル化、ヒドロキシル化、メチル化、ミリストイル化、NEDD化、ニトロ化、酸化、パルミトイル化、リン酸化、プレニル化、S-ニトロシル化、硫酸化、SUMO化、及びユビキチン化)、化学修飾変異体、非天然アミノ酸、及びタンパク質原性アミノ酸、たとえば、セレノシステイン及びピロリシンが挙げられる。いくつかの実施形態では、アミノ酸のタイプのサブセットは、1つ以上の類似の生化学的性質を有する1超且つ20未満のアミノ酸を含む。たとえば、いくつかの実施形態では、アミノ酸のタイプとは、荷電側鎖(たとえば、正及び/又は負荷電側鎖)を有するアミノ酸、極性側鎖(たとえば、極性非荷電側鎖)を有するアミノ酸、非極性側鎖(たとえば、非極性脂肪族及び/又は芳香族側鎖)を有するアミノ酸、及び疎水性側鎖を有するアミノ酸から選択される1タイプを意味する。
いくつかの実施形態では、本明細書に提供される方法は、ポリペプチドと、1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識付認識分子と、を接触させることを含む。例示的且つ非限定的例として、4つの標識付認識分子が本願の方法で使用される場合、いずれか1つの認識分子は、他の3つのいずれかが選択的に結合する他の1タイプのアミノ酸とは異なる1タイプの末端アミノ酸に選択的に結合する(たとえば、第1の認識分子は第1のタイプに結合し、第2の認識分子は第2のタイプに結合し、第3の認識分子は第3のタイプに結合し、且つ第4の認識分子は第4のタイプの末端アミノ酸に結合する)。この考察の目的では、本明細書に記載の方法との関連での1つ以上の標識付認識分子は、標識付認識分子のセットと代替的にいいうる。
いくつかの実施形態では、標識付認識分子のセットは、少なくとも1つ且つ6つまでの標識付認識分子を含む。たとえば、いくつかの実施形態では、標識付認識分子のセットは、1つ、2つ、3つ、4つ、5つ、又は6つの標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、10以下の標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、8つ以下の標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、6つ以下の標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、4つ以下の標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、3つ以下の標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、2つ以下の標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、4つの標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、少なくとも2つ且つ20まで(たとえば、少なくとも2つ且つ10まで、少なくとも2つ且つ8つまで、少なくとも4つ且つ20まで、少なくとも4つ且つ10まで)の標識付認識分子を含む。いくつかの実施形態では、標識付認識分子のセットは、20超(たとえば、20~25、20~30)の認識分子を含む。しかしながら、いずれの数の認識分子も所望の使用に適応する本願の方法に従って使用されうることが認識されるべきである。
本願によれば、いくつかの実施形態では、1タイプ以上のアミノ酸は、標識付認識分子の発光を検出することにより同定される。いくつかの実施形態では、標識付認識分子は、1タイプのアミノ酸に選択的に結合する認識分子と、認識分子に関連付けられる発光を有する発光標識と、を含む。こうして、発光(たとえば、発光寿命、発光強度、及び本明細書の他の箇所に記載の他の発光性)は、ポリペプチドのアミノ酸を同定するように認識分子の選択的結合に関連付けられうる。いくつかの実施形態では、複数のタイプの標識付認識分子が本願に係る方法で使用されうるとともに、各タイプは、複数間でユニークに同定可能な発光を有する発光標識を含む。好適な発光標識は、フルオロフォア色素などの発光分子を含みうるとともに本明細書の他の箇所に記載されている。
いくつかの実施形態では、1タイプ以上のアミノ酸は、標識付認識分子の1つ以上の電気特性を検出することにより同定される。いくつかの実施形態では、標識付認識分子は、1タイプのアミノ酸に選択的に結合する認識分子と、認識分子に会合される伝導率標識と、を含む。こうして、1つ以上の電気特性(たとえば、電荷、電流振動カラー、及び他の電気特性)は、ポリペプチドのアミノ酸を同定するように認識分子の選択的結合に関連付けられうる。いくつかの実施形態では、複数のタイプの標識付認識分子が本願に係る方法で使用されうるとともに、各タイプは、複数間でユニークに同定可能な電気シグナルの変化(たとえば、コンダクタンスの変化、たとえば、特性パターンの伝導率の大きさの変化及び伝導率の遷移)を生成する伝導率標識を含む。いくつかの実施形態では、複数のタイプの標識付認識分子は各々、異なる数の荷電基(たとえば、異なる数の負及び/又は正荷電基)を有する伝導率標識を含む。それゆえ、いくつかの実施形態では、伝導率標識は電荷標識である。電荷標識の例としては、デンドリマー、ナノ粒子、核酸、及び複数の荷電基を有する他のポリマーが挙げられる。いくつかの実施形態では、伝導率標識は、その正味電荷(net charge)(たとえば、正味正電荷又は正味負電荷)により、その電荷密度により、及び/又はその荷電基数によりユニークに同定可能である。
いくつかの実施形態では、アミノ酸認識分子は、従来から公知の技術を用いて当業者により工学操作されうる。いくつかの実施形態では、望ましい性質は、ポリペプチドの末端(たとえば、N末端又はC末端)に位置するときのみ1タイプのアミノ酸に選択的に且つ高親和性で結合する能力を含みうる。さらに他の実施形態では、望ましい性質は、ポリペプチドの末端(たとえば、N末端又はC末端)に位置するとき及びポリペプチドの内部位置に位置するとき1タイプのアミノ酸に選択的に且つ高親和性で結合する能力を含みうる。いくつかの実施形態では、望ましい性質は、1タイプ超のアミノ酸に選択的に且つ低親和性で(たとえば、約50nM以上、たとえば、約50nM~約50μM、約100nM~約10μM、約500nM~約50μMのKDで)結合する能力を含む。たとえば、いくつかの態様では、本願は、ポリペプチド分解プロセス時の可逆結合相互作用を検出することによるシーケンシング方法を提供する。有利には、かかる方法は、1タイプ超のアミノ酸(たとえば、アミノ酸タイプのサブセット)に低親和性で可逆結合する認識分子を用いて実施されうる。
本明細書で用いられる場合、いくつかの実施形態では、「選択的」及び「特異的」(及びそれらの変化形、たとえば、選択的に、特異的に、選択性、特異性)という用語は、優先的結合相互作用を意味する。たとえば、いくつかの実施形態では、1タイプのアミノ酸に選択的に結合するアミノ酸認識分子は、1タイプのアミノ酸に他の1タイプのアミノ酸よりも優先的に結合する。選択的結合相互作用は、1タイプのアミノ酸(たとえば1タイプの末端アミノ酸)と他のタイプのアミノ酸(たとえば他のタイプの末端アミノ酸)とを典型的には約10倍超~100倍以上(たとえば、約1,000倍超又は10,000倍超)で識別するであろう。それゆえ、選択的結合相互作用とは、1タイプのアミノ酸を他のタイプのアミノ酸よりもユニークに同定可能ないずれかの結合相互作用を意味しうることが認識されるべきである。たとえば、いくつかの態様では、本願は、1つ以上のアミノ酸認識分子とポリペプチド分子との会合の指標となるデータを得ることによるポリペプチドシーケンシング方法を提供する。いくつかの実施形態では、データは、ポリペプチド分子のアミノ酸との一連の可逆アミノ酸認識分子結合相互作用に対応する一連のシグナルパルスを含み、且つデータは、アミノ酸のアイデンティティーを決定するために使用されうる。したがって、いくつかの実施形態では、「選択的」又は「特異的」結合相互作用とは、1タイプのアミノ酸と他のタイプのアミノ酸とを識別する検出結合相互作用を意味する。
いくつかの実施形態では、アミノ酸認識分子は、他のタイプのアミノ酸に有意に結合することなく約10-6M未満(たとえば、約10-7M未満、約10-8M未満、約10-9M未満、約10-10M未満、約10-11M未満、約10-12M未満、10-16M程度まで)の解離定数(KD)で1タイプのアミノ酸に結合する。いくつかの実施形態では、アミノ酸認識分子は、約100nM未満、約50nM未満、約25nM未満、約10nM未満、又は約1nM未満のKDで1タイプのアミノ酸(たとえば1タイプの末端アミノ酸)に結合する。いくつかの実施形態では、アミノ酸認識分子は、約50nM~約50μM(たとえば、約50nM~約500nM、約50nM~約5μM、約500nM~約50μM、約5μM~約50μM、又は約10μM~約50μM)のKDで1タイプのアミノ酸に結合する。いくつかの実施形態では、アミノ酸認識分子は、約50nMのKDで1タイプのアミノ酸に結合する。
いくつかの実施形態では、アミノ酸認識分子は、約10-6M未満(たとえば、約10-7M未満、約10-8M未満、約10-9M未満、約10-10M未満、約10-11M未満、約10-12M未満、10-16M程度まで)のKDで2タイプ以上のアミノ酸に結合する。いくつかの実施形態では、アミノ酸認識分子は、約100nM未満、約50nM未満、約25nM未満、約10nM未満、又は約1nM未満のKDで2タイプ以上のアミノ酸に結合する。いくつかの実施形態では、アミノ酸認識分子は、約50nM~約50μM(たとえば、約50nM~約500nM、約50nM~約5μM、約500nM~約50μM、約5μM~約50μM、又は約10μM~約50μM)のKDで2タイプ以上のアミノ酸に結合する。いくつかの実施形態では、アミノ酸認識分子は、約50nMのKDで2タイプ以上のアミノ酸に結合する。
いくつかの実施形態では、アミノ酸認識分子は、少なくとも0.1s-1の解離速度(Koff)で少なくとも1タイプのアミノ酸に結合する。いくつかの実施形態では、解離速度は、約0.1s-1~約1,000s-1(たとえば、約0.5s-1~約500s-1、約0.1s-1~約100s-1、約1s-1~約100s-1、又は約0.5s-1~約50s-1)である。いくつかの実施形態では、解離速度は、約0.5s-1~約20s-1である。いくつかの実施形態では、解離速度は、約2s-1~約20s-1である。いくつかの実施形態では、解離速度は、約0.5s-1~約2s-1である。
いくつかの実施形態では、KD又はkoffの値は既知の文献の値でもよく、又は値は実験的に決定されてもよい。たとえば、KD又はkoffの値は、単一分子アッセイ又はアンサンブルアッセイにおいて測定されうる(たとえば、実施例4及び図19Mを参照されたい)。いくつかの実施形態では、koffの値は、本明細書の他の箇所に記載されるように単一分子アッセイで取得したシグナルパルス情報に基づいて実験的に決定されうる。たとえば、koffの値は、平均パルス持続時間の逆数によって概算されてもよい。いくつかの実施形態では、アミノ酸認識分子は、2タイプ以上のアミノ酸に2タイプ以上の各々に対して異なるのKD又はkoffで結合する。いくつかの実施形態では、第1のタイプのアミノ酸に対する第1のKD又はkoffは、第2のタイプのアミノ酸に対する第2のKD又はkoffとは少なくとも10%(たとえば、少なくとも25%、少なくとも50%、少なくとも100%、又はそれ以上)だけ異なる。いくつかの実施形態では、KD又はkoffの第1の値と第2の値とは、約10~25%、25~50%、50~75%、75~100%、又は100%超、たとえば、約2倍、3倍、4倍、5倍、又はそれ以上に異なる。
本明細書に提供される方法及び組成物に従って、図2は、標識付認識分子の各種構成例及び使用例を示す。いくつかの実施形態では、標識付認識分子200は、発光標識210(たとえば標識)と、ポリペプチド220の1タイプ以上の末端アミノ酸に選択的に結合する認識分子(斑点形状として示される)と、を含む。いくつかの実施形態では、認識分子は、末端位置又は末端位置及び内部位置の両方の1タイプのアミノ酸又はアミノ酸のタイプのサブセット(たとえば、20未満の通常のタイプのアミノ酸)に対して選択的である。
本明細書に記載されるように、「アミノ酸認識分子」は、1分子に他の1分子よりも(たとえば、1タイプのアミノ酸に他の1タイプのアミノ酸よりも)選択的又は特異的に結合可能ないずれかのバイオ分子でありうる。いくつかの実施形態では、認識分子は、ペプチダーゼでないか又はペプチダーゼ活性を有していない。たとえば、いくつかの実施形態では、本願のポリペプチドシーケンシング方法は、ポリペプチド分子と1つ以上の認識分子及び切断試薬とを接触させることを含む。かかる実施形態では、1つ以上の認識分子は、ペプチダーゼ活性を有しておらず、且つポリペプチド分子からの1つ以上のアミノ酸の除去(たとえば、ポリペプチド分子の末端からのアミノ酸除去)は、切断試薬により実施される。
認識分子は、たとえば、合成又は組換えでありうるタンパク質及び核酸を含む。いくつかの実施形態では、認識分子は、抗体若しくは抗体の抗原結合部分、SH2ドメイン含有タンパク質若しくはその断片、又は酵素バイオ分子、たとえば、ペプチダーゼ、アミノトランスフェラーゼ、リボザイム、アプタザイム、若しくはtRNAシンテターゼ(「繰返しポリペプチド分析及び処理のための分子及び方法(MOLECULES AND METHODS FOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING)」という名称の2016年9月2日出願の米国特許出願第15/255,433号明細書に記載のアミノアシルtRNAシンテターゼ及び関連分子を含む)でありうる。
いくつかの態様では、本願は、本明細書に記載の方法又は当分野で知られた方法に従って使用するためのアミノ酸認識分子の発見及び開発に関する。いくつかの実施形態では、本願は、タンパク質ファミリーの他のホモログメンバー間に存在することが以前は知られていなかった、結合性を有するアミノ酸結合タンパク質(たとえば、ClpSタンパク質)を提供する。いくつかの実施形態では、本願は、工学操作されたアミノ酸結合タンパク質を提供する。たとえば、いくつかの実施形態では、本願は、2つ以上のアミノ酸結合タンパク質の直列コピーを有する単一ポリペプチドを含む融合構築物を提供する。
本発明者らは、本願の融合構築物が、標識バックグラウンドノイズ(たとえば、バックグラウンド蛍光)を増加させることなく、認識分子濃度を効果的に増加させることを可能にすることを認識し、且つ評価している。発明者らは、本願の融合構築物が、シーケンシング反応の確度を増加させ、及び/又はシーケンシング反応を実施するために必要な時間量を減少させることを認識し、且つ評価している。そのほか、アミノ酸結合タンパク質の2タイプ以上の異なる直列コピーを有する融合構築物を提供することによって、反応により少ない試薬しか必要とされないので、これは、シーケンスのより効率的且つ安価なアプローチを提供する。
いくつかの実施形態では、本願の認識分子は分解経路タンパク質である。認識分子として使用するのに好適な分解経路タンパク質の例としては、限定されるものではないが、N末端則経路タンパク質、たとえば、Arg/N末端則経路タンパク質、Ac/N末端則経路タンパク質、及びPro/N末端則経路タンパク質が挙げられる。いくつかの実施形態では、認識分子は、Gidタンパク質(たとえば、Gid4又はGid10タンパク質)、UBRボックスタンパク質(たとえば、UBR1、UBR2)又はそのUBRボックスドメイン含有タンパク質断片、p62タンパク質又はそのZZドメイン含有断片、及びClpSタンパク質(たとえば、ClpS1、ClpS2)から選択されるN末端則経路タンパク質である。それゆえ、いくつかの実施形態では、標識付認識分子200は、分解経路タンパク質を含む。いくつかの実施形態では、標識付認識分子200は、ClpSタンパク質である。
いくつかの実施形態では、本願の認識分子は、ClpSタンパク質、たとえば、アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS1、アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS2、シネココッカス・エロンガタス(Synechococcus elongatus)ClpS1、シネココッカス・エロンガタス(Synechococcus elongatus)ClpS2、サーモシネココッカス・エロンガタス(Thermosynechococcus elongatus)ClpS、エシェリキア・コリ(Escherichia coli)ClpS、又はプラスモジウム・ファルシパラム(Plasmodium falciparum)ClpSである。いくつかの実施形態では、認識分子は、L/Fトランスフェラーゼ、たとえば、エシェリキア・コリ(Escherichia coli)ロイシル/フェニルアラニルtRNAタンパク質トランスフェラーゼである。いくつかの実施形態では、認識分子は、D/Eロイシルトランスフェラーゼ、たとえば、ビブリオ・バルニフィカス(Vibrio vulnificus)アスパラギン酸/グルタミン酸ロイシルトランスフェラーゼBptである。いくつかの実施形態では、認識分子は、UBRタンパク質又はUBRボックスドメイン、たとえば、UBRタンパク質又はヒトUBR1及びUBR2若しくはサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)UBR1のUBRボックスドメインである。いくつかの実施形態では、認識分子は、p62タンパク質、たとえば、H.サピエンス(H.sapiens)p62タンパク質又はラタス・ノルベギカス(Rattus norvegicus)p62タンパク質又は最低限でもZZドメインを含むそれらのトランケーション変異体である。いくつかの実施形態では、認識分子は、Gid4タンパク質、たとえば、H.サピエンス(H.sapiens)GID4又はサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)GID4である。いくつかの実施形態では、認識分子は、Gid10タンパク質、たとえば、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)GID10である。いくつかの実施形態では、認識分子は、N-メリストイルトランスフェラーゼ(N-meristoyltransferase)、たとえば、リーシュマニア・メジャー(Leishmania major)N-メリストイルトランスフェラーゼ(N-meristoyltransferase)又はH.サピエンス(H.sapiens)N-メリストイルトランスフェラーゼ(N-meristoyltransferase)NMT1である。いくつかの実施形態では、認識分子は、BIR2タンパク質、たとえば、ドロソフィラ・メラノガステル(Drosophila melanogaster)BIR2である。いくつかの実施形態では、認識分子は、チロシンキナーゼ又はチロシンキナーゼのSH2ドメイン、たとえば、H.サピエンス(H.sapiens)FynSH2ドメイン、H.サピエンス(H.sapiens)SrcチロシンキナーゼSH2ドメイン、又はそれらの変異体、たとえば、H.サピエンス(H.sapiens)FynSH2ドメイン三重突然変異体スーパーバインダーである。いくつかの実施形態では、認識分子は、抗体又は抗体フラグメント、たとえば、ホスホチロシンに対する一本鎖抗体可変フラグメント(scFv)又は本明細書に記載の他の翻訳後修飾アミノ酸変異体である。
表1及び表2は、アミノ酸認識分子の配列例のリストを提供する。また、表1及び表2にとくに明記されていない限り、ポリペプチドの末端位置のアミノ酸アイデンティティーに対する各分子のアミノ酸結合優先度も示される。これらの配列及び本明細書に記載の他の例は、非限定的であることが意図され、且つ本願に係る認識分子は、最低限でもペプチド認識を担うドメイン又はサブドメインを含有するそのいずれかのホモログ、変異体、又はそれらの断片を含みうることが認識されるべきである。
それゆえ、いくつかの実施形態では、本願は、表1又は表2から選択されるアミノ酸配列を有する(又は表1又は表2から選択されるアミノ酸配列に対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、80~90%、90~95%、95~99%、若しくはそれ以上のアミノ酸配列同一性を有するアミノ酸配列を有する)アミノ酸認識分子を提供する。いくつかの実施形態では、アミノ酸認識分子は、表1又は表2に列挙されるアミノ酸認識分子に対して25~50%、50~60%、60~70%、70~80%、80~90%、90~95%、若しくは95~99%、又はそれ以上のアミノ酸配列同一性を有する。いくつかの実施形態では、アミノ酸認識分子は、修飾アミノ酸認識分子であり、且つ表1又は表2に示される配列に対して1つ以上のアミノ酸の欠失、付加、又は突然変異を含む。いくつかの実施形態では、修飾アミノ酸認識分子は、表1又は表2に示される配列に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、又はそれ以上のアミノ酸(連続したアミノ酸でもそうでなくてもよい)の欠失、付加、又は突然変異を含む。
いくつかの実施形態では、アミノ酸認識分子は、2つ以上のアミノ酸結合タンパク質(たとえば、2つ以上のバインダー)の直列コピーを有する単一ポリペプチドを含む。本明細書で用いられる場合、いくつかの実施形態では、分子内のエレメントの直列配置又は配向は、エレメントが連続して融合されるように、各エレメントが線形融合内のその次のエレメントに末端同士で連結していることを意味する。たとえば、いくつかの実施形態では、2つのバインダーの直列コピーを有するポリペプチドは、一方のバインダーのC末端が他方のバインダーのN末端に融合された融合ポリペプチドを意味する。同様に、2つ以上のバインダーの直列コピーを有するポリペプチドは、第1のバインダーのC末端が第2のバインダーのN末端に融合され、第2のバインダーのC末端が第3のバインダーのN末端に融合された融合ポリペプチドなどを意味する。かかる融合ポリペプチドは、同じバインダーの複数コピー又は互いに異なるバインダーの複数コピーを含みうる。いくつかの実施形態では、本願の融合ポリペプチドは、少なくとも2つ且つ10までのバインダー(たとえば、少なくとも2つのバインダー且つ8つ、6つ、5つ、4つ、又は3つまでのバインダー)を有する。いくつかの実施形態では、本願の融合ポリペプチドは、5つ以下のバインダー(たとえば、2つ、3つ、4つ、又は5つのバインダー)を有する。それゆえ、いくつかの実施形態では、標識付認識分子200は、本願の融合ポリペプチドを含む。
いくつかの実施形態では、単一コーディング配列の発現により、2つ以上の独立結合部位を有する単一全長ポチペプチドが生成される場合、融合ポリペプチドは、フレキシブルリンカーをコードするセグメントによって分離されるモノマー形バインダーサブユニットをコードするセグメントを含む単一コーディング配列の発現によって提供される。いくつかの実施形態では、1つ以上のモノマー形サブユニット(たとえば、バインダー)は、ClpSタンパク質である。いくつかの実施形態では、ClpSサブユニットは、同一でも非同一でもよい。非同一の場合、ClpSサブユニットは、同親ClpSタンパク質の識別可能な変異体であってもよく、又はそれらは、互いに異なる親ClpSに由来してもよい。いくつかの実施形態では、融合ポリペプチドは、1つ以上のClpSモノマー及び1つ以上の非ClpSモノマーを含む。いくつかの実施形態では、モノマー形サブユニットは、非ClpSモノマーを含む。いくつかの実施形態では、モノマー形サブユニットは、1つ以上の分解経路タンパク質を含む。たとえば、いくつかの実施形態では、モノマー形サブユニットは、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有タンパク質断片、p62タンパク質若しくはそのZZドメイン含有断片、及びClpSタンパク質(たとえば、ClpS1、ClpS2)のうちの1つ以上を含む。
いくつかの実施形態では、融合ポリペプチドの少なくとも1つのバインダーは、表1又は表2から選択されるアミノ酸配列を有する(又は表1又は表2から選択されるアミノ酸配列に対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、80~90%、90~95%、95~99%、若しくはそれ以上のアミノ酸配列同一性を有するアミノ酸配列を有する)。いくつかの実施形態では、融合ポリペプチドの各バインダーは、表1又は表2から選択されるアミノ酸配列に少なくとも80%(たとえば、80~90%、90~95%、95~99%、又はそれ以上)のアミノ酸配列同一性を有する(又は表1又は表2から選択されるアミノ酸配列に対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、80~90%、90~95%、95~99%、若しくはそれ以上のアミノ酸配列同一性を有するアミノ酸配列を有する)。いくつかの実施形態では、融合ポリペプチドのバインダーは、修飾され、表1又は表2に示される配列に対して1つ以上のアミノ酸欠失、付加、又は突然変異を含む。いくつかの実施形態では、融合ポリペプチドのバインダーは、表1又は表2に示される配列に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、又はそれ以上のアミノ酸(連続したアミノ酸でもそうでなくてもよい)の欠失、付加、又は突然変異を含む。
いくつかの実施形態では、融合ポリペプチドのバインダーは、1つ以上のアミノ酸の同一セットを認識する。いくつかの実施形態では、融合ポリペプチドのバインダーは、1つ以上のアミノ酸の識別可能なセットを認識する。いくつかの実施形態では、融合ポリペプチドのバインダーは、アミノ酸の重複するセットを認識する。いくつかの実施形態では、融合ポリペプチドのバインダーが同じアミノ酸を認識する場合、それらは、同じ特性パルスパターンを有するアミノ酸又は互いに異なる特性パルスパターンを有するアミノ酸を認識しうる。
いくつかの実施形態では、融合ポリペプチドのバインダーは、共有結合、又は一方のバインダーのC末端ともう一方のバインダーのN末端とを共有結合的に連結するリンカーのいずれかによって、末端同士で連結される。本願の融合ポリペプチドとの関連で、リンカーは、2つのバインダーを連結するが2つのバインダーのいずれに対応するポリペプチド配列の部分も形成しない、融合ポリペプチド内の1つ以上のアミノ酸を意味する。いくつかの実施形態では、リンカーは、少なくとも2つのアミノ酸(たとえば、少なくとも2つ、3つ、4つ、5つ、6つ、8つ、10、15、25、50、100、又はそれ以上のアミノ酸)を含む。いくつかの実施形態では、リンカーは、5つまで、10まで、15まで、25まで、50まで、又は100までのアミノ酸を含む。いくつかの実施形態では、リンカーは、約2つ~約200のアミノ酸(たとえば、約2つ~約100、約5つ~約50、約2つ~約20、約5つ~約20、又は約2つ~約30のアミノ酸)を含む。
いくつかの実施形態では、本願は、2つ以上のアミノ酸結合タンパク質の直列コピーを有する単一ポリペプチドをコードする核酸を提供する。いくつかの実施形態では、核酸は、本願の融合ポリペプチドをコードする発現構築物である。いくつかの実施形態では、発現構築物は、少なくとも2つ且つ10までのバインダー(たとえば、少なくとも2つのバインダー且つ8つ、6つ、5つ、4つ、又は3つまでのバインダー)を有する融合ポリペプチドをコードする。いくつかの実施形態では、発現構築物は、5つ以下のバインダー(たとえば、2つ、3つ、4つ、又は5つのバインダー)を有する融合ポリペプチドをコードする。
いくつかの実施形態では、アミノ酸認識分子は、1つ以上の標識を含む。いくつかの態様では、1つ以上の標識は、明細書の他の箇所に記載されるように発光標識又は伝導率標識を含む。いくつかの実施形態では、1つ以上の標識は、1つ以上のポリオール部分(たとえば、デキストラン、ポリビニルピロリドン、ポリエチレングリコール、ポリプロピレングリコール、ポリオキシエチレングリコール、及びポリビニルアルコールから選択された1つ以上の部分)を含む。たとえば、いくつかの実施形態では、アミノ酸認識分子は、PEG化される(PEGylated)。いくつかの実施形態では、ポリオール修飾(たとえば、PEG化)は、基体(たとえば、シーケンシングチップ)表面への非特異的な固着を制限しうる。いくつかの実施形態では、ポリオール修飾は、アミノ酸認識分子とその他の認識分子との間、アミノ酸認識分子と切断試薬との間、又はアミノ酸認識分子とシーケンシング反応混合物中に存在するその他の種との間のアグリゲーション又は相互作用を制限しうる。PEG化は、認識分子(たとえば、ClpSタンパク質などのアミノ酸結合タンパク質)をmPEG4-NHSエステルとインキュベートすることによって実施可能であり、これによって表面露出リシン側鎖などの一級アミンが標識される。他のタイプのPEG、及びポリオール修飾の他の方法は、当分野で知られている。
いくつかの実施形態では、1つ以上標識は、タグ配列を含む。たとえば、いくつかの実施形態では、アミノ酸認識分子は、アミノ酸結合以外の1つ以上の機能を提供するタグ配列を含む。いくつかの実施形態では、タグ配列は、認識分子のビオチン化(たとえば、ビオチン部分及びビスビオチン部分をはじめとする1つ以上のビオチン分子の取込み)を可能にする少なくとも1つのビオチンリガーゼ認識配列を含む。いくつかの実施形態では、タグ配列は、直列に配向された2つのビオチンリガーゼ認識配列を含む。いくつかの実施形態では、ビオチンリガーゼ認識配列は、配列とビオチン分子との間の共有結合を触媒するビオチンリガーゼによって認識されるアミノ酸配列を意味する。タグ配列の各ビオチンリガーゼ認識配列は、ビオチン部分に共有結合されうるため、複数のビオチンリガーゼ認識配列を有するタグ配列は、複数のビオチン分子に共有結合されうる。1つ以上のビオチンリガーゼ認識配列を有するタグ配列の領域は、ビオチン化タグ又はビオチン化配列と一般的にいいうる。いくつかの実施形態では、ビスビオチン又はビスビオチン部分は、直列に配向された2つのビオチンリガーゼ認識配列に結合する2つのビオチンを意味しうる。
タグ配列中の機能配列の追加の例としては、認識分子の精製及び/又は修飾に有用な精製タグ、切断部位、及び他の部分が挙げられる。表3は、タグ配列の非限定的配列のリストを提供し、そのうちのいずれか1つ以上は、本願のアミノ酸認識分子のいずれか1つとの組合せで(たとえば、表1に示される配列との組合せで)使用されうる。表3に示されるタグ配列は、非限定的であることが意図され、且つ本願に係る認識分子は、認識分子ポリペプチド或いは内部位置のN末端又はC末端にタグ配列(たとえば、Hisタグ及び/又はビオチン化タグ)のいずれか1つ以上を含みうるか、N末端とC末端との間がスプリットされうるか、さもなければ当技術分野で実用されるように他の形で再構成されうることが認識されるべきである。
いくつかの実施形態では、本願の認識分子は、シーケンシング方法のペプチダーゼ及び/又は核酸アプトマーなどの他のタイプのアミノ酸結合分子と共に使用されうるアミノ酸結合タンパク質である。プロテアーゼ又はプロテイナーゼともいわれるペプチダーゼは、ペプチド結合の加水分解を触媒する酵素である。ペプチダーゼは、ポリペプチドをより短い断片に消化するとともに、内部又は末端でそれぞれポリペプチド鎖を切断するエンドペプチダーゼ及びエキソペプチダーゼに一般に分類されうる。いくつかの実施形態では、標識付認識分子200は、エキソペプチダーゼ活性又はエンドペプチダーゼ活性を不活性化するように修飾されたペプチダーゼを含む。こうして、標識付認識分子200は、ポリペプチドからアミノ酸を切断することもなく選択的に結合する。さらに他の実施形態では、本願のアミノ酸結合タンパク質とともに、エキソペプチダーゼ又はエンドペプチダーゼ活性を不活性化するように修飾されていないペプチダーゼが使用されうる。たとえば、いくつかの実施形態では、標識付認識分子は標識付エキソペプチダーゼ202を含む。
本願のある特定の実施形態によれば、タンパク質シーケンシング方法は、ポリペプチドの末端の繰返し検出及び切断を含みうる。いくつかの実施形態では、アミノ酸の検出及び切断の両工程を実施する単一試薬として標識付エキソペプチダーゼ202が使用されうる。一般的に描かれるように、いくつかの実施形態では、標識付エキソペプチダーゼ202は、ポリペプチドのN末端又はC末端のアミノ酸にそれぞれ選択的に結合してそれを切断するようにアミノペプチダーゼ活性又はカルボキシペプチダーゼ活性を有する。ある特定の実施形態では、標識付エキソペプチダーゼ202は、本明細書に記載されるように標識付エキソペプチダーゼ202を非切断標識付認識分子200として使用すべく選択的結合性を保持するように当業者により触媒的に不活性化されうることが認識されるべきである。
エキソペプチダーゼは、一般に、そのアミノ末端の遊離アミノ基又はそのカルボキシ末端の遊離カルボキシル基の少なくとも1つを含むポリペプチド基質を必要とする。いくつかの実施形態では、本願に係るエキソペプチダーゼは、ポリペプチドの末端又はその近くの結合を加水分解する。いくつかの実施形態では、エキソペプチダーゼは、ポリペプチド末端から3残基以下の結合を加水分解する。たとえば、いくつかの実施形態では、エキソペプチダーゼにより触媒される単一加水分解反応は、ポリペプチド末端から単一アミノ酸、ジペプチド、又はトリペプチドを切断する。
いくつかの実施形態では、本願に係るエキソペプチダーゼは、アミノ末端又はカルボキシ末端からそれぞれ単一アミノ酸を切断するアミノペプチダーゼ又はカルボキシペプチダーゼである。いくつかの実施形態では、本願に係るエキソペプチダーゼは、アミノ末端又はカルボキシ末端からそれぞれジペプチドを切断するジペプチジルペプチダーゼ又はペプチジルジペプチダーゼである。さらに他の実施形態では、本願に係るエキソペプチダーゼは、アミノ末端からトリペプチドを切断するトリペプチジルペプチダーゼである。各クラス又はそのサブクラスのペプチダーゼの分類及び活性は、周知であり且つ文献に記載されている(たとえば、グルプリヤ,V.S.(Gurupriya,V.S.)及びロイ,S.C.(Roy,S.C.)著、「男性生殖におけるプロテアーゼ及びプロテアーゼ阻害剤(Proteases and Protease Inhibitors in Male Reproduction)」、プロテアーゼ・イン・フィジオロジー・アンド・パソロジー(Proteases in Physiology and Pathology)、p.195~216、2017年、並びにブリックス,K.(Brix,K.)及びストッカー,W.(Stocker,W.)著、「プロテアーゼ:構造及び機能(Proteases:Structure and Function)」、第1章)を参照されたい)。いくつかの実施形態では、本願に係るペプチダーゼは、ポリペプチド末端から3アミノ酸超を除去する。それゆえ、いくつかの実施形態では、ペプチダーゼは、たとえば、特定位置(たとえば、特定アミノ酸の前又は後)で優先的に切断するエンドペプチダーゼである。いくつかの実施形態では、エンドペプチダーゼ活性のポリペプチド切断産物のサイズは、分析されるポリペプチド内の切断部位(たとえばアミノ酸)の分布に依存するであろう。
本願に係るエキソペプチダーゼは、シーケンシング反応の方向性に基づいて選択又は工学操作されうる。たとえば、ポリペプチドのアミノ末端からカルボキシ末端へのシーケンシングの実施形態では、エキソペプチダーゼはアミノペプチダーゼ活性を含む。逆に、ポリペプチドのカルボキシ末端からアミノ末端へのシーケンシングの実施形態では、エキソペプチダーゼはカルボキシペプチダーゼ活性を含む。特異的カルボキシ末端アミノ酸を認識するとともに標識付エキソペプチダーゼとして使用されうるか又は本明細書に記載の非切断標識付認識分子として使用するように不活性化されうるカルボキシペプチダーゼの例は、文献に記載されている(たとえば、ガルシア-ゲレロ,M.C.(Garcia-Guerrero,M.C.)ら著、2018年、米国科学アカデミー紀要(PNAS)、第115巻、第17号を参照されたい)。
切断試薬及び/又は認識分子として使用するのに好適なペプチダーゼとしては、1タイプ以上のアミノ酸に選択的に結合するアミノペプチダーゼが挙げられる。いくつかの実施形態では、アミノペプチダーゼ認識分子は、アミノペプチダーゼ活性を不活性化するように修飾される。いくつかの実施形態では、アミノペプチダーゼ切断試薬は、非特異的であるため、ポリペプチドの末端からほとんど又はすべてのタイプのアミノ酸を切断する。いくつかの実施形態では、アミノペプチダーゼ切断試薬は、ポリペプチドの末端の他のタイプのアミノ酸と比較してより効率良くポリペプチドの末端から1タイプ以上のアミノ酸を切断する。たとえば、本願に係るアミノペプチダーゼは、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セレノシステイン、セリン、トレオニン、トリプトファン、チロシン、及び/又はバリンを特異的に切断する。いくつかの実施形態では、アミノペプチダーゼはプロリンアミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼはプロリンイミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼはグルタミン酸/アスパラギン酸特異的アミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼはメチオニン特異的アミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼは表4に示されるアミノペプチダーゼである。いくつかの実施形態では、アミノペプチダーゼ切断試薬は表4に示されるペプチド基質を切断する。
いくつかの実施形態では、アミノペプチダーゼは非特異的アミノペプチダーゼである。いくつかの実施形態では、非特異的アミノペプチダーゼは亜鉛メタロプロテアーゼである。いくつかの実施形態では、非特異的アミノペプチダーゼは表5に示されるアミノペプチダーゼである。いくつかの実施形態では、非特異的アミノペプチダーゼは表5に示されるペプチド基質を切断する。
それゆえ、いくつかの実施形態では、本願は、表4若しくは表5から選択されるアミノ酸配列を有する(又は表4若しくは表5から選択されるアミノ酸配列に対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、80~90%、90~95%、95~99%、若しくはそれ以上のアミノ酸配列同一性を有するアミノ酸配列を有する)アミノペプチダーゼ(たとえば、アミノペプチダーゼ認識分子、アミノペプチダーゼ切断試薬)を提供する。いくつかの実施形態では、アミノペプチダーゼは、表4又は表5に列挙されるアミノペプチダーゼに対して25~50%、50~60%、60~70%、70~80%、80~90%、90~95%、若しくは95~99%、又はそれ以上のアミノ酸配列同一性を有する。いくつかの実施形態では、アミノペプチダーゼは、修飾アミノペプチダーゼであり、且つ表4又は表5に示される配列に対して1つ以上のアミノ酸突然変異を含む。
2つ以上のアミノ酸配列を比較する目的では、第1のアミノ酸配列と第2のアミノ酸配列との間の「配列同一性(sequence identity)」(本明細書では「アミノ酸同一性」ともいう)のパーセントは、[第2のアミノ酸配列中の対応する位置のアミノ酸残基と同一の第1のアミノ酸配列中のアミノ酸残基の数]を[第1のアミノ酸配列中のアミノ酸残基の合計数]で除算して[100]を乗算することにより計算されうる。この場合、第1のアミノ酸配列と比較して第2のアミノ酸配列中のアミノ酸残基の各欠失、挿入、置換、又は付加は、単一アミノ酸残渣(位置)の差とみなされる。代替的に、2つのアミノ酸配列間の配列同一性の程度は、既知のコンピュータアルゴリズムを用いて計算されうる(たとえば、スミス(Smith)及びウォーターマン(Waterman)著、1970年、アドバンシズ・イン・アプライド・マセマティックス(Adv.Appl.Math.)、第2巻、p.482cの局所相同性アルゴリズムにより、ニードルマン(Needleman)及びブンシュ(Wunsch)著、ジャーナル・オブ・モレキュラー・バイオロジー(J.Mol.Biol.)、1970年、第48巻、p.443の相同性アライメントアルゴリズムにより、ピアソン(Pearson)及びリップマン(Lipman)著、米国科学アカデミー紀要(Proc.Natl.Acad.Sci.USA)、1998年、第85巻、p.2444の類似性検索法により、又はブラスト(Blast)、クラスタル(Clustal)、オメガ(Omega)として利用可能なアルゴリズム若しくは他の配列アライメントアルゴリズムをたとえば標準的設定値を用いてコンピュータで実行することにより)。通常、以上で概説した計算方法に従って2つのアミノ酸配列間の「配列同一性」のパーセントを決定する目的では、最大数のアミノ酸残基を有するアミノ酸配列は「第1」のアミノ酸配列とみなされ、他のアミノ酸配列は「第2」のアミノ酸配列とみなされるであろう。
追加的又は代替的に、配列間の同一性に関して2つ以上の配列が評価されうる。2つ以上の核酸配列又はアミノ酸配列との関連での「同一」又はパーセント「同一性」という用語は、同一の2つ以上の配列又はサブ配列を意味する。以上の配列比較アルゴリズムの1つを用いて又は手動アライメント及び目視検査により測定される比較ウィンドウ又は指定領域にわたり比較して最大の対応が得られるようにアライメントしたときに、2つの配列が指定領域にわたり又は全配列にわたり同一(たとえば、少なくとも80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、又は99.9%同一)の特定パーセントのアミノ酸残基又はヌクレオチドを有する場合、2つの配列は「実質的に同一」である。任意選択的に、同一性は、少なくとも約25、50、75、若しくは100アミノ酸長の領域にわたり、又は100~150、150~200、100~200、若しくは200アミノ酸長以上の領域にわたり存在する。
追加的又は代替的に、配列間のアライメントに関して2つ以上の配列が評価されうる。2つ以上の核酸配列又はアミノ酸配列との関連での「アライメント」又はパーセント「アライメント」という用語は、同一の2つ以上の配列又はサブ配列を意味する。以上の配列比較アルゴリズムの1つを用いて又は手動アライメント及び目視検査により測定される比較ウィンドウ又は指定領域にわたり比較して最大の対応が得られるようにアライメントしたときに、2つの配列が指定領域にわたり又は全配列にわたり同一(たとえば、少なくとも80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、又は99.9%同一)の特定パーセントのアミノ酸残基又はヌクレオチドを有する場合、2つの配列は「実質的にアラインメント」させる。任意選択的に、アライメントは、少なくとも約25、50、75、若しくは100アミノ酸長の領域にわたり、又は100~150、150~200、100~200、若しくは200アミノ酸長以上の領域にわたり存在する。
タンパク質分子のほか、核酸分子は、本願に係るアミノ酸認識分子として使用するのに有利なさまざまな性質を有する。
核酸アプタマーは、高親和性且つ選択性で所望の標的に結合するように工学操作された核酸分子である。それゆえ、核酸アプタマーは、当技術分野で公知の選択及び/又は富化技術を用いて所望のタイプのアミノ酸に選択的に結合するように工学操作されうる。そのため、いくつかの実施形態では、認識分子は、核酸アプタマー(たとえば、DNAアプタマー、RNAアプタマー)を含む。図2に示されるように、いくつかの実施形態では、標識付認識分子は、1タイプの末端アミノ酸に選択的に結合する標識付アプタマー204である。たとえば、いくつかの実施形態では、標識付アプタマー204は、本明細書に記載されるように、ポリペプチドの末端の1タイプのアミノ酸(たとえば、単一タイプのアミノ酸又はアミノ酸のタイプのサブセット)に選択的に結合する。示されていないが、標識付アプタマー204は、本願の方法に従ってポリペプチドのいずれかの位置(たとえば、ポリペプチドの末端位置又は末端位置及び内部位置)の1タイプのアミノ酸に選択的に結合するように工学操作されうることが認識されるべきである。
核酸アプタマーは、高親和性且つ選択性で所望の標的に結合するように工学操作された核酸分子である。それゆえ、核酸アプタマーは、当技術分野で公知の選択及び/又は富化技術を用いて所望のタイプのアミノ酸に選択的に結合するように工学操作されうる。そのため、いくつかの実施形態では、認識分子は、核酸アプタマー(たとえば、DNAアプタマー、RNAアプタマー)を含む。図2に示されるように、いくつかの実施形態では、標識付認識分子は、1タイプの末端アミノ酸に選択的に結合する標識付アプタマー204である。たとえば、いくつかの実施形態では、標識付アプタマー204は、本明細書に記載されるように、ポリペプチドの末端の1タイプのアミノ酸(たとえば、単一タイプのアミノ酸又はアミノ酸のタイプのサブセット)に選択的に結合する。示されていないが、標識付アプタマー204は、本願の方法に従ってポリペプチドのいずれかの位置(たとえば、ポリペプチドの末端位置又は末端位置及び内部位置)の1タイプのアミノ酸に選択的に結合するように工学操作されうることが認識されるべきである。
いくつかの実施形態では、標識付認識分子は、結合誘起発光を有する標識を含む。たとえば、いくつかの実施形態では、標識付アプタマー206は、ドナー標識212とアクセプター標識214とを含み、図2のパネル(I)及び(II)に例示されるように機能する。パネル(I)に描かれるように、遊離分子としての標識付アプタマー206は、ドナー標識212及びアクセプター標識214が標識間の検出可能FRETを制限する距離(たとえば約10nm以上)だけ分離されるコンフォメーションをとる。パネル(II)に描かれるように、選択的結合分子としての標識付アプタマー206は、ドナー標識212及びアクセプター標識214が標識間の検出可能FRETを促進する距離内(たとえば約10nm以下)にあるコンフォメーションをとる。さらに他の実施形態では、標識付アプタマー206は、クエンチング部分を含むとともに分子ビーコンと同様に機能し、標識付アプタマー206の発光は、遊離分子として内部クエンチされ、且つ選択的結合分子として回復させる(たとえば、ハマグチ(Hamaguchi)ら著、2001年、アナリティカル・バイオケミストリー(Analytical Biochemistry)、第294巻、p.126~131を参照されたい)。理論により拘束されることを望むものではないが、結合誘起発光のこれらの及び他のタイプの機構は、バックグラウンド発光を有利に低減又は排除して本明細書に記載の方法の全体的感度及び確度を増加させると考えられる。
シールド認識分子(Shielded Recognition Molecules)
本明細書に記載の実施形態によれば、単一分子ポリペプチドシーケンシング方法は、励起光で表面固定ポリペプチドに照明することと、アミノ酸認識分子に装着された標識により生成される発光を検出することと、により行うことが可能である。いくつかの場合には、標識により生成される放射及び/又は非放射減衰は、ポリペプチドに光損傷をもたらしうる。たとえば、図3Aは、表面に固定されたポリペプチドに認識分子が会合して示されるシーケンシング反応例を例示する。
本明細書に記載の実施形態によれば、単一分子ポリペプチドシーケンシング方法は、励起光で表面固定ポリペプチドに照明することと、アミノ酸認識分子に装着された標識により生成される発光を検出することと、により行うことが可能である。いくつかの場合には、標識により生成される放射及び/又は非放射減衰は、ポリペプチドに光損傷をもたらしうる。たとえば、図3Aは、表面に固定されたポリペプチドに認識分子が会合して示されるシーケンシング反応例を例示する。
励起照明の存在下で、標識は、検出可能会合イベントをもたらす放射減衰を介して蛍光を生成可能である。しかしながら、いくつかの場合には、標識は、反応性酸素種300の形成をもたらす可能性のある非放射減衰を生成する。反応性酸素種300は、最終的に固定ペプチドを損傷する可能性があり、その場合、ポリペプチドの完全配列情報を得る前に反応が終了することになる。この光損傷は、たとえば、露出ポリペプチド末端(トップの中抜き矢印)、内部位置(中間の中抜き矢印)、表面にポリペプチドを装着する表面リンカー(ボトムの中抜き矢印)で発生する可能性がある。
本発明者らは、光損傷を軽減可能であり且つアミノ酸認識分子へのシールディングエレメントの取込みにより認識時間を延長可能であることを見いだした。図3Bは、シールド302を含むシールド認識分子を用いたシーケンシング反応例を例示する。シールド302は、標識とポリペプチドとの間の距離の増加を提供する共有結合性又は非共有結合性連結基を形成するので、標識-ポリペプチド分離距離にわたるフリーラジカル減衰に起因して反応性酸素種300からの損傷作用を低減可能である。シールド302はまた、反応性酸素種300並びに放射及び/又は非放射減衰からの損傷を吸収することにより標識からポリペプチドをシールドする立体バリアを提供可能である。
理論により拘束されることを望むものではないが、認識成分と標識成分との間に位置決めされるシールドは、標識成分により放出される放射及び/又は非放射減衰を吸収、偏向、さもなければブロックできると考えられる。いくつかの実施形態では、シールドは、1つ以上の標識(たとえば発光標識)と1つ以上のアミノ酸認識分子との相互作用を防止又は制限する。いくつかの実施形態では、シールドは、1つ以上の標識とアミノ酸認識分子に会合する1つ以上の分子(たとえば、認識分子に会合するポリペプチド)との相互作用を防止又は制限する。それゆえ、いくつかの実施形態では、シールドという用語は、認識成分と標識成分との間に形成される連結基のいずれかの部分により提供される保護効果又はシールディング効果を一般に意味しうる。
いくつかの実施形態では、シールドは、1つ以上のアミノ酸認識分子(たとえば認識成分)と1つ以上の標識(たとえば標識成分)とに装着される。いくつかの実施形態では、認識成分及び標識成分は、シールド上の非近接部位に装着される。たとえば、1つ以上のアミノ酸認識分子は、シールドの第1の側に装着可能であり、且つ1つ以上の標識は、シールドの第2の側に装着可能であり、この場合、シールドの第1及び第2の側は互いに離れている。いくつかの実施形態では、装着部位は、シールドのおおよそ両側である。
シールドが認識分子に装着される部位とシールドが標識に装着される部位との間の距離は、スペースを介する線形測定又はシールドの表面全体にわたる非線形測定でありうる。シールド上の認識分子結合部位と標識結合部位との間の距離は、シールドの3次元構造のモデリングにより測定可能である。いくつかの実施形態では、この距離は、少なくとも2nm、少なくとも4nm、少なくとも6nm、少なくとも8nm、少なくとも10nm、少なくとも12nm、少なくとも15nm、少なくとも20nm、少なくとも30nm、少なくとも40nm、又はそれ以上でありうる。代替的に、シールド上の認識分子と標識との相対位置は、シールドの構造を二次曲面(たとえば、楕円体、楕円柱)として扱うことにより記述可能である。いくつかの実施形態では、認識分子結合部位及び標識結合部位は、シールドを表す楕円体形状の周りの距離の少なくとも1/8の距離だけ離れている。いくつかの実施形態では、認識分子及び標識は、シールドを表す楕円体形状の周りの距離の少なくとも1/4の距離だけ離れている。いくつかの実施形態では、認識分子及び標識は、シールドを表す楕円体形状の周りの距離の少なくとも1/3の距離だけ離れている。いくつかの実施形態では、認識分子及び標識は、シールドを表す楕円体形状の周りの距離の1/2の距離だけ離れている。
シールドのサイズは、アミノ酸認識分子がポリペプチドに会合するときに標識がポリペプチドに直接接触できないか又はその可能性が低くなるようにすべきである。シールドのサイズはまた、アミノ酸認識分子がポリペプチドに会合するときに装着標識が検出可能になるようにすべきである。たとえば、サイズは、装着発光標識が励起される照明体積内にあるようにすべきである。
実施者がシールディング効果を評価可能なさまざまなパラメータが存在することが認識されるべきである。一般に、シールディングエレメントの効果は、シールディングエレメントを有する組成物とシールディングエレメントの欠如した組成物との間の比較アセスメントを行うことにより評価可能である。たとえば、シールディングエレメントは、アミノ酸認識分子の認識時間を増加させることが可能である。いくつかの実施形態では、認識時間とは、本明細書に記載のポリペプチドシーケンシング反応時に認識分子とポリペプチドとの間の会合イベントが観測可能な時間の長さを意味する。いくつかの実施形態では、認識時間は、アミノ酸認識分子がシールディングエレメントを欠如しているがそれ以外は類似又は同一である点を除けば同一条件下で実施されるポリペプチドシーケンシング反応と比べて、約10~25%、25~50%、50~75%、75~100%、又は100%超、たとえば、約2倍、3倍、4倍、5倍、又はそれ以上に増加する。いくつかの実施形態では、シールディングエレメントは、シーケンシング確度(sequencing accuracy)及び/又は配列リード長を増加させることが可能である(たとえば、以上に記載の比較条件下で実施されるシーケンシング反応と比べて、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも25%、又はそれ以上に)。
それゆえ、いくつかの態様では、本願は、少なくとも1つのアミノ酸認識分子と、少なくとも1つの検出可能標識と、認識分子と標識との間に共有結合性又は非共有結合性連結基を形成するシールディングエレメント(たとえば「シールド」)と、を含むシールド認識分子を提供する。いくつかの実施形態では、シールディングエレメントは、少なくとも2nm、少なくとも5nm、少なくとも10nm、少なくとも12nm、少なくとも15nm、少なくとも20nm、又はそれ以上の長さである(たとえば、水性溶液中で)。いくつかの実施形態では、シールディングエレメントは、約2nm~約100nmの長さ(たとえば、約2nm~約50nm、約10nm~約50nm、約20nm~約100nm)である。
いくつかの実施形態では、シールド(たとえばシールディングエレメント)は、1つ以上のアミノ酸認識分子(たとえば認識成分)と1つ以上の標識(たとえば標識成分)との間に共有結合性又は非共有結合性連結基を形成する。本明細書で用いられる場合、いくつかの実施形態では、共有結合性及び非共有結合性の連結又は連結基とは、シールドへの認識成分及び標識成分の装着の性状を意味する。
いくつかの実施形態では、共有結合性連結又は共有結合性連結基とは、共有結合又は一連のコンティグ共有結合を介して認識成分及び標識成分の各々に装着されるシールドを意味する。一方又は両方の成分の共有結合性装着は、当技術分野で公知の共有結合性コンジュゲーション方法により達成可能である。たとえば、いくつかの実施形態では、一方又は両方の成分をシールドに装着するために、クリックケミストリー技術(たとえば、銅触媒、歪み促進、銅フリーのクリックケミストリーなど)を使用可能である。かかる方法は、一般に、反応性部分間に1つ以上の共有結合を形成するように一方の反応性部分を他方の反応性部分にコンジュゲートすることを含む。それゆえ、いくつかの実施形態では、シールドの第1の反応性部分は、共有結合性装着を形成するように認識成分又は標識成分の第2の反応性部分に接触される。反応性部分の例としては、限定されるものではないが、反応性のアミン、アジド、アルキン、ニトロン、アルケン(たとえばシクロアルケン)、テトラジン、テトラゾール、並びにクリック反応及び類似のカップリング技術に好適な他の反応性部分が挙げられる。
いくつかの実施形態では、非共有結合性連結又は非共有結合性連結基とは、1つ以上の非共有結合性カップリング手段、たとえば、限定されるものではないがレセプター-リガンド相互作用及びオリゴヌクレオチド鎖ハイブリダイゼーションを介して認識成分及び標識成分の一方又は両方に装着されるシールドを意味する。レセプター-リガンド相互作用の例は、本明細書に提供されており、限定されるものではないが、タンパク質-タンパク質複合体、タンパク質-リガンド複合体、タンパク質-アプタマー複合体、及びアプタマー-核酸複合体が挙げられる。オリゴヌクレオチド鎖ハイブリダイゼーションに対する種々の構成及びストラテジーは、本明細書に記載されており、当技術分野で公知である(たとえば、米国特許出願公開第2019/0024168号明細書を参照されたい)。
いくつかの実施形態では、シールド302は、バイオ分子やデンドリティックポリマーなどのポリマーを含む。図3Cは、ポリマーシールドの例及び本願のシールド認識分子の構成を示す。第1のシールド構築物304は、タンパク質シールド330の例を示す。いくつかの実施形態では、タンパク質シールド330は、認識分子と標識との間に共有結合性連結基を形成する。たとえば、いくつかの実施形態では、タンパク質シールド330は、1つ以上の共有結合を介して、たとえば、タンパク質シールド330の天然又は非天然アミノ酸の側鎖を介する共有結合性装着により、認識分子及び標識の各々に装着される。いくつかの実施形態では、アミノ酸認識分子は、末端同士で連結された少なくとも1つのアミノ酸結合タンパク質及びタンパク質シールド330を有する単一ポリペプチドを含む。
それゆえ、いくつかの態様では、本願は、末端同士で連結(たとえば、C末端とN末端との融合)したアミノ酸結合タンパク質及びタンパク質シールドを有する融合ポリペプチドを含むシールド認識分子を提供する。いくつかの実施形態では、バインダー及びタンパク質シールドは、共有結合、又は一方のタンパク質のC末端と他方のタンパク質のN末端とを共有結合的に連結するリンカーのいずれかによって、末端同士で連結される。いくつかの実施形態では、融合ポリペプチドとの関連でのリンカーは、バインダーとタンパク質シールドとを連結するがバインダー又はタンパク質シールドのいずれに対応するポリペプチド配列の部分も形成しない、融合ポリペプチド内の1つ以上のアミノ酸を意味する。いくつかの実施形態では、リンカーは、少なくとも2つのアミノ酸(たとえば、少なくとも2つ、3つ、4つ、5つ、6つ、8つ、10、15、25、50、100、又はそれ以上のアミノ酸)を含む。いくつかの実施形態では、リンカーは、5つまで、10まで、15まで、25まで、50まで、又は100までのアミノ酸を含む。いくつかの実施形態では、リンカーは、約2つ~約200のアミノ酸(たとえば、約2つ~約100、約5つ~約50、約2つ~約20、約5つ~約20、又は約2つ~約30のアミノ酸)を含む。
いくつかの実施形態では、融合ポリペプチドのタンパク質シールドは、少なくとも10kDaの分子量を有するタンパク質である。たとえば、いくつかの実施形態では、タンパク質シールドは、少なくとも10kDa且つ500kDaまで(たとえば、約10kDa~約250kDa、約10kDa~約150kDa、約10kDa~約100kDa、約20kDa~約80kDa、約15kDa~約100kDa、又は約15kDa~約50kDa)の分子量を有するタンパク質である。いくつかの実施形態では、融合ポリペプチドのタンパク質シールドは、少なくとも25のアミノ酸を含むタンパク質である。たとえば、いくつかの実施形態では、タンパク質シールドは、少なくとも25且つ1,000までのアミノ酸(たとえば、約100~約1,000のアミノ酸、約100~約750のアミノ酸、約500~約1,000のアミノ酸、約250~約750のアミノ酸、約50~約500のアミノ酸、約100~約400のアミノ酸、又は約50~約250までのアミノ酸)を含むタンパク質である。
いくつかの実施形態では、タンパク質シールドは、1つ以上のタグタンパク質を含むポチペプチドである。いくつかの実施形態では、タンパク質シールドは、少なくとも2つのタグタンパク質を含むポチペプチドである。いくつかの実施形態では、少なくとも2つのタグタンパク質は同一である(たとえば、ポリペプチドは、タグタンパク質配列の少なくとも2つのコピーを含む)。いくつかの実施形態では、少なくとも2つのタグタンパク質は互いに異なる(たとえば、ポリペプチドは、少なくとも2つの互いに異なるタグタンパク質配列を含む)。タグタンパク質の例は、限定されるものではないが、Fasciola hepatica 8kDa抗原(Fh8)、マルトース結合タンパク質(MBP)、N利用物質(N-utilization substance)(NusA)、チオレドキシン(Trx)、ユビキチン類似因子(SUMO)、グルタチオンSトランスフェラーゼ(GST)、溶解性エンハンサーペプチド配列(SET)、プロテインGのIgGドメインB1(GB1)、プロテインAのIgG繰り返しドメインZZ(ZZ)、突然変異デハロゲナーゼ(HaloTag)、溶解性エンハンシングユビキタスタグ(SNUT)、17キロダルトンタンパク質(Skp)、T7ファージタンパク質キナーゼ(T7PK)、E.コリ(E.coli)選択プロテインA(EspA)、モノマー形バクテリオファージT7 0.3タンパク質(Orcタンパク質;Mocr)、E.コリ(E.coli)トリプシン阻害剤(Ecotin)、カルシウム結合タンパク質(CaBP)、ストレス応答性ヒ酸レダクターゼ(ArsC)、翻訳開始因子IF2のN末端(IF2ドメインI)、ストレス応答性タンパク質(たとえば、RpoA、SlyD、Tsf、RpoS、PotD、Crr)、及びE.コリ(E.coli)酸性タンパク質(たとえば、msyB、msyD、rpoD)が挙げられる。たとえば、コスタ,S.(Costa,S.)ら著、「エシェリキア・コリ(Escherichia coli)におけるタンパク質溶解度、精製、及び免疫原性のための融合タグ:新規Fh8システム(Fusion tags for protein solubility, purification and immunogenicity in Escherichia coli: the novel Fh8 system)」、フロンティア・イン・マイクロバイオロジー(Front Microbiol.)、2014年2月19日、第5巻、p.63(関連の内容は参照により本明細書に組み込まれる)を参照されたい。
本明細書に記載されるように、本願のシールディングエレメントは、アミノ酸認識分子の標識成分により放出される放射及び/又は非放射減衰を有利に吸収、偏向、さもなければブロックしうる。そのため、融合ポリペプチドの好適なタンパク質シールドは、当業者によって容易に選択可能であることが認識されるべきである。たとえば、発明者らは、酵素(たとえば、DNAポリメラーゼ、グルタチオンSトランスフェラーゼ)、輸送タンパク質(たとえば、マルトース結合タンパク質)、蛍光タンパク質(たとえば、GFP)、及び商業的に入手可能なタグタンパク質(SNAP-tag(登録商標))に融合したアミノ酸結合タンパク質を有するポリペプチドを含む融合ポリペプチドとの関連でのさまざまなタイプのタンパク質シールドの使用を実証してきた発明者らは、直列に配向されたタンパク質シールドの複数コピーを有する融合ポリペプチドの使用をさらに実証してきた。
それゆえ、いくつかの実施形態では、本願は、1つ以上の直列配向タンパク質シールドに融合された1つ以上の直列配向アミノ酸結合タンパク質を有する融合ポリペプチドを提供する。いくつかの実施形態では、融合ポリペプチドが、2つ以上の直列配向バインダー及び/又は2つ以上の直列配向シールドを含む場合、2つ以上のバインダーのうちの1つの末端は、2つ以上のシールドのうちの1つの末端と末端同士で連結される。2つ以上のバインダーの直列コピーを有する融合ポリペプチドは、本明細書の他の箇所に記載され、いくつかの実施形態では、かかる融合物は、2つ以上のバインダーのうちの1つと末端同士で連結されたタンパク質シールドをさらに含む。
いくつかの実施形態では、タンパク質シールド330は、認識分子と標識との間に非共有結合性連結基を形成する。たとえば、いくつかの実施形態では、タンパク質シールド330は、1つ以上のリガンド結合部位を含むモノマー形又はマルチマー形のタンパク質である。いくつかの実施形態では、非共有結合基は、1つ以上のリガンド結合部位に結合する1つ以上のリガンド部分を介して形成される。タンパク質シールドによって形成される非共有結合のさらなる例は、本明細書の他の箇所に記載される。
第2のシールド構築物306は、第2のオリゴヌクレオチド鎖334にハイブリダイズされた第1のオリゴヌクレオチド鎖332を含む2本鎖核酸シールドの例を示す。示されるように、いくつかの実施形態では、2本鎖核酸シールドは、第1のオリゴヌクレオチド鎖332に装着された認識分子と、第2のオリゴヌクレオチド鎖334に装着された標識と、を含みうる。こうして、2本鎖核酸シールドは、オリゴヌクレオチド鎖ハイブリダイゼーションを介して認識分子と標識との間に非共有結合性連結基を形成する。いくつかの実施形態では、認識分子及び標識は、同一オリゴヌクレオチド鎖に装着可能であり、これは一本鎖核酸シールド又は他のオリゴヌクレオチド鎖とのハイブリダイゼーションを介して2本鎖核酸シールドを提供可能である。いくつかの実施形態では、鎖ハイブリダイゼーションは、認識分子と標識との間の分離をさらに増強するために連結基内の剛性の増加を提供可能である。
シールディングエレメント302が核酸を含む場合、標識と認識分子との間の分離距離は、核酸上の装着部位間の距離により測定可能である(たとえば、直接装着又は1つ以上の追加のシールドポリマーを介するなどによる間接装着)。いくつかの実施形態では、核酸上の装着部位間の距離は、標識と認識分子との間に存在する核酸内のヌクレオチドの数により測定可能である。ヌクレオチドの数とは、一本鎖核酸中のヌクレオチド塩基の数又は2本鎖核酸中のヌクレオチド塩基対の数のどちらかを意味しうることを理解すべきである。
それゆえ、いくつかの実施形態では、認識分子の装着部位及び標識の装着部位は、5~200ヌクレオチド(たとえば、5~150ヌクレオチド、5~100ヌクレオチド、5~50ヌクレオチド、10~100ヌクレオチド)だけ分離されうる。核酸中のいずれの位置も、認識分子、標識、又は1つ以上の追加のポリマーシールドに対する装着部位として機能しうることが認識されるべきである。いくつかの実施形態では、装着部位は、5’末端若しくは3’末端又はおおよそその位置或いは核酸の鎖に沿った内部位置でありうる。
第2のシールド構築物306の非限定的構成は、鎖ハイブリダイゼーションを介して非共有結合性連結を形成するシールドの例を例示する。非共有結合性連結のさらなる例は、オリゴヌクレオチドシールド336を含む第3のシールド構築物308により例示される。いくつかの実施形態では、オリゴヌクレオチドシールド336は、認識分子に結合して非共有結合性連結を形成する核酸アプタマーである。いくつかの実施形態では、認識分子は、核酸アプタマーであり、且つオリゴヌクレオチドシールド336は、アプタマーにハイブリダイズして非共有結合性連結を形成するオリゴヌクレオチド鎖を含む。
第4のシールド構築物310は、デンドリティックポリマーシールド338の例を示す。本明細書で用いられる場合、いくつかの実施形態では、デンドリティックポリマーとは、一般にポリオール又はデンドリマーを意味する。ポリオール及びデンドリマーは、当技術分野に記載されており、特定構成に最適化された分岐状デンドリティック構造を含みうる。いくつかの実施形態では、デンドリティックポリマーシールド338は、ポリエチレングリコール、テトラエチレングリコール、ポリ(アミドアミン)、ポリ(プロピレンイミン)、ポリ(プロピレンアミン)、カルボシラン、ポリ(L-リシン)、又はそれらの1つ以上の組合せを含む。
デンドリマー又はデンドロンは、コアの周りが典型的には対称であり且つ球状3次元形態をとりうる繰返し分岐状分子である。たとえば、アストリュク(Astruc)ら著、2010年、ケミカル・レビューズ(Chem.Rev.)、第110巻、p.1857を参照されたい。本願のシールドへのかかる構造の取込みは、標識とそれに会合する1つ以上のバイオ分子(たとえば、認識分子及び/又は認識分子に会合するポリペプチド)との間の接触の立体阻害を介して保護効果を提供可能である。分子の1次構造の変動を介するデンドリマーの化学的性質及び物理的性質のリファインメントは、デンドリマー表面の潜在的機能化を含めて要望に応じたシールディング効果の調整を可能にする。デンドリマーは、当技術分野で公知の広範にわたる材料及び分岐反応を用いてさまざまな技術により合成されうる。かかる合成変動は、必要に応じたデンドリマーの性質のカスタマイズを可能にする。本願のシールドに従って使用可能なポリオール及びデンドリマー化合物の例としては、限定されるものではないが米国特許出願公開第20180346507号明細書に記載の化合物が挙げられる。
図3Dは、本願のシールド認識分子のさらなる構成例を示す。タンパク質-核酸構築物312は、タンパク質の形態の1つ超のポリマーと2本鎖核酸とを含むシールドの例を示す。いくつかの実施形態では、シールドのタンパク質部分は、共有結合性連結を介してシールドの核酸部分に装着される。いくつかの実施形態では、装着は、非共有結合性連結を介する。たとえば、いくつかの実施形態では、シールドのタンパク質部分は、1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する1価又は多価タンパク質である。いくつかの実施形態では、シールドのタンパク質部分はアビジンタンパク質を含む。
いくつかの実施形態では、本願のシールド認識分子はアビジン核酸構築物314である。いくつかの実施形態では、アビジン核酸構築物314は、アビジンタンパク質340と2本鎖核酸とを含むシールドを含む。本明細書に記載されるように、直接的又は本明細書に記載の1つ以上の追加のシールドポリマーを介するなどにより間接的のどちらかで、1つ以上のアミノ酸認識分子と1つ以上の標識との間に非共有結合性連結を形成するために、アビジンタンパク質340が使用されうる。
アビジンタンパク質はビオチン結合タンパク質であり、一般にアビジンタンパク質の4つのサブユニットの各々にビオチン結合部位を有する。アビジンタンパク質としては、たとえば、アビジン、ストレプトアビジン、トラプタビジン、タマビジン、ブラダビジン、キセナビジン(xenavidin)、並びにそれらのホモログ及び変異体が挙げられる。いくつかの場合には、モノマー形、ダイマー形、又はテトラマー形のアビジンタンパク質を使用可能である。いくつかの実施形態では、アビジンタンパク質複合体のアビジンタンパク質は、テトラマー形(たとえばホモテトラマー)のストレプトアビジンである。いくつかの実施形態では、アビジンタンパク質のビオチン結合部位は、1つ以上のアミノ酸認識分子、1つ以上の標識、及び/又は本明細書に記載の1つ以上の追加のシールドポリマーに対する装着部位を提供する。
アビジンタンパク質複合体の例示的な図は、図3Dのインセットパネルに示される。インセットパネルに示されるように、アビジンタンパク質340は、ビオチン部分(白丸として示される)に結合可能なタンパク質の4つのサブユニットの各々に結合部位342を含みうる。アビジンタンパク質340の多価性は、例示目的で一般的に示される各種連結構成を可能にしうる。たとえば、いくつかの実施形態では、アビジンタンパク質340への単一装着点を提供するためにビオチン連結部分344を使用可能である。いくつかの実施形態では、アビジンタンパク質340への2つの装着点を提供するためにビスビオチン連結部分346を使用可能である。アビジン核酸構築物314により例示されるように、アビジンタンパク質複合体は、認識分子と標識との間の分離距離の増加を提供するためにトランス構成を形成する2つのビスビオチン連結部分により形成されうる。
アビジンタンパク質シールド構成の各種さらなる例が示される。第1のアビジン構築物316は、ビスビオチン連結部分を介して認識分子に及び個別ビオチン連結部分を介して2つの標識に装着されたアビジンシールドの例を示す。第2のアビジン構築物318は、個別ビオチン連結部分を介して2つ認識分子に及びビスビオチン連結部分を介して標識に装着されたアビジンシールドの例を示す。第3のアビジン構築物320は、個別ビオチン連結部分を介して2つ認識分子に及び核酸の各鎖のビオチン連結部分を介して標識付核酸に装着されたアビジンシールドの例を示す。第4のアビジン構築物322は、個別ビスビオチン連結部分を介して認識分子及び標識付核酸に装着されたアビジンシールドの例を示す。示されるように、標識は、標識と核酸との間のデンドリティックポリマーにより認識分子からさらにシールドされる。第5のアビジン構築物324は、2つのアビジンシールド認識分子に装着された内部標識325の例を示す。示されるように、各認識分子は、ビスビオチン連結部分を介して異なるアビジンタンパク質に装着され、内部標識326は、個別ビスビオチン連結部分を介して両方のアビジンタンパク質に装着される。
図3A~3Dに示されるシールド認識分子の構成例は、例示する目的で提供されることが認識されるべきである。本発明者らは、シールド認識分子の認識成分と標識成分との間に共有結合性又は非共有結合性の連結を形成する1つ以上の異なるポリマーを用いた各種他のシールド構成を構想した。例として、図3Eは、本願に係るシールド構成のモジュール性を例示する。
図3Eのトップに示されるように、シールド認識分子は、一般に認識成分350とシールディングエレメント352と標識成分354とを含む。例示を容易にするために、認識成分350は、1つのアミノ酸認識分子として描かれ、且つ標識成分354は、1つの標識として描かれる。
本願のシールド認識分子は、1つ以上のアミノ酸認識分子と1つ以上の標識とに装着されたシールディングエレメント352を含みうることが認識されるべきである。認識成分350が1つ超の認識分子を含む場合、各認識分子は、シールディングエレメント352上の1つ以上の装着部位でシールディングエレメント352に装着可能である。いくつかの実施形態では、認識成分350は、本明細書の他の箇所に記載されるように、2つ以上のアミノ酸結合タンパク質の直列コピーを有する単一ポリペプチド融合構築物を含む。標識成分354が1つ超の標識を含む場合、各標識は、シールディングエレメント352上の1つ以上の装着部位でシールディングエレメント352に装着可能である。標識成分354は、単一の装着点を有するように一般的に示されるが、この態様に限定されない。たとえば、いくつかの実施形態では、アビジン構築物324によって例示されるように、1つ超の装着点を有する内部標識が使用されて1つ超の認識成分350及び/又はシールディングエレメント352に連結してもよい。
いくつかの実施形態では、シールディングエレメント352はタンパク質360を含む。いくつかの実施形態では、タンパク質360は1価又は多価タンパク質である。いくつかの実施形態では、タンパク質360は、モノマー又はマルチマータンパク質、たとえば、タンパク質ホモダイマー、タンパク質ヘテロダイマー、タンパク質オリゴマー、又は他のタンパク質分子である。いくつかの実施形態では、シールディングエレメント352は、少なくとも1つの他の分子に非共有結合されたタンパク質により形成されるタンパク質複合体を含む。たとえば、いくつかの実施形態では、シールディングエレメント352は、タンパク質-タンパク質複合体362を含む。いくつかの実施形態では、タンパク質-タンパク質複合体362は、他のタンパク質分子に特異的に結合された1つのタンパク質分子を含む。いくつかの実施形態では、タンパク質-タンパク質複合体362は、抗原に結合された抗体又は抗体フラグメント(たとえばscFv)を含む。いくつかの実施形態では、タンパク質-タンパク質複合体362は、タンパク質リガンドに結合されたレセプターを含む。タンパク質-タンパク質複合体の追加の例としては、限定されるものではないが、トリプシン-アプロチニン、バルナーゼ-バルスター、及びコリシンE9-Im9免疫タンパク質が挙げられる。
いくつかの実施形態では、シールディングエレメント352は、タンパク質-リガンド複合体364を含む。いくつかの実施形態では、タンパク質-リガンド複合体364は、1価タンパク質と非タンパク質リガンド部分とを含む。たとえば、いくつかの実施形態では、タンパク質-リガンド複合体364は、低分子阻害剤部分に結合された酵素を含む。いくつかの実施形態では、タンパク質-リガンド複合体364は、非タンパク質リガンド部分に結合されたレセプターを含む。
いくつかの実施形態では、シールディングエレメント352は、1つ以上のリガンド部分に非共有結合された多価タンパク質により形成される多価タンパク質複合体を含む。いくつかの実施形態では、シールディングエレメント352は、1つ以上のビオチン連結部分に非共有結合されたアビジンタンパク質により形成されるアビジンタンパク質複合体を含む。構築物366、368、370、及び372は、アビジンタンパク質複合体の例示的例を提供するとともに、そのうちのいずれか1つ以上は、シールディングエレメント352に取り込まれうる。
いくつかの実施形態では、シールディングエレメント352は、2つのビスビオチン連結部分に結合されたアビジンタンパク質を含むツーウェイアビジン複合体366を含む。いくつかの実施形態では、シールディングエレメント352は、2つのビオチン連結部分とビスビオチン連結部分とに結合されたアビジンタンパク質を含むスリーウェイアビジン複合体368を含む。いくつかの実施形態では、シールディングエレメント352は、4つのビオチン連結部分に結合されたアビジンタンパク質を含むフォーウェイアビジン複合体370を含む。
いくつかの実施形態では、シールディングエレメント352は、アビジンタンパク質に工学操作により導入された1つ又は2つの非機能性結合部位を含むアビジンタンパク質を含む。たとえば、いくつかの実施形態では、シールディングエレメント352は、2つのサブユニットの各々でビオチン連結部分に結合されたアビジンタンパク質を含む2価アビジン複合体372を含み、この場合、アビジンタンパク質は、2つの他のサブユニットの各々で非機能性リガンド結合部位348を含む。示されるように、いくつかの実施形態では、2価アビジン複合体372はトランス2価アビジンタンパク質を含むが、所望の実現形態に依存してシス2価アビジンタンパク質が使用されうる。いくつかの実施形態では、アビジンタンパク質は3価アビジンタンパク質である。いくつかの実施形態では、3価アビジンタンパク質は、1つのサブユニットに非機能性リガンド結合部位348を含むとともに、3つのビオチン連結部分に結合されるか又は1つのビオチン連結部分及び他のサブユニットでビスビオチン連結部分に結合される。
いくつかの実施形態では、シールディングエレメント352は、デンドリティックポリマー374を含む。いくつかの実施形態では、デンドリティックポリマー374は、本明細書の他の箇所に記載されるようにポリオール又はデンドリマーである。いくつかの実施形態では、デンドリティックポリマー374は、分岐状ポリオール又は分岐状デンドリマーである。いくつかの実施形態では、デンドリティックポリマー374は、単糖-TEG、二糖、N-アセチル単糖、TEMPO-TEG、トロロックス-TEG又はグリセロールデンドリマーを含む。本願のシールド認識分子に係る有用なポリオールの例としては、ポリエーテルポリオール及びポリエステルポリオール、たとえば、ポリエチレングリコール、ポリプロピレングリコール、及び当技術分野で周知の類似のかかるポリマーが挙げられる。いくつかの実施形態では、デンドリティックポリマー374は、次式:-(CH2CH2O)n-(式中、nは1~500(両端の値を含む)の整数である)の化合物を含む。いくつかの実施形態では、デンドリティックポリマー374は、次式:-(CH2CH2O)n-(式中、nは1~100(両端の値を含む)の整数である)の化合物を含む。
いくつかの実施形態では、シールディングエレメント352は核酸を含む。いくつかの実施形態では、核酸は一本鎖である。いくつかの実施形態では、標識成分354は、一本鎖核酸の一方の末端(たとえば、5’末端又は3’末端)に直接的又は間接的に装着され、且つ認識成分350は、一本鎖核酸の他方の末端(たとえば、3’末端又は5’末端)に直接的又は間接的に装着される。たとえば、一本鎖核酸は、核酸の5’末端に装着された標識と、核酸の3’末端に装着されたアミノ酸認識分子と、を含みうる。
いくつかの実施形態では、シールディングエレメント352は二本鎖核酸376を含む。示されるように、いくつかの実施形態では、二本鎖核酸376は、鎖ハイブリダイゼーションを介して認識成分350と標識成分354との間に非共有結合性連結を形成可能である。しかしながら、いくつかの実施形態では、二本鎖核酸376は、同一オリゴヌクレオチド鎖への装着を介して認識成分350と標識成分354との間に共有結合性連結を形成可能である。いくつかの実施形態では、標識成分354は、二本鎖核酸の一方の末端に直接的又は間接的に装着され、且つ認識成分350は、二本鎖核酸の他方の末端に直接的又は間接的に装着される。たとえば、二本鎖核酸は、一方の鎖の5’末端に装着された標識と、他方の鎖の5’末端に装着されたアミノ酸認識分子と、を含みうる。
いくつかの実施形態では、シールディングエレメント352は、シールドの立体バルクを増加させるのに有用でありうる1つ以上の構造モチーフを形成する核酸を含む。核酸構造モチーフの例としては、限定されるものではないが、ステム-ループ、スリーウェイジャンクション(たとえば、2つ以上のステム-ループモチーフにより形成される)、フォーウェイジャンクション(たとえばホリデイジャンクション)、及びバルジループが挙げられる。
いくつかの実施形態では、シールディングエレメント352は、ステム-ループ378を形成する核酸を含む。ステム-ループ又はヘアピンループは、オリゴヌクレオチド鎖がフォールドして同一鎖の他のセクションと塩基対を形成するときに形成されるオリゴヌクレオチド鎖上のヌクレオチドの不対ループである。いくつかの実施形態では、ステム-ループ378の不対ループは、3~10ヌクレオチドを含む。それゆえ、ステム-ループ378は、ハイブリダイズしてステムを形成する反転相補配列を有するオリゴヌクレオチド鎖の2つの領域による形成可能であり、この場合、2つの領域は、不対ループを形成する3~10ヌクレオチドにより分離される。いくつかの実施形態では、ステム-ループ378のステムは、A/Tヌクレオチドと比較して生じる追加の水素結合相互作用により安定性の増加を提供可能な1つ以上のG/Cヌクレオチドを有するように設計可能である。いくつかの実施形態では、ステム-ループ378のステムは、不対ループ配列に直接近接するG/Cヌクレオチドを含む。いくつかの実施形態では、ステム-ループ378のステムは、不対ループ配列に近接する最初の2、3、4、又は5ヌクレオチド内にG/Cヌクレオチドを含む。いくつかの実施形態では、ステム-ループ378の不対ループは、1つ以上の装着部位を含む。いくつかの実施形態では、装着部位は、不対ループ中の脱塩基部位に発生する。いくつかの実施形態では、装着部位は、不対ループの塩基に発生する。
いくつかの実施形態では、ステム-ループ378は、二本鎖核酸により形成される。本明細書に記載されるように、いくつかの実施形態では、二本鎖核酸は、第1及び第2のオリゴヌクレオチド鎖の鎖ハイブリダイゼーションを介して非共有結合性連結基を形成可能である。しかしながら、いくつかの実施形態では、シールディングエレメント352は、ステム-ループモチーフを形成する一本鎖核酸を含んで共有結合性連結基を提供する。いくつかの実施形態では、シールディングエレメント352は、2つ以上のステム-ループモチーフを形成する核酸を含む。たとえば、いくつかの実施形態では、核酸は2つのステム-ループモチーフを含む。いくつかの実施形態では、モチーフが一緒になってスリーウェイジャンクションを形成するように、1つのステム-ループモチーフのステムは他のステムに近接する。いくつかの実施形態では、シールディングエレメント352は、フォーウェイジャンクション378を形成する核酸を含む。いくつかの実施形態では、フォーウェイジャンクション378は、2つ以上のオリゴヌクレオチド鎖(たとえば、2、3、又は4つのオリゴヌクレオチド鎖)のハイブリダイゼーションを介して形成される。
いくつかの実施形態では、シールディングエレメント352は、図3Eの360、362、364、366、368、370、372、374、376、378、及び380から選択される1つ以上のポリマーを含む。360、362、364、366、368、370、372、374、376、378、及び380の各々に示される連結部分及び装着部位は、例示目的で示されており、好ましい連結部位又は装着部位の構成を描くことを意図するものではないことが認識されるべきである。
いくつかの態様では、本願は、式(II)
A-(Y)n-D
(II)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり;nは、1~10(両端の値を含む)の整数であり;且つ、Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、本願は、式(II)の可溶性アミノ酸認識分子を含む組成物を提供する。
A-(Y)n-D
(II)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり;nは、1~10(両端の値を含む)の整数であり;且つ、Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、本願は、式(II)の可溶性アミノ酸認識分子を含む組成物を提供する。
いくつかの実施形態では、Aは、複数のアミノ酸認識分子を含む。いくつかの実施形態では、複数の各アミノ酸認識分子は、Y上の異なる装着部位に装着される。いくつかの実施形態では、複数のアミノ酸認識分子の少なくとも2つは、Y上の単一装着部位に装着される。いくつかの実施形態では、アミノ酸認識分子は、認識タンパク質又は核酸アプタマー、たとえば、本明細書の他の箇所に記載のものである。
いくつかの実施形態では、検出可能標識は、発光標識又は伝導率標識である。いくつかの実施形態では、発光標識は、少なくとも1つのフルオロフォア色素分子を含む。いくつかの実施形態では、Dは、20以下のフルオロフォア色素分子を含む。いくつかの実施形態では、フルオロフォア色素分子の数とアミノ酸認識分子の数との比は、1:1~20:1である。いくつかの実施形態では、発光標識は、ドナー標識とアクセプター標識とを含む少なくとも1つのFRETペアを含む。いくつかの実施形態では、ドナー標識とアクセプター標識との比は、1:1、2:1、3:1、4:1、又は5:1である。いくつかの実施形態では、アクセプター標識とドナー標識との比は、1:1、2:1、3:1、4:1、又は5:1である。
いくつかの実施形態では、Dは20nm(200Å)未満の直径である。いくつかの実施形態では、-(Y)n-は少なくとも2nmの長さである。いくつかの実施形態では、-(Y)n-は少なくとも5nmの長さである。いくつかの実施形態では、-(Y)n-は少なくとも10nmの長さである。いくつかの実施形態では、Yの各々は、独立して、バイオ分子、ポリオール、又はデンドリマーである。いくつかの実施形態では、バイオ分子は、核酸、ポリペプチド、又は多糖である。
いくつかの実施形態では、アミノ酸認識分子は、以下の式:
A-Y1-(Y)m-D又はA-(Y)m-Y1-D
(式中、Y1は、核酸又はポリペプチドであり、且つmは、0~10(両端の値を含む)の整数である)
のうちの1つである。
A-Y1-(Y)m-D又はA-(Y)m-Y1-D
(式中、Y1は、核酸又はポリペプチドであり、且つmは、0~10(両端の値を含む)の整数である)
のうちの1つである。
いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖を介して共有結合性連結を形成する。いくつかの実施形態では、核酸は、ハイブリダイズされた第1及び第2のオリゴヌクレオチド鎖を介して非共有結合性連結を形成する。
いくつかの実施形態では、ポリペプチドは、1価又は多価タンパク質である。いくつかの実施形態では、1価又は多価タンパク質は、1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する。いくつかの実施形態では、A、Y、又はDは、リガンド部分を含む。
いくつかの実施形態では、アミノ酸認識分子は、以下の式:
A-(Y)m-Y2-D又はA-Y2-(Y)m-D
(式中、Y2は、ポリオール又はデンドリマーであり、且つmは、0~10(両端の値を含む)の整数である)
のうちの1つである。いくつかの実施形態では、ポリオール又はデンドリマーは、ポリエチレングリコール、テトラエチレングリコール、ポリ(アミドアミン)、ポリ(プロピレンイミン)、ポリ(プロピレンアミン)、カルボシラン、ポリ(L-リシン)、又はそれらの1つ以上の組合せを含む。
A-(Y)m-Y2-D又はA-Y2-(Y)m-D
(式中、Y2は、ポリオール又はデンドリマーであり、且つmは、0~10(両端の値を含む)の整数である)
のうちの1つである。いくつかの実施形態では、ポリオール又はデンドリマーは、ポリエチレングリコール、テトラエチレングリコール、ポリ(アミドアミン)、ポリ(プロピレンイミン)、ポリ(プロピレンアミン)、カルボシラン、ポリ(L-リシン)、又はそれらの1つ以上の組合せを含む。
いくつかの態様では、本願は、式(III):
A-Y1-D
(III)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Y1は、核酸又はポリペプチドであり;Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Y1が核酸であるとき、核酸は共有結合性又は非共有結合性連結基を形成する。いくつかの実施形態では、Y1がポリペプチドであるとき、ポリペプチドは、50×10-9M未満の解離定数(KD)により特徴付けられる非共有結合性連結基を形成する。
A-Y1-D
(III)
(式中、Aは、少なくとも1つのアミノ酸認識分子を含むアミノ酸結合成分であり;Y1は、核酸又はポリペプチドであり;Dは、少なくとも1つの検出可能標識を含む標識成分である)
のアミノ酸認識分子を提供する。いくつかの実施形態では、Y1が核酸であるとき、核酸は共有結合性又は非共有結合性連結基を形成する。いくつかの実施形態では、Y1がポリペプチドであるとき、ポリペプチドは、50×10-9M未満の解離定数(KD)により特徴付けられる非共有結合性連結基を形成する。
いくつかの実施形態では、Y1は、第1のオリゴヌクレオチド鎖を含む核酸である。いくつかの実施形態では、核酸は、第1のオリゴヌクレオチド鎖にハイブリダイズされた第2のオリゴヌクレオチド鎖を含む。いくつかの実施形態では、Aは、第1のオリゴヌクレオチド鎖に装着され、且つDは、第2のオリゴヌクレオチド鎖に装着される。いくつかの実施形態では、Aは、第1のオリゴヌクレオチド鎖上の第1の装着部位に装着され、且つDは、第1のオリゴヌクレオチド鎖上の第2の装着部位に装着される。いくつかの実施形態では、核酸の各オリゴヌクレオチド鎖は、150未満、100未満、又は50未満のヌクレオチドを含む。
いくつかの実施形態では、Y1は、1価又は多価タンパク質である。いくつかの実施形態では、1価又は多価タンパク質は、1価又は多価タンパク質のリガンド結合部位に装着されたリガンド部分を介して少なくとも1つの非共有結合性連結を形成する。いくつかの実施形態では、A及びDの少なくとも1つは、リガンド部分を含む。いくつかの実施形態では、ポリペプチドは、アビジンタンパク質(たとえば、アビジン、ストレプトアビジン、トラプタビジン、タマビジン、ブラダビジン、キセナビジン(xenavidin)、又はそれらのホモログ若しくは変異体)である。いくつかの実施形態では、リガンド部分はビオチン部分である。
いくつかの実施形態では、アミノ酸認識分子は、以下の式:
A-Y1-(Y)n-D又はA-(Y)n-Y1-D
(式中、Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり、且つnは、1~10(両端の値を含む)の整数である)
のうちの1つである。いくつかの実施形態では、Yの各々は、独立して、バイオ分子、ポリオール、又はデンドリマーである。
A-Y1-(Y)n-D又はA-(Y)n-Y1-D
(式中、Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり、且つnは、1~10(両端の値を含む)の整数である)
のうちの1つである。いくつかの実施形態では、Yの各々は、独立して、バイオ分子、ポリオール、又はデンドリマーである。
他の態様では、本願は、核酸と、核酸上の第1の装着部位に装着された少なくとも1つのアミノ酸認識分子と、核酸上の第2の装着部位に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子を提供する。いくつかの実施形態では、核酸は、少なくとも1つのアミノ酸認識分子と少なくとも1つの検出可能標識との間に共有結合性又は非共有結合性連結基を形成する。
いくつかの実施形態では、核酸は、第2のオリゴヌクレオチド鎖にハイブリダイズされた第1のオリゴヌクレオチド鎖を含む二本鎖核酸である。いくつかの実施形態では、第1の装着部位は、第1のオリゴヌクレオチド鎖上にあり、且つ第2の装着部位は、第2のオリゴヌクレオチド鎖上にある。いくつかの実施形態では、少なくとも1つのアミノ酸認識分子は、少なくとも1つのアミノ酸認識分子と核酸との間に共有結合性又は非共有結合性連結基を形成するタンパク質を介して第1の装着部位に装着される。いくつかの実施形態では、少なくとも1つの検出可能標識は、少なくとも1つの検出可能標識と核酸との間に共有結合性又は非共有結合性連結基を形成するタンパク質を介して第2の装着部位に装着される。いくつかの実施形態では、第1及び第2の装着部位は、核酸上の5~100ヌクレオチド塩基又はヌクレオチド塩基対だけ分離される。
さらに他の態様では、本願は、少なくとも2つのリガンド結合部位を含む多価タンパク質と、タンパク質上の第1のリガンド結合部位に結合された第1のリガンド部分を介してタンパク質に装着された少なくとも1つのアミノ酸認識分子と、タンパク質上の第2のリガンド結合部位に結合された第2のリガンド部分を介してタンパク質に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子を提供する。
いくつかの実施形態では、多価タンパク質は、4つのリガンド結合部位を含むアビジンタンパク質である。いくつかの実施形態では、リガンド結合部位は、ビオチン結合部位であり、且つリガンド部分は、ビオチン部分である。いくつかの実施形態では、ビオチン部分の少なくとも1つは、ビスビオチン部分であり、且つビスビオチン部分は、アビジンタンパク質上の2つビオチン結合部位に結合される。いくつかの実施形態では、少なくとも1つのアミノ酸認識分子は、第1のリガンド部分を含む核酸を介してタンパク質に装着される。いくつかの実施形態では、少なくとも1つの検出可能標識は、第2のリガンド部分を含む核酸を介してタンパク質に装着される。
本明細書の他の箇所に記載されるように、本願のシールド認識分子は、本願に係るポリペプチドシーケンシング方法又は当技術分野で公知のいずれかの方法で使用されうる。たとえば、いくつかの実施形態では、本明細書に提供されるシールド認識分子は、本明細書に提供されるか又はポリペプチドシーケンシング反応で複数の反応混合物の繰返しサイクリングを含みうる当技術分野で従来から知られるエドマン型分解反応で使用されうる。いくつかの実施形態では、本明細書に提供されるシールド認識分子は、単一反応混合物でアミノ酸認識及び分解を含む本願の動的シーケンシング反応で使用されうる。
ポリペプチドシーケンシング
ポリペプチドの末端アミノ酸を同定する方法に加えて、本願は、標識付認識分子を使用してポリペプチドをシーケンシングする方法を提供する。いくつかの実施形態では、シーケンシングの方法は、ポリペプチド末端を、末端アミノ酸検出及び末端アミノ酸切断の繰返しサイクルにさらすことを含みうる。たとえば、いくつかの実施形態では、本願は、ポリペプチドと本明細書に記載の1つ以上の標識付認識分子とを接触させること、及びポリペプチドをエドマン分解にさらすことを含む、ポリペプチドのアミノ酸配列を決定する方法を提供する。
ポリペプチドの末端アミノ酸を同定する方法に加えて、本願は、標識付認識分子を使用してポリペプチドをシーケンシングする方法を提供する。いくつかの実施形態では、シーケンシングの方法は、ポリペプチド末端を、末端アミノ酸検出及び末端アミノ酸切断の繰返しサイクルにさらすことを含みうる。たとえば、いくつかの実施形態では、本願は、ポリペプチドと本明細書に記載の1つ以上の標識付認識分子とを接触させること、及びポリペプチドをエドマン分解にさらすことを含む、ポリペプチドのアミノ酸配列を決定する方法を提供する。
従来のエドマン分解は、ポリペプチドの末端アミノ酸を修飾及び切断する繰返しサイクルを含み、各連続して切断されるアミノ酸が同定されて、ポリペプチドのアミノ酸配列を決定する。従来のエドマン分解の例示的例のように、ポリペプチドのN末端アミノ酸が、フェニルイソチオシアネート(PITC)を使用して修飾され、PITC誘導N末端アミノ酸を形成する。次いで、PITC誘導N末端アミノ酸は、酸性条件、塩基性条件、及び/又は高温を使用して切断される。また、PITC誘導N末端アミノ酸を切断する工程は、中性のpH又は中性に近いpHの比較的穏やかな切断条件を含む、原虫トリパノソーマ・クルーズ(Trypanosoma cruzi)由来の修飾システインプロテアーゼを使用して酵素的に達成されてもよいことが示されている。有用な酵素の非限定的例は、「繰返しポリペプチド分析及び処理のための分子及び方法(MOLECULES AND METHODS FOR ITERATIVE POLYPEPTIDE ANALYSIS AND PROCESSING)」という名称の2016年9月2日出願の米国特許出願第15/255,433号明細書に記載されている。
本願にかかる標識付認識分子を使用したエドマン分解によるシーケンシングの例は、図4に描かれる。いくつかの実施形態では、エドマン分解によるシーケンシングは、リンカー424を介して固形担体の表面430に固定される(たとえば、サンプルウェルのボトム表面又は側壁表面)ポリペプチド420を提供することを含む。いくつかの実施形態では、本明細書に記載されるように、ポリペプチド420は一方の末端(たとえば、アミノ末端アミノ酸又はカルボキシ末端アミノ酸)で固定されるため、他方の末端は、末端アミノ酸の検出及び切断のために遊離している。それゆえ、いくつかの実施形態では、本明細書に記載のエドマン分解法で使用される試薬は、ポリペプチド420の非固定(たとえば、遊離)末端で末端アミノ酸と選択的に相互作用する。こうして、ポリペプチド420は、検出及び切断の繰返しサイクルにわたって固定されたままである。この目的で、いくつかの実施形態では、リンカー424は、たとえば、化学的切断条件下での表面430からのポリペプチド420の離脱を制限するなどのために、検出及び切断に使用される条件の所望のセットに従って設計されうる。ポリペプチドを表面に固定するために好適なリンカー組成及び技術は、本明細書の他の箇所に記載されている。
本願によれば、いくつかの実施形態では、エドマン分解によるシーケンシングの方法は、ペプチド420と、1タイプ以上の末端アミノ酸に選択的に結合する1つ以上の標識付認識分子とを接触させる、工程(I)を含む。示されるように、いくつかの実施形態では、標識付認識分子400は、末端アミノ酸に選択的に結合することによってポリペプチド420と相互作用する。いくつかの実施形態では、工程(I)は、ポリペプチド420の末端アミノ酸(たとえば、遊離アミノ酸)に選択的に結合しない1つ以上の標識付認識分子のいずれかを除去することをさらに含む。
いくつかの実施形態では、方法は、標識付認識分子400を検出することによってポリペプチド420の末端アミノ酸を同定することをさらに含む。いくつかの実施形態では、検出は、標識付認識分子400からの発光を検出することを含む。本明細書に記載されるように、いくつかの実施形態では、発光は、標識付認識分子400とユニークに関連付けられるため、発光は、標識付認識分子400が選択的に結合するアミノ酸のタイプと関連付けられる。このように、いくつかの実施形態では、このアミノ酸のタイプは、標識付認識分子400の1つ以上の発光性を決定することによって同定される。
いくつかの実施形態では、エドマン分解によるシーケンシングの方法は、ポリペプチド420の末端アミノ酸を除去する、工程(2)を含む。いくつかの実施形態では、工程(2)は、ポリペプチド420から標識付認識分子400(たとえば、末端アミノ酸に選択的に結合する1つ以上の標識付認識分子のいずれか)を除去することを含む。いくつかの実施形態では、工程(2)は、末端アミノ酸と、イソチオシアネート(たとえば、PITC)とを接触させてイソチオシアネート修飾末端アミノ酸を形成することによって、ポリペプチド420の末端アミノ酸(たとえば、有利アミノ酸)を修飾することを含む。いくつかの実施形態では、イソチオシアネート修飾末端アミノ酸は、非修飾末端アミノ酸よりも切断試薬(たとえば、化学的又は酵素的切断試薬)による除去の影響を受けやすい。
いくつかの実施形態では、工程(2)は、ポリペプチド420と、イソチオシアネート修飾末端アミノ酸に特異的に結合及び切断するプロテアーゼ440とを接触させることによって末端アミノ酸を除去することを含む。いくつかの実施形態では、プロテアーゼ440は、修飾システインプロテアーゼを含む。いくつかの実施形態では、プロテアーゼ440は、トリパノソーマ・クルーズ(Trypanosoma cruzi)由来のシステインプロテアーゼなどの修飾システインプロテアーゼを含む(たとえば、ボーゴ(Borgo)ら著、2015年、プロテイン・サイエンス(Protein Science)、24巻、p.571~579を参照されたい)。さらに他の実施形態では、工程(2)は、ポリペプチド420を、イソチオシアネート修飾末端アミノ酸を切断するのに十分な化学的(たとえば、酸性、塩基性)条件にさらすことによって末端アミノ酸を除去することを含む。
いくつかの実施形態では、エドマン分解によるシーケンシングの方法は、末端アミノ酸切断の後に、ポリペプチド420を洗浄する、工程(3)を含む。いくつかの実施形態では、洗浄は、プロテアーゼ440を除去することを含む。いくつかの実施形態では、洗浄は、中性のpH条件にポリペプチド420を回復させることを含む(たとえば、酸性条件又は塩基性条件による化学的切断の後に)。いくつかの実施形態では、エドマン分解によるシーケンシングに方法は、複数のサイクルに工程(1)から(3)を繰返すことを含む。
いくつかの態様では、本願は、末端アミノ酸と、標識付アミノ酸認識分子及び標識切断分子(たとえば、標識非特異的エキソペプチダーゼ)との結合相互作用を評価することによる、リアルタイムのポリペプチドシーケンシングの方法を提供する。図5は、個別の会合イベントがシグナル出力500のシグナルパルスを生じさせるシーケンシングの方法の例を示す。図5のインセットパネルは、このアプローチによるリアルタイムシーケンシングの一般的なスキームを例示する。示されるように、標識付認識分子510は、選択的に、末端アミノ酸(明細書ではリシンとして示される)と会合(たとえば、結合)し、末端アミノ酸から解離する。これにより、末端アミノ酸を同定するために使用されうるシグナルパルス500における一連のパルスが生じる。いくつかの実施形態では、一連のパルスは、対応する末端アミノ酸のアイデンティティーの診断となりうるパルスパターン(たとえば、特性パターン)を提供する。
理論により拘束されることを望むものではないが、標識付認識分子510は、会合速度すなわち結合の「on」速度(kon)及び解離速度すなわち結合の「off」速度(koff)によって定義される結合親和性(KD)に従って選択的に結合する。速度定数koff及びkonは、パルス持続時間(たとえば、検出可能な会合イベントに対応する時間)及びパルス間持続時間(たとえば、検出可能会合イベント同士の間の時間)それぞれの重要な決定因子である。いくつかの実施形態では、これらの速度は、最高のシーケンシング確度を与えるパルス持続時間及びパルス速度(たとえば、シグナルパルスの頻度)を達成するために工学操作されうる。
インセットパネルに示すように、シーケンシング反応混合物は、標識付認識分子510のものとは異なる発光標識を含む標識付非特異的エキソペプチダーゼ520をさらに含む。いくつかの実施形態では、標識付非特異的エキソペプチダーゼ520は、標識付認識分子510の濃度よりも低い濃度で混合物中に存在する。いくつかの実施形態では、標識付特異的エキソペプチダーゼ520は、ほとんど又はすべてのタイプのアミノ酸を切断するように広範な特異性を示す。それゆえ、動的シーケンシングアプローチは、エキソペプチダーゼ切断活性によって触媒される分解反応の過程全体にわたり、ポリペプチドの末端に結合する認識分子をモニタリングすることを含みうる。
シグナル出力500の進行によって例示されるように、いくつかの実施形態では、標識付非特異的エキソペプチダーゼ520による末端アミノ酸切断はシグナルパルスを生じさせ、これらのイベントは、標識付認識分子510の結合パルスよりも低頻度で発生する。こうして、ポリペプチドのアミノ酸は、リアルタイムシーケンシングプロセスにてカウント及び/又は同定しうる。シグナル出力500にさらに例示されるように、いくつかの実施形態では、複数の標識付認識分子が使用されてもよく、各々は対応する末端アミノ酸を同定するために使用されうる診断パルスパターン(たとえば、特性パターン)を有する。たとえば、いくつかの実施形態では、互いに異なる特性パターン(シグナル出力500においてリシン、フェニルアラニン、及びグルタミンの各々によって例示されるような)は、異なるタイプの末端アミノ酸を有する1つ以上の標識付認識分子の会合に対応する。本明細書に記載されるように、1タイプより多くのアミノ酸と会合する単一認識分子は、本願に従って使用されうることが認識されるべきである。それゆえ、いくつかの実施形態では、互いに異なる特性パターンは、1つの標識付認識分子と、互いに異なるタイプの末端アミノ酸との会合に対応する。
本明細書に記載されるように、シグナルパルス情報は、一連のシグナルパルスの特性パターンに基づいてアミノ酸を同定するために使用されうる。いくつかの実施形態では、特性パターンは、各シグナルパルスがパルス持続時間を含む、複数のシグナルパルスを含む。いくつかの実施形態では、複数のシグナルパルスは、特性パターンにおけるパルス持続時間の分布の要的統計(たとえば、平均、中央値、時間減衰定数)によって特徴付けられうる。いくつかの実施形態では、特性パターンの平均パルス持続時間は、約1ミリ秒~約10秒(たとえば、約1ms~1s、約1ms~約100ms、約1ms~約10ms、約10ms~約10s、約100ms~約10s、約1s~約10s、約10ms~約100ms、又は約100ms~約500ms)である。いくつかの実施形態では、平均パルス持続時間は、約50ミリ秒~約2秒、約50ミリ秒~約500ミリ秒、又は約500ミリ秒~約2秒である。
いくつかの実施形態では、単一ポリペプチドの互いに異なるタイプのアミノ酸に対応する互いに異なる特性パルスパターンは、要的統計における統計学的有意差に基づいて互いに識別可能である。たとえば、いくつかの実施形態では、一方の特性パターンは、少なくとも10ミリ秒(たとえば、約10ms~約10s、約10ms~約1s、約10ms~約100ms、約100ms~約10s、約1s~約10s、又は約100ms~約1s)の平均パルス持続時間の差に基づいて他方の特性パターンと識別可能である。いくつかの実施形態では、平均パルス持続時間の差は、少なくとも50ms、少なくとも100ms、少なくとも250ms、少なくとも500ms、又はそれ以上である。いくつかの実施形態では、平均パルス持続時間の差は、約50ms~約1s、約50ms~約500ms、約50ms~約250ms、約100ms~約500ms、約250ms~約500ms、又は約500ms~約1sである。いくつかの実施形態では、一方の特性パターンの平均パルス持続時間は、約10~25%、25~50%、50~75%、75~100%、又は100%超、たとえば、約2倍、3倍、4倍、5倍、又はそれ以上に他方の特性パターンの平均パルス持続時間と異なる。いくつかの実施形態では、互いに異なる特性パターン間の平均パルス持続時間の差がより小さいとき、統計学的信頼性をもって一方を他方と識別するために、各特性パターン内でより多くの数のパルス持続時間が必要とされうる。
いくつかの実施形態では、特性パターンは、ポリペプチドのアミノ酸とアミノ酸に結合するための手段(たとえば、アミノ酸認識分子)との間の複数の会合イベントを一般的に意味する。いくつかの実施形態では、特性パターンは、少なくとも10の会合イベント(たとえば、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも1,000、又はそれ以上の会合イベント)を含む。いくつかの実施形態では、特性パターンは、約10~約100の会合イベント(たとえば、y約10~約500の会合イベント、約10~約250の会合イベント、約10~約100の会合イベント、又は約50~約500の会合イベント)を含む。いくつかの実施形態では、複数の会合イベントは、複数のシグナルパルスとして検出される。
いくつかの実施形態では、特性パターンは、本明細書に記載されるように要的統計によって特徴付けられうる複数のシグナルパルスを意味する。いくつかの実施形態では、特性パターンは、少なくとも10のシグナルパルス(たとえば、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも250、少なくとも500、少なくとも1,000、又はそれ以上のシグナルパルス)を含む。いくつかの実施形態では、特性パターンは、約10~約100のシグナルパルス(たとえば、約10~約500のシグナルパルス、約10~約250のシグナルパルス、約10~約100のシグナルパルス、又は約50~約500のシグナルパルス)を含む。
いくつかの実施形態では、特性パターンは、アミノ酸認識分子とポリペプチドのアミノ酸との間で、アミノ酸の除去の前の時間インターバルに発生する複数の会合イベントを意味する。いくつかの実施形態では、特性パターンは、2つの切断イベント(たとえば、アミノ酸の除去の前と以前に末端に露出していたアミノ酸の除去の後と)の間の時間インターバルに発生する複数の会合イベントを意味する。いくつかの実施形態では、特性パターンの時間インターバルは、約1分~約30分(たとえば、約1分~約20分、約1分~約10分、約5分~約20分、約5分~約15分、又は約5分~約10分)である。
いくつかの実施形態では、ポリペプチドシーケンシング反応条件は、特性パターンを有する所望の信頼水準を提供する十分な会合イベントを可能にする時間インターバルを達成するように構成されうる。これは、たとえば、試薬濃度、1つの試薬と別の試薬とのモル比(たとえば、アミノ酸認識分子と切断試薬とのモル比、1つの認識分子と別の認識分子との比、1つの切断試薬と別の切断試薬との比)、さまざまな試薬のタイプの数(たとえば、互いに異なるタイプの認識分子及び/又は切断試薬の数、切断試薬のタイプの数に対する認識分子のタイプの数)、切断活性(たとえば、ペプチダーゼ活性)、結合性(たとえば、認識分子結合の速度論的及び/又は熱力学的結合パラメータ)、試薬修飾(たとえば、相互作用ダイナミックスを変化させうるポリオール及び他のタンパク質修飾)、反応混合物組成(たとえば、pH、緩衝剤、塩、2価カチオン、界面活性剤、及び本明細書に記載の他の反応混合物組成などの1つ以上の組成物)、反応の温度、及び当業者に明らかのさまざまな他のパラメータ、並びにこれらの組み合わせを含むさまざまな性質に基づいて反応条件を構成することによって達成可能である。反応条件は、たとえば、シグナルパルス情報(たとえば、パルス持続時間、パルス間持続時間、大きさの変化)、標識化ストラトジー(たとえば、フルオロフォアの数及び/又はタイプ、リンカーがシールディングエレメントを有するか有しないか)、表面修飾(たとえば、ポリペプチド固定を含むサンプルウェル表面の修飾)、サンプル調製(たとえば、ポリペプチド断片サイズ、固定のためのポリペプチド修飾)、及び本明細書に記載のその他の態様を含む、本明細書に記載の1つ以上の態様に基づいて構成されうる。
いくつかの実施形態では、本願に係るポリペプチドシーケンシング反応は、アミノ酸の認識及び切断が単一反応混合物中で同時に発生しうる条件下で実施される。たとえば、いくつかの実施形態では、ポリペプチドシーケンシング反応は、会合イベント及び切断イベントが発生可能なpHを有する反応混合物において実施される。いくつかの実施形態では、ポリペプチドシーケンシング反応は、約6.5~約9.0のpHの反応混合物において実施される。いくつかの実施形態では、ポリペプチドシーケンシング反応は、約7.5~約8.0(たとえば、約7.0~約8.0、約7.5~約8.5、約7.5~約8.0、又は8.0~約8.5)のpHの反応混合物において実施される。
いくつかの実施形態では、ポリペプチドシーケンシング反応は、1つ以上の緩衝剤を含む反応混合物中で実施される。いくつかの実施形態では、反応混合物は、少なくとも10mM(たとえば、少なくとも20mM且つ250mMまで、少なくとも50mM、10~250mM、10~100mM、20~100mM、50~100mM、又は100~200mM)の濃度で緩衝剤を含む。いくつかの実施形態では、反応混合物は、約10mM~約50mM(たとえば、約10mM~約25mM、約25mM~約50mM、又は約20mM~約40mM)の濃度の緩衝剤を含む。緩衝剤の例としては、限定されるものではないが、HEPES(4-(2-ヒドロキシエチル)ー1ーピペラジンエタンスルホン酸)、Tris(トリス(ヒドロキシメチル)アミノメタン)、及びMOPS(3-(N-モノホリノ)プロパンスルホン酸)が挙げられる。
いくつかの実施形態では、ポリペプチドシーケンシング反応は、少なくとも10mMの濃度の塩を含む反応混合物中で実施される。いくつかの実施形態では、反応混合物は、少なくとも10mM(たとえば、少なくとも20mM、少なくとも50mM、少なくとも100mM、又はそれ以上)の塩を含む。いくつかの実施形態では、反応混合物は、約10mM~約250mM(たとえば、約20mM~約200mM、約50mM~約150mM、約10mM~約50mM、又は約10mM~約100mM)の濃度の塩を含む。塩の例としては、限定されるものではないが、塩化ナトリウム(NaCl)、酢酸ナトリウム(NaOAc)、及び酢酸カリウム(KOAc)などのナトリウム塩、カリウム塩、及び酢酸塩が挙げられる。
反応混合物中に使用するための組成物の追加の例としては、2価カチオン(たとえば、Mg2+、Co2+)及び界面活性剤(ポリソルベート20)が挙げられる。いくつかの実施形態では、反応混合物は、約0.1mM~約50mM(たとえば、約10mM~約50mM、約0.1mM~約10mM、又は約1mM~約20mM)の濃度の2価カチオンを含む。いくつかの実施形態では、反応混合物は、少なくとも0.01%(たとえば、約0.01%~約0.10%)の濃度の界面活性剤を含む。いくつかの実施形態では、反応混合物は、酸素排除系(PCA/PCD系又はピラノース/カタラーゼ/グルコース系)及び/又は1つ以上のトリプレット状態クエンチャー(たとえば、トロロックス、COT、及びNBA)などの単一分子解析に有用な1つ以上の成分を含む。
いくつかの実施形態では、ポリペプチドシーケンシング反応は、会合イベント及び切断イベントが発生しうる温度で実施される。いくつかの実施形態では、ポリペプチドシーケンシング反応は、少なくとも10℃の温度で実施される。いくつかの実施形態では、ポリペプチドシーケンシング反応は、約10℃~約50℃(たとえば、15~45℃、25℃前後、30℃前後、35℃前後、37℃前後)の温度で実施される。いくつかの実施形態では、ポリペプチドシーケンシング反応は、室温前後で実施される。
以前に詳述したように、図5に例示されるリアルタイムシーケンシングプロセスは、末端アミノ酸認識及び末端アミノ酸切断のサイクルを通常含み、認識及び切断の相対的出現は、標識付認識分子510と標識付非特異的エキソペプチダーゼ520との間の濃度差によって制御可能である。いくつかの実施形態では、濃度差は、個別アミノ酸の認識の間に検出されるシグナルパルスの数が同定に望ましい信頼区間を提供するように最適化されうる。たとえば、初期のシーケンシング反応が、望ましい信頼区間を有する特性パターンの決定を可能にするには少なすぎる切断イベント間のシグナルパルスしか有しないシグナルデータを提供する場合、シーケンシング反応は、認識分子に対して減少した濃度の非特異的エキソペプチダーゼを使用して繰り返されうる。
いくつかの実施形態では、本願に係るポリペプチドシーケンシングは、ペプチドと、1つ以上のアミノ酸認識分子及び/又は1つ以上の切断試薬(たとえば、ペプチダーゼ)を含むシーケンシング反応混合物とを接触させることによって、行うことが可能である。いくつかの実施形態では、シーケンシング反応混合物は、約10nM~約10μMの濃度でアミノ酸認識分子を含む。いくつかの実施形態では、シーケンシング反応混合物は、約500nM~約500μMの濃度で切断試薬を含む。
いくつかの実施形態では、シーケンシング反応混合物は、約100nM~約10μM、約250nM~約10μM、約100nM~約1μM、約250nM~約1μM、約250nM~約750nM、又は約500nM~約1μMの濃度でアミノ酸認識分子を含む。いくつかの実施形態では、シーケンシング反応混合物は、約100nM、約250nM、約500nM、約750nM、又は約1μMの濃度でアミノ酸認識分子を含む。
いくつかの実施形態では、シーケンシング反応混合物は、約500nM~約250nM、約500nM~約100nM、約1μM~約100μM、約500nM~約50μM、約1μM~約100μM、約10μM~約200μM、又は約10μM~約100μMの濃度で切断試薬を含む。いくつかの実施形態では、シーケンシング反応混合物は、約1μM、約5μM、約10μM、約30μM、約50μM、約70μM、又は約100μMの濃度で切断試薬を含む。
いくつかの実施形態では、シーケンシング反応混合物は、約10nM~約10μMの濃度のアミノ酸認識分子、及び約500nM~約500μMの濃度の切断試薬を含む。いくつかの実施形態では、シーケンシング反応混合物は、約100nM~約1μMの濃度のアミノ酸認識分子、及び約1μM~約100μMの濃度の切断試薬を含む。いくつかの実施形態では、シーケンシング反応混合物は、約250nM~約1μMの濃度のアミノ酸認識分子、及び約10μM~約100μMの濃度の切断試薬を含む。いくつかの実施形態では、シーケンシング反応混合物は、約500nMの濃度のアミノ酸認識分子、及び約25μM~約75μMの濃度の切断試薬を含む。いくつかの実施形態では、反応混合物中のアミノ酸認識分子の濃度及び/又は切断試薬の濃度は、本明細書の他の箇所に記載されるようである。
いくつかの実施形態では、シーケンシング反応混合物は、約500:1、約400:1、約300:1、約200:1、約100:1、約75:1、約50:1、約25:1、約10:1、約5:1、約2:1、又は約1:1のモル比で、アミノ酸認識分子と切断試薬とを含む。いくつかの実施形態では、シーケンシング反応混合物は、約10:1~約200:1のモル比で、アミノ酸認識分子と切断試薬とを含む。いくつかの実施形態では、シーケンシング反応混合物は、約50:1~約150:1のモル比で、アミノ酸認識分子と切断試薬とを含む。いくつかの実施形態では、反応混合物中のアミノ酸認識分子と切断試薬とのモル比は、約1:1,000~約1:1又は約1:1~約100:1(たとえば、約1:1,000、約1:500、約1:200、約1:100、約1:10、約1:5、約1:2、約1:1、約5:1、約10:1、約50:1、約100:1)である。いくつかの実施形態では、反応混合物中のアミノ酸認識分子と切断試薬とのモル比は、約1:100~約1:1又は約1:1~約10:1である。いくつかの実施形態では、反応混合物中のアミノ酸認識分子と切断試薬とのモル比は、本明細書の他の箇所に記載されるようである。
いくつかの実施形態では、シーケンシング反応混合物は、1つ以上のアミノ酸認識分子及び1つ以上の切断試薬を含む。いくつかの実施形態では、シーケンシング反応混合物は、少なくとも3つのアミノ酸認識分子と、少なくとも1つの切断試薬とを含む。いくつかの実施形態では、シーケンシング反応混合物は、2つ以上の切断試薬を含む。いくつかの実施形態では、シーケンシング反応混合物は、少なくとも1つ且つ10までの切断試薬(たとえば、1つ~3つの切断試薬、2つ~10の切断試薬、1つ~5つの切断試薬、3つ~10の切断試薬)を含む。いくつかの実施形態では、シーケンシング反応混合物は、少なくとも3つ且つ30までのアミノ酸認識分子(たとえば、3~25、3~20、3~10、3~5、5~30、5~20、5~10、又は10~20のアミノ酸認識分子)を含む。いくつかの実施形態では、1つ以上のアミノ酸認識分子は、表1又は表2から選択された少なくとも1つの認識分子を含む。いくつかの実施形態では、1つ以上の切断試薬は、表4から選択された少なくとも1つのペプチダーゼ分子を含む。
いくつかの実施形態では、シーケンシング反応混合物は、1つより多くのアミノ酸認識分子及び/又は1つより多くの切断試薬を含む。いくつかの実施形態では、1つより多くのアミノ酸認識分子(又は切断試薬)を含むとして記載されるシーケンシング反応混合物は、1タイプより多くのアミノ酸認識分子(又は切断試薬)を有するような混合物を意味する。たとえば、いくつかの実施形態では、シーケンシング反応混合物は、2つ以上のアミノ酸結合タンパク質を含む。いくつかの実施形態では、2つ以上のアミノ酸結合タンパク質は、2タイプ以上のアミノ酸結合タンパク質を意味する。いくつかの実施形態では、1タイプのアミノ酸結合タンパク質は、反応混合物中の別のタイプのアミノ酸結合タンパク質とは異なるアミノ酸配列を有する。いくつかの実施形態では、1タイプのアミノ酸結合タンパク質は、反応混合物中の別のタイプのアミノ酸結合タンパク質の標識とは異なる標識を有する。いくつかの実施形態では、1タイプのアミノ酸結合タンパク質は、反応混合物中の別のタイプのアミノ酸結合タンパク質が会合するアミノ酸とは異なるアミノ酸と会合(たとえば、結合)する。いくつかの実施形態では、1タイプのアミノ酸結合タンパク質は、反応混合物中の別のタイプのアミノ酸結合タンパク質が会合するアミノ酸のサブセットとは異なるアミノ酸のサブセットと会合(たとえば、結合)する。
図5に例示される例は、標識付切断試薬を使用したシーケンシングプロセスに関するが、シーケンシングプロセスは、この態様に限定されるものではない。本明細書の他の箇所に記載されるように、本発明者らは、非標識切断分子を使用した単一分子シーケンシングを実証した。いくつかの実施形態では、切断試薬が逐次末端アミノ酸を除去するおおよその頻度が知られており、たとえば、使用される酵素の周知の活性及び/又は濃度に基づく。いくつかの実施形態では、試薬による末端アミノ酸切断は、たとえばアミノ酸認識のために検出されるシグナル又は検出されるシグナルがないことに基づいて推測される。
本発明者らは、さらに、記載されるような濃度差アプローチと組み合わせて又はこれに代わって使用されうる、リアルタイムシーケンシング反応を制御するための技術を認識している。温度依存性リアルタイムシーケンシングプロセスの例は、図6に示される。パネル(I)~(III)は、温度依存性末端アミノ酸認識及びアミノ酸切断のサイクルを含むシーケンシング反応を例示する。シーケンシング反応の各サイクルを、2つの温度範囲で行った。第1の温度範囲(「T1」)は、エキソペプチダーゼ活性よりも認識分子活性に最適であり(たとえば、末端アミノ酸認識を促進するため)、第2の温度範囲(「T2」)は、認識分子活性よりもエキソペプチダーゼ活性に最適である(たとえば、末端アミノ酸切断を促進するため)。シーケンシング反応は、反応混合物温度を第1の温度範囲T1(アミノ酸認識を開始するため)と第2の温度範囲T2(アミノ酸切断を開始するため)との間で変化させることによって、進行する。それゆえ、温度依存性シーケンシングプロセスの進行は、温度によって制御され、互いに異なる温度範囲の間(たとえば、T1とT2との間)の変化は、手動プロセス又は自動プロセスによって行われうる。いくつかの実施形態では、第1の温度範囲T1の認識分子活性(たとえば、アミノ酸に対する結合親和性(KD))は、第2の温度範囲T2と比較した場合、少なくとも10倍、少なくとも100倍、少なくとも1,000倍、少なくとも10,000倍、少なくとも100,000倍、又はそれ以上に上昇する。いくつかの実施形態では、第2の温度範囲T2のエキソペプチダーゼ活性(たとえば、切断産物への基質変換の速度)は、第1の温度範囲T1と比較した場合、少なくとも2倍、10倍、少なくとも25倍、少なくとも50倍、少なくとも100倍、少なくとも1,000倍、又はそれ以上に上昇する。
いくつかの実施形態では、第1の温度範囲T1は、第2の温度範囲T2よりも低い。いくつかの実施形態では、第1の温度範囲T1は、約15℃~約40℃(たとえば、約25℃~約35℃、約15℃~約30℃、約20℃~約30℃)である。いくつかの実施形態では、第2の温度範囲T2は、約40℃~約100℃(たとえば、約50℃~約90℃、約60℃~約90℃、約70℃~約90℃)である。いくつかの実施形態では、第1の温度範囲T1は、約20℃~約40℃(たとえば、おおよそ30℃)であり、第2の温度範囲T2は、約60℃~約100℃(たとえば、おおよそ80℃)である。
いくつかの実施形態では、第1の温度範囲T1は、第2の温度範囲T2よりも高い。いくつかの実施形態では、第1の温度範囲T1は、約40℃~約100℃(たとえば、約50℃~約90℃、約60℃~約90℃、約70℃~約90℃)である。いくつかの実施形態では、第2の温度範囲T2は、約15℃~約40℃(たとえば、約25℃~約35℃、約15℃~約30℃、約20℃~約30℃)である。いくつかの実施形態では、第1の温度範囲T1は、約60℃~約100℃(たとえば、おおよそ80℃)であり、第2の温度範囲T2は、約20℃~約40℃(たとえば、おおよそ30℃)である。
パネル(I)は、エキソペプチダーゼ活性よりも認識分子活性に最適な第1の温度範囲T1以内の温度のシーケンシング反応混合物を描く。例示のために、アミノ酸配列「KFVAG...」のポリペプチドが示される。反応混合物温度が第1の温度範囲T1以内のとき、混合物内の標識付認識分子は、活性化(たとえば、復元)されて、ポリペプチド末端との会合によってアミノ酸認識を開始する。また、第1の温度範囲T1では、混合物中の標識付エキソペプチダーゼは、不活性化(たとえば、変性)されて、認識中のアミノ酸切断が阻害される。パネル(I)では、第1の認識分子は、ポリペプチド末端のリシンと可逆的に会合するように示されると同時に、標識付エキソペプチダーゼ(たとえば、PfuアミノペプチダーゼI(Pfu API))は変性して示される。いくつかの実施形態では、アミノ酸認識は、アミノ酸の切断開始前の時に、既定の持続時間だけ発生する。いくつかの実施形態では、アミノ酸認識は、アミノ酸の切断開始前の時に、認識に所望の信頼区間に到達するために必要な持続時間だけ発生する。アミノ酸認識の後に、第2の温度範囲T2以内に混合物の温度を変化させることによって、反応が進む。
パネル(II)は、認識分子活性よりもエキソペプチダーゼ活性に最適な第2の温度範囲T2以内の温度のシーケンシング反応混合物を描く。この例の例示目的のために、第2の温度範囲T2は、第1の温度範囲T1よりも高いが、試薬活性は、任意の所望の温度範囲に最適化されうることが認識されるべきである。それゆえ、パネル(I)からパネル(II)への進行は、適切な熱源を使用して反応混合物温度を上昇させることによって行われる。反応混合物が第2の温度範囲T2以内の温度に到達したとき、混合物内の標識付エキソペプチダーゼは、活性化(たとえば、復元)されて、エキソペプチダーゼ活性による末端アミノ酸切断を開始する。また、第2の温度範囲T2では、混合物中の標識付認識分子は、不活性化(たとえば、変性)されて、切断中のアミノ酸認識が阻害される。パネル(II)では、標識付エキソペプチダーゼは、末端リシン残基を切断しているように示されると同時に、標識付認識分子は変性されている。いくつかの実施形態では、アミノ酸切断は、ポリペプチド末端の逐次アミノ酸の認識開始前の時に、既定の持続時間だけ発生する。いくつかの実施形態では、アミノ酸切断は、逐次アミノ酸の認識開始前の時に、切断を検出するために必要な持続時間だけ発生する。アミノ酸切断の後に、第1の温度範囲T1以内に混合物の温度を変化させることによって、反応が進む。
パネル(III)は、シーケンシング反応における次のサイクルの開始を描き、反応混合物温度は、第1の温度範囲T1以内まで低下されている。それゆえ、この例では、パネル(II)からパネル(III)への進行は、熱源から反応混合物を除去するか、又は別の方法で反応混合物を第1の温度範囲T1以内に冷却(たとえば、能動的又は受動的に)することによって行われうる。示されるように、ポリペプチド末端のフェニルアラニンと可逆的に会合する第2の認識分子を含む標識付認識分子は、復元されているが、標識付エキソペプチダーゼは変性して示される。この例に例示されるように温度依存性の方法でアミノ酸認識及びアミノ酸切断をさらに循環させることによって、シーケンシング反応が継続される。
それゆえ、動的シーケンシングアプローチは、反応混合物中の1つ以上のタンパク質のタンパク質活性又は機能のレベルで制御される反応サイクルを含みうる。図6に描かれるとともに上述される温度依存性ポリペプチドシーケンシングプロセスは、条件依存的な認識及び切断の制御可能なサイクルによるポリペプチドシーケンシングの全般的なアプローチの例示でありうる。たとえば、いくつかの実施形態では、アプローチは、発光活性化試薬を使用した発光依存的なシーケンシングプロセスを提供する。いくつかの実施形態では、発光依存的なシーケンシングプロセスは、発光依存的なアミノ酸認識及び切断のサイクルを含む。シーケンシング反応の各サイクルは、シーケンシング反応混合物を2つの異なる発光条件にさらすことによって行われうる。第1の発光条件は、エキソペプチダーゼ活性よりも認識分子活性に最適であり(たとえば、アミノ酸認識を促進するため)、第2の発光条件は、認識分子活性よりもエキソペプチダーゼ活性に最適である(たとえば、アミノ酸切断を促進するため)。シーケンシング反応は、第1の発光条件に反応混合物をさらすこと(アミノ酸認識を開始するため)と、第2の発光条件に反応混合物をさらすこと(アミノ酸切断を開始するため)との間で変化させることによって進行する。限定されるものではないが例として、いくつかの実施形態では、2つの異なる発光条件は、第1の波長及び第2の波長を含む。
いくつかの態様では、本願は、1つ以上の標識付認識分子と末端アミノ酸及び内部アミノ酸との結合相互作用、並びに標識付非特異的エキソペプチダーゼと末端アミノ酸との結合相互作用を評価することによる、リアルタイムのポリペプチドシーケンシングの方法を提供する。図7は、図5及び6のアプローチを説明及び例示する方法が、末端位置及び内部位置の両方で1タイプのアミノ酸に選択的に結合し、解離する標識付認識アミノ酸を使用することによって改変された、シーケンシングの方法の例を示す。以前のアプローチで記載されるように、選択的結合は、シグナル出力700における一連のパルスを生じさせる。しかしながら、このアプローチでは、一連のパルスは、ポリペプチド全体のアミノ酸のタイプの数によって決定される速度で発生する。それゆえ、いくつかの実施形態では、会合イベントに対応するパルスの速度は、ポリペプチド中に現在存在するコグネート(cognate)アミノ酸の数の診断でありうる。
以前のアプローチでのように、標識付非特異的ペプチダーゼ720は、標識付認識分子710よりも比較的低い濃度で存在して、たとえば、切断イベント間に最適な時間ウィンドウを与える(図7、インセットパネル)。そのほか、特定の実施形態では、標識付非特異的ペプチダーゼ720のユニークに同定可能な発光標識は、切断イベントが発生した時を示す。ポリペプチドが繰返し切断されるにつれて、標識付認識分子710による結合に対応するパルスの速度は、末端アミノ酸が標識付非特異的ペプチダーゼ720によって切断されるたびに段階的に低下しうる。この概念は、矢印によって示される時間に切断イベントがある、時間の関数としてパルス速度を一般的に描くプロット702によって例示される。そのため、いくつかの実施形態では、切断イベント間に検出されるパターン内で生じるパルスパターン及び/又はパルスの速度に基づいて、アミノ酸を同定し、それによってポリペプチドをこのアプローチで配列決定することができる。
いくつかの実施形態では、末端ポリペプチド配列情報(たとえば、本明細書に記載されるように決定される)は、1つ以上の他の情報源から得られたポリペプチド配列情報と組み合わされてもよい。たとえば、末端ポリペプチド配列情報は、内部ポリペプチド配列情報と組み合わされる。いくつかの実施形態では、内部ポリペプチド配列情報は、本明細書に記載されるように、内部アミノ酸と会合する1つ以上のアミノ酸認識分子を使用して得ることができる。内部又は他のポリペプチド配列情報は、ポリペプチド分解プロセスの前又はその間に得ることができる。いくつかの実施形態では、これらの方法から得られた配列情報は、たとえば、1つ以上の内部アミノ酸認識分子を用いて得られた配列情報などの他の技術を用いたポリペプチド配列情報と組み合わされてもよい。
シーケンシング用サンプルの調製
ポリペプチドサンプルは、シーケンシング前に修飾可能である。いくつかの実施形態では、ポリペプチドのN末端アミノ酸又はC末端アミノ酸を修飾可能である。図8は、タンパク質サンプルから末端修飾ポリペプチドを調製するための末端修飾の非限定的例を例示する。工程(1)では、タンパク質サンプル800は、断片化されてポリペプチド断片802を生成する。ポリペプチドは、対象ポリペプチドを切断(たとえば化学的に)及び/又は消化(たとえば、トリプシンなどのペプチダーゼを用いて酵素的に)することにより断片化可能である。断片化は、標識化の前又は後に実施可能である。いくつかの実施形態では、断片化は、全タンパク質の標識化後に実施される。1つ以上のアミノ酸は、切断の前又は後に標識されて標識付ポリペプチドを生成可能である。いくつかの実施形態では、ポリペプチドは、化学的又は酵素的断片化の後にサイズ選択される。いくつかの実施形態では、より小さなポリペプチド(たとえば<2kDa)は除去され、より大きなポリペプチドは配列解析のために保持される。サイズ選択は、ゲル濾過、SEC、透析、PAGEゲル抽出、マイクロ流体張力フローなどの技術又はいずれかの他の好適な技術を用いて達成可能である。工程(2)では、ポリペプチド断片802のN末端又はC末端は、修飾されて末端修飾ポリペプチド804を生成する。いくつかの実施形態では、修飾は、固定部分を付加することを含む。いくつかの実施形態では、修飾は、カップリング部分を付加することを含む。
ポリペプチドサンプルは、シーケンシング前に修飾可能である。いくつかの実施形態では、ポリペプチドのN末端アミノ酸又はC末端アミノ酸を修飾可能である。図8は、タンパク質サンプルから末端修飾ポリペプチドを調製するための末端修飾の非限定的例を例示する。工程(1)では、タンパク質サンプル800は、断片化されてポリペプチド断片802を生成する。ポリペプチドは、対象ポリペプチドを切断(たとえば化学的に)及び/又は消化(たとえば、トリプシンなどのペプチダーゼを用いて酵素的に)することにより断片化可能である。断片化は、標識化の前又は後に実施可能である。いくつかの実施形態では、断片化は、全タンパク質の標識化後に実施される。1つ以上のアミノ酸は、切断の前又は後に標識されて標識付ポリペプチドを生成可能である。いくつかの実施形態では、ポリペプチドは、化学的又は酵素的断片化の後にサイズ選択される。いくつかの実施形態では、より小さなポリペプチド(たとえば<2kDa)は除去され、より大きなポリペプチドは配列解析のために保持される。サイズ選択は、ゲル濾過、SEC、透析、PAGEゲル抽出、マイクロ流体張力フローなどの技術又はいずれかの他の好適な技術を用いて達成可能である。工程(2)では、ポリペプチド断片802のN末端又はC末端は、修飾されて末端修飾ポリペプチド804を生成する。いくつかの実施形態では、修飾は、固定部分を付加することを含む。いくつかの実施形態では、修飾は、カップリング部分を付加することを含む。
それゆえ、本明細書に提供されるのは、表面(たとえば、タンパク質分析に使用されるチップ上のサンプルウェルの表面)への固定を可能にする部分でタンパク質及びポリペプチドの末端を修飾する方法である。いくつかの実施形態では、かかる方法は、本願に従って分析される標識付ポリペプチドの末端を修飾することを含む。さらに他の実施形態では、かかる方法は、タンパク質又は本願に従ってポリペプチド基質を分解若しくはトランスロケートする酵素の末端を修飾することを含む。
いくつかの実施形態では、タンパク質又はポリペプチドのカルボキシ末端は、(i)タンパク質又はポリペプチドの遊離カルボン酸基をブロックすることと、(ii)タンパク質又はポリペプチドを変性することと(たとえば、熱及び/又は化学的手段により)、(iii)タンパク質又はポリペプチドの遊離チオール基をブロックすることと、(iv)タンパク質又はポリペプチドを消化して遊離C末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、(v)遊離C末端カルボン酸基に機能部分をコンジュゲートすることと(たとえば化学的に)、を含む方法で修飾される。いくつかの実施形態では、本方法は、(i)の後且つ(ii)の前にタンパク質又はポリペプチドを含むサンプルを透析することをさらに含む。
いくつかの実施形態では、タンパク質又はポリペプチドのカルボキシ末端は、(i)タンパク質又はポリペプチドを変性することと(たとえば、熱及び/又は化学的手段により)、(ii)タンパク質又はポリペプチドの遊離チオール基をブロックすることと、(iii)タンパク質又はポリペプチドを消化して遊離C末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、(iv)遊離C末端カルボン酸基をブロックしてブロックC末端カルボン酸基を含む少なくとも1つのポリペプチド断片を生成することと、(v)ブロックC末端カルボン酸基に機能部分をコンジュゲートすることと(たとえば酵素的に)、を含む方法で修飾される。いくつかの実施形態では、本方法は、(iv)の後且つ(v)の前にタンパク質又はポリペプチドを含むサンプルを透析することをさらに含む。
いくつかの実施形態では、遊離カルボン酸基をブロックすることは、非修飾カルボン酸と比べて化学反応性を変化させるこの基の化学修飾を意味する。好適なカルボン酸ブロッキング方法は、当技術分野で公知であり、官能基化されるポリペプチドのカルボキシ末端カルボン酸基とは化学的に異なるように側鎖カルボン酸基を修飾するべきである。いくつかの実施形態では、遊離カルボン酸基をブロックすることは、ポリペプチドの遊離カルボン酸基をエステル化又はアミド化することを含む。いくつかの実施形態では、遊離カルボン酸基をブロックすることは、たとえば、ポリペプチドとメタノール性HClとを反応させることにより、ポリペプチドの遊離カルボン酸基をメチルエステル化することを含む。遊離カルボン酸基をブロックするのに有用な試薬及び技術の追加の例としては、限定されるものではないが、4-スルホ-2,3,5,6-テトラフルオロフェノール(STP)及び/又はカルボジイミド、たとえば、N-(3-ジメチルアミノプロピル)-N’-エチルカルボジイミド塩酸塩(EDAC)、ウロニウム試薬、ジアゾメタン、フィッシャーエステル化用のアルコール及び酸、NHSエステルを形成するためのN-ヒドロキシルスクシンイミド(NHS)の使用(潜在的に後続のエステル形成又はアミン形成への中間体として)、又はカルボニルジイミダゾール(CDI)との反応、又は混合アンヒドリドの形成、又は潜在的にエステル若しくはアミドのどちらかの形成を介して、カルボン酸を修飾若しくはブロックするいずれかの他の方法が挙げられる。
いくつかの実施形態では、遊離チオール基をブロックすることは、非修飾チオールと比べて化学反応性を変化させるこの基の化学修飾を意味する。いくつかの実施形態では、遊離チオール基をブロックすることは、タンパク質又はポリペプチドの遊離チオール基を還元及びアルキル化することを含む。いくつかの実施形態では、還元及びアルキル化は、ポリペプチドと、ジチオトレイトール(DTT)並びにヨードアセトアミド及びヨード酢酸の一方又は両方と、を接触させることにより行われる。使用されうる追加及び代替のシステイン還元試薬の例は周知であり、限定されるものではないが、2-メルカプトエタノール、トリス(2-カルボキシエチル)ホスフィン塩酸塩(TCEP)、トリブチルホスフィン、ジチオブチルアミン(DTBA)、又はチオール基を還元可能ないずれかの試薬が挙げられる。使用されうる追加及び代替のシステインブロッキング(たとえば、システインアルキル化)試薬の例は周知であり、限定されるものではないが、アクリルアミド、4-ビニルピリジン、N-エチルマレイミド(NEM)、N-ε-マレイミドカプロン酸(EMCA)、又はジスルフィド結合形成を防止するようにシステインを修飾するいずれかの試薬が挙げられる。
いくつかの実施形態では、消化は酵素消化を含む。いくつかの実施形態では、消化は、消化条件下でタンパク質又はポリペプチドとエンドペプチダーゼ(たとえばトリプシン)とを接触させることにより行われる。いくつかの実施形態では、消化は化学消化を含む。化学消化及び酵素消化に好適な試薬の例は、当技術分野で公知であり、限定されるものではないが、トリプシン、ケモトリプシン(chemotrypsin)、Lys-C、Arg-C、Asp-N、Lys-N、BNPS-スカトール、CNBr、カスパーゼ、ギ酸、グルタミルエンドペプチダーゼ、ヒドロキシルアミン、ヨードソ安息香酸、好中球エラスターゼ、ペプシン、プロリン-エンドペプチダーゼ、プロテイナーゼK、ブドウ球菌ペプチダーゼI、サーモリシン、及びトロンビンが挙げられる。
いくつかの実施形態では、機能部分はビオチン分子を含む。いくつかの実施形態では、機能部分は、アルキニルなどの反応性化学部分を含む。いくつかの実施形態では、機能部分をコンジュゲートすることは、当技術分野で公知のように、カルボキシペプチダーゼYによるカルボキシ末端カルボキシメチルエステル基のビオチン化を含む。
いくつかの実施形態では、可溶化性部分がポリペプチドに付加される。図9は、たとえば、ポリペプチドに可溶化性リンカーをコンジュゲートするプロセスを用いて、ポリペプチドの末端アミノ酸に付加される可溶化性部分の非限定的例を例示する。
いくつかの実施形態では、リンカーコンジュゲーティング部分912を含む末端修飾ポリペプチド910は、ポリペプチドコンジュゲーティング部分922を含む可溶化性リンカー920にコンジュゲートされる。いくつかの実施形態では、可溶化性リンカーは、バイオ分子(たとえば、斑点形状として示される)などの可溶化性ポリマーを含む。いくつかの実施形態では、912と922との間に形成された連結932を含む得られるリンカーコンジュゲートポリペプチド930は、表面コンジュゲーティング部分934をさらに含む。それゆえ、いくつかの実施形態では、本明細書に提供される方法及び組成物は、その溶解性を増加させる部分でポリペプチドの末端を修飾するのに有用である。いくつかの実施形態では、可溶化性部分は、断片化(たとえば、トリプシンを用いるなどの酵素的断片化)から生じる相対的に不溶性の小さなポリペプチドに有用である。たとえば、いくつかの実施形態では、ポリペプチドプール中の短いポリペプチドは、ポリマー(たとえば、短いオリゴ、糖、又は他の荷電ポリマー)をポリペプチドにコンジュゲートすることにより可溶化可能である。
いくつかの実施形態では、サンプルウェルの1つ以上の表面(たとえば、サンプルウェルの側壁)を修飾可能である。サンプルウェル側壁のパッシベーション及び/又はアンチファウリングの非限定的例は、ボトム表面への単一分子固定を促進するために使用されうる修飾表面を用いてサンプルウェルの模式図例が例示される図10に示される。いくつかの実施形態では、1040はSiO2である。いくつかの実施形態では、1042は、ポリペプチドコンジュゲーティング部分(たとえば、TCO、テトラジン、N3、アルキン、アルデヒド、NCO、NHS、チオール、アルケン、DBCO、BCN、TPP、ビオチン、又は他の好適なコンジュゲーティング部分)である。いくつかの実施形態では、1050はTiO2又はAl2O3である。いくつかの実施形態では、1052は、疎水性C4~18分子、ポリテトラフルオロエチレン化合物(たとえば(CF2)4~12)、ポリオール、たとえば、ポリエチレングリコール(たとえばPEG3~100)、ポリプロピレングリコール、ポリオキシエチレングリコール、又はそれらの組合せ若しくは変化形、或いは双性イオンたとえばスルホベタインである。いくつかの実施形態では、1060はSiである。いくつかの実施形態では、1070はAlである。いくつかの実施形態では、1080はTiNである。
発光標識
本明細書で用いられる場合、発光標識とは、1つ以上の光子を吸収し且つ1つ以上の持続時間後に1つ以上の光子を後続的に放出しうる分子のことである。いくつかの実施形態では、この用語は、状況に依存して「標識」又は「発光分子」と同義的に用いられる。本明細書に記載されるある特定の実施形態に係る発光標識は、標識付認識分子の発光標識、標識付ペプチダーゼ(たとえば、標識付エキソペプチダーゼ、標識付非特異的エキソペプチダーゼ)の発光標識、標識付ペプチドの発光標識、標識付補因子の発光標識、又は本明細書に記載の他の標識付組成物を意味しうる。いくつかの実施形態では、本願に係る発光標識は、1つ以上の標識付アミノ酸を含む標識付ポリペプチドの標識付アミノ酸を意味する。
本明細書で用いられる場合、発光標識とは、1つ以上の光子を吸収し且つ1つ以上の持続時間後に1つ以上の光子を後続的に放出しうる分子のことである。いくつかの実施形態では、この用語は、状況に依存して「標識」又は「発光分子」と同義的に用いられる。本明細書に記載されるある特定の実施形態に係る発光標識は、標識付認識分子の発光標識、標識付ペプチダーゼ(たとえば、標識付エキソペプチダーゼ、標識付非特異的エキソペプチダーゼ)の発光標識、標識付ペプチドの発光標識、標識付補因子の発光標識、又は本明細書に記載の他の標識付組成物を意味しうる。いくつかの実施形態では、本願に係る発光標識は、1つ以上の標識付アミノ酸を含む標識付ポリペプチドの標識付アミノ酸を意味する。
いくつかの実施形態では、発光標識は、第1及び第2のクロモフォアを含みうる。いくつかの実施形態では、第1のクロモフォアの励起状態は、第2のクロモフォアへのエネルギー移動を介して緩和可能である。いくつかの実施形態では、エネルギー移動は、フェルスター共鳴エネルギー移動(FRET)である。かかるFRETペアは、たとえば、図2の標識付アプタマー206に対して本明細書に例示及び記載されるように、混合物中の複数の発光標識間の標識ごとの区別をより容易にする性質を有する発光標識を提供するのに有用でありうる。さらに他の実施形態では、FRETペアは、第1の発光標識の第1のクロモフォアと第2の発光標識の第2のクロモフォアとを含む。ある特定の実施形態では、FRETペアは、第1のスペクトル領域で励起エネルギーを吸収し、且つ第2のスペクトル領域で発光を放出しうる。
いくつかの実施形態では、発光標識とは、フルオロフォア又は色素を意味する。典型的には、発光標識は、芳香族又はヘテロ芳香族化合物を含むとともに、ピレン、アントラセン、ナフタレン、ナフチルアミン、アクリジン、スチルベン、インドール、ペンゾインドール、オキサゾール、カルバゾール、チアゾール、ベンゾチアゾール、ベンゾオキサゾール、フェナントリジン、フェノキサジン、ポルフィリン、キノリン、エチジウム、ベンズアミド、シアニン、カルボシアニン、サリチレート、アントラニレート、クマリン、フルオロセイン、ローダミン、キサンテン、又は他の類似化合物でありうる。
いくつかの実施形態では、発光標識は、下記:5/6-カルボキシローダミン6G、5-カルボキシローダミン6G、6-カルボキシローダミン6G、6-TAMRA、アベリア(Abberior)(登録商標)スター(STAR)440SXP、アベリア(Abberior)(登録商標)スター(STAR)470SXP、アベリア(Abberior)(登録商標)スター(STAR)488、アベリア(Abberior)(登録商標)スター(STAR)512、アベリア(Abberior)(登録商標)スター(STAR)520SXP、アベリア(Abberior)(登録商標)スター(STAR)580、アベリア(Abberior)(登録商標)スター(STAR)600、アベリア(Abberior)(登録商標)スター(STAR)635、アベリア(Abberior)(登録商標)スター(STAR)635P、アベリア(Abberior)(登録商標)スターレッド(STAR RED)、アレキサフルオル(Alexa Fluor)(登録商標)350、アレキサフルオル(Alexa Fluor)(登録商標)405、アレキサフルオル(Alexa Fluor)(登録商標)430、アレキサフルオル(Alexa Fluor)(登録商標)480、アレキサフルオル(Alexa Fluor)(登録商標)488、アレキサフルオル(Alexa Fluor)(登録商標)514、アレキサフルオル(Alexa Fluor)(登録商標)532、アレキサフルオル(Alexa Fluor)(登録商標)546、アレキサフルオル(Alexa Fluor)(登録商標)555、アレキサフルオル(Alexa Fluor)(登録商標)568、アレキサフルオル(Alexa Fluor)(登録商標)594、アレキサフルオル(Alexa Fluor)(登録商標)610×、アレキサフルオル(Alexa Fluor)(登録商標)633、アレキサフルオル(Alexa Fluor)(登録商標)647、アレキサフルオル(Alexa Fluor)(登録商標)660、アレキサフルオル(Alexa Fluor)(登録商標)680、アレキサフルオル(Alexa Fluor)(登録商標)700、アレキサフルオル(Alexa Fluor)(登録商標)750、アレキサフルオル(Alexa Fluor)(登録商標)790、AMCA、アトー(ATTO)390、アトー(ATTO)425、アトー(ATTO)465、アトー(ATTO)488、アトー(ATTO)495、アトー(ATTO)514、アトー(ATTO)520、アトー(ATTO)532、アトー(ATTO)542、アトー(ATTO)550、アトー(ATTO)565、アトー(ATTO)590、アトー(ATTO)610、アトー(ATTO)620、アトー(ATTO)633、アトー(ATTO)647、アトー(ATTO)647N、アトー(ATTO)655、アトー(ATTO)665、アトー(ATTO)680、アトー(ATTO)700、アトー(ATTO)725、アトー(ATTO)740、アトー(ATTO)Oxa12、アトー(ATTO)Rho101、アトー(ATTO)Rho11、アトー(ATTO)Rho12、アトー(ATTO)Rho13、アトー(ATTO)Rho14、アトー(ATTO)Rho3B、アトー(ATTO)Rho6G、アトー(ATTO)Thio12、BDホライゾン(Horizon)(商標)V450、ボディピー(BODIPY)(登録商標)493/501、ボディピー(BODIPY)(登録商標)530/550、ボディピー(BODIPY)(登録商標)558/568、ボディピー(BODIPY)(登録商標)564/570、ボディピー(BODIPY)(登録商標)576/589、ボディピー(BODIPY)(登録商標)581/591、ボディピー(BODIPY)(登録商標)630/650、ボディピー(BODIPY)(登録商標)650/665、ボディピー(BODIPY)(登録商標)FL、ボディピー(BODIPY)(登録商標)FL-X、ボディピー(BODIPY)(登録商標)R6G、ボディピー(BODIPY)(登録商標)TMR、ボディピー(BODIPY)(登録商標)TR、CALフルオル(Fluor)(登録商標)ゴールド540、CALフルオル(Fluor)(登録商標)グリーン510、CALフルオル(Fluor)(登録商標)オレンジ560、CALフルオル(Fluor)(登録商標)レッド590、CALフルオル(Fluor)(登録商標)レッド610、CALフルオル(Fluor)(登録商標)レッド615、CALフルオル(Fluor)(登録商標)レッド635、カスケード(Cascade)(登録商標)ブルー、CF(商標)350、CF(商標)405M、CF(商標)405S、CF(商標)488A、CF(商標)514、CF(商標)532、CF(商標)543、CF(商標)546、CF(商標)555、CF(商標)568、CF(商標)594、CF(商標)620R、CF(商標)633、CF(商標)633-V1、CF(商標)640R、CF(商標)640R-V1、CF(商標)640R-V2、CF(商標)660C、CF(商標)660R、CF(商標)680、CF(商標)680R、CF(商標)680R-V1、CF(商標)750、CF(商標)770、CF(商標)790、クロメオ(Chromeo)(商標)642、クロミス(Chromis)425N、クロミス(Chromis)500N、クロミス(Chromis)515N、クロミス(Chromis)530N、クロミス(Chromis)550A、クロミス(Chromis)550C、クロミス(Chromis)550Z、クロミス(Chromis)560N、クロミス(Chromis)570N、クロミス(Chromis)577N、クロミス(Chromis)600N、クロミス(Chromis)630N、クロミス(Chromis)645A、クロミス(Chromis)645C、クロミス(Chromis)645Z、クロミス(Chromis)678A、クロミス(Chromis)678C、クロミス(Chromis)678Z、クロミス(Chromis)770A、クロミス(Chromis)770C、クロミス(Chromis)800A、クロミス(Chromis)800C、クロミス(Chromis)830A、クロミス(Chromis)830C、Cy(登録商標)3、Cy(登録商標)3.5、Cy(登録商標)3B、Cy(登録商標)5、Cy(登録商標)5.5、Cy(登録商標)7、ディライト(DyLight)(登録商標)350、ディライト(DyLight)(登録商標)405、ディライト(DyLight)(登録商標)415-Co1、ディライト(DyLight)(登録商標)425Q、ディライト(DyLight)(登録商標)485-LS、ディライト(DyLight)(登録商標)488、ディライト(DyLight)(登録商標)504Q、ディライト(DyLight)(登録商標)510-LS、ディライト(DyLight)(登録商標)515-LS、ディライト(DyLight)(登録商標)521-LS、ディライト(DyLight)(登録商標)530-R2、ディライト(DyLight)(登録商標)543Q、ディライト(DyLight)(登録商標)550、ディライト(DyLight)(登録商標)554-R0、ディライト(DyLight)(登録商標)554-R1、ディライト(DyLight)(登録商標)590-R2、ディライト(DyLight)(登録商標)594、ディライト(DyLight)(登録商標)610-B1、ディライト(DyLight)(登録商標)615-B2、ディライト(DyLight)(登録商標)633、ディライト(DyLight)(登録商標)633-B1、ディライト(DyLight)(登録商標)633-B2、ディライト(DyLight)(登録商標)650、ディライト(DyLight)(登録商標)655-B1、ディライト(DyLight)(登録商標)655-B2、ディライト(DyLight)(登録商標)655-B3、ディライト(DyLight)(登録商標)655-B4、ディライト(DyLight)(登録商標)662Q、ディライト(DyLight)(登録商標)675-B1、ディライト(DyLight)(登録商標)675-B2、ディライト(DyLight)(登録商標)675-B3、ディライト(DyLight)(登録商標)675-B4、ディライト(DyLight)(登録商標)679-C5、ディライト(DyLight)(登録商標)680、ディライト(DyLight)(登録商標)683Q、ディライト(DyLight)(登録商標)690-B1、ディライト(DyLight)(登録商標)690-B2、ディライト(DyLight)(登録商標)696Q、ディライト(DyLight)(登録商標)700-B1、ディライト(DyLight)(登録商標)700-B1、ディライト(DyLight)(登録商標)730-B1、ディライト(DyLight)(登録商標)730-B2、ディライト(DyLight)(登録商標)730-B3、ディライト(DyLight)(登録商標)730-B4、ディライト(DyLight)(登録商標)747、ディライト(DyLight)(登録商標)747-B1、ディライト(DyLight)(登録商標)747-B2、ディライト(DyLight)(登録商標)747-B3、ディライト(DyLight)(登録商標)747-B4、ディライト(DyLight)(登録商標)755、ディライト(DyLight)(登録商標)766Q、ディライト(DyLight)(登録商標)775-B2、ディライト(DyLight)(登録商標)775-B3、ディライト(DyLight)(登録商標)775-B4、ディライト(DyLight)(登録商標)780-B1、ディライト(DyLight)(登録商標)780-B2、ディライト(DyLight)(登録商標)780-B3、ディライト(DyLight)(登録商標)800、ディライト(DyLight)(登録商標)830-B2、ディオミクス(Dyomics)-350、ディオミクス(Dyomics)-350XL、ディオミクス(Dyomics)-360XL、ディオミクス(Dyomics)-370XL、ディオミクス(Dyomics)-375XL、ディオミクス(Dyomics)-380XL、ディオミクス(Dyomics)-390XL、ディオミクス(Dyomics)-405、ディオミクス(Dyomics)-415、ディオミクス(Dyomics)-430、ディオミクス(Dyomics)-431、ディオミクス(Dyomics)-478、ディオミクス(Dyomics)-480XL、ディオミクス(Dyomics)-481XL、ディオミクス(Dyomics)-485XL、ディオミクス(Dyomics)-490、ディオミクス(Dyomics)-495、ディオミクス(Dyomics)-505、ディオミクス(Dyomics)-510XL、ディオミクス(Dyomics)-511XL、ディオミクス(Dyomics)-520XL、ディオミクス(Dyomics)-521XL、ディオミクス(Dyomics)-530、ディオミクス(Dyomics)-547、ディオミクス(Dyomics)-547P1、ディオミクス(Dyomics)-548、ディオミクス(Dyomics)-549、ディオミクス(Dyomics)-549P1、ディオミクス(Dyomics)-550、ディオミクス(Dyomics)-554、ディオミクス(Dyomics)-555、ディオミクス(Dyomics)-556、ディオミクス(Dyomics)-560、ディオミクス(Dyomics)-590、ディオミクス(Dyomics)-591、ディオミクス(Dyomics)-594、ディオミクス(Dy
omics)-601XL、ディオミクス(Dyomics)-605、ディオミクス(Dyomics)-610、ディオミクス(Dyomics)-615、ディオミクス(Dyomics)-630、ディオミクス(Dyomics)-631、ディオミクス(Dyomics)-632、ディオミクス(Dyomics)-633、ディオミクス(Dyomics)-634、ディオミクス(Dyomics)-635、ディオミクス(Dyomics)-636、ディオミクス(Dyomics)-647、ディオミクス(Dyomics)-647P1、ディオミクス(Dyomics)-648、ディオミクス(Dyomics)-648P1、ディオミクス(Dyomics)-649、ディオミクス(Dyomics)-649P1、ディオミクス(Dyomics)-650、ディオミクス(Dyomics)-651、ディオミクス(Dyomics)-652、ディオミクス(Dyomics)-654、ディオミクス(Dyomics)-675、ディオミクス(Dyomics)-676、ディオミクス(Dyomics)-677、ディオミクス(Dyomics)-678、ディオミクス(Dyomics)-679P1、ディオミクス(Dyomics)-680、ディオミクス(Dyomics)-681、ディオミクス(Dyomics)-682、ディオミクス(Dyomics)-700、ディオミクス(Dyomics)-701、ディオミクス(Dyomics)-703、ディオミクス(Dyomics)-704、ディオミクス(Dyomics)-730、ディオミクス(Dyomics)-731、ディオミクス(Dyomics)-732、ディオミクス(Dyomics)-734、ディオミクス(Dyomics)-749、ディオミクス(Dyomics)-749P1、ディオミクス(Dyomics)-750、ディオミクス(Dyomics)-751、ディオミクス(Dyomics)-752、ディオミクス(Dyomics)-754、ディオミクス(Dyomics)-776、ディオミクス(Dyomics)-777、ディオミクス(Dyomics)-778、ディオミクス(Dyomics)-780、ディオミクス(Dyomics)-781、ディオミクス(Dyomics)-782、ディオミクス(Dyomics)-800、ディオミクス(Dyomics)-831、eフルオル(eFluor)(登録商標)450、エオシン、FITC、フルオレセイン、ハイライト(HiLyte)(商標)フルオル(Fluor)405、ハイライト(HiLyte)(商標)フルオル(Fluor)488、ハイライト(HiLyte)(商標)フルオル(Fluor)532、ハイライト(HiLyte)(商標)フルオル(Fluor)555、ハイライト(HiLyte)(商標)フルオル(Fluor)594、ハイライト(HiLyte)(商標)フルオル(Fluor)647、ハイライト(HiLyte)(商標)フルオル(Fluor)680、ハイライト(HiLyte)(商標)フルオル(Fluor)750、IRダイ(IRDye)(登録商標)680LT、IRダイ(IRDye)(登録商標)750、IRダイ(IRDye)(登録商標)800CW、JOE、ライトサイクラー(LightCycler)(登録商標)640R、ライトサイクラー(LightCycler)(登録商標)レッド610、ライトサイクラー(LightCycler)(登録商標)レッド640、ライトサイクラー(LightCycler)(登録商標)レッド670、ライトサイクラー(LightCycler)(登録商標)レッド705、リサミンローダミンB、ナフトフルオレセイン、オレゴングリーン(Oregon Green)(登録商標)488、オレゴングリーン(Oregon Green)(登録商標)514、パシフィックブルー(Pacific Blue)(商標)、パシフィックグリーン(Pacific Green)(商標)、パシフィックオレンジ(Pacific Orange)(商標)、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、クエーサー(Quasar)(登録商標)570、クエーサー(Quasar)(登録商標)670、クエーサー(Quasar)(登録商標)705、ローダミン123、ローダミン6G、ローダミンB、ローダミングリーン、ローダミングリーン-X、ローダミンレッド、ROX、セタ(Seta)(商標)375、セタ(Seta)(商標)470、セタ(Seta)(商標)555、セタ(Seta)(商標)632、セタ(Seta)(商標)633、セタ(Seta)(商標)650、セタ(Seta)(商標)660、セタ(Seta)(商標)670、セタ(Seta)(商標)680、セタ(Seta)(商標)700、セタ(Seta)(商標)750、セタ(Seta)(商標)780、セタ(Seta)(商標)APC-780、セタ(Seta)(商標)PerCP-680、セタ(Seta)(商標)R-PE-670、セタ(Seta)(商標)646、セタウ(SeTau)380、セタウ(SeTau)425、セタウ(SeTau)647、セタウ(SeTau)405、スクエア(Square)635、スクエア(Square)650、スクエア(Square)660、スクエア(Square)672、スクエア(Square)680、スルホローダミン101、TAMRA、TET、テキサスレッド(Texas Red)(登録商標)、TMR、TRITC、ヤキマイエロー(Yakima Yellow)(商標)、ゼノン(Zenon)(登録商標)、Zy3、Zy5、Zy5.5、及びZy7の1つ以上から選択される色素を含む。
omics)-601XL、ディオミクス(Dyomics)-605、ディオミクス(Dyomics)-610、ディオミクス(Dyomics)-615、ディオミクス(Dyomics)-630、ディオミクス(Dyomics)-631、ディオミクス(Dyomics)-632、ディオミクス(Dyomics)-633、ディオミクス(Dyomics)-634、ディオミクス(Dyomics)-635、ディオミクス(Dyomics)-636、ディオミクス(Dyomics)-647、ディオミクス(Dyomics)-647P1、ディオミクス(Dyomics)-648、ディオミクス(Dyomics)-648P1、ディオミクス(Dyomics)-649、ディオミクス(Dyomics)-649P1、ディオミクス(Dyomics)-650、ディオミクス(Dyomics)-651、ディオミクス(Dyomics)-652、ディオミクス(Dyomics)-654、ディオミクス(Dyomics)-675、ディオミクス(Dyomics)-676、ディオミクス(Dyomics)-677、ディオミクス(Dyomics)-678、ディオミクス(Dyomics)-679P1、ディオミクス(Dyomics)-680、ディオミクス(Dyomics)-681、ディオミクス(Dyomics)-682、ディオミクス(Dyomics)-700、ディオミクス(Dyomics)-701、ディオミクス(Dyomics)-703、ディオミクス(Dyomics)-704、ディオミクス(Dyomics)-730、ディオミクス(Dyomics)-731、ディオミクス(Dyomics)-732、ディオミクス(Dyomics)-734、ディオミクス(Dyomics)-749、ディオミクス(Dyomics)-749P1、ディオミクス(Dyomics)-750、ディオミクス(Dyomics)-751、ディオミクス(Dyomics)-752、ディオミクス(Dyomics)-754、ディオミクス(Dyomics)-776、ディオミクス(Dyomics)-777、ディオミクス(Dyomics)-778、ディオミクス(Dyomics)-780、ディオミクス(Dyomics)-781、ディオミクス(Dyomics)-782、ディオミクス(Dyomics)-800、ディオミクス(Dyomics)-831、eフルオル(eFluor)(登録商標)450、エオシン、FITC、フルオレセイン、ハイライト(HiLyte)(商標)フルオル(Fluor)405、ハイライト(HiLyte)(商標)フルオル(Fluor)488、ハイライト(HiLyte)(商標)フルオル(Fluor)532、ハイライト(HiLyte)(商標)フルオル(Fluor)555、ハイライト(HiLyte)(商標)フルオル(Fluor)594、ハイライト(HiLyte)(商標)フルオル(Fluor)647、ハイライト(HiLyte)(商標)フルオル(Fluor)680、ハイライト(HiLyte)(商標)フルオル(Fluor)750、IRダイ(IRDye)(登録商標)680LT、IRダイ(IRDye)(登録商標)750、IRダイ(IRDye)(登録商標)800CW、JOE、ライトサイクラー(LightCycler)(登録商標)640R、ライトサイクラー(LightCycler)(登録商標)レッド610、ライトサイクラー(LightCycler)(登録商標)レッド640、ライトサイクラー(LightCycler)(登録商標)レッド670、ライトサイクラー(LightCycler)(登録商標)レッド705、リサミンローダミンB、ナフトフルオレセイン、オレゴングリーン(Oregon Green)(登録商標)488、オレゴングリーン(Oregon Green)(登録商標)514、パシフィックブルー(Pacific Blue)(商標)、パシフィックグリーン(Pacific Green)(商標)、パシフィックオレンジ(Pacific Orange)(商標)、PET、PF350、PF405、PF415、PF488、PF505、PF532、PF546、PF555P、PF568、PF594、PF610、PF633P、PF647P、クエーサー(Quasar)(登録商標)570、クエーサー(Quasar)(登録商標)670、クエーサー(Quasar)(登録商標)705、ローダミン123、ローダミン6G、ローダミンB、ローダミングリーン、ローダミングリーン-X、ローダミンレッド、ROX、セタ(Seta)(商標)375、セタ(Seta)(商標)470、セタ(Seta)(商標)555、セタ(Seta)(商標)632、セタ(Seta)(商標)633、セタ(Seta)(商標)650、セタ(Seta)(商標)660、セタ(Seta)(商標)670、セタ(Seta)(商標)680、セタ(Seta)(商標)700、セタ(Seta)(商標)750、セタ(Seta)(商標)780、セタ(Seta)(商標)APC-780、セタ(Seta)(商標)PerCP-680、セタ(Seta)(商標)R-PE-670、セタ(Seta)(商標)646、セタウ(SeTau)380、セタウ(SeTau)425、セタウ(SeTau)647、セタウ(SeTau)405、スクエア(Square)635、スクエア(Square)650、スクエア(Square)660、スクエア(Square)672、スクエア(Square)680、スルホローダミン101、TAMRA、TET、テキサスレッド(Texas Red)(登録商標)、TMR、TRITC、ヤキマイエロー(Yakima Yellow)(商標)、ゼノン(Zenon)(登録商標)、Zy3、Zy5、Zy5.5、及びZy7の1つ以上から選択される色素を含む。
発光
いくつかの態様では、本願は、発光標識の1つ以上の発光性に基づくポリペプチドシーケンシング及び/又は同定に関する。いくつかの実施形態では、発光標識は、発光寿命、発光強度、輝度、吸収スペクトル、発光スペクトル、発光量子収率、又はそれらの2つ以上の組合せに基づいて同定される。いくつかの実施形態では、複数のタイプの発光標識は、異なる発光寿命、発光強度、輝度、吸収スペクトル、発光スペクトル、発光量子収率、又はそれらの2つ以上の組合せに基づいて互いに識別可能である。同定することは、発光標識に会合する1タイプのアミノ酸(たとえば、単一タイプ又はタイプのサブセット)の厳密なアイデンティティー及び/又は量を割り当てることを意味しうるとともに、他のタイプのアミノ酸と比べてポリペプチド中のアミノ酸位置を割り当てることも意味しうる。
いくつかの態様では、本願は、発光標識の1つ以上の発光性に基づくポリペプチドシーケンシング及び/又は同定に関する。いくつかの実施形態では、発光標識は、発光寿命、発光強度、輝度、吸収スペクトル、発光スペクトル、発光量子収率、又はそれらの2つ以上の組合せに基づいて同定される。いくつかの実施形態では、複数のタイプの発光標識は、異なる発光寿命、発光強度、輝度、吸収スペクトル、発光スペクトル、発光量子収率、又はそれらの2つ以上の組合せに基づいて互いに識別可能である。同定することは、発光標識に会合する1タイプのアミノ酸(たとえば、単一タイプ又はタイプのサブセット)の厳密なアイデンティティー及び/又は量を割り当てることを意味しうるとともに、他のタイプのアミノ酸と比べてポリペプチド中のアミノ酸位置を割り当てることも意味しうる。
いくつかの実施形態では、発光は、発光標識を一連の個別光パルスに暴露することと、標識から放出される各光子のタイミング又は他の性質を評価することと、により検出される。いくつかの実施形態では、標識から逐次放出される複数の光子の情報は、アグリゲートされ、且つ標識を同定することにより関連アミノ酸のタイプを同定するように評価される。いくつかの実施形態では、標識の発光寿命は、標識から逐次放出される複数の光子から決定され、且つ発光寿命は、標識を同定するために使用可能である。いくつかの実施形態では、標識の発光強度は、標識から逐次放出される複数の光子から決定され、且つ発光強度は、標識を同定するために使用可能である。いくつかの実施形態では、標識の発光寿命及び発光強度は、標識から逐次放出される複数の光子から決定され、且つ発光寿命及び発光強度は、標識を同定するために使用可能である。
本願のいくつかの態様では、単一ポリペプチド分子は、複数の個別光パルスに露出され、且つ一連の放出光子は、検出及び解析される。いくつかの実施形態では、一連の放出光子は、実験の時間にわたり反応サンプル中で変化しない存在する単一ポリペプチド分子に関する情報を提供する。しかしながら、いくつかの実施形態では、一連の放出光子は、反応サンプル中に異なる時間で存在する一連の異なる分子に関する情報を提供する(たとえば、反応又はプロセスが進行する際)。限定されるものではないが例として、かかる情報は、本願に従って化学分解又は酵素分解に付されたポリペプチドをシーケンス及び/又は同定するために使用されうる。
ある特定の実施形態では、発光標識は、一光子を吸収し且つある持続時間後に一光子を放出する。いくつかの実施形態では、標識の発光寿命は、持続時間を測定することにより決定又は推定可能である。いくつかの実施形態では、標識の発光寿命は、複数のパルスイベント及び放出イベントに対して複数の持続時間を測定することにより決定又は推定可能である。いくつかの実施形態では、標識の発光寿命は、持続時間を測定することにより複数のタイプの標識の発光寿命間で区別可能である。いくつかの実施形態では、標識の発光寿命は、複数のパルスイベント及び放出イベントに対して複数の持続時間を測定することにより複数のタイプの標識の発光寿命間で区別可能である。ある特定の実施形態では、標識は、標識の発光寿命を決定又は推定することにより複数のタイプの標識間で同定又は区別される。ある特定の実施形態では、標識は、複数のタイプの標識の複数の発光寿命間で標識の発光寿命を区別することにより複数のタイプの標識間で同定又は区別される。
発光標識の発光寿命の決定は、いずれかの好適な方法を用いて実施可能である(たとえば、好適な技術を用いて寿命を測定することにより又は放出の時間依存特性を決定することにより)。いくつかの実施形態では、1つの標識の発光寿命を決定することは、他の標識と比べて寿命を決定することを含む。いくつかの実施形態では、標識の発光寿命を決定することは、参照と比べて寿命を決定することを含む。いくつかの実施形態では、標識の発光寿命を決定することは、寿命(たとえば蛍光寿命)を測定することを含む。いくつかの実施形態では、標識の発光寿命を決定することは、寿命の指標となる1つ以上の時間特性を決定することを含む。いくつかの実施形態では、標識の発光寿命は、励起パルスに対する1つ以上の時間ゲートウィンドウ全体にわたり発生する複数の放出イベント(たとえば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、又はそれ以上の放出イベント)の分布に基づいて決定可能である。たとえば、標識の発光寿命は、励起パルスに対して測定された光子到着時間の分布に基づいて異なる発光寿命を有する複数の標識から識別可能である。
発光標識の発光寿命は、標識が励起状態に達した後に放出される光子のタイミングの指標となり、標識は、光子のタイミングの指標となる情報により区別可能であることが認識されるべきである。いくつかの実施形態は、標識により放出される光子に関連付けられる時間を測定することにより標識の発光寿命に基づいて標識を複数の標識から区別することを含みうる。時間の分布は、分布から決定されうる発光寿命の指標を提供しうる。いくつかの実施形態では、標識は、たとえば、時間の分布と既知の標識に対応する参照分布とを比較することにより、時間の分布に基づいて複数の標識から区別可能である。いくつかの実施形態では、発光寿命の値は、時間の分布から決定された。
本明細書で用いられる場合、いくつかの実施形態では、発光強度とは、パルス励起エネルギーの送達により励起されている発光標識により放出される単位時間当たりの放出光子数を意味する。いくつかの実施形態では、発光強度とは、パルス励起エネルギーの送達により励起されている標識により放出され且つ特定センサー又はセンサーのセットにより検出される単位時間当たりの検出放出光子数を意味する。
本明細書で用いられる場合、いくつかの実施形態では、輝度とは、発光標識当たりの平均発光強度について報告するパラメータを意味する。そのため、いくつかの実施形態では、「発光強度」は、1つ以上の標識を含む組成物の輝度を一般に意味するように使用されうる。いくつかの実施形態では、標識の輝度は、その量子収率と吸光係数との積に等しい。
本明細書で用いられる場合、いくつかの実施形態では、発光量子収率とは、放出イベントをもたらす所与の波長又は所与のスペクトル領域内での励起イベントの割合を意味し、典型的には1未満である。いくつかの実施形態では、本明細書に記載の発光標識の発光量子収率は、0~約0.001、約0.001~約0.01、約0.01~約0.1、約0.1~約0.5、約0.5~0.9、又は約0.9~1である。いくつかの実施形態では、標識は、発光量子収率を同定又は推定することにより同定される。
本明細書で用いられる場合、いくつかの実施形態では、励起エネルギーは光源からの光パルスである。いくつかの実施形態では、励起エネルギーは可視スペクトル域にある。いくつかの実施形態では、励起エネルギーは紫外スペクトル域にある。いくつかの実施形態では、励起エネルギーは赤外スペクトル域にある。いくつかの実施形態では、励起エネルギーは、複数の放出光子が検出される発光標識の吸収極大又はその近くにある。ある特定の実施形態では、励起エネルギーは、約500nm~約700nm(たとえば、約500nm~約600nm、約600nm~約700nm、約500nm~約550nm、約550nm~約600nm、約600nm~約650nm、又は約650nm~約700nm)である。ある特定の実施形態では、励起エネルギーは、単色でありうるか又はあるスペクトル領域に閉じ込められうる。いくつかの実施形態では、スペクトル領域は、約0.1nm~約1nm、約1nm~約2nm、又は約2nm~約5nmの領域を有する。いくつかの実施形態では、スペクトル領域は、約5nm~約10nm、約10nm~約50nm、又は約50nm~約100nmの領域を有する。
シーケンシング
本願の態様は、ポリペプチドやタンパク質などの生体ポリマーのシーケンシングに関する。本明細書で用いられる場合、「シーケンシング」、「配列決定」、「配列を決定する」などの用語は、ポリペプチド又はタンパク質に関して、ポリペプチド又はタンパク質の部分配列情報さらには全配列情報の決定を含む。すなわち、この用語は、配列比較、フィンガープリンティング、確率的フィンガープリンティング、及び標的分子に関する同レベルの情報、さらには対象領域内の標的分子の各アミノ酸の明確な同定及び順序付けを含む。いくつかの実施形態では、この用語は、ポリペプチドの単一アミノ酸を同定することを含む。さらに他の実施形態では、ポリペプチドの1アミノ酸超が同定される。本明細書で用いられる場合、いくつかの実施形態では、「同定すること」、「アイデンティティーを決定すること」などの用語は、アミノ酸に関して、アミノ酸の明確なアイデンティティーの決定、さらにはアミノ酸の明確なアイデンティティーの確率の決定を含む。たとえば、いくつかの実施形態では、アミノ酸は、アミノ酸が特定のタイプである確率(たとえば0%~100%)を決定することにより、又は複数の特定のタイプの各々の確率を決定することにより、同定される。それゆえ、いくつかの実施形態では、本明細書で用いられる「アミノ酸配列」、「ポリペプチド配列」、及び「タンパク質配列」という用語は、ポリペプチド又はタンパク質の物質それ自体を意味しうるとともに、特定のポリペプチド又はタンパク質を生化学的に特徴付ける特定の配列情報(たとえば、一方の末端から他方の末端へのアミノ酸の順序を表す一連の文字)に制限されるものではない。
本願の態様は、ポリペプチドやタンパク質などの生体ポリマーのシーケンシングに関する。本明細書で用いられる場合、「シーケンシング」、「配列決定」、「配列を決定する」などの用語は、ポリペプチド又はタンパク質に関して、ポリペプチド又はタンパク質の部分配列情報さらには全配列情報の決定を含む。すなわち、この用語は、配列比較、フィンガープリンティング、確率的フィンガープリンティング、及び標的分子に関する同レベルの情報、さらには対象領域内の標的分子の各アミノ酸の明確な同定及び順序付けを含む。いくつかの実施形態では、この用語は、ポリペプチドの単一アミノ酸を同定することを含む。さらに他の実施形態では、ポリペプチドの1アミノ酸超が同定される。本明細書で用いられる場合、いくつかの実施形態では、「同定すること」、「アイデンティティーを決定すること」などの用語は、アミノ酸に関して、アミノ酸の明確なアイデンティティーの決定、さらにはアミノ酸の明確なアイデンティティーの確率の決定を含む。たとえば、いくつかの実施形態では、アミノ酸は、アミノ酸が特定のタイプである確率(たとえば0%~100%)を決定することにより、又は複数の特定のタイプの各々の確率を決定することにより、同定される。それゆえ、いくつかの実施形態では、本明細書で用いられる「アミノ酸配列」、「ポリペプチド配列」、及び「タンパク質配列」という用語は、ポリペプチド又はタンパク質の物質それ自体を意味しうるとともに、特定のポリペプチド又はタンパク質を生化学的に特徴付ける特定の配列情報(たとえば、一方の末端から他方の末端へのアミノ酸の順序を表す一連の文字)に制限されるものではない。
いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中の少なくとも2つ(たとえば、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、又はそれ以上)のアミノ酸を同定することを含む。いくつかの実施形態では、少なくとも2つのアミノ酸は連続アミノ酸である。いくつかの実施形態では、少なくとも2つのアミノ酸は非連続アミノ酸である。
いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中のすべてのアミノ酸の100%未満(たとえば、99%未満、95%未満、90%未満、85%未満、80%未満、75%未満、70%未満、65%未満、60%未満、55%未満、50%未満、45%未満、40%未満、35%未満、30%未満、25%未満、20%未満、15%未満、10%未満、5%未満、1%未満、又はそれ以下)の同定を含む。たとえば、いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中の1タイプのアミノ酸の100%未満の同定(たとえば、ポリペプチド分子中の1タイプのすべてのアミノ酸の一部分の同定)を含む。いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド分子中の各タイプのアミノ酸の100%未満の同定を含む。
いくつかの実施形態では、ポリペプチド分子のシーケンシングは、ポリペプチド中の少なくとも1つ、少なくとも5つ、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、少なくとも85、少なくとも90、少なくとも95、少なくとも100、又はそれ以上のタイプのアミノ酸の同定を含む。
いくつかの実施形態では、本願は、経時的にポリペプチドの末端に存在する一連のアミノ酸を同定することにより(たとえば、末端のアミノ酸の繰返し検出及び切断により)ポリペプチドをシーケンスするための組成物及び方法を提供する。さらに他の実施形態では、本願は、ポリペプチドの標識付アミノ含有率を同定することと、参照配列データベースと比較することと、によりポリペプチドをシーケンスするための組成物及び方法を提供する。
いくつかの実施形態では、本願は、ポリペプチドの複数の断片をシーケンスすることによりポリペプチドをシーケンスするための組成物及び方法を提供する。いくつかの実施形態では、ポリペプチドをシーケンスすることは、複数のポリペプチド断片の配列情報を組み合わせてポリペプチドの配列を同定及び/又は決定する工程を含む。いくつかの実施形態では、配列情報を組み合わせることは、コンピュータハードウェア及びソフトウェアにより実施されうる。本明細書に記載の方法は、関連ポリペプチドのセット、たとえば、生物の全プロテオームのシーケンシングを可能にし得る。いくつかの実施形態では、本出願の態様に従って複数の単一分子シーケンシング反応がパラレルに実施される(たとえば、単一チップ上で)。たとえば、いくつかの実施形態では、複数の単一分子シーケンシング反応は、各々、単一チップ上の個別サンプルウェル中で実施される。
いくつかの実施形態では、本明細書に提供される方法は、タンパク質の複合混合物を含むサンプル中の個別タンパク質のシーケンシング及び同定に使用されうる。いくつかの実施形態では、本願は、タンパク質の複合混合物中の個別タンパク質をユニークに同定する方法を提供する。いくつかの実施形態では、個別タンパク質は、タンパク質の部分アミノ酸配列を決定することにより混合サンプルで検出される。いくつかの実施形態では、タンパク質の部分アミノ酸配列は、おおよそ5~50アミノ酸の連続ストレッチ内にある。
いかなる特定理論にも拘束されることを望むものではないが、ほとんどのヒトタンパク質は、プロテオミックデータベースを参照して不完全配列情報を用いて同定可能であると考えられる。たとえば、ヒトプロテオームの単純モデリングは、6~40アミノ酸のストレッチ内のちょうど4つのタイプのアミノ酸を検出することによりタンパク質のおおよそ98%をユニークに同定可能であることを示した(たとえば、スワミナサン(Swaminathan)ら著、プロス・コンピーテーショナル・バイオロジー(PLoS Comput Biol.)、2015年、第11巻、第2号、p.e1004080、及びヤオ(Yao)ら著、フィジカル・バイオロジー(Phys.Biol.)、2015年、第12巻、第5号、p.055003を参照されたい)。したがって、タンパク質の複合混合物は、おおよそ6~40アミノ酸の短いポリペプチド断片に分解(たとえば、化学分解、酵素分解)可能であり、且つこのポリペプチドライブラリーのシーケンシングは、元の複合混合物中に存在するタンパク質の各々のアイデンティティー及び存在量を明らかにするであろう。選択的アミノ酸標識化と部分配列情報を決定することによるポリペプチドの同定とを行うための組成物及び方法は、「単一分子ペプチドシーケンシング(SINGLE MOLECULE PEPTIDE SEQUENCING)」という名称の2015年9月15日出願の米国特許出願第15/510,962号明細書(その全体が参照により組み込まれる)に詳細に記載されている。
実施形態は、少なくとも約50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%、又は99.9999%の確度などの高確度で単一ポリペプチド分子をシーケンス可能である。いくつかの実施形態では、単一分子シーケンシングに使用される標的分子は、サンプルウェルのボトム表面や側壁表面などの固形担体の表面に固定されるポリペプチドである。サンプルウェルはまた、本願に係るシーケンシング反応に必要とされるいずれかの他の試薬、たとえば、1つ以上の好適な緩衝液、補因子、標識付認識分子、及び酵素(たとえば、発光標識又は非標識でありうる触媒活性又は不活性のエキソペプチダーゼ酵素)を含有可能である。
以上に記載されるように、いくつかの実施形態では、本願に係るシーケンシングは、アミノ酸が特定のタイプである確率を決定することによりアミノ酸を同定することを含む。従来のタンパク質同定システムは、ポリペプチドを同定するためにポリペプチド中の各アミノ酸の同定を必要とする。しかしながら、ポリペプチド中の各アミノ酸を正確に同定するのは困難である。たとえば、第1の認識分子が第1のアミノ酸に会合する相互作用から収集されるデータは、第2の認識分子が第2のアミノ酸に会合する相互作用から収集されるデータと2つのアミノ酸を区別するのに十分な程度に異ならないおそれがある。いくつかの実施形態では、本願に係るシーケンシングは、従来のタンパク質同定システムとは異なりタンパク質中の各アミノ酸の同定を必要としない(ただし、除外するものではない)タンパク質同定システムを用いることによりこの問題を回避する。
それゆえ、いくつかの実施形態では、本願に係るシーケンシングは、タンパク質を同定するために機械学習技術を使用するタンパク質同定システムを用いて行われうる。いくつかの実施形態では、システムは、(1)リアルタイムタンパク質シーケンシングデバイスを用いてタンパク質のポリペプチドに関するデータを収集することと、(2)機械学習モデル及び収集データを用いてある特定のアミノ酸がそれぞれの位置でポリペプチドの一部である確率を同定することと、(3)「確率的フィンガープリント」として同定確率を用いてタンパク質を同定することと、により動作する。いくつかの実施形態では、タンパク質のポリペプチドに関するデータは、アミノ酸に選択的に結合する試薬を用いて得られうる。例として、試薬及び/又はアミノ酸は、励起エネルギーの適用に反応して光を放出する発光標識で標識されうる。この例では、タンパク質シーケンシングデバイスは、試薬とサンプル中のアミノ酸との結合相互作用時にタンパク質(たとえばポリペプチド)のサンプルに励起エネルギーを適用しうる。いくつかの実施形態では、配列決定デバイスの1つ以上のセンサー(たとえば、光検出器、電気センサー、及び/又はいずれかの他の好適なタイプのセンサー)は、結合相互作用時に検出しうる。一方、検出光放出から収集及び/又は取得されるデータは、機械学習モデルに提供されうる。機械学習モデル並びに関連システム及び方法は、「機械学習で実行可能なタンパク質同定(MACHINE LEARNING ENABLED PROTEIN IDENTIFICATION)」という名称の2019年6月12日出願の米国仮特許出願第62/860,750号明細書(その全体が参照により組み込まれる)に詳細に記載されている。
本願に係るシーケンシングは、いくつかの態様では、ポリペプチドを基体(たとえば、固形担体、たとえば、チップ、たとえば、本明細書に記載のインテグレートデバイス)の表面上に固定することを含みうる。いくつかの実施形態では、ポリペプチドは、基体上のサンプルウェルの表面上(たとえば、サンプルウェルのボトム表面上)に固定されうる。いくつかの実施形態では、ポリペプチドのN末端アミノ酸が固定される(たとえば、表面に装着される)。いくつかの実施形態では、ポリペプチドのC末端アミノ酸が固定される(たとえば、表面に装着される)。いくつかの実施形態では、1つ以上の非末端アミノ酸が固定される(たとえば、表面に装着される)。固定アミノ酸は、たとえば、本願に記載されるように、いずれかの好適な共有結合性又は非共有結合性連結を用いて装着可能である。いくつかの実施形態では、複数のポリペプチドが複数のサンプルウェルに、たとえば、基体上のサンプルウェルのアレイ中に装着される(たとえば、各サンプルウェルの表面たとえばボトム表面に1つのポリペプチドが装着される)。
本願に係るシーケンシングは、いくつかの態様では、単一分子分析を可能にするシステムを用いて実施されうる。システムは、インテグレートデバイスと、インテグレートデバイスにインターフェースするように構成された機器と、を含みうる。インテグレートデバイスは、ピクセルのアレイを含みうるとともに、個別ピクセルは、サンプルウェルと少なくとも1つの光検出器とを含む。インテグレートデバイスのサンプルウェルは、インテグレートデバイスの表面上又は表面全体にわたり形成されうるとともに、インテグレートデバイスの表面上に配置されたサンプルを受け取るように構成されうる。全体として、サンプルウェルは、サンプルウェルのアレイとみなされうる。複数のサンプルウェルは、サンプルウェルの少なくとも一部分が単一サンプル(たとえば、ポリペプチドなどの単一分子)を受け取るように好適なサイズ及び形状を有しうる。いくつかの実施形態では、サンプルウェル内のサンプルの数は、いくつかのサンプルウェルが1つのサンプルを含有し、一方、他のものがゼロ、2、又はそれ以上のサンプルを含有するように、インテグレートデバイスのサンプルウェル内に分配されうる。
励起光は、インテグレートデバイスの外部の1つ以上の光源からインテグレートデバイスに提供される。インテグレートデバイスの光学コンポーネントは、光源から励起光を受け取り、光をインテグレートデバイスのサンプルウェルのアレイにダイレクトし、そしてサンプルウェル内の照射領域を照明しうる。いくつかの実施形態では、サンプルウェルは、サンプルウェルの表面に近接してサンプルを保持できるようにするとともにサンプルへの励起光の送達及びサンプルからの放出光の検出を容易にしうる構成を有しうる。照明領域内に位置決めされるサンプルは、励起光により照明されるとそれに反応して放出光を放出しうる。たとえば、サンプルは、励起光の照明を介して励起状態を達成するとそれに反応して光を放出する蛍光マーカーで標識されうる。次いで、サンプルにより放出される放出光は、分析されるサンプルを有するサンプルウェルに対応するピクセル内の1つ以上の光検出器により検出されうる。いくつかの実施形態によれば数がおおよそ10,000ピクセル~1,000,000ピクセルの範囲内でありうるサンプルウェルのアレイ全体にわたり実施されるとき、複数のサンプルはパラレルに分析可能である。
インテグレートデバイスは、励起光を受け取って励起光をサンプルウェルアレイ間にダイレクトするための光学システムを含みうる。光学システムは、インテグレートデバイスに励起光を結合して他の光学コンポーネントに励起光をダイレクトするように構成された1つ以上のグレーティングカプラーを含みうる。光学システムは、グレーティングカプラーからサンプルウェルアレイに向けて励起光をダイレクトする光学コンポーネントを含みうる。かかる光学コンポーネントは、光学スプリッターと光学コンバイナーとウェーブガイドとを含みうる。いくつかの実施形態では、1つ以上の光学スプリッターは、グレーティングカプラーからの励起光を結合して励起光をウェーブガイドの少なくとも1つに送達しうる。いくつかの実施形態によれば、光学スプリッターは、ウェーブガイドの各々が実質的に類似した量の励起光を受け取るようにすべてのウェーブガイドにわたり実質的に均一な励起光の送達を可能にする構成を有しうる。かかる実施形態は、インテグレートデバイスのサンプルウェルが受け取る励起光の均一性を改善することによりインテグレートデバイスの性能を改善しうる。たとえば、サンプルウェルに励起光を結合するために及び/又は光検出器に放出光をダイレクトするために、インテグレートデバイスに含めるのに好適なコンポーネントの例は、「分子をプローブ、検出、及び分析するためのインテグレートデバイス(INTEGRATED DEVICE FOR PROBING,DETECTING AND ANALYZING MOLECULES)」という名称の2015年8月7日出願の米国特許出願第14/821,688号明細書、及び「分子をプローブ、検出、及び分析するための外部光源付きインテグレートデバイス(INTEGRATED DEVICE WITH EXTERNAL LIGHT SOURCE FOR PROBING,DETECTING,AND ANALYZING MOLECULES)」という名称の2014年11月17日出願の米国特許出願第14/543,865号明細書(両方ともその全体が参照により組み込まれる)に記載されている。インテグレートデバイスに実装されうる好適なグレーティングカプラー及びウェーブガイドの例は、「光カプラー及びウェーブガイドシステム(OPTICAL COUPLER AND WAVEGUIDE SYSTEM)」という名称の2017年12月15日出願の米国特許出願第15/844,403号明細書(その全体が参照により組み込まれる)に記載されている。
追加のフォトニック構造は、サンプルウェルと光検出器との間に位置決めされうるとともに、放出光の検出時にシグナルノイズに寄与するおそれのある光検出器に達する励起光を低減又は予防するように構成されうる。いくつかの実施形態では、インテグレートデバイスの回路として作用しうる金属層はまた、空間フィルターとしても作用しうる。好適なフォトニック構造の例は、分光フィルターと偏光フィルターと空間フィルターとを含みうるとともに、「光拒絶フォトニック構造(OPTICAL REJECTION PHOTONIC STRUCTURES)」という名称の2018年7月23日出願の米国特許出願第16/042,968号明細書(その全体が参照により組み込まれる)に記載されている。
インテグレートデバイスから離れて位置決めされるコンポーネントは、インテグレートデバイスに励起源を位置決め及びアライメントするために使用されうる。かかるコンポーネントは、レンズ、ミラー、プリズム、ウィンドウ、アパーチャ、アテニュエータ、及び/又は光ファイバーをはじめとする光学コンポーネントを含みうる。追加の機械的コンポーネントは、1つ以上のアライメントコンポーネントの制御を可能にするために機器に含まれうる。かかる機械的コンポーネントは、アクチュエーター、ステッパーモータ、及び/又はノブを含みうる。好適な励起源及びアライメント機構の例は、「パルスレーザー及びシステム(PULSED LASER AND SYSTEM)」という名称の2016年5月20日出願の米国特許出願第15/161,088号明細書(その全体が参照により組み込まれる)に記載されている。ビームステアリングモジュールの他の一例は、「コンパクトビーム整形及びステアリングアセンブリー(COMPACT BEAM SHAPING AND STEERING ASSEMBLY)」という名称の2017年12月14日出願の米国特許出願第15/842,720号明細書(参照により本明細書に組み込まれる)に記載されている。好適な励起源の追加の例は、「分子をプローブ、検出、及び分析するためのインテグレートデバイス(INTEGRATED DEVICE FOR PROBING,DETECTING AND ANALYZING MOLECULES)」という名称の2015年8月7日出願の米国特許出願第14/821,688号明細書(その全体が参照により組み込まれる)に記載されている。
インテグレートデバイスの個別ピクセルと共に位置決めされる光検出器は、ピクセルの対応するサンプルウェルからの放出光を検出するように構成及び位置決めされうる。好適な光検出器の例は、「受け取った光子の時間ビニングのためのインテグレートデバイス(INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS)」という名称の2015年8月7日出願の米国特許出願第14/821,656号明細書(その全体が参照により組み込まれる)に記載されている。いくつかの実施形態では、サンプルウェル及びそのそれぞれの光検出器は、共通軸に沿ってアライメントされうる。こうすると、光検出器は、ピクセル内のサンプルウェルにオーバーラップしうる。
検出放出光の特性は、放出光に関連付けられるマーカーを同定するための指標を提供しうる。かかる特性は、光検出器により検出される光子の到着時間、光検出器により経時的に蓄積される光子の量、及び/又は2つ以上の光検出器にわたる光子の分布をはじめとするいずれかの好適なタイプの特性を含みうる。いくつかの実施形態では、光検出器は、サンプルの放出光に関連付けられる1つ以上のタイミング特性(たとえば発光寿命)の検出を可能にする構成を有しうる。光検出器は、励起光のパルスがインテグレートデバイスを介して伝搬した後の光子到着時間の分布を検出しうるとともに、到着時間の分布は、サンプルの放出光のタイミング特性の指標(たとえば、発光寿命のプロキシ)を提供しうる。いくつかの実施形態では、1つ以上の光検出器は、マーカーにより放出される放出光の確率の指標(たとえば発光強度)を提供する。いくつかの実施形態では、複数の光検出器は、放出光の空間分布をキャプチャーするようにサイズ決め及び配置されうる。次いで、1つ以上の光検出器からの出力シグナルは、複数のマーカー間でマーカーを区別するために使用されうるとともに、複数のマーカーは、サンプル中のサンプルを同定するために使用されうる。いくつかの実施形態では、サンプルは、複数の励起エネルギーにより励起されうるとともに、複数の励起エネルギーに反応してサンプルにより放出される放出光及び/又は放出光のタイミング特性は、マーカーを複数のマーカーから区別しうる。
動作時、励起光を用いてウェル内のサンプルの一部又は全部を励起することと、サンプル放出からのシグナルを光検出器で検出することと、により、サンプルウェル内のサンプルのパラレル分析が行われる。サンプルからの放出光は、対応する光検出器により検出されて少なくとも1つの電気シグナルに変換されうる。電気シグナルは、インテグレートデバイスの回路内の伝導ラインに沿って伝達されうるとともに、インテグレートデバイスにインターフェースされた機器に接続されうる。電気シグナルは、後続処理及び/又は解析されうる。電気シグナルの処理又は解析は、機器上又は機器外のどちらかに位置する好適なコンピューティングデバイスで行われうる。
機器は、機器及び/又はインテグレートデバイスの動作を制御するためのユーザインターフェースを含みうる。ユーザインターフェースは、ユーザによる機器への情報の入力、たとえば、機器の機能を制御するために使用されるコマンド及び/又は設定値などの情報の入力を可能にするように構成されうる。いくつかの実施形態では、ユーザインターフェースは、ボタン、スイッチ、ダイヤル、及び音声コマンド用マイクロフォンを含みうる。ユーザインターフェースは、機器及び/又はインテグレートデバイスの性能に関するフィードバック、たとえば、適正アライメント及び/又はインテグレートデバイス上の光検出器からのリードアウトシグナルにより得られる情報、のユーザによる受取りを可能にしうる。いくつかの実施形態では、ユーザインターフェースは、オーディブルフィードバックを提供するためにスピーカーを用いたフィードバックを提供しうる。いくつかの実施形態では、ユーザインターフェースは、ユーザにビジュアルフィードバックを提供するためにインジケータライト及び/又はディスプレイスクリーンを含みうる。
いくつかの実施形態では、機器は、コンピューティングデバイスに接続するように構成されたコンピュータインターフェースを含みうる。コンピュータインターフェースは、USBインターフェース、ファイヤワイヤ(FireWire)(商標)インターフェース、又はいずれかの他の好適なコンピュータインターフェースでありうる。コンピューティングデバイスは、ラップトップコンピュータやデスクトップコンピュータなどのいずれかの汎用コンピュータでありうる。いくつかの実施形態では、コンピューティングデバイスは、好適なコンピュータインターフェースを経由してワイヤレスネットワークを介してアクセス可能なサーバ(たとえば、クラウドベースサーバ)でありうる。コンピュータインターフェースは、機器とコンピューティングデバイスとの間の情報の通信を促進しうる。コンピューティングデバイスへの機器を制御及び/又は構成するための入力情報は、提供され得、及びコンピュータインターフェースを介して機器に伝達され得る。機器により発生する出力情報は、コンピュータインターフェースを経由してコンピューティングデバイスにより受け取られうる。出力情報は、機器の性能に関するフィードバック、インテグレートデバイスの性能、及び/又は光検出器のリードアウトシグナルから発生するデータを含みうる。
いくつかの実施形態では、機器は、インテグレートデバイスの1つ以上の光検出器から受け取ったデータを解析するように及び/又は励起源に制御シグナルを伝達するように構成された処理デバイスを含みうる。いくつかの実施形態では、処理デバイスは、汎用プロセッサー、特化(specially-adapted)プロセッサー(たとえば、中央処理ユニット(CPU)、たとえば、1つ以上のマイクロプロセッサーコア若しくはマイクロコントローラコア、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、カスタム集積回路、ディジタルシグナルプロセッサー(DSP)、又はそれらの組合せ)を含みうる。いくつかの実施形態では、1つ以上の光検出器からのデータの処理は、機器の処理デバイス及び外部コンピューティングデバイスの両方により実施されうる。他の実施形態では、外部コンピューティングデバイスは省略されうるとともに、1つ以上の光検出器からのデータの処理は、インテグレートデバイスの処理デバイスのみにより実施されうる。
いくつかの実施形態によれば、発光放出特性に基づいてサンプルを解析するように構成された機器は、異なる発光分子間の発光寿命及び/若しくは強度の差並びに/又は異なる環境の同一発光分子の寿命及び/若しくは強度の差を検出しうる。発光放出寿命の差は、異なる発光分子の存在若しくは不在を見分けるために及び/又は発光分子が晒される異なる環境若しくは条件を見分けるために使用可能であることを、本発明者らは認識し高く評価した。いくつかの場合には、寿命(たとえば、発光波長ではない)に基づいて発光分子を見分けることは、システムの態様を単純化しうる。例として、波長識別光学素子(たとえば、波長フィルター、各波長の専用検出器、異なる波長の専用パルス光源、及び/又は回折光学素子)は、寿命に基づいて発光分子を見分けるときに数が低減されうるか又は排除されうる。いくつかの場合には、単一特性波長で動作する単一パルス光源は、光学スペクトルの同一波長領域内で放出するが測定可能に異なる寿命を有する異なる発光分子を励起するために使用されうる。同一波長領域に放出する異なる発光分子を励起して見分けるために、異なる波長で動作する複数の光源ではなく単一のパルス光源を使用する解析システムは、動作及び維持の複雑さが軽減され、よりコンパクトになりうるとともに、より低コストで製造されうる。
発光寿命解析に基づく解析システムはある特定の利益を有しうるが、解析システムにより得られる情報量及び/又は検出確度は、追加の検出技術を許容すれば増加させうる。たとえば、システムのいくつかの実施形態は、発光波長及び/又は発光強度に基づいてサンプルの1つ以上の性質を見分けるように追加的に構成されうる。いくつかの実現形態では、発光強度は、異なる発光標識を区別するために追加的又は代替的に使用されうる。たとえば、いくつかの発光標識は、それらの減衰率が類似しているおそれがあったとしても、有意に異なる強度で放出しうるか又はそれらの励起確率に有意差(たとえば、少なくとも約35%の差)を有しうる。測定励起光に対してビンシグナルを参照することにより、強度レベルに基づいて異なる発光標識を区別可能でありうる。
いくつかの実施形態によれば、異なる発光寿命は、発光標識の励起に続く発光放出イベントを時間ビンするように構成された光検出器を用いて区別されうる。時間ビニングは、光検出器に対する単一電荷蓄積サイクル時に発生しうる。電荷蓄積サイクルは、光発生キャリヤーが時間ビニング光検出器のビンに蓄積されるリードアウトイベント間のインターバルである。時間ビニング光検出器の例は、「受け取った光子の時間ビニングのためのインテグレートデバイス(INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS)」という名称の2015年8月7日出願の米国特許出願第14/821,656号明細書(参照により本明細書に組み込まれる)に記載されている。いくつかの実施形態では、時間ビニング光検出器は、光子吸収/キャリヤー発生領域で電荷キャリヤーを発生して電荷キャリヤー貯蔵領域の電荷キャリヤー貯蔵ビンに電荷キャリヤーを直接移送しうる。かかる実施形態では、時間ビニング光検出器は、キャリヤー移動/キャプチャー領域を含まないこともありうる。かかる時間ビニング光検出器は、「直接ビニングピクセル」といいうる。直接ビニングピクセルを含む時間ビニング光検出器の例は、「直接ビニングピクセルを備えたインテグレート光検出器(INTEGRATED PHOTODETECTOR WITH DIRECT BINNING PIXEL)」という名称の2017年12月22日出願の米国特許出願第15/852,571号明細書(参照により本明細書に組み込まれる)に記載されている。
いくつかの実施形態では、各試薬が発光強度に基づいて同定されうるように、同一タイプの異数のフルオロフォアがサンプル中の異なる試薬に連結されうる。たとえば、2つのフルオロフォアは、第1の標識付認識分子に連結されうるとともに、4つ以上のフルオロフォアは、第2の標識付認識分子に連結されうる。異数のフルオロフォアであるため、異なる認識分子に関連付けられる異なる励起確率及びフルオロフォア放出確率が存在しうる。たとえば、第2の標識付認識分子では、シグナル蓄積インターバル時、より多くの放出イベントが存在しうるので、ビンの見掛けの強度は、第1の標識付認識分子よりも有意に高くなる。
フルオロフォア減衰率及び/又はフルオロフォア強度に基づいてヌクレオチド又はいずれかの他の生物学的若しくは化学的サンプルを区別することは、光学励起及び検出システムの単純化を可能にしうることを、本発明者らは認識し高く評価した。たとえば、光学励起は、単一波長光源(たとえば、複数の光源ではなく1つの特性波長を生成する光源又は複数の異なる特性波長で動作する光源)で実施されうる。そのほか、波長識別光学素子及びフィルターは、検出システムに必要とされないこともありうる。また、異なるフルオロフォアからの放出を検出するために、各サンプルウェルに対して単一光検出器が使用されうる。「特性波長」又は「波長」という語句は、放射線の限定バンド幅内の中心波長又は主波長(たとえば、パルス光源による20nmバンド幅出力内の中心波長又はピーク波長)を意味するものとして用いられる。いくつかの場合には、「特性波長」又は「波長」は、光源による放射線出力の合計バンド幅内のピーク波長を意味するものとして用いられうる。
計算技術
本出願の態様は、本明細書に記載のポリペプチドシーケンシング技術により発生したデータを解析するための計算技術に関する。以上で考察されるように、たとえば、図1A及び1Bとの関連では、これらのシーケンシング技術を用いて発生したデータは、シーケンスされるポリペプチドの末端に露出されるアミノ酸にアミノ酸認識分子が会合するインスタンスの指標となる一連のシグナルパルスを含みうる。一連のシグナルパルスは、分解プロセスが逐次アミノ酸を除去して進行するにつれて経時的にその時点の末端のアミノ酸のタイプに依存して、さまざまな1つ以上のフィーチャー(たとえば、パルス持続時間、パルス間持続時間、大きさの変化)を有しうる。得られるシグナルトレースは、それぞれのアミノ酸に関連付けられるさまざまな1つ以上のフィーチャーから生じる特性パターンを含みうる。本明細書に記載の計算技術は、アミノ酸配列を同定するためにこれらのシーケンシング技術を用いて得られるかかるデータを解析する部分として実現されうる。
本出願の態様は、本明細書に記載のポリペプチドシーケンシング技術により発生したデータを解析するための計算技術に関する。以上で考察されるように、たとえば、図1A及び1Bとの関連では、これらのシーケンシング技術を用いて発生したデータは、シーケンスされるポリペプチドの末端に露出されるアミノ酸にアミノ酸認識分子が会合するインスタンスの指標となる一連のシグナルパルスを含みうる。一連のシグナルパルスは、分解プロセスが逐次アミノ酸を除去して進行するにつれて経時的にその時点の末端のアミノ酸のタイプに依存して、さまざまな1つ以上のフィーチャー(たとえば、パルス持続時間、パルス間持続時間、大きさの変化)を有しうる。得られるシグナルトレースは、それぞれのアミノ酸に関連付けられるさまざまな1つ以上のフィーチャーから生じる特性パターンを含みうる。本明細書に記載の計算技術は、アミノ酸配列を同定するためにこれらのシーケンシング技術を用いて得られるかかるデータを解析する部分として実現されうる。
いくつかの実施形態は、ポリペプチドの分解プロセス時のデータを得ることと、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分を決定するようにデータを解析することと、ポリペプチドに相当するアミノ酸配列を出力すること、を含みうる。図11は、本明細書に記載のポリペプチドシーケンシング技術を用いて得られるデータを解析することによりアミノ酸配列を同定するための例示的処理パイプライン1100の図である。図11に示されるように、シーケンシングデータ1102を解析することは、会合イベント同定技術1104とアミノ酸同定技術1106とを用いてアミノ酸配列1108を出力することを含みうる。
本明細書で考察されるように、シーケンシングデータ1102は、ポリペプチドの分解プロセス時に得られうる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時のポリペプチドの末端のアミノ酸アイデンティティーの指標となる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時に末端の異なるタイプの末端アミノ酸に結合する1つ以上のアミノ酸認識分子により生成されるシグナルの指標となる。模範的シーケンシングデータは、以上で考察される図1A及び1Bに示される。
分解プロセス時にシグナルがどのように発生するかに依存して、シーケンシングデータ1102は、1つ以上の異なるタイプのシグナルの指標となりうる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時に発生する発光シグナルの指標となる。たとえば、発光標識は、アミノ酸認識分子を標識するために使用されうるとともに、発光標識により放出される発光は、アミノ酸認識分子が特定アミノ酸に会合して発光シグナルをもたらすときに検出されうる。いくつかの実施形態では、シーケンシングデータ1102は、分解プロセス時に発生する電気シグナルの指標となる。たとえば、シーケンスされるポリペプチド分子は、ナノポアに固定されうるとともに、電気シグナル(たとえば、コンダクタンスの変化)は、アミノ酸認識分子が特定アミノ酸に会合するときに検出されうる。
いくつかの実施形態は、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するシーケンシングデータ1102の部分を決定するようにシーケンシングデータ1102を解析することを含む。図11に示されるように、会合イベント同定技術1104は、シーケンシングデータ1102にアクセスして会合イベントに対応するシーケンシングデータ1102の部分を同定するようにシーケンシングデータを解析しうる。会合イベントは、データ中では図1Bに示されるCP1やCP2などの特性パターンに対応しうる。いくつかの実施形態では、会合イベント同定技術1104は、一連の切断イベントを検出することと、逐次切断イベント間のシーケンシングデータ1102の部分を決定することと、を含みうる。例として、図1Bに示されるCP1とCP2との間の切断イベントは、CP1に対応するデータの第1の部分が第1の会合イベントとして同定されうるとともに、CP2に対応するデータの第2の部分が第2の会合イベントとして同定されうるように、検出されうる。
いくつかの実施形態は、シーケンシングデータ1102の決定部分の1つ以上に対してアミノ酸のタイプを同定することを含む。図11に示されるように、アミノ酸同定技術1106は、会合イベント同定技術1104により同定された会合イベントの1つ以上に対してアミノ酸のタイプを決定するために使用されうる。いくつかの実施形態では、会合イベント同定技術1104より同定されるデータの個別部分は、パルスパターンを含みうるとともに、アミノ酸同定技術1106は、そのそれぞれのパルスパターンに基づいて1つ以上の部分に対してアミノ酸のタイプを決定しうる。図1Bを参照して、アミノ酸同定技術1106は、CP1に対して第1のタイプのアミノ酸及びCP2に対して第2のタイプのアミノ酸を同定しうる。いくつかの実施形態では、アミノ酸のタイプを決定することは、データが閾値超であるときの会合イベント同定技術1104を用いて同定される部分などのデータの部分内の時間量を同定することと、データの部分に対して時間量と持続時間とを比較することと、を含みうる。たとえば、CP1に対してアミノ酸のタイプを同定することは、シグナルが閾値超である場合のCP1内の時間量、たとえば、シグナルがML超である場合の時間帯pdを決定することと、CP1に対してそれを合計持続時間と比較することと、を含みうる。いくつかの実施形態では、アミノ酸のタイプを決定することは、会合イベント同定技術1102により同定されたデータの1つ以上の部分に対して1つ以上のパルス持続時間を同定することを含みうる。たとえば、CP1に対してアミノ酸のタイプを同定することは、CP1に対して時間帯pdなどのパルス持続時間を決定することを含みうる。いくつかの実施形態では、アミノ酸のタイプを決定することは、会合イベント同定技術1104を用いて同定されたデータの1つ以上の部分に対して1つ以上のパルス間持続時間を同定することを含みうる。たとえば、CP1に対してアミノ酸のタイプを同定することは、ipdなどのパルス間持続時間を同定することを含みうる。
シーケンシングデータ1102の逐次部分に対してアミノ酸のタイプを同定することにより、アミノ酸同定技術1106は、ポリペプチドに相当するアミノ酸配列1108を出力しうる。いくつかの実施形態では、アミノ酸配列は、会合イベント同定技術1104を用いて同定されたデータの部分に対応する一連のアミノ酸を含む。
図12は、本明細書に記載の技術のいくつかの実施形態に係るポリペプチド分子のアミノ酸配列を決定するための例示的プロセス1200のフローチャートである。プロセス1200は、本明細書に記載の技術の態様がこの態様に限定されないので、いずれかの好適なコンピューティングデバイス(たとえば、単一コンピューティングデバイス、単一物理的位置に共配置された又は互いに離れた複数の物理的位置に配置された複数のコンピューティングデバイス、クラウドコンピューティングシステムの1つ以上のコンピューティングデバイス部分など)で実施されうる。いくつかの実施形態では、会合イベント同定技術1104及びアミノ酸同定技術1106は、アミノ酸配列を決定するためにプロセス1200の一部又は全部を実施しうる。
プロセス1200は、単一ポリペプチド分子と1つ以上の末端アミノ酸認識分子とを接触させることを含む動作1202で始まる。次に、プロセス1200は、1つ以上の末端アミノ酸認識分子と、単一ポリペプチドが分解されつつある間に単一ポリペプチドの末端に露出される逐次アミノ酸と、の会合の指標となる一連のシグナルパルスを検出することを含む動作1104に進む。一連のパルスは、たとえば、会合イベント同定技術1104及びアミノ酸同定技術1106を用いることにより、単一ポリペプチド分子のシーケンシングを可能にしうる。
プロセス1200は、単一ポリペプチド分子と1つ以上の末端アミノ酸認識分子とを接触させることを含む動作1202で始まる。次に、プロセス1200は、1つ以上の末端アミノ酸認識分子と、単一ポリペプチドが分解されつつある間に単一ポリペプチドの末端に露出される逐次アミノ酸と、の会合の指標となる一連のシグナルパルスを検出することを含む動作1104に進む。一連のパルスは、たとえば、会合イベント同定技術1104及びアミノ酸同定技術1106を用いることにより、単一ポリペプチド分子のシーケンシングを可能にしうる。
いくつかの実施形態では、プロセス1200は、たとえば、アミノ酸同定技術1106を用いることにより、一連のシグナルパルスの第1の特性パターンに基づいて単一ポリペプチド分子の第1のタイプのアミノ酸を同定することを含む動作1206を含みうる。
図13は、本明細書に記載の技術のいくつかの実施形態に係るポリペプチドに相当するアミノ酸配列を決定するための例示的プロセス1300のフローチャートである。プロセス1300は、本明細書に記載の技術の態様がこの態様に限定されないので、いずれかの好適なコンピューティングデバイス(たとえば、単一コンピューティングデバイス、単一物理的位置に共配置された又は互いに離れた複数の物理的位置に配置された複数のコンピューティングデバイス、クラウドコンピューティングシステムの1つ以上のコンピューティングデバイス部分など)で実施されうる。いくつかの実施形態では、会合イベント同定技術1104及びアミノ酸同定技術1106は、アミノ酸配列を決定するためにプロセス1300の一部又は全部を実施しうる。
プロセス1300は、ポリペプチドの分解プロセス時のデータが得られる動作1302で始まる。いくつかの実施形態では、データは、分解プロセス時のポリペプチドの末端のアミノ酸アイデンティティー(identity)の指標となる。いくつかの実施形態では、データは、分解プロセス時に末端の異なるタイプの末端アミノ酸に結合する1つ以上のアミノ酸認識分子により生成されるシグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する発光シグナルの指標となる。いくつかの実施形態では、データは、分解プロセス時に発生する電気シグナルの指標となる。
次に、プロセス1300は動作1304に進み、そこでデータが解析されて、たとえば、会合イベント同定技術1104及びアミノ酸同定技術1106を用いることにより、分解プロセス時にポリペプチドの末端に逐次露出されるアミノ酸に対応するデータの部分が決定される。いくつかの実施形態では、データを解析することは、一連の切断イベントを検出することと、たとえば、会合イベント同定技術1104を用いることにより、逐次切断イベント間のデータの部分を決定することと、をさらに含む。
いくつかの実施形態では、データを解析することは、たとえば、アミノ酸同定技術1106を用いることにより、個別部分の各々に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、個別部分の各々は、パルスパターンを含み、且つデータを解析することは、そのそれぞれのパルスパターンに基づいて1つ以上の部分に対してアミノ酸のタイプを決定することをさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、データが閾値超であるときの部分内の時間量を同定することと、部分に対して時間量と持続時間とを比較することと、をさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス持続時間を同定することをさらに含む。いくつかの実施形態では、アミノ酸のタイプを決定することは、1つ以上の部分の各々に対して少なくとも1つのパルス間持続時間を同定することをさらに含む。
次に、プロセス1300は動作1306に進み、そこでたとえば、ユーザインターフェースを介して、ポリペプチドに相当するアミノ酸配列が出力される。いくつかの実施形態では、アミノ酸配列は、部分に対応する一連のアミノ酸を含む。
本明細書に記載の技術の実施形態のいずれかと組み合わせて使用されうるコンピュータシステム1400の例示的実現形態が図14に示される。コンピュータシステム1400は、1つ以上のプロセッサー1410と、非一時コンピュータ可読記憶媒体(たとえば、メモリー1420及び1つ以上の不揮発性記憶媒体1430)を含む1つ以上の製造品と、を含む。プロセッサー1410は、メモリー1420及び不揮発性記憶デバイス1430に対するデータ書込み及びデータ読出しをいずれかの好適な方式で制御しうるが、本明細書に記載の技術の態様は、この点に限定されるものではない。本明細書に記載の機能性のいずれかを実施するために、プロセッサー1410は、プロセッサー1410により実行されるプロセッサー実行可能命令を記憶する非一時コンピュータ可読記憶媒体として機能しうる1つ以上の非一時コンピュータ可読記憶媒体(たとえば、メモリー1420)に記憶された1つ以上のプロセッサー実行可能命令を実行しうる。
コンピューティングデバイス1400はまた、コンピューティングデバイスと他のコンピューティングデバイスとの通信(たとえば、ネットワークを介して)を媒介しうるネットワーク入出力(I/O)インターフェース1440を含みうるとともに、コンピューティングデバイスによるユーザへの出力の提供及びユーザからの入力の受取りを媒介しうる1つ以上のユーザI/Oインターフェース1450も含みうる。ユーザI/Oインターフェースとしては、キーボード、マウス、マイクロフォン、ディスプレイデバイス(たとえば、モニター又はタッチスクリーン)、スピーカー、カメラ、及び/又は各種他のタイプのI/Oデバイスなどのデバイスが挙げられうる。
以上に記載の実施形態は、多くの手段のいずれかで実現可能である。たとえば、実施形態は、ハードウェア、ソフトウェア、又はそれらの組合せを用いて実現しうる。ソフトウェアで実現する場合、ソフトウェアコードは、単一コンピューティングデバイスに提供されるか又は複数のコンピューティングデバイスに分散されるかにかかわらず、いずれかの好適なプロセッサー(たとえば、マイクロプロセッサー)又は一群のプロセッサーで実行可能である。以上に記載の機能を実施する任意のコンポーネント又は一群のコンポーネントは、以上で考察された機能を制御する1つ以上のコントローラであると一般にみなしうることを認識すべきである。1つ以上のコントローラは、多くの方法で、たとえば、以上に述べた機能を実施するマイクロコード又はソフトウェアを用いてプログラムされた専用ハードウェアを用いて又は汎用ハードウェア(たとえば、1つ以上のプロセッサー)を用いて、実現可能である。
これに関連して、本明細書に記載の実施形態の一実現形態(implementation)は、1つ以上のプロセッサーで実行するときに1つ以上の実施形態の以上で考察される機能を実施するコンピュータプログラム(すなわち、複数の実行可能命令)によりコードされる少なくとも1つのコンピュータ可読記憶媒体(たとえば、RAM、ROM、EEPROM、フラッシュメモリー、又は他のメモリー技術、CD-ROM、ディジタル多用途ディスク(DVD)、又は他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、又は他の磁気記憶デバイス、又は他のタンジブル非一時コンピュータ可読記憶媒体)を含むことが認識されるべきである。コンピュータ可読媒体は、本明細書で考察される技術の態様を実現するために、記憶されたプログラムをいずれかのコンピューティングデバイスにロードできるようにトランスポート可能でありうる。そのほか、実行時に以上で考察された機能のいずれかを実施するコンピュータプログラムへの参照は、ホストコンピュータ上で実行されるアプリケーションプログラムに限定されるものではないことが認識されるべきである。むしろ、コンピュータプログラム及びソフトウェアという用語は、本明細書で考察される技術の態様を実現するように1つ以上のプロセッサーをプログラムするために利用可能ないずれかのタイプのコンピュータコード(たとえば、アプリケーションソフトウェア、ファームウェア、マイクロコード、又はいずれかの他の形態のコンピュータ命令)を参照するために一般的な意味で本明細書で用いられる。
実施例1.ペプチド表面固定用の可溶化性リンカー
水性緩衝液へのオリゴペプチドの溶解性の改善を試みて、ペプチド断片をオリゴヌクレオチドリンカーにコンジュゲートすることにより、水への溶解性を改善しうるとともに単一分子レベルでペプチドを表面固定するための機能部分も提供しうると判断された。さまざまなペプチド-リンカーコンジュゲートが合成され、ペプチド-DNAコンジュゲート及びペプチド-PEGコンジュゲートに関して構造例が図15Aに描かれる。リンカーコンジュゲーションは、評価されたさまざまなペプチド-リンカーコンジュゲートの各々で水性溶液へのペプチドの溶解性を大きく増強することが観測された。
水性緩衝液へのオリゴペプチドの溶解性の改善を試みて、ペプチド断片をオリゴヌクレオチドリンカーにコンジュゲートすることにより、水への溶解性を改善しうるとともに単一分子レベルでペプチドを表面固定するための機能部分も提供しうると判断された。さまざまなペプチド-リンカーコンジュゲートが合成され、ペプチド-DNAコンジュゲート及びペプチド-PEGコンジュゲートに関して構造例が図15Aに描かれる。リンカーコンジュゲーションは、評価されたさまざまなペプチド-リンカーコンジュゲートの各々で水性溶液へのペプチドの溶解性を大きく増強することが観測された。
N末端アミノペプチダーゼによるペプチドN末端のアミノ酸切断に関して、ペプチド-リンカーコンジュゲートを評価した(以下の表6)。
表6に示されるペプチド-リンカーコンジュゲートは、プロリンイミノペプチダーゼ(「PIP」)又はラットアミノペプチダーゼN(「ラットAPN」)のどちらかと共にインキュベートされ、且つペプチド切断は、LCMSによりモニターされた。表6のエントリー5の切断を実証するLCMSの例は、図15Bに示される。すべての他の切断反応は、同様に測定された。表6に示されるように、正荷電ペプチド-DNAコンジュゲート(「オリゴ」及び「オリゴ-PEG」リンカー)は、試験アミノペプチダーゼにより切断されず、DNAオリゴヌクレオチドリンカーを有するすべての他のコンジュゲートクラス(負荷電、芳香族、疎水性)は切断された。比較により、正荷電ペプチド-PEGコンジュゲートは、アミノペプチダーゼの少なくとも1つにより切断されることが示された。
標識付ペプチド-リンカーコンジュゲートを用いて、異なる組成のペプチドを単一分子分析のために個別サンプルウェル表面に固定可能であることが示された。これらの実験では、DNAリンカーは、色素で標識され(たとえば、ペプチド-DNAコンジュゲートの場合、図15Aに描かれる通りである)、且つ個別サンプルウェルへの異なるペプチド-DNAコンジュゲートのローディングは、色素蛍光により測定された。ローディング実験例は、図15Cに示される。標識付ペプチド-DNAコンジュゲート(50pM)の蛍光放出を測定することにより、チップ上のサンプルウェルの少なくとも18%は、表面固定コンジュゲートを有してサンプルウェル当たり単一占有でロードされたと判断された。これらの実験は、ペプチド-リンカーコンジュゲートが非コンジュゲートペプチドカウンターパートと比較して増強された水への溶解性を呈すること、コンジュゲートリンカーが異なるアミノペプチダーゼによるペプチドの末端アミノ酸切断を防止しないこと、且つ異なる組成のペプチド-リンカーコンジュゲートが単一分子レベルでチップ表面に固定されうることを実証した。
実施例2.ポリペプチド基質のエキソペプチダーゼ切断
さまざまなアミノペプチダーゼの切断能力を試験した。ペプチド基質の切断は、高速液体クロマトグラフィー(HPLC)を使用してアッセイされた。選ばれたエキソペプチダーゼのアミノ酸切断活性の概要は、図16に示される。特異的切断活性は、次の酵素:「cVPr」(V.プロテオリティカス(V.proteolyticus)アミノペプチダーゼ)、「yPIP」(Y.ペスティス(Y.pestis)プロリンイミノペプチダーゼ)、「D/E APN」(L.ニューモフィラ(L.pneumophila)M1アミノペプチダーゼ)、hTET(パイロコッカス・ホリコシイ(Pyrococcus horikoshii)TETアミノペプチダーゼ)、及びPfu API(「PfuTET」)に対して示される。末端アミノ酸に対する比活性は、アミノ酸に一文字略号を用いて、示されるように分類される(「XP-」は、隣接又はペナルティメートのプロリン(P)残基を有するいずれかの末端アミノ酸(X)を表す)。
さまざまなアミノペプチダーゼの切断能力を試験した。ペプチド基質の切断は、高速液体クロマトグラフィー(HPLC)を使用してアッセイされた。選ばれたエキソペプチダーゼのアミノ酸切断活性の概要は、図16に示される。特異的切断活性は、次の酵素:「cVPr」(V.プロテオリティカス(V.proteolyticus)アミノペプチダーゼ)、「yPIP」(Y.ペスティス(Y.pestis)プロリンイミノペプチダーゼ)、「D/E APN」(L.ニューモフィラ(L.pneumophila)M1アミノペプチダーゼ)、hTET(パイロコッカス・ホリコシイ(Pyrococcus horikoshii)TETアミノペプチダーゼ)、及びPfu API(「PfuTET」)に対して示される。末端アミノ酸に対する比活性は、アミノ酸に一文字略号を用いて、示されるように分類される(「XP-」は、隣接又はペナルティメートのプロリン(P)残基を有するいずれかの末端アミノ酸(X)を表す)。
実施例3.単一分子レベルの固定ペプチドの末端アミノ酸切断
固定ペプチドのオンチップアミノ酸切断のアッセイは、標識付ペプチドコンジュゲートを用いて開発された。アッセイは、固定ペプチドに対するエキソペプチダーゼの酵素認識及び切断活性を決定する方法を提供するように設計された。これは速度論的結合パラメータ及び一般的結合親和性の測定を可能にしうる。
固定ペプチドのオンチップアミノ酸切断のアッセイは、標識付ペプチドコンジュゲートを用いて開発された。アッセイは、固定ペプチドに対するエキソペプチダーゼの酵素認識及び切断活性を決定する方法を提供するように設計された。これは速度論的結合パラメータ及び一般的結合親和性の測定を可能にしうる。
ペプチドのN末端アミノ酸切断を評価するために、PEGスペーサーを介して色素に装着されたN末端アスパラギン酸を含有する色素標識付ペプチドを設計及び合成した。このペプチドはまた、酵素プロリンイミノペプチダーゼ(エルシニア・ペスティス(Yersinia pestis)由来であり、他でも知られ、本明細書では「yPIP」といわれる)により特異的に認識される修飾アスパラギン酸に隣接するプロリン残基も含有していた。酵素yPIPは、プロリン残基の上流のN末端アミノ酸のみを切断するはずである。
この及び他の標識付ペプチドがバルクでyPIPにより効率的にカットされることを示した後(たとえば、実施例1に記載の通り)、単一分子レベルでN末端アミノ酸切断を観測するために、オンチップ色素/ペプチドコンジュゲートアッセイを開発した。図17Aは、色素/ペプチドコンジュゲートアッセイの一般的スキームを示す(インセットパネル)。示されるように、スペーサーを介してN末端アミノ酸に装着された標識を有するペプチドは、リンカーを介して表面に固定される。ペプチダーゼに暴露された後、N末端アミノ酸切断は、検出可能観測容積からの標識付残基の除去をもたらすとともに、標識からのシグナルの付随的損失により測定される。インセットパネルの右側の酵素-ペプチド複合体は、N末端切断部位を一般的に描く。
図17Aは、色素/ペプチドコンジュゲートアッセイに使用するように設計及び合成された標識付ペプチド構築物を示す(ボトム)。これらの実験では、N末端にペナルティメート(penultimate)プロリン残基を有するペプチドのN末端アスパラギン酸残基にローダミン色素(アトー(ATTO)Rho6G)を装着した。示されるように、表面固定のためにビオチン部分を有する可溶化性DNAリンカーにペプチドをさらにコンジュゲートした。
標識付ペプチドコンジュゲートは、サンプルウェルのアレイを有するガラスチップ上にロードされた。ローダミン蛍光により単一占有のサンプルウェルのパーセントローディングを決定するために、ローディングの前及び後でチップの画像を取得した。次いで、ロードされたチップ上に酵素yPIPを導入し、37℃で2時間インキュベートした。yPIPの導入に続いてチップの画像を取得して失われた緑色色素のパーセントを計算することにより、N末端アミノ酸切断を評価した。図17Bは、ローディングステージへの6~7%ローディングと、yPIPと共にインキュベートした後、事前にロードされたウェルで91%シグナル損失(これはN末端アミノ酸切断の指標となる)と、を呈した実験のイメージング結果を示す。図17Cは、これらの実験の代表的シグナルトレースを示しており、標識付ペプチドのローディング時に色素シグナルの増加が検出されるとともに、yPIPへの暴露に続いて色素シグナルの損失が検出されることが実証される。
単一分子レベルでのN末端アミノ酸切断のさらなる確認として、エキソペプチダーゼ認識及び切断活性を評価するために、オンチップFRETアッセイを開発した。図18Aは、FRETペプチドコンジュゲートアッセイ(パネルA)及びFRET酵素コンジュゲートアッセイ(パネルB)を一般的に描く。FRETペプチドコンジュゲートアッセイ(パネルA)では、固定ペプチド構築物は、リンカーに装着されたFRETドナー標識と、N末端に装着されたFRETアクセプター標識と、を含む。N末端アミノ酸切断は、ペプチダーゼに暴露したときのFRETアクセプター標識からのシグナルの損失により検出される。そのほか、この設計は、FRETドナー標識からの放出を追跡することにより、実験全体を通してペプチドコンジュゲートのローディングのモニタリングを可能にする。
FRET酵素コンジュゲートアッセイ(パネルB)では、固定ペプチド構築物は、リンカーに装着されたFRETペアの第1の標識を含み、且つペプチダーゼは、FRETペアの第2の標識で標識される。N末端アミノ酸切断は、ペプチドへのペプチダーゼの近接が十分であり且つN末端での滞留時間が十分であるときに発生するFRET相互作用に帰属可能な蛍光の増強により検出される。そのほか、このアッセイは、プロセッシブ切断によるFRETシグナルの経時的増加を検出することにより、プロセッシブエキソペプチダーゼによるプロセッシブアミノ酸切断の評価を可能にする。
図18Aはまた、パネルAのFRETペプチドコンジュゲートアッセイに使用するために設計及び合成されたFRETペプチド構築物をパネルAに示す。示されるように、FRETペプチド構築物は、N末端ペナルティメートプロリン残基を有するペプチドのN末端アスパラギン酸残基に装着されたローダミン色素(アトー(ATTO)647N)を含んでいた。ペプチドは、FRETのためにシアニン色素(Cy3B)と表面固定のためにビオチン部分とに装着された可溶化性DNAリンカーにさらにコンジュゲートされた。
この実験では、FRETペプチド構築物は、サンプルウェルのアレイを有するガラスチップ上にロードされ、且つ捕集光は、最初に緑色フィルター及び次いで赤色フィルターによりフィルターされた。FRETペプチド構築物のローディングは、緑色及び赤色フィルターの両方を通り抜けるシグナルを測定することにより検出された。末端アミノ酸切断は、シグナルが緑色フィルターのみで測定可能であるときに検出されたことから、FRETペプチド構築物の赤色色素コンジュゲートN末端アミノ酸がyPIPにより切断されたことが示唆される。この検出パターンはパネルCに例示される。示されるように、yPIPの添加前に両方の色素が検出可能であり且つyPIPと共にインキュベートした後に緑色色素のみが視認可能である場合、こうした検出パターンの変化はペプチドの切断に起因するものであり全体的な光漂白にもペプチドの損失にも起因しないと、合理的に結論付け可能である。そのほか、単独の緑色色素からの蛍光の増加が予想されるであろう。なぜなら、その放出がもはや赤色色素により吸収されないからである。
ホスホン酸とシランとを用いて表面パッシベーションにより修飾されたチップへのFRETペプチド構築物のローディングに続いて、yPIPを導入していくつかの時間点で画像を得た。全体的切断トレンドを評価するために、各実験に対して(緑色)/(緑色+赤色)の比を計算した。この比は、発生する切断の程度と共に増加する。図18Bは、yPIPと共にインキュベートした異なる時間点のすべてのアパーチャにわたるFRET放出比のプロットである。示されるように、蛍光放出比への緑色色素の寄与が経時的に増加することから、yPIPと共にインキュベートしたとき、より多くのN末端アスパラギン酸残基がカットされて、緑色色素のみのトランケートペプチドが残ることが示唆される。
次いで、どの時間点で色素蛍光が観測されたかを決定することにより、異なる時間点でカッティング効率を評価した。これは単純な閾値化により行われた。たとえば、平均色素発光シグナルが励起時に>2.5であった場合、色素は存在すると決定された(各対応するフィルターを適用したとき)。次いで、カッティングを呈するアパーチャは、実験のローディングフェーズ時に緑色色素及び赤色色素の両方を呈するであろうが、yPIPに暴露された時間点で緑色色素のみを呈するであろう。図18Cに示されるように、チップがyPIPと共により長いインキュベーション時間に露出されると、徐々により多くのカッティングが観測された。3つのyPIP処理時間点の各々で呈するカッティングを示すシグナルトレース例を図18Dに示す。
デキストランを用いて表面パッシベーションにより修飾されたチップを用いてyPIP及び他のペプチダーゼにより追加の実験を実施したところ、チップ上へのペプチダーゼの導入に続いて経時的な末端アミノ酸切断の増加を示す類似の結果を生じた。図18Eは、yPIPと共にインキュベートした異なる時間点のロードされたアパーチャにわたるFRET放出比のプロットである。図18Fは、アミノペプチダーゼと共にインキュベートした異なる時間点のロードされたアパーチャにわたるFRET放出比のプロットである。全体として、ここでの実験は、異なるエキソペプチダーゼ及び異なる標識化ストラテジーを用いて単一分子レベルでリアルタイムにN末端アミノ酸切断を検出可能であることを実証する。
実施例4.標識付認識分子による末端アミノ酸識別
N末端芳香族残基を検出するために、標識付認識分子として使用するための潜在的候補として、タンパク質分解経路に関与するアダプタータンパク質を同定した。α-プロテオバクテリア(A.ツメファシエンス(A.tumefaciens))由来のアダプタータンパク質ClpS2を発現し、露出されたシステイン残基に標識した。図19Aは、スティックとして示される露出されたシステイン残基と共にClpS2タンパク質の結晶構造を示す。露出されたシステイン残基は、ローダミン色素(アトー(ATTO)532)で標識された。
N末端芳香族残基を検出するために、標識付認識分子として使用するための潜在的候補として、タンパク質分解経路に関与するアダプタータンパク質を同定した。α-プロテオバクテリア(A.ツメファシエンス(A.tumefaciens))由来のアダプタータンパク質ClpS2を発現し、露出されたシステイン残基に標識した。図19Aは、スティックとして示される露出されたシステイン残基と共にClpS2タンパク質の結晶構造を示す。露出されたシステイン残基は、ローダミン色素(アトー(ATTO)532)で標識された。
標識付ClpS2により単一分子レベルでN末端アミノ酸識別が可能であるかを試験するために、異なるN末端芳香族残基を有するペプチドを調製した。これらの実験の単一分子強度トレース例を図19Bに示す。示されるように、シグナルトレースは、N末端フェニルアラニン残基(F、トップのシグナルトレース)、N末端チロシン残基(Y、中間のシグナルトレース)、又はN末端トリプトファン残基(W、ボトムのシグナルトレース)のどれかを有するペプチドのN末端に可逆結合する標識付認識分子に対応する残基特異的オンオフ結合パターンを実証する。
図19C~19Eに示される結果を用いて、単一分子トラジェクトリーのさらなる解析を行った。図19Cは、標識付ClpS2により可逆結合されたときの3つのN末端残基間のディスクリミナントパルス持続時間(シグナルピークの持続時間)を示すプロットである。図19Dは、3つのN末端残基間のディスクリミナント(discriminant)パルス間持続時間(シグナルパルス間の持続時間)を示すプロットである。図19Eは、ペプチドN末端のフェニルアラニン、チロシン、及びトリプトファン間のディスクリミナントパルス持続時間をさらに例示するプロットを示す。異なるN末端残基の平均パルス持続時間は、ヒストグラム(A)~(B)及びレイヤードヒストグラム(C)により可視化される。
ロイシン認識用の標識付認識分子として使用するために、サーモシノコッカス・エロンガタス(Thermosynochoccus elongatus)由来の他のアダプタータンパク質ClpSを評価した。図19F~19Hに示される滞留時間解析から得られるデータは、標識付teClpSタンパク質が0.71秒間の平均パルス持続時間でポリペプチドの末端ロイシン残基との検出可能結合相互作用を生成することを実証した。これらの実験に使用されるteClpSタンパク質のアミノ酸配列は表1に示される。
ロイシン認識用の潜在的試薬としてA.ツメファシエンス(A.tumefaciens)ClpS1及びS.エロンガタス(elongatus)ClpS2並びにプロリン認識用の潜在的試薬としてGID4を評価するために、類似の実験を行った。図19Iは、A.ツメファシエンス(A.tumefaciens)ClpS1によるフェニルアラニン、ロイシン、トリプトファン、及びチロシンの区別可能認識を示した滞留時間解析の結果例を示す。図19Jは、S.エロンガタス(elongatus)ClpS2によるロイシン認識を実証する滞留時間解析の結果例を示す。図19K~19Lは、GID4によるプロリン認識を実証する滞留時間解析の結果例を示す。
さまざまなタイプの末端アミノ酸に結合する1つの認識分子の反応速度を評価するために、A.ツメファシエンス(A.Tumefaciens)ClpS2(atClpS2-V1)のさまざまなペプチダーゼへの結合親和性を、結合偏光アッセイにて決定した。図19Mには、atClpS2-V1とさまざまなN末端アミノ酸(フェニルアラニン(左側プロット)、チロシン(中央プロット)、及びトリプロファン(右側プロット))を有するペプチドとのKDによる模範的結合曲線が示される。各ペプチドは、隣接したペナルティメート位置にアラニン残基を含有していた。アンサンブル測定に基づいて、atClpS2-V1との決定されたKD値は、以下:フェニルアラニンペプチドに対して743nM、チロシンペプチドに対して2049nM、及びトリプトファンペプチドに対して3510nMのようであった。
実施例5.分解時の認識によるポリペプチドシーケンシング
進行中の分解反応時のN末端アミノ酸認識によるペプチドシーケンシングを評価するために実験を行った。これらの実験の結果例は、図20A~20Dに示されており、これらは、同一反応混合物で標識付ClpS2タンパク質及びアミノペプチダーゼを用いてリアルタイムで行われた2つの独立したポリペプチドシーケンシング反応により得られた単一分子強度トレースを示す。各反応では、配列YAAWAAFADDDWK(配列番号234)のポリペプチドは、チップ上にペプチド組成物(10pM)を20分間ロードすることによりC末端リシン残基を介してチップ表面に固定され、且つ固定されたペプチドは、標識付認識分子(500nMのアトー(ATTO)542標識付A.ツメファシエンス(A.tumefaciens)ClpS2-V1)及びアミノペプチダーゼ切断試薬(8μMのVPr)の存在下でモニターされた。
進行中の分解反応時のN末端アミノ酸認識によるペプチドシーケンシングを評価するために実験を行った。これらの実験の結果例は、図20A~20Dに示されており、これらは、同一反応混合物で標識付ClpS2タンパク質及びアミノペプチダーゼを用いてリアルタイムで行われた2つの独立したポリペプチドシーケンシング反応により得られた単一分子強度トレースを示す。各反応では、配列YAAWAAFADDDWK(配列番号234)のポリペプチドは、チップ上にペプチド組成物(10pM)を20分間ロードすることによりC末端リシン残基を介してチップ表面に固定され、且つ固定されたペプチドは、標識付認識分子(500nMのアトー(ATTO)542標識付A.ツメファシエンス(A.tumefaciens)ClpS2-V1)及びアミノペプチダーゼ切断試薬(8μMのVPr)の存在下でモニターされた。
図20A及び20Cは、2つの異なるシーケンシングランのシグナルトレースデータを示し、トップのパネル(図20Aのパネル1、図20Cのパネル2)はフルトレースを示し、且つボトムのパネル(Y、W、F)はフルトレース内の強調領域の各々に対応する拡大領域を示す。図20B及び20Dは、それぞれ、図20A及び20Cに記された対応するパネルのトレースデータのパルス持続時間統計をヒストグラムで示す。各シーケンシングランのフルシグナルトレース(パネル1、2)に示されるように、反応過程全体にわたりシグナルパルスの3つの個別時間インターバルが観測された。拡大領域(パネルY、W、F)により強調されるように、3つのインターバルは、シグナルパルスのパターンの観測可能な差に基づいて互いに視覚的に区別可能である。
シグナルパルスデータをさらに解析するために、各時間インターバルでパルス持続時間統計を決定した(図20B及び20D)。ClpS2を用いた定常状態オンチップ結合アッセイでこれらのアミノ酸に対して個別に観測されたものに対応するようにパルス持続時間分布の差を決定したところ、シグナルパルス情報は、シーケンシングランからのインターバルと個別アミノ酸結合アッセイからのインターバルとの間で表現型に一貫性があった。
シグナルパルス情報の解析により確認されるように、各シーケンシングランの進行で観測されるシグナルパルスの3つの時間インターバルは、それぞれ、Y、W、及びFの認識パターンに対応する(パネル1、2)。シグナルパルスパターン間の介在時間帯は、N末端アラニン残基に結合しないClpS2-V1の選択性に起因する。フルシグナルトレースにより例示されるように、第1のインターバルはY認識に対応し、それに続いて、VPrペプチダーゼがY及び2つアラニン残基をカットするので休止があり、続いてW認識に対応する第2のインターバルがあり、それに続いて、VPrペプチダーゼがW及び2つアラニン残基をカットするので他の休止があり、最後にF認識に対応する第3のインターバルがあり、その後、VPrペプチダーゼがFをカットして除去し、残留するADDDWKペプチドで停止する。進行中の分解反応時に末端アミノ酸認識により得られるパルス持続時間情報は、異なるタイプの末端アミノ酸を識別する特性パターンを決定するために使用可能であることが、これらの結果から示される。
実施例6.標識付エキソペプチダーゼによる末端アミノ酸の同定及び切断
ペプチドの末端アミノ酸を同定することと、ペプチドから末端アミノ酸を切断することと、の両方が可能な単一試薬の可能性を調べるために、試験を実施した。単一試薬として、エキソペプチダーゼは、末端残基に対する切断活性を保持しつつペプチドに結合可能でなければならない。それゆえ、異なるエキソペプチダーゼの天然の表面露出アミノ酸に的を絞ることにより、伝統的標識化ストラテジーを利用する初期のアプローチを行った。これらの実験では、エキソペプチダーゼ標識化のためのロバストな方法であることが証明された蛍光色素で、表面露出システイン(-SH)又はリシン(-NH2)残基を標識した。しかしながら、ある特定の場合には、このアプローチは、1つ以上の色素で標識されるタンパク質の不均一集団を生成した。
ペプチドの末端アミノ酸を同定することと、ペプチドから末端アミノ酸を切断することと、の両方が可能な単一試薬の可能性を調べるために、試験を実施した。単一試薬として、エキソペプチダーゼは、末端残基に対する切断活性を保持しつつペプチドに結合可能でなければならない。それゆえ、異なるエキソペプチダーゼの天然の表面露出アミノ酸に的を絞ることにより、伝統的標識化ストラテジーを利用する初期のアプローチを行った。これらの実験では、エキソペプチダーゼ標識化のためのロバストな方法であることが証明された蛍光色素で、表面露出システイン(-SH)又はリシン(-NH2)残基を標識した。しかしながら、ある特定の場合には、このアプローチは、1つ以上の色素で標識されるタンパク質の不均一集団を生成した。
エキソペプチダーゼ上のどこで標識化を行うかをより精密に制御して各エキソペプチダーゼ分子が単一蛍光色素で確実に標識されるようにするために(さらには色素のオフターゲット反応性を排除するために)、新しい標識化ストラテジーを検討した。これらの実験では、反応性官能基を含有する非天然アミノ酸がエキソペプチダーゼに導入される部位特異的標識化ストラテジーを用いて、標識付エキソペプチダーゼを調製した(たとえば、チン,J.W.(Chin,J.W.)ら著、ジャーナル・オブ・アメリカン・ケミカル・ソサイエティー(J Am Chem Soc.)、2002年8月7日、第124巻、第31号、p.9026~9027を参照されたい)。
287位のリシン残基からp-アジドフェニルアラニン(pAzF)側鎖を有する残基への突然変異により、エルシニア・ペスティス(Yersinia pestis)(yPIP)由来のプロリンイミノペプチダーゼを修飾した。図21Aは、スティックとして示されるK287側鎖で示されたpAzFの化学構造により示唆される突然変異を有するyPIPの結晶構造を示す。この突然変異部位は、この位置のαヘリックスにより提供される安定性に基づいて且つ新しいアジド官能基が確実に溶媒露出されるように選択される。
突然変異体アミノtRNAシンテターゼとアミノ酸鎖中にpAzFを取り込むのに必要な突然変異体tRNAとを含有するpEVOLプラスミドを得た。次いで、クイックチェンジ(QuickChange)II突然変異誘発キットを用いて、pAzFの特異的組込みに必要なアンバー停止コドン(TAG)をcDNAに導入した。次いで、cDNAをシーケンスしてTAGコドン位置を確認した。この後、yPIPアンバー突然変異体を含有するpET21b+プラスミドと、tRNAがアンバーコドンに対してpAzFを仕込む細胞機構を含有するpEVOLプラスミドと、の両方の共トランスフェクションを行った。次いで、共トランスフェクトされた細胞を0.8ODUまで成長させ、2LのLB中の2mM pAzFの存在下で0.02%アラビノース及び1mM IPTGにより誘導し、化学分解を用いて採取した。5mLアフィニティークロマトグラフィーカラムを用いて精製し、100mMイミダゾールでタンパク質を溶出した。次いで、得られるタンパク質を50mM HEPES pH8.0及び0.5M KClで透析して濃縮し、アリコートに分け、フラッシュ凍結し、その後、-20℃で貯蔵した。
精製タンパク質中のアジド基の存在を確認するために、DBCO-Cy3(2mM)とpAzF-yPIP変異体(220μM)とを反応させた(反応条件:50mM HEPES pH8.0、0.5mM KCl、及び20%DMSO、37℃で10時間、室温で48時間)。サイズ排除クロマトグラフィーによりタンパク質反応産物を精製したところ、得られたタンパク質はアジド反応性DBCO-Cy3試薬で100%標識されたと判断されたことから(図21B)、非天然アミノ酸のロバストな取込みが示唆される。
非標識及び標識付pAzF変異体のSDS-PAGE解析により、最終産物のタンパク質標識化及び純度を確認した。図21Cは、pAzF-yPIPのCy3標識化を確認するSDS-PAGEゲルの写真を示す(ラダーを示すためにゲルのオーバー露出画像が図21Dに示される)。図21Eは、色素及びタンパク質の両方がコマイグレートして(co-migrate)純粋であることを確認するクーマシー染色ゲルの写真を示す。
標識化及び精製の後に酵素が依然として活性であることを確認するために、色素標識付pAzF-yPIP変異体を活性アッセイに使用した。図21Fに示されるように、Cy3-pAzF-yPIPは、HPLCにより測定したとき、1000倍過剰基質を用いて1時間でペプチド基質を100%加水分解可能であった。これらの実験は、天然タンパク質構造/機能の撹乱を最小限に抑えてエキソペプチダーゼの部位特異的修飾及び標識化を可能にする方法を実証する。
実施例7.ポリペプチドシーケンシングでの修飾アミノ酸の認識
特異的翻訳後修飾を含有するアミノ酸の認識を評価するために、実験を実施した。リン酸化チロシン残基に対する潜在的認識分子として、FynチロシンキナーゼのSrc相同性2(SH2)ドメインの三重突然変異型変異体(T8V、S10A、K15L)をペプチドシーケンシングで試験した。変異体タンパク質をサンプルウェルのボトムに固定し、N末端ホスホチロシンを含有する蛍光標識付ペプチドを添加し、単一分子シグナルトレースを収集した。図22Aの代表的トレースより示されるように、これらの実験時、固定タンパク質によるペプチド結合が検出された。これらの実験時に収集されたパルス持続時間データは、図22Bに示される(トップ、ミドル、及びボトムのプロットは、それぞれ、図22Aのトップ、中間、及びボトムのトレースに対応する)。パルス持続時間及びパルス間持続時間の統計は、図22Cに示される(それぞれ、トップ及びボトムのパネル)。
特異的翻訳後修飾を含有するアミノ酸の認識を評価するために、実験を実施した。リン酸化チロシン残基に対する潜在的認識分子として、FynチロシンキナーゼのSrc相同性2(SH2)ドメインの三重突然変異型変異体(T8V、S10A、K15L)をペプチドシーケンシングで試験した。変異体タンパク質をサンプルウェルのボトムに固定し、N末端ホスホチロシンを含有する蛍光標識付ペプチドを添加し、単一分子シグナルトレースを収集した。図22Aの代表的トレースより示されるように、これらの実験時、固定タンパク質によるペプチド結合が検出された。これらの実験時に収集されたパルス持続時間データは、図22Bに示される(トップ、ミドル、及びボトムのプロットは、それぞれ、図22Aのトップ、中間、及びボトムのトレースに対応する)。パルス持続時間及びパルス間持続時間の統計は、図22Cに示される(それぞれ、トップ及びボトムのパネル)。
Fynタンパク質がリン酸化チロシンに特異的であることを確認するために、対照実験を実施した。3つの異なるペプチド:N末端非修飾チロシンを含有する第1のペプチド(Y、図22D)、N末端及びペナルティメートの非修飾チロシンを含有する第2のペプチド(YY、図22E)、及びN末端ホスホセリンを含有する第3のペプチド(図22F)の各々に対して、実験を繰り返した。示されるように、陰性対照実験に使用されるペプチドのいずれを用いても、結合は検出されなかった。
実施例8.ポリペプチドシーケンシングでのペナルティメートアミノ酸の認識
A.ツメファシエンス(A.tumefaciens)ClpS2-V1のパルス持続時間に及ぼすペナルティメートアミノ酸の影響を決定するために、実験を実施した。N末端にユニークジペプチド配列を含有する49の異なる蛍光標識ペプチドを調製した。ただし、N末端アミノ酸は、F、W、又はYであり、且つペナルティメート位置は、20種の天然アミノ酸の1つであった。各実験では、ClpS2-V1をサンプルウェルのボトムに固定し、蛍光標識付ペプチドの1つを添加して一分子シグナルトレースを10~20分間収集した。各ペプチドに対しては最小でも50のサンプルウェルで、パルス持続時間データを収集した。
A.ツメファシエンス(A.tumefaciens)ClpS2-V1のパルス持続時間に及ぼすペナルティメートアミノ酸の影響を決定するために、実験を実施した。N末端にユニークジペプチド配列を含有する49の異なる蛍光標識ペプチドを調製した。ただし、N末端アミノ酸は、F、W、又はYであり、且つペナルティメート位置は、20種の天然アミノ酸の1つであった。各実験では、ClpS2-V1をサンプルウェルのボトムに固定し、蛍光標識付ペプチドの1つを添加して一分子シグナルトレースを10~20分間収集した。各ペプチドに対しては最小でも50のサンプルウェルで、パルス持続時間データを収集した。
図23は、50ペプチドの各々に対するパルス持続時間の中央値を示しており、データ点は、異なる記号を用いて表されたペナルティメートアミノ酸(x軸)とN末端アミノ酸とによりグループ化されている。
実施例9.複数の認識分子による同時アミノ酸認識
1つ超の標識付認識分子による固定ペプチドの末端アミノ酸認識を実証するために、単一分子ペプチド認識実験を実施した。N末端フェニルアラニンを含有する単一ペプチド分子(FYPLPWPDDDY(配列番号235))をチップのサンプルウェル内に固定した。各500nMのatClpS1(アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS1、表1に提供される配列)及びatClpS2-V1(アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS2変異体1、表1に提供される配列)を含有する緩衝液を添加した。ただし、atClpS1及びatClpS2-V1は、それぞれ、Cy3及びCy3Bで標識された。Cy3Bの強度はCy3よりも高いので、atClpS2-V1結合イベントは、atClpS1結合イベントから容易に区別可であった。
1つ超の標識付認識分子による固定ペプチドの末端アミノ酸認識を実証するために、単一分子ペプチド認識実験を実施した。N末端フェニルアラニンを含有する単一ペプチド分子(FYPLPWPDDDY(配列番号235))をチップのサンプルウェル内に固定した。各500nMのatClpS1(アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS1、表1に提供される配列)及びatClpS2-V1(アグロバクテリウム・ツミファシエンス(Agrobacterium tumifaciens)ClpS2変異体1、表1に提供される配列)を含有する緩衝液を添加した。ただし、atClpS1及びatClpS2-V1は、それぞれ、Cy3及びCy3Bで標識された。Cy3Bの強度はCy3よりも高いので、atClpS2-V1結合イベントは、atClpS1結合イベントから容易に区別可であった。
図24A~24Cは、差次的標識付認識分子による単一分子ペプチド認識を示す実験の結果を示す。代表的トレースは図24Aに提示される。パルス持続時間分布は、各バインダーに対して識別可能であり(図24B)、単一バインダーの実験で観測されるそれらの速度論的プロファイルに対応した。平均パルス持続時間は、atClpS1では1.3秒間及びatClpS2-V1では1.0秒間であった(図24C)。パルス速度もまた識別可能であり、atClpS1では8.1パルス/min及びatClp2-V1では14.1パルス/minであった(図24C)。そのため、1つ超の認識分子が固定ペプチドの動的認識のために含まれるとき、各認識分子の結合特性(パルス持続時間、パルス間持続時間、及びパルス速度を含む)は、ペプチド配列に関する情報を同時に提供可能である。
実施例10.認識分子リンカーによる光安定性の増強
単一分子シーケンシング時の固定ペプチドの光安定性を評価するために、実験を実施した。アトー(ATTO)532からの放出により認識をモニターするために、532nmの励起光の存在下で固定ペプチド基質を含有するサンプルウェルに実施例4に記載の色素標識付atClpS2-V1を添加した。代表的トレースは図25Aに示される。トップパネルに示されるように、認識は、実験を始めてからおおよそ600秒間で中止されることが観測された。ボトムパネルは、反応を始めてからおおよそ180~430秒間のシグナルパルスを示す拡大図である。
単一分子シーケンシング時の固定ペプチドの光安定性を評価するために、実験を実施した。アトー(ATTO)532からの放出により認識をモニターするために、532nmの励起光の存在下で固定ペプチド基質を含有するサンプルウェルに実施例4に記載の色素標識付atClpS2-V1を添加した。代表的トレースは図25Aに示される。トップパネルに示されるように、認識は、実験を始めてからおおよそ600秒間で中止されることが観測された。ボトムパネルは、反応を始めてからおおよそ180~430秒間のシグナルパルスを示す拡大図である。
図25Bは、これらの実験に使用されるClpS2タンパク質の結晶構造の可視化を示す。示されるように、色素コンジュゲーション部位として機能するシステイン残基は、末端アミノ酸結合部位からおおよそ2nmである。ペプチドに対する光損傷は、結合時にペプチドのN末端への色素の近接により引き起こされるという仮説を立てた。色素近接の潜在的光損傷作用を軽減するために、色素とペプチドのN末端との間の距離を10nm超に増加させるリンカーを介してClpS2タンパク質を色素標識した。リンカーは、ストレプトアビジンと二本鎖核酸とを含んでいた。2つのCy3B色素分子で二本鎖核酸を標識し、ビスビオチン部分を介してストレプトアビジンに装着し、ビオチン部分を介してストレプトアビジン上の残留する2つの結合部位の各々にClpS2タンパク質を装着した。この色素シールドClpS2分子を用いた代表的トレースは図25Cに示される。トップパネルに示されるように、認識時間は、実験を始めてからおおよそ6,000秒間に延長された。ボトムパネルは、反応を始めてからおおよそ750~930秒間のシグナルパルスを示す拡大図である。
2つのCy3B色素分子で標識され、且つビスビオチン部分を介してストレプトアビジンに装着された二本鎖核酸を含有するリンカーを用いてDNA-ストレプトアビジン認識分子を生成し、ビスビオチン部分を介してストレプトアビジン上の残留する2つの結合部位に単一ClpS2タンパク質を装着した。この構築物は、単一分子ペプチドシーケンシング反応に使用され、これらの実験の代表的トレースは、図26A~26Dに示される。
反応条件を次のように変更して、すなわち、DNA-ストレプトアビジンClpS2認識分子をhTETアミノ酸切断試薬との組合せで使用して、実施例5に記載のシーケンシング実験を繰り返した。代表的シグナルトレースは図27に示される。
実施例11.複数のエキソペプチダーゼによる分解時の認識によるシーケンシング
単一分子ペプチドシーケンシング反応混合物中での差次的切断特異性を有する複数のタイプのエキソペプチダーゼの使用を評価するために、実験を実施した。チップのサンプルウェル内にC末端リシン残基を介して単一ペプチド分子(YAAWAAFADDDWK(配列番号234))を固定した。アミノ酸認識用のatClpS2-V1とアミノ酸切断用のhTETとを含有する緩衝液を添加した。代表的トレースは図28Aに提示され、パルスパターン領域の拡大図が図28Bに示される。
単一分子ペプチドシーケンシング反応混合物中での差次的切断特異性を有する複数のタイプのエキソペプチダーゼの使用を評価するために、実験を実施した。チップのサンプルウェル内にC末端リシン残基を介して単一ペプチド分子(YAAWAAFADDDWK(配列番号234))を固定した。アミノ酸認識用のatClpS2-V1とアミノ酸切断用のhTETとを含有する緩衝液を添加した。代表的トレースは図28Aに提示され、パルスパターン領域の拡大図が図28Bに示される。
差次的特異性を有する2タイプのエキソペプチダーゼの存在下でシーケンシング反応を評価するために、実験を行った。チップのサンプルウェル内にC末端リシン残基を介して単一ペプチド分子(FYPLPWPDDDYK(配列番号236))を固定した。アミノ酸認識用のatClpS2-V1とアミノ酸切断用のyPIP及びhTETの両方とを含有する緩衝液を添加した。代表的トレースは図28Cに提示され、パルスパターン領域の拡大図が図28Dに示される。これらの反応条件の追加の代表的トレースは図28Eに示される。
差次的特異性を有する2タイプのエキソペプチダーゼの存在下でシーケンシング反応を評価するために、さらなる実験を行った。チップのサンプルウェル内にC末端リシン残基を介して単一ペプチド分子(YPLPWPDDDYK(配列番号237))を固定した。一実験では、アミノ酸認識用のatClpS2-V1とアミノ酸切断用のyPIP及びhTETの両方とを含有する緩衝液を添加した。代表的トレースは図28Fに提示され、パルスパターン領域の拡大図が図28Gに示される。これらの反応条件の追加の代表的トレースは図28Hに示される。さらなる実験では、アミノ酸認識用のatClpS2-V1とアミノ酸切断用のPfuTET及びyPIPの両方とを含有する緩衝液(50mM MOPS、60mM KOAc、200μM Co(OAc)2)を添加した。代表的トレースは図28Iに提示され、パルスパターン領域の拡大図が図28Jに示される。
実施例12.新規ClpSタンパク質の同定及び評価
N末端フェニルアラニン(F)、トリプトファン(W)、チロシン(Y)、及びロイシン(L)に結合するClpSタンパク質は、報告されている。以前に未知であったN末端結合性を有する潜在的な新規ClpSホモログを発見するために、このタンパク質ファミリーに存在する配列多様性の全てを包含するおおよそ60種から特徴付けられていないClpSタンパク質の高度に多様なパネルを、相同性解析に基づいて設計した。
N末端フェニルアラニン(F)、トリプトファン(W)、チロシン(Y)、及びロイシン(L)に結合するClpSタンパク質は、報告されている。以前に未知であったN末端結合性を有する潜在的な新規ClpSホモログを発見するために、このタンパク質ファミリーに存在する配列多様性の全てを包含するおおよそ60種から特徴付けられていないClpSタンパク質の高度に多様なパネルを、相同性解析に基づいて設計した。
ClpSタンパク質のパネルを、ハイスループット発現および精製ワークフローを使用してスクリーニングした。ClpSタンパク質を、100mLスケールでE.コリ(E.coli)細胞において過剰発現させ、同時発現させたビオチンリガーゼによってin vivoでビオチン化し、細胞溶解によって放出させ、ストレプトアビジンと複合体化し、コバルトアフィニティークロマトグラフィーによって精製した。SDS-PAGEクロマトグラフィーによる解析は、>85%純粋なClpSタンパク質を示した(図29A)。
各新規ホモログのアミノ酸結合プロファイルを、バイオレイヤー干渉法によって評価した。既知の結合プロファイルを有するClpSタンパク質(atClpS2-V1、atClpS1、及びteClpS)を対照として含めた。これらのアッセイでは、目的のN末端アミノ酸を含有するペプチドをバイオレイヤー干渉センサー表面上に固定化し、ClpSタンパク質に結合させ、緩衝液中でインキュベートしてClpS分子を解離させた。結合反応(nm)及び解離オフ速度(kdis、s-1)を、速度論モデルを用いて測定した。各ClpSタンパク質の測定を、アミノ酸I、V、M、F、Y、及びW、並びに陰性対照としてのD、E、A、及びRについて30℃で実施した。全てのペプチドは、ペナルティメートアラニン(A)を含有し、配列XAKLDEESILKQK(配列番号238)からなっていた。
61個のClpSホモログ(58個の新規ホモログ、3個の参照ホモログ)のバイオレイヤー干渉法スクリーニングからの結果を図29Bに示す。14個のClpSホモログについての選択結果を、図29Cに示されるプロットにまとめる。反応(y軸)は、8つの異なるジペプチドについて解離速度の逆数に対してプロットされている(陰性対照DA、AA、及びRAについてのデータは示されていない)。これらのプロットにおいて、y軸上のより高い値は、より強い会合反応に対応し、x軸上のより高い値は、より遅い解離速度を示す。スクリーニングされたClpSホモログの中で、ホモログ「PS372」は、ロイシン、イソロイシン、及びバリンのバインダーとして際立っていた。LA、IA、及びVAを用いたPS372についての反応曲線を図29Dに示す。PS372は、F、Y、又はWペプチドへの結合を示さなかった。結果は、PS372が、シーケンシング反応のための検出可能なオン及びオフ結合を示すバインダーに典型的な速度論的パラメータでIAおよびLAに結合することを示した。
ClpSホモログを蛍光偏光によって評価して、FITC標識付ペプチド(XAKLDEESILKQK-FITC(配列番号238))とClpS:ストレプトアビジン複合体との相互作用を測定した。I、V、L、F、Y、及びWについての偏光反応(ミリ偏光、mP)並びに全強度の測定を、ハイスループット384ウェルプレートフォーマットにおいて、480nm励起及び530nm発光波長を使用して実施し、23℃で30分間インキュベートした後に読み取り値を収集した。溶液中結合の結果は、PS372が、ロイシン、イソロイシン、及びバリンと、LA>IA>VAの順の反応強度で結合することを確証した(図29E)。atClpS2-V1の結合反応はFA>YA>WAであり、teClpSの結合反応はLA>FA>YA>WAであった。
PS372によるイソロイシン及びバリン結合に対するペナルティメートアミノ酸の効果を、バイオレイヤー干渉法によってN末端IR、IQ、及びVRを有するペプチドへの結合を測定することによって評価した(ペプチド配列:XXKLDEESILKQK(配列番号:291))。測定値は、比較のためにteClpSでも取得された。結果は、PS372が、IRと比較してより高い親和性でIQ及びIAに結合することを示したが(図29F)、teClpSは、IRペプチドのみに対して非常に速い解離を伴う小さな反応を示した。PS372はVAとよく結合し、VRとはごくわずかな反応しか示さず、teClpSはVペプチドとは反応を示さなかった。
LF、LA、IR、IA、VR、及びVAペプチドを用いてPS372についてバインダーオンチップ実験を行って、単一分子アッセイにおけるシグナルパルス検出による認識を評価した。PS372は、LF及びLAペプチドで長い平均パルス幅を示した(それぞれ1207ms及び876ms)。比較のために、L-バインダーteClpSで観測された平均パルス幅は768msであった(PS372よりも約37%短い)。短いパルス持続時間でのパルス化が、IR(83ms)及びIA(70ms)ペプチドの両方を有するPS372について観測された。図29Gは、IRペプチド(トップ)及びLFペプチド(ボトム)を有するPS372のパルス幅のヒストグラムを示し、5分ウィンドウ内の代表的トレースを、各ヒストグラムの右側に示す。
これらの実験は、イソロイシン及びバリンに対して強い固有の親和性を示すことが知られている第1のClpSタンパク質の同定および生化学的特徴付けを実証する。バイオレイヤー干渉法および蛍光偏光を使用する結合速度論の分析に基づいて、PS372は、W、F、Y、及びLの認識に限定される他の全ての公知のClpSタンパク質とは異なり、N末端ロイシン、イソロイシン、及びバリンを認識する。さらに、単一分子レベルでのI及びLとPS372との観察可能な結合が、バインダーオンチップアッセイにおいて確認され、シグナルパルスデータは、シーケンシング反応に有利な性質を示した。
実施例13.新規ClpSホモログの標識及びシーケンシングにおける使用
ClpSホモログPS372及びBirAプラスミドの大規模(5L)バッチをE.コリ(E.coli)に形質転換し、0.4mM IPTG及び160μMビオチン(in vivoビオチン化)で14℃にて一晩発現させた。回収した細胞を5mLのコバルトアフィニティークロマトグラフィーカラムで精製した。ビオチン化効率を、SDS-PAGEを使用して評価し(図30A)、6倍過剰のストレプトアビジン(SV)と混合した場合のPS372バンドの完全なシフトに基づいて100%であると決定した。
ClpSホモログPS372及びBirAプラスミドの大規模(5L)バッチをE.コリ(E.coli)に形質転換し、0.4mM IPTG及び160μMビオチン(in vivoビオチン化)で14℃にて一晩発現させた。回収した細胞を5mLのコバルトアフィニティークロマトグラフィーカラムで精製した。ビオチン化効率を、SDS-PAGEを使用して評価し(図30A)、6倍過剰のストレプトアビジン(SV)と混合した場合のPS372バンドの完全なシフトに基づいて100%であると決定した。
ビオチン化PS372(PS372-Bt)を、透析を使用してPEG化のために適切な緩衝液に移した。次いで、タンパク質を、室温で2時間、mPEG4-NHSエステルを使用してPEG化し、続いて一晩透析して過剰のmPEG4-NHSを除去した。PEG化及びビオチン化PS372(PS372-Bt-mPEG4)を濃縮し、予め形成されたSVとビオチン化Cy3B標識付オリゴヌクレオチドとの1:1複合体とコンジュゲートさせ、HPLCカラムで精製した。HPLCプロファイルは、2つの主要なピークを示し(図30B)、ピーク3が目的のピークであった(1:1(PS372:SV色素)複合体)。
HPLC精製後、得られたピークを適切な濃度に濃縮し、チップ表面への非特異的結合に起因してオンチップアッセイにおいて干渉し得る標識付SV上の任意のフリーのビオチン結合部位について試験した。図30Cに示すように、AttoRho6で標識した遊離ビオチンを全ての試料に添加し、対照と共にSDS-PAGEにかけた。Cy3チャネル(パネル(a)及び(c))は、レーン6および7において1:1種(PS372:SV色素)の存在を示し、AttoRho6の非存在(パネル(b)及び(c))は、標識付タンパク質上にフリーのビオチン結合部位がないことを確認した。
標識付タンパク質をペプチドオンチップ認識アッセイで試験したところ、平均パルス幅78msでN末端イソロイシンペプチド(IAALAAVAADDDW(配列番号:239))に結合し、平均パルス幅957msでN末端ロイシンペプチド(LAAIAAFAADDDW(配列番号:292))に結合することを示した。エキソペプチダーゼ(hTET)の存在下での動的シーケンシングアッセイの結果は、N末端イソロイシンペプチドについてはIからLへ、N末端ロイシンペプチドについてはLからIへの明確な遷移を示した(図30D)。
進行中の分解反応時の色素標識付PS372でのN末端アミノ酸認識によるペプチドシーケンシングを評価するために実験を行った。リアルタイム動的ペプチドシーケンシングアッセイを、色素標識付PS372認識因子及びアミノペプチダーゼ切断試薬(hTET)の存在において、表面固定化ポリペプチド(IAALAAVAADDDW(配列番号:239))をモニタリングすることによって行った。リアルタイム動的ペプチドシーケンシングアッセイの例示データを図30Eに示し、平均パルス幅を各パルスクラスターの下に列挙する。示されるように、パルス幅分布における差は、イソロイシン及びロイシン認識を容易に区別し、動的シーケンシング反応における色素標識付PS372によるこれらのアミノ酸の認識を実証した。
実施例14.新規なメチオニン結合ClpSタンパク質の工学操作
アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)ClpS2の熱安定性変異体から出発して、160,000個の変異体の潜在的多様性を有するClpS突然変異体のライブラリーを作製した(トゥルマン(Tullman)ら著、2020年、Biochem.Enj.J.、第154巻、p.107438を参照されたい)。タンパク質が酵母の表面上に提示されうるような突然変異ClpS遺伝子をPCR増幅するための縮重プライマーを使用して、酵母における相同組換えによってライブラリーを作製した。この方法を使用して、各タンパク質変異体は、酵母細胞の表面上に約1,000コピーで提示され、クローンを単離することによって、提示されるタンパク質の遺伝子配列を決定しうる。これは、どのタンパク質変異体が目的の性質を有するかを決定するために必要な遺伝子型-表現型リンクを維持する。
アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)ClpS2の熱安定性変異体から出発して、160,000個の変異体の潜在的多様性を有するClpS突然変異体のライブラリーを作製した(トゥルマン(Tullman)ら著、2020年、Biochem.Enj.J.、第154巻、p.107438を参照されたい)。タンパク質が酵母の表面上に提示されうるような突然変異ClpS遺伝子をPCR増幅するための縮重プライマーを使用して、酵母における相同組換えによってライブラリーを作製した。この方法を使用して、各タンパク質変異体は、酵母細胞の表面上に約1,000コピーで提示され、クローンを単離することによって、提示されるタンパク質の遺伝子配列を決定しうる。これは、どのタンパク質変異体が目的の性質を有するかを決定するために必要な遺伝子型-表現型リンクを維持する。
100万を超えるクローンを得た後、変異体ライブラリーを提示する酵母と、配列MRFVGECK-ビオチン(配列番号:240)を含有するペプチド、並びにフルオロフォアストレプトアビジン-PE及び抗myc AlexaFluor647とを組み合わせることによって、蛍光活性化セルソーティング(FACS)を介して選択を行った。ペプチドに結合し、且つClpSタンパク質のC末端にmycタグを含有する細胞は、FACSによって得られたプロットの象限2(右上)に保持されると予想され、セルソーターは、これらを培養チューブに仕分けして別のラウンドの選択及び/又はシーケンシング用に増殖させ、捕捉された変異体を同定する。このライブラリーに対して2ラウンドのFACSを実施したところ、図31Aに示されるプロットに見られる改善が得られた(左側プロット:0.5μMのMRペプチドを用いた第1のラウンド、中央プロット:0.5μM MRペプチドを用いた第2のラウンド、右側プロット:比較のために0.05μMのMRペプチドを用いた第2のラウンド、予想通りほとんど結合を示さなかった)。
2ラウンドの選択後、酵母の単一クローンをプレーティングによって単離し、シーケンシングした。2つの候補が、「TMR L」(PS490)及び「TAF K」(PS489)として突然変異した4つの残基の配列を有して出現した。さらなる特徴付けの際に、酵母ディスプレイを使用して、タンパク質がMR、MQ、及びIRに結合するが、IQ又はEGペプチドには結合しないことが示された。これらの2つのクローンを発現ベクターにサブクローニングして、バイオレイヤー干渉アッセイのための精製及びストレプトアビジン標識を容易にした。タンパク質を発現させ、精製し、アッセイして、元の熱安定性atClpS2変異体(PS023)と共にさまざまなN末端アミノ酸との結合反応速度を測定した。図31B~31Fに示されるデータは、MRペプチド、並びにMA、LA、及びFAペプチドへのPS489の結合を確認した。そのほか、PS490は、MR、LA、及びFAに結合する。
実施例15.設計された突然変異変異体ClpS認識分子
単一分子シーケンシング反応において有利でありうるより長いパルス幅を達成するように合理的に設計された活性部位置換を有するatClpS1の変異体を作製した。設計された変異体(PS218)は、野生型atClpS1に対して以下の突然変異:M51F、E52Q、M73T、T70Wを含有する。FA、LF、WA、及びYAペプチドを用いてPS218についてバインダーオンチップ実験を行って、単一分子アッセイにおけるシグナルパルス検出による認識を評価した。表7の結果によって示されるように、野生型タンパク質に対する置換は、試験した各ペプチドでより長いパルス幅をもたらす。
単一分子シーケンシング反応において有利でありうるより長いパルス幅を達成するように合理的に設計された活性部位置換を有するatClpS1の変異体を作製した。設計された変異体(PS218)は、野生型atClpS1に対して以下の突然変異:M51F、E52Q、M73T、T70Wを含有する。FA、LF、WA、及びYAペプチドを用いてPS218についてバインダーオンチップ実験を行って、単一分子アッセイにおけるシグナルパルス検出による認識を評価した。表7の結果によって示されるように、野生型タンパク質に対する置換は、試験した各ペプチドでより長いパルス幅をもたらす。
実施例16.シーケンシングに使用するためのUBRボックスドメインホモログの評価
本発明者らは、酵母UBR由来のUBRボックスドメインが、L又はIが後に続く場合にのみRに対して強い結合親和性を示すことを見出した。単一分子ペプチドシーケンシングにおいて有用であるように、ペナルティメートアミノ酸の存在下でより広い範囲の高親和性R結合を有するUBRボックスドメインを同定するために、UBRボックスドメインホモログのスクリーニングを行った。UBRボックスドメインホモログのアミノ酸結合性をバイオレイヤー干渉法によって評価した。N末端アルギニン(R)、続いてペナルティメート位置にさまざまなアミノ酸を含むペプチドをバイオレイヤー干渉センサー表面上に固定し、UBRボックスタンパク質に結合させ、緩衝液中でインキュベートしてUBRボックス分子を解離させた。ペナルティメート位置のさまざまなアミノ酸の前にN末端Rを含有する14のペプチダーゼと結合するUBRボックスホモログPS535(図32A)及びPS522(図32B)についての例示反応トラジェクトリーが示される。図32Cは、ペナルティメート位置の様々なアミノ酸の前にN末端Rを含有する14のポリペプチドに対する24のUBRボックスホモログを測定した結果を示すヒートマップである。結果は、ホモログPS535、PS522、PS528、及びPS505が、広範囲のペナルティメートアミノ酸の存在下でRに対する高い結合親和性を維持することを実証する。
本発明者らは、酵母UBR由来のUBRボックスドメインが、L又はIが後に続く場合にのみRに対して強い結合親和性を示すことを見出した。単一分子ペプチドシーケンシングにおいて有用であるように、ペナルティメートアミノ酸の存在下でより広い範囲の高親和性R結合を有するUBRボックスドメインを同定するために、UBRボックスドメインホモログのスクリーニングを行った。UBRボックスドメインホモログのアミノ酸結合性をバイオレイヤー干渉法によって評価した。N末端アルギニン(R)、続いてペナルティメート位置にさまざまなアミノ酸を含むペプチドをバイオレイヤー干渉センサー表面上に固定し、UBRボックスタンパク質に結合させ、緩衝液中でインキュベートしてUBRボックス分子を解離させた。ペナルティメート位置のさまざまなアミノ酸の前にN末端Rを含有する14のペプチダーゼと結合するUBRボックスホモログPS535(図32A)及びPS522(図32B)についての例示反応トラジェクトリーが示される。図32Cは、ペナルティメート位置の様々なアミノ酸の前にN末端Rを含有する14のポリペプチドに対する24のUBRボックスホモログを測定した結果を示すヒートマップである。結果は、ホモログPS535、PS522、PS528、及びPS505が、広範囲のペナルティメートアミノ酸の存在下でRに対する高い結合親和性を維持することを実証する。
UBRタンパク質は、保存されたN末端則経路の一部として塩基性N末端残基R、K、及びHに結合する。シーケンシングにおける使用に好ましい性質を有する高親和性UBRタンパク質を同定するために、44種(PS501~PS544)由来の特徴付けられていないUBRボックスドメインホモログの多様なパネルを設計した。UBRボックスドメインホモログを発現させ、精製し、バイオレイヤー干渉法によってN末端アミノ酸への結合について評価した。R、K及びH結合について、各タンパク質について30℃で測定を行った。各新規ホモログのアミノ酸結合プロファイルを、まず、単一点スクリーニングアッセイを使用するバイオレイヤー干渉法によって評価した。このスクリーニングにおける全てのペプチドは、XがR、K、又はHである場合、ペナルティメートアラニン(A)を含有し、配列XAKLDEESILKQK(配列番号238)からなっていた。
RA/KA/HAペプチド結合についてのバイオレイヤー干渉法反応測定を図32Dにまとめる。ホモログPS522、PS528、PS535、及びPS538は、RAペプチド及びKAペプチドに対する好ましい結合トラジェクトリーを示し、RAペプチドに対して顕著に高い反応を示した。PS528は、より遅い解離トラジェクトリーを示し、HAペプチドへの結合を示した。これらの結果に基づいて、15のUBRボックスドメインホモログ(PS614~PS629)の第2のパネルを、K.ラクティス(K.lactis)に関連するホモログの拡大されたセットを含めて設計した。PS621は好ましい結合特性を示し、結果はPS528と同様であった(図32D)。
アルギニン結合に対するペナルティメートアミノ酸の影響を評価するために、UBRボックスドメインホモログを、N末端RXを有する14の異なるペプチド(ペプチド配列:RXGGGDDDFFK(配列番号:241))への結合について評価した。選択されたRXジペプチドは、ヒトプロテオームにおいて最も頻繁に見出される14種である。40のUBRボックスタンパク質についてのバイオレイヤー干渉反応測定のフルセットを図32Eにまとめる。結果は、PS535、PS522、PS528、及びPS621がRXジペプチドに対して広範な結合範囲を有することを示した。哺乳動物起源のUBR候補PS522及びPS535は、より速い解離速度を有するRジペプチドについて広範な認識を示した(図示せず)。Kluveromyces酵母ファミリー由来のホモログPS528及びPS621もまた、Rジペプチドの広範な認識を示した。
次いで、選択された候補について単一点蛍光偏光アッセイを実施した。これらのアッセイでは、標識付ペプチド(XAKLDEESILKQK-FITC(配列番号:238))とUBRストレプトアビジン複合体との相互作用を、これらの分子が溶液中で遊離している形式で測定した。RA、KA、及びHAペプチドについての偏光反応(ミリ偏光、mP)および総強度の測定を行った。結果は、PS528及びPS621が強い反応でRAペプチドに結合することを示した(図32F)。また、反応トラジェクトリーは、PS528及びPS621が、強いRAバインダー(図示せず)であり、動的シーケンシング反応において検出可能なオン及びオフ結合を示すバインダーに典型的な速度論的パラメータで結合することを示した。
次いで、選択されたUBRボックスドメイン候補の結合親和性を、N末端R及びKペプチドについてのKD(解離定数)値を測定することによって評価した。RA及びKAペプチドについて、漸増濃度のUBRタンパク質でアッセイを行った(図32G、トッププロット)。結合滴定曲線からKD値を決定した。図32G(ボトムの棒グラフ)に示すように、RA及びKAペプチドについて結合が観測され、PS621及びPS528は、RAペプチドに対して比較的高い結合親和性を示した(それぞれ、420nM及び460nMのKD値)。
N末端アルギニンペプチドについてのペプチドオンチップ認識アッセイを、PS621及びPS528を用いて行った。PS528及びPS621の両方は、N末端Rを認識し、単一分子レベルでの色素標識付RLペプチドへの結合が、約60msの平均パルス幅で、これらの認識アッセイにおいて確認された。色素標識付RLペプチドを用いたペプチドオンチップ認識アッセイにおけるPS621の代表的トレースを図32Hに示す。
また、UBRタンパク質PS621又はPS528をatClpS2-V1及びPS557と組み合わせた3バインダー系を使用して、動的シーケンシングを行った。これらのセットのバインダーは、ヒトユビキチン由来の天然ペプチド断片(配列:DQQRLIFAGK(配列番号:242))のR、L、I、及びFを認識することが示された。PS528、atClpS2-V1、及びPS557を使用する3-バインダー動的シーケンシングランからのこのペプチドについての例示的なシーケンシングトレースを図32Iに示す。
実施例17.シーケンシングにおける使用のためのPS372ホモログの同定及び評価
単一分子ペプチドシーケンシングにおいてイソロイシン及びバリン認識が可能なClpSタンパク質を同定するために、PS372ホモログタンパク質のスクリーニングを行った。PS372ホモログのアミノ酸結合性を、実施例12に記載されるようなバイオレイヤー干渉法によって評価した。例示の反応トラジェクトリーは、ペナルティメート位置のアラニンの前にさまざまなN末端アミノ酸(I、V、L、F)を含有する4つのポリペプチドと結合するPS372(図33A)及びホモログPS545(図33B)、PS551(図33C)、PS557(図33D)、並びにPS558(図33E)について示される。図33Fは、34のPS372ホモログを測定した結果を示すヒートマップである。
単一分子ペプチドシーケンシングにおいてイソロイシン及びバリン認識が可能なClpSタンパク質を同定するために、PS372ホモログタンパク質のスクリーニングを行った。PS372ホモログのアミノ酸結合性を、実施例12に記載されるようなバイオレイヤー干渉法によって評価した。例示の反応トラジェクトリーは、ペナルティメート位置のアラニンの前にさまざまなN末端アミノ酸(I、V、L、F)を含有する4つのポリペプチドと結合するPS372(図33A)及びホモログPS545(図33B)、PS551(図33C)、PS557(図33D)、並びにPS558(図33E)について示される。図33Fは、34のPS372ホモログを測定した結果を示すヒートマップである。
実施例18.多価アミノ酸バインダーの工学操作
フレキシブルペプチドリンカーをコードするセグメントによって末端同士で連結されたatClpS2-V1の2つのコピーをコードするセグメントを含有する単一コーディング配列から発現される直列融合分子として、多価アミノ酸バインダーを設計した。単一のコーディング配列の発現により、直列に配向された2つのClpSタンパク質を有する単一の全長ポリペプチド(ビスatClpS2-V1)が生成された。それぞれ異なるリンカーを有する3つのビスatClpS2-V1バインダーを設計し、発現させた:PS609(「リンカー1」配列:GGGSGGGSGGGSG(配列番号:243))、PS610(「リンカー2」配列:GSAGSAAGSGEF(配列番号:244))、及びPS611(「リンカー3」配列:GSAGSAAGSGEFGSAGSAAGSGEFGSAGSAAGSGEF(配列番号:245))。
フレキシブルペプチドリンカーをコードするセグメントによって末端同士で連結されたatClpS2-V1の2つのコピーをコードするセグメントを含有する単一コーディング配列から発現される直列融合分子として、多価アミノ酸バインダーを設計した。単一のコーディング配列の発現により、直列に配向された2つのClpSタンパク質を有する単一の全長ポリペプチド(ビスatClpS2-V1)が生成された。それぞれ異なるリンカーを有する3つのビスatClpS2-V1バインダーを設計し、発現させた:PS609(「リンカー1」配列:GGGSGGGSGGGSG(配列番号:243))、PS610(「リンカー2」配列:GSAGSAAGSGEF(配列番号:244))、及びPS611(「リンカー3」配列:GSAGSAAGSGEFGSAGSAAGSGEFGSAGSAAGSGEF(配列番号:245))。
PS610ポリペプチドをビオチン化し、上記のように色素標識付ストレプトアビジンとコンジュゲートさせた。色素標識付PS610をペプチドオンチップ認識アッセイにおいて試験し、N末端フェニルアラニンペプチド(FAAAYP(配列番号:246))への結合を示した。比較目的のために、1価バインダー(色素標識付atClpS2-V1)及び直列バインダーPS610をそれぞれ、同じバインダー濃度(500nM)を用いて認識アッセイにおいて試験した。これらの実験からの代表的な単一分子パルストラジェクトリー及びパルス統計を図34Aに示す(左側パネル:1価バインダー、右側パネル:PS610)。示されるように、直列バインダーを使用して、パルス間持続時間の中央値は約5.8倍短く、パルス化の観測された速度は2.3倍速かったが、さまざまなバインダーを使用したパルス幅の中央値は、一貫していた。
固定化インスリンB鎖(配列:FVNQHLCGSHLVEALYLVCGERGFFYTPKA(配列番号:247))のN末端の動的認識を、色素標識付atClpS2-V1及びPS610について、さまざまなバインダー濃度で独立して調べた。単一分子パルストラジェクトリーを20分間取得した。これらの実験からの結果(表8に示す)を使用して、バインダー濃度の関数としての平均パルス速度のプロットを生成した(図34B)。示されるように、直列バインダーPS610は、各濃度でより高い平均オンオフ結合速度(パルス速度)を示した。
進行中の分解反応時の色素標識付PS610でのN末端アミノ酸認識によるペプチドシーケンシングを評価するために実験を行った。リアルタイム動的ペプチドシーケンシングアッセイを、色素標識付PS610(100nM)、色素標識付PS372(250nM)、及びアミノペプチダーゼ切断試薬(hTET及びpfuTET)の存在下において、グルカゴン様ペプチド1の表面固定化ペプチド断片(配列:EFIAWLVK(配列番号:248))をモニタリングすることによって行った。PS372を識別可能な色素で標識してI及びL認識のために提供し、固定化ペプチドのN末端アミノ酸の繰返し切断をアミノペプチダーゼによって実施した。リアルタイムシーケンシングアッセイからの例示トレースは、図34Cに示される。PS610による特徴的なF及びW認識に対応するパルスの領域は、自動解析ワークフローを使用して正確に同定された。
バインダーオンチップ実験は、PS610、又は比較目的のために1価バインダーについて、N末端FAを含有する色素標識ペプチドで実施された。図34Dには、1価バインダー(トップトレース)について及び直列バインダーPS610(ボトムトレース)についての代表的トレースが示される。示されるように、atClpS2の直列コピーからなる固定化PS610は、自由に拡散する色素標識付ペプチドへの結合におけるパルスオーバーパルスパターンを示す。これらの結果は、2つの連結されたPS610のモノマーの各々が、独立して同時に、それらの標的ペプチドに結合可能であることを実証する。
各ビスatClpS2-V1バインダー(PS609、PS610、及びPS611)のアミノ酸結合プロファイルを、上述のようにバイオレイヤー干渉法によって評価した。1価atClpS-V1を対照として行った。各バインダーの測定を、アミノ酸F、Y、及びW、並びに陰性対照としてのI、L、M、及びVについて実施した。全てのペプチドは、ペナルティメートアラニン(A)を含有していた。1価バインダーについての反応曲線を図35Aに示す。直列バインダーPS609、PS610、及びPS611についての反応曲線を、それぞれ図35B、35C、及び35Dに示す。
多価バインダーPS651を、フレキシブルペプチドリンカー(リンカー2)をコードするセグメントによって末端同士で連結されるatClpS-V1の3つのコピー(Tris-atClpS-V1)をコードするセグメントを含む単一コーディング配列から発現する直列融合分子として設計した。蛍光偏光研究を、PS651、ビスClpS2-V2バインダー(PS609、PS610、PS611)、及びモノマー形バインダーatClpS2-V1で実施して、ペナルティメート位置のアラニン残基とともにN末端フェニルアラニン残基を有するペプチドについて結合親和性を決定した。これらの研究から得られたKD値を、以下の表9に報告する。これらの結果は、さまざまなリンカーを含む直列atClpS2-V1構築物がF、Y、及びWへの結合を保持することを実証する。
追加の多価アミノ酸バインダーを、N末端認識について設計し、評価した。表10は、設計されたさまざまな直列バインダー及び対応するポリペプチド配列のリストを含む。各発現構築物は、表3のC末端His/ビスビオチン化タグを含む。
多価バインダーPS612は、2つの異なるClpSタンパク質モノマー(atClpS2-V1及びPS372)の直列コピーを含むポリペプチドである。PS612のアミノ酸結合プロファイルを、上述のようにバイオレイヤー干渉法によって評価した。1価バインダーatClpS2-V1及びPS372を、対照として個別に行った。図36Aは、atClpS2-V1(左側プロット)及びPS372(右側プロット)の反応曲線を示す。各モノマー形バインダーについて以前観測されたように、atClpS2-V1は、N末端F、W、及びYに結合し、PS372は、N末端I、L、及びVに結合する。直列バインダーPS612の反応曲線は、図36Bに示される。示されるように、結合は、N末端F、W、Y、I、L、及びVを有するPS612について観測された。これらの結果は、2つの異なるClpSモノマー(この例ではatClpS2-V1及びPS372)の直列コピーからなる単一ポリペプチドが各親ClpSタンパク質の完全なアミノ酸結合能力を示すことを実証する。
多価バインダーPS614は、直列に配向されたClpSバインダーPS372の2つのコピーを含むポリペプチドである。PS614のアミノ酸結合プロファイルを、上述のようにバイオレイヤー干渉法によって評価した。図36Cは、1価バインダーPS372についての反応曲線を示し、PS372がN末端I、L、及びVに結合するという以前の観察を裏付ける。直列バインダーPS614についての反応曲線は、図36Dに示される。示されるように、N末端I、L、及びVを有するPS614への結合が観測された。これらの結果は、直列PS372構築物がL、I、及びVへの強い結合を保持することを実証する。
多価バインダーPS637、PS638、及びPS639は、直列に配向され、それぞれリンカー1、リンカー2、及びリンカー3によって分離されるClpSバインダーの2つのコピーを各々含むポリペプチドである。各バインダーのアミノ酸結合プロファイルを、上述のようにバイオレイヤー干渉法によって評価した。図36Eは、1価バインダーPS557についての反応曲線を示し、PS557がN末端I、L、及びVに結合するという以前の観察を裏付ける。直列バインダーPS637、PS638、及びPS639についての反応曲線は、それぞれ図36F、36G、及び36Hに示される。示されるように、N末端I、L、及びVを有する直列バインダーへの結合が観測された。これらの結果は、さまざまなリンカーを含む直列PS557構築物がI、L、及びVへの結合を保持することを実証する。
上記の結果は、さまざまな多価ClpSバインダーが、F、Y、W、L、I、及びVを含む末端アミノ酸への結合を保持することを示した。追加の多価アミノ酸バインダーを、フレキシブルペプチドリンカーをコードするセグメントによって末端どうして連結されたUBRボックスバインダーの2つのコピーをコードするセグメントを含む単一コーディング配列から発現した直列融合分子として設計した。単一コーディング配列の発現により、直列に配向された2つのUBRボックスホモログ(ビスPS621、ビスPS528)を有する単一全長ポリペプチドが生成される。
3つの異なる構築物を、各多価UBRボックスバインダーについて設計して発現させた:PS690、PS691、及びPS692(それぞれリンカー1、リンカー2、及びリンカー3を有するビスPS621バインダー)、並びにPS693、PS694、及びPS695(それぞれリンカー1、リンカー2、及びリンカー3を有するビスPS528)。蛍光偏光研究を実施して、ペナルティメート位置のアラニン残基とともにN末端アルギニン残基を有するペプチドについて、多価UBRボックスバインダー及び対応するモノマー形バインダーの各々の結合親和性を評価した。これらの研究から得られたKD値を、以下の表11に報告する。
これらの研究の結果は、多価バインダーが、複数のClpS又はUBRボックスタンパク質ホモログをコードするセグメントを含む単一コーディング配列から発現した直列融合分子として得ることができることを実証する。そのほか、これらの多価アミノ酸バインダーは、F、Y、W、L、I、V、及びRを含む末端アミノ酸への結合を保持することを示される。
実施例19.光損傷軽減のためのシールド認識分子融合物
実施例10で記載されるように、DNAストレプトアビジンシールディングエレメントの使用は、動的シーケンシング反応の間、固定されたペプチドの光安定性を向上させることが示された。追加のシールド認識分子を、フレキシブルペプチドリンカーによって末端同士で結合された、アミノ酸結合タンパク質及びタンパク質シールドの1つ又は2つのコピーをコードするセグメントを含む単一コーディング配列から発現した直列融合分子として設計した。こうして、シールド認識分子の結合成分及びシールディングエレメントは、単一発現構築物から生成されうる。表12は、設計されたさまざまな融合構築物及び対応するポリペプチド配列のリストを提供する。
実施例10で記載されるように、DNAストレプトアビジンシールディングエレメントの使用は、動的シーケンシング反応の間、固定されたペプチドの光安定性を向上させることが示された。追加のシールド認識分子を、フレキシブルペプチドリンカーによって末端同士で結合された、アミノ酸結合タンパク質及びタンパク質シールドの1つ又は2つのコピーをコードするセグメントを含む単一コーディング配列から発現した直列融合分子として設計した。こうして、シールド認識分子の結合成分及びシールディングエレメントは、単一発現構築物から生成されうる。表12は、設計されたさまざまな融合構築物及び対応するポリペプチド配列のリストを提供する。
表12に示すように、各融合構築物は、以下のタンパク質シールド:リンカー2を介して融合されたSNAPタグタンパク質(「SNAPタグ融合物」として示される)、直列に配向されたSNAPタグタンパク質の2つのコピー(「2xSNAPタグ融合物」として示される)、リンカー2及びHis/ビスビオチンタグを含むセグメントを介して融合されたSNAPタグタンパク質(「SNAPタグ融合物2」として示される)、DNAポリメラーゼ(「EF融合物として示される」)、マルトース結合タンパク質(「MBP融合物」として示される)、グルタチオンSトランスフェラーゼタンパク質(「GST融合物」として示される)、又は緑色蛍光タンパク質(「GFP融合物」として示される)のうちの1つに融合したアミノ酸結合タンパク質(PS557又はatClpS2-V1)を含んだ。
ストップトフローアッセイを実施して、PS557、atClpS2-V1、及びタンパク質シールドのC末端付加によって駆動される融合タンパク質について、会合(kon)及び解離(koff)の速度を測定した。ストップトフローによってオン速度定数を測定するために、バインダーをFITCペプチドと迅速に混合し、反応をリアルタイムで追跡した。アッセイ設計を例示する模式図を図37A(トップパネル)に示す。N末端LAペプチドをPS557派生物に使用し、N末端FAペプチドをatClpS2-V1派生物に使用した。このアッセイでは、蛍光シグナルは、タンパク質結合時のクエンチングにより減少した。複数の濃度のバインダーで得られた平均トレースを減衰方程式にあてはめて、会合速度を導出した(図37A、中央パネル)。さまざまなバインダー濃度に対する会合速度のプロットの線形勾配は、kon速度定数を与える(図37A、ボトムパネル)。
ストップトフローによって解離速度(koff)を測定するために、最適な濃度で標識付ペプチド基質に結合するバインダーの複合体を過剰非標識トラップペプチドと迅速に混合した。アッセイ設計を例示する模式図を図37B(トップパネル)に示す。ペプチドN末端からのバインダー解離は、クエンチングの逆転により、蛍光シグナルの増加をもたらした。平均速度トレースを指数方程式に当てはめて、koffを決定した(図37B、ボトムパネル)。
ストップトフローアッセイによって決定された速度は、表13(PS557及びPS557派生融合物)及び表14(atClpS2-V1及びatClpS2-V1派生融合物)に示される。
結果は、タンパク質シールド構築物とClpSタンパク質とのC末端融合物が、単一分子ペプチドシーケンシングアッセイでの使用に有用なClpS対照に類似の反応速度論プロフィールを有する完全に活性化したN末端認識剤を生成することを実証する。
均等物及び範囲
請求項では、「a」、「an」、及び「the」などの冠詞は、相反する指示がない限り又はとくに文脈から自明でない限り、1つ又は2つ以上を意味しうる。グループの1つ以上のメンバー間に「or(又は)」を含む請求項又は説明は、相反する指示がない限り又はとくに文脈から自明でない限り、グループメンバーの1つ、2つ以上、又はすべてが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する場合、満足されるとみなされる。本発明は、グループの厳密に1つのメンバーが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する実施形態を含む。本発明は、グループメンバーの2つ以上又はすべてが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する実施形態を含む。
請求項では、「a」、「an」、及び「the」などの冠詞は、相反する指示がない限り又はとくに文脈から自明でない限り、1つ又は2つ以上を意味しうる。グループの1つ以上のメンバー間に「or(又は)」を含む請求項又は説明は、相反する指示がない限り又はとくに文脈から自明でない限り、グループメンバーの1つ、2つ以上、又はすべてが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する場合、満足されるとみなされる。本発明は、グループの厳密に1つのメンバーが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する実施形態を含む。本発明は、グループメンバーの2つ以上又はすべてが所与のプロダクト又はプロセスに存在するか、利用されるか、又は他の形で関連する実施形態を含む。
さらに、本発明は、列挙された請求項の1つ以上から他の請求項に1つ以上の限定、要素、文節、及び記述語が導入された、変形形態、組合せ形態、及び入替え形態をすべて包含する。たとえば、他の請求項に依存するいずれかの請求項は、同一基本請求項に依存するいずれかの他の請求項に見いだされる1つ以上の限定を含むように修正可能である。要素がリストとして、たとえば、マーカッシュグループ形式で提示された場合、要素の各サブグループもまた開示され、且つ任意の要素をグループから除外可能である。一般に、本発明又は本発明の態様が、特定の要素及び/又は特徴を含んで参照される場合、本発明の特定の実施形態又は本発明の態様は、そのような要素及び/又は特徴からなるか又は本質的にそれらからなると理解されるべきである。簡単にするために、それらの実施形態は、本明細書では、とくにこの通りの言葉で明記されていない。
本明細書及び特許請求の範囲で用いられる「and/or(及び/又は)」という語句は、そのように結合された要素の「一方又は両方」、すなわち、いくつかの場合には連結して存在し且つ他の場合には分離して存在する要素を意味するものと理解すべきである。「and/or(及び/又は)」を用いて列挙された複数の要素は、同様に解釈されるべきである。すなわち、要素の「1つ以上」は、そのように結合される。任意選択的に、具体的に特定された要素に関連するかしないかにかかわらず、「and/or(及び/又は)」という句により具体的に特定された以外の他の要素が存在していてもよい。したがって、たとえば、「A及び/又はB」という参照語は、「comprising(~を含む)」などのオープンエンドの言語と組み合わせて用いられる場合、一実施形態では、Aのみ(任意選択的にB以外の要素を含めて)、他の実施形態では、Aのみ(任意選択的にA以外の要素を含めて)、さらに他の実施形態では、A及びBの両方(任意選択的に他の要素を含む)などを意味しうる。
本明細書及び特許請求の範囲で用いられる場合、「or(又は)」は、以上に定義された「and/or(及び/又は)」と同一の意味を有するものと理解すべきである。たとえば、リスト中の分離したアイテムの場合、「or(又は)」又は「and/or(及び/又は)」は、包括的なものと解釈されるものとする。すなわち、少なくとも1つを含むが、それだけでなく、いくつかの要素又は列挙された要素の2つ以上も含まれ、任意選択的に、追加の列挙されていないアイテムも含まれる。明らかに相反する指定がされている用語、たとえば、「only one of(~のうちの1つのみ)」又は「exactly one of(~のうちの厳密に1つ)」又は特許請求の範囲で用いられる場合の「consisting of(~からなる)」は、いくつかの要素又は列挙された要素のうち厳密に1つの要素の包含を意味するであろう。一般的には、本明細書で用いられる「or(又は)」という用語は、「either(いずれか一方)」、「one of(~の1つ)」、「only one of(~のうちの1つのみ)」、又は「exactly one of(~のうちの厳密に1つ)」などのように排他性の用語が先行する場合、排他的代替物(すなわち「一方又は他方ただし両方ではない」)を表すとのみ解釈されるものとする。特許請求の範囲で用いられる「consisting essentially of(~から本質的になる)」は、特許法の分野で用いられるその通常の意味を有するものとする。
本明細書及び特許請求の範囲で用いられる場合、1つ以上の要素のリストを参照する「少なくとも1つ」という語句は、要素のリスト中の任意の1つ以上の要素から選択される少なくとも1つの要素を意味すると理解すべきであるが、必ずしも、要素のリスト内に具体的に列挙されたあらゆる要素の少なくともの1つを含むとは限らず、要素のリスト中の要素の任意の組合せが除外されるとは限らない。また、この定義では、具体的に特定された要素に関連するかしないかにかかわらず、「少なくとも1つ」という語句が参照する要素のリスト内に具体的に特定された要素以外の要素が、任意選択的に存在してもよいことも許容される。そのため、限定されるものではないが例として、「at least one of A and B(A及びBの少なくとも1つ)」(又は等価的に「at least one of A or B(A又はBの少なくとも1つ)」又は等価的に「at least one of A and/or B(A及び/又はBの少なくとも1つ)」)は、一実施形態では、Bが存在せずに(任意選択的にB以外の要素を含めて)、任意選択的に2つ以上のAを含めて、少なくとも1つのA、他の実施形態では、Aは存在せずに(任意選択的にA以外の要素を含めて)、任意選択的に2つ以上のBを含めて、少なくとも1つのB、さらに他の実施形態では、任意選択的に2つ以上のAを含めて、少なくとも1つのA、及び任意選択的に2つ以上のBを含めて、少なくとも1つのB(任意選択的に他の要素を含めて)などを意味しうる。
また、明らかに相反する指定がされていない限り、2つ以上の工程又は行為を含む本明細書に特許請求されたいずれの方法でも、方法の工程又は行為の順序は、方法の工程又は行為が挙げられた順序に必ずしも限定されるとは限らないことを理解すべきである。
特許請求の範囲では、以上の明細書の場合と同様に、「comprising(~を含む)」、「including(~を含む)」、「carrying(~を担持する)」、「having(~を有する)」、「containing(~を含有する)」、「~を含む(involving)」、「~を保持する(holding)」、「composed of(~で構成される)」などの移行句はすべて、オープンエンドであることを理解すべきである。「consisting of(~からなる)」及び「consisting essentially of(~から本質的になる)」という移行句だけは、米国特許庁特許審査手順マニュアル(United States Patent Office Manual of Patent Examining Procedures)のセクション2111.03に示されるように、それぞれ、クローズ又はセミクローズの移行句であるものとする。オープンエンドの移行句(たとえば、「comprising(~を含む)」)を用いた本文書に記載の実施形態は、代替実施形態では、オープンエンドの移行句により記載される特徴について「consisting of(~からなる)」及び「consisting essentially of(~から本質的になる)」として企図されることが認識されるべきである。たとえば、適用が「AとBとを含む組成物」を記載する場合、適用はまた、代替実施形態の「AとBとからなる組成物」及び「AとBとから本質的になる組成物」も企図する。
範囲が与えられる場合、端点が含まれている。さらに、とくに指定がないかぎり又はとくに文脈及び当業者の理解から自明でないかぎり、範囲として表現された値は、文脈上明らかに異なる場合を除いて、範囲の下限の1/10単位まで、本発明のさまざまな実施形態で指定の範囲内の任意の特定の値又は部分範囲を仮定しうる。
本出願では、さまざまな発行特許、公開特許出願、雑誌論文、及び他の出版物(それらはすべて参照により本明細書に組み込まれる)が参照される。組み込まれた参照のいずれかと本明細書との間で矛盾がある場合、本明細書が優先するものとする。それに加えて、先行技術に包含される本発明の特定の実施形態はいずれも、請求項の任意の1項以上から明示的に除外されうる。そのような実施形態は、当業者に公知であるとみなされるので、たとえ本明細書で明示的に除外が明記されていないとしても、それらは除外されうる。先行技術の存在に関係するかしないかにかかわらず、任意の理由で、本発明の任意の特定の実施形態を任意の請求項から除外しうる。
当業者であれば、通常の実験の域を出ることなく、本明細書で説明した特定の実施形態に対する多くの等価形態が分かるであろう。又はそれらを確認できるであろう。本明細書に記載の実施形態の範囲は、以上の説明に限定されるものではなく、添付の特許請求の範囲に明記される通りである。以下の特許請求の範囲に規定される本発明の趣旨又は範囲から逸脱することなく、本明細書に各種変更及び修正を加えうることは当業者であれば分かるであろう。
本明細書の変数のいずれかの定義での化学基のリストの列挙は、列挙された基のいずれかの単一基又は組合せとしてのその変数の定義を含む。本明細書の変数に対する実施形態の列挙は、いずれかの単一実施形態又はいずれかの他の実施形態若しくはその一部分との組合せとしての実施形態を含む。本明細書の実施形態の列挙は、いずれかの単一実施形態又はいずれかの他の実施形態若しくはその一部分との組合せとして実施形態を含む。
Claims (144)
- 表1又は表2から選択された配列に少なくとも80%同一なアミノ酸配列を有するとともに1つ以上の標識を含む、組換えアミノ酸結合タンパク質。
- 前記1つ以上の標識は、発光標識又は伝導率標識を含む、請求項1に記載の組換えアミノ酸結合タンパク質。
- 前記発光標識は、少なくとも1つのフルオロフォア色素分子を含む、請求項2に記載の組換えアミノ酸結合タンパク質。
- 前記発光標識は、20以下のフルオロフォア色素分子を含む、請求項2又は3に記載の組換えアミノ酸結合タンパク質。
- 前記発光標識は、ドナー標識とアクセプター標識とを含む少なくとも1つのFRETペアを含む、請求項2~4のいずれか一項に記載の組換えアミノ酸結合タンパク質。
- 前記ドナー標識と前記アクセプター標識との比は、1:1、2:1、3:1、4:1、又は5:1である、請求項5に記載の組換えアミノ酸結合タンパク質。
- 前記アクセプター標識と前記ドナー標識との比は、1:1、2:1、3:1、4:1、又は5:1である、請求項5に記載の組換えアミノ酸結合タンパク質。
- 前記伝導率標識は、荷電ポリマーを含む、請求項1~7のいずれか一項に記載の組換えアミノ酸結合タンパク質。
- 前記1つ以上の標識は、タグ配列を含む、請求項1~8のいずれか一項に記載の組換えアミノ酸結合タンパク質。
- 前記タグ配列は、精製タグ、切断部位、及びビオチン化配列のうちの1つ以上を含む、請求項9に記載の組換えアミノ酸結合タンパク質。
- 前記ビオチン化配列は、少なくとも1つのビオチンリガーゼ認識配列を含む、請求項10に記載の組換えアミノ酸結合タンパク質。
- 前記ビオチン化配列は、直列に配向された2つのビオチンリガーゼ認識配列を含む、請求項10又は11に記載の組換えアミノ酸結合タンパク質。
- 前記1つ以上の標識は、ビオチン部分を含む、請求項1~12のいずれか一項に記載の組換えアミノ酸結合タンパク質。
- 前記ビオチン部分は、少なくとも1つのビオチン分子を含む、請求項13に記載の組換えアミノ酸結合タンパク質。
- 前記ビオチン部分は、ビスビオチン部分である、請求項13又は14に記載の組換えアミノ酸結合タンパク質。
- 前記標識は、少なくとも1つのビオチン分子が装着された少なくとも1つのビオチンリガーゼ認識配列を含む、請求項14又は15に記載の組換えアミノ酸結合タンパク質。
- 前記1つ以上の標識は、1つ以上のポリオール部分を含む、請求項1~16のいずれか一項に記載の組換えアミノ酸結合タンパク質。
- 前記1つ以上のポリオール部分は、デキストラン、ポリビニルピロリドン、ポリエチレングリコール、ポリプロピレングリコール、ポリオキシエチレングリコール、ポリビニルアルコール、又はこれらの組み合わせ若しくはバリエーションを含む、請求項17に記載の組換えアミノ酸結合タンパク質。
- 前記組換えアミノ酸結合タンパク質は、前記1つ以上の標識が装着された1つ以上の非天然アミノ酸を含む、請求項1~18のいずれか一項に記載の組換えアミノ酸結合タンパク質。
- 前記アミノ酸配列は、表1から選択された配列に80~90%、90~95%、又は少なくとも95%同一である、請求項1~19のいずれか一項に記載の組換えアミノ酸結合タンパク質。
- 請求項1~20のいずれか一項に記載の組換えアミノ酸結合タンパク質を含む組成物。
- 2つ以上のアミノ酸認識分子を含むポリペプチドシーケンシング反応組成物であって、前記2つ以上のアミノ酸認識分子のうちの少なくとも1つは、請求項1~20のいずれか一項に記載の組換えアミノ酸結合タンパク質である、ポリペプチドシーケンシング反応組成物。
- 前記組成物は、少なくとも1タイプの切断試薬を含む、請求項22に記載のポリペプチドシーケンシング反応組成物。
- ポリペプチドシーケンシング方法であって、
ポリペプチドと請求項22又は23に記載のポリペプチドシーケンシング反応組成物とを接触させることと、
前記ポリペプチドが分解されつつある間に前記ポリペプチドと少なくとも1つのアミノ酸認識分子との一連の相互作用を検出することによって前記ポリペプチドをシーケンシングすることと、を含む、方法。 - アミノ酸結合タンパク質及びペプチダーゼを含むポリペプチドシーケンシング反応混合物であって、前記アミノ酸結合タンパク質は1つ以上の標識を含み、前記標識付アミノ酸結合タンパク質と前記ペプチダーゼとのモル比は、約1:1,000~約1:1、又は約1:1~約100:1である、ポリペプチドシーケンシング反応混合物。
- 前記モル比は、約1:100~約1:1、又は約1:1~約10:1である、請求項25に記載のポリペプチドシーケンシング反応混合物。
- 前記モル比は、約1:1,000、約1:500、約1:200、約1:100、約1:10、約1:5、約1:2、約1:1、約5:1、約10:1、約50:1、約100:1である、請求項25又は26に記載のポリペプチドシーケンシング反応混合物。
- 前記アミノ酸結合タンパク質は、合成タンパク質又は組換えタンパク質である、請求項25~27のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記アミノ酸結合タンパク質は、分解経路タンパク質、不活性化ペプチダーゼ、抗体、アミノトランスフェラーゼ、tRNAシンテターゼ、又はSH2ドメイン含有タンパク質若しくはその断片である、請求項25~28のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記アミノ酸結合タンパク質は、ClpSタンパク質、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、又はp62タンパク質若しくはそのZZドメイン含有断片である、請求項25~29のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記アミノ酸結合タンパク質は、ClpSタンパク質である、請求項25~30のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記ClpSタンパク質は、A.ツミファシエンス(A.tumifaciens)、C.クレセンタス(C.crescentus)、E.コリ(E.coli)、S.エロンガタス(S.elongatus)、P.ファルシパラム(P.falciparum)、T.エロンガタス(T.elongatus)、又はこれらの相同種由来のClpS1又はClpS2である、請求項31に記載のポリペプチドシーケンシング反応混合物。
- 前記アミノ酸結合タンパク質は、表1又は表2から選択された配列に少なくとも80%、80~90%、90~95%、又は少なくとも95%同一のアミノ酸配列を有するタンパク質である、請求項25~32のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記アミノ酸結合タンパク質は、請求項A1~A19のいずれか一項に記載の組換えアミノ酸結合タンパク質である、請求項25~33のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記ペプチダーゼは、エキソペプチダーゼである、請求項25~34のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記ペプチダーゼは、アミノペプチダーゼ又はカルボキシペプチダーゼである、請求項25~35のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記ペプチダーゼは、1タイプより多くのアミノ酸をペプチダーゼの末端から切断する非特異的エキソペプチダーゼである、請求項25~36のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記ペプチダーゼは、プロリンアミノペプチダーゼ、プロリンイミノペプチダーゼ、グルタミン酸/アスパラギン酸特異的アミノペプチダーゼ、メチオニン特異的アミノペプチダーゼ、又は亜鉛メタロプロテアーゼである、請求項25~37のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記ペプチダーゼは、表4又は表5から選択された配列に少なくとも80%、80~90%、90~95%、又は少なくとも95%同一のアミノ酸配列を有する酵素である、請求項25~38のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記反応混合物は、1つより多くのアミノ酸結合タンパク質を含む、請求項25~39のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記反応混合物は、1つより多くのペプチダーゼを含む、請求項25~40のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 前記反応混合物は、表面に固定されたペプチド分子を含む、請求項25~41のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 単一ペプチド分子、少なくとも1つのペプチダーゼ分子、及び少なくとも3つのアミノ酸認識分子を含む、ポリペプチドシーケンシング反応混合物。
- 少なくとも1つ且つ10までのペプチダーゼ分子を含む、請求項43に記載のポリペプチドシーケンシング反応混合物。
- 少なくとも1つ且つ5つまでのペプチダーゼ分子を含む、請求項43又は44に記載のポリペプチドシーケンシング反応混合物。
- 少なくとも1つ且つ3つまでのペプチダーゼ分子を含む、請求項43~45のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 少なくとも3つ且つ30までのアミノ酸認識分子を含む、請求項43~46のいずれか一項に記載のポリペプチドシーケンシング反応混合物。
- 20まで、10まで、又は5つまでのアミノ酸認識分子を含む、請求項47に記載のポリペプチドシーケンシング反応混合物。
- サンプルウェルのアレイを含む基体であって、前記アレイの少なくとも1つのサンプルウェルは、請求項43~48のいずれか一項に記載のポリペプチドシーケンシング反応混合物を含む、基体。
- 前記少なくとも1つのサンプルウェルはボトム表面を含み、前記単一ポリペプチド分子は前記ボトム表面に固定される、請求項49に記載の基体。
- サンプルウェルのアレイを含む基体であって、前記アレイの少なくとも1つのサンプルウェルは、単一ポリペプチド分子、切断手段、及び結合手段を含み、前記結合手段及び前記切断手段は、前記結合手段と前記ポリペプチド上の末端アミノ酸との間の少なくとも10の会合イベントを、前記ポリペプチドから前記末端アミノ酸を前記切断手段によって除去する前に達成するように構成される、基体。
- 末端同士で連結した少なくとも第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質を有するポリペプチドを含むアミノ酸認識分子であって、前記第1のアミノ酸結合タンパク質及び前記第2のアミノ酸結合タンパク質は、少なくとも2つのアミノ酸を含むリンカーによって分離されている、アミノ酸認識分子。
- 前記第1のアミノ酸結合タンパク質と前記第2のアミノ酸結合タンパク質とは、同じである、請求項52に記載のアミノ酸認識分子。
- 前記第1のアミノ酸結合タンパク質と前記第2のアミノ酸結合タンパク質とは、互いに異なる、請求項52に記載のアミノ酸認識分子。
- 前記第1のアミノ酸結合タンパク質及び前記第2のアミノ酸結合タンパク質は、それぞれ独立して、表1又は表2から選択されたアミノ酸配列に対して少なくとも80%のアミノ酸配列同一性を有する、請求項52~54のいずれか一項に記載のアミノ酸認識分子。
- 前記リンカーは、100までのアミノ酸を含む、請求項52~55のいずれか一項に記載のアミノ酸認識分子。
- 前記リンカーは、約5から約50のアミノ酸を含む、請求項52~56のいずれか一項に記載のアミノ酸認識分子。
- 式(I):
(Z1-X1)n-Z2
(I)
(式中、Z1及びZ2は、独立したアミノ酸結合タンパク質であり、X1は、少なくとも2つのアミノ酸を含むリンカーであり、前記アミノ酸結合タンパク質は前記リンカーによって末端同士で結合されており、且つnは1~5(両端の値を含む)の整数である)
のポリペプチドを含むアミノ酸認識分子。 - Z1及びZ2は、同じタイプのアミノ酸結合タンパク質を含む、請求項58に記載のアミノ酸認識分子。
- Z1及びZ2は、互いに異なるタイプのアミノ酸結合タンパク質を含む、請求項58に記載のアミノ酸認識分子。
- Z1及びZ2は、独立して任意選択で、少なくとも1つの検出標識を含む標識成分に関連する、請求項58~60のいずれか一項に記載のアミノ酸認識分子。
- 前記ポリペプチドは、さらにタグ配列を含む、請求項58~61のいずれか一項に記載のアミノ酸認識分子。
- 前記タグ配列は、前記ポリペプチドの末端か、又は末端の近くにある、請求項62に記載のアミノ酸認識分子。
- 前記タグ配列は、少なくとも1つのビオチンリガーゼ認識配列を含む、請求項62又は63に記載のアミノ酸認識分子。
- 前記タグ配列は、直列に配向された2つのビオチンリガーゼ認識配列を含む、請求項62~64のいずれか一項に記載のアミノ酸認識分子。
- Z1及びZ2は、それぞれ独立して、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する、請求項58~65のいずれか一項に記載のアミノ酸認識分子。
- X1は、100までのアミノ酸を含む、請求項58~66のいずれか一項に記載のアミノ酸認識分子。
- X1は、約5から約50のアミノ酸を含む、請求項58~67のいずれか一項に記載のアミノ酸認識分子。
- 末端同士で連結したアミノ酸結合タンパク質と標識付タンパク質とを有するポリペプチドを含むアミノ酸認識分子であって、前記アミノ酸結合タンパク質及び前記標識付タンパク質は、少なくとも2つのアミノ酸を含むリンカーによって分離されている、アミノ酸認識分子。
- 前記リンカーは、100までのアミノ酸を含む、請求項69に記載のアミノ酸認識分子。
- 前記リンカーは、約5から約50のアミノ酸を含む、請求項69又は70に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、少なくとも10kDaの分子量を有する、請求項69~71のいずれか一項に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、約10kDa~約150kDaの分子量を有する、請求項69~72のいずれか一項に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、約15kDa~約100kDaの分子量を有する、請求項69~73のいずれか一項に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、少なくとも50アミノ酸を含む、請求項69~74のいずれか一項に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、約50~約1,000のアミノ酸を含む、請求項69~75のいずれか一項に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、約100~約750のアミノ酸を含む、請求項69~76のいずれか一項に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、DNAポリメラーゼ、マルトース結合タンパク質、グルタチオンSトランスフェラーゼ、緑色蛍光タンパク質、及びSNAPタグからなる群から選択されたタンパク質を含む、請求項69~77のいずれか一項に記載のアミノ酸認識分子。
- 前記標識付タンパク質は、発光標識を含む、請求項69~78のいずれか一項に記載のアミノ酸認識分子。
- 前記発光標識は、少なくとも1つのフルオロフォア色素分子を含む、請求項79に記載のアミノ酸認識分子。
- 前記アミノ酸結合タンパク質は、Gidタンパク質、UBRボックスタンパク質若しくはそのUBRボックスドメイン含有断片、p62タンパク質若しくはそのZZドメイン含有断片、又はClpSタンパク質である、請求項69~80のいずれか一項に記載のアミノ酸認識分子。
- 前記アミノ酸結合タンパク質は、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する、請求項69~81のいずれか一項に記載のアミノ酸認識分子。
- ポリペプチドシーケンシング方法であって、
反応混合物中の単一ポリペプチド分子と結合手段及び切断手段を含む組成物とを接触させることを含み、
前記結合手段及び前記切断手段は、前記結合手段と前記ポリペプチド上の末端アミノ酸との間の少なくとも10の会合イベントを、前記ポリペプチドから前記末端アミノ酸を前記切断手段によって除去する前に達成するように構成される、方法。 - 前記結合手段及び前記切断手段は、少なくとも10且つ1,000までの会合イベントを、前記末端アミノ酸を除去する前に達成するように構成される、請求項83に記載の方法。
- 前記結合手段及び前記切断手段は、500まで、200まで、又は100までの会合イベントを、前記末端アミノ酸を除去する前に達成するように構成される、請求項83又は84に記載の方法。
- 前記末端アミノ酸は、前記少なくとも10の会合イベントの前の切断イベントにて前記ポリペプチドの末端に露出した、請求項83~85のいずれか一項に記載の方法。
- 前記少なくとも10の会合イベントは、前記切断イベントの後に起こる、請求項86に記載の方法。
- 前記結合手段及び前記切断手段は、切断イベント間に少なくとも1分の時間インターバルを達成するように構成される、請求項83~87のいずれか一項に記載の方法。
- 前記時間インターバルは、約1分~約20分、約5分~約15分、又は約1分~約10分である、請求項88に記載の方法。
- 前記結合手段は1つ以上のアミノ酸認識分子を含み、前記切断手段は1つ以上のペプチダーゼ分子を含む、請求項83~89のいずれか一項に記載の方法。
- アミノ酸認識分子とペプチダーゼ分子とのモル比は、少なくとも10の会合イベントを、前記末端アミノ酸を除去する前に達成するように構成される、請求項90に記載の方法。
- 前記アミノ酸認識分子と前記ペプチダーゼ分子とのモル比は、約1:1,000~約1:1又は約1:1~約100:1である、請求項91に記載の方法。
- 前記アミノ酸認識分子と前記ペプチダーゼ分子とのモル比は、約1:100~約1:1又は約1:1~約10:1である、請求項91に記載の方法。
- 前記アミノ酸認識分子と前記ペプチダーゼ分子とのモル比は、約1:1,000、約1:500、約1:200、約1:100、約1:10、約1:5、約1:2、約1:1、約5:1、約10:1、約50:1、約100:1である、請求項91に記載の方法。
- ポリペプチドの分解プロセス時のデータを得ることと、
前記分解プロセス時に前記ポリペプチドの末端に逐次露出されるアミノ酸に対応する前記データの部分であって、独立した前記部分の各々は、少なくとも1つのパルス持続時間を含むパルスパターンを含み、前記パルスパターンは約1ミリ秒~約10秒の平均パルス持続時間を含む、前記データの部分を決定するように前記データを解析することと、
前記ポリペプチドに相当するアミノ酸配列を出力することと、を含む、方法。 - 前記平均パルス持続時間は、約50ミリ秒~約2秒である、請求項95に記載の方法。
- 前記平均パルス持続時間は、約50ミリ秒~約500ミリ秒又は約500ミリ秒~約2秒である、請求項95又は96に記載の方法。
- 第1のタイプのアミノ酸の前記パルスパターンは、第2のタイプのアミノ酸の前記パルスパターンと少なくとも10ミリ秒の平均パルス持続時間だけ異なる、請求項95~97のいずれか一項に記載の方法。
- 第1のタイプのアミノ酸の前記パルスパターンは、第2のタイプのアミノ酸の前記パルスパターンと約10ミリ秒~約100ミリ秒又は約100ミリ秒~約10秒の平均パルス持続時間だけ異なる、請求項95~97のいずれか一項に記載の方法。
- ポリペプチドシーケンシング方法であって、
単一ポリペプチド分子と1つ以上のアミノ酸認識分子とを接触させることと、
前記1つ以上のアミノ酸認識分子と、前記単一ポリペプチドが分解されつつある間に前記単一ポリペプチド分子の末端に露出される逐次アミノ酸と、の会合の指標となる一連のシグナルパルスを検出することにより、前記単一ポリペプチド分子をシーケンスすることと、を含み、
前記1つ以上のアミノ酸認識分子と前記末端に露出される各タイプのアミノ酸との会合が、前記末端に露出される他のタイプのアミノ酸とは異なる前記一連のシグナルパルスの特性パターンを生成し、前記特性パターンのシグナルパルスは約1ミリ秒~約10秒の平均パルス持続時間を含む、方法。 - ポリペプチドをシーケンシングする方法であって、
反応混合物中の単一ポリペプチド分子と1つ以上のアミノ酸認識分子及び切断試薬を含む組成物とを接触させることと、
前記1つ以上のアミノ酸認識分子と前記単一ポリペプチド分子の末端との前記切断試薬の存在下での会合の指標となる一連のシグナルパルスであって、前記一連のシグナルパルスは、前記切断試薬による末端アミノ酸切断の結果として、経時的に前記末端にて曝露された一連のアミノ酸の指標である、一連のシグナルパルスを検出することを含み、
前記1つ以上のアミノ酸認識分子と前記末端に露出される各タイプのアミノ酸との会合が、前記末端に露出される他のタイプのアミノ酸とは異なる前記一連のシグナルパルスの特性パターンを生成し、前記特性パターンのシグナルパルスは約1ミリ秒~約10秒の平均パルス持続時間を含む、方法。 - ポリペプチドシーケンス方法であって、
a)単一ポリペプチド分子の末端の第1のアミノ酸を同定することと、
b)前記第1のアミノ酸を除去して前記単一ポリペプチド分子の前記末端の第2のアミノ酸を露出させることと、
c)前記単一ポリペプチド分子の前記末端の前記第2のアミノ酸を同定することと、を含み、
(a)~(c)は、1つ以上のアミノ酸認識分子を含む単一反応混合物中で実施され、
前記第1のアミノ酸及び前記第2のアミノ酸は、前記1つ以上のアミノ酸認識分子と、前記単一ポリペプチド分子の末端との会合の指標となる一連のシグナルパルスを検出することによって同定され、
前記1つ以上のアミノ酸認識分子と前記第1のアミノ酸との会合により、前記第2のアミノ酸とは異なる前記一連のシグナルパルスの特性パターンが生成され、前記特性パターンのシグナルパルスは約1ミリ秒~約10秒の平均パルス持続時間を含む、方法。 - ポリペプチドのアミノ酸を同定する方法であって、
単一ポリペプチド分子と前記単一ポリペプチド分子に結合する1つ以上のアミノ酸認識分子とを接触させることと、
前記1つ以上のアミノ酸認識分子と前記単一ポリペプチド分子とのポリペプチド分解条件下での会合の指標となる一連のシグナルパルスを検出することと、
前記一連のシグナルパルスにおける特性パターンであって、前記特性パターンのシグナルパルスは、約1ミリ秒~約10秒の平均パルス持続時間を含む、前記一連のシグナルパルスにおける特性パターンに基づいて、前記単一ポリペプチド分子の第1のタイプのアミノ酸を同定することと、を含む、方法。 - 前記平均パルス持続時間は、約50ミリ秒~約2秒である、請求項100~103のいずれか一項に記載の方法。
- 前記平均パルス持続時間は、約50ミリ秒~約500ミリ秒又は約500ミリ秒~約2秒である、請求項100~104のいずれか一項に記載の方法。
- 前記特性パターンは、少なくとも10のシグナルパルスを含む、請求項100~105のいずれか一項に記載の方法。
- 少なくとも1タイプのアミノ酸の前記特性パターンは、約50~約200のシグナルパルスを含む、請求項100~106のいずれか一項に記載の方法。
- 少なくとも1タイプのアミノ酸の前記特性パターンは、約25~約100のシグナルパルスを含む、請求項100~107のいずれか一項に記載の方法。
- 第1のタイプのアミノ酸の前記特性パターンは、第2のタイプのアミノ酸の前記特性パターンと少なくとも10ミリ秒の平均パルス持続時間だけ異なる、請求項100~108のいずれか一項に記載の方法。
- 第1のタイプのアミノ酸の前記特性パターンは、第2のタイプのアミノ酸の前記特性パターンと約10ミリ秒~約100ミリ秒又は約100ミリ秒~約1秒の平均パルス持続時間だけ異なる、請求項100~109のいずれか一項に記載の方法。
- 前記方法は、前記1つ以上のアミノ酸認識分子及び1つ以上の切断試薬を含む組成物を含む反応混合物中で実施される、請求項100~110のいずれか一項に記載の方法。
- 前記反応混合物中のアミノ酸認識分子と切断試薬とのモル比は、約1:1,000~約1:1又は約1:1~約100:1である、請求項111に記載の方法。
- 前記反応混合物中のアミノ酸認識分子と切断試薬とのモル比は、約1:100~約1:1又は約1:1~約10:1である、請求項111に記載の方法。
- 前記反応混合物中のアミノ酸認識分子と切断試薬とのモル比は、約1:1,000、約1:500、約1:200、約1:100、約1:10、約1:5、約1:2、約1:1、約5:1、約10:1、約50:1、約100:1である、請求項111に記載の方法。
- 前記1つ以上のアミノ酸認識分子は、1つ以上の末端アミノ酸認識分子を含む、請求項100~114のいずれか一項に記載の方法。
- 前記1つ以上のアミノ酸認識分子の各々は、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有するアミノ酸結合タンパク質を含む、請求項100~115のいずれか一項に記載の方法。
- 少なくとも1つのハードウェアプロセッサーと、
前記少なくとも1つのハードウェアプロセッサーによって実行されるときに前記少なくとも1つのハードウェアプロセッサーに請求項100~116のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する少なくとも1つの非一時コンピュータ可読記憶媒体と、を含む、システム。 - 少なくとも1つのハードウェアプロセッサーによって実行されるときに前記少なくとも1つのハードウェアプロセッサーに請求項100~116のいずれか一項に記載の方法を実施させるプロセッサー実行可能命令を記憶する、少なくとも1つの非一時コンピュータ可読記憶媒体。
- 式(II):
A-(Y)n-D
(II)
(式中、Aは、表1又は表2から選択されたアミノ酸配列に対して少なくとも80%のアミノ酸配列同一性を有する少なくとも1つのアミノ酸結合タンパク質を含むアミノ酸結合コンポーネントであり、
Yの各々は、共有結合性又は非共有結合性連結基を形成するポリマーであり、
nは、0~10(両端の値を含む)の整数であり、
且つDは、少なくとも1つの検出標識を含む標識コンポーネントであって、Dは20nm(200Å)未満の直径である)
の可溶性アミノ酸認識分子を含む組成物。 - 前記可溶性アミノ酸認識分子は、末端同士で連結したA及びY1を有するポリペプチドを含み、A及びY1は少なくとも2つのアミノ酸を含むリンカーによって分離されている、請求項119に記載の組成物。
- 前記リンカーは、100までのアミノ酸を含む、請求項120に記載の組成物。
- 前記リンカーは、約5~約50のアミノ酸を含む、請求項120又は121に記載の組成物。
- Y1は、少なくとも10kDaの分子量を有するタンパク質である、請求項119~122のいずれか一項に記載の組成物。
- Y1は、約10kDa~約150kDaの分子量を有するタンパク質である、請求項119~123のいずれか一項に記載の組成物。
- Y1は、約15kDa~約100kDaの分子量を有するタンパク質である、請求項119~124のいずれか一項に記載の組成物。
- Y1は、少なくとも50アミノ酸を含むタンパク質である、請求項119~125のいずれか一項に記載の組成物。
- Y1は、約50~約1,000のアミノ酸を含むタンパク質である、請求項119~126のいずれか一項に記載の組成物。
- Y1は、約100~約750のアミノ酸を含むタンパク質である、請求項119~127のいずれか一項に記載の組成物。
- Y1は、DNAポリメラーゼ、マルトース結合タンパク質、グルタチオンSトランスフェラーゼ、緑色蛍光タンパク質、及びSNAPタグからなる群から選択されたタンパク質である、請求項119~128のいずれか一項に記載の組成物。
- Aは、末端同士で連結した少なくとも第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質を有するポリペプチドを含み、前記第1のアミノ酸結合タンパク質及び前記第2のアミノ酸結合タンパク質は、少なくとも2つのアミノ酸を含むリンカーによって分離されている、請求項119~129のいずれか一項に記載の組成物。
- 前記第1のアミノ酸結合タンパク質と前記第2のアミノ酸結合タンパク質とは、同じである、請求項130に記載の組成物。
- 前記第1のアミノ酸結合タンパク質と前記第2のアミノ酸結合タンパク質とは、互いに異なる、請求項130又は131に記載の組成物。
- 前記第1のアミノ酸結合タンパク質及び前記第2のアミノ酸結合タンパク質は、それぞれ独立して、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する、請求項130~132のいずれか一項に記載の組成物。
- 前記リンカーは、100までのアミノ酸を含む、請求項130~133のいずれか一項に記載の組成物。
- 前記リンカーは、約5~約50のアミノ酸を含む、請求項130~134のいずれか一項に記載の組成物。
- 式(III):
A-Y1-D
(III)
(式中、Aは、表1又は表2から選択されたアミノ酸配列に対して少なくとも80%のアミノ酸配列同一性を有する少なくとも1つのアミノ酸結合タンパク質を含むアミノ酸結合コンポーネントであり、
Y1は、核酸又はポリペプチドであり、
且つDは、少なくとも1つの検出標識を含む標識コンポーネントであり、
Y1が核酸であるとき、前記核酸は共有結合性又は非共有結合性連結基を形成し、且つ、
Y1がポリペプチドであるとき、前記ポリペプチドは、50×10-9M未満の解離定数(KD)により特徴付けられる非共有結合性連結基を形成する)
のアミノ酸認識分子。 - Aは、末端同士で連結した少なくとも第1のアミノ酸結合タンパク質及び第2のアミノ酸結合タンパク質を有するポリペプチドを含み、前記第1のアミノ酸結合タンパク質及び前記第2のアミノ酸結合タンパク質は、少なくとも2つのアミノ酸を含むリンカーによって分離されている、請求項136に記載のアミノ酸認識分子。
- 前記第1のアミノ酸結合タンパク質と前記第2のアミノ酸結合タンパク質とは、同じである、請求項137に記載のアミノ酸認識分子。
- 前記第1のアミノ酸結合タンパク質と前記第2のアミノ酸結合タンパク質とは、互いに異なる、請求項137又は138に記載のアミノ酸認識分子。
- 前記第1のアミノ酸結合タンパク質及び前記第2のアミノ酸結合タンパク質は、それぞれ独立して、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有する、請求項137~139のいずれか一項に記載のアミノ酸認識分子。
- 前記リンカーは、100までのアミノ酸を含む、請求項137~140のいずれか一項に記載のアミノ酸認識分子。
- 前記リンカーは、約5~約50のアミノ酸を含む、請求項137~141のいずれか一項に記載のアミノ酸認識分子。
- 核酸と、
前記核酸上の第1の装着部位に装着された少なくとも1つのアミノ酸認識分子であって、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有するアミノ酸結合タンパク質を含む、少なくとも1つのアミノ酸認識分子と、
前記核酸上の第2の装着部位に装着された少なくとも1つの検出可能標識と、を含むアミノ酸認識分子であって、
前記核酸は、前記少なくとも1つのアミノ酸認識分子と前記少なくとも1つの検出可能標識との間に共有結合性又は非共有結合性連結基を形成する、アミノ酸認識分子。 - 少なくとも2つのリガンド結合部位を含む多価タンパク質と、
前記タンパク質上の第1のリガンド結合部位に結合された第1のリガンド部分を介して前記タンパク質に装着された少なくとも1つのアミノ酸認識分子であって、表1又は表2から選択されたアミノ酸配列に少なくとも80%同一のアミノ酸配列を有するアミノ酸結合タンパク質を含む、少なくとも1つのアミノ酸認識分子と、
前記タンパク質上の第2のリガンド結合部位に結合された第2のリガンド部分を介して前記タンパク質に装着された少なくとも1つの検出可能標識と、を含む、アミノ酸認識分子。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063027913P | 2020-05-20 | 2020-05-20 | |
US63/027,913 | 2020-05-20 | ||
US202063059919P | 2020-07-31 | 2020-07-31 | |
US63/059,919 | 2020-07-31 | ||
PCT/US2021/033493 WO2021236983A2 (en) | 2020-05-20 | 2021-05-20 | Methods and compositions for protein sequencing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023527764A true JP2023527764A (ja) | 2023-06-30 |
JPWO2021236983A5 JPWO2021236983A5 (ja) | 2024-05-28 |
Family
ID=76730980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022570635A Pending JP2023527764A (ja) | 2020-05-20 | 2021-05-20 | タンパク質シーケンスのための方法及び組成物 |
Country Status (8)
Country | Link |
---|---|
US (1) | US12065466B2 (ja) |
EP (1) | EP4143579A2 (ja) |
JP (1) | JP2023527764A (ja) |
KR (1) | KR20230012052A (ja) |
CN (1) | CN116134046A (ja) |
AU (1) | AU2021276522A1 (ja) |
CA (1) | CA3177375A1 (ja) |
WO (1) | WO2021236983A2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113287020A (zh) * | 2018-11-15 | 2021-08-20 | 宽腾矽公司 | 用于蛋白质测序的方法及组合物 |
WO2023245104A2 (en) * | 2022-06-15 | 2023-12-21 | Quantum-Si Incorporated | Methods and compositions for protein fingerprinting |
US20240272170A1 (en) * | 2022-08-04 | 2024-08-15 | Quantum-Si Incorporated | Compositions and methods for polypeptide analysis |
Family Cites Families (106)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4435728A1 (de) | 1994-01-19 | 1995-07-20 | Boehringer Mannheim Gmbh | Biotinsilan-Verbindungen und diese Verbindungen enthaltende Bindematrix |
US5654419A (en) | 1994-02-01 | 1997-08-05 | The Regents Of The University Of California | Fluorescent labels and their use in separations |
GB2333597B (en) | 1996-10-29 | 2001-04-18 | Univ Nebraska At Lincoln | Method for detecting point mutations in dna utilizing fluorescence energy transfer |
US6153442A (en) | 1998-05-20 | 2000-11-28 | Dade Behring Inc. | Reagents and methods for specific binding assays |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
WO2000036152A1 (en) | 1998-12-14 | 2000-06-22 | Li-Cor, Inc. | A system and methods for nucleic acid sequencing of single molecules by polymerase synthesis |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US6936702B2 (en) | 2000-06-07 | 2005-08-30 | Li-Cor, Inc. | Charge-switch nucleotides |
US6869764B2 (en) | 2000-06-07 | 2005-03-22 | L--Cor, Inc. | Nucleic acid sequencing using charge-switch nucleotides |
CA2314398A1 (en) | 2000-08-10 | 2002-02-10 | Edward Shipwash | Microarrays and microsystems for amino acid analysis and protein sequencing |
US20060014212A1 (en) | 2002-05-10 | 2006-01-19 | Epitome Biosystems, Inc. | Proteome epitope tags and methods of use thereof in protein modification analysis |
WO2004092331A2 (en) | 2003-04-08 | 2004-10-28 | Li-Cor, Inc. | Composition and method for nucleic acid sequencing |
US20100035254A1 (en) | 2003-04-08 | 2010-02-11 | Pacific Biosciences Of California, Inc. | Composition and method for nucleic acid sequencing |
GB0324456D0 (en) | 2003-10-20 | 2003-11-19 | Isis Innovation | Parallel DNA sequencing methods |
WO2005044836A2 (de) | 2003-11-05 | 2005-05-19 | Genovoxx Gmbh | Makromolekulare nukleotidverbindungen und methoden zu deren anwendung |
AR048685A1 (es) * | 2004-04-09 | 2006-05-17 | Monsanto Technology Llc | Metodos para el control de infestaciones de insectos en plantas. |
US7462452B2 (en) | 2004-04-30 | 2008-12-09 | Pacific Biosciences Of California, Inc. | Field-switch sequencing |
CA2496294A1 (en) | 2005-02-07 | 2006-08-07 | The University Of British Columbia | Apparatus and methods for concentrating and separating particles such as molecules |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
ATE481505T1 (de) | 2005-12-12 | 2010-10-15 | Us Gov Health & Human Serv | Sonde zum sequenzieren von nukleinsäure und verwendungsverfahren |
CN101341254A (zh) * | 2005-12-24 | 2009-01-07 | 蒂加斯克乳制品研究中心 | 反-10,顺-12十八碳二烯酸的生产方法 |
WO2007123708A2 (en) | 2006-03-31 | 2007-11-01 | Epitome Biosystems, Inc. | Post translational modification pattern analysis |
US8084734B2 (en) | 2006-05-26 | 2011-12-27 | The George Washington University | Laser desorption ionization and peptide sequencing on laser induced silicon microcolumn arrays |
JP5244103B2 (ja) * | 2006-08-09 | 2013-07-24 | ホームステッド クリニカル コーポレイション | 器官特異的蛋白質およびその使用方法 |
US20090028832A1 (en) * | 2006-08-10 | 2009-01-29 | Chung Leland F | Compositions and methods for targeted tumor therapy |
DE602008000796D1 (de) | 2008-01-15 | 2010-04-22 | Univ Utrecht Holding Bv | Verfahren zur Bestimmung der Aminosäurensequenz von Peptiden |
WO2009097368A2 (en) | 2008-01-28 | 2009-08-06 | Complete Genomics, Inc. | Methods and compositions for efficient base calling in sequencing reactions |
US7968702B2 (en) | 2008-03-13 | 2011-06-28 | Pacific Biosciences Of California, Inc. | Labeled reactants and their uses |
EP3045542B1 (en) | 2008-03-28 | 2016-11-16 | Pacific Biosciences of California, Inc. | Methods for nucleic acid sequencing |
US8420366B2 (en) | 2008-03-31 | 2013-04-16 | Pacific Biosciences Of California, Inc. | Generation of modified polymerases for improved accuracy in single molecule sequencing |
US8999676B2 (en) | 2008-03-31 | 2015-04-07 | Pacific Biosciences Of California, Inc. | Recombinant polymerases for improved single molecule sequencing |
AU2009251881B2 (en) | 2008-03-31 | 2015-03-26 | Pacific Biosciences Of California, Inc | Single molecule loading methods and compositions |
US8257954B2 (en) | 2008-03-31 | 2012-09-04 | Pacific Biosciences Of California, Inc. | Generation of modified polymerases for improved accuracy in single molecule sequencing |
WO2010044892A1 (en) | 2008-10-17 | 2010-04-22 | President And Fellows Of Harvard College | Diagnostic method based on large scale identification of post-translational modification of proteins |
WO2010059206A2 (en) | 2008-11-19 | 2010-05-27 | Pacific Biosciences Of California, Inc. | Modular nucleotide compositions and uses therefor |
WO2010065531A1 (en) | 2008-12-01 | 2010-06-10 | Robi David Mitra | Single molecule protein screening |
WO2010065322A1 (en) | 2008-12-01 | 2010-06-10 | Research Triangle Institute | Concurrent identification of multitudes of polypeptides |
KR101063981B1 (ko) | 2009-01-12 | 2011-09-14 | 서강대학교산학협력단 | 자유 라디칼 개시제 및 이를 이용한 펩타이드 서열의 동정방법 |
DE102009013653B4 (de) | 2009-03-18 | 2014-09-18 | Bruker Daltonik Gmbh | Protein-Sequenzierung mit MALDI-Massenspektrometrie |
US20100255487A1 (en) | 2009-03-27 | 2010-10-07 | Life Technologies Corporation | Methods and apparatus for single molecule sequencing using energy transfer detection |
WO2010117420A2 (en) | 2009-03-30 | 2010-10-14 | Pacific Biosciences Of California, Inc. | Fret-labeled compounds and uses therefor |
EP2414545B1 (en) | 2009-04-03 | 2017-01-11 | Sequenom, Inc. | Nucleic acid preparation compositions and methods |
US9566335B1 (en) | 2009-09-25 | 2017-02-14 | The Governing Council Of The University Of Toronto | Protein sequencing method and reagents |
SG185438A1 (en) | 2010-05-06 | 2012-12-28 | Ibis Biosciences Inc | Integrated sample preparation systems and stabilized enzyme mixtures |
US8927488B2 (en) * | 2010-05-17 | 2015-01-06 | Cebix, Inc. | Pegylated C-peptide |
EP2689028B1 (en) | 2011-03-23 | 2017-08-30 | Pacific Biosciences Of California, Inc. | Isolation of polymerase-nucleic acid complexes and loading onto substrates |
WO2013112745A1 (en) | 2012-01-24 | 2013-08-01 | The Regents Of The University Of Colorado, A Body Corporate | Peptide identification and sequencing by single-molecule detection of peptides undergoing degradation |
US9062091B2 (en) | 2012-02-15 | 2015-06-23 | Pacific Biosciences Of California, Inc. | Polymerase enzyme substrates with protein shield |
AU2013226090B2 (en) | 2012-02-27 | 2018-03-08 | Amunix Operating Inc. | XTEN conjugate compositions and methods of making same |
CA2878679A1 (en) * | 2012-07-11 | 2014-01-16 | Amunix Operating Inc. | Factor viii complex with xten and von willebrand factor protein, and uses thereof |
NL2009191C2 (en) | 2012-07-16 | 2014-01-20 | Univ Delft Tech | Single molecule protein sequencing. |
US9435810B2 (en) | 2013-03-15 | 2016-09-06 | Washington University | Molecules and methods for iterative polypeptide analysis and processing |
US10544449B2 (en) | 2013-06-14 | 2020-01-28 | Pacific Biosciences Of California, Inc. | Bis-biotinylation tags |
WO2014201265A1 (en) | 2013-06-14 | 2014-12-18 | Pacific Biosciences Of California, Inc. | Bis-biotinylation tags |
WO2014205401A1 (en) | 2013-06-21 | 2014-12-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
WO2015021079A1 (en) | 2013-08-05 | 2015-02-12 | Pacific Biosciences Of California, Inc. | Protected fluorescent reagent compounds |
AU2014348305B2 (en) | 2013-11-17 | 2020-10-01 | Quantum-Si Incorporated | Integrated device with external light source for probing detecting and analyzing molecules |
KR102384909B1 (ko) | 2014-08-08 | 2022-04-11 | 퀀텀-에스아이 인코포레이티드 | 수신된 광자들의 시간 비닝을 위한 집적 디바이스 |
AU2015300779B2 (en) | 2014-08-08 | 2021-03-04 | Quantum-Si Incorporated | Integrated device with external light source for probing, detecting, and analyzing molecules |
CA2961493C (en) | 2014-09-15 | 2023-10-03 | Board Of Regents, The University Of Texas System | Improved single molecule peptide sequencing |
US10150872B2 (en) | 2015-02-04 | 2018-12-11 | Pacific Biosciences Of California, Inc. | Multimeric protected fluorescent reagents |
WO2016164530A1 (en) | 2015-04-07 | 2016-10-13 | University Of Maryland, College Park | Compositions and methods for high throughput protein sequencing |
US10246742B2 (en) | 2015-05-20 | 2019-04-02 | Quantum-Si Incorporated | Pulsed laser and bioanalytic system |
WO2016193980A1 (en) | 2015-06-03 | 2016-12-08 | Bar Ilan University | Methods and kits for detection and quantification of large-scale post translational modifications of proteins |
US10125391B2 (en) | 2015-08-06 | 2018-11-13 | Pacific Biosciences Of California, Inc. | Single molecule nanoFET sequencing systems and methods |
WO2017063093A1 (en) | 2015-10-16 | 2017-04-20 | Andrew Emili | Protein sequencing methods and reagents |
CN108350491A (zh) | 2015-11-18 | 2018-07-31 | 加利福尼亚太平洋生物科学股份有限公司 | 将核酸加载到基材上 |
US10676788B2 (en) | 2015-11-20 | 2020-06-09 | Pacific Biosciences Of California, Inc. | Modified nucleotide reagents |
EP3452591B1 (en) | 2016-05-02 | 2023-08-16 | Encodia, Inc. | Macromolecule analysis employing nucleic acid encoding |
CA2967752A1 (en) | 2016-05-18 | 2017-11-18 | Bioinformatics Solutions Inc. | Methods and systems for assembly of protein sequences |
CN118853848A (zh) | 2016-08-31 | 2024-10-29 | 哈佛学院董事及会员团体 | 将生物分子的检测组合到使用荧光原位测序的单个试验的方法 |
JP7189874B2 (ja) | 2016-12-16 | 2022-12-14 | クアンタム-エスアイ インコーポレイテッド | 光カプラおよび導波路システム |
JP7050068B2 (ja) | 2016-12-16 | 2022-04-07 | クアンタム-エスアイ インコーポレイテッド | コンパクトなビーム成形およびステアリングアセンブリ |
EP4224530A1 (en) | 2016-12-22 | 2023-08-09 | Quantum-si Incorporated | Integrated photodetector with direct binning pixel |
US11072816B2 (en) | 2017-05-03 | 2021-07-27 | The Broad Institute, Inc. | Single-cell proteomic assay using aptamers |
AU2018261007B2 (en) | 2017-05-05 | 2024-09-26 | Quantum-Si Incorporated | Substrates having modified surface reactivity and antifouling properties in biological reactions |
KR102626317B1 (ko) | 2017-07-24 | 2024-01-18 | 퀀텀-에스아이 인코포레이티드 | 고강도 표지된 반응물 조성물 및 서열분석 방법 |
CA3069974A1 (en) | 2017-07-24 | 2019-01-31 | Quantum-Si Incorporated | Optical rejection photonic structures |
JP7418323B2 (ja) | 2017-08-24 | 2024-01-19 | ザ ユナイテッド ステイツ オブ アメリカ, アズ リプレゼンテッド バイ ザ セクレタリー, デパートメント オブ ヘルス アンド ヒューマン サービシーズ | 遠赤および近ir範囲におけるシアニンフルオロフォアの配座の束縛 |
US10592121B2 (en) | 2017-09-14 | 2020-03-17 | Samsung Electronics Co., Ltd. | Quasi-synchronous protocol for large bandwidth memory systems |
GB201715684D0 (en) | 2017-09-28 | 2017-11-15 | Univ Gent | Means and methods for single molecule peptide sequencing |
WO2019089846A1 (en) | 2017-10-31 | 2019-05-09 | Encodia, Inc. | Methods and compositions for polypeptide analysis |
US11513126B2 (en) | 2017-10-31 | 2022-11-29 | Encodia, Inc. | Kits for analysis using nucleic acid encoding and/or label |
US11841371B2 (en) | 2018-03-13 | 2023-12-12 | The Broad Institute, Inc. | Proteomics and spatial patterning using antenna networks |
CN112513269A (zh) | 2018-07-12 | 2021-03-16 | 德克萨斯大学系统董事会 | 通过寡核苷酸进行分子邻域检测 |
JP2021530549A (ja) | 2018-07-23 | 2021-11-11 | ボード オブ リージェンツ, ザ ユニバーシティ オブ テキサス システムBoard Of Regents, The University Of Texas System | タンパク質における翻訳後修飾の、単一分子配列決定による同定 |
EP3837553A1 (en) | 2018-08-17 | 2021-06-23 | Regeneron Pharmaceuticals, Inc. | Methods for de novo protein sequencing |
CA3117476A1 (en) | 2018-10-05 | 2020-04-09 | Board Of Regents, The University Of Texas System | Solid-phase n-terminal peptide capture and release |
US10836798B2 (en) | 2018-11-08 | 2020-11-17 | Government Of The United States Of America, As Represented By The Secretary Of Commerce | Amino acid-specific binder and selectively identifying an amino acid |
CN113287020A (zh) | 2018-11-15 | 2021-08-20 | 宽腾矽公司 | 用于蛋白质测序的方法及组合物 |
US11499979B2 (en) | 2019-01-08 | 2022-11-15 | Massachusetts Institute Of Technology | Single-molecule protein and peptide sequencing |
EP3914727A4 (en) | 2019-01-22 | 2022-11-30 | Singular Genomics Systems, Inc. | POLYNUCLEOTIDE BARCODES FOR MULTIPLEXED PROTEOMICS |
WO2020198080A1 (en) | 2019-03-22 | 2020-10-01 | Augmenta Bioworks, Inc. | Isolation of single cells and uses thereof |
GB201904697D0 (en) | 2019-04-03 | 2019-05-15 | Vib Vzw | Means and methods for single molecule peptide sequencing |
US20220214353A1 (en) | 2019-04-23 | 2022-07-07 | Encodia, Inc. | Methods for spatial analysis of proteins and related kits |
WO2020243643A1 (en) | 2019-05-31 | 2020-12-03 | President And Fellows Of Harvard College | Systems and methods for ms1-based mass identification including super-resolution techniques |
KR20220019778A (ko) | 2019-06-12 | 2022-02-17 | 퀀텀-에스아이 인코포레이티드 | 머신 학습을 이용한 단백질 식별을 위한 기법들 및 관련된 시스템들 및 방법들 |
US11346842B2 (en) | 2019-06-20 | 2022-05-31 | Massachusetts Institute Of Technology | Single molecule peptide sequencing methods |
AU2020346959B2 (en) | 2019-09-13 | 2024-05-09 | Google Llc | Methods and compositions for protein and peptide sequencing |
US20210148922A1 (en) | 2019-10-28 | 2021-05-20 | Quantum-Si Incorporated | Methods of single-polypeptide sequencing and reconstruction |
US20210139973A1 (en) | 2019-10-28 | 2021-05-13 | Quantum-Si Incorporated | Methods of single-cell polypeptide sequencing |
US20210147474A1 (en) | 2019-10-28 | 2021-05-20 | Quantum-Si Incorporated | Methods of preparing samples for multiplex polypeptide sequencing |
WO2021086901A1 (en) | 2019-10-28 | 2021-05-06 | Quantum-Si Incorporated | Methods of preparing an enriched sample for polypeptide sequencing |
GB201918108D0 (en) | 2019-12-10 | 2020-01-22 | Vib Vzw | Improved aminopeptiadases for single molecule peptide sequencing |
US20210354134A1 (en) | 2020-04-22 | 2021-11-18 | Quantum-Si Incorporated | Sample preparation for sequencing |
US20210396762A1 (en) | 2020-06-19 | 2021-12-23 | Encodia, Inc. | Methods for peptide analysis employing multi-component detection agent and related kits |
-
2021
- 2021-05-20 AU AU2021276522A patent/AU2021276522A1/en active Pending
- 2021-05-20 JP JP2022570635A patent/JP2023527764A/ja active Pending
- 2021-05-20 EP EP21736775.4A patent/EP4143579A2/en active Pending
- 2021-05-20 CN CN202180059615.XA patent/CN116134046A/zh active Pending
- 2021-05-20 CA CA3177375A patent/CA3177375A1/en active Pending
- 2021-05-20 WO PCT/US2021/033493 patent/WO2021236983A2/en active Application Filing
- 2021-05-20 KR KR1020227044454A patent/KR20230012052A/ko active Search and Examination
- 2021-05-20 US US17/326,247 patent/US12065466B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2021236983A3 (en) | 2021-12-30 |
US20210364527A1 (en) | 2021-11-25 |
AU2021276522A1 (en) | 2023-01-05 |
CA3177375A1 (en) | 2021-11-25 |
US12065466B2 (en) | 2024-08-20 |
EP4143579A2 (en) | 2023-03-08 |
CN116134046A (zh) | 2023-05-16 |
WO2021236983A2 (en) | 2021-11-25 |
KR20230012052A (ko) | 2023-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240272169A1 (en) | Methods and compositions for protein sequencing | |
JP2023527764A (ja) | タンパク質シーケンスのための方法及び組成物 | |
CA2839702C (en) | Identifying peptides at the single molecule level | |
CN114929887A (zh) | 单个多肽测序和重建的方法 | |
CN114929888A (zh) | 制备用于多重多肽测序的样品的方法、试剂盒和装置 | |
US20240344122A1 (en) | Methods of single-cell sequencing | |
US9914955B2 (en) | Genetically encoded FRET-based MMP-9 activity biosensor and use thereof | |
US20230221330A1 (en) | Labeled binding reagents and methods of use thereof | |
US20240272170A1 (en) | Compositions and methods for polypeptide analysis | |
WO2023245129A2 (en) | Directed protein evolution | |
CN118742811A (zh) | 用于多肽分析的组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240520 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240520 |