JP2020120682A

JP2020120682A - 核酸エンコーディングを使用した巨大分子解析

Info

Publication number: JP2020120682A
Application number: JP2020081385A
Authority: JP
Inventors: チーマーク; Mark Chee; ガンダーソンケビン; Kevin Gunderson; フィリップワイナーマイケル; Phillip Weiner Michael
Original assignee: Encodia Inc
Current assignee: Encodia Inc
Priority date: 2016-05-02
Filing date: 2020-05-01
Publication date: 2020-08-13
Anticipated expiration: 2037-05-02
Also published as: US12123878B2; KR20220038549A; WO2017192633A1; US20240302381A1; KR20190035613A; JP2019523635A; US11959922B2; DK3452591T3; US20210302431A1; KR102516168B1; US12019077B2; WO2017192633A9; JP7097627B2; SG11201809649WA; NZ747941A; JP2022065157A; CN110199019B; JP2022126865A; AU2017259794B2; EP3452591A1

Abstract

【課題】核酸エンコーディングを使用した巨大分子解析を提供すること。【解決手段】ペプチド、ポリペプチド、およびタンパク質を含めた巨大分子を、核酸エンコーディングを使用して解析するための方法が開示される。タンパク質配列決定および／または解析に適用される巨大分子配列決定および／または解析に関する改善された技法、ならびに、それを実現するための製品、方法およびキットが当技術分野において依然として必要とされている。高度に並行化された、正確な、感度の高い、かつハイスループットなプロテオミクス技術が必要とされている。本開示は、これらおよび他の必要性を満たすものである。【選択図】なし

Description

配列表に関する記述
本出願に付随する配列表は、紙コピーの代わりにテキスト形式で提供され、また、これによって参照により本明細書に組み込まれる。配列表を含むテキストファイルの名称は、７６０２２９＿４０１ＷＯ＿ＳＥＱＵＥＮＣＥ＿ＬＩＳＴＩＮＧ．ｔｘｔである。テキストファイルは、３８．７ＫＢであり、２０１７年５月２日に作成され、ＥＦＳ−Ｗｅｂを介して電子的に提出される。

本開示は、一般に、分子認識事象のバーコーディングおよび核酸エンコーディングを使用した、ペプチド、ポリペプチド、およびタンパク質を含めた巨大分子の解析に関する。

タンパク質は、多くの異なる生物学的機能を実行および促進し、細胞生物学および生理学において不可欠な役割を果たす。異なるタンパク質分子のレパートリーは広範囲にわたり、翻訳後修飾（ＰＴＭ）によって導入される追加的な多様性に起因して、トランスクリプトームよりもはるかに複雑である。さらに、細胞内のタンパク質は、環境、生理的状況、および病態に応答して動的に変化する（発現レベルおよび修飾の状態）。したがって、タンパク質は、特にゲノム情報と比べて、莫大な量のほとんど明らかになっていない関連情報を含有する。一般に、プロテオミクス解析ではゲノミクス解析と比べて革新が遅れている。ゲノミクスの分野では、次世代シーケンシング（ＮＧＳ）により、数十億のＤＮＡ配列を単一の計器における実行で解析することが可能になることによって当該分野が変容しているが、一方で、タンパク質解析およびペプチド配列決定では、スループットが今でも限られている。

それにもかかわらず、このタンパク質情報は健康および疾患におけるプロテオームダイナミクスをよりよく理解するため、ならびに高精度の医療を可能にするのを補助するために直接必要である。そのように、このプロテオミクス情報の収集を小型化および高度に並行化するための「次世代」ツールの開発に大きな関心が寄せられている。

タンパク質の高度に並行な高分子特徴付けおよび認識は、いくつかの理由で困難である。親和性に基づくアッセイの使用は、多くの場合、いくつかの重要な難題に起因して難しい。１つの重要な難題は、親和性作用物質の集合の読み取りを同類の巨大分子の集合に多重化することである；別の難題は、親和性作用物質とオフターゲットの巨大分子との交差反応性を最小化することである；第３の難題は、効率的なハイスループットの読み取りプラットフォームを開発することである。この問題の例は、試料中のタンパク質の大多数または全てを識別および定量化することが１つの目標であるプロテオミクスにおいて生じる。さらに、タンパク質の種々の翻訳後修飾（ＰＴＭ）を単一分子レベルで特徴付けることが望ましい。現在、これは、ハイスループットなやり方で実現するのが大変な課題である。

タンパク質またはペプチド巨大分子の分子認識および特徴付けは、一般には、イムノアッセイを使用して実施される。ＥＬＩＳＡ、マルチプレックスＥＬＩＳＡ（例えば、スポッテッド抗体アレイ（ｓｐｏｔｔｅｄａｎｔｉｂｏｄｙａｒｒａｙ）、液体粒子ＥＬＩＳＡアレイ）、デジタルＥＬＩＳＡ（例えば、Ｑｕａｎｔｅｒｉｘ、Ｓｉｎｇｕｌｅｘ）、逆相タンパク質アレイ（ＲＰＰＡ）、および多くの他のものを含めた、多くの異なるイムノアッセイ形式が存在する。これらの異なるイムノアッセイプラットフォームは全て、高親和性かつ高度に特異的な（または選択的な）抗体（結合性物質）の開発、試料レベルおよび分析物レベルのどちらにおいても多重化能力が限られていること、感度およびダイナミックレンジが限られていること、ならびに交差反応性およびバックグラウンドシグナルを含めた、同様の難題に直面する。ペプチド配列決定（エドマン分解または質量分析）による直接タンパク質特徴付けなどの、結合性物質にとらわれない手法により有用な代替的手法がもたらされる。しかし、これらの手法はいずれも、極めて並行またはハイスループットなものではない。

エドマン分解に基づくペプチド配列決定は、１９５０年にＰｅｈｒＥｄｍａｎによって最初に提唱されたものであり、言い換えると、ペプチドのＮ末端アミノ酸の、一連の化学修飾による段階的分解および下流のＨＰＬＣ分析（後に質量分析による解析に置き換えられた）である。第１のステップにおいて、Ｎ末端アミノ酸を穏やかな塩基性条件下（ＮＭＰ／メタノール／Ｈ_２Ｏ）でフェニルイソチオシアネート（ＰＩＴＣ）を用いて修飾してフェニルチオカルバモイル（ＰＴＣ）誘導体を形成させる。第２のステップでは、ＰＴＣで修飾されたアミノ基を酸（無水ＴＦＡ）で処理して、切断された環状ＡＴＺ（２−アニリノ−５（４）−チアゾリノン（ｔｈｉｏｚｏｌｉｎｏｎｅ）修飾アミノ酸を創出し、新しいＮ末端をペプチド上に残す。切断された環状ＡＴＺアミノ酸をＰＴＨアミノ酸誘導体に変換し、逆相ＨＰＬＣによって分析する。このプロセスを、ペプチド配列を構成するアミノ酸の全てまたは部分的な数がＮ末端から除去され識別されるまで反復的に継続する。一般に、エドマン分解ペプチド配列決定は、時間がかかり、１日当たりほんの数ペプチドとスループットが限られている。

ここ１０〜１５年で、ＭＡＬＤＩ、エレクトロスプレー質量分析（ＭＳ）、およびＬＣ−ＭＳ／ＭＳを使用したペプチド解析が大きくエドマン分解に取って代わっている。ＭＳ器械使用（Ｒｉｌｅｙら、２０１６年、ＣｅｌｌＳｙｓｔ、２巻：１４２〜１４３頁）における最近の進歩にもかかわらず、ＭＳにはなお、計器費用が高いこと、洗練された使用者が求められること、数量化能力が不十分であること、およびプロテオームのダイナミックレンジにわたって測定を行う能力が限られていることを含めたいくつかの欠点がある。例えば、タンパク質は異なる効率レベルでイオン化するので、試料間の絶対的な定量化およびさらには相対的な定量化も困難である。質量タグの実装が相対的な定量化の改善に役立っているが、プロテオームの標識が必要になる。試料中のタンパク質の濃度が非常に大きな範囲にわたって（血漿に関しては１０桁にわたって）変動し得るダイナミックレンジがさらなる複雑化の要因である。一般には、ＭＳではより豊富な種のみが分析され、豊富さが低いタンパク質の特徴付けは困難になる。最後に、試料スループットは、一般には、実行当たり数千ペプチドに限られ、データ非依存性解析（ＤＩＡ）に関して、このスループットは真のボトムアップ式のハイスループットなプロテオーム解析には不十分である。さらに、各試料について記録された何千もの複雑なＭＳスペクトルをデコンボリューションするために著しいコンピュータ処理の必要性がある。

Ｒｉｌｅｙら、２０１６年、ＣｅｌｌＳｙｓｔ、２巻：１４２〜１４３頁

したがって、タンパク質配列決定および／または解析に適用される巨大分子配列決定および／または解析に関する改善された技法、ならびに、それを実現するための製品、方法およびキットが当技術分野において依然として必要とされている。高度に並行化された、正確な、感度の高い、かつハイスループットなプロテオミクス技術が必要とされている。本開示は、これらおよび他の必要性を満たすものである。

本発明のこれらおよび他の態様は、以下の詳細な説明を参照すれば明らかになろう。この目的のために、ある特定のバックグラウンド情報、手順、化合物および／または組成物がより詳細に記載されている種々の参考文献が本明細書に記載され、これらはそれぞれが、これによって全体が参照により組み込まれる。

本開示の複数の実施形態は、概して、高度に並行な、ハイスループットなデジタル巨大分子解析、特にペプチド解析の方法に関する。

第１の実施形態は、巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した巨大分子および付随する記録タグを用意するステップと；
（ｂ）前記巨大分子を、前記巨大分子に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記記録タグに移行させて、一次伸長記録タグを生成するステップと；
（ｄ）前記巨大分子を、前記巨大分子に結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｅ）前記第２のコーディングタグの情報を前記一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップと；
（ｆ）前記二次伸長記録タグを解析するステップと
を含む方法である。

第２の実施形態は、接触させるステップ（ｂ）および（ｄ）を逐次的に実施する、実施形態１に記載の方法である。

第３の実施形態は、接触させるステップ（ｂ）および（ｄ）を同時に実施する、実施形態１に記載の方法である。

第４の実施形態は、ステップ（ｅ）と（ｆ）の間に、
（ｘ）前記第２の結合性物質を、前記巨大分子に結合することが可能な第３の（またはより高次の）結合性物質であって、前記第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｄ）および（ｅ）を１回または複数回繰り返すステップと；
（ｙ）前記第３の（またはより高次の）コーディングタグの情報を前記第２の（またはより高次の）伸長記録タグに移行させて、第３の（またはより高次の）伸長記録タグを生成するステップと
をさらに含み、
ステップ（ｆ）において前記第３の（またはより高次の）伸長記録タグを解析する、実施形態１に記載の方法である。

第５の実施形態は、巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した巨大分子、付随する第１の記録タグおよび付随する第２の記録タグを用意するステップと；
（ｂ）前記巨大分子を、前記巨大分子に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記第１の記録タグに移行させて、第１の伸長記録タグを生成するステップと；
（ｄ）前記巨大分子を、前記巨大分子に結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｅ）前記第２のコーディングタグの情報を前記第２の記録タグに移行させて、第２の伸長記録タグを生成するステップと；
（ｆ）前記第１の伸長記録タグおよび第２の伸長記録タグを解析するステップと
を含む方法である。

第６の実施形態は、接触させるステップ（ｂ）および（ｄ）を逐次的に実施する、実施形態５に記載の方法である。

第７の実施形態は、接触させるステップ（ｂ）および（ｄ）を同時に実施する、実施形態５に記載の方法である。

第８の実施形態は、ステップ（ａ）が、前記固体支持体に接合した付随する第３の（またはより高次の）記録タグを用意するステップをさらに含む、実施形態５に記載の方法である。

第９の実施形態は、ステップ（ｅ）と（ｆ）の間に、
（ｘ）前記第２の結合性物質を、前記巨大分子に結合することが可能な第３の（またはより高次の）結合性物質であって、前記第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｄ）および（ｅ）を１回または複数回繰り返すステップと；
（ｙ）前記第３の（またはより高次の）コーディングタグの情報を前記第３の（またはより高次の）記録タグに移行させて、第３の（またはより高次の）伸長記録タグを生成するステップと
をさらに含み、
ステップ（ｆ）において前記第１の伸長記録タグ、前記第２の伸長記録タグおよび前記第３の（またはより高次の）伸長記録タグを解析する、実施形態８に記載の方法である。

第１０の実施形態は、前記第１のコーディングタグ、前記第２のコーディングタグ、および任意のより高次のコーディングタグが、結合サイクル特異的スペーサー配列を含む、実施形態５から９までのいずれか１つに記載の方法である。

第１１の実施形態は、ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）を化学薬剤で修飾するステップと；
（ｃ）前記ペプチドを、修飾された前記ＮＴＡＡに結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｄ）前記第１のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと；
（ｅ）前記伸長記録タグを解析するステップと
を含む方法である。

第１２の実施形態は、ステップ（ｃ）が、前記ペプチドを、前記第２の（またはより高次の）結合性物質に関する識別情報を有する第２の（またはより高次の）コーディングタグを含む第２の（またはより高次の）結合性物質であって、ステップ（ｂ）の前記修飾されたＮＴＡＡ以外の修飾されたＮＴＡＡに結合することが可能である第２の（またはより高次の）結合性物質と接触させることをさらに含む、実施形態１１に記載の方法である。

第１３の実施形態は、前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触後に逐次的に行う、第１２の実施形態に記載の方法である。

第１４の実施形態は、前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触と同時に行う、第１２の実施形態に記載の方法である。

第１５の実施形態は、前記化学薬剤が、イソチオシアネート誘導体、２，４−ジニトロベンゼンスルホン酸（ｄｉｎｉｔｒｏｂｅｎｚｅｎｅｓｕｌｆｏｎｉｃ）（ＤＮＢＳ）、４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）１−フルオロ−２，４−ジニトロベンゼン、ダンシルクロリド、７−メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬である、実施形態１１から１４までのいずれか１つに記載の方法である。

第１６の実施形態は、ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）を化学薬剤で修飾して、修飾されたＮＴＡＡを得るステップと；
（ｃ）前記ペプチドを、前記修飾されたＮＴＡＡに結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｄ）前記第１のコーディングタグの情報を前記記録タグに移行させて、第１の伸長記録タグを生成するステップと；
（ｅ）前記修飾されたＮＴＡＡを除去して、新しいＮＴＡＡを露出させるステップと；
（ｆ）前記ペプチドの前記新しいＮＴＡＡを化学薬剤で修飾して、新しく修飾されたＮＴＡＡを得るステップと；
（ｇ）前記ペプチドを、前記新しく修飾されたＮＴＡＡに結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｈ）前記第２のコーディングタグの情報を前記第１の伸長記録タグに移行させて、第２の伸長記録タグを生成するステップと；
（ｉ）前記第２の伸長記録タグを解析するステップと
を含む方法である。

第１７の実施形態は、ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドを、前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと；
（ｄ）前記伸長記録タグを解析するステップと
を含む方法である。

第１８の実施形態では、ステップ（ｂ）が、前記ペプチドを、前記第２の（またはより高次の）結合性物質に関する識別情報を有する第２の（またはより高次の）コーディングタグを含む第２の（またはより高次の）結合性物質であって、前記ペプチドの前記ＮＴＡＡ以外のＮＴＡＡに結合することが可能な第２の（またはより高次の）結合性物質と接触させることをさらに含む、第１７の実施形態に記載の方法である。

第１９の実施形態は、前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触後に逐次的に行う、第１８の実施形態に記載の方法である。

第２０の実施形態は、前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触と同時に行う、第１８の実施形態に記載の方法である。

第２１の実施形態は、ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドを、前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記記録タグに移行させて、第１の伸長記録タグを生成するステップと；
（ｄ）前記ＮＴＡＡを除去して、前記ペプチドの新しいＮＴＡＡを露出させるステップと；
（ｅ）前記ペプチドを、前記新しいＮＴＡＡに結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｈ）前記第２のコーディングタグの情報を前記第１の伸長記録タグに移行させて、第２の伸長記録タグを生成するステップと；
（ｉ）前記第２の伸長記録タグを解析するステップと
を含む方法である。

第２２の実施形態は、前記巨大分子が、タンパク質、ポリペプチドまたはペプチドである、実施形態１から１０までのいずれか１つに記載の方法である。

第２３の実施形態は、前記巨大分子が、ペプチドである、実施形態１から１０までのいずれか１つに記載の方法である。

第２４の実施形態は、前記ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、実施形態１１から２３までのいずれか１つに記載の方法である。

第２５の実施形態は、前記巨大分子が、脂質、炭水化物、または大環状分子である、実施形態１から１０までのいずれか１つに記載の方法である。

第２６の実施形態は、前記記録タグが、ＤＮＡ分子、偽相補的塩基を有するＤＮＡ、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＰＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、実施形態１から２５までのいずれか１つに記載の方法である。

第２７の実施形態は、前記記録タグが、ユニバーサルプライミング部位を含む、実施形態１から２６までのいずれか１つに記載の方法である。

第２８の実施形態は、前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、実施形態２７に記載の方法である。

第２９の実施形態は、前記記録タグが、一意の分子識別子（ＵＭＩ）を含む、実施形態１から２８までに記載の方法である。

第３０の実施形態は、記録タグがバーコードを含む、第１〜第２９の実施形態のいずれか１つに記載の方法である。

第３１の実施形態は、前記記録タグが、その３’末端にスペーサーを含む、実施形態１から３０までのいずれか１つに記載の方法である。

第３２の実施形態は、前記巨大分子および前記付随する記録タグを、前記固体支持体に共有結合により接合させる、実施形態１から３１までのいずれか１つに記載の方法である。

第３３の実施形態は、前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、実施形態１から３２までのいずれか１つに記載の方法である。

第３４の実施形態は、前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、実施形態３３に記載の方法である。

第３５の実施形態は、複数の巨大分子および付随する記録タグを固体支持体に接合する、実施形態１から３４までのいずれか１つに記載の方法である。

第３６の実施形態は、前記複数の巨大分子の間に前記固体支持体上で平均距離＞５０ｎｍの間隔をあける、実施形態３５に記載の方法である。

第３７の実施形態は、前記結合性物質が、ポリペプチドまたはタンパク質である、実施形態１から３６までのいずれか１つに記載の方法である。

第３８の実施形態は、前記結合性物質が、改変アミノペプチダーゼ、改変アミノアシルｔＲＮＡ合成酵素、改変アンチカリン、または改変ＣｌｐＳである、実施形態３７に記載の方法である。

第３９の実施形態は、前記結合性物質が、巨大分子に選択的に結合することが可能である、実施形態１から３８までのいずれか１つに記載の方法である。

第４０の実施形態は、前記コーディングタグが、ＤＮＡ分子、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＰＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、実施形態１から３９までのいずれか１つに記載の方法である。

第４１の実施形態は、前記コーディングタグが、エンコーダー配列を含む、実施形態１から４０までのいずれか１つに記載の方法である。

第４２の実施形態は、前記コーディングタグが、スペーサー、結合サイクル特異的配列、一意の分子識別子、ユニバーサルプライミング部位、またはそれらの任意の組合せをさらに含む、実施形態１から４１までのいずれか１つに記載の方法である。

第４３の実施形態は、前記結合性物質と前記コーディングタグが、リンカーによって接合されている、実施形態１から４２までのいずれか１つに記載の方法である。

第４４の実施形態は、前記結合性物質と前記コーディングタグが、ＳｐｙＴａｇ／ＳｐｙＣａｔｃｈｅｒまたはＳｎｏｏｐＴａｇ／ＳｎｏｏｐＣａｔｃｈｅｒペプチド−タンパク質対によって接合されている、実施形態１から４２までに記載の方法である。

第４５の実施形態は、前記コーディングタグの情報の前記記録タグへの移行が、ＤＮＡリガーゼによって媒介される、実施形態１から４４までのいずれか１つに記載の方法である。

第４６の実施形態は、前記コーディングタグの情報の前記記録タグへの移行が、ＤＮＡポリメラーゼによって媒介される、実施形態１から４４までのいずれか１つに記載の方法である。

第４７の実施形態は、前記コーディングタグの情報の前記記録タグへの移行が、化学的ライゲーションによって媒介される、実施形態１から４４までのいずれか１つに記載の方法である。

第４８の実施形態は、前記伸長記録タグの解析が、核酸配列決定法を含む、実施形態１から４７までのいずれか１つに記載の方法である。

第４９の実施形態は、前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、実施形態４８に記載の方法である。

第５０の実施形態は、前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングである、実施形態４８に記載の方法である。

第５１の実施形態は、前記伸長記録タグを解析前に増幅する、実施形態１から５０までのいずれか１つに記載の方法である。

第５２の実施形態は、前記伸長記録タグに含有されるコーディングタグ情報の順序が、前記結合性物質による前記巨大分子への結合の順序に関する情報を提供する、実施形態１から５１までに記載の方法である。

第５３の実施形態は、前記伸長記録タグに含有される前記コーディングタグ情報の頻度が、前記結合性物質による前記巨大分子への結合の頻度に関する情報を提供する、実施形態１から５２までに記載の方法である。

第５４の実施形態は、複数の巨大分子を表す複数の伸長記録タグを並行して解析する、実施形態１から５３までに記載の方法である。

第５５の実施形態は、前記複数の巨大分子を表す複数の伸長記録タグを多重化アッセイで解析する、実施形態５４に記載の方法である。

第５６の実施形態は、前記複数の伸長記録タグが、解析前に標的濃縮アッセイを受ける、実施形態１から５５までのいずれか１つに記載の方法である。

第５７の実施形態は、前記複数の伸長記録タグが、解析前にサブトラクションアッセイを受ける、実施形態１から５６までのいずれか１つに記載の方法である。

第５８の実施形態は、前記複数の伸長記録タグが、極めて豊富な種を減少させるために解析前に正規化アッセイを受ける、実施形態１から５７までのいずれか１つに記載の方法である。

第５９の実施形態は、前記ＮＴＡＡを、改変アミノペプチダーゼ、改変アミノ酸ｔＲＮＡ合成酵素、穏やかなエドマン分解、エドマナーゼ（Ｅｄｍａｎａｓｅ）酵素、または無水ＴＦＡによって除去する、実施形態１から５８までのいずれか１つに記載の方法である。

第６０の実施形態は、少なくとも１つの結合性物質が末端アミノ酸残基に結合する、実施形態１から５９までのいずれか１つに記載の方法である。

第６１の実施形態は、少なくとも１つの結合性物質が翻訳後修飾されたアミノ酸に結合する、実施形態１から６０までのいずれか１つに記載の方法である。

第６２の実施形態は、複数のタンパク質複合体、タンパク質、またはポリペプチドを含む試料由来の１つまたは複数のペプチドを解析するための方法であって、

（ａ）前記試料中の前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、任意選択で固体支持体と接合した複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと；
（ｂ）前記複数のタンパク質複合体、タンパク質、および／またはポリペプチドを複数のペプチドに断片化するステップと；
（ｃ）前記複数のペプチドと前記複数のコンパートメントタグを、前記複数のペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きペプチドを生成するステップと；
（ｄ）前記コンパートメントタグ付きペプチドを前記複数のコンパートメントから収集するステップと；
（ｅ）１つまたは複数のコンパートメントタグ付きペプチドを、実施形態１から２１までおよび実施形態２６から６１までのいずれか１つに記載の方法に従って解析するステップと
を含む方法である。

第６３の実施形態は、前記コンパートメントがマイクロ流体液滴である、実施形態６２に記載の方法である。

第６４の実施形態は、前記コンパートメントがマイクロウェルである、実施形態６２に記載の方法である。

第６５の実施形態は、前記コンパートメントが、表面上の分離された領域である、実施形態６２に記載の方法である。

第６６の実施形態は、各コンパートメントが、平均して単一の細胞を含む、実施形態６２から６５までのいずれか１つに記載の方法である。

第６７の実施形態は、複数のタンパク質複合体、タンパク質、またはポリペプチドを含む試料由来の１つまたは複数のペプチドを解析するための方法であって、
（ａ）前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のユニバーサルＤＮＡタグで標識するステップと；
（ｂ）前記試料中の前記複数の標識されたタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと；
（ｃ）前記複数のタンパク質複合体、タンパク質、またはポリペプチドと前記複数のコンパートメントタグを、前記複数のタンパク質複合体、タンパク質、またはポリペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きタンパク質複合体、タンパク質またはポリペプチドを生成するステップと；
（ｄ）前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントから収集するステップと；
（ｅ）任意選択で前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドをコンパートメントタグ付きペプチドに断片化するステップと；
（ｆ）１つまたは複数のコンパートメントタグ付きペプチドを、実施形態１から２１までおよび実施形態２６から６１までのいずれか１つに記載の方法に従って解析するステップと
を含む方法である。

第６８の実施形態は、コンパートメントタグ情報を、ペプチドに付随する記録タグにプライマー伸長またはライゲーションによって移行させる、実施形態６２から６７までのいずれか１つに記載の方法である。

第６９の実施形態は、前記固体支持体がビーズを含む、実施形態６２から６８までのいずれか１つに記載の方法である。

第７０の実施形態は、前記ビーズが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、実施形態６９に記載の方法である。

第７１の実施形態は、前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、実施形態６２から７０までのいずれか１つに記載の方法である。

第７２の実施形態は、前記コンパートメントタグが、バーコードおよび任意選択でＵＭＩを含む、実施形態６２から７１までのいずれか１つに記載の方法である。

第７３の実施形態は、前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、前記複数のコンパートメントタグが接合したビーズを、スプリット・アンド・プール（ｓｐｌｉｔ−ａｎｄ−ｐｏｏｌ）合成によって形成する、実施形態７２に記載の方法である。

第７４の実施形態は、前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合したビーズを、個々の合成または固定化によって形成する、実施形態７２に記載の方法である。

第７５の実施形態は、前記コンパートメントタグが記録タグ内の成分であり、前記記録タグが任意選択でスペーサー、一意の分子識別子、ユニバーサルプライミング部位、またはそれらの任意の組合せをさらに含む、実施形態６２から７４までのいずれか１つに記載の方法である。

第７６の実施形態は、前記コンパートメントタグが、前記複数のタンパク質複合体、タンパク質、またはポリペプチドの内部アミノ酸またはＮ末端アミノ酸と反応することが可能な機能的部分をさらに含む、実施形態６２から７５までのいずれか１つに記載の方法である。

第７７の実施形態は、前記機能的部分がＮＨＳ基である、実施形態７６に記載の方法である。

第７８の実施形態は、前記機能的部分がアルデヒド基である、実施形態７６に記載の方法である。

第７９の実施形態は、前記複数のコンパートメントタグが、前記コンパートメントタグを前記コンパートメントに印刷、スポッティング、インク噴射すること、またはその組合せによって形成されたものである、実施形態６２から７８までのいずれか１つに記載の方法である。

第８０の実施形態は、前記コンパートメントタグが、ペプチドをさらに含む、実施形態６２から７９までのいずれか一項に記載の方法である。

第８１の実施形態は、前記コンパートメントタグペプチドが、タンパク質リガーゼ認識配列を含む、実施形態８０に記載の方法である。

第８２の実施形態は、前記タンパク質リガーゼが、ブテラーゼＩまたはそのホモログである、実施形態８１に記載の方法である。

第８３の実施形態は、前記複数のポリペプチドをプロテアーゼで断片化する、実施形態６２から８２までのいずれか一項に記載の方法である。

第８４の実施形態は、前記プロテアーゼがメタロプロテアーゼである、実施形態８３に記載の方法。

第８５の実施形態は、前記メタロプロテアーゼの活性が金属カチオンの光活性化放出によってモジュレートされる、実施形態８４に記載の方法である。

第８６の実施形態は、前記複数のポリペプチドを前記複数のコンパートメントに分配する前に１つまたは複数の豊富なタンパク質を前記試料からサブトラクションすることをさらに含む、実施形態６２から８５までのいずれか１つに記載の方法である。

第８７の実施形態は、前記複数のペプチドと前記コンパートメントタグを接合する前に前記コンパートメントタグを前記固体支持体から遊離させることをさらに含む、実施形態６２から８６までのいずれか１つに記載の方法である。

第８８の実施形態は、ステップ（ｄ）の後に、前記コンパートメントタグ付きペプチドを固体支持体に記録タグを伴って接合させることをさらに含む、実施形態６２に記載の方法である。

第８９の実施形態は、前記コンパートメントタグ付きペプチド上の前記コンパートメントタグの情報を前記付随する記録タグに移行させることをさらに含む、実施形態８８に記載の方法である。

第９０の実施形態は、ステップ（ｅ）の前に前記コンパートメントタグを前記コンパートメントタグ付きペプチドから除去することをさらに含む、実施形態８９に記載の方法である。

第９１の実施形態は、解析されるペプチドが由来する前記単一の細胞の同一性を前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、実施形態６２から９０までのいずれか１つに記載の方法である。

第９２の実施形態は、解析されるペプチドが由来する前記タンパク質またはタンパク質複合体の同一性を前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、実施形態６２から９０までのいずれか１つに記載の方法である。

第９３の実施形態は、複数の巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した複数の巨大分子および付随する記録タグを用意するステップと；
（ｂ）前記複数の巨大分子を、前記複数の巨大分子に結合することが可能な複数の結合性物質であって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングタグを含む複数の結合性物質と接触させるステップと；
（ｃ）（ｉ）前記巨大分子に付随する記録タグの情報を前記巨大分子に結合した前記結合性物質の前記コーディングタグに移行させて、伸長コーディングタグを生成するステップ；または（ｉｉ）巨大分子に付随する記録タグおよび前記巨大分子に結合した前記結合性物質のコーディングタグの情報をジタグ構築物に移行するステップと；
（ｄ）前記伸長コーディングタグまたはジタグ構築物を収集するステップと；
（ｅ）任意選択でステップ（ｂ）〜（ｄ）を１回または複数回の結合サイクルにわたって繰り返すステップと；
（ｆ）伸長コーディングタグまたはジタグ構築物の収集物を解析するステップと
を含む方法である。

第９４の実施形態は、前記巨大分子がタンパク質である、実施形態９３に記載の方法である。

第９５の実施形態は、前記巨大分子が、ペプチドである、実施形態９３に記載の方法である。

第９６の実施形態は、前記ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、実施形態９５に記載の方法である。

第９７の実施形態は、前記記録タグが、ＤＮＡ分子、ＲＮＡ分子、ＰＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、実施形態９３から９６までのいずれか１つに記載の方法である。

第９８の実施形態は、前記記録タグが、一意の分子識別子（ＵＭＩ）を含む、実施形態９３から９７までのいずれか１つに記載の方法である。

第９９の実施形態は、前記記録タグが、コンパートメントタグを含む、実施形態９３から９８までに記載の方法である。

第１００の実施形態は、前記記録タグが、ユニバーサルプライミング部位を含む、実施形態９３から９９までのいずれか１つに記載の方法である。

第１０１の実施形態は、前記記録タグが、その３’末端にスペーサーを含む、実施形態９３から１００までのいずれか１つに記載の方法である。

第１０２の実施形態は、前記記録タグの３’末端をブロッキングしてポリメラーゼによる前記記録タグの伸長を防止し、巨大分子に付随する記録タグおよび前記巨大分子に結合している前記結合性物質のコーディングタグの情報をジタグ構築物に移行させる、実施形態９３から１０１までのいずれか１つに記載の方法である。

第１０３の実施形態は、前記コーディングタグが、エンコーダー配列を含む、実施形態９３から１０２までのいずれか１つに記載の方法である。

第１０４の実施形態は、前記コーディングタグが、ＵＭＩを含む、実施形態９３から１０３までのいずれか１つに記載の方法である。

第１０５の実施形態は、前記コーディングタグが、ユニバーサルプライミング部位を含む、実施形態９３から１０４までのいずれか１つに記載の方法である。

第１０６の実施形態は、前記コーディングタグが、その３’末端にスペーサーを含む、実施形態９３から１０５までのいずれか１つに記載の方法である。

第１０７の実施形態は、前記コーディングタグが、結合サイクル特異的配列を含む、実施形態９３から１０６までのいずれか１つに記載の方法である。

第１０８の実施形態は、前記結合性物質と前記コーディングタグが、リンカーによって接合されている、実施形態９３から１０７までのいずれか１つに記載の方法である。

第１０９の実施形態は、前記記録タグの情報の前記コーディングタグへの移行が、プライマー伸長によってもたらされる、実施形態９３から１０８までのいずれか１つに記載の方法である。

第１１０の実施形態は、前記記録タグの情報の前記コーディングタグへの移行が、ライゲーションによってもたらされる、実施形態９３から１０８までのいずれか１つに記載の方法である。

第１１１の実施形態は、前記ジタグ構築物が、ギャップ充填、プライマー伸長、またはその両方によって生成される、実施形態９３から１０８までのいずれか１つに記載の方法である。

第１１２の実施形態は、前記ジタグ分子が、前記記録タグに由来するユニバーサルプライミング部位、前記記録タグに由来するコンパートメントタグ、前記記録タグに由来する一意の分子識別子、前記記録タグに由来する任意選択のスペーサー、前記コーディングタグに由来するエンコーダー配列、前記コーディングタグに由来する一意の分子識別子、前記コーディングタグに由来する任意選択のスペーサー、および前記コーディングタグに由来するユニバーサルプライミング部位を含む、実施形態９３から９７まで、１０７、１０８、および１１１のいずれか１つに記載の方法である。

第１１３の実施形態は、前記巨大分子および前記付随する記録タグを、前記固体支持体に共有結合により接合させる、実施形態９３から１１２までのいずれか１つに記載の方法である。

第１１４の実施形態は、前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、実施形態１１３に記載の方法である。

第１１５の実施形態は、前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、実施形態１１４に記載の方法である。

第１１６の実施形態は、前記結合性物質が、ポリペプチドまたはタンパク質である、実施形態９３から１１５までのいずれか１つに記載の方法である。

第１１７の実施形態は、前記結合性物質が、改変アミノペプチダーゼ、改変アミノアシルｔＲＮＡ合成酵素、改変アンチカリン、または抗体もしくはその結合性断片である、実施形態１１６に記載の方法である。

第１１８の実施形態は、前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、実施形態９５から１１７までのいずれか１つに記載の方法である。

第１１９の実施形態は、前記結合性物質が、Ｎ末端アミノ酸残基、Ｃ末端アミノ酸残基、または内部アミノ酸残基に結合する、実施形態１１８に記載の方法である。

第１２０の実施形態は、前記結合性物質が、Ｎ末端ペプチド、Ｃ末端ペプチド、または内部ペプチドに結合する、実施形態１１８に記載の方法である。

第１２１の実施形態は、前記結合性物質がＮ末端アミノ酸残基に結合し、前記Ｎ末端アミノ酸残基が各結合サイクル後に切断される、実施形態１１９に記載の方法である。

第１２２の実施形態は、前記結合性物質がＣ末端アミノ酸残基に結合し、前記Ｃ末端アミノ酸残基が各結合サイクル後に切断される、実施形態１１９に記載の方法である。

実施形態１２３．Ｎ末端アミノ酸残基がエドマン分解によって切断される、実施形態１２１に記載の方法。

実施形態１２４．前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、実施形態９３に記載の方法。

実施形態１２５．ステップ（ｂ）の後に、前記巨大分子および付随する結合性物質を含む複合体を前記固体支持体から解離させ、液滴またはマイクロ流体液滴のエマルジョン中に分配する、実施形態９３から１２４までのいずれか１つに記載の方法。

実施形態１２６．各マイクロ流体液滴が、平均して、前記巨大分子および前記結合性物質を含む複合体を１つ含む、実施形態１２５に記載の方法。

実施形態１２７．伸長コーディングタグまたはジタグ構築物を生成する前に前記記録タグを増幅する、実施形態１２５または１２６に記載の方法。

実施形態１２８．エマルジョン融合ＰＣＲを使用して、前記記録タグ情報を前記コーディングタグに移行させる、またはジタグ構築物の集団を創出する、実施形態１２５から１２７までのいずれか１つに記載の方法。

実施形態１２９．伸長コーディングタグまたはジタグ構築物の収集物を解析前に増幅させる、実施形態９３から１２８のいずれか１つに記載の方法。

実施形態１３０．伸長コーディングタグまたはジタグ構築物の収集物の解析が、核酸配列決定法を含む、実施形態９３から１２９までのいずれか１つに記載の方法。

実施形態１３１．前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、実施形態１３０に記載の方法。

実施形態１３２．前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングである、実施形態１３０に記載の方法。

実施形態１３３．前記巨大分子の部分的組成を、一意のコンパートメントタグおよび任意選択でＵＭＩを使用する複数の伸長コーディングタグまたはジタグ構築物の解析によって決定する、実施形態１３０に記載の方法。

実施形態１３４．前記解析ステップを、塩基当たりのエラー率が＞５％、＞１０％、＞１５％、＞２０％、＞２５％、または＞３０％である配列決定法を用いて実施する、実施形態１から１３３までのいずれか１つに記載の方法。

実施形態１３５．コーディングタグ、記録タグ、またはその両方の識別成分が、エラー訂正コードを含む、実施形態１から１３４までのいずれか１つに記載の方法。

実施形態１３６．前記識別成分が、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せから選択される、実施形態１３５に記載の方法。

実施形態１３７．前記エラー訂正コードが、Ｈａｍｍｉｎｇコード、Ｌｅｅ距離コード、非対称Ｌｅｅ距離コード、Ｒｅｅｄ−Ｓｏｌｏｍｏｎコード、およびＬｅｖｅｎｓｈｔｅｉｎ−Ｔｅｎｅｎｇｏｌｔｓコードから選択される、実施形態１３５または１３６に記載の方法。

実施形態１３８．コーディングタグ、記録タグ、またはその両方の識別成分が、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することが可能であり、前記解析ステップが、前記識別成分を識別するために前記一意の電流またはイオンフラックスまたは光学的シグネチャを検出することを含む、実施形態１から１３４までのいずれか１つに記載の方法。

実施形態１３９．前記識別成分が、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せから選択される、実施形態１３８に記載の方法。

実施形態１４０．複数の巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した複数の巨大分子および付随する記録タグを用意するステップと；
（ｂ）前記複数の巨大分子を、同類の巨大分子に結合することが可能な複数の結合性物質であって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングタグを含む複数の結合性物質と接触させるステップと；
（ｃ）第１の結合性物質の第１のコーディングタグの情報を第１の巨大分子に付随する第１の記録タグに移行させて、一次伸長記録タグを生成するステップであって、前記第１の結合性物質が前記第１の巨大分子に結合するステップと；
（ｄ）前記複数の巨大分子を、同類の巨大分子に結合することが可能な複数の結合性物質と接触させるステップと；
（ｅ）第２の結合性物質の第２のコーディングタグの情報を前記一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップであって、前記第２の結合性物質が前記第１の巨大分子に結合するステップと；
（ｆ）任意選択でステップ（ｄ）〜（ｅ）を「ｎ」回の結合サイクルにわたって繰り返すステップであって、前記第１の巨大分子に結合する各結合性物質の各コーディングタグの情報を前の結合サイクルで生成した伸長記録タグに移行させて、前記第１の巨大分子を表すｎ次伸長記録タグを生成するステップと；
（ｇ）前記ｎ次伸長記録タグを解析するステップと
を含む方法。

実施形態１４１．複数の巨大分子を表す複数のｎ次伸長記録タグを生成し、解析する、実施形態１４０に記載の方法。

実施形態１４２．前記巨大分子が、タンパク質である、実施形態１４０または１４１に記載の方法。

実施形態１４３．前記巨大分子が、ペプチドである、実施形態１４２に記載の方法。

実施形態１４４．前記ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、実施形態１４３に記載の方法。

実施形態１４５．前記複数の巨大分子が、多数のプールされた試料由来の巨大分子を含む、実施形態１４０から１４４までのいずれか１つに記載の方法。

実施形態１４６．前記記録タグが、ＤＮＡ分子、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＰＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、実施形態１４０から１４５までのいずれか１つに記載の方法。

実施形態１４７．前記記録タグが、一意の分子識別子（ＵＭＩ）を含む、実施形態１４０から１４６までに記載の方法。

実施形態１４８．前記記録タグが、コンパートメントタグを含む、実施形態１４０から１４７までに記載の方法。

実施形態１４９．前記記録タグが、ユニバーサルプライミング部位を含む、実施形態１４０から１４８までのいずれか１つに記載の方法。

実施形態１５０．前記記録タグが、その３’末端にスペーサーを含む、実施形態１４０から１４９までのいずれか１つに記載の方法。

実施形態１５１．前記コーディングタグが、エンコーダー配列を含む、実施形態１４０から１５０までのいずれか１つに記載の方法。

実施形態１５２．前記コーディングタグが、ＵＭＩを含む、実施形態１４０から１５１までのいずれか１つに記載の方法。

実施形態１５３．前記コーディングタグが、ユニバーサルプライミング部位を含む、実施形態１４０から１５２までのいずれか１つに記載の方法。

実施形態１５４．前記コーディングタグが、その３’末端にスペーサーを含む、実施形態１４０から１５３までのいずれか１つに記載の方法。

実施形態１５５．前記コーディングタグが、結合サイクル特異的配列を含む、実施形態１４０から１５４までのいずれか１つに記載の方法。

実施形態１５６．前記コーディングタグが、一意の分子識別子を含む、実施形態１４０から１５５までのいずれか１つに記載の方法。

実施形態１５７．前記結合性物質と前記コーディングタグが、リンカーによって接合されている、実施形態１４０から１５６までのいずれか１つに記載の方法。

実施形態１５８．前記記録タグの情報の前記コーディングタグへの移行が、プライマー伸長によって媒介される、実施形態１４０から１５７までのいずれか１つに記載の方法。

実施形態１５９．前記記録タグの情報の前記コーディングタグへの移行が、ライゲーションによって媒介される、実施形態１４０から１５８までのいずれか１つに記載の方法。

実施形態１６０．前記複数の巨大分子、前記付随する記録タグ、またはその両方が、前記固体支持体に共有結合により接合している、実施形態１４０から１５９までのいずれか１つに記載の方法。

実施形態１６１．前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、実施形態１４０から１６０までのいずれか１つに記載の方法。

実施形態１６２．前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、実施形態１６１に記載の方法。

実施形態１６３．前記結合性物質が、ポリペプチドまたはタンパク質である、実施形態１４０から１６２までのいずれか１つに記載の方法。

実施形態１６４．前記結合性物質が、改変アミノペプチダーゼ、改変アミノアシルｔＲＮＡ合成酵素、改変アンチカリン、または抗体もしくはその結合性断片である、実施形態１６３に記載の方法。

実施形態１６５．前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、実施形態１４２から１６４までのいずれか１つに記載の方法。

実施形態１６６．前記結合性物質が、Ｎ末端アミノ酸残基、Ｃ末端アミノ酸残基、または内部アミノ酸残基に結合する、実施形態１６５に記載の方法。

実施形態１６７．前記結合性物質が、Ｎ末端ペプチド、Ｃ末端ペプチド、または内部ペプチドに結合する、実施形態１６５に記載の方法。

実施形態１６８．前記結合性物質が、修飾されたＮ末端アミノ酸残基、修飾されたＣ末端アミノ酸残基、または修飾された内部アミノ酸残基の化学標識に結合する、実施形態１４２から１６４までのいずれか１つに記載の方法。

実施形態１６９．前記結合性物質がＮ末端アミノ酸残基または前記修飾されたＮ末端アミノ酸残基の化学標識に結合し、前記Ｎ末端アミノ酸残基が各結合サイクル後に切断される、実施形態１６６または１６８に記載の方法。

実施形態１７０．前記結合性物質がＣ末端アミノ酸残基または前記修飾されたＣ末端アミノ酸残基に化学標識に結合し、前記Ｃ末端アミノ酸残基が各結合サイクル後に切断される、実施形態１６６または１６８に記載の方法。

実施形態１７１．前記Ｎ末端アミノ酸残基が、エドマン分解、エドマナーゼ、改変アミノペプチダーゼ、または改変アシルペプチドヒドロラーゼによって切断される、実施形態１６９に記載の方法。

実施形態１７２．前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、実施形態１６３に記載の方法。

実施形態１７３．前記複数のｎ次伸長記録タグを解析前に増幅させる、実施形態１４０から１７２までのいずれか１つに記載の方法。

実施形態１７４．前記ｎ次伸長記録タグの解析が、核酸配列決定法を含む、実施形態１４０から１７３までのいずれか１つに記載の方法。

実施形態１７５．複数の巨大分子を表す複数のｎ次伸長記録タグを並行して解析する、実施形態１７４に記載の方法。

実施形態１７６．前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、実施形態１７４または１７５に記載の方法。

実施形態１７７．前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングである、実施形態１７４または１７５に記載の方法。

添付の図面を参照して、本発明の非限定的な実施形態を例として説明する。図面は模式的であり、正確な縮尺は意図されていない。例示が目的であるため、すべての構成要素がすべて図面で標記されているとは限らず、また、当業者による本発明の理解に例示が必要とされない場合は、本発明の各実施形態のすべての構成要素が示されているとも限らない。

図１Ａは、図面に示されている機能的エレメントの凡例を示す。図１Ｂは、タンパク質コードをＤＮＡコードへと転換するための基本的概要を示す。この転換では、複数のタンパク質またはポリペプチドが複数のペプチドに断片化され、それらがその後複数のペプチドを表わす伸長記録タグのライブラリーへと変換される。伸長記録タグは、ペプチド配列を表わすＤＮＡコード付きライブラリーを構成する。ライブラリーは、適切に修飾して、任意の次世代シーケンシング（ＮＧＳ）プラットフォームで配列決定することができる。同上。

図２Ａ〜２Ｄは、単一のまたは複数の記録タグと共局在化または共標識されている固定化タンパク質と相互作用するコーディングタグを含む結合性物質（例えば、抗体、アンチカリン、Ｎ−レコグニンタンパク質（Ｎ−ｒｅｃｏｇｎｉｎｓｐｒｏｔｅｉｎ）（例えば、ＡＴＰ依存性Ｃｌｐプロテアーゼアダプタータンパク質（ＣｌｐＳ）、アプタマーなど、およびそれらの変異体／ホモログ）の複数のサイクルを使用する、本明細書で開示されている方法によるタンパク質巨大分子解析の例を示す。記録タグは、ユニバーサルプライミング部位、バーコード（例えば、分配バーコード、コンパートメントバーコード、画分バーコード）、任意選択の一意の分子識別子（ＵＭＩ）配列、およびコーディングタグの情報移行に使用されるスペーサー配列（Ｓｐ）で構成される。スペーサー配列（Ｓｐ）は、すべての結合サイクルにわたって一定であってもよく、結合性物質特異的であってもよく、または結合サイクル数特異的であってもよい。コーディングタグは、結合性物質の識別情報を提供するエンコーダー配列、任意選択のＵＭＩ、および記録タグの相補的スペーサー配列にハイブリダイズし、コーディングタグ情報の記録タグへの移行（例えば、プライマー伸長、本明細書ではポリメラーゼ伸長とも呼ばれる）を容易にするスペーサー配列で構成されている。図２Ａは、同種結合性物質とタンパク質とのサイクル結合により伸長記録タグを創出するプロセス、および結合性物質のコーディングタグからタンパク質の記録タグへの対応する情報移行を示す。一連の連続した結合およびコーディングタグ情報移行ステップの後、結合性物質（例えば、抗体１（Ａｂ１）、抗体２（Ａｂ２）、抗体３（Ａｂ３）、．．．抗体「ｎ」（Ａｂｎ））の識別情報を提供する、「ｎ」結合サイクルからのエンコーダー配列を含む結合性物質コーディングタグ情報、記録タグに由来するバーコード／任意選択のＵＭＩ、結合性物質のコーディングタグに由来する任意選択のＵＭＩ配列、ならびに増幅およびデジタル次世代シーケンシングによる解析を容易にするための、ライブラリー構築物の各末端にある隣接ユニバーサルプライミング配列を含む最終伸長記録タグが産生される。図２Ｂは、ＤＮＡバーコード付き記録タグでタンパク質を標識するためのスキームの例を示す。上段パネルでは、Ｎ−ヒドロキシスクシンイミド（ＮＨＳ）は、アミン反応性カップリング剤であり、ジベンゾシクロオクチル（ＤＢＣＯ）は、固形基材の表面への「クリック」カップリングに有用な歪みアルキンである。このスキームでは、記録タグは、タンパク質のリシン（Ｋ）残基（および任意選択でＮ末端アミノ酸）のεアミンに、ＮＨＳ部分を介してカップリングされる。下段パネルでは、ヘテロ二機能性リンカーであるＮＨＳアルキンを使用して、リシン（Ｋ）残基のεアミンを標識し、アルキン「クリック」部分を創出する。その後、アジド標識ＤＮＡ記録タグを、標準的クリック化学によりこれら反応性アルキン基に容易に付着させることができる。さらに、ＤＮＡ記録タグは、逆ｉＥＤＤＡ反応によりＴＣＯ誘導体化配列決定基材と下流でカップリングするための直交性メチルテトラジン（ｍＴｅｔ）部分を用いて設計することができる。図２Ｃは、記録タグを使用したタンパク質解析法の２つの例を示す。上段パネルでは、タンパク質巨大分子は、捕捉剤により固体支持体に固定化されており、任意選択で架橋されている。タンパク質または捕捉剤はいずれも、記録タグで標識されていてもよい。下段パネルでは、付随する記録タグを有するタンパク質は、固体支持体に直接固定化されている。図２Ｄは、同種結合物質のＤＮＡコード化、および得られた伸長記録タグの配列決定を使用した単純なタンパク質イムノアッセイの全体的なワークフローの例を示す。タンパク質は、記録タグによりバーコード化（つまりインデックス化）し、サイクル結合解析前にプールすることができ、試料スループットおよび結合試薬節約が大幅に増加される試料であってもよい。この手法は、逆相タンパク質アッセイ（ＲＰＰＡ）を実施するための、有効なデジタル式のより単純でより大規模化可能な手法である。同上。同上。同上。

図３Ａ〜３Ｄは、ペプチド配列を表わすＤＮＡ伸長記録タグを構築することによる、分解に基づくペプチド配列決定のプロセスを示す。これは、Ｎ末端アミノ酸（ＮＴＡＡ）結合、ペプチドに付着している記録タグへのコーディングタグ情報の移行、ＮＴＡＡ切断のサイクルプロセスを使用し、このプロセスをすべて固体支持体でサイクル様式で繰り返すエドマン分解様手法により達成される。ペプチドのＮ末端分解に由来する伸長記録タグの例示的な構築の概要が提供されている：（Ａ）ペプチドのＮ末端アミノ酸を標識する（例えば、フェニルチオカルバモイル（ＰＴＣ）、ジニトロフェニル（ＤＮＰ）、スルホニルニトロフェニル（ＳＮＰ）、アセチル、またはグアニジンジル（ｇｕａｎｉｄｉｎｄｙｌ）部分で）；（Ｂ）は、標識ＮＴＡＡに結合された結合性物質および付随するコーディングタグを示す；（Ｃ）は、固体支持体（例えば、ビーズ）に結合され、記録タグに（例えば、三機能性リンカーを介して）付随するペプチドを示し、結合性物質がペプチドのＮＴＡＡに結合すると、コーディングタグの情報が記録タグに移行され（例えば、プライマー伸長により）、伸長記録タグが生成される；（Ｄ）標識ＮＴＡＡを、化学的または酵素的な手段により切断して、新しいＮＴＡＡを露出させる。矢印により示されているように、このサイクルを「ｎ」回繰り返して、最終伸長記録タグを生成する。最終伸長記録タグは、任意選択で、下流の増幅およびＤＮＡ配列決定を容易にするために、ユニバーサルプライミング部位により隣接されている。フォワードユニバーサルプライミング部位（例えば、ＩｌｌｕｍｉｎａのＰ５−Ｓ１配列）は、元の記録タグ設計の一部であってもよく、リバースユニバーサルプライミング部位（例えば、ＩｌｌｕｍｉｎａのＰ７−Ｓ２’配列）は、記録タグの伸長の最終ステップとして添加してもよい。この最終ステップは、結合性物質とは独立して実施してもよい。

図４Ａ〜４Ｂは、本明細書で開示されている方法による例示的なタンパク質配列決定ワークフローを示す。図４Ａは、例示的なワークフローを示し、代替モードが明灰色の破線で概説されており、四角の中に示されている特定の実施形態が矢印で関連付けられている。ワークフローの各ステップの代替モードが、矢印下方の四角の中に示されている。図４Ｂは、サイクル結合およびコーディングタグ情報移行ステップを実施する際の、情報移行の効率を向上させるための選択肢を示す。１分子当たり複数の記録タグを用いることができる。さらに、所与の結合事象毎に、コーディングタグ情報の記録タグへの移行を複数回実施してもよく、またはその代わりに表面増幅ステップを用いて、伸長記録タグライブラリーなどのコピーを創出してもよい。同上。

図５Ａ〜５Ｂは、プライマー伸長を使用して、結合性物質のコーディングタグの識別情報を、巨大分子（例えば、ペプチド）に付随する記録タグへと移行して伸長記録タグを生成するための伸長記録タグの例示的な構築の概要を示す。結合性物質に関する識別情報を有する一意のエンコーダー配列を含むコーディングタグは各末端が、任意選択で、共通スペーサー配列（Ｓｐ’）により隣接されている。図５Ａは、ビーズに連結されている記録タグ標識ペプチドのＮＴＡＡに結合するコーディングタグを含むＮＴＡＡ結合性物質を示す。記録タグは、相補的スペーサー配列（Ｓｐ）を介してコーディングタグにアニーリングし、プライマー伸長反応は、スペーサー（Ｓｐ）をプライミング部位として使用したコーディングタグ情報の記録タグへの移行を媒介する。コーディングタグは、結合性物質から遠位にある末端での一本鎖スペーサー（Ｓｐ’）配列との二本鎖として示されている。この構成は、記録タグの内部部位へのコーディングタグのハイブリダイゼーションを最小限に抑え、記録タグの末端スペーサー（Ｓｐ）配列と、コーディングタグの一本鎖スペーサー突出（Ｓｐ’）とのハイブリダイゼーションに有利に働く。さらに、伸長記録タグは、コーディングタグと内部記録タグ配列エレメントとのハイブリダイゼーションを阻止するために、オリゴヌクレオチド（エンコーダー、スペーサー配列に相補的な）と事前にアニーリングされていてもよい。図５Ｂは、結合、およびコーディングタグ情報の移行、およびユニバーサルプライミング部位の３’末端への付加の「ｎ」回のサイクル後に産生された最終伸長記録タグを示す（「^＊＊＊」は、伸長記録タグに示されていないその間の結合サイクルを表わす）。

図６は、コーディングタグ情報が、酵素的ライゲーションにより伸長記録タグへと移行されることを示す。それぞれの記録タグを有する２つの異なる巨大分子が示されており、記録タグ伸長は並行して進行する。ライゲーションは、スペーサー配列（Ｓｐ）が、記録タグの相補的スペーサー（Ｓｐ’）とアニーリングする「粘着末端」突出を有するように、二本鎖コーディングタグを設計することにより容易になり得る。二本鎖コーディングタグの相補鎖は、情報を記録タグへと移行させる。ライゲーションを使用して記録タグを伸長させる場合、伸長の方向は、示されているように、５’から３’へであってもよく、または任意選択で３’から５’へであってもよい。

図７は、スペーサー配列を伸長記録タグに挿入せずに、記録タグまたは伸長記録タグの３’ヌクレオチドを、コーディングタグ（またはその相補体）の５’ヌクレオチドと連結させる化学的ライゲーションにより、コーディングタグ情報を記録タグへと移行させる、「無スペーサー」手法を示す。また、伸長記録タグおよびコーディングタグの向きを逆にして、記録タグの５’末端が、コーディングタグ（または相補体）の３’末端にライゲーションされるようにしてもよい。示されている例では、記録タグの相補的「ヘルパー」オリゴヌクレオチド配列（「記録ヘルパー」）とコーディングタグとのハイブリダイゼーションを使用して、複合体を安定させ、記録タグのコーディングタグ相補鎖への特異的な化学的ライゲーションを可能にさせる。得られた伸長記録タグは、スペーサー配列を欠いている。また、ＤＮＡ、ＰＮＡ、または類似の核酸ポリマーを用いることができる「クリック化学」型の化学的ライゲーション（例えば、アジドおよびアルキン部分（３本線記号として示されている）が使用される）が示されている。

図８Ａ〜８Ｂは、Ｎ末端アミノ酸分解の前に、ペプチドの翻訳後修飾（ＰＴＭ）情報を伸長記録タグに書き込むための例示的な方法を示す。図８Ａ：結合性物質に関する識別情報を有するコーディングタグを含む結合性物質（例えば、ホスホチロシン抗体の識別情報を有するコーディングタグを含むホスホチロシン抗体）を、ペプチドに結合することが可能である。ホスホチロシンが、図示されているように記録タグ標識ペプチドに存在する場合、ホスホチロシン抗体がホスホチロシンに結合すると、コーディングタグおよび記録タグが、相補的スペーサー配列を介してアニーリングし、コーディングタグ情報が記録タグに移行され、伸長記録タグが生成される。図８Ｂ：伸長記録タグは、一次アミノ酸配列（例えば、「ａａ_１」、「ａａ_２」、「ａａ_３」、．．．、「ａａ_Ｎ」）およびペプチドの翻訳後修飾（例えば、「ＰＴＭ_１」、「ＰＴＭ_２」）の両方のコーディングタグ情報を含んでいてもよい。

図９Ａ〜９Ｂは、結合性物質を巨大分子に結合させ、結合性物質に付着しているコーディングタグの情報を、固体支持体（例えば、ビーズ）に付着している単一の巨大分子の部位に共局在化されている複数の記録タグ中の個々の記録タグへと移行させ、それにより巨大分子を集合的に表す複数の伸長記録タグを生成する複数サイクルのプロセスを示す。この図では、例示のために過ぎないが、巨大分子は、ペプチドであり、各サイクルは、結合性物質を、Ｎ末端アミノ酸（ＮＴＡＡ）に結合させること、コーディングタグ情報を記録タグに移行させることにより結合事象を記録すること、その後そのＮＴＡＡを除去して、新しいＮＴＡＡを露出させることを含む。図９Ａは、巨大分子と共に固体支持体に共局在化されている複数の記録タグ（ユニバーサルフォワードプライミング配列およびＵＭＩを含む）を示す。個々の記録タグは、伸長反応をプライムして、コーディングタグ情報を記録タグへと移行するために使用することができる、結合性物質のコーディングタグ内の共通スペーサー配列に相補的な共通スペーサー配列（Ｓｐ）を有する。図９Ｂは、各連続サイクルの結合に使用されるサイクル特異的ＮＴＡＡ結合性物質の様々なプールを示し、各プールは、サイクル特異的スペーサー配列を有する。

図１０Ａ〜１０Ｃは、結合性物質に付着しているコーディングタグの情報を、固体支持体（例えば、ビーズ）に付着している単一の巨大分子の部位に共局在化されている複数の記録タグのうちの記録タグへと移行させ、それにより巨大分子を集合的に表す複数の伸長記録タグを生成する複数のサイクルを含む例示的モードを示す。この図では、例示のために過ぎないが、巨大分子は、ペプチドであり、プロセスの各ラウンドは、ＮＴＡＡと結合させること、結合事象を記録すること、その後そのＮＴＡＡを除去して、新しいＮＴＡＡを露出させることを含む。図１０Ａは、好ましくは１ビーズ当たり単一分子の巨大分子と共に固体支持体に共局在化された複数の記録タグ（ユニバーサルフォワードプライミング配列およびＵＭＩを含む）を示す。個々の記録タグは、異なる「サイクル特異的」配列（例えば、Ｃ_１、Ｃ_２、Ｃ_３、．．．Ｃ_ｎ）を有する異なるスペーサー配列を３’末端に有する。好ましくは、各ビーズの記録タグは、同じＵＭＩ配列を共有する。第１のサイクルの結合（サイクル１）では、複数のＮＴＡＡ結合性物質を巨大分子と接触させる。サイクル１で使用される結合性物質は、記録タグのサイクル１Ｃ_１スペーサー配列に相補的な共通５’スペーサー配列（Ｃ’１）を有する。また、サイクル１で使用される結合性物質は、サイクル２スペーサーＣ_２に相補的な３’スペーサー配列（Ｃ’_２）を有する。結合サイクル１中、第１のＮＴＡＡ結合性物質は、巨大分子の遊離Ｎ末端に結合し、第１のコーディングタグの情報が、相補的Ｃ’_１スペーサー配列にハイブリダイズされたＣ_１配列から、プライマー伸長により、同種記録タグに移行される。ＮＴＡＡを除去して、新しいＮＴＡＡを露出させた後、結合サイクル２は、サイクル１結合性物質の３’スペーサー配列と同一であるサイクル２５’スペーサー配列（Ｃ’_２）および共通のサイクル３３’スペーサー配列（Ｃ’_３）を有する複数のＮＴＡＡ結合性物質を、巨大分子と接触させる。第２のＮＴＡＡ結合性物質は、巨大分子のＮＴＡＡと結合し、第２のコーディングタグの情報が、プライマー伸長により、相補的なＣ_２およびＣ’_２スペーサー配列から同種記録タグへと移行される。これらのサイクルを、最大「ｎ」結合サイクル繰り返し、最後の伸長記録タグを、ユニバーサルリバースプライミング配列でキャッピングし、単一の巨大分子と共局在化されている複数の伸長記録タグを生成し、各伸長記録タグは、１結合サイクルに由来するコーディングタグ情報を有する。各連続結合サイクルで使用される各セットの結合性物質は、コーディングタグにサイクル特異的スペーサー配列を有するため、結合サイクル情報を、得られる伸長記録タグの結合性物質情報と関連付けることができる。図１０Ｂは、結合の各連続サイクルに使用されるサイクル特異的結合性物質の様々なプールを示し、各プールは、サイクル特異的スペーサー配列を有する。図１０Ｃは、サイクル特異的スペーサー配列を使用し、伸長記録タグのＰＣＲアセンブリに基づいて、巨大分子の部位に共局在化されている伸長記録タグのコレクションを逐次的に組み立て、それにより巨大分子の順序付けられた配列を提供することができる方法を示す。好ましいモードでは、鎖状体形成前に、増幅により各伸長記録タグの複数のコピーを生成する。

図１１Ａ〜１１Ｂは、記録タグからコーディングタグまたはジタグ構築物への情報移行を示す。結合情報を記録するための２つの方法（Ａ）および（Ｂ）が示されている。結合性物質は、本明細書に記載の任意のタイプの結合性物質であってもよく、抗ホスホチロシン結合性物質が示されているが、それは例示のために過ぎない。伸長コーディングタグまたはジタグ構築の場合、結合情報をコーディングタグから記録タグへと移行させるのではなく、情報を、記録タグからコーディングタグへと移行させて、伸長コーディングタグを生成するか（Ａ）、または情報を、記録タグおよびコーディングタグの両方から第３のジタグ形成構築物へと移行させるか（Ｂ）のいずれかである。ジタグおよび伸長コーディングタグは、記録タグ（バーコード、任意選択のＵＭＩ配列、および任意選択のコンパートメントタグ（ＣＴ）配列（図示せず））、およびコーディングタグの情報を含む。ジタグおよび伸長コーディングタグを、記録タグから溶出させ、収集し、任意選択で増幅し、次世代シーケンサーで読み取ることができる。

図１２Ａ〜１２Ｄは、ＰＮＡコンビナトリアルバーコード／ＵＭＩ記録タグの設計、および結合事象のジタグ検出を示す。図１２Ａには、化学的ライゲーションによる、４つの基本ＰＮＡワード配列（Ａ、Ａ’−Ｂ、Ｂ’−Ｃ、およびＣ’）のコンビナトリアルＰＮＡバーコード／ＵＭＩの構築が示されている。ＤＮＡアームのハイブリダイズは、ＰＮＡバーコード／ＵＭＩのコンビナトリアルアセンブリの無スペーサーコンビナトリアル鋳型を創出するために含まれている。化学的ライゲーションは、アニーリングされたＰＮＡ「ワード」を縫い合わせるために使用される。図１２Ｂは、記録タグのＰＮＡ情報をＤＮＡ中間体へと移行させるための方法示す。ＤＮＡ中間体は、情報をコーディングタグへと移行させることが可能である。すなわち、相補的ＤＮＡワード配列を、ＰＮＡにアニーリングさせ、化学的にライゲーションする（任意選択で、ＰＮＡ鋳型を使用するリガーゼが発見された場合は、酵素的にライゲーションする）。図１２Ｃでは、ＤＮＡ中間体は、スペーサー配列Ｓｐを介して、コーディングタグと相互作用するように設計されている。鎖置換プライマー伸長ステップは、ライゲーションされたＤＮＡを置換し、記録タグ情報をＤＮＡ中間体からコーディングタグへと移行させ、伸長コーディングタグを生成する。ターミネーターヌクレオチドを、ＤＮＡ中間体の末端に組み込んで、プライマー伸長によるコーディングタグ情報のＤＮＡ中間体への移行を防止してもよい。図１２Ｄ：あるいは、情報を、コーディングタグからＤＮＡ中間体へと移行させて、ジタグ構築物を生成してもよい。ターミネーターヌクレオチドを、コーディングタグの末端に組み込んで、ＤＮＡ中間体からコーディングタグへの記録タグ情報の移行を防止してもよい。

図１３Ａ〜１３Ｅは、コンパートメントバーコート付きビーズへのプロテオーム分配、その後のエマルジョン融合ＰＣＲでのジタグアセンブリによる、ペプチド配列組成を表わすエレメントのライブラリーの生成を示す。その後、ペプチドのアミノ酸の内容は、Ｎ末端配列決定法により、またはその代わりに、アミノ酸特異的化学的標識もしくはコーディングタグが付随されている結合性物質を付着（共有結合または非共有結合）させることにより特徴付けることができる。コーディングタグは、ユニバーサルプライミング配列、ならびにアミノ酸を識別するためのエンコーダー配列、コンパートメントタグ、およびアミノ酸ＵＭＩで構成されている。情報移行の後、ジタグを、記録タグＵＭＩにより元の分子にマッピングし戻す。図１３Ａでは、プロテオームを、バーコード付きビーズを有する液滴にコンパートメント化する。付随する記録タグ（コンパートメントバーコード情報を含む）を有するペプチドを、ビーズ表面に付着させる。液滴エマルジョンを破壊して、ペプチドが分配されているバーコード付きビーズを放出させる。図１３Ｂでは、ペプチドの特定のアミノ酸残基を、部位特異的標識部分にコンジュゲートされているＤＮＡコーディングタグで化学的に標識する。ＤＮＡコーディングタグは、アミノ酸バーコード情報および任意選択でアミノ酸ＵＭＩを含む。図１３Ｃ：標識ペプチド−記録タグ複合体を、ビーズから放出させる。図１３Ｄ：標識ペプチド−記録タグ複合体を、１コンパートメント当たり平均で１つ未満のペプチド−記録タグ複合体が存在するように、ナノエマルジョンまたはマイクロエマルジョンへと乳化する。図１３Ｅ：エマルジョン融合ＰＣＲは、記録タグ情報（例えば、コンパートメントバーコード）を、アミノ酸残基に付着しているＤＮＡコーディングタグのすべてに移行させる。

図１４は、乳化されたペプチド記録タグ−コーディングタグ複合体からの伸長コーディングタグの生成を示す。図１３Ｃのペプチド複合体を、１液滴当たり平均で単一のペプチド複合体となるように、ＰＣＲ試薬と共に液滴内へと共乳化する。３プライマー融合ＰＣＲ（ｔｈｒｅｅ−ｐｒｉｍｅｒｆｕｓｉｏｎＰＣＲ）手法を使用して、ペプチドに付随されている記録タグを増幅し、増幅した記録タグを、複数の結合性物質コーディングタグまたは共有結合で標識されたアミノ酸のコーディングタグと融合し、プライマー伸長によりコーディングタグを伸長させて、ペプチドＵＭＩおよびコンパートメントタグ情報を、記録タグからコーディングタグへと移行させ、得られた伸長コーディングタグを増幅する。１液滴当たり複数の伸長コーディングタグ種が存在し、存在する各アミノ酸エンコーダー配列−ＵＭＩコーディングタグ毎に種が異なる。このようにして、ペプチド内のアミノ酸の同一性および計数を両方とも決定することができる。Ｕ１ユニバーサルプライマーおよびＳｐプライマーは、Ｕ２_ｔｒユニバーサルプライマーよりも高い融解Ｔｍを有するように設計される。これにより、２段階ＰＣＲが可能になり、２段階ＰＣＲでは、最初の少数回のサイクルをより高いアニーリング温度で実施して記録タグを増幅し、その後、ＰＣＲ中に記録タグおよびコーディングタグが互いにプライミングして伸長コーディングタグが産生されるように、より低いＴｍの段階へと進み、Ｕ１およびＵ２_ｔｒユニバーサルプライマーを使用して、得られた伸長コーディングタグ産物の増幅にプライミングする。ある特定の実施形態では、Ｕ２_ｔｒプライマーからの時期尚早ポリメラーゼ伸長は、光解離性３’ブロッキング基を使用することにより防止することができる（Ｙｏｕｎｇら、２００８年、Ｃｈｅｍ．Ｃｏｍｍｕｎ．（Ｃａｍｂ）４巻：４６２〜４６４頁）。記録タグを増幅する第１のラウンドのＰＣＲ、およびコーディングタグＳｐ_ｔｒが、記録タグの増幅されたＳｐ’配列のコーディングタグの伸長にプライミングする第２のラウンドの融合ＰＣＲステップの後、Ｕ２_ｔｒの３’ブロッキング基を除去し、Ｕ１およびＵ２_ｔｒプライマーを有する伸長コーディングタグを増幅するために、より高い温度でのＰＣＲを開始させる。

図１５は、タンパク質のマッピング性およびフェージングの増強を容易にするプロテオーム分配およびバーコード付与の使用を示す。ペプチド配列決定では、典型的には、タンパク質を消化してペプチドにする。このプロセスでは、親タンパク質分子に由来する個々のペプチド間の関係性に関する情報、および親タンパク質分子に対するそれらの関係性が失われる。この情報を再構築するために、個々のペプチド配列を、それらが由来する可能性のあるタンパク質配列のコレクションにマッピングし戻す。そのようなセット内に一意の一致を見出すタスクは、短鎖および／または部分ペプチド配列では、コレクションのサイズおよび複雑性（例えば、プロテオーム配列複雑性）が増加すると共により困難となる。バーコード付き（例えば、コンパートメントタグ付き）コンパートメントまたは区分へとプロテオームを分配し、その後タンパク質をペプチドへと消化し、コンパートメントタグをペプチドに接合することにより、ペプチド配列をマッピングする必要のある「タンパク質」空間が低減され、複雑なタンパク質試料の場合のタスクが大幅に単純化される。ペプチドへと消化する前に、一意の分子識別子（ＵＭＩ）を有するタンパク質を標識することにより、ペプチドを元のタンパク質分子にマッピングし戻すことが容易になり、同じタンパク質分子に由来する翻訳後修飾（ＰＴＭ）変異体間のフェージング情報の注釈、および個々のプロテオフォームの識別が可能になる。図１５Ａは、分配バーコードを含む記録タグでタンパク質を標識し、その後記録タグ標識ペプチドへと断片化することを含む、プロテオーム分配の例を示す。図１５Ｂ：部分ペプチド配列情報または組成情報のみの場合でさえ、このマッピングは、高度に縮重性である。しかしながら、同じタンパク質に由来する複数のペプチドからの情報と結び付けられた部分ペプチド配列または組成情報は、元のタンパク質分子の一意の識別を可能にする。

図１６は、コンパートメントタグ付きビーズ配列設計の例示的なモードを示す。コンパートメントタグは、個々のコンパートメントを識別するためのＸ_５〜２０のバーコード、およびコンパートメントタグが接合されているペプチドを識別するためのＮ_５〜１０の一意の分子識別子（ＵＭＩ）を含み、ＸおよびＮは、縮重した核酸塩基または核酸塩基ワードを表わす。コンパートメントタグは、一本鎖であってもよく（上段に図示）、または二本鎖であってもよい（下段に図示）。任意選択で、コンパートメントタグは、目的のペプチドと接合するためのタンパク質リガーゼ（例えば、ブテラーゼＩ（ｂｕｔｅｌａｓｅＩ））の認識配列を有するペプチド配列を含むキメラ分子であってもよい（左側に図示）。あるいは、目的のペプチドとのカップリングのために、化学的部分が、コンパートメントタグに含まれていてもよい（例えば、右側の図に示されるようなアジド）。

図１７Ａ〜１７Ｂは、（Ａ）複数のペプチドを表す複数の伸長記録タグおよび（Ｂ）標準的ハイブリッド捕捉技法による標的ペプチド濃縮の例示的な方法を示す。例えば、ハイブリッド捕捉濃縮では、ペプチドのライブラリーを表わす伸長記録タグのライブラリーから、１つまたは複数の目的のペプチド（「標的ペプチド」）を表わす伸長記録タグとハイブリダイズする１つまたは複数のビオチン化「ベイト」オリゴヌクレオチドを使用してもよい。ベイトオリゴヌクレオチド：標的とする伸長記録タグハイブリダイゼーション対を、ハイブリダイゼーション後にビオチンタグにより溶液からプルダウンして、１つまたは複数の目的のペプチドを表わす伸長記録タグの濃縮画分を生成する。伸長記録タグの分離（「プルダウン」）は、例えば、ストレプトアビジンコーティング磁気ビーズを使用して達成することができる。ビオチン部分を、ビーズのストレプトアビジンと結合させ、磁石を使用してビーズを局在化させ、溶液を除去または交換することにより分離を達成する。望ましくないかまたは過剰に豊富なペプチドを表わす伸長記録タグに競合的にハイブリダイズする非ビオチン化競合物質濃縮オリゴヌクレオチドを、任意選択で、ハイブリッド捕捉アッセイのハイブリダイゼーションステップに含めて、濃縮された標的ペプチドの量をモジュレートしてもよい。非ビオチン化競合オリゴヌクレオチドは、標的ペプチドとのハイブリダイゼーションを競合するが、ハイブリダイゼーション二本鎖は、ビオチン部分が存在しないため捕捉ステップ中に捕捉されない。したがって、競合オリゴヌクレオチドのビオチン化「ベイト」オリゴヌクレオチドに対する比を調整することにより、濃縮された伸長記録タグ画分を、広いダイナミックレンジにわたってモジュレートすることができる。このステップは、試料内のタンパク質存在量のダイナミックレンジ問題に対処するために重要になるであろう。

図１８Ａ〜１８Ｂは、単一細胞およびバルクプロテオームを個々の液滴内に分配するための例示的な方法を示し、各液滴は、ペプチドをそれらの元のタンパク質複合体と、または単一の細胞に由来するタンパク質と相関させるために、複数のコンパートメントタグが付着しているビーズを含む。コンパートメントタグは、バーコードを含む。液滴形成後の液滴構成成分の操作：（Ａ）単一細胞を個々の液滴内に分配し、その後細胞溶解して細胞プロテオームを放出させ、タンパク質分解により細胞プロテオームをペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する；（Ｂ）バルクプロテオームを、複数の液滴内に分配し、個々の液滴は、タンパク質複合体を含み、その後タンパク質分解によりタンパク質複合体をペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する。熱不安定性メタロ−プロテアーゼを使用し、光ケージ化２価カチオンを光放出させてプロテアーゼを活性化した後、封入されているタンパク質をペプチドへと消化することができる。プロテアーゼは、十分なタンパク質分解後に加熱不活化してもよく、または２価カチオンをキレートしてもよい。液滴は、ペプチドのＮ−またはＣ−末端アミノ酸のいずれかにライゲートすることが可能な核酸バーコード（記録タグとは別の）を含む、ハイブリダイズされたまたは放出可能なコンパートメントタグを含む。

図１９Ａ〜１９Ｂは、単一細胞およびバルクプロテオームを個々の液滴内に分配するための例示的な方法を示し、各液滴は、ペプチドをそれらの元のタンパク質またはタンパク質複合体と、またはタンパク質を元の単一細胞と相関させるために、コンパートメントタグが付着している複数の二機能性記録タグを有するビーズを含む。液滴形成後の液滴構成成分の操作：（Ａ）単一細胞を個々の液滴内に分配し、その後細胞溶解して細胞プロテオームを放出させ、タンパク質分解により細胞プロテオームをペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する；（Ｂ）バルクプロテオームを、複数の液滴内に分配し、個々の液滴は、タンパク質複合体を含み、その後タンパク質分解によりタンパク質複合体をペプチドへと消化し、十分なタンパク質分解後にプロテアーゼを不活化する。熱不安定性メタロ−プロテアーゼを使用し、光ケージ化２価カチオン（例えば、Ｚｎ２＋）を光放出させた後、封入されているタンパク質をペプチドへと消化することができる。プロテアーゼは、十分なタンパク質分解後に加熱不活化してもよく、または２価カチオンをキレートしてもよい。液滴は、ペプチドのＮ−またはＣ−末端アミノ酸のいずれかにライゲートすることが可能な核酸バーコード（記録タグとは別の）を含む、ハイブリダイズされたまたは放出可能なコンパートメントタグを含む。

図２０Ａ〜２０Ｌは、ペプチドに付着したコンパートメントバーコード付き記録タグの生成を示す。コンパートメントバーコード付与技術（例えば、マイクロ流体液滴中のバーコード付きビーズなど）を使用して、コンパートメント特異的バーコードを、特定のコンパートメント内に封入されている分子内容物に移行させることができる。（Ａ）特定の実施形態では、タンパク質分子を変性させ、リシン残基（Ｋ）のε−アミン基を、活性化されたユニバーサルＤＮＡタグ分子（５’末端にＮＨＳ部分を有することが示されているユニバーサルプライミング配列（Ｕ１）を含む）と化学的にコンジュゲートさせる。ユニバーサルＤＮＡタグをポリペプチドにコンジュゲーションした後、過剰なユニバーサルＤＮＡタグを除去する。（Ｂ）ユニバーサルＤＮＡタグ付きポリペプチドを、ビーズに結合された核酸分子とハイブリダイズさせ、個々のビーズに結合された核酸分子は、コンパートメントタグ（バーコード）配列の一意の集団を含む。コンパートメント化は、液滴などの異なる物理的コンパートメント内（破線楕円により示されている）に試料を分離することにより生じ得る。あるいは、コンパートメント化は、例えば、ポリペプチドのユニバーサルＤＮＡタグを、ビーズのコンパートメントＤＮＡタグにアニーリングさせることによって、標識ポリペプチドをビーズ表面に固定化することにより、追加の物理的分離を必要とせずに、直接的に達成することができる。単一のポリペプチド分子は、単一のビーズとのみ相互作用する（例えば、単一のポリペプチドは、複数のビーズにまたがっていない）。しかしながら、複数のポリペプチドが、同じビーズと相互作用する場合がある。コンパートメントバーコード配列（ＢＣ）に加えて、ビーズに結合された核酸分子は、共通Ｓｐ（スペーサー）配列、一意の分子識別子（ＵＭＩ）、およびポリペプチドＤＮＡタグＵ１’に相補的な配列で構成されていてもよい。（Ｃ）ユニバーサルＤＮＡタグ付きポリペプチドを、ビーズに結合されたコンパートメントタグとアニーリングさせた後、付着リンカーを切断することよりコンパートメントタグをビーズから放出する。（Ｄ）アニーリングしたＵ１ＤＮＡタグプライマーを、ビーズに由来するコンパートメントタグ核酸分子を鋳型として使用する、ポリメラーゼに基づくプライマー伸長により伸長させる。プライマー伸長ステップは、（Ｃ）に示されているようにコンパートメントタグをビーズから放出させた後で、または任意選択でコンパートメントタグが依然としてビーズに付着している間（図示せず）に実施してもよい。これにより、ビーズのコンパートメントタグに由来するバーコード配列が、ポリペプチドのＵ１ＤＮＡタグ配列に効果的に書き込まれる。この新しい配列が、記録タグを構成する。プライマー伸長後、プロテアーゼ、例えば、Ｌｙｓ−Ｃ（リシン残基のＣ末端側を切断する）、Ｇｌｕ−Ｃ（グルタミン酸残基のＣ末端側を、および程度は低いがグルタミン酸残基を切断する）、またはプロテイナーゼＫなどのランダムプロテアーゼを使用して、ポリペプチドをペプチド断片へと切断する。（Ｅ）各ペプチド断片は、本明細書で開示されているように下流でペプチド配列決定するために、そのＣ末端リシンを、記録タグを構成する伸長ＤＮＡタグ配列で標識する。（Ｆ）記録タグ付きペプチドを、歪みアルキン標識ＤＢＣＯを介してアジドビーズにカップリングする。また、アジドビーズは、任意選択で、ＤＢＣＯ−アジド固定化の効率を促進するために、記録タグに相補的な捕捉配列を含む。なお、元のビーズからペプチドを除去し、新しい固体支持体（例えば、ビーズ）に再固定化することにより、ペプチド間の最適な分子間離間が可能になり、本明細書で開示されているペプチド配列決定法が容易になることが留意されるべきである。図２０Ｇ〜２０Ｌは、アルキンで予め標識したポリペプチド（図２Ｂに記載のような）へのＤＮＡタグのクリック化学的コンジュゲーションを使用すること以外は、図２０Ａ〜２０Ｆに示されているものと同様の概念を示す。アジドおよびｍＴｅｔ化学は、直交性であり、ＤＮＡタグへのクリックコンジュゲーション、および配列決定基材へのクリックｉＥＤＤＡコンジュゲーション（ｍＴｅｔおよびＴＣＯ）を可能にする。同上。同上。同上。

図２１は、流動フォーカスＴ字路を使用して、単一細胞を、コンパートメントタグ付き（例えば、バーコード）ビーズにコンパートメント化するための例示的な方法を示す。２つの水流を用いると、液滴形成時に、細胞溶解およびプロテアーゼ活性化（Ｚｎ^２＋混合）を容易に開始することができる。

図２２Ａ〜２２Ｂは、例示的なタグ化詳細を示す。（Ａ）コンパートメントタグ（ＤＮＡ−ペプチドキメラ）を、ブテラーゼＩによるペプチドライゲーションを使用して、ペプチドに付着させる。（Ｂ）ペプチド配列決定の開始前に、コンパートメントタグ情報を、付随する記録タグへと移行させる。任意選択で、アスパラギン酸残基のＮ末端でペプチド結合を選択的に切断するエンドペプチダーゼＡｓｐＮを使用して、記録タグへの情報移行後、コンパートメントタグを切断することができる。

図２３Ａ〜２３Ｃは、組織切片の空間的プロテオミクスに基づく解析のためのアレイに基づくバーコードを示す。（Ａ）空間的にコードされたＤＮＡバーコードのアレイ（ＢＣ_ｉｊと表記されているバーコードを特徴とする）を、組織切片（ＦＦＰＥまたは凍結）と組み合わせる。一実施形態では、組織切片は、固定および透過処理されている。好ましい実施形態では、アレイ特徴サイズは、細胞サイズ（ヒト細胞の場合、約１０μｍ）よりも小さい。（Ｂ）アレイにマウントした組織切片を試薬で処理して架橋を元に戻す（例えば、シトラコン酸無水物を用いた抗原回復プロトコール（Ｎａｍｉｍａｔｓｕ，Ｇｈａｚｉｚａｄｅｈら、２００５年）、その後その中のタンパク質を、タンパク質分子をすべてＤＮＡ記録タグで効果的に標識する部位反応性ＤＮＡ標識で標識する（例えば、抗原回復後に遊離されたリシンの標識）。標識および洗浄後、アレイに結合したＤＮＡバーコード配列を切断し、マウントした組織切片への拡散を可能にし、その中にあるタンパク質に付着したＤＮＡ記録タグとハイブリダイズさせる。（Ｃ）ここで、アレイにマウントした組織を、ポリメラーゼ伸長に供して、ハイブリダイズされたバーコードの情報を、タンパク質を標識しているＤＮＡ記録タグへと移行させる。バーコード情報の移行後、アレイにマウントした組織を、スライドからこすり落とし、任意選択でプロテアーゼにより消化し、タンパク質またはペプチドを溶液内に抽出する。

図２４Ａ〜２４Ｂは、ビーズに固定化されており、コーディングタグに付着した結合性物質によりアッセイされる２つの異なる例示的なＤＮＡ標的巨大分子（ＡＢおよびＣＤ）を示す。このモデル系は、結合された物質から近位記録タグへのコーディングタグ移行の単一分子挙動を例示する役目を果たす。好ましい実施形態では、コーディングタグは、プライマー伸長により伸長記録コーディングタグに組み込まれる。図２４Ａは、ＡＢ巨大分子が、Ａ特異的結合性物質（「Ａ’」、ＡＢ巨大分子の「Ａ」成分に相補的オリゴヌクレオチド配列）と相互作用して、付随するコーディングタグの情報がプライマー伸長により記録タグへと移行され、Ｂ特異的結合性物質（「Ｂ’」、ＡＢ巨大分子の「Ｂ」成分に相補的なオリゴヌクレオチド配列）と相互作用して、付随するコーディングタグの情報がプライマー伸長により記録タグへと移行されることを示す。コーディングタグＡおよびＢは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析では長さが異なる必要はない。Ａ’およびＢ’結合性物質の結合は、単一結合サイクルの代替的な可能性として示されている。第２のサイクルが追加されれば、伸長記録タグはさらに伸長されることになる。第１および第２のサイクルにてＡ’またはＢ’結合性物質のいずれが添加されるかに応じて、伸長記録タグは、形態ＡＡ、ＡＢ、ＢＡ、およびＢＢのコーディングタグ情報を含むことができる。したがって、伸長記録タグは、結合物質の同一性だけでなく、結合事象の順序に関する情報も含む。同様に、図２４Ｂは、ＣＤ巨大分子が、Ｃ特異的結合性物質（「Ｃ’」、ＣＤ巨大分子の「Ｃ」成分に相補的なオリゴヌクレオチド配列）と相互作用して、付随するコーディングタグの情報がプライマー伸長により記録タグへと移行され、Ｄ特異的結合性物質（「Ｄ’」、ＣＤ巨大分子の「Ｄ」成分に相補的なオリゴヌクレオチド配列）と相互作用して、付随するコーディングタグの情報がプライマー伸長によりに記録タグへと移行されることを示す。コーディングタグＣおよびＤは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析には長さが異なる必要はない。Ｃ’およびＤ’結合性物質の結合は、単一結合サイクルの代替的な可能性として示されている。第２のサイクルが追加されれば、伸長記録タグはさらに伸長されることになる。第１および第２のサイクルにてＣ’またはＤ’結合性物質のいずれが添加されるかに応じて、伸長記録タグは、形態ＣＣ、ＣＤ、ＤＣ、およびＤＤのコーディングタグ情報を含むことができる。コーディングタグは、任意選択でＵＭＩを含んでいてもよい。コーディングタグにＵＭＩが含まれることにより、結合事象に関する追加情報を記録することが可能になり、それにより、結合事象を個々の結合性物質のレベルで区別することが可能になる。これは、個々の結合性物質が、１つよりも多くの結合事象に参加することができる場合（例えば、その結合親和性が、１つよりも多くの事象に参加するのに十分な頻度で解離および再結合することができるような程度である場合）、有用であり得る。また、エラー訂正に有用であり得る。例えば、いくつかの状況下では、コーディングタグは、同じ結合サイクルで２回またはそれよりも多くの頻度で、情報を記録タグに移行させる場合がある。ＵＭＩを使用すれば、これらが、すべて単一結合事象に関連する繰り返し情報移行事象である可能性が高いことが明らかになるであろう。同上。

図２５は、ビーズに固定化されており、コーディングタグに付着した結合性物質によりアッセイされる例示的なＤＮＡ標的巨大分子（ＡＢ）を示す。Ａ特異的結合性物質（「Ａ’」、ＡＢ巨大分子のＡ成分に相補的なオリゴヌクレオチド）は、ＡＢ巨大分子と相互作用し、付随するコーディングタグの情報が、ライゲーションにより記録タグへと移行される。Ｂ特異的結合性物質（「Ｂ’」、ＡＢ巨大分子のＢ成分に相補的なオリゴヌクレオチド）は、ＡＢ巨大分子と相互作用し、付随するコーディングタグの情報が、ライゲーションにより記録タグへと移行される。コーディングタグＡおよびＢは配列が異なり、この図では、容易に識別することができるように長さも異なっている。長さが異なることにより、ゲル電気泳動法によるコーディングタグ移行の解析が容易になるが、次世代シーケンシングによる解析には長さが異なる必要はない。

図２６Ａ〜２６Ｂは、プライマー伸長による結合／コーディングタグ移行の例示的なＤＮＡ−ペプチド巨大分子を示す。図２６Ａは、ビーズに固定化されている例示的なオリゴヌクレオチド−ペプチド標的巨大分子（「Ａ」オリゴヌクレオチド−ｃＭｙｃペプチド）を示す。ｃＭｙｃ−特異的結合性物質（例えば、抗体）は、巨大分子のｃＭｙｃペプチド部分と相互作用し、付随するコーディングタグの情報が記録タグに移行される。ｃＭｙｃコーディングタグの情報の記録タグへの移行は、ゲル電気泳動法により解析することができる。図２６Ｂは、ビーズに固定化されている例示的なオリゴヌクレオチド−ペプチド標的巨大分子（「Ｃ」オリゴヌクレオチド−赤血球凝集素（ＨＡ）ペプチド）を示す。ＨＡ−特異的結合性物質（例えば、抗体）は、巨大分子のＨＡペプチド部分と相互作用し、付随するコーディングタグの情報が記録タグに移行される。コーディングタグの情報の記録タグへの移行は、ゲル電気泳動法により解析することができる。ｃＭｙｃ抗体−コーディングタグおよびＨＡ抗体−コーディングタグの結合は、単一結合サイクルの代替的な可能性として示されている。第２のサイクルが実施されれば、伸長記録タグはさらに伸長されることになる。第１および第２の結合サイクルにてｃＭｙｃ抗体−コーディングタグまたはＨＡ抗体−コーディングタグのいずれを添加するかに応じて、伸長記録タグは、形態ｃＭｙｃ−ＨＡ、ＨＡ−ｃＭｙｃ、ｃＭｙｃ−ｃＭｙｃ、およびＨＡ−ＨＡのコーディングタグ情報を含むことができる。また、図示されていないが、追加の結合性物質を導入して、巨大分子のＡおよびＣオリゴヌクレオチド成分の検出を可能にすることができる。したがって、異なるタイプの骨格を含むハイブリッド巨大分子は、情報を記録タグへと移行させ、結合事象の順序ならびに結合性物質の同一性に関する情報を含む伸長記録タグを読み出すことにより解析することができる。

図２７Ａ〜２７Ｄは、エラー訂正バーコードの生成を示す。（Ａ）６５個のエラー訂正バーコード（配列番号１〜６５）のサブセットを、Ｒソフトウェアパッケージ「ＤＮＡＢａｒｃｏｄｅｓ」（ｈｔｔｐｓ：／／ｂｉｏｃｏｎｄｕｃｔｏｒ．ｒｉｋｅｎ．ｊｐ／ｐａｃｋａｇｅｓ／３．３／ｂｉｏｃ／ｍａｎｕａｌｓ／ＤＮＡＢａｒｃｏｄｅｓ／ｍａｎ／ＤＮＡＢａｒｃｏｄｅｓ．ｐｄｆ）から、コマンドパラメーター［ｃｒｅａｔｅ．ｄｎａｂａｒｃｏｄｅｓ（ｎ＝１５、ｄｉｓｔ＝１０）］を使用して導出した７７個のバーコードのセットから選択した。このアルゴリズムは、４個の置換の距離まで置換エラーを訂正することができ、９個の置換までエラーを検出することができる１５ｍｅｒ「Ｈａｍｍｉｎｇ」バーコードを生成する。様々なナノポア電流レベル（ナノポアに基づく配列決定の場合）を示さなかったか、またはこのセットの他のメンバーとも相関していたバーコードを濾過することにより、６５個のバーコードのサブセットを生成した。（Ｂ）細孔を通り抜ける１５ｍｅｒバーコードの予測ナノポア電流レベルのプロット。予測電流は、各１５ｍｅｒバーコードワードを、１１個のオーバーラップ５ｍｅｒワードの複合セットに分割し、５ｍｅｒＲ９ナノポア電流レベル参照テーブル（ｔｅｍｐｌａｔｅ＿ｍｅｄｉａｎ６８ｐＡ．５ｍｅｒｓ．ｍｏｄｅｌ（ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｊｔｓ／ｎａｎｏｐｏｌｉｓｈ／ｔｒｅｅ／ｍａｓｔｅｒ／ｅｔｃ／ｒ９−ｍｏｄｅｌｓ）を使用して、バーコードがナノポアを一度に一塩基ずつ通り抜ける際の対応する電流レベルを予測することにより算出した。（Ｂ）から理解することができるように、６５個のバーコードのこのセットは、そのメンバーの各々に一意の電流シグネチャを示す。（Ｃ）ＤＴＲおよびＤＴＲプライマーのオーバーラップセットを使用した、ナノポアシーケンシング用のモデル伸長記録タグとしてのＰＣＲ産物の生成が示されている。その後、ＰＣＲアンプリコンをライゲーションして、鎖状の伸長記録タグモデルを形成する。（Ｄ）図２７Ｃに示されているように生成された、例示的な「伸長記録タグ」モデルのナノポアシーケンシングリード（リード長７３４塩基）。ＭｉｎＩｏｎＲ９．４リードは、７．２の品質スコアを有する（リード品質は不良）。しかしながら、バーコード配列は、リード品質が低い場合でさえ（Ｑｓｃｏｒｅ＝７．２）、ｌａｌｉｇｎを使用して容易に識別することができる。１５ｍｅｒスペーサーエレメントには下線が引かれている。バーコードは、ＢＣまたはＢＣ’記号と表記されているフォワード方向またはリバース方向のいずれでもアラインすることができる。同上。同上。

図２８Ａ〜２８Ｄは、記録タグによるタンパク質の分析物特異的標識を示す。（Ａ）その天然コンフォメーションをとっている目的のタンパク質分析物を標的とする結合性物質は、ＤＮＡ記録タグの相補的分析物特異的バーコード（ＢＣ_Ａ）にハイブリダイズする分析物特異的バーコード（ＢＣ_Ａ’）を含む。あるいは、切断可能なリンカーを介してＤＮＡ記録タグを結合性物質に付着させることができ、ＤＮＡ記録タグを、タンパク質に直接「クリック」させ、その後結合性物質から切断する（切断可能なリンカーにより）。ＤＮＡ記録タグは、反応性カップリング部分（目的のタンパク質にカップリングするためのクリック化学試薬（例えば、アジド、ｍＴｅｔなど）、および他の機能性成分（例えば、ユニバーサルプライミング配列（Ｐ１）、試料バーコード（ＢＣ_Ｓ）、分析物特異的バーコード（ＢＣ_Ａ）、およびスペーサー配列（Ｓｐ）など）を含む。また、試料バーコード（ＢＣ_Ｓ）を使用して、異なる試料に由来するタンパク質を標識および区別することができる。また、ＤＮＡ記録タグは、その後の基材表面へのカップリングのための直交性カップリング部分（例えば、ｍＴｅｔ）を含んでいてもよい。目的のタンパク質に記録タグをクリック化学カップリングする場合、タンパク質を、ＤＮＡ記録タグのクリック化学カップリング部分と同種のクリック化学カップリング部分で予め標識する（例えば、タンパク質のアルキン部分は、ＤＮＡ記録タグのアジド部分と同種である）。クリック化学カップリング用のカップリング部分でＤＮＡ記録タグを標識するための試薬の例としては、リシン標識用のアルキン−ＮＨＳ試薬、光親和性標識用のアルキン−ベンゾフェノン試薬などが挙げられる。（Ｂ）結合性物質が近位標的タンパク質と結合した後、記録タグの反応性カップリング部分（例えば、アジド）は、近位タンパク質の同種クリック化学カップリング部分（３本線記号として示されている）に共有結合で付着する。（Ｃ）標的タンパク質分析物を記録タグで標識した後、ウラシル特異的切除試薬（例えば、ＵＳＥＲ（商標））を使用してウラシル（Ｕ）を消化することにより、付着している結合性物質を除去する。（Ｄ）ＤＮＡ記録タグで標識した標的タンパク質分析物を、クリック化学（アルキン−アジド結合対、メチルテトラジン（ｍＴＥＴ）−ｔｒａｎｓ−シクロオクテン（ＴＣＯ）結合対など）などの好適なバイオコンジュゲート化学反応を使用して基材表面に固定化する。ある特定の実施形態では、標的タンパク質−記録タグ標識アッセイ全体を、結合性物質のプールおよび記録タグのプールを使用して、多数の異なる標的タンパク質分析物を含む単一チューブ中で実施する。試料バーコード（ＢＣ_Ｓ）を含む記録タグで試料内のタンパク質分析物を標的標識した後、複数のタンパク質分析物試料を、（Ｄ）の固定化ステップ前にプールしてもよい。したがって、ある特定の実施形態では、数百個の試料にわたって最大数千個のタンパク質分析物を、単一チューブ次世代タンパク質アッセイ（ＮＧＰＡ）で標識および固定化することができ、高価な親和性試薬（例えば、抗体）が大幅に節約される。

図２９Ａ〜２９Ｅは、ＤＮＡ記録タグとポリペプチドとのコンジュゲーションを示す。（Ａ）変性ポリペプチドを、アルキン−ＮＨＳエステル（アセチレン−ＰＥＧ−ＮＨＳエステル）試薬またはアルキン−ベンゾフェノンなどの二機能性クリック化学試薬で標識して、アルキン標識（３本線記号）ポリペプチドを生成する。また、アルキンは、ジベンゾシクロオクチル（ＤＢＣＯ）などを含むシクロオクチンなどの歪みアルキンであってもよい。（Ｂ）アルキン標識ポリペプチドに化学的にカップリングされるＤＮＡ記録タグ設計の例が示されている。記録タグは、ユニバーサルプライミング配列（Ｐ１）、バーコード（ＢＣ）、およびスペーサー配列（Ｓｐ）を含む。記録タグを、基材表面にカップリングするためのｍＴｅｔ部分、および標識ポリペプチドのアルキン部分とカップリングするためのアジド部分で標識する。（Ｃ）変性アルキン標識タンパク質またはポリペプチドを、アルキンおよびアジド部分を介して記録タグで標識する。任意選択で、記録タグ標識ポリペプチドを、コンパートメントバーコードで、例えば、コンパートメントビーズに付着した相補的配列とアニーリングさせ、プライマー伸長（ポリメラーゼ伸長とも呼ばれる）させることにより、または図２０Ｈ〜２０Ｊに示されているように、さらに標識することができる。（Ｄ）記録タグ標識ポリペプチドをプロテアーゼ消化することにより、記録タグ標識ペプチドの集団が創出される。一部の実施形態では、一部のペプチドは、いかなる記録タグにも標識されていないであろう。他の実施形態では、一部のペプチドには、１つまたは複数の記録タグが付着していてもよい。（Ｅ）記録タグ標識ペプチドを、ＴＣＯ基で機能化された基材表面とペプチドに付着した記録タグのｍＴｅｔ部分との間の逆電子要請型ディールス−アルダー（ｉＥＤＤＡ）クリック化学反応を使用して、基材表面に固定化する。ある特定の実施形態では、図示されている異なる段階間で、クリーンアップステップを用いてもよい。直交性クリック化学（例えば、アジド−アルキンおよびｍＴｅｔ−ＴＣＯ）を使用することにより、記録タグによるポリペプチドのクリック化学標識、および記録タグ標識ペプチドの基材表面へのクリック化学固定化が両方とも可能になる（その全体が参照により組み込まれる、ＭｃＫａｙら、２０１４年、Ｃｈｅｍ．Ｂｉｏｌ．、２１巻：１０７５〜１１０１頁を参照されたい）。

図３０Ａ〜３０Ｅは、ポリペプチドの初期ＤＮＡ標識後の、試料バーコードの記録タグへの書き込みを示す。（Ａ）変性ポリペプチドを、アルキン−ＮＨＳ試薬またはアルキン−ベンゾフェノンなどの二機能性クリック化学試薬で標識して、アルキン標識ポリペプチドを生成する。（Ｂ）ポリペプチドをアルキン（またはその代わりにクリック化学部分）で標識した後、ユニバーサルプライミング配列（Ｐ１）を含み、アジド部分およびｍＴｅｔ部分で標識されているＤＮＡタグを、アジド−アルキン相互作用によりポリペプチドにカップリングする。他のクリック化学相互作用を用いてもよいことが理解される。（Ｃ）試料バーコード情報（ＢＣ_Ｓ’）および他の記録タグ機能性成分（例えば、ユニバーサルプライミング配列（Ｐ１’）、スペーサー配列（Ｓｐ’））を含む記録タグＤＮＡ構築物は、相補的ユニバーサルプライミング配列を介してＤＮＡタグ標識ポリペプチドとアニーリングする（Ｐ１−Ｐ１’）。記録タグ情報は、ポリメラーゼ伸長によりＤＮＡタグに移行される。（Ｄ）記録タグ標識ポリペプチドをプロテアーゼ消化することにより、記録タグ標識ペプチドの集団が創出される。（Ｅ）記録タグ標識ペプチドを、ＴＣＯ基で機能化された表面とペプチドに付着した記録タグのｍＴｅｔ部分との間の逆電子要請型ディールス−アルダー（ｉＥＤＤＡ）クリック化学反応を使用して、基材表面に固定化する。ある特定の実施形態では、図示されている異なる段階間で、クリーンアップステップを用いてもよい。直交性クリック化学（例えば、アジド−アルキンおよびｍＴｅｔ−ＴＣＯ）を使用することにより、記録タグによるポリペプチドのクリック化学標識、および記録タグ標識ペプチドの基材表面へのクリック化学固定化が両方とも可能になる（その全体が参照により組み込まれる、ＭｃＫａｙら、２０１４年、Ｃｈｅｍ．Ｂｉｏｌ．、２１巻：１０７５〜１１０１頁を参照されたい）。

図３１Ａ〜３１Ｅは、ポリペプチドにバーコードを付与するためのビーズコンパートメント化を示す。（Ａ）ポリペプチドを、ヘテロ二機能性クリック化学試薬による標準的バイオコンジュゲーションまたは光親和性標識技法を使用して、溶液中で標識する。考え得る標識部位としては、リシン残基のε−アミン（例えば、図示されているようなＮＨＳ−アルキンと）またはペプチドの炭素骨格（例えば、ベンゾフェノン−アルキンと）が挙げられる。（Ｂ）ユニバーサルプライミング配列（Ｐ１）を含むアジド標識ＤＮＡタグを、標識ポリペプチドのアルキン部分にカップリングする。（Ｃ）ＤＮＡタグ標識ポリペプチドを、ＤＮＡ記録タグ標識ビーズに、相補的ＤＮＡ配列（Ｐ１およびＰ１’）を介してアニーリングさせる。ビーズのＤＮＡ記録タグは、スペーサー配列（Ｓｐ’）、コンパートメントバーコード配列（ＢＣ_Ｐ’）、任意選択の一意の分子識別子（ＵＭＩ）、およびユニバーサル配列（Ｐ１’）を含む。ＤＮＡ記録タグ情報は、ポリメラーゼ伸長により（あるいは、ライゲーションを用いてもよい）、ポリペプチドのＤＮＡタグに移行される。情報移行後、得られたポリペプチドは、コンパートメントバーコードを含むいくつかの機能性エレメントを含有する複数の記録タグを含む。（Ｄ）記録タグ標識ポリペプチドをプロテアーゼ消化することにより、記録タグ標識ペプチドの集団が創出される。記録タグ標識ペプチドをビーズから解離させ、（Ｅ）配列決定基材に再固定化する（例えば、図示されているようなｍＴｅｔ部分とＴＣＯ部分との間のｉＥＤＤＡクリック化学を使用して）。

図３２Ａ〜３２Ｈは、次世代タンパク質アッセイ（ＮＧＰＡ）のワークフローの例を示す。タンパク質試料を、いくつかの機能性単位、例えば、ユニバーサルプライミング配列（Ｐ１）、バーコード配列（ＢＣ）、任意選択のＵＭＩ配列、およびスペーサー配列（Ｓｐ）（結合性物質コーディングタグとの情報移行を可能にする）で構成されているＤＮＡ記録タグで標識する。（Ａ）標識タンパク質を、基材（例えば、ビーズ、多孔性ビーズ、または多孔性マトリックス）に固定化する（受動的にまたは共有結合で）。（Ｂ）基材をタンパク質でブロッキングし、任意選択で、分析物記録タグ配列の非特異的相互作用を最小限に抑えるために、スペーサー配列に相補的な競合オリゴヌクレオチド（Ｓｐ’）を添加する。（Ｃ）分析物特異的抗体（付随するコーディングタグを有する）を、基質に結合されたタンパク質と共にインキュベートする。コーディングタグは、その後のウラシル特異的切断のためのウラシル塩基を含んでいてもよい。（Ｄ）抗体結合後、該当する場合は、過剰な競合オリゴヌクレオチド（Ｓｐ’）を洗い流す。コーディングタグは、相補的スペーサー配列を介して記録タグと一時的にアニーリングし、コーディングタグ情報は、プライマー伸長反応で記録タグへと移行され、伸長記録タグが生成される。固定化されたタンパク質が変性されている場合、結合されている抗体およびアニーリングされているコーディングタグを、０．１ＮＮａＯＨなどのアルカリ洗浄条件下で除去することができる。固定化されたタンパク質が、天然コンフォメーションをとっている場合、より穏やかな条件で、結合されている抗体およびコーディングタグを除去する必要がある場合がある。より穏やかな抗体除去条件の例は、パネルＥ〜Ｈに概説されている。（Ｅ）コーディングタグから記録タグへの情報移行後、コーディングタグを、ウラシル特異的切除試薬（例えば、ＵＳＥＲ（商標））酵素ミックスを使用して、そのウラシル部位にニックを入れる（切断する）。（Ｆ）結合されている抗体を、高塩濃度および低／高ｐＨ洗浄を使用して、タンパク質から除去する。抗体に付着したままの切断型ＤＮＡコーディングタグは、短鎖であり、同様に迅速に溶出する。より長鎖のＤＮＡコーディングタグ断片は、記録タグにアニーリングしたままであってもよく、またはアニーリングしたままでなくてもよい。（Ｇ）第２の結合サイクルが、ステップ（Ｂ）〜（Ｄ）と同様に開始し、第２のプライマー伸長ステップでは、プライマー伸長により、コーディングタグ情報が第２の抗体から伸長記録タグへと移行される。（Ｈ）２つの結合サイクルの結果は、記録タグに付着した第１の抗体および第２の抗体からの結合情報の鎖状物である。同上。

図３３Ａ〜３３Ｄは、複数の結合性物質および酵素媒介性連続情報移行を使用した１段階次世代タンパク質アッセイ（ＮＧＰＡ）を示す。２つの同種結合性物質（例えば、抗体）が同時に結合されている固定化タンパク質分子を用いたＮＧＰＡアッセイ。複数の同種抗体結合事象の後、プライマー伸長およびＤＮＡニッキングの組合せステップを使用して、結合されている抗体のコーディングタグから記録タグへと情報を移行させる。コーディングタグのキャレット記号（＾）は、二本鎖ＤＮＡニッキングエンドヌクレアーゼ部位を表わす。（Ａ）図示されている例では、タンパク質のエピトープ１（Ｅｐｉ＃１）に結合されている抗体のコーディングタグは、相補的スペーサー配列のハイブリダイゼーション後のプライマー伸長ステップにて、コーディングタグ情報（例えば、エンコーダー配列）を記録タグへと移行させる。（Ｂ）伸長記録タグとコーディングタグとの間に二本鎖ＤＮＡが形成されたら、３７℃で活性であるＮｔ．ＢｓｍＡＩなどの、二本鎖ＤＮＡ基質の一方のＤＮＡの鎖のみを切断するニッキングエンドヌクレアーゼを使用して、コーディングタグを切断する。ニッキングステップ後、切断型コーディングタグ結合性物質および伸長記録タグで形成された二本鎖は、熱力学的に不安定になり、解離する。より長鎖のコーディングタグ断片は、記録タグにアニーリングしたままであってもよく、またはアニーリングしたままでなくてもよい。（Ｃ）これにより、タンパク質のエピトープ＃２（Ｅｐｉ＃２）に結合されている抗体のコーディングタグが、相補的スペーサー配列を介して伸長記録タグにアニーリングし、プライマー伸長によりＥｐｉ＃２抗体のコーディングタグから伸長記録タグへと情報を移行させることにより、伸長記録タグをさらに伸長させることが可能になる。（Ｄ）この場合も、伸長記録タグとＥｐｉ＃２抗体のコーディングタグとの間に二本鎖ＤＮＡが形成された後、Ｎｂ．ＢｓｓＳＩなどのニッキングエンドヌクレアーゼによりコーディングタグにニックを入れる。ある特定の実施形態では、プライマー伸長（ポリメラーゼ伸長とも呼ばれる）中は非鎖置換ポリメラーゼの使用が好ましい。非鎖置換ポリメラーゼは、単一塩基よりも多くが記録タグにアニーリングしたままである切断されたコーディングタグ残部の伸長を防止する。（Ａ）〜（Ｄ）のプロセスは、近位の結合されている結合性物質のコーディングタグがすべて、ハイブリダイゼーション、伸長記録タグへの情報移行、ニッキングステップにより「消費」されるまで自発的に繰り返すことができる。コーディングタグは、所与の分析物（例えば、同種タンパク質）に特異的なすべての結合性物質（例えば、抗体）と同一であるエンコーダー配列を含んでいてもよく、エピトープ特異的なエンコーダー配列を含んでいてもよく、または異なる分子事象を区別するための一意の分子識別子（ＵＭＩ）を含んでいてもよい。

図３４Ａ〜３４Ｃは、基材表面の反応性部分のタイトレーションを使用した記録タグ−ペプチド固定化の密度制御を示す。（Ａ）基材表面のペプチド密度は、基材の表面の機能性カップリング部分の密度を制御することによりタイトレーションすることができる。これは、活性カップリング分子対「ダミー」カップリング分子の適切な比で、基質の表面を誘導体化することにより達成することができる。図示されている例では、ＮＨＳ−ＰＥＧ−ＴＣＯ試薬（活性カップリング分子）を、ＮＨＳ−ｍＰＥＧ（ダミー分子）を規定されている比で組み合わせて、アミン表面をＴＣＯで誘導体化する。機能化ＰＥＧは、３００から４０，０００を超える種々の分子量のものが入手可能である。（Ｂ）二機能性５’アミンＤＮＡ記録タグ（ｍＴｅｔは他方の機能的部分である）を、スクシンイミジル４−（Ｎ−マレイミドメチル）シクロヘキサン−１（ＳＭＣＣ）二機能性架橋剤を使用して、ペプチドのＮ末端Ｃｙｓ残基にカップリングする。記録タグの内部ｍＴｅｔ−ｄＴ基を、ｍテトラジン−アジドを使用して、アジド−ｄＴ基から創出する。（Ｃ）記録タグ標識ペプチドを、ｍＴｅｔとＴＣＯとのｉＥＤＤＡクリック化学反応を使用して、（Ａ）の活性化基材表面に固定化する。ｍＴｅｔ−ＴＣＯｉＥＤＤＡカップリング反応は、非常に迅速であり、効率的であり、安定的である（ｍＴｅｔ−ＴＣＯは、Ｔｅｔ−ＴＣＯよりも安定的である）。

図３５Ａ〜３５Ｃは、次世代タンパク質シーケンシング（ＮＧＰＳ）結合サイクル特異的コーディングタグを示す。（Ａ）サイクル特異的Ｎ末端アミノ酸（ＮＴＡＡ）結合性物質コーディングタグを用いたＮＧＰＳアッセイの設計。ＮＴＡＡ結合性物質（例えば、Ｎ末端ＤＮＰ標識チロシンに特異的な抗体）は、ユニバーサルプライミング配列（Ｐ１）、バーコード（ＢＣ）、およびスペーサー配列（Ｓｐ）を含む記録タグに付随されているペプチドのＤＮＰ標識ＮＴＡＡに結合する。結合性物質がペプチドの同種ＮＴＡＡに結合すると、ＮＴＡＡ結合性物質に付随されているコーディングタグは、記録タグに接近し、相補的スペーサー配列を介して記録タグにアニーリングする。コーディングタグ情報は、ポリメラーゼ伸長により記録タグに移行される。コーディングタグがどの結合サイクルを表わすのかを記録するために、コーディングタグは、サイクル特異的バーコードを含んでいてもよい。ある特定の実施形態では、分析物に結合する結合性物質のコーディングタグは、一意の結合サイクル特異的バーコードと組み合わされている、サイクル数に依存しない同じエンコーダーバーコードを有する。他の実施形態では、分析物に対する結合性物質のコーディングタグは、分析物−結合サイクルの組合せ情報についての一意のエンコーダーバーコードを含む。いずれの手法でも、共通スペーサー配列を、各結合サイクルでの結合性物質のコーディングタグに使用することができる。（Ｂ）この例では、各結合サイクルの結合性物質は、結合サイクルを識別するための短い結合サイクル特異的バーコードを有し、これにより、結合性物質を識別するエンコーダーバーコードと共に、特定の結合性物質結合サイクルの組合せを識別する一意の組合せバーコードが提供される。（Ｃ）結合サイクルの完了後、伸長記録タグを、キャッピングサイクルステップを使用して増幅可能なライブラリーに変換することができ、キャッピングサイクルステップでは、例えば、ユニバーサルプライミング配列Ｐ２およびスペーサー配列Ｓｐ’に連結されたユニバーサルプライミング配列Ｐ１’を含むキャップが、まず相補的Ｐ１およびＰ１’配列を介して伸長記録タグとアニーリングして、キャップが伸長記録タグと接近する。伸長記録タグおよびキャップの相補的ＳｐおよびＳｐ’配列がアニーリングし、プライマー伸長により、第２のユニバーサルプライマー配列（Ｐ２）が伸長記録タグに付加される。

図３６Ａ〜３６Ｅは、コーディングタグから記録タグへの情報移行を実証するためのＤＮＡに基づくモデル系を示す。例示的な結合および分子内書き込みを、オリゴヌクレオチドモデル系により実証した。コーディングタグの標的指向性物質Ａ’およびＢ’を、記録タグの標的結合領域ＡおよびＢとハイブリダイズするように設計した。２つの記録タグｓａＲＴ＿Ａｂｃ＿ｖ２（Ａ標的）およびｓａＲＴ＿Ｂｂｃ＿Ｖ２（Ｂ標的）を等濃度でプールすることにより、記録タグ（ＲＴ）ミックスを調製した。記録タグは、５’末端がビオチン化されており、一意の標的結合領域、ユニバーサルフォワードプライマー配列、一意のＤＮＡバーコード、および８塩基共通スペーサー配列（Ｓｐ）を含む。コーディングタグは、８塩基共通スペーサー配列（Ｓｐ’）に隣接されている一意のエンコーダーバーコード塩基を含み、８塩基共通スペーサー配列の１つは、ポリエチレングリコールリンカーを介してＡまたはＢ標的物質と共有結合で連結されている。（Ａ）ビオチン化記録タグオリゴヌクレオチド（ｓａＲＴ＿Ａｂｃ＿ｖ２およびｓａＲＴ＿Ｂｂｃ＿Ｖ２）を、ビオチン化ダミーＴ１０オリゴヌクレオチドと共に、ストレプトアビジンビーズに固定化した。ＡまたはＢ捕捉配列（それぞれ同種結合性物質Ａ’およびＢ’により認識される）および結合標的を識別するための対応するバーコード（ｒｔＡ＿ＢＣおよびｒｔＢ＿ＢＣ）を有する記録タグを設計した。このモデル系のバーコードはすべて、６５個の１５ｍｅｒバーコード（配列番号１〜６５）のセットから選択した。一部の場合では、ゲル解析を容易にするために、１５ｍｅｒバーコードを組み合わせて、より長いバーコードを構成した。特に、ｒｔＡ＿ＢＣ＝ＢＣ＿１＋ＢＣ＿２；ｒｔＢ＿ＢＣ＝ＢＣ＿３。また、記録タグのＡおよびＢ配列と同種の結合性物質の２つのコーディングタグ、つまりＣＴ＿Ａ’−ｂｃ（エンコーダーバーコード＝ＢＣ＿５）およびＣＴ＿Ｂ’−ｂｃ（エンコーダーバーコード＝ＢＣ＿５＋ＢＣ＿６）を合成した。任意選択で、コーディングタグを、ビーズに固定化された記録タグにアニーリングさせる前に、コーディングタグ配列の部分に相補的なブロッキングオリゴ（ＤｕｐＣＴ＿Ａ’ＢＣおよびＤｕｐＣＴ＿ＡＢ’ＢＣ）（一本鎖Ｓｐ’配列が後に残る）を、コーディングタグに予めアニーリングさせた。鎖置換ポリメラーゼは、ポリメラーゼ伸長中にブロッキングオリゴを除去する。バーコード凡例（挿入図）には、記録タグおよびコーディングタグの機能的バーコードへの１５ｍｅｒバーコードの帰属が示されている。（Ｂ）記録タグバーコード設計およびコーディングタグエンコーダーバーコード設計は、記録タグとコーディングタグとの「分子内」対「分子間」相互作用の容易なゲル解析を提供する。この設計では、望ましくない「分子間」相互作用（Ａ記録タグとＢ’コーディングタグとの、およびＢ記録タグとＡ’コーディングタグとの）は、所望の「分子内」（Ａ記録タグとＡ’コーディングタグとの；Ｂ記録タグとＢ’コーディングタグとの）相互作用産物よりも１５塩基だけ長いかまたは短いかのいずれかであるゲル産物を生成する。プライマー伸長ステップでは、Ａ’およびＢ’コーディングタグバーコード（ｃｔＡ’＿ＢＣ、ｃｔＢ’＿ＢＣ）が、リバース相補体バーコード（ｃｔＡ＿ＢＣおよびｃｔＢ＿ＢＣ）に変更される。（Ｃ）プライマー伸長アッセイは、コーディングタグから記録タグへと情報が移行されたこと、およびアダプター配列が、プライマー伸長により、ＰＣＲ解析のためのアニーリングされたＥｎｄＣａｐオリゴに付加されたことを実証した。（Ｄ）ダミーＴ２０オリゴを使用して記録タグの表面密度をタイトレーションすることによる「分子内」情報移行の最適化。ビオチン化記録タグオリゴを、１：０から、１：１０、１：１００００までの全域にわたる種々の比で、ビオチン化ダミーＴ２０オリゴと混合した。低減された記録タグ密度（１：１０^３および１：１０^４）では、「分子内」相互作用が、「分子間」相互作用よりも優勢である。（Ｆ）ＤＮＡモデル系の単純な伸長として、Ｎａｎｏ−Ｔａｇ_１５ペプチド−ストレプトアビジン結合対を含む単純なタンパク質結合系が示されているが（Ｋ_Ｄ約４ｎＭ）（Ｐｅｒｂａｎｄｔら、２００７年、Ｐｒｏｔｅｉｎｓ、６７巻：１１４７〜１１５３頁）、任意の数のペプチド−結合性物質モデル系を用いることができる。Ｎａｎｏ−Ｔａｇ_１５ペプチド配列は、（ｆＭ）ＤＶＥＡＷＬＧＡＲＶＰＬＶＥＴ（配列番号１３１）（ｆＭ＝ホルミル−Ｍｅｔ）である。Ｎａｎｏ−Ｔａｇ_１５ペプチドは、短い可撓性リンカーペプチド（ＧＧＧＧＳ）およびＤＮＡ記録タグにカップリングするためのシステイン残基をさらに含む。他の例示的なペプチドタグ−同種結合性物質対としては、カルモジュリン結合ペプチド（ＣＢＰ）−カルモジュリン（Ｋ_Ｄ約２ｐＭ）（Ｍｕｋｈｅｒｊｅｅら、２０１５年、Ｊ．Ｍｏｌ．Ｂｉｏｌ．、４２７巻：２７０７〜２７２５頁）、アミロイドベータ（Ａβ１６〜２７）ペプチド−ＵＳ７／Ｌｃｎ２アンチカリン（０．２ｎＭ）（Ｒａｕｔｈら、２０１６年、Ｂｉｏｃｈｅｍ．Ｊ．、４７３巻：１５６３〜１５７８頁）、ＰＡタグ／ＮＺ−１抗体（Ｋ_Ｄ約４００ｐＭ）、ＦＬＡＧ−Ｍ２Ａｂ（２８ｎＭ）、ＨＡ−４Ｂ２Ａｂ（１．６ｎＭ）、およびＭｙｃ−９Ｅ１０Ａｂ（２．２ｎＭ）（Ｆｕｊｉｉら、２０１４年、ＰｒｏｔｅｉｎＥｘｐｒ．Ｐｕｒｉｆ．、９５巻：２４０〜２４７頁）が挙げられる。（Ｅ）プライマー伸長による結合性物質のコーディングタグから記録タグへの分子内情報移行の試験としては、相補的ＤＮＡ配列「Ａ」に結合するオリゴヌクレオチド「結合性物質」を、試験および開発に使用することができる。このハイブリダイゼーション事象は、本質的にｆＭよりも大きな親和性を示す。Ｎａｎｏ−ｔａｇ_１５ペプチドエピトープの試験結合性物質としては、ストレプトアビジンを使用してもよい。ペプチドタグ−結合性物質相互作用は高親和性であるが、酸性での洗浄および／または高塩濃度での洗浄により容易に妨害することができる（Ｐｅｒｂａｎｄｔら、上記）。同上。同上。

図３７Ａ〜３７Ｂは、ペプチドのＵＭＩ標識ＮまたはＣ末端からＤＮＡタグ標識体へと情報を移行させるための、ナノ−またはマイクロ−エマルジョンＰＣＲの使用を示す。（Ａ）ポリペプチドのＮ−またはＣ−末端を、一意の分子識別子（ＵＭＩ）を含む核酸分子で標識する。ＵＭＩは、その後のＰＣＲにプライミングするために使用される配列により隣接されていてもよい。その後、ポリペプチドの内部部位を、ＵＭＩを隣接するプライミング配列に相補的な配列を含む別々のＤＮＡタグで「本体標識」する。（Ｂ）得られた標識ポリペプチドを乳化し、エマルジョンＰＣＲ（ｅＰＣＲ）（あるいは、エマルジョンｉｎｖｉｔｒｏ転写−ＲＴ−ＰＣＲ（ＩＶＴ−ＲＴ−ＰＣＲ）反応または他の好適な増幅反応を実施することができる）を実施して、Ｎ−またはＣ−末端ＵＭＩを増幅する。マイクロエマルジョンまたはナノエマルジョンは、平均液滴直径が５０〜１０００ｎｍで、１液滴当たり平均で１つ未満のポリペプチドが存在するように形成される。ＰＣＲ前およびＰＣＲ後の液滴内容物の概略が、それぞれ左パネルおよび右パネルに示されている。ＵＭＩアンプリコンを、内部ポリペプチド本体ＤＮＡと相補的プライミング配列を介してハイブリダイズさせ、ＵＭＩ情報を、プライマー伸長によりアンプリコンから内部ポリペプチド本体ＤＮＡタグへと移行させる。

図３８は、単一細胞プロテオミクスを示す。細胞を、ポリマー形成性サブユニット（例えば、アクリルアミド）を含む液滴に封入し、溶解する。ポリマー形成性サブユニットを重合させ（例えば、ポリアクリルアミド）、タンパク質を、ポリマーマトリックスに架橋する。エマルジョン液滴を破壊し、透過性ポリマーマトリックスに付着した単一細胞タンパク質ライセートを含む重合ゲルビーズを放出させる。タンパク質は、天然コンフォメーションで、または溶解および封入緩衝液中に尿素などの変性剤を含めることにより変性状態でのいずれかでポリマーマトリックスに架橋する。コンパートメントバーコードおよび他の記録タグ成分（例えば、ユニバーサルプライミング配列（Ｐ１）、スペーサー配列（Ｓｐ）、任意選択の一意の分子識別子（ＵＭＩ））を含む記録タグを、バーコード付きビーズとの乳化またはコンビナトリアルインデックス化を含む、当技術分野で公知のおよび本明細書に記載のいくつかの方法を使用してタンパク質に付着させる。また、単一細胞タンパク質を含む重合ゲルビーズを、記録タグ付加後にプロテイナーゼ消化にかけて、ペプチド配列決定に好適な記録タグ標識ペプチドを生成することができる。ある特定の実施形態では、ポリマーマトリックスは、ｔｒｉｓ（２−カルボキシエチル）ホスフィン（ＴＣＥＰ）またはジチオトレイトール（ＤＴＴ）などの還元剤に曝されると破壊されるジスルフィド架橋ポリマーなどの適切な添加剤に溶解するように設計することができる。

図３９Ａ〜３９Ｅは、二機能性Ｎ末端アミノ酸（ＮＴＡＡ）修飾因子およびキメラ切断試薬を使用したアミノ酸切断反応の増強を示す。（Ａ）および（Ｂ）固相基材に付着しているペプチドを、ビオチン−フェニルイソチオシアネート（ＰＩＴＣ）などの二機能性ＮＴＡＡ修飾因子で修飾する。（Ｃ）低親和性エドマナーゼ（＞μＭＫｄ）を、ストレプトアビジン−エドマナーゼキメラタンパク質を使用して、ビオチン−ＰＩＴＣ標識ＮＴＡＡに動員する。（Ｄ）エドマナーゼ切断の効率は、ビオチン−ストレプトアビジン（ｓｔｒｅｐａｖｉｄｉｎ）相互作用の結果として有効局所濃度が増加するため、大幅に向上する。（Ｅ）切断されたビオチン−ＰＩＴＣ標識ＮＴＡＡおよび付随するストレプトアビジン−エドマナーゼキメラタンパク質は、切断後に遠方に拡散する。いくつかの他のバイオコンジュゲーション動員戦略も用いることができる。アジド修飾ＰＩＴＣは、市販の（４−アジドフェニルイソチオシアネート、Ｓｉｇｍａ）であり、アルキン−ビオチンとのクリック化学反応によるビオチン−ＰＩＴＣなどの、ＰＩＴＣの他のバイオコンジュゲートへのアジド−ＰＩＴＣのいくつかの単純な変換を可能にする。

図４０Ａ〜４０Ｉは、タンパク質ライセート（ゲルビーズに封入されていてもよい）に由来するＣ末端記録タグ標識ペプチドの生成を示す。（Ａ）変性ポリペプチドを酸無水物と反応させて、リシン残基を標識する。一実施形態では、アルキン（ｍＴｅｔ）置換シトラコン酸無水物＋プロピオン酸無水物のミックスを使用して、リシンをｍＴｅｔで標識する。（縞模様の長方形として示されている）（Ｂ）その結果は、一部のリシンがプロピオン基（ポリペプチド鎖にある正方形として示されている）でブロッキングされたアルキン（ｍＴｅｔ）標識ポリペプチドである。アルキン（ｍＴｅｔ）部分は、クリック化学に基づくＤＮＡ標識に有用である。（Ｃ）ＤＮＡタグ（黒抜き長方形として示されている）を、アジドまたはｔｒａｎｓ−シクロオクテン（ＴＣＯ）標識を使用して、それぞれアルキンまたはｍＴｅｔ部分にクリック化学により付着させる。（Ｄ）バーコードならびにスペーサー（Ｓｐ）配列およびユニバーサルプライミング配列などの機能的エレメントを、図３１に示されているようなプライマー伸長ステップを使用してＤＮＡタグに追加して、記録タグ標識ポリペプチドを産生する。バーコードは、試料バーコード、分配バーコード、コンパートメントバーコード、空間位置バーコードなど、またはそれらの任意の組合せであってもよい。（Ｅ）得られた記録タグ標識ポリペプチドを、プロテアーゼでまたは化学的に記録タグ標識ペプチドに断片化する。（Ｆ）例示のために、２つの記録タグで標識されているペプチド断片が示されている。（Ｇ）記録タグのユニバーサルプライミング配列に相補的なユニバーサルプライミング配列を含むＤＮＡタグを、ペプチドのＣ末端にライゲーションさせる。また、Ｃ末端ＤＮＡタグは、ペプチドを表面にコンジュゲートするための部分を含む。（Ｈ）Ｃ末端ＤＮＡタグの相補的ユニバーサルプライミング配列および確率論的に選択された記録タグがアニーリングする。分子内プライマー伸長反応を使用して、記録タグからＣ末端ＤＮＡタグへと情報を移行させる。（Ｉ）ペプチドの内部記録タグを、無水マレイン酸を介してリシン残基にカップリングする。このカップリングは酸性ｐＨで可逆的である。内部記録タグを、酸性ｐＨにてペプチドのリシン残基から切断し、Ｃ末端記録タグはそのまま残る。任意選択で、新しく露出したリシン残基を、プロピオン無水物などの非加水分解性無水物でブリッキングしてもよい。同上。

図４１は、ＮＧＰＳアッセイの好ましい実施形態のワークフローを示す。

図４２Ａ〜４２Ｄは、ＮＧＰＳシーケンシングアッセイの例示的なステップを示す。記録タグで標識した表面に結合されているペプチドのＮ末端アミノ酸（ＮＴＡＡ）アセチル化またはアミジン化ステップは、ＮＴＡＡ結合性物質が、アセチル化ＮＴＡＡに結合するように遺伝子操作されているか、または天然ＮＴＡＡに結合するように遺伝子操作されているかに応じて、ＮＴＡＡ結合性物質による結合の前に生じてもよく、または結合の後で生じてもよい。第１の場合、（Ａ）まず、ペプチドのＮＴＡＡを、無水酢酸を使用して化学的手段により、またはＮ末端アセチルトランスフェラーゼ（ＮＡＴ）を用いて酵素的にアセチル化する。（Ｂ）ＮＴＡＡは、遺伝子操作されたアンチカリン、アミノアシルｔＲＮＡシンテターゼ（ａａＲＳ）、ＣｌｐＳなどのＮＴＡＡ結合性物質により認識される。ＤＮＡコーディングタグは、結合性物質に付着しており、特定のＮＴＡＡ結合性物質を識別するバーコードエンコーダー配列を含む。（Ｃ）アセチル化ＮＴＡＡがＮＴＡＡ結合性物質と結合した後に、ＤＮＡコーディングタグは、相補的配列を介して記録タグと一時的にアニーリングし、コーディングタグ情報が、ポリメラーゼ伸長により記録タグへと移行される。代替的な実施形態では、記録タグ情報は、ポリメラーゼ伸長によりコーディングタグへと移行される。（Ｄ）アセチル化ＮＴＡＡは、アセチル化ペプチドの末端アセチル化アミノ酸の加水分解を触媒する遺伝子操作されたアシルペプチドヒドロラーゼ（ＡＰＨ）によりペプチドから切断される。アセチル化ＮＴＡＡの切断後、このサイクルは、新たに露出したＮＴＡＡのアセチル化から開始して自発的に繰り返される。Ｎ末端アセチル化が、ＮＴＡＡ修飾／切断の例示的なモードとして使用されているが、その代わりに、グアニル部分などの他のＮ末端部分を、それに応じて切断化学を変更して置換してもよい。グアニジン化を用いる場合、グアニル化ＮＴＡＡは、０．５〜２％ＮａＯＨ溶液を使用して、穏やかな条件下で切断することができる（その全体が参照により組み込まれる、Ｈａｍａｄａ、２０１６年を参照されたい）。ＡＰＨは、ブロッキングされたペプチドのＮα−アセチル化アミノ酸の除去を触媒することができるセリンペプチダーゼであり、プロリルオリゴペプチダーゼ（ＰＯＰ）ファミリー（クランＳＣ、ファミリーＳ９）に属する。ＡＰＨは、真核生物細胞、細菌細胞、および古細菌細胞のＮ−末端アセチル化タンパク質の重要な制御因子である。

図４３Ａ〜４３Ｂは、例示的な記録タグ−コーディングタグ設計特徴を示す。（Ａ）例示的な記録タグ付随タンパク質（またはペプチド）および付随するコーディングタグを有する結合されている結合性物質（例えば、アンチカリン）の構造。プライマー伸長反応での確率論的な非鋳型３’末端アデノシン（Ａ）付加を受け入れるために、コーディングタグのスペーサー（Ｓｐ’）とバーコード（ＢＣ’）配列との間にチミジン（Ｔ）塩基が挿入されている。（Ｂ）ＤＮＡコーディングタグは、ＳｐｙＣａｔｃｈｅｒ−ＳｐｙＴａｇタンパク質−ペプチド相互作用により結合性物質（例えば、アンチカリン）に付着している。

図４４Ａ〜４４Ｅは、記録タグへの切断性物質のハイブリダイゼーションを使用したＮＴＡＡ切断反応の増強を示す（Ａ）および（Ｂ）。固相基材（例えば、ビーズ）に付着している記録タグ標識ペプチドのＮＴＡＡを、例えば、ＰＩＴＣ、ＤＮＰ、ＳＮＰ、アセチル修飾因子、グアニジン化などで修飾または標識する（Ｍｏｄ）。（Ｃ）切断酵素（例えば、アシルペプチドヒドロラーゼ（ＡＰＨ）、アミノペプチダーゼ（ＡＰ）、エドマナーゼなど）を、記録タグのユニバーサルプライミング配列に相補的なユニバーサルプライミング配列を含むＤＮＡタグに付着させる。切断酵素は、切断酵素のＤＮＡタグおよび記録タグの相補的ユニバーサルプライミング配列のハイブリダイゼーションにより、修飾ＮＴＡＡに動員される。（Ｄ）このハイブリダイゼーションステップは、ＮＴＡＡに対する切断酵素の有効親和性を大幅に向上させる。（Ｅ）切断されたＮＴＡＡは、遠方に拡散し、付随する切断酵素は、ハイブリダイズされたＤＮＡタグを剥離することにより除去することができる。

図４５は、ペプチドリガーゼ＋プロテアーゼ＋ジアミノペプチダーゼを使用したサイクル分解ペプチド配列決定を示す。ブテラーゼＩにより、ＴＥＶ−ブテラーゼＩペプチド基質（ＴＥＮＬＹＦＱＮＨＶ、配列番号１３２）が、クエリペプチドのＮＴＡＡにライゲーションされる。ブテラーゼは、ペプチド基質のＣ末端にＮＨＶモチーフを必要とする。ライゲーション後、タバコエッチウイルス（ＴＥＶ）プロテアーゼを使用して、グルタミン（Ｑ）残基の後でキメラペプチド基質を切断して、クエリペプチドのＮ末端にアスパラギン（Ｎ）残基が付着したキメラペプチドが得られる。２つのアミノ酸残基をＮ末端から切断するジアミノペプチダーゼ（ＤＡＰ）またはジペプチジルペプチダーゼにより、Ｎ付加されたクエリペプチドが２つのアミノ酸だけ短くなり、クエリペプチドのアスパラギン残基（Ｎ）および元のＮＴＡＡが効果的に除去される。新たに露出したＮＴＡＡを、本明細書で提供されているような結合性物質を使用して読み取り、その後、サイクル全体を「ｎ」回繰り返して、「ｎ」個のアミノ酸を配列決定する。ストレプトアビジン−ＤＡＰ金属酵素キメラタンパク質を使用することにより、およびビオチン部分をＮ末端アスパラギン残基に係留することにより、ＤＡＰ処理能力の制御を可能にすることができる。

本明細書において具体的に定義されていない用語には、本開示および文脈を踏まえて当業者により与えられる意味であろう意味が与えられるべきである。しかし、本明細書で使用される場合、それに反する指定がなければ、用語は示された意味を有する。
Ｉ．緒言

本開示は、一部において、タンパク質およびペプチドの特徴付けおよび配列決定に直接適用される、高度に並行な、ハイスループットなデジタル巨大分子特徴付けおよび定量化方法を提供する（図１Ｂ、図２Ａを参照されたい）。本明細書に記載の方法では、識別情報を核酸分子または配列決定可能なポリマーの形態で有するコーディングタグを含む結合性物質を使用し、ここで、結合性物質は、目的の巨大分子と相互作用するものである。多数の連続的な結合サイクルを実施し、各サイクルは、プールされた試料を表すものであることが好ましい、固体支持体上に固定化した複数の巨大分子を複数の結合性物質に曝露させることを含む。各結合サイクル中、巨大分子に結合する各結合性物質の同一性、および任意選択で結合サイクル数を、結合性物質コーディングタグから巨大分子と共局在する記録タグに情報を移行させることによって記録する。代替の実施形態では、付随する巨大分子に関する識別情報を含む記録タグからの情報を、結合した結合性物質のコーティングタグ（例えば、伸長コーディングタグを形成するため）または第３の「ジタグ」構築物に移行させることができる。多数サイクルの結合事象により、巨大分子と共局在する記録タグに関する歴史的な結合情報が構築され、それにより、多数のコーディングタグを含む伸長記録タグが、所与の巨大分子についての時間的な結合履歴を表す共直線的な順序で生じる。さらに、サイクル特異的コーディングタグを使用して各サイクルからの情報を追跡することができ、したがって、あるサイクルが何らかの理由でスキップされた場合に、伸長記録タグがその後のサイクルで情報を収集し続け、情報が欠如したサイクルを識別することができる。

あるいは、コーディングタグから記録タグに情報を書き込むまたは移行させる代わりに、付随する巨大分子に関する識別情報を含む記録タグから、伸長コーディングタグを形成するコーディングタグまたは第３のジタグ構築物に情報を移行させることができる。得られた伸長コーディングタグまたはジタグを、その後の配列解析のために各結合サイクル後に収集することができる。バーコード（例えば、分配タグ、コンパートメントタグ、試料タグ、画分タグ、ＵＭＩ、またはそれらの任意の組合せ）を含む記録タグ上の識別情報を使用して、伸長コーディングタグまたはジタグ配列読み取りを元の巨大分子にマッピングし戻すことができる。このように、巨大分子の結合履歴の核酸コードライブラリー表示を生成する。この核酸コードライブラリーを、非常にハイスループットの次世代デジタルシーケンシング法を使用して増幅させ、解析し、それにより、実行当たり数百万〜数十億の分子を解析することができる。結合情報に関する核酸コードライブラリーの創出は、ハイブリダイゼーションを使用するＤＮＡに基づく技法による濃縮、サブトラクション、および正規化が可能になるという点で、別のように有用である。これらのＤＮＡに基づく方法は、容易におよび迅速に大規模化可能かつカスタマイズ可能であり、タンパク質ライブラリーなどの他の種類の巨大分子ライブラリーの直接操作のために利用可能なものよりも費用効果が大きい。したがって、結合情報に関する核酸コードライブラリーを配列決定前に１つまたは複数の技法によって処理して、配列の表示を濃縮および／またはサブトラクションおよび／または正規化することができる。これにより、最大の目的の情報が、個々のメンバーの豊富さが多数の桁にわたって最初に変動し得る非常に大きなライブラリーから、はるかに効率的に、迅速に、かつ大きな費用効果で抽出される。重要なことに、ライブラリー表示を操作するためのこれらの核酸に基づく技法は、より慣習的な方法と直交性のものであり、それらと組み合わせて使用することができる。例えば、アルブミンなどの、一般的な、極めて豊富なタンパク質を、望ましくないタンパク質の全てではないが大多数を除去することができるタンパク質に基づく方法を使用してサブトラクションすることができる。その後、伸長記録タグライブラリーのアルブミン特異的メンバーもサブトラクションし、したがって、より徹底的な全体的サブトラクションを実現することができる。

一態様では、本開示は、ＤＮＡ記録タグで標識されたペプチドの大きな集団（例えば、数百万〜数十億）からの配列決定を可能にする、エドマン様分解手法を使用した、ペプチド配列決定のための高度に並行化された手法を提供する。これらの記録タグで標識されたペプチドは、タンパク質試料のタンパク質分解による消化または限定された加水分解に由来するものであり、記録タグで標識されたペプチドは、配列決定基板（例えば、多孔質ビーズ）に、基板上の適切な分子間間隔でランダムに固定化される。ＮＴＡＡ切断反応を触媒するまたは動員する、フェニルチオカルバモイル（ＰＴＣ）、ジニトロフェノール（ＤＮＰ）、スルホニルニトロフェノール（ＳＮＰ）、ダンシル、７−メトキシクマリン、アセチル、またはグアニジニルなどの小さな化学的部分を用いたペプチドのＮ末端アミノ酸（ＮＴＡＡ）残基の修飾により、エドマン様分解プロセスの周期的制御が可能になる。修飾用化学的部分により、同類のＮＴＡＡ結合性物質に対する結合親和性の増強をもたらすこともできる。各固定化ペプチドの修飾されたＮＴＡＡを、コーディングタグを含む同類のＮＴＡＡ結合性物質の結合、および、コーディングタグ情報（例えば、結合性物質に関する識別情報をもたらすエンコーダー配列）のコーディングタグからペプチドの記録タグへの移行（例えば、プライマー伸長またはライゲーション）によって識別する。その後、修飾されたＮＴＡＡを化学的方法または酵素的手段によって除去する。ある特定の実施形態では、修飾されたＮＴＡＡの除去を触媒させるために酵素（例えば、エドマナーゼ）を工学的に操作する。他の実施形態では、アミノペプチダーゼまたはアシルペプチドヒドロラーゼなどの天然に存在するエキソペプチダーゼを、適切な化学修飾の存在下でのみ末端アミノ酸を切断するように工学的に操作することができる。
ＩＩ．定義

以下の説明では、種々の実施形態の詳細な理解をもたらすために、ある特定の具体的詳細を記載する。しかし、これらの詳細を伴わずに本化合物を作製および使用できることが当業者には理解されよう。他の場合では、実施形態の説明が不必要に不明瞭になるのを回避するために、周知の構造は詳細に示されていないまたは記載されていない。文脈上異なる解釈を要する場合を除き、本明細書およびそれが従う特許請求の範囲全体を通して、「含む（ｃｏｍｐｒｉｓｅ）」という単語および「含む（ｃｏｍｐｒｉｓｅｓ）」および「含む（ｃｏｍｐｒｉｓｉｎｇ）」などのその変形は、制限のない、包括的な意味で、すなわち、「含むが、これだけに限定されない（ｉｎｃｌｕｄｉｎｇ，ｂｕｔｎｏｔｌｉｍｉｔｅｄｔｏ）」と解釈されるべきである。さらに、「含む（ｃｏｍｐｒｉｓｉｎｇ）」という用語（および「含む（ｃｏｍｐｒｉｓｅ）」または「含む（ｃｏｍｐｒｉｓｅｓ）」または「有する（ｈａｖｉｎｇ）」または「含む（ｉｎｃｌｕｄｉｎｇ）」などの関連する用語）は、他のある特定の実施形態では、例えば、本明細書に記載の任意の組成物（ｃｏｍｐｏｓｉｔｉｏｎｏｆｍａｔｔｅｒ）、組成物（ｃｏｍｐｏｓｉｔｉｏｎ）、方法、またはプロセスなどのある実施形態が、記載されている特徴「からなる（ｃｏｎｓｉｓｔｏｆ）」または「から本質的になる（ｃｏｎｓｉｓｔｅｓｓｅｎｔｉａｌｌｙｏｆ）」ものであり得ることを排除するものではない。本明細書で提示される表題は単に便宜上のものであり、特許請求された実施形態の範囲または意味とは解釈されない。

本明細書全体を通して、「一実施形態」または「ある実施形態」への言及は、当該実施形態に関連して記載される特定の特徴、構造または特性が少なくとも１つの実施形態に含まれることを意味する。したがって、本明細書全体を通して各所での「一実施形態では」または「ある実施形態では」という句の出現は、必ずしも全てが同じ実施形態について言及しているのではない。さらに、特定の特徴、構造、または特性は、任意の適切な様式で組み合わせて１つまたは複数の実施形態にすることができる。

本明細書で使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」および「その（ｔｈｅ）」は、文脈により明確に別段の規定がなされない限り、複数の指示対象を包含する。したがって、例えば、「１つのペプチド（ａｐｅｐｔｉｄｅ）」への言及は、１つもしくは複数のペプチド、またはペプチドの混合物を含む。また、特に明記されていないまたは文脈から明らかでない限り、本明細書で使用される場合、「または（ｏｒ）」という用語は、包括的であり、「または（ｏｒ）」と「および（ａｎｄ）」の両方を包含するものと理解される。

本明細書で使用される場合、「巨大分子」という用語は、より小さなサブユニットで構成される大きな分子を包含する。巨大分子の例としては、これだけに限定されないが、ペプチド、ポリペプチド、タンパク質、核酸、炭水化物、脂質、大環状分子が挙げられる。巨大分子は、共有結合により連結した２つまたはそれよりも多くの型の巨大分子の組合せで構成されるキメラ巨大分子（例えば、核酸と連結したペプチド）も含む。巨大分子は、２つまたはそれよりも多くの巨大分子の非共有結合性の複合体で構成される「巨大分子集合体」も含み得る。巨大分子集合体は、同じ型の巨大分子で構成されるもの（例えば、タンパク質−タンパク質）であってもよく、２つまたはそれよりも多くの異なる型の巨大分子で構成されるもの（例えば、タンパク質−ＤＮＡ）であってもよい。

本明細書で使用される場合、「ペプチド」という用語は、ペプチド、ポリペプチドおよびタンパク質を包含し、ペプチド結合によって接合した２つまたはそれよりも多くのアミノ酸の鎖を含む分子を指す。一般に述べると、２０〜３０個よりも多くのアミノ酸を有するペプチドが一般にポリペプチドと称され、５０個よりも多くのアミノ酸を有するペプチドが一般にタンパク質と称される。ペプチドのアミノ酸は、最も典型的にはＬ−アミノ酸であるが、Ｄ−アミノ酸、修飾されたアミノ酸、アミノ酸類似体、アミノ酸模倣物、またはそれらの任意の組合せであってもよい。ペプチドは、天然に存在するものであってもよく、合成的に作製されたものであってもよく、組換えによって発現させたものであってもよい。ペプチドは、アミノ酸の鎖を修飾する追加的な基、例えば、翻訳後修飾によって付加された官能基も含んでよい。

本明細書で使用される場合、「アミノ酸」という用語は、ペプチドの単量体サブユニットとして機能する、アミン基、カルボン酸基、および各アミノ酸に特異的な側鎖を有する有機化合物を指す。アミノ酸は、２０種の標準の天然に存在するまたは正規のアミノ酸ならびに非標準アミノ酸を含む。標準の天然に存在するアミノ酸としては、アラニン（ＡまたはＡｌａ）、システイン（ＣまたはＣｙｓ）、アスパラギン酸（ＤまたはＡｓｐ）、グルタミン酸（ＥまたはＧｌｕ）、フェニルアラニン（ＦまたはＰｈｅ）、グリシン（ＧまたはＧｌｙ）、ヒスチジン（ＨまたはＨｉｓ）、イソロイシン（ＩまたはＩｌｅ）、リシン（ＫまたはＬｙｓ）、ロイシン（ＬまたはＬｅｕ）、メチオニン（ＭまたはＭｅｔ）、アスパラギン（ＮまたはＡｓｎ）、プロリン（ＰまたはＰｒｏ）、グルタミン（ＱまたはＧｌｎ）、アルギニン（ＲまたはＡｒｇ）、セリン（ＳまたはＳｅｒ）、トレオニン（ＴまたはＴｈｒ）、バリン（ＶまたはＶａｌ）、トリプトファン（ＷまたはＴｒｐ）、およびチロシン（ＹまたはＴｙｒ）が挙げられる。アミノ酸は、Ｌ−アミノ酸であってもＤ−アミノ酸であってもよい。非標準アミノ酸は、天然に存在するまたは化学的に合成された修飾されたアミノ酸、アミノ酸類似体、アミノ酸模倣物、非標準タンパク質新生性アミノ酸、または非タンパク質新生性アミノ酸であり得る。非標準アミノ酸の例としては、これだけに限定されないが、セレノシステイン、ピロリジン、およびＮ−ホルミルメチオニン、β−アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、３−置換アラニン誘導体、グリシン誘導体、環置換フェニルアラニンおよびチロシン誘導体、直鎖コアアミノ酸、Ｎ−メチルアミノ酸が挙げられる。

本明細書で使用される場合、「翻訳後修飾」という用語は、リボソームによるペプチドの翻訳が完了した後に当該ペプチド上で生じる修飾を指す。翻訳後修飾は、共有結合性修飾または酵素的修飾であり得る。翻訳後修飾の例としては、これだけに限定されないが、アシル化、アセチル化、アルキル化（メチル化を含む）、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ−カルボキシル化、グルタミル化、グリシル化、グリコシル化、グリコシルホスファチジルイノシトール付加（ｇｌｙｐｉａｔｉｏｎ）、ヘムＣ付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、Ｓ−グルタチオン化、Ｓ−ニトロシル化、Ｓ−スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびＣ末端アミド化が挙げられる。翻訳後修飾は、ペプチドのアミノ末端および／またはカルボキシル末端の修飾を含む。末端アミノ基の修飾としては、これだけに限定されないが、デスアミノ、Ｎ−低級アルキル、Ｎ−ジ低級アルキル、およびＮ−アシル修飾が挙げられる。末端カルボキシ基の修飾としては、これだけに限定されないが、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾（例えば、低級アルキルはＣ_１〜Ｃ_４アルキルである）が挙げられる。翻訳後修飾は、例えば、これだけに限定されないが、アミノ末端とカルボキシ末端の間にあるアミノ酸の、上記のものなどの修飾も含む。翻訳後修飾という用語は、１つまたは複数の検出可能な標識を含むペプチド修飾も含み得る。

本明細書で使用される場合、「結合性物質」という用語は、巨大分子または巨大分子の成分もしくは特徴に結合する、結び付く、それと合体する、それを認識する、またはそれと組み合わさる核酸分子、ペプチド、ポリペプチド、タンパク質、炭水化物、または小分子を指す。結合性物質は、巨大分子または巨大分子の成分もしくは特徴と共有結合性の結び付きまたは非共有結合性の結び付きを形成し得る。結合性物質はまた、核酸分子−ペプチドキメラ結合性物質または炭水化物−ペプチドキメラ結合性物質などの、２つまたはそれよりも多くの型の分子で構成されるキメラ結合性物質であってもよい。結合性物質は、天然に存在する分子であってもよく、合成的に作製された分子であってもよく、組換えによって発現させた分子であってもよい。結合性物質は、巨大分子の単一の単量体またはサブユニット（例えば、ペプチドの単一のアミノ酸）に結合し得る、または巨大分子の複数の連結したサブユニット（例えば、より長いペプチド、ポリペプチド、もしくはタンパク質分子のジ−ペプチド、トリ−ペプチド、またはより高次のペプチド）に結合し得る。結合性物質は、直鎖状分子または三次元構造（コンフォメーションとも称される）を有する分子に結合し得る。例えば、抗体結合性物質は、直鎖ペプチド、ポリペプチド、もしくはタンパク質に結合し得る、または、コンフォメーションペプチド、ポリペプチド、もしくはタンパク質に結合し得る。結合性物質は、ペプチド、ポリペプチド、またはタンパク質分子のＮ末端ペプチド、Ｃ末端ペプチド、または介在するペプチドに結合し得る。結合性物質は、ペプチド分子のＮ末端アミノ酸、Ｃ末端アミノ酸、または介在するアミノ酸に結合し得る。結合性物質は、好ましくは、化学修飾されたまたは標識されたアミノ酸に、改変されていないまたは標識されていないアミノ酸よりも優先的に結合し得る。例えば、結合性物質は、好ましくは、アセチル部分、グアニル部分、ダンシル部分、ＰＴＣ部分、ＤＮＰ部分、ＳＮＰ部分などで修飾されたアミノ酸に、前記部分を保有しないアミノ酸よりも優先的に結合し得る。結合性物質は、ペプチド分子の翻訳後修飾に結合し得る。結合性物質は、巨大分子の成分もしくは特徴への選択的結合を示し得る（例えば、結合性物質は、２０種の可能性のある天然のアミノ酸残基のうちの１種に選択的に結合することができ、他の１９種の天然のアミノ酸残基には非常に低い親和性で結合するまたは全く結合しない）。結合性物質は、結合性物質が複数の巨大分子の成分もしくは特徴に結合することが可能な場合、より低い選択的結合を示し得る（例えば、結合性物質は、２つまたはそれよりも多くの異なるアミノ酸残基に同様の親和性で結合し得る）。結合性物質は、コーディングタグを含み、これは、リンカーによって結合性物質に接合されている。

本明細書で使用される場合、「リンカー」という用語は、２つの分子を接合するために使用される、ヌクレオチド、ヌクレオチド類似体、アミノ酸、ペプチド、ポリペプチド、または非ヌクレオチド化学的部分の１つまたは複数を指す。リンカーは、結合性物質とコーディングタグを接合するため、記録タグと巨大分子（例えば、ペプチド）を接合するため、巨大分子と固体支持体を接合するため、記録タグと固体支持体などを接合するために使用することができる。ある特定の実施形態では、リンカーにより、２つの分子が酵素反応または化学反応（例えば、クリックケミストリー）を介して接合される。

本明細書で使用される場合、「プロテオミクス」という用語は、細胞、組織、および体液内のプロテオーム、ならびに対応する細胞内および組織内のプロテオームの空間的分布の定量的分析を指す。さらに、プロテオミクス試験は、生物学および定義された生物学的または化学的刺激に応じて継続的に時間変化するプロテオームの動的状態を含む。

本明細書で使用される場合、「非同類結合性物質」という用語は、特定の結合サイクル反応において調査される巨大分子の特徴、成分、またはサブユニットに、対応する巨大分子の特徴、成分、またはサブユニットに高親和性で結合する「同類結合性物質」と比較して、結合することができないまたは低親和性で結合する結合性物質を指す。例えば、ペプチド分子のチロシン残基を結合反応において調査する場合、非同類結合性物質は、チロシン残基に低親和性で結合するまたは全く結合しないものであり、したがって、非同類結合性物質では、コーディングタグ情報を同類結合性物質から記録タグに移行させるために適した条件下でコーディングタグ情報が記録タグに効率的に移行されない。あるいは、ペプチド分子のチロシン残基を結合反応において調査する場合、非同類結合性物質は、チロシン残基に低親和性で結合するまたは全く結合しないものであり、したがって、伸長記録タグではなく伸長コーディングタグを伴う実施形態に適した条件下で、記録タグ情報はコーディングタグに効率的に移行されない。

遊離のアミノ基を有する、ペプチド鎖の一方の末端の末端アミノ酸は、本明細書では、「Ｎ末端アミノ酸」（ＮＴＡＡ）と称される。遊離のカルボキシル基を有する、鎖の他方の末端の末端アミノ酸は、本明細書では、「Ｃ末端アミノ酸」（ＣＴＡＡ）と称される。ペプチドを構成するアミノ酸には、順番に番号を付すことができ、ペプチドは「ｎ」アミノ酸長になる。本明細書で使用される場合、ＮＴＡＡは、ｎ番目のアミノ酸と考えられる（本明細書では「ｎＮＴＡＡ」とも称される）。この命名法を使用すると、Ｎ末端からＣ末端までのペプチドの長さを下方に次のアミノ酸はｎ−１アミノ酸、次いでｎ−２アミノ酸などである。ある特定の実施形態では、ＮＴＡＡ、ＣＴＡＡ、またはその両方を化学的部分で修飾または標識することができる。

本明細書で使用される場合、「バーコード」という用語は、巨大分子（例えば、タンパク質、ポリペプチド、ペプチド）、結合性物質、結合サイクルからの結合性物質のセット、試料巨大分子、試料のセット、コンパートメント（例えば、液滴、ビーズ、または分離された位置）内の巨大分子、コンパートメントのセット内の巨大分子、巨大分子の画分、巨大分子画分のセット、空間的領域または空間的領域のセット、巨大分子のライブラリー、または結合性物質のライブラリーについての一意の識別子タグまたは起源情報をもたらす約２〜約３０塩基（例えば、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９または３０塩基）の核酸分子を指す。バーコードは、人工的な配列であっても天然に存在する配列であってもよい。ある特定の実施形態では、バーコードの集団内の各バーコードは異なるものである。他の実施形態では、バーコードの集団のバーコードの一部が異なる、例えば、バーコードの集団のバーコードの少なくとも約１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９７％、または９９％が異なる。バーコードの集団は、ランダムに生成することもでき、非ランダムに生成することもできる。ある特定の実施形態では、バーコードの集団は、エラー訂正バーコードである。バーコードは、多重化された配列決定データをコンピュータによりデコンボリューションし、個々の巨大分子、試料、ライブラリーなどに由来する配列読み取りを識別するために使用することができる。バーコードはまた、マッピングを増強するための小さなコンパートメント中に分布させた巨大分子の集合のデコンボリューションのために使用することもできる。例えば、ペプチドをプロテオームにマッピングし戻すのではなく、ペプチドをその起源であるタンパク質分子またはタンパク質複合体にマッピングし戻す。

「試料バーコード」は、「試料タグ」とも称され、巨大分子がいずれの試料に由来するかを識別するものである。

「空間バーコード」は、巨大分子が２Ｄまたは３Ｄ組織切片のいずれの領域に由来するかを識別するものである。空間バーコードは、組織切片に関する分子病理学のために使用することができる。空間バーコードにより、組織切片（複数可）由来の複数の試料またはライブラリーのマルチプレックス配列決定が可能になる。

本明細書で使用される場合、「コーディングタグ」という用語は、それに付随する結合性物質に関する識別情報を含む、２および１００ならびにその間のあらゆる整数を含めて約２塩基〜約１００塩基の核酸分子を指す。「コーディングタグ」は、「配列決定可能なポリマー」で作られたものであってよい（例えば、それぞれ、その全体が参照により組み込まれる、Ｎｉｕら、２０１３年、Ｎａｔ．Ｃｈｅｍ．、５巻：２８２〜２９２頁；Ｒｏｙら、２０１５年、Ｎａｔ．Ｃｏｍｍｕｎ．６巻：７２３７頁；Ｌｕｔｚ、２０１５年、Ｍａｃｒｏｍｏｌｅｃｕｌｅｓ、４８巻：４７５９〜４７６７頁を参照されたい）。コーディングタグは、任意選択で片側に１つのスペーサーが隣接するまたは両側にスペーサーが隣接するエンコーダー配列を含む。コーディングタグはまた、任意選択のＵＭＩおよび／または任意選択の結合サイクル特異的バーコードで構成されてもよい。コーディングタグは、一本鎖であっても二本鎖であってもよい。二本鎖コーディングタグは、平滑末端、突出末端、またはその両方を含んでよい。コーディングタグとは、結合性物質、結合性物質に直接付着したコーディングタグとハイブリダイズした相補配列（例えば、二本鎖コーディングタグに関して）、または、伸長記録タグに存在するコーディングタグ情報に直接付着したコーディングタグを指し得る。ある特定の実施形態では、コーディングタグは、結合サイクル特異的スペーサーまたはバーコード、一意の分子識別子、ユニバーサルプライミング部位、またはそれらの任意の組合せをさらに含んでよい。

本明細書で使用される場合、「エンコーダー配列」または「エンコーダーバーコード」という用語は、それが付随する結合性物質に関する識別情報をもたらす、約２塩基〜約３０塩基（例えば、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９または３０塩基）の長さの核酸分子を指す。エンコーダー配列は、それが付随する結合性物質を一意的に識別することができるものである。ある特定の実施形態では、エンコーダー配列により、それが付随する結合性物質および結合性物質が使用される結合サイクルに関する識別情報がもたらされる。他の実施形態では、エンコーダー配列をコーディングタグ内の別の結合サイクル特異的バーコードと組み合わせる。あるいは、エンコーダー配列により、それに付随する結合性物質を２種またはそれよりも多くの異なる結合性物質のセットのメンバーに属するものと識別することができる。一部の実施形態では、解析のためにはこの識別のレベルで十分である。例えば、アミノ酸に結合する結合性物質を伴う一部の実施形態では、ペプチドの特定の位置におけるアミノ酸残基を決定的に識別するのではなく、ペプチドがその位置において２つの可能性のあるアミノ酸のうちの１つを含むことを知ることで十分であり得る。別の例では、タンパク質標的の１種よりも多くのエピトープを認識し、様々な特異性を有する抗体の混合物を含むポリクローナル抗体に共通のエンコーダー配列を使用する。他の実施形態では、エンコーダー配列により可能性のある結合性物質のセットを識別する場合、逐次的な脱コーディング手法を使用して、各結合性物質の一意の識別をもたらすことができる。これは、繰り返される結合のサイクルにおいて所与の結合性物質に対するエンコーダー配列を変動させるによって実現される（Ｇｕｎｄｅｒｓｏｎら、２００４年、ＧｅｎｏｍｅＲｅｓ．、１４巻：８７０〜７頁を参照されたい）。各結合サイクルからのコーディングタグ情報を部分的に識別することにより、他のサイクルからのコーディング情報と組み合わせると、結合性物質について一意の識別子がもたらされ、例えば、個々のコーディングタグ（またはエンコーダー配列）ではなく、コーディングタグの特定の組合せにより、結合性物質に関する一意的識別情報がもたらされる。結合性物質のライブラリー内のエンコーダー配列は同じまたは同様の数の塩基を有することが好ましい。

本明細書で使用される場合、「結合サイクル特異的タグ」、「結合サイクル特異的バーコード」、または「結合サイクル特異的配列」という用語は、特定の結合サイクル内で使用される結合性物質のライブラリーを識別するために使用される一意の配列を指す。結合サイクル特異的タグは、約２塩基〜約８塩基（例えば、２、３、４、５、６、７、または８塩基）の長さを含み得る。結合サイクル特異的タグは、結合性物質のコーディングタグ内に、スペーサー配列の一部として、エンコーダー配列の一部として、ＵＭＩの一部として、またはコーディングタグ内の別の成分として組み入れることができる。

本明細書で使用される場合、「スペーサー」（Ｓｐ）という用語は、記録タグまたはコーディングタグの末端上に存在する約１塩基〜約２０塩基（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、または２０塩基）の長さの核酸分子を指す。ある特定の実施形態では、スペーサー配列は、一方の末端または両方の末端におけるコーディングタグのエンコーダー配列に隣接する。結合性物質の巨大分子への結合後、それらに付随するコーディングタグおよび記録タグ上の相補的なスペーサー配列間のアニーリングにより、それぞれ、結合情報の、プライマー伸長反応またはライゲーションによる記録タグ、コーディングタグ、またはジタグ構築物への移行が可能になる。Ｓｐ’は、Ｓｐに相補的なスペーサー配列を指す。結合性物質のライブラリー内のスペーサー配列は同じ数の塩基を有することが好ましい。共通する（共有されるまたは同一の）スペーサーを結合性物質のライブラリーにおいて使用することができる。スペーサー配列は、特定の結合サイクルにおいて使用される結合性物質を追跡するために、「サイクル特異的」配列を有してよい。スペーサー配列（Ｓｐ）は、結合サイクル全てにわたって一定のものであってもよく、特定のクラスの巨大分子に対して特異的なものであってもよく、結合サイクル数に特異的なものであってもよい。巨大分子クラス特異的スペーサーにより、完了した結合／伸長サイクルからの同類結合性物質の伸長記録タグに存在するコーディングタグ情報が、その後の結合サイクルにおいて同じクラスの巨大分子を認識する別の結合性物質のコーディングタグとクラス特異的スペーサーを介してアニーリングすることが可能になる。正確な同類の対の逐次的な結合によってのみ、相互作用するスペーサーエレメントおよび有効なプライマー伸長がもたらされる。スペーサー配列は、記録タグ内の相補的なスペーサー配列とアニーリングしてプライマー伸長（ポリメラーゼ伸長とも称される）反応を開始させる、またはライゲーション反応のための「副子」をもたらす、または「粘着末端」ライゲーション反応を媒介するために十分な数の塩基を含み得る。スペーサー配列は、コーディングタグ内のエンコーダー配列よりも少ない数の塩基を含み得る。

本明細書で使用される場合、「記録タグ」という用語は、それが付随する巨大分子に関する識別情報を含む核酸分子または配列決定可能なポリマー分子を指す（例えば、それぞれ、その全体が参照により組み込まれる、Ｎｉｕら、２０１３年、Ｎａｔ．Ｃｈｅｍ．、５巻：２８２〜２９２頁；Ｒｏｙら、２０１５年、Ｎａｔ．Ｃｏｍｍｕｎ．、６巻：７２３７頁；Ｌｕｔｚ、２０１５年、Ｍａｃｒｏｍｏｌｅｃｕｌｅｓ、４８巻：４７５９〜４７６７頁を参照されたい）。ある特定の実施形態では、結合性物質が巨大分子に結合した後、結合性物質と連結しているコーディングタグからの情報を、結合性物質が巨大分子に結合している間に巨大分子に付随する記録タグに移行させることができる。他の実施形態では、結合性物質が巨大分子に結合した後、巨大分子に付随する記録タグからの情報を、結合性物質が巨大分子に結合している間に結合性物質と連結しているコーディングタグに移行させることができる。記録タグは、巨大分子に直接連結していてもよく、巨大分子に多機能性リンカーを介して連結していてもよく、固体支持体で巨大分子の近傍にある（または共局在する）ことによって巨大分子に付随していてもよい。記録タグは、連結がコーディングタグ情報を記録タグに移行させるまたはその逆のために使用される方法に適合するものである限りは、５’末端または３’末端に連結していてもよく、内側の部位に連結していてもよい。記録タグは、他の機能的成分、例えば、ユニバーサルプライミング部位、一意の分子識別子、バーコード（例えば、試料バーコード、画分バーコード、空間バーコード、コンパートメントタグなど）、コーディングタグのスペーサー配列と相補的なスペーサー配列、またはそれらの任意の組合せをさらに含んでよい。記録タグのスペーサー配列は、コーディングタグ情報を記録タグに移行させるためにポリメラーゼ伸長を使用する実施形態では記録タグの３’末端にあることが好ましい。

本明細書で使用される場合、「プライマー伸長」という用語は「ポリメラーゼ伸長」とも称され、核酸ポリメラーゼ（例えば、ＤＮＡポリメラーゼ）によって触媒される反応であって、相補鎖とアニーリングする核酸分子（例えば、オリゴヌクレオチドプライマー、スペーサー配列）を、相補鎖を鋳型として使用してポリメラーゼによって伸長させる反応を指す。

本明細書で使用される場合、「一意の分子識別子」または「ＵＭＩ」という用語は、ＵＭＩが連結された各巨大分子（例えば、ペプチド）または結合性物質についての一意の識別子タグをもたらす、約３〜約４０塩基（３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、または４０塩基の長さの核酸分子を指す。巨大分子ＵＭＩは、複数の伸長記録タグからの配列決定データをコンピュータによりデコンボリューションして個々の巨大分子を起源とする伸長記録タグを識別するために使用することができる。結合性物質ＵＭＩは、特定の巨大分子に結合する個々の結合性物質それぞれを識別するために使用することができる。例えば、ＵＭＩを使用して、特定のペプチド分子に存在する単一のアミノ酸に特異的な結合性物質についての個々の結合事象の数を識別することができる。結合性物質または巨大分子に関してＵＭＩおよびバーコードの両方に言及される場合、バーコードは、個々の結合性物質または巨大分子についてのＵＭＩ以外の識別情報（例えば、試料バーコード、コンパートメントバーコード、結合サイクルバーコード）を指すことが理解される。

本明細書で使用される場合、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」または「ユニバーサルプライミング配列」という用語は、ライブラリー増幅のためおよび／または配列決定反応のために使用することができる核酸分子を指す。ユニバーサルプライミング部位としては、これだけに限定されないが、ＰＣＲ増幅のためのプライミング部位（プライマー配列）、一部の次世代シーケンシングプラットフォームにおいてブリッジ増幅を可能にする、フローセル表面上の相補的なオリゴヌクレオチドとアニーリングするフローセルアダプター配列、配列決定プライミング部位、またはこれらの組合せを挙げることができる。ユニバーサルプライミング部位は、次世代デジタルシーケンシングと併せて一般に使用されるものを含めた他の型の増幅のために使用することができる。例えば、伸長記録タグ分子を環状化し、ローリングサークル増幅にユニバーサルプライミング部位を使用して、配列決定鋳型として使用することができるＤＮＡナノボールを形成することができる（Ｄｒｍａｎａｃら、２００９年、Ｓｃｉｅｎｃｅ、３２７巻：７８〜８１頁）。あるいは、記録タグ分子を環状化し、ユニバーサルプライミング部位からのポリメラーゼ伸長によって直接配列決定することができる（Ｋｏｒｌａｃｈら、２００８年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．、１０５巻：１１７６〜１１８１頁）。「フォワード」という用語は、「ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合、「５’」または「センス」と称される場合もある。「リバース」という用語は、ユニバーサルプライミング部位」または「ユニバーサルプライマー」に関連して使用される場合は、「３’」または「アンチセンス」と称される場合もある。

本明細書で使用される場合、「伸長記録タグ」という用語は、結合性物質が巨大分子に結合した後に少なくとも１つの結合性物質のコーディングタグ（またはその相補配列）の情報が移行された記録タグを指す。コーディングタグの情報は、記録タグに直接移行させることもでき（例えば、ライゲーション）、間接的に移行させることもできる（例えば、プライマー伸長）。コーディングタグの情報は、記録タグに酵素的に移行させることもでき、化学的に移行させることもできる。伸長記録タグは、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１２５、１５０、１７５、２００またはそれよりも多くのコーディングタグの結合性物質情報を含み得る。伸長記録タグの塩基配列は、コーディングタグによって識別される結合性物質の結合の時間的および逐次的順序を反映する場合もあり、コーディングタグによって識別される結合性物質の結合の部分的な逐次的順序を反映する場合もあり、コーディングタグによって識別される結合性物質の結合のいかなる順序も反映しない場合もある。ある特定の実施形態では、伸長記録タグ中に存在するコーディングタグ情報は、解析される巨大分子配列を少なくとも２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または１００％の同一性で表す。解析される巨大分子配列が伸長記録タグによって１００％の同一性で表されないある特定の実施形態では、エラーは、結合性物質によるオフターゲットの結合、または「飛ばされた」結合サイクル（例えば、結合サイクル中に結合性物質が巨大分子に結合できないことが原因で、プライマー伸長反応の失敗が原因で）、またはその両方に起因する可能性がある。

本明細書で使用される場合、「伸長コーディングタグ」という用語は、コーディングタグが接合している結合性物質の、記録タグが付随している巨大分子への結合後に少なくとも１つの記録タグ（またはその相補配列）の情報が移行されたコーディングタグを指す。記録タグの情報は、コーディングタグに直接移行させることもでき（例えば、ライゲーション）、間接的に移行させることもできる（例えば、プライマー伸長）。記録タグの情報は、酵素的に移行させることもでき、化学的に移行させることもできる。ある特定の実施形態では、伸長コーディングタグは、１つの結合事象を反映する１つの記録タグの情報を含む。本明細書で使用される場合、「ジタグ」または「ジタグ構築物」または「ジタグ分子」という用語は、コーディングタグが接合している結合性物質の、記録タグが付随する巨大分子への結合後に少なくとも１つの記録タグ（またはその相補配列）の情報および少なくとも１つのコーディングタグ（またはその相補配列）が移行された核酸分子を指す（図１１Ｂを参照されたい）。記録タグの情報およびコーディングタグは、ジタグに間接的に移行させることができる（例えば、プライマー伸長）。記録タグの情報は、酵素的に移行させることもでき、化学的に移行させることもできる。ある特定の実施形態では、ジタグは、記録タグのＵＭＩ、記録タグのコンパートメントタグ、記録タグのユニバーサルプライミング部位、コーディングタグのＵＭＩ、コーディングタグのエンコーダー配列、結合サイクル特異的バーコード、コーディングタグのユニバーサルプライミング部位、またはそれらの任意の組合せを含む。

本明細書で使用される場合、「固体支持体」、「固体表面」、または「固体基板」または「基板」という用語は、巨大分子（例えば、ペプチド）を、共有結合性の相互作用および非共有結合性の相互作用またはそれらの任意の組合せを含めた当技術分野で公知の任意の手段によって直接または間接的に結び付けることができる、多孔質材料および非多孔質材料を含めた任意の固体材料を指す。固体支持体は、２次元（例えば、平面）であってもよく、３次元（例えば、ゲルマトリックスまたはビーズ）であってもよい。固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、フローセル、信号変換電子機器を含めたバイオチップ、チャネル、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ポリマーマトリックス、ナノ粒子、またはマイクロスフェアを含めた任意の支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン（登録商標）、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸（ｐｏｌｙａｃｔｉｃａｃｉｄ）、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、デキストラン、またはそれらの任意の組合せが挙げられる。固体支持体は、薄膜、膜、ビン、ディッシュ、繊維、織られた繊維、チューブなどの成形ポリマー、粒子、ビーズ、マイクロスフェア、微小粒子、またはそれらの任意の組合せをさらに含む。例えば、固体表面がビーズである場合、ビーズは、これだけに限定されないが、セラミックビーズ、ポリスチレンビーズ、ポリマービーズ、メチルスチレンビーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズを含み得る。ビーズは、球状であっても不規則な形状であってもよい。ビーズのサイズは、ナノメートル、例えば１００ｎｍから、ミリメートル、例えば１ｍｍまでにわたり得る。ある特定の実施形態では、ビーズのサイズは、約０．２ミクロンから約２００ミクロンまで、または約０．５ミクロンから約５ミクロンまでにわたる。一部の実施形態では、ビーズは、直径約１μｍ、約１．５μｍ、約２μｍ、約２．５μｍ、約２．８μｍ、約３μｍ、約３．５μｍ、約４μｍ、約４．５μｍ、約５μｍ、約５．５μｍ、約６μｍ、約６．５μｍ、約７μｍ、約７．５μｍ、約８μｍ、約８．５μｍ、約９μｍ、約９．５μｍ、約１０μｍ、約１０．５μｍ、約１５μｍ、または約２０μｍであり得る。ある特定の実施形態では、「ビーズ（ａｂｅａｄ）」固体支持体とは、個々のビーズを指す場合もあり、複数のビーズを指す場合もある。

本明細書で使用される場合、「核酸分子」または「ポリヌクレオチド」という用語は、３’−５’リン酸ジエステル結合で連結されたデオキシリボヌクレオチドまたはリボヌクレオチドを含有する一本鎖または二本鎖ポリヌクレオチド、ならびにポリヌクレオチド類似体を指す。核酸分子としては、これだけに限定されないが、ＤＮＡ、ＲＮＡ、およびｃＤＮＡが挙げられる。ポリヌクレオチド類似体は、天然のポリヌクレオチドにおいて見出される標準のリン酸ジエステル連結以外の骨格、および任意選択で、修飾された糖部分またはリボースもしくはデオキシリボース以外の部分を有し得る。ポリヌクレオチド類似体は、標準のポリヌクレオチド塩基とワトソン・クリック塩基対合によって水素結合することが可能な塩基を含有し、ここで、類似体骨格は、当該塩基を、そのような水素結合がオリゴヌクレオチド類似体分子と標準のポリヌクレオチド内の塩基との間で配列特異的に可能になるように提示する。ポリヌクレオチド類似体の例としては、これだけに限定されないが、異種核酸（ｘｅｎｏｎｕｃｌｅｉｃａｃｉｄ）（ＸＮＡ）、架橋核酸（ＢＮＡ）、グリコール核酸（ＧＮＡ）、ペプチド核酸（ＰＮＡ）、γＰＮＡ、モルホリノポリヌクレオチド、ロックド核酸（ＬＮＡ）、トレオース核酸（ＴＮＡ）、２’−Ｏ−メチルポリヌクレオチド、２’−Ｏ−アルキルリボシル置換ポリヌクレオチド、ホスホロチオエートポリヌクレオチド、およびボロノホスフェートポリヌクレオチドが挙げられる。ポリヌクレオチド類似体は、例えば、７−デアザプリン類似体、８−ハロプリン類似体、５−ハロピリミジン類似体、または、ヒポキサンチン、ニトロアゾール、イソカルボスチリル類似体、アゾールカルボキサミド、および芳香族トリアゾール類似体を含めた、任意の塩基と対合することができるユニバーサル塩基類似体、または、親和性結合のためのビオチン部分などの追加的な機能性を有する塩基類似体を含めたプリンまたはピリミジン類似体を有し得る。

本明細書で使用される場合、「核酸配列決定」とは、核酸分子内または核酸分子の試料中のヌクレオチドの順序を決定することを意味する。

本明細書で使用される場合、「次世代シーケンシング」は、数百万〜数十億の分子を並行して配列決定することを可能にするハイスループットな配列決定法を指す。次世代シーケンシング法の例としては、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、およびパイロシーケンシングが挙げられる。プライマーを固体基板および核酸分子に対する相補配列に付着させることにより、核酸分子を固体基板にプライマーを介してハイブリダイズさせることができ、次いで、固体基板上の別個の領域においてポリメラーゼを使用することによって多数のコピーを生成させて、増幅させることができる（これらの群分けは、時にはポリメラーゼコロニーまたはポロニーと称される）。したがって、配列決定プロセス中、特定の位置にあるヌクレオチドについて多数回配列決定することができる（例えば、数百回または数千回）−このカバレッジの深さは、「ディープシーケンシング」と称される。ハイスループットな核酸配列決定技術の例としては、Ｓｅｒｖｉｃｅ（Ｓｃｉｅｎｃｅ、３１１巻：１５４４〜１５４６頁、２００６年）によって概説されている通り、並行ビーズアレイ、合成による配列決定、ライゲーションによる配列決定、キャピラリー電気泳動、電子マイクロチップ、「バイオチップ」、マイクロアレイ、並行マイクロチップ、および単一分子アレイなどの形式を含めた、Ｉｌｌｕｍｉｎａ、ＢＧＩ、Ｑｉａｇｅｎ、Ｔｈｅｒｍｏ−Ｆｉｓｈｅｒ、およびＲｏｃｈｅにより提供されるプラットフォームが挙げられる。

本明細書で使用される場合、「単一分子シーケンシング」または「第３世代シーケンシング」とは、単一分子シーケンシング装置からの読み取りがＤＮＡの単一分子の配列決定によって生成される次世代シーケンシング法を指す。段階的な手法で配列決定するために増幅に依拠して多くのＤＮＡ分子を並行してクローニングする次世代シーケンシング法とは異なり、単一分子シーケンシングでは、ＤＮＡの単一分子を調査し、増幅または同期化の必要はない。単一分子シーケンシングは、各塩基の組み入れ後に配列決定反応を休止する（「ｗａｓｈ−ａｎｄ−ｓｃａｎ」サイクル）必要のある方法、および読み取りステップ間の停止を必要としない方法を含む。単一分子シーケンシング法の例としては、単一分子リアルタイムシーケンシング（ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）、ナノポアに基づく配列決定（ＯｘｆｏｒｄＮａｎｏｐｏｒｅ）、ＤＩ（ｄｕｐｌｅｘｉｎｔｅｒｒｕｐｔｅｄ）ナノポアシーケンシング、および先端顕微鏡を使用したＤＮＡのダイレクトイメージングが挙げられる。

本明細書で使用される場合、巨大分子の「解析」とは、巨大分子の成分の全部または一部を数量化すること、特徴付けること、区別すること、またはこれらの組合せを意味する。例えば、ペプチド、ポリペプチド、またはタンパク質の解析は、ペプチドのアミノ酸配列（連続したまたは連続していない）の全部または一部を決定することを含む。巨大分子の解析は、巨大分子の成分の部分的な識別も含む。例えば、巨大分子タンパク質配列内のアミノ酸の部分的な識別により、タンパク質のアミノ酸を、可能性のあるアミノ酸のサブセットに属するものと識別することができる。解析は、一般にはｎＮＴＡＡの解析で開始され、次いで、次のペプチドのアミノ酸（すなわち、ｎ−１、ｎ−２、ｎ−３など）に進行する。これは、ｎＮＴＡＡが切断され、それにより、ｎ−１ペプチドのアミノ酸がＮ末端アミノ酸に変わることによって実現される（本明細書では、「ｎ−１ＮＴＡＡ」と称される）。ペプチドの解析は、ペプチド上の翻訳後修飾の存在および頻度を決定することも含み得、これは、ペプチド上の翻訳後修飾の逐次的順序に関する情報が含む場合もあり、含まない場合もある。ペプチドの解析は、ペプチド内のエピトープの逐次的順序または位置に関する情報を含む場合もあり、含まない場合もある、ペプチド内のエピトープの存在および頻度を決定することも含み得る。ペプチドの解析は、異なる型の解析を組み合わせること、例えば、エピトープ情報、アミノ酸配列情報、翻訳後修飾情報、またはそれらの任意の組合せを得ることを含み得る。

本明細書で使用される場合、「コンパートメント」という用語は、巨大分子のサブセットを巨大分子の試料から分離または隔離する物理的な領域または容積を指す。例えば、コンパートメントにより、個々の細胞を他の細胞から分離すること、または試料のプロテオームのサブセットを試料の残りのプロテオームから分離することができる。コンパートメントは、水性コンパートメント（例えば、マイクロ流体液滴）、固体コンパートメント（例えば、プレート上のピコタイターウェルまたはマイクロタイターウェル、チューブ、バイアル、ゲルビーズ）、または表面上の分離された領域であってよい。コンパートメントは、巨大分子を固定化することができる１つまたは複数のビーズを含んでよい。

本明細書で使用される場合、「コンパートメントタグ」または「コンパートメントバーコード」という用語は、１つまたは複数のコンパートメント（例えば、マイクロ流体液滴）内の、構成物（例えば、単一の細胞のプロテオーム）に関する識別情報を含む、約４塩基〜約１００塩基（４塩基、１００塩基、およびその間の任意の整数を含む）の一本鎖または二本鎖核酸分子を指す。コンパートメントバーコードにより、試料中の巨大分子のサブセット、例えば、複数（例えば、数百万〜数十億）のコンパートメントから同じ物理的コンパートメントまたはコンパートメントの群に分離されたタンパク質試料のサブセットが識別される。したがって、コンパートメントタグを使用して、同じコンパートメントタグを有する１つまたは複数のコンパートメントに由来する構成物と、異なるコンパートメントタグを有する別のコンパートメント内の構成物を、これらの構成物が一緒にプールされた後であっても区別することができる。各コンパートメント内または２つもしくはそれよりも多くのコンパートメントの群内のタンパク質および／またはペプチドを一意のコンパートメントタグで標識することにより、個々のコンパートメントまたはコンパートメントの群内の同じタンパク質、タンパク質複合体、または細胞に由来するペプチドを識別することができる。コンパートメントタグは、任意選択で片側またはその両側にスペーサー配列が隣接するバーコード、および任意選択のユニバーサルプライマーを含む。スペーサー配列は、記録タグのスペーサー配列に相補的なものであってよく、それにより、コンパートメントタグ情報の記録タグへの移行が可能になる。コンパートメントタグは、特に、コンパートメントタグが、本明細書に記載の下流のペプチド解析方法に使用される記録タグを含む実施形態に関しては、ユニバーサルプライミング部位、一意の分子識別子（それに付着したペプチドに関する識別情報をもたらす）、またはその両方も含んでよい。コンパートメントタグは、ペプチドとのカップリングのための機能的部分（例えば、アルデヒド、ＮＨＳ、ｍＴｅｔ、アルキンなど）を含んでよい。あるいは、コンパートメントタグは、コンパートメントタグと目的のペプチドのライゲーションを可能にするためのタンパク質リガーゼの認識配列を含むペプチドを含んでよい。コンパートメントは、単一のコンパートメントタグ、任意選択のＵＭＩ配列を保存する複数の同一のコンパートメントタグ、または２種またはそれよりも多くの異なるコンパートメントタグを含んでよい。ある特定の実施形態では、各コンパートメントは、一意のコンパートメントタグを含む（１対１のマッピング）。他の実施形態では、より大きなコンパートメントの集団からの多数のコンパートメントは、同じコンパートメントタグを含む（多対１のマッピング）。コンパートメントタグは、コンパートメント内の固体支持体（例えば、ビーズ）に接合していてもよく、コンパートメント自体の表面（例えば、ピコタイターウェルの表面）に接合していてもよい。あるいは、コンパートメントタグは、コンパートメント内の溶液中に遊離していてよい。

本明細書で使用される場合、「分配」という用語は、試料内の巨大分子の集団に由来する巨大分子の亜集団への一意のバーコードのランダムな割り当てを指す。ある特定の実施形態では、分配は、巨大分子をコンパートメントに区分することによって実現することができる。分配は、単一のコンパートメント内の巨大分子で構成されるものであってもよく、コンパートメントの集団に由来する多数のコンパートメント内の巨大分子で構成されるものであってもよい。

本明細書で使用される場合、「分配タグ」または「分配バーコード」とは、分配に関する識別情報を含む、約４塩基〜約１００塩基（４塩基、１００塩基、およびその間の任意の整数を含む）の一本鎖または二本鎖核酸分子を指す。ある特定の実施形態では、巨大分子に関する分配タグは、巨大分子を同じバーコードで標識されたコンパートメント（複数可）に分配することにより生じる同一のコンパートメントタグを指す。

本明細書で使用される場合、「画分」という用語は、サイズ、疎水性、等電点、親和性などによる分画などの物理的または化学的分離方法を使用して残りの試料または細胞小器官から選別された試料内の巨大分子のサブセット（例えば、タンパク質）を指す。分離方法としては、ＨＰＬＣ分離、ゲル分離、アフィニティー分離、細胞分画、細胞小器官分画、組織分画などが挙げられる。流体の流れ、磁性、電流、質量、密度などの物理特性も分離のために使用することができる。

本明細書で使用される場合、「画分バーコード」という用語は、画分内の巨大分子に関する識別情報を含む、約４塩基〜約１００塩基（４塩基、１００塩基、およびその間の任意の整数を含む）の一本鎖または二本鎖核酸分子を指す。
ＩＩＩ．巨大分子の解析方法

本明細書に記載の方法は、巨大分子解析のための、高度に並行化された手法を提供する。高度に多重化された巨大分子結合アッセイを、次世代シーケンシングによる読み取りのために核酸分子ライブラリーに変換する。本明細書において提示される方法は、タンパク質またはペプチド配列決定に特に有用である。

好ましい実施形態では、タンパク質試料を、バーコード（例えば、試料バーコード、コンパートメントバーコード）および任意選択の一意の分子識別子を含む少なくとも１つの核酸記録タグを用いて単一分子レベルで標識する。タンパク質試料にタンパク質分解による消化を行って記録タグで標識されたペプチドの集団（例えば、数百万〜数十億）を生成する。これらの記録タグで標識されたペプチドをプールし、固体支持体（例えば、多孔質ビーズ）上にランダムに固定化する。プールされ、固定化された、記録タグで標識されたペプチドを多数の連続的な結合サイクルに供し、各結合サイクルは、付随する結合性物質を識別するエンコーダー配列を含むコーディングタグで標識された複数の結合性物質（例えば、天然に存在するアミノ酸２０種全てに対する結合性物質）に曝露することを含む。各結合サイクル中、結合性物質のペプチドへの結合に関する情報を、結合性物質のコーディングタグ情報を記録タグに移行させること（または記録タグ情報をコーディングタグに移行させることもしくは記録タグ情報およびコーディングタグ情報の両方を別のジタグ構築物に移行させること）によって捕捉する。結合サイクルが完了したら、アッセイされたペプチドの結合履歴を表す伸長記録タグ（または伸長コーディングタグまたはジタグ構築物）のライブラリーを生成し、これを、非常にハイスループットの次世代デジタルシーケンシング法を使用して解析することができる。記録タグに核酸バーコードを使用することにより、例えば、ペプチド配列の起源である試料、細胞、プロテオームのサブセット、またはタンパク質を識別するために、大量のペプチド配列決定データをデコンボリューションすることが可能になる。

一態様では、巨大分子を解析するための方法であって、（ａ）巨大分子および固体支持体に接合した付随するまたは共局在する記録タグを用意するステップと；（ｂ）巨大分子を、巨大分子に結合することが可能な第１の結合性物質であって、第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；（ｃ）第１のコーディングタグの情報を記録タグに移行させて、一次伸長記録タグを生成するステップと；（ｄ）巨大分子を、巨大分子に結合することが可能な第２の結合性物質であって、第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；（ｅ）第２のコーディングタグの情報を一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップと；（ｆ）二次伸長タグを解析するステップと（例えば、図２Ａ〜Ｄを参照されたい）を含む方法が提供される。

ある特定の実施形態では、接触させるステップ（ｂ）および（ｄ）を逐次的に実施する、例えば、第１の結合性物質と第２の結合性物質を、別々の結合サイクル反応で巨大分子と接触させる。他の実施形態では、接触させるステップ（ｂ）および（ｄ）を同時に、例えば、第１の結合性物質、第２の結合性物質、および任意選択で追加的な結合性物質を含む単一の結合サイクル反応などで実施する。好ましい実施形態では、接触させるステップ（ｂ）および（ｄ）は、それぞれ、巨大分子を複数の結合性物質と接触させることを含む。

ある特定の実施形態では、方法は、ステップ（ｅ）と（ｆ）の間に、（ｘ）第２の結合性物質を巨大分子に結合することが可能な第３の（またはより高次の）結合性物質であって、第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｄ）および（ｅ）を１回または複数回繰り返すステップと；（ｙ）第３の（またはより高次の）コーディングタグの情報を第２の（またはより高次の）伸長記録タグに移行させて、第３の（またはより高次の）伸長記録タグを生成するステップと；（ｚ）第３の（またはより高次の）伸長記録タグを解析するステップとをさらに含む。

第３の（またはより高次の）結合性物質を第１の結合性物質および第２の結合性物質とは別の結合サイクル反応で巨大分子と接触させることができる。あるいは、第３の（またはより高次の）結合性物質を第１の結合性物質、および第２の結合性物質と一緒に単一の結合サイクル反応で巨大分子と接触させることができる。

第２の態様では、巨大分子を解析するための方法であって、（ａ）固体支持体に接合した巨大分子、付随する第１の記録タグおよび付随する第２の記録タグを用意するステップと；（ｂ）巨大分子を、巨大分子に結合することが可能な第１の結合性物質であって、第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；（ｃ）第１のコーディングタグの情報を第１の記録タグに移行させて、第１の伸長記録タグを生成するステップと；（ｄ）巨大分子を、巨大分子に結合することが可能な第２の結合性物質であって、第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；（ｅ）第２のコーディングタグの情報を第２の記録タグに移行させて、第２の伸長記録タグを生成するステップと；（ｆ）第１の伸長記録タグおよび第２の伸長記録タグを解析するステップとを含む方法が提供される。

ある特定の実施形態では、接触させるステップ（ｂ）および（ｄ）を逐次的に実施する、例えば、第１の結合性物質および第２の結合性物質を別々の結合サイクル反応で巨大分子と接触させる。他の実施形態では、接触させるステップ（ｂ）および（ｄ）を同時に、例えば、第１の結合性物質、第２の結合性物質、および任意選択で追加的な結合性物質を含む単一の結合サイクル反応などで実施する。

ある特定の実施形態では、ステップ（ａ）は、固体支持体に接合した付随する第３の（またはより高次の）記録タグを用意するステップをさらに含む。さらなる実施形態では、方法は、ステップ（ｅ）と（ｆ）の間に、（ｘ）第２の結合性物質を巨大分子に結合することが可能な第３の（またはより高次の）結合性物質であって、第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｄ）および（ｅ）を１回または複数回繰り返すステップと；（ｙ）第３の（またはより高次の）コーディングタグの情報を第３の（またはより高次の）記録タグに移行させて、第３の（またはより高次の）伸長記録タグを生成するステップと；（ｚ）第１の伸長記録タグ、第２の伸長記録タグおよび第３の（またはより高次の）伸長記録タグを解析するステップとをさらに含む。

ある特定の実施形態では、第１のコーディングタグ、第２のコーディングタグ、および任意のより高次のコーディングタグはそれぞれ、結合サイクル特異的配列を有する。

第３の態様では、ペプチドを解析する方法であって、（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；（ｂ）ペプチドのＮ末端アミノ酸（ＮＴＡＡ）を化学的部分で修飾して、修飾されたＮＴＡＡを生成するステップと；（ｃ）ペプチドを、修飾されたＮＴＡＡに結合することが可能な第１の結合性物質であって、第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；（ｄ）第１のコーディングタグの情報を記録タグに移行させて、伸長記録タグを生成するステップと；（ｅ）伸長記録タグを解析するステップと（例えば、図３を参照されたい）を含む方法が提供される。

ある特定の実施形態では、ステップ（ｃ）が、前記ペプチドを、前記第２の（またはより高次の）結合性物質に関する識別情報を有する第２の（またはより高次の）コーディングタグを含む第２の（またはより高次の）結合性物質であって、ステップ（ｂ）の前記修飾されたＮＴＡＡ以外の修飾されたＮＴＡＡに結合することが可能である第２の（またはより高次の）結合性物質と接触させることをさらに含む。さらなる実施形態では、ペプチドの第２の（またはより高次の）結合性物質との接触を、ペプチドの第１の結合性物質との接触後に逐次的に行う、例えば、第１の結合性物質および第２の（またはより高次の）結合性物質を別々の結合サイクル反応でペプチドと接触させる。他の実施形態では、ペプチドの第２の（またはより高次の）結合性物質との接触を、ペプチドの第１の結合性物質との接触と同時に、例えば、第１の結合性物質および第２の（またはより高次の）結合性物質）を含む単一の結合サイクル反応などで行う。

ある特定の実施形態では、化学的部分をＮＴＡＡに化学反応または酵素反応を介して付加する。

ある特定の実施形態では、ＮＴＡＡを修飾するために使用される化学的部分は、フェニルチオカルバモイル（ＰＴＣ）、ジニトロフェノール（ＤＮＰ）部分；スルホニルオキシニトロフェニル（ＳＮＰ）部分、ダンシル部分；７−メトキシクマリン部分；チオアシル部分；チオアセチル部分；アセチル部分；グアニジニル部分；またはチオベンジル部分である。

化学的部分は、化学薬剤を使用してＮＴＡＡに付加することができる。ある特定の実施形態では、ＮＴＡＡをＰＴＣ部分で修飾するための化学薬剤は、フェニルイソチオシアネートまたはその誘導体である；ＮＴＡＡをＤＮＰ部分で修飾するための化学薬剤は、２，４−ジニトロベンゼンスルホン酸（ＤＮＢＳ）または１−フルオロ−２，４−ジニトロベンゼン（ＤＮＦＢ）などのハロゲン化アリールである；ＮＴＡＡをスルホニルオキシニトロフェニル（ＳＮＰ）部分で修飾するための化学薬剤は、４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）である；ＮＴＡＡをダンシル基で修飾するための化学薬剤は、ダンシルクロリドなどのスルホニルクロリドである；ＮＴＡＡを７−メトキシクマリン部分で修飾するための化学薬剤は、７−メトキシクマリン酢酸（ＭＣＡ）である；ＮＴＡＡをチオアシル部分で修飾するための化学薬剤は、チオアシル化試薬である；ＮＴＡＡをチオアセチル部分で修飾するための化学薬剤は、チオアセチル化試薬である；ＮＴＡＡをアセチル部分で修飾するための化学薬剤は、アセチル化試薬（例えば、無水酢酸）である；ＮＴＡＡをグアニジニル（アミジニル）部分で修飾するための化学薬剤は、グアニジニル化試薬である、または、ＮＴＡＡをチオベンジル部分で修飾するための化学薬剤は、チオベンジル化試薬である。

第４の態様では、本開示は、ペプチドを解析するための方法であって、（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；（ｂ）ペプチドのＮ末端アミノ酸（ＮＴＡＡ）を化学的部分で修飾して、修飾されたＮＴＡＡを生成するステップと；（ｃ）ペプチドを、修飾されたＮＴＡＡに結合することが可能な第１の結合性物質であって、第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；（ｄ）第１のコーディングタグの情報を記録タグに移行させて、第１の伸長記録タグを生成するステップと；（ｅ）修飾されたＮＴＡＡを除去して、新しいＮＴＡＡを露出させるステップと；（ｆ）ペプチドの新しいＮＴＡＡを化学的部分で修飾して、新しく修飾されたＮＴＡＡを生成するステップと；（ｇ）ペプチドを、新しく修飾されたＮＴＡＡに結合することが可能な第２の結合性物質であって、第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；（ｈ）第２のコーディングタグの情報を第１の伸長記録タグに移行させて、第２の伸長記録タグを生成するステップと；（ｉ）第２の伸長記録タグを解析するステップとを含む方法を提供する。

ある特定の実施形態では、接触させるステップ（ｃ）および（ｇ）を逐次的に実施する、例えば、第１の結合性物質および第２の結合性物質を別々の結合サイクル反応でペプチドと接触させる。

ある特定の実施形態では、方法は、ステップ（ｈ）と（ｉ）の間に、（ｘ）第２の結合性物質を修飾されたＮＴＡＡに結合することが可能な第３の（またはより高次の）結合性物質であって、第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｅ）、（ｆ）および（ｇ）を１回または複数回繰り返すステップと；（ｙ）第３の（またはより高次の）コーディングタグの情報を第２の（またはより高次の）伸長記録タグに移行させて、第３の（またはより高次の）伸長記録タグを生成するステップと；（ｚ）第３の（またはより高次の）伸長記録タグを解析するステップとをさらに含む。

ある特定の実施形態では、化学的部分は、フェニルチオカルバモイル（ＰＴＣ）、ジニトロフェノール（ＤＮＰ）部分；スルホニルオキシニトロフェニル（ＳＮＰ）部分、ダンシル部分；７−メトキシクマリン部分；チオアシル部分；チオアセチル部分；アセチル部分；グアニル部分；またはチオベンジル部分である。

化学的部分は、化学薬剤を使用してＮＴＡＡに付加することができる。ある特定の実施形態では、ＮＴＡＡをＰＴＣ部分で修飾するための化学薬剤は、フェニルイソチオシアネートまたはその誘導体である；ＮＴＡＡをＤＮＰ部分で修飾するための化学薬剤は、２，４−ジニトロベンゼンスルホン酸（ＤＮＢＳ）または１−フルオロ−２，４−ジニトロベンゼン（ＤＮＦＢ）などのハロゲン化アリールである；ＮＴＡＡをスルホニルオキシニトロフェニル（ＳＮＰ）部分で修飾するための化学薬剤は、４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）である；ＮＴＡＡをダンシル基で修飾するための化学薬剤は、ダンシルクロリドなどのスルホニルクロリドである；ＮＴＡＡを７−メトキシクマリン部分で修飾するための化学試薬は、７−メトキシクマリン酢酸（ＭＣＡ）である；ＮＴＡＡをチオアシル部分で修飾するための化学薬剤は、チオアシル化試薬である；ＮＴＡＡをチオアセチル部分で修飾するための化学薬剤は、チオアセチル化試薬である；ＮＴＡＡをアセチル部分で修飾するための化学薬剤は、アセチル化剤（例えば、無水酢酸）である；ＮＴＡＡをグアニル部分で修飾するための化学薬剤は、グアニジニル化試薬である、またはＮＴＡＡをチオベンジル部分で修飾するための化学薬剤は、チオベンジル化試薬である。

第５の態様では、ペプチドを解析するための方法であって、（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；（ｂ）ペプチドを、ペプチドのＮ末端アミノ酸（ＮＴＡＡ）に結合することが可能な第１の結合性物質であって、第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；（ｃ）第１のコーディングタグの情報を記録タグに移行させて、伸長記録タグを生成するステップと；（ｄ）伸長記録タグを解析するステップとを含む方法が提供される。

ある特定の実施形態では、ステップ（ｂ）が、前記ペプチドを、前記第２の（またはより高次の）結合性物質に関する識別情報を有する第２の（またはより高次の）コーディングタグを含む第２の（またはより高次の）結合性物質であって、前記ペプチドの前記ＮＴＡＡ以外のＮＴＡＡに結合することが可能な第２の（またはより高次の）結合性物質と接触させることをさらに含む。さらなる実施形態では、ペプチドの第２の（またはより高次の）結合性物質との接触を、ペプチドの第１の結合性物質との接触後に逐次的に行う、例えば、第１の結合性物質および第２の（またはより高次の）結合性物質を別々の結合サイクル反応でペプチドと接触させる。他の実施形態では、ペプチドの第２の（またはより高次の）結合性物質との接触を、ペプチドを第１の結合性物質と接触させるのと同時に、例えば、第１の結合性物質および第２の（またはより高次の）結合性物質を含む単一の結合サイクル反応などで行う。

第６の態様では、ペプチドを解析するための方法であって、（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；（ｂ）ペプチドを、ペプチドのＮ末端アミノ酸（ＮＴＡＡ）に結合することが可能な第１の結合性物質であって、第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；（ｃ）第１のコーディングタグの情報を記録タグに移行させて、第１の伸長記録タグを生成するステップと；（ｄ）ＮＴＡＡを除去して、ペプチドの新しいＮＴＡＡを露出させるステップと；（ｅ）ペプチドを、新しいＮＴＡＡに結合することが可能な第２の結合性物質であって、第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；（ｆ）第２のコーディングタグの情報を第１の伸長記録タグに移行させて、第２の伸長記録タグを生成するステップと；（ｇ）第２の伸長記録タグを解析するステップとを含む方法が提供される。

ある特定の実施形態では、方法は、ステップ（ｆ）と（ｇ）の間に、（ｘ）第２の結合性物質を巨大分子に結合することが可能な第３の（またはより高次の）結合性物質であって、第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｄ）、（ｅ）および（ｆ）を１回または複数回繰り返すステップと；（ｙ）第３の（またはより高次の）コーディングタグの情報を第２の（またはより高次の）伸長記録タグに移行させて第３の（またはより高次の）伸長記録タグを生成するステップとをさらに含み、ステップ（ｇ）において第３の（またはより高次の）伸長記録タグを解析する。

ある特定の実施形態では、接触させるステップ（ｂ）および（ｅ）を逐次的に実施する、例えば、第１の結合性物質および第２の結合性物質を別々の結合サイクル反応でペプチドと接触させる。

本明細書において提示される実施形態のいずれかでは、方法は、複数の巨大分子を並行して解析することを含む。好ましい実施形態では、方法は、複数のペプチドを並行して解析することを含む。

本明細書において提示される実施形態のいずれかでは、巨大分子（またはペプチド）を結合性物質と接触させるステップは、巨大分子（またはペプチド）を複数の結合性物質と接触させることを含む。

本明細書において提示される実施形態のいずれかでは、巨大分子は、タンパク質、ポリペプチド、またはペプチドであってよい。さらなる実施形態では、ペプチドは、生体試料に由来するタンパク質またはポリペプチドを断片化することによって得ることができる。

本明細書において提示される実施形態のいずれかでは、巨大分子は、炭水化物、脂質、核酸、もしくは大環状分子であるまたはそれを含んでよい。

本明細書において提示される実施形態のいずれかでは、記録タグは、ＤＮＡ分子、修飾塩基を有するＤＮＡ分子、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＰＮＡ分子、γＰＮＡ分子（Ｄｒａｇｕｌｅｓｃｕ−Ａｎｄｒａｓｉら、２００６年、Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．、１２８巻：１０２５８〜１０２６７頁）、ＧＮＡ分子、またはそれらの任意の組合せであってよい。

本明細書において提示される実施形態のいずれかでは、記録タグは、ユニバーサルプライミング部位を含んでよい。さらなる実施形態では、ユニバーサルプライミング部位は、増幅、ライゲーション、配列決定、またはこれらの組合せのためのプライミング部位を含む。

本明細書において提示される実施形態のいずれかでは、記録タグは、一意の分子識別子、コンパートメントタグ、分配バーコード、試料バーコード、画分バーコード、スペーサー配列、またはそれらの任意の組合せを含んでよい。

本明細書において提示される実施形態のいずれかでは、コーディングタグは、一意の分子識別子（ＵＭＩ）、エンコーダー配列、結合サイクル特異的配列、スペーサー配列、またはそれらの任意の組合せを含んでよい。

本明細書において提示される実施形態のいずれかでは、コーディングタグ内の結合サイクル特異的配列は、結合サイクル特異的スペーサー配列であってよい。

ある特定の実施形態では、結合サイクル特異的配列は、エンコーダー配列とは別のバーコードとしてコードされる。他の実施形態では、エンコーダー配列および結合サイクル特異的配列は、結合性物質に対しておよび各結合サイクルに対して一意である単一のバーコードに記載される。

ある特定の実施形態では、スペーサー配列は、多数の結合サイクルからの結合性物質の間で共有される共通の結合サイクル配列を含む。他の実施形態では、スペーサー配列は、同じ結合サイクルからの結合性物質の間で共有される一意の結合サイクル配列を含む。

本明細書において提示される実施形態のいずれかでは、記録タグは、バーコードを含んでよい。

本明細書において提示される実施形態のいずれかでは、巨大分子および付随する記録タグ（複数可）は、固体支持体に共有結合により接合していてよい。

本明細書において提示される実施形態のいずれかでは、固体支持体は、ビーズ、多孔質ビーズ、多孔質マトリックス、拡張可能なゲルビーズまたはマトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアであってよい。

本明細書において提示される実施形態のいずれかでは、固体支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズであってよい。

本明細書において提示される実施形態のいずれかでは、複数の巨大分子および付随する記録タグを固体支持体に接合することができる。さらなる実施形態では、複数の巨大分子の間に固体支持体上で平均距離≧５０ｎｍ、≧１００ｎｍ、または≧２００ｎｍの間隔をあける。

本明細書において提示される実施形態のいずれかでは、結合性物質は、ポリペプチドまたはタンパク質であり得る。さらなる実施形態では、結合性物質は、改変もしくはバリアントアミノペプチダーゼ、改変もしくはバリアントアミノアシルｔＲＮＡ合成酵素、改変もしくはバリアントアンチカリン、または改変もしくはバリアントＣｌｐＳである。

本明細書において提示される実施形態のいずれかでは、結合性物質は、巨大分子に選択的に結合することが可能なものであってよい。

本明細書において提示される実施形態のいずれかでは、コーディングタグは、ＤＮＡ分子、修飾塩基を有するＤＮＡ分子、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＧＮＡ分子、ＰＮＡ分子、γＰＮＡ分子、またはこれらの組合せであってよい。

本明細書において提示される実施形態のいずれかでは、結合性物質とコーディングタグは、リンカーによって接合されていてよい。

本明細書において提示される実施形態のいずれかでは、結合性物質とコーディングタグは、ＳｐｙＴａｇ／ＳｐｙＣａｔｃｈｅｒまたはＳｎｏｏｐＴａｇ／ＳｎｏｏｐＣａｔｃｈｅｒペプチド−タンパク質対（それぞれ、その全体が参照により組み込まれる、Ｚａｋｅｒｉら、２０１２年、ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ、１０９巻（１２号）：Ｅ６９０〜６９７頁；Ｖｅｇｇｉａｎｉら、２０１６年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、１１３巻：１２０２〜１２０７頁）によって接合されていてよい。

本明細書において提示される実施形態のいずれかでは、コーディングタグの情報の記録タグへの移行は、ＤＮＡリガーゼによって媒介される。あるいは、コーディングタグの情報の記録タグへの移行は、ＤＮＡポリメラーゼまたは化学的ライゲーションによって媒介される。

本明細書において提示される実施形態のいずれかでは、伸長記録タグを解析するステップは、核酸配列決定を含んでよい。さらなる実施形態では、核酸配列決定は、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである。他の実施形態では、核酸配列決定は、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、ナノギャップトンネリングシーケンシング、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングである。

本明細書において提示される実施形態のいずれかでは、伸長記録タグを解析前に増幅させることができる。

本明細書において提示される実施形態のいずれかでは、伸長記録タグに含有されるコーディングタグ情報の順序が、結合性物質による巨大分子への結合の順序に関する情報、したがって、結合性物質によって検出される分析物の配列を提供することができる。

本明細書において提示される実施形態のいずれかでは、伸長記録タグに含有される特定のコーディングタグ情報（例えば、エンコーダー配列）の頻度は、特定の結合性物質による巨大分子への結合の頻度、したがって、結合性物質によって検出される巨大分子内の分析物の頻度に関する情報を提供することができる。

本明細書に開示されている実施形態のいずれかでは、多数の巨大分子（例えば、タンパク質）試料であって、各試料内の巨大分子の集団が試料特異的バーコードを含む記録タグで標識されている試料をプールすることができる。そのような巨大分子試料のプールを単一の反応チューブ内での結合サイクルに供することができる。

本明細書において提示される実施形態のいずれかでは、複数の巨大分子を表す複数の伸長記録タグを並行して解析することができる。

本明細書において提示される実施形態のいずれかでは、複数の巨大分子を表す複数の伸長記録タグを多重化アッセイで解析することができる。

本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、解析前に標的濃縮アッセイを行うことができる。

本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、解析前にサブトラクションアッセイを行うことができる。

本明細書において提示される実施形態のいずれかでは、複数の伸長記録タグに対して、極めて豊富な種を減少させるために解析前に正規化アッセイを行うことができる。

本明細書において提示される実施形態のいずれかでは、ＮＴＡＡを、改変アミノペプチダーゼ、改変アミノ酸ｔＲＮＡ合成酵素、穏やかなエドマン分解、エドマナーゼ（Ｅｄｍａｎａｓｅ）酵素、または無水ＴＦＡによって除去することができる。

本明細書において提示される実施形態のいずれかでは、少なくとも１つの結合性物質は、末端アミノ酸残基に結合し得る。ある特定の実施形態では、末端アミノ酸残基は、Ｎ末端アミノ酸またはＣ末端アミノ酸である。

本明細書に記載の実施形態のいずれかでは、少なくとも１つの結合性物質は、翻訳後修飾されたアミノ酸に結合し得る。

上述の実施形態の特徴を以下の節でさらに詳細に提示する。
ＩＶ．巨大分子

一態様では、本開示は、巨大分子の解析に関する。巨大分子は、より小さなサブユニットで構成される大きな分子である。ある特定の実施形態では、巨大分子は、タンパク質、タンパク質複合体、ポリペプチド、ペプチド、核酸分子、炭水化物、脂質、大環状分子、またはキメラ巨大分子である。

本明細書に開示されている方法に従って解析される巨大分子（例えば、タンパク質、ポリペプチド、ペプチド）は、これだけに限定されないが、細胞（初代細胞および培養細胞株の両方）、細胞溶解物または抽出物、エキソソームを含めた細胞小器官または小胞、組織および組織抽出物などの生体試料；生検材料；排泄物；事実上あらゆる生物体の体液（例えば、血液、全血、血清、血漿、尿、リンパ液、胆汁、脳脊髄液、間質液、眼房水または硝子体液、初乳、痰、羊水、唾液、肛門および膣分泌物、汗および精液、漏出液、滲出液（例えば、膿瘍もしくは任意の他の感染もしくは炎症の部位から得られる流体）または関節（正常な関節もしくは関節リウマチ、変形性関節症、痛風もしくは化膿性関節炎などの疾患の影響を受けている関節）から得られる流体）（マイクロバイオームを含有する試料を含めた哺乳動物由来試料であることが好ましく、マイクロバイオームを含有する試料を含めたヒト由試料であることが特に好ましい）；環境試料（例えば、空気、農業、水および土壌試料など）；微生物バイオフィルムおよび／または微生物群、ならびに微生物の胞子に由来する試料を含めた微生物試料；細胞外液、細胞培養物からの細胞外上清、細菌内の封入体、ミトコンドリア区画を含めた細胞区画、および細胞ペリプラズムを含めた研究試料を含めた適切な供給源または試料から得ることができる。

ある特定の実施形態では、巨大分子は、タンパク質、タンパク質複合体、ポリペプチド、またはペプチドである。ペプチド、ポリペプチド、またはタンパク質のアミノ酸配列情報および翻訳後修飾を、次世代シーケンシング法によって解析することができる核酸コードライブラリーに変換する。ペプチドは、Ｌ−アミノ酸、Ｄ−アミノ酸、またはその両方を含んでよい。ペプチド、ポリペプチド、タンパク質、またはタンパク質複合体は、標準の、天然に存在するアミノ酸、修飾されたアミノ酸（例えば、翻訳後修飾）、アミノ酸類似体、アミノ酸模倣物、またはそれらの任意の組合せを含んでよい。一部の実施形態では、ペプチド、ポリペプチド、またはタンパク質は、天然に存在するもの、合成的に作製されたもの、または組換えによって発現させたものである。上述のペプチド実施形態のいずれかでは、ペプチド、ポリペプチド、タンパク質、またはタンパク質複合体は、翻訳後修飾をさらに含んでよい。

標準の、天然に存在するアミノ酸としては、アラニン（ＡまたはＡｌａ）、システイン（ＣまたはＣｙｓ）、アスパラギン酸（ＤまたはＡｓｐ）、グルタミン酸（ＥまたはＧｌｕ）、フェニルアラニン（ＦまたはＰｈｅ）、グリシン（ＧまたはＧｌｙ）、ヒスチジン（ＨまたはＨｉｓ）、イソロイシン（ＩまたはＩｌｅ）、リシン（ＫまたはＬｙｓ）、ロイシン（ＬまたはＬｅｕ）、メチオニン（ＭまたはＭｅｔ）、アスパラギン（ＮまたはＡｓｎ）、プロリン（ＰまたはＰｒｏ）、グルタミン（ＱまたはＧｌｎ）、アルギニン（ＲまたはＡｒｇ）、セリン（ＳまたはＳｅｒ）、トレオニン（ＴまたはＴｈｒ）、バリン（ＶまたはＶａｌ）、トリプトファン（ＷまたはＴｒｐ）、およびチロシン（ＹまたはＴｙｒ）が挙げられる。非標準アミノ酸としては、セレノシステイン、ピロリジン、およびＮ−ホルミルメチオニン、β−アミノ酸、ホモアミノ酸、プロリンおよびピルビン酸誘導体、３−置換アラニン誘導体、グリシン誘導体、環置換フェニルアラニンおよびチロシン誘導体、直鎖コアアミノ酸、およびＮ−メチルアミノ酸が挙げられる。

ペプチド、ポリペプチド、またはタンパク質の翻訳後修飾（ＰＴＭ）は、共有結合性修飾であっても酵素的修飾であってもよい。翻訳後修飾の例としては、これだけに限定されないが、アシル化、アセチル化、アルキル化（メチル化を含む）、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ−カルボキシル化、グルタミル化、グリシル化、グリコシル化（例えば、Ｎ結合、Ｏ結合、Ｃ結合、ホスホグリコシル化）、グリコシルホスファチジルイノシトール付加（ｇｌｙｐｉａｔｉｏｎ）、ヘムＣ付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、Ｓ−グルタチオン化、Ｓ−ニトロシル化、Ｓ−スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびＣ末端アミド化が挙げられる。翻訳後修飾は、ペプチドのアミノ末端および／またはカルボキシル末端、ポリペプチド、またはタンパク質の修飾を含む。末端アミノ基の修飾としては、これだけに限定されないが、デスアミノ、Ｎ−低級アルキル、Ｎ−ジ−低級アルキル、およびＮ−アシル修飾が挙げられる。末端カルボキシ基の修飾としては、これだけに限定されないが、アミド、低級アルキルアミド、ジアルキルアミド、および低級アルキルエステル修飾（例えば、低級アルキルは、Ｃ_１〜Ｃ_４アルキルである）が挙げられる。翻訳後修飾は、例えば、これだけに限定されないが、ペプチド、ポリペプチド、またはタンパク質のアミノ末端とカルボキシ末端の間にあるアミノ酸の、上記のものなどの修飾も含む。翻訳後修飾により、細胞内のタンパク質の「生物学的性質」、例えば、その活性、構造、安定性、または局在を調節することができる。リン酸化は最も一般的な翻訳後修飾であり、タンパク質の調節、特に細胞シグナル伝達において重要な役割を果たす（Ｐｒａｂａｋａｒａｎら、２０１２年、ＷｉｌｅｙＩｎｔｅｒｄｉｓｃｉｐＲｅｖＳｙｓｔＢｉｏｌＭｅｄ、４巻：５６５〜５８３頁）。グリコシル化などの、タンパク質への糖の付加により、タンパク質のフォールディングが促進されること、安定性が改善されること、および調節機能が修飾されることが示されている。タンパク質に脂質を付着させるにより、細胞膜へのターゲティングが可能になる。翻訳後修飾は、１つまたは複数の検出可能な標識を含めるための、ペプチド、ポリペプチド、またはタンパク質の修飾も含み得る。

ある特定の実施形態では、ペプチド、ポリペプチド、またはタンパク質を断片化することができる。例えば、生体試料などの試料に由来するタンパク質を断片化することにより、断片化されたペプチドを得ることができる。ペプチド、ポリペプチド、またはタンパク質を、プロテアーゼまたはエンドペプチダーゼによる断片化を含めた当技術分野で公知の任意の手段によって断片化することができる。一部の実施形態では、ペプチド、ポリペプチド、またはタンパク質の断片化を、特異的なプロテアーゼまたはエンドペプチダーゼを使用することによって標的化する。特異的なプロテアーゼまたはエンドペプチダーゼは、特異的なコンセンサス配列に結合し、そこで切断する（例えば、ＥＮＬＹＦＱ＼Ｓコンセンサス配列に対して特異的なＴＥＶプロテアーゼ）。他の実施形態では、ペプチド、ポリペプチド、またはタンパク質の断片化を、非特異的プロテアーゼまたはエンドペプチダーゼを使用することにより、標的化しないまたはランダムなものにする。非特異的プロテアーゼは、コンセンサス配列ではなく特定のアミノ酸残基に結合し、そこで切断することができる（例えば、プロテイナーゼＫは、非特異的セリンプロテアーゼである）。プロテイナーゼおよびエンドペプチダーゼは当技術分野で周知であり、タンパク質またはポリペプチドを切断してより小さなペプチド断片にするために使用することができるものの例としては、プロテイナーゼＫ、トリプシン、キモトリプシン、ペプシン、サーモリシン、トロンビン、第Ｘａ因子、フューリン、エンドペプチダーゼ、パパイン、ペプシン、スブチリシン、エラスターゼ、エンテロキナーゼ、Ｇｅｎｅｎａｓｅ（商標）Ｉ、エンドプロテアーゼＬｙｓＣ、エンドプロテアーゼＡｓｐＮ、エンドプロテアーゼＧｌｕＣなどが挙げられる（Ｇｒａｎｖｏｇｌら、２００７年、ＡｎａｌＢｉｏａｎａｌＣｈｅｍ、３８９巻：９９１〜１００２頁）。ある特定の実施形態では、ペプチド、ポリペプチド、またはタンパク質を、プロテイナーゼＫによって、または、任意選択で、迅速な不活化を可能にするために熱不安定性型のプロテイナーゼＫによって、断片化する。プロテイナーゼＫは、尿素およびＳＤＳなどの変性試薬中で非常に安定であり、それにより、完全に変性したタンパク質を消化することが可能になる。タンパク質およびポリペプチドのペプチドへの断片化は、ＤＮＡタグまたはＤＮＡ記録タグを付着させる前に実施することもでき、その後に実施することもできる。

化学試薬を使用してタンパク質をペプチド断片に消化することもできる。化学試薬により、特定のアミノ酸残基において切断することができる（例えば、臭化シアンにより、メチオニン残基のＣ末端においてペプチド結合が加水分解される）。ポリペプチドまたはタンパク質をより小さなペプチドに断片化するための化学試薬としては、臭化シアン（ＣＮＢｒ）、ヒドロキシルアミン、ヒドラジン、ギ酸、ＢＮＰＳ−スカトール［２−（２−ニトロフェニルスルフェニル）−３−メチルインドール］、ヨードソ安息香酸、・ＮＴＣＢ＋Ｎｉ（２−ニトロ−５−チオシアノ安息香酸）などが挙げられる。

ある特定の実施形態では、酵素的切断または化学的切断の後、得られるペプチド断片は、ほぼ同じ所望の長さ、例えば、約１０アミノ酸から約７０アミノ酸まで、約１０アミノ酸から約６０アミノ酸まで、約１０アミノ酸から約５０アミノ酸まで、約１０アミノ酸から約４０アミノ酸まで、約１０アミノ酸から約３０アミノ酸まで、約２０アミノ酸から約７０アミノ酸まで、約２０アミノ酸から約６０アミノ酸まで、約２０アミノ酸から約５０アミノ酸まで、約２０アミノ酸から約４０アミノ酸まで、約２０アミノ酸から約３０アミノ酸まで、約３０アミノ酸から約７０アミノ酸まで、約３０アミノ酸から約６０アミノ酸まで、約３０アミノ酸から約５０アミノ酸まで、または約３０アミノ酸から約４０アミノ酸までである。切断反応は、タンパク質またはポリペプチド試料に、プロテイナーゼまたはエンドペプチダーゼ切断部位を含有するペプチド配列を含む短い試験ＦＲＥＴ（蛍光共鳴エネルギー移動）ペプチドをスパイクすることにより、好ましくはリアルタイムで、モニターすることができる。インタクトなＦＲＥＴペプチドでは、蛍光基およびクエンチャー基が切断部位を含有するペプチド配列のいずれかの末端に付着しており、クエンチャーとフルオロフォアの間の蛍光共鳴エネルギー移動により、低い蛍光が生じる。試験ペプチドがプロテアーゼまたはエンドペプチダーゼによって切断されると、クエンチャーおよびフルオロフォアが分離し、それにより、蛍光の大きな増大がもたらされる。切断反応は、ある特定の蛍光強度が実現された時に停止させることができ、これにより、再現性のある切断エンドポイントを実現することが可能になる。

巨大分子（例えば、ペプチド、ポリペプチド、またはタンパク質）の試料に対して、固体支持体に付着させる前にタンパク質分画法を行うことができ、ここで、タンパク質またはペプチドを細胞内の位置、分子量、疎水性、もしくは等電点などの１つもしくは複数の性質、またはタンパク質濃縮法によって分離する。その代わりにまたはそれに加えて、特定のタンパク質またはペプチドを選択するため（例えば、その全体が参照により組み込まれる、Ｗｈｉｔｅａｋｅｒら、２００７年、Ａｎａｌ．Ｂｉｏｃｈｅｍ．、３６２巻：４４〜５４頁を参照されたい）または特定の翻訳後修飾を選択するため（例えば、その全体が参照により組み込まれる、Ｈｕａｎｇら、２０１４年、Ｊ．Ｃｈｒｏｍａｔｏｇｒ．Ａ、１３７２巻：１〜１７頁を参照されたい）に、タンパク質濃縮法を使用することができる。あるいは、免疫グロブリンなどの特定のクラス（複数可）のタンパク質、またはＩｇＧなどの免疫グロブリン（Ｉｇ）アイソタイプを、解析のために親和性により濃縮または選択することができる。免疫グロブリン分子の場合では、親和性結合に関与する超可変配列の配列および豊富さまたは頻度を解析することが特に興味深く、これは、特に、これらが疾患の進行に応答して変動するまたは健康、免疫、および／もしくは疾患表現型と相関するからである。過度に豊富なタンパク質を、標準の免疫親和性方法を使用して試料からからサブトラクションすることもできる。豊富なタンパク質の枯渇は、タンパク質構成物の８０％よりも多くがアルブミンおよび免疫グロブリンである血漿試料に関して有用であり得る。例えばＰＲＯＴＩＡおよびＰＲＯＴ２０（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ）など、血漿試料の過度に豊富なタンパク質の枯渇のために、いくつかの市販品が入手可能である。

ある特定の実施形態では、巨大分子は、タンパク質またはポリペプチドで構成される。一実施形態では、タンパク質またはポリペプチドを標準のアミンカップリング化学によってＤＮＡ記録タグで標識する（例えば、図２Ｂ、２Ｃ、２８、２９、３１、４０）を参照されたい。ε−アミノ基（例えばリシン残基の）およびＮ末端アミノ基は、反応のｐＨに応じて、アミン反応性カップリング剤で特に標識しやすい（ＭｅｎｄｏｚａおよびＶａｃｈｅｔ、２００９年）。特定の実施形態では（例えば、図２Ｂおよび図２９を参照されたい）、記録タグは、反応性部分（例えば、固体表面、多機能性リンカー、または巨大分子へのコンジュゲーションのための部分）、リンカー、ユニバーサルプライミング配列、バーコード（例えば、コンパートメントタグ、分配バーコード、試料バーコード、画分バーコード、またはそれらの任意の組合せ）、任意選択のＵＭＩ、およびコーディングタグへの／からの情報移行を容易にするためのスペーサー（Ｓｐ）配列で構成される。別の実施形態では、タンパク質を、まず、ユニバーサルＤＮＡタグで標識し、その後で、酵素的または化学的カップリングステップによってバーコード−Ｓｐ配列（試料、コンパートメント、スライド上の物理的位置を表すなど）をタンパク質に付着させることができる（例えば、図２０、３０、３１、４０を参照されたい）。ユニバーサルＤＮＡタグは、タンパク質またはポリペプチド巨大分子を標識するために使用され、バーコード（例えば、コンパートメントタグ、記録タグなど）の付着点として使用することができるヌクレオチドの短い配列を含む。例えば、記録タグは、その末端に、ユニバーサルＤＮＡタグと相補的な配列を含んでよい。ある特定の実施形態では、ユニバーサルＤＮＡタグは、ユニバーサルプライミング配列である。標識されたタンパク質上のユニバーサルＤＮＡタグが記録タグ（例えば、ビーズに結合させたもの）内の相補配列とハイブリダイズしたら、アニーリングされたユニバーサルＤＮＡタグをプライマー伸長によって伸長させ、それにより、ＤＮＡタグが付されたタンパク質に記録タグ情報を移行させることができる。特定の実施形態では、タンパク質を、プロテイナーゼにより消化してペプチドにする前に、ユニバーサルＤＮＡタグで標識する。次いで、消化物に由来する標識されたペプチド上のユニバーサルＤＮＡタグを、情報価値があり、有効な記録タグに変換することができる。

ある特定の実施形態では、タンパク質巨大分子を親和性捕捉試薬によって固体支持体に固定化すること（および任意選択で共有結合により架橋結合させること）ができ、ここで、記録タグは、親和性捕捉試薬に直接付随している、あるいは、タンパク質を固体支持体に記録タグと共に直接固定化することができる（例えば、図２Ｃを参照されたい）。
Ｖ．固体支持体

本開示の巨大分子を固体支持体の表面（「基板表面」とも称される）に接合する。固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアを含めた任意の多孔質または非多孔質支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン（登録商標）、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、またはそれらの任意の組合せが挙げられる。固体支持体は、薄膜、膜、ビン、ディッシュ、繊維、織られた繊維、チューブなどの成形ポリマー、粒子、ビーズ、微小粒子、またはそれらの任意の組合せをさらに含む。例えば、固体表面がビーズである場合、ビーズとしては、これだけに限定されないが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズを挙げることができる。

ある特定の実施形態では、固体支持体は、フローセルである。フローセルの形態は、異なる次世代シーケンシングプラットフォームの間で変動し得る。例えば、Ｉｌｌｕｍｉｎａフローセルは、その表面に一連のオリゴヌクレオチドアンカーが結合した、顕微鏡スライドと同様の平面の光学的に透明な表面である。鋳型ＤＮＡは、末端にフローセル表面上のオリゴヌクレオチドと相補的なアダプターがライゲーションしている。アダプター付加した一本鎖ＤＮＡをフローセルに結合させ、固相「ブリッジ」ＰＣＲによって増幅した後、配列決定する。４５４フローセル（４５４ＬｉｆｅＳｃｉｅｎｃｅｓ）は、７５ピコリットルのウェルを約１６０万個有する光ファイバースライドである「ピコタイター」プレートを支持するものである。せん断された鋳型ＤＮＡの個々の分子をそれぞれ別々のビーズに捕捉し、各ビーズを油エマルジョン中の水性ＰＣＲ反応混合物の個々の液滴中に区画化する。鋳型をビーズ表面上でＰＣＲによってクローン的に増幅し、次いで、鋳型がローディングされたビーズを配列決定反応のためにピコタイタープレートのウェル中に、理想的には１ウェル当たり１個またはそれ未満のビーズに分布させる。ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓからのＳＯＬｉＤ（ＳｕｐｐｏｒｔｅｄＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＬｉｇａｔｉｏｎａｎｄＤｅｔｅｃｔｉｏｎ）計器では、４５４システムと同様に、鋳型分子をエマルジョンＰＣＲによって増幅する。増幅した鋳型を含有しないビーズを選別するステップの後、ビーズに結合した鋳型がフローセル上に蓄積する。フローセルは、ＴＷＩＳＴ（商標）ＤＮＡ合成カラム（ＧｌｅｎＲｅｓｅａｒｃｈ）などの単純なフィルターフリットであってもよい。

ある特定の実施形態では、固体支持体はビーズであり、これは、個々のビーズを指す場合もあり複数のビーズを指す場合もある。一部の実施形態では、ビーズは、下流の解析のために使用される選択された次世代シーケンシングプラットフォーム（例えば、ＳＯＬｉＤまたは４５４）に適合するものである。一部の実施形態では、固体支持体は、アガロースビーズ、常磁性ビーズ、ポリスチレンビーズ、ポリマービーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、ガラスビーズ、または制御ポアビーズである。さらなる実施形態では、ビーズは、巨大分子への結合を容易にするために、結合機能性（例えば、アミン基、ビオチン標識された巨大分子、抗体との結合用のストレプトアビジンなどの親和性リガンド）でコーティングすることができる。

タンパク質、ポリペプチド、またはペプチドは、固体支持体に、直接または間接的に、共有結合性の相互作用および非共有結合性の相互作用またはそれらの任意の組合せを含めた当技術分野で公知の任意の手段によって接合させることができる（例えば、それぞれ、これによってその全体が参照により組み込まれる、Ｃｈａｎら、２００７年、ＰＬｏＳＯｎｅ、２巻：ｅ１１６４頁；Ｃａｚａｌｉｓら、Ｂｉｏｃｏｎｊ．Ｃｈｅｍ．、１５巻：１００５〜１００９頁；Ｓｏｅｌｌｎｅｒら、２００３年、Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．、１２５巻：１１７９０〜１１７９１頁；Ｓｕｎら、２００６年、Ｂｉｏｃｏｎｊｕｇ．Ｃｈｅｍ．、１７巻、５２〜５７頁；Ｄｅｃｒｅａｕら、２００７年、Ｊ．Ｏｒｇ．Ｃｈｅｍ．、７２巻：２７９４〜２８０２頁；Ｃａｍａｒｅｒｏら、２００４年、Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．、１２６巻：１４７３０〜１４７３１頁；Ｇｉｒｉｓｈら、２００５年、Ｂｉｏｏｒｇ．Ｍｅｄ．Ｃｈｅｍ．Ｌｅｔｔ．、１５巻：２４４７〜２４５１頁；Ｋａｌｉａら、２００７年、Ｂｉｏｃｏｎｊｕｇ．Ｃｈｅｍ．、１８巻：１０６４〜１０６９頁；Ｗａｔｚｋｅら、２００６年、ＡｎｇｅｗＣｈｅｍ．Ｉｎｔ．Ｅｄ．Ｅｎｇｌ．、４５巻：１４０８〜１４１２頁；Ｐａｒｔｈａｓａｒａｔｈｙら、２００７年、ＢｉｏｃｏｎｊｕｇａｔｅＣｈｅｍ．、１８巻：４６９〜４７６頁；およびＢｉｏｃｏｎｊｕｇａｔｅＴｅｃｈｎｉｑｕｅｓ、Ｇ．Ｔ．Ｈｅｒｍａｎｓｏｎ、ＡｃａｄｅｍｉｃＰｒｅｓｓ（２０１３年）を参照されたい）。例えば、ペプチドを固体支持体にライゲーション反応によって接合させることができる。あるいは、固体支持体は、直接または間接的にペプチドを固体支持体に接合することを容易にするための作用物質またはコーティングを含んでよい。タンパク質、核酸、炭水化物および小分子を含めた任意の適切な分子または材料をこの目的のために使用することができる。例えば、一実施形態では、作用物質は、親和性分子である。別の例では、作用物質は、別の分子のアルキニル基と反応して固体支持体と他の分子の間の結び付きまたは結合を容易にすることができる、アジド基である。

タンパク質、ポリペプチド、またはペプチドは、固体支持体に、「クリックケミストリー」と称される方法を使用して接合させることができる。この目的のために、迅速かつ実質的に不可逆的である任意の反応を使用してタンパク質、ポリペプチド、またはペプチドを固体支持体に付着させることができる。例示的な反応としては、トリアゾールが形成される、アジドとアルキンの銅により触媒される反応（ヒュスゲン１，３−双極子付加環化）、歪み促進型アジド−アルキン付加環化（ＳＰＡＡＣ）、ジエンと求ジエン体の反応（ディールス・アルダー）、歪み促進型アルキン−ニトロン付加環化、歪アルケンとアジド、テトラジンまたはテトラゾールの反応、アルケン−アジド［３＋２］付加環化、アルケン−テトラジン逆電子要請型ディールス・アルダー（ＩＥＤＤＡ）反応（例えば、ｍ−テトラジン（ｍＴｅｔ）−ｔｒａｎｓ−シクロオクテン（ＴＣＯ））、アルケン−テトラゾール光化学反応、アジド−ホスフィンのシュタウディンガーライゲーション、ならびに、求電子原子に対する求核攻撃による脱離基の置換（Ｈｏｒｉｓａｗａ２０１４年、Ｋｎａｌｌ、Ｈｏｌｌａｕｆら、２０１４年）などの種々の置換反応が挙げられる。例示的な置換反応としては、アミンと活性化エステルの反応；アミンとＮ−ヒドロキシスクシンイミドエステルの反応；アミンとイソシアネートの反応；アミンとイソチオシアネートの反応などが挙げられる。

一部の実施形態では、巨大分子および固体支持体を、２つの相補的な反応性基の反応によって形成することができる官能基、例えば、前述の「クリック」反応のうちの１つの生成物である官能基によって接合する。種々の実施形態では、官能基は、アルデヒド、オキシム、ヒドラゾン、ヒドラジド、アルキン、アミン、アジド、アシルアジド、ハロゲン化アシル、ニトリル、ニトロン、スルフヒドリル、ジスルフィド、ハロゲン化スルホニル、イソチオシアネート、イミドエステル、活性化エステル（例えば、Ｎ−ヒドロキシスクシンイミドエステル、ペンチン酸ＳＴＰエステル）、ケトン、α，β−不飽和カルボニル、アルケン、マレイミド、α−ハロイミド、エポキシド、アジリジン、テトラジン、テトラゾール、ホスフィン、ビオチンまたはチイラン官能基と、相補的な反応性基との反応によって形成することができる。例示的な反応は、アミン（例えば、第一級アミン）とＮ−ヒドロキシスクシンイミドエステルまたはイソチオシアネートの反応である。

さらに他の実施形態では、官能基は、アルケン、エステル、アミド、チオエステル、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。さらなる実施形態では、官能基は、アルケン、エステル、アミド、チオエステル、チオ尿素、ジスルフィド、炭素環式、複素環式またはヘテロアリール基を含む。他の実施形態では、官能基は、アミドまたはチオ尿素を含む。一部のより具体的な実施形態では、官能基は、トリアゾリル官能基、アミド、またはチオ尿素官能基である。

好ましい実施形態では、迅速かつ低インプット濃度で高収率がもたらされるので、ｉＥＤＤＡクリックケミストリーを巨大分子（例えば、タンパク質、ポリペプチド、ペプチド）を固体支持体に固定化するために使用する。別の好ましい実施形態では、テトラジンではなくｍ−テトラジンをｉＥＤＤＡクリックケミストリー反応に使用し、これは、ｍ−テトラジンが改善された結合安定性を有するからである。

好ましい実施形態では、基板表面をＴＣＯで官能化し、記録タグで標識したタンパク質、ポリペプチド、ペプチドを、ＴＣＯでコーティングした基板表面に、付着したｍ−テトラジン部分を介して固定化する（図３４）。

タンパク質、ポリペプチド、またはペプチドは、そのＣ末端、Ｎ末端、または内部アミノ酸により、例えば、アミン基、カルボキシル基、またはスルフィドリル基を介して、固体支持体の表面に固定化することができる。アミン基へのカップリングに使用される標準の活性化された支持体としては、ＣＮＢｒで活性化された支持体、ＮＨＳで活性化された支持体、アルデヒドで活性化された支持体、アズラクトンで活性化された支持体、およびＣＤＩで活性化された支持体が挙げられる。カルボキシルカップリングに使用される標準の活性化された支持体としては、アミン支持体にカップリングするカルボジイミドで活性化されたカルボキシル部分が挙げられる。システインカップリングでは、マレイミド、ヨードアセチル、およびピリジルジスルフィドで活性化された支持体を使用することができる。ペプチドカルボキシ末端固定化の代替方式では、Ｃ末端にリシンまたはアルギニン残基を含有するペプチドに、それらを切断することなく結合する、触媒として不活性なトリプシンの誘導体であるアンヒドロトリプシンを使用する。

ある特定の実施形態では、タンパク質、ポリペプチド、またはペプチドを固体支持体に、固体表面に結合させたリンカーをタンパク質、ポリペプチド、またはペプチドのリシン基に共有結合により付着させることによって固定化する。

固体支持体への固定化前または固定化後に、タンパク質、ポリペプチド、またはペプチドに記録タグを付着させることができる。例えば、タンパク質、ポリペプチド、またはペプチドを、まず記録タグで標識し、次いで、カップリングのための２つの機能的部分を含む記録タグを介して固体表面に固定化することができる（図２８を参照されたい）。記録タグの一方の機能的部分をタンパク質とカップリングさせ、他方の機能的部分により、記録タグで標識したタンパク質を固体支持体に固定化する。

あるいは、タンパク質、ポリペプチドまたはペプチドを記録タグで標識する前に、タンパク質、ポリペプチド、またはペプチドを固体支持体に固定化する。例えば、タンパク質をまずクリックケミストリー部分などの反応性基で誘導体化することができる。次いで、活性化されたタンパク質分子を適切な固体支持体に付着させ、次いで、相補的なクリックケミストリー部分を使用して記録タグで標識することができる。例として、アルキンおよびｍＴｅｔ部分で誘導体化したタンパク質を、アジドおよびＴＣＯで誘導体化したビーズに固定化し、アジドおよびＴＣＯで標識された記録タグに付着させることができる。

巨大分子（例えば、タンパク質、ポリペプチド、またはペプチド）を固体支持体に付着させるための本明細書において提示される方法はまた、記録タグを固体支持体に付着させるまたは記録タグを巨大分子（例えば、タンパク質、ポリペプチド、またはペプチド）に付着させるためにも使用することができることが理解される。

ある特定の実施形態では、結合性物質への非特異的吸収を最小限にするために、固体支持体の表面を不動態化（ブロッキング）する。「不動態化」された表面とは、結合性物質の非特異的結合を最小限にするために材料の外層で処理された表面を指す。表面を不動態化する方法としては、表面を、ポリエチレングリコール（ＰＥＧ）（Ｐａｎら、２０１５年、Ｐｈｙｓ．Ｂｉｏｌ．、１２巻：０４５００６頁）、ポリシロキサン（例えば、ＰｌｕｒｏｎｉｃＦ−１２７）、星型ポリマー（例えば、星型ＰＥＧ）（Ｇｒｏｌｌら、２０１０年、ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ．、４７２巻：１〜１８頁）、疎水性ジクロロジメチルシラン（ＤＤＳ）＋自己組織化Ｔｗｅｅｎ−２０（Ｈｕａら、２０１４年、Ｎａｔ．Ｍｅｔｈｏｄｓ、１１巻：１２３３〜１２３６頁）、およびダイヤモンド様炭素（ＤＬＣ）、ＤＬＣ＋ＰＥＧ（Ｓｔａｖｉｓら、２０１１年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、１０８巻：９８３〜９８８頁）のようなポリマーで不動態化することを含めた、蛍光単一分子解析の文献からの標準の方法が挙げられる。共有結合性の表面修飾に加えて、Ｔｗｅｅｎ−２０のような界面活性物質、溶液中ポリシロキサン（Ｐｌｕｒｏｎｉｃシリーズ）、ポリビニルアルコール（ＰＶＡ）、ならびにＢＳＡおよびカゼインのようなタンパク質を含めたいくつもの不動態化剤を同様に使用することができる。あるいは、固体基板の表面上または容積内のタンパク質、ポリペプチド、またはペプチドの密度を、タンパク質、ポリペプチドまたはペプチドを固体基板に固定化する際に競合剤または「ダミー」反応性分子をスパイクすることによって調整することができる（図３６Ａを参照されたい）。

ある特定の実施形態では、多数の巨大分子を同じ固体支持体上に固定化する場合、例えば、結合性物質が第１の巨大分子に結合し、そのコーディングタグ情報が第１の巨大分子に付随する記録タグではなく近隣の巨大分子に付随する記録タグに移行する交差結合または分子間事象の発生を低減するまたはそれを防止するために、巨大分子の間に適切に間隔をあけることができる。固体支持体上の巨大分子の間隔（例えば、タンパク質、ポリペプチド、またはペプチドの間隔）を制御するために、基板表面上の機能的カップリング基（例えば、ＴＣＯ）の密度を調整することができる（図３４を参照されたい）。一部の実施形態では、固体支持体（例えば、多孔質支持体）の表面上または容積内で多数の巨大分子の間に約５０ｎｍ〜約５００ｎｍ、または約５０ｎｍ〜約４００ｎｍ、または約５０ｎｍ〜約３００ｎｍ、または約５０ｎｍ〜約２００ｎｍ、または約５０ｎｍ〜約１００ｎｍの距離で間隔をあける。一部の実施形態では、固体支持体の表面上で多数の巨大分子の間に少なくとも５０ｎｍ、少なくとも６０ｎｍ、少なくとも７０ｎｍ、少なくとも８０ｎｍ、少なくとも９０ｎｍ、少なくとも１００ｎｍ、少なくとも１５０ｎｍ、少なくとも２００ｎｍ、少なくとも２５０ｎｍ、少なくとも３００ｎｍ、少なくとも３５０ｎｍ、少なくとも４００ｎｍ、少なくとも４５０ｎｍ、または少なくとも５００ｎｍの平均距離で間隔をあける。一部の実施形態では、固体支持体の表面上で多数の巨大分子の間に少なくとも５０ｎｍの平均距離で間隔をあける。一部の実施形態では、固体支持体の表面上または容積内で巨大分子の間に、経験的に分子内事象に対する分子間事象の相対的な頻度が＜１：１０；＜１：１００；＜１：１，０００；または＜１：１０，０００になるように間隔をあける。適切な間隔頻度は、機能アッセイを使用して経験的に決定することができ（実施例２３を参照されたい）、希釈によっておよび／または基板表面上の部位への付着について競合する「ダミー」スペーサー分子をスパイクすることによって実現することができる。

例えば、図３４に示されている通り、ＰＥＧ−５０００（ＭＷ約５０００）を使用して、基板表面（例えば、ビーズ表面）上のペプチド間の間隙の空間をブロッキングする。さらに、ペプチドを同じくＰＥＧ−５０００分子に付着させた機能的部分とカップリングさせる。好ましい実施形態では、これは、ＮＨＳ−ＰＥＧ−５０００−ＴＣＯ＋ＮＨＳ−ＰＥＧ−５０００−メチルの混合物をアミン誘導体化ビーズにカップリングすることによって実現される（図３４を参照されたい）。２つのＰＥＧ間（ＴＣＯ対メチル）の化学量論比を調整して、基板表面上の機能的カップリング部分（ＴＣＯ基）の適切な密度を生じさせる；メチル−ＰＥＧはカップリングに対して不活性である。ＴＣＯ基間の有効な間隔は、表面上のＴＣＯ基の密度を測定することによって算出することができる。ある特定の実施形態では、固体表面上のカップリング部分（例えば、ＴＣＯ）間の平均間隔は、少なくとも５０ｎｍ、少なくとも１００ｎｍ、少なくとも２５０ｎｍ、または少なくとも５００ｎｍである。ビーズをＰＥＧ５０００−ＴＣＯ／メチルで誘導体化した後、表面上の過剰なＮＨ_２基を反応性無水物（例えば、無水酢酸または無水コハク酸）でクエンチする。
ＶＩ．記録タグ

少なくとも１つの記録タグを巨大分子に直接または間接的に付随または共局在させ、固体支持体に接合させる（例えば、図５を参照されたい）。記録タグは、ＤＮＡ、ＲＮＡ、ＰＮＡ、γＰＮＡ、ＧＮＡ、ＢＮＡ、ＸＮＡ、ＴＮＡ、ポリヌクレオチド類似体、またはこれらの組合せを含んでよい。記録タグは、一本鎖であってもよく、部分的にまたは完全に二本鎖であってもよい。記録タグは、平滑末端を有してもよく突出末端を有してもよい。ある特定の実施形態では、結合性物質が巨大分子に結合したら、結合性物質のコーディングタグの識別情報を記録タグに移行させて、伸長記録タグを生成する。その後の結合サイクルにおいて伸長記録タグに対するさらなる伸長を行うことができる。

記録タグは、固体支持体に、共有結合性の相互作用および非共有結合性の相互作用、またはそれらの任意の組合せを含めた当技術分野で公知の任意の手段によって直接または間接的に（例えば、リンカーを介して）接合させることができる。例えば、記録タグを固体支持体にライゲーション反応によって接合させることができる。あるいは、固体支持体は、記録タグを固体支持体に直接または間接的に接合させることを容易にするための作用物質またはコーティングを含んでよい。核酸分子を固体支持体（例えば、ビーズ）に固定化するための戦略は、それぞれ、その全体が参照により本明細書に組み込まれる、米国特許第５，９００，４８１号；Ｓｔｅｉｎｂｅｒｇら（２００４年、Ｂｉｏｐｏｌｙｍｅｒｓ、７３巻：５９７〜６０５頁）；Ｌｕｎｄら、１９８８年（ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．、１６巻：１０８６１〜１０８８０頁）；およびＳｔｅｉｎｂｅｒｇら（２００４年、Ｂｉｏｐｏｌｙｍｅｒｓ、７３巻：５９７〜６０５頁）に記載されている。

ある特定の実施形態では、巨大分子（例えば、ペプチド）と付随する記録タグの共局在は、巨大分子および記録タグを、固体支持体表面に直接付着させた二機能性リンカーとコンジュゲートすることによって実現される。Ｓｔｅｉｎｂｅｒｇら（２００４年、Ｂｉｏｐｏｌｙｍｅｒ、７３巻：５９７〜６０５頁）。さらなる実施形態では、三機能性部分を使用して固体支持体（例えば、ビーズ）を誘導体化し、得られた二機能性部分を巨大分子および記録タグの両方とカップリングさせる。

巨大分子および固体支持体の付着に関して記載されているものなどの方法および試薬（例えば、クリックケミストリー試薬および光親和性標識試薬）を記録タグの付着にも使用することができる。

特定の実施形態では、単一の記録タグを巨大分子（例えば、ペプチド）に、好ましくは脱ブロッキングしたＮ末端アミノ酸またはＣ末端アミノ酸に付着させることによって付着させる。別の実施形態では、多数の記録タグを巨大分子（例えば、タンパク質、ポリペプチド、またはペプチド）に、好ましくはリシン残基またはペプチド骨格に付着させる。一部の実施形態では、多数の記録タグで標識した巨大分子（例えば、タンパク質またはポリペプチド）を、それぞれが平均して１つの記録タグで標識された、より小さなペプチドに断片化または消化する。

ある特定の実施形態では、記録タグは、任意選択の、ＵＭＩが付随する各巨大分子（例えば、タンパク質、ポリペプチド、ペプチド）についての一意の識別子タグをもたらす一意の分子識別子（ＵＭＩ）を含む。ＵＭＩは、約３〜約４０塩基、約３〜約３０塩基、約３〜約２０塩基、または約３〜約１０塩基、または約３〜約８塩基であってよい。一部の実施形態では、ＵＭＩは、約３塩基、４塩基、５塩基、６塩基、７塩基、８塩基、９塩基、１０塩基、１１塩基、１２塩基、１３塩基、１４塩基、１５塩基、１６塩基、１７塩基、１８塩基、１９塩基、２０塩基、２５塩基、３０塩基、３５塩基、または４０塩基の長さである。ＵＭＩを使用して、複数の伸長記録タグからの配列決定データをデコンボリューションして個々の巨大分子からの配列読み取りを識別することができる。一部の実施形態では、巨大分子のライブラリー内で、各巨大分子に単一の記録タグを付随させ、各記録タグが一意のＵＭＩを含む。他の実施形態では、記録タグの多数のコピーを単一の巨大分子に付随させ、記録タグの各コピーは同じＵＭＩを含む。一部の実施形態では、ＵＭＩは、結合性物質のコーディングタグ内のスペーサーまたはエンコーダー配列と、これらの成分を配列解析中に区別することを容易にするために、異なる塩基配列を有する。

ある特定の実施形態では、記録タグは、例えば、存在する場合、ＵＭＩ以外のバーコードを含む。バーコードは、約３〜約３０塩基、約３〜約２５塩基、約３〜約２０塩基、約３〜約１０塩基、約３〜約１０塩基、約３〜約８塩基の長さの核酸分子である。一部の実施形態では、バーコードは、約３塩基、４塩基、５塩基、６塩基、７塩基、８塩基、９塩基、１０塩基、１１塩基、１２塩基、１３塩基、１４塩基、１５塩基、２０塩基、２５塩基、または３０塩基の長さである。一実施形態では、バーコードにより、複数の試料またはライブラリーのマルチプレックス配列決定が可能になる。バーコードを使用して、分配、画分、コンパートメント、試料、空間的位置、または巨大分子（例えば、ペプチド）が由来するライブラリーを識別することができる。バーコードを使用して、多重化された配列データをデコンボリューションし、個々の試料またはライブラリーからの配列読み取りを識別する。例えば、バーコードが付されたビーズは、試料のエマルジョンおよび分配を伴う方法に、例えば、プロテオームを分配するために、有用である。

バーコードは、例えば液滴、マイクロウェル、固体支持体上の物理的領域などのコンパートメントに一意のバーコードが割り当てられたコンパートメントタグを表し得る。コンパートメントと特異的なバーコードの結び付きは、例えば、単一のバーコードが付されたビーズをコンパートメントに封入することによって、例えば、バーコードが付された液滴をコンパートメントに直接混合させるまたは添加することによって、バーコード試薬をコンパートメントに直接プリントまたは注射することによってなどの任意の数のやり方で実現することができる。コンパートメント内のバーコード試薬を使用して、コンパートメント特異的バーコードをコンパートメント内の巨大分子またはその断片に付加する。コンパートメント内へのタンパク質の分配に適用すると、バーコードを使用して、解析されるペプチドをコンパートメント内のそれらの起源であるタンパク質分子にマッピングし戻すことができる。これにより、タンパク質識別が著しく容易になる。コンパートメントバーコードを使用してタンパク質複合体を識別することもできる。

他の実施形態では、コンパートメントの集団のサブセットを表す多数のコンパートメントにそのサブセットを表す一意のバーコードを割り当てることができる。

あるいは、バーコードは、試料識別バーコードであってよい。試料バーコードは、単一反応容器中のまたは単一の固体基板または固体基板の集合（例えば、平面スライド、単一のチューブまたは容器などに含有されるビーズの集団）に固定化された試料のセットの多重化解析に有用である。多くの異なる試料由来の巨大分子を、試料特異的バーコードを有する記録タグで標識することができ、次いで、全ての試料を、固体支持体への固定化、周期的結合、および記録タグ解析の前に一緒にプールすることができる。あるいは、ＤＮＡによりコードされるライブラリー作成後まで試料を別々に保持し、ＤＮＡによりコードされるライブラリーのＰＣＲ増幅中に試料バーコードを付着させ、次いで、配列決定前に混合することができる。この手法は、豊富さのクラスが異なる分析物（例えば、タンパク質）をアッセイする場合に有用であり得る。例えば、試料を分割し、バーコードを付し、一方の部分を豊富さが低い分析物に対する結合性物質を使用して処理し、他方の部分を豊富さがより高い分析物に対する結合性物質を使用して処理することができる。特定の実施形態では、この手法は、特定のタンパク質分析物アッセイのダイナミックレンジをタンパク質分析物の標準の発現レベルの「スイートスポット」に入るように調整するのに役立つ。

ある特定の実施形態では、多数の異なる試料に由来するペプチド、ポリペプチド、またはタンパク質を、試料特異的バーコードを含有する記録タグで標識する。多試料バーコードが付されたペプチド、ポリペプチド、またはタンパク質を周期的結合反応前に混合することができる。このように、デジタル逆相タンパク質アレイ（ＲＰＰＡ）に対する高度に多重化された代替物が有効に創出される（Ｇｕｏ、Ｌｉｕら、２０１２年、Ａｓｓａｄｉ、Ｌａｍｅｒｚら、２０１３年、Ａｋｂａｎｉ、Ｂｅｃｋｅｒら、２０１４年、ＣｒｅｉｇｈｔｏｎおよびＨｕａｎｇ、２０１５年）。デジタルＲＰＰＡ様アッセイの創出には、翻訳研究、バイオマーカー検証、薬物発見、臨床、および高精度の医療における多数の適用がある。

ある特定の実施形態では、記録タグは、ユニバーサルプライミング部位、例えば、フォワードまたは５’ユニバーサルプライミング部位を含む。ユニバーサルプライミング部位は、ライブラリー増幅反応をプライミングするためおよび／または配列決定のために使用することができる核酸配列である。ユニバーサルプライミング部位としては、これだけに限定されないが、ＰＣＲ増幅のためのプライミング部位、フローセル表面上の相補的なオリゴヌクレオチドとアニーリングするフローセルアダプター配列（例えば、Ｉｌｌｕｍｉｎａ次世代シーケンシング）、配列決定プライミング部位、またはこれらの組合せを挙げることができる。ユニバーサルプライミング部位は、約１０塩基〜約６０塩基であってよい。一部の実施形態では、ユニバーサルプライミング部位は、ＩｌｌｕｍｉｎａＰ５プライマー（５’−ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡ−３’−配列番号１３３）またはＩｌｌｕｍｉｎａＰ７プライマー（５’−ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡＧＡＴ−３’−配列番号１３４）を含む。

ある特定の実施形態では、記録タグは、その末端、例えば３’末端にスペーサーを含む。本明細書で使用される場合、記録タグに関してスペーサー配列への言及は、その同類結合性物質に付随するスペーサー配列、またはその同類結合性物質に付随するスペーサー配列と相補的なスペーサー配列と同一のスペーサー配列を含む。記録タグ上の末端、例えば３’スペーサーにより、第１の結合サイクル中に同類結合性物質の識別情報をそのコーディングタグから記録タグに移行させることが可能になる（例えば、プライマー伸長または粘着末端ライゲーションのための相補的なスペーサー配列のアニーリングによって）。

一実施形態では、スペーサー配列は、約１〜２０塩基の長さ、約２〜１２塩基の長さ、または５〜１０塩基の長さである。スペーサーの長さは、コーディングタグ情報を記録タグに移行させるためのプライマー伸長反応の温度および反応条件などの因子に依存し得る。

好ましい実施形態では、記録タグ内のスペーサー配列を、記録タグ内の他の領域に対して最小の相補性を有するように設計する；同様に、コーディングタグ内のスペーサー配列はコーディングタグ内の他の領域に対して最小の相補性を有するべきである。言い換えれば、記録タグおよびコーディングタグのスペーサー配列は、記録タグまたはコーディングタグ内に存在する一意の分子識別子、バーコード（例えば、コンパートメント、分配、試料、空間的位置）、ユニバーサルプライマー配列、エンコーダー配列、サイクル特異的配列などの成分に対して最小の配列相補性を有するべきである。

結合性物質スペーサーについて記載されている通り、一部の実施形態では、巨大分子のライブラリーに付随する記録タグは、共通のスペーサー配列を共有する。他の実施形態では、巨大分子のライブラリーに付随する記録タグは、それらの同類結合性物質の結合サイクル特異的スペーサー配列と相補的な結合サイクル特異的スペーサー配列を有し、これは、非連鎖状伸長記録タグを使用する場合に有用であり得る（図１０を参照されたい）。

伸長記録タグの収集物は、事後に連鎖状にすることができる（例えば、図１０を参照されたい）。結合サイクルが完了した後、ビーズ固体支持体であって、各ビーズが平均してビーズ当たり１つまたは１つ未満の巨大分子を有し、各巨大分子が巨大分子の部位に共局在する伸長記録タグの収集物を有するビーズ固体支持体をエマルジョン中に入れる。エマルジョンは、各液滴が平均して最大で１ビーズによって占められるように形成する。任意選択のアセンブリＰＣＲ反応をエマルジョン中で実施してビーズ上の巨大分子と共局在する伸長記録タグを増幅し、それらを別の伸長記録タグの異なるサイクル特異的配列間のプライミングによって共直線的な順序でアセンブルさせる（Ｘｉｏｎｇ、Ｐｅｎｇら、２００８年）。その後、エマルジョンを破壊し、アセンブルした伸長記録タグを配列決定する。

別の実施形態では、ＤＮＡ記録タグは、第１の結合サイクルに特異的なユニバーサルプライミング配列（Ｕ１）、１つまたは複数のバーコード配列（ＢＣｓ）、およびスペーサー配列（Ｓｐ１）で構成される。第１の結合サイクルでは、結合性物質はＳｐ１相補的スペーサー、エンコーダーバーコード、および任意選択のサイクルバーコード、および第２のスペーサーエレメント（Ｓｐ２）で構成されるＤＮＡコーディングタグを使用する。少なくとも２つの異なるスペーサーエレメントを使用することの有用性は、第１の結合サイクルにより潜在的に複数のＤＮＡ記録タグのうちの１つが選択され、単一のＤＮＡ記録タグが伸長し、その結果、伸長ＤＮＡ記録タグの最後に新しいＳｐ２スペーサーエレメントがもたらされることである。第２の結合サイクルおよびその後の結合サイクルでは、結合性物質は、Ｓｐ１’ではなくＳｐ２’スペーサーだけを含有する。このように、第１のサイクルからの単一の伸長記録タグのみがその後のサイクルで伸長する。別の実施形態では、第２のサイクルおよびその後のサイクルに結合性物質特異的スペーサーを使用することができる。

一部の実施形態では、記録タグは、５’から３’の方向に、ユニバーサルフォワード（または５’）プライミング配列、ＵＭＩ、およびスペーサー配列を含む。一部の実施形態では、記録タグは、５’から３’の方向に、ユニバーサルフォワード（または５’）プライミング配列、任意選択のＵＭＩ、バーコード（例えば、試料バーコード、分配バーコード、コンパートメントバーコード、空間バーコード、またはそれらの任意の組合せ）、およびスペーサー配列を含む。一部の他の実施形態では、記録タグは、５’から３’の方向に、ユニバーサルフォワード（または５’）プライミング配列、バーコード（例えば、試料バーコード、分配バーコード、コンパートメントバーコード、空間バーコード、またはそれらの任意の組合せ）、任意選択のＵＭＩ、およびスペーサー配列を含む。

改変ＤＮＡおよびＰＮＡからＵＭＩを生成するためにコンビナトリアル手法を使用することができる。一実施例では、ＵＭＩは、互いに直交性になるように設計された短いワード配列（４〜１５ｍｅｒ）のセットの「化学的ライゲーション」によって構築することができる（ＳｐｉｒｏｐｕｌｏｓおよびＨｅｅｍｓｔｒａ、２０１２年）。「ワード」ポリマーの化学的ライゲーションを導くためにＤＮＡ鋳型を使用する。ＤＮＡ鋳型は、単に溶液中で副成分を一緒に混合することによってコンビナトリアル鋳型構造をアセンブルすることを可能にするハイブリダイズアームを用いて構築する（図１２Ｃを参照されたい）。ある特定の実施形態では、この設計には「スペーサー」配列は存在しない。ワードスペースのサイズは、１０ワードから１０，０００またはそれよりも多くのワードまで変動し得る。ある特定の実施形態では、ワードは、交差ハイブリダイズはしないように互いとは異なるが、それでも比較的均一なハイブリダイゼーション条件が保たれるように選択する。一実施形態では、ワードの長さは、およそ１０塩基であり、サブセット内に約１０００ワードを有する（これは、全１０ｍｅｒワードスペースのたった０．１％である、約４^１０＝百万ワード）。これらのワードのセット（サブセット内に１０００）を連鎖状にして、複雑さ＝１０００^ｎパワーの最終的なコンビナトリアルＵＭＩを生成することができる。連鎖状にした４つのワードに関しては、これにより、１０^１２種の異なるエレメントのＵＭＩ多様性が生じる。これらのＵＭＩ配列を巨大分子（ペプチド、タンパク質など）に単一分子レベルで付加する。一実施形態では、ＵＭＩの多様性は、ＵＭＩを付着させる巨大分子の分子数を超える。このように、ＵＭＩにより、目的の巨大分子が一意的に識別される。コンビナトリアルワードＵＭＩの使用により、多数塩基長のワードを読み取るために一塩基分解能は必要ないので、エラー率が高いシーケンサー（例えば、ナノポアシーケンサー、ナノギャップトンネリングシーケンシングなど）での読み取りが容易になる。コンビナトリアルワード手法は、コンパートメントタグ、分配バーコード、空間バーコード、試料バーコード、エンコーダー配列、サイクル特異的配列、およびバーコードなどの、他の同一性に関する情報価値のある記録タグまたはコーディングタグの成分を生成するためにも使用することができる。ナノポアシーケンシングに関する方法およびエラー許容性ワード（コード）を有する情報をコードするＤＮＡは、当技術分野で公知である（例えば、それぞれ、その全体が参照により組み込まれる、Ｋｉａｈら、２０１５年、ＣｏｄｅｓｆｏｒＤＮＡｓｅｑｕｅｎｃｅｐｒｏｆｉｌｅｓ．ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ（ＩＳＩＴ）；Ｇａｂｒｙｓら、２０１５年、ＡｓｙｍｍｅｔｒｉｃＬｅｅｄｉｓｔａｎｃｅｃｏｄｅｓｆｏｒＤＮＡ−ｂａｓｅｄｓｔｏｒａｇｅ．ＩＥＥＥＳｙｍｐｏｓｉｕｍｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ（ＩＳＩＴ）；Ｌａｕｒｅら、２０１６年、Ｃｏｄｉｎｇｉｎ２Ｄ：ＵｓｉｎｇＩｎｔｅｎｔｉｏｎａｌＤｉｓｐｅｒｓｉｔｙｔｏＥｎｈａｎｃｅｔｈｅＩｎｆｏｒｍａｔｉｏｎＣａｐａｃｉｔｙｏｆＳｅｑｕｅｎｃｅ−ＣｏｄｅｄＰｏｌｙｍｅｒＢａｒｃｏｄｅｓ．Ａｎｇｅｗ．Ｃｈｅｍ．Ｉｎｔ．Ｅｄ．ｄｏｉ：１０．１００２／ａｎｉｅ．２０１６０５２７９；Ｙａｚｄｉら、２０１５年、ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＭｏｌｅｃｕｌａｒ，ＢｉｏｌｏｇｉｃａｌａｎｄＭｕｌｔｉ−ＳｃａｌｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ、１巻：２３０〜２４８頁；およびＹａｚｄｉら、２０１５年、ＳｃｉＲｅｐ、５巻：１４１３８頁を参照されたい）。したがって、ある特定の実施形態では、本明細書に記載の実施形態のいずれかにおける伸長記録タグ、伸長コーディングタグ、またはジタグ構築物は、エラー訂正コードである識別成分（例えば、ＵＭＩ、エンコーダー配列、バーコード、コンパートメントタグ、サイクル特異的配列など）で構成される。一部の実施形態では、エラー訂正コードは、Ｈａｍｍｉｎｇコード、Ｌｅｅ距離コード、非対称Ｌｅｅ距離コード、Ｒｅｅｄ−Ｓｏｌｏｍｏｎコード、およびＬｅｖｅｎｓｈｔｅｉｎ−Ｔｅｎｅｎｇｏｌｔｓコードから選択される。ナノポアシーケンシングに関しては、電流またはイオンフラックスプロファイルおよび非対称の塩基呼び出しエラーは使用されるナノポアの型および生化学的性質に内因するものであり、上述のエラー訂正手法を使用してよりロバストなＤＮＡコードを設計するためにこの情報を使用することができる。ロバストなＤＮＡナノポアシーケンシングバーコードの使用に対する代替として、バーコード配列の電流またはイオンフラックスシグネチャを直接使用し（その全体が参照により組み込まれる、米国特許第７，０６０，５０７号）、それによりＤＮＡ塩基呼び出しを完全に回避し、バーコード配列を、Ｌａｓｚｌｏら（２０１４年、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．、３２巻：８２９〜８３３頁、その全体が参照により組み込まれる）に記載されている通り、予測される電流／フラックスシグネチャにマッピングし戻すことによってすぐに識別することができる。この論文において、Ｌａｓｚｌｏらは、生物学的ナノポア、ＭｓｐＡから、異なるワードのつながりをナノポアを通過させた時に生じる電流シグネチャ、ならびに、得られた電流シグネチャを配列のユニバースからの可能性のある電流シグネチャのｉｎｓｉｌｉｃｏ予測にマッピングし戻すことによってＤＮＡ鎖をマッピングおよび識別する能力について記載している（２０１４年、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．、３２巻：８２９〜８３３頁）。同様の概念を、ＤＮＡコードおよびナノギャップトンネル電流に基づくＤＮＡ配列決定によって生じる電気信号に適用することができる（Ｏｈｓｈｉｒｏら、２０１２年、ＳｃｉＲｅｐ、２巻：５０１頁）。

したがって、ある特定の実施形態では、コーディングタグ、記録タグ、またはその両方の識別成分は、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することが可能であり、本明細書において提示される方法のいずれかの解析ステップは、識別成分を識別するために一意の電流またはイオンフラックスまたは光学的シグネチャを検出することを含む。一部の実施形態では、識別成分は、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せから選択される。

ある特定の実施形態では、試料中の巨大分子（例えば、タンパク質、ポリペプチド、またはペプチド）の全量または実質的な量（例えば、少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、または１００％）を記録タグで標識する。巨大分子の標識は、巨大分子を固体支持体に固定化する前に行うこともでき、その後に行うこともできる。

他の実施形態では、試料中の巨大分子のサブセット（例えば、タンパク質、ポリペプチド、またはペプチド）を記録タグで標識する。特定の実施形態では、試料由来の巨大分子のサブセットに記録タグを用いて標的化（分析物特異的）標識を行う。タンパク質の標的化記録タグ標識は、相補的な標的特異的ベイト配列、例えば記録タグ内の分析物特異的バーコードとアニーリングする短い標的特異的ＤＮＡ捕捉用プローブ、例えば分析物特異的バーコードと連結した標的タンパク質特異的結合性物質（例えば、抗体、アプタマーなど）を使用して実現することができる（図２８Ａを参照されたい）。記録タグは、標的タンパク質上に存在する同類の反応性部分（例えば、クリックケミストリー標識、光親和性標識）に対する反応性部分を含む。例えば、記録タグは、アルキンで誘導体化されたタンパク質と相互作用させるためのアジド部分を含んでよい、または、記録タグは、ネイティブなタンパク質で相互作用させるためのベンゾフェノンを含んでよい、などである（図２８Ａ〜Ｂを参照されたい）。標的タンパク質に標的タンパク質特異的結合性物質を結合させたら、記録タグおよび標的タンパク質をそれらの対応する反応性部分を介してカップリングさせる（図２８Ｂ〜Ｃを参照されたい）。標的タンパク質を記録タグで標識した後、標的タンパク質特異的結合性物質を、標的タンパク質特異的結合性物質に連結したＤＮＡ捕捉用プローブの消化によって除去することができる。例えば、ＤＮＡ捕捉用プローブをウラシル塩基が含有されるように設計することができ、次いでこれを、ウラシル特異的切除試薬（例えば、ＵＳＥＲ（商標））を用いた消化の標的とし、標的タンパク質特異的結合性物質を標的タンパク質から解離させることができる。

一実施例では、標的タンパク質のセットに特異的な抗体を、相補的なベイト配列（例えば、図２８の分析物バーコードＢＣ_Ａの）を用いて設計した記録タグとハイブリダイズするＤＮＡ捕捉用プローブ（例えば、図２８の分析物バーコードＢＣ_Ａ）で標識することができる。タンパク質の試料特異的標識は、試料特異的バーコードを含む記録タグ上の相補的なベイト配列とハイブリダイズするＤＮＡ捕捉用プローブで標識された抗体を使用することによって実現することができる。

別の例では、標的タンパク質特異的アプタマーを試料中のタンパク質のサブセットの標的化記録タグ標識のために使用する。標的特異的アプタマーを、記録タグ内の相補的なベイト配列とアニーリングするＤＮＡ捕捉用プローブに連結する。記録タグは、対応する反応性部分を有する標的タンパク質とカップリングするための反応性化学プローブまたは光反応性化学プローブ（例えば、ベンゾフェノン（ＢＰ））を含む。アプタマーがその標的タンパク質分子に結合し、記録タグが標的タンパク質の極めて近傍になり、その結果、記録タグと標的タンパク質がカップリングする。

小分子タンパク質親和性リガンドに付着させた光反応性化学プローブを使用した光親和性（ＰＡ）タンパク質標識は以前記載されている（Ｐａｒｋ，Ｋｏｈら、２０１６年）。典型的な光反応性化学プローブとしては、以前に記載されている照射波長の下で活性化されたベンゾフェノンに基づくプローブ（反応性ジラジカル、３６５ｎｍ）、フェニルジアジリンに基づくプローブ（反応性炭素、３６５ｎｍ）、およびアジ化フェニルに基づくプローブ（反応性ニトレンフリーラジカル、２６０ｎｍ）が挙げられる（ＳｍｉｔｈおよびＣｏｌｌｉｎｓ、２０１５年）。好ましい実施形態では、タンパク質試料中の標的タンパク質を、Ｌｉらにより開示された、ベンゾフェノンで標識した記録タグ内のベイト配列を同類結合性物質（例えば、核酸アプタマー（図２８を参照されたい））に付着させたＤＮＡ捕捉用プローブとハイブリダイズさせる方法（Ｌｉ、Ｌｉｕら、２０１３年）を使用して試料バーコードを含む記録タグで標識する。光親和性標識されたタンパク質標的に関しては、光親和性部分により標的タンパク質ではなく抗体が自己標識される可能性があるので、抗体よりもＤＮＡ／ＲＮＡアプタマーを標的タンパク質特異的結合性物質として使用することが好ましい。対照的に、光親和性標識は、核酸に対してはタンパク質よりも効率が低く、それにより、ＤＮＡ指向性化学標識または光標識についてはアプタマーがより良好なビヒクルになる。光親和性標識と同様に、Ｒｏｓｅｎら（Ｒｏｓｅｎ、Ｋｏｄａｌら、２０１４年、Ｋｏｄａｌ、Ｒｏｓｅｎら、２０１６年）記載されているものと同様に、アプタマー結合性部位の近傍にある反応性リシン（または他の部分）のＤＮＡ指向性化学標識を使用することもできる。

上述の実施形態では、標的特異的結合性物質と記録タグを連結するために、ハイブリダイゼーションに加えて他の型の連結を使用することができる（図２８Ａを参照されたい）。例えば、図２８Ｂに示されている通り、２つの部分を、捕捉された標的タンパク質（または他の巨大分子）が記録タグと共有結合したら、切断され、結合性物質を放出するように設計されたリンカーを使用して共有結合により連結することができる。適切なリンカーを記録タグの様々な位置、例えば、３’末端、または記録タグの５’末端に付着させたリンカー内などに付着させることができる。
ＶＩＩ．結合性物質およびコーディングタグ

本明細書に記載の方法では、巨大分子に結合することが可能な結合性物質を使用する。結合性物質は、巨大分子の成分もしくは特徴に結合することが可能な任意の分子であってよい（例えば、ペプチド、ポリペプチド、タンパク質、核酸、炭水化物、小分子など）。結合性物質は、天然に存在する分子であってもよく、合成的に作製された分子であってもよく、組換えによって発現させた分子であってもよい。結合性物質は、巨大分子の単一の単量体またはサブユニット（例えば、ペプチドの単一のアミノ酸）に結合し得る、または巨大分子の多数の連結したサブユニット（例えば、より長いペプチド分子のジペプチド、トリペプチド、またはより高次のペプチド）に結合し得る。

ある特定の実施形態では、結合性物質を、共有結合により結合するように設計することができる。共有結合は、正確な部分への結合が条件付けられるまたはそれが有利になるように設計することができる。例えば、ＮＴＡＡおよびその同類のＮＴＡＡ特異的結合性物質はそれぞれ、ＮＴＡＡ特異的結合性物質が同類のＮＴＡＡに結合したらカップリング反応が行われてこれら２つの間に共有結合性の連結が生じるように、反応性基を用いて修飾することができる。同類の反応性基を欠く他の位置への結合性物質の非特異的結合では共有結合による付着はもたらされない。結合性物質とその標的の間の共有結合により、非特異的に結合した結合性物質を除去するためによりストリンジェントな洗浄を使用することが可能になり、したがって、アッセイの特異度が増大する。

ある特定の実施形態では、結合性物質は、選択的結合性物質であってよい。本明細書で使用される場合、選択的結合とは、結合性物質が、特異的なリガンド（例えば、アミノ酸またはアミノ酸のクラス）に、異なるリガンド（例えば、アミノ酸またはアミノ酸のクラス）への結合と比べて優先的に結合できることを指す。選択性は、一般に、結合性物質との複合体において１つのリガンドが別のリガンドで置換される反応についての平衡定数とされる。一般には、そのような選択性は、リガンドの空間的な幾何学的形状ならびに／またはリガンドが結合性物質に結合する様式および程度、例えば、水素結合またはファンデルワールス力（非共有結合性の相互作用）によるもしくは可逆的または非可逆的な共有結合による、結合性物質への付着などに関連付けられる。選択性は、絶対的なものとは対照的に相対的なものであってよいこと、および、リガンド濃度を含めた種々の因子が選択性に影響を及ぼし得ることも理解されるべきである。したがって、一実施例では、結合性物質は、２０種の標準のアミノ酸のうちの１種に選択的に結合する。非選択的結合の例では、結合性物質は、２０種の標準のアミノ酸のうちの２種またはそれよりも多くに結合し得る。

本明細書に開示されている方法の実施において、結合性物質の、巨大分子の特徴または成分に選択的に結合する能力は、結合性物質のコーディングタグ情報の巨大分子に付随する記録タグへの移行、記録タグ情報のコーディングタグへの移行、またはコーディングタグ情報および記録タグ情報のジタグ分子への移行を可能にするために十分なものであればよい。したがって、選択的とは、巨大分子が暴露される他の結合性物質に対して相対的なものであればよい。結合性物質の選択性は、特定のアミノ酸に対して絶対的なものである必要はなく、非極性もしくは非極性側鎖を有するアミノ酸、または電気的に（正にもしくは負に）荷電した側鎖を有するアミノ酸、または芳香族側鎖を有するアミノ酸などのアミノ酸のクラス、または一部の特異的なクラスまたはサイズの側鎖などに選択的なものであってよいことも理解されるべきである。

特定の実施形態では、結合性物質は、目的の巨大分子に対して高い親和性および高い選択性を有する。特に、低い解離速度で高い結合親和性を有することがコーディングタグと記録タグの間の情報移行に効果的である。ある特定の実施形態では、結合性物質のＫｄは、＜１０ｎＭ、＜５ｎＭ、＜１ｎＭ、＜０．５ｎＭ、または＜０．１ｎＭである。特定の実施形態では、結合性物質を巨大分子に、結合が完了するように駆動するために、結合性物質のＫｄの＞１０×、＞１００×、または＞１０００×の濃度で添加する。抗体の単一のタンパク質分子への結合カイネティクスに関する詳細な考察は、Ｃｈａｎｇら（Ｃｈａｎｇ，Ｒｉｓｓｉｎら、２０１２年）に記載されている。

結合性物質の、ペプチドの小さなＮ末端アミノ酸（ＮＴＡＡ）に対する親和性を増大させるために、ＮＴＡＡを、ジニトロフェノール（ＤＮＰ）などの「免疫原性」ハプテンで修飾することができる。これは、ＤＮＰ基をＮＴＡＡのアミン基に付着させるサンガー試薬であるジニトロフルオロベンゼン（ＤＮＦＢ）を使用して周期的な配列決定手法で実行することができる。商業的な抗ＤＮＰ抗体は、低ｎＭ範囲（約８ｎＭ、ＬＯ−ＤＮＰ−２）で親和性を有する（Ｂｉｌｇｉｃｅｒ，Ｔｈｏｍａｓら、２００９年）；そのように、ＤＮＰで（ＤＮＦＢを介して）修飾されたいくつものＮＴＡＡに対して親和性が高いＮＴＡＡ結合性物質を工学的に操作し、同時に特定のＮＴＡＡに対する良好な結合選択性を実現することが可能であるはずなのは当然である。別の例では、ＮＴＡＡを、４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）を使用してスルホニルニトロフェノール（ＳＮＰ）で修飾することができる。アセチル基またはアミジニル（グアニジニル）基などの代替的なＮＴＡＡ修飾因子を用いて同様の親和性の増強を実現することもできる。

ある特定の実施形態では、結合性物質は、ペプチド分子のＮＴＡＡ、ＣＴＡＡ、介在するアミノ酸、ジペプチド（２つのアミノ酸の配列）、トリペプチド（３つのアミノ酸の配列）、またはより高次のペプチドに結合し得る。一部の実施形態では、結合性物質のライブラリー内の各結合性物質は、特定のアミノ酸、例えば、２０種の標準の天然に存在するアミノ酸のうちの１種に選択的に結合する。標準の、天然に存在するアミノ酸としては、アラニン（ＡまたはＡｌａ）、システイン（ＣまたはＣｙｓ）、アスパラギン酸（ＤまたはＡｓｐ）、グルタミン酸（ＥまたはＧｌｕ）、フェニルアラニン（ＦまたはＰｈｅ）、グリシン（ＧまたはＧｌｙ）、ヒスチジン（ＨまたはＨｉｓ）、イソロイシン（ＩまたはＩｌｅ）、リシン（ＫまたはＬｙｓ）、ロイシン（ＬまたはＬｅｕ）、メチオニン（ＭまたはＭｅｔ）、アスパラギン（ＮまたはＡｓｎ）、プロリン（ＰまたはＰｒｏ）、グルタミン（ＱまたはＧｌｎ）、アルギニン（ＲまたはＡｒｇ）、セリン（ＳまたはＳｅｒ）、トレオニン（ＴまたはＴｈｒ）、バリン（ＶまたはＶａｌ）、トリプトファン（ＷまたはＴｒｐ）、およびチロシン（ＹまたはＴｙｒ）が挙げられる。

ある特定の実施形態では、結合性物質は、アミノ酸の翻訳後修飾に結合し得る。一部の実施形態では、ペプチドは、１つまたは複数の翻訳後修飾を含み、これは、同じものであっても異なるものであってもよい。ペプチドのＮＴＡＡ、ＣＴＡＡ、介在するアミノ酸、またはこれらの組合せを翻訳後に修飾することができる。アミノ酸に対する翻訳後修飾としては、アシル化、アセチル化、アルキル化（メチル化を含む）、ビオチン化、ブチリル化、カルバミル化、カルボニル化、脱アミド化、脱イミノ化、ジフタミド形成、ジスルフィド架橋形成、エリミニル化、フラビン付着、ホルミル化、ガンマ−カルボキシル化、グルタミル化、グリシル化、グリコシル化、グリコシルホスファチジルイノシトール付加（ｇｌｙｐｉａｔｉｏｎ）、ヘムＣ付着、ヒドロキシル化、ハイプシン形成、ヨウ素化、イソプレニル化、脂質付加、リポイル化、マロニル化、メチル化、ミリストイル化、酸化、パルミトイル化、ペグ化、ホスホパンテテイニル化、リン酸化、プレニル化、プロピオニル化、レチニリデンシッフ塩基形成、Ｓ−グルタチオン化、Ｓ−ニトロシル化、Ｓ−スルフェニル化、セレン化、サクシニル化、スルフィン化、ユビキチン化、およびＣ末端アミド化が挙げられる（ＳｅｏおよびＬｅｅ、２００４年、Ｊ．Ｂｉｏｃｈｅｍ．Ｍｏｌ．Ｂｉｏｌ．、３７巻：３５〜４４頁も参照されたい）。

ある特定の実施形態では、タンパク質、ポリペプチド、またはペプチドのグリコシル化の状態を検出するための結合性物質としてレクチンを使用する。レクチンは、遊離の炭水化物または糖タンパク質のグリカンエピトープを選択的に認識することができる炭水化物−結合性タンパク質である。種々のグリコシル化の状態（例えば、コア−フコース、シアル酸、Ｎ−アセチル−Ｄ−ラクトサミン、マンノース、Ｎ−アセチル−グルコサミン）を認識するレクチンの一覧は、Ａ、ＡＡＡ、ＡＡＬ、ＡＢＡ、ＡＣＡ、ＡＣＧ、ＡＣＬ、ＡＯＬ、ＡＳＡ、ＢａｎＬｅｃ、ＢＣ２Ｌ−Ａ、ＢＣ２ＬＣＮ、ＢＰＡ、ＢＰＬ、Ｃａｌｓｅｐａ、ＣＧＬ２、ＣＮＬ、Ｃｏｎ、ＣｏｎＡ、ＤＢＡ、Ｄｉｓｃｏｉｄｉｎ、ＤＳＡ、ＥＣＡ、ＥＥＬ、Ｆ１７ＡＧ、Ｇａｌ１、Ｇａｌ１−Ｓ、Ｇａｌ２、Ｇａｌ３、Ｇａｌ３Ｃ−Ｓ、Ｇａｌ７−Ｓ、Ｇａｌ９、ＧＮＡ、ＧＲＦＴ、ＧＳ−Ｉ、ＧＳ−ＩＩ、ＧＳＬ−Ｉ、ＧＳＬ−ＩＩ、ＨＨＬ、ＨＩＨＡ、ＨＰＡ、Ｉ、ＩＩ、Ｊａｃａｌｉｎ、ＬＢＡ、ＬＣＡ、ＬＥＡ、ＬＥＬ、Ｌｅｎｔｉｌ、Ｌｏｔｕｓ、ＬＳＬ−Ｎ、ＬＴＬ、ＭＡＡ、ＭＡＨ、ＭＡＬ＿Ｉ、Ｍａｌｅｃｔｉｎ、ＭＯＡ、ＭＰＡ、ＭＰＬ、ＮＰＡ、Ｏｒｙｓａｔａ、ＰＡ−ＩＩＬ、ＰＡ−ＩＬ、ＰＡＬａ、ＰＨＡ−Ｅ、ＰＨＡ−Ｌ、ＰＨＡ−Ｐ、ＰＨＡＥ、ＰＨＡＬ、ＰＮＡ、ＰＰＬ、ＰＳＡ、ＰＳＬ１ａ、ＰＴＬ、ＰＴＬ−Ｉ、ＰＷＭ、ＲＣＡ１２０、ＲＳ−Ｆｕｃ、ＳＡＭＢ、ＳＢＡ、ＳＪＡ、ＳＮＡ、ＳＮＡ−Ｉ、ＳＮＡ−ＩＩ、ＳＳＡ、ＳＴＬ、ＴＪＡ−Ｉ、ＴＪＡ−ＩＩ、ＴｘＬＣＩ、ＵＤＡ、ＵＥＡ−Ｉ、ＵＥＡ−ＩＩ、ＶＦＡ、ＶＶＡ、ＷＦＡ、ＷＧＡを含む（Ｚｈａｎｇら、２０１６年、ＭＡＢＳ、８巻：５２４〜５３５頁を参照されたい）。

ある特定の実施形態では、結合性物質は、修飾または標識されたＮＴＡＡに結合し得る。修飾または標識されたＮＴＡＡは、ＰＩＴＣ、１−フルオロ−２，４−ジニトロベンゼン（サンガー試薬、ＤＮＦＢ）、ダンシルクロリド（ＤＮＳ−Ｃｌ、もしくは１−ジメチルアミノナフタレン−５−スルホニルクロリド）、４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）、アセチル化試薬、グアニジン化試薬、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬で標識されているものであってよい。

ある特定の実施形態では、結合性物質は、アプタマー（例えば、ペプチドアプタマー、ＤＮＡアプタマー、またはＲＮＡアプタマー）、抗体、アンチカリン、ＡＴＰ依存性Ｃｌｐプロテアーゼアダプタータンパク質（ＣｌｐＳ）、抗体結合性断片、抗体模倣物、ペプチド、ペプチド模倣物、タンパク質、またはポリヌクレオチド（例えば、ＤＮＡ、ＲＮＡ、ペプチド核酸（ＰＮＡ）、γＰＮＡ、架橋核酸（ＢＮＡ）、異種核酸（ＸＮＡ）、グリセロール核酸（ＧＮＡ）、またはトレオース核酸（ＴＮＡ）、またはそのバリアント）であってよい。

本明細書で使用される場合、抗体（ａｎｔｉｂｏｄｙ）および抗体（ａｎｔｉｂｏｄｉｅｓ）という用語は、広範な意味で使用され、インタクトな抗体分子、例えば、これだけに限定されないが、免疫グロブリンＡ、免疫グロブリンＧ、免疫グロブリンＤ、免疫グロブリンＥ、および免疫グロブリンＭだけでなく、少なくとも１つのエピトープに免疫特異的に結合する抗体分子の任意の免疫反応性成分（複数可）も含む。抗体は、天然に存在するものであってもよく、合成的に作製されたものであってもよく、組換えによって発現させたものであってもよい。抗体は、融合タンパク質であってよい。抗体は、抗体模倣物であってよい。抗体の例としては、これだけに限定されないが、Ｆａｂ断片、Ｆａｂ’断片、Ｆ（ａｂ’）_２断片、単鎖抗体断片（ｓｃＦｖ）、ミニボディ（ｍｉｎｉａｎｔｉｂｏｄｙ）、ダイアボディ（ｄｉａｂｏｄｙ）、架橋結合した抗体断片、Ａｆｆｉｂｏｄｙ（商標）、ナノボディ、単一ドメイン抗体、ＤＶＤ−Ｉｇ分子、アルファボディ、アフィマー（ａｆｆｉｍｅｒ）、アフィチン（ａｆｆｉｔｉｎ）、サイクロチド、分子などが挙げられる。抗体工学またはタンパク質工学技法を使用して得られる免疫反応性産物もまた、明白に抗体という用語の意味の範囲内に入る。関連するプロトコールを含めた抗体および／またはタンパク質工学の詳細な説明は、他の場所の中でも、Ｊ．ＭａｙｎａｒｄおよびＧ．Ｇｅｏｒｇｉｏｕ、２０００年、Ａｎｎ．Ｒｅｖ．Ｂｉｏｍｅｄ．Ｅｎｇ．、２巻：３３９〜７６頁；ＡｎｔｉｂｏｄｙＥｎｇｉｎｅｅｒｉｎｇ、Ｒ．ＫｏｎｔｅｒｍａｎｎおよびＳ．Ｄｕｂｅｌ編、ＳｐｒｉｎｇｅｒＬａｂＭａｎｕａｌ、ＳｐｒｉｎｇｅｒＶｅｒｌａｇ（２００１年）；米国特許第５，８３１，０１２号；およびＳ．Ｐａｕｌ、ＡｎｔｉｂｏｄｙＥｎｇｉｎｅｅｒｉｎｇＰｒｏｔｏｃｏｌｓ、ＨｕｍａｎａＰｒｅｓｓ（１９９５年）において見いだすことができる。

抗体と同様に、ペプチドを特異的に認識する核酸およびペプチドアプタマーは、公知の方法を使用して作製することができる。アプタマーは、標的分子に、高度に特異的な、コンフォメーション依存性様式で結合し、一般には、非常に高い親和性を有するが、より低い結合親和性を有するアプタマーも所望であれば選択することができる。アプタマーは、標的間を、メチル基またはヒドロキシル基が存在するかしないかなどの非常に小さな構造的差異に基づいて区別することが示されており、また、ある特定のアプタマーは、Ｄ−鏡像異性体とＬ−鏡像異性体を区別することができる。薬物、金属イオン、および有機色素、ペプチド、ビオチン、ならびに、これだけに限定されないが、ストレプトアビジン、ＶＥＧＦ、およびウイルスタンパク質を含めたタンパク質を含めた小分子標的に結合するアプタマーが得られている。アプタマーは、ビオチン化の後、フルオレセイン標識の後、ならびにガラス表面およびマイクロスフェアに付着した際に機能活性を保持することが示されている（Ｊａｙａｓｅｎａ、１９９９年、ＣｌｉｎＣｈｅｍ、４５巻：１６２８〜５０頁；Ｋｕｓｓｅｒ、２０００年、Ｊ．Ｂｉｏｔｅｃｈｎｏｌ．、７４巻：２７〜３９頁；Ｃｏｌａｓ、２０００年、ＣｕｒｒＯｐｉｎＣｈｅｍＢｉｏｌ、４巻：５４〜９頁を参照されたい）。アルギニンおよびＡＭＰに特異的に結合するアプタマーも記載されている（ＰａｔｅｌおよびＳｕｒｉ、２０００年、Ｊ．Ｂｉｏｔｅｃｈ．、７４巻：３９〜６０頁を参照されたい）。特定のアミノ酸に結合するオリゴヌクレオチドアプタマーがＧｏｌｄら（１９９５年、Ａｎｎ．Ｒｅｖ．Ｂｉｏｃｈｅｍ．、６４巻：７６３〜９７頁）に開示されている。アミノ酸に結合するＲＮＡアプタマーも記載されている（ＡｍｅｓおよびＢｒｅａｋｅｒ、２０１１年、ＲＮＡＢｉｏｌ．、８巻；８２〜８９頁；Ｍａｎｎｉｒｏｎｉら、２０００年、ＲＮＡ、６巻：５２０〜２７頁；Ｆａｍｕｌｏｋ、１９９４年、Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．、１１６巻：１６９８〜１７０６頁）。

結合性物質は、天然に存在するまたは合成的に作製されたタンパク質を、アミノ酸配列内に１つまたは複数の変異が導入されるように遺伝子工学によって修飾して、特定の巨大分子の成分もしくは特徴（例えば、ＮＴＡＡ、ＣＴＡＡ、または翻訳後修飾されたアミノ酸またはペプチド）に結合する工学的に操作されたタンパク質を生じさせることによって作出することができる。例えば、エキソペプチダーゼ（例えば、アミノペプチダーゼ、カルボキシペプチダーゼ）、エキソプロテアーゼ、変異エキソプロテアーゼ、変異アンチカリン、変異ＣｌｐＳ、抗体、またはｔＲＮＡ合成酵素を改変して、特定のＮＴＡＡに選択的に結合する結合性物質を創出することができる。別の例では、カルボキシペプチダーゼを改変して、特定のＣＴＡＡに選択的に結合する結合性物質を創出することができる。結合性物質はまた、修飾されたＮＴＡＡまたは修飾されたＣＴＡＡ、例えば、翻訳後修飾（例えば、リン酸化ＮＴＡＡまたはリン酸化ＣＴＡＡ）を有するもの、または標識（例えば、ＰＴＣ、１−フルオロ−２，４−ジニトロベンゼン（サンガー試薬、ＤＮＦＢを使用して）、ダンシルクロリド（ＤＮＳ−Ｃｌ、もしくは１−ジメチルアミノナフタレン−５−スルホニルクロリドを使用して）、もしくはチオアシル化試薬、チオアセチル化試薬、アセチル化試薬、アミジン化（グアニジン化）試薬、もしくはチオベンジル化試薬を使用して）で修飾されたものに特異的に結合するように設計または改変し、利用することもできる。タンパク質の定向進化のための戦略は、当技術分野で公知であり（例えば、Ｙｕａｎら、２００５年、Ｍｉｃｒｏｂｉｏｌ．Ｍｏｌ．Ｂｉｏｌ．Ｒｅｖ．、６９巻：３７３〜３９２頁によって概説されている）、それらとして、ファージディスプレイ、リボソームディスプレイ、ｍＲＮＡディスプレイ、ＣＩＳディスプレイ、ＣＡＤディスプレイ、エマルジョン、細胞表面ディスプレイ法、酵母表面ディスプレイ、細菌表面ディスプレイなどが挙げられる。

一部の実施形態では、修飾されたＮＴＡＡに選択的に結合する結合性物質を利用することができる。例えば、ＮＴＡＡをフェニルイソチオシアネート（ＰＩＴＣ）と反応させてフェニルチオカルバモイル−ＮＴＡＡ誘導体を形成することができる。このように、結合性物質をフェニルチオカルバモイル部分のフェニル基ならびにＮＴＡＡのアルファ炭素Ｒ基のどちらにも選択的に結合するように適合させることができる。このように、ＰＩＴＣを使用することにより、以下に考察する通り、その後の、ＮＴＡＡのエドマン分解による切断が可能になる。別の実施形態では、ＮＴＡＡをサンガー試薬（ＤＮＦＢ）と反応させて、ＤＮＰで標識されたＮＴＡＡを生成することができる（図３を参照されたい）。任意選択で、ＤＮＦＢを、ＤＮＦＢが高度に可溶性である１−エチル−３−メチルイミダゾリウムビス［（トリフルオロメチル）スルホニル］イミド（［エミン］［Ｔｆ２Ｎ］）などのイオン性液体と共に使用する。このように、結合性物質を、ＤＮＰとＮＴＡＡのＲ基の組合せに選択的に結合するように工学的に操作することができる。ＤＮＰ部分の付加により、結合性物質とＮＴＡＡの相互作用に対するより大きな「ハンドル」がもたらされ、より高い親和性相互作用が導かれるはずである。さらに別の実施形態では、結合性物質は、ＤＮＰで標識されたＮＴＡＡを認識し、それによりペプチドのアミノペプチダーゼ分解の周期的制御がもたらされるように工学的に操作されたアミノペプチダーゼであってよい。ＤＮＰで標識されたＮＴＡＡが切断されたら、新しく露出したＮＴＡＡへの結合およびその切断のためにＤＮＦＢ誘導体化の別のサイクルを実施する。好ましい特定の実施形態では、アミノペプチダーゼは、単量体メタロ−プロテアーゼであり、そのようなアミノペプチダーゼは亜鉛によって活性化される（ＣａｌｃａｇｎｏおよびＫｌｅｉｎ、２０１６年）。別の例では、結合性物質は、例えば４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）を使用することによってスルホニルニトロフェノール（ＳＮＰ）で修飾されたＮＴＡＡに選択的に結合し得る。さらに別の実施形態では、結合性物質は、アセチル化されたまたはアミジン化されたＮＴＡＡに選択的に結合し得る。

ＮＴＡＡを修飾するために使用することができる他の試薬としては、トリフルオロエチルイソチオシアネート、イソチオシアン酸アリル、およびジメチルアミノアゾベンゼンイソチオシアネートが挙げられる。

結合性物質を、修飾されたＮＴＡＡに対する高い親和性、修飾されたＮＴＡＡに対する高い特異性、またはその両方のために工学的に操作することができる。一部の実施形態では、結合性物質を、ファージディスプレイを使用した有望な親和性足場の定向進化によって開発することができる。

個々のまたは小さな群の標識（ビオチン化）されたＮＴＡＡに結合し、それを切断する工学的に操作されたアミノペプチダーゼ変異体が記載されている（その全体が参照により組み込まれる、ＰＣＴ公開第ＷＯ２０１０／０６５３２２号を参照されたい）。アミノペプチダーゼは、タンパク質またはペプチドのＮ末端からアミノ酸を切断する酵素である。天然のアミノペプチダーゼは、非常に限られた特異性を有し、一般的に、Ｎ末端アミノ酸を前進的に切断し、アミノ酸を次々に切断する（Ｋｉｓｈｏｒら、２０１５年、Ａｎａｌ．Ｂｉｏｃｈｅｍ．、４８８巻：６〜８頁）。しかし、残基特異的アミノペプチダーゼが同定されている（Ｅｒｉｑｕｅｚら、Ｊ．Ｃｌｉｎ．Ｍｉｃｒｏｂｉｏｌ．、１９８０年、１２巻：６６７〜７１頁；Ｗｉｌｃｅら、１９９８年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、９５巻：３４７２〜３４７７頁；Ｌｉａｏら、２００４年、Ｐｒｏｔ．Ｓｃｉ．、１３巻：１８０２〜１０頁）。アミノペプチダーゼを、特定の部分（例えば、ＰＴＣ、ＤＮＰ、ＳＮＰなど）で標識された、標準のアミノ酸を表す２０種の異なるＮＴＡＡに特異的に結合するように工学的に操作することができる。ペプチドのＮ末端の段階的分解の制御は、標識の存在下でのみ活性な（例えば、結合活性または触媒活性）、工学的に操作されたアミノペプチダーゼを使用することによって実現される。別の例では、Ｈａｖｒａｎａｋら（米国特許公開第２０１４／０２７３００４号）が、アミノアシルｔＲＮＡ合成酵素（ａａＲＳ）を特異的なＮＴＡＡ結合物質として工学的に操作することに関して記載している。ａａＲＳのアミノ酸結合ポケットは、同類のアミノ酸に結合する内因性の能力を有するが、一般に、不十分な結合親和性および特異性を示す。さらに、これらの天然のアミノ酸結合物質はＮ末端標識を認識しない。ａａＲＳ足場の定向進化を使用して、Ｎ末端標識に関してＮ末端アミノ酸を認識する、親和性がより高く、特異性がより高い結合性物質を生成することができる。

別の例では、高度に選択的な工学的に操作されたＣｌｐＳも文献に記載されている。Ｅｍｉｌｉらは、Ｅ．ｃｏｌｉＣｌｐＳタンパク質のファージディスプレイによる定向進化の結果、ＮＴＡＡにアスパラギン酸、アルギニン、トリプトファン、およびロイシン残基に対して選択的に結合する能力を有する４つの異なるバリアントがもたらされることを記載している（米国特許第９，５６６，３３５号、その全体が参照により組み込まれる）。

特定の実施形態では、アンチカリンを、標識されたＮＴＡＡ（例えば、ＤＮＰ、ＳＮＰ、アセチル化など）に対する高い親和性および高い特異性の両方について工学的に操作する。アンチカリン足場のある特定の変形は、ベータバレル構造に起因して、単一のアミノ酸への結合に適した形状を有する。Ｎ末端アミノ酸（修飾を伴うまたは伴わない）は、この「ベータバレル」バケットに潜在的に適合し、認識され得る。工学的に操作された新規の結合活性を有する親和性が高いアンチカリンが記載されている（Ｓｋｅｒｒａ、２００８年、ＦＥＢＳＪ．、２７５巻：２６７７〜２６８３頁によって概説されている）。例えば、フルオレセインおよびジゴキシゲニンに対して親和性が高い結合性（低ｎＭ）を有するアンチカリンが工学的に操作されている（ＧｅｂａｕｅｒおよびＳｋｅｒｒａ、２０１２年）。新しい結合機能のために代替的足場を工学的に操作することについては、Ｂａｎｔａら（２０１３年、Ａｎｎｕ．Ｒｅｖ．Ｂｉｏｍｅｄ．Ｅｎｇ．、１５巻：９３〜１１３頁）によっても概説されている。

所与の一価の結合性物質の機能的親和性（結合活性）を、一価の結合性物質の二価またはより高次の多量体を使用することによって少なくとも１桁分だけ増大させることができる（ＶａｕｑｕｅｌｉｎおよびＣｈａｒｌｔｏｎ、２０１３年）。結合活性とは、多数の同時に存在する非共有結合性の相互作用の蓄積された強度を指す。個々の結合相互作用は容易に解離し得る。しかし、多数の結合相互作用が同時に存在する場合、単一の結合相互作用の一過性の解離では結合性タンパク質は発散せず、結合相互作用は回復する可能性がある。結合性物質の結合活性を増大させるための代替的方法は、結合性物質に付着させるコーディングタグと巨大分子に付随させる記録タグに相補配列を含めることである。

一部の実施形態では、修飾されたＣ末端アミノ酸（ＣＴＡＡ）に選択的に結合する結合性物質を利用することができる。カルボキシペプチダーゼは、遊離のカルボキシル基を含有する末端アミノ酸を切断するプロテアーゼである。いくつものカルボキシペプチダーゼがアミノ酸の優先性を示し、例えば、カルボキシペプチダーゼＢは、アルギニンおよびリシンなどの塩基性アミノ酸において優先的に切断する。カルボキシペプチダーゼを改変して、特定のアミノ酸に選択的に結合する結合性物質を創出することができる。一部の実施形態では、カルボキシペプチダーゼを、修飾部分ならびにＣＴＡＡのアルファ炭素Ｒ基のどちらにも選択的に結合するように工学的に操作することができる。したがって、工学的に操作されたカルボキシペプチダーゼは、Ｃ末端標識に関連して標準のアミノ酸を表す２０種の異なるＣＴＡＡを特異的に認識し得る。ペプチドのＣ末端からの段階的分解の制御は、標識の存在下でのみ活性な（例えば、結合活性または触媒活性）工学的に操作されたカルボキシペプチダーゼを使用することによって実現される。一実施例では、ＣＴＡＡをパラ−ニトロアニリド基または７−アミノ−４−メチルクマリニル基によって修飾することができる。

本明細書に記載の方法において使用するための結合物質を生成するために工学的に操作することができる他の潜在的な足場としては、アンチカリン、アミノ酸ｔＲＮＡ合成酵素（ａａＲＳ）、ＣｌｐＳ、Ａｆｆｉｌｉｎ（登録商標）、Ａｄｎｅｃｔｉｎ（商標）、Ｔ細胞受容体、ジンクフィンガータンパク質、チオレドキシン、ＧＳＴＡ１−１、ＤＡＲＰｉｎ、アフィマー、アフィチン、アルファボディ（ａｌｐｈａｂｏｄｙ）、アビマー（ａｖｉｍｅｒ）、クニッツドメインペプチド、モノボディ（ｍｏｎｏｂｏｄｙ）、単一ドメイン抗体、ＥＥＴＩ−ＩＩ、ＨＰＳＴＩ、細胞内抗体、リポカリン、ＰＨＤ−フィンガー、Ｖ（ＮＡＲ）ＬＤＴＩ、エビボディ（ｅｖｉｂｏｄｙ）、Ｉｇ（ＮＡＲ）、ノッチン、マキシボティ（ｍａｘｉｂｏｄｙ）、ネオカルジノスタチン、ｐＶＩＩＩ、テンダミスタット、ＶＬＲ、プロテインＡ足場、ＭＴＩ−ＩＩ、エコチン、ＧＣＮ４、Ｉｍ９、クニッツドメイン、ミクロボディ、ＰＢＰ、トランスボディ（ｔｒａｎｓ−ｂｏｄｙ）、テトラネクチン（ｔｅｔｒａｎｅｃｔｉｎ）、ＷＷドメイン、ＣＢＭ４−２、ＤＸ−８８、ＧＦＰ、ｉＭａｂ、Ｌｄｌ受容体ドメインＡ、Ｍｉｎ−２３、ＰＤＺ−ドメイン、トリ膵臓ポリペプチド、カリブドトキシン／１０Ｆｎ３、ドメイン抗体（Ｄａｂ）、ａ２ｐ８アンキリンリピート、昆虫防御Ａペプチド、設計されたＡＲタンパク質、Ｃ型レクチンドメイン、ブドウ球菌ヌクレアーゼ、Ｓｒｃ相同性ドメイン３（ＳＨ３）、またはＳｒｃ相同性ドメイン２（ＳＨ２）が挙げられる。

結合性物質を、より高い温度および穏やかな変性条件（例えば、尿素、グアニジンチオシアネート、イオン溶液の存在など）に耐えるように工学的に操作することができる。変性剤の使用は、結合性物質の直鎖ペプチドエピトープへの結合に干渉する可能性がある、表面に結合したペプチドの二次構造、例えば、α−ヘリックス構造、β−ヘアピン、β−鎖、および他のこのような構造などを低減するのに役立つ。一実施形態では、結合サイクル中にペプチド二次構造を低減するために１−エチル−３−メチルイミダゾリウムアセテート（［ＥＭＩＭ］＋［ＡＣＥ］）などのイオン性液体を使用する（Ｌｅｓｃｈ、Ｈｅｕｅｒら、２０１５年）。

記載されている任意の結合性物質はまた、結合性物質に関する識別情報を含有するコーディングタグも含む。コーディングタグは、それが付随する結合性物質に関する一意の識別情報をもたらす約３塩基〜約１００塩基の核酸分子である。コーディングタグは、約３〜約９０塩基、約３〜約８０塩基、約３〜約７０塩基、約３〜約６０塩基、約３塩基〜約５０塩基、約３塩基〜約４０塩基、約３塩基〜約３０塩基、約３塩基〜約２０塩基、約３塩基〜約１０塩基、または約３塩基〜約８塩基を含み得る。一部の実施形態では、コーディングタグは、約３塩基、４塩基、５塩基、６塩基、７塩基、８塩基、９塩基、１０塩基、１１塩基、１２塩基、１３塩基、１４塩基、１５塩基、１６塩基、１７塩基、１８塩基、１９塩基、２０塩基、２５塩基、３０塩基、３５塩基、４０塩基、５５塩基、６０塩基、６５塩基、７０塩基、７５塩基、８０塩基、８５塩基、９０塩基、９５塩基、または１００塩基の長さである。コーディングタグは、ＤＮＡ、ＲＮＡ、ポリヌクレオチド類似体、またはこれらの組合せで構成されるものであってよい。ポリヌクレオチド類似体は、ＰＮＡ、γＰＮＡ、ＢＮＡ、ＧＮＡ、ＴＮＡ、ＬＮＡ、モルホリノポリヌクレオチド、２’−Ｏ−メチルポリヌクレオチド、アルキルリボシル置換ポリヌクレオチド、ホスホロチオエートポリヌクレオチド、および７−デアザプリン類似体を含む。

コーディングタグは、付随する結合性物質に関する識別情報をもたらすエンコーダー配列を含む。エンコーダー配列は、約３塩基〜約３０塩基、約３塩基〜約２０塩基、約３塩基〜約１０塩基、または約３塩基〜約８塩基である。一部の実施形態では、エンコーダー配列は、約３塩基、４塩基、５塩基、６塩基、７塩基、８塩基、９塩基、１０塩基、１１塩基、１２塩基、１３塩基、１４塩基、１５塩基、２０塩基、２５塩基、または３０塩基の長さである。エンコーダー配列の長さにより、生成され得る一意のエンコーダー配列の数が決定される。コード配列が短いほど、生成される一意のコード配列の数が少なくなり、これは、少数の結合性物質を使用する場合に有用であり得る。巨大分子の集団を解析する場合にはより長いエンコーダー配列が望ましい可能性がある。例えば、５塩基のエンコーダー配列は式５’−ＮＮＮＮＮ−３’（配列番号１３５）（式中、Ｎは任意の天然に存在するヌクレオチドまたは類似体であってよい）を有する。４種の天然に存在するヌクレオチドＡ、Ｔ、Ｃ、およびＧを使用すると、５塩基の長さを有する一意のエンコーダー配列の総数は１，０２４になる。一部の実施形態では、例えば、塩基が全て同一であるか、少なくとも３つの連続した塩基が同一であるか、またはその両方であるエンコーダー配列を除くことにより、一意のエンコーダー配列の総数を減らすことができる。特定の実施形態では、≧５０種の一意のエンコーダー配列のセットを結合性物質ライブラリーに使用する。

一部の実施形態では、コーディングタグまたは記録タグの識別成分、例えば、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、分配バーコード、試料バーコード、空間的領域バーコード、サイクル特異的配列またはそれらの任意の組合せを、Ｈａｍｍｉｎｇ距離、Ｌｅｅ距離、非対称Ｌｅｅ距離、Ｒｅｅｄ−Ｓｏｌｏｍｏｎ、Ｌｅｖｅｎｓｈｔｅｉｎ−Ｔｅｎｅｎｇｏｌｔｓ、または同様のエラー訂正方法に供する。Ｈａｍｍｉｎｇ距離は、長さが等しい２つのつながりの間の異なる位置の数を指す。Ｈａｍｍｉｎｇ距離により、１つのつながりを他のつながりに変えるために必要な置換の最小数が測定される。Ｈａｍｍｉｎｇ距離は、妥当な距離があいたエンコーダー配列を選択することによってエラーを訂正するために使用することができる。したがって、エンコーダー配列が５塩基である例では、使用できるエンコーダー配列の数は２５６種の一意のエンコーダー配列に減少する（１→４^４エンコーダー配列のＨａｍｍｉｎｇ距離＝２５６種のエンコーダー配列）。別の実施形態では、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せを、周期的な脱コーディングプロセスによって容易に読み取られるように設計する（Ｇｕｎｄｅｒｓｏｎ、２００４年、ＧｅｎｏｍｅＲｅｓ．、１４巻：８７０〜７頁）。別の実施形態では、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、分配バーコード、空間バーコード、試料バーコード、サイクル特異的配列、またはそれらの任意の組合せを、一塩基分解能が必要なのではなく、多数の塩基のワード（約５〜２０塩基の長さ）を読み取る必要があるので、正確度の低いナノポアシーケンシングによって読み取られるように設計する。本開示の方法において使用することができる１５ｍｅｒのエラー訂正Ｈａｍｍｉｎｇバーコードのサブセットは配列番号１〜６５に記載されており、それらの対応する逆相補的な配列は配列番号６６〜１３０に記載されている。

一部の実施形態では、結合性物質のライブラリー内の一意の結合性物質のそれぞれが一意のエンコーダー配列を有する。例えば、２０種の一意のエンコーダー配列を２０種の標準のアミノ酸に結合する２０種の結合性物質のライブラリーに使用することができる。修飾されたアミノ酸（例えば、翻訳後修飾されたアミノ酸）を識別するために追加的なコーディングタグ配列を使用することができる。別の例では、３０種の一意のエンコーダー配列を２０種の標準のアミノ酸および１０種の翻訳後修飾されたアミノ酸（例えば、リン酸化アミノ酸、アセチル化アミノ酸、メチル化アミノ酸）に結合する３０種の結合性物質のライブラリーに使用することができる。他の実施形態では、２種またはそれよりも多くの異なる結合性物質が同じエンコーダー配列を共有してよい。例えば、それぞれが異なる標準のアミノ酸に結合する２種の結合性物質が同じエンコーダー配列を共有してよい。

ある特定の実施形態では、コーディングタグは、一方の末端または両方の末端にスペーサー配列をさらに含む。スペーサー配列は、約１塩基〜約２０塩基、約１塩基〜約１０塩基、約５塩基〜約９塩基、または約４塩基〜約８塩基である。一部の実施形態では、スペーサーは、約１塩基、２塩基、３塩基、４塩基、５塩基、６塩基、７塩基、８塩基、９塩基、１０塩基、１１塩基、１２塩基、１３塩基、１４塩基、１５塩基または２０塩基の長さである。一部の実施形態では、コーディングタグ内のスペーサーは、エンコーダー配列よりも短い、例えば、エンコーダー配列よりも少なくとも１塩基、２塩基、３塩基、４塩基、５塩基、６、塩基、７塩基、８塩基、９塩基、１０塩基、１１塩基、１２塩基、１３塩基、１４塩基、１５塩基、２０塩基、または２５塩基短い。他の実施形態では、コーディングタグ内のスペーサーは、エンコーダー配列と同じ長さである。ある特定の実施形態では、スペーサーは、結合性物質特異的であり、したがって、前の結合サイクルからのスペーサーは現行の結合サイクルにおいて適切な結合性物質からのスペーサーとのみ相互作用する。例は、両方の抗体が巨大分子に逐次的に結合する場合にのみ情報移行を可能にするスペーサー配列を含有する同類の抗体の対である。スペーサー配列は、プライマー伸長反応のためのプライマーアニーリング部位、またはライゲーション反応における副子もしくは粘着末端として使用することができる。コーディングタグ上の５’スペーサー（図５Ａ、「＊Ｓｐ’」を参照されたい）は、Ｔ_ｍを上昇させるために、記録タグ上の３’スペーサーに対する偽性相補的塩基を任意選択で含有してよい（Ｌｅｈｏｕｄら、２００８年、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．、３６巻：３４０９〜３４１９頁）。

一部の実施形態では、結合性物質の集合内のコーディングタグは、アッセイに使用される共通のスペーサー配列を共有する（例えば、多数の結合サイクル方法に使用される結合性物質のライブラリー全体がそれらのコーディングタグに共通のスペーサーを有する）。別の実施形態では、コーディングタグは、特定の結合サイクルを識別する結合サイクルタグで構成される。他の実施形態では、結合性物質のライブラリー内のコーディングタグは、結合サイクル特異的スペーサー配列を有する。一部の実施形態では、コーディングタグは、結合サイクル特異的スペーサー配列を１つ含む。例えば、第１の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル１」特異的スペーサー配列を含み、第２の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル２」特異的スペーサー配列を含み、「ｎ」回の結合サイクルまで同様である。さらなる実施形態では、第１の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル１」特異的スペーサー配列および「サイクル２」特異的スペーサー配列を含み、第２の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル２」特異的スペーサー配列および「サイクル３」特異的スペーサー配列を含み、「ｎ」回の結合サイクルまで同様である。この実施形態は、結合サイクルが完了した後の非連鎖状伸長記録タグのＰＣＲアセンブリに有用である（図１０を参照されたい）。一部の実施形態では、スペーサー配列は、プライマー伸長反応または粘着末端ライゲーション反応を開始するために記録タグまたは伸長記録タグ内の相補的なスペーサー配列とアニーリングするのに十分な数の塩基を含む。

記録タグの集団が巨大分子に付随する場合、サイクル特異的スペーサー配列を使用してコーディングタグの情報を単一の記録タグ上に連鎖状にすることもできる。第１の結合サイクルでコーディングタグからランダムに選択された記録タグに情報を移行させ、その後の結合サイクルではサイクル依存性スペーサー配列を使用して伸長記録タグのみをプライミングすることができる。より詳細には、第１の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル１」特異的スペーサー配列および「サイクル２」特異的スペーサー配列を含み、第２の結合サイクルで使用される結合性物質に対するコーディングタグは「サイクル２」特異的スペーサー配列および「サイクル３」特異的スペーサー配列を含み、「ｎ」回の結合サイクルまで同様である。第１の結合サイクルからの結合性物質のコーディングタグは、相補的なサイクル１特異的スペーサー配列を介して記録タグとアニーリングすることが可能である。コーディングタグ情報が記録タグに移行したら、結合サイクル１の最後に、サイクル２特異的スペーサー配列が伸長記録タグの３’末端に位置する。第２の結合サイクルからの結合性物質のコーディングタグは、相補的なサイクル２特異的スペーサー配列を介して伸長記録タグとアニーリングすることが可能である。コーディングタグ情報が伸長記録タグに移行したら、結合サイクル２の最後に、サイクル３特異的スペーサー配列が伸長記録タグの３’末端に位置し、「ｎ」回の結合サイクルまで同様である。この実施形態は、多数の結合サイクルの中で特定の結合サイクルにおける結合情報の移行が前の結合サイクルを経た（伸長）記録タグ上でのみ起こるものとする。しかし、時には、結合性物質は同類の巨大分子に結合し損ねる。「追跡」ステップとして各結合サイクル後に結合サイクル特異的スペーサーを含むオリゴヌクレオチドを使用して、結合サイクルの事象が失敗したとしても結合サイクルを同期させたままにすることができる。例えば、同類結合性物質が結合サイクル１の間に巨大分子に結合し損ねた場合、結合サイクル１後に、サイクル１特異的スペーサー、サイクル２特異的スペーサーの両方、および「ヌル」エンコーダー配列を含むオリゴヌクレオチドを使用する追跡ステップを追加する。「ヌル」エンコーダー配列は、エンコーダー配列、または、好ましくは、「ヌル」結合サイクルを正に識別する特異的なバーコードが存在しないことであってよい。「ヌル」オリゴヌクレオチドは、記録タグとサイクル１特異的スペーサーを介してアニーリングすることが可能であり、サイクル２特異的スペーサーが記録タグに移行される。したがって、結合サイクル１事象の失敗にもかかわらず、結合サイクル２からの結合性物質が伸長記録タグとサイクル２特異的スペーサーを介してアニーリングすることが可能である。「ヌル」オリゴヌクレオチドにより、伸長記録タグ内で結合サイクル１に結合事象失敗の印が付けられる。

好ましい実施形態では、結合サイクル特異的エンコーダー配列をコーディングタグに使用する。結合サイクル特異的エンコーダー配列は、完全に一意の分析物（例えば、ＮＴＡＡ）−結合サイクルエンコーダーバーコードを使用することによって、または分析物（例えば、ＮＴＡＡ）エンコーダー配列とサイクル特異的バーコードを接合させた組合せ使用によってのいずれかで実現することができる（図３５を参照されたい）。組合せ手法を使用することの有利な点は、設計する必要がある総バーコードがより少なくなることである。１０サイクルにわたって使用する２０種の分析物結合性物質のセットに対しては、２０種の分析物エンコーダー配列バーコードおよび１０種の結合サイクル特異的バーコードのみを設計する必要がある。対照的に、結合サイクルが結合性物質エンコーダー配列に直接埋め込まれる場合には、合計２００種の独立したエンコーダーバーコードを設計する必要があり得る。結合サイクル情報をエンコーダー配列に直接埋め込むことの利点は、ナノポア読み取りにエラー訂正バーコードを使用する場合にコーディングタグの全長を最小化することができることである。エラー耐性バーコードの使用により、配列決定プラットフォームおよびよりエラーが生じやすい手法を使用して高度に正確なバーコード識別が可能になるが、迅速な解析スピード、低費用、および／またはよりポータブルな器械使用などの他の利点がある。そのような例の１つは、ナノポアに基づく配列決定読み取りである。

一部の実施形態では、コーディングタグは、結合性物質の近位にある第２の（３’）スペーサー配列内の切断可能なまたはニッキング可能なＤＮＡ鎖を含む（図３２を参照されたい）。例えば、３’スペーサーは、ウラシル特異的切除試薬（ＵＳＥＲ）によってニッキングすることができる１つまたは複数のウラシル塩基を有してよい。ＵＳＥＲにより、ウラシルの位置に一ヌクレオチドギャップが生成される。別の例では、３’スペーサーは、２重鎖の一方の鎖のみを加水分解するニッキングエンドヌクレアーゼの認識配列を含んでよい。３’スペーサー配列を切断またはニッキングするために使用する酵素は、一方のＤＮＡ鎖のみ（コーディングタグの３’スペーサー）に作用し、したがって、（伸長）記録タグに属する２重鎖内の他方の鎖はインタクトなまま残されることが好ましい。これらの実施形態は、プライマー伸長が起こった後に結合性物質を（伸長）記録タグから変性によらずに除去し、その後の結合サイクルに利用可能な一本鎖ＤＮＡスペーサー配列を伸長記録タグ上に残すことが可能になるので、タンパク質をそれらのネイティブなコンフォメーションで解析するアッセイにおいて特に有用である。

コーディングタグは、パリンドローム配列を含有するように設計することもできる。コーディングタグにパリンドローム配列を含めることにより、新生の成長している伸長記録タグが、コーディングタグ情報が移行するに従ってそれ自体でフォールディングすることが可能になる。伸長記録タグはより緻密な構造にフォールディングし、望ましくない分子間結合およびプライマー伸長事象が有効に減少する。

一部の実施形態では、コーディングタグは、同じ分析物を認識する結合性物質を用いて以前に伸長した記録タグ上でのみプライミング伸長することが可能な分析物特異的スペーサーを含む。伸長記録タグは、分析物特異的スペーサーおよびエンコーダー配列を含むコーディングタグを使用して一連の結合事象から組み立てることができる。一実施形態では、第１の結合事象では、一般的な３’スペーサープライマー配列および次の結合サイクルで使用するための５’末端の分析物特異的スペーサー配列で構成されるコーディングタグを伴う結合性物質を使用する；次いで、その後の結合サイクルでは、コードされる分析物特異的３’スペーサー配列を伴う結合性物質を使用する。この設計により、正確な一連の同類結合事象のみから創出される増幅可能なライブラリーエレメントがもたらされる。オフターゲットのおよび交差反応性結合相互作用により、増幅可能でない伸長記録タグが導かれる。一実施例では、同類結合性物質と特定の巨大分子分析物の対を２つの結合サイクルに使用して分析物を識別する。第１の同類結合性物質は、一般的な記録タグのスペーサー配列上でのプライミング伸長のための一般的なスペーサー３’配列および次の結合サイクルで使用される５’末端のコードされる分析物特異的スペーサーで構成されるコーディングタグを含有する。対応する同類結合性物質対に関しては、第２の結合性物質の３’分析物特異的スペーサーと第１の結合性物質の５’分析物特異的スペーサーを対応させる。このように、結合性物質の同類の対の正確な結合によってのみ、増幅可能な伸長記録タグがもたらされる。交差反応性結合性物質は記録タグ上でプライミング伸長することができず、増幅可能な伸長記録タグ産物は生成しない。この手法では、本明細書に開示されている方法の特異性が著しく増強される。同じ原理を、３つの結合サイクルを使用するトリプレット結合性物質セットに適用することができる。第１の結合サイクルでは、記録タグ上の一般的な３’Ｓｐ配列と結合性物質コーディングタグ上の一般的なスペーサーを相互作用させる。プライマー伸長により、分析物特異的５’スペーサーを含めたコーディングタグ情報を記録タグに移行させる。その後の結合サイクルでは、結合性物質のコーディングタグ上の分析物特異的スペーサーを使用する。

ある特定の実施形態では、コーディングタグは、コーディングタグが連結した結合性物質についての一意の分子識別子をさらに含んでよい。結合性物質についてのＵＭＩは、配列決定読み取りのために伸長コーディングタグまたはジタグ分子を利用し、エンコーダー配列と組み合わせて、結合性物質の同一性および巨大分子に対する一意の結合事象の数に関する情報をもたらす実施形態において有用であり得る。

別の実施形態では、コーディングタグは、ランダム化配列（Ｎのセット、ここで、Ｎ＝Ａ、Ｃ、Ｇ、Ｔからのランダムな選択、またはワードのセットからのランダムな選択である）を含む。一連の「ｎ」回の結合サイクルおよびコーディングタグ情報の（伸長）記録タグへの移行の後、最終的な伸長記録タグ産物は、一連のこれらのランダム化配列で構成され、これは、最終的な伸長記録タグについての「複合性の」一意の分子識別子（ＵＭＩ）を集合的に形成する。例えば、各コーディングタグが（ＮＮ）配列（４＊４＝１６の可能性のある配列）を含有する場合、１０回の配列決定サイクル後に、分布した２ｍｅｒの組合せセットが１０種形成され、可能性のある伸長記録タグ産物についての複合性のＵＭＩ配列１６^１０〜１０^１２種という総多様性が創出される。ペプチド配列決定実験で約１０^９個の分子を使用するとすれば、この多様性は、配列決定実験のための有効なＵＭＩのセットを創出するために十分すぎるほどである。多様性の増大は、単にコーディングタグ内により長いランダム化領域（ＮＮＮ、ＮＮＮＮなど）を使用することによって実現することができる。

コーディングタグは、３’スペーサー配列の３’末端に組み入れられたターミネーターヌクレオチドを含んでよい。結合性物質が巨大分子およびそれらの対応するコーディングタグに結合し、記録タグが相補的なスペーサー配列を介してアニーリングした後、情報をコーディングタグから記録タグに移行させるため、または情報を記録タグからコーディングタグに移行させるためにプライマー伸長することが可能になる。コーディングタグの３’末端にターミネーターヌクレオチドを付加することにより、記録タグ情報のコーディングタグへの移行が防止される。伸長コーディングタグの生成を伴う本明細書に記載の実施形態に関しては、コーディングタグ情報の記録タグへの移行を防止するために、記録タグの３’末端にターミネーターヌクレオチドを含めることが好ましい場合があることが理解される。

コーディングタグは、一本鎖分子であってもよく、二本鎖分子であってもよく、部分的に二本鎖であってもよい。コーディングタグは、平滑末端、突出末端、またはその一方を含んでよい。一部の実施形態では、コーディングタグは、部分的に二本鎖であり、それにより、コーディングタグが成長している伸長記録タグの内部のエンコーダーおよびスペーサー配列にアニーリングすることが防止される。

コーディングタグは、結合性物質に、共有結合性の相互作用および非共有結合性の相互作用を含めた当技術分野で公知の任意の手段を使用して直接または間接的に接合される。一部の実施形態では、コーディングタグを結合性物質に酵素的にまたは化学的に接合することができる。一部の実施形態では、コーディングタグを結合性物質にライゲーションによって接合することができる。他の実施形態では、コーディングタグを結合性物質に親和性結合対（例えば、ビオチンおよびストレプトアビジン）を介して接合する。

一部の実施形態では、結合性物質とコーディングタグをＳｐｙＣａｔｃｈｅｒ−ＳｐｙＴａｇ相互作用によって接合する（図４３Ｂを参照されたい）。ＳｐｙＴａｇペプチドは、ＳｐｙＣａｔｃｈｅｒタンパク質と自発的なイソペプチド連結によって不可逆的な共有結合を形成し、それにより、力および厳しい条件に対して抵抗性であるペプチド相互作用を創出するための遺伝子によりコードされたやり方がもたらされる（Ｚａｋｅｒｉら、２０１２年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．、１０９巻：Ｅ６９０〜６９７頁；Ｌｉら、２０１４年、Ｊ．Ｍｏｌ．Ｂｉｏｌ．、４２６巻：３０９〜３１７頁）。結合性物質を、ＳｐｙＣａｔｃｈｅｒタンパク質を含む融合タンパク質として発現させることができる。一部の実施形態では、ＳｐｙＣａｔｃｈｅｒタンパク質を結合性物質のＮ末端またはＣ末端に付加する。ＳｐｙＴａｇペプチドとコーディングタグを標準のコンジュゲーション化学を使用してカップリングすることができる（ＢｉｏｃｏｎｊｕｇａｔｅＴｅｃｈｎｉｑｕｅｓ、Ｇ．Ｔ．Ｈｅｒｍａｎｓｏｎ、ＡｃａｄｅｍｉｃＰｒｅｓｓ（２０１３年））。

他の実施形態では、結合性物質とコーディングタグをＳｎｏｏｐＴａｇ−ＳｎｏｏｐＣａｔｃｈｅｒペプチド−タンパク質相互作用によって接合する。ＳｎｏｏｐＴａｇペプチドは、ＳｎｏｏｐＣａｔｃｈｅｒタンパク質とイソペプチド結合を形成する（Ｖｅｇｇｉａｎｉら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、２０１６年、１１３巻：１２０２〜１２０７頁）。結合性物質を、ＳｎｏｏｐＣａｔｃｈｅｒタンパク質を含む融合タンパク質として発現させることができる。一部の実施形態では、ＳｎｏｏｐＣａｔｃｈｅｒタンパク質を結合性物質のＮ末端またはＣ末端に付加する。ＳｎｏｏｐＴａｇペプチドとコーディングタグを標準のコンジュゲーション化学を使用してカップリングすることができる。

さらに他の実施形態では、結合性物質とコーディングタグをＨａｌｏＴａｇ（登録商標）タンパク質融合タグとその化学的リガンドによって接合する。ＨａｌｏＴａｇは、合成リガンド（ＨａｌｏＴａｇリガンド）と共有結合するように設計された改変ハロアルカンデハロゲナーゼである（Ｌｏｓら、２００８年、ＡＣＳＣｈｅｍ．Ｂｉｏｌ．、３巻：３７３〜３８２頁）。合成リガンドは、種々の有用な分子に付着したクロロアルカンリンカーを含む。ＨａｌｏＴａｇとクロロアルカンリンカーの間に、高度に特異的であり、生理的条件下で迅速に起こり、基本的に不可逆的である共有結合が形成される。

ある特定の実施形態では、巨大分子を非同類結合性物質とも接触させる。本明細書で使用される場合、非同類結合性物質とは、考察されている特定の巨大分子とは異なる巨大分子の特徴または成分に対して選択的である結合性物質を指す。例えば、ｎＮＴＡＡがフェニルアラニンであり、ペプチドをそれぞれフェニルアラニン、チロシン、およびアスパラギンに対して選択的な３種の結合性物質と接触させる場合、フェニルアラニンに対して選択的な結合性物質がｎ番目のＮＴＡＡ（すなわち、フェニルアラニン）に選択的に結合することが可能な第１の結合性物質ということになり、一方、他の２種の結合性物質はそのペプチドに対して非同類結合性物質ということになる（フェニルアラニン以外のＮＴＡＡに対して選択的であるので）。しかし、チロシン結合性物質およびアスパラギン結合性物質は、試料中の他のペプチドに対して同類結合性物質になり得る。次いで、ｎＮＴＡＡ（フェニルアラニン）をペプチドから切断し、それにより、ペプチドのｎ−１アミノ酸をｎ−１ＮＴＡＡ（例えば、チロシン）に変換し、次いで、ペプチドを同じ３種の結合性物質と接触させると、チロシンに対して選択的な結合性物質が、ｎ−１ＮＴＡＡ（すなわち、チロシン）に選択的に結合することが可能な第２の結合性物質ということになり、一方、他の２種の結合性物質は非同類結合性物質ということになる（チロシン以外のＮＴＡＡに対して選択的であるので）。

したがって、作用物質が結合性物質であるか非同類結合性物質であるかは、結合のために現在利用可能な特定の巨大分子の特徴または成分の性質に依存することが理解されるべきである。また、多数の巨大分子を多重化反応において解析する場合、１つの巨大分子に対する結合性物質は別の巨大分子に対しては非同類結合性物質であり得、逆もまた同じである。したがって、結合性物質に関する以下の説明は本明細書に記載されているあらゆる型の結合性物質（すなわち、同類結合性物質および非同類結合性物質のどちらにも）に適用可能であることが理解されるべきである。
ＶＩＩＩ．コーディングタグ情報の記録タグへの周期的移行

本明細書に記載の方法において、結合性物質が巨大分子に結合したら、その連結したコーディングタグの識別情報を巨大分子に付随する記録タグに移行させ、それにより、「伸長記録タグ」を生成する。伸長記録タグは、実施された各結合サイクルを表す、結合性物質のコーディングタグからの情報を含み得る。しかし、伸長記録タグはまた、例えば、結合性物質が巨大分子に結合し損ねたことが原因で、コーディングタグが見落とされた、損傷を受けた、または欠陥があることが原因で、プライマー伸長反応が失敗したことが原因で、「飛ばされた」結合サイクルを経る可能性もある。結合事象が起こったとしても、例えば、コーディングタグが損傷を受けたまたは欠陥があることが原因で、プライマー伸長反応にエラーが導入されたことが原因で、コーディングタグから記録タグへの情報の移行が不完全であるまたは１００％未満の正確さになる可能性がある）。したがって、伸長記録タグは、その付随する巨大分子において起こった結合事象の１００％、または最大で９５％、９０％、８５％、８０％、７５％、７０％、６５％、６０％、６５％、５５％、５０％、４５％、４０％、３５％、３０％を表す可能性がある。さらに、伸長記録タグ中に存在するコーディングタグ情報は、対応するコーディングタグに対して少なくとも３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、または１００％の同一性を有する可能性がある。

ある特定の実施形態では、伸長記録タグは、多数の連続的な結合事象を表す、多数のコーディングタグからの情報を含む可能性がある。これらの実施形態では、単一の連鎖状の伸長記録タグは単一の巨大分子を表す可能性がある（図２Ａを参照されたい）。本明細書で言及される通り、コーディングタグ情報の記録タグへの移行は、多数の連続的な結合事象を伴う方法において起こると思われる伸長記録タグへの移行も含む。

ある特定の実施形態では、結合事象情報をコーディングタグから記録タグに周期的に移行させる（図２Ａおよび２Ｃを参照されたい）。交差反応性結合事象を、配列決定後に、少なくとも２つの異なるコーディングタグを要求し、２つまたはそれよりも多くの独立した結合事象を識別し、同じ結合性物質のクラス（特定のタンパク質と同類）にマッピングすることにより、情報科学的にフィルターにかけて除去することができる。任意選択の試料バーコードまたはコンパートメントバーコードを記録タグに含めることができ、同じく任意選択のＵＭＩ配列も含めることができる。コーディングタグは、任意選択のＵＭＩ配列をエンコーダーおよびスペーサー配列と一緒に含有してもよい。ユニバーサルプライミング配列（Ｕ１およびＵ２）も増幅およびＮＧＳ配列決定のために伸長記録タグに含めることもできる（図２Ａを参照されたい）。

特定の結合性物質に付随するコーディングタグ情報を記録タグに種々の方法を使用して移行させることができる。ある特定の実施形態では、コーディングタグの情報を記録タグに、プライマー伸長によって移行させる（Ｃｈａｎ、ＭｃＧｒｅｇｏｒら、２０１５年）。記録タグまたは伸長記録タグの３’末端のスペーサー配列をコーディングタグの３’末端の相補的なスペーサー配列とアニーリングさせ、ポリメラーゼ（例えば、鎖置換ポリメラーゼ）により、アニーリングしたコーディングタグを鋳型として使用して記録タグ配列を伸長させる（図５〜７を参照されたい）。一部の実施形態では、コーディングタグと伸長記録タグに存在する内部のエンコーダーおよびスペーサー配列のハイブリダイゼーションを防止するために、コーディングタグエンコーダー配列および５’スペーサーと相補的なオリゴヌクレオチドをコーディングタグとプレアニーリングさせることができる。一本鎖のままのコーディングタグ上の３’末端スペーサーを記録タグ上の末端３’スペーサーと結合させることが好ましい。他の実施形態では、コーディングタグと内部の部位とのアニーリングを防止するために、新生記録タグを一本鎖結合性タンパク質でコーティングすることができる。あるいは、完全に二本鎖のコーディングタグへの３’末端の侵入を容易にするために、新生記録タグをＲｅｃＡ（またはｕｖｓＸなどの関連する相同体）でコーティングすることもできる（Ｂｅｌｌら、２０１２年、Ｎａｔｕｒｅ、４９１巻：２７４〜２７８頁）。この形態により、二本鎖のコーディングタグが内部の記録タグエレメントと相互作用することが防止されるが、それでも、伸長記録タグのＲｅｃＡコーティングされた３’尾部による鎖の侵入は起こりやすい（Ｂｅｌｌら、２０１５年、Ｅｌｉｆｅ、４巻：ｅ０８６４６頁）。一本鎖結合性タンパク質が存在することにより、鎖置換反応が容易になり得る。

好ましい実施形態では、プライマー伸長のために使用されるＤＮＡポリメラーゼは、鎖置換活性を有し、３’−５エキソヌクレアーゼ活性が限られているまたはそれを欠く。そのようなポリメラーゼの多数の例のいくつかとして、クレノウｅｘｏ−（ＤＮＡＰｏｌ１のクレノウ断片）、Ｔ４ＤＮＡポリメラーゼｅｘｏ−、Ｔ７ＤＮＡポリメラーゼｅｘｏ（シーケナーゼ２．０）、Ｐｆｕｅｘｏ−、Ｖｅｎｔｅｘｏ−、ＤｅｅｐＶｅｎｔｅｘｏ−、ＢｓｔＤＮＡポリメラーゼ大断片ｅｘｏ−、ＢｃａＰｏｌ、９°ＮＰｏｌ、およびＰｈｉ２９Ｐｏｌｅｘｏ−が挙げられる。好ましい実施形態では、ＤＮＡポリメラーゼは、室温および最大４５℃までで活性である。別の実施形態では、「ウォームスタート」バージョンの好熱性ポリメラーゼを使用し、したがって、ポリメラーゼを約４０℃〜５０℃で活性化し、使用する。例示的なウォームスタートポリメラーゼは、Ｂｓｔ２．０ウォームスタートＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）である。

鎖置換複製に有用な添加剤としては、Ｅ．ｃｏｌｉのＳＳＢタンパク質、ファージＴ４遺伝子３２産物、ファージＴ７遺伝子２．５タンパク質、ファージＰｆ３ＳＳＢ、複製タンパク質ＡＲＰＡ３２およびＲＰＡ１４サブユニット（Ｗｏｌｄ、１９９７年）などの、細菌起源、ウイルス起源、または真核生物起源のいくつもの一本鎖ＤＮＡ結合性タンパク質（ＳＳＢタンパク質）のいずれか；アデノウイルスＤＮＡ結合性タンパク質、単純ヘルペスタンパク質ＩＣＰ８、ＢＭＲＦ１ポリメラーゼアクセサリーサブユニット、ヘルペスウイルスＵＬ２９ＳＳＢ様タンパク質などの他のＤＮＡ結合性タンパク質；ファージＴ７ヘリカーゼ／プライマーゼ、ファージＴ４遺伝子４１ヘリカーゼ、Ｅ．ｃｏｌｉＲｅｐヘリカーゼ、Ｅ．ｃｏｌｉｒｅｃＢＣＤヘリカーゼ、ｒｅｃＡ、Ｅ．ｃｏｌｉおよび真核生物トポイソメラーゼ（Ｃｈａｍｐｏｕｘ、２００１年）などの、ＤＮＡ複製に関与することが公知のいくつもの複製複合体タンパク質のいずれかが挙げられる。

記録タグの末端スペーサー配列により伸長自己伸長がプライミングされる場合などのミスプライミングまたは自己プライミング事象は、一本鎖結合性タンパク質（Ｔ４遺伝子３２、Ｅ．ｃｏｌｉＳＳＢなど）、ＤＭＳＯ（１〜１０％）、ホルムアミド（１〜１０％）、ＢＳＡ（１０〜１００μｇ／ｍｌ）、ＴＭＡＣｌ（１〜５ｍＭ）、硫酸アンモニウム（１０〜５０ｍＭ）、ベタイン（１〜３Ｍ）、グリセロール（５〜４０％）、またはエチレングリコール（５〜４０％）をプライマー伸長反応に含めることによって最小化することができる。

大多数のＡ型ポリメラーゼは、３’エキソヌクレアーゼ活性を欠き（内因的または工学的除去）、例えば、クレノウｅｘｏ−、Ｔ７ＤＮＡポリメラーゼｅｘｏ−（シーケナーゼ２．０）、およびＴａｑポリメラーゼは、２重鎖増幅産物の３’平滑末端へのヌクレオチド、好ましくはアデノシン塩基（より低い程度でＧ塩基、配列の状況に依存する）の非鋳型付加を触媒する。Ｔａｑポリメラーゼに関しては、３’ピリミジン（Ｃ＞Ｔ）により、非鋳型アデノシン付加が最小限になり、一方、３’プリンヌクレオチド（Ｇ＞Ａ）では非鋳型アデノシン付加が有利になる。プライマー伸長のためにＴａｑポリメラーゼを使用する実施形態では、コーディングタグにおいて、結合性物質から遠位のスペーサー配列と隣接するバーコード配列（例えば、エンコーダー配列またはサイクル特異的配列）との間にチミジン塩基を置くことにより、記録タグのスペーサー配列の３’末端上の非鋳型アデノシンヌクレオチドの散在的包含に適応させる（図４３Ａ）。このように、伸長記録タグ（非鋳型アデノシン塩基を有するまたは有さない）は、コーディングタグとアニーリングし、プライマー伸長を受けることが可能である。

あるいは、特にＯ−へリックス領域における１つまたは複数の点変異によって非鋳型ターミナルトランスフェラーゼ活性を著しく低下させた変異ポリメラーゼ（中温性または好熱性）を使用することにより、非鋳型塩基の付加を減少させることができる（米国特許第７，５０１，２３７号を参照されたい）（Ｙａｎｇ、Ａｓｔａｔｋｅら、２００２年）。３’エキソヌクレアーゼが欠損しており、鎖置換能を有するＰｆｕｅｘｏ−も非鋳型ターミナルトランスフェラーゼ活性を有さない。

別の実施形態では、最適なポリメラーゼ伸長緩衝液は、４０〜１２０ｍＭの、例えばＴｒｉｓ−酢酸、Ｔｒｉｓ−ＨＣｌ、ＨＥＰＥＳなどの緩衝剤、ｐＨ６〜９で構成される。

伸長記録タグの末端スペーサー配列と伸長記録タグの内部の領域の自己アニーリングによって開始される自己プライミング／ミスプライミング事象は、記録／伸長記録タグに偽相補的塩基を含めることによって最小化することができる（Ｌａｈｏｕｄ、Ｔｉｍｏｓｈｃｈｕｋら、２００８年）、（Ｈｏｓｈｉｋａ、Ｃｈｅｎら、２０１０年）。偽相補的塩基は、化学修飾が存在することに起因する互いとの２重鎖の形成に対する有意に低下したハイブリダイゼーション親和性を示す。しかし、多くの偽相補的修飾塩基は、天然のＤＮＡまたはＲＮＡ配列と強い塩基対を形成し得る。ある特定の実施形態では、コーディングタグスペーサー配列は、多数のＡ塩基およびＴ塩基で構成され、ホスホラミダイトオリゴヌクレオチド合成を使用して市販の偽相補的塩基２−アミノアデニンおよび２−チオチミンを記録タグに組み入れる。追加的な偽相補的塩基を、プライマー伸長中に、偽相補的ヌクレオチドを反応に添加することによって伸長記録タグに組み入れることができる（Ｇａｍｐｅｒ、Ａｒａｒら、２００６年）。

溶液中のコーディングタグで標識された結合性物質と固定化されたタンパク質の記録タグとの非特異的な相互作用を最小限にするために、記録タグスペーサー配列と相補的な競合剤オリゴヌクレオチド（遮断オリゴヌクレオチドとも称される）を結合反応に添加して、非特異的な相互作用を最小限にする（図３２Ａ〜Ｄ）。遮断オリゴヌクレオチドは、比較的短いものである。プライマー伸長前に過剰な競合オリゴヌクレオチドを結合反応から洗い流し、これにより、特にわずかな温度の上昇（例えば、３０〜５０℃）に曝露させると、アニーリングした競合オリゴヌクレオチドが記録タグから有効に解離する。遮断オリゴヌクレオチドは、プライマー伸長を防止するために３’末端にターミネーターヌクレオチドを含んでよい。

ある特定の実施形態では、記録タグ上のスペーサー配列とコーディングタグ上の相補的なスペーサー配列のアニーリングは、プライマー伸長反応条件下（すなわち、アニーリングＴｍが反応温度と同様である）で準安定である。これにより、コーディングタグのスペーサー配列で記録タグのスペーサー配列とアニーリングした任意の遮断オリゴヌクレオチドを置き換えることが可能になる。

特定の結合性物質に付随するコーディングタグ情報は、ライゲーションによって記録タグに移行させることもできる（例えば、図６および７を参照されたい）。ライゲーションは、平滑末端ライゲーションであってもよく、粘着末端ライゲーションであってもよい。ライゲーションは、酵素的ライゲーション反応であってよい。リガーゼの例としては、これだけに限定されないが、Ｔ４ＤＮＡリガーゼ、Ｔ７ＤＮＡリガーゼ、Ｔ３ＤＮＡリガーゼ、ＴａｑＤＮＡリガーゼ、Ｅ．ｃｏｌｉＤＮＡリガーゼ、９°ＮＤＮＡリガーゼ、Ｅｌｅｃｔｒｏｌｉｇａｓｅ（登録商標）が挙げられる。あるいは、ライゲーションは、化学的ライゲーション反応であってよい（図７を参照されたい）。図において、スペーサーを欠くライゲーションは、「記録ヘルパー」配列とコーディングタグ上のアームのハイブリダイゼーションを使用することによって実現される。アニーリングした相補配列を、標準の化学的ライゲーションまたは「クリックケミストリー」を使用して化学的にライゲーションする（Ｇｕｎｄｅｒｓｏｎ、Ｈｕａｎｇら、１９９８年、Ｐｅｎｇ、Ｌｉら、２０１０年、Ｅｌ−Ｓａｇｈｅｅｒ、Ｃｈｅｏｎｇら、２０１１年、Ｅｌ−Ｓａｇｈｅｅｒ、Ｓａｎｚｏｎｅら、２０１１年、Ｓｈａｒｍａ、Ｋｅｎｔら、２０１２年、ＲｏｌｏｆｆおよびＳｅｉｔｚ、２０１３年、Ｌｉｔｏｖｃｈｉｃｋ、Ｃｌａｒｋら、２０１４年、Ｒｏｌｏｆｆ、Ｆｉｃｈｔら、２０１４年）。

別の実施形態では、ＰＮＡの移行は、公開された技法を使用した化学的ライゲーションで実現することができる。ＰＮＡの構造は、５’Ｎ末端アミン基および非反応性３’Ｃ末端アミドを有するようなものである。ＰＮＡの化学的ライゲーションには、末端を化学的に活性になるように修飾することが必要である。これは、一般には、５’Ｎ末端をシステイニル部分で誘導体化し、３’Ｃ末端をチオエステル部分で誘導体化することによってなされる。そのような修飾されたＰＮＡは、標準のネイティブな化学的ライゲーション条件を使用することで容易にカップリングする（Ｒｏｌｏｆｆら、２０１３年、Ｂｉｏｏｒｇａｎ．Ｍｅｄ．Ｃｈｅｍ．、２１巻：３４５８〜３４６４頁）。

一部の実施形態では、コーディングタグ情報を、トポイソメラーゼを使用して移行させることができる。トポイソメラーゼを使用して、記録タグ上のトポ荷電３’リン酸とコーディングタグまたはその相補物の５’末端とライゲーションすることができる（Ｓｈｕｍａｎら、１９９４年、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．、２６９巻：３２６７８〜３２６８４頁）。

本明細書に記載の通り、結合性物質は、翻訳後修飾されたアミノ酸に結合し得る。したがって、ペプチド巨大分子を伴うある特定の実施形態では、伸長記録タグは、アミノ酸配列および翻訳後修飾に関するコーディングタグ情報を含む。一部の実施形態では、内部の翻訳後修飾されたアミノ酸（例えば、リン酸化、グリコシル化、サクシニル化、ユビキチン化、Ｓ−ニトロシル化、メチル化、Ｎ−アセチル化、脂質付加など）の検出は、末端アミノ酸（例えば、ＮＴＡＡまたはＣＴＡＡ）の検出および切断の前に実現される。一実施例では、ペプチドをＰＴＭ修飾のために結合性物質と接触させ、付随するコーディングタグ情報を上記の通り記録タグに移行する（図８Ａを参照されたい）。アミノ酸修飾に関するコーディングタグ情報の検出および移行が完了したら、一次アミノ酸配列に関するコーディングタグ情報の検出および移行の前に、Ｎ末端またはＣ末端分解法を使用してＰＴＭ修飾基を除去することができる。したがって、得られた伸長記録タグにより、ペプチド配列における翻訳後修飾の存在が、逐次的順序ではないが、一次アミノ酸配列情報と併せて示される（図８Ｂを参照されたい）。

一部の実施形態では、内部の翻訳後修飾されたアミノ酸の検出は、一次アミノ酸配列の検出と並行して行うことができる。一実施例では、ＮＴＡＡ（またはＣＴＡＡ）を、単独でまたは結合性物質のライブラリー（例えば、２０種の標準のアミノ酸および選択された翻訳後修飾されたアミノ酸に対する結合性物質で構成されるライブラリー）の一部としての、翻訳後修飾されたアミノ酸に対して特異的な結合性物質と接触させる。末端アミノ酸切断および結合性物質（または結合性物質のライブラリー）との接触の連続的なサイクルを後に続ける。したがって、得られた伸長記録タグにより、一次アミノ酸配列に関して、翻訳後修飾の存在および順序が示される。

ある特定の実施形態では、コーディングタグ情報移行の全体的な頑強性および効率を改善するために、巨大分子ごとに記録タグのアンサンブルを使用することができる（例えば、図９を参照されたい）。単一の記録タグではなく、所与の巨大分子に付随する記録タグのアンサンブルを使用することにより、コーディングタグと記録タグのカップリング収率が潜在的に高いこと、およびライブラリーの全収率が高いことに起因して、ライブラリー構築の効率が改善される。単一の連鎖状の伸長記録タグの収率は、連鎖の段階的収率に直接依存し、一方、コーディングタグ情報を受容することが可能な多数の記録タグの使用では、指数関数的な連鎖の喪失を受けない。

そのような実施形態の例が図９および１０に示されている。図９Ａおよび１０Ａでは、固体支持体上で単一の巨大分子に多数の記録タグが付随している（空間的共局在または単一の巨大分子の単一のビーズへの限局によって）。結合性物質を固体支持体に周期的に曝露させ、各サイクルにおいて、それらの対応するコーディングタグにより、共局在する多数の記録タグのうちの１つに情報が移行される。図９Ａに示されている例では、結合サイクル情報は、コーディングタグ上に存在するスペーサーにコードされている。各結合サイクルについて、結合性物質のセットに設計されたサイクル特異的スペーサー配列で印をつける（図９Ａおよび９Ｂ）。例えば、ＮＴＡＡ結合性物質の場合では、同じアミノ酸残基に対する結合性物質を異なるコーディングタグで標識する、またはサイクル特異的情報をスペーサー配列に含めて、両方の結合性物質の同一性およびサイクル数を示す。

図９Ａにおいて例示されている通り、第１の結合サイクル（サイクル１）において、複数のＮＴＡＡ結合性物質を巨大分子と接触させる。サイクル１で使用する結合性物質は、記録タグのスペーサー配列と相補的な共通のスペーサー配列を有する。サイクル１で使用する結合性物質は、サイクル１特異的配列を含む３’−スペーサー配列も有する。結合サイクル１の間に、第１のＮＴＡＡ結合性物質が巨大分子の遊離末端に結合し、第１のコーディングタグおよび記録タグ内の共通のスペーサー配列の相補配列がアニーリングし、第１のコーディングタグの情報が同類の記録タグに共通のスペーサー配列からのプライマー伸長を介して移行する。ＮＴＡＡを除去して、新しいＮＴＡＡを露出させた後、結合サイクル２により、記録タグのスペーサー配列と相補的な共通のスペーサー配列を有する複数のＮＴＡＡ結合性物質を接触させる。サイクル２で使用する結合性物質は、サイクル２特異的配列を含む３’−スペーサー配列も有する。第２のＮＴＡＡ結合性物質が巨大分子のＮＴＡＡに結合し、第２のコーディングタグの情報が記録タグにプライマー伸長を介して移行する。これらのサイクルを最大「ｎ」回の結合サイクルまで繰り返し、単一の巨大分子と共局在する複数の伸長記録タグを生成し、ここで、各伸長記録タグは、１つの結合サイクルからのコーディングタグ情報を有する。連続的な結合サイクルのそれぞれで使用される結合性物質の各セットは、コーディングタグ内のサイクル特異的スペーサー配列を有するので、結合サイクル情報を、得られた伸長記録タグ内の結合性物質情報と関連づけることができる。

代替の実施形態では、図９Ａと同様に、固体支持体（例えば、ビーズ）上で単一の巨大分子に多数の記録タグが付随しているが、この場合、特定の結合サイクルで使用される結合性物質は、今の結合サイクルに対するサイクル特異的スペーサーおよび次の結合サイクルに対するサイクル特異的スペーサーが隣接するコーディングタグを有する（図１０Ａおよび１０Ｂ）。この設計は、伸長記録タグの集団を単一の共直線性の伸長記録タグに変換するための最終的なアセンブリＰＣＲステップを支持するためのものである（図１０Ｃ）。単一の共直線性の伸長記録タグのライブラリーを配列決定前に濃縮、サブトラクションおよび／または正規化方法に供すことができる。第１の結合サイクル（サイクル１）では、第１の結合性物質が結合すると、サイクル１特異的スペーサー（Ｃ’１）を含むコーディングタグの情報が、末端に相補的なサイクル１特異的スペーサー（Ｃ１）を含む記録タグに移行する。第２の結合サイクル（サイクル２）では、第２の結合性物質が結合すると、サイクル２特異的スペーサー（Ｃ’２）を含むコーディングタグの情報が、末端に相補的なサイクル２特異的スペーサー（Ｃ２）を含む異なる記録タグに移行する。このプロセスを第ｎの結合サイクルまで続ける。一部の実施形態では、伸長記録タグ内の第ｎのコーディングタグにユニバーサルリバースプライミング配列を用いてキャップ形成する、例えば、ユニバーサルリバースプライミング配列を第ｎのコーディングタグ設計の一部として組み入れることもでき、ユニバーサルリバースプライミング配列を第ｎの結合サイクルの後に続く反応、例えば尾部を有するプライマーを使用した増幅反応などに添加することもできる。一部の実施形態では、各結合サイクル時に、巨大分子を、それらの対応する結合性物質に関する識別情報および結合サイクル情報を含むコーディングタグと接合した結合性物質の集合に曝露させる（図９および図１０）。特定の実施形態では、第ｎの結合サイクルが完了した後、伸長記録タグでコーティングしたビーズ基板を油乳剤に平均して液滴当たり１ビーズ未満またはそれとほぼ同等になるように入れる。次いで、アセンブリＰＣＲを使用して、伸長記録タグをビーズから増幅し、多数の別々の記録タグを、別々の伸長記録タグ内のサイクル特異的スペーサー配列を介してプライミングすることによって共直線的な順序でアセンブルさせる（図１０Ｃ）（Ｘｉｏｎｇら、２００８年、ＦＥＭＳＭｉｃｒｏｂｉｏｌ．Ｒｅｖ．、３２巻：５２２〜５４０頁）。あるいは、結合性物質のコーディングタグを有するサイクル特異的スペーサーを使用する代わりに、各結合サイクル中または各結合サイクル後に、サイクル特異的スペーサーを別々に伸長記録タグに付加することができる。単一の巨大分子を集合的に表すものである伸長記録タグの集団を使用することの、単一の巨大分子を表すものである単一の連鎖状の伸長記録タグに対する１つの利点は、より高濃度の記録タグにより、コーディングタグ情報の移行の効率が上昇し得ることである。さらに、結合サイクルを数回繰り返して同類結合事象の完了を確実にすることができる。さらに、伸長記録タグの表面増幅により、情報移行の重複性をもたらすことができる（図４Ｂを参照されたい）。コーディングタグ情報が必ずしも移行されない場合、ほとんどの場合、それでも、コーディングタグ情報の不完全な集合を、タンパク質などの、情報含有量が非常に高い巨大分子を識別するために使用することが可能であるはずである。短いペプチドであっても、非常に多数の可能性のあるタンパク質配列を具体化し得る。例えば、１０ｍｅｒのペプチドは、２０^１０種の可能性のある配列を有する。したがって、欠失および／または多義性を含有する可能性がある部分的または不完全な配列を、それでも、多くの場合、一意的にマッピングすることができる。

タンパク質のネイティブなコンフォメーションが照会される一部の実施形態では、結合性物質の近位のスペーサーエレメント内の切断可能なまたはニッキング可能なＤＮＡ鎖で構成されるコーディングタグを有する結合性物質を用いて周期的結合アッセイを実施する（図３２）。例えば、結合性物質の近位のスペーサーは、ウラシル特異的切除試薬（ＵＳＥＲ）によってニッキングすることができる１つまたは複数のウラシル塩基を有してよい。別の例では、結合性物質の近位のスペーサーは、２重鎖の一方の鎖のみを加水分解するニッキングエンドヌクレアーゼの認識配列を含んでよい。この設計により、結合性物質を伸長記録タグから変性によらずに除去し、その後のイムノアッセイサイクルのための遊離の一本鎖ＤＮＡスペーサーエレメントを創出することが可能になる。好ましい実施形態では、プライマー伸長ステップ後の結合性物質の酵素的ＵＳＥＲ除去を可能にするために、コーディングタグにウラシル塩基を組み入れる（図３２Ｅ〜Ｆ）。ウラシルによるＵＳＥＲ切除後、結合性物質および切り詰められたコーディングタグを、タンパク質−結合性物質相互作用を破壊するための、高塩濃度（４ＭのＮａＣｌ、２５％ホルムアミド）および穏やかな熱を含めた種々の穏やかな条件下で除去することができる。記録タグとアニーリングしたままの他の切り詰められたコーディングタグＤＮＡの残り（図３２Ｆ）は、わずかに温度を上昇させると容易に解離する。

結合性物質の近位のスペーサーエレメント内の切断可能なまたはニッキング可能なＤＮＡ鎖で構成されるコーディングタグにより、多数の結合した結合性物質からコーディングタグ情報を移行させるための単一の均一なアッセイも可能になる（図３３を参照されたい）。好ましい実施形態では、結合性物質の近位のコーディングタグはニッキングエンドヌクレアーゼ配列モチーフを含み、これは、ｄｓＤＮＡに関して規定された配列モチーフにおいてニッキングエンドヌクレアーゼにより認識され、ニッキングされる。多数の結合性物質の結合後、複合ポリメラーゼ伸長（鎖置換活性を欠く）＋ニッキングエンドヌクレアーゼ試薬混合物を使用して、コーディングタグの近位の記録タグまたは伸長記録タグへの反復移行を生じさせる。各移行ステップ後、得られた伸長記録タグ−コーディングタグ２重鎖をニッキングエンドヌクレアーゼによってニッキングし、それにより、結合性物質に付着した切り詰められたスペーサーを放出させ、追加的な近位の結合した結合性物質のコーディングタグとアニーリングすることが可能な伸長記録タグ３’スペーサー配列に曝露させる（図３３Ｂ〜Ｄ）。コーディングタグスペーサー配列内へのニッキングモチーフの配置は、切断されていないコーディングタグスペーサー配列と容易に交換することができる、準安定ハイブリッドが創出されるように設計する。このように、２種またはそれよりも多くの結合性物質が同じタンパク質分子に同時に結合する場合、多重に結合した結合性物質からのコーディングタグ情報の記録タグ上への連鎖による結合情報は、単一反応混合物において、いかなる周期的な試薬交換も伴わずに生じる（図３３Ｃ〜Ｄ）。この実施形態は、次世代タンパク質アッセイ（ＮＧＰＡ）、特に、タンパク質上の多価エピトープに対するポリクローナル抗体（またはモノクローナル抗体の混合集団）を用いるものに特に有用である。

変性したタンパク質、ポリペプチド、およびペプチドの解析を伴う実施形態に関しては、結合した結合性物質およびアニーリングしたコーディングタグを、プライマー伸長後に、高度変性条件（例えば、０．１〜０．２ＮのＮａＯＨ、６Ｍの尿素、２．４Ｍのグアニジニウムイソチオシアネート、９５％ホルムアミドなど）を使用することによって除去することができる。
ＩＸ．記録タグ情報のコーディングタグまたはジタグ構築物への周期的移行

別の態様では、結合性物質が巨大分子に結合した後にコーディングタグから記録タグに情報を書き込むのではなく、任意選択のＵＭＩ配列（例えば、特定のペプチドまたはタンパク質分子を識別する）および少なくとも１つのバーコード（例えば、コンパートメントタグ、分配バーコード、試料バーコード、空間的位置バーコードなど）を含む記録タグからコーディングタグに情報を移行させ、それにより、伸長コーディングタグを生成することができる（図１１Ａを参照されたい）。ある特定の実施形態では、結合性物質および付随する伸長コーディングタグを、各結合サイクル後、および任意選択でエドマン分解化学ステップの前に収集する。ある特定の実施形態では、コーディングタグは、結合サイクル特異的タグを含む。周期的なエドマン分解におけるＮＴＡＡの検出などの全ての結合サイクルが完了した後、伸長コーディングタグの完全な収集物を増幅し、配列決定し、ペプチド上の情報を、ＵＭＩ（ペプチド同一性）、エンコーダー配列（ＮＴＡＡ結合性物質）、コンパートメントタグ（単一の細胞またはプロテオームのサブセット）、結合サイクル特異的配列（サイクル数）、またはそれらの任意の組合せの間の関連性から決定することができる。同じコンパートメントタグ／ＵＭＩ配列を有するライブラリーエレメントを同じ細胞、プロテオームのサブセット、分子などにマッピングし戻し、ペプチド配列を再構築することができる。この実施形態は、記録タグがエドマン分解プロセス中に過度の損傷を保持する場合に有用であり得る。

複数の巨大分子を解析するための方法であって、（ａ）固体支持体に接合した複数の巨大分子および付随する記録タグを用意するステップと；（ｂ）複数の巨大分子を複数の巨大分子に結合することが可能な複数の結合性物質であって、各結合性物質が結合性物質に関する識別情報を有するコーディングタグを含む複数の結合性物質と接触させるステップと；（ｃ）（ｉ）巨大分子に付随する記録タグの情報を巨大分子に結合した結合性物質のコーディングタグに移行させて、伸長コーディングタグを生成するステップ（図１１Ａを参照されたい）；または（ｉｉ）巨大分子に付随する記録タグおよび巨大分子に結合した結合性物質のコーディングタグの情報をジタグ構築物に移行するステップと（図１１Ｂを参照されたい）；（ｄ）伸長コーディングタグまたはジタグ構築物を収集するステップと；（ｅ）任意選択でステップ（ｂ）〜（ｄ）を１回または複数回の結合サイクルにわたって繰り返すステップと；（ｆ）伸長コーディングタグまたはジタグ構築物の収集物を解析するステップと
を含む方法が本明細書において提示される。

ある特定の実施形態では、記録タグからコーディングタグへの情報移行は、記録タグのプライマー伸長を防止するために記録タグの３’末端を任意選択でブロッキングする（例えば、図１１Ａを参照されたい）プライマー伸長ステップを使用して実現することができる。得られた伸長コーディングタグおよび付随する結合性物質を各結合事象の後および情報移行の完了後に収集することができる。図１１Ｂに例示されている例では、記録タグは、ユニバーサルプライミング部位（Ｕ２’）、バーコード（例えば、コンパートメントタグ「ＣＴ」）、任意選択のＵＭＩ配列、および共通のスペーサー配列（Ｓｐ１）で構成される。ある特定の実施形態では、バーコードは、個々のコンパートメントを表すコンパートメントタグであり、また、ＵＭＩを使用して、配列読み取りを照会されている特定のタンパク質またはペプチド分子にマッピングし戻すことができる。図１１Ｂの例において例示されている通り、コーディングタグは、共通のスペーサー配列（Ｓｐ２’）、結合性物質エンコーダー配列、およびユニバーサルプライミング部位（Ｕ３）で構成される。コーディングタグで標識した結合性物質の導入前に、記録タグのＵ２’ユニバーサルプライミング部位と相補的であり、ユニバーサルプライミング配列Ｕ１およびサイクル特異的タグを含むオリゴヌクレオチド（Ｕ２）を記録タグＵ２’とアニーリングさせる。さらに、アダプター配列Ｓｐ１’−Ｓｐ２を記録タグＳｐ１とアニーリングさせる。このアダプター配列は、コーディングタグ上のＳｐ２’配列とも相互作用することができ、それにより、記録タグとコーディングタグが互いと近傍になる。結合事象の前または後のいずれかにギャップ充填伸長ライゲーションアッセイを実施する。ギャップ充填を結合サイクルの前に実施する場合、結合サイクル後のプライマー伸長ステップを使用してジタグ形成を完了させる。いくつもの結合サイクルにわたってジタグを収集した後、ジタグの収集物を配列決定し、ＵＭＩ配列を介して元のペプチド分子にマッピングし戻す。有効性を最大にするために、ＵＭＩ配列の多様性はＵＭＩでタグが付された単一分子の数の多様性を超えるものでなければならないことが理解される。

ある特定の実施形態では、巨大分子は、タンパク質またはペプチドである。ペプチドは生体試料由来のタンパク質を断片化することによって得ることができる。

記録タグは、ＤＮＡ分子、ＲＮＡ分子、ＰＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、γＰＮＡ分子、またはこれらの組合せであってよい。記録タグは、それが付随する巨大分子（例えば、ペプチド）を識別するＵＭＩを含む。ある特定の実施形態では、記録タグは、コンパートメントタグをさらに含む。記録タグは、ユニバーサルプライミング部位も含んでよく、これを下流の増幅に使用することができる。ある特定の実施形態では、記録タグは、３’末端にスペーサーを含む。スペーサーは、コーディングタグ内のスペーサーと相補的であってよい。記録タグの３’末端をブロッキングして（例えば、光不安定性３’ブロッキング基）ポリメラーゼによる記録タグの伸長を防止し、それにより、巨大分子に付随する記録タグの情報のコーディングタグへの移行または巨大分子に付随する記録タグおよびコーディングタグの情報のジタグ構築物への移行を容易にすることができる。

コーディングタグは、コーディング物質が連結した結合性物質を識別するエンコーダー配列を含む。ある特定の実施形態では、コーディングタグは、コーディングタグが連結した各結合性物質に対する一意の分子識別子（ＵＭＩ）をさらに含む。コーディングタグは、下流の増幅のために使用することができるユニバーサルプライミング部位を含んでよい。コーディングタグは、３’末端にスペーサーを含んでよい。スペーサーは、記録タグ内のスペーサーに相補的であってよく、記録タグ情報をコーディングタグに移行させるためのプライマー伸長反応を開始するために使用することができる。コーディングタグは、伸長コーディングタグまたはジタグの起源である結合サイクルを識別するための結合サイクル特異的配列も含んでよい。

記録タグの情報のコーディングタグへの移行は、プライマー伸長またはライゲーションによってもたらすことができる。記録タグおよびコーディングタグの情報のジタグ構築物への移行は、ギャップ充填反応、プライマー伸長反応、またはその両方で生じさせることができる。

ジタグ分子は、伸長記録タグのものと同様の機能的成分を含む。ジタグ分子は、記録タグに由来するユニバーサルプライミング部位、記録タグに由来するバーコード（例えば、コンパートメントタグ）、記録タグに由来する任意選択の一意の分子識別子（ＵＭＩ）、記録タグに由来する任意選択のスペーサー、コーディングタグに由来するエンコーダー配列、コーディングタグに由来する任意選択の一意の分子識別子、結合サイクル特異的配列、コーディングタグに由来する任意選択のスペーサー、およびコーディングタグに由来するユニバーサルプライミング部位を含んでよい。

ある特定の実施形態では、記録タグを、バーコードのコンビナトリアル連鎖をコードするワードを使用して生成することができる。コンビナトリアルをコードするワードの使用により、アニーリングおよび化学的ライゲーションを使用して情報をＰＮＡ記録タグからコーディングタグまたはジタグ構築物に移行させることができる方法がもたらされる（例えば、図１２Ａ〜Ｄを参照されたい）。本明細書に開示されているペプチドを解析する方法がエドマン分解による末端アミノ酸の切断を伴うある特定の実施形態では、ＰＮＡなどの、エドマン分解の厳しい条件に対して抵抗性の記録タグを使用することが望ましい可能性がある。エドマン分解プロトコールにおける１つの厳しいステップは、Ｎ末端アミノ酸を切断するための無水ＴＦＡ処理である。このステップにより、一般には、ＤＮＡが破壊される。ＰＮＡは、ＤＮＡとは対照的に、酸加水分解に対して高度に抵抗性である。ＰＮＡでの問題は、情報移行の酵素的方法がより難しくなる、すなわち、好ましい様式が化学的ライゲーションによる情報移行になることである。図１１Ｂにおいて、記録タグおよびコーディングタグ情報は酵素的ギャップ充填伸長ライゲーションステップによって書き込まれるが、これは、現在、ＰＮＡ鋳型を用いると、ＰＮＡを使用するポリメラーゼが開発されなければ、都合がよくない。化学的ライゲーションが必要であり、その産物は容易には増幅されないので、ＰＮＡ記録タグからコーディングタグへのバーコードおよびＵＭＩの書き込みには問題がある。化学的ライゲーションの方法は、文献に広範囲にわたって記載されている（Ｇｕｎｄｅｒｓｏｎら、１９９８年、ＧｅｎｏｍｅＲｅｓ．、８巻：１１４２〜１１５３頁；Ｐｅｎｇら、２０１０年、Ｅｕｒ．Ｊ．Ｏｒｇ．Ｃｈｅｍ．、４１９４〜４１９７頁；Ｅｌ−Ｓａｇｈｅｅｒら、２０１１年、Ｏｒｇ．Ｂｉｏｍｏｌ．Ｃｈｅｍ．、９巻：２３２〜２３５頁；Ｅｌ−Ｓａｇｈｅｅｒら、２０１１年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、１０８巻：１１３３８〜１１３４３頁；Ｌｉｔｏｖｃｈｉｃｋら、２０１４年、Ａｒｔｉｆ．ＤＮＡＰＮＡＸＮＡ、５巻：ｅ２７８９６頁；Ｒｏｌｏｆｆら、２０１４年、ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．、１０５０巻：１３１〜１４１頁）。

コンビナトリアルＰＮＡバーコードおよびＵＭＩ配列を創出するために、ｎ−ｍｅｒのライブラリーからのＰＮＡワードのセットをコンビナトリアルにライゲーションすることができる。各ＰＮＡワードが１，０００ワードの空間に由来する場合、４つの組合せ配列により、１，０００^４＝１０^１２コードのコーディング空間が生じる。このように、４，０００種の異なるＤＮＡ鋳型配列の出発セットから、１０^１２を超えるＰＮＡコードを生成することができる（図１２Ａ）。連鎖状のワードの数を調整すること、または基本のワードの数を調整することにより、より小さなまたはより大きなコーディング空間を生成することができる。そのように、ＰＮＡ記録タグとハイブリダイズさせたＤＮＡ配列を使用した情報移行は、ＤＮＡワードアセンブリハイブリダイゼーションおよび化学的ライゲーションを使用して完了させることができる（図１２Ｂを参照されたい）。ＰＮＡ鋳型上のＤＮＡワードのアセンブリおよびＤＮＡワードの化学的ライゲーションの後、得られた中間体を使用して、情報をコーディングタグに／から移行させることができる（図１２Ｃおよび図１２Ｄを参照されたい）。

ある特定の実施形態では、巨大分子および付随する記録タグは、固体支持体に共有結合により接合している。固体支持体は、ビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアであってよい。固体支持体は、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズであってよい。

ある特定の実施形態では、結合性物質は、タンパク質またはポリペプチドである。一部の実施形態では、結合性物質は、改変またはバリアントアミノペプチダーゼ、改変またはバリアントアミノアシルｔＲＮＡ合成酵素、改変またはバリアントアンチカリン、改変またはバリアントＣｌｐＳ、または改変またはバリアント抗体またはその結合性断片である。ある特定の実施形態では、結合性物質は、単一のアミノ酸残基、ジペプチド、トリペプチド、またはペプチドの翻訳後修飾に結合する。一部の実施形態では、結合性物質は、Ｎ末端アミノ酸残基、Ｃ末端アミノ酸残基、または内部アミノ酸残基に結合する。一部の実施形態では、結合性物質は、Ｎ末端ペプチド、Ｃ末端ペプチド、または内部ペプチドに結合する。一部の実施形態では、結合性物質は、ペプチドの翻訳後修飾のアミノ酸の部位特異的な共有結合性標識である。

ある特定の実施形態では、ステップ（ｂ）において複数の巨大分子を複数の結合性物質と接触させた後、巨大分子および付随する結合性物質を含む複合体を固体支持体から解離させ、液滴またはマイクロ流体液滴のエマルジョン中に分配する。一部の実施形態では、各マイクロ流体液滴は、巨大分子および結合性物質を含む複合体を最大で１つ含む。

ある特定の実施形態では、伸長コーディングタグまたはジタグ構築物を生成する前に前記記録タグを増幅する。巨大分子および付随する結合性物質を含む複合体を液滴またはマイクロ流体液滴に液滴当たりの複合体が最大で１つになるように分配する実施形態では、記録タグの増幅により、情報をコーディングタグまたはジタグ構築物に移行させるための鋳型として追加的な記録タグがもたらされる（図１３および図１４を参照されたい）。エマルジョン融合ＰＣＲを使用して、記録タグ情報をコーディングタグに移行させるか、またはジタグ構築物の集団を創出することができる。

生成された伸長コーディングタグまたはジタグ構築物の収集物を解析前に増幅させることができる。伸長コーディングタグまたはジタグ構築物の収集物の解析は、核酸配列決定法を含んでよい。合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシング。核酸配列決定法は、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングであってよい。

エドマン分解およびＰＩＴＣ、サンガー薬剤（ＤＮＦＢ）、ＳＮＦＢ、アセチル化試薬、アミジン化（グアニジン化）試薬などのＮ末端アミンを化学的に標識する方法により、アデニン、グアニン、およびシトシンなどの標準の核酸またはＰＮＡ塩基の内部アミノ酸および環外アミンを修飾することもできる。ある特定の実施形態では、ペプチドのリシン残基のε−アミンを、配列決定の前に酸無水物、グアニジン化剤、または同様のブロッキング試薬でブロッキングする。ＤＮＡ塩基の環外アミンはペプチドのＮ末端第一級アミンよりもはるかに反応性が低いが、ＤＮＡ塩基の内部アミノ酸および環外アミンに対する非標的活性を低下させる、アミン反応性作用物質のＮ末端アミンに対する反応性の制御が、配列決定アッセイにとって重要である。修飾反応の選択性は、ｐＨ、溶媒（水性対有機、非プロトン性、非極性、極性非プロトン性、イオン性液体など）、塩基および触媒、共溶媒、温度、および時間などの反応条件を調整することによってモジュレートすることができる。さらに、ＤＮＡ塩基の環外アミンの反応性は、ＤＮＡがｓｓＤＮＡの形態であるかｄｓＤＮＡの形態であるかによってモジュレートされる。修飾を最小限にするために、ＮＴＡＡ化学修飾の前に、記録タグを相補ＤＮＡプローブ：Ｐ１’、｛試料ＢＣｓ｝’、｛Ｓｐ−ＢＣ｝’などとハイブリダイズさせることができる。別の実施形態では、保護された環外アミンを有する核酸の使用も使用することもできる（Ｏｈｋｕｂｏ、Ｋａｓｕｙａら、２００８年）。さらに別の実施形態では、ＳＮＦＢなどの「反応性が低い」アミン標識化合物により、ＤＮＡの内部アミノ酸および環外アミンに対するオフターゲットの標識が軽減される（ＣａｒｔｙおよびＨｉｒｓ、１９６８年）。ＳＮＦＢは、パラスルホニル基がパラニトロ基よりも電子求引性であり、それにより、ＤＮＦＢよりも活性が低いＳＮＦＢでのフッ素置換が導かれるという事実に起因してＤＮＦＢよりも反応性が低い。

ＮＴＡＡ α−アミン修飾を最適化し、オフターゲットのアミノ酸修飾またはＤＮＡ修飾を最小限にするためのカップリング条件およびカップリング試薬の調整は、化学および反応条件（濃度、温度、時間、ｐＨ、溶媒の型など）を慎重に選択することによって可能である。例えば、ＤＮＦＢは、二級アミンと、水中よりもアセトニトリルなどの非プロトン性溶媒中の方が容易に反応することが公知である。環外アミンが軽度に修飾されてもなお相補的なプローブが配列とハイブリダイズすることが可能になるが、ポリメラーゼに基づくプライマー伸長を妨害する可能性がある。環外アミンを保護しながら、それでも水素結合を可能にすることも可能である。これは、保護された塩基がなお目的の標的とハイブリダイズすることが可能であるという最近の刊行物に記載された（Ｏｈｋｕｂｏ、Ｋａｓｕｙａら、２００８年）。一実施形態では、工学的に操作されたポリメラーゼを使用して、ＤＮＡコーディングタグ鋳型上の記録タグの伸長中に、保護された塩基を有するヌクレオチドを組み入れる。別の実施形態では、工学的に操作されたポリメラーゼを使用して、ＰＮＡ記録タグ鋳型上のコーディングタグの伸長中に記録タグＰＮＡ鋳型（ｗ／またはｗ／ｏ保護された塩基）上のヌクレオチドを組み入れる。別の実施形態では、情報を、外因性オリゴヌクレオチドをＰＮＡ記録タグとアニーリングさせることによって記録タグからコーディングタグに移行させることができる。ハイブリダイゼーションの特異性は、ｎ−ｍｅｒのワードのアセンブリに基づく設計などの配列空間が別個であるＵＭＩを選択することによって容易にすることができる（Ｇｅｒｒｙ、Ｗｉｔｏｗｓｋｉら、１９９９年）。
エドマン様Ｎ末端ペプチド分解配列決定を使用してペプチドの直鎖状アミノ酸配列を決定することができるが、代替的な実施形態を使用して、伸長記録タグ、伸長コーディングタグ、およびジタグを利用する方法を用いたペプチドの部分的な組成分析を実施することができる。結合性物質または化学標識を使用してペプチド上のＮ末端および内部の両方のアミノ酸またはアミノ酸修飾を識別することができる。化学薬剤により、アミノ酸（例えば、標識）を部位特異的に共有結合により修飾することができる（ＳｌｅｔｔｅｎおよびＢｅｒｔｏｚｚｉ、２００９年、Ｂａｓｌｅ、Ｊｏｕｂｅｒｔら、２０１０年）（ＳｐｉｃｅｒおよびＤａｖｉｓ、２０１４年）。部位特異的に標識されたアミノ酸のコーディングおよびその後の識別を容易にするために、単一のアミノ酸を標的とする化学標識剤にコーディングタグを付着させることができる（図１３を参照されたい）。

ペプチド組成分析にはペプチドの環状分解は必要なく、したがって、ＤＮＡを含有するタグを厳しいエドマン化学に曝露することの問題が回避される。環状結合様式では、組成情報（アミノ酸またはジペプチド／トリペプチド情報）、ＰＴＭ情報、および一次アミノ酸配列をもたらすために伸長コーディングタグまたはジタグを使用することもできる。一実施形態では、この組成情報は、本明細書に記載の伸長コーディングタグまたはジタグ手法を使用して読み取ることができる。ＵＭＩおよびコンパートメントタグ情報と組み合わせると、伸長コーディングタグまたはジタグの収集物により、ペプチドおよびそれらの起源であるコンパートメントのタンパク質（複数可）に関する組成情報がもたらされる。同じコンパートメントタグ（および表面上起源であるタンパク質分子）にマッピングし戻された伸長コーディングタグまたはジタグの収集物は、部分的な組成情報を有するペプチドをマッピングするための強力なツールである。プロテオーム全体にマッピングし戻すのではなく、コンパートメントタグ付きペプチドの集合を限られたタンパク質分子のサブセットにマッピングし戻し、これにより、マッピングの一意性が著しく増大する。

本明細書で使用される結合性物質は、単一のアミノ酸、ジペプチド、トリペプチド、またはさらに長いペプチド配列モチーフを認識し得る。Ｔｅｓｓｌｅｒ（２０１１年、ＤｉｇｉｔａｌＰｒｏｔｅｉｎＡｎａｌｙｓｉｓ：ＴｅｃｈｎｏｌｏｇｉｅｓｆｏｒＰｒｏｔｅｉｎＤｉａｇｎｏｓｔｉｃｓａｎｄＰｒｏｔｅｏｍｉｃｓｔｈｒｏｕｇｈＳｉｎｇｌｅＭｏｌｅｃｕｌｅＤｅｔｅｃｔｉｏｎ．Ｐｈ．Ｄ．、ＷａｓｈｉｎｇｔｏｎＵｎｉｖｅｒｓｉｔｙｉｎＳｔ．Ｌｏｕｉｓ）は、荷電したジペプチドエピトープのサブセットに対して比較的選択的なジペプチド抗体を生成することができることを実証した（Ｔｅｓｓｌｅｒ、２０１１年）。代替のタンパク質足場（例えば、ａａＲＳ、アンチカリン、ＣｌｐＳなど）およびアプタマーへの定向進化の適用を使用して、ジペプチド／トリペプチド結合性物質のセットを増大させることができる。単一のタンパク質分子にマッピングし戻すことと併せたジペプチド／トリペプチド組成分析からの情報は、各タンパク質分子を一意的に識別し、定量化するために十分なものであり得る。最大で、合計４００種の可能性のあるジペプチドの組合せがある。しかし、最も頻度が高く、かつ最も抗原性が高い（荷電、親水性、疎水性）ジペプチドのサブセットが、結合性物質を生成するために十分なものであるはずである。この数は、４０〜１００種の異なる結合性物質のセットを構成し得る。４０種の異なる結合性物質のセットに関して、平均１０ｍｅｒのペプチドに少なくとも１種の結合性物質が結合する見込みは約８０％である。この情報を同じタンパク質分子に由来する全てのペプチドと組み合わせることにより、タンパク質分子の識別が可能になり得る。ペプチドおよびその起源であるタンパク質に関するこの情報全てを組み合わせて、より正確かつ的確なタンパク質配列特徴付けをもたらすことができる。

部分的なペプチド配列情報を使用する最近のデジタルタンパク質特徴付けアッセイが提唱された（Ｓｗａｍｉｎａｔｈａｎら、２０１５年、ＰＬｏＳＣｏｍｐｕｔ．Ｂｉｏｌ．、１１巻：ｅ１００４０８０頁）（Ｙａｏ、Ｄｏｃｔｅｒら、２０１５年）。すなわち、当該手法では、システイン、リシン、アルギニン、チロシン、アスパラギン酸／グルタミン酸などの、標準の化学を使用して容易に標識されるアミノ酸の蛍光標識を使用する（Ｂａｓｌｅ、Ｊｏｕｂｅｒｔら、２０１０年）。部分的なペプチド配列情報を用いることの問題は、プロテオームにマッピングし戻すことが一対多数の関連であり、一意のタンパク質が識別されないことである。この一対多数のマッピング問題は、プロテオーム全体空間を、ペプチドがマッピングし戻される限られたタンパク質分子のサブセットに減少させることによって解決することができる。本質的に、単一の部分的なペプチド配列を１００種または１０００種の異なるタンパク質配列にマッピングし戻すことができるが、いくつかのペプチド（例えば、単一のタンパク質分子の消化に由来する１０ペプチド）のセットを全て、コンパートメント内のタンパク質分子のサブセットに含有される単一のタンパク質分子にマッピングし戻した場合、タンパク質分子の同一性を推定することが容易であることが公知である。例えば、同じ分子に由来する全てのペプチドに関するペプチドプロテオームマップの交差により、可能性のあるタンパク質同一性のセットが著しく制限される（図１５を参照されたい）。

特に、部分的なペプチド配列または組成のマッピング可能性は、コンパートメントのタグおよびＵＭＩの革新的使用を行うことによって有意に増強される。すなわち、プロテオームを最初にバーコードが付されたコンパートメントに分配し、ここで、コンパートメントバーコードはＵＭＩ配列にも付着している。コンパートメントバーコードはコンパートメントに一意の配列であり、ＵＭＩはコンパートメント内のバーコードが付された分子それぞれに一意の配列である（図１６を参照されたい）。一実施形態では、この分配は、その全体が参照により組み込まれる、ＰＣＴ公開第ＷＯ２０１６／０６１５１７号に開示されているものと同様の方法を使用して、ビーズに付着したＤＮＡコンパートメントバーコードとのハイブリダイゼーションによる、ＤＮＡタグで標識されたポリペプチドとビーズの表面との直接相互作用によって実現される（図３１を参照されたい）。プライマー伸長ステップにより、ビーズに連結されたコンパートメントバーコードからポリペプチド上のＤＮＡタグに情報を移行させる（図２０）。別の実施形態では、この分配は、ＵＭＩを含有する、バーコードが付されたビーズおよびタンパク質分子をエマルジョンの液滴中に共封入することによって実現される。さらに、液滴は、任意選択でタンパク質をペプチドに消化するプロテアーゼを含有する。いくつものプロテアーゼを、レポータータグが付されたポリペプチドを消化するために使用することができる（Ｓｗｉｔｚａｒ、Ｇｉｅｒａら、２０１３年）。ブテラーゼＩなどの酵素的リガーゼとプロテアーゼの共封入では、酵素をプロテアーゼ消化に対して抵抗性にするために、ペグ化などの酵素の修飾が必要になり得る（ＦｒｏｋｊａｅｒおよびＯｔｚｅｎ、２００５年、Ｋａｎｇ、Ｗａｎｇら、２０１０年）。消化後、ペプチドをバーコード−ＵＭＩタグとライゲーションする。好ましい実施形態では、下流の生化学的操作を容易にするために、バーコード−ＵＭＩタグをビーズ上に保持する（図１３を参照されたい）。

バーコード−ＵＭＩとペプチドのライゲーション後、エマルジョンを破壊し、ビーズを回収する。バーコードが付されたペプチドを、それらの一次アミノ酸配列、またはそれらのアミノ酸組成によって特徴付けることができる。ペプチドに関するどちらの型の情報も、プロテオームのサブセットにマッピングし戻すために使用することができる。一般に、配列情報は、組成情報よりもはるかに小さいプロテオームのサブセットにマッピングし戻される。それにもかかわらず、多数のペプチド（配列または組成）からの情報を同じコンパートメントバーコードと組み合わせることにより、ペプチドの起源であるタンパク質（複数可）を一意的に識別することが可能である。このように、プロテオーム全体を特徴付け、定量化することができる。ペプチド上の一次配列情報は、ペプチド配列を表すＤＮＡにコードされるライブラリー（ＤＮＡＥｎｃｏｄｅｄＬｉｂｒａｒｙ）（ＤＥＬ）の伸長記録タグ創出を伴うペプチド配列決定反応を実施することによって引き出すことができる。好ましい実施形態では、記録タグは、コンパートメントバーコードおよびＵＭＩ配列で構成される。この情報を、コーディングタグから移行された一次またはＰＴＭアミノ酸情報と共に使用して、最終的なマッピングされたペプチド情報を生成する。

ペプチド配列情報に対する代替は、コンパートメントバーコードおよびＵＭＩと連結したペプチドアミノ酸またはジペプチド／トリペプチド組成情報を生成することである。これは、ＵＭＩ−バーコードが付されたペプチドを伴うビーズを、各ペプチド上の選択されたアミノ酸（内部）をアミノ酸コード情報および別のアミノ酸ＵＭＩ（ＡＡＵＭＩ）を含むＤＮＡタグで部位特異的に標識するアミノ酸標識ステップに供することによって実現される（図１３を参照されたい）。最も化学標識しやすいアミノ酸（ＡＡ）は、リシン、アルギニン、システイン、チロシン、トリプトファン、およびアスパラギン酸／グルタミン酸であるが、他のＡＡに対する標識スキームを同様に展開することも実行可能であり得る（ＭｅｎｄｏｚａおよびＶａｃｈｅｔ、２００９年）。所与のペプチドは、同じ型のＡＡをいくつか含有し得る。同じ型の多数のアミノ酸の存在は、付着したＡＡＵＭＩ標識によって区別することができる。各標識分子は、ＤＮＡタグ内に異なるＵＭＩを有し、それによりアミノ酸の計数が可能になる。化学標識に対する代替は、ＡＡを結合性物質で「標識」することである。例えば、ＡＡコード情報およびＡＡＵＭＩを含むコーディングタグで標識されたチロシン特異的抗体を使用して、ペプチドの全てのチロシンに印を付けることができる。この手法に伴う注意事項は、大きなかさのある抗体では立体的な障害が生じることであり、この目的のためには、より小さなｓｃＦｖ、アンチカリン、またはＣｌｐＳバリアントを使用することが理想的である。

一実施形態では、ＡＡへのタグ付け後、情報を、記録タグと、ペプチド上の結合したまたは共有結合によりカップリングした結合性物質に付随する多数のコーディングタグとの間で、液滴当たり単一のペプチドが含有されるようにペプチド複合体を区画化し、エマルジョン融合ＰＣＲを実施して、区画化されたペプチドのアミノ酸組成を特徴付ける伸長コーディングタグまたはジタグのセットを構築することによって移行させる。ジタグの配列決定後、同じバーコードを有するペプチド上の情報を単一のタンパク質分子にマッピングし戻すことができる。

特定の実施形態では、タグが付されたペプチド複合体をビーズから解離させ（図１３を参照されたい）、小さなミニコンパートメント（例えば、マイクロエマルジョン）に、平均して単一の標識された／結合した結合性物質ペプチド複合体のみが所与のコンパートメント内に存在するように分配する。特定の実施形態では、この区画化は、マイクロエマルジョン液滴の生成によって実現される（Ｓｈｉｍ、Ｒａｎａｓｉｎｇｈｅら、２０１３年、Ｓｈｅｍｂｅｋａｒ、Ｃｈａｉｐａｎら、２０１６年）。ペプチド複合体に加えて、ＰＣＲ試薬も、液滴中に３種のプライマー（Ｕ１、Ｓｐ、およびＵ２_ｔｒ）と共封入することができる。液滴形成後、Ｕ１およびＳｐのみがアニーリングし、記録タグ産物が増幅するように、高いアニーリング温度でエマルジョンＰＣＲを数サイクル実施する（約５〜１０サイクル）（図１３を参照されたい）。この最初の５〜１０サイクルのＰＣＲの後、アミノ酸コードタグ上のＵ２_ｔｒおよびＳｐ_ｔｒが増幅に加わるようにアニーリング温度を低下させ、さらに約１０ラウンドを実施する。３プライマーエマルジョンＰＣＲにより、ペプチドＵＭＩ−バーコードとＡＡコードタグの全てが有効に組み合わされ、それにより、ペプチドおよびそのアミノ酸組成のジタグライブラリー表示が生成する。３プライマーＰＣＲおよびタグの連鎖を実施する他のモダリティを使用することもできる。別の実施形態は、光デブロッキング、または不安定なブロッキングされた３’ヌクレオチドの３’デブロッキングを開始するための油可溶性還元体の添加によって活性化される、３’ブロッキングされたＵ２プライマーの使用である。エマルジョンＰＣＲ後、ＮＧＳ配列決定のためのライブラリーエレメントをフォーマットするための一般的なプライマーを用いて別のラウンドのＰＣＲを実施することができる。

このように、ライブラリーエレメントの異なる配列成分を計数および分類のために使用する。所与のペプチド（コンパートメントバーコード−ＵＭＩの組合せによって識別される）について、多くのライブラリーエレメントが存在し、それぞれが識別用ＡＡコードタグおよびＡＡＵＭＩを有する（図１３を参照されたい）。ＡＡコードおよび付随するＵＭＩを使用して、所与のペプチド内の所与のアミノ酸型の存在を計数する。したがって、ペプチド（おそらくＧｌｕＣ、ＬｙｓＣ、またはＥｎｄｏＡｓｎＮ消化物）を、そのアミノ酸組成（例えば、Ｃｙｓが２つ、Ｌｙｓが１つ、Ａｒｇが１つ、Ｔｙｒが２つなど）によって、空間的順序は考慮せず、特徴付ける。それにもかかわらず、これにより、ペプチドをプロテオームのサブセットにマッピングするため、また、同じタンパク質分子に由来する他のペプチドと組み合わせて使用した場合には、タンパク質を一意的に識別および定量化するための、十分なシグネチャがもたらされる。
Ｘ．末端アミノ酸（ＴＡＡ）標識方法

ある特定の実施形態では、本明細書に記載の方法においてペプチドを結合性物質と接触させる前に、ペプチドの末端アミノ酸（例えば、ＮＴＡＡまたはＣＴＡＡ）を修飾または標識する。

一部の実施形態では、ＮＴＡＡをフェニルイソチオシアネート（ＰＩＴＣ）と反応させて、フェニルチオカルバモイル（ＰＴＣ）−ＮＴＡＡ誘導体を生成する。エドマン分解では、一般には、フェニルイソチオシアネート（ＰＩＴＣ）を使用してＮ末端を標識する。ＰＩＴＣは、本明細書に開示されている方法に十分に適する２つの性質を有する：（１）ＰＩＴＣはＮ末端アミン基を高い効率で標識する；および（２）得られるＰＴＣ誘導体化ＮＴＡＡは、酸処理されると自己異性化を受け、それにより当該アミノ酸が残りのペプチドから切断される。

ＮＴＡＡを標識するために使用することができる他の試薬としては、４−スルホフェニルイソチオシアネート、３−ピリジルイソチオシアネート（ＰＹＩＴＣ）、２−ピペリジノエチルイソチオシアネート（ＰＥＩＴＣ）、３−（４−モルホリノ）プロピルイソチオシアネート（ＭＰＩＴＣ）、３−（ジエチルアミノ）プロピルイソチオシアネート（ＤＥＰＴＩＣ）（Ｗａｎｇら、２００９年、ＡｎａｌＣｈｅｍ、８１巻：１８９３〜１９００頁）、（１−フルオロ−２，４−ジニトロベンゼン（サンガー試薬、ＤＮＦＢ）、ダンシルクロリド（ＤＮＳ−Ｃｌ、または１−ジメチルアミノナフタレン−５−スルホニルクロリド）、４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）、アセチル化試薬、アミジン化（グアニジン化）試薬、２−カルボキシ−４，６−ジニトロクロロベンゼン、７−メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、およびチオベンジル化試薬が挙げられる。ＮＴＡＡを標識のためにブロッキングする場合、例えば、Ｎ−アセチルブロッキングをアシルペプチドヒドロラーゼ（ＡＰＨ）で除去することなど、末端をアンブロッキングするための手法がいくつも存在する（Ｆａｒｒｉｅｓ、Ｈａｒｒｉｓら、１９９１年、Ｅｕｒ．Ｊ．Ｂｉｏｃｈｅｍ．、１９６巻：６７９〜６８５頁）。ペプチドのＮ末端をアンブロッキングする方法は、当技術分野で公知である（例えば、それぞれ、その全体が参照により本明細書に組み込まれる、Ｋｒｉｓｈｎａら、１９９１年、Ａｎａｌ．Ｂｉｏｃｈｅｍ．、１９９巻：４５〜５０頁；Ｌｅｏｎｅら、２０１１年、Ｃｕｒｒ．Ｐｒｏｔｏｃ．ＰｒｏｔｅｉｎＳｃｉ．、第１１章：ユニット１１．７；Ｆｏｗｌｅｒら、２００１年、Ｃｕｒｒ．Ｐｒｏｔｏｃ．ＰｒｏｔｅｉｎＳｃｉ．、第１１章：ユニット１１．７を参照されたい）。

ダンシルクロリドは、ペプチドの遊離のアミン基と反応して、ＮＴＡＡのダンシル誘導体をもたらす。ＤＮＦＢおよびＳＮＦＢはペプチドのα−アミン基と反応して、それぞれＤＮＰ−ＮＴＡＡ、およびＳＮＰ−ＮＴＡＡを生成させる。さらに、ＤＮＦＢおよびＳＮＦＢはどちらも、リシン残基のε−アミンとも反応する。ＤＮＦＢはまた、チロシンおよびヒスチジンアミノ酸残基とも反応する。ＳＮＦＢは、ＤＮＦＢよりも良好なアミン基に対する選択性を有し、ＮＴＡＡ修飾に好ましい（ＣａｒｔｙおよびＨｉｒｓ、１９６８年）。ある特定の実施形態では、ポリペプチドをプロテアーゼ消化してペプチドにする前に、リシンε−アミンを有機無水物でプレブロッキングする。

別の有用なＮＴＡＡ修飾因子はアセチル基であり、その理由は、アセチル化ＮＴＡＡを除去する公知の酵素、すなわち、Ｎ末端アセチル化アミノ酸を切断し、それによりペプチドを単一アミノ酸だけ有効に短縮するアシルペプチドヒドロラーゼ（ＡＰＨ）が存在するからである｛Ｃｈａｎｇ、２０１５年、＃３７３；Ｆｒｉｅｄｍａｎｎ、２０１３年、＃３７４｝。ＮＴＡＡは、無水酢酸を用いて化学的にアセチル化することもでき、Ｎ末端アセチルトランスフェラーゼ（ＮＡＴ）を用いて酵素的にアセチル化することもできる｛Ｃｈａｎｇ、２０１５年、＃３７３；Ｆｒｉｅｄｍａｎｎ、２０１３年、＃３７４｝。さらに別の有用なＮＴＡＡ修飾因子はアミジニル（グアニジニル）部分であり、その理由は、アミジン化ＮＴＡＡの証明された切断化学、すなわち、Ｎ末端アミジン化ペプチドを０．５〜２％ＮａＯＨと一緒に穏やかにインキュベートすることにより、Ｎ末端アミノ酸の切断がもたらされることが文献で知られているからである｛Ｈａｍａｄａ、２０１６年、＃３８３｝。これにより、穏やかなエドマン様化学的Ｎ末端分解ペプチド配列決定プロセスが有効にもたらされる。さらに、ある特定のアミジン化（グアニジン化）試薬および下流のＮａＯＨ切断は、ＤＮＡエンコーディングに非常に適合性である。

ＮＴＡＡにＤＮＰ／ＳＮＰ基、アセチル基、またはアミジニル（グアニジニル）基が存在することにより、工学的に操作された結合性物質との相互作用のより良好な取り扱いがもたらされ得る。低ｎＭの親和性を有する商業的なＤＮＰ抗体がいくつも存在する。他のＮＴＡＡ標識方法としては、トリプリガーゼ（ｔｒｙｐｌｉｇａｓｅ）を用いた標識（Ｌｉｅｂｓｃｈｅｒら、２０１４年、ＡｎｇｅｗＣｈｅｍＩｎｔＥｄＥｎｇｌ、５３巻：３０２４〜３０２８頁）、およびアミノアシルトランスフェラーゼを用いた標識（Ｗａｇｎｅｒら、２０１１年、ＪＡｍＣｈｅｍＳｏｃ、１３３巻：１５１３９〜１５１４７頁）が挙げられる。

イソチオシアネートは、イオン性液体の存在下では、第一級アミンに対して増強された反応性を有することが示されている。イオン性液体は、有機化学反応における優れた溶媒であり（また、触媒として作用する）、チオ尿素を形成する、イソチオシアネートとアミンの反応を増強することができる。例は、フェニルイソチオシアネート（ＰＩＴＣ）による芳香族および脂肪族アミンの迅速かつ効率的な標識のためにイオン性液体１−ブチル−３−メチル−イミダゾリウムテトラフルオロボレート［Ｂｍｉｍ］［ＢＦ４］を使用することである（Ｌｅ、Ｃｈｅｎら、２００５年）。エドマン分解は、ＰＩＴＣなどのイソチオシアネートとペプチドのアミノＮ末端の反応を伴う。そのように、一実施形態では、より穏やかな標識および分解条件をもたらすことによってエドマン分解プロセスの効率を改善するためにイオン性液体を使用する。例えば、イオン性液体［Ｂｍｉｍ］［ＢＦ４］中５％（ｖｏｌ．／ｖｏｌ．）ＰＩＴＣを２５℃で１０分間使用することは、ピリジン、エタノール、およびｄｄＨ２Ｏを含有する溶液（１：１：１ｖｏｌ．／ｖｏｌ．／ｖｏｌ．）中５％（ｖｏｌ．／ｖｏｌ．）ＰＩＴＣを５５℃で６０分間使用する標準のエドマンＰＩＴＣ誘導体化条件下で標識することよりも効率的である（Ｗａｎｇ、Ｆａｎｇら、２００９年）。好ましい実施形態では、ポリペプチドの内部のリシン、チロシン、ヒスチジン、およびシステインアミノ酸を、ペプチドへの断片化の前にブロッキングする。このように、ペプチド配列決定反応中、ペプチドＮＴＡＡのα−アミン基のみが修飾に利用可能になるようにする。これは、特に、ＤＮＦＢ（サンガー試薬）およびダンシルクロリドを使用する場合に適切である。

ある特定の実施形態では、ＮＴＡＡは、ＮＴＡＡ標識ステップの前にブロッキングされている（特にタンパク質の元のＮ末端）。その場合、例えば、Ｎ−アセチルブロッキングをアシルペプチドヒドロラーゼ（ＡＰＨ）で除去することなど、Ｎ末端をアンブロッキングするための手法がいくつも存在する（Ｆａｒｒｉｅｓ、Ｈａｒｒｉｓら、１９９１年）。ペプチドのＮ末端をアンブロッキングする他の方法がいくつも当技術分野で公知である（例えば、それぞれ、その全体が参照により本明細書に組み込まれる、Ｋｒｉｓｈｎａら、１９９１年、Ａｎａｌ．Ｂｉｏｃｈｅｍ．、１９９巻：４５〜５０頁；Ｌｅｏｎｅら、２０１１年、Ｃｕｒｒ．Ｐｒｏｔｏｃ．ＰｒｏｔｅｉｎＳｃｉ．、第１１章：ユニット１１．７；Ｆｏｗｌｅｒら、２００１年、Ｃｕｒｒ．Ｐｒｏｔｏｃ．ＰｒｏｔｅｉｎＳｃｉ．、第１１章：ユニット１１．７を参照されたい）。

ＣＴＡＡは、Ｈｅｒｍａｎｓｏｎ（Ｈｅｒｍａｎｓｏｎ、２０１３年）に記載されている通り、いくつもの異なるカルボキシル反応性試薬を用いて修飾することができる。別の例では、ＣＴＡＡを混合無水物およびイソチオシアネートで修飾して、チオヒダントインを生成する（（ＬｉｕおよびＬｉａｎｇ、２００１年）および米国特許第５，０４９，５０７号）。チオヒダントインで修飾されたペプチドは、基剤中上昇した温度で切断されて、最後から２番目のＣＴＡＡが露出し、それにより、Ｃ末端に基づくペプチド分解配列決定手法を有効に生成することができる（ＬｉｕおよびＬｉａｎｇ、２００１年）。ＣＴＡＡに対して行うことができる他の修飾としては、パラ−ニトロアニリド基の付加および７−アミノ−４−メチルクマリニル基の付加が挙げられる。
ＸＩ．末端アミノ酸切断方法

ペプチドの解析に関するある特定の実施形態では、末端アミノ酸（Ｎ末端またはＣ末端）への結合性物質の結合、およびコーディングタグ情報の記録タグへの移行、記録タグ情報のコーディングタグへの移行、記録タグ情報およびコーディングタグ情報のジタグ構築物への移行の後、末端アミノ酸をペプチドから除去または切断して、新しい末端アミノ酸を露出させる。一部の実施形態では、末端アミノ酸は、ＮＴＡＡである。他の実施形態では、末端アミノ酸は、ＣＴＡＡである。

末端アミノ酸の切断は、化学的切断および酵素的切断を含めた、任意の数の公知の技法によって実現することができる。化学的切断の例は、エドマン分解である。ペプチドのエドマン分解中、ｎＮＴＡＡをフェニルイソチオシアネート（ＰＩＴＣ）と弱アルカリ性条件下で反応させて、フェニルチオカルバモイル−ＮＴＡＡ誘導体を形成する。次に、酸性条件下で、フェニルチオカルバモイル−ＮＴＡＡ誘導体を切断し、それにより、遊離のチアゾリノン誘導体を生成し、それにより、ペプチドのｎ−１アミノ酸をＮ末端アミノ酸（ｎ−１ＮＴＡＡ）に変換する。このプロセスのステップを以下に例示する：

典型的なエドマン分解では、上記の通り、長いインキュベーション時間にわたって厳しい高温の化学的条件（例えば、無水ＴＦＡ）の発生が必要になる。これらの条件は、一般に、巨大分子の核酸エンコーディングには適合しない。

化学的エドマン分解を核酸エンコーディングに好都合の手法に変換するために、厳しい化学的ステップを穏やかな化学的分解または効率的な酵素的ステップで置き換える。一実施形態では、化学的エドマン分解を、元々記載された条件よりも穏やかな条件を使用して利用することができる。アセトニトリル中無水ＴＦＡを酢酸トリエチルアミンで置き換えること（例えば、その全体が参照により組み込まれる、Ｂａｒｒｅｔｔ、１９８５年、ＴｅｔｒａｈｅｄｒｏｎＬｅｔｔ．、２６巻：４３７５〜４３７８頁を参照されたい）を含め、エドマン分解のための穏やかな切断条件がいくつか文献に記載されている。ＮＴＡＡの切断は、エドマン分解と比較して穏やかな切断条件を使用するチオアシル化分解を使用することによって実現することもできる（米国特許第４，８６３，８７０号を参照されたい）。

別の実施形態では、無水ＴＦＡによる切断を、穏やかな条件下で切れやすいペプチド結合のカルボニル基のチオ尿素硫黄原子の求核攻撃によるＰＩＴＣ誘導体化Ｎ末端アミノ酸の除去を触媒する、工学的に操作された酵素である「エドマナーゼ（Ｅｄｍａｎａｓｅ）」で置き換えることができる（その全体が参照により組み込まれる、米国特許公開第ＵＳ２０１４／０２７３００４号を参照されたい）。エドマナーゼは、Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉに由来するシステインプロテアーゼであるクルザイン（ｃｒｕｚａｉｎ）を改変することによって作出された（Ｂｏｒｇｏ、２０１４年）。Ｃ２５Ｇ変異により触媒性システイン残基が除去されたと同時に、エドマン試薬（ＰＩＴＣ）のフェニル部分との立体的な適合を創出するための３つの変異（Ｇ６５Ｓ、Ａ１３８Ｃ、Ｌ１６０Ｙ）が選択された。

ＮＴＡＡの酵素的切断は、アミノペプチダーゼによって実現することもできる。アミノペプチダーゼは、単量体酵素および多量体酵素として天然に存在し、金属またはＡＴＰ依存性であり得る。天然のアミノペプチダーゼは、非常に限られた特異性を有し、一般的に、Ｎ末端アミノ酸を前進的に切断し、それにより、アミノ酸を次々に切断する。本明細書に記載の方法に関しては、アミノペプチダーゼを、ＮＴＡＡに対して、Ｎ末端標識で修飾されている場合にのみ特異的な結合活性または触媒活性を有するように工学的に操作することができる。例えば、アミノペプチダーゼを、Ｎ末端アミノ酸がＤＮＰ／ＳＮＰ、ＰＴＣ、ダンシルクロリド、アセチル、アミジニルなどの基によって修飾されている場合にＮ末端アミノ酸のみを切断するように工学的に操作することができる。このように、アミノペプチダーゼは、一度にＮ末端から単一のアミノ酸だけ切断し、分解サイクルの制御を可能にする。一部の実施形態では、改変アミノペプチダーゼは、アミノ酸残基同一性に関しては非選択的である一方で、Ｎ末端標識に関しては選択的である。他の実施形態では、改変アミノペプチダーゼは、アミノ酸残基同一性とＮ末端標識の両方に関して選択的である。酵素的ＮＴＡＡ分解の修飾特異性のモデルの例は、ＢｏｒｇｏおよびＨａｖｒａｎｅｋにより例示されており、そこでは、構造−機能補助設計を通じて、メチオニンアミノペプチダーゼがロイシンアミノペプチダーゼに変換された（ＢｏｒｇｏおよびＨａｖｒａｎｅｋ、２０１４年）。ＤＮＰ／ＳＮＰで修飾されたＮＴＡＡなどの修飾されたＮＴＡＡに同様の手法をとることができ、ここで、アミノペプチダーゼを、ＤＮＰ／ＳＮＰ基が存在するＮ末端アミノ酸のみを切断するように工学的に操作する（構造−機能に基づく設計および定向進化の両方を使用する）。個々のまたは小さな群の標識した（ビオチン化した）ＮＴＡＡに結合し、それを切断する工学的に操作されたアミノペプチダーゼ変異体が記載されている（ＰＣＴ公開第ＷＯ２０１０／０６５３２２号を参照されたい）。

ある特定の実施形態では、緻密な単量体金属酵素的アミノペプチダーゼを、ＤＮＰで標識されたＮＴＡＡを認識し、切断するように工学的に操作する。単量体メタロ−アミノペプチダーゼの使用には、重要な利点が２つある：１）緻密な単量体タンパク質は、ファージディスプレイを使用してディスプレイおよびスクリーニングするのがはるかに容易である；２）メタロ−アミノペプチダーゼは、適切な金属カチオンを添加または除去することによってその活性をオン／オフにすることができるという点で、独特の利点を有する。例示的なアミノペプチダーゼとしては、Ｓｔｒｅｐｔｏｍｙｃｅｓｓｐ．ＫＫ５０６（ＳＫＡＰ）（Ｙｏｏ、Ａｈｎら、２０１０年）、Ｓｔｒｅｐｔｏｍｙｃｅｓｇｒｉｓｅｕｓ（ＳＧＡＰ）、Ｖｉｂｒｉｏｐｒｏｔｅｏｌｙｔｉｃｕｓ（ＶＰＡＰ）、（ＳｐｕｎｇｉｎおよびＢｌｕｍｂｅｒｇ、１９８９年、Ｂｅｎ−Ｍｅｉｒ、Ｓｐｕｎｇｉｎら、１９９３年）などの、アミノペプチダーゼのＭ２８ファミリーが挙げられる。これらの酵素は、室温およびｐＨ８．０で安定であり、ロバストであり、かつ活性であり、したがって、ペプチド解析に好ましい穏やかな条件に適合する。

別の実施形態では、アミノペプチダーゼを、Ｎ末端アミノ酸標識の存在下でのみ活性になるように工学的に操作することにより、周期的切断が達成される。さらに、アミノペプチダーゼを、非特異的になるように、したがって、１つの特定のアミノ酸を別のアミノ酸に対して選択的に認識するのではなく、単に標識されたＮ末端を認識するように、工学的に操作することができる。好ましい実施形態では、メタロペプチダーゼ単量体アミノペプチダーゼ（例えば、Ｖｉｂｒｏロイシンアミノペプチダーゼ）（Ｈｅｒｎａｎｄｅｚ−Ｍｏｒｅｎｏ、Ｖｉｌｌａｓｅｎｏｒら、２０１４年）を、修飾されたＮＴＡＡ（例えば、ＰＴＣ、ＤＮＰ、ＳＮＰ、アセチル化された、アシル化されたなど）のみを切断するように工学的に操作する。

さらに別の実施形態では、アセチル化ＮＴＡＡを切断するように工学的に操作されたアシルペプチドヒドロラーゼ（ＡＰＨ）を使用することによって周期的切断を達成する。ＡＰＨは、ブロッキングされたペプチドからのＮα−アセチル化アミノ酸の除去を触媒することができるセリンペプチダーゼであり、真核細胞、細菌細胞および古細菌細胞において、Ｎ末端がアセチル化されたタンパク質の重要な調節因子である。ある特定の実施形態では、ＡＰＨは、二量体であり、エキソペプチダーゼ活性のみを有する（Ｇｏｇｌｉｅｔｔｉｎｏ、Ｂａｌｅｓｔｒｉｅｒｉら、２０１２年、Ｇｏｇｌｉｅｔｔｉｎｏ、Ｒｉｃｃｉｏら、２０１４年）。工学的に操作されたＡＰＨは、内因性または野生型ＡＰＨよりも高い親和性および低い選択性を有し得る。

さらに別の実施形態では、ＮＴＡＡのアミジン化（グアニジニル化）を使用して、標識されたＮＴＡＡのＮａＯＨを使用した穏やかな切断を可能にする（Ｈａｍａｄａ、２０１６年、その全体が参照により組み込まれる）。Ｓ−メチルイソチオ尿素、３，５−ジメチルピラゾール−１−カルボキサミジン、Ｓ−エチルチオウロニウムブロミド、Ｓ−エチルチオウロニウムクロリド、Ｏ−メチルイソ尿素、Ｏ−メチルイソウロニウム硫酸塩、Ｏ−メチルイソ尿素硫化水素塩、２−メチル−１−ニトロイソ尿素、アミノイミノメタンスルホン酸、シアナミド、シアノグアニド、ジシアンジアミド、３，５−ジメチル−１−グアニルピラゾール硝酸塩および３，５−ジメチルピラゾール、Ｎ，Ｎ’−ビス（オルト−クロロ−Ｃｂｚ）−Ｓ−メチルイソチオ尿素およびＮ，Ｎ’−ビス（オルト−ブロモ−Ｃｂｚ）−Ｓ−メチルイソチオ尿素を含めたいくつものアミジン化（グアニジニル化）試薬が当技術分野で公知である（Ｋａｔｒｉｔｚｋｙ、２００５年、その全体が参照により組み込まれる）。

ＮＴＡＡの標識、結合、および分解ワークフローの例は以下の通りである（図４１および４２を参照されたい）：タンパク質分解による消化に由来する、記録タグで標識されたペプチドの大きな集団（例えば、５千万〜１０億）を単一分子シーケンシング基板（例えば、多孔質ビーズ）に適切な分子内間隔でランダムに固定化する。周期的に、各ペプチドのＮ末端アミノ酸（ＮＴＡＡ）を小さな化学的部分（例えば、ＤＮＰ、ＳＮＰ、アセチル）で修飾して、ＮＴＡＡ分解プロセスの周期的制御をもたらし、同類結合性物質による結合親和性を増強する。各固定化ペプチドの修飾されたＮ末端アミノ酸（例えば、ＤＮＰ−ＮＴＡＡ、ＳＮＰ−ＮＴＡＡ、アセチル−ＮＴＡＡ）に同類のＮＴＡＡ結合性物質を結合させ、結合したＮＴＡＡ結合性物質に付随するコーディングタグからの情報を固定化されたペプチドに付随する記録タグに移行させる。ＮＴＡＡの認識、結合、およびコーディングタグ情報の記録タグへの移行の後、標識されたＮＴＡＡを、標識の存在下でのみＮＴＡＡを切断することができる工学的に操作されたアミノペプチダーゼ（例えば、ＤＮＰ−ＮＴＡＡもしくはＳＮＰ−ＮＴＡＡに対して）または工学的に操作されたＡＰＨ（例えば、アセチル−ＮＴＡＡに対して）に曝露させることによって除去する。他のＮＴＡＡ標識（例えば、ＰＩＴＣ）も、適切に工学的に操作されたアミノペプチダーゼとともに使用することもできる。特定の実施形態では、単一の工学的に操作されたアミノペプチダーゼまたはＡＰＨは、Ｎ末端アミノ酸標識を有する全ての可能性のあるＮＴＡＡ（翻訳後修飾バリアントを含む）を普遍的に切断する。別の特定の実施形態では、２種、３種、４種、またはそれよりも多くの工学的に操作されたアミノペプチダーゼまたはＡＰＨを使用して、標識されたＮＴＡＡのレパートリーを切断する。

ＤＮＰまたはＳＮＰで標識されたＮＴＡＡに対する活性を有するアミノペプチダーゼは、ベンジルペニシリンに対するメタロ−ベータ−ラクタマーゼ酵素の工学的操作におけるＰｏｎｓａｒｄらにより記載されている手法（Ｐｏｎｓａｒｄ、Ｇａｌｌｅｎｉら、２００１年、Ｆｅｒｎａｎｄｅｚ−Ｇａｃｉｏ、Ｕｇｕｅｎら、２００３年）のような、アポ酵素（金属補助因子の不在下では不活性）に対する密接結合の選択、その後の機能的触媒の選択ステップを組み合わせるスクリーニングを使用して選択することができる。この二段階選択は、Ｚｎ２＋イオンの添加によって活性化されたメタロ−ＡＰの使用を伴う。固定化されたペプチド基板への密接結合選択の後、Ｚｎ２＋を導入し、ＤＮＰまたはＳＮＰで標識されたＮＴＡＡを加水分解することが可能な、触媒として活性なファージにより、結合したファージの上清中への放出が導かれる。ＤＮＰまたはＳＮＰで標識されたＮＴＡＡを切断するための活性なＡＰを濃縮するために、選択ラウンドを繰り返し実施する。

本明細書において提示される実施形態のいずれかでは、ＮＴＡＡの切断試薬のＮＴＡＡへの動員は、キメラ切断酵素およびキメラＮＴＡＡ修飾因子によって増強することができ、ここで、キメラ切断酵素およびキメラＮＴＡＡ修飾因子は、それぞれ、互いと密接結合反応することが可能な部分を含む（例えば、ビオチン−ストレプトアビジン）（図３９を参照されたい）。例えば、ＮＴＡＡをビオチン−ＰＩＴＣで修飾し、キメラ切断酵素（ストレプトアビジン−エドマナーゼ）を修飾されたＮＴＡＡにストレプトアビジン−ビオチン相互作用によって動員し、それにより切断酵素の親和性および効率を改善することができる。修飾されたＮＴＡＡが切断され、付随する切断酵素と共にペプチドから発散する。キメラエドマナーゼの例では、この手法により、親和性Ｋ_ＤがμＭからサブピコモルまで有効に増大する。記録タグと相互作用する切断剤上のＤＮＡタグを使用した係留により、同様の切断の増強も実現することができる（図４４を参照されたい）。

ＮＴＡＡの切断のための代替として、ジペプチジルアミノペプチダーゼ（ＤＡＰ）を使用して、最後の２つのＮ末端アミノ酸をペプチドから切断することができる。ある特定の実施形態では、単一のＮＴＡＡを切断することができる（図４５を参照されたい）：図４５は、ブテラーゼＩペプチド基板のＮ末端ライゲーションによりＴＥＶエンドペプチダーゼ基板をペプチドのＮ末端に付着させる、Ｎ末端分解のための手法を示す。付着後、ＴＥＶエンドペプチダーゼにより、新しくライゲーションされたペプチドが照会ペプチド（配列決定を受けているペプチド）から切断され、ＮＴＡＡに付着した単一のアスパラギン（Ｎ）が残る。Ｎ末端から２つのアミノ酸を切断するＤＡＰと一緒にインキュベートすることにより、元のＮＴＡＡの最終的な除去がもたらされる。このプロセス全体をＮ末端分解プロセスとして周期的に繰り返すことができる。

ＣＴＡＡ結合性物質に関する実施形態に関しては、ＣＴＡＡをペプチドから切断する方法も当技術分野で公知である。例えば、米国特許第６，０４６，０５３号には、ペプチドまたはタンパク質をアルキル酸無水物と反応させて、カルボキシ末端をオキサゾロンに変換させ、酸およびアルコールまたはエステルを用いた反応によってＣ末端アミノ酸を遊離させる方法が開示されている。ＣＴＡＡの酵素的切断はまた、カルボキシペプチダーゼによっても実現することができる。いくつかのカルボキシペプチダーゼは、アミノ酸の優先性を示し、例えば、カルボキシペプチダーゼＢは、アルギニンおよびリシンなどの塩基性アミノ酸において優先的に切断する。上記の通り、カルボキシペプチダーゼをアミノペプチダーゼと同じように改変して、Ｃ末端標識を有するＣＴＡＡに特異的に結合するカルボキシペプチダーゼを工学的に作製することもできる。このように、カルボキシペプチダーゼは、Ｃ末端から一度に単一のアミノ酸のみを切断し、分解サイクルの制御を可能にする。一部の実施形態では、改変カルボキシペプチダーゼは、アミノ酸残基同一性に関しては非選択的であるが、Ｃ末端標識については選択的である。他の実施形態では、改変カルボキシペプチダーゼは、アミノ酸残基同一性およびＣ末端標識の両方に関して選択的である。
ＸＩＩ．伸長記録タグ、伸長コーディングタグ、またはジタグの処理および解析

目的の巨大分子（複数可）を表す伸長記録タグ、伸長コーディングタグ、およびジタグライブラリーを、種々の核酸配列決定法を使用して処理および解析することができる。配列決定法の例としては、これだけに限定されないが、連鎖停止配列決定（サンガー配列決定）；合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、およびパイロシーケンシングなどの次世代シーケンシング法；および単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、ＤＩ（ｄｕｐｌｅｘｉｎｔｅｒｒｕｐｔｅｄ）シーケンシング、および先端顕微鏡を使用したＤＮＡのダイレクトイメージングなどの第３世代シーケンシング法が挙げられる。

伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーを様々なやり方で増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに、例えば、ＰＣＲまたはエマルジョンＰＣＲによって指数関数的な増幅を行うことができる。エマルジョンＰＣＲにより、より均一な増幅がもたらされることが公知である（Ｈｏｒｉ、Ｆｕｋａｎｏら、２００７年）。あるいは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに、例えば、Ｔ７ＲＮＡポリメラーゼを使用した鋳型ＤＮＡのｉｎｖｉｔｒｏ転写によって線形増幅を行うことができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、それに含有されるユニバーサルフォワードプライミング部位およびユニバーサルリバースプライミング部位に適合するプライマーを使用して増幅することができる。伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーは、伸長記録タグ、伸長コーディングタグ、またはジタグの５’末端、３’末端または両末端のいずれかに配列を付加するための尾部を有するプライマーを使用して増幅することもできる。伸長記録タグ、伸長コーディングタグ、またはジタグの末端に付加することができる配列としては、多数のライブラリーを単一の配列決定の実行に多重化することを可能にするライブラリー特異的指数配列、アダプター配列、読み取りプライマー配列、または、配列決定プラットフォームに適合する、伸長記録タグ、伸長コーディングタグ、もしくはジタグのライブラリーを作出するための任意の他の配列が挙げられる。次世代シーケンシングのための調製におけるライブラリー増幅の例は以下の通りである：ビーズ（約１０ｎｇ）約１ｍｇから溶出した伸長記録タグライブラリー、２００ｕＭのｄＮＴＰ、１μＭの各フォワードおよびリバース増幅プライマー、０．５μｌ（１Ｕ）のＰｈｕｓｉｏｎＨｏｔＳｔａｒｔ酵素（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を使用してＰＣＲ反応体積２０μｌをセットアップし、以下のサイクル条件に供す：９８℃で３０秒、その後、９８℃で１０秒、６０℃で３０秒、７２℃で３０秒を２０サイクル、その後、７２℃で７分、次いで、４℃で保持。

ある特定の実施形態では、増幅前、増幅中または増幅後のいずれかにおいて、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーに標的濃縮を行うことができる。標的濃縮は、配列決定前に、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーから、目的の巨大分子を表す伸長記録タグを選択的に捕捉または増幅するために使用することができる。タンパク質配列に対する標的濃縮は、費用が高く、また、標的タンパク質に対して高度に特異的な結合性物質を作製することが難しいので、困難である。抗体は、非特異的であり、何千ものタンパク質にわたる規模生産が難しいことが周知である。本開示の方法では、タンパク質コードを核酸コードに変換し、次いで、ＤＮＡライブラリーに利用可能な広範囲の標的化ＤＮＡ濃縮戦略を使用することによってこの問題を回避する。目的のペプチドを、それらの対応する伸長記録タグを濃縮することによって試料中で濃縮することができる。標的化濃縮の方法が当技術分野で公知であり、それらとして、ハイブリッド捕捉アッセイ、ＰＣＲに基づくアッセイ、例えば、ＴｒｕＳｅｑｃｕｓｔｏｍＡｍｐｌｉｃｏｎ（Ｉｌｌｕｍｉｎａ）、ｐａｄｌｏｃｋプローブ（分子反転プローブとも称される）などが挙げられる（それぞれ、その全体が参照により本明細書に組み込まれる、Ｍａｍａｎｏｖａら、２０１０年、ＮａｔｕｒｅＭｅｔｈｏｄｓ、７巻：１１１〜１１８頁；Ｂｏｄｉら、Ｊ．Ｂｉｏｍｏｌ．Ｔｅｃｈ．、２０１３年、２４巻：７３〜８６頁；Ｂａｌｌｅｓｔｅｒら、２０１６年、ＥｘｐｅｒｔＲｅｖｉｅｗｏｆＭｏｌｅｃｕｌａｒＤｉａｇｎｏｓｔｉｃｓ、３５７〜３７２頁；Ｍｅｒｔｅｓら、２０１１年、ＢｒｉｅｆＦｕｎｃｔ．Ｇｅｎｏｍｉｃｓ、１０巻：３７４〜３８６頁；Ｎｉｌｓｓｏｎら、１９９４年、Ｓｃｉｅｎｃｅ、２６５巻：２０８５〜８頁を参照されたい）。

一実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーをハイブリッド捕捉に基づくアッセイによって濃縮する（例えば、図１７Ａおよび図１７Ｂを参照されたい）。ハイブリッド−捕捉に基づくアッセイでは、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーを、アフィニティータグ（例えば、ビオチン）で標識した標的特異的オリゴヌクレオチドまたは「ベイトオリゴヌクレオチド」とハイブリダイズさせる。標的特異的オリゴヌクレオチドとハイブリダイズさせた伸長記録タグ、伸長コーディングタグ、またはジタグを、親和性リガンド（例えば、ストレプトアビジンでコーティングしたビーズ）を使用してそれらの親和性タグを介して「プルダウン」し、バックグラウンド（非特異的な）伸長記録タグを洗い流す（例えば、図１７を参照されたい）。次いで、濃縮された伸長記録タグ、伸長コーディングタグ、またはジタグを正の濃縮のために得る（例えば、ビーズから溶出する）。

アレイに基づく「ｉｎｓｉｔｕ」オリゴヌクレオチド合成およびその後のオリゴヌクレオチドプールの増幅によって合成されたベイトオリゴヌクレオチドに関しては、所与のオリゴヌクレオチドアレイ内でユニバーサルプライマーのいくつかのセットを使用することにより、競合するベイトを工学的に操作してプールにすることができる。それぞれの型のユニバーサルプライマーについて、ビオチン化プライマーと非ビオチン化プライマーの比により、濃縮比を制御する。いくつかのプライマー型の使用により、いくつかの濃縮比を設計して最終的なオリゴヌクレオチドベイトプールにすることができる。

ベイトオリゴヌクレオチドを目的の巨大分子を表す伸長記録タグ、伸長コーディングタグ、またはジタグと相補的になるように設計することができる。伸長記録タグ、伸長コーディングタグ、またはジタグ内のスペーサー配列に対するベイトオリゴヌクレオチドの相補性の程度は、０％から１００％まで、およびその間の任意の整数にすることができる。このパラメーターは、少しの濃縮実験によって容易に最適化することができる。一部の実施形態では、コーディングタグ設計においてエンコーダー配列に対するスペーサーの長さを最小化する、または、スペーサーを、ベイト配列とのハイブリダイゼーションに利用できないように設計する。１つの手法は、補助因子の存在下で二次構造を形成するスペーサーを使用することである。そのような二次構造の例は、互いの上に積み重なった２つまたはそれよりも多くのグアニンカルテットによって形成される構造である、Ｇ−４重鎖である（Ｂｏｃｈｍａｎ、Ｐａｅｓｃｈｋｅら、２０１２年）。グアニンカルテットは、フーグスティーン水素結合によって結びついた４つのグアニン塩基によって形成される平面正方形構造である。Ｇ−４重鎖構造は、カチオン、例えば、Ｋ＋イオン対Ｌｉ＋イオンの存在下で安定化される。

使用するベイトオリゴヌクレオチドの数を最小限にするために、各タンパク質に由来する比較的一意のペプチドのセットをバイオインフォマティクスにより識別することができ、目的のペプチドの対応する伸長記録タグライブラリー表示と相補的なベイトオリゴヌクレオチドのみをハイブリッド捕捉アッセイに使用する。同じまたは異なるベイトセットを用いて逐次的なラウンドまたは濃縮を行うこともできる。

その断片（例えば、ペプチド）を表す伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリー中の巨大分子（例えば、タンパク質またはポリペプチド）の全長を濃縮するために、「タイルド」ベイトオリゴヌクレオチドをタンパク質の核酸表示全体にわたって設計することができる。

別の実施形態では、プライマー伸長およびライゲーションに基づき媒介される増幅濃縮（ＡｍｐｌｉＳｅｑ、ＰＣＲ、ＴｒｕＳｅｑＴＳＣＡなど）を使用して、巨大分子のサブセットを表すライブラリーエレメントを選択し、モジュール画分を濃縮することができる。競合するオリゴを使用して、プライマー伸長、ライゲーション、または増幅の程度を調整することもできる。最も単純な実行では、これは、ユニバーサルプライマー尾部を含む標的特異的プライマーと５’ユニバーサルプライマー尾部を欠く競合プライマーの混合物によって実現することができる。最初のプライマー伸長の後、５’ユニバーサルプライマー配列を有するプライマーのみを増幅することができる。ユニバーサルプライマー配列を有するプライマーとユニバーサルプライマー配列を有さないプライマーの比により、増幅する標的の分率を制御する。他の実施形態では、ハイブリダイズするが伸長しないプライマーを含めることを使用して、プライマー伸長、ライゲーション、または増幅を受けるライブラリーエレメントの分率をモジュレートすることができる。

配列決定前に伸長記録タグ、伸長コーディングタグ、またはジタグをライブラリーから選択的に除去するために標的化濃縮法を負の選択形式で使用することもできる。したがって、ビオチン化ベイトオリゴヌクレオチドおよびストレプトアビジンでコーティングしたビーズを使用する上記の例において、上清を配列決定のために保持する一方で、ビーズに結合したベイト−オリゴヌクレオチド：伸長記録タグ、伸長コーディングタグ、またはジタグハイブリッドは解析しない。除去することができる望ましくない伸長記録タグ、伸長コーディングタグ、またはジタグの例は、豊富な巨大分子種、例えば、タンパク質、アルブミン、免疫グロブリンなどを表すものである。

標的とハイブリダイズするがビオチン部分を欠く競合オリゴヌクレオチドベイトをハイブリッド捕捉ステップに使用して、濃縮しようとする任意の特定の遺伝子座の分率をモジュレートすることもできる。競合オリゴヌクレオチドベイトは、標的とのハイブリダイゼーションについて、濃縮中の標的プルダウンの分率を有効にモジュレートする標準のビオチン化ベイトと競合する（図１７）。特にアルブミンなどの過度に豊富な種に関して、この競合的な抑制手法を使用することで１０桁のタンパク質発現のダイナミックレンジを何桁か圧縮することができる。したがって、所与の遺伝子座に関して、標準のハイブリッド捕捉に対する捕捉されるライブラリーエレメントの分率を１００％から０％濃縮までモジュレートすることができる。

さらに、ライブラリー正規化技法を使用して、過度に豊富な種を伸長記録タグ、伸長コーディングタグ、またはジタグライブラリーから除去することができる。この手法は、トリプシン、ＬｙｓＣ、ＧｌｕＣなどの部位特異的プロテアーゼ消化によって生成されたペプチドを起源とする定義された長さのライブラリーに対して最良に機能する。一実施例では、正規化は、二本鎖ライブラリーを変性させ、ライブラリーエレメントを再アニーリングさせることによって実現することができる。豊富なライブラリーエレメントは、２分子ハイブリダイゼーションカイネティクスの二次速度定数に起因して、豊富さがより低いエレメントよりも迅速に再アニーリングする（Ｂｏｃｈｍａｎ、Ｐａｅｓｃｈｋｅら、２０１２年）。ヒドロキシアパタイトカラムでのクロマトグラフィー（ＶａｎｄｅｒＮｏｏｔら、２０１２年、Ｂｉｏｔｅｃｈｎｉｑｕｅｓ、５３巻：３７３〜３８０頁）またはライブラリーを、ｄｓＤＮＡライブラリーエレメントを破壊するタラバガニ由来の２重鎖特異的ヌクレアーゼ（ＤＳＮ）で処理すること（Ｓｈａｇｉｎら、２００２年、ＧｅｎｏｍｅＲｅｓ．、１２巻：１９３５〜４２頁）などの当技術分野で公知の方法を使用して、ｓｓＤＮＡライブラリーエレメントを豊富なｄｓＤＮＡライブラリーエレメントから分離することができる。

固体支持体に付着させる前の巨大分子および／または得られた伸長記録タグライブラリーの分画、濃縮、およびサブトラクション方法の任意の組合せにより、配列決定読み取りを節約し、豊富さが低い種の測定を改善することができる。

一部の実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグのライブラリーをライゲーションまたは末端相補的ＰＣＲによって連鎖状にして、それぞれ多数の異なる伸長記録タグ、伸長コーディングタグ、またはジタグを含む長いＤＮＡ分子を創出する（それぞれ、その全体が参照により組み込まれる、Ｄｕら、２００３年、ＢｉｏＴｅｃｈｎｉｑｕｅｓ、３５巻：６６〜７２頁；Ｍｕｅｃｋｅら、２００８年、Ｓｔｒｕｃｔｕｒｅ、１６巻：８３７〜８４１頁；米国特許第５，８３４，２５２号）。この実施形態は、長鎖のＤＮＡをナノポアシーケンシングデバイスによって解析するナノポアシーケンシングに好ましい。

一部の実施形態では、伸長記録タグ、伸長コーディングタグ、またはジタグに対して直接単一分子解析を実施する（例えば、Ｈａｒｒｉｓら、２００８年、Ｓｃｉｅｎｃｅ、３２０巻：１０６〜１０９頁を参照されたい）。伸長記録タグ、伸長コーディングタグ、またはジタグを、フローセル表面（任意選択でマイクロセルパターン）へのローディングに適合するフローセルまたはビーズなどの固体支持体上で直接解析することができ、ここで、フローセルまたはビーズは、単一分子シーケンサーまたは単一分子脱コーディング計器に組み込むことができる。単一分子脱コーディングに関しては、プールした蛍光標識した脱コーディングオリゴヌクレオチドの数ラウンドのハイブリダイゼーション（Ｇｕｎｄｅｒｓｏｎら、２００４年、ＧｅｎｏｍｅＲｅｓ．、１４巻：９７０〜７頁）を使用して、伸長記録タグ内のコーディングタグの同一性および順序の両方を確認することができる。コーディングタグの結合の順序をデコンボリューションするために、結合性物質を上記のサイクル特異的コーディングタグで標識することができる（Ｇｕｎｄｅｒｓｏｎら、２００４年、ＧｅｎｏｍｅＲｅｓ．、１４巻：９７０〜７頁も参照されたい）。サイクル特異的コーディングタグは、単一の巨大分子を表す単一の連鎖状の伸長記録タグ、または単一の巨大分子を表す伸長記録タグの集合のどちらに対しても機能する。

伸長レポータータグ、伸長コーディングタグ、またはジタグライブラリーの配列決定後、得られた配列をそれらのＵＭＩにより崩壊させ、次いで、それらの対応する巨大分子（例えば、ペプチド、タンパク質、タンパク質複合体）に付随させ、細胞内の巨大分子型全体（例えば、ペプチド、ポリペプチド、タンパク質巨大分子についてのプロテオーム）とアラインメントすることができる。得られた配列をそれらのコンパートメントタグにより崩壊させ、特定の実施形態では、単一のタンパク質分子のみまたは非常に限られた数のタンパク質分子を含有する、それらの対応するコンパートメントのプロテオームに付随させることもできる。タンパク質の識別および数量化はどちらも、このデジタルペプチド情報から容易に引き出すことができる。

一部の実施形態では、コーディングタグ配列を特定の配列決定解析プラットフォームに対して最適化することができる。特定の実施形態では、配列決定プラットフォームは、ナノポアシーケンシングである。一部の実施形態では、配列決定プラットフォームの塩基当たりのエラー率は、＞５％、＞１０％、＞１５％、＞２０％、＞２５％、または＞３０％である。例えば、ナノポアシーケンシング装置を使用して伸長記録タグを解析する場合、バーコード配列（例えば、エンコーダー配列）を、ナノポアを通過時に最適に電気的に区別可能になるように設計することができる。本明細書に記載の方法に従ったペプチド配列決定は、ナノポアシーケンシングの一塩基正確度はまだ幾分低いが（７５％〜８５％）、「エンコーダー配列」の決定は、はるかにより正確であるはずである（＞９９％）ことを考慮すると、ナノポアシーケンシングによく適し得る。さらに、ＤＩ（ｄｕｐｌｅｘｉｎｔｅｒｒｕｐｔｅｄ）ナノポアシーケンシングと称される技法を、システム設計を著しく単純化する分子モーターを必要とせずに、ナノポア鎖シーケンシングと共に使用することができる（Ｄｅｒｒｉｎｇｔｏｎ、Ｂｕｔｌｅｒら、２０１０年）。ＤＩナノポアシーケンシングによる伸長記録タグの読み取りには、連鎖状の伸長記録タグライブラリー内のスペーサーエレメントを相補的なオリゴヌクレオチドとアニーリングする必要がある。本明細書で使用されるオリゴヌクレオチドは、得られる２重鎖の有効なＴｍを上昇させるために、ＬＮＡ、または他の改変された核酸または類似体を含んでよい。これらの２重鎖スペーサー領域で装飾された一本鎖伸長記録タグがポアを通過するに従い、２本鎖領域が狭窄域で一過性にストールし、それにより、２重鎖領域に隣接する約３塩基の電流読み取りが可能になる。特定の実施形態では、ＤＩナノポアシーケンシングのために、エンコーダー配列を、スペーサーエレメントに隣接する３塩基により最大限に電気的に区別可能なナノポアシグナルが生じるように設計する（Ｄｅｒｒｉｎｇｔｏｎら、２０１０年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ、１０７巻：１６０６０〜５頁）。モーターフリーＤＩシーケンシングの代替として、スペーサーエレメントを、ナノポアを通過するに従い、伸長記録タグ、伸長コーディングタグ、またはジタグを一過性にストールし、それにより、隣接するエンコーダー配列の読み取りを可能にするＧ−カルテットなどの二次構造をとるように設計することができる（Ｓｈｉｍ、Ｔａｎら、２００９年、Ｚｈａｎｇ、Ｚｈａｎｇら、２０１６年）。ストールを過ぎて進んだ後、次のスペーサーにより一過性のストールが創出され、それにより、次のエンコーダー配列の読み取りが可能になる、などである。

本明細書に開示されている方法は、複数の巨大分子（例えば、ペプチド）の同時（多重化）検出、定量化および／または配列決定を含めた解析のために使用することができる。多重化とは、本明細書で使用される場合、複数の巨大分子を同じアッセイで解析することを指す。複数の巨大分子は、同じ試料に由来するものであってもよく、異なる試料に由来するものであってもよい。複数の巨大分子は、同じ対象に由来するものであってもよく、異なる対象に由来するものであってもよい。解析される複数の巨大分子は、異なる巨大分子（例えば、ペプチド）であってもよく、異なる試料に由来する同じ巨大分子（例えば、ペプチド）であってもよい。複数の巨大分子は、２またはそれよりも多くの巨大分子、５またはそれよりも多くの巨大分子、１０またはそれよりも多くの巨大分子、５０またはそれよりも多くの巨大分子、１００またはそれよりも多くの巨大分子、５００またはそれよりも多くの巨大分子、１０００またはそれよりも多くの巨大分子、５，０００またはそれよりも多くの巨大分子、１０，０００またはそれよりも多くの巨大分子、５０，０００またはそれよりも多くの巨大分子、１００，０００またはそれよりも多くの巨大分子、５００，０００またはそれよりも多くの巨大分子、または１，０００，０００またはそれよりも多くの巨大分子を含む。

試料多重化は、記録タグで標識された巨大分子試料を予めバーコーディングすることによって実現することができる。各バーコードは異なる試料を表し、試料を周期的結合アッセイまたは配列解析前にプールすることができる。このように、多くのバーコードで標識した試料を単一のチューブ内で同時に処理することができる。この手法は、逆相タンパク質アレイ（ＲＰＰＡ）で実施するイムノアッセイに対する有意な改善である（Ａｋｂａｎｉ、Ｂｅｃｋｅｒら、２０１４年、ＣｒｅｉｇｈｔｏｎおよびＨｕａｎｇ、２０１５年、ＮｉｓｈｉｚｕｋａおよびＭｉｌｌｓ、２０１６年）。このように、本開示は、基本的に、単純なワークフローを用いるＲＰＰＡアッセイの代わりに、多重化された高度にデジタルの試料および分析物を提供する。
ＸＩＩＩ．ＮＴＡＡの認識、記録タグ伸長、およびＮＴＡＡの切断の周期的ラウンドによる巨大分子の特徴付け

ある特定の実施形態では、本開示において提示される巨大分子を解析するための方法は、多数の結合サイクルを有し、ここで、巨大分子を複数の結合性物質と接触させ、連続的な結合性物質の結合により、履歴的な結合情報が核酸に基づくコーディングタグの形態で少なくとも１つの巨大分子に付随する記録タグに移行する。このように、多数の結合事象に関する情報を含有する履歴的記録を核酸形式で生成する。

Ｎ末端分解に基づく手法を使用してペプチド巨大分子を解析する方法に関する実施形態では、（図３、図４、図４１、および図４２を参照されたい）、第１の結合性物質をｎアミノ酸のペプチドのｎＮＴＡＡに接触させ、結合させ、第１の結合性物質のコーディングタグ情報をペプチドに付随する記録タグに移行させ、それにより、一次伸長記録タグを生成した後、ｎＮＴＡＡを本明細書に記載の通り切断する。ｎＮＴＡＡの切断により、ペプチドのｎ−１アミノ酸がＮ末端アミノ酸に変わり、これは、本明細書ではｎ−１ＮＴＡＡと称される。本明細書に記載の通り、ｎＮＴＡＡは、任意選択で、部分（例えば、ＰＴＣ、ＤＮＰ、ＳＮＰ、アセチル、アミジニルなど）で標識することができ、これは、標識された形態のＮＴＡＡに結合するように工学的に操作された切断酵素と併せて特に有用である。ｎＮＴＡＡを標識した場合、次いで、ｎ−１ＮＴＡＡも同じ部分を用いて標識する。第２の結合性物質をペプチドと接触させ、ｎ−１ＮＴＡＡに結合させ、第２の結合性物質のコーディングタグ情報を一次伸長記録タグに移行させ、それにより、二次伸長記録タグ（例えば、ペプチドを表す連鎖状のｎ次伸長記録タグを生成するため）または異なる記録タグ（例えば、ペプチドを集合的に表す多数の伸長記録タグを生成するため）を生成する。ｎ−１ＮＴＡＡの切断により、ペプチドのｎ−２アミノ酸がＮ末端アミノ酸に変わり、これは、本明細書ではｎ−２ＮＴＡＡと称される。追加的な結合、移行、切断、および任意選択でＮＴＡＡ標識を、上記の通り、最大ｎアミノ酸まで行って、ペプチドを集合的に表す、ｎ次伸長記録タグまたはｎ個の別々の伸長記録タグを生成することができる。本明細書で使用される場合、ｎ「次」とは、結合性物質、コーディングタグ、または伸長記録タグに関して使用される場合、結合性物質およびそれに付随するコーディングタグを使用することができるｎ回の結合サイクル、または、伸長記録タグを創出するｎ回の結合サイクルを指す。

一部の実施形態では、第１の結合性物質および第２の結合性物質、ならびに任意選択で任意のさらなる結合性物質（例えば、第３の結合性物質、第４の結合性物質、第５の結合性物質など）の巨大分子への接触を同時に実施する。例えば、第１の結合性物質および第２の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質を、例えば結合性物質のライブラリーを形成するために、一緒にプールすることができる。別の例では、第１の結合性物質および第２の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質を、一緒にプールするのではなく、巨大分子に同時に添加する。一実施形態では、結合性物質のライブラリーは、２０種の標準の天然に存在するアミノ酸に選択的に結合する少なくとも２０種の結合性物質を含む。

他の実施形態では、第１の結合性物質および第２の結合性物質、ならびに任意選択で任意のさらなる次数の結合性物質をそれぞれ別々の結合サイクルで巨大分子をと接触させ、逐次的に添加する。ある特定の実施形態では、多数の結合性物質を同時に使用することが好ましく、その理由は、並行手法により時間が節約されるから、および、結合性物質が競合状態になり、それにより、同類結合性物質が結合する部位への非同類結合性物質による非特異的結合が低減するからである。

本明細書に記載の方法によって生成される最終的な伸長記録タグの長さは、コーディングタグ（例えば、エンコーダー配列およびスペーサー）の長さ、記録タグ（例えば、一意の分子識別子、スペーサー、ユニバーサルプライミング部位、バーコード）の長さ、実施される結合サイクルの数、および各結合サイクルからのコーディングタグが同じ伸長記録タグに移行されるか多数の伸長記録タグに移行されるかを含めた多数の因子に依存する。ペプチドを表し、エドマン分解様切断方法によって作製される連鎖状の伸長記録タグの例では、コーディングタグが、両側に５塩基のスペーサーが隣接する５塩基のエンコーダー配列を有する場合、ペプチドの結合性物質履歴を示す最終的な伸長記録タグ上のコーディングタグ情報は、１０塩基×エドマン分解サイクルの数になる。２０サイクルの実行に関しては、伸長記録は、少なくとも２００塩基である（最初の記録タグ配列は含めない）。この長さは、標準の次世代シーケンシング計器に適合する。

最終的な結合サイクルおよび最終的な結合性物質のコーディングタグ情報の伸長記録タグへの移行の後、記録タグに、ユニバーサルリバースプライミング部位をライゲーション、プライマー伸長または当技術分野で公知の他の方法によって付加することによってキャップ形成することができる。一部の実施形態では、記録タグ内のユニバーサルフォワードプライミング部位は最終的な伸長記録タグに付属するユニバーサルリバースプライミング部位に適合する。一部の実施形態では、ユニバーサルリバースプライミング部位は、ＩｌｌｕｍｉｎａＰ７プライマー（５’−ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡＧＡＴ−３’−配列番号１３４）またはＩｌｌｕｍｉｎａＰ５プライマー（５’−ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡ−３’−配列番号１３３）である。記録タグの鎖のセンスに応じてセンスまたはアンチセンスＰ７を付属させることができる。伸長記録タグライブラリーを固体支持体（例えば、ビーズ）からから直接切断または増幅し、従来の次世代シーケンシングアッセイおよびプロトコールに使用することができる。

一部の実施形態では、プライマー伸長反応を一本鎖伸長記録タグのライブラリーに対して実施して、その相補鎖をコピーする。

ＮＧＰＳペプチドシーケンシングアッセイは、いくつかの化学的ステップおよび酵素的ステップを周期的進行で含む。ＮＧＰＳシーケンシングは単一分子であるという事実により、いくつかの重要な利点がプロセスに付与される。単一分子アッセイの第１の重要な利点は、種々の周期的化学的／酵素的ステップにおける非能率に対する頑強性である。これは、コーディングタグ配列内に存在するサイクル特異的バーコードを使用することによって可能になる。

サイクル特異的コーディングタグを使用して、各サイクルからの情報を追跡する。これは単一分子シーケンシング手法であるので、配列決定プロセスの各結合／移行サイクルにおける７０％の効率でさえ、マッピング可能な配列情報を生成するために十分すぎるほどである。例として、１０塩基ペプチド配列「ＣＰＶＱＬＷＶＤＳＴ」（配列番号１６９）は、我々の配列プラットフォームでは「ＣＰＸＱＸＷＸＤＸＴ」（配列番号１７０）と読み取られる可能性がある（Ｘ＝任意のアミノ酸；アミノ酸の存在はサイクル数追跡によって推定される）。この部分的なアミノ酸配列読み取りは、ＢＬＡＳＴＰを使用してそれをヒトｐ５３タンパク質に一意的にマッピングし戻すために十分すぎるほどである。そのように、我々のプロセスはいずれも完全にロバストにする必要はない。さらに、サイクル特異的バーコードを我々の分配概念と組み合わせれば、どのペプチドのセットが元のタンパク質分子にマッピングされるかが（コンパートメントバーコードによって）わかるので、１０カ所の位置のうちの数アミノ酸を識別するだけでタンパク質の絶対的な識別を実現することができる。

ＸＩＶ．分画、区画化、および結合能が限定された樹脂によるタンパク質正規化

プロテオミクス解析の重要な問題の１つは、試料中のタンパク質の豊富さの大きなダイナミックレンジに取り組むことである。タンパク質は、血漿中で１０桁を超えるダイナミックレンジにわたる（「上位２０種」が枯渇した血漿でさえ）。ある特定の実施形態では、解析前に、試料からのある特定のタンパク質種（例えば、極めて豊富なタンパク質）のサブトラクションを実施する。これは、例えば、上位２０種の血漿タンパク質を枯渇させるＳｉｇｍａのＰＲＯＴ２０免疫枯渇キットなどの市販のタンパク質枯渇試薬を使用して実現することができる。さらに、ダイナミックレンジを管理可能な３〜４桁までさらに著しく低下させる手法をとることが有用であると思われる。ある特定の実施形態では、タンパク質試料のダイナミックレンジは、電気泳動および液体クロマトグラフィーを含めた標準の分画法を使用してタンパク質試料を分画するか（Ｚｈｏｕ、Ｎｉｎｇら、２０１２年）、または、画分を、限られた能力のタンパク質結合性ビーズ／樹脂（例えば、ヒドロキシル化シリカ粒子）をローディングしたコンパートメント（例えば、液滴）に分配し（ＭｃＣｏｒｍｉｃｋ、１９８９年）、結合したタンパク質を溶出することによってモジュレートすることができる。各区画化された画分中の過剰なタンパク質を洗い流す。

電気泳動による方法の例としては、キャピラリー電気泳動（ＣＥ）、キャピラリー等電点電気泳動（ＣＩＥＦ）、キャピラリー等速電気泳動（ＣＩＴＰ）、フリーフロー電気泳動、ゲル溶出分画液相封入電気泳動（ＧＥＬＦｒＥＥ）が挙げられる。液体クロマトグラフィータンパク質の分離方法の例としては、逆相（ＲＰ）、イオン交換（ＩＥ）、サイズ排除（ＳＥ）、親水性相互作用などが挙げられる。コンパートメント分配の例としては、エマルジョン、液滴、マイクロウェル、平らな基板上の物理的に分離された領域などが挙げられる。例示的なタンパク質結合性ビーズ／樹脂としては、フェノール基またはヒドロキシル基で誘導体化されたシリカナノ粒子（例えば、ＳｔｒａｔａＣｌｅａｎＲｅｓｉｎ（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ製）、ＲａｐｉｄＣｌｅａｎ（ＬａｂＴｅｃｈ製）など）が挙げられる。ビーズ／樹脂の結合能を限定することにより、所与の画分中に溶出する高度に豊富なタンパク質は部分的にビーズに結合するだけになり、過剰なタンパク質は除去される。
ＸＶ．単一の細胞のプロテオームの分配または分子サブサンプリング

別の態様では、本開示は、バーコーディングおよび分配技法を使用して試料中のタンパク質を大規模並列解析するための方法を提供する。タンパク質解析の現行の手法は、タンパク質巨大分子をペプチド配列決定に適した短いペプチド分子に断片化することを伴う。したがって、そのような手法を使用して得られる情報は、断片化ステップによって限定され、例えば、翻訳後修飾、各試料中に存在するタンパク質間相互作用、試料中に存在するタンパク質集団の組成、または特定の細胞または細胞の集団に由来するなどのタンパク質巨大分子の起源を含めたタンパク質の広範な連続した情報は排除される。タンパク質分子内の翻訳後修飾に関する広範な情報（例えば、プロテオフォーム特徴付け）により、より徹底的な生物学的像がもたらされ、どのペプチドがどのタンパク質分子に属するかに関する広範な情報により、ペプチド配列の、基礎をなすタンパク質配列へのよりロバストなマッピングがもたらされる（図１５Ａを参照されたい）。これは、ペプチド配列決定技術によりたった５種のアミノ酸型からの情報などの不完全なアミノ酸配列情報がもたらされる場合に特に関連する。本明細書に開示されている分配方法を使用することにより、同じタンパク質分子に由来するいくつものペプチドからの情報と組み合わせて、タンパク質分子の同一性（例えば、プロテオフォーム）をより正確に評価することができる。コンパートメントタグを同じコンパートメント（複数可）に由来するタンパク質およびペプチドに付随させることにより、分子および細胞情報の再構成が容易になる。典型的なプロテオーム解析では、細胞を溶解させ、タンパク質を短いペプチドに消化し、それにより、どのタンパク質がどの細胞または細胞型に由来するか、およびどのペプチドがどのタンパク質またはタンパク質複合体に由来するかに関する全体的な情報が破壊される。この全体的な情報は、細胞および組織内の生物学および生化学を理解するために重要である。

分配とは、試料内の巨大分子の集団に由来する巨大分子の亜集団への一意のバーコードのランダムな割り当てを指す。分配は、巨大分子をコンパートメントに区分することによって実現することができる。分配は、単一のコンパートメント内の巨大分子で構成されるものであってもよく、コンパートメントの集団に由来する多数のコンパートメント内の巨大分子で構成されるものであってもよい。

複数（例えば、数百万〜数十億）のコンパートメントから同じ物理的コンパートメントまたはコンパートメントの群に、またはそれにおいて分離された巨大分子のサブセットまたはタンパク質試料のサブセットを一意のコンパートメントタグによって識別する。したがって、コンパートメントタグを使用して、同じコンパートメントタグを有する１つまたは複数のコンパートメントに由来する構成物と、異なるコンパートメントタグを有する別のコンパートメント（またはコンパートメントの群）内の構成物を、これらの構成物が一緒にプールされた後であっても区別することができる。

本開示は、複雑なプロテオーム試料（例えば、複数のタンパク質複合体、タンパク質、またはポリペプチド）または複雑な細胞試料を複数のコンパートメントに分配することによってタンパク質解析を増強する方法であって、各コンパートメントが、個々のコンパートメント内では同じであり（任意選択のＵＭＩ配列は除いて）、他のコンパートメントのコンパートメントタグとは異なる複数のコンパートメントタグを含む、方法を提供する（図１８〜２０を参照されたい）。コンパートメントは、任意選択で、複数のコンパートメントタグが接合した固体支持体（例えば、ビーズ）を含む。複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のペプチドに断片化し、次いで、それを複数のコンパートメントタグと、複数のコンパートメント内で複数のペプチドと複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きペプチドを生成する。あるいは、複数のタンパク質複合体、タンパク質、またはポリペプチドに、複数のコンパートメントタグを、複数のタンパク質複合体、タンパク質またはポリペプチドと複数のコンパートメント内の複数のコンパートメントタグのアニーリングまたは接合を可能にするために十分な条件下で接合し、それにより、複数のコンパートメントタグ付きタンパク質複合体、タンパク質、ポリペプチドを生成する。次いで、コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントから収集し、任意選択で複数のコンパートメントタグ付きペプチドに断片化する。１つまたは複数のコンパートメントタグ付きペプチドを本明細書に記載の方法のいずれかに従って解析する。

ある特定の実施形態では、コンパートメントタグ情報を巨大分子に付随する記録タグ（例えば、ペプチド）にプライマー伸長（図５）またはライゲーション（図６）によって移行させる。

一部の実施形態では、コンパートメントタグは、コンパートメント内で溶液中に遊離している。他の実施形態では、コンパートメントタグをコンパートメントの表面（例えば、マイクロタイタープレートもしくはピコタイタープレートのウェルの底）またはビーズもしくはコンパートメント内のビーズに直接接合させる。

コンパートメントは、水性コンパートメント（例えば、マイクロ流体液滴）であっても固体コンパートメントであってもよい。固体コンパートメントとしては、例えば、ナノ粒子、マイクロスフェア、マイクロタイターウェルもしくはピコタイターウェル、またはアレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、もしくはニトロセルロースに基づくポリマー表面上の分離された領域が挙げられる。ある特定の実施形態では、各コンパートメントは、平均して、単一の細胞を含有する。

固体支持体は、これだけに限定されないが、ビーズ、マイクロビーズ、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フローセル、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアを含めた任意の支持体表面であってよい。固体支持体用の材料としては、これだけに限定されないが、アクリルアミド、アガロース、セルロース、ニトロセルロース、ガラス、金、石英、ポリスチレン、ポリエチレン酢酸ビニル、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、テフロン（登録商標）、フルオロカーボン、ナイロン、シリコンゴム、ポリ酸無水物、ポリグリコール酸、ポリ乳酸、ポリオルトエステル、官能化シラン、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、ポリアミノ酸、またはそれらの任意の組合せが挙げられる。ある特定の実施形態では、固体支持体は、ビーズ、例えば、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである。

コンパートメントタグを付けたビーズを伴うコンパートメントに試料を分配する種々の方法は、Ｓｈｅｍｂｅｋａｒらにより概説されている（Ｓｈｅｍｂｅｋａｒ、Ｃｈａｉｐａｎら、２０１６年）。一実施例では、プロテオームをエマルジョンにより液滴中に分配して、タンパク質分子およびタンパク質複合体に関する全体的な情報を本明細書に開示されている方法を使用して記録することを可能にする（例えば、図１８および図１９を参照されたい）。ある特定の実施形態では、プロテオームをコンパートメント（例えば、液滴）に、コンパートメントタグを付けたビーズ、活性化可能なプロテアーゼ（直接または間接的に熱、光などによって）、およびプロテアーゼ抵抗性になるように工学的に操作された（例えば、修飾リシン、ペグ化など）ペプチドリガーゼと一緒に分配する。ある特定の実施形態では、プロテオームを変性剤で処理して、タンパク質またはポリペプチドのペプチド構成物を評価することができる。タンパク質のネイティブな状態に関する情報が望まれる場合、相互作用するタンパク質複合体を、それに由来するペプチドのその後の分析のためにコンパートメントに分配することができる。

コンパートメントタグは、任意選択で片側または両側にスペーサーまたはユニバーサルプライマー配列が隣接するバーコードを含む。プライマー配列は、記録タグの３’配列に対して相補的であってよく、それにより、プライマー伸長反応によるコンパートメントタグ情報の記録タグへの移行が可能になる（図２２Ａ〜Ｂを参照されたい）。バーコードは、固体支持体もしくはコンパートメントに付着した一本鎖核酸分子または固体支持体もしくはコンパートメントとハイブリダイズしたその相補配列、または両方の鎖で構成されるものであってよい（例えば、図１６を参照されたい）。コンパートメントタグは、ペプチドとのカップリングのための、例えばスペーサーに付着した、機能的部分を含んでよい。一実施例では、機能的部分（例えば、アルデヒド）は、複数のペプチド上のＮ末端アミノ酸残基と反応することが可能である。別の例では、機能的部分は、複数のペプチド上の内部アミノ酸残基（例えば、リシンまたは「クリック」反応性部分で標識されたリシン）と反応することが可能である。別の実施形態では、機能的部分は、単に、ＤＮＡタグで標識されたタンパク質とハイブリダイズすることが可能な相補ＤＮＡ配列であってよい。あるいは、コンパートメントタグは、コンパートメントタグの目的のペプチドへのライゲーションを可能にするために、タンパク質リガーゼ（例えば、ブテラーゼＩまたはそのホモログ）の認識配列を含むペプチドをさらに含むキメラ分子であってよい（図２２Ａを参照されたい）。コンパートメントタグは、より大きな核酸分子内の成分であってよく、当該核酸分子は、それに接合したペプチドに関する識別情報をもたらすための一意の分子識別子、スペーサー配列、ユニバーサルプライミング部位、またはそれらの任意の組合せを任意選択でさらに含む。このＵＭＩ配列は、一般に、コンパートメント内のコンパートメントタグの集団の間で異なる。ある特定の実施形態では、コンパートメントタグは、記録タグ内の成分であり、したがって、個々のコンパートメント情報をもたらすために使用する同じタグを、それが付着したペプチドに関する個々のペプチド情報を記録するためにも使用する。

ある特定の実施形態では、コンパートメントタグは、コンパートメントタグをコンパートメントにプリント、スポッティング、インク噴射することによって形成することができる。ある特定の実施形態では、複数のコンパートメントタグを付けたビーズであって、ビーズ当たり１つのバーコード型が存在するビーズを、Ｋｌｅｉｎら、２０１５年、Ｃｅｌｌ、１６１巻：１１８７〜１２０１頁；Ｍａｃｏｓｋｏら、２０１５年、Ｃｅｌｌ、１６１巻：１２０２〜１２１４頁；およびＦａｎら、２０１５年、Ｓｃｉｅｎｃｅ、３４７巻：１２５８３６７頁に記載されている通り、スプリット・アンド・プール（ｓｐｌｉｔ−ａｎｄ−ｐｏｏｌ）オリゴヌクレオチドライゲーションまたは合成によって形成する。コンパートメントタグを付けたビーズは、個々の合成または固定化によって形成することもできる。ある特定の実施形態では、コンパートメントタグを付けたビーズは、一方の部分が記録タグを含むコンパートメントタグを含み、他方の部分が消化されたペプチドをカップリングすることができる機能的部分を含む二機能性記録タグをさらに含む（図１９および図２０）。

ある特定の実施形態では、複数のコンパートメント内の複数のタンパク質またはポリペプチドを、プロテアーゼを用いて複数のペプチドに断片化する。プロテアーゼは、メタロプロテアーゼであってよい。ある特定の実施形態では、メタロプロテアーゼの活性が金属カチオンの光活性化放出によってモジュレートされる。使用することができるエンドペプチダーゼの例としては、トリプシン、キモトリプシン、エラスターゼ、サーモリシン、ペプシン、クロストリパン、グルタミルエンドペプチダーゼ（ＧｌｕＣ）、エンドペプチダーゼＡｒｇＣ、ペプチジル−ａｓｐメタロ−エンドペプチダーゼ（ＡｓｐＮ）、エンドペプチダーゼＬｙｓＣおよびエンドペプチダーゼＬｙｓＮが挙げられる。それらの活性化の形式は、緩衝液および二価カチオンの必要性に応じて変動する。任意選択で、タンパク質またはポリペプチドをペプチド断片に十分に消化した後、プロテアーゼを不活性化する（例えば、熱、フルオロ油またはシリコーン油可溶性阻害剤、例えば、二価カチオンキレート化剤など）。

コンパートメントタグを用いたペプチドバーコーディングのある特定の実施形態では、タンパク質分子（任意選択で、変性ポリペプチド）を、ＤＮＡタグを用いて、ＤＮＡタグをタンパク質のリシン基のε−アミン部分とのコンジュゲーションによって、またはアルキンなどの反応性クリック部分で予め標識したタンパク質／ポリペプチドに付着させるクリックケミストリーによって間接的に標識する（図２Ｂおよび図２０Ａを参照されたい）。次いで、ＤＮＡタグで標識したポリペプチドを、コンパートメントタグ（例えば、液滴内に含有されるビーズに結合したＤＮＡバーコード）を含むコンパートメントに分配し（図２０Ｂを参照されたい）、ここで、コンパートメントタグは、各コンパートメントを識別するバーコードを含有する。一実施形態では、ビーズに付随する単一のタンパク質／ポリペプチド分子と単一の種のＤＮＡバーコードを共封入する（図２０Ｂを参照されたい）。別の実施形態では、ＰＣＴ公開第ＷＯ２０１６／０６１５１７号（その全体が参照により組み込まれる）に記載されているものと、ＤＮＡではなくタンパク質に適用されること以外は同様に、コンパートメントは、付着したコンパートメント（ビーズ）タグと共にビーズの表面を構成し得る。コンパートメントタグは、バーコード（ＢＣ）配列、ユニバーサルプライミング部位（Ｕ１’）、ＵＭＩ配列、およびスペーサー配列（Ｓｐ）を含んでよい。一実施形態では、分配と同時にまたはその後に、コンパートメントタグをビーズから切断し、ポリペプチドに付着したＤＮＡタグと、例えば、それぞれＤＮＡタグおよびコンパートメントタグ上の相補的なＵ１配列およびＵ１’配列を介してハイブリダイズさせる。ビーズへの分配に関しては、ＤＮＡタグで標識したタンパク質をビーズ表面上のコンパートメントタグと直接ハイブリダイズさせることができる（図２０Ｃを参照されたい）。このハイブリダイゼーションステップ後、ＤＮＡタグとハイブリダイズしたポリペプチドをコンパートメントから抽出し（例えば、エマルジョン「分解」、またはビーズからのコンパートメントタグの切断）、ポリメラーゼに基づくプライマー伸長ステップを使用して、バーコードおよびＵＭＩ情報をポリペプチド上のＤＮＡタグに書き込んでコンパートメントバーコードが付された記録タグをもたらす（図２０Ｄを参照されたい）。ポリペプチドを、Ｃ末端リシンにおいてユニバーサルプライミング配列を含有する記録タグ、コンパートメントタグ、およびＵＭＩで標識されたペプチドに切断するために、ＬｙｓＣプロテアーゼ消化を使用することができる（図２０Ｅを参照されたい）。一実施形態では、ＬｙｓＣプロテアーゼを、ＤＮＡタグが付されたリシン残基が許容されるように工学的に操作する。得られる記録タグで標識されたペプチドを、固体基板（例えば、ビーズ）に、記録タグが付されたペプチド間の分子間相互作用を最小限にするために適した密度で固定化する（図２０Ｅおよび２０Ｆを参照されたい）。

ペプチドのコンパートメントタグへの付着（または逆もまた同じ）は、固定化されたコンパートメントタグへの直接付着であってもよく、その相補配列（二本鎖の場合）への付着であってもよい。あるいは、コンパートメントタグを固体支持体またはコンパートメントの表面から引き離し、ペプチドおよび液相コンパートメントタグをコンパートメント内に接合させることができる。一実施形態では、コンパートメントタグ（例えば、オリゴヌクレオチドの末端）上の機能的部分は、ペプチドのＮ末端のアミンにシッフ塩基を通じて直接カップリングしたアルデヒドである（図１６を参照されたい）。別の実施形態では、コンパートメントタグを、タンパク質リガーゼに対するペプチドモチーフ（ｎ−Ｘ・・・ＸＸＣＧＳＨＶ−ｃ）を含む核酸−ペプチドキメラ分子として構築する。核酸−ペプチドコンパートメントタグ構築物を、消化されたペプチドと、ブテラーゼＩまたはそのホモログなどのペプチドリガーゼを使用してコンジュゲートする。ブテラーゼＩ、および他のアスパラギニルエンドペプチダーゼ（ＡＥＰ）相同体を使用して、オリゴヌクレオチド−ペプチドコンパートメントタグ構築物のＣ末端と消化されたペプチドのＮ末端をライゲーションすることができる（Ｎｇｕｙｅｎ、Ｗａｎｇら、２０１４年、Ｎｇｕｙｅｎ、Ｃａｏら、２０１５年）。この反応は、速く、高度に効率的である。得られたコンパートメントタグ付きペプチドを、その後、本明細書に記載の核酸ペプチド解析のために固体支持体に固定化することができる。

ある特定の実施形態では、コンパートメントタグと複数の断片化されたペプチドを接合させる前に、固体支持体またはコンパートメントの表面に接合しているコンパートメントタグを放出させる（図１８を参照されたい）。一部の実施形態では、コンパートメントタグ付きペプチドを複数のコンパートメントから収集した後、コンパートメントタグ付きペプチドを、記録タグを伴って固体支持体に接合する。次いで、コンパートメントタグ情報をコンパートメントタグ付きペプチド上のコンパートメントタグから付随する記録タグに移行させることができる（例えば、記録タグおよびコンパートメントタグ内の相補的なスペーサー配列からプライミングされるプライマー伸長反応によって）。一部の実施形態では、次いで、本明細書に記載の方法に従ったペプチド解析の前に、コンパートメントタグをコンパートメントタグ付きペプチドから除去する。さらなる実施形態では、最初に複数のタンパク質を消化するために使用した配列特異的プロテアーゼ（例えば、ＥｎｄｏＡｓｐＮ）を、コンパートメントタグ情報を付随する記録タグに移行した後、ペプチドのＮ末端からのコンパートメントタグの除去にも使用する（図２２Ｂを参照されたい）。

コンパートメントに基づく分配のための手法は、Ｔジャンクションおよびフローフォーカシング、撹拌または小さな穴を有する膜（例えば、エッチング飛跡膜）を通じた押出しを使用したエマルジョン生成などを使用するマイクロ流体デバイスによる液滴形成などを含む（図２１を参照されたい）。区画化に伴う問題は、コンパートメントの内部の取扱いである。ある特定の実施形態では、コンパートメント内で一連の異なる生化学的ステップを行うことは、流体成分の交換が困難であるので、難しい場合がある。以前に記載されている通り、液滴内部の限られた特徴、例えば、ｐＨ、キレート化剤、還元剤などは、エマルジョンのフルオロ油に試薬を添加することによって改変することができる。しかし、水性相と有機相両方の溶解性を有する化合物の数は限られている。１つの手法は、コンパートメント内の反応を、基本的に目的の分子へのバーコードの移行に限定することである。

タンパク質／ペプチドをコンパートメントタグ（バーコード）で構成される記録タグで標識した後、タンパク質／ペプチドを、固体支持体に、結合した同類結合性物質のコーディングタグから結合したペプチドまたはタンパク質分子に付着した対応する記録タグ／タグへの情報の分子内移行を有利にするために適した密度で固定化する。分子間情報移行は、固体支持体の表面上の分子の分子間間隔を制御することによって最小化される。

ある特定の実施形態では、コンパートメントタグは、コンパートメントの集団内の各コンパートメントに対して一意である必要はない。コンパートメントの集団内のコンパートメントのサブセット（２つ、３つ、４つ、またはそれよりも多く）は、同じコンパートメントタグを共有してよい。例えば、各コンパートメントは、試料から巨大分子の亜集団を捕捉するように作用するビーズ表面の集団で構成されてよい（ビーズ当たり多くの分子が捕捉される）。さらに、ビーズは、捕捉される巨大分子に付着させることができるコンパートメントバーコードを含む。各ビーズは、単一のコンパートメントバーコード配列のみを含むが、このコンパートメントバーコードは、コンパートメント内の他のビーズ上で複製され得る（多くのビーズが同じバーコードにマッピングされる）。物理的コンパートメントとコンパートメントバーコードの間で多対１のマッピングをなすことができ（必要ではないが）、さらに、コンパートメント内の巨大分子間で多対１のマッピングをなすことができる（必要ではないが）。分配バーコードは、試料内の巨大分子の集団から巨大分子をサブサンプリングするための一意のバーコードの割り当てと定義される。この分配バーコードは、同じバーコードで標識されたコンパートメント内の巨大分子の分配から生じる同一のコンパートメントバーコードで構成されてよい。物理的コンパートメントの使用により、元の試料が有効にサブサンプリングされて、分配バーコードの割り当てがもたらされる。例えば、１０，０００種の異なるコンパートメントバーコードで標識されたビーズのセットがもたらされる。さらに、所与のアッセイにおいて、ビーズ百万個の集団をアッセイに使用されると仮定する。平均で、コンパートメントバーコード当たり１００個のビーズが存在する（ポアソン分布）。さらに、ビーズにより巨大分子１千万個の凝集体が捕捉されると仮定する。平均で、ビーズ当たり１０個の巨大分子が存在し、コンパートメントバーコード当たりのコンパートメントは１００個であり、分配バーコード（１００個の別個の物理的コンパートメント当たり１００個のコンパートメントバーコードで構成される）当たり有効に１０００個の巨大分子が存在する。

別の実施形態では、ポリペプチドの単一分子分配および分配バーコーディングは、ポリペプチドを、Ｎ末端またはＣ末端またはその両方において、増幅可能なＤＮＡＵＭＩタグ（例えば、記録タグ）を用いて標識すること（化学的にまたは酵素的に）によって実現される（図３７を参照されたい）。ＤＮＡタグをポリペプチドのボディ（内部アミノ酸）に非特異的な光標識または図２Ｂにおいて例示されている通りリシンなどの反応性アミノ酸への特異的な化学的付着によって付着させる。ペプチドの末端に付着させた記録タグからの情報をＤＮＡタグに酵素的エマルジョンＰＣＲ（Ｗｉｌｌｉａｍｓ、Ｐｅｉｓａｊｏｖｉｃｈら、２００６年、Ｓｃｈｕｔｚｅ、Ｒｕｂｅｌｔら、２０１１年）またはエマルジョンｉｎｖｉｔｒｏ転写／逆転写（ＩＶＴ／ＲＴ）ステップによって移行させる。好ましい実施形態では、ナノエマルジョンを使用し、その結果、平均して、５０ｎｍ〜１０００ｎｍのサイズのエマルジョン液滴当たり単一のポリペプチド未満が存在するようにする（Ｎｉｓｈｉｋａｗａ、Ｓｕｎａｍｉら、２０１２年、Ｇｕｐｔａ、Ｅｒａｌら、２０１６年）。さらに、プライマー、ｄＮＴＰ、Ｍｇ２＋、ポリメラーゼ、およびＰＣＲ緩衝液を含めたＰＣＲの全ての成分を水性エマルジョン混合物に含める。ＩＶＴ／ＲＴを使用する場合には、記録タグを、Ｔ７／ＳＰ６ＲＮＡポリメラーゼプロモーター配列を用い、ポリペプチドのボディに付着したＤＮＡタグにハイブリダイズする転写物が生成されるように設計する（Ｒｙｃｋｅｌｙｎｃｋ、Ｂａｕｄｒｅｙら、２０１５年）。逆転写酵素（ＲＴ）により、ハイブリダイズしたＲＮＡ分子からＤＮＡタグに情報がコピーされる。このように、エマルジョンＰＣＲまたはＩＶＴ／ＲＴを使用して、末端記録タグからポリペプチドのボディに付着させた多数のＤＮＡタグに情報を有効に移行させることができる。

細胞内容物のビーズへのゲル化による封入は、単一の細胞を解析するために有用な手法である（ＴａｍｍｉｎｅｎおよびＶｉｒｔａ２０１５、Ｓｐｅｎｃｅｒ、Ｔａｍｍｉｎｅｎら、２０１６年）。単一の細胞液滴のバーコーディングにより、単一の細胞に由来する成分を全て同じ識別子で標識することが可能になる（Ｋｌｅｉｎ、Ｍａｚｕｔｉｓら、２０１５年、Ｇｕｎｄｅｒｓｏｎ、Ｓｔｅｅｍｅｒｓら、２０１６年、Ｚｉｌｉｏｎｉｓ、Ｎａｉｎｙｓら、２０１７年）。コンパートメントバーコーディングは、一意のバーコードを、各液滴に、液滴接合によって（Ｒａｉｎｄａｎｃｅ）、バーコードが付されたビーズを液滴に導入することによって（１０× Ｇｅｎｏｍｉｃｓ）、または、その全体が参照により組み込まれる、Ｇｕｎｄｅｒｓｏｎら（Ｇｕｎｄｅｒｓｏｎ、Ｓｔｅｅｍｅｒｓら、２０１６年）およびＰＣＴ公開第ＷＯ２０１６／１３０７０４号に記載されている通り、封入およびゲル化後にスプリット・プール（ｓｐｌｉｔ−ｐｏｏｌ）コンビナトリアルバーコーディングを使用して液滴の成分をコンビナトリアルバーコーディングすることによって、直接組み入れることを含めた、いくつものやり方で実現することができる。Ａｄｅｙら（Ｖｉｔａｋ、Ｔｏｒｋｅｎｃｚｙら、２０１７年）に記載されている通り、同様のコンビナトリアル標識スキームを核にも適用することができる。

上記の液滴バーコーディング手法は、ＤＮＡ解析には使用されているが、タンパク質解析には使用されていない。上記の液滴バーコーディングプラットフォームをタンパク質を用いた研究に適合させるには、いくつかの革新的なステップが必要である。まず第１は、バーコードは主にＤＮＡ配列で構成され、このＤＮＡ配列情報をタンパク質分析物に付与する必要があることである。ＤＮＡ分析物の場合では、ＤＮＡ情報をＤＮＡ分析物に移行させることは比較的簡単である。対照的に、ＤＮＡ情報をタンパク質に移行させることは、特に、下流の解析のためにタンパク質を変性させ、消化してペプチドにする場合には、より困難である。これにより、各ペプチドをコンパートメントバーコードで標識することが必要になる。問題は、細胞が液滴に封入されたら、タンパク質を変性させ、得られたポリペプチドをプロテアーゼ消化し、同時にペプチドをＤＮＡバーコードで標識するのが難しいことである。細胞をポリマー形成液滴に封入し、それらを重合（ゲル化）して、水性緩衝液にすることができる多孔質ビーズにすることにより、液滴中の細胞とは異なり、多数の異なる反応ステップを実施するためのビヒクルがもたらされる（ＴａｍｍｉｎｅｎおよびＶｉｒｔａ、２０１５年、Ｓｐｅｎｃｅｒ、Ｔａｍｍｉｎｅｎら、２０１６年）（Ｇｕｎｄｅｒｓｏｎ、Ｓｔｅｅｍｅｒｓら、２０１６年）。封入されたタンパク質がその後ゲルビーズから拡散することを防止するために、封入されたタンパク質をゲルマトリックスと架橋結合させることが好ましい。このゲルビーズ形式により、ゲル中に閉じ込められたタンパク質を化学的にまたは酵素的に変性させ、ＤＮＡタグで標識し、プロテアーゼ消化し、いくつもの他の介入に供すことが可能になる。図３８は、例示的な単一の細胞のゲルマトリックスへの封入および溶解を示す。
ＸＶＩ．組織および単一の細胞の空間的プロテオミクス

バーコードの別の使用は、空間的に分布したＤＮＡバーコード配列のアレイ表面上での組織の空間的分割である。組織タンパク質を、アレイ表面に乗せた細胞組織内のタンパク質の空間的位置を反映するバーコードを含むＤＮＡ記録タグで標識すれば、Ｓｔａｈｌら（２０１６年、Ｓｃｉｅｎｃｅ、３５３巻（６２９４号）：７８〜８２頁）およびＣｒｏｓｅｔｔｏら（Ｃｏｒｓｅｔｔｏ、Ｂｉｅｎｋｏら、２０１５年）に記載されている空間的トランスクリプトームと同様に、組織スライス内のタンパク質分析物の空間的分布を配列解析後に再構築することができる。空間バーコードの付着は、アレイに結合させたバーコードをアレイから放出させ、それらを組織切片中に拡散させることによって実現することができる、あるいは、組織切片中のタンパク質をＤＮＡ記録タグで標識し、次いで、タンパク質をプロテアーゼで消化して、拡散し、アレイ上の空間バーコードとハイブリダイズする標識されたペプチドを放出させることができる。次いで、バーコード情報をペプチドに付着させた記録タグに移行させることができる（酵素的にまたは化学的に）。

組織内のタンパク質の空間的バーコーディングは、ＤＮＡ記録タグで化学的に標識された、固定／透過処理した組織スライスを、空間的にコードされたＤＮＡアレイであって、アレイ上の各特徴が空間的に識別可能なバーコードを有する、ＤＮＡアレイに置くことによって実現することができる（図２３を参照されたい）。アレイバーコードをＤＮＡタグに付着させるために、組織スライスをプロテアーゼで消化し、それにより、拡散し、組織スライスに隣接する近位のアレイ特徴にハイブリダイズすることができるＤＮＡタグで標識されたペプチドを放出させることができる。アレイバーコード情報は、化学的／酵素的ライゲーションまたはポリメラーゼ伸長によってＤＮＡタグに移行させることができる。あるいは、標識されたペプチドをアレイ表面に拡散させる代わりに、アレイ上のバーコード配列を切断し、組織スライス上の近位の領域に拡散させ、その中のＤＮＡタグで標識されたタンパク質にハイブリダイズさせることができる。再度、バーコーディング情報は、化学的／酵素的ライゲーションまたはポリメラーゼ伸長によって移行させることができる。この第２の場合には、バーコード情報の移行後にプロテアーゼ消化を実施することができる。いずれの手法の結果も、記録タグで標識されたタンパク質またはペプチドの収集であり、ここで、記録タグは、元の組織内のタンパク質／ペプチドの位置に関する２−Ｄ空間的情報を有するバーコードを含む。さらに、翻訳後修飾の空間的分布を特徴付けることができる。この手法により、感度が高く、高度に多重化されたｉｎｓｉｔｕデジタル免疫組織化学的アッセイがもたらされ、また、現代の分子病理学の基礎が形成され、それによりはるかに正確な診断および予後判定が導かれるはずである。

別の実施形態では、細胞小器官および細胞区画内のタンパク質構成物／ＰＴＭを識別するために、細胞内に空間的バーコーディングを使用することができる（Ｃｈｒｉｓｔｏｆｏｒｏｕら、２０１６年、Ｎａｔ．Ｃｏｍｍｕｎ．、７巻：８９９２頁、その全体が参照により組み込まれる）。近位のタンパク質に付着させることができる細胞内空間バーコードをもたらすために、いくつもの手法を使用することができる。一実施形態では、細胞または組織を構成物細胞小器官中に細胞内分画し、異なるタンパク質細胞小器官画分バーコードを付すことができる。空間的な細胞標識の他の方法は、その全体が参照により組み込まれる、Ｍａｒｘ、２０１５年、ＮａｔＭｅｔｈｏｄｓ、１２巻：８１５〜８１９頁による総説に記載されている；同様の手法を本明細書で使用することができる。

以下の実施例は例示のために提示されるものであり、限定するものではない。

（実施例１）
プロテイナーゼＫによるタンパク質試料の消化
ペプチドのライブラリーを、トリプシン、プロテイナーゼＫなどのプロテアーゼで消化することによりタンパク質試料から調製する。トリプシンは、好ましくは、リシンおよびアルギニンのような正電荷のアミノ酸のＣ末端側を切断するが、プロテイナーゼＫは、タンパク質の全体にわたって非選択的に切断する。そのため、プロテイナーゼＫ消化は、短鎖ペプチド（約３０個のアミノ酸）を生成するのに十分なタンパク質分解を提供するが、試料が過剰消化されないような好ましい酵素対ポリペプチドの比を使用して、注意深くタイトレーションすることが必要である。一般的に、所与のプロテイナーゼＫロット毎に、機能活性のタイトレーションを実施することが必要である。この例では、タンパク質試料を、１×ＰＢＳ／１ｍＭＥＤＴＡ／０．５ｍＭＣａＣｌ_２／０．５％ＳＤＳ（ｐＨ８．０）中で１：１０〜１：１００（ｗ／ｗ）の酵素：タンパク質比にてプロテイナーゼＫを用いて、１時間３７℃にて消化する。インキュベーション後、ＰＭＳＦを、終濃度が５ｍＭになるように添加して、さらなる消化を阻害する。

プロテイナーゼＫの特異的活性は、「化学的基質」ベンゾイルアルギニン−ｐ−ニトロアニリドをプロテイナーゼＫと共にインキュベートし、約４１０ｎｍで吸収を示す黄色ｐ−ニトロアニリン産物の発色を測定することにより、測定することができる。酵素活性は、１単位が毎分１μモルのｐ−ニトロアニリドの産生と等しい単位で測定し、特異的活性は、酵素活性／ｍｇ総タンパク質の単位で測定する。その後、溶液中のタンパク質の総量で酵素活性を除算することにより、特異的活性を算出する。

（実施例２）
ＳＰ３オンビーズプロテアーゼ消化および標識を使用した試料調製
Ｈｕｇｈｅｓら（２０１４年、ＭｏｌＳｙｓｔＢｉｏｌ、１０巻：７５７頁）により記載されているようなＳＰ３試料調製プロトコールを使用して、タンパク質を抽出し、変性させる。抽出した後、タンパク質ミックス（およびビーズ）を、０．０２％ＳＤＳで補完された１ｍＭＥＤＴＡを有する５０ｍＭホウ酸緩衝液（ｐＨ８．０）中で１時間３７℃で溶解した。タンパク質溶解後、ジスルフィド結合を、終濃度が５ｍＭになるようにＤＴＴを添加し、試料を５０℃で１０分間インキュベートすることにより還元する。終濃度が１０ｍＭになるようにヨードアセトアミドを添加することによりシステインをアルキル化し、室温で２０分間、暗所でインキュベートする。反応を、５０ｍＭホウ酸緩衝液で２倍に希釈し、Ｇｌｕ−ＣまたはＬｙｓ−Ｃを、１：５０（ｗ／ｗ）の最終プロテイナーゼ：タンパク質比で添加する。試料を３７℃で一晩（約１６時間）インキュベートして、消化を完了した。Ｈｕｇｈｅｓら（上記）により記載されているように試料を消化した後、８分間のインキュベーション中、アセトニトリルの終濃度が９５％になるように１００％アセトニトリルを添加することによりペプチドをビーズに結合させ、アセトニトリルで洗浄する。洗浄した後、５分間のピペット混合ステップにより、１０μｌの２％ＤＭＳＯ中でビーズからペプチドを溶出する。

（実施例３）
記録タグとペプチドとのカップリング
ＤＮＡ記録タグを、いくつかの方法でペプチドにカップリングする（Ａｓｌａｍら、１９９８年、Ｂｉｏｃｏｎｊｕｇａｔｉｏｎ：ＰｒｏｔｅｉｎＣｏｕｐｌｉｎｇＴｅｃｈｎｉｑｕｅｓｆｏｒｔｈｅＢｉｏｍｅｄｉｃａｌＳｃｉｅｎｃｅｓ，ＭａｃｍｉｌｌａｎＲｅｆｅｒｅｎｃｅＬＴＤ；ＨｅｒｍａｎｓｏｎＧＴ、１９９６年、ＢｉｏｃｏｎｊｕｇａｔｅＴｅｃｈｎｉｑｕｅｓ、ＡｃａｄｅｍｉｃＰｒｅｓｓＩｎｃ．、１９９６年を参照されたい）。１つの手法では、カルボジイミド（ｃａｒｂｄｉｉｍｉｄｅ）化学を使用してペプチドのＣ末端にカップリングされる５’アミン、およびクリック化学を使用してアジドビーズにカップリングされる内部歪みアルキンＤＢＣＯ−ｄＴ（ＧｌｅｎＲｅｓｅａｒｃｈ、ＶＡ）を用いて、オリゴヌクレオチド記録タグを構築する。カルボジイミドカップリングを完了へと駆動し、ペプチド間カップリングを制限するために、大幅に過剰なモル濃度の記録タグを使用して、溶液中で記録タグをペプチドにカップリングする。あるいは、５’歪みアルキン（ＤＢＣＯ−ｄＴ）を用いてオリゴヌクレオチドを構築し、アジド誘導体化ペプチドにカップリングし（ペプチドのＣ末端にカップリングするアジド−ＰＥＧ−アミンおよびカルボジイミドにより）、その後アルデヒド反応性ＨｙＮｉｃヒドラジンビーズにカップリングする。この目的のためには、記録タグオリゴヌクレオチドを、内部アルデヒドホルミルインドール（Ｔｒｉｌｉｎｋ）基で容易に標識することができる。あるいは、Ｃ末端アミンにカップリングするのではなく、その代わりに、記録タグを、内部リシン残基にカップリングしてもよい（好ましくは、Ｌｙｓ−Ｃ消化後、またはその代わりにＧｌｕ−Ｃ消化後）。１つの手法では、これは、ＮＨＳ−アジド（または、ＮＨＳ−ＰＥＧ−アジド）基を用いてリシンアミンを活性化し、その後５’アミン標識記録タグにカップリングすることにより達成することができる。別の手法では、５’アミン標識記録タグを、ＤＳＳなどの過剰なＮＨＳホモ二機能性架橋試薬と反応させて、５’ＮＨＳ活性化記録タグを創出することができる。この５’ＮＨＳ活性化記録タグは、ペプチドのリシン残基のε−アミノ基に直接カップリングすることができる。

（実施例４）
ペプチドのアミノ酸の部位特異的標識
活性化ＤＮＡタグで直接的に（ヘテロ二機能性アミノ酸部位特異的試薬による活性化を使用して）、またはＤＮＡタグの同種クリック部分に付着させるために後に使用されるクリック部分を有するアミノ酸を部位特異的に標識するクリック化学ヘテロ二機能性試薬により間接的に修飾することができる（Ｌｕｎｄｂｌａｄ、２０１４年）タンパク質またはペプチドのアミノ酸の異なる５つの例。典型的なタンパク質入力は、０．１％ＲａｐｉＧｅｓｔ（商標）ＳＦ界面活性剤および５ｍＭＴＣＥＰを含む５０μｌの適切な水性緩衝液中に１μｇのタンパク質を含む。ＲａｐｉＧｅｓｔ（商標）ＳＤは、標識または消化を向上させるためにタンパク質をポリペプチドへと変性させるための酸分解性界面活性剤として有用である。以下のアミノ酸標識戦略を使用することができる：マレイミド化学を使用したシステイン−−−２００μＭのスルホ−ＳＭＣＣ活性化ＤＮＡタグを使用して、システインを、１００ｍＭＭＥＳ緩衝液（ｐＨ６．５）＋１％ＴＸ−１００中で１時間、部位特異的に標識する；ＮＨＳ化学を使用したリシン−−−２００μＭのＤＳＳまたはＢＳ^３活性化ＤＮＡタグを使用して、溶液相タンパク質またはビーズ結合ペプチドのリシンを、室温にて１時間、ホウ酸緩衝液（５０ｍＭ、ｐＨ８．５）＋１％ＴＸ−１００中で部位特異的に標識する；チロシンは、４−フェニル−３Ｈ−１，２，４−トリアゾリン−３，５（４Ｈ）−ジオン（ＰＴＡＤ）で修飾する；またはジアゾニウム化学−−−ジアゾニウム化学の場合、ＤＮＡタグを、ＥＤＣおよび４−カルボキシルベンゼンジアゾニウムテトラフルオロボレート（ＡｉｋｏｎＩｎｔｅｒｎａｔｉｏｎａｌ、Ｃｈｉｎａ）で活性化する。タンパク質またはビーズ結合ペプチドを、ホウ酸緩衝液（５０ｍＭ、ｐＨ８．５）＋１％ＴＸ−１００中で、２００μＭのジアゾニウム誘導体化ＤＮＡタグと共に１時間氷上にてインキュベートすることにより、チロシンとのジアゾ連結を創出する（Ｎｇｕｙｅｎ、Ｃａｏら、２０１５年）。ＥＤＣ化学を使用してアスパラテート／グルタメートを修飾する−−−アミン標識ＤＮＡタグを、ｐＨ６．５のＭＥＳ中でビーズ結合ペプチドおよび１００ｍＭＥＤＣ／５０ｍＭイミダゾールと共に、室温で１時間にわたってインキュベートする（Ｂａｓｌｅら、２０１０年、Ｃｈｅｍ．Ｂｉｏｌ．、１７巻：２１３〜２２７頁）。標識の後、過剰な活性化ＤＮＡタグを、Ｃ４レジンＺｉｐＴｉｐｓ（Ｍｉｌｌｉｐｏｒｅ）からのタンパク結合溶出を使用して除去する。溶出したタンパク質を、１×ＰＢＳ緩衝液で５０μｌにする。

（実施例５）
歪みアルキン記録タグ標識ペプチドのアジド活性化ビーズへの固定化
市販のアミンＤｙｎａｂｅａｄｓ（登録商標）Ｍ−２７０を、アジドＰＥＧＮＨＳエステルヘテロ二機能性リンカー（ＪｅｎＫｅｍＴｅｃｈｎｏｌｏｇｙ、Ｔｘ）と反応させることにより、アジド誘導体化Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ−２７０ビーズを生成する。さらに、メトキシまたはヒドロキシルＰＥＧＮＨＳエステルと適切な比で混合することにより、アジドの表面密度をタイトレーションすることができる。所与のペプチド試料毎に、１〜２ｍｇのアジド誘導体化Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ−２７０ビーズ（約１．３×１０^８個のビーズ）を、１００μｌのホウ酸緩衝液（５０ｍＭホウ酸ナトリウム、ｐＨ８．５）で希釈し、１ｎｇの記録タグペプチドを添加し、２３〜３７℃で１時間インキュベートする。２００μｌのホウ酸緩衝液で３回洗浄する。

（実施例６）
ホルミルインドール反応性ＨｙＮｉｃビーズの創出
アミンビーズのＨｙＮｉｃ誘導体化により、ホルミルインドール反応性ビーズを創出する。２０ｍｇのＤｙｎａｂｅａｄｓ（登録商標）Ｍ−２７０アミンビーズ（２．８μｍ）のアリコートを、２００ｕｌのホウ酸緩衝液に懸濁する。短時間の超音波処理後、１〜２ｍｇのスルホ−Ｓ−ＨｙＮｉｃ（スクシンイミジル６−ヒドラジノニコチネートアセトンヒドラゾン、ＳＡＮＨ）（カタログ＃Ｓ−１００２、Ｓｏｌｕｌｉｎｋ、ＳａｎＤｉｅｇｏ）を添加し、反応混合物を室温で１時間にわたって振とうする。その後、ビーズを、ホウ酸緩衝液で２回およびクエン酸緩衝液（２００ｍＭクエン酸ナトリウム）で１回洗浄する。ビーズを、終濃度が１０ｍｇ／ｍｌになるようにクエン酸緩衝液に懸濁する。

（実施例７）
記録タグホルミルインドール（ｆｏｒｍｌｉｎｄｏｌｅ）標識ペプチドの活性化ビーズへの固定化
１〜２ｍｇのＨｙＮｉｃ活性化Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ−２７０ビーズのアリコート（約１．３×１０^８個ビーズ）を、５０ｍＭアニリンで補完された１００μｌのクエン酸緩衝液で希釈し、約１ｎｇの記録タグペプチドコンジュゲートを添加し、３７℃で１時間にわたってインキュベートする。ビーズを、２００μｌのクエン酸緩衝液で３回洗浄し、１００μｌのホウ酸緩衝液に再懸濁した。

（実施例８）
オリゴヌクレオチドモデル系−コーディングタグの識別情報をサイクル様式で記録タグへと移行させることによる結合性物質履歴の記録
核酸コーディングタグおよび記録タグの場合、標準的核酸酵素学を使用したライゲーションまたはプライマー伸長により、結合されている結合性物質のコーディングタグから近位の記録タグへと、情報を移行させることができる。これは、結合性物質標的を表す５’部分および記録タグを表す３’部分を有するオリゴヌクレオチドで構成される単純なモデル系で実証することができる。オリゴヌクレオチドの内部部位を、ｄＴ−アルキン修飾（ＤＢＣＯ−ｄＴ、ＧｌｅｎＲｅｓｅａｒｃｈ）によるクリック化学を使用して固定化することができる。図２４Ａに示されている例では、固定化されたオリゴヌクレオチド（ＡＢ標的）は、同種オリゴヌクレオチド「結合性物質」であるＡオリゴおよびＢオリゴが結合することができる、ＡおよびＢと標識されている２つの標的結合領域を含む。ＡオリゴおよびＢオリゴヌクレオチドは、共通スペーサー（Ｓｐ）を介して記録タグと相互作用して、プライマー伸長（またはライゲーション）を開始するコーディングタグ（配列および長さが異なる）に連結されている。Ｓｐの長さは、結合性物質結合中の非特異的相互作用を最小限に抑えるために、短く（例えば、６〜９塩基）しておくべきである。この特定の例では、コーディングタグの長さは、「Ａ」オリゴ結合事象（１０塩基エンコーダー配列）と「Ｂ」オリゴ結合事象（２０塩基エンコーダー配列）がゲル解析で容易に区別されるように設計されている。

ＰＡＧＥゲルを単に解析することにより、ＡまたはＢコーディングタグ移行の効率を測定することが可能であり、実験パラメーターの容易な最適化が可能である。ＡＢ標的配列に加えて、ＣおよびＤが、ＡおよびＢと相互作用しない異なるハイブリダイゼーション配列であることを除いて、同様のオリゴヌクレオチドＣＤ標的配列が用いられる（図２４Ｂを参照されたい）。さらに、ＣおよびＤは、それぞれ３０塩基ＤＮＡコードおよび４０塩基ＤＮＡコードを含む、異なる配列および長さのコーディングタグを含む。第２の標的配列ＣＤの目的は、ＡＢおよびＣＤ標的分子間の交差相互作用を評価することである。特定のハイブリダイゼーションを考慮すると、ＡＢ標的に結合されたオリゴに接続されているＡまたはＢコーディングタグ間に分子間交差が生じない限り、ＣＤ標的の伸長記録タグが、ＡまたはＢコーディングタグ情報を含むことはない。同様に、ＡＢ標的の伸長記録タグは、ＣまたはＤコーディングタグ情報を含むはずがない。ＡＢおよびＣＤ標的が物理的近傍に接近している状況では（つまり＜５０ｎｍ）、掛け合い応答が起こる可能性が高い。したがって、表面の標的巨大分子を適切に離間させることが重要である。

このオリゴヌクレオチドモデル系は、結合性物質履歴の記録能力の十分な特徴付けを可能にする。図２５は、プライマー伸長ではなくライゲーションによる情報移行を示す。まずゲルで最適化した後、種々の結合およびアッセイプロトコールを実施し、配列決定により評価する。一意の分子識別子（ＵＭＩ）配列は、計数のために使用され、単一の巨大分子に由来するリードの識別を可能にし、元の試料中の総合的で全体的な巨大分子複雑性の尺度を提供する。例示的な履歴結合プロトコールとしては、Ａ−Ｂ−Ｃ−Ｂ−Ａ、Ａ−Ｂ−Ａ−Ａ−Ｂ−Ａ、Ａ−Ｂ−Ｃ−Ｄ−Ａ−Ｃなどが挙げられる：得られる最終産物は、それぞれ、ＵＭＩ−Ｓｐ−Ａ−Ｓｐ−Ｂ−Ｓｐ−Ｂ−Ｓｐ−Ａ−Ｓｐ＋ＵＭＩ−Ｓｐ−Ｃ−Ｓｐ；ＵＭＩ−Ｓｐ−Ａ−Ｓｐ−Ｂ−Ｓｐ−Ａ−Ｓｐ−Ａ−Ｓｐ−Ｂ−Ｓｐ−Ａ；ＵＭＩ−Ａ−Ｓｐ−Ｂ−Ｓｐ−Ａ＋ＵＭＩ−Ｓｐ−Ｃ−Ｓｐ−Ｄ−Ｓｐ−Ｃ−Ｓｐと読み取られるはずである。この解析の結果は、さらなる最適化を可能にする。

（実施例９）
オリゴヌクレオチド−ペプチドモデル系−コーディングタグの識別情報をサイクル様式で記録タグへと移行させることによる結合性物質履歴の記録
オリゴヌクレオチドモデル系を検証した後、例示的な標的オリゴヌクレオチド配列の５’末端にペプチドエピトープタグをコンジュゲートすることにより、オリゴヌクレオチド系からペプチドモデル系を構築する（図２６Ａおよび２６Ｂ）。例示的なペプチドエピトープタグとしては以下のものが挙げられる：ＦＬＡＧ（ＤＹＫＤＤＤＤＫ）（配列番号１７１）、Ｖ５（ＧＫＰＩＰＮＰＬＬＧＬＤＳＴ）（配列番号１７２）、ｃ−Ｍｙｃ（ＥＱＫＬＩＳＥＥＤＬ）（配列番号１７３）、ＨＡ（ＹＰＹＤＶＰＤＹＡ）（配列番号１７４）、Ｖ５（ＧＫＰＩＰＮＰＬＬＧＬＤＳＴ）（配列番号１７５）、ＳｔｒｅｐＴａｇＩＩ（ＮＷＳＨＰＱＦＥＫ）（配列番号１７６）など。ペプチドエピトープタグをオリゴヌクレオチドにカップリングするための、任意選択のＣｙｓ−Ｓｅｒ−Ｇｌｙリンカーが含まれていてもよい。実施例７のＡＢオリゴヌクレオチド鋳型を、Ａ＿オリゴヌクレオチド−ｃＭｙｃペプチド構築物に取り替え、実施例７のＣＤオリゴヌクレオチド鋳型を、Ｃ＿オリゴヌクレオチド−ＨＡペプチド構築物に取り替える（図２６を参照されたい）。また、Ａ＿オリゴヌクレオチド−ｃＭｙｃペプチド構築物は、ＣＳＧリンカーおよびＮ末端ホスホチロシンを含む。同様に、同種ペプチド結合性物質であるｃＭｙｃ抗体およびＨＡ抗体を、それぞれＢオリゴヌクレオチドコーディングタグおよびＤオリゴヌクレオチドコーディングタグでタグ化する。ホスホチロシン特異的抗体は、別の「Ｅ」コーディングタグでタグ化する。このように、ペプチドモデル系は、オリゴヌクレオチド系と対応しており、オリゴ結合および抗体結合の両方が、このモデル系で試験される。

抗ｃ−ｍｙｃ抗体（２Ｇ８Ｄ５、マウスモノクローナル、ＧｅｎＳｃｒｉｐｔ）、抗ＨＡ抗体（５Ｅ１１Ｄ８、マウスモノクローナル、ＧｅｎＳｃｒｉｐｔ）、ｓｔｒｅｐ−タグＩＩ抗体（５Ａ９Ｆ９、マウスモノクローナル、ＧｅｎＳｃｒｉｐｔ）、または抗ＦＬＡＧ抗体（５ＡＥ８５、マウスモノクローナル、ＧｅｎＳｃｒｉｐｔ）を使用した固定化ＤＮＡペプチド構築物の抗体染色を、０．１〜１μｇ／ｍｌの１×ＰＢＳＴ（ＰＢＳ＋０．１％Ｔｗｅｅｎ２０）を使用して実施する。インキュベーションを、典型的には室温で３０分間実施する。また、１×ＰＢＳＴ中１％のＰＶＰを使用した標準的プレブロッキングおよび染色後洗浄を実施する。抗体脱染色は、高濃度塩（１ＭＮａＣｌ）および低ｐＨ（グリシン、ｐＨ２．５）または高ｐＨ（トリエチルアミン、ｐＨ１１．５）のいずれかで洗浄することにより効果的に達成される。

標的オリゴヌクレオチドは、アジドビーズに付着させるための内部アルキン標識を含み、５’末端は、Ｗｉｌｌｉａｍｓら（２０１０年、ＣｕｒｒＰｒｏｔｏｃＮｕｃｌｅｉｃＡｃｉｄＣｈｅｍ．第４章：４．４１項）に記載されているように、ペプチドのＣ末端システインにＳＭＣＣ媒介性付着させるためのアミノ基を含む。あるいは、標準的カルボジイミドカップリングを、オリゴヌクレオチドおよびペプチドのコンジュゲーション反応に使用する（Ｌｕら、２０１０年、Ｂｉｏｃｏｎｊｕｇ．Ｃｈｅｍ．、２１巻：１８７〜２０２頁）。この場合、過剰なオリゴを使用して、カルボジイミド反応を駆動し、ペプチド間カップリングを最小限に抑える。コンジュゲーション後、ＰＡＧＥゲルから切除し、溶出することにより、最終産物を精製する。

（実施例１０）
ＤＮＡ／ＰＮＡコーディングタグ相補体を記録タグにライゲーションさせることによるコーディングタグ移行
コーディングタグを、ライゲーションにより直接的または間接的のいずれかで記録タグに移行させて、伸長記録タグを生成する。一実行例では、アニーリングされたコーディングタグの相補体を、記録タグにライゲーションさせる（図２５）。このコーディングタグ相補体は、核酸（ＤＮＡまたはＲＮＡ）であってもよく、ペプチド核酸（ＰＮＡ）であってもよく、または成長中の記録タグにライゲーションすることが可能ないくつかの他のコードディング分子であってもよい。ライゲーションは、ＤＮＡおよびＲＮＡの場合、標準的なＡＴＰ依存性およびＮＡＤＨ依存性リガーゼを使用して酵素的であってもよく、またはライゲーションは、ＤＮＡ／ＲＮＡおよび特にペプチド核酸ＰＮＡの両方の場合、化学媒介性であってもよい。

ＤＮＡの酵素的ライゲーションの場合、アニーリングされたコーディングタグは、記録タグの３’ヒドロキシルとライゲーションするために、５’リン酸塩を必要とする。例示的な酵素的ライゲーション条件は、以下の通りである（Ｇｕｎｄｅｒｓｏｎ、Ｈｕａｎｇら、１９９８年）。標準的Ｔ４ＤＮＡライゲーション反応は、５０ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ７．８）、１０ｍＭＭｇＣｌ２、１０ｍＭＤＴＴ、１ｍＭＡＴＰ、５０μｇ／ｍｌＢＳＡ、１００ｍＭＮａＣｌ、０．１％ＴＸ−１００、および２．０Ｕ／μｌＴ４ＤＮＡリガーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を含む。Ｅ．ｃｏｌｉＤＮＡリガーゼ反応は、４０ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ８．０）、１０ｍＭＭｇＣｌ_２、５ｍＭＤＴＴ、０．５ｍＭＮＡＤＨ、５０μｇ／ｍｌＢＳＡ、０．１％ＴＸ−１００、および０．０２５Ｕ／μｌＥ．ｃｏｌｉＤＮＡリガーゼ（Ａｍｅｒｓｈａｍ）を含む。ＴａｑＤＮＡライゲーション反応は、２０ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ７．６）、２５ｍＭ酢酸カリウム、１０ｍＭ酢酸マグネシウム、１０ｍＭＤＴＴ、１ｍＭＮＡＤＨ、５０μｇ／ｍｌＢＳＡ、０．１％ＴｒｉｔｏｎＸ−１００、１０％ＰＥＧ、１００ｍＭＮａＣｌ、および１．０Ｕ／μｌＴａｑＤＮＡリガーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を含む。Ｔ４およびＥ．ｃｏｌｉＤＮＡリガーゼ反応は、室温で１時間にわたって実施し、ＴａｑＤＮＡリガーゼ反応は、４０℃で１時間にわたって実施する。

ＤＮＡ／ＰＮＡコーディングタグ移行の場合、鋳型化ＤＮＡ／ＰＮＡの化学的ライゲーションのいくつかの方法を用いることができる。そうした方法としては、標準的な化学的ライゲーションおよびクリック化学手法が挙げられる。鋳型ＤＮＡライゲーションの例示的な化学的ライゲーション条件は、以下の通りである（Ｇｕｎｄｅｒｓｏｎ、Ｈｕａｎｇら、１９９８年）：鋳型３’リン酸塩リポータータグと５’リン酸塩コーディングタグとのライゲーションは、５０ｍＭ２−［Ｎ−モルホリノ］エタンスルホン酸（ＭＥＳ）（ＫＯＨでｐＨ６．０）、１０ｍＭＭｇＣｌ_２、０．００１％ＳＤＳ、新しく調製した２００ｍＭＥＤＣ、５０ｍＭイミダゾール（ＨＣｌでｐＨ６．０）または５０ｍＭＨＯＢｔ（ＨＣｌでｐＨ６．０）、および３．０〜４．０ＭＴＭＡＣｌ（Ｓｉｇｍａ）を含む反応中で、室温にて１時間以内に生じる。

ＰＮＡの鋳型依存性ライゲーションの例示的な条件としては、ＮＨ_２−ＰＮＡ−ＣＨＯポリマー（例えば、コーディングタグ相補体および伸長記録タグ）のライゲーションが挙げられ、Ｂｒｕｄｎｏら（Ｂｒｕｄｎｏ、Ｂｉｒｎｂａｕｍら、２０１０年）により記載されている。ＰＮＡは、５’アミン等価物および３’アルデヒド等価物を有しており、化学的ライゲーションにより２つの部分がカップリングされてシッフ塩基が創出され、シッフ塩基は、その後シアノ水素化ホウ素ナトリウムで還元される。このカップリングの典型的な反応条件は、以下の通りである：１００ｍＭＴＡＰＳ（ｐＨ８．５）、８０ｍＭＮａＣｌ、および８０ｍＭシアノ水素化ホウ素ナトリウム、室温で６０分間。５’アミノ末端１，２−アミノチオール修飾および３’Ｃ末端チオエステル修飾を含む機能化ＰＮＡを使用する未変性化学的ライゲーションの例示的な条件は、Ｒｏｌｏｆｆら（２０１４年、ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．、１０５０巻：１３１〜１４１頁）により記載されている。また、他のＮ−およびＣ−末端ＰＮＡ部分を、ライゲーションに使用することができる。別の例は、クリック化学を使用したＰＮＡの化学的ライゲーションを含む。Ｐｅｎｇら（２０１０年、ＥｕｒｏｐｅａｎＪ．Ｏｒｇ．Ｃｈｅｍ．、２０１０年：４１９４〜４１９７頁）の手法を使用して、ＰＮＡを、５’アジドおよび３’アルキンで誘導体化し、クリック化学を使用してライゲーションすることができる。「クリック」化学ライゲーションの例示的な反応条件は、１０ｍＭリン酸カリウム緩衝液、１００ｍＭＫＣｌ、５ｍＭＴＨＰＴＡ（ｔｒｉｓ−ヒドロキシプロピルトリゾリル（ｔｒｉｚｏｌｙｌ）アミン）、０．５ｍＭＣｕＳＯ_４、および２．５ｍＭＮａ−アスコルビン酸塩を含む１００μｌの反応ミックス中での、１〜２ｍｇビーズとの鋳型化ＰＮＡ−ＰＮＡである。化学的ライゲーション反応は、室温で１時間インキュベートされる。ＰＮＡライゲーションの他の例示的な方法は、Ｓａｋｕｒａｉら（Ｓａｋｕｒａｉ、Ｓｎｙｄｅｒら、２００５年）により記載されている。

（実施例１１）
ＤＮＡへのＰＮＡ変換
ＰＮＡ鋳型にアニーリングされたＤＮＡオリゴヌクレオチドのクリック化学媒介性重合を使用して、ＰＮＡをＤＮＡへと変換する。ＤＮＡオリゴは、ＤＮＡポリメラーゼにより複製することが可能なヌクレオチド間トリアゾール連結を創出するために、反応性５’アジドおよび３’アルキンを含む（Ｅｌ−Ｓａｇｈｅｅｒら、２０１１年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１０８巻：１１３３８〜１１３４３頁）。ＰＮＡのあらゆる考え得るコーディングタグに相補的なＤＮＡオリゴの完全なセット（１０ｎＭ、１×ハイブリダイゼーション緩衝液中：１０ｍＭＮａ−ホウ酸塩（ｐＨ８．５）、０．２ＭＮａＣｌ）を、固相に結合されているＰＮＡ分子と共に３０分間インキュベートする（２３〜５０℃）。アニーリングの後、固相に結合されているＰＮＡ−ＤＮＡ構築物を、アスコルビン酸ナトリウム緩衝液（１０ｍＭアスコルビン酸ナトリウム、２００ｍＭＮａＣｌ）で１回洗浄する。「クリック化学」反応条件は、以下の通りである：ビーズ上のＰＮＡ−ＤＮＡを、新たなアスコルビン酸ナトリウム緩衝液中でインキュベートし、１０ｍＭＴＨＰＴＡ＋２ｍＭＣｕＳＯ_４のミックスと１：１で組み合わせて、室温で１時間インキュベートする。その後、ビーズを、ハイブリダイゼーション緩衝液で１回、およびＰＣＲ緩衝液で２回洗浄する。化学的ライゲーションの後、得られたライゲーションＤＮＡ産物を、Ｅｌ−Ｓａｇｈｅｅｒら（２０１１年、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１０８巻：１１３３８〜１１３４３頁）により記載されているような条件下でＰＣＲにより増幅する。

（実施例１２）
核酸記録およびコーディングタグと適合性の穏やかなＮ末端エドマン分解
Ｎ末端エドマン分解とＤＮＡコーディングとの適合性は、この手法が、ペプチド配列決定で機能することを可能にする。無水ＴＦＡが用いられるＮ末端エドマン分解の標準的条件では、ＤＮＡは破壊される。しかしながら、この効果は、より穏やかな切断条件を開発し、より高い酸耐性を有する修飾ＤＮＡを開発することにより緩和される。Ｎ末端エドマン分解の穏やかな条件を、フェニルチオカルバモイル（ＰＴＣ）−ペプチドの切断を最適化すること、および切断条件下でＤＮＡ／ＰＮＡコード付きライブラリーの安定性を測定することの組合せを使用して開発する。さらに、天然ＤＮＡは、低ｐＨでの脱プリンを低減する７−デアザプリンなどの塩基修飾、および脱ピリミジン化を低減する５’メチル修飾シトシンを使用することにより、酸加水分解に対して安定化させることができる（ＳｃｈｎｅｉｄｅｒおよびＣｈａｉｔ、１９９５年、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．、２３巻：１５７０〜１５７５頁）。チミンが酸断片化に対して最も安定した塩基であることを考慮すると、Ｔ豊富なコーディングタグも有用であり得る。穏やかなＮ末端エドマン分解の条件は、無水ＴＦＡ切断の代わりに、Ｂａｒｒｅｔｔら（その全体が参照により組み込まれる、１９８５年、ＴｅｔｒａｈｅｄｒｏｎＬｅｔｔ．、２６巻：４３７５〜４３７８頁）により記載されているように、アセトニトリル中のトリエチルアミンアセテートを６０℃で使用する穏やかな１０分間の塩基切断を使用することである。こうした穏やかな条件は、ほとんどのタイプのＤＮＡ記録およびコーディングタグと適合性である。代替選択肢として、ＰＮＡは完全に酸安定性であるため、ＰＮＡをコーディングタグに使用する（ＲａｙおよびＮｏｒｄｅｎ、２０００年、ＦＡＳＥＢＪ．、１４巻：１０４１〜１０６０頁）。

ＮＴＡＡ結合物質の同一性をコードするためにＤＮＡコーディングタグ／記録タグを使用することと、穏やかなＮ末端エドマン分解反応を実施することとの適合性を、以下のアッセイを使用して実証する。抗ホスホチロシンおよび抗ｃＭｙｃ抗体の両方を使用して、モデルペプチドを読み取る。単一のエドマン分解ステップを使用した、Ｃ−ＭｙｃおよびＮ末端ホスホチロシン検出、コーディングタグ書き込み、およびＮ末端ホスホチロシンの除去。このステップの後、ペプチドを、抗ホスホチロシンおよび抗ｃＭｙｃ抗体で再び染色する。Ｎ末端分解に対する記録タグの安定性を、ｑＰＣＲにより評価する。ホスホチロシンの効果的な除去は、配列決定、ｑＰＣＲ、またはゲル電気泳動により解析して、最終記録タグ配列にＥ−オリゴヌクレオチドコーディングタグ情報が存在しないことにより示される。

（実施例１３）
コンパートメントタグ付きビーズの調製。

コンパートメントタグ付きビーズを調製するには、ホスホラミダイト合成またはスプリット・アンド・プールライゲーションのいずれかが使用されるスプリット・アンド・プール合成手法を使用して、ビーズに固定化されているオリゴヌクレオチドにバーコードを組み込む。コンパートメントタグは、コンパートメントタグがそれに接合される各ペプチドまたはタンパク質分子を一義的に標識するための一意の分子識別子（ＵＭＩ）をさらに含む。例示的なコンパートメントタグ配列は、以下の通りである：５’−ＮＨ_２−ＧＣＧＣＡＡＴＣＡＧ−ＸＸＸＸＸＸＸＸＸＸＸＸ−ＮＮＮＮＮ−ＴＧＣＡＡＧＧＡＴ−３’（配列番号１７７）。ＸＸＸＸＸＸＸＸＸＸＸＸ（配列番号１７８）バーコード配列は、スプリット−プールオンビーズ合成により生成されるビーズ毎の核酸塩基配列の固定集団であり、この固定配列は、ビーズ毎に異なる。ＮＮＮＮＮ（配列番号１７９）配列は、その後それに接合されるペプチド分子の一意の分子識別子（ＵＭＩ）としての役目を果たすように、ビーズ内で無作為化される。バーコード配列は、Ｍａｃｏｓｋｏら（その全体が参照により組み込まれる、２０１５年、Ｃｅｌｌ、１６１巻：１２０２〜１２１４頁）により記載されているようなスプリット・アンド・プール手法を使用して、ビーズ上で合成することができる。ＵＭＩ配列は、縮重塩基混合物（各カップリングステップに存在する４つのホスホラミダイト塩基すべての混合物）を使用して、オリゴヌクレオチドを合成することにより創出することができる。５’−ＮＨ_２を、スクシンイミジル４−（Ｎ−マレイミドメチル）シクロヘキサン−１−カルボキシレート（ＳＭＣＣ）およびＮ末端からＣ末端への配列「ＣＧＧＳＳＧＳＮＨＶ」（配列番号１８０）を有するシステイン含有ブテラーゼＩペプチド基質で活性化し、Ｗｉｌｌｉａｍｓら（２０１０年、ＣｕｒｒＰｒｏｔｏｃＮｕｃｌｅｉｃＡｃｉｄＣｈｅｍ．第４章：４．４１項）により記載されているような修飾プロトコールを使用して、ＳＭＣＣ活性化コンパートメントタグ付きビーズにカップリングする。すなわち、２００μｌの磁気ビーズ（１０ｍｇ／ｍｌ）を、１．５ｍｌのＥｐｐｅｎｄｏｒｆチューブに入れる。１ｍｌのカップリング緩衝液（５ｍＭＥＤＴＡ、０．０１％Ｔｗｅｅｎ２０、ｐＨ７．４を有する１００ｍＭＫＨ_２ＰＯ_４緩衝液、ｐＨ７．２）をチューブに添加し、短時間ボルテックスする。新たに調製した４０μｌのスルホ−ＳＭＣＣ（ＤＭＳＯ中５０ｍｇ／ｍｌ、ＴｈｅｒｍｏＦｉｓｈｅｒ）を、磁気ビーズに添加し、混合する。反応を、室温にて１時間、ロータリーミキサーでインキュベートする。インキュベーション後、磁石でビーズを上清から分離し、５００μｌのカップリング緩衝液で３回洗浄する。ビーズを、４００μｌのカップリング緩衝液に再懸濁する。１ｍＬのＣＧＧＳＳＧＳＮＨＶ（配列番号１８０）ペプチドを磁気ビーズに添加する（ＴＣＥＰ還元（５ｍＭ）および氷冷アセトン沈殿後、カップリング緩衝液中１ｍｇ／ｍＬ）。反応を、室温にて２時間、ロータリーミキサーでインキュベートする。反応を、カップリング緩衝液で１回洗浄する。４００μｌのクエンチング緩衝液（１０ｍｇ／ｍＬのメルカプトコハク酸、ｐＨ７．４を有する１００ｍＭＫＨ_２ＰＯ_４緩衝液、ｐＨ７．２）を反応混合物に添加し、ロータリーミキサーで２時間インキュベートする。反応混合物を、カップリング緩衝液で３回洗浄する。得られたビーズを、保管緩衝液（０．０２％ＮａＮ_３、０．０１％Ｔｗｅｅｎ２０、ｐＨ７．４を含む１０ｍＭＫＨ_２ＰＯ_４緩衝液、ｐＨ７．２）に再懸濁し、４℃で保管する。

（実施例１４）
封入ビーズおよびタンパク質の生成
コンパートメントタグ付きビーズおよびタンパク質を、エンドプロテアーゼＡｓｐＮ（ＥｎｄｏＡｓｐＮ）などの亜鉛メタロ−エンドペプチダーゼ、任意選択の光ケージ化Ｚｎキレート剤（例えば、ＺｉｎｃＣｌｅａｖＩ）、および遺伝子操作された耐熱性ブテラーゼＩホモログ（Ｂａｎｄａｒａ、Ｋｅｎｎｅｄｙら、２００９年、Ｂａｎｄａｒａ、Ｗａｌｓｈら、２０１１年、Ｃａｏ、Ｎｇｕｙｅｎら、２０１５年）と組み合わせる。実施例１２のコンパートメントタグ付きビーズをタンパク質と混合し、Ｔ字路型マイクロ流体または流動フォーカスデバイス（図２１を参照されたい）で乳化する。二水流構成では、一方の流動中のタンパク質およびＺｎ^２＋を、他方の流動からのメタロ−エンドペプチダーゼと組み合わせて、液滴形成時に直ちに消化を開始させることができる。一流動構成では、すべての試薬を予め混合し、一緒に乳化する。これには、任意選択の光ケージ化Ｚｎキレート剤（例えば、ＺｉｎｃＣｌｅａｖＩ）を使用して、液滴形成後に、ＵＶ光への曝露によりタンパク質消化を開始させることが必要である。濃度および流動条件は、１液滴当たりのビーズが平均で１つ未満になるように調整する。最適化された実験では、１０^８個のフェムト液滴を、液滴の約１０％がビーズを含有する含有率で製作することができる（Ｓｈｉｍら、２０１３年、ＡＣＳＮａｎｏ、７巻：５９５５〜５９６４頁）。一流動手法では、液滴を形成した後、エマルジョンをＵＶ−３６５ｎｍの光に曝露して光ケージ化Ｚｎ^２＋を放出させ、ＥｎｄｏＡｓｐＮプロテアーゼを活性化することにより、プロテアーゼを活性化する。エマルジョンを、３７℃で１時間インキュベートして、タンパク質をペプチドへと消化する。消化した後、エマルジョンを８０℃で１５分間加熱することにより、ＥｎｄｏＡｓｐＮを不活化する。二流動調合では、２つの流動の組み合わせ中に、Ｚｎ^２＋を液滴内に導入する。この場合、ＥｎｄｏＡｓｐＮは、キレート剤がＵＶ光への曝露時に活性化される光活性化Ｚｎ^２＋ケージ分子を使用することにより、または２−アルキルマロン酸もしくはＥＤＴＡ−ＭＯなどの両親媒性Ｚｎ^２＋キレート作用剤を、油相に添加することにより不活化することができる。両親媒性ＥＤＴＡ分子の例としては、ＥＤＴＡ−ＭＯ、ＥＤＴＡ−ＢＯ、ＥＤＴＡ−ＢＰ、ＤＰＴＡ−ＭＯ、ＤＰＴＡ−ＢＯ、ＤＰＴＡ−ＢＰなど（Ｏｊｈａ、Ｓｉｎｇｈら２０１０年、Ｍｏｇｈａｄｄａｍ、ｄｅＣａｍｐｏら２０１２年）が挙げられる。また、エマルジョン油に両親媒性の酸または塩基を添加することにより液滴のｐＨを変更することを含む、他のモダリティを使用して、液滴内部の反応を制御することができる。例えば、液滴ｐＨは、水／油に可溶性である酢酸を使用して低下させることができる。フルオロ−エマルジョンへの酢酸の添加は、酢酸分子が両親媒性の性質を持つため、液滴コンパートメント内のｐＨの低下に結び付く（ＭａｓｈａｇｈｉおよびｖａｎＯｉｊｅｎ、２０１５年、ＳｃｉＲｅｐ、５巻：１１８３７頁）。同様に、塩基であるプロピルアミンを添加すると、液滴内部はアルカリ化される。同様の手法を、油／水に可溶性の酸化還元試薬、還元剤、キレート剤、および触媒などの他のタイプの両親媒性分子に使用することができる。

コンパートメント化されたタンパク質をペプチドへと消化した後、ブテラーゼＩまたは化学的ライゲーション（例えば、アルデヒド−アミノなど）を使用して、ペプチドを、ビーズ上のコンパートメントタグにライゲーションする（オリゴヌクレオチドペプチドバーコードキメラ）（図１６および図２２Ａを参照されたい）。任意選択の手法では、オリゴ−チオデプシペプチド「化学的基質」を用いて、ブテラーゼＩライゲーションを不可逆的にする（Ｎｇｕｙｅｎ、Ｃａｏら、２０１５年）。ライゲーションの後、エマルジョンを「クラック」し、コンパートメントタグ付きペプチド構築物が固定化されているビーズをバルクで収集するか、またはコンパートメント付きペプチドをビーズから切断し、バルクで収集する。コンパートメントタグ付きペプチドが固定化されているビーズが記録タグを含む場合、これらビーズは、本明細書に記載されている核酸コーディングに基づくペプチド解析法に直接使用することができる。対照的に、コンパートメントタグ付きペプチドをビーズ基材から切断した場合、コンパートメントタグ付きペプチドを、コンパートメントタグ付きペプチドのＣ末端へのコンジュゲーションにより記録タグに付随させ、その後、本明細書に記載のように、コーディングタグ付き結合性物質との結合サイクルおよび配列決定解析を行うために、固体支持体に固定化する。記録タグとコンパートメントタグ付きペプチドとの付随は、三機能性リンカー分子を使用して達成することができる。サイクルシーケンシング解析を行うために、付随する記録タグを有するコンパートメントタグ付きペプチドを固体支持体に固定化した後、コンパートメント情報を、プライマー伸長またはライゲーションを使用して、付随する記録タグへと移行させる（図２２Ｂを参照されたい）。コンパートメントタグ情報を記録タグに移行させた後、元のペプチド消化で使用されたものと同じ酵素を使用して、コンパートメントタグをペプチドから切断することができる（図２２Ｂを参照されたい）。これにより、ペプチドの元のＮ末端が回復されるため、本明細書に記載のようなＮ末端分解ペプチド配列決定法が可能になる。

（実施例１５）
３プライマー融合エマルジョンＰＣＲにより、アミノ酸特異的コーディングタグで共有結合的に修飾されたペプチドの記録タグを付随させることによるジタグ生成
コンパートメントタグおよび分子ＵＭＩで構成される記録タグを有するペプチドを、コーディングタグ部位特異的化学標識で化学的に修飾する。また、コーディングタグは、修飾ペプチド内の所与のタイプのアミノ酸の数を計数することが可能になるようにＵＭＩを含む。ＴｙｓｏｎおよびＡｒｍｏｒ（ＴｙｓｏｎおよびＡｒｍｏｕｒ、２０１２年）の改変プロトコールを使用して、エマルジョンＰＣＲを、１×ＰＨＵＳＩＯＮ（商標）ＧＣ反応緩衝液（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）、２００μＭの各ｄＮＴＰ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、１μＭプライマーＵ１、１μＭプライマーＵ２ｔｒ、２５ｎＭプライマーＳｐ、１４単位のＰＨＵＳＩＯＮ（商標）高フィデリティーＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を含む１００μｌの総水性容積中で調製する。１０μｌの水相を、ＴｕｒｎｅｒおよびＨｕｒｌｅｓ（２００９年、Ｎａｔ．Ｐｒｏｔｏｃ．、４巻：１７７１〜１７８３頁）により以前に記載されているように、２ｍｌクライオバイアル中の軽油（Ｓｉｇｍａ）に溶解した２００μｌの油相（４．５％ｖｏｌ／ｖｏｌ）Ｓｐａｎ８０、０．４％ｖｏｌ／ｖｏｌのＴｗｅｅｎ８０、および０．０５％ＴｒｉｔｏｎＸ−１００に、合計５分間にわたって１０００ｒｐｍで撹拌しながら、５〜１０秒ごとに添加する。得られたエマルジョンの平均液滴サイズは、約５ミクロンだった。Ｔ字路および流動フォーカスの使用などのエマルジョンを生成するための他の方法も用いることができる（Ｂｒｏｕｚｅｓ、Ｍｅｄｋｏｖａら、２００９年）。エマルジョン生成後、１００μｌの水／油混合物を０．５ｍｌのＰＣＲチューブに移し、第１ラウンドの増幅を、以下の条件で実施する：９８℃で３０秒間；９８℃で１０秒間、７０℃で３０秒間、および７２℃で３０秒間を４０サイクル；その後７２℃で５分間の伸長。第２ラウンドの増幅反応を、以下の条件で実施する：９８℃で３０秒間；９８℃で１０秒間、５５℃で３０秒間、および７２℃で３０秒間を４０サイクル；その後４℃で維持。ＰＣＲの最終サイクル後できるだけ早く、２００μｌのヘキサン（Ｓｉｇｍａ）をＰＣＲチューブに直接添加し、２０秒間ボルテックスし、１３，０００ｇで３分間遠心分離することにより、エマルジョンを崩壊させる。

（実施例１６）
伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の配列決定
記録タグまたはコーディングタグのスペーサー（Ｓｐ）またはユニバーサルプライミング部位は、配列の本体に３つの塩基のみ（例えばＡ、Ｃ、およびＴ）および配列の５’末端に第４の塩基（例えば、Ｇ）を使用して設計することができる。合成による配列決定（ＳＢＳ）の場合、これにより、標準的非発光性（ｄａｒｋ）（未標識および非終端化）ヌクレオチド（ｄＡＴＰ、ｄＧＴＰ、およびｄＴＴＰ）および単一ｆｆＣ色素標識可逆的ターミネーター（例えば、完全に機能的なシトシン三リン酸塩）のミックスを使用して、スペーサー配列全体にわたって非発光性塩基を迅速に組み込むことが可能になる。このようにすると、関連するエンコーダー配列、一意の分子識別子、コンパートメントタグ、伸長リポータータグの結合サイクル配列、伸長コーディングタグ、またはジタグのみがＳＢＳ配列決定され、無関連のスペーサーまたはユニバーサルプライミング配列は「スキップ」される。スペーサーの塩基および配列の５’末端の第４の塩基の同一性は、変更してもよく、上記の同一性は、例示のために提供されているに過ぎない。

（実施例１７）
タンパク質ライセートの調製。

種々の試料タイプからタンパク質ライセートを製作するための幅広く様々なプロトコールが、当技術分野で公知である。プロトコールの相違点の多くは、細胞タイプ、およびライセート中の抽出されたタンパク質が未変性状態で解析されるかまたは変性状態で解析されるかに依存する。ＮＧＰＡアッセイの場合、天然コンフォメーションのタンパク質または変性タンパク質のいずれも、固体基材に固定化することができる（図３２を参照されたい）。さらに、未変性タンパク質を固定化した後、基材の表面に固定化されたタンパク質を変性させてもよい。変性タンパク質を用いる利点は２つある。第１に、多数の抗体試薬は、線形エピトープ（例えば、ウエスタンブロットＡｂ）に結合し、変性タンパク質は、線形エピトープへのより良好な接近を提供する。第２に、ＮＧＰＡアッセイワークフローは、変性タンパク質を使用すると単純化される。それは、固定化されているタンパク質が既に変性されているため、アルカリ性（例えば、０．１ＮａＯＨ）剥離条件を使用して、アニーリングされたコーディングタグを伸長記録タグから剥離することができるためである。これは、結合事象および情報移行後に、アニーリングされているコーディングタグを酵素的に除去することが必要とされる、天然コンフォメーションのタンパク質を含むアッセイを使用して、アニーリングされているコーディングタグを除去する場合と対照的である。

未変性タンパク質溶解緩衝液の例としては、５０ｍｍＨＥＰＥＳ（ｐＨ７．４）、１５０ｍＭＮａＣｌ、１％ＴｒｉｔｏｎＸ−１００、１．５ｍＭＭｇＣｌ２、１０％グリセロールで構成されるＲＰＰＡ緩衝液；およびＭ−ＰＥＲ哺乳動物タンパク質抽出試薬（ＴｈｅｒｍｏＦｉｓｈｅｒ）などの市販の緩衝液が挙げられる。変性溶解緩衝液は、５０ｍｍＨＥＰＥＳ（ｐＨ８．）、１％ＳＤＳを含む。尿素（１Ｍ〜３Ｍ）またはグアニジンＨＣｌ（１〜８Ｍ）の添加も、タンパク質試料の変性に使用することができる。溶解緩衝液の上記成分に加えて、一般的には、プロテアーゼおよびホスファターゼ阻害剤も含まれている。プロテアーゼ阻害剤および典型的な濃度の例としては、アプロチニン（ａｐｔｒｏｔｉｎｉｎ）（２μｇ／ｍｌ）、ロイペプチン（５〜１０μｇ／ｍｌ）、ベンズアミジン（１５μｇ／ｍｌ）、ペプスタチンＡ（１μｇ／ｍｌ）、ＰＭＳＦ（１ｍＭ）、ＥＤＴＡ（５ｍＭ）、およびＥＧＴＡ（１ｍＭ）が挙げられる。ホスファターゼ阻害剤の例としては、Ｎａピロリン酸塩（１０ｍＭ）、フッ化ナトリウム（５〜１００ｍＭ）、およびオルトバナジン酸ナトリウム（１ｍＭ）が挙げられる。追加の添加剤としては、タンパク質試料からＤＮＡを除去するためのＤＮＡａｓｅＩ、およびジスルフィド結合を還元するためのＤＴＴなどの還元剤を挙げることができる。

組織培養細胞から調製される未変性タンパク質ライセートプロトコールの一例は、以下の通りである。接着細胞をトリプシン処理し（ＰＢＳ中０．０５％トリプシン−ＥＤＴＡ）、遠心分離（２００ｇで５分間）により収集し、氷冷ＰＢＳで２回洗浄する。プロテアーゼ／ホスファターゼ阻害剤および添加剤（例えば、ＥＤＴＡ非含有完全阻害剤（Ｒｏｃｈｅ）およびＰｈｏｓＳｔｏｐ（Ｒｏｃｈｅ）で補完された氷冷Ｍ−ＰＥＲ哺乳動物抽出試薬（１０^７細胞／１００ｍｍ皿または１５０ｃｍ^２フラスコ当たり約１ｍＬ）を添加する。得られた細胞懸濁液を、４℃にて２０分間にわたって回転振とう器でインキュベートし、その後、４℃にて２０分間、約１２，０００ｒｐｍ（細胞タイプに依存する）で遠心分離して、タンパク質上清を単離する。ＢＣＡアッセイを使用してタンパク質を定量化し、ＰＢＳに１ｍｇ／ｍｌで再懸濁する。タンパク質ライセートは、直ちに使用してもよく、または液体窒素で瞬間凍結して、−８０℃で保管してもよい。

ＨｕｇｈｓらのＳＰ３プロトコールに基づく、組織培養細胞から調製される変性タンパク質ライセートプロトコールの一例は、以下の通りである。接着細胞をトリプシン処理し（ＰＢＳ中０．０５％トリプシン−ＥＤＴＡ）、遠心分離（２００ｇで５分間）により収集し、氷冷ＰＢＳで２回洗浄する。プロテアーゼ／ホスファターゼ阻害剤および添加剤（例えば、１×ｃＯｍｐｌｅｔｅプロテアーゼ阻害剤カクテル（Ｒｏｃｈｅ））で補完された氷冷変性溶解緩衝液（１０^７細胞／１００ｍｍ皿または１５０ｃｍ^２フラスコ当たり約１ｍＬ）を添加する。得られた細胞懸濁液を、９５℃で５分間インキュベートし、５分間氷上に置く。ベンゾナーゼヌクレアーゼ（５００Ｕ／ｍｌ）をライセートに添加し、３７℃で３０分間インキュベートしてＤＮＡおよびＲＮＡを除去する。

ライセート１００ｕＬ当たり５μＬの２００ｍＭＤＴＴを添加することによりタンパク質を還元し、４５℃で３０分間インキュベートする。タンパク質システイン基のアルキル化（ａｌｋｌｙｌａｔｉｏｎ）は、ライセート１００ｕＬ当たり１０ｕＬの４００ｍＭヨードアセトアミドを添加することにより達成し、２４℃で３０分間、暗所でインキュベートする。ライセート１００ｕＬ当たり１０ｕＬの２００ｍＭＤＴＴを添加することにより、反応をクエンチする。任意選択で、ライセート１００ｕｌ当たり２ｕｌの酸無水物および１００ｕｌの１ＭＮａ２ＣＯ３（ｐＨ８．５）を添加することにより、タンパク質をアシル化する。室温で３０分間インキュベートする。「ｉｎｖｉｖｏ」でアセチル化されたリシンと、アシル化によるリシン基の「ｉｎｓｉｔｕ」ブロッキングとの区別が可能になるように、無水酢酸ではなく、吉草酸無水物、安息香酸無水物、およびプロピオン酸無水物が推奨される（Ｓｉｄｏｌｉ、Ｙｕａｎら、２０１５年）。５ｍｇのＴｒｉｓ（２−アミノエチル）アミン、ポリマー（Ｓｉｇｍａ）を添加し、室温で３０分間インキュベーションすることにより反応をクエンチする。ポリマー樹脂は、ライセートを２０００ｇで１分間遠心分離して、０．４５ｕｍ酢酸セルロースＳｐｉｎ−Ｘチューブ（Ｃｏｒｎｉｎｇ）を通過させることにより除去する。ＢＣＡアッセイを使用してタンパク質を定量化し、ＰＢＳに１ｍｇ／ｍｌで再懸濁する。

追加の例では、タンパク質閉じ込め、アルキル化、およびペプチダーゼ消化に、ＭＷＣＯ濾過デバイスが使用される、Ｅｒｄｅらに記載のフィルター支援試料調製（ＦＡＳＰ）プロトコールを使用して標識ペプチドを生成する（Ｅｒｄｅ、Ｌｏｏら２０１４年、ＦｅｉｓｔおよびＨｕｍｍｏｎ２０１５年）。

（実施例１８）
分配タグ付きペプチドの生成。

ＤＮＡタグ（任意選択の試料バーコードおよび直交性付着部分を有する）を、標準的バイオコンジュゲーション法（Ｈｅｒｍａｎｓｏｎ、２０１３年）を使用して、変性ポリペプチドのリシンのε−アミノ基を標識するために使用するか、またはその代わりにベンゾフェノンなどの光親和性標識（ＰＡＬ）法を使用して、ポリペプチドに付着させる（Ｌｉ、Ｌｉｕら、２０１３年）。ポリペプチドのリシン基をまたは無作為にＣＨ基（ＰＡＬにより）をＤＮＡタグで標識し、アシル無水物でのアシル化により未標識基をブロッキングした後、ＤＮＡタグ標識アシル化ポリペプチドを、ユニバーサルプライミング配列、コンパートメントバーコード、任意選択のＵＭＩ、およびポリペプチドに付着したＤＮＡタグの部分に相補的なプライマー配列を含むＤＮＡオリゴヌクレオチドが付着しているコンパートメントビーズにアニーリングさせる。複数のＤＮＡハイブリダイゼーションタグには協同性があるため、単一のポリペプチド分子は、主に単一のビーズと相互作用し、同じコンパートメントバーコードを、ポリペプチド分子のすべてのＤＮＡタグに書き込むことが可能である。アニーリング後、ポリペプチド結合ＤＮＡタグは、アニーリングされたビーズ結合ＤＮＡ配列のポリメラーゼ伸長反応にプライミングする。このように、コンパートメントバーコードおよび他の機能的エレメントは、結合されているポリペプチドに付着したＤＮＡタグに書き込まれる。このステップの完了時には、複数の記録タグがポリペプチドに付着しており、記録タグは、共通スペーサー配列、バーコード配列（例えば、試料、画分、コンパートメント、空間など）、任意選択のＵＭＩ、および他の機能的エレメントを有する。この標識ポリペプチドは、トリプシン、ＧｌｕＣ、プロテイナーゼＫなどの標準的エンドプロテアーゼを使用して、ペプチド断片へと消化することができる。注：リシン標識ポリペプチドの消化にトリプシンを使用する場合、ポリペプチドは、Ａｒｇ残基でのみ切断され、Ｌｙｓ残基では切断されない（Ｌｙｓ残基は標識されているため）。プロテアーゼ消化は、ビーズ上で直接実施してもよく、または標識ポリペプチドをバーコード付きビーズから除去した後で実施してもよい。

（実施例１９）
モデル系のＤＮＡ記録タグ−ペプチドコンジュゲートの調製

５’ＮＨ_２基および後にビーズにカップリングするための内部ｍＴｅｔｒａｚｉｎｅ基を有する記録タグオリゴヌクレオチドを合成する（ｍＴｅｔ−ＰＥＧ−Ｎ_３ヘテロ二機能性架橋剤により、アルキン−ｄＴをｍＴｅｔｒａｚｉｎｅ−ｄＴに変換する）。オリゴヌクレオチドの５’ＮＨ_２を、Ｗｉｌｌｉａｍｓら（ＷｉｌｌｉａｍｓおよびＣｈａｐｕｔ２０１０年）により記載されているように、ＬＣ−ＳＭＣＣ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）などのＮＨＳ／マレイミドヘテロ二機能性架橋剤を使用して、ペプチドの反応性システインにカップリングする。特に、２０ｎｍｏｌの５’ＮＨ_２標識オリゴヌクレオチドをエタノール沈殿し、シリコーン処理チューブ中の１８０ｕｌリン酸カップリング緩衝液（０．１Ｍリン酸カリウム緩衝液、ｐＨ７．２）に再懸濁する。５ｍｇのＬＣ−ＳＭＣＣを、１ｍＬのＤＭＦ（５ｍｇ／ｍｌ）に再懸濁する（アリコートにして−２０で保管）。２０ｕｌのＬＣ−ＳＭＣＣ（５ｍｇ／ｍｌ）のアリコートを、１８０ｕｌの再懸濁したオリゴヌクレオチドに添加し、混合し、室温で１時間インキュベートする。混合物を２回エタノール沈殿する。得られたマレイミド（ｍａｌｅｍｉｄｅ）誘導体化オリゴヌクレオチドを、２００ｕｌのリン酸カップリング緩衝液に再懸濁する。システイン残基を含むペプチド（＞９５％純度、脱塩）を、１ｍｇ／ｍｌのＤＭＳＯ（約０．５ｍＭ）に再懸濁する。およそ５０ｎｍｏｌのペプチド（１００ｕｌ）を、反応ミックスに添加し、室温で一晩インキュベートする。得られたＤＮＡ記録タグーペプチドコンジュゲートを、Ｗｉｌｌｉａｍら（ＷｉｌｌｉａｍｓおよびＣｈａｐｕｔ２０１０年）により記載されているように、未変性ＰＡＧＥを使用して精製する。コンジュゲートを、シリコーン処理チューブ中の１００ｕＭ濃度のリン酸カップリング緩衝液に再懸濁する。

（実施例２０）
ＤＮＡ−ペプチド固定化用の基材の開発。

Ｍ−２７０アミン磁気Ｄｙｎａｂｅａｄｓを、それぞれアルキンまたはメチルテトラジン標識オリゴ−ペプチドコンジュゲートにカップリングすることが可能なアジド誘導体化ビーズまたはＴＣＯ誘導体化ビーズのいずれかに変換することにより、クリック化学固定化に好適な磁気ビーズを創出する（例えば、図２９Ｄ〜２９Ｅ；図３０Ｄ〜３０Ｅを参照されたい）。すなわち、１０ｍｇのＭ−２７０ビーズを、５００ｕｌのホウ酸緩衝液（１００ｍＭホウ酸ナトリウム、ｐＨ８．５）で洗浄および再懸濁する。ＴＣＯ−ＰＥＧ（１２−１２０）−ＮＨＳ（Ｎａｎｏｃｓ）およびメチル−ＰＥＧ（１２−１２０）−ＮＨＳの混合物を、１ｍＭでＤＭＳＯに再懸濁し、Ｍ−２７０アミンビーズと共に室温で一晩インキュベートする。メチルのＴＣＯＰＥＧに対する比をタイトレーションして、ＴＣＯ部分が＜１００個／ｕｍ^２で存在するように、ビーズの最終ＴＣＯ表面密度を調整する（例えば、図３１Ｅ、図３４を参照されたい）。未反応アミン基を、ＤＭＦ中の０．１Ｍ無水酢酸および０．１ＭＤＩＥＡの混合物を用いて（１０ｍｇビーズ毎に５００ｕｌ）、室温で２時間キャッピングする。キャッピングし、ＤＭＦで３回洗浄した後、ビーズを、１０ｍｇ／ｍｌでリン酸カップリング緩衝液に再懸濁する。

（実施例２１）
記録タグ標識ペプチドの基材への固定化。

記録タグ標識ペプチドを、記録タグのｍＴｅｔ基および活性化ビーズまたは基材の表面のＴＣＯ基を使用してＩＥＤＤＡクリック化学反応により、基材に固定化する。この反応は、反応物の入力濃度が低い場合でさえ、迅速および効率的である。さらに、メチルテトラジンを使用することにより、より大きな安定性が結合に付与される（ＳｅｌｖａｒａｊおよびＦｏｘ２０１３年、Ｋｎａｌｌ、Ｈｏｌｌａｕｆら２０１４年、ＷｕおよびＤｅｖａｒａｊ２０１６年）。２００ｎｇのＭ−２７０ＴＣＯビーズを、１００ｕｌのリン酸カップリング緩衝液に再懸濁する。記録タグにｍＴｅｔ部分を含む５ｐｍｏｌのＤＮＡ記録タグ標識ペプチドを、終濃度が約５０ｎＭになるようにビーズに添加する。反応を、室温にて１時間インキュベートする。固定化した後、基材の未反応ＴＣＯ基を、リン酸カップリング緩衝液中の１ｍＭメチルテトラジン酸により、室温にて１時間クエンチする。

（実施例２２）
Ｎ末端アミノ酸（ＮＴＡＡ）修飾
化学的ＮＴＡＡアセチル化：
ペプチドのＮＴＡＡを、有機または水性溶液（スルホ−ＮＨＳ−アセテート）中で、無水酢酸またはＮＨＳ−アセテートのいずれかを使用してアセチル化する。無水酢酸誘導体化の場合、ＤＭＦ中１０ｍＭの無水酢酸を、ペプチドと共に室温で３０分間インキュベートする（Ｈａｌｐｉｎ、Ｌｅｅら、２００４年）。あるいは、１００ｍＭの２−（Ｎ−モルホリノ）エタンスルホネート（ＭＥＳ）緩衝液（ｐＨ６．０）中５０ｍＭの無水酢酸および１ＭのＮａＣｌを使用して、室温で３０分間、ペプチドを水溶液中でアセチル化する（Ｔｓｅ、Ｓｎｙｄｅｒら、２００８年）。ＮＨＳ−アセテート誘導体化の場合、スルホ−ＮＨＳ−アセテートのストック溶液（ＤＭＳＯ中１００ｍＭ）を調製し、１００ｍＭリン酸ナトリウム緩衝液（ｐＨ８．０）または１００ｍＭホウ酸緩衝液（ｐＨ９．４）に、終濃度が５〜１０ｍＭになるように添加し、室温で１０〜３０分間インキュベートする（Ｇｏｏｄｎｏｗ、２０１４年）。

酵素的ＮＴＡＡアセチル化：
以下の条件を使用して、Ｎ−アセチルトランスフェラーゼ（Ｓｕｌｆｏｌｏｂｕｓｓｏｌｆａｔａｒｉｃｕｓに由来するＳｓＡｒｄ１）に曝露することにより、ペプチドのＮＴＡＡを酵素的にアセチル化する。ペプチドを、２μＭのＳｓＡｒｄ１と共に、ＮＡＴ緩衝液（２０ｍＭＴｒｉｓ−ＨＣｌ、ｐＨ８．０、１００ｍＭＮａＣｌ、１ｍＭＥＤＴＡ、１ｍＭアセチル−ＣｏＡ）中で、１０分間６０℃にてインキュベートする（ＣｈａｎｇおよびＨｓｕ、２０１５年）。

化学的ＮＴＡＡアミジン化（グアニジン化）：
ペプチドを、１０ｍＭＮ，Ｎ−ビス（ｔｅｒｔ−ブトキシカルボニル）チオ尿素、２０ｍＭトリメチルアミン、および１２ｍＭ向山試薬（２−クロロ−１−メチルピリジニウムヨージド）のＤＭＦ溶液で、３０分間室温にてインキュベートする。あるいは、ペプチドを、１０ｍＭ１Ｈ−ピラゾール−１−カルボキサミジン塩酸塩、１０ｍＭＤＩＥＡのＤＭＦ溶液で、３０分間室温にてインキュベートする。標準的脱ブロッキング法を使用して、保護基を除去する。あるいは、ペプチドを、ＰＢＳ緩衝液（ｐＨ８．０）または１００ｍＭホウ酸緩衝液（ｐＨ８．０）中１０ｍＭＳ−メチルイソチオ尿素で、３０分間１０℃にてインキュベートする（Ｔｓｅ、Ｓｎｙｄｅｒら、２００８年）。

ＰＩＴＣ標識：
ペプチドを、イオン性液体［Ｂｍｉｍ］［ＢＦ４］中５％（ｖｏｌ／ｖｏｌ）のＰＩＴＣで、５分間室温にてインキュベートする。伸長ＤＮＡ記録タグに存在するヌクレオチド塩基の環外アミンの異所標識を最小限に抑えつつ、ＮＴＡＡが定量的にＰＩＴＣで標識されるように、反応時間を最適化する。

ＤＮＦＢ標識：
２，４−ジニトロフルオロベンゼン（ＤＮＦＢ）を、メタノール中５ｍｇ／ｍｌのストックとして調製する。溶液は、光から保護し、毎日新しく調製する。１０ｍＭホウ酸緩衝液（ｐＨ８．０）中０．５〜５．０ｕｇ／ｍｌのＤＮＦＢで、５〜３０分間３７℃にてインキュベーションすることにより、ペプチドを標識する。

ＳＮＦＢ標識：
４−スルホニル−２−ニトロ−フルオロベンゼン（ＳＮＦＢ）を、メタノール中５ｍｇ／ｍｌのストックとして調製する。溶液は、光から保護し、毎日新しく調製すべきである。１０ｍＭホウ酸緩衝液（ｐＨ８．０）中０．５〜５．０ｕｇ／ｍｌのＤＮＦＢで、５〜３０分間３７℃にてインキュベーションすることにより、ペプチドを標識する。

アセチル化ＮＴＡＡペプチドの切断：
２５ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ７．５）中で１０ｕＭのアシルペプチドヒドロラーゼ（ＡＰＨ）酵素（Ｓｕｌｆｏｌｏｂｕｓｓｏｌｆａｔａｒｉｃｕｓ由来、ＳＳＯ２６９３）と共に、１０分間９０℃にてインキュベーションすることにより、アセチル化ＮＴＡＡをペプチドから切断する（Ｇｏｇｌｉｅｔｔｉｎｏ、Ｂａｌｅｓｔｒｉｅｒｉら、２０１２年）。

アミジン化ＮＴＡＡペプチドの切断：
アミジン化（グアニジン化）ＮＴＡＡを、０．１ＮＮａＯＨ中で、１０分間３７℃にてインキュベーションすることにより、ペプチドから切断する（Ｈａｍａｄａ、２０１６年）。

（実施例２３）
モデル系によるコーディングタグ情報の記録タグへの分子内移行の実証
ＤＮＡモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の「分子内」移行を試験した（図３６Ａを参照されたい）。２つの異なるタイプの記録タグオリゴヌクレオチドを使用した。ｓａＲＴ＿Ａｂｃ＿ｖ２（配列番号１４１）は、「Ａ」ＤＮＡ捕捉配列（配列番号１５３）（「Ａ’」結合性物質の模倣エピトープ）および対応する「Ａ」バーコード（ｒｔＡ＿ＢＣ）を含んでいた。ｓａＲＴ＿Ｂｂｃ＿Ｖ２（配列番号１４２）は、「Ｂ」ＤＮＡ捕捉配列（配列番号１５４）（「Ｂ’」結合性物質の模倣エピトープ）および対応する「Ｂ」バーコード（ｒｔＢ＿ＢＣ）を含んでいた。これらバーコードは、基本的な６５セットの１５ｍｅｒバーコード（配列番号１〜６５）およびそれらのリバース相補的配列（配列番号６６〜１３０）の組合せだった。ｒｔＡ＿ＢＣは、２つのバーコード、ＢＣ＿１およびＢＣ＿２の同鎖上の組合せであり、ｒｔＢ＿ＢＣは、１つのバーコード、ＢＣ＿３のみである。同様に、コーディングタグのバーコード（エンコーダー配列）も、６５個の１５ｍｅｒバーコード（配列番号１〜６５）の基本的なセットに由来するバーコードで構成されていた。ＣＴ＿Ａ’−ｂｃ＿１ＰＥＧ（配列番号１４４）およびＣＴ＿Ｂ’−ｂｃ（配列番号１４７）コーディングタグは、それぞれ相補的捕捉配列Ａ’およびＢ’で構成され、それぞれ１５ｍｅｒバーコードＢＣ＿５、およびＢＣ＿５＆ＢＣ＿６と割り当てた。記録タグおよびコーディングタグのこの設計設定により、容易なゲル解析が可能になる。所望の「分子内」プライマー伸長は、類似サイズのオリゴヌクレオチド産物を生成するが、望ましくない「分子間」伸長は、「分子内」産物よりも１５塩基大きな１つのオリゴ産物および１５塩基短い別のオリゴ産物を生成する（図３６Ｂ）。

「分子内」対「分子間」情報移行に対する記録タグ密度の効果を評価した。正しい情報移行のためには、「分子間」情報移行（Ａ’コーディングタグはＡ記録タグと結合するが、情報はＢ記録タグへと移行されること、およびその逆）ではなく、「分子内」情報移行（「Ａ’」コーディングタグからＡ記録タグ；Ｂ’コーディングタグからＢ記録タグ）が観察されなければならない。ビーズ表面の記録タグ間隔の効果を試験するために、ビオチン化記録タグオリゴヌクレオチドｓａＲＴ＿Ａｂｃ＿ｖ２（配列番号１４１）およびｓａＲＴ＿Ｂｂｃ＿ｖ２（配列番号１４２）を１：１の比で混合し、その後、１：０、１：１０、１：１０^２、１：１０^３、および１：１０^４の比で、ｓａＤｕｍｍｙ−Ｔ１０オリゴヌクレオチド（配列番号１４３）に対してタイトレーションした。合計で２０ｐｍｏｌの記録タグオリゴヌクレオチドを、５０ｕｌの固定化緩衝液（５ｍＭＴｒｉｓ−Ｃｌ（ｐＨ７．５）、０．５ｍＭＥＤＴＡ、１ＭＮａＣｌ）中で５ｕｌのＭ２７０ストレプトアビジンビーズ（Ｔｈｅｒｍｏ）と共に、３７℃で１５分間インキュベートした。ビーズを、１００ｕｌの固定化緩衝液で３回、室温にて洗浄した。ほとんどのその後の洗浄ステップでは、１００ｕｌの容積を使用した。ビーズを２５ｕｌの５×アニーリング緩衝液（５０ｍＭＴｒｉｓ−Ｃｌ（ｐＨ７．５）、１０ｍＭＭｇＣｌ２）に再懸濁し、コーディングタグミックスを添加することにより、コーディングタグ（後のサイクルには、ＤｕｐＣＴ配列との二本鎖アニーリングが必要である）を、ビーズに固定化されている記録タグとアニーリングさせる。６５℃で１分間加熱し、その後室温へと徐々に冷却する（０．２℃／秒）ことにより、コーディングタグを記録タグにアニーリングさせる。あるいは、コーディングタグを、３７℃にてＰＢＳＴ緩衝液中でアニーリングさせてもよい。ビーズを、室温にてＰＢＳＴ（ＰＢＳ＋０．１％Ｔｗｅｅｎ−２０）で洗浄し、３７℃にて５分間ＰＢＳＴで２回洗浄し、室温にてＰＢＳＴで１回洗浄し、１×アニーリング緩衝液で最終洗浄した。ビーズを、１９．５ｕｌの伸長緩衝液（５０ｍＭＴｒｉｓ−Ｃｌ（ｐＨ７．５）、２ｍＭＭｇＳＯ４、１２５ｕＭｄＮＴＰ、５０ｍＭＮａＣｌ、１ｍＭジチオトレイトール、０．１％Ｔｗｅｅｎ−２０、および０．１ｍｇ／ｍｌＢＳＡ）に再懸濁し、３７℃で１５分間インキュベートした。クレノウｅｘｏ−ＤＮＡポリメラーゼ（ＮＥＢ、５Ｕ／ｕｌ）を、０．１２５Ｕ／ｕｌの終濃度でビーズに添加し、３７℃で５分間インキュベートした。プライマー伸長後、ビーズを、ＰＢＳＴで２回、５０ｕｌの０．１ＮａＯＨで１回室温にて５分間、ＰＢＳＴで３回、およびＰＢＳで１回洗浄した。下流ＰＣＲアダプター配列Ｒ１’を付加するために、ＥｎｄＣａｐ２Ｔオリゴ（Ｒ１（配列番号１５２）で構成される）を、コーディングタグオリゴヌクレオチドで実施したのと同様に、ハイブリダイズさせ、ビーズ上で伸長させた。アダプター配列を付加した後、最終伸長記録タグオリゴヌクレオチドを、９５％ホルムアミド／１０ｍＭＥＤＴＡ中で５分間６５℃にてインキュベーションすることにより、ストレプトアビジンビーズから溶出した。溶出産物のおよそ１／１００を、２０ｕｌで１８サイクルにてＰＣＲ増幅し、ＰＣＲ産物の１ｕｌを、１０％変性ＰＡＧＥゲルで解析した。得られたゲルは、コーディングタグ情報がポリメラーゼ伸長により記録タグに書き込まれるという原理の証明を実証し（図３６Ｃ）、ビーズ表面の記録タグ密度を希釈すると、「分子間」伸長事象よりも「分子内」伸長事象を主に生成することができることを示した。

このモデル系では、対応するエンコーダー配列およびユニバーサルリバースプライマー部位を含む記録タグＲＴ＿ＡＢＣおよびＲＴ＿ＢＢＣからのＰＣＲ産物のサイズは、１００塩基対（図３６Ｃ）であるが、ｓａＲＴ＿ＡＢＣ（配列番号１４１）／ＣＴ＿Ｂ’ＢＣ（配列番号１４７）およびｓａＲＴ＿ＢＢＣ（配列番号１４２）／ＣＴ＿Ａ’ＢＣ（配列番号１４４）の誤対合による産物は、それぞれ１１５塩基対および８５塩基対である。図３６Ｄに示されているように、ビーズにｓａＲＴ＿ＡＢＣ（配列番号１４１）およびｓａＲＴ＿ＢＢＣ（配列番号１４２）が高密度で存在する場合、３つのバンドが観察された。高密度では、記録タグは、それ自体に結合する近位のコーディングタグ（分子内事象）または近隣の記録タグ（分子間事象）で伸長することが予想された。しかしながら、誤対合による産物のバンドは、ダミーオリゴヌクレオチドの記録タグを希釈することにより減少し、１：１００００の比では消失した。この結果は、記録タグがビーズ表面に低密度で離間されていたため、分子間事象が減少したことを実証した。

／３ＳｐＣ３／＝３’ Ｃ３（炭素３個）スペーサー
／５Ｂｉｏｓｇ／＝５’ビオチン
／ｉＳＰ１８／＝１８原子ヘキサ−エチレングリコールスペーサー

（実施例２４）
ナノポアシーケンサーでの伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の配列決定
ＤＮＡバーコードは、現在の塩基コールエラー率が１０％台またはそれよりも高いナノポアに基づくシーケンサーなどの、非常にエラーを起こしやすいＮＧＳシーケンサーでの使用に耐えるように設計することができる。いくつかのエラー訂正コード系が文献に記載されている。こうしたエラー訂正コード系としては、Ｈａｍｍｉｎｇコード、Ｒｅｅｄ−Ｓｏｌｏｍｏｎコード、Ｌｅｖｅｎｓｈｔｅｉｎコード、Ｌｅｅコードなどが挙げられる。エラー耐性バーコードは、選択した設計パラメーターに応じて、挿入エラー、欠失エラー、および置換エラーを訂正することが可能なＲＢｉｏｃｏｎｄｕｃｔｏｒパッケージ「ＤＮＡｂａｒｃｏｄｅｓ」を使用した、ＨａｍｍｉｎｇおよびＬｅｖｅｎｓｈｔｅｉｎコードに基づいていた（ＢｕｓｃｈｍａｎｎおよびＢｙｓｔｒｙｋｈ、２０１３年）。６５個の異なる１５ｍｅｒＨａｍｍｉｎｇバーコードのセットが、図２７Ａに示されている（配列番号１〜６５に示されており、それらのリバース相補的配列はそれぞれ配列番号６６〜１３０に示されている）。これらのバーコードは、最小Ｈａｍｍｉｎｇ距離が１０であり、４つの置換エラーおよび２つのインデルエラーまでを自己訂正する。これは、１０％のエラー率でのナノポアシーケンサーの正確な読み出しに十分過ぎる程である。さらに、これらのバーコードは、予測ナノポア電流シグネチャを使用して、７７個のオリジナルバーコードのセットから濾過されている（図２７Ｂを参照されたい）。これらのバーコードは、バーコード全体にわたって大きな電流レベル差を示し、そのセットの他のバーコードと極力相関しないように濾過した。このようにすると、これらバーコードを使用したアッセイからの実際の生ナノポア電流レベルプロットを、塩基コールアルゴリズムを使用せずに、予測バーコードシグネチャに対して直接的にマッピングすることができる（Ｌａｓｚｌｏ、Ｄｅｒｒｉｎｇｔｏｎら、２０１４年）。

ナノポアシーケンシングを使用した伸長記録タグ、伸長コーディングタグ、またはジタグ構築物の解析を模倣するために、４つのフォワードプライマー（ＤＴＦ１（配列番号１５７）、ＤＴＦ２（配列番号１５８）、ＤＴＦ３（配列番号１５９）、ＤＴＦ４（配列番号１６０））および４つのリバースプライマー（ＤＴＲ９（配列番号１６１）、ＤＴＲ１０（配列番号１６２）、ＤＴＲ１１（配列番号１６３）、ＤＴＲ１２（配列番号１６４））を使用した１５ｍｅｒバーコードの小さなサブセットで構成されるＰＣＲ産物を生成した（図２７Ｃ）。この８個プライマーのセットを、隣接するフォワードプライマーＦ１（配列番号１６５）およびリバースプライマーＲ１（配列番号１６６）と共にＰＣＲ反応に含めた。ＤＴＦおよびＤＴＲプライマーは、相補的１５ｍｅｒスペーサー配列（Ｓｐ１５）（配列番号１６７）を介してアニーリングした。４つのＤＴＦフォワードプライマーおよび４つのＤＴＲリバースプライマーの組合せは、１６個の考え得るＰＣＲ産物をもたらす。

ＰＣＲ後、アンプリコンを、平滑末端ライゲーション（図２７Ｃ）により以下の通り鎖状化した。２０ｕｌのＰＣＲ産物を、２０ｕｌのＱｕｉｃｋＬｉｇａｓｅＭｉｘ（ＮＥＢ）と直接混合し、室温で一晩インキュベートした。長さが約０．５〜２ｋｂの得られたライゲーション産物を、Ｚｙｍｏ精製カラムを使用して精製し、２０ｕｌの水に溶出した。この精製ライゲーション産物の約７ｕｌを、ＭｉｎＩｏｎＬｉｂｒａｒｙＲａｐｉｄＳｅｑｕｅｎｃｉｎｇＰｒｅｐキット（ＳＱＫ−ＲＡＤ００２）に直接使用し、ＭｉｎＩＯＮＭｋ１Ｂ（Ｒ９．４）デバイスで解析した。品質スコアが７．２（正確性が約８０％）の７３４ｂｐナノポアリードの一例が、図２７Ｄに示されている。配列決定の正確性が不良であるにもかかわらず、ＭｉｎＩｏｎ配列リードに対するバーコードのｌａｌｉｇｎに基づくアラインメントにより示されているように、配列中の多数のバーコードは容易に読み取り可能である（図２７Ｄ）。

（実施例２５）
ゲルビーズへの単一細胞の封入
単一細胞を、標準的技法（ＴａｍｍｉｎｅｎおよびＶｉｒｔａ２０１５年、Ｓｐｅｎｃｅｒ、Ｔａｍｍｉｎｅｎら２０１６年）を使用して、液滴（約５０μｍ）に封入する（図３８を参照されたい）。ポリアクリルアミド（アクリルアミド：ビスアクリルアミド（２９：１）（３０％ｗ／ｖｏｌ））、ベンゾフェノンメタクリルアミド（ＢＭ）、およびＡＰＳを、細胞と共に不連続相に含有させて、連続油相にＴＥＭＥＤを添加する（液滴内に拡散する）と重合を起こすことが可能な液滴を創出する。ベンゾフェノンを、ポリアクリルアミドゲル液滴のマトリックスに架橋させる。これは、その後のタンパク質とポリアクリルアミドマトリックスとの光親和性架橋を可能にする（Ｈｕｇｈｅｓ、Ｓｐｅｌｋｅら２０１４年、Ｋａｎｇ、Ｙａｍａｕｃｈｉら２０１６年）。得られた単一細胞ゲルビーズ内に固定化されたタンパク質を、様々な方法を使用して単一細胞バーコード化することができる。一実施形態では、ＤＮＡタグを、以前に記載されているようなアミン反応性作用剤または光活性ベンゾフェノンＤＮＡタグを使用して化学的にまたは光化学的に、単一細胞ゲルビーズ内の固定化されているタンパク質に付着させる。単一細胞ゲルビーズは、以前に記載されているようなバーコード付きビーズとの同時封入により、バーコードを含む液滴に封入することができ、タンパク質に移行されたＤＮＡバーコードタグまたはその代わりに単一細胞ゲルビーズ内のタンパク質を、Ａｍｉｎｉ、Ｃｕｓａｎｏｖｉｃｈ、およびＧｕｎｄｅｒｓｏｎら（Ａｍｉｎｉ、Ｐｕｓｈｋａｒｅｖら２０１４年、Ｃｕｓａｎｏｖｉｃｈ、Ｄａｚａら２０１５年）（Ｇｕｎｄｅｒｓｏｎ、Ｓｔｅｅｍｅｒｓら２０１６年）により記載されているような一連のプール・アンド・スプリットステップによりコンビナトリアル的にインデックス化することができる。最も単純な実行例では、単一細胞ゲルビーズ内のタンパク質を、まず「クリック化学」部分で標識し（図４０を参照されたい）、その後コンビナトリアルＤＮＡバーコードを、プール・アンド・スプリット手法を使用して、タンパク質試料にクリックする。
参考文献：

上記の詳細な説明に照らして、これらおよび他の変更を実施形態に対して行うことができる。一般的に、以下の特許請求の範囲においては、使用されている用語は、特許請求の範囲を、本明細書および本特許請求の範囲で開示されている特定の実施形態に限定するものとは解釈されるべきでなく、考え得るすべての実施形態ならびにそのような特許請求の範囲が権利を有する等価物の完全な範囲を含むと解釈されるべきである。したがって、特許請求の範囲は、本開示により限定されない。

上記に記載されている種々の実施形態を組み合わせて、さらなる実施形態を提供することができる。米国特許仮出願第６２／３３０，８４１号、米国特許仮出願第６２／３３９，０７１号、および米国特許仮出願第６２／３７６，８８６号を含む、本明細書で引用されている、および／または出願データシートに列挙されている米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、および非特許文献はすべて、それらの全体が参照により本明細書に組み込まれる。必要に応じて、種々の特許、出願、および刊行物の概念を用いるために、本実施形態の態様を改変して、またさらなる実施形態を提供することができる。
本発明は、例えば、以下の項目を提供する。
（項目１）
巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した巨大分子および付随する記録タグを用意するステップと；
（ｂ）前記巨大分子を、前記巨大分子に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記記録タグに移行させて、一次伸長記録タグを生成するステップと；
（ｄ）前記巨大分子を、前記巨大分子に結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｅ）前記第２のコーディングタグの情報を前記一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップと；
（ｆ）前記二次伸長記録タグを解析するステップと
を含む方法。
（項目２）
接触させるステップ（ｂ）および（ｄ）を逐次的に実施する、項目１に記載の方法。
（項目３）
接触させるステップ（ｂ）および（ｄ）を同時に実施する、項目１に記載の方法。
（項目４）
ステップ（ｅ）と（ｆ）の間に、
（ｘ）前記第２の結合性物質を、前記巨大分子に結合することが可能な第３の（またはより高次の）結合性物質であって、前記第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｄ）および（ｅ）を１回または複数回繰り返すステップと；
（ｙ）前記第３の（またはより高次の）コーディングタグの情報を前記第２の（またはより高次の）伸長記録タグに移行させて、第３の（またはより高次の）伸長記録タグを生成するステップと
をさらに含み、
ステップ（ｆ）において前記第３の（またはより高次の）伸長記録タグを解析する、項目１に記載の方法。
（項目５）
巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した巨大分子、付随する第１の記録タグおよび付随する第２の記録タグを用意するステップと；
（ｂ）前記巨大分子を、前記巨大分子に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記第１の記録タグに移行させて、第１の伸長記録タグを生成するステップと；
（ｄ）前記巨大分子を、前記巨大分子に結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｅ）前記第２のコーディングタグの情報を前記第２の記録タグに移行させて、第２の伸長記録タグを生成するステップと；
（ｆ）前記第１の伸長記録タグおよび第２の伸長記録タグを解析するステップと
を含む方法。
（項目６）
接触させるステップ（ｂ）および（ｄ）を逐次的に実施する、項目５に記載の方法。
（項目７）
接触させるステップ（ｂ）および（ｄ）を同時に実施する、項目５に記載の方法。
（項目８）
ステップ（ａ）が、前記固体支持体に接合した付随する第３の（またはより高次の）記録タグを用意するステップをさらに含む、項目５に記載の方法。
（項目９）
ステップ（ｅ）と（ｆ）の間に、
（ｘ）前記第２の結合性物質を、前記巨大分子に結合することが可能な第３の（またはより高次の）結合性物質であって、前記第３の（またはより高次の）結合性物質に関する識別情報を有する第３の（またはより高次の）コーディングタグを含む第３の（またはより高次の）結合性物質に置き換えることにより、ステップ（ｄ）および（ｅ）を１回または複数回繰り返すステップと；
（ｙ）前記第３の（またはより高次の）コーディングタグの情報を前記第３の（またはより高次の）記録タグに移行させて、第３の（またはより高次の）伸長記録タグを生成するステップと
をさらに含み、
ステップ（ｆ）において前記第１の伸長記録タグ、前記第２の伸長記録タグおよび前記第３の（またはより高次の）伸長記録タグを解析する、項目８に記載の方法。
（項目１０）
前記第１のコーディングタグ、前記第２のコーディングタグ、および任意のより高次のコーディングタグが、結合サイクル特異的スペーサー配列を含む、項目５から９までのいずれか一項に記載の方法。
（項目１１）
ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）を化学薬剤で修飾するステップと；
（ｃ）前記ペプチドを、修飾された前記ＮＴＡＡに結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｄ）前記第１のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと；
（ｅ）前記伸長記録タグを解析するステップと
を含む方法。
（項目１２）
ステップ（ｃ）が、前記ペプチドを、前記第２の（またはより高次の）結合性物質に関する識別情報を有する第２の（またはより高次の）コーディングタグを含む第２の（またはより高次の）結合性物質であって、ステップ（ｂ）の前記修飾されたＮＴＡＡ以外の修飾されたＮＴＡＡに結合することが可能である第２の（またはより高次の）結合性物質と接触させることをさらに含む、項目１１に記載の方法。
（項目１３）
前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触後に逐次的に行う、項目１２に記載の方法。
（項目１４）
前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触と同時に行う、項目１２に記載の方法。
（項目１５）
前記化学薬剤が、イソチオシアネート誘導体、２，４−ジニトロベンゼンスルホン酸（ｄｉｎｉｔｒｏｂｅｎｚｅｎｅｓｕｌｆｏｎｉｃ）（ＤＮＢＳ）、４−スルホニル−２−ニトロフルオロベンゼン（ＳＮＦＢ）１−フルオロ−２，４−ジニトロベンゼン、ダンシルクロリド、７−メトキシクマリン酢酸、チオアシル化試薬、チオアセチル化試薬、またはチオベンジル化試薬である、項目１１から１４までのいずれか一項に記載の方法。
（項目１６）
ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）を化学薬剤で修飾して、修飾されたＮＴＡＡを得るステップと；
（ｃ）前記ペプチドを、前記修飾されたＮＴＡＡに結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｄ）前記第１のコーディングタグの情報を前記記録タグに移行させて、第１の伸長記録タグを生成するステップと；
（ｅ）前記修飾されたＮＴＡＡを除去して、新しいＮＴＡＡを露出させるステップと；
（ｆ）前記ペプチドの前記新しいＮＴＡＡを化学薬剤で修飾して、新しく修飾されたＮＴＡＡを得るステップと；
（ｇ）前記ペプチドを、前記新しく修飾されたＮＴＡＡに結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｈ）前記第２のコーディングタグの情報を前記第１の伸長記録タグに移行させて、第２の伸長記録タグを生成するステップと；
（ｉ）前記第２の伸長記録タグを解析するステップと
を含む方法。
（項目１７）
ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドを、前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記記録タグに移行させて、伸長記録タグを生成するステップと；
（ｄ）前記伸長記録タグを解析するステップと
を含む方法。
（項目１８）
ステップ（ｂ）が、前記ペプチドを、前記第２の（またはより高次の）結合性物質に関する識別情報を有する第２の（またはより高次の）コーディングタグを含む第２の（またはより高次の）結合性物質であって、前記ペプチドの前記ＮＴＡＡ以外のＮＴＡＡに結合することが可能な第２の（またはより高次の）結合性物質と接触させることをさらに含む、項目１７に記載の方法。
（項目１９）
前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触後に逐次的に行う、項目１８に記載の方法。
（項目２０）
前記ペプチドの前記第２の（またはより高次の）結合性物質との接触を、前記ペプチドの前記第１の結合性物質との接触と同時に行う、項目１８に記載の方法。
（項目２１）
ペプチドを解析するための方法であって、
（ａ）固体支持体に接合したペプチドおよび付随する記録タグを用意するステップと；
（ｂ）前記ペプチドを、前記ペプチドのＮ末端アミノ酸（ＮＴＡＡ）に結合することが可能な第１の結合性物質であって、前記第１の結合性物質に関する識別情報を有する第１のコーディングタグを含む第１の結合性物質と接触させるステップと；
（ｃ）前記第１のコーディングタグの情報を前記記録タグに移行させて、第１の伸長記録タグを生成するステップと；
（ｄ）前記ＮＴＡＡを除去して、前記ペプチドの新しいＮＴＡＡを露出させるステップと；
（ｅ）前記ペプチドを、前記新しいＮＴＡＡに結合することが可能な第２の結合性物質であって、前記第２の結合性物質に関する識別情報を有する第２のコーディングタグを含む第２の結合性物質と接触させるステップと；
（ｈ）前記第２のコーディングタグの情報を前記第１の伸長記録タグに移行させて、第２の伸長記録タグを生成するステップと；
（ｉ）前記第２の伸長記録タグを解析するステップと
を含む方法。
（項目２２）
前記巨大分子が、タンパク質、ポリペプチドまたはペプチドである、項目１から１０までのいずれか一項に記載の方法。
（項目２３）
前記巨大分子が、ペプチドである、項目１から１０までのいずれか一項に記載の方法。
（項目２４）
前記ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、項目１１から２３までのいずれか一項に記載の方法。
（項目２５）
前記巨大分子が、脂質、炭水化物、または大環状分子である、項目１から１０までのいずれか一項に記載の方法。
（項目２６）
前記記録タグが、ＤＮＡ分子、偽相補的塩基を有するＤＮＡ、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＰＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、項目１から２５までのいずれか一項に記載の方法。
（項目２７）
前記記録タグが、ユニバーサルプライミング部位を含む、項目１から２６までのいずれか一項に記載の方法。
（項目２８）
前記ユニバーサルプライミング部位が、増幅、配列決定、またはその両方のためのプライミング部位を含む、項目２７に記載の方法。
（項目２９）
前記記録タグが、一意の分子識別子（ＵＭＩ）を含む、項目１から２８までに記載の方法。
（項目３０）
前記記録タグが、バーコードを含む、項目１から２９までのいずれか一項に記載の方法。
（項目３１）
前記記録タグが、その３’末端にスペーサーを含む、項目１から３０までのいずれか一項に記載の方法。
（項目３２）
前記巨大分子および前記付随する記録タグを、前記固体支持体に共有結合により接合させる、項目１から３１までのいずれか一項に記載の方法。
（項目３３）
前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、項目１から３２までのいずれか一項に記載の方法。
（項目３４）
前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目３３に記載の方法。
（項目３５）
複数の巨大分子および付随する記録タグを固体支持体に接合する、項目１から３４までのいずれか一項に記載の方法。
（項目３６）
前記複数の巨大分子の間に前記固体支持体上で平均距離＞５０ｎｍの間隔をあける、項目３５に記載の方法。
（項目３７）
前記結合性物質が、ポリペプチドまたはタンパク質である、項目１から３６までのいずれか一項に記載の方法。
（項目３８）
前記結合性物質が、改変アミノペプチダーゼ、改変アミノアシルｔＲＮＡ合成酵素、改変アンチカリン、または改変ＣｌｐＳである、項目３７に記載の方法。
（項目３９）
前記結合性物質が、巨大分子に選択的に結合することが可能である、項目１から３８までのいずれか一項に記載の方法。
（項目４０）
前記コーディングタグが、ＤＮＡ分子、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＰＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、項目１から３９までのいずれか一項に記載の方法。
（項目４１）
前記コーディングタグが、エンコーダー配列を含む、項目１から４０までのいずれか一項に記載の方法。
（項目４２）
前記コーディングタグが、スペーサー、結合サイクル特異的配列、一意の分子識別子、ユニバーサルプライミング部位、またはそれらの任意の組合せをさらに含む、項目１から４１までのいずれか一項に記載の方法。
（項目４３）
前記結合性物質と前記コーディングタグが、リンカーによって接合されている、項目１から４２までのいずれか一項に記載の方法。
（項目４４）
前記結合性物質と前記コーディングタグが、ＳｐｙＴａｇ／ＳｐｙＣａｔｃｈｅｒまたはＳｎｏｏｐＴａｇ／ＳｎｏｏｐＣａｔｃｈｅｒペプチド−タンパク質対によって接合されている、項目１から４２までに記載の方法。
（項目４５）
前記コーディングタグの情報の前記記録タグへの移行が、ＤＮＡリガーゼによって媒介される、項目１から４４までのいずれか一項に記載の方法。
（項目４６）
前記コーディングタグの情報の前記記録タグへの移行が、ＤＮＡポリメラーゼによって媒介される、項目１から４４までのいずれか一項に記載の方法。
（項目４７）
前記コーディングタグの情報の前記記録タグへの移行が、化学的ライゲーションによって媒介される、項目１から４４までのいずれか一項に記載の方法。
（項目４８）
前記伸長記録タグの解析が、核酸配列決定法を含む、項目１から４７までのいずれか一項に記載の方法。
（項目４９）
前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、項目４８に記載の方法。
（項目５０）
前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングである、項目４８に記載の方法。
（項目５１）
前記伸長記録タグを解析前に増幅する、項目１から５０までのいずれか一項に記載の方法。
（項目５２）
前記伸長記録タグに含有されるコーディングタグ情報の順序が、前記結合性物質による前記巨大分子への結合の順序に関する情報を提供する、項目１から５１までに記載の方法。
（項目５３）
前記伸長記録タグに含有される前記コーディングタグ情報の頻度が、前記結合性物質による前記巨大分子への結合の頻度に関する情報を提供する、項目１から５２までに記載の方法。
（項目５４）
複数の巨大分子を表す複数の伸長記録タグを並行して解析する、項目１から５３までに記載の方法。
（項目５５）
前記複数の巨大分子を表す複数の伸長記録タグを多重化アッセイで解析する、項目５４に記載の方法。
（項目５６）
前記複数の伸長記録タグが、解析前に標的濃縮アッセイを受ける、項目１から５５までのいずれか一項に記載の方法。
（項目５７）
前記複数の伸長記録タグが、解析前にサブトラクションアッセイを受ける、項目１から５６までのいずれか一項に記載の方法。
（項目５８）
前記複数の伸長記録タグが、極めて豊富な種を減少させるために解析前に正規化アッセイを受ける、項目１から５７までのいずれか一項に記載の方法。
（項目５９）
前記ＮＴＡＡを、改変アミノペプチダーゼ、改変アミノ酸ｔＲＮＡ合成酵素、穏やかなエドマン分解、エドマナーゼ（Ｅｄｍａｎａｓｅ）酵素、または無水ＴＦＡによって除去する、項目１から５８までのいずれか一項に記載の方法。
（項目６０）
少なくとも１つの結合性物質が末端アミノ酸残基に結合する、項目１から５９までのいずれか一項に記載の方法。
（項目６１）
少なくとも１つの結合性物質が翻訳後修飾されたアミノ酸に結合する、項目１から６０までのいずれか一項に記載の方法。
（項目６２）
複数のタンパク質複合体、タンパク質、またはポリペプチドを含む試料由来の１つまたは複数のペプチドを解析するための方法であって、
（ａ）前記試料中の前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、任意選択で固体支持体と接合した複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと；
（ｂ）前記複数のタンパク質複合体、タンパク質、および／またはポリペプチドを複数のペプチドに断片化するステップと；
（ｃ）前記複数のペプチドと前記複数のコンパートメントタグを、前記複数のペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きペプチドを生成するステップと；
（ｄ）前記コンパートメントタグ付きペプチドを前記複数のコンパートメントから収集するステップと；
（ｅ）１つまたは複数のコンパートメントタグ付きペプチドを、項目１から２１までおよび項目２６から６１までのいずれか一項に記載の方法に従って解析するステップとを含む方法。
（項目６３）
前記コンパートメントがマイクロ流体液滴である、項目６２に記載の方法。
（項目６４）
前記コンパートメントがマイクロウェルである、項目６２に記載の方法。
（項目６５）
前記コンパートメントが、表面上の分離された領域である、項目６２に記載の方法。
（項目６６）
各コンパートメントが、平均して単一の細胞を含む、項目６２から６５までのいずれか一項に記載の方法。
（項目６７）
複数のタンパク質複合体、タンパク質、またはポリペプチドを含む試料由来の１つまたは複数のペプチドを解析するための方法であって、
（ａ）前記複数のタンパク質複合体、タンパク質、またはポリペプチドを複数のユニバーサルＤＮＡタグで標識するステップと；
（ｂ）前記試料中の前記複数の標識されたタンパク質複合体、タンパク質、またはポリペプチドを複数のコンパートメントに分配するステップであって、各コンパートメントが、複数のコンパートメントタグを含み、前記複数のコンパートメントタグが、個々のコンパートメント内では同じであり、他のコンパートメントのコンパートメントタグとは異なる、ステップと；
（ｃ）前記複数のタンパク質複合体、タンパク質、またはポリペプチドと前記複数のコンパートメントタグを、前記複数のタンパク質複合体、タンパク質、またはポリペプチドと前記複数のコンパートメント内の前記複数のコンパートメントタグとのアニーリングまたは接合を可能にするのに十分な条件下で接触させ、それにより、複数のコンパートメントタグ付きタンパク質複合体、タンパク質またはポリペプチドを生成するステップと；
（ｄ）前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドを前記複数のコンパートメントから収集するステップと；
（ｅ）任意選択で前記コンパートメントタグ付きタンパク質複合体、タンパク質、またはポリペプチドをコンパートメントタグ付きペプチドに断片化するステップと；
（ｆ）１つまたは複数のコンパートメントタグ付きペプチドを、項目１から２１までおよび項目２６から６１までのいずれか一項に記載の方法に従って解析するステップとを含む方法。
（項目６８）
コンパートメントタグ情報を、ペプチドに付随する記録タグにプライマー伸長またはライゲーションによって移行させる、項目６２から６７までのいずれか一項に記載の方法。
（項目６９）
前記固体支持体がビーズを含む、項目６２から６８までのいずれか一項に記載の方法。
（項目７０）
前記ビーズが、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目６９に記載の方法。
（項目７１）
前記コンパートメントタグが、一本鎖または二本鎖核酸分子を含む、項目６２から７０までのいずれか一項に記載の方法。
（項目７２）
前記コンパートメントタグが、バーコードおよび任意選択でＵＭＩを含む、項目６２から７１までのいずれか一項に記載の方法。
（項目７３）
前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、前記複数のコンパートメントタグが接合したビーズを、スプリット・アンド・プール（ｓｐｌｉｔ−ａｎｄ−ｐｏｏｌ）合成によって形成する、項目７２に記載の方法。
（項目７４）
前記固体支持体がビーズであり、前記コンパートメントタグがバーコードを含み、さらに、複数のコンパートメントタグが接合したビーズを、個々の合成または固定化によって形成する、項目７２に記載の方法。
（項目７５）
前記コンパートメントタグが記録タグ内の成分であり、前記記録タグが任意選択でスペーサー、一意の分子識別子、ユニバーサルプライミング部位、またはそれらの任意の組合せをさらに含む、項目６２から７４までのいずれか一項に記載の方法。
（項目７６）
前記コンパートメントタグが、前記複数のタンパク質複合体、タンパク質、またはポリペプチドの内部アミノ酸またはＮ末端アミノ酸と反応することが可能な機能的部分をさらに含む、項目６２から７５までのいずれか一項に記載の方法。
（項目７７）
前記機能的部分がＮＨＳ基である、項目７６に記載の方法。
（項目７８）
前記機能的部分がアルデヒド基である、項目７６に記載の方法。
（項目７９）
前記複数のコンパートメントタグが、前記コンパートメントタグを前記コンパートメントに印刷、スポッティング、インク噴射すること、またはその組合せによって形成されたものである、項目６２から７８までのいずれか一項に記載の方法。
（項目８０）
前記コンパートメントタグが、ペプチドをさらに含む、項目６２から７９までのいずれか一項に記載の方法。
（項目８１）
前記コンパートメントタグペプチドが、タンパク質リガーゼ認識配列を含む、項目８０に記載の方法。
（項目８２）
前記タンパク質リガーゼが、ブテラーゼＩまたはそのホモログである、項目８１に記載の方法。
（項目８３）
前記複数のポリペプチドをプロテアーゼで断片化する、項目６２から８２までのいずれか一項に記載の方法。
（項目８４）
前記プロテアーゼがメタロプロテアーゼである、項目８３に記載の方法。
（項目８５）
前記メタロプロテアーゼの活性が金属カチオンの光活性化放出によってモジュレートされる、項目８４に記載の方法。
（項目８６）
前記複数のポリペプチドを前記複数のコンパートメントに分配する前に１つまたは複数の豊富なタンパク質を前記試料からサブトラクションすることをさらに含む、項目６２から８５までのいずれか一項に記載の方法。
（項目８７）
前記複数のペプチドと前記コンパートメントタグを接合する前に前記コンパートメントタグを前記固体支持体から遊離させることをさらに含む、項目６２から８６までに記載の方法。
（項目８８）
ステップ（ｄ）の後に、前記コンパートメントタグ付きペプチドを固体支持体に記録タグを伴って接合させることをさらに含む、項目６２に記載の方法。
（項目８９）
前記コンパートメントタグ付きペプチド上の前記コンパートメントタグの情報を前記付随する記録タグに移行させることをさらに含む、項目８８に記載の方法。
（項目９０）
ステップ（ｅ）の前に前記コンパートメントタグを前記コンパートメントタグ付きペプチドから除去することをさらに含む、項目８９に記載の方法。
（項目９１）
解析されるペプチドが由来する前記単一の細胞の同一性を前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、項目６２から９０までのいずれか一項に記載の方法。
（項目９２）
解析されるペプチドが由来する前記タンパク質またはタンパク質複合体の同一性を前記解析されるペプチドのコンパートメントタグ配列に基づいて決定することをさらに含む、項目６２から９０までのいずれか一項に記載の方法。
（項目９３）
複数の巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した複数の巨大分子および付随する記録タグを用意するステップと；
（ｂ）前記複数の巨大分子を、前記複数の巨大分子に結合することが可能な複数の結合性物質であって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングタグを含む複数の結合性物質と接触させるステップと；
（ｃ）（ｉ）前記巨大分子に付随する記録タグの情報を前記巨大分子に結合した前記結合性物質の前記コーディングタグに移行させて、伸長コーディングタグを生成するステップ；または（ｉｉ）巨大分子に付随する記録タグおよび前記巨大分子に結合した前記結合性物質のコーディングタグの情報をジタグ構築物に移行するステップと；
（ｄ）前記伸長コーディングタグまたはジタグ構築物を収集するステップと；
（ｅ）任意選択でステップ（ｂ）〜（ｄ）を１回または複数回の結合サイクルにわたって繰り返すステップと；
（ｆ）伸長コーディングタグまたはジタグ構築物の収集物を解析するステップと
を含む方法。
（項目９４）
前記巨大分子がタンパク質である、項目９３に記載の方法。
（項目９５）
前記巨大分子が、ペプチドである、項目９３に記載の方法。
（項目９６）
前記ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、項目９５に記載の方法。
（項目９７）
前記記録タグが、ＤＮＡ分子、ＲＮＡ分子、ＰＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、項目９３から９６までのいずれか一項に記載の方法。
（項目９８）
前記記録タグが、一意の分子識別子（ＵＭＩ）を含む、項目９３から９７までのいずれか一項に記載の方法。
（項目９９）
前記記録タグが、コンパートメントタグを含む、項目９３から９８までに記載の方法。
（項目１００）
前記記録タグが、ユニバーサルプライミング部位を含む、項目９３から９９までのいずれか一項に記載の方法。
（項目１０１）
前記記録タグが、その３’末端にスペーサーを含む、項目９３から１００までのいずれか一項に記載の方法。
（項目１０２）
前記記録タグの３’末端をブロッキングしてポリメラーゼによる前記記録タグの伸長を防止し、巨大分子に付随する記録タグおよび前記巨大分子に結合している前記結合性物質のコーディングタグの情報をジタグ構築物に移行させる、項目９３から１０１までのいずれか一項に記載の方法。
（項目１０３）
前記コーディングタグが、エンコーダー配列を含む、項目９３から１０２までのいずれか一項に記載の方法。
（項目１０４）
前記コーディングタグが、ＵＭＩを含む、項目９３から１０３までのいずれか一項に記載の方法。
（項目１０５）
前記コーディングタグが、ユニバーサルプライミング部位を含む、項目９３から１０４までのいずれか一項に記載の方法。
（項目１０６）
前記コーディングタグが、その３’末端にスペーサーを含む、項目９３から１０５までのいずれか一項に記載の方法。
（項目１０７）
前記コーディングタグが、結合サイクル特異的配列を含む、項目９３から１０６までのいずれか一項に記載の方法。
（項目１０８）
前記結合性物質と前記コーディングタグが、リンカーによって接合されている、項目９３から１０７までのいずれか一項に記載の方法。
（項目１０９）
前記記録タグの情報の前記コーディングタグへの移行が、プライマー伸長によってもたらされる、項目９３から１０８までのいずれか一項に記載の方法。
（項目１１０）
前記記録タグの情報の前記コーディングタグへの移行が、ライゲーションによってもたらされる、項目９３から１０８までのいずれか一項に記載の方法。
（項目１１１）
前記ジタグ構築物が、ギャップ充填、プライマー伸長、またはその両方によって生成される、項目９３から１０８までのいずれか一項に記載の方法。
（項目１１２）
前記ジタグ分子が、前記記録タグに由来するユニバーサルプライミング部位、前記記録タグに由来するコンパートメントタグ、前記記録タグに由来する一意の分子識別子、前記記録タグに由来する任意選択のスペーサー、前記コーディングタグに由来するエンコーダー配列、前記コーディングタグに由来する一意の分子識別子、前記コーディングタグに由来する任意選択のスペーサー、および前記コーディングタグに由来するユニバーサルプライミング部位を含む、項目９３から９７まで、１０７、１０８、および１１１のいずれか一項に記載の方法。
（項目１１３）
前記巨大分子および前記付随する記録タグを、前記固体支持体に共有結合により接合させる、項目９３から１１２までのいずれか一項に記載の方法。
（項目１１４）
前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、項目１１３に記載の方法。
（項目１１５）
前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目１１４に記載の方法。
（項目１１６）
前記結合性物質が、ポリペプチドまたはタンパク質である、項目９３から１１５までのいずれか一項に記載の方法。
（項目１１７）
前記結合性物質が、改変アミノペプチダーゼ、改変アミノアシルｔＲＮＡ合成酵素、改変アンチカリン、または抗体もしくはその結合性断片である、項目１１６に記載の方法。
（項目１１８）
前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、項目９５から１１７までのいずれか一項に記載の方法。
（項目１１９）
前記結合性物質が、Ｎ末端アミノ酸残基、Ｃ末端アミノ酸残基、または内部アミノ酸残基に結合する、項目１１８に記載の方法。
（項目１２０）
前記結合性物質が、Ｎ末端ペプチド、Ｃ末端ペプチド、または内部ペプチドに結合する、項目１１８に記載の方法。
（項目１２１）
前記結合性物質がＮ末端アミノ酸残基に結合し、前記Ｎ末端アミノ酸残基が各結合サイクル後に切断される、項目１１９に記載の方法。
（項目１２２）
前記結合性物質がＣ末端アミノ酸残基に結合し、前記Ｃ末端アミノ酸残基が各結合サイクル後に切断される、項目１１９に記載の方法。
（項目１２３）
Ｎ末端アミノ酸残基がエドマン分解によって切断される、項目１２１に記載の方法。
（項目１２４）
前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、項目９３に記載の方法。
（項目１２５）
ステップ（ｂ）の後に、前記巨大分子および付随する結合性物質を含む複合体を前記固体支持体から解離させ、液滴またはマイクロ流体液滴のエマルジョン中に分配する、項目９３から１２４までのいずれか一項に記載の方法。
（項目１２６）
各マイクロ流体液滴が、平均して、前記巨大分子および前記結合性物質を含む複合体を１つ含む、項目１２５に記載の方法。
（項目１２７）
伸長コーディングタグまたはジタグ構築物を生成する前に前記記録タグを増幅する、項目１２５または１２６に記載の方法。
（項目１２８）
エマルジョン融合ＰＣＲを使用して、前記記録タグ情報を前記コーディングタグに移行させる、またはジタグ構築物の集団を創出する、項目１２５から１２７までに記載の方法。
（項目１２９）
伸長コーディングタグまたはジタグ構築物の収集物を、解析前に増幅させる、項目９３から１２８までのいずれか一項に記載の方法。
（項目１３０）
伸長コーディングタグまたはジタグ構築物の収集物の解析が、核酸配列決定法を含む、項目９３から１２９までのいずれか一項に記載の方法。
（項目１３１）
前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、項目１３０に記載の方法。
（項目１３２）
前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングである、項目１３０に記載の方法。
（項目１３３）
前記巨大分子の部分的組成を、一意のコンパートメントタグおよび任意選択でＵＭＩを使用する複数の伸長コーディングタグまたはジタグ構築物の解析によって決定する、項目１３０に記載の方法。
（項目１３４）
前記解析ステップを、塩基当たりのエラー率が＞５％、＞１０％、＞１５％、＞２０％、＞２５％、または＞３０％である配列決定法を用いて実施する、項目１から１３３までのいずれか一項に記載の方法。
（項目１３５）
コーディングタグ、記録タグ、またはその両方の識別成分が、エラー訂正コードを含む、項目１から１３４までのいずれか一項に記載の方法。
（項目１３６）
前記識別成分が、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せから選択される、項目１３５に記載の方法。
（項目１３７）
前記エラー訂正コードが、Ｈａｍｍｉｎｇコード、Ｌｅｅ距離コード、非対称Ｌｅｅ距離コード、Ｒｅｅｄ−Ｓｏｌｏｍｏｎコード、およびＬｅｖｅｎｓｈｔｅｉｎ−Ｔｅｎｅｎｇｏｌｔｓコードから選択される、項目１３５または１３６に記載の方法。
（項目１３８）
コーディングタグ、記録タグ、またはその両方の識別成分が、一意の電流またはイオンフラックスまたは光学的シグネチャを生成することが可能であり、前記解析ステップが、前記識別成分を識別するために前記一意の電流またはイオンフラックスまたは光学的シグネチャを検出することを含む、項目１から１３４までのいずれか一項に記載の方法。
（項目１３９）
前記識別成分が、エンコーダー配列、バーコード、ＵＭＩ、コンパートメントタグ、サイクル特異的配列、またはそれらの任意の組合せから選択される、項目１３８に記載の方法。
（項目１４０）
複数の巨大分子を解析するための方法であって、
（ａ）固体支持体に接合した複数の巨大分子および付随する記録タグを用意するステップと；
（ｂ）前記複数の巨大分子を、同類の巨大分子に結合することが可能な複数の結合性物質であって、各結合性物質が前記結合性物質に関する識別情報を有するコーディングタグを含む複数の結合性物質と接触させるステップと；
（ｃ）第１の結合性物質の第１のコーディングタグの情報を第１の巨大分子に付随する第１の記録タグに移行させて、一次伸長記録タグを生成するステップであって、前記第１の結合性物質が前記第１の巨大分子に結合するステップと；
（ｄ）前記複数の巨大分子を、同類の巨大分子に結合することが可能な複数の結合性物質と接触させるステップと；
（ｅ）第２の結合性物質の第２のコーディングタグの情報を前記一次伸長記録タグに移行させて、二次伸長記録タグを生成するステップであって、前記第２の結合性物質が前記第１の巨大分子に結合するステップと；
（ｆ）任意選択でステップ（ｄ）〜（ｅ）を「ｎ」回の結合サイクルにわたって繰り返すステップであって、前記第１の巨大分子に結合する各結合性物質の各コーディングタグの情報を前の結合サイクルで生成した伸長記録タグに移行させて、前記第１の巨大分子を表すｎ次伸長記録タグを生成するステップと；
（ｇ）前記ｎ次伸長記録タグを解析するステップと
を含む方法。
（項目１４１）
複数の巨大分子を表す複数のｎ次伸長記録タグを生成し、解析する、項目１４０に記載の方法。
（項目１４２）
前記巨大分子が、タンパク質である、項目１４０または１４１に記載の方法。
（項目１４３）
前記巨大分子が、ペプチドである、項目１４２に記載の方法。
（項目１４４）
前記ペプチドが、生体試料由来のタンパク質を断片化することによって得られる、項目１４３に記載の方法。
（項目１４５）
前記複数の巨大分子が、多数のプールされた試料由来の巨大分子を含む、項目１４０から１４４までのいずれか一項に記載の方法。
（項目１４６）
前記記録タグが、ＤＮＡ分子、ＲＮＡ分子、ＢＮＡ分子、ＸＮＡ分子、ＬＮＡ分子、ＰＮＡ分子、γＰＮＡ分子、またはこれらの組合せである、項目１４０から１４５までのいずれか一項に記載の方法。
（項目１４７）
前記記録タグが、一意の分子識別子（ＵＭＩ）を含む、項目１４０から１４６までに記載の方法。
（項目１４８）
前記記録タグが、コンパートメントタグを含む、項目１４０から１４７までに記載の方法。
（項目１４９）
前記記録タグが、ユニバーサルプライミング部位を含む、項目１４０から１４８までのいずれか一項に記載の方法。
（項目１５０）
前記記録タグが、その３’末端にスペーサーを含む、項目１４０から１４９までのいずれか一項に記載の方法。
（項目１５１）
前記コーディングタグが、エンコーダー配列を含む、項目１４０から１５０までのいずれか一項に記載の方法。
（項目１５２）
前記コーディングタグが、ＵＭＩを含む、項目１４０から１５１までのいずれか一項に記載の方法。
（項目１５３）
前記コーディングタグが、ユニバーサルプライミング部位を含む、項目１４０から１５２までのいずれか一項に記載の方法。
（項目１５４）
前記コーディングタグが、その３’末端にスペーサーを含む、項目１４０から１５３までのいずれか一項に記載の方法。
（項目１５５）
前記コーディングタグが、結合サイクル特異的配列を含む、項目１４０から１５４までのいずれか一項に記載の方法。
（項目１５６）
前記コーディングタグが、一意の分子識別子を含む、項目１４０から１５５までのいずれか一項に記載の方法。
（項目１５７）
前記結合性物質と前記コーディングタグが、リンカーによって接合されている、項目１４０から１５６までのいずれか一項に記載の方法。
（項目１５８）
前記記録タグの情報の前記コーディングタグへの移行が、プライマー伸長によって媒介される、項目１４０から１５７までのいずれか一項に記載の方法。
（項目１５９）
前記記録タグの情報の前記コーディングタグへの移行が、ライゲーションによって媒介される、項目１４０から１５８までのいずれか一項に記載の方法。
（項目１６０）
前記複数の巨大分子、前記付随する記録タグ、またはその両方が、前記固体支持体に共有結合により接合している、項目１４０から１５９までのいずれか一項に記載の方法。
（項目１６１）
前記固体支持体が、ビーズ、多孔質ビーズ、多孔質マトリックス、アレイ、ガラス表面、シリコン表面、プラスチック表面、フィルター、膜、ナイロン、シリコンウェーハチップ、フロースルーチップ、信号変換電子機器を含むバイオチップ、マイクロタイターウェル、ＥＬＩＳＡプレート、スピン干渉ディスク、ニトロセルロースメンブレン、ニトロセルロースに基づくポリマー表面、ナノ粒子、またはマイクロスフェアである、項目１４０から１６０までのいずれか一項に記載の方法。
（項目１６２）
前記固体支持体が、ポリスチレンビーズ、ポリマービーズ、アガロースビーズ、アクリルアミドビーズ、固体コアビーズ、多孔質ビーズ、常磁性ビーズ、ガラスビーズ、または制御ポアビーズである、項目１６１に記載の方法。
（項目１６３）
前記結合性物質が、ポリペプチドまたはタンパク質である、項目１４０から１６２までのいずれか一項に記載の方法。
（項目１６４）
前記結合性物質が、改変アミノペプチダーゼ、改変アミノアシルｔＲＮＡ合成酵素、改変アンチカリン、または抗体もしくはその結合性断片である、項目１６３に記載の方法。
（項目１６５）
前記結合性物質が、単一のアミノ酸残基、ジペプチド、トリペプチドまたは前記ペプチドの翻訳後修飾に結合する、項目１４２から１６４までのいずれか一項に記載の方法。
（項目１６６）
前記結合性物質が、Ｎ末端アミノ酸残基、Ｃ末端アミノ酸残基、または内部アミノ酸残基に結合する、項目１６５に記載の方法。
（項目１６７）
前記結合性物質が、Ｎ末端ペプチド、Ｃ末端ペプチド、または内部ペプチドに結合する、項目１６５に記載の方法。
（項目１６８）
前記結合性物質が、修飾されたＮ末端アミノ酸残基、修飾されたＣ末端アミノ酸残基、または修飾された内部アミノ酸残基の化学標識に結合する、項目１４２から１６４までのいずれか一項に記載の方法。
（項目１６９）
前記結合性物質がＮ末端アミノ酸残基または前記修飾されたＮ末端アミノ酸残基の化学標識に結合し、前記Ｎ末端アミノ酸残基が各結合サイクル後に切断される、項目１６６または１６８に記載の方法。
（項目１７０）
前記結合性物質がＣ末端アミノ酸残基または前記修飾されたＣ末端アミノ酸残基に化学標識に結合し、前記Ｃ末端アミノ酸残基が各結合サイクル後に切断される、項目１６６または１６８に記載の方法。
（項目１７１）
前記Ｎ末端アミノ酸残基が、エドマン分解、エドマナーゼ、改変アミノペプチダーゼ、または改変アシルペプチドヒドロラーゼによって切断される、項目１６９に記載の方法
（項目１７２）
前記結合性物質が、アミノ酸または翻訳後修飾の部位特異的な共有結合性標識である、項目１６３に記載の方法。
（項目１７３）
前記複数のｎ次伸長記録タグを解析前に増幅させる、項目１４０から１７２までのいずれか一項に記載の方法。
（項目１７４）
前記ｎ次伸長記録タグの解析が、核酸配列決定法を含む、項目１４０から１７３までのいずれか一項に記載の方法。
（項目１７５）
複数の巨大分子を表す複数のｎ次伸長記録タグを並行して解析する、項目１７４に記載の方法。
（項目１７６）
前記核酸配列決定法が、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ポロニーシーケンシング、イオン半導体シーケンシング、またはパイロシーケンシングである、項目１７４または１７５に記載の方法。
（項目１７７）
前記核酸配列決定法が、単一分子リアルタイムシーケンシング、ナノポアに基づく配列決定、または先端顕微鏡を使用したＤＮＡのダイレクトイメージングである、項目１７４または１７５に記載の方法。

（実施例２３）
モデル系によるコーディングタグ情報の記録タグへの分子内移行の実証
ＤＮＡモデル系を使用して、ビーズに固定化されている記録タグへのコーディングタグ情報の「分子内」移行を試験した（図３６Ａを参照されたい）。２つの異なるタイプの記録タグオリゴヌクレオチドを使用した。ｓａＲＴ＿Ａｂｃ＿ｖ２（配列番号１４１）は、「Ａ」ＤＮＡ捕捉配列（配列番号１５５）（「Ａ’」結合性物質の模倣エピトープ）および対応する「Ａ」バーコード（ｒｔＡ＿ＢＣ）を含んでいた。ｓａＲＴ＿Ｂｂｃ＿Ｖ２（配列番号１４２）は、「Ｂ」ＤＮＡ捕捉配列（配列番号１５６）（「Ｂ’」結合性物質の模倣エピトープ）および対応する「Ｂ」バーコード（ｒｔＢ＿ＢＣ）を含んでいた。これらバーコードは、基本的な６５セットの１５ｍｅｒバーコード（配列番号１〜６５）およびそれらのリバース相補的配列（配列番号６６〜１３０）の組合せだった。ｒｔＡ＿ＢＣは、２つのバーコード、ＢＣ＿１およびＢＣ＿２の同鎖上の組合せであり、ｒｔＢ＿ＢＣは、１つのバーコード、ＢＣ＿３のみである。同様に、コーディングタグのバーコード（エンコーダー配列）も、６５個の１５ｍｅｒバーコード（配列番号１〜６５）の基本的なセットに由来するバーコードで構成されていた。ＣＴ＿Ａ’−ｂｃ＿１ＰＥＧ（配列番号１４４）およびＣＴ＿Ｂ’−ｂｃ（配列番号１４７）コーディングタグは、それぞれ相補的捕捉配列Ａ’およびＢ’で構成され、それぞれ１５ｍｅｒバーコードＢＣ＿５、およびＢＣ＿５＆ＢＣ＿６と割り当てた。記録タグおよびコーディングタグのこの設計設定により、容易なゲル解析が可能になる。所望の「分子内」プライマー伸長は、類似サイズのオリゴヌクレオチド産物を生成するが、望ましくない「分子間」伸長は、「分子内」産物よりも１５塩基大きな１つのオリゴ産物および１５塩基短い別のオリゴ産物を生成する（図３６Ｂ）。

Claims

明細書に記載の発明。