[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6905934B2 - 腫瘍試料の多重遺伝子分析 - Google Patents

腫瘍試料の多重遺伝子分析 Download PDF

Info

Publication number
JP6905934B2
JP6905934B2 JP2017530219A JP2017530219A JP6905934B2 JP 6905934 B2 JP6905934 B2 JP 6905934B2 JP 2017530219 A JP2017530219 A JP 2017530219A JP 2017530219 A JP2017530219 A JP 2017530219A JP 6905934 B2 JP6905934 B2 JP 6905934B2
Authority
JP
Japan
Prior art keywords
section
sequence
subgenome
segment
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017530219A
Other languages
English (en)
Other versions
JP2018502563A (ja
JP2018502563A5 (ja
Inventor
オットー,ジェフリー・アラン
ナハス,ミッシェル
リプソン,ドロン
Original Assignee
ファウンデーション・メディシン・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファウンデーション・メディシン・インコーポレイテッド filed Critical ファウンデーション・メディシン・インコーポレイテッド
Publication of JP2018502563A publication Critical patent/JP2018502563A/ja
Publication of JP2018502563A5 publication Critical patent/JP2018502563A5/ja
Priority to JP2021106868A priority Critical patent/JP7245872B2/ja
Application granted granted Critical
Publication of JP6905934B2 publication Critical patent/JP6905934B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Data Mining & Analysis (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

関連出願に対する相互参照
本願は、2014年12月5日に出願された米国仮出願第62/088,457号の優先権を主張するものであり、前記出願の内容は、参照によりその全体が本明細書に組み込まれる。
配列リスト
本願は、ASCII形式で電子出願された配列リストを含有し、その全体が参照により本明細書に組み込まれる。2015年12月3日に作成された前記ASCIIコピーは、F2036−7056WO_SL.txtという名称で、サイズは1,172バイトである。
本発明は、腫瘍試料からの核酸を分析するための最適化された方法、例えば、最適化された核酸選択、リードアライメントおよび突然変異呼び出しを統合した方法に関する。
癌細胞のゲノム試験は、癌のより良好な理解の発展と、より効果的な処置アプローチの管理に対する著しい有望性を示す。ゲノム試験は、患者の癌細胞のゲノムの配列決定、およびそれらの細胞における何らかのゲノム変化の同定を含む。ゲノム変化には、とりわけ、例えば、突然変異、塩基置換、再編成、欠失、挿入が含まれ得る。特定の患者の癌に見られる場合、これらのゲノム変化を理解することは、より良好な処置を開発することにも役立ち、ゲノム変化情報を用いて特定の癌変異体を処置するための最良のアプローチを特定することに役立ち得る。
本明細書中に記載の方法は、関心領域を評価するための、例えば試料中の関心領域のクローンプロファイルを評価するための、ベイトセットへの試料核酸のハイブリダイゼーションの使用を提供する。例えば、本明細書中に記載の方法によって、体細胞変化、例えば、再編成または体細胞高頻度変異にさらされている遺伝子座の存在量または構造の分析が可能になる。本明細書中に記載の方法によって、選択配列、例えばVセグメント、または他の配列、例えば免疫グロブリン配列、B細胞受容体(BCR)配列、またはT細胞受容体(TCR)配列の再編成および発現の評価が可能になる。本明細書中に記載の方法は、例えば選択されたシグネチャーまたはそれらを含有する細胞の相対的存在量を提供する、クローン分析を可能にする。典型的な非限定的な用途は、体細胞再編成抗体およびB細胞受容体またはT細胞受容体遺伝子におけるV、DまたJセグメントの使用を評価することである。本方法は、ゲノムレベル(例えば染色体DNAの分析)または転写レベル(例えばmRNAの分析)またはその両方で行い得る。一実施形態において、本方法は、第1の対象区間のクローンプロファイルおよび第2の予め選択された対象区間の配列、例えばVセグメントのクローンプロファイル、および別の遺伝子、例えば癌遺伝子における突然変異の出現または不在を提供する。一実施形態において、第1の細胞タイプにおける第1の対象区間のクローンプロファイルが提供される。別の実施形態において、第2の細胞タイプにおける第2の対象区間の配列が提供される。例えば、第1の細胞タイプは非悪性細胞、例えば腫瘍浸潤リンパ球(TIL)であり得、第2の細胞タイプは悪性細胞であり得る。第1の細胞タイプおよび第2の細胞タイプは、患者からの同じ試料、例えば腫瘍試料から得ることができる。したがって、本方法は、クローンプロファイルおよび体細胞突然変異、例えば、疾患、例えば癌に関連する体細胞突然変異の統合分析を提供する。
したがって、一態様において、本発明は、対象における、対象区間、例えばサブゲノム区間または発現サブゲノム区間(またはそれを含有する細胞)のクローンプロファイルを評価または提供する方法であって、
(a)各メンバーが対象からの核酸を含む複数のメンバー、例えば固形腫瘍または血液悪性腫瘍(または前悪性腫瘍)試料からの複数の腫瘍メンバー、を含む核酸ライブラリを得て;
(b)それぞれが対象区間を含む複数の選択メンバーまたはその一部(本明細書ではライブラリキャッチと呼ばれることがある。)を提供するために、ライブラリをベイトセットと接触させ;
(c)例えば、対象区間の増幅配列を提供するために、複数の選択メンバーの各メンバーを増幅してもよく;
(d)対象区間の1回以上の出現の配列を得て、それによって対象区間のクローンプロファイルを提供または評価する
ことを含む方法を特徴とする。一実施形態において、段階(a)は、対象からの核酸を断片化する、例えばせん断することを含む。
一実施形態において、段階(b)は、溶液ハイブリダイゼーションの条件下でライブラリをベイトセットと接触させることを含む。
一実施形態において、段階(b)は、表面ベースのハイブリダイゼーションの条件下でライブラリをベイトセットと接触させることを含む。
一実施形態において、段階(b)は、表面上のベイトセット、例えば複数のベイトを含む基材上に配置されたベイトセットとライブラリを接触させることを含む。
一実施形態において、段階(c)は、メンバー中の標的/対象核酸との配列特異的相互作用に依存するかまたはそれを含む方法によって、例えば、メンバー中の標的/対象核酸に結合するプライマーを用いて、複数の選択メンバーの各メンバーを増幅することによって、複数の選択メンバーの各メンバーを増幅することを含む。
一実施形態において、段階(c)は、プライマー対を用いて複数の選択メンバーの各メンバーを増幅することを含み、そのメンバーの標的/対象核酸にプライマー対の少なくとも一方のメンバーが結合しない。
一実施形態において、段階(c)は、メンバー中の標的/対象核酸との配列特異的相互作用に依存しないか、またはそれを含まない方法によって複数の選択メンバーの各メンバーを増幅すること含む。
一実施形態において、段階(c)は、メンバー中の標的/対象核酸に結合しないプライマー対を用いて複数の選択メンバーの各メンバーを増幅することによって、複数の選択メンバーの各メンバーを増幅することを含む。
一実施形態において、対象区間はサブゲノム区間を含む。
一実施形態において、対象区間は発現サブゲノム区間を含む。
一実施形態において、本方法は、サブゲノム区間および発現サブゲノム区間のクローンプロファイルを評価することを含む。
一実施形態において、本方法は、対象区間での第1の対立遺伝子またはシグネチャー(例えば第1のVセグメント)の配列を、比較値、例えば予め選択された値、例えば第2の対立遺伝子またはシグネチャー(例えば第2のVセグメント)の配列の関数である値と比較することを含む。
一実施形態において、本方法は、
(e)(i)対象区間での配列、シグネチャーまたは対立遺伝子の分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)、存在量または同一性、例えば配列、シグネチャーもしくは対立遺伝子の相対的存在量、または対象区間での複数の配列、シグネチャーもしくは対立遺伝子のそれぞれの相対的存在量についての値;または
(ii)可変性、例えば、体細胞高頻度変異から生じる配列可変性、例えば連結部でのインデルの形成による、VD、DJまたはVJ連結、またはCDR、例えば重鎖CDR3から生じる配列可変性、シグネチャーまたは対象区間内の配列可変性についての値であって、例えば、可変性についての値が、対象または試料中の対象区間について存在する異なる変異体の数の関数である値
を得ることをさらに含む。
一実施形態において、(i)は、対象区間での第1の配列、対立遺伝子またはシグネチャーの存在量に対する、対象区間での第1の配列、対立遺伝子またはシグネチャーの相対的存在量についての値を得ることを含む。一実施形態において、(i)は、第2の対象区間での第2の配列、対立遺伝子またはシグネチャーの存在量に対する、対象区間での第1の配列、対立遺伝子またはシグネチャーの相対的存在量についての値を得ることを含む。
一実施形態において、(i)は、対象区間での複数の配列、対立遺伝子またはシグネチャーの存在量に対する、対象区間での第1の配列、対立遺伝子またはシグネチャーの相対的存在量についての値を得ることを含む。
一実施形態において、(i)は、発現サブゲノム区間で、配列、対立遺伝子またはシグネチャー、例えば再編成、例えば転座の出現またはレベルについての値を得ることを含む。
一実施形態において、本方法は、対応するサブゲノム区間での、配列、対立遺伝子またはシグネチャー、例えば再編成、例えば転座の出現またはレベルについての値を得ることをさらに含む。
一実施形態において、(ii)は、対象区間で生じる、異なる配列、対立遺伝子またはシグネチャーの数についての値を得ることを含む。
一実施形態において、本方法は、(e)(i)を得ることを含む。
一実施形態において、本方法は、シグネチャーに対して(e)(i)を得ることを含む。
一実施形態において、本方法は、対立遺伝子に対して(e)(i)を得ることを含む。
一実施形態において、本方法は、(e)(ii)を得ることを含む。
一実施形態において、本方法は、第1の対象区間での、配列、対立遺伝子またはシグネチャー、例えばVセグメント、またはVDJもしくはVJ再編成のクローンプロファイル;および
i)対象の表現型、例えば疾患状態;または
ii)第2の対象区間での遺伝子型、例えば表1〜9から選択される遺伝子またはMHC遺伝子、例えばMHCクラスIまたはMHCクラスII遺伝子の遺伝子型、
を提供することを含む。
一実施形態において、表現型は、
感染因子、例えば、細菌、ウイルス、原生動物または真菌による感染;
疾患のステージ;
障害、例えば癌の遺伝子型の変化;
障害の発現における変化、例えば癌の場合、処置に対する攻撃性もしくは耐性における変化、例えば癌の場合、転移の発現;
処置発現(treatment develops)への反応性;
疾患または障害の進行、再燃、再発または持続;
疾患に関連する薬剤への事前の曝露;
抗原またはワクチンへの事前の曝露もしくは反応;
対象からのプロテオミクスデータ;
年齢;
性別;
体重;
病歴、例えば、疾患の既往歴もしくは以前の処置;または
環境的もしくは職業的要因
を含む。
一実施形態において、第2の対象区間での遺伝子型は、例えば表1〜9からの遺伝子における、体細胞突然変異、例えば再編成、例えば転座を含む。
一実施形態において、段階(d)は:
(i)対象区間の複数の出現のそれぞれの配列を得て、例えば、Vセグメントを含む対象区間の第1の出現およびVセグメントを含む区間の第2の出現の配列を得ることを含み、この第1および第2の出現は、VD、DJまたはVJ連結部での多様性によって異なるか;または
(ii)第1の対象区間および第2の異なる対象区間の配列を得ることを含み、例えば第1の対象区間は第1の遺伝子からの配列を含み、第2の対象区間は第2の遺伝子からの配列を含む。
一実施形態において、段階(d)は、対象区間の複数の出現、例えば、VDJ配列を含む対象区間の複数の出現、例えば、特定のVセグメント、特定のDセグメントおよび特定のJセグメントを含むVDJ配列を含む対象区間の複数の出現、のそれぞれの配列を得ることを含む。
一実施形態において、対象区間の複数の出現の第1の出現は、サブゲノム区間を含む。
一実施形態において、対象区間の複数の出現の第2の出現は、サブゲノム区間を含む。
一実施形態において、対象区間の複数の出現の第1の出現は、発現サブゲノム区間を含む。
一実施形態において、対象区間の複数の出現の第2の出現は、発現サブゲノム区間を含む。
一実施形態において、対象区間の複数の出現の第1の出現は、サブゲノム区間、例えば再編成、例えば転座を含み;対象区間の複数の出現の第2の出現は、発現サブゲノム区間、例えばサブゲノム区間に対応する発現サブゲノム区間を含み、これは例えば、ゲノムの、例えば体細胞ゲノムの再編成の発現の評価を可能にし、例えばゲノム再編成およびその発現の相対的存在量の評価を可能にする。
一実施形態において、本方法は、サブゲノム区間に存在するシグネチャーの発現の出現またはレベルを評価することを含む。
一実施形態において、段階(d)は、第1の対象区間および第2の異なる対象区間の配列を得ることを含み、例えば、第1および第2の区間は、対象区間からの異なるゲノム配列、例えば第1の遺伝子からの配列および第2の遺伝子からの配列に対応する。
一実施形態において、第1の対象区間はVDJセグメントの第1の組み合わせを含み、第2の対象区間はVDJセグメントの第2の組み合わせを含み、例えば第1の対象区間は第1のVセグメントを含み、第2の対象区間は第2のVセグメントを含む。
一実施形態において、第1の対象区間は第1のサブゲノム区間を含み、第2の対象区間は第2のサブゲノム区間を含む。
一実施形態において、第1の対象区間は第1の発現サブゲノム区間を含み、第2の対象区間は第2の発現サブゲノム区間を含む。
一実施形態において、第1の対象区間はサブゲノム区間を含み、第2の対象区間は発現サブゲノム区間を含む。
一実施形態において、評価することは、癌の第1のクローンに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、癌の第2のクローンに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、例えば参照物に対する、例えば、癌の第2のクローンの存在量に対する、癌の第1クローンの存在量についての値を提供することを含む。
一実施形態において、本方法は、遺伝子型を含む癌の第1のクローンおよび第2の遺伝子型を含む第2のクローンの相対的存在量を提供することを含む。
一実施形態において、本方法は、第1の突然変異、例えば再編成を含む癌の第1のクローンおよび突然変異を含まない第2のクローンの相対的存在量を提供することを含む。
一実施形態において、本方法は、第1の突然変異、例えば再編成、例えば転座を含む癌の第1のクローンおよび第2の突然変異、例えば再編成、例えば転位を含む第2のものを含まない第2のクローンの相対的存在量を提供することを含む。
一実施形態において、評価することは、第1のVセグメントに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第2のVセグメントに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第1のVセグメントおよび第2のVセグメントの相対的存在量についての値を提供することを含む。
一実施形態において、評価することは、第1のDセグメントに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第2のDセグメントに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第1のDセグメントおよび第2のDセグメントの相対的存在量についての値を提供することを含む。
一実施形態において、評価することは、第1のJセグメントに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第2のJセグメントに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第1のJセグメントおよび第2のJセグメントの相対的存在量についての値を提供することを含む。
一実施形態において、評価することは、第1のVDJまたはVJの組み合わせに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第2のVDJまたはVJの組み合わせに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、第1のVDJまたはVJの組み合わせおよび第2のVDJまたはVJの組み合わせの相対的存在量についての値を提供することを含む。
一実施形態において、評価することは、抗体軽鎖に対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、抗体重鎖に対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、抗体軽鎖および抗体重鎖の相対的存在量の値を提供することを含む。
一実施形態において、評価することは、サブゲノム区間における配列、対立遺伝子またはシグネチャーに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、発現サブゲノム区間中の配列、対立遺伝子またはシグネチャーに対するクローンプロファイルを提供することを含む。
一実施形態において、評価することは、サブゲノム区間中の配列、対立遺伝子またはシグネチャーに対する、および発現サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての相対的存在量についての値を提供することを含む。
一実施形態において、評価することは、対象区間中の遺伝子座、例えばV、D、またはJセグメントにおける高頻度変異に対する可変性を提供することを含む。
一実施形態において、評価することは、例えば対象区間において連結部でインデルを形成することによって、VD、DJまたはVJ連結部から生じる可変性を提供することを含む。
一実施形態において、評価することは、対象区間においてCDR、例えば重鎖CDR3における可変性を提供することを含む。
一実施形態において、評価することは、表10からの配列(またはその配列を含む細胞)に対するクローンプロファイルを提供することを含む。
Figure 0006905934
一実施形態において、本方法は、(e)(i)についての値を得ることを含む。
一実施形態において、(e)(i)の値は、比較値、例えば予め選択された値、例えば第2の配列、シグネチャーまたは対立遺伝子(例えば第2のVセグメント)の存在量の関数である値に対する、対象区間における配列、シグネチャーまたは対立遺伝子(例えば第1のVセグメント)の存在量についての値を含む。
一実施形態において、(e)(i)の値は、比較値、例えば予め選択された値、例えば事象を欠く配列、例えば対象区間中の非突然変異または非再編成配列の存在量の関数である値に対する、対象区間における事象、例えば配列、対立遺伝子またはシグネチャー、例えば突然変異または再編成の存在量についての値を含む。
一実施形態において、(e)(i)の値は、対象区間でX個の固有の(すなわち互いに異なる)配列、シグネチャーまたは対立遺伝子のそれぞれについての相対的存在量の値を含む。
一実施形態において、Xは、3、4、5、6、7、8、9、10、20、30、40、50、100または200以上である。
一実施形態において、Xは、1,000、10,000、100,000、1,000,000、10,000,000または50,000,000以上である。
一実施形態において、本方法は、例えば、存在量の関数、例えば相対的存在量として、例えばヒストグラムとして、(e)(i)の値を表示することをさらに含む。
一実施形態において、対象区間は、Igスーパーファミリー受容体、例えばT細胞受容体またはB細胞受容体からの配列を含む。
一実施形態において、対象区間は、Vセグメント、DセグメントまたはJセグメントからの配列を含む。
一実施形態において、対象区間は、表10からの配列を含む。
一実施形態において、本方法は、Vセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、複数の、Vセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、Jセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、複数の、Jセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、Dセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、複数の、Dセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、クラススイッチ領域配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、複数の、クラススイッチ領域配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む。
一実施形態において、本方法は、(e)(i)および(e)(ii)を得ることを含む。
一実施形態において、本方法は、(e)(ii)についての値を得ることを含む。
一実施形態において、本方法は、体細胞高頻度変異からの可変性についての値を得ることを含む。
一実施形態において、本方法は、例えば、連結部でのインデルの形成によってVD、DJまたはVJ連結部から生じる可変性についての値を得ることを含む。
一実施形態において、本方法は、CDR、例えば重鎖CDR3可変性から生じる可変性についての値を得ることを含む。
一実施形態において、対象区間は、表10からの配列を含む。
一実施形態において、本方法は、対象区間の複数の固有のコピー、例えば、対象区間での複数の固有のシグネチャー、の配列を得ることを含む。
一実施形態において、(e)(ii)における値は、対象区間に対する複数の、例えばX個のシグネチャーにおける配列多様性についての値を含む。
一実施形態において、値は、対象区間での固有のシグネチャーの数を含む。
一実施形態において、値は、対象区間での固有のシグネチャーの表示、記録または一覧を含む。
一実施形態において、値は、例えば、対象区間の総コピーの関数としての固有のコピーの数の尺度を含む。
一実施形態において、Xは、3、4、5、6、7、8、9、10、20、30、40、50、100、200、300、400または500以上である。
一実施形態において、Xは、1,000、10,000、100,000、1,000,000、10,000,000または50,000,000以上である。
一実施形態において、複数のシグネチャーは全て、単一のVDJまたはVJの組み合わせに対するものであり、例えば、選択されたVDJまたはVJの組み合わせにおける配列多様性についての値を提供する。
一実施形態において、可変性は、セグメント連結、例えば、VD、DJまたはVJ連結部での多様性、例えば連結部での挿入または欠失からの可変性を含む。
一実施形態において、可変性は、体細胞高頻度変異からの可変性を含む。
一実施形態において、複数のシグネチャーのそれぞれは、異なるVDJまたはVJの組み合わせに対するものである。
一実施形態において、可変性は、セグメント連結部、例えば、VD、DJまたはVJ連結部での多様性、例えば連結部での挿入または欠失からの可変性を含む。
一実施形態において、ライブラリは、例えば、B細胞悪性腫瘍を含む対象、例えばマントル細胞癌を含む対象からのB細胞から作製される。
一実施形態において、対象区間は、B細胞受容体からの、V、DもしくはJセグメントまたはVDもしくはDJ連結部をコードする配列を含む。
一実施形態において、本方法は、可変性、例えば体細胞高頻度変異、の量を比較値と比較することをさらに含み、比較値との予め選択された関係、例えば比較値より大きいことは、疾患の、転帰、予後またはステージを示す。
一実施形態において、本方法は、ライブラリを単一のベイトセットと接触させることを含む。
一実施形態において、本方法は、ライブラリを複数のベイトセットと接触させることを含む。
一実施形態において、本方法は、
対象区間での配列;
対象区間でのシグネチャー;または
対象区間での対立遺伝子
を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、
対象区間での第2の配列;
対象区間での第2のシグネチャー;または
対象区間での第2の対立遺伝子
を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する第2のベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、複数の、例えば少なくともX個の固有のベイトセットと接触させることを含み、複数のベイトセットのそれぞれは、
対象区間からの異なる配列;
対象区間での異なるシグネチャー;または
対象区間での異なる対立遺伝子
を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはこれとハイブリッド形成し、
Xは、2、3、4、5、6、7、8、9、10、50、100または200と同等である。
一実施形態において、本方法は、
対象区間での第1の配列および第2の配列;
対象区間での第1のシグネチャーおよび第2のシグネチャー;または
対象区間での第1の対立遺伝子および第2の対立遺伝子
を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含む。
一実施形態において、本方法は、
対象区間からの少なくともX個の配列;
対象区間での少なくともX個のシグネチャー;または
対象区間での少なくともX個の対立遺伝子
を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含み、
Xは、独立に、2、3、4、5、6、7、8、9、10、50、100または200と同等である。
一実施形態において、本方法は、対象もしくは試料における対象区間で存在しない、第1の配列、対立遺伝子もしくはシグネチャーを捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含む。
一実施形態において、対象区間は、表10からの配列を含む。
一実施形態において、本方法は、第1のV、DもしくはJセグメントからの配列および第2のV、DもしくはJセグメントからの配列を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含む。
一実施形態において、対象区間は、V、DまたはJセグメントの配列を含む。
一実施形態において、本方法は、Vセグメント(DまたはJセグメントではない。)を捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、Dセグメント(VまたはJセグメントではない。)を捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、Jセグメント(VまたはDセグメントではない。)を捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、Vセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、Dセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、Jセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、VD、DJまたはVJ連結部にまたがる(1つまたは複数の)ベイトを含むベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、再編成されたVDJまたはVJ配列にまたがる(1つまたは複数の)ベイトを含むベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、核酸類似体、例えばロックド核酸(LNA)、ペプチド核酸(PNA)または二環式核酸(BNA)を含む(1つまたは複数の)ベイトを含むベイトセットとライブラリを接触させることを含む。
一実施形態において、本方法は、機能的であるために十分に長いが、親和性最適化に十分短い(1つまたは複数の)ベイトを含むベイトセットとライブラリを接触させることを含む。
一実施形態において、対象区間はサブゲノム区間を含む。
一実施形態において、対象区間は発現サブゲノム区間を含む。
一実施形態において、本方法は、サブゲノム区間の配列を得ることおよび発現サブゲノム区間の配列を得ることを含む。
一実施形態において、本方法は、サブゲノム区間のクローンプロファイルを評価することを含む。
一実施形態において、本方法は、発現サブゲノム区間のクローンプロファイルを評価することを含む。
一実施形態において、本方法は、サブゲノム区間のクローンプロファイルを評価することおよび発現サブゲノム区間のクローンプロファイルを評価することを含む。
一実施形態において、本方法は、サブゲノム区間に存在するシグネチャーの発現の出現またはレベルを評価することを含み、例えば、シグネチャー、例えば再編成、例えば転座が対応するサブゲノム区間に存在する。
一実施形態において、本方法は、サブゲノム区間に存在するシグネチャーの発現の出現またはレベルを評価することを含み、例えば、シグネチャー、例えば再編成、例えば転座は、対応するサブゲノム区間における存在量の関数である。
一実施形態において、本方法は、サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての、および発現サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての相対的存在量についての値を提供することを含む評価することを含む。
一実施形態において、本方法は、対象区間の複数の出現のそれぞれの配列を得ることを含み;
段階(a)、(b)および(c)のうちの1つが、対象区間の第1の出現および対象区間の第2の出現に対して個別に行われ、例えば段階(a)、(b)および(c)のうち1つが、第1の出現に対して第1の反応混合物中で、および第2の出現に対して第2の反応混合物中で行われる。
一実施形態において、(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または(a)、(b)および(c)は個別に行われる。
一実施形態において、対象区間の複数の固有のコピーの第1のコピーは、サブゲノム区間を含む。
一実施形態において、対象区間の複数の固有のコピーの第2のコピーは、サブゲノム区間、例えばサブゲノム区間に対応する発現サブゲノム区間を含む。
一実施形態において、複数のうち第1の出現はサブゲノム区間を含み、例えばこのサブゲノム区間は、VDJ配列、例えば、特定のVセグメント、特定のDセグメントおよび特定のJセグメントを含むVDJ配列を含み;
複数のうち第2の出現は発現サブゲノム区間を含み、例えばこの発現サブゲノム区間は、VDJ配列、例えば特定のVセグメント、特定のDセグメントおよび特定のJセグメントを含むVDJ配列を含む。
一実施形態において、対象区間の第1の出現は、発現サブゲノム区間を含む。
一実施形態において、対象区間の第2の出現は、発現サブゲノム区間を含む。
一実施形態において、本方法は、対象区間の複数の出現のそれぞれの配列を得ることを含み;
段階(a)、(b)および(c)のうちの少なくとも1つが、対象区間の第1の出現に対しておよび対象区間の第2の出現に対して同じ反応混合物中で行われる。
一実施形態において、(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが同じ反応混合物中で行われる。
一実施形態において、
段階(b)において、対象区間の複数の出現の第1のコピーを第1のベイトセットと接触させ、
段階(b)において、対象区間の第2の出現を第2のベイトセット、例えば、第1のベイトセット中の何れのベイトとも異なる配列を含むベイトを含む第2のベイトセットと接触させる。
一実施形態において、段階(b)において、対象区間の複数の固有のコピーの第1のコピーをベイトセットと接触させ;段階(b)において、対象区間の複数の固有のコピーの第2のコピーを同じベイトセットと接触させ、例えば両方のベイトセットが同じ(1つまたは複数の)ベイトを含む。
一実施形態において、本方法は、対象区間および第2の異なる対象区間(異なるとは、異なる染色体位置から、を意味する。)の配列を得ることを含み、段階(a)、(b)および(c)のうち1つは、第1の対象区間のために第1の反応混合物において、および第2の対象区間のために第2の反応混合物中で行われる。
一実施形態において、(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが個別に行われる。
一実施形態において、対象区間はサブゲノム区間を含む。
一実施形態において、第2の異なる対象区間はサブゲノム区間を含む。
一実施形態において、第1の対象区間は発現サブゲノム区間を含む。
一実施形態において、第2の異なる対象区間は発現サブゲノム区間を含む。
一実施形態において、第1の対象区間はサブゲノム区間を含み、第2の異なる対象区間は発現サブゲノム区間を含む。
一実施形態において、本方法は、対象区間および第2の異なる対象区間(異なるとは、異なる染色体位置から、を意味する。)の配列を得ることを含み、段階(a)、(b)および(c)のうち少なくとも1つは、第1の対象区間のためにおよび第2の対象区間のために同じ反応混合物中で行われる。
一実施形態において、(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが同じ反応混合物中で行われる。
一実施形態において、段階(b)において、第1の対象区間を第1のベイトセットと接触させ;段階(b)において、第2の対象区間を第2のベイトセット、例えば、第1のベイトセット中の何れのベイトとも異なる配列を含むベイトを含む第2のベイトセットと接触させる。
一実施形態において、段階(b)において、第1の対象区間をベイトセットと接触させ;段階(b)において、第2の対象区間を同じベイトセットと接触させ、例えば両方のベイトセットが同じ(1つまたは複数の)ベイトを含む。
一実施形態において、本方法は、段階(a)〜(d)を反復すること段階を含む。
一実施形態において、本方法は、次の1つ以上の後に、段階(a)〜(d)を反復することを含む:
予め選択された期間の経過;
障害、例えば癌の遺伝子型変化;
障害の発現における変化、例えば癌の場合は、処置に対する攻撃性または耐性における変化、例えば癌の場合は、転移の発現;
処置発現(treatment develops)への反応性欠如;または
疾患もしくは障害の進行、再燃、再発または持続性。
一実施形態において、ライブラリは染色体DNAから作製される。
一実施形態において、ライブラリは、RNA、例えばmRNAから作製される。
一実施形態において、本方法は:
(a)染色体DNAから作製されたライブラリからのサブゲノム区間のクローンプロファイルを評価すること;
(b)RNA、例えばmRNAから作製されたライブラリからの発現サブゲノム区間のクローンプロファイルを評価すること;および
例えば対象区間の選択配列、対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む。
一実施形態において、段階(a)およびまたは(b)は、
(i)対象区間での対立遺伝子の分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)存在量または同一性、例えば、対象区間での、相対的存在量、対立遺伝子または複数の対立遺伝子のそれぞれの相対的存在量についての値;または
(ii)対象区間でのシグネチャーの分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)存在量または同一性、例えば、対象区間での、相対的存在量、シグネチャー、または複数のシグネチャーのそれぞれの相対的存在量についての値;または
(iii)シグネチャーまたは対象区間内の可変性、例えば体細胞高頻度変異についての値
を得ることを含む。
一実施形態において、
段階(a)は(i)を含み、段階(b)は(i)を含むか;
段階(a)は(i)を含み、段階(b)は(ii)を含むか;
段階(a)は(i)を含み、段階(b)は(iii)を含むか;
段階(a)は(ii)を含み、段階(b)は(i)を含むか;
段階(a)は(ii)を含み、段階(b)は(ii)を含むか;
段階(a)は(ii)を含み、段階(b)は(iii)を含むか;
段階(a)は(iii)を含み、段階(b)は(i)を含むか;
段階(a)は(iii)を含み、段階(b)は(ii)を含むか;または
段階(a)は(iii)を含み、段階(b)は(iii)を含む。
一実施形態において、ライブラリは、疾患状態組織から、例えば癌細胞から作製される。
一実施形態において、ライブラリは、固形腫瘍、例えば本明細書中に記載の固形腫瘍からの細胞から作製される。
一実施形態において、ライブラリは、浸潤固形腫瘍、例えば本明細書中に記載の固形腫瘍を有する細胞、例えばB細胞またはT細胞から作製される。
一実施形態において、ライブラリは、血液悪性腫瘍(または前悪性腫瘍)、例えば、本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)からの細胞から作製される。
一実施形態において、ライブラリは無細胞DNAから作製される。
一実施形態において、ライブラリは、非疾患状態の組織から作製される。
一実施形態において、ライブラリは、末梢血、骨髄、腫瘍組織、腫瘍浸潤細胞、リンパ球、B細胞、プレB細胞、成熟B細胞、T細胞または無細胞DNAから作製される。
一実施形態において、ライブラリは、腫瘍浸潤細胞、例えば腫瘍浸潤B細胞、プレB細胞、成熟B細胞またはT細胞から作製される。
一実施形態において、ライブラリは、末梢B細胞、プレB細胞、成熟B細胞またはT細胞、例えばCD4+もしくはCD8+、T細胞から作製される。
一実施形態において、本方法は、非疾患状態組織、例えば腫瘍を付随しない細胞、例えば非腫瘍細胞、または末梢血リンパ球に対するクローンプロファイルを評価することを含む。
一実施形態において、本方法は、疾患状態組織、例えば腫瘍細胞または腫瘍浸潤細胞に対する、または非癌性障害に対するクローンプロファイルを評価することを含む。
一実施形態において、ライブラリはT細胞から作製され、サブゲノム区間はT細胞受容体、例えばアルファ/ベータまたはデルタ/ガンマ、TCR鎖をコードする配列を含む。
一実施形態において、本方法は、
(a)第1の細胞タイプからの、例えば、第1の細胞タイプから作製された、例えば、第1の細胞タイプからの染色体DNAまたはRNA、例えばmRNAから作製されたライブラリからの、対象区間のクローンプロファイルを評価すること;
(b)第2の細胞タイプからの、例えば、第2の細胞タイプから作製された、例えば、第2の細胞タイプからの染色体DNAまたはRNA、例えばmRNAから作製されたライブラリからの、対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、(a)および(b)で提供される評価を比較してもよいこと
を含む。
一実施形態において、本方法は、
(a)第1の細胞タイプからの対象区間のクローンプロファイルを評価すること;
(b)第2の細胞タイプからの対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む。
一実施形態において、本方法は:
(a)染色体DNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;
(b)RNA、例えばmRNA、例えばcDNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む。
一実施形態において、本方法は、
(a)第1の期間に対象区間のクローンプロファイルを評価すること;
(b)第2の期間に対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む。
一実施形態において、この第1の期間は予め選択された事象の前であり、第2の期間は予め選択された事象の後であり、この予め選択された事象は、感染、医学的または外科的手順、例えば移植、診断、処置、例えば第1選択の処置もしくは第2選択の処置を受けること、再発または再燃または疾患を含み得る。
一実施形態において、本方法は、
疾患状態細胞からの対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること;および
疾患状態細胞からの対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること
を含む。
一実施形態において、本方法は、
疾患状態細胞からの第1の対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること;および
疾患状態細胞からの第2の異なる対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること
を含む。
一実施形態において、対象は癌を有する。別の実施形態において、対象は、血液悪性腫瘍(または前悪性腫瘍)を有する。さらに別の実施形態において、対象は固形腫瘍を有する。
一実施形態において、ライブラリはB細胞から作製され、対象はB細胞悪性腫瘍、例えばマントル細胞癌を有する。
一実施形態において、対象は癌以外の障害を有する。
一実施形態において、対象は、免疫障害、例えば自己免疫障害、免疫不全、例えば遺伝性もしくは後天性免疫不全、例えばAIDSまたはHIV感染を有する。
一実施形態において、対象は、移植片レシピエント、例えば、骨髄レシピエント、実質臓器レシピエントまたは皮膚移植片レシピエントである。
一実施形態において、対象は、感染または感染性疾患、例えば、ウイルス性、細菌性、原生動物性または真菌性の感染もしくは疾患を有する。
一実施形態において、対象区間は、クローン事象を代表する、ヌクレオチド位置または連結部または配列を含む。
一実施形態において、対象区間は、T細胞クローンまたはB細胞クローンを代表する、ヌクレオチド位置または連結部または配列を含む。
一実施形態において、段階(c)または本方法は、メンバー中の標的/対象核酸との配列特異的相互作用に依存する方法によって、例えば、メンバー中の標的/対象核酸に結合するプライマーを用いて、複数のものの各メンバーを増幅することによって、複数のものの各メンバーまたは何れかのメンバーを増幅することを含まない。
一実施形態において、段階(d)は、
前記ライブラリからのメンバー(またはライブラリキャッチ)からの対象区間に対するリードを得て;
複数のメンバーのそれぞれについて、対象区間内のヌクレオチド位置に対するリードからヌクレオチド値を割り当てること
を含む。
一実施形態において、本方法は、複数のメンバーの各メンバー中の対象からの核酸の5’または3’末端にアダプター配列を付着させる、例えば連結することを含む。
一実施形態において、本方法は、複数のメンバーの各メンバー中の対象からの核酸の5’および3’末端にアダプター配列を付着させる、例えば連結することを含む。
一実施形態において、前記の複数のメンバーの各メンバーは、5’から3’方向に、5’アダプター配列、対象配列(例えばゲノム配列または転写配列)および3’アダプターを含む。
一実施形態において、前記の複数のメンバーの各メンバーは、5’から3’方向に、5’アダプター配列、対象配列(例えばゲノム配列または転写配列)および3’アダプターを含み、このアダプターのうち1つは、識別子、例えばバーコードとして機能し得る配列を含む。
一実施形態において、この複数メンバーの各メンバーは、アダプター配列に特異的なプライマーを用いて増幅される。
一実施形態において、この複数メンバーの各メンバーは、5’アダプターに結合するプライマーまたは3’アダプターに結合するプライマーを含むプライマーセットを用いて増幅される。
一実施形態において、この複数メンバーの各メンバーは、5’アダプターに結合するプライマーを含むプライマーセットを用いて増幅される。
一実施形態において、この複数メンバーの各メンバーは、3’アダプターに結合するプライマーを含むプライマーセットを用いて増幅される。
一実施形態において、この複数メンバーの各メンバーは、アダプター配列に特異的なプライマーおよびメンバーにおける標的/対象核酸に特異的なプライマーを用いて増幅される。
一実施形態において、段階(d)は、
例えば、配列決定を含む方法によって、例えば次世代配列決定法で、メンバー、例えば前記のライブラリまたはライブラリキャッチからの腫瘍メンバーからサブゲノム区間に対するリードを得て;
アライメント方法、例えば本明細書中に記載のアライメント方法によって前記のリードをアライメントし;
予め選択されたヌクレオチド位置に対して前記のリードからヌクレオチド値を割り当てる(例えば、ベイジアン法または本明細書中に記載の方法を用いて突然変異を呼び出す)ことを含む。
対象区間に対するクローンプロファイルを提供するための本明細書中に記載の方法は、他の情報を提供する方法で増強され得る。一実施形態において、本方法は、例えば、体細胞再編成または体細胞高頻度変異を受けない遺伝子、例えば、免疫グロブリン遺伝子以外およびT細胞受容体遺伝子以外の遺伝子に対してクローンプロファイルが提供されるもの以外の遺伝子に対する対象区間の配列を提供し得る。これらの配列は、関心のある核酸を回収するための溶液ハイブリダイゼーションおよびベイトの使用によって提供され得る。
一実施形態において、本方法は、第2の、例えば第2の対象区間、例えば表1〜9から選択される本明細書中に記載の遺伝子からの配列を含む対象区間の配列を提供することをさらに含む。
一実施形態において、本方法は、第2の、例えば第2の対象区間、例えばmiRNA、プロモーターまたは他の要素をコードする配列を含む対象区間の配列を提供することをさらに含む。
一実施形態において、本方法は、免疫グロブリンまたはT細胞またはB細胞受容体遺伝子以外の遺伝子からのものである第2の対象区間の配列を提供することをさらに含む。一実施形態において、本方法は、例えば表1〜9から選択される、第3の、または少なくともX個のさらなる対象区間の配列を提供すること(Xは4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500と等しい。)を含む。
一実施形態において、第3の、またはX個のさらなる対象区間は、免疫グロブリン、B細胞受容体またはT細胞受容体遺伝子以外の遺伝子由来である。
一実施形態において、Xは、5、10、20、30、40、50、100、150、200、250、300、350、400、450または500以上である。
一実施形態において、本方法は、
(a)第1の細胞タイプからの、例えば第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される第1の対象区間のクローンプロファイルを評価すること;および
(b)第2の細胞タイプからの、例えば第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば表1〜9から選択される第2の対象区間の配列を提供すること
を含む。
一実施形態において、本方法は、
(a)第1の細胞タイプからの、例えば第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される第1の対象区間のクローンプロファイルを評価すること;および
(b)第2の細胞タイプからの、例えば第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば表1〜9から選択される、第2、第3または少なくともX個のさらなる対象区間の配列を提供すること(Xは、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500に等しい。)
を含む。
一実施形態において、本方法は、
(a)第1の細胞タイプからの、例えば第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される、第1の、第2の、または少なくともX個のさらなる対象区間のクローンプロファイルを評価すること(Xは、3、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500に等しい。);および
(b)第2の細胞タイプからの、例えば第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば、表1〜9から選択される、(X+1)番目の対象区間の配列を提供すること
を含む。
一実施形態において、本方法は、
(a)第1の細胞タイプからの、例えば第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される1つ以上(例えば、2、3、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450、500、またはそれ以上)の対象区間のクローンプロファイルを評価すること;および
(b)第2の細胞タイプからの、例えば第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば表1〜9から選択される1つ以上(例えば、2、3、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450、500以上)の対象区間の配列を提供すること
を含む。
一実施形態において、第1の細胞タイプまたは第1の細胞タイプから作製されたライブラリは、第2の細胞タイプまたは第2の細胞タイプから作製されたライブラリが得られる試料と同じ試料から得られる。例えば、試料は、非癌細胞(または非悪性細胞、例えば腫瘍浸潤リンパ球)および癌細胞(または悪性細胞)の両方を含有し得る。
一実施形態において、第1の細胞タイプまたは第1の細胞タイプから作製されたライブラリは、第2の細胞タイプまたは第2の細胞タイプから作製されたライブラリが得られる試料とは異なる試料から得られる。例えば、第1の細胞タイプ、または第1の細胞タイプから作製されたライブラリが得られる試料は、非癌細胞(または非悪性細胞、例えば腫瘍浸潤リンパ球)を含有し得、本質的に癌細胞(または悪性細胞)不含であり;第2の細胞タイプまたは第2の細胞タイプから作製されたライブラリが得られる試料は、癌細胞(または悪性細胞)を含有し得、本質的に非癌細胞(または非悪性細胞、例えば、腫瘍浸潤リンパ球)不含である。
一実施形態において、第1の細胞タイプおよび第2の細胞タイプは、同時に得られる。別の実施形態において、第1の細胞タイプは、例えば、第2の細胞タイプが得られる前、少なくとも1日、2日、3日、1週間、2週間、3週間、1カ月、2カ月、3カ月、4カ月、5カ月または6カ月前に得られる。また別の実施形態において、第1の細胞タイプは、例えば、第2の細胞タイプが得られた後、少なくとも1日、2日、3日、1週間、2週間、3週間、1カ月、2カ月、3カ月、4カ月、5カ月または6カ月後に得られる。
一実施形態において、本方法は、第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)を試料、例えば腫瘍試料から単離することをさらに含む。別の実施形態において、本方法は、第2の細胞タイプ、例えば癌細胞または悪性細胞を試料、例えば腫瘍試料から単離することをさらに含む。また別の実施形態において、本方法は、第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)を単離し;第2の細胞タイプ、例えば癌細胞または悪性細胞を、試料、例えば腫瘍試料から単離することをさらに含む。
一実施形態において、本方法は、第1の細胞タイプ(例えば非癌細胞または非悪性細胞、例えば腫瘍浸潤リンパ球)、第2の細胞タイプ(例えば癌細胞または悪性細胞)または両方を試料、例えば腫瘍試料から単離することなく行われ、例えばライブラリが作製される。
一実施形態において、本方法は、
(a)各メンバーが対象からの核酸を含む複数のメンバーを含む核酸ライブラリ、例えば本明細書中に記載のライブラリを得て;
(b)それぞれが第2の(または続く)対象区間を含む複数の選択メンバーまたはその一部(本明細書中でライブラリキャッチと呼ぶときがある。)を提供するために、例えば溶液または表面ハイブリダイゼーションの条件下で、このライブラリをベイトセットと接触させ;
(c)例えばメンバー中での標的/対象核酸との配列特異的相互作用に依存しない方法によって、例えば、メンバー中の標的/対象核酸に結合しないプライマーを用いて複数のものの各メンバーを増幅することによって、複数のものの各メンバーを増幅し;
(d)対象区間のそれぞれの配列を得ること
によって、第2の(または続く)対象区間の配列を提供することを含む。
一実施形態において、段階(d)は、
(d)(i)例えば配列決定を含む方法によって、例えば次世代配列決定法で、メンバー、例えば前記のライブラリまたはライブラリキャッチからの腫瘍メンバーからサブゲノム区間に対するリードを得て;
(d)(ii)アライメント方法、例えば本明細書中に記載のアライメント方法によって前記リードをアライメントし;
(d)(iii)予め選択されたヌクレオチド位置に対して前記のリードからヌクレオチド値を割り当てる(例えば、ベイジアン法または本明細書中に記載の方法を用いて突然変異を呼び出す)
ことを含む。
別の態様において、本発明は、例えば、染色体腕の少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%もしくは90%または全てを含む、全腕または大きな再編成、例えば再編成、例えば転座、複製、挿入または欠失の発生について対象を評価する方法であって;
(a)各メンバーが対象からの核酸を含む複数のメンバーを含む核酸ライブラリを得て;
(b)それぞれが対象区間を含む複数の選択メンバーまたはその一部(本明細書中でライブラリキャッチと呼ぶときがある。)を提供するために、例えば溶液ハイブリダイゼーションの条件下でライブラリをベイトセットと接触させ;
(c)例えばメンバー中での標的/対象核酸との配列特異的相互作用に依存しない方法によって、例えば、メンバー中の標的/対象核酸に結合しないプライマーを用いて複数のものの各メンバーを増幅することによって、複数のものの各メンバーを増幅し;
(d)全腕または大きな再編成の判定を可能にすることなどのために染色体上に配置される複数の対象区間の配列を得る
ことを含む方法を特色とする。
本明細書中で使用される場合、「大きな再編成」とは、例えば染色体の少なくとも約10%、20%、30%、40%、50%、60%もしくは70%または染色体の腕(例えば長腕または短腕)の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは100%に影響を及ぼす再編成を指す。
また別の態様において、本発明は対象を評価する方法であって、
(a)各メンバーが対象からの核酸を含む複数のメンバー、例えば血液癌試料からの複数の腫瘍メンバーを含む核酸ライブラリを得て;
(b)それぞれが対象区間を含む複数の選択メンバーまたはその一部(本明細書中でライブラリキャッチと呼ぶときがある。)を提供するために、例えば溶液ハイブリダイゼーションの条件下でライブラリをベイトセットと接触させ;
(c)例えばメンバー中での標的/対象核酸との配列特異的相互作用に依存しない方法によって、例えば、メンバー中の標的/対象核酸に結合しないプライマーを用いて複数の選択メンバーの各メンバーを増幅することによって、複数の選択メンバーの各メンバーを増幅し;
(d)サブゲノム区間および発現サブゲノム区間の配列を得て
それによって対象を評価すること
を含む方法を特徴とし;
(i)本方法は、サブゲノム区間および発現サブゲノム区間の両方を提供するベイトセットとライブラリを接触させることを含み;
(ii)本方法は、サブゲノム区間を提供する第1のベイトセットおよび発現サブゲノム区間を提供する第2のベイトセットとライブラリを接触させることを含み;
(iii)ライブラリはゲノムDNAを含み、サブゲノム区間を提供するベイトセットと接触させられ、本方法が、発現サブゲノム区間を提供するためにベイトセットと接触させられるcDNAを含む第2のライブラリをさらに含み;
(iv)ライブラリはゲノムDNAを含み、サブゲノム区間を提供するベイトセットと接触させられ、本方法は、発現サブゲノム区間を提供するために第2のベイトセットと接触させられるcDNAを含む第2のライブラリをさらに含み;または
(v)本方法は、第1の対象区間、例えばサブゲノム区間を提供するために第1の反応混合物において、および例えばサブゲノム区間に対応する、第2の対象区間、例えば発現サブゲノム区間を提供するために第2の反応混合物において、段階(a)、(b)および(c)のうち1つを実施することを含む。
一実施形態において、(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが個別に行われる。
一実施形態において、サブゲノム区間および発現サブゲノム区間は、独立して、表1〜4から選択される。
一実施形態において、本方法は、Xが、2、3、4、5、10、20、30、40、50、100、150、200、250、300、350、400、450、500と等しいかまたはこれを超える、少なくともX個の対象区間の配列を提供することを含む。
一実施形態において、サブゲノム区間および発現サブゲノム区間は、同じ対象区間に対応し、例えば、同じ遺伝子からの(1つまたは複数の)配列を含む。
一態様において、本発明は、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)からの腫瘍試料を分析する方法を特徴とする。本方法は、
(a)複数の標的メンバー、例えば腫瘍メンバーを含む1つまたは複数のライブラリを試料、例えば腫瘍試料から得て;
(b)選択メンバー(本明細書中では「ライブラリキャッチ」と呼ばれることがある。)を提供するために、1つまたは複数のライブラリをベイトセット(または複数のベイトセット)と接触させてもよく;
(c)例えば配列決定法によって、例えば次世代配列決定法で、ライブラリまたはライブラリキャッチからの腫瘍メンバーからの対象区間(例えば、サブゲノム区間または発現サブゲノム区間)に対するリードを得て;
(d)前記のリードをアライメントし;
(e)予め選択されたヌクレオチド位置についての、例えば複数の対象区間(例えばサブゲノム区間、発現サブゲノム区間または両方)のそれぞれ、例えば複数の遺伝子のそれぞれ、における予め選択されたヌクレオチド位置についての前記のリードからヌクレオチド値を割り当て(例えば、突然変異呼び出し、例えばBayeisan法によるもの)、
それによって前記の試料を分析することを含み:ここで、
(i)X個のヌクレオチド位置のそれぞれを、段階(b)、(c)、(d)または(e)のうち1つまたは組み合わせについて固有の条件のセット下で分析してもよい(ここで、固有とは、他のX−1個の条件のセットとは異なることを意味し、Xは少なくとも2、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900または1000である。)。例えば、第1の条件のセット、例えば本明細書中に記載の条件のセットは、例えば第1のサブゲノム区間または遺伝子における第1のヌクレオチド位置に対して使用され、第2の条件のセット、例えば本明細書中に記載の第2の条件のセットは、第2のヌクレオチド位置に対して、例えば第2のサブゲノム区間または遺伝子において使用され;
(ii)そのヌクレオチド位置で起こり得る予め選択された改変、例えば突然変異の特徴、例えば本明細書中に記載の特徴に反応するX個のヌクレオチド位置のそれぞれについて、ヌクレオチド位置を固有の条件セット下で分析する(ここで、固有とは、他のX−1個の条件のセットとは異なることを意味し、Xは少なくとも(at lest)2、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900または1000である。)。例えば、第1の対象区間(サブゲノム区間または発現サブゲノム区間)におけるヌクレオチド位置で生じ得る予め選択された変化、例えば突然変異の特徴、例えば本明細書中に記載の特徴に応答して、ヌクレオチド位置を第1の条件のセット下で分析し、第2の対象区間(例えば、サブゲノム区間または発現サブゲノム区間)におけるヌクレオチド位置で生じ得る予め選択された変化、例えば突然変異の特徴、例えば本明細書中に記載の特徴に応答して、ヌクレオチド位置を第2の条件のセット下で分析する;
(iii)前記の方法が、少なくとも2、5、10、20、50、100、200、300、400、500、600、700、800、900または1000個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)、例えば遺伝子におけるヌクレオチド位置に対する95、98または99%感度または特異性を可能にする条件下で、試料、例えば保存腫瘍試料において行われる;または
(iv)本方法は、
a)約500X以上の配列決定デプスを提供するために、例えば試料からの細胞のうち5%を超えないもので存在する突然変異を配列決定するために、第1の対象区間(例えばサブゲノム区間または発現サブゲノム区間)を配列決定すること;
b)約200X以上、例えば、約200X〜約500Xの配列決定デプスを提供するために、例えば試料からの細胞のうち10%を超えないもので存在する突然変異を配列決定するために、第2の対象区間(例えばサブゲノム区間または発現サブゲノム区間)を配列決定すること;
c)約10〜100X配列決定デプスを提供するために、例えば、a)異なる薬物を患者が代謝する能力を説明し得る薬理ゲノム(PGx)一塩基多型(SNP)またはb)患者を固有に同定するために使用され得るゲノムSNP(例えばフィンガープリント)から選択される1つ以上の対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方、例えばエクソン)を配列決定するために、第3の対象区間(例えばサブゲノム区間または発現サブゲノム区間)を配列決定すること;
d)約5〜50X配列決定デプスを提供するために、例えば構造的限界点、例えばゲノム転座またはインデルを検出するために、第4の対象区間(例えばサブゲノム区間または発現サブゲノム区間)を配列決定すること
例えば、イントロン限界点の検出は、高い検出信頼性を確保するために5〜50Xの配列対スパニングデプスを必要とする。このようなベイトセットは、例えば、転座/インデルが起こり易い癌遺伝子を検出するために使用し得る;または
e)約0.1〜300X配列決定デプスを提供するために、例えばコピー数の変化を検出するために、第5の対象区間(例えば、サブゲノム区間または発現サブゲノム区間)を配列決定すること
のうち1つ以上または全てを含む。一実施形態において、配列決定デプスは、コピー数の変化を検出するために約0.1〜10Xの配列決定デプスの範囲である。他の実施形態において、配列決定デプスは、ゲノムDNAのコピー数の増加/減少またはヘテロ接合性喪失(LOH)を評価するために使用されるゲノムSNP/遺伝子座を検出するために、約100〜300Xの範囲である。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーおよび発現サブゲノム区間に対応するメンバーが得られるライブラリを得ることを含む。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第1のライブラリを得ることおよび、発現サブゲノム区間に対応するメンバーが得られる第2のライブラリを得ることを含む。
一実施形態において、サブゲノム区間および発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために、ベイトセットが使用される。
一実施形態において、第1のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第2のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。
代表的な第1および第2の条件セットは、
第1のベイトセットが第1の対象区間(例えばサブゲノム区間または発現区間)に対して使用され、第2のベイトセットが第2の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対して使用され;
第1の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するリードに第1のアライメント方法が適用され、第2の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するリードに第2のアライメント方法が適用され;
第1の対象区間(例えばサブゲノム区間または発現サブゲノム区間)のヌクレオチド位置に第1の突然変異呼び出し法が適用され、第2の対象区間(例えば、サブゲノム区間または発現サブゲノム区間)のヌクレオチド位置に第2の突然変異呼び出し方法が適用されること
を含む。
一実施形態において、
第1のベイト条件のセット、第1のアライメント方法および第1の突然変異呼び出し方法で第1のヌクレオチド位置を分析し;
前記の第1のベイト条件のセット、第2のアライメント方法および前記の第1の突然変異呼び出し方法で第2のヌクレオチド位置を分析し;
前記の第1のベイト条件のセット、前記の第1のアライメント方法および第2の突然変異呼び出し方法で第3のヌクレオチド位置を分析し、
他の2つの条件と比較したとき、それぞれが固有の条件下で分析された3個のヌクレオチド位置を提供する。
一実施形態において、本条件は
第1のベイトセットが第1の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対して使用され、第2のベイトセットが第2の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対して使用される;
第1の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するリードに第1のアライメント方法が適用され、第2の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するリードに第2のアライメント方法が適用される;または
第1の対象区間(例えばサブゲノム区間または発現サブゲノム区間)のヌクレオチド位置に第1の突然変異呼び出し方法が適用され、第2の対象区間(例えばサブゲノム区間または発現サブゲノム区間)のヌクレオチド位置に第2の突然変異呼び出し方法が適用されること
を含む。
代表的な特徴としては、
(i)変化が位置する遺伝子または遺伝子のタイプ、例えば、癌遺伝子または腫瘍抑制因子、予め選択されたまたは変異体または変異体のタイプ、例えば突然変異を特徴とする、または予め選択された頻度の突然変異を特徴とする遺伝子または遺伝子のタイプ、または本明細書中に記載の他の遺伝子もしくは遺伝子のタイプ;
(ii)変化のタイプ、例えば、置換、挿入、欠失または転座;
(iii)変化について分析している試料のタイプ、例えば、FFPE試料、血液試料または骨髄穿刺試料;
(iv)評価している変化のヌクレオチドの位置にあるかまたはその付近にある配列、例えば、対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するミスアライメントについての予想される傾向に影響を与え得る配列、例えばヌクレオジテッド(nucleodited)位置にあるかまたはその付近にある反復配列の存在;
(v)例えば予め選択されたタイプの腫瘍における、変化、例えば突然変異を示す選択された型の腫瘍における突然変異を示すリードを観察する事前(例えば文献)期待値;
(vi)塩基呼び出しエラーのみによる変化を示すリードを観察する確率;または
(vii)変化を検出するために所望される予め選択された配列決定のデプス
が挙げられる。
一実施形態において、特徴は、配列決定されているヌクレオチドの同一性以外のものであり、例えば、この特徴は、配列がAまたはTであるか否かではない。
一実施形態において、段階(b)が存在する。一実施形態において、段階(b)は存在しない。
一実施形態において、少なくともX個の遺伝子からのサブゲノム区間、例えば、表1〜4からの少なくともX個の遺伝子を異なる条件下で分析し、Xは、2、3、4、5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500に等しいかまたはこれを超える。
一実施形態において、本方法は、次のうち1つ以上を含む:
(i)本方法、例えば上記方法の段階(b)は、本明細書中に記載のベイトセット、例えば、「ベイト」という見出しの下で記載されるようなベイトセットの使用を含むか;
(ii)本方法、例えば上記方法の段階(c)は、対象区間のセットまたは群(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に対して、または本明細書中に記載の遺伝子のセットもしくは群からリードを得ることを含むか;
(iii)本方法、例えば上記方法の段階(d)は、本明細書中に記載の複数のアライメント方法、例えば「アライメント」という見出しの下で記載される方法の使用を含むか;
(iv)本方法、例えば上記方法の段階(e)は、本明細書中に記載の、ヌクレオチド値を予め選択されたヌクレオチド位置に割り当てるための複数の方法、例えば「突然変異呼び出し」の見出しの下で、または「臨床癌検体の次世代配列決定からの、体細胞ゲノム変化の高感度検出のためのベイジアン法」の題名のセクションに記載の方法の使用を含むか;または
(v)本方法は、本明細書中に記載の対象区間、例えば「遺伝子選択」という題名のセクションで本明細書中に記載のような、サブゲノム区間、発現サブゲノム区間またはその両方のセットにヌクレオチド値を割り当てること
を含む。
一実施形態において、本方法は、(i)および(ii)〜(v)のうち1、2、3個または全てを含む。
一実施形態において、本方法は、(ii)および、(i)および(iii)〜(v)のうち1、2、3個または全てを含む。
一実施形態において、本方法は、(iii)および、(i)、(ii)、(iv)および(v)のうち1、2、3個または全てを含む。
一実施形態において、本方法は、(iv)および、(i)〜(iii)および(v)のうち1、2、3個または全てを含む。
一実施形態において、本方法は、(v)および、(i)〜(iv)のうち1、2、3個または全てを含む。
アライメント
本明細書中で開示される方法は、配列決定方法、特に多数の多様な遺伝子における多数の多様な遺伝的事象の大規模並行配列決定に依存する方法、例えば本明細書中に記載の癌からの腫瘍試料を分析する方法において、性能を最適化するための複数の個別に調整されたアライメント方法またはアルゴリズムの使用を統合し得る。実施形態において、リードを分析するために、異なる遺伝子における多数の変異体のそれぞれに対して個別にカスタマイズまたは調整される複数のアライメント方法を使用する。実施形態において、調整は、配列決定されている遺伝子(または他のサブゲノムイナーバル(inerval))(のうち1つ以上)の機能、試料中の腫瘍タイプ、配列決定されている変異体または試料もしくは対象の特徴であり得る。配列決定しようとする多数の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に対して個々に調整されるアライメント条件の選択または使用は、速度、感度および特異性の最適化を可能にする。本方法は、比較的多数の多様な対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に対するリードのアライメントが最適化される場合に特に有効である。
したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)からの腫瘍試料、を分析する方法を特徴とする。本方法は、
(a)試料からの複数メンバー、例えば腫瘍試料からの複数の腫瘍メンバーを含む1つまたは複数のライブラリを得て;
(b)例えば選択メンバー(本明細書中では「ライブラリキャッチ」と呼ばれることがある。)を提供するために、1つまたは複数のライブラリをベイトセット(または複数のベイトセット)と接触させることによって、予め選択された配列に対して1つまたは複数のライブラリを濃縮してもよく;
(c)例えば配列決定を含む方法によって、例えば次世代配列決定法を用いて、メンバー、例えばライブラリまたはライブラリキャッチからの腫瘍メンバーから、対象区間、例えば、サブゲノム区間または発現サブゲノム区間に対するリードを得て;
(d)アライメント方法、例えば本明細書中に記載のアライメント方法によって前記のリードをアライメントし;
(e)予め選択されたヌクレオチド位置についての前記のリードからヌクレオチド値を割り当て(例えばベイジアン法により、例えば突然変異を呼び出すこと)、
それによって前記の腫瘍試料を分析することを含み、
X個の固有の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれからのリードを、固有のアライメント方法でアライメントしてもよく、ここで、固有の対象区間(例えばサブゲノム区間または発現サブゲノム区間)は、他のX−1個の対象区間(例えば、サブゲノム区間または発現サブゲノム区間またはその両方)とは異なることを意味し、固有のアライメント方法は、他のX−1個のアライメント方法とは異なることを意味し、Xは少なくとも2である。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーおよび発現サブゲノム区間に対応するメンバーが得られるライブラリを得ることを含む。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第1のライブラリを得ることおよび、発現サブゲノム区間に対応するメンバーが得られる第2のライブラリを得ることを含む。
一実施形態において、サブゲノム区間および発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために、ベイトセットが使用される。
一実施形態において、第1のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第2のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。
一実施形態において、段階(b)が存在する。一実施形態において、段階(b)は存在しない。
一実施形態において、Xは少なくとも3、4、5、10、15、20、30、50、100、200、300、400、500、600、700、800、900または1,000である。
一実施形態において、少なくともX個の遺伝子、例えば表1〜4からの少なくともX個の遺伝子からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)が、固有のアライメント方法でアライメントされ、Xは、2、3、4、5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500と等しいかまたはそれを超える。
一実施形態において、方法(例えば、上に列挙した方法の要素(d))は、リードを分析、例えばアライメントするためのアライメント方法を選択または使用することを含み、
前記のアライメント方法は、
(i)腫瘍タイプ、例えば前記の試料中の腫瘍タイプ;
(ii)配列決定されている前記の対象区間(例えばサブゲノム区間または発現サブゲノム区間)が位置する遺伝子または遺伝子のタイプ、例えば、予め選択されたまたは変異体もしくは変異体のタイプ、例えば突然変異、または予め選択された頻度の突然変異を特徴とする、遺伝子または遺伝子のタイプ;
(iii)分析されている部位(例えばヌクレオチド位置);
(iv)評価されている対象区間(例えばサブゲノム区間または発現サブゲノム区間)内の変異体のタイプ、例えば置換;
(v)試料のタイプ、例えば、FFPE試料、血液試料または骨髄穿刺試料;および
(vi)評価されている前記のサブゲノム区間にあるかまたはその付近にある配列、例えば前記の対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するミスアライメントについての予想される傾向、例えば、前記の対象区間(例えばサブゲノム区間または発現サブゲノム区間)にあるかまたはその付近にある反復配列の存在
のうち1つ以上または全ての関数であるか、それに対応して選択されるかまたはそれに対して最適化される。
本明細書中の他の箇所で述べるように、方法は、比較的多数の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に対するリードのアライメントが最適化される場合に特に有効である。したがって、一実施形態において、少なくともX個の固有のアライメント方法が、少なくともX個の固有のサブゲノム区間に対するリードを分析するために使用され、ここで固有とは他のX−1個とは異なることを意味し、Xは、2、3、4、5、10、15、20、30、50、100、200、300、400、500、600、700、800、900、1,000と等しいかまたはそれを超える。
一実施形態において、表1〜4からの少なくともX個の遺伝子からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)を分析し、Xは、2、3、4、5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500と等しいかまたはそれを超える。
一実施形態において、少なくとも3、5、10、20、40、50、60、70、80、90、100、200、300、400または500個の異なる遺伝子のそれぞれにおいて対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に固有のアライメント方法が適用される。
一実施形態において、少なくとも20、40、60、80、100、120、140、160または180、200、300、400または500個の遺伝子、例えば表1〜4からの遺伝子におけるヌクレオチド位置にヌクレオチド値を割り当てる。一実施形態において、分析した前記の遺伝子の、少なくとも10、20、30、40または50%のそれぞれにおいて、対象区間(例えば、サブゲノム区間または発現サブゲノム区間)に固有のアライメント方法が適用される。
本明細書で開示される方法は、煩雑なリード、例えば、再配列を有するリードの迅速かつ効率的なアライメントを可能にする。したがって、対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するリードが、再編成、例えばインデルを伴うヌクレオチド位置を含む実施形態において、本方法は、適切に調整され、
予め選択される再編成とアライメントするために予め選択される再編成参照配列を、リードとのアライメントのために選択すること(この実施形態において、参照配列はゲノム再編成と同一ではない。);
前記の予め選択された再編成参照配列とリードを比較する、例えばアライメントすること;
を含むアライメント方法を使用することを含み得る。
実施形態において、煩雑なリードをアライメントするために他の方法が使用される。これらの方法は、比較的多数の多様なサブゲノム区間に対するリードのアライメントが最適化される場合に特に有効である。一例として、腫瘍試料を分析する方法は、
第1のパラメータのセット(例えば、第1のマッピングアルゴリズム、または第1の参照配列を用いて)の下でリードの比較、例えばアライメント比較を行い、前記のリードが第1の所定のアライメント基準を満たすか(例えば、このリードを前記の第1の参照配列と、例えば予め選択されたミスマッチ数未満で、アライメントし得るか)否かを判定し;
前記のリードが第1の所定のアライメント基準に合致しない場合、第2のパラメータのセット(例えば、第2のマッピングアルゴリズム、または第2の参照配列を用いて)の下で第2のアライメント比較を行い;
前記のリードが前記の第2の所定の基準と合致するか(例えば、予め選択されたミスマッチ数未満で前記の第2の参照配列とリードをアライメントし得るか)否かを判定してもよい
ことを含み得、
ここで前記の第2のパラメータのセットは、パラメータのセット、例えば前記の第2の参照配列の使用を含み、これは、前記の第1のパラメータのセットと比較して、予め選択された変異体、例えば再編成、例えば挿入、欠失または転座に対するリードとのアライメントの可能性が高くなる。
これらおよび他のアライメント方法は、本明細書中の他の箇所、例えば、「アライメント」というセクションでより詳細に論じる。そのモジュールの要素は、腫瘍を分析する方法に含められ得る。実施形態において、「アライメント」という題名のセクションからのアライメント方法は、「突然変異呼び出し」という題名のセクションからの突然変異呼び出し方法および/または「ベイト」という題名のセクションからのベイトセットと組み合わせられる。この方法は、「遺伝子選択」という題名のセクションからの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のセットに適用し得る。
突然変異呼び出し
本明細書中で開示される方法は、配列決定方法、特に、例えば腫瘍試料からの、例えば本明細書中に記載の癌からの、多数の多様な遺伝子における多数の多様な遺伝的事象の大規模並行配列決定に依存する方法において性能を最適化するために、カスタマイズされているかまたは調整されている突然変異呼び出しパラメータの使用を統合し得る。この方法の実施形態において、多数の予め選択された対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれに対する突然変異呼び出しは、個別にカスタマイズされるか、または微調整される。カスタマイズ化または調整は、本明細書中に記載の因子の1つ以上、例えば、試料中の癌のタイプ、配列決定しようとする対象区間(例えばサブゲノム区間または発現サブゲノム区間)が位置する遺伝子、または配列決定しようとする変異体に基づき得る。配列決定しようとする多数の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に対して微調整されるアライメント条件のこの選択または使用は、速度、感度および特異性の最適化を可能にする。本方法は、比較的多数の多様な対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に対するリードのアライメントが最適化される場合に特に有効である。
したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)からの腫瘍試料、を分析する方法を特徴とする。本方法は、
(a)試料からの複数メンバー、例えば試料、例えば腫瘍試料からの複数の腫瘍メンバーを含む1つまたは複数のライブラリを得て;
(b)選択されたメンバー、例えばライブラリキャッチを提供するために、例えばライブラリをベイトセット(または複数のベイトセット)と接触させることによって、予め選択された配列に対して1つまたは複数のライブラリを濃縮してもよく;
(c)例えば配列決定を含む方法によって、例えば次世代配列決定法を用いて、メンバー、例えば前記のライブラリまたはライブラリキャッチからの腫瘍メンバーから、対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するリードを得て;
(d)アライメント方法、例えば本明細書中に記載のアライメント方法によって前記のリードをアライメントし;
(e)予め選択されたヌクレオチド位置についての前記のリードからヌクレオチド値を割り当て(例えばベイジアン法または本明細書中に記載の呼び出し方法によって、例えば突然変異を呼び出し)、それにより前記の腫瘍試料を分析すること
を含む。
ここで
固有の呼び出し方法によって、X個の固有の対象区間(サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれにおいヌクレオチド位置にヌクレオチド値を割り当ててもよく、ここで固有の対象区間(例えば、サブゲノム区間または発現サブゲノム区間)は、他のX−1個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)とは異なることを意味し、固有の呼び出し方法は、他のX−1個の呼び出し方法とは異なることを意味し、Xは少なくとも2である。呼び出し方法は異なり得、それによって、例えば異なるベイジアン事前値(prior value)に依存することにより、固有であり得る。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーおよび発現サブゲノム区間に対応するメンバーが得られるライブラリを得ることを含む。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第1のライブラリを得ることおよび、発現サブゲノム区間に対応するメンバーが得られる第2のライブラリを得ることを含む。
一実施形態において、サブゲノム区間および発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために、ベイトセットが使用される。
一実施形態において、第1のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第2のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。
一実施形態において、段階(b)が存在する。一実施形態において、段階(b)は存在しない。
一実施形態において、前記のヌクレオチド値を割り当てることは、タイプの腫瘍における前記の予め選択されたヌクレオチド位置で、予め選択された変異体、例えば突然変異を示すリードを観察する先行(例えば文献)期待値であるかまたはそれに相当する値の関数である。
一実施形態において、本方法は、少なくとも10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000個の予め選択されたヌクレオチド位置に対してヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)を含み、ここで各割り当ては、タイプの腫瘍における前記の予め選択されたヌクレオチド位置で、予め選択された変異体、例えば突然変異を示すリードを観察する先行(例えば文献)期待値であるかまたはそれに相当する固有の(他の割り当てについての値とは対照的)値の関数である。
一実施形態において、前記のヌクレオチド値を割り当てることは、変異体がある頻度(例えば、1%、5%または10%など)で試料中に存在する場合、および/または変異体が存在しない(例えば、塩基呼び出しエラーのみに起因してリードで観察される)場合、前記の予め選択されたヌクレオチド位置で前記の予め選択された変異体を示すリードを観察する確率を表す一連の値の関数である。
一実施形態において、方法(例えば、上記で列挙される方法の段階(e))は、突然変異呼び出し方法を含む。本明細書中に記載の突然変異呼び出し方法は、次のことを含み得る:
前記X個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれにおける予め選択されたヌクレオチド位置に対して、
(i)タイプXの腫瘍中の前記の予め選択されたヌクレオチド位置に、予め選択された変異体、例えば突然変異を示すリードを観察する先行(例えば文献)期待値であるかまたはそれを表す第1の値;および
(ii)変異体がある頻度(例えば、1%、5%、10%など)で試料中に存在する場合、および/または変異体が存在しない(例えば、塩基呼び出しエラーのみに起因してリードで観察される)場合、前記の予め選択されたヌクレオチド位置で前記の予め選択された変異体を示すリードを観察する確率を表す第2の値のセット
を得ること、
前記の値に応答して、第1の値を使用して第2のセット中の値の間で比較を、例えば本明細書中に記載のベイジアン法によって、推測する(例えば、突然変異の存在の事後確率を計算する)ことにより、前記の予め選択されたヌクレオチド位置のそれぞれに対する前記のリードからのヌクレオチド値を割り当て(例えば突然変異を呼び出し)、それによって前記の試料を分析すること。
一実施形態において、本方法は、次のうち1つ以上または全てを含む:
(i)少なくとも10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000個の予め選択されたヌクレオチド位置に対してヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)であって、各割り当てが、(他の割り当てとは対照的に)固有の第1および/または第2の値に基づくもの;
(ii)割り当ての少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400または500が、例えば予め選択された腫瘍タイプにおける細胞の、5、10または20%未満で予め選択された変異体が存在する確率の関数である第1の値を用いて行われる、(i)の方法の割り当て;
(iii)少なくともX個の予め選択されたヌクレオチド位置に対してヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)であって、このそれぞれが、予め選択されたタイプの腫瘍、例えば前記の試料の腫瘍タイプ中に存在する(他のX−1個の割り当てとは対照的に)固有の確率を有する予め選択された変異体と関連し、X個の割り当てのそれぞれが、(他のX−1個の割り当てとは対照的に)固有の第1および/または第2の値に基づくものであってもよい(X=2、3、5、10、20、40、50、60、70、80、90、100、200、300、400または500);
(iv)第1および第2のヌクレオチド位置にヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)であって、前記の第1のヌクレオチド位置で第1の予め選択された変異体が予め選択されたタイプの腫瘍(例えば前記の試料の腫瘍タイプ)中に存在する可能性が、前記の第2のヌクレオチド位置に第2の予め選択された変異体が存在する可能性よりも少なくとも2、5、10、20、30または40倍大きく、各割り当てが、(他の割り当てとは対照的に)固有の第1の値および/または第2の値に基づいていてもよいもの;
(v)複数の予め選択されたヌクレオチド位置にヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)であって、前記の複数のものが、次の確率範囲のうち1つ以上、例えば少なくとも3、4、5、6、7または全てに入る変異体に対する割り当てを含むこと:
0.01以下;
0.01より大きく0.02以下;
0.02より大きく0.03以下;
0.03より大きく0.04以下;
0.04より大きく0.05以下;
0.05より大きく0.1以下;
0.1より大きく0.2以下;
0.2より大きく0.5以下;
0.5より大きく1.0以下;
1.0より大きく2.0以下;
2.0より大きく5.0以下;
5.0より大きく10.0以下;
10.0より大きく20.0以下;
20.0より大きく50.0以下;および
50より大きく100.0%以下;
ここで確率範囲は、予め選択されたヌクレオチド位置での予め選択された変異体が予め選択されたタイプの腫瘍(例えば前記の試料の腫瘍タイプ)において存在する確率または、予め選択されたヌクレオチド位置での予め選択された変異体が腫瘍試料中の細胞、腫瘍試料からのライブラリまたは予め選択されたタイプ(例えば前記の試料の腫瘍タイプ)に対するそのライブラリからのライブラリキャッチの列挙される%で腫瘍中に存在する確率の範囲であり;
ここで、各割り当ては、固有の第1および/または第2の値に基づいてもよい(例えば、列挙される確率範囲での他の割り当てと対照的に固有であるかまたは、他の挙げられる確率範囲の1つ以上または全てに対する第1のおよび/または第2の値とは対照的に固有である。)。
(vi)前記の試料中のDNAの50、40、25、20、15、10、5、4、3、2、1、0.5、0.4、0.3、0.2または0.1%未満で存在する予め選択された変異体をそれぞれが独立に有する、少なくとも1、2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000個の予め選択されたヌクレオチド位置に対してヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)であって;各割り当てが、(他の割り当てとは対照的に)固有の第1および/または第2の値に基づいてもよいこと;
(vii)第1および第2のヌクレオチド位置にヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)であって、前記の試料のDNA中の第1の位置での予め選択された変異体の可能性が、前記の試料のDNA中の前記の第2のヌクレオチド位置での予め選択された変異体の可能性よりも少なくとも2、5、10、20、30または40倍大きく、各割り当てが、(他の割り当てとは対照的に)固有の第1の値および/または第2の値に基づいてもよいこと;
(viii)次のもののうち1つ以上または全てにおいてヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと):
(1)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の1%未満で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(2)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の1〜2%で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(3)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の2%超から3%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(4)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の3%超から4%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(5)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の4%超から5%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(6)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の5%超から10%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(7)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の10%超から20%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(8)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の20%超から40%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;
(9)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の40%超から50%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;または
(10)前記の試料中の細胞、前記の試料からのライブラリ中の核酸またはそのライブラリからのライブラリキャッチ中の核酸の50%超から100%以下で予め選択された変異体が存在する、少なくとも1、2、3、4または5個の予め選択されたヌクレオチド位置;ここで、各割り当てが、固有の第1および/または第2の値に基づくものであってもよい(例えば、列挙される確率範囲での他の割り当てと対照的に固有であるか(例えば1%未満の(i)における範囲)または、他の挙げられている範囲の1つ以上または全てにおける判定に対する第1および/または第2の値とは対照的に固有である。);または
(ix)他のX−1個のヌクレオチド位置での予め選択された変異体に対する可能性と比較した場合に固有である(前記の試料のDNA中に予め選択された変異体が存在する)可能性をそれぞれが独立に有するX個のヌクレオチド位置のそれぞれでヌクレオチド値を割り当てること(例えば突然変異を呼び出すこと)であって、ここでXが、1、2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000以上であり、各割り当てが、(他の割り当てと対照的に)固有の第1および/または第2の値に基づくもの。
この方法の実施形態において、リードを評価し、リードからヌクレオチド位置についての値、例えばある遺伝子中の特定の位置での突然変異の呼び出し、を選択するために、「閾値」を使用する。この方法の実施形態において、多数の予め選択された対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれに対する閾値は、カスタマイズされるか、または微調整される。カスタマイズまたは調整は、本明細書中に記載の因子の1つ以上、例えば、試料中の癌のタイプ、配列決定しようとする対象区間(サブゲノム区間または発現サブゲノム区間)が位置する遺伝子または配列決定しようとする変異体に基づき得る。これは、配列決定しようとする多数の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれに対して微調整される呼び出しを提供する。本方法は、比較的多数の多様なサブゲノム区間を分析する場合に特に有効である。
したがって、別の実施形態において、腫瘍を分析する方法は、次の突然変異呼び出し方法:
前記のX個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれについて閾値を得ることであって、前記の得られたX個の閾値のそれぞれが、他のX−1個の閾値と比較して固有であり、それによりX個の固有の閾値を提供すること;
前記のX個の対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれに対して、予め選択されたヌクレオチド位置における予め選択されたヌクレオチド値を有するリードの数の関数である実測値をその固有の閾値と比較し、それによって前記のX個の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれにその固有の閾値を適用すること;および
前記の比較の結果に応じて、予め選択されたヌクレオチド位置にヌクレオチド値を割り当ててもよいことを含み、
ここでXは2以上である。
一実施形態において、本方法は、それぞれが独立に、0.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.02または0.01未満である確率の関数である第1の値を有する少なくとも2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000個の予め選択されたヌクレオチド位置にヌクレオチド値を割り当てることを含む。
一実施形態において、本方法は、他のX−1個の第1の値と比較して固有である第1の値をそれぞれが独立に有する少なくともX個のヌクレオチド位置のそれぞれにヌクレオチド値を割り当てることを含み、前記のX個の第1の値のそれぞれは、0.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.02または0.01未満である確率の関数であり、
Xは、1、2、3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000以上である。
一実施形態において、少なくとも20、40、60、80、100、120、140、160または180、200、300、400または500個の遺伝子、例えば表1〜4からの遺伝子におけるヌクレオチド位置にヌクレオチド値を割り当てる。一実施形態において、固有の第1および/または第2の値は、分析した前記の遺伝子の、少なくとも10、20、30、40または50%それぞれにおいて、対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に適用される。
本方法の実施形態は、例えば次の実施形態から分かるように、比較的多数の対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)に対する閾値が最適化される場合に適用され得る。
一実施形態において、固有の閾値は、少なくとも3、5、10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000個の異なる遺伝子のそれぞれにおいて対象区間、例えば、サブゲノム区間または発現サブゲノム区間、に適用される。
一実施形態において、少なくとも20、40、60、80、100、120、140、160または180、200、300、400または500個の遺伝子、例えば表1〜4からの遺伝子におけるヌクレオチド位置にヌクレオチド値を割り当てる。一実施形態において、分析された前記の遺伝子の少なくとも10、20、30、40または50%のそれぞれにおいて、サブゲノム区間に対して固有の閾値が適用される。
一実施形態において、表1〜4からの少なくとも5、10、20、30または40個の遺伝子におけるヌクレオチド位置にヌクレオチド値を割り当てる。一実施形態において、分析された少なくとも10、20、30、40または50%の前記の遺伝子のそれぞれにおいて、対象区間(例えば、サブゲノム区間、発現サブゲノム区間)に固有の閾値が適用される。
これらおよび他の突然変異呼び出し方法は、本明細書中の他の箇所、例えば、「突然変異」という題名のセクションでより詳細に論じる。そのモジュールの要素は、腫瘍を分析する方法に含められ得る。実施形態において、「突然変異呼び出し」という題名のセクションからのアライメント方法は、「アライメント」という題名のセクションからのアライメント方法および/または「ベイト」という題名のセクションからのベイトセットと組み合わせられる。本方法は、「遺伝子選択」という題名のセクションからの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のセットに適用され得る。
ベイト
本明細書中に記載の方法は、配列決定しようとする標的核酸の選択のためのベイト、例えば溶液ハイブリダイゼーションでの使用のためのベイトの適切な選択による、1名以上の対象からの、試料、例えば腫瘍試料、例えば本明細書中に記載の癌からの多数の遺伝子および遺伝子産物の最適化配列決定を提供する。予め選択された選択効率を有するベイトセットに従って、様々な対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)またはそのクラスに対する選択効率を適合させる。このセクションで使用される場合、「選択効率」とは、(1つまたは複数の)標的対象区間(例えば、(1つまたは複数の)サブゲノム区間、(1つまたは複数の)発現サブゲノム区間またはその両方)に従って調節されるような配列カバレッジのレベルまたはデプスを指す。
したがって、方法(例えば、上記で列挙される方法の段階(b))は、選択されたメンバー(例えばライブラリキャッチ)を提供するためにライブラリを複数のベイトと接触させることを含む。
したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)からの腫瘍試料、を分析する方法を特徴とする。本方法は、
(a)試料からの複数のメンバー(例えば標的メンバー)、例えば腫瘍試料からの複数の腫瘍メンバーを含む1つまたは複数のライブラリを得て;
(b)選択メンバー(例えばライブラリキャッチ)を提供するために、1つまたは複数のライブラリをベイトセット(または複数のベイトセット)と接触させ;
(c)例えば配列決定を含む方法によって、例えば次世代配列決定法を用いて、メンバー、例えば前記のライブラリまたはライブラリキャッチからの腫瘍メンバーから、対象区間、例えばサブゲノム区間、発現サブゲノム区間またはその両方に対するリードを得て;
(d)アライメント方法、例えば本明細書中に記載のアライメント方法によって前記のリードをアライメントし;
(e)予め選択されたヌクレオチド位置についての前記のリードからヌクレオチド値を割り当て(例えばベイジアン法または本明細書中に記載の方法により、例えば突然変異を呼び出し)、それにより前記の腫瘍試料を分析することを含み、 本方法は、複数の、例えば少なくとも2、3、4または5個のベイトまたはベイトセットとライブラリを接触させることを含んでいてもよく、前記の複数の各ベイトまたはベイトセットは、(複数における他のベイトと対照的に)固有の、予め選択された選択に対する効率を有する。例えば、各固有のベイトまたはベイトセットは、配列決定の固有のデプスを提供する。本明細書で使用される場合、「ベイトセット」という用語は、1つのベイトまたは複数のベイト分子をまとめて指す。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーおよび発現ゲノム区間に対応するメンバーが得られるライブラリを得ることを含む。
一実施形態において、本方法は、サブゲノム区間に対応するメンバーが得られる第1のライブラリを得ることおよび、発現サブゲノム区間に対応するメンバーが得られる第2のライブラリを得ることを含む。
一実施形態において、サブゲノム区間および発現区間の両方を含むメンバーまたはライブラリキャッチを提供するために、ベイトセットが使用される。
一実施形態において、第1のベイトセットは、サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用され、第2のベイトセットは、発現サブゲノム区間を含むメンバーまたはライブラリキャッチを提供するために使用される。
一実施形態において、複数のものにおける第1のベイトセットの選択効率は、複数のものにおける第2のベイトセットの効率と少なくとも2倍異なる。一実施形態において、第1および第2のベイトセットは、少なくとも2倍異なる配列決定のデプスを提供する。
一実施形態において、本方法は、次のベイトセットのうち1つまたは複数をライブラリと接触させることを含む:
a)約500X以上の配列決定デプスを提供するために、例えば試料からの細胞のうち5%を超えないもので存在する突然変異を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット;
b)約200X以上、例えば、約200X〜約500Xの配列決定デプスを提供するために、例えば試料からの細胞のうち10%を超えないもので存在する突然変異を配列決定するために、サブゲノム区間を含む十分なメンバーを選択するベイトセット;
c)約10〜100X配列決定デプスを提供するために、例えば、a)異なる薬物を患者が代謝する能力を説明し得る薬理ゲノム(PGx)一塩基多型(SNP)またはb)患者を固有に同定するために使用され得るゲノムSNP(例えばフィンガープリント)から選択される1つ以上のサブゲノム区間(例えばエクソン)を配列決定するためにサブゲノム区間を含む十分なメンバーを選択するベイトセット;
d)約5〜50X配列決定デプスを提供するために、例えば構造限界点、例えばゲノム転座またはインデルなどを検出するために、対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む十分なメンバーを選択するベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために5〜50Xの配列対スパニングデプスを必要とする。このようなベイトセットは、例えば、転座/インデルが起こり易い癌遺伝子を検出するために使用し得るか;または
e)約0.1〜300X配列決定デプスを提供するために、例えばコピー数の変化を検出するために、対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む十分なメンバー選択するベイトセット。一実施形態において、配列決定デプスは、コピー数の変化を検出するために約0.1〜10Xの配列決定デプスの範囲である。他の実施形態において、配列決定デプスは、ゲノムDNAのコピー数の増加/減少またはヘテロ接合性喪失(LOH)を評価するために使用されるゲノムSNP/遺伝子座を検出するために、約100〜300Xの範囲である。このようなベイトセットは、例えば、増幅/欠失が起こり易い癌遺伝子を検出するために使用され得る。
本明細書で使用される場合の配列決定デプスのレベル(例えば、配列決定デプスのX倍レベル)は、重複リード、例えばPCR重複リードの検出および除去後のリード(例えば固有のリード)のカバレッジのレベルを指す。
一実施形態において、ベイトセットは、1つ以上の再編成、例えば、ゲノム再編成を含有するイントロンを含有する対象区間(例えばサブゲノム区間または発現サブゲノム区間)を選択する。このような実施形態において、ベイトセットは、選択効率を高めるために反復配列が遮蔽されるように設計される。再編成が既知の連結配列を有する実施形態において、選択効率を高めるために、連結配列に対して相補的なベイトセットを設計し得る。
実施形態において、本方法は、それぞれが異なるベイト設計ストラテジーを有する2つ以上の異なる標的カテゴリを捕捉するように設計されたベイトの使用を含む。実施形態において、本明細書中で開示されるハイブリッド捕捉方法および組成物は、標的配列の定められたサブセット(例えば、標的メンバー)を捕捉し、そのサブセットの外側のカバレッジを最小限にしながら、標的配列の均質なカバレッジを提供する。一実施形態において、標的配列は、ゲノムDNAからのエクソン全体またはその選択されたサブセットを含む。別の実施形態において、標的配列は、大きな染色体領域、例えば染色体アーム全体を含む。本明細書に開示される方法および組成物は、複雑な標的核酸配列(例えば核酸ライブラリ)に対する異なるデプスおよびカバレッジのパターンを達成するための異なるベイトセットを提供する。
一実施形態において、本方法は、1つまたは複数の核酸ライブラリの選択されたメンバー(例えばライブラリキャッチ)を提供することを含む。本方法は、
複数のメンバー、例えば、標的核酸メンバー(例えば、複数の腫瘍メンバー、参照メンバーおよび/またはPGxメンバーを含む。)を含む1つまたは複数のライブラリ(例えば1つまたは複数の核酸ライブラリ)を提供し;
複数のベイト/メンバーハイブリッドを含むハイブリダイゼーション混合物を形成するために、複数のベイト(例えばオリゴヌクレオチドベイト)と1つまたは複数のライブラリを、例えば溶液ベースの反応において接触させ;
例えば前記のハイブリダイゼーション混合物を、前記の複数のベイト/メンバーハイブリッドの分離を可能にする結合実体と接触させることによって前記のハイブリダイゼーション混合物から複数のベイト/メンバーハイブリッドを分離し、
それによってライブラリキャッチ(例えば、1つまたは複数のライブラリからの核酸分子の、選択されたまたは濃縮されたサブグループ)を提供すること
を含み、
この複数のベイトは、次のうち2つ以上を含んでいてもよい:
a)低頻度、例えば約5%以下で出現する(すなわち、試料からの細胞のうち5%がそれらのゲノムにおいて変化を保有する。)変化(例えば1つ以上の突然変異)に対する高レベルの感度を可能にするために最大デプスのカバレッジが必要とされる、高レベルの標的(例えば、対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む1つ以上の腫瘍メンバー、このような遺伝子、エクソンまたは塩基)を選択する第1のベイトセット。一実施形態において、第1のベイトセットは、約500X以上の配列決定デプスを必要とする変化(例えば点突然変異)を含む腫瘍メンバーを選択する(例えば、それに相補的である。)。
b)a)における高レベルの標的よりも高い頻度、例えば約10%の頻度で(すなわち、試料からの細胞のうち10%がそれらのゲノムにおいて変化を保有する。)出現する変化(例えば1つ以上の突然変異)に対する高レベルの感度を可能にするために高いカバレッジが必要とされる、中程度のレベルの標的(例えば、遺伝子、エクソンまたは塩基など、対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む1つ以上の腫瘍メンバー)を選択する第2のベイトセット。一実施形態において、第2のベイトセットは、約200X以上の配列決定デプスを必要とする変化(例えば点突然変異)を含む腫瘍メンバーを選択する(例えばそれと相補的である。)。
c)高レベルの感度を可能にするために、例えばヘテロ接合性の対立遺伝子を検出するために、低−中程度のカバレッジが必要とされる、低レベルの標的(例えば、対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む1つ以上のPGxメンバー、例えば遺伝子、エクソンまたは塩基など)を選択する第3のベイトセット。例えば、ヘテロ接合性の対立遺伝子の検出は、高い検出信頼性を確保するために10〜100Xの配列決定デプスを必要とする。一実施形態において、第3のベイトセットは、a)患者が様々な薬物を代謝する能力を説明し得る薬理ゲノミクス(PGx)一塩基多型(SNP)またはb)患者を固有に同定するために使用され得るゲノムSNP(例えばフィンガープリント)から選択される1つ以上の対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方、例えばエクソン)を選択し;
d)例えば、ゲノム転座またはインデルなどの構造的限界点を検出するために、低中程度のカバレッジが必要とされる第1のイントロン標的(例えば、イントロン配列を含むメンバー)を選択する第4のベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために5〜50Xの配列対スパニングデプスを必要とする。前記の第4のベイトセットは、例えば、転座/インデル傾向のある癌遺伝子を検出するために使用し得;または
e)コピー数の変化を検出する能力を向上させるために低密度のカバレッジが必要とされる第2のイントロン標的(例えばイントロンメンバー)を選択する第5のベイトセット。例えば、いくつかの末端エクソンの1コピー欠失の検出は、高い検出信頼性を確保するために0.1〜300Xのカバレッジを必要とする。一実施形態において、カバレッジのデプスは、コピー数の変化を検出するために約0.1〜10Xの範囲である。他の実施形態において、カバレッジのデプスは、ゲノムDNAのコピー数の増加/減少またはヘテロ接合性喪失(LOH)を評価するために使用されるゲノムSNP/遺伝子座を検出するために、約100〜300Xの範囲である。前記の第5のベイトセットは、例えば、増幅/欠失が起こり易い癌遺伝子を検出するために使用され得る。
前述のベイトセットのうち2、3、4またはそれを超えるものの何らかの組み合わせを使用し得、例えば、第1および第2のベイトセット;第1および第3のベイトセット;第1および第4のベイトセット;第1および第5のベイトセット;第2および第3のベイトセット;第2および第4のベイトセット;第2および第5のベイトセット;第3および第4のベイトセット;第3および第5のベイトセット;第4および第5のベイトセット;第1、第2および第3のベイトセット;第1、第2および第4のベイトセット;第1、第2および第5のベイトセット;第1、第2、第3、第4のベイトセット;第1、第2、第3、第4および第5のベイトセットの組み合わせなどである。
一実施形態において、第1、第2、第3、第4または第5のベイトセットのそれぞれは、選択(例えば捕捉)のための予め選択された効率を有する。一実施形態において、選択効率についての値は、a)〜e)による全5個のベイトのうち少なくとも2、3、4個について同じである。他の実施形態において、選択効率についての値は、a)〜e)による全5個のベイトのうち少なくとも2、3、4個について異なる。
いくつかの実施形態において、少なくとも2、3、4または5個全てのベイトセットが、異なる予め選択された効率値を有する。例えば、選択効率についての値は、次のうち1つ以上(one of more)から選択される:
(i)第1の予め選択された効率は、少なくとも約500X以上の配列決定デプスである第1の選択効率についての値を有する(例えば、第2、第3、第4または第5の予め選択された選択効率よりも大きい選択効率についての値を有する。(例えば、第2の選択効率についての値よりも約2〜3倍大きく;第3の選択効率についての値よりも約5〜6倍大きく;第4の選択効率についての値よりも約10倍大きく;第5の選択効率についての値よりも約50〜5000倍大きい。);
(ii)第2の予め選択された効率は、少なくとも約200X以上の配列決定デプスである第2の選択効率についての値を有し、例えば、第3、第4または第5の予め選択された選択効率よりも大きい選択効率についての値を有する。(例えば、第3の選択効率についての値よりも約2倍大きく;第4の選択効率についての値よりも約4倍大きく;第5の選択効率についての値よりも約20〜2000倍大きい。);
(iii)第3の予め選択された効率は、少なくとも約100X以上の配列決定デプスである第3の選択効率についての値を有し、例えば、第4または第5の予め選択された選択効率よりも大きい選択効率についての値を有する(例えば、第4の選択効率についての値よりも約2倍大きく;第5の選択効率についての値よりも約10〜1000倍大きい。);
(iv)第4の予め選択された効率は、少なくとも約50X以上の配列決定デプスである第4の選択効率についての値を有し、例えば、第5の予め選択された選択効率よりも大きい選択効率についての値を有する(例えば、第5の選択効率についての値よりも約50〜500倍大きい。);または
(v)第5の予め選択された効率は、少なくとも約10X〜0.1X配列決定デプスである第5の選択効率についての値を有する。
ある一定の実施形態において、選択効率についての値は、異なるベイトセットの差次的な表示、ベイトサブセットの差次的な重複(differential overlap)、異なるベイトパラメータ、異なるベイトセットの混合および/または異なるタイプのベイトセットの使用のうち1つ以上により改変される。例えば、選択効率の変動(例えば、各ベイトセット/標的カテゴリの相対的配列カバレッジ)は、次のうち1つ以上を変更することによって調整し得る:
(i)異なるベイトセットの差次的な表示−相対的な標的カバレッジのデプスを増強/低下させるために、所与の標的(例えば標的メンバー)を捕捉するためのベイトセット設計は、より多くの/より少ないコピー数に含まれ得る;
(ii)ベイトセットの差次的な重複(differential overlap)−相対的な標的カバレッジのデプスを増強/低下させるために、所与の標的(例えば標的メンバー)を捕捉するためのベイトセット設計は、近隣ベイト間のより長いかまたはより短い重複を含み得る;
(iii)差次的ベイトパラメータ−捕捉効率を低下させ、相対的な標的カバレッジのデプスを低下させるために、所与の標的(例えば標的メンバー)を捕捉するためのベイトセット設計は、配列修飾/長さがより短いことを含み得る;
(iv)異なるベイトセットの混合−相対標的カバレッジのデプスを増強/低下させるために、異なる標的セットを捕捉するように設計されるベイトセットを異なるモル比率で混合し得る;
(v)異なるタイプのオリゴヌクレオチドベイトセットの使用−ある一定の実施形態において、ベイトセットは次のものを含み得る:
(a)1つ以上の化学的に(例えば非酵素的に)合成された(例えば個別に合成された)ベイト、
(b)アレイにおいて合成された1つ以上のベイト、
(c)1つ以上の酵素的に調製された、例えばインビトロで転写されたベイト;
(d)(a)、(b)および/または(c)の何らかの組み合わせ、
(e)1つ以上のDNAオリゴヌクレオチド(例えば天然または非天然のDNAオリゴヌクレオチド)、
(f)1つ以上のRNAオリゴヌクレオチド(例えば天然または非天然のRNAオリゴヌクレオチド)、
(g)(e)および(f)の組み合わせ、または
(h)上記の何れかの組み合わせ。
異なるオリゴヌクレオチドの組み合わせは、様々な比、例えば、1:1、1:2、1:3、1:4、1:5、1:10、1:20、1:50;1:100、1:1000などから選択される比率で混合され得る。一実施形態において、化学合成されたベイトとアレイ生成ベイトとの比率は、1:5、1:10または1:20から選択される。DNAまたはRNAオリゴヌクレオチドは、天然または非天然であり得る。ある一定の実施形態において、ベイトは、例えば融解温度を上昇させるために1つ以上の非天然ヌクレオチドを含む。代表的な非天然オリゴヌクレオチドとしては、修飾DNAまたはRNAヌクレオチドが挙げられる。代表的な修飾ヌクレオチド(例えば修飾RNAまたはDNAヌクレオチド)としては、ロックド核酸(LNA)(LNAヌクレオチドのリボース部分が2’酸素および4’炭素を連結する余分な架橋で修飾される。);ペプチド核酸(PNA)、例えば、ペプチド結合によって連結された繰り返しN−(2−アミノエチル)−グリシン単位から構成されるPNA;低GC領域を捕捉するように修飾されたDNAまたはRNAオリゴヌクレオチド;二環式核酸(BNA);架橋オリゴヌクレオチド;修飾5−メチルデオキシシチジン;および2,6−ジアミノプリンが挙げられるが限定されない。他の修飾DNAおよびRNAヌクレオチドは当技術分野で公知である。
ある一定の実施形態において、標的配列(例えば標的メンバー)の実質的に均一または均質なカバレッジが得られる。例えば、各ベイトセット/標的カテゴリ内で、ベイトパラメータを修飾することによって、例えば次のうち1つ以上によって、カバレッジの均一性を最適化し得る:
(i)同じカテゴリ中の他の標的に対して過小/過剰にカバーされる標的(例えば標的メンバー)のカバレッジを拡大/縮小させるために、ベイト表示または重複を増加/減少させることを使用し得る;
(ii)低カバレッジのために、標的配列(例えば高GC含量配列)を捕捉することが困難である場合、例えば隣接配列(例えばGCリッチ度がより低い隣接配列)をカバーするようにベイトセットで標的化される領域を拡大する;
(iii)ベイトの二次構造を減少させ、その選択効率を高めるために、ベイト配列の修飾をなし得る;
(iv)同じカテゴリ内の異なるベイトの融解ハイブリダイゼーション速度を等しくするために、ベイトの長さの変更を使用し得る。(長さが様々なベイトを作製することによって)直接、または(一貫した長さのベイトを作製し、ベイト末端を任意の配列で置き換えることによって)間接的にベイト長を変更し得る;
(v)同じ標的領域(すなわちフォワードおよびリバース鎖)に対して異なる向きのベイトを修飾することで、結合効率が異なり得る。各標的に対して最適のカバレッジを提供する何れかの方向性を有するベイトセットを選択し得る;
(vi)各ベイト上に存在する結合実体、例えば捕捉タグ(例えばビオチン)の量を変更することは、その結合効率に影響を及ぼし得る。相対標的カバレッジを拡大/縮小させるために、特定の標的を標的とするベイトのタグレベルを増加/減少させることを使用し得る;
(vii)標的への結合親和性に影響を及ぼし、相対標的カバレッジを拡大/縮小させるために、異なるベイトに対して使用されるヌクレオチドのタイプを変更し得る;または
(viii)高GC含量に対して低いまたは通常のGC含量の領域間での融解ハイブリダイゼーション速度を等しくするために、修飾オリゴヌクレオチドベイトを用いること、例えばより安定な塩基対形成を有することを使用し得る。
例えば、異なるタイプのオリゴヌクレオチドベイトセットを使用し得る。
一実施形態において、選択効率についての値は、予め選択された標的領域を包含するために異なるタイプのベイトオリゴヌクレオチドを使用することによって修正される。例えば、大きな標的領域(例えば1〜2MBの全標的領域)をカバーするために、第1のベイトセット(例えば10,000〜50,000のRNAまたはDNAベイトを含むアレイに基づくベイトセット)を使用し得る。予め選択された標的領域(例えば、標的領域の関心のある全域、例えば250kb以下の選択されたサブゲノム区間)をカバーするために、第2のベイトセット(例えば5,000個未満のベイトを含む個別に合成されたRNAまたはDNAベイトセット)および/またはより高い二次構造、例えばより高いGC含量の領域を第1のベイトセットに添加し得る。関心のある選択対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、本明細書中に記載の遺伝子もしくは遺伝子産物のうち1つ以上またはその断片に対応し得る。第2のベイトセットは、所望のベイト重複に応じて、約1〜5,000、2〜5,000、3〜5,000、10〜5,000、100〜5,000、500〜5,000、100〜5,000、1,000〜5,000、2,000〜5,000個のベイトを含み得る。他の実施形態において、第2のベイトセットは、第1のベイトセットに添加される選択オリゴベイト(例えば、400、200、100、50、40、30、20、10、5、4、3、2または1個未満のベイト)を含み得る。第2のベイトセットは、個々のオリゴベイトのあらゆる比率で混合され得る。例えば、第2のベイトセットは、1:1の等モル比として存在する個々のベイトを含み得る。あるいは、第2のベイトセットは、例えば、ある一定の標的(例えば、ある一定の標的は、他の標的と比較して5〜10Xの第2のベイトを有し得る。)の捕捉を最適化するために、異なる比率(例えば、1:5、1:10、1:20)で存在する個々のベイトを含み得る。
他の実施形態において、ベイトの当モル混合を使用した場合に観察される異なる配列捕捉効率に関連してベイトの相対的存在量または結合実体の密度(例えばハプテンまたは親和性タグ密度)を調整し、次いで内部水平化した群2に対して、全体的なベイト混合物に差次的過剰量の内部水平化した群1を導入することにより、群内(例えば、第1、第2または第3の複数のベイト)で個々のベイトの効率を等しくすることによって、選択効率が調整される。
一実施形態において、本方法は、腫瘍メンバー、例えば、腫瘍細胞からの対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む核酸分子を選択するベイトセット(本明細書で「腫瘍ベイトセット」とも呼ばれる。)を含む複数のベイトセットの使用を含む。腫瘍メンバーは、腫瘍細胞中に存在する何らかのヌクレオチド配列、例えば腫瘍または癌細胞中に存在する本明細書中に記載のような突然変異型、野生型、PGx、参照またはイントロンヌクレオチド配列であり得る。一実施形態において、腫瘍メンバーは、低頻度で出現する変化(例えば1つ以上の突然変異)を含み、例えば、腫瘍試料からの細胞の約5%以下がそれらのゲノムにおいて変化を有する。他の実施形態において、腫瘍メンバーは、腫瘍試料からの細胞の約10%の頻度で出現する変化(例えば1つ以上の突然変異)を含む。他の実施形態において、腫瘍メンバーは、PGx遺伝子または遺伝子産物からのサブゲノム区間、イントロン配列、例えば、本明細書中に記載のようなイントロン配列、腫瘍細胞中に存在する参照配列を含む。
別の態様において、本発明は、本明細書中に記載のベイトセット、本明細書中に記載の個々のベイトセットの組み合わせ、例えば本明細書中に記載の組み合わせを特徴とする。(1つまたは複数の)ベイトセットは、説明書、標準物質、緩衝液または酵素または他の試薬を含んでいてもよいキットの一部であり得る。
遺伝子選択
分析のための予め選択された対象区間、例えば、サブゲノム区間、発現サブゲノム区間またはその両方、例えば遺伝子および他の領域のセットまたは群に対するサブゲノム区間の群またはセットが本明細書中で記載される。
したがって、一実施形態において、方法は、得られた核酸試料からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の、表1〜4から選択される、遺伝子または遺伝子産物からの対象区間(例えばサブゲノム区間または発現サブゲノム区間)を例えば次世代配列決定法によって配列決定し、それにより、例えば本明細書中に記載の癌からの腫瘍試料を分析することを含む。
したがって、一態様において、本発明は、試料、例えば、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)からの腫瘍試料、を分析する方法を特徴とする。本方法は、
(a)試料からの複数メンバー、例えば、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)からの腫瘍試料からの複数の腫瘍メンバーを含む1つまたは複数のライブラリを得て;
(b)選択メンバー(例えばライブラリキャッチ)を提供するために、例えば1つまたは複数のライブラリをベイトセット(または複数のベイトセット)と接触させることによって、予め選択した配列に対して1つまたは複数のライブラリを濃縮してもよく;
(c)例えば配列決定を含む方法によって、例えば次世代配列決定法で、メンバー、例えば前記のライブラリまたはライブラリキャッチからの腫瘍メンバーから、対象区間(例えばサブゲノム区間または発現サブゲノム区間)に対するリードを得て;
(d)アライメント方法、例えば本明細書中に記載のアライメント方法によって前記のリードをアライメントし;
(e)予め選択されたヌクレオチド位置についての前記のリードからヌクレオチド値を割り当て(例えばベイジアン法または本明細書中に記載の方法により、突然変異を呼び出し)、それにより前記の腫瘍試料を分析することを含み、
本方法は、試料からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の、表1〜4から選択される、遺伝子または遺伝子産物からの対象区間(例えばサブゲノム区間または発現サブゲノム区間)を例えば次世代配列決定法によって配列決定することを含んでいてもよい。
一実施形態において、段階(b)が存在する。一実施形態において、段階(b)は存在しない。
別の実施形態において、次のセットまたは群の1つの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)を分析する。例えば、腫瘍または癌遺伝子または遺伝子産物、参照(例えば野生型)遺伝子または遺伝子産物およびPGx遺伝子または遺伝子産物に関連する対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、腫瘍試料からサブゲノム区間の群またはセットを提供し得る。
一実施形態において、本方法は、リード、例えば配列、腫瘍試料からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のセットを得るが、ここで、この対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、次のもののうち少なくとも1、2、3、4、5、6、7または全てから選択される:
A)表1〜4による突然変異型または野生型遺伝子もしくは遺伝子産物からの、少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の対象区間、例えばサブゲノム区間または発現サブゲノム区間またはその両方;
B)腫瘍または癌に関連する遺伝子または遺伝子産物(例えば陽性または陰性処置反応予測因子であるか、陽性または陰性予後因子であるかまたは腫瘍もしくは癌の鑑別診断を可能とするもの、例えば表1〜4による遺伝子または遺伝子産物)からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の対象区間(例えばサブゲノム区間または発現サブゲノム区間またはその両方);
C)表1〜4から選択される、薬物代謝、薬物反応性または毒性の1つ以上に関連する遺伝子または遺伝子産物(そこでPGx遺伝子とも呼ばれる。)に存在するサブゲノム区間の突然変異型または野生型遺伝子もしくは遺伝子産物(例えば一塩基多型(SNP))からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の対象区間(例えばサブゲノム区間または発現サブゲノム区間またはその両方);
D)表1〜4から選択される、(i)薬物で処置された癌患者のより良好な生存率(例えばパクリタキセルで処置された乳癌患者のより良好な生存率);(ii)パクリタキセル代謝;(iii)薬物に対する毒性;または(iv)薬物に対する副作用のうち1つ以上に関連する遺伝子または遺伝子産物中に存在する対象区間(例えばサブゲノム区間または発現サブゲノム区間)の突然変異型もしくは野生型PGx遺伝子または遺伝子産物(例えば一塩基多型(SNP))からの少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の対象区間(例えばサブゲノム区間または発現サブゲノム区間またはその両方);
E)表1〜4による少なくとも5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400、500個、またはそれ以上の遺伝子または遺伝子産物の転座変化;
F)表1〜4から選択される少なくとも5個の遺伝子または遺伝子産物であって、例えば予め選択された位置での対立遺伝子の多様性が予め選択されたタイプの腫瘍と関連し、前記の対立遺伝子の多様性が、前記の腫瘍タイプにおける細胞の5%未満で存在するもの;
G)GCリッチ領域に埋め込まれている表1〜4から選択される少なくとも5個の遺伝子または遺伝子産物;または
H)癌発症のための遺伝(例えば、生殖系列リスク)要因(例えば、遺伝子または遺伝子産物は表1〜4から選択される。)を示す少なくとも5個の遺伝子または遺伝子産物。
また別の実施形態において、本方法は、リード、例えば配列、腫瘍試料からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のセットを得るが、ここでこの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、表1に記載の遺伝子または遺伝子産物のうち、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300、400または全てから選択される。
また別の実施形態において、本方法は、リード、例えば配列、腫瘍試料からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のセットを得るが、ここでこの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、表2に記載の遺伝子または遺伝子産物のうち、5、6、7、8、9、10、15、20、25、30または全てから選択される。
また別の実施形態において、本方法は、リード、例えば配列、腫瘍試料からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のセットを得るが、ここでこの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、表3に記載の遺伝子または遺伝子産物のうち、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、200、300または全てから選択される。
また別の実施形態において、本方法は、リード、例えば配列、腫瘍試料からの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)のセットを得るが、ここでこの対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、表4に記載の遺伝子または遺伝子産物のうち、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80または全てから選択される。
これらおよび他のサブゲノム区間のセットおよび群は、本明細書の他の箇所、例えば、「遺伝子選択」という題名のセクションでより詳細に論じる。
本明細書中に記載の方法の何れも、以下の実施形態の1つ以上と組み合わせ得る。
他の実施形態において、試料は腫瘍試料であり、例えば、1つ以上の前悪性または悪性細胞を含む。ある一定の実施形態において、試料、例えば腫瘍試料は、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)から得られる。ある一定の実施形態において、試料、例えば腫瘍試料は、固形腫瘍、軟部組織腫瘍または転移性病変から得られる。他の実施形態において、試料、例えば腫瘍試料は、切除縁からの組織または細胞を含む。ある一定の実施形態において、試料、例えば腫瘍試料は、腫瘍浸潤リンパ球を含む。試料は、組織学的に正常な組織であり得る。別の実施形態において、試料、例えば腫瘍試料は、1つ以上の循環腫瘍細胞(CTC)(例えば血液試料から得られるCTC)を含む。一実施形態において、試料、例えば腫瘍試料は、1つ以上の非悪性細胞を含む。一実施形態において、試料、例えば腫瘍試料は、1つ以上の腫瘍浸潤リンパ球を含む。
一実施形態において、本方法は、試料、例えば、本明細書中に記載の腫瘍試料を得ることをさらに含む。試料は、直接的または間接的に得られ得る。一実施形態において、試料は、悪性細胞および非悪性細胞(例えば、腫瘍浸潤リンパ球)の両方を含有する試料から、例えば単離または精製によって得られる。
他の実施形態において、本方法は、本明細書中に記載の方法を使用して、試料、例えば組織学的に正常な試料、例えば切除縁からのもの、を評価することを含む。出願人は、組織学的に正常な組織から得られた試料(例えば他の点では組織学的に正常な組織縁)が、本明細書に記載されるような変化を依然として有し得ることを発見した。したがって、本方法は、検出された変化の存在に基づいて組織試料を再分類することをさらに含み得る。
別の実施形態において、得られるかまたは分析されるリードの少なくとも10、20、30、40、50、60、70、80または90%は、本明細書中に記載の遺伝子、例えば表1〜4からの遺伝子からの対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)に対するものである。
一実施形態において、本方法で生成される突然変異呼び出しの少なくとも10、20、30、40、50、60、70、80または90%は、本明細書中に記載の遺伝子または遺伝子産物、例えば表1〜4からの遺伝子または遺伝子産物からの対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)に対するものである。
一実施形態において、本方法において使用される固有の閾値の少なくとも10、20、30、40、50、60、70、80または90%は、本明細書中に記載の遺伝子または遺伝子産物、例えば表1〜4からの遺伝子または遺伝子産物からの対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)に対するものである。
一実施形態において、第三者に対してアノテーションされるかまたは報告される突然変異呼び出しの少なくとも10、20、30、40、50、60、70、80または90%は、本明細書中に記載の遺伝子または遺伝子産物、例えば表1〜4からの遺伝子または遺伝子産物からの対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)に対するものである。
一実施形態において、本方法は、腫瘍および/または対照核酸試料(例えばFFPE由来核酸試料)から得られたヌクレオチド配列リードを得ることを含む。
一実施形態において、リードは、NGS配列決定方法によって提供される。
一実施形態において、本方法は、核酸メンバーの1つまたは複数のライブラリを提供し、前記の1つまたは複数のライブラリの複数のメンバーから、予め選択されたサブゲノム区間を配列決定することを含む。実施形態において、本方法は、配列決定のための前記の1つまたは複数のライブラリのサブセットを選択する段階、例えば溶液ベースの選択または固体支持体(例えばアレイ)ベースの選択を含み得る。
一実施形態において、本方法は、核酸の選択サブグループ、例えばライブラリキャッチを提供するために、1つまたは複数のライブラリを複数のベイトに接触させる段階を含む。一実施形態において、接触段階は溶液ハイブリダイゼーションにおいて行われる。別の実施形態において、接触段階は、固体支持体、例えばアレイにおいて行われる。ある一定の実施形態において、本方法は、1回以上のさらなるハイブリダイゼーションによってハイブリダイゼーション段階を繰り返すことを含む。いくつかの実施形態において、本方法は、同じまたは異なるベイト収集物を用いた1回以上のさらなるハイブリダイゼーションにライブラリキャッチを供することをさらに含む。
さらに他の実施形態において、本方法は、ライブラリキャッチを分析することをさらに含む。一実施形態において、ライブラリキャッチは、配列決定方法、例えば、本明細書中に記載のような次世代配列決定方法によって分析される。本方法は、例えば、溶液ハイブリダイゼーションによってライブラリキャッチを単離し、核酸配列決定にそのライブラリキャッチを供することを含む。ある一定の実施形態において、ライブラリキャッチを再配列決定し得る。次世代配列決定方法は当技術分野で公知であり、例えばMetzker,M.(2010)Nature Biotechnology Reviews 11:31−46に記載されている。
一実施形態において、ヌクレオチド位置に対する割り当て値は、説明的なアノテーション付きで第三者に伝達してもよい。
一実施形態において、ヌクレオチド位置に対する割り当て値は、第三者に伝達されない。
一実施形態において、複数のヌクレオチド位置に対する割り当て値は、場合によっては説明的なアノテーション付きで、第三者に伝達され、第2の複数のヌクレオチド位置に対する割り当て値は第三者に伝達されない。
一実施形態において、少なくとも0.01、0.02、0.03、0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、15または30メガ塩基の塩基、例えばゲノム塩基を配列決定する。
一実施形態において、本方法は、少なくとも1つのSNPを含む複数のリードを評価することを含む。
一実施形態において、本方法は、試料および/または対照リード中のSNP対立遺伝子比を決定することを含む。
一実施形態において、本方法は、例えばバーコード解析によって1つ以上のリードを対象に割り当てることを含む。
一実施形態において、本方法は、例えば、バーコード解析によって、腫瘍リードまたは対照リードとして1つ以上のリードを割り当てることを含む。
一実施形態において、本方法は、例えば、参照配列とのアライメントによって、前記の1つ以上のリードのそれぞれをマッピングすることを含む。
一実施形態において、本方法は、呼び出された突然変異を提出(memorializing)することを含む。
一実施形態において、本方法は、呼び出された突然変異にアノテーションすること、例えば突然変異構造、例えばミスセンス突然変異、または機能、例えば疾患表現型、の指標がある呼び出された突然変異にアノテーションすることを含む。
一実施形態において、本方法は、腫瘍および対照核酸に対するヌクレオチド配列リードを得ることを含む。
一実施形態において、本方法は、例えばベイジアン呼び出し法または非ベイジアン呼び出し法によって、対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)のそれぞれに対する、ヌクレオチド値、例えば変異体、例えば突然変異を呼び出すことを含む。
一実施形態において、例えば異なる対象からの複数の試料が同時に処理される。
本明細書で開示される方法は、対象のゲノムまたはトランスクリプトームに存在する変化を検出するために使用し得、DNAおよびRNA配列決定、例えば標的化RNAおよび/またはDNA配列決定に適用し得る。したがって、本発明において特徴となる別の態様は、本明細書中に記載の変化を検出するための、標的化RNA配列決定、例えば試料、例えばFFPE試料、血液試料または骨髄穿刺試料から得られたRNA由来のcDNAの配列決定ための方法を含む。この変化は、再編成、例えば遺伝子融合をコードする再編成であり得る。他の実施形態において、本方法は、遺伝子または遺伝子産物のレベルの変化(例えば増加または減少)、例えば、本明細書中に記載の遺伝子または遺伝子産物の発現の変化の検出を含む。本方法は、標的RNAについて試料を濃縮する段階を含んでいてもよい。他の実施形態において、本方法は、ある一定の高存在量のRNA、例えばリボソームまたはグロビンRNAの試料を枯渇させる段階を含む。RNA配列決定方法は、単独で、または本明細書中に記載のDNA配列決定方法と組み合わせて使用し得る。一実施形態において、本方法は、DNA配列決定段階およびRNA配列決定段階を実施することを含む。本方法は、あらゆる順序で行い得る。例えば、本方法は、本明細書中に記載の変化の発現をRNA配列決定することによって確認すること、例えば本発明のDNA配列決定方法によって検出される突然変異または融合の発現を確認することを含み得る。他の実施形態において、本方法は、RNA配列決定段階を行い、続いてDNA配列決定段階を行うことを含む。
別の態様において、本発明は、標的化サブゲノム領域に対する配列決定/アライメントアーチファクトのデータベースを構築することを含む方法を特徴とする。実施形態において、偽の突然変異呼び出しを除去し、特異性を改善するために、データベースを使用し得る。一実施形態において、データベースは、無関係の非腫瘍(例えばFFPE、血液または骨髄穿刺)試料または細胞株の配列決定を行い、これらの正常試料の1つ以上において無作為の配列決定エラーのみに起因する、予想されるものよりも頻度が高いと思われる非参照対立遺伝子事象を記録することによって構築される。このアプローチは、生殖系列変異をアーチファクトとして分類し得るが、それは体細胞突然変異に関する方法では許容可能である。アーチファクトとしての生殖細胞系列変異のこの誤分類は、必要に応じて、既知の生殖系列変異(共通変異体の除去)に対して、および1個体のみに出現するアーチファクトに対して(希少変異の除去)このデータベースをフィルタリングすることにより、改善し得る。
本明細書中で開示される方法は、例えば、ゲノムの癌関連セグメントに適用されるような、最適化されたベイトに基づく選択、最適化されたアライメントおよび最適化された突然変異呼び出しを含む多数の最適化された要素の統合を可能にする。本明細書中に記載の方法は、癌ごと、遺伝子ごとおよび部位ごとに最適化し得る腫瘍のNGSに基づく分析を提供する。これは、例えば、本明細書中に記載の遺伝子/部位および腫瘍タイプに適用し得る。本方法は、所定の配列決定技術を用いて突然変異検出に対する感度および特異性のレベルを最適化する。癌ごと、遺伝子ごと、および部位ごとの最適化は、臨床製品にとって必須である非常に高いレベルの感度/特異性(例えば両方について>99%)を提供する。
本明細書に記載される方法は、最適処置および疾患管理の決断を知らせるために、日常的な実在の試料からの、次世代配列決定技術を用いた、臨床および規制グレードの包括的な分析および妥当に実用可能な遺伝子の包括的セット(これは一般的には50〜500個の遺伝子の範囲であり得る。)に対するゲノム異常の解釈を提供する。
本明細書中に記載の方法は、最適処置および疾患管理の判断を知らせるために、腫瘍試料を送付してその腫瘍に対するゲノムおよび他の分子の変化の包括的な分析および説明を受領する腫瘍専門医/病理学者のためのワンストップショッピングを提供する。
本明細書中に記載の方法は、標準的な入手可能な腫瘍試料を採取するロバストで現実的な臨床癌診断ツールを提供し、1つの試験で、どの異常が腫瘍の原因になり得、腫瘍専門医に処置判断を伝えるのに有用であり得るかの包括的な説明を腫瘍専門医に提供するために、包括的なゲノムおよび他の分子の異常分析を提供する。
本明細書中に記載の方法は、臨床グレードの品質の、患者の癌ゲノムの包括的分析を提供する。方法は、最も関連性の高い遺伝子および潜在的な変化を含み、突然変異、コピー数、再編成、例えば転座、発現およびエピジェネティックマーカーの分析のうち1つ以上を含む。遺伝子分析の結果は、実施可能な結果の記述的報告とともに状況を説明し得る。方法は、この使用を関連する科学的および医学的知識の最新のセットと結び付ける。
本明細書中に記載の方法は、ケアの質および効率の両方の向上をもたらす。これには、腫瘍が、標準治療がないかまたは確立された一連の治療が患者にとって無効であるような、稀であるかまたはあまり研究されていないタイプのものであり、さらなる治療の選択のための、または臨床試験参加のための合理的根拠が有用であり得る、適用を含む。例えば、方法は、治療の何れかの時点で、腫瘍専門医が意思決定を伝えるために利用可能な完全な「分子イメージ」および/または「分子サブ診断」を有することによって利益を得る選択を可能にする。
本明細書中に記載の方法は、患者または別の者または実体、例えば介護者、例えば医師、例えば腫瘍専門医、病院、クリニック、第三者の支払人、保険会社または官公庁に、例えば電子、ウェブベースまたは紙形態で、レポートを提供することを含み得る。この報告は、本方法からの結果、例えばヌクレオチド値の同定、試料のタイプの腫瘍と関連する、例えば対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)に対する、変化、突然変異もしくは野生型配列の有無の指標を含み得る。報告書はまた、配列の役割における情報、例えば疾患における変化、突然変異または野生型配列も含み得る。このような情報は、予後、耐性または潜在的もしくは示唆された治療選択肢に対する情報を含み得る。報告は、治療選択肢の起こり得る有効性、治療選択肢の許容性または、患者、例えば試験において、および実施形態において同定される、本報告で同定される、配列、変化または突然変異を有する患者に対する治療選択肢の適用の妥当性に対する情報を含み得る。例えば、報告は、薬物の投与、例えば予め選択された投与量での、または予め選択された処置計画での、例えば他の薬物と組み合わせられた、患者への投与に対する、情報または推奨を含み得る。一実施形態において、本方法で同定される突然変異の全てが報告で特定される訳ではない。例えば、報告は、例えば予め選択された治療選択肢による処置に対する癌の発生、予後、ステージまたは易罹患性との相関の予め選択されたレベルを有する遺伝子における突然変異に限定され得る。本明細書において特徴となる方法は、本方法を実施する実体による試料の受領から7日、14日または21日以内に、例えば本明細書中に記載の実体に報告を送付することを可能にする。
このように、本発明において特徴とされる方法は、例えば試料の受領から7、14または21日以内という、迅速なターンアラウンド時間を可能にする。
本明細書中に記載の方法は、組織学的に正常な試料、例えば切除縁からの試料を評価するためにも使用し得る。本明細書中に記載のような1つ以上の変化を検出する場合、組織は、例えば悪性または前悪性として再分類され得、および/または治療経過が変更され得る。
ある一定の態様において、本明細書中に記載の配列決定方法は、非癌用途、例えば法医学用途(例えば、歯科記録の使用の代替としてまたはそれに加えた同定)、父親検査および、疾患の診断および予後、例えば、中でも感染性疾患、自己免疫障害、嚢胞性線維症、ハンチントン病、アルツハイマー病に対して有用である。例えば、本明細書中に記載の方法による遺伝子変化の同定は、特定の障害を発症することについての個体の存在またはリスクを示し得る。
別段の定めがない限り、本明細書で使用される全ての技術用語および科学用語は、本発明が属する技術分野での通常の技術者によって一般的に理解されるものと同じ意味を有する。本明細書に記載されているものと同様または同等の方法および材料を本発明の実施または試験において使用し得るが、適切な方法および材料を以下に記載する。本明細書中で言及される全ての刊行物、特許出願、特許および他の参考文献は、その全体において参照により組み込まれる。さらに、材料、方法および実施例は単なる例示であり、限定することを意図するものではない。
本発明の他の特徴および利点は、詳細な説明、図面から、および特許請求の範囲から明らかになるであろう。
図1Aは、腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャートを示す。 図1Bは、腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャートを示す。 図1Cは、腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャートを示す。 図1Dは、腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャートを示す。 図1Eは、腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャートを示す。 図1Fは、腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャートを示す。 図2は、突然変異検出に対する事前予測およびリードデプスの影響を示す。
遺伝子および遺伝子産物の選択された群を評価することによる、1名以上の対象からの試料、例えば疾患状態組織または非疾患状態組織からの、多数の遺伝子および遺伝子産物、例えば抗体または免疫グロブリンスーパーファミリー受容体(例えばT細胞受容体またはB細胞受容体)を配列決定するための最適化された方法およびアッセイが開示される。一実施形態において、本発明の特色とされる方法およびアッセイは、多重アッセイ形式、例えば、多数の遺伝子における多数の多様な遺伝子事象からの複数のシグナルを組み込んだアッセイにおいて使用される。本明細書中に開示されるのは、癌性表現型(例えば、癌リスク、癌進行、癌処置または処置に対する耐性のうち1つ以上)に(例えば、陽性または陰性に)関連する遺伝子または遺伝子産物の選択された群に少なくとも部分的に基づく方法およびアッセイである。このような予め選択された遺伝子または遺伝子産物は、配列決定方法、特に多数の多様な遺伝子、例えば腫瘍または対照試料の大規模並行配列決定に依存する方法の適用を可能にする。
本明細書中で開示される方法は、例えばDNAおよびRNAレベルの一方または両方での、対象区間のクローン分析を提供する。例えば、本明細書中で開示される方法は、対象区間での事象の相対的存在量、例えば免疫グロブリン、B細胞受容体またはT細胞受容体中の、例えば特定のVセグメントまたはVD、VJもしくはDJ連結部の相対的存在量を提供することを可能にする。他の方法は、対象区間での、例えば体細胞高頻度変異からの、多様性レベルの評価を可能にする。他の方法は、大きな染色体、例えば全腕再編成の分析を可能にする。他の(Onther)の方法は、血液悪性腫瘍(または前悪性腫瘍)に関与する対象区間の、例えばDNAまたはRNAレベルの一方または両方での、評価を可能にする。
ある一定の用語を最初に定義する。本明細書全体を通じてさらなる用語を定義する。
本明細書で使用される場合、冠詞「a」および「an」は、その冠詞の文法上の目的語の1つまたは複数(例えば少なくとも1つ)を指す。
「約」および「およそ」は、一般に、測定の性質または精度を考慮して、測定された量に対する許容可能なエラーの程度を意味する。代表的なエラーの程度は、所与の値または値の範囲の20%以内、一般的には10%以内、より一般的には5%以内である。
「得る」または「得ること」とは、この用語が本明細書中で使用される場合、物理的実体または値を「直接得ること」または「間接的に得ること」によって、物理的実体または値、例えば数値の所有を得ることを指す。「直接得ること」とは、物理的実体または値を得るために、ある工程を行うこと(例えば、合成または分析方法を行うこと)を意味する。「間接的に得ること」とは、別の団体または供給元(例えば、物理的実体または値を直接得る第三者の研究室)から物理的実体または値を受領することを指す。物理的実体を直接得ることは、物理的材料、例えば出発材料における物理的変化を含む工程を行うことを含む。代表的な変化は、2つまたは1つ(ore)の出発材料から物理的実体を作製し、物質をせん断または断片化し、物質を分離または精製し、2つ以上の別個の実体を混合物になるように組み合わせ、共有または非共有結合を破壊するかまたは形成させることを含む化学反応を行うことを含む。値を直接得ることは、試料または別の物質における物理的変化を含む工程を行うこと、例えば物質、例えば試料、分析物または試薬における物理的変化を含む分析工程を行うこと(本明細書中で「物理学的分析」と呼ぶことがある。)、分析方法、例えば次のもの:物質、例えば分析物またはその断片もしくは他の誘導体を別の物質から分離または精製すること;分析物またはその断片もしくは他の誘導体を別の物質、例えば緩衝液、溶媒または反応物と組み合わせること;または、分析物の第1の原子と第2の原子との間の共有結合もしくは非共有結合を切断または形成させることによって;または試薬もしくはその断片もしくは他の誘導体の構造を変化させることによって、例えば試薬の第1の原子と第2の原子との間の共有結合もしくは非共有結合を切断または形成させることによって、分析物またはその断片もしくは他の誘導体の構造を変化させることのうちの1つ以上を含む方法を行うことを含む。
「配列を得ること」または「リードを得ること」は、この用語が本明細書中で使用される場合、配列またはリードを「直接得る」または「間接的に得る」ことによってヌクレオチド配列またはアミノ酸配列の所有を得ることを指す。配列またはリードを「直接得ること」は、配列決定方法(例えば次世代配列決定(NGS)法)を行うなど、配列を得るための工程を行うこと(例えば、合成法または分析法を行うこと)を意味する。配列またはリードを「間接的に得る」とは、別の集団または供給源(例えば、配列を直接得た第三者研究室)から配列の情報または知識を受領するかまたは配列を受領することを指す。得られた配列またはリードは、全配列である必要はなく、例えば、配列を得る対象構成に存在するように本明細書中で開示される変化のうち1つ以上を識別する少なくとも1個のヌクレオチドの配列決定、または情報もしくは知識を得ることである。
配列またはリードを直接得ることは、物理的物質、例えば出発材料、例えば組織または細胞試料など、例えば生検または単離核酸(例えばDNAまたはRNA)試料における物理的変化を含む工程を行うことを含む。代表的な変化は、2つ以上の出発材料から物理的実体を作製し、物質、例えばゲノムDNA断片など、をせん断または断片化し;物質を分離または精製し(例えば組織から核酸試料を単離し);2つ以上の別個の実体を混合物になるように組み合わせ、共有または非共有結合を破壊するかまたは形成させることを含む化学反応を行うことを含む。値を直接得ることは、上記のような試料または別の物質における物理的変化を含む工程を行うことを含む。
「試料を得ること」とは、この用語が本明細書中で使用される場合、試料を「直接得る」かまたは「間接的に得る」ことによって、試料、例えば組織試料または核酸試料の所有を得ることを指す。「試料を直接得る」とは、試料を得るための工程を行うこと(例えば、外科的手術または抽出などの物理的方法を行うこと)を意味する。「試料を間接的に得る」とは、別の団体または供給元(例えば、試料を直接得る第三者の研究室)から試料を受領することを指す。試料を直接得ることは、物理的物質、例えば出発材料、例えば組織、例えばヒト患者における組織または患者から以前に単離された組織における物理的変化を含む工程を行うことを含む。代表的な変化は、出発材料から物理的実体を作製し、組織を解体または擦り取り;物質(例えば試料組織または核酸試料)を分離または精製し;2つ以上の別個の実体を混合物になるように組み合わせ;共有または非共有結合を破壊するかまたは形成させることを含む化学反応を行うことを含む。試料を直接得ることは、例えば上記のような試料または別の物質における物理的変化を含む工程を行うことを含む。
「アライメントセレクタ」は、本明細書中で使用される場合、予め選択されたサブゲノム区間の配列決定を最適化し得るアライメント方法、例えばアライメントアルゴリズムまたはパラメータの選択を可能にするかまたは指示するパラメータを指す。アライメントセレクタは、例えば、次のもののうち1つ以上の関数に特異的であり得るか、または関数として選択され得る。
1.配列状況、例えば、サブゲノム区間に対するリードのミスアライメントに対する傾向を付随するサブゲノム区間(例えば、評価しようとする予め選択されたヌクレオチド位置)の配列状況。例えば、ゲノムの他の場所で反復される評価しようとするサブゲノム区間中またはその付近の配列要素の存在は、ミスアライメントを引き起こし得、それによって性能が低下し得る。ミスアライメントを最小限に抑えるアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を向上させ得る。この場合、アライメントセレクタについての値は、配列状況の関数、例えば、ゲノム(または分析されているゲノムの一部分)中の少なくとも予め選択された回数反復される予め選択された長さの配列の有無であり得る。
2.分析されている腫瘍タイプ。例えば、特定の腫瘍型は、欠失率の増加を特徴とし得る。したがって、インデルに対してより感度が高いアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を向上させ得る。この場合、アライメントセレクタについての値は、腫瘍タイプの関数、例えば腫瘍タイプに対する識別子であり得る。一実施形態において、この値は、腫瘍タイプ、例えば血液悪性腫瘍(または前悪性腫瘍)の同一性である。
3.分析されている遺伝子または遺伝子のタイプ、例えば遺伝子または遺伝子のタイプを分析し得る。例として、癌遺伝子は、置換またはインフレームインデルを特徴とすることが多い。したがって、これらの変異体に対して特に感度が高く、他のものに対して特異的であるアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を向上させ得る。腫瘍抑制因子はフレームシフトインデルを特徴とすることが多い。したがって、これらの変異体に対して特に感度が高いアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を向上させ得る。したがって、サブゲノム区間と調和するアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を向上させ得る。この場合、アライメントセレクタについての値は、遺伝子または遺伝子のタイプ、例えば遺伝子または遺伝子のタイプに対する識別子の関数であり得る。一実施形態において、値は遺伝子の同一性である。
4.分析されている部位(例えばヌクレオチド位置)。この場合、アライメントセレクタについての値は、部位または部位のタイプ、例えば部位または部位のタイプに対する識別子の関数であり得る。一実施形態において、値は部位の同一性である。(例えば、その部位を含有する遺伝子が別の遺伝子と相同性が高い場合、通常型/高速の短いリードアライメントアルゴリズム(例えばBWA)は2つの遺伝子間を区別することが困難であり得、より強力なアライメント方法(Smith−Waterman)または均等アセンブリ(even assembly)(ARACHNE)を必要とする可能性がある。同様に、遺伝子配列が複雑性の低い領域(例えばAAAAAA)を含有する場合、より強力なアライメント方法が必要であり得る。
5.評価されているサブゲノム区間に関連する、変異体または変異体のタイプ。例えば、置換、挿入、欠失、転座または他の再編成。したがって、特異的な変異体のタイプに対してより感度が高いアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を向上させ得る。この場合、アライメントセレクタについての値は、変異体のタイプの関数、例えば変異体のタイプに対する識別子であり得る。一実施形態において、値は、変異体のタイプ、例えば置換、の同一性である。
6.試料のタイプ、FFPEまたは他の固定試料。試料のタイプ/品質は、エラー(非参照配列の偽の観察)率に影響を与え得る。したがって、試料における真偽率を的確に具現化するアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を向上させ得る。この場合、アライメントセレクタについての値は、試料のタイプの関数、例えば試料タイプに対する識別子であり得る。一実施形態において、値は、試料タイプ、例えば固定試料、の同一性である。
遺伝子または遺伝子産物(例えば、マーカー遺伝子または遺伝子産物)の本明細書で使用される場合の「変化」または「変化した構造」は、遺伝子または遺伝子産物内の1つまたは複数の突然変異、例えば、正常または野生型遺伝子と比較した場合、遺伝子または遺伝子産物の量または活性に影響を及ぼす突然変異の存在を指す。この変化は、正常または健康な組織または細胞(例えば対照)におけるその量、構造および/または活性と比較した場合の、癌組織または癌細胞における量、構造および/または活性におけるものであり得、癌などの疾患状態と関連する。例えば、癌に関連するか、または抗癌治療に対する反応性を予測する変化は、正常で健康な組織または細胞と比較した場合の、癌組織または癌細胞における、ヌクレオチド配列(例えば突然変異)、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性またはメチル化状態の変化であり得る。代表的な突然変異としては、点突然変異(例えば、サイレント、ミスセンスまたはナンセンス)、欠失、挿入、逆位、連結突然変異、重複、転座、染色体間および染色体内再編成が挙げられるが限定されない。突然変異は、遺伝子のコードまたは非コード領域に存在し得る。ある一定の実施形態において、(1つまたは複数の)変化は、再編成、例えば1つ以上のイントロンまたはその断片(例えば、5’−および/または3’−UTRにおける1つ以上の再編成)を含むゲノム再編成として検出される。ある一定の実施形態において、変化は、表現型、例えば癌性表現型(例えば、癌リスク、癌進行、癌処置または癌処置に対する耐性のうち1つ以上)に関連する(または関連しない)。一実施形態において、変化は、癌に対する遺伝的リスク因子、陽性処置反応予測因子、陰性処置反応予測因子、陽性予後因子、陰性予後因子または診断因子のうち1つ以上に関連する。
「クローンプロファイル」は、この用語が本明細書中で使用される場合、出現、同一性、可変性、分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)、または1つ以上の配列、例えば対象区間の(またはそれを含む細胞の)、対立遺伝子またはシグネチャーの存在量、例えば相対的存在量を指す。一実施形態において、クローンプロファイルは、対象区間に対する複数の配列、対立遺伝子またはシグネチャーが試料中に存在する場合、対象区間(またはそれを含む細胞)に対する1つの配列、対立遺伝子またはシグネチャーについての相対的存在量についての値である。例えば、一実施形態において、クローンプロファイルは、対象区間に対する複数のVDJまたはVJの組み合わせのうち1つ以上の相対的存在量についての値を含む。一実施形態において、クローンプロファイルは、対象区間に対する選択されたVセグメントの、相対的存在量についての値を含む。一実施形態において、クローンプロファイルは、対象区間の配列内での、例えば体細胞高頻度変異から生じるような多様性についての値を含む。一実施形態において、クローンプロファイルは、例えば配列、対立遺伝子またはシグネチャーを含む発現サブゲノム区間の出現またはレベルによって証明されるような、配列、対立遺伝子またはシグネチャーの発現の出現またはレベルについての値を含む。
「発現サブゲノム区間」は、この用語が本明細書で使用される場合、サブゲノム区間の転写された配列を指す。一実施形態において、発現サブゲノム区間の配列は、それが転写される元のサブゲノム区間とは異なり、例えば、一部の配列が転写されないことがあり得る。
「シグネチャー」は、この用語が本明細書中で使用される場合、対象区間の配列を指す。シグネチャーは、対象区間で複数の可能性のうちの1つの出現の特徴であり得、例えば、シグネチャーは、再編成された重鎖または軽鎖可変領域遺伝子における選択されたVセグメントの出現;選択されたVJ連結部の出現、例えば、再編成された重鎖可変領域遺伝子における選択されたVおよび選択されたJセグメントの出現の特徴であり得る。一実施形態において、シグネチャーは、複数の特異的な核酸配列を含む。したがって、シグネチャーは、特異的な核酸配列に限定されず、むしろ、対象区間での配列または可能性の第1のグループと、対象区間での可能性の第2のグループとを区別し得る、例えば第1のVセグメントと第2のVセグメントとを区別し得るのに十分固有であり、これによって、例えば様々なVセグメントの使用の評価が可能となる。シグネチャーという用語は、特異的な核酸配列である、特異的シグネチャーという用語を含む。一実施形態において、シグネチャーは、特異的な事象、例えば、再編成事象を示すものであるか、またはその帰結である。
「サブゲノム区間」は、この用語が本明細書中で使用される場合、ゲノム配列の一部分を指す。一実施形態において、サブゲノム区間は、単一のヌクレオチド位置、例えば腫瘍表現型と(陽性または陰性に)関連するヌクレオチド位置変異体であり得る。一実施形態において、サブゲノム区間は、複数のヌクレオチド位置を含む。このような実施形態は、少なくとも2、5、10、50、100、150または250個のヌクレオチド位置の長さの配列を含む。サブゲノム区間は、遺伝子全体またはその予め選択された部分、例えばコード領域(またはその一部)、予め選択されたイントロン(またはその一部)またはエクソン(またはその一部)を含み得る。サブゲノム区間は、天然の、例えばゲノムの核酸の断片の全てまたは一部を含み得る。例えば、サブゲノム区間は、配列決定反応に供されるゲノムDNAの断片に対応し得る。実施形態において、サブゲノム区間は、ゲノム供給源からの連続的な配列である。実施形態において、サブゲノム区間は、ゲノム中で連続していない配列を含み、例えば、cDNA中のエクソン−エクソン連結部で形成され、見出される連結部を含み得る。
一実施形態において、サブゲノム区間は、再編成された配列、例えば、VセグメントとDセグメント、DセグメントとJセグメント、VセグメントとJセグメントまたはJセグメントとクラスセグメントの連結の結果として生じるBまたはT細胞における配列に対応する。
一実施形態において、サブゲノム区間において多様性はない。
一実施形態において、サブゲノム区間において多様性があり、例えば、サブゲノム区間が複数の配列によって表され、例えばVD配列をカバーするサブゲノム区間は、複数のシグネチャーによって表され得る。
一実施形態において、サブゲノム区間は:単一ヌクレオチド位置;遺伝子内領域または遺伝子間領域;エクソンもしくイントロン、またはその断片、典型的にはエクソン配列またはその断片;コード領域または非コード領域、例えばプロモーター、エンハンサー、5’非翻訳領域(5’UTR)または3’非翻訳領域(3’UTR)またはその断片;cDNAまたはその断片;SNP;体細胞突然変異、生殖系列突然変異またはその両方;変化、例えば点または単一突然変異;欠失突然変異(例えば、インフレーム欠失、遺伝子内欠失、完全遺伝子欠失);挿入突然変異(例えば遺伝子内挿入);逆位突然変異(例えば染色体内逆位);連結突然変異;連結される挿入突然変異;逆位複製突然変異;タンデム複製(例えば染色体内タンデム複製);転座(例えば、染色体転座、非相反転座);再編成(例えば、ゲノム再編成(例えば1つ以上のイントロンまたはその断片の再編成;再編成されたイントロンは、5’−および/または3’UTRを含み得る。);遺伝子コピー数の変化;遺伝子発現の変化;RNAレベルの変化、またはそれらの組み合わせを含むかまたはそれらからなる。「遺伝子のコピー数」は、特定の遺伝子産物をコードする細胞中のDNA配列の数を指す。一般に、所与の遺伝子について、哺乳動物は各遺伝子の2つのコピーを有する。コピー数は、例えば、遺伝子増幅または複製によって増加させ得るか、または欠失によって減少させ得る。
「対象区間」は、この用語が本明細書で使用される場合、サブゲノム区間または発現サブゲノム区間を指す。一実施形態において、サブゲノム区間および発現サブゲノム区間は対応し、つまり、発現サブゲノム区間は、対応するサブゲノム区間から発現される配列を含む。一実施形態において、サブゲノム区間および発現サブゲノム区間は対応せず、つまり、発現サブゲノム区間は、対応しないサブゲノム区間から発現される配列を含まないが、むしろ異なるサブゲノム区間に対応する。一実施形態において、サブゲノム区間および発現サブゲノム区間は部分的に対応し、つまり、発現サブゲノム区間は、対応するサブゲノム区間から発現される配列および異なる対応するサブゲノム区間から発現される配列を含む。
本明細書で使用される場合、「ライブラリ」という用語は、メンバーの集合体を指す。一実施形態において、ライブラリは、核酸メンバーの集合体、例えば全ゲノム、サブゲノム断片、cDNA、cDNA断片、RNA、例えばmRNA、RNA断片またはこれらの組み合わせの集合体を含む。一実施形態において、ライブラリメンバーの一部または全てがアダプター配列を含む。アダプター配列は、一方または両方の末端に位置し得る。アダプター配列は、例えば、配列決定法(例えばNGS法)に対して、増幅に対して、逆転写に対して、またはベクターへのクローニングに対して有用であり得る。
ライブラリは、メンバー、例えば標的メンバー(例えば、腫瘍メンバー、参照メンバー、PGxメンバーまたはこれらの組み合わせ)の集合体を含み得る。ライブラリのメンバーは、単一個体由来であり得る。実施形態において、ライブラリは、複数の対象(例えば、2、3、4、5、6、7、8、9、10、20、30、またはそれ以上の対象)からのメンバーを含み得、例えば、複数の対象からのメンバーを含むライブラリを形成させるために、異なる対象からの2つ以上のライブラリを組み合わせ得る。一実施形態において、対象は、癌または腫瘍を有するか、または有するリスクがあるヒトである。
「ライブラリキャッチ」は、ライブラリのサブセット、例えば予め選択されたサブゲノム区間、例えば予め選択されたベイトとのハイブリダイゼーションによって捕捉された産物について濃縮されたサブセットを指す。
本明細書で用いられる場合、「メンバー」または「ライブラリメンバー」または他の同様の用語は、ライブラリのメンバーである核酸分子、例えばDNA、RNAまたはそれらの組み合わせを指す。典型的には、メンバーはDNA分子、例えばゲノムDNAまたはcDNAである。メンバーは、断片化された、例えばせん断または酵素的に調製されたゲノムDNAであり得る。メンバーは、対象からの配列を含み、対象に由来しない配列、例えば、アダプター配列、プライマー配列または同定を可能にする他の配列、例えば「バーコード」配列も含み得る。
本明細書中で使用される「ベイト」は、ハイブリッド捕捉試薬のタイプである。ベイトは、ハイブリッド形成し得(例えば相補的であり得る)、それにより標的核酸の捕捉を可能とする核酸分子、例えばDNAまたはRNA分子であり得る。一実施形態において、ベイトはRNA分子(例えば天然または修飾RNA分子);DNA分子(例えば天然または修飾DNA分子)またはそれらの組み合わせである。他の実施形態において、ベイトは、例えば、結合実体への結合による、ベイトおよびベイトに対してハイブリッド形成する核酸によって形成されるハイブリッドの捕捉および分離を可能にする、結合実体、例えば親和性タグを含む。一実施形態において、ベイトは溶液相ハイブリダイゼーションに適している。一実施形態において、ベイトは二環式核酸(BNA)分子である。
「ベイトセット」は、本明細書で使用される場合、1つまたは複数のベイト分子を指す。
「結合実体」は、分析物に特異的に結合することができる分子タグが、直接または間接的に連結され得る何らかの分子を意味する。結合実体は、各ベイト配列上の親和性タグであり得る。ある一定の実施形態において、結合実体は、アビジン分子などのパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物からベイト/メンバーハイブリッドを分離することを可能にする。代表的な結合実体としては、ビオチン分子、ハプテン、抗体、抗体結合断片、ペプチドおよびタンパク質が挙げられるが限定されない。
「相補的」とは、2つの核酸鎖の領域間、または同じ核酸鎖の2つの領域間の配列相補性を指す。第1の核酸領域のアデニン残基は、残基がチミンまたはウラシルである場合、第1の領域に対して逆平行である第2の核酸領域の残基と特異的な水素結合を形成(「塩基対形成」)することが可能であることが知られている。同様に、第1の核酸鎖のシトシン残基は、残基がグアニンである場合、第1の鎖とは逆平行である第2の核酸鎖の残基と塩基対形成可能であることが知られている。核酸の第1の領域は、2つの領域が逆平行に配置されるときに第1の領域の少なくとも1つのヌクレオチド残基が、第2の領域の残基と塩基対形成可能である場合、同じまたは異なる核酸の第2の領域と相補的である。ある一定の実施形態において、第1の領域は第1の部分を含み、第2の領域は第2の部分を含み、それによって第1および第2の部分が逆平行に配置される場合、第1の部分のヌクレオチド残基の少なくとも約50%、少なくとも約75%、少なくとも約90%または少なくとも約95%が、第2の部分のヌクレオチド残基と塩基対形成可能である。他の実施形態において、第1の部分の全てのヌクレオチド残基は、第2の部分のヌクレオチド残基と塩基対形成可能である。
「癌」または「腫瘍」という用語は、本明細書中で交換可能に使用される。これらの用語は、制御されない増殖、不死性、転移能、急速な成長および増殖速度およびある一定の特徴的な形態学的特徴など、癌を引き起こす細胞の典型的な特徴を保有する細胞の存在を指す。癌細胞は、腫瘍の形態であることが多いが、このような細胞は動物内で単独で存在し得るか、または非腫瘍形成癌細胞、例えば白血病細胞などであり得る。これらの用語には、固形腫瘍、軟部組織腫瘍または転移病変が含まれる。本明細書中で使用される場合、「癌」という用語は、前悪性ならびに悪性の癌を含む。
本明細書中で使用される場合、「可能性が高い」または「可能性向上」とは、項目、物体、物または人間が出現する確率が高いことを指す。したがって、一例では、処置に反応する可能性が高いと思われる対象は、参照対象または対象の群と比較して、処置に反応する確率が高くなる。
「可能性が低い」とは、参照に対して、事象、項目、物体、物または人間が出現する確率が低いことを指す。したがって、処置に反応する可能性が低い対象は、参照対象または対象の群と比較して、処置に反応する確率が低くなる。
「対照メンバー」は、非腫瘍細胞からの配列を有するメンバーを指す。
本明細書中で使用される場合、「インデルアライメント配列セレクタ」は、予め選択されたインデルの場合、リードを一緒にアライメントしようとする配列の選択を可能にするか、またはそれを方向付けるパラメータを指す。このような配列の使用は、インデルを含む予め選択されたサブゲノム区間の配列決定を最適化し得る。インデルアライメント配列セレクタの値は、予め選択されたインデルの関数、例えばインデルに対する識別子である。一実施形態において、値はインデルの同一性である。
本明細書中で使用される場合、「次世代配列決定またはNGSまたはNG配列決定」は、ハイスループット方式で、(例えば、1回の分子配列決定において)個々の核酸分子または個々の核酸分子に対するクローン性に増大させた代理物のヌクレオチド配列の何れかを決定する何らかの配列決定法を指す(例えば、10、10、10、またはそれ以上を超える分子を同時に配列決定する。)。一実施形態において、ライブラリ中の核酸種の相対的存在量は、配列決定実験により生成されたデータ中のそれらの同族配列の出現の相対数を数えることによって推定し得る。次世代配列決定方法は当技術分野で公知であり、例えば、参照により本明細書中に組み込まれる、Metzker,M.(2010)Nature Biotechnology Reviews 11:31−46に記載されている。次世代配列決定は、試料中の核酸の5%未満に存在する変異を検出し得る。
本明細書中で言及される場合、「ヌクレオチド値」は、予め選択されたヌクレオチド位置を占有するかまたはこれに割り当てられる(1つまたは複数の)ヌクレオチドの同一性に相当する。典型的なヌクレオチド値としては、欠損(例えば欠失);付加(例えば1つ以上のヌクレオチドの挿入、その識別は含まれてもよいしまたは含まれなくてもよい。);または存在(占有);A;T;C;またはGが挙げられる。他の値は、例えばYでなくてもよく(Yは、A、T、GまたはCである。);AまたはX(Xは、T、GまたはCのうち1つまたは2つである。);TまたはX(Xは、A、GまたはCのうち1つまたは2つである。);GまたはX(Xは、T、AまたはCのうち1つまたは2つである。);CまたはX(Xは、T、GまたはAのうち1つまたは2つである。);ピリミジンヌクレオチド;またはプリンヌクレオチドであり得る。ヌクレオチド値は、ヌクレオチド位置において1個以上、例えば2、3または4個の塩基(または本明細書に記載される他の値、例えば欠損または付加)に対する頻度であり得る。例えば、ヌクレオチド値は、ヌクレオチド位置における、Aに対する頻度およびGに対する頻度を含み得る。
「または」は、文脈上別段の明示がない限り、「および/または」という用語を意味するために本明細書中で使用され、これと交換可能に使用される。本明細書中の一部の句における「および/または」という用語の使用は、文脈上別段の明示がない限り、「または」という用語の使用が「および/または」という用語と交換可能ではないことを意味しない。
「一次対照」とは、腫瘍試料中のNAT組織以外の非腫瘍組織を指す。血液は代表的な一次対照である。
本明細書中で使用される場合、「再編成アライメント配列セレクタ」は、予め選択された再編成の場合、リードを一緒にアライメントしようとする配列の選択を可能にするか、またはそれを方向付けるパラメータを指す。このような配列の使用によって、再編成を含む予め選択されたサブゲノム区間の配列決定が最適化され得る。再編成アライメント配列セレクタについての値は、予め選択された再編成、例えば再編成に対する識別子の関数である。一実施形態において、値は再編成の同一性である。「インデルアライメント配列セレクタ」(本明細書中の他の箇所でも定義される。)は、再編成アライメント配列セレクタの例である。
「試料」、「組織試料」、「患者試料」、「患者細胞または組織試料」または「検体」はそれぞれ、対象または患者の組織または循環細胞から得られた同様の細胞の集合体を指す。組織試料の供給源は、新鮮な、凍結されたおよび/または保存された臓器、組織試料、生検または吸引物からのような固形組織;血液または何らかの血液成分;脊髄液、羊水、腹水または間質液などの体液;または対象の妊娠または発生の何れかの時点からの細胞であり得る。組織試料は、保存剤、抗凝固剤、緩衝剤、固定液、栄養剤、抗生物質など、本来、天然には組織と混合されない化合物を含有し得る。一実施形態において、試料は、凍結試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフィン包埋(FFPE)組織標本として保存される。例えば、試料は、マトリックス、例えば、FFPEブロックまたは凍結試料中で包埋され得る。別の実施形態において、試料は血液試料である。さらに別の実施形態において、試料は骨髄穿刺試料である。
一実施形態において、試料は、腫瘍、例えば、腫瘍細胞または腫瘍浸潤リンパ球(TIL)に関連する細胞である。一実施形態において、試料は腫瘍試料であり、例えば、1つ以上の前悪性または悪性細胞を含む。一実施形態において、血液悪性腫瘍(または前悪性腫瘍)、例えば本明細書中に記載の血液悪性腫瘍(または前悪性腫瘍)から試料が得られる。ある一定の実施形態において、試料、例えば腫瘍試料は、固形腫瘍、軟部組織腫瘍または転移性病変から得られる。他の実施形態において、試料、例えば腫瘍試料は、切除縁からの組織または細胞を含む。別の実施形態において、試料、例えば腫瘍試料は、1つ以上の循環腫瘍細胞(CTC)(例えば血液試料から得られるCTC)を含む。一実施形態において、試料は、腫瘍、例えば非腫瘍細胞または末梢血リンパ球に関連しない細胞である。
本明細書中で使用される場合、「感度」は、ある方法の、不均一な配列集団中での予め選択された配列変異体の検出能の尺度である。予め選択された配列変異体が試料中の配列の少なくともF%として存在する試料が与えられると仮定して、ある方法が予め選択されたC%の信頼度でS%の回数で予め選択された配列を検出し得る場合、その方法は、F%の変異体に対してS%の感度を有する。一例として、予め選択された変異体配列が試料中の配列の少なくとも5%として存在する試料が与えられると仮定して、ある方法が予め選択された99%の信頼度で10回のうち9回、予め選択された配列を検出し得る場合、その方法は、5%の変異体に対して90%の感度を有する(F=5%;C=99%;S=90%)。代表的な感度としては、C=90%、95%、99%および99.9%の信頼度レベルで、F=1%、5%、10%、20%、50%、100%の配列変異体に対して、S=90%、95%、99%の感度が挙げられる。
本明細書中で使用される場合、「特異性」は、ある方法が、真に出現する予め選択された配列変異体を配列決定アーチファクトまたは他の密接に関連する配列と区別する能力の尺度である。これは、偽陽性検出を回避する能力である。偽陽性検出は、試料調製中の関心のある配列に導入されるエラー、配列決定エラーまたは偽遺伝子または遺伝子ファミリーのメンバーのような密接に関連する配列の不注意な配列決定から生じ得る。XTrue配列が真に変異体であり、XNot trueが真に変異体ではないNTotal配列の試料セットに適用したときに、ある方法が変異体でないものとして真ではない変異体の少なくともX%を選択する場合、この方法はX%の特異性を有する。例えば、500個の配列が真に変異体であり、500個が真に変異体ではない1000個の配列の試料セットに適用したときに、ある方法が変異体でないものとして500個の真ではない変異体の90%を選択する場合、この方法は90%の特異性を有する。代表的な特異性としては、90、95、98および99%が挙げられる。
本明細書中で使用される場合、「腫瘍核酸試料」は、腫瘍または癌試料からの核酸分子を指す。典型的には、これは腫瘍または癌試料からのDNA、例えばゲノムDNA、またはRNA由来のcDNAである。ある一定の実施形態において、腫瘍核酸試料が精製または単離される(例えばその天然の状態から除去される)。
本明細書中で使用される場合、「対照」または「参照」「核酸試料」は、対照または参照試料からの核酸分子を指す。典型的には、これは、遺伝子または遺伝子産物の変化または変異を含有しないDNA、例えばゲノムDNA、またはRNAに由来するcDNAである。ある一定の実施形態において、参照または対照核酸試料は、野生型または非突然変異配列である。ある一定の実施形態において、参照核酸試料が精製または単離される(例えばその天然状態から除去される)。他の実施形態において、参照核酸試料は、同じもしくは異なる対象からの、非腫瘍試料、例えば、血液対照、正常隣接組織(NAT)または何らかの他の非癌性試料からのものである。
核酸分子を「配列決定すること」は、分子(例えばDNA分子、RNA分子またはRNA分子に由来するcDNA分子)中の少なくとも1個のヌクレオチドの同一性を決定することを必要とする。実施形態において、分子中のヌクレオチド全てよりも少ない同一性が決定される。他の実施形態において、分子中のヌクレオチドの大部分または全ての同一性が決定される。
本明細書中で使用される場合、「閾値」は、対象区間(例えばサブゲノム区間または発現サブゲノム区間)にヌクレオチド値を割り当てるために存在する必要があるリードの数の関数である値である。例えば、これは、そのヌクレオチド値をサブゲノム区間中のそのヌクレオチド位置に割り当てるために必要とされる、ヌクレオチド位置における特定のヌクレオチド値、例えばAを有するリードの数の関数である。閾値は、例えば整数などのリードの数として(またはその関数として)、または予め選択された値を有するリードの割合として表し得る。例として、閾値がXであり、「A」のヌクレオチド値を有するX+1個のリードが存在する場合、「A」の値は、対象区間における予め選択された位置(例えばサブゲノム区間または発現サブゲノム区間)に割り当てられる。閾値はまた、突然変異または変異体予想、突然変異頻度またはベイジアン事前法(Bayesian prior)の関数として表し得る。一実施形態において、予め選択された突然変異頻度は、そのヌクレオチド値を呼び出すために、予め選択された位置でヌクレオチド値、例えばAまたはGを有するリードの予め選択された数または割合を必要とする。実施形態において、閾値は、突然変異予想、例えば突然変異頻度および腫瘍タイプの関数であり得る。例えば、予め選択されたヌクレオチド位置の予め選択された変異は、患者が第1の腫瘍タイプを有する場合、第1の閾値を有し得、患者が第2の腫瘍タイプを有する場合、第2の閾値を有し得る。
本明細書中で使用される場合、「標的メンバー」は、核酸ライブラリから単離したい核酸分子を指す。一実施形態において、標的メンバーは、腫瘍メンバー、参照メンバー、対照メンバーまたは本明細書中に記載のようなPGxメンバーであり得る。
「腫瘍メンバー」または他の同様の用語(例えば「腫瘍または癌関連メンバー」)は、本明細書中で使用される場合、腫瘍細胞からの配列を有するメンバーを指す。一実施形態において、腫瘍メンバーは、癌性表現型に関連する変化(例えば突然変異)を有する配列(例えばヌクレオチド配列)を有する対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む。他の実施形態において、腫瘍メンバーは、野生型配列(例えば野生型ヌクレオチド配列)を有する対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む。例えば、ヘテロ接合型またはホモ接合型野生型対立遺伝子からの対象区間(例えばサブゲノム区間または発現サブゲノム区間)が癌細胞に存在する。腫瘍メンバーは、参照メンバーまたはPGxメンバーを含み得る。
本明細書中で使用される場合、「参照メンバー」または他の同様の用語(例えば「対照メンバー」)は、癌性表現型と関連がない配列(例えばヌクレオチド配列)を有する対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含むメンバーを指す。一実施形態において、参照メンバーは、突然変異した場合に癌性表現型と関連する遺伝子または遺伝子産物の野生型または非突然変異ヌクレオチド配列を含む。参照メンバーは、癌細胞または非癌細胞に存在し得る。
本明細書中で使用される場合、「PGxメンバー」または他の同様の用語は、遺伝子の薬理遺伝学的または薬理ゲノムプロファイルに関連する対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含むメンバーを指す。一実施形態において、PGxメンバーはSNP(例えば本明細書中に記載のSNP)を含む。他の実施形態において、PGxメンバーは、表1〜4による対象区間(例えばサブゲノム区間または発現サブゲノム区間)を含む。
本明細書中で使用される場合、「変異体」は、複数の構造、例えば多型遺伝子座における対立遺伝子を有し得るサブゲノム区間で存在し得る構造を指す。
見出し、例えば、(a)、(b)、(i)などは、明細書および特許請求の範囲を単に読み易くするために与えられる。明細書または特許請求の範囲における見出しの使用は、段階または要素がアルファベット順または数字順またはそれらが提示される順序で行われる必要はない。
遺伝子または遺伝子産物の選択
選択された遺伝子または遺伝子産物(本明細書中で「標的遺伝子または遺伝子産物」とも呼ぶ。)は、遺伝子内領域または遺伝子間領域を含む対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)を含み得る。例えば、対象区間(例えばサブゲノム区間または発現サブゲノム区間)は、エクソンまたはイントロン、またはその断片、典型的にはエクソン配列またはその断片を含み得る。対象区間(例えばサブゲノム区間または発現サブゲノム区間)は、コード領域または非コード領域、例えばプロモーター、エンハンサー、5’非翻訳領域(5’UTR)または3’非翻訳領域(3’UTR)またはその断片を含み得る。他の実施形態において、対象区間は、cDNAまたはその断片を含む。他の実施形態において、対象区間は、例えば本明細書中に記載のようなSNPを含む。
他の実施形態において、対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、ゲノム中の実質的に全てのエクソン、例えば本明細書中に記載のような対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)の1つ以上(関心のある選択される遺伝子または遺伝子産物(例えば、本明細書中に記載されているような癌性表現型に関連する遺伝子または遺伝子産物)からのエクソン)を含む。一実施形態において、対象区間(例えばサブゲノム区間または発現サブゲノム区間)には、体細胞突然変異、生殖細胞系列突然変異またはその両方が含まれる。一実施形態において、対象区間(例えばサブゲノム区間または発現サブゲノム区間)は、変化、例えば、点または単一突然変異、欠失突然変異(例えばインフレーム欠失、遺伝子内欠失、完全遺伝子欠失)、挿入突然変異(例えば遺伝子内挿入)、逆位突然変異(例えば染色体内逆位)、連結突然変異、連結挿入突然変異、逆方向重複突然変異、タンデム重複(例えば染色体内タンデム重複)、転座(例えば、染色体転座、非相反転座)、再編成、遺伝子コピー数の変化またはそれらの組み合わせを含む。ある一定の実施形態において、対象区間(例えばサブゲノム区間または発現サブゲノム区間)は、試料中の腫瘍細胞のゲノムのコード領域の5、1、0.5、0.1%、0.01%、0.001%未満を構成する。他の実施形態において、対象区間(例えば、サブゲノム区間、発現サブゲノム区間またはその両方)は、疾患に関与せず、例えば、本明細書中に記載の癌性表現型と関連しない。
一実施形態において、標的遺伝子または遺伝子産物はバイオマーカーである。本明細書中で使用される場合、「バイオマーカー」または「マーカー」は、変化し得る遺伝子、mRNAまたはタンパク質であり、前記の変化は癌に関連する。この変化は、正常または健康な組織または細胞(例えば対照)におけるその量、構造および/または活性と比較した場合の、癌組織または癌細胞における量、構造および/または活性におけるものであり得、癌などの疾患状態と関連する。例えば、癌に関連するか、または抗癌治療に対する反応性を予測するマーカーは、正常で健康な組織または細胞と比較した場合、癌組織または癌細胞では、ヌクレオチド配列、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性またはメチル化状態の変化を有し得る。さらに、「マーカー」は、その構造が変化している、例えば突然変異している(突然変異を含有する)分子を含み、例えば、癌などの疾患状態に関連する組織または細胞に存在する場合、例えば、置換、欠失または挿入によって、ヌクレオチドまたはアミノ酸レベルで野生型配列と異なる。
一実施形態において、標的遺伝子または遺伝子産物は、一塩基多型(SNP)を含む。別の実施形態において、遺伝子または遺伝子産物は、小さな欠失、例えば小さな遺伝子内欠失(例えばインフレームまたはフレームシフト欠失)を有する。さらに別の実施形態において、標的配列は遺伝子全体の欠失から生じる。さらに別の実施形態において、標的配列は、小さな挿入、例えば小さな遺伝子内挿入を有する。一実施形態において、標的配列は、逆位、例えば、染色体内逆位から生じる。別の実施形態において、標的配列は、染色体間転座から生じる。さらに別の実施形態において、標的配列はタンデム重複を有する。一実施形態において、標的配列は望ましくない特徴(例えば高GC含量または反復要素)を有する。別の実施形態において、標的配列は、例えばその反復性のために、それ自体がうまく標的化され得ないヌクレオチド配列の部分を有する。一実施形態において、標的配列はオルタナティブスプライシングから生じる。別の実施形態において、標的配列は、表1〜4による遺伝子または遺伝子産物またはその断片から選択される。
一実施形態において、標的遺伝子または遺伝子産物またはその断片は、抗体遺伝子または遺伝子産物、免疫グロブリンスーパーファミリー受容体(例えばB細胞受容体(BCR)またはT細胞受容体(TCR))遺伝子または遺伝子産物、またはその断片である。
ヒト抗体分子(およびB細胞受容体)は、少なくとも次の3つの遺伝子座上の遺伝子によってコードされる定常領域(C)および可変領域(V)の両方を有する重鎖および軽鎖から構成される。
1.免疫グロブリン重鎖に対する遺伝子セグメントを含有する14番染色体上の免疫グロブリン重鎖遺伝子座(IGH@);
2.免疫グロブリン軽鎖に対する遺伝子セグメントを含有する2番染色体上の免疫グロブリンカッパ(κ)遺伝子座(IGK@);
3.免疫グロブリン軽鎖に対する遺伝子セグメントを含有する22番染色体上の免疫グロブリンラムダ(λ)遺伝子座(IGL@)。
各重鎖および軽鎖遺伝子は、抗体タンパク質の可変領域に対する3つの異なるタイプの遺伝子セグメントの複数のコピーを含有する。例えば、免疫グロブリン重鎖領域は、5個の異なるクラスγ、δ、α、μおよびε、44個の可変(V)遺伝子セグメント、27個の多様性(D)遺伝子セグメントおよび6個の連結(J)遺伝子セグメントのうちの1つを含有し得る。軽鎖はまた、多数のVおよびJ遺伝子セグメントを有し得るが、D遺伝子セグメントを有さない。ラムダ軽鎖は7個の可能なC領域を有し、カッパ軽鎖は1個を有する。
免疫グロブリン重鎖遺伝子座(IGH@)は、ヒト抗体(または免疫グロブリン)の重鎖に対する遺伝子を含有するヒト14番染色体上の領域である。例えば、IGH遺伝子座は、IGHV(可変)、IGHD(多様性)、IGHJ(連結)およびIGHC(定常)遺伝子を含む。免疫グロブリン重鎖をコードする代表的な遺伝子としては、
IGHV1−2,IGHV1−3,IGHV1−8,IGHV1−12,IGHV1−14,IGHV1−17,IGHV1−18,IGHV1−24,IGHV1−45,IGHV1−46,IGHV1−58,IGHV1−67,IGHV1−68,IGHV1−69,IGHV1−38−4,IGHV1−69−2,IGHV2−5,IGHV2−10,IGHV2−26,IGHV2−70,IGHV3−6,IGHV3−7,IGHV3−9,IGHV3−11,IGHV3−13,IGHV3−15,IGHV3−16,IGHV3−19,IGHV3−20,IGHV3−21,IGHV3−22,IGHV3−23,IGHV3−25,IGHV3−29,IGHV3−30,IGHV3−30−2,IGHV3−30−3,IGHV3−30−5,IGHV3−32,IGHV3−33,IGHV3−33−2,IGHV3−35,IGHV3−36,IGHV3−37,IGHV3−38,IGHV3−41,IGHV3−42,IGHV3−43,IGHV3−47,IGHV3−48,IGHV3−49,IGHV3−50,IGHV3−52,IGHV3−53,IGHV3−54,IGHV3−57,IGHV3−60,IGHV3−62,IGHV3−63,IGHV3−64,IGHV3−65,IGHV3−66,IGHV3−71,IGHV3−72,IGHV3−73,IGHV3−74,IGHV3−75,IGHV3−76,IGHV3−79,IGHV3−38−3,IGHV3−69−1,IGHV4−4,IGHV4−28,IGHV4−30−1,IGHV4−30−2,IGHV4−30−4,IGHV4−31,IGHV4−34,IGHV4−39,IGHV4−55,IGHV4−59,IGHV4−61,IGHV4−80,IGHV4−38−2,IGHV5−51,IGHV5−78,IGHV5−10−1,IGHV6−1,IGHV7−4−1,IGHV7−27,IGHV7−34−1,IGHV7−40,IGHV7−56,IGHV7−81,IGHVII−1−1,IGHVII−15−1,IGHVII−20−1,IGHVII−22−1,IGHVII−26−2,IGHVII−28−1,IGHVII−30−1,IGHVII−31−1,IGHVII−33−1,IGHVII−40−1,IGHVII−43−1,IGHVII−44−2,IGHVII−46−1,IGHVII−49−1,IGHVII−51−2,IGHVII−53−1,IGHVII−60−1,IGHVII−62−1,IGHVII−65−1,IGHVII−67−1,IGHVII−74−1,IGHVII−78−1,IGHVIII−2−1,IGHVIII−5−1,IGHVIII−5−2,IGHVIII−11−1,IGHVIII−13−1,IGHVIII−16−1,IGHVIII−22−2,IGHVIII−25−1,IGHVIII−26−1,IGHVIII−38−1,IGHVIII−44,IGHVIII−47−1,IGHVIII−51−1,IGHVIII−67−2,IGHVIII−67−3,IGHVIII−67−4,IGHVIII−76−1,IGHVIII−82,IGHVIV−44−1,IGHD1−1,IGHD1−7,IGHD1−14,IGHD1−20,IGHD1−26,IGHD2−2,IGHD2−8,IGHD2−15,IGHD2−21,IGHD3−3,IGHD3−9,IGHD3−10,IGHD3−16,IGHD3−22,IGHD4−4,IGHD4−11,IGHD4−17,IGHD4−23,IGHD5−5,IGHD5−12,IGHD5−18,IGHD5−24,IGHD6−6,IGHD6−13,IGHD6−19,IGHD6−25,IGHD7−27,IGHJ1,IGHJ1P,IGHJ2,IGHJ2P,IGHJ3,IGHJ3P,IGHJ4,IGHJ5,IGHJ6,IGHA1,IGHA2,IGHG1,IGHG2,IGHG3,IGHG4,IGHGP,IGHD,IGHE,IGHEP1,IGHM,およびIGHV1−69D
が挙げられるが限定されない。
免疫グロブリンカッパ遺伝子座(IGK@)は、抗体(または免疫グロブリン)のカッパ(κ)軽鎖に対する遺伝子を含有するヒト2番染色体上の領域である。例えば、IGK遺伝子座は、IGKV(可変)、IGKJ(連結)およびIGKC(定常)遺伝子を含む。免疫グロブリンカッパ軽鎖をコードする代表的な遺伝子としては、
IGKV1−5,IGKV1−6,IGKV1−8,IGKV1−9,IGKV1−12,IGKV1−13,IGKV1−16,IGKV1−17,IGKV1−22,IGKV1−27,IGKV1−32,IGKV1−33,IGKV1−35,IGKV1−37,IGKV1−39,IGKV1D−8,IGKV1D−12,IGKV1D−13,IGKV1D−16 IGKV1D−17,IGKV1D−22,IGKV1D−27,IGKV1D−32,IGKV1D−33,IGKV1D−35,IGKV1D−37,IGKV1D−39,IGKV1D−42,IGKV1D−43,IGKV2−4,IGKV2−10,IGKV2−14,IGKV2−18,IGKV2−19,IGKV2−23,IGKV2−24,IGKV2−26,IGKV2−28,IGKV2−29,IGKV2−30,IGKV2−36,IGKV2−38,IGKV2−40,IGKV2D−10,IGKV2D−14,IGKV2D−18,IGKV2D−19,IGKV2D−23,IGKV2D−24,IGKV2D−26,IGKV2D−28,IGKV2D−29,IGKV2D−30,IGKV2D−36,IGKV2D−38,IGKV2D−40,IGKV3−7,IGKV3−11,IGKV3−15,IGKV3−20,IGKV3−25,IGKV3−31,IGKV3−34,IGKV3D−7,IGKV3D−11,IGKV3D−15,IGKV3D−20,IGKV3D−25,IGKV3D−31.IGKV3D−34,IGKV4−1,IGKV5−2,IGKV6−21,IGKV6D−21,IGKV6D−41,IGKV7−3,IGKJ1,IGKJ2,IGKJ3,IGKJ4,IGKJ5,およびIGKC
が挙げられるが限定されない。
免疫グロブリンラムダ遺伝子座(IGL@)は、抗体(または免疫グロブリン)のラムダ(λ)軽鎖に対する遺伝子を含有するヒト22番染色体上の領域である。例えば、IGL遺伝子座は、IGLV(可変)、IGLJ(連結)およびIGLC(定常)遺伝子を含む。免疫グロブリンラムダ軽鎖をコードする代表的な遺伝子としては、
IGLV1−36,IGLV1−40,IGLV1−41,IGLV1−44,IGLV1−47,IGLV1−50,IGLV1−51,IGLV1−62,IGLV2−5,IGLV2−8,IGLV2−11,IGLV2−14,IGLV2−18,IGLV2−23,IGLV2−28,IGLV2−33,IGLV2−34,IGLV3−1,IGLV3−2,IGLV3−4,IGLV3−6,IGLV3−7,IGLV3−9,IGLV3−10,IGLV3−12,IGLV3−13,IGLV3−15,IGLV3−16,IGLV3−17,IGLV3−19,IGLV3−21,IGLV3−22,IGLV3−24,IGLV3−25,IGLV3−26,IGLV3−27,IGLV3−29,IGLV3−30,IGLV3−31,IGLV3−32,IGLV4−3,IGLV4−60,IGLV4−69,IGLV5−37,IGLV5−39,IGLV5−45,IGLV5−48,IGLV5−52,IGLV6−57,IGLV7−35,IGLV7−43,IGLV7−46,IGLV8−61,IGLV9−49,IGLV10−54,IGLV10−67,IGLV11−55,IGLVI−20,IGLVI−38,IGLVI−42,IGLVI−56,IGLVI−63,IGLVI−68,IGLVI−70,IGLVIV−53,IGLVIV−59,IGLVIV−64,IGLVIV−65,IGLVIV−66−1,IGLVV−58,IGLVV−66,IGLVVI−22−1,IGLVVI−25−1,IGLVVII−41−1,IGLJ1,IGLJ2,IGLJ3,IGLJ4,IGLJ5,IGLJ6,IGLJ7,IGLC1,IGLC2,IGLC3,IGLC4,IGLC5,IGLC6,およびIGLC7
が挙げられるが限定されない。
B細胞受容体(BCR)は、次の2つの部分から構成される:i)1つのアイソタイプの膜結合型免疫グロブリン分子(例えば、IgDまたはIgM)。膜内在性ドメインの存在を除いて、これらはその分泌型と同一であり得る。ii)シグナル伝達部分、つまりジスルフィド架橋によって一緒に結合されたIg−α/Ig−β(CD79)と呼ばれるヘテロ二量体。二量体の各メンバーは、原形質膜にまたがり、免疫受容体活性化チロシンモチーフ(ITAM)を有する細胞質尾部を有する。
T細胞受容体(TCR)は、2本の異なるタンパク質鎖(すなわちヘテロ二量体)から構成される。T細胞のうち95%において、これはアルファ(α)鎖とベータ(β)鎖からなり、一方でT細胞のうち5%において、ガンマおよびデルタ(γ/δ)鎖からなる。この比率は、個体発生中および病的状態において変化し得る。T細胞受容体遺伝子は、固有の抗原受容体とともにその細胞を提供するためにリンパ球の発生中に再編成されるそれらのベータおよびデルタ鎖(およびそれらのアルファ鎖およびガンマ鎖におけるVおよびJ遺伝子セグメント)中に複数のV、DおよびJ遺伝子セグメントも含有するという点において、免疫グロブリン遺伝子と類似している。
T細胞受容体アルファ遺伝子座(TRA)は、TCRアルファ鎖に対する遺伝子を含有するヒト14番染色体上の領域である。例えば、TRA遺伝子座は、例えば、TRAV(可変)、TRAJ(連結)およびTRAC(定常)遺伝子を含む。T細胞受容体アルファ鎖をコードする代表的な遺伝子としては、
TRAV1−1,TRAV1−2,TRAV2,TRAV3,TRAV4,TRAV5,TRAV6,TRAV7,TRAV8−1,TRAV8−2,TRAV8−3,TRAV8−4,TRAV8−5,TRAV8−6,TRAV8−7,TRAV9−1,TRAV9−2,TRAV10,TRAV11,TRAV12−1,TRAV12−2,TRAV12−3,TRAV13−1,TRAV13−2,TRAV14DV4,TRAV15,TRAV16,TRAV17,TRAV18,TRAV19,TRAV20,TRAV21,TRAV22,TRAV23DV6,TRAV24,TRAV25,TRAV26−1,TRAV26−2,TRAV27,TRAV28,TRAV29DV5,TRAV30,TRAV31,TRAV32,TRAV33,TRAV34,TRAV35,TRAV36DV7,TRAV37,TRAV38−1,TRAV38−2DV8,TRAV39,TRAV40,TRAV41,TRAJ1,TRAJ2,TRAJ3,TRAJ4,TRAJ5,TRAJ6,TRAJ7,TRAJ8,TRAJ9,TRAJ10,TRAJ11,TRAJ12,TRAJ13,TRAJ14,TRAJ15,TRAJ16,TRAJ17,TRAJ18,TRAJ19,TRAJ20,TRAJ21,TRAJ22,TRAJ23,TRAJ24,TRAJ25,TRAJ26,TRAJ27,TRAJ28,TRAJ29,TRAJ30,TRAJ31,TRAJ32,TRAJ33,TRAJ34,TRAJ35,TRAJ36,TRAJ37,TRAJ38,TRAJ39,TRAJ40,TRAJ41,TRAJ42,TRAJ43,TRAJ44,TRAJ45,TRAJ46,TRAJ47,TRAJ48,TRAJ49,TRAJ50,TRAJ51,TRAJ52,TRAJ53,TRAJ54,TRAJ55,TRAJ56,TRAJ57,TRAJ58,TRAJ59,TRAJ60,TRAJ61,およびTRAC
が挙げられるが限定されない。
T細胞受容体ベータ遺伝子座(TRB)は、TCRベータ鎖に対する遺伝子を含有するヒト7番染色体上の領域である。例えば、TRB遺伝子座は、例えばTRBV(可変)、TRBD(多様性)、TRBJ(連結)およびTRBC(定常)遺伝子を含む。T細胞受容体ベータ鎖をコードする代表的な遺伝子としては、
TRBV1,TRBV2,TRBV3−1,TRBV3−2,TRBV4−1,TRBV4−2,TRBV4−3,TRBV5−1,TRBV5−2,TRBV5−3,TRBV5−4,TRBV5−5,TRBV5−6,TRBV5−7,TRBV6−2,TRBV6−3,TRBV6−4,TRBV6−5,TRBV6−6,TRBV6−7,TRBV6−8,TRBV6−9,TRBV7−1,TRBV7−2,TRBV7−3,TRBV7−4,TRBV7−5,TRBV7−6,TRBV7−7,TRBV7−8,TRBV7−9,TRBV8−1,TRBV8−2,TRBV9,TRBV10−1,TRBV10−2,TRBV10−3,TRBV11−1,TRBV11−2,TRBV11−3,TRBV12−1,TRBV12−2,TRBV12−3,TRBV12−4,TRBV12−5,TRBV13,TRBV14,TRBV15,TRBV16,TRBV17,TRBV18,TRBV19,TRBV20−1,TRBV21−1,TRBV22−1,TRBV23−1,TRBV24−1,TRBV25−1,TRBV26,TRBV27,TRBV28,TRBV29−1,TRBV30,TRBVA,TRBVB,TRBV5−8,TRBV6−1,TRBD1,TRBD2,TRBJ1−1,TRBJ1−2,TRBJ1−3,TRBJ1−4,TRBJ1−5,TRBJ1−6,TRBJ2−1,TRBJ2−2,TRBJ2−2P,TRBJ2−3,TRBJ2−4,TRBJ2−5,TRBJ2−6,TRBJ2−7,TRBC1,およびTRBC2
が挙げられるが限定されない。
T細胞受容体デルタ遺伝子座(TRD)は、TCRデルタ鎖に対する遺伝子を含有するヒト14番染色体上の領域である。例えば、TRD遺伝子座は、例えば、TRDV(可変)、TRDJ(連結)およびTRDC(定常)遺伝子を含む。T細胞受容体デルタ鎖をコードする代表的な遺伝子としては、
TRDV1,TRDV2,TRDV3,TRDD1,TRDD2,TRDD3,TRDJ1,TRDJ2,TRDJ3,TRDJ4,およびTRDC
が挙げられるが限定されない。
T細胞受容体ガンマ遺伝子座(TRG)は、TCRガンマ鎖に対する遺伝子を含有するヒト7番染色体上の領域である。例えば、TRG遺伝子座は、例えばTRGV(可変)、TRGJ(連結)およびTRGC(定常)遺伝子を含む。T細胞受容体ガンマ鎖をコードする代表的な遺伝子としては、
TRGV1,TRGV2,TRGV3,TRGV4,TRGV5,TRGV5P,TRGV6,TRGV7,TRGV8,TRGV9,TRGV10,TRGV11,TRGVA,TRGVB,TRGJ1,TRGJ2,TRGJP,TRGJP1,TRGJP2,TRGC1,およびTRGC2
が挙げられるが限定されない。
代表的な癌としては、B細胞癌、例えば多発性骨髄腫、黒色腫、乳癌、肺癌(非小細胞肺癌またはNSCLCなど)、気管支癌、結腸直腸癌、前立腺癌、膵臓癌、胃癌、卵巣癌、膀胱癌、脳または中枢神経系癌、末梢神経系癌、食道癌、子宮頸癌、子宮または子宮内膜癌、口腔または咽頭の癌、肝臓癌、腎臓癌、精巣癌、胆道癌、小腸または虫垂癌、唾液腺癌、甲状腺癌、副腎癌、骨肉腫、軟骨肉腫、血液組織の癌、腺癌、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸癌、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性疾患(MPD)、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄球性白血病(CML)、慢性リンパ球性白血病(CLL)、真性多血症、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫(endotheliosarcoma)、リンパ管肉腫、リンパ管内皮肉腫(lymphangioendotheliosarcoma)、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮癌、基底細胞癌、腺癌、汗腺癌、皮脂腺癌、乳頭癌、乳頭状腺癌、髄様癌、気管支原性肺癌、腎細胞癌、肝癌、胆管癌、絨毛癌、セミノーマ、胚性癌腫、ウィルムス腫瘍、膀胱癌、上皮癌、神経膠腫、星状細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽腫、聴神経腫瘍、乏突起神経膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞癌、甲状腺癌、胃癌、頭頸部癌、小細胞癌、本態性血小板血症、原発性骨髄線維症、好酸球増加症候群、全身性肥満細胞症、家族性(familiar)過好酸球増加症、慢性好酸球性白血病、神経内分泌性の癌、カルチノイド腫瘍などが挙げられるが限定されない。
一実施形態において、癌は、血液悪性腫瘍(または前悪性腫瘍)である。本明細書中で使用される場合、血液悪性腫瘍は、造血またはリンパ組織の腫瘍、例えば、血液、骨髄またはリンパ節に影響を与える腫瘍を指す。代表的な造血悪性腫瘍としては、白血病(例えば急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、ヘアリー細胞白血病、急性単球性白血病(AMoL)、慢性骨髄単球性白血病(CMML)、若年性骨髄単球性白血病(JMML)または大型顆粒リンパ球性白血病)、リンパ腫(例えば、AIDS関連リンパ腫、皮膚T細胞リンパ腫、ホジキンリンパ腫(例えば、古典的ホジキンリンパ腫または結節性リンパ球優位型ホジキンリンパ腫)、菌状息肉腫、非ホジキンリンパ腫(例えば、B細胞非ホジキンリンパ腫(例えば、バーキットリンパ腫、小リンパ球性リンパ腫(CLL/SLL)、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、免疫芽球性大細胞型リンパ腫、前駆Bリンパ芽球性リンパ腫またはマントル細胞リンパ腫)またはT細胞非ホジキンリンパ腫(菌状息肉腫、未分化大細胞リンパ腫または前駆Tリンパ芽球性リンパ腫))、一次中枢神経系リンパ腫、セザリー症候群、ワルデンストレームマクログロブリン血症)、慢性骨髄増殖性腫瘍、ランゲルハンス細胞組織球増殖症、多発性骨髄腫/形質細胞腫瘍、骨髄異形成症候群または骨髄異形成/骨髄増殖性腫瘍が挙げられるが、限定されない。本明細書中で使用される場合、前悪性腫瘍は、悪性ではないが悪性になると思われる組織を指す。
一実施形態において、標的遺伝子または遺伝子産物またはその断片は、表1〜4に記載の遺伝子または遺伝子産物の何れかから選択される。
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
一実施形態において、標的遺伝子または遺伝子産物またはその断片は、癌、例えば血液悪性腫瘍(または前悪性疾患)に関連する1つ以上の置換、インデルまたはコピー数変化を有する。代表的な遺伝子または遺伝子産物としては、
ABL1,ACTB,AKT1,AKT2,AKT3,ALK,AMER1(FAM123BまたはWTX),APC,APH1A,AR,ARAF,ARFRP1,ARHGAP26(GRAF)ARID1A,ARID2,ASMTL,ASXL1,ATM,ATR,ATRX,AURKA,AURKB,AXIN1,AXL,B2M,BAP1,BARD1,BCL10,BCL11B,BCL2,BCL2L2,BCL6,BCL7A,BCOR,BCORL1,BIRC3,BLM,BRAF,BRCA1,BRCA2,BRD4,BRIP1(BACH1),BRSK1,BTG2,BTK,BTLA,c11または,f30(EMSY),CAD,CARD11,CBFB,CBL,CCND1,CCND2,CCND3,CCNE1,CCT6B,CD22,CD274,(PDL1),CD36,CD58,CD70,CD79A,CD79B,CDC73,CDH1,CDK12,CDK4,CDK6,CDK8,CDKN1B,CDKN2A,CDKN2B,CDKN2C,CEBPA,CHD2,CHEK1,CHEK2,CIC,CIITA,CKS1B,CPS1,CREBBP,CRKL,CRLF2,CSF1R,CSF3R,CTCF,CTNNA1,CTNNB1,CUX1,CXCR4,DAXX,DDR2,DDX3X,DNM2,DNMT3A,DOT1L,DTX1,DUSP2,DUSP9,EBF1,ECT2L,EED,EGFR,ELP2,EP300,EPHA3,EPHA5,EPHA7,EPHB1,ERBB2,ERBB3,ERBB4,ERG,ESR1,ETS1,ETV6,EXOSC6,EZH2,FAF1,FAM46C,FANCA,FANCC,FANCD2,FANCE,FANCF,FANCG,FANCL,FAS(TNFRSF6),FBXO11,FBXO31,FBXW7,FGF10,FGF14,FGF19,FGF23,FGF3,FGF4,FGF6,FGFR1,FGFR2,FGFR3,FGFR4,FHIT,FLCN,FLT1,FLT3,FLT4,FLYWCH1,FOXL2,FOXO1,FOXO3,FOXP1,FRS2,GADD45B,GATA1,GATA2,GATA3,GID4(C17orf39),GNA11,GNA12,GNA13,GNAQ,GNAS,GPR124,GRIN2A,GSK3B,GTSE1,HDAC1,HDAC4,HDAC7,HGF,HIST1H1C,HIST1H1D,HIST1H1E,HIST1H2AC,HIST1H2AG,HIST1H2AL,HIST1H2AM,HIST1H2BC,HIST1H2BJ,HIST1H2BK,HIST1H2BO,HIST1H3B,HNF1A,HRAS,HSP90AA1,ICK,ID3,IDH1,IDH2,IGF1R,IKBKE,IKZF1,IKZF2,IKZF3,IL7R,INHBA,INPP4B,INPP5D(SHIP),IRF1,IRF4,IRF8,IRS2,JAK1,JAK2,JAK3,JARID2,JUN,KAT6A(MYST3),KDM2B,KDM4C,KDM5A,KDM5C,KDM6A,KDR,KEAP1,KIT,KLHL6,KMT2A(MLL),KMT2B(MLL2),KMT2C(MLL3),KRAS,LEF1,LRP1B,LRRK2,MAF,MAFB,MAGED1,MALT1,MAP2K1,MAP2K2,MAP2K4,MAP3K1,MAP3K14,MAP3K6,MAP3K7,MAPK1,MCL1,MDM2,MDM4,MED12,MEF2B,MEF2C,MEN1,MET,MIB1,MITF,MKI67,MLH1,MPL,MRE11A,MSH2,MSH3,MSH6,MTOR,MUTYH,MYC,MYCL(MYCL1),MYCN,MYD88,MYO18A,NCOR2,NCSTN,NF1,NF2,NFE2L2,NFKBIA,NKX2−1,NOD1,NOTCH1,NOTCH2,NPM1,NRAS,NT5C2,NTRK1,NTRK2,NTRK3,NUP93,NUP98,P2RY8,PAG1,PAK3,PALB2,PASK,PAX5,PBRM1,PC,PCBP1,PCLO,PDCD1,PDCD11,PDCD1LG2(PDL2),PDGFRA,PDGFRB,PDK1,PHF6,PIK3CA,PIK3CG,PIK3R1,PIK3R2,PIM1,PLCG2,POT1,PPP2R1A,PRDM1,PRKAR1A,PRKDC,PRSS8,PTCH1,PTEN,PTPN11,PTPN2,PTPN6(SHP−1),PTPRO,RAD21,RAD50,RAD51,RAF1,RARA,RASGEF1A,RB1,RELN,RET,RHOA,RICTOR,RNF43,ROS1,RPTOR,RUNX1,S1PR2,SDHA,SDHB,SDHC,SDHD,SERP2,SETBP1,SETD2,SF3B1,SGK1,SMAD2,SMAD4,SMARCA1,SMARCA4,SMARCB1,SMC1A,SMC3,SMO,SOCS1,SOCS2,SOCS3,SOX10,SOX2,SPEN,SPOP,SRC,SRSF2,STAG2,STAT3,STAT4,STAT5A,STAT5B,STAT6,STK11,SUFU,SUZ12,TAF1,TBL1XR1,TCF3,TCL1A,TET2,TGFBR2,TLL2,TMEM30A,TMSB4XP8(TMSL3),TNFAIP3,TNFRSF11A,TNFRSF14,TNFRSF17,TOP1,TP53,TP63,TRAF2,TRAF3,TRAF5,TSC1,TSC2,TSHR,TUSC3,TYK2,U2AF1,U2AF2,VHL,WDR90,WHSC1(MMSET,または,NSD2),WISP3,WT1,XBP1,XPO1,YY1AP1,ZMYM3,ZNF217,ZNF24(ZSCAN3),ZNF703,またはZRSR2
が挙げられるが限定されない。
一実施形態において、標的遺伝子または遺伝子産物またはその断片は、癌、例えば血液悪性腫瘍(または前悪性疾患)に関連する1つ以上の再編成を有する。代表的な遺伝子または遺伝子産物としては、
ALK,BCL6,BRAF,CRLF2,EPOR,ETV4,ETV6,FGFR2,IGK,BCL2,BCR,CCND1,EGFR,ETV1,ETV5,EWSR1,IGH,IGL,JAK1,KMT2A,(MLL),NTRK1,PDGFRB,RARA,ROS1,TRG,JAK2,MYC,PDGFRA,RAF1,RET,またはTMPRSS2
が挙げられるが限定されない。
別の実施形態において、標的遺伝子または遺伝子産物またはその断片は、癌に関連する1つ以上の融合を有する。代表的な遺伝子または遺伝子産物としては、
ABI1,CBFA2T3,EIF4A2,FUS,JAK1,MUC1,PBX1,RNF213,TET1,ABL1,CBFB,ELF4,GAS7,JAK2,MYB,PCM1,ROS1,TFE3,ABL2,CBL,ELL,GLI1,JAK3,MYC,PCSK7,RPL22,TFG,ACSL6,CCND1,ELN,GMPS,JAZF1,MYH11,PDCD1LG2(PDL2),RPN1,TFPT,AFF1,CCND2,EML4,GPHN,KAT6A(MYST3),MYH9,PDE4DIP,RUNX1,TFRC,AFF4,CCND3,EP300,HERPUD1,KDSR,NACA,PDGFB,RUNX1T1(ETO),TLX1,ALK,CD274(PDL1),EPOR,HEY1,KIF5B,NBEAP1(BCL8),PDGFRA,RUNX2,TLX3,ARHGAP26(GRAF),CDK6,EPS15,HIP1,KMT2A(MLL),NCOA2,PDGFRB,SEC31A,TMPRSS2,ARHGEF12,CDX2,ERBB2,HIST1H4I,LASP1,NDRG1,PER1,SEPT5,TNFRSF11A,ARID1A,CHIC2,ERG,HLF,LCP1,NF1,PHF1,SEPT6,TOP1,ARNT,CHN1,ETS1,HMGA1,LMO1,NF2,PICALM,SEPT9,TP63,ASXL1,CIC,ETV1,HMGA2,LMO2,NFKB2,PIM1,SET,TPM3,ATF1,CIITA,ETV4,HOXA11,LPP,NIN,PLAG1,SH3GL1,TPM4,ATG5,CLP1,ETV5,HOXA13,LYL1,NOTCH1,PML,SLC1A2,TRIM24,ATIC,CLTC,ETV6,HOXA3,MAF,NPM1,POU2AF1,SNX29(RUNDC2A),TRIP11,BCL10,CLTCL1,EWSR1,HOXA9,MAFB,NR4A3,PPP1CB,SRSF3,TTL,BCL11A,CNTRL(CEP110),FCGR2B,HOXC11,MALT1,NSD1,PRDM1,SS18,TYK2,BCL11B,COL1A1,FCRL4,HOXC13,MDS2,NTRK1,PRDM16,SSX1,USP6,BCL2,CREB3L1,FEV,HOXD11,MECOM,NTRK2,PRRX1,SSX2,WHSC1(MMSET,または,NSD2),BCL3,CREB3L2,FGFR1,HOXD13,MKL1,NTRK3,PSIP1,SSX4,WHSC1L1,BCL6,CREBBP,FGFR1OP,HSP90AA1,MLF1,NUMA1,PTCH1,STAT6,YPEL5,BCL7A,CRLF2,FGFR2,HSP90AB1,MLLT1(ENL),NUP214,PTK7,STL,ZBTB16,BCL9,CSF1,FGFR3,IGH,MLLT10(AF10),NUP98,RABEP1,SYK,ZMYM2,BCOR,CTNNB1,FLI1,IGK,MLLT3,NUTM2A,RAF1,TAF15,ZNF384,BCR,DDIT3,FNBP1,IGL,MLLT4,(AF6),OMD,RALGDS,TAL1,ZNF521,BIRC3,DDX10,FOXO1,IKZF1,MLLT6,P2RY8,RAP1GDS1,TAL2,BRAF,DDX6,FOXO3,IL21R,MN1,PAFAH1B2,RARA,TBL1XR1,BTG1,DEK,FOXO4,IL3,MNX1,PAX3,RBM15,TCF3(E2A),CAMTA1,DUSP22,FOXP1,IRF4,MSI2,PAX5,RET,TCL1A(TCL1),CARS,EGFR,FSTL3,ITK,MSN,PAX7,RHOH,またはTEC
が挙げられるが限定されない。
一実施形態において、標的遺伝子または遺伝子産物またはその断片は、表5A〜9に記載の遺伝子または遺伝子産物の何れかから選択される。
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
「優先度1」は、選択された遺伝子または遺伝子産物の最優先事項を指す。
「癌遺伝子」は、優先度1と比較して優先度が低い、癌関連遺伝子または遺伝子産物を指す。
「PGx遺伝子」は、薬理遺伝学および薬理ゲノミクス(PGx)にとって重要である遺伝子を指す。
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
実行可能性カテゴリは、以下のように分類される。表6は、異なる癌のタイプにおける代表的な変化に対する異なるカテゴリの適用のまとめを提供する。
カテゴリA:承認/標準的治療に対する感度または耐性を予測する承認/標準変化
転移性結腸癌におけるKRAS G13D
乳癌におけるERBB2増幅
非小細胞肺癌におけるEGFR L858R
カテゴリB:特定の実験的治療に対する包含または除外基準である変化
結腸癌、肺癌または乳癌におけるKRAS G13D
黒色腫、結腸癌または肺癌におけるBRAF V600E
黒色腫におけるNRAS Q61K
乳癌におけるPIK3CA H1047R
乳癌におけるFGFR1増幅
乳癌におけるPTEN二対立遺伝子不活性化
乳癌または膵臓癌におけるBRCA1二対立遺伝子不活性化
カテゴリC:標準的または実験的治療に対する感度または耐性を予測する証拠が限定的な変化(初期臨床データ、相反する臨床データ、前臨床データ、理論)
結腸癌におけるKRAS Q61H(初期臨床データ)
乳癌におけるPIK3CA H1047R(相反する臨床データ)
結腸癌におけるBRAF V600E(相反する臨床データ)
肺癌におけるERBB2突然変異または増幅(症例報告)
肺癌におけるBRAF D594G(前臨床)
乳癌におけるFGFR1増幅(前臨床)
乳癌におけるATM二対立遺伝子不活性化(前臨床)
結腸癌におけるTSC1二対立遺伝子不活性化(前臨床)
乳癌におけるATR二対立遺伝子不活性化(理論)
肉腫におけるBRAF V600E突然変異(理論)
カテゴリD:癌の特定のサブタイプにおける予後または診断有用性がある変化
結腸癌におけるMSH2二対立遺伝子不活性化(強力な臨床的証拠)
結腸癌におけるBRAF V600E(強力な臨床的証拠)
肺癌におけるKRAS G13D(強力な臨床的証拠)
乳癌におけるBRCA1の不活性化(強力な臨床的証拠)
カテゴリE:明確な臨床的意義のない、癌における明確な生物学的意義の変化(すなわちドライバー変異)
結腸癌におけるAPC二対立遺伝子不活性化
乳癌におけるTP53二対立遺伝子不活性化
黒色腫におけるMITF増幅
卵巣癌におけるARID1A
カテゴリF:癌における既知の生物学的意義のない変化
既知の癌遺伝子における新規変化
治療標的
既知の癌遺伝子の相同分子種
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
Figure 0006905934
前述の方法の適用には、医学的検体における配列決定のための特定の1つまたは複数の遺伝子の全ての既知の配列変異(またはそのサブセット)を含有するオリゴヌクレオチドのライブラリを使用することが含まれる。
ある一定の実施形態において、本方法またはアッセイは、次のうち1つ以上をさらに含む:
(i)核酸試料のフィンガープリントを行うこと;
(ii)核酸試料中の遺伝子または遺伝子産物(例えば本明細書中に記載のような遺伝子または遺伝子産物)の存在量を定量すること;
(iii)試料中の転写産物の相対的存在量を定量すること;
(iv)核酸試料を特定の対象(例えば正常対照または癌患者)に属するものとして同定すること;
(v)核酸試料中の遺伝的形質(例えば1つ以上の対象の遺伝的性質(例えば、民族性、人種、家族の特徴))を同定すること;
(vi)核酸試料中の倍数性を決定し;核酸試料中のヘテロ接合性の喪失を判定すること;
(vii)核酸試料中の遺伝子重複事象の有無を判定すること;
(viii)核酸試料中の遺伝子増幅事象の有無を判定すること;または
(ix)核酸試料中の腫瘍/正常細胞混合のレベルを決定すること。
核酸試料
様々な組織試料が、本方法で使用される核酸試料の供給源となり得る。対象の試料(例えば、腫瘍試料、正常隣接組織(NAT)、血液試料、循環腫瘍細胞(CTC)を含有する試料または何らかの正常な対照)から、ゲノムまたはサブゲノム核酸(例えばDNAまたはRNA)を単離し得る。ある一定の実施形態において、組織試料は、凍結試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフィン包埋(FFPE)組織標本として保存される。例えば、試料は、マトリックス、例えば、FFPEブロックまたは凍結試料中で包埋され得る。ある一定の実施形態において、組織試料は血液試料である。他の実施形態において、組織試料は、骨髄穿刺(BMA)試料である。単離段階は、個々の染色体のフローソーティング;および/または対象の試料(例えば、腫瘍試料、NAT、血液試料)を顕微解剖することを含み得る。
「単離」核酸分子は、核酸分子の天然の供給源に存在する他の核酸分子から分離されている核酸分子である。ある一定の実施形態において、「単離」核酸分子は、核酸が由来する生物のゲノムDNA中の核酸(すなわち、核酸の5’および3’末端に位置する配列)に天然に隣接する配列(タンパク質コード配列など)を含まない。例えば、様々な実施形態において、単離された核酸分子は、核酸が由来する細胞のゲノムDNA中の核酸に天然に隣接する、約5kB未満、約4kB未満、約3kB未満、約2kB未満、約1kB未満、約0.5kB未満または約0.1kB未満のヌクレオチド配列を含有し得る。さらに、RNA分子またはcDNA分子などの「単離」核酸分子は、例えば、組み換え技術によって作製されるか、または化学的前駆体または他の化学物質を実質的に含まない場合、例えば化学合成される場合、他の細胞性物質または培地を実質的に含み得ない。
「他の細胞性物質または培地を実質的に含まない」という語は、ある核酸分子が単離されているかまたは組み換え産生される細胞の細胞構成成分から、その分子が分離される、核酸分子の調製を含む。したがって、実質的に細胞性物質を含まない核酸分子は、約30%未満、約20%未満、約10%未満または約5%未満(乾燥重量)の他の細胞性物質または培地を有する核酸分子の調製を含む。
ある一定の実施形態において、核酸は、経年試料、例えば経年FFPE試料から単離される。経年試料は、例えば、1年、2年、3年、4年、5年、10年、15年、20年、25年、50年、75年または100年以上であり得る。
核酸試料は、様々な大きさの組織試料(例えば、生検、FFPE試料、血液試料または骨髄穿刺試料)から得ることができる。例えば、核酸は、5〜200μmまたはそれを超える組織試料から単離し得る。例えば、組織試料は、5μm、10μm、20μm、30μm、40μm、50μm、70μm、100μm、110μm、120μm、150μmまたは200μmまたはそれ以上を測定し得る。
組織試料からのDNA単離のためのプロトコールを実施例1で提供する。ホルムアルデヒドまたはパラホルムアルデヒド固定、パラフィン包埋(FFPE)組織から核酸(例えばDNA)を単離するためのさらなる方法は、例えばCronin M.ら(2004)Am J Pathol.164(1):35−42;Masuda N.ら(1999)Nucleic Acids Res.27(22):4436−4443;Specht K.ら(2001)Am J Pathol.158(2):419−429,Ambion RecoverAll(商標)Total Nucleic Acid Isolation Protocol(Ambion,Cat.No.AM1975,September 2008),Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kit Technical Manual(Promega Literature #TM349,February 2011),E.Z.N.A.(登録商標)FFPE DNA Kit Handbook(OMEGA bio−tek,Norcross,GA,product numbers D3399−00,D3399−01およびD3399−02;June 2009)およびQIAamp(登録商標)DNA FFPE Tissue Handbook(Qiagen,Cat.No.37625,October 2007)で開示されている。RecoverAll(商標)Total Nucleic Acid Isolation Kitは、高温でキシレンを使用して、パラフィン包埋試料とグラスファイバーフィルターを溶解させて核酸を捕捉する。Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kitは、FFPE組織の1〜10μm切片からのゲノムDNAの精製のために、Maxwell(登録商標)16機器とともに使用される。シリカ被覆常磁性粒子(PMP)を用いてDNAを精製し、低溶出体積で溶出させる。E.Z.N.A.(登録商標)FFPE DNA Kitは、ゲノムDNAの単離のためにスピンカラムおよび緩衝液系を使用する。QIAamp(登録商標)DNA FFPE Tissue Kitは、ゲノムおよびミトコンドリアDNAの精製のために、QIAamp(登録商標)DNA Microテクノロジーを使用する。血液からのDNA単離のためのプロトコールは、例えば、Maxwell(登録商標)16 LEV Blood DNA KitおよびMaxwell 16 Buccal Swab LEV DNA Purification Kit Technical Manual(Promega Literature #TM333,January 1,2011)で開示されている。
RNA単離のためのプロトコールは、例えばMaxwell(登録商標)16 Total RNA Purification Kit Technical Bulletin(Promega Literature #TB351,August 2009)で開示されている。
単離核酸試料(例えば、ゲノムDNA試料)は、日常的な技術を実施することによって断片化またはせん断し得る。例えば、ゲノムDNAは、物理的せん断法、酵素的切断法、化学的切断法および当業者にとって周知の他の方法によって断片化し得る。核酸ライブラリは、ゲノムの複雑性の全てまたは実質的に全てを含み得る。この文脈において「実質的に全て」という用語は、実際には、手順の最初の段階の間に、ゲノムの複雑性のいくつかの不必要な喪失があり得る可能性を指す。本明細書中に記載の方法はまた、核酸ライブラリがゲノムの一部である場合、すなわちゲノムの複雑性が設計によって減少する場合にも有用である。いくつかの実施形態において、ゲノムの何らかの選択部分を、本明細書中に記載の方法とともに使用し得る。ある一定の実施形態において、エクソーム全体またはそのサブセットが単離される。
本発明において特徴となる方法は、ライブラリ(例えば、本明細書中に記載のような核酸ライブラリ)を提供するために核酸試料を単離することをさらに含み得る。ある一定の実施形態において、核酸試料は、全ゲノム、サブゲノム断片またはその両方を含む。核酸ライブラリを調製するために、単離された核酸試料を使用し得る。したがって、一実施形態において、本発明において特徴となる方法は、ライブラリ(例えば、本明細書中に記載のような核酸ライブラリ)を提供するために核酸試料を単離することをさらに含む。全ゲノムまたはサブゲノム断片からライブラリを単離および調製するためのプロトコールは当技術分野で公知である(例えば、IlluminaのゲノムDNA試料調製キット)。ある一定の実施形態において、対象の試料(例えば、腫瘍試料、正常隣接組織(NAT)、血液試料または何らかの正常な対照)から、ゲノムまたはサブゲノムDNA断片を単離する。一実施形態において、試料(例えば腫瘍またはNAT試料)は保存検体である。例えば、試料は、マトリックス、例えば、FFPEブロックまたは凍結試料中で包埋される。ある一定の実施形態において、単離段階は、個々の染色体のフローソーティング;および/または対象の試料(例えば、腫瘍試料、NAT、血液試料)を顕微解剖することを含む。ある一定の実施形態において、核酸ライブラリを作製するために使用される核酸試料は、5マイクログラム未満、1マイクログラム未満または500ng未満、200ng未満、100ng未満、50ng未満、10ng未満、5ng未満または1ng未満である。
さらに他の実施形態において、ライブラリを作製するために使用される核酸試料は、RNAまたはRNA由来のcDNAを含む。いくつかの実施形態において、RNAは全細胞RNAを含む。他の実施形態において、ある種の大量のRNA配列(例えばリボソームRNA)が枯渇している。いくつかの実施形態において、全RNA調製物中のポリ(A)尾部付きmRNA分画が濃縮されている。いくつかの実施形態において、cDNAは、ランダムプライムcDNA合成法によって作製される。他の実施形態において、cDNA合成は、オリゴ(dT)含有オリゴヌクレオチドで開始させることによって成熟mRNAのポリ(A)尾部で惹起される。欠失、ポリ(A)濃縮およびcDNA合成のための方法は、当業者にとって周知である。
本方法は、当業者にとって周知である特異的または非特異的核酸増幅法によって核酸試料を増幅することをさらに含み得る。いくつかの実施形態、ある一定の実施形態において、核酸試料は、例えばランダムプライム鎖置換増幅などの全ゲノム増幅法によって増幅される。
他の実施形態において、物理的または酵素的方法により核酸試料を断片化またはせん断し、合成アダプターに連結させ、(例えば分取ゲル電気泳動により)サイズ選択し、(例えばPCRにより)増幅させる。他の実施形態において、ハイブリッド選択の前に明確なサイズ選択または増幅なしに、核酸の断片化およびアダプター連結群を使用する。
他の実施形態において、単離DNA(例えばゲノムDNA)を断片化またはせん断する。いくつかの実施形態において、ライブラリは、例えば、他の手段によって細分画化された、ゲノムの縮小版または定められた部分であるゲノムDNAの細分画など、ゲノムDNAの50%未満を含む。他の実施形態において、ライブラリは、全てまたは実質的に全てのゲノムDNAを含む。
いくつかの実施形態において、ライブラリは、例えば、他の手段によって細分画化された、ゲノムの縮小版または定められた部分であるゲノムDNAの細分画など、ゲノムDNAの50%未満を含む。他の実施形態において、ライブラリは、全てまたは実質的に全てのゲノムDNAを含む。全ゲノムまたはサブゲノム断片からライブラリを単離および調製するためのプロトコールは、当技術分野で公知であり(例えば、IlluminaのゲノムDNA試料調製キット)、実施例において本明細書中に記載されている。DNAせん断に対する代替法は、本明細書中で実施例4として記載する。例えば、代替的なDNAせん断法は、より自動化可能および/またはより効率的であり得る(例えば、分解されたFFPE試料を用いる。)。ライブラリ調製中のライゲーション段階を回避するために、DNAせん断法に対する代替法を使用し得る。
本明細書中に記載の方法は、例えば、供給源DNAまたはRNAの量が(例えば全ゲノム増幅の後でさえも)制限される場合に、少量の核酸を使用して行われ得る。一実施形態において、核酸は、約5μg、4μg、3μg、2μg、1μg、0.8μg、0.7μg、0.6μg、0.5μgまたは400ng、300ng、200ng、100ng、50ng、10ng、5ng、1ng未満またはそれ未満の核酸試料を含む。例えば、典型的には50〜100ngのゲノムDNAを用いて開始し得る。しかし、ハイブリダイゼーション段階、例えば溶液ハイブリダイゼーションの前に、(例えばPCRを使用して)ゲノムDNAを増幅する場合、より少ない量で開始し得る。したがって、ハイブリダイゼーション、例えば溶液ハイブリダイゼーションの前に、ゲノムDNAを増幅することは可能であるが必須ではない。
ライブラリを作製するために使用される核酸試料は、RNAまたはRNA由来のcDNAも含み得る。いくつかの実施形態において、RNAは全細胞RNAを含む。他の実施形態において、ある種の大量のRNA配列(例えばリボソームRNA)が枯渇している。他の実施形態において、全RNA調製物中のポリ(A)尾部付きmRNA分画が濃縮されている。いくつかの実施形態において、cDNAは、ランダムプライムcDNA合成法によって作製される。他の実施形態において、cDNA合成は、オリゴ(dT)含有オリゴヌクレオチドで開始させることによって成熟mRNAのポリ(A)尾部で惹起される。欠失、ポリ(A)濃縮およびcDNA合成のための方法は、当業者にとって周知である。
本方法は、当業者にとって公知である特異的または非特異的核酸増幅法によって核酸試料を増幅することをさらに含み得る。核酸試料は、例えばランダムプライム鎖置換増幅などの全ゲノム増幅法によって増幅され得る。
本明細書中に記載のような物理的または酵素的方法により核酸試料を断片化またはせん断し、合成アダプターに連結し、(例えば分取ゲル電気泳動により)サイズ選択し、(例えばPCRにより)増幅し得る。ハイブリッド選択の前に明確なサイズ選択または増幅なしに、核酸の断片化およびアダプター連結群を使用する。
一実施形態において、核酸試料は、非癌細胞または非悪性細胞、例えば腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)またはその両方を含む。一実施形態において、核酸試料は、非癌細胞または非悪性細胞、例えば腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)またはその両方を含み、癌細胞または悪性細胞からのDNA、RNA(またはRNA由来のcDNA)またはその両方を含まないか、または基本的これら不含である。
一実施形態において、核酸試料は、癌細胞または悪性細胞からのDNA、RNA(またはRNA由来のcDNR)を含む。一実施形態において、核酸試料は、癌細胞または悪性細胞からのDNA、RNA(またはRNA由来のcDNR)を含み、非癌細胞または非悪性細胞、例えば腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)またはその両方を含まないか、または基本的これら不含である。
一実施形態において、核酸試料は、非癌細胞または非悪性細胞、例えば腫瘍浸潤リンパ球からのDNA、RNA(またはRNA由来のcDNA)またはその両方および癌細胞または悪性細胞からのDNA、RNA(またはRNA由来のcDNA)またはその両方を含む。
ベイトの設計および構築
ベイトは、ハイブリッド形成し得(例えば相補的であり得る)、それにより標的核酸の捕捉を可能とする核酸分子、例えばDNAまたはRNA分子であり得る。ある一定の実施形態において、標的核酸は、ゲノムDNA分子である。他の実施形態において、標的核酸は、RNA分子またはRNA分子由来のcDNA分子である。一実施形態において、ベイトはRNA分子である。他の実施形態において、ベイトは、例えば、結合実体への結合による、ベイトおよびベイトに対してハイブリッド形成する核酸によって形成されるハイブリッドの捕捉および分離を可能にする、結合実体、例えば親和性タグを含む。一実施形態において、ベイトは溶液相ハイブリダイゼーションに適している。
典型的には、RNA分子はベイト配列として使用される。RNA−DNA2本鎖は、DNA−DNA2本鎖よりも安定であり、したがって核酸のより良好である可能性がある捕捉がもたらされる。
RNAベイトは、DNA依存性RNAポリメラーゼを用いたDNA分子のデノボ化学合成および転写を含むが限定されない、当技術分野で公知の方法を用いて、本明細書の他の箇所に記載のように作製され得る。一実施形態において、ベイト配列は、例えばヒトDNAまたはプールされたヒトDNA試料を鋳型として用いて、PCRなどの既知の核酸増幅法を用いて作製される。その後、オリゴヌクレオチドをRNAベイトに変換し得る。一実施形態において、例えばRNAポリメラーゼプロモーター配列のオリゴヌクレオチドの一方の末端への付加に基づいて、インビトロ転写を使用する。一実施形態において、ベイト配列を増幅または再増幅することによって、例えばPCRまたは他の核酸増幅法を用いて、例えば各標的特異的プライマー対のうち一方のプライマーにRNAプロモーター配列を尾部付加することによって、RNAポリメラーゼプロモーター配列をベイトの末端に付加する。一実施形態において、RNAポリメラーゼは、T7ポリメラーゼ、SP6ポリメラーゼまたはT3ポリメラーゼである。一実施形態において、RNAベイトはタグ、例えば親和性タグで標識される。一実施形態において、RNAベイトは、例えばビオチン化UTPを使用してインビトロ転写によって作製される。別の実施形態において、RNAベイトをビオチンなしで作製し、次いでソラレン架橋などの当技術分野で周知の方法を用いてビオチンをRNA分子に架橋する。一実施形態において、RNAベイトは、RNase耐性RNA分子であり、これは例えば、RNase分解に耐性があるRNA分子を生成させるために転写中に修飾ヌクレオチドを用いることによって作製し得る。一実施形態において、RNAベイトは、2本鎖DNA標的の一方の鎖にのみ対応する。典型的には、このようなRNAベイトは自己相補的ではなく、ハイブリダイゼーションドライバーとしてより効果的である。
ベイトセットは、ベイトが参照配列の標的を選択するのに最適であるように、参照配列から設計し得る。いくつかの実施形態において、ベイト配列は、混合塩基(例えば縮重)を用いて設計する。例えば、(1つまたは複数の)混合塩基が共通のSNPまたは突然変異の(1つまたは複数の)位置でベイト配列中に含まれ得、両方の対立遺伝子(例えばSNPおよび非SNP;突然変異体および非突然変異体)を捕捉するためにベイト配列を最適化し得る。いくつかの実施形態において、混合縮重オリゴヌクレオチドを使用するのではなく、複数のオリゴヌクレオチドベイトを用いて全ての既知の配列変異体(またはそのサブセット)を標的化し得る。
ある一定の実施形態において、ベイトセットは、約100ヌクレオチド〜300ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。典型的には、ベイトセットは、約130ヌクレオチド〜230ヌクレオチドまたは約150〜200ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。他の実施形態において、ベイトセットは、約300ヌクレオチド〜1000ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。
いくつかの実施形態において、オリゴヌクレオチド中の標的メンバー特異的配列は、約40〜1000ヌクレオチド、約70〜300ヌクレオチド、約100〜200ヌクレオチド長、典型的には約120〜170ヌクレオチド長である。
いくつかの実施形態において、ベイトセットは結合実体を含む。結合実体は、各ベイト配列上の親和性タグであり得る。いくつかの実施形態において、親和性タグはビオチン分子またはハプテンである。ある一定の実施形態において、結合実体は、アビジン分子などのパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物からベイト/メンバーハイブリッドを分離することを可能にする。
他の実施形態において、ベイトセット中のオリゴヌクレオチドは、同じ標的メンバー配列に対して順方向および逆方向相補配列を含有し、それによって逆相補的メンバー特異的な配列を有するオリゴヌクレオチドは逆相補ユニバーサル尾部も保有する。これは、同じ鎖である、すなわち互いに相補的でない、RNA転写産物をもたらし得る。
他の実施形態において、ベイトセットは、1つ以上の位置に縮重または混合塩基を含有するオリゴヌクレオチドを含む。さらに他の実施形態において、ベイトセットは、単一種の集団または生物の群集に存在する複数のまたは実質的に全ての既知の配列変異を含む。一実施形態において、ベイトセットは、ヒト集団に存在する複数のまたは実質的に全ての既知の配列変異を含む。
他の実施形態において、ベイトセットは、cDNA配列を含むか、またはcDNA配列に由来する。他の実施形態において、ベイトセットは、ゲノムDNA、cDNAまたはクローン化DNAから増幅される増幅産物(例えばPCR産物)を含む。
他の実施形態において、ベイトセットはRNA分子を含む。いくつかの実施形態において、セットは、より安定でRNase耐性であるものを含むが限定されない、化学的、酵素的に修飾された、またはインビトロで転写されたRNA分子を含む。
さらに他の実施形態において、ベイトは、参照により本明細書中に組み込まれる、米国特許出願公開第2010/0029498およびGnirke,A.ら(2009)Nat Biotechnol.27(2):182−189に記載の方法によって作製される。例えば、最初にマイクロアレイ上で合成された長い合成オリゴヌクレオチドのプールを得て、ベイト配列を作製するためにオリゴヌクレオチドを増幅することによって、ビオチン化RNAベイトを作製し得る。いくつかの実施形態において、ベイトは、ベイト配列の一方の末端でRNAポリメラーゼプロモーター配列を付加し、RNAポリメラーゼを用いてRNA配列を合成することによって作製される。一実施形態において、合成オリゴデオキシヌクレオチドのライブラリは、Agilent Technologies,Inc.などの市販業者から入手し、公知の核酸増幅法を用いて増幅し得る。
したがって、上記のベイトセットを作製する方法が提供される。本方法は、1つ以上の標的特異的ベイトオリゴヌクレオチド配列(例えば、本明細書中に記載のような1つ以上の突然変異捕捉、参照または対照オリゴヌクレオチド配列)を選択すること;標的特異的ベイトオリゴヌクレオチド配列のプールを得ること(例えばマイクロアレイ合成によって、標的特異的ベイトオリゴヌクレオチド配列のプールを合成すること);および場合によってはベイトセットを作製するためにオリゴヌクレオチドを増幅することを含む。
他の実施形態において、本方法は、1つ以上のビオチン化プライマーを用いてオリゴヌクレオチドを(例えばPCRによって)増幅することをさらに含む。いくつかの実施形態において、オリゴヌクレオチドは、マイクロアレイに連結される各オリゴヌクレオチドの末端にユニバーサル配列を含む。本方法は、オリゴヌクレオチドからユニバーサル配列を除去することをさらに含み得る。このような方法はまた、オリゴヌクレオチドの相補鎖を除去し、オリゴヌクレオチドをアニーリングし、オリゴヌクレオチドを伸長させることも含み得る。これらの実施形態の一部において、オリゴヌクレオチドを(例えばPCRによって)増幅するための方法は、1つ以上のビオチン化プライマーを使用する。いくつかの実施形態において、本方法は増幅されたオリゴヌクレオチドのサイズ選択を行うことをさらに含む。
一実施形態において、RNAベイトセットが作製される。本方法は、本明細書中に記載の方法に従い、ベイト配列のセットを作製し、ベイト配列の一方の末端でRNAポリメラーゼプロモーター配列を付加し、RNAポリメラーゼを用いてRNA配列を合成することを含む。RNAポリメラーゼは、T7 RNAポリメラーゼ、SP6 RNAポリメラーゼまたはT3 RNAポリメラーゼから選択され得る。他の実施形態において、RNAポリメラーゼプロモーター配列は、ベイト配列を(例えばPCRにより)増幅することによってベイト配列の末端で付加される。ベイト配列が、ゲノムまたはcDNAからの特異的なプライマー対を用いてPCRによって増幅される実施形態において、RNAプロモーター配列を各対の2つの特異的プライマーの一方の5’末端に付加することにより、標準的な方法を用いて、RNAベイトに転写し得るPCR産物が得られる。
他の実施形態において、ベイトセットは、ヒトDNAまたはプールされたヒトDNA試料を鋳型として使用して作製し得る。このような実施形態において、オリゴヌクレオチドは、ポリメラーゼ連鎖反応(PCR)によって増幅される。他の実施形態において、増幅されたオリゴヌクレオチドは、ローリングサークル増幅またはハイパーブランチド・ローリングサークル増幅によって再増幅される。ヒトDNAまたはプールされたヒトDNA試料を鋳型として使用してベイト配列を作製するためにも、同じ方法を使用し得る。制限消化、パルスフィールドゲル電気泳動、フローソーティング、CsCl密度勾配遠心分離、選択的動的再会合(selective kinetic reassociation)、染色体調製物の顕微解剖および当業者にとって公知の他の分画化方法を含むが限定されない他の方法によって得られたゲノムの細分画を用いて、ベイト配列を作製するためにも、同じ方法を使用し得る。
ある一定の実施形態において、ベイトセット中のベイト数は1,000未満である。他の実施形態において、ベイトセット中のベイト数は、1,000を超えるか、5,000を超えるか、10,000を超えるか、20,000を超えるか、50,000を超えるか、100,000を超えるか、または500,000を超える。
ベイト配列の長さは、約70ヌクレオチド〜1000ヌクレオチドであり得る。一実施形態において、ベイトの長さは、約100〜300ヌクレオチド、110〜200ヌクレオチドまたは120〜170ヌクレオチド長である。上記のものに加えて、約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800および900ヌクレオチド長の中間的なオリゴヌクレオチド長を本明細書中に記載の方法において使用し得る。いくつかの実施形態において、約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220または230塩基のオリゴヌクレオチドを使用し得る。
各ベイト配列は、一方または両方の末端に標的特異的(例えばメンバー特異的)ベイト配列およびユニバーサル尾部を含み得る。本明細書で使用される場合、「ベイト配列」という用語は、標的特異的ベイト配列またはオリゴヌクレオチドの標的特異的「ベイト配列」および他のヌクレオチドを含むオリゴヌクレオチド全体を指し得る。ベイト中の標的特異的配列は、約40ヌクレオチド〜1000ヌクレオチド長である。一実施形態において、標的特異的配列は、約70ヌクレオチド〜300ヌクレオチド長である。別の実施形態において、標的特異的配列は、約100ヌクレオチド〜200ヌクレオチド長である。さらに別の実施形態において、標的特異的配列は、約120ヌクレオチド〜170ヌクレオチド長、一般的には120ヌクレオチド長である。上述のものに加えて、約40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800および900ヌクレオチド長の標的特異的配列、ならびに上述の間の長さの標的特異的配列など、中間的な長さも、本明細書中に記載の方法において使用され得る。
一実施形態において、ベイトは、約50〜200ヌクレオチド長(例えば、50、60、80、90、100、110、120、130、140、150、160、170、190または200ヌクレオチド)のオリゴマー(例えばRNAオリゴマー、DNAオリゴマーまたはそれらの組み合わせから成っている。)である。一実施形態において、各ベイトオリゴマーは、標的特異的ベイト配列である約120〜170個、または典型的には約120個のヌクレオチドを含む。ベイトは、一方または両方の末端でさらなる非標的特異的ヌクレオチド配列を含み得る。さらなるヌクレオチド配列は、例えば、PCT増幅のために、またはベイト識別子として使用され得る。ある一定の実施形態において、ベイトは、本明細書中に記載のような結合実体(例えば、ビオチン分子などの捕捉タグ)をさらに含む。結合実体、例えばビオチン分子は、例えばベイトの5’−、3’−末端または内部に(例えば、ビオチン化ヌクレオチドを組み込むことによって)ベイトに付着させ得る。一実施形態において、ビオチン分子は、ベイトの5’−末端で連結される。
代表的な一実施形態において、ベイトは約150ヌクレオチド長のオリゴヌクレオチドであり、そのうち120ヌクレオチドは標的特異的「ベイト配列」である。他の30のヌクレオチド(例えば各末端で15ヌクレオチド)は、PCR増幅に使用される任意のユニバーサル尾部である。尾部は、使用者により選択される何らかの配列であり得る。例えば、合成オリゴヌクレオチドのプールは、5’−ATCGCACCAGCGTGTN120CACTGCGGCTCCTCA−3’(配列番号1)の配列のオリゴヌクレオチドを含み得、N120は標的特異的ベイト配列を示す。
本明細書中に記載のベイト配列は、エクソンおよび短い標的配列の選択のために使用し得る。一実施形態において、ベイトは、約100ヌクレオチド〜300ヌクレオチド長である。別の実施形態において、ベイトは、約130ヌクレオチド〜230ヌクレオチド長である。さらに別の実施形態において、ベイトは、約150ヌクレオチド〜200ヌクレオチド長である。例えばエクソンおよび短い標的配列の選択のための、ベイト中の標的特異的配列は、約40ヌクレオチド〜1000ヌクレオチド長である。一実施形態において、標的特異的配列は、約70ヌクレオチド〜300ヌクレオチド長である。別の実施形態において、標的特異的配列は、約100ヌクレオチド〜200ヌクレオチド長である。さらに別の実施形態において、標的特異的配列は、約120ヌクレオチド〜170ヌクレオチド長である。
いくつかの実施形態において、長いオリゴヌクレオチドは、標的配列を捕捉するために必要なオリゴヌクレオチドの数を最小限にし得る。例えば、エクソン1個あたり1つのオリゴヌクレオチドを使用し得る。当技術野で、ヒトゲノム中のタンパク質コードエクソンの平均および中央値の長さはそれぞれ約164および120塩基対であることが知られている。長いベイトほど、特異性が高く、短いものよりも良好に捕捉し得る。結果として、オリゴヌクレオチドベイト配列あたりの成功率は、短いオリゴヌクレオチドの場合よりも高い。一実施形態において、最小ベイトカバー配列は、例えばエクソンサイズの標的を捕捉する場合、1個のベイトの大きさ(例えば120〜170塩基)である。ベイト配列の長さを決定する際、ベイトが不必要に長いと、標的に直接隣接する、より多くの不必要なDNAを捕捉することも考慮に入れ得る。長いオリゴヌクレオチドベイトほど、また、短いものよりもDNA試料中の標的領域における多型に対してより耐性であり得る。典型的には、ベイト配列は参照ゲノム配列に由来する。実際のDNA試料中の標的配列が参照配列から逸脱する場合、例えば、それが一塩基多型(SNP)を含有する場合、それはベイトとあまり効率的にハイブリッド形成し得ず、したがって、ベイト配列とハイブリッド形成させられる配列が提示不十分であるかまたは完全に不在であり得る。例えば120〜170塩基における単一の誤対合は、それぞれ多重増幅およびマイクロアレイ捕捉における典型的なベイトまたはプライマー長である20または70塩基の単一のミスマッチよりもハイブリッドの安定性に対する影響が少なくなり得るという理由から、より長い合成ベイト分子では、SNPに起因する対立遺伝子の脱落が起こる可能性が低くなり得る。
ゲノム領域など、捕捉ベイトの長さと比較して長い標的の選択の場合、ベイト配列の長さは、一般的には、隣接配列の標的化を最小限に抑えるという唯一の目的のためにベイト配列の最大サイズを制限する必要がないことを除いて、上記の短い標的に対するベイトと同じサイズ範囲にある。あるいは、オリゴヌクレオチドは、はるかに広い枠(一般的には600塩基)にわたり表記され得る。この方法は、典型的なエクソンよりもかなり大きい(例えば約500塩基)DNA断片を捕捉するために使用し得る。結果として、かなりより多くの不必要な隣接非標的配列が選択される。
ベイト合成
ベイトは、何らかのタイプのオリゴヌクレオチド、例えばDNAまたはRNAであり得る。DNAまたはRNAベイト(「オリゴベイト」)は、個々に合成し得るか、またはDNAもしくはRNAベイトセットとしてアレイで合成し得る(「アレイベイト」)。オリゴベイトは、アレイ方式で提供されるかまたは単離オリゴとして提供されるかにかかわらず、一般的には1本鎖である。ベイトは、本明細書中に記載のような結合実体(例えば、ビオチン分子などの捕捉タグ)をさらに含み得る。結合実体、例えばビオチン分子は、ベイトに、例えばベイトの5’−、3’−末端、一般的にはベイトの5’−末端に付着させ得る。ベイトセットは、例えば、国際公開第2012/092426号パンフレットに記載のような、当技術分野で記載の方法によって合成され得る。
ハイブリダイゼーション条件
本発明で特徴となる方法は、選択されたライブラリキャッチを提供するために、ライブラリ(例えば核酸ライブラリ)を複数のベイトと接触させる段階を含む。接触段階は溶液ハイブリダイゼーションで行われ得る。ある一定の実施形態において、本方法は、1回以上のさらなる溶液ハイブリダイゼーションによってハイブリダイゼーション段階を繰り返すことを含む。いくつかの実施形態において、本方法は、同じまたは異なるベイト収集物を用いた1回以上のさらなる溶液ハイブリダイゼーションにライブラリキャッチを供することをさらに含む。本明細書における方法での使用に適合させ得るハイブリダイゼーション法は、例えば、国際公開第2012/092426号パンフレットに記載のように、当技術分野で記載されている。
本発明のさらなる実施形態または特徴は以下のとおりである。
別の態様において、本発明は、上記のベイトセットを作製する方法を特徴とする。本方法は、1つ以上の標的特異的ベイトオリゴヌクレオチド配列(例えば、本明細書中に記載のような遺伝子または遺伝子産物の対象区間(例えばサブゲノム区間、発現サブゲノム区間またはその両方)に対応するベイト配列の何れか)を選択すること;標的特異的ベイトオリゴヌクレオチド配列のプールを得ること(例えば、マイクロアレイ合成によって、標的特異的ベイトオリゴヌクレオチド配列のプールを合成すること);場合によってはベイトセットを作製するためにオリゴヌクレオチドを増幅することを含む。
さらに別の態様において、本発明は、核酸試料における、癌性表現型(例えば、本明細書中に記載の遺伝子または遺伝子産物における変化のうち少なくとも10、20、30、50個、またはそれ以上)に、例えば陽性または陰性に関連する変化の有無を判定するための方法を特徴とする。本方法は、核酸キャッチを得るために、本明細書中に記載の方法およびベイトの何れかによる溶液ベースの選択に対して試料中の核酸を接触させ;(例えば次世代配列決定によって)核酸キャッチの全てまたはサブセットを配列決定し、それによって本明細書中に記載の遺伝子または遺伝子産物における変化の有無を判定することを含む。
ある一定の実施形態において、ベイトセットは、約100ヌクレオチド〜300ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。典型的には、ベイトセットは、約130ヌクレオチド〜230ヌクレオチドまたは約150〜200ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。他の実施形態において、ベイトセットは、約300ヌクレオチド〜1000ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。
いくつかの実施形態において、オリゴヌクレオチド中の標的メンバー特異的配列は、約40〜1000ヌクレオチド、約70〜300ヌクレオチド、約100〜200ヌクレオチド長、典型的には約120〜170ヌクレオチド長である。
いくつかの実施形態において、ベイトセットは結合実体を含む。結合実体は、各ベイト配列上の親和性タグであり得る。いくつかの実施形態において、親和性タグはビオチン分子またはハプテンである。ある一定の実施形態において、結合実体は、アビジン分子などのパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、ハイブリダイゼーション混合物からベイト/メンバーハイブリッドを分離することを可能にする。
他の実施形態において、ベイトセット中のオリゴヌクレオチドは、同じ標的メンバー配列に対して順方向および逆方向相補配列を含有し、それによって逆相補的メンバー特異的な配列を有するオリゴヌクレオチドは逆相補ユニバーサル尾部も保有する。これは、同じ鎖である、すなわち互いに相補的でない、RNA転写産物をもたらし得る。
他の実施形態において、ベイトセットは、1つ以上の位置に縮重または混合塩基を含有するオリゴヌクレオチドを含む。さらに他の実施形態において、ベイトセットは、単一種の集団または生物の群集に存在する複数のまたは実質的に全ての既知の配列変異を含む。一実施形態において、ベイトセットは、ヒト集団に存在する複数のまたは実質的に全ての既知の配列変異を含む。
他の実施形態において、ベイトセットは、cDNA配列を含むか、またはcDNA配列に由来する。一実施形態において、cDNAは、RNA配列、例えば、腫瘍または癌細胞由来のRNA、例えば腫瘍−FFPE試料、血液試料または骨髄穿刺試料から得られるRNAから調製される。他の実施形態において、ベイトセットは、ゲノムDNA、cDNAまたはクローン化DNAから増幅される増幅産物(例えばPCR産物)を含む。
他の実施形態において、ベイトセットはRNA分子を含む。いくつかの実施形態において、セットは、より安定でRNase耐性であるものを含むが限定されない、化学的、酵素的に修飾された、またはインビトロで転写されたRNA分子を含む。
さらに他の実施形態において、ベイトは、参照により本明細書中に組み込まれる、米国特許出願公開第2010/0029498およびGnirke,A.ら(2009)Nat Biotechnol.27(2):182−189に記載の方法によって作製される。例えば、最初にマイクロアレイ上で合成された長い合成オリゴヌクレオチドのプールを得て、ベイト配列を作製するためにオリゴヌクレオチドを増幅することによって、ビオチン化RNAベイトを作製し得る。いくつかの実施形態において、ベイトは、ベイト配列の一方の末端でRNAポリメラーゼプロモーター配列を付加し、RNAポリメラーゼを用いてRNA配列を合成することによって作製される。一実施形態において、合成オリゴデオキシヌクレオチドのライブラリは、Agilent Technologies,Inc.などの市販業者から入手し、公知の核酸増幅法を用いて増幅し得る。
したがって、上記のベイトセットを作製する方法が提供される。本方法は、1つ以上の標的特異的ベイトオリゴヌクレオチド配列(例えば、本明細書中に記載のような1つ以上の突然変異捕捉、参照または対照オリゴヌクレオチド配列)を選択すること;標的特異的ベイトオリゴヌクレオチド配列のプールを得ること(例えばマイクロアレイ合成によって、標的特異的ベイトオリゴヌクレオチド配列のプールを合成すること);および場合によってはベイトセットを作製するためにオリゴヌクレオチドを増幅することを含む。
他の実施形態において、本方法は、1つ以上のビオチン化プライマーを用いてオリゴヌクレオチドを(例えばPCRによって)増幅することをさらに含む。いくつかの実施形態において、オリゴヌクレオチドは、マイクロアレイに連結される各オリゴヌクレオチドの末端にユニバーサル配列を含む。本方法は、オリゴヌクレオチドからユニバーサル配列を除去することをさらに含み得る。このような方法はまた、オリゴヌクレオチドの相補鎖を除去し、オリゴヌクレオチドをアニーリングし、オリゴヌクレオチドを伸長させることも含み得る。これらの実施形態の一部において、オリゴヌクレオチドを(例えばPCRによって)増幅するための方法は、1つ以上のビオチン化プライマーを使用する。いくつかの実施形態において、本方法は増幅されたオリゴヌクレオチドのサイズ選択を行うことをさらに含む。
一実施形態において、RNAベイトセットが作製される。本方法は、本明細書中に記載の方法に従い、ベイト配列のセットを作製し、ベイト配列の一方の末端でRNAポリメラーゼプロモーター配列を付加し、RNAポリメラーゼを用いてRNA配列を合成することを含む。RNAポリメラーゼは、T7 RNAポリメラーゼ、SP6 RNAポリメラーゼまたはT3 RNAポリメラーゼから選択され得る。他の実施形態において、RNAポリメラーゼプロモーター配列は、ベイト配列を(例えばPCRにより)増幅することによってベイト配列の末端で付加される。ベイト配列が、ゲノムまたはcDNAからの特異的なプライマー対を用いてPCRによって増幅される実施形態において、RNAプロモーター配列を各対の2つの特異的プライマーの一方の5’末端に付加することにより、標準的な方法を用いて、RNAベイトに転写し得るPCR産物が得られる。
他の実施形態において、ベイトセットは、ヒトDNAまたはプールされたヒトDNA試料を鋳型として使用して作製し得る。このような実施形態において、オリゴヌクレオチドは、ポリメラーゼ連鎖反応(PCR)によって増幅される。他の実施形態において、増幅されたオリゴヌクレオチドは、ローリングサークル増幅またはハイパーブランチド・ローリングサークル増幅によって再増幅される。ヒトDNAまたはプールされたヒトDNA試料を鋳型として使用してベイト配列を作製するためにも、同じ方法を使用し得る。制限消化、パルスフィールドゲル電気泳動、フローソーティング、CsCl密度勾配遠心分離、選択的動的再会合(selective kinetic reassociation)、染色体調製物の顕微解剖および当業者にとって公知の他の分画化方法を含むが限定されない他の方法によって得られたゲノムの細分画を用いて、ベイト配列を作製するためにも、同じ方法を使用し得る。
ある一定の実施形態において、ベイトセット中のベイト数は1,000未満、例えば2、3、4、5、10、50、100、500ベイトである。他の実施形態において、ベイトセット中のベイト数は、1,000を超えるか、5,000を超えるか、10,000を超えるか、20,000を超えるか、50,000を超えるか、100,000を超えるか、または500,000を超える。
ある一定の実施形態において、ライブラリ(例えば核酸ライブラリ)は、メンバーの集合を含む。本明細書中に記載の場合、ライブラリメンバーは、標的メンバー(例えば、腫瘍メンバー、参照メンバーおよび/または対照メンバー;本明細書中でそれぞれ第1、第2および/または第3のメンバーとも呼ばれる。)を含み得る。ライブラリのメンバーは、単一個体由来であり得る。一実施形態において、ライブラリは、複数の対象(例えば、2、3、4、5、6、7、8、9、10、20、30、またはそれ以上の対象)からのメンバーを含み得、例えば、複数の対象からのメンバーを有するライブラリを形成させるために、異なる対象からの2つ以上のライブラリを組み合わせ得る。一実施形態において、対象は、癌または腫瘍を有するか、または有するリスクがあるヒトである。
本明細書で用いられる場合、「メンバー」または「ライブラリメンバー」または他の同様の用語は、ライブラリのメンバーである核酸分子、例えばDNAまたはRNAを指す。典型的には、メンバーはDNA分子、例えばゲノムDNAまたはcDNAである。メンバーは、せん断されたゲノムDNAであり得る。他の実施形態において、メンバーはcDNAであり得る。他の実施形態において、メンバーはRNAであり得る。メンバーは、対象からの配列を含み、対象に由来しない配列、例えば同定を可能にする、プライマーまたは配列、例えば「バーコード」配列も含み得る。
さらに別の実施形態において、本発明において特徴となる方法は、ライブラリ(例えば、本明細書中に記載のような核酸ライブラリ)を提供するために核酸試料を単離することをさらに含む。ある一定の実施形態において、核酸試料は、全ゲノム、サブゲノム断片またはその両方を含む。全ゲノムまたはサブゲノム断片からライブラリを単離および調製するためのプロトコールは当技術分野で公知である(例えば、IlluminaのゲノムDNA試料調製キット)。ある一定の実施形態において、対象の試料(例えば、腫瘍試料、正常隣接組織(NAT)、血液試料または何らかの正常な対照)から、ゲノムまたはサブゲノムDNA断片を単離する。一実施形態において、試料(例えば腫瘍またはNAT試料)は保存物である。例えば、試料は、マトリックス、例えば、FFPEブロックまたは凍結試料中で包埋される。ある一定の実施形態において、単離段階は、個々の染色体のフローソーティング;および/または対象の試料(例えば、腫瘍試料、NAT、血液試料)を顕微解剖することを含む。ある一定の実施形態において、核酸ライブラリを作製するために使用される核酸試料は、5マイクログラム未満、1マイクログラム未満、または500ng未満(例えば200ng以下)である。
さらに他の実施形態において、ライブラリを作製するために使用される核酸試料は、RNAまたはRNA由来のcDNAを含む。いくつかの実施形態において、RNAは全細胞RNAを含む。他の実施形態において、ある種の大量のRNA配列(例えばリボソームRNA)が枯渇している。いくつかの実施形態において、全RNA調製物中のポリ(A)尾部付きmRNA分画が濃縮されている。いくつかの実施形態において、cDNAは、ランダムプライムcDNA合成法によって作製される。他の実施形態において、cDNA合成は、オリゴ(dT)含有オリゴヌクレオチドで開始させることによって成熟mRNAのポリ(A)尾部で惹起される。欠失、ポリ(A)濃縮およびcDNA合成のための方法は、当業者にとって周知である。
本方法は、当業者にとって周知である特異的または非特異的核酸増幅法によって核酸試料を増幅することをさらに含み得る。
いくつかの実施形態、ある一定の実施形態において、核酸試料は、例えばランダムプライム鎖置換増幅などの全ゲノム増幅法によって増幅される。
他の実施形態において、物理的または酵素的方法により核酸試料を断片化またはせん断し、合成アダプターに連結させ、(例えば分取ゲル電気泳動により)サイズ選択し、(例えばPCRにより)増幅させる。他の実施形態において、ハイブリッド選択の前に明確なサイズ選択または増幅なしに、核酸の断片化およびアダプター連結群を使用する。
他の実施形態において、単離DNA(例えばゲノムDNA)を断片化またはせん断する。いくつかの実施形態において、ライブラリは、例えば、他の手段によって細分画化された、ゲノムの縮小版または定められた部分であるゲノムDNAの細分画など、ゲノムDNAの50%未満を含む。他の実施形態において、ライブラリは、全てまたは実質的に全てのゲノムDNAを含む。
ある一定の実施形態において、ライブラリのメンバーは、遺伝子内領域または遺伝子間領域を含むサブゲノム区間を含む。別の実施形態において、サブゲノム区間は、エクソンまたはイントロン、またはその断片、典型的にはエクソン配列またはその断片を含む。一実施形態において、サブゲノム区間は、コード領域または非コード領域、例えばプロモーター、エンハンサー、5’非翻訳領域(5’UTR)、または3’非翻訳領域(3’UTR)またはその断片を含む。他の実施形態において、サブゲノム区間は、cDNAまたはその断片(例えば、腫瘍RNA(例えば、腫瘍試料から抽出されたRNA、例えばFFPE−腫瘍試料から抽出されたRNA)から得られるcDNA)を含む。他の実施形態において、サブゲノム区間は、例えば本明細書中に記載のようなSNPを含む。他の実施形態において、標的メンバーは、ゲノム中の実質的に全てのエクソンを含む。他の実施形態において、標的メンバーは、本明細書中に記載のようなサブゲノム区間、例えば、関心のある選択された遺伝子または遺伝子産物(例えば、本明細書中に記載のような癌性表現型と関連がある遺伝子または遺伝子産物)からのサブゲノム区間、例えばエクソンを含む。
一実施形態において、サブゲノム区間は、体細胞突然変異、生殖細胞系列突然変異またはその両方を含む。一実施形態において、サブゲノム区間は、変化、例えば、点または単一突然変異、欠失突然変異(例えばインフレーム欠失、遺伝子内欠失、完全遺伝子欠失)、挿入突然変異(例えば遺伝子内挿入)、逆位突然変異(例えば染色体内逆位)、連結突然変異、連結挿入突然変異、逆方向重複突然変異、タンデム重複(例えば、染色体内タンデム重複)、転座(例えば、染色体転座、非相反転座)、再編成(例えばゲノム再編成)、遺伝子コピー数の変化またはそれらの組み合わせを含む。ある一定の実施形態において、サブゲノム区間は、試料中の腫瘍細胞のゲノムのコード領域の5、1、0.5、0.1%、0.01%、0.001%未満を構成する。他の実施形態において、サブゲノム区間は、疾患に関与せず、例えば、本明細書中に記載のような癌性表現型と関連しない。
本発明の特色とされる方法は、核酸の選択されたサブグループ、例えばライブラリキャッチを提供するために、1つまたは複数のライブラリ(例えば1つまたは複数の核酸ライブラリ)を複数のベイトに接触させる段階を含む。一実施形態において、接触段階は、固体支持体、例えばアレイにおいて行われる。ハイブリダイゼーションに対する適した固体支持体は、例えば、Albert,T.J.ら(2007)Nat.Methods 4(11):903−5;Hodges、E.ら(2007)Nat.Genet.39(12):1522−7;Okou,D.T.ら(2007)Nat.Methods 4(11):907−9に記載されており、その内容は参照により本明細書に組み込まれる。他の実施形態において、接触段階は溶液ハイブリダイゼーションにおいて行われる。ある一定の実施形態において、本方法は、1回以上のさらなるハイブリダイゼーションによってハイブリダイゼーション段階を繰り返すことを含む。いくつかの実施形態において、本方法は、同じまたは異なるベイト収集物を用いた1回以上のさらなるハイブリダイゼーションにライブラリキャッチを供することをさらに含む。
他の実施形態において、本発明の特色とされる方法は、(例えばPCRによって)ライブラリキャッチを増幅することをさらに含む。他の実施形態において、ライブラリキャッチを増幅しない。
さらに他の実施形態において、本方法は、ライブラリキャッチを分析することをさらに含む。一実施形態において、ライブラリキャッチは、配列決定方法、例えば、本明細書中に記載のような次世代配列決定方法によって分析される。本方法は、溶液ハイブリダイゼーションによってライブラリキャッチを単離し、核酸配列決定にそのライブラリキャッチを供することを含む。ある一定の実施形態において、ライブラリキャッチを再配列決定し得る。次世代配列決定方法は当技術分野で公知であり、例えばMetzker,M.(2010)Nature Biotechnology Reviews 11:31−46に記載されている。
さらに他の実施形態において、本方法は、ライブラリキャッチを遺伝子型判定に供し、それによって選択された核酸の遺伝子型を同定する段階をさらに含む。
ある一定の実施形態において、本方法は次のうち1つ以上をさらに含む:
i)核酸試料のフィンガープリントを行うこと;
ii)核酸試料中の遺伝子または遺伝子産物(例えば本明細書中に記載のような遺伝子または遺伝子産物)の存在量を定量すること(例えば試料中の転写産物の相対的存在量を定量すること);
iii)核酸試料を特定の対象(例えば、正常対照または癌患者)に属するものとして同定すること;
iv)核酸試料中の遺伝的形質(例えば1つ以上の対象の遺伝的性質(例えば、民族性、人種、家族の特徴))を同定すること;
v)核酸試料中の倍数性を決定すること;核酸試料中のヘテロ接合性の喪失を判定すること;
vi)核酸試料中の遺伝子重複事象の有無を判定すること;
vii)核酸試料中の遺伝子増幅事象の有無を判定すること;または
viii)核酸試料中の腫瘍/正常細胞混合のレベルを決定すること。
本明細書中に記載の方法の何れも、以下の実施形態の1つ以上と組み合わせ得る。
一実施形態において、本方法は、腫瘍および/または対照核酸試料(例えばFFPE由来核酸試料または血液試料もしくは骨髄穿刺試料由来の核酸試料)から得られたヌクレオチド配列リードを得ることを含む。
一実施形態において、リードは、次世代配列決定方法によって提供される。
一実施形態において、本方法は、核酸メンバーのライブラリを提供し、前記のライブラリの複数のメンバーから、予め選択されたサブゲノム区間を配列決定することを含む。実施形態において、本方法は、配列決定のための前記のライブラリのサブセットを選択する段階、例えば溶液ベースの選択、を含み得る。
ある一定の実施形態において、方法は、それぞれが異なるベイト設計ストラテジーを有する2つ以上の異なる標的カテゴリを捕捉するように設計されるハイブリッド捕捉方法を含む。ハイブリッド捕捉方法および組成物は、標的配列の定められたサブセット(例えば標的メンバー)を捕捉し、そのサブセットの外側のカバレッジを最小限にしながら、標的配列の均質なカバレッジを提供することを目的としている。一実施形態において、標的配列は、ゲノムDNAからのエクソン全体またはその選択されたサブセットを含む。本明細書で開示される方法および組成物は、複雑な標的核酸配列(例えばライブラリ)に対する異なるデプスおよびカバレッジのパターンを達成するための異なるベイトセットを提供する。
ある一定の実施形態において、ベイトセットおよび標的の異なるカテゴリは次のとおりである。
A.低頻度で出現する突然変異に対して高レベルの感度を可能にするために最大デプスのカバレッジが必要とされる高レベルの標的(例えば1つ以上の腫瘍メンバーおよび/または参照メンバー、例えば遺伝子、エクソンまたは塩基など)を選択する第1のベイトセット。例えば、約5%以下の頻度で出現する点突然変異の検出(すなわち、試料を調製した細胞の5%が、そのゲノム中にこの突然変異を有する)。第1のベイトセットは通常、高い検出信頼性を確保するために、約500X以上の配列決定デプスを必要とする。一実施形態において、第1のベイトセットは、ある一定のタイプの癌において頻繁に突然変異が起こっている1つ以上のサブゲノム区間(例えばエクソン)、例えば表1〜4による遺伝子または遺伝子産物を選択する。
B.高レベル標的より高い頻度で、例えば約10%の頻度で出現する突然変異に対して高レベルの感度を可能にするために高いカバレッジが必要とされる中レベルの標的標的(例えば1つ以上の腫瘍メンバーおよび/または参照メンバー、例えば遺伝子、エクソンまたは塩基など)を選択する第2のベイトセット。例えば、10%の頻度で出現する変化(例えば点突然変異)の検出は、高い検出信頼性を確保するために約200X以上の配列決定デプスを必要とする。一実施形態において、第2のベイトセットは、表1〜4による遺伝子または遺伝子産物から選択される1つ以上のサブゲノム区間(例えばエクソン)を選択する。
C.高レベルの感度を可能にするために、例えばヘテロ接合性の対立遺伝子を検出するために、低−中程度のカバレッジが必要とされる、低レベルの標的を選択する第3のベイトセット(例えば1つ以上のPGxメンバー、例えば遺伝子、エクソンまたは塩基など)。例えば、ヘテロ接合性の対立遺伝子の検出は、高い検出信頼性を確保するために10〜100Xの配列決定デプスを必要とする。一実施形態において、第3のベイトセットは、a)患者が様々な薬物を代謝する能力を説明し得る薬理ゲノミクスSNP、b)患者を固有に同定(フィンガープリント)するために使用され得るゲノムSNP、c)ゲノムDNAのコピー数増加/減少およびヘテロ接合性喪失(LOH)を評価するために使用され得るゲノムSNP/遺伝子座から選択される1つ以上のサブゲノム区間(例えばエクソン)を選択する。
D.ゲノム転座またはインデルなどの構造的限界点を検出するために、低−中程度のカバレッジが必要とされるイントロン標的(例えばイントロンメンバー)を選択する第4のベイトセット。例えば、イントロン限界点の検出は、高い検出信頼性を確保するために5〜50Xの配列対スパニングデプスを必要とする。前記の第4のベイトセットは、例えば、転座/インデルが起こり易い癌遺伝子を検出するために使用され得る。
E.コピー数の変化を検出する能力を向上させるために小さいカバレッジが必要とされるイントロン標的(例えばイントロンメンバー)を選択する第5のベイトセット。例えば、いくつかの末端エクソンの1コピー欠失の検出は、高い検出信頼性を確保するために0.1〜10Xのカバレッジを必要とする。前記の第5のベイトセットは、例えば、増幅/欠失が起こり易い癌遺伝子を検出するために使用され得る。
本発明の特色とされる方法および組成物は、各ベイトセット/標的カテゴリの相対的な配列カバレッジを調整することを含む。ベイト設計における相対的な配列カバレッジの相違を実現するための方法は、次のうち1つ以上を含む:
(i)異なるベイトセットの差次的な表示−相対的な標的カバレッジのデプスを増強/低下させるために、所与の標的(例えば標的メンバー)を捕捉するためのベイトセット設計は、より多くの/より少ないコピー数に含まれ得る;
(ii)ベイトセットの差次的な重複(differential overlap)−相対的な標的カバレッジのデプスを増強/低下させるために、所与の標的(例えば標的メンバー)を捕捉するためのベイトセット設計は、近隣ベイト間のより長いかまたはより短い重複を含み得る;
(iii)差次的ベイトパラメータ−捕捉効率を低下させ、相対的な標的カバレッジのデプスを低下させるために、所与の標的(例えば標的メンバー)を捕捉するためのベイトセット設計は、配列修飾/長さがより短いことを含み得る;
(iv)異なるベイトセットの混合−相対標的カバレッジのデプスを増強/低下させるために、異なる標的セットを捕捉するように設計されるベイトセットを異なるモル比率で混合し得る;
(v)異なるタイプのオリゴヌクレオチドベイトセットの使用−ある一定の実施形態において、ベイトセットは次のものを含み得る:
(a)1つ以上の化学的に(例えば、非酵素的に)合成された(例えば個別に合成された)ベイト、
(b)アレイにおいて合成された1つ以上のベイト、
(c)1つ以上の酵素的に調製された、例えばインビトロで転写されたベイト;
(d)(a)、(b)および/または(c)の何らかの組み合わせ、
(e)1つ以上のDNAオリゴヌクレオチド(例えば天然または非天然のDNAオリゴヌクレオチド)、
(f)1つ以上のRNAオリゴヌクレオチド(例えば天然または非天然のRNAオリゴヌクレオチド)、
(g)(e)および(f)の組み合わせ、または
(h)上記の何れかの組み合わせ。
異なるオリゴヌクレオチドの組み合わせは、様々な比、例えば、1:1、1:2、1:3、1:4、1:5、1:10、1:20、1:50;1:100、1:1000などから選択される比率で混合され得る。一実施形態において、化学合成されたベイトとアレイ生成ベイトとの比率は、1:5、1:10または1:20から選択される。DNAまたはRNAオリゴヌクレオチドは、天然または非天然であり得る。ある一定の実施形態において、ベイトは、例えば融解温度を上昇させるために1つ以上の非天然ヌクレオチドを含む。代表的な非天然オリゴヌクレオチドとしては、修飾DNAまたはRNAヌクレオチドが挙げられる。代表的な修飾RNAヌクレオチドは、ロックド核酸(LNA)であり、LNAヌクレオチドのリボース部分は2’酸素および4’炭素を連結する余分な架橋で修飾されている(Kaur,H;Arora,A;Wengel,J;Maiti,S;Arora,A.;Wengel,J.;Maiti,S.(2006).「Thermodynamic,Counterion,and Hydration Effects for the Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes」.Biochemistry 45(23):7347−55)。他の修飾された代表的なDNAおよびRNAヌクレオチドとしては、ペプチド結合によって連結される反復N−(2−アミノエチル)−グリシン単位から構成されるペプチド核酸(PNA)(Egholm,M.ら(1993)Nature 365(6446):566−8);低GC領域を捕捉するように修飾されたDNAまたはRNAオリゴヌクレオチド;二環式核酸(BNA)または架橋オリゴヌクレオチド;修飾5−メチルデオキシシチジン;および2,6−ジアミノプリンが挙げられるが、限定されない。他の修飾DNAおよびRNAヌクレオチドは当技術分野で公知である。
ある一定の実施形態において、標的配列(例えば標的メンバー)の実質的に均一または均質なカバレッジが得られる。例えば、各ベイトセット/標的カテゴリ内で、ベイトパラメータを修飾することによって、例えば次のうち1つ以上によって、カバレッジの均一性を最適化し得る:
(i)同じカテゴリ中の他の標的に対して過小/過剰にカバーされる標的(例えば標的メンバー)のカバレッジを拡大/縮小させるために、ベイト表示または重複を増加/減少させることを使用し得る;
(ii)低カバレッジのために、標的配列(例えば高GC含量配列)を捕捉することが困難である場合、例えば隣接配列(例えばGCリッチ度がより低い隣接配列)をカバーするようにベイトセットで標的化される領域を拡大する;
(iii)ベイトの二次構造を減少させ、その選択効率を高めるために、ベイト配列の修飾をなし得る;
(iv)同じカテゴリ内の異なるベイトの融解ハイブリダイゼーション速度を等しくするために、ベイトの長さの変更を使用し得る。(長さが様々なベイトを作製することによって)直接、または(一貫した長さのベイトを作製し、ベイト末端を任意の配列で置き換えることによって)間接的にベイト長を変更し得る;
(v)同じ標的領域(すなわちフォワードおよびリバース鎖)に対して異なる向きのベイトを修飾することで、結合効率が異なり得る。各標的に対して最適のカバレッジを提供する何れかの方向性を有するベイトセットを選択し得る;
(vi)各ベイト上に存在する結合実体、例えば捕捉タグ(例えばビオチン)の量を変更することは、その結合効率に影響を及ぼし得る。相対標的カバレッジを拡大/縮小させるために、特定の標的を標的とするベイトのタグレベルを増加/減少させることを使用し得る;
(vii)標的への結合親和性に影響を及ぼし、相対標的カバレッジを拡大/縮小させるために、異なるベイトに対して使用されるヌクレオチドのタイプを変更し得る;または
(viii)高GC含量に対して低いまたは通常のGC含量の領域間での融解ハイブリダイゼーション速度を等しくするために、修飾オリゴヌクレオチドベイトを用いること、例えばより安定な塩基対形成を有することを使用し得る。
例えば、異なるタイプのオリゴヌクレオチドベイトセットを使用し得る。
一実施形態において、選択効率についての値は、予め選択された標的領域を包含するために異なるタイプのベイトオリゴヌクレオチドを使用することによって修正される。例えば、大きな標的領域(例えば1〜2MBの全標的領域)をカバーするために、第1のベイトセット(例えば10,000〜50,000のRNAまたはDNAベイトを含むアレイに基づくベイトセット)を使用し得る。予め選択された標的領域(例えば、標的領域の関心のある全域、例えば250kb以下の選択されたサブゲノム区間)をカバーするために、第2のベイトセット(例えば5,000個未満のベイトを含む個別に合成されたRNAまたはDNAベイトセット)および/またはより高い二次構造、例えばより高いGC含量の領域を第1のベイトセットに添加し得る。関心のある選択されたサブゲノム区間、は、本明細書中に記載の遺伝子もしくは遺伝子産物またはその断片のうち1つ以上に対応し得る。第2のベイトセットは、所望のベイト重複に応じて、約2,000〜5,000ベイトを含み得る。さらに他の実施形態において、第2のベイトセットは、第1のベイトに添加される選択されたオリゴベイト(例えば、400、200、100、50、40、30、20、10個未満のベイト)を含み得る。第2のベイトセットは、個々のオリゴベイトのあらゆる比率で混合され得る。例えば、第2のベイトセットは、1:1の等モル比として存在する個々のベイトを含み得る。あるいは、第2のベイトセットは、例えば、ある一定の標的(例えば、ある一定の標的は、他の標的と比較して5〜10Xの第2のベイトを有し得る。)の捕捉を最適化するために、異なる比率(例えば、1:5、1:10、1:20)で存在する個々のベイトを含み得る。
配列決定
本発明はまた、核酸を配列決定する方法も含む。これらの方法において、核酸ライブラリメンバーは、例えば、溶液ハイブリダイゼーションを用いて本明細書中に記載の方法を使用することによって単離され、それによりライブラリキャッチを提供する。ライブラリキャッチまたはそのサブグループの配列決定を行い得る。したがって、本発明の特色とされる方法は、ライブラリキャッチを分析することをさらに含む。一実施形態において、ライブラリキャッチは、配列決定方法、例えば、本明細書中に記載のような次世代配列決定方法によって分析される。本方法は、溶液ハイブリダイゼーションによってライブラリキャッチを単離し、核酸配列決定にそのライブラリキャッチを供することを含む。ある一定の実施形態において、ライブラリキャッチを再配列決定し得る。
当技術分野で公知の何らかの配列決定方法を使用し得る。選択方法によって単離された核酸の配列決定は、一般的には、次世代配列決定(NGS)を用いて行われる。本明細書中での使用に適切な配列決定方法は、例えば、国際公開第2012/092426号パンフレットに記載のように、当技術分野で記載される。
NGSリードが作製された後、それらは既知の参照配列とアライメントされ得るか、または新規にアセンブリされ得る。例えば、NGSリードを参照配列(例えば野生型配列)とアライメントすることによって、試料(例えば腫瘍試料)中の一塩基多型および構造変異体などの遺伝子変異の同定を達成し得る。NGSに対する配列アライメントの方法は、例えばTrapnell C.およびSalzberg S.L.Nature Biotech.,2009,27:455−457に記載されている。デノボアセンブリの例は、例えば、Warren R.ら、Bioinformatics,2007,23:500−501;Butler J.ら、Genome Res.,2008,18:810−820;およびZerbino D.R.およびBirney E.,Genome Res.,2008,18:821−829に記載されている。配列アライメントまたはアセンブリは、1つ以上のNGSプラットフォームからのリードデータを使用して、例えば、Roche/454およびIllumina/Solexaリードデータを混合して、行い得る。
アライメント
アライメントとは、リードをある位置、例えばゲノムの位置と適合させる工程である。ミスアライメント(例えば、ゲノム中の正しくない位置での短いリードからの塩基対の配置)、例えば、実際の癌突然変異の周辺のリードの配列状況(例えば反復配列の存在)によるミスアライメントは、代替対立遺伝子のリードが、代替対立遺伝子リードの主な集積を回避し得るので、突然変異検出の感度低下につながり得る。実際の突然変異が存在しない場合に問題のある配列状況が生じる場合、ミスアライメントは、参照ゲノム塩基の実際のリードを誤った位置に配置することにより、「突然変異が起こる」対立遺伝子のアーチファクトのリードを導入し得る。増加した多重遺伝子分析のための突然変異呼び出しアルゴリズムは、存在量が少ない突然変異に対しても高感度であるべきなので、これらのミスアライメントは偽陽性発見率を増加させ/特異性を減少させ得る。
本明細書で論じられるように、実際の突然変異に対する感度の低下は、分析されている遺伝子における予想される突然変異部位の周囲のアライメントの質を(手作業でまたは自動化方式で)評価することによって対処し得る。評価しようとする部位は、癌突然変異のデータベース(例えばCOSMIC)から得ることができる。問題があると特定される領域は、例えば、Smith−Watermanアライメントなどのより遅いがより正確なアライメントアルゴリズムを用いたアライメント最適化(または再アライメント)によって、関連する配列状況においてより良好な性能を与えるように選択されたアルゴリズムを使用して修正され得る。一般的なアライメントアルゴリズムが問題を修正することができない場合、例えば、置換を含有する可能性が高い遺伝子に対する極大差ミスマッチペナルティパラメータの調整;ある一定の腫瘍タイプで共通する特定の突然変異タイプ(例えば黒色腫におけるC→T)に基づいて特定のミスマッチペナルティパラメータを調整すること;またはある一定の試料タイプで共通する特定の突然変異タイプに基づく特定のミスマッチペナルティパラメータ(例えば、FFPEで共通する置換)を調整することによって、カスタマイズされたアライメントアプローチを作成し得る。
ミスアライメントによる評価遺伝子領域における特異性低下(偽陽性率の増加)は、配列決定された試料中の全ての突然変異呼び出しの手動または自動検査によって評価し得る。ミスアライメントのために偽の突然変異呼び出しを起こし易いことが分かった領域に対して上記と同じアライメント修正を行い得る。可能なアルゴリズム修正が見つからない場合、問題領域からの「突然変異」を試験パネルから分類または選別して排除し得る。
本明細書中で開示される方法によって、再編成、例えばインデルが関連するサブゲノム区間の配列決定において、特に、例えば腫瘍試料からの、多数の多様な遺伝子における多数の多様な遺伝的事象の大規模並行配列決定に依存する方法において、性能を最適化するための複数の個別に調整されたアライメント方法またはアルゴリズムの使用が可能になり得る。実施形態において、リードを分析するために、異なる遺伝子における多数の再編成のそれぞれに対して個別にカスタマイズまたは調整される複数のアライメント方法を使用する。実施形態において、調整は、(1つ以上の)配列決定されている遺伝子(または他のサブゲノム区間)の機能、試料中の腫瘍タイプ、配列決定されている変異体または試料もしくは対象の特徴であり得る。配列決定しようとする多数のサブゲノム区間に対して微調整されるアライメント条件のこの選択または使用によって、速度、感度および特異性の最適化が可能になる。本方法は、比較的多数の多様なサブゲノム区間に対するリードのアライメントが最適化される場合に特に有効である。実施形態において、本方法は、再編成に最適化されたアライメント方法および、再編成に関連しないサブゲノム区間に対して最適化された他の方法の使用を含む。
したがって、一実施形態において、本明細書中に記載の方法、例えば腫瘍試料を分析する方法は、本明細書中に記載の再編成のためのアライメント方法を含む。
一般的に、インデル突然変異の正確な検出は、本明細書中では無効である配列決定プラットフォーム上の偽のインデル率が比較的低いので、アライメントにおける演習である(したがって、正しくアライメントされたインデルの僅かな観察でさえ、突然変異の強力な証拠となり得る。)。しかし、インデルの存在下での正確なアライメントは困難であり得る(特にインデル長が長くなる場合)。例えば置換の、アライメントに関連する一般的な問題に加えて、インデル自体がアライメントに問題を引き起こし得る。(例えば、ジヌクレオチド反復の2bpの欠失は、容易かつ断定的に判別し得ない。)。より短い(<15bp)明らかなインデル含有リードの誤った配置によって、感度および特異性の両方が低下し得る。より大きいインデル(個々のリードの長さ−発明者らの工程では36bp−により近付く。)によって、リードを全くアライメントすることができなくなり、標準的な一連のアライメントリードにおいてインデルの検出が不可能になる。
これらの問題に対処し、性能を改善するために、癌突然変異のデータベースを使用し得る。偽陽性インデル発見を減少させるために(特異性改善)、一般的に予想されるインデル周辺の領域を配列状況に起因する問題のあるアライメントについて調べ、上記の置換と同様に扱い得る。インデル検出の感度を向上させるために、癌で予想されるインデルにおける情報を使用するいくつかの異なるアプローチを使用し得る。例えば、予想されるインデルを含有した短いリードを模擬実験し、アライメントを試み得る。アライメントを試験し得、問題のあるインデル領域は、例えば、ギャップオープン/伸長ペナルティを低下させることによって、または部分的なリード(例えば、リードの前半または後半)をアライメントすることによって、アライメントパラメータを調整し得る。
あるいは、正常な参照ゲノムだけでなく、既知または可能性のある癌インデル突然変異のそれぞれを含有するゲノムの代替バージョンでも最初のアライメントを試み得る。このアプローチにおいて、最初にアライメントできなかったかまたはアライメントが不正確であったインデルのリードが、ゲノムの代替(突然変異)バージョンにおいて首尾よく配置される。
このようにして、インデルのアライメント(したがって呼び出し)を、予想される癌遺伝子/部位に対して最適化し得る。本明細書中で使用される場合、配列アライメントアルゴリズムは、リード配列と参照配列との間の類似性を評価することによって、リード配列(例えば次世代配列決定からの、例えば短いリード配列)がゲノム中のどこから由来する可能性が最も高いかを同定するために使用される計算方法またはアプローチを具体化する。配列アライメントの問題に対して、様々なアルゴリズムを適用し得る。いくつかのアルゴリズムは比較的遅いが、比較的高い特異性を可能にする。これらには、例えばダイナミックプログラミングに基づくアルゴリズム(algrithms)が含まれる。ダイナミックプログラミングは、問題をより単純な段階に分解することによって複雑な問題を解決するための方法である。他のアプローチは比較的より効率的であるが、一般的にはあまり完璧なものではない。これらは、例えば、発見的アルゴリズムおよび大規模データベース検索のために設計された確率的方法を含む。
アライメントパラメータは、アルゴリズムの性能を調整するために、例えば、リード配列と参照配列との間で最適な網羅的または局所的アライメントを生成させるために、アライメントアルゴリズムにおいて使用される。アライメントパラメータは、マッチ、ミスマッチおよびインデルに対して重みを与え得る。例えば、重みが低いほど、多くのミスマッチおよびインデルとのアライメントが可能になる。
配列状況、例えば反復配列(例えば、タンデムリピート、散在反復)、低複雑性領域、インデル、偽遺伝子またはパラログの存在は、アライメント特異性に影響を及ぼし得る(例えばミスアライメントを引き起こす)。本明細書で使用される場合、ミスアライメントとは、ゲノム中の不正確な位置での短いリードからの塩基対の配置を指す。
アライメントアルゴリズムが選択される場合、またはアライメントパラメータが腫瘍タイプ、例えば特定の突然変異または突然変異タイプを有する傾向のある腫瘍タイプに基づいて調整される場合、アライメントの感度を向上させ得る。
アライメントアルゴリズムが選択される場合、またはアライメントパラメータが特定の遺伝子タイプ(例えば癌遺伝子、腫瘍抑制遺伝子)に基づいて調整される場合、アライメントの感度を向上させ得る。癌関連遺伝子の異なるタイプにおける突然変異は、癌表現型に対して異なる影響を有し得る。例えば、突然変異癌遺伝子対立遺伝子が一般的に優性である。突然変異体腫瘍抑制対立遺伝子は、一般的に劣性であり、これは、殆どの場合、影響が現れる前に、腫瘍抑制遺伝子の両方の対立遺伝子に波及されなければならないことを意味する。
アライメントアルゴリズムが選択される場合、またはアライメントパラメータが突然変異タイプ(例えば一塩基多型、インデル(挿入または欠失)、逆位、転座、タンデムリピート)に基づいて調整される場合、アライメントの感度を調整し(例えば向上させ)得る。
アライメントアルゴリズムが選択される場合、またはアライメントパラメータが突然変異部位(例えば突然変異ホットスポット)に基づいて調整される場合、アライメントの感度を調整し(例えば向上させ)得る。突然変異ホットスポットは、突然変異が通常の突然変異率よりも100倍頻繁に生じるゲノム中の部位を指す。
アライメントアルゴリズムが選択される場合、またはアライメントパラメータが試料タイプ(例えばFFPE試料)に基づいて調整される場合、アライメントの感度/特異性を調整し(例えば向上させ)得る。
アライメントアルゴリズムは、試料タイプ(例えば、FFPE試料、血液試料または骨髄穿刺試料)に基づいて、アライメント感度/特異性を調整する(例えば増加させる)ように選択し得る。
アライメントの最適化は、例えば、国際公開第2012/092426号パンフレットに記載のように、当技術分野で記載されている。
突然変異呼び出し
塩基呼び出しとは配列決定装置の生の結果を指す。突然変異呼び出しは、配列決定されているヌクレオチド位置についてヌクレオチド値、例えばA、G、TまたはCを選択する工程を指す。典型的には、ある位置に対する配列決定リード(または塩基呼び出し)は、複数の値を提供し、例えば一部のリードはTを与え、一部はGを与える。突然変異呼び出しは、ヌクレオチド値、例えばこれらの値のうち1つを配列に割り当てる工程である。これは「突然変異」呼び出しと呼ばれるが、何らかのヌクレオチド位置、例えば突然変異体対立遺伝子、野生型対立遺伝子、突然変異体または野生型の何れとも特徴付けられていない対立遺伝子に対応する位置に、または可変性を特徴としない位置に、ヌクレオチド値を割り当てるためにこれを適用し得る。突然変異呼び出しのための方法は、次のうち1つ以上を含み得る:参照配列における各位置での情報に基づいて独立呼び出しを生成すること(例えば配列リードを調べること;塩基呼び出しおよび品質スコアを調べること;可能性のある遺伝子型を考慮し、観察される塩基および品質スコアの確率を計算すること;および(例えばベイズ規則を使用して)遺伝子型を割り当てること);偽陽性を除去すること(例えば、リードデプスが予想よりもかなり低いかまたは高いSNPを拒絶するためにデプス閾値を使用すること;小さなインデルに起因する偽陽性を除去するための局所的な再アライメント);および呼び出しを改良するための連鎖不均衡(LD)/インピュテーションに基づく分析を行うこと。
特異的な遺伝子型および位置に関連する遺伝子型尤度を計算するための式は、例えば、Li H.およびDurbin R.Bioinformatics,2010;26(5):589−95に記載されている。ある一定の癌タイプにおける特定の突然変異に対する事前予想は、その癌タイプからの試料を評価する際に使用し得る。このような尤度は、癌突然変異の公開データベース、例えばCatalogue of Somatic Mutation in Cancer(COSMIC),HGMD(Human Gene Mutation Database),The SNP Consortium,Breast Cancer Mutation Data Base(BIC)およびBreast Cancer Gene Database(BCGD)由来であり得る。
LD/インピュテーションに基づく分析の例は、例えば、Browning B.L.およびYu Z.Am.J.Hum.Genet.2009,85(6):847−61に記載されている。低カバレッジSNP呼び出し方法の例は、例えば、Li Y.ら、Annu.Rev.Genomics Hum.Genet.2009,10:387−406に記載されている。
アライメントの後、呼び出し方法、例えば、ベイジアン突然変異呼び出し法を使用して置換の検出を行い得;これはサブゲノム区間のそれぞれ、例えば評価しようとする遺伝子のエクソンにおける各塩基に適用され、代替的対立遺伝子の存在が観察される。この方法は、塩基呼び出しエラーのみの存在下でリードデータを観察する確率と、突然変異の存在下でリードデータを観察する確率を比較する。この比較が突然変異の存在を十分に強く支持する場合、突然変異が呼び出され得る。
癌DNAの分析のための50%または100%の頻度からの限定的な逸脱に対処する方法が開発されている(例えば、SNVMix−Bioinformatics.2010 March 15;26(6):730−736)。しかし、本明細書中で開示される方法によって、試料DNAの1%〜100%の全範囲で、特に50%未満のレベルで突然変異対立遺伝子の存在の可能性を考慮することができるようになる。このアプローチは、天然(多クローン性)腫瘍DNAの低純度FFPE試料における突然変異の検出に特に重要である。
ベイジアン突然変異検出アプローチの利点は、突然変異の存在の確率と、塩基呼び出しエラーのみの確率との比較を、その部位での突然変異の存在の事前予想によって重み付けし得ることである。所与の癌タイプに対する頻繁に突然変異が起こる部位で代替対立遺伝子のいくつかのリードが観察される場合、突然変異の証拠の量が通常の閾値を満たさなくても、突然変異の存在が確信的に呼び出され得る。次いで、より希少な突然変異/より低い純度の試料に対してさえも検出感度を向上させるために、または、リードカバレッジを縮小させるためにその試験をよりロバストなものにするために、この柔軟性を使用し得る。癌で突然変異が起こっているゲノム中の無作為な塩基対の尤度は約1e−6である。典型的な多重遺伝子癌ゲノムパネルにおける多くの部位での特異的な突然変異の尤度は、数桁高いものであり得る。これらの尤度は、癌突然変異の公開データベース(例えばCOSMIC)由来であり得る。インデル呼び出しは、挿入または削除によって参照配列と異なる配列決定データにおいて塩基を探す工程であり、通常、関連する信頼スコアまたは統計学的証拠の計量を含む。
インデル呼び出しの方法は、候補インデルを同定し、局所再アライメントを通じて遺伝子型尤度を計算し、LDに基づく遺伝子型推測および呼び出しを行う段階を含み得る。典型的には、可能性のあるインデル候補を得るために、ベイジアン法を使用し、次にこれらの候補をベイジアンフレームワークにおいて参照配列と一緒に試験する。
候補インデルを生成させるためのアルゴリズムは、例えば、McKenna A.ら、Genome Res.2010;20(9):1297−303;Ye K.ら、Bioinformatics,2009;25(21):2865−71;Lunter G.およびGoodson M.Genome Res.2010,印刷物に先行して電子版で公開;Li H.ら、Bioinformatics 2009,Bioinformatics 25(16):2078−9に記載されている。
インデル呼び出しおよび個々のレベルの遺伝子型尤度を生成させるための方法には、例えば、Dindelアルゴリズム(Albers C.A.ら、Genome Res.2011;21(6):961−73)が含まれる。例えば、リードを分析し、最初のインデル呼び出しを生成させ、各候補インデルに対して遺伝子型尤度を生成させるためにベイジアンEMアルゴリズムを使用し得、続いて、例えばQCALL(Le S.Q.およびDurbin R.Genome Res.2011;21(6):952−60)を用いて遺伝子型のインピュテーションを行う。パラメータ、例えばインデルを観察するという事前予想などは、インデルの大きさまたは場所に基づいて調整し得る(例えば、増加または減少させ得る。)。
突然変異呼び出しの最適化は、例えば、国際公開第2012/092426号パンフレットに記載のように、当技術分野で記載されている。
他の実施形態
本明細書中に記載の方法の実施形態において、本方法における下流の段階またはパラメータを修正するために、本方法における段階またはパラメータを使用する。
一実施形態において、前記の試料からの核酸の単離;ライブラリ構築;ベイトの設計または選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異呼び出し方法の選択;突然変異呼び出しまたは突然変異アノテーションのうち1つ以上または全てにおいて下流の段階またはパラメータを修正するために、腫瘍試料の特徴を使用する。
一実施形態において、前記の試料からの核酸の単離;ライブラリ構築;ベイトの設計または選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異呼び出し方法の選択;突然変異呼び出しまたは突然変異アノテーションのうち1つ以上または全てにおいて下流の段階またはパラメータを変更するために、単離した腫瘍または対照、核酸の特徴を使用する。
一実施形態において、前記の試料からの核酸の再単離;続くライブラリ構築;ベイトの設計または選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異呼び出し方法の選択;突然変異呼び出しまたは突然変異アノテーションのうち1つ以上または全てにおいて下流の段階またはパラメータを修正するために、ライブラリの特徴を使用する。
一実施形態において、前記の試料からの核酸の再単離;続くライブラリ構築;ベイトの設計または選択;ハイブリダイゼーション条件;配列決定;リードマッピング;突然変異呼び出し方法の選択;突然変異呼び出しまたは突然変異アノテーションのうち1つ以上または全てにおいて下流の段階またはパラメータを修正するために、ライブラリ−キャッチの特徴を使用する。
一実施形態において、前記の試料からの核酸の再単離;続くライブラリ構築;ベイトの設計または選択;ハイブリダイゼーション条件の続く決定;続く配列決定;リードマッピング;突然変異呼び出し方法の選択;突然変異呼び出しまたは突然変異アノテーションのうち1つ以上または全てにおいて下流の段階またはパラメータを修正するために、配列決定方法の特徴を使用する。
一実施形態において、前記の試料からの核酸の再単離;続くライブラリ構築;ベイトの設計または選択;ハイブリダイゼーション条件の続く決定;続く配列決定;続くリードマッピング;突然変異呼び出し方法の選択;突然変異呼び出しまたは突然変異アノテーションのうち1つ以上または全てにおいて下流の段階またはパラメータを修正するために、マッピングしたリードの収集物の特徴を使用する。
一実施形態において、本方法は、腫瘍試料の特徴についての値を得ること、例えば、前記の試料中の腫瘍細胞の割合についての、前記の腫瘍試料の細胞性についての;または腫瘍試料の画像からの値を得ることを含む。
実施形態において、本方法は、腫瘍試料の特徴に対する前記の得られた値に応答して、腫瘍試料からの核酸の単離、ライブラリ構築;ベイト設計または選択;ベイト/ライブラリメンバーハイブリダイゼーション;配列決定;または突然変異呼び出しに対してパラメータを選択することを含む。
一実施形態において、方法は、前記の腫瘍試料中に存在する腫瘍組織の量についての値を得て、前記の得られた値を参照基準と比較し、前記の参照基準が満たされる場合に、前記の腫瘍試料を許容し、例えば前記の腫瘍試料が30、40または50%を超える腫瘍細胞を含有する場合に前記の腫瘍試料を許容することをさらに含む。
一実施形態において、方法は、例えば、前記の腫瘍試料からの、参照基準に合わない腫瘍試料からの腫瘍組織をマクロダイセクションすることによって、腫瘍細胞に対して濃縮されたサブ試料を得ることをさらに含む。
一実施形態において、方法は、一次対照、例えば血液試料が利用可能であるか否かを判定し、もしそうであれば、前記の一次対照から対照核酸(例えばDNA)を単離することをさらに含む。
一実施形態において、方法は、前記の腫瘍試料中にNATが存在するか否かを判定すること(例えば利用可能な一次対照試料がない場合)をさらに含む。
一実施形態において、方法は、例えば、一次対照がない腫瘍試料中の前記のNATからの非腫瘍組織をマクロダイセクションすることによって、非腫瘍細胞に対して濃縮されたサブ試料を得ることをさらに含む。
一実施形態において、方法は、利用可能な一次対照およびNATがないことを判定し、合致する対照なしで分析について前記の腫瘍試料をマーキングすることをさらに含む。
一実施形態において、方法は、単離腫瘍核酸試料を提供するために前記の腫瘍試料から核酸を単離することをさらに含む。
一実施形態において、方法は、単離対照核酸試料を提供するために対照から核酸を単離することをさらに含む。
一実施形態において、方法は、検出可能な核酸がない試料を拒絶することをさらに含む。
一実施形態において、方法は、前記の単離核酸試料中での核酸収率についての値を得て、得られた値を参照基準と比較することをさらに含み、例えば、前記の得られた値が前記の参照基準未満である場合、ライブラリ構築前に前記の単離核酸試料を増幅することを含む。
一実施形態において、方法は、前記の単離核酸試料中の核酸断片の大きさについての値を得ることおよび得られた値を参照基準、例えば少なくとも300、600または900bpの大きさ、例えば平均の大きさと比較することをさらに含む。この決定に反応して、本明細書中に記載のパラメータを調整または選択し得る。
一実施形態において、方法は、ライブラリを得ることをさらに含み、ここで前記の核酸断片の大きさは、参照値未満であるかまたはこれと等しく、前記のライブラリは、DNA単離とライブラリ作製との間の断片化段階なく作製される。
一実施形態において、方法は、核酸断片を得ることをさらに含み、前記の核酸断片の大きさが参照値と等しいかまたはこれより大きい場合、それを断片化して、次いでライブラリにする。
一実施形態において、方法は、例えば複数のメンバーのそれぞれに識別可能な別個の核酸配列(バーコード)を付加することによって、複数のライブラリメンバーのそれぞれに標識することをさらに含む。
一実施形態において、方法は、複数のライブラリメンバーのそれぞれにプライマーを付着させることをさらに含む。
一実施形態において、方法は、複数のベイトを提供することおよび複数のベイトを選択することをさらに含み、前記の選択は、次のものに反応するものである:1)患者の特徴、例えば年齢、腫瘍のステージ、以前の処置または耐性;2)腫瘍タイプ;3)腫瘍試料の特徴;4)対照試料の特徴;5)対照の存在またはタイプ;6)単離腫瘍(または対照)核酸試料の特徴;7)ライブラリの特徴;8)腫瘍試料中の腫瘍のタイプと関連することが知られる突然変異;9)腫瘍試料中の腫瘍のタイプと関連することが知られていない突然変異;10)予め選択された配列の配列を決定する(またはそれとハイブリッド形成するかまたはそれを回収する)または予め選択された突然変異、例えば高gc領域または再編成がある配列と関連する難しさを同定する能力、;または11)配列決定されている遺伝子。
一実施形態において、方法は、例えば前記の腫瘍試料中の少数の腫瘍細胞の判定に対応して、ベイトまたは複数のベイトを選択し、第2の遺伝子のメンバーと比較した場合、第1の遺伝子からのメンバーの捕捉を比較的高く効率的にすることをさらに含み、例えば第1の遺伝子における突然変異は腫瘍試料の腫瘍タイプに対する腫瘍表現型と関連する。
一実施形態において、方法は、ライブラリ−キャッチの特徴についての値、例えば核酸濃度または表示を得ることおよび得られた値を核酸濃度に対するかまたは表示に対する参照基準と比較することをさらに含む。
一実施形態において、方法は、手直しに対する参照基準を満たさないライブラリの特徴についての値を有するライブラリを選択することをさらに含む。
一実施形態において、方法は、ライブラリ定量化に対する参照基準を満たすライブラリの特徴についての値を有するライブラリを選択することをさらに含む。
一実施形態において、方法は、対象に対する腫瘍タイプ、遺伝子および遺伝子変化(TGA)の関連付けを提供することをさらに含む。
一実施形態において、方法は、複数の要素を有する予め選択されたデータベースを提供することをさらに含み、各要素はTGAを含む。
一実施形態において、方法は、
予め選択されたデータベース、例えば検証されたTGAのデータベースにおいて前記のTGAが存在するか否かを判定し;
前記の対象からの前記TGA(アノテーションすること)と予め選択されたデータベースからのTGAに対する情報を結合させ;
前記の予め選択されたデータベースにおいて前記の対象に対する第2または次のTGAが存在するか否かを判定してもよく、そうである場合、予め選択されたデータベースからの第2または次のTGAに対する情報を前記の患者に存在する前記の第2のTGAと関連させること
を含む、対象のTGAの特徴を調べることをさらに含む。
一実施形態において、方法は、レポートを作成するために対象のTGAの有無、および場合によっては関連するアノテーションを提出(memorializing)することをさらに含む。
一実施形態において、方法は、受領者側に前記のレポートを送付することをさらに含む。
一実施形態において、方法は、
予め選択されたデータベース、例えば検証されたTGAのデータベースにおいて前記のTGAが存在するか否かを判定し;
前記の予め選択されたデータベースにないTGAが既知の臨床的に関連するGまたはAを有することを判定し、そうである場合、前記の予め選択されたデータベースにおいて前記のTGAに対するエントリーを提供する
ことを含む、対象のTGAの特徴を調べることをさらに含む。
一実施形態において、方法は、レポートを作成するために対象からの腫瘍試料のDNAで見られる突然変異の有無を提出(memorializing)することをさらに含む。
一実施形態において、方法は、レポートを作成するために対象のTGAの有無、および場合によっては関連するアノテーションを提出(memorializing)することをさらに含む。
一実施形態において、方法は、受領者側に前記のレポートを送付することをさらに含む。
本開示はまた、次の付番された段落の何れかも含む:
1.対象における、対象区間、例えばサブゲノム区間または発現サブゲノム区間(またはそれを含有する細胞)のクローンプロファイルを評価または提供する方法であって、
(a)各メンバーが前記対象からの核酸を含む複数のメンバー、例えば固形腫瘍または血液悪性腫瘍(または前悪性腫瘍)試料からの複数の腫瘍メンバー、を含む核酸ライブラリを得て;
(b)それぞれが前記対象区間を含む複数の選択メンバーまたはその一部(本明細書ではライブラリキャッチと呼ばれることがある。)を提供するために、前記ライブラリをベイトセットと接触させ;
(c)例えば、前記対象区間の増幅配列を提供するために、前記複数の選択メンバーの各メンバーを増幅してもよく;
(d)前記対象区間の1回以上の出現の配列を得て;それによって前記対象区間のクローンプロファイルを提供または評価すること
を含む方法。
2.段階(a)が前記対象からの核酸を断片化する、例えばせん断することを含む、段落1の方法。
3.段階(b)が、溶液ハイブリダイゼーションの条件下で前記ライブラリを前記ベイトセットと接触させることを含む、段落1または2の方法。
4.段階(b)が、表面ベースのハイブリダイゼーションの条件下で前記ライブラリを前記ベイトセットと接触させることを含む、段落1または2の方法。
5.段階(b)が、表面上の前記ベイトセット、例えば複数のベイトを含む基材上に配置されたベイトセットと前記ライブラリを接触させる段階を含む、段落4の方法。
6.段階(c)が、前記メンバー中の標的/対象核酸との配列特異的相互作用に依存するかまたはそれを含む方法によって、例えば、前記メンバー中の標的/対象核酸に結合するプライマーを用いて、前記複数の選択メンバーの各メンバーを増幅することによって、前記複数の選択メンバーの各メンバーを増幅することを含む、段落1〜5の何れかの方法。
7.段階(c)が、プライマー対を用いて前記複数の選択メンバーの各メンバーを増幅し、前記メンバー中の標的/対象核酸に前記プライマー対の少なくとも1つのメンバーが結合しない、段落1〜5の何れかの方法。
8.段階(c)が、前記メンバー中の標的/対象核酸との配列特異的相互作用に依存しないか、またはそれを含まない方法によって前記複数の選択メンバーの各メンバーを増幅すること含む、段落1〜5の何れかの方法。
9.段階(c)が、前記メンバー中の標的/対象核酸に結合しないプライマー対を用いて前記複数の選択メンバーの各メンバーを増幅することによって、前記複数の選択メンバーの各メンバーを増幅することを含む、段落1〜5の何れかの方法。
10.前記対象区間がサブゲノム区間を含む、段落1〜9の何れかの方法。
11.前記対象区間が発現サブゲノム区間を含む、段落1〜9の何れかの方法。
12.サブゲノム区間および発現サブゲノム区間のクローンプロファイルを評価することを含む、段落1〜11の何れかの方法。
13.前記対象区間での第1の対立遺伝子またはシグネチャー(例えば第1のVセグメント)の配列を比較値、例えば予め選択された値、例えば第2の対立遺伝子またはシグネチャー(例えば第2のVセグメント)の配列の関数である値と比較することを含む、段落1〜12の何れかの方法。
14.(e)(i)対象区間での配列、シグネチャーまたは対立遺伝子の分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)、存在量または同一性、例えば配列、シグネチャーもしくは対立遺伝子の相対的存在量、または対象区間での複数の配列、シグネチャーもしくは対立遺伝子のそれぞれの相対的存在量についての値;または
(ii)可変性、例えば、体細胞高頻度変異から生じる配列可変性、例えば連結部でのインデルの形成による、VD、DJ、またはVJ連結、またはCDR、例えば重鎖CDR3から生じる配列可変性、シグネチャーまたは対象区間内の配列可変性についての値であって、例えば、可変性についての値が、対象または試料中の対象区間について存在する異なる変異体の数の関数である値
を得ることをさらに含む、段落1〜13の何れかの方法。
15.(i)が、前記対象区間での第1の配列、対立遺伝子またはシグネチャーの存在量に対する、前記対象区間での第1の配列、対立遺伝子またはシグネチャーの相対的存在量についての値を得ることを含む、段落14の方法。
16.(i)が、第2の対象区間での第2の配列、対立遺伝子またはシグネチャーの存在量に対する、前記対象区間での第1の配列、対立遺伝子またはシグネチャーの相対的存在量についての値を得ることを含む、段落14の方法。
17.(i)が、発現サブゲノム区間での、配列、対立遺伝子またはシグネチャー、例えば再編成、例えば転座の出現またはレベルについての値を得ることを含む、段落14の方法。
18.対応するサブゲノム区間で、配列、対立遺伝子またはシグネチャー、例えば再編成、例えば転座の出現またはレベル、についての値を得ることをさらに含む、段落17の方法。
19.(ii)が、対象区間で生じる異なる配列、対立遺伝子またはシグネチャーの数についての値を得ることを含む、段落14の方法。
20.(e)(i)を得ることを含む、段落14の方法。
21.シグネチャーに対して(e)(i)を得ることを含む、段落14の方法。
22.対立遺伝子に対して(e)(i)を得ることを含む、段落14の方法。
23.(e)(ii)を得ることを含む、段落14の方法。
24.第1の対象区間での、配列、対立遺伝子またはシグネチャー、例えばVセグメント、またはVDJもしくはVJ再編成のクローンプロファイル;および
i)前記対象の表現型、例えば疾患状態;または
ii)第2の対象区間での遺伝子型、例えば表1〜4もしくは表5A〜9またはMHC遺伝子、例えばMHCクラスIまたはMHCクラスII遺伝子から選択される遺伝子の遺伝子型
を提供することを含む、段落1〜23の何れかの方法。
25.前記表現型が、
感染因子、例えば、細菌、ウイルス、原生動物または真菌による感染;
疾患のステージ;
障害、例えば癌の遺伝子型の変化;
障害の発現における変化、例えば癌の場合、処置に対する攻撃性もしくは耐性における変化、例えば癌の場合、転移の発現;
処置発現(treatment develops)への反応性;
疾患または障害の進行、再燃、再発または持続;
疾患に関連する薬剤への事前の曝露;
抗原またはワクチンへの事前の曝露もしくは反応;
対象からのプロテオミクスデータ;
年齢;
性別;
体重;
病歴、例えば、疾患の既往歴もしくは以前の処置;または
環境的もしくは職業的要因
を含む、段落24の方法。
26.前記第2の対象区間での遺伝子型が、例えば表1〜4または表5A〜9からの遺伝子における、体細胞突然変異、例えば再編成、例えば転座を含む、段落24の方法。
27.段階(d)が:
(i)前記対象区間の複数の出現のそれぞれの配列を得て、例えば、Vセグメントを含む対象区間の第1の出現および前記Vセグメントを含む区間の第2の出現の配列を得ることを含み、前記第1および第2の出現が、VD、DJまたはVJ連結部での多様性によって異なるか;または
(ii)前記対象区間および第2の異なる対象区間の配列を得ることを含み、例えば前記第1の対象区間が第1の遺伝子からの配列を含み、前記第2の対象区間が第2の遺伝子からの配列を含む、
段落1〜26の何れかの方法。
28.段階(d)が、前記対象区間の複数の出現、例えば、VDJ配列を含む対象区間の複数の出現、例えば、特定のVセグメント、特定のDセグメントおよび特定のJセグメントを含むVDJ配列を含む対象区間の複数の出現、のそれぞれの配列を得ることを含む、段落1〜27の何れかの方法。
29.対象区間の複数の出現の第1の出現がサブゲノム区間を含む、段落27または28の方法。
30.前記対象区間の複数の出現の第2の出現がサブゲノム区間を含む、段落29の方法。
31.前記対象区間の複数の出現の第1の出現が発現サブゲノム区間を含む、段落27または28の方法。
32.前記対象区間の複数の出現の第2の出現が発現サブゲノム区間を含む、段落31の方法。
33.前記対象区間の複数の出現の第1の出現が、サブゲノム区間、例えば再編成、例えば転座を含み;
前記対象区間の複数の出現の第2の出現が、発現サブゲノム区間、例えばそのサブゲノム区間に対応する発現サブゲノム区間を含み、これが例えば、ゲノム、例えば体細胞ゲノムの再編成の発現の評価を可能にし、例えばゲノム再編成およびその発現の相対的存在量の評価を可能にする、段落27または28の方法。
34.サブゲノム区間に存在するシグネチャーの発現の出現またはレベルを評価することを含む、段落33の方法。
35.段階(d)が、第1の対象区間および第2の異なる対象区間の配列を得ることを含み、例えば、前記第1および第2の区間が、前記対象区間からの異なるゲノム配列、例えば第1の遺伝子からの配列および第2の遺伝子からの配列に対応する、段落1〜34の何れかの方法。
36.前記第1の対象区間がVDJセグメントの第1の組み合わせを含み、前記第2の対象区間がVDJセグメントの第2の組み合わせを含み、例えば前記第1の対象区間が第1のVセグメントを含み、前記の第2の対象区間が第2のVセグメントを含む、段落35の方法。
37.前記の第1の対象区間が第1のサブゲノム区間を含み、前記の第2の対象区間が第2のサブゲノム区間を含む、段落35の方法。
38.前記第1の対象区間が第1の発現サブゲノム区間を含み、前記第2の対象区間が第2の発現サブゲノム区間を含む、段落35の方法。
39.前記第1の対象区間がサブゲノム区間を含み、前記第2の対象区間が発現サブゲノム区間を含む、段落35の方法。
40.評価することが、癌のクローンに対するクローンプロファイルを提供することを含む、段落1〜39の何れかの方法。
41.評価することが、癌の第2のクローンに対するクローンプロファイルを提供することを含む、段落40の方法。
42.評価することが、例えば参照物に対する、例えば癌の前記第2のクローンの存在量に対する、前記癌の第1クローンの存在量についての値を提供することを含む、段落41の方法。
43.遺伝子型を含む癌の第1のクローンおよび第2の遺伝子型を含む第2のクローンの相対的存在量を提供することを含む、段落42の方法。
44.第1の突然変異、例えば再編成を含む癌の第1のクローンおよび前記の突然変異を含まない第2のクローンの相対的存在量を提供することを含む、段落42の方法。
45.第1の突然変異、例えば再編成、例えば転座を含む癌の第1のクローンおよび第2の突然変異、例えば再編成、例えば転座を含む第2のクローンの相対的存在量を提供することを含む、段落42の方法。
46.評価することが、第1のVセグメントに対するクローンプロファイルを提供することを含む、段落1〜45の何れかの方法。
47.評価することが、第2のVセグメントに対するクローンプロファイルを提供することを含む、段落46の方法。
48.評価することが、第1のVセグメントおよび第2のVセグメントの相対的存在量についての値を提供することを含む、段落46の方法。
49.評価することが、第1のDセグメントに対するクローンプロファイルを提供することを含む、段落1〜48の何れかの方法。
50.評価することが、第2のDセグメントに対するクローンプロファイルを提供することを含む、段落49の方法。
51.評価することが、第1のDセグメントおよび第2のDセグメントの相対的存在量についての値を提供することを含む、段落49の方法。
52.評価することが、第1のJセグメントに対するクローンプロファイルを提供することを含む、段落1〜51の何れかの方法。
53.評価することが、第2のJセグメントに対するクローンプロファイルを提供することを含む、段落52の方法。
54.評価することが、第1のJセグメントおよび第2のJセグメントの相対的存在量についての値を提供することを含む、段落52の方法。
55.評価することが、第1のVDJまたはVJの組み合わせに対するクローンプロファイルを提供することを含む、段落1〜54の何れかの方法。
56.評価することが、第2のVDJまたはVJの組み合わせに対するクローンプロファイルを提供することを含む、段落55の方法。
57.評価することが、第1のVDJまたはVJの組み合わせおよび第2のVDJまたはVJの組み合わせの相対的存在量についての値を提供することを含む、段落55の方法。
58.評価することが、抗体軽鎖に対するクローンプロファイルを提供することを含む、段落1〜57の何れかの方法。
59.評価することが、抗体重鎖に対するクローンプロファイルを提供することを含む、段落58の方法。
60.評価することが、抗体軽鎖および抗体重鎖の相対的存在量についての値を提供することを含む、段落58の方法。
61.評価することが、サブゲノム区間における配列、対立遺伝子またはシグネチャーに対するクローンプロファイルを提供することを含む、段落1〜60の何れかの方法。
62.評価することが、発現サブゲノム区間における配列、対立遺伝子またはシグネチャーに対するクローンプロファイルを提供することを含む、段落61の方法。
63.評価することが、サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての、および発現サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての、相対的存在量に対する値を提供することを含む、段落61の方法。
64.評価することが、対象区間中の遺伝子座、例えばV、DまたはJセグメントにおける高頻度変異に対する可変性を提供することを含む、段落1〜63の何れかの方法。
65.評価することが、例えば対象区間でVD、DJまたはVJ連結部にインデルを形成することによって、VD、DJまたはVJ連結部から生じる可変性を提供することを含む、段落1〜64の何れかの方法。
66.評価することが、サブゲノム区間中のCDR、例えば重鎖CDR3における可変性を提供することを含む、段落1〜65の何れかの方法。
67.評価することが、表10からの配列(または前記配列を含む細胞)に対するクローンプロファイルを提供することを含む、段落1〜66の何れかの方法。
68.(e)(i)についての値を得ることを含む、段落14の方法。
69.前記(e)(i)の値が、比較値、例えば予め選択された値、例えば第2の配列、シグネチャーまたは対立遺伝子(例えば第2のVセグメント)の存在量の関数である値に対する、対象区間における配列、シグネチャーまたは対立遺伝子(例えば第1のVセグメント)の存在量についての値を含む、段落68の方法。
70.前記(e)(i)の値が、比較値、例えば予め選択された値、例えば事象を欠く配列、例えばある対象区間中の非突然変異または非再編成配列の存在量の関数である値に対する、前記対象区間における事象、例えば配列、対立遺伝子またはシグネチャー、例えば突然変異または再編成の存在量についての値を含む、段落68の方法。
71.前記(e)(i)の値が、対象区間でX個の固有の(すなわち互いに異なる)配列、シグネチャーまたは対立遺伝子のそれぞれについての相対的存在量の値を含む、段落68の方法。
72.Xが、3、4、5、6、7、8、9、10、20、30、40、50、100または200以上である、段落71の方法。
73.Xが1,000、10,000、100,000、1,000,000、10,000,000または50,000,000以上である、段落72の方法。
74.例えば、存在量の関数、例えば相対的存在量として、例えばヒストグラムとして、(e)(i)の値を表示することをさらに含む、段落68〜73の何れかの方法。
75.前記対象区間が、Igスーパーファミリー受容体、例えばT細胞受容体またはB細胞受容体からの配列を含む、段落68〜74の何れかの方法。
76.前記対象区間が、Vセグメント、DセグメントまたはJセグメントからの配列を含む、段落68〜75の何れかの方法。
77.前記対象区間が表10からの配列を含む、段落68〜76の何れかの方法。
78.Vセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜77の何れかの方法。
79.複数のVセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜78の何れかの方法。
80.Jセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜79の何れかの方法。
81.複数のJセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜80の何れかの方法。
82.Dセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜81の何れかの方法。
83.複数のDセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜82の何れかの方法。
84.クラススイッチ領域配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜83の何れかの方法。
85.複数のクラススイッチ領域配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、段落68〜84の何れかの方法。
86.(e)(ii)についての値を得ることを含む、段落14の方法。
87.体細胞高頻度変異からの可変性についての値を得ることを含む、段落86の方法。
88.例えば、VD、DJまたはVJ連結部でのインデルの形成によってVD、DJまたはVJ連結部から生じる可変性についての値を得ることを含む、段落86または87の方法。
89.CDRの、例えば重鎖CDR3の、可変性から生じる可変性についての値を得ることを含む、段落86〜88の何れかの方法。
90.前記対象区間が表10からの配列を含む、段落86〜89の何れかの方法。
91.前記対象区間の複数の固有のコピー、例えば、前記対象区間での複数の固有のシグネチャー、の配列を得ることを含む、段落86〜90の何れかの方法。
92.前記(e)(ii)における値が、前記対象区間に対する複数の、例えばX個のシグネチャーにおける配列多様性についての値を含む、段落86〜91の何れかの方法。
93.前記値が、前記対象区間における固有のシグネチャーの数を含む、段落86〜92の何れかの方法。
94.前記値が、前記対象区間における固有のシグネチャーの表示、記録または一覧を含む、段落86〜93の何れかの方法。
95.前記値が、例えば、前記対象区間の全コピーの関数としての固有のコピーの数の尺度を含む、段落86〜94の何れかの方法。
96.Xが、3、4、5、6、7、8、9、10、20、30、40、50、100、200、300、400または500以上である、段落92〜95の何れかの方法。
97.Xが、1,000、10,000、100,000、1,000,000、10,000,000または50,000,000以上である、段落92〜96の何れかの方法。
98.前記複数のシグネチャーが全て、単一のVDJまたはVJの組み合わせに対するものであり、例えば、選択されたVDJまたはVJの組み合わせにおける配列多様性についての値を提供する、段落86〜97の何れかの方法。
99.前記可変性が、セグメント連結、例えば、VD、DJまたはVJ連結部における多様性、例えば前記連結部における挿入または欠損からの可変性を含む、段落86〜98の何れかの方法。
100.前記可変性が、体細胞高頻度変異からの可変性を含む、段落86〜99の何れかの方法。
101.前記複数のシグネチャーのそれぞれが、異なるVDJまたはVJの組み合わせに対するものである、段落86〜100の何れかの方法。
102.前記可変性が、セグメント連結、例えば、VD、DJまたはVJ連結部における多様性、例えば前記連結部における挿入または欠損からの可変性を含む、段落86〜101の何れかの方法。
103.前記ライブラリが、B細胞、例えば、B細胞悪性腫瘍を含む対象、例えばマントル細胞癌を含む対象、から作製される、段落86〜102の何れかの方法。
104.前記対象区間が、B細胞受容体からの、V、DもしくはJセグメントまたはVDもしくはDJ連結部をコードする配列を含む、段落86〜103の何れかの方法。
105.可変性、例えば体細胞高頻度変異、の量を比較値と比較することをさらに含み、前記比較値との予め選択された関係、例えば前記比較値より大きいことが、疾患の、転帰、予後またはステージを示す、段落86〜104の何れかの方法。
106.(e)(i)および(e)(ii)を得ることを含む、段落14〜105の何れかの方法。
107.前記ライブラリを単一のベイトセットと接触させることを含む、段落1〜106の何れかの方法。
108.前記ライブラリを複数のベイトセットと接触させることを含む、段落1〜106の何れかの方法。
109.前記対象区間での配列;
前記対象区間でのシグネチャー;または
前記対象区間での対立遺伝子
を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと、前記ライブラリを接触させることを含む、段落1〜108の何れかの方法。
110.前記対象区間での第2の配列;
前記対象区間での第2のシグネチャー;または
前記対象区間での第2の対立遺伝子
を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する、第2のベイトセットと前記ライブラリを接触させることを含む、段落1〜109の方法。
111.複数の、例えば少なくともX個の固有のベイトセットと接触させる段階を含み、前記複数のベイトセットのそれぞれが、
前記対象区間からの異なる配列;
前記対象区間での異なるシグネチャー;または
前記対象区間での異なる対立遺伝子
を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成し、
Xが、2、3、4、5、6、7、8、9、10、50、100または200と同等である、
段落1〜106の何れかの方法。
112.前記対象区間での第1の配列および第2の配列;
前記対象区間での第1のシグネチャーおよび第2のシグネチャー;または
前記対象区間での第1の対立遺伝子および第2の対立遺伝子
を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含む、段落1〜111の何れかの方法。
113.前記対象区間からの少なくともX個の配列;
前記対象区間での少なくともX個のシグネチャー;または
前記対象区間での少なくともX個の対立遺伝子
を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含み、
Xが、独立に、2、3、4、5、6、7、8、9、10、50、100または200と同等である、
段落1〜112の何れかの方法。
114.前記対象もしくは試料中において対象区間で存在しない、第1の配列、対立遺伝子またはシグネチャーを、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含む、段落1〜113の何れかの方法。
115.前記対象区間が表10からの配列を含む、段落1〜114の何れかの方法。
116.第1のV、DまたはJセグメントからの配列および第2のV、DまたはJセグメントからの配列を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成するベイトセットと接触させることを含む、段落1〜115の何れかの方法。
117.前記対象区間が、V、DまたはJセグメントの配列を含む、段落1〜116の何れかの方法。
118.Vセグメント(DまたはJセグメントではない。)を捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットと前記ライブラリを接触させることを含む、段落1〜117の何れかの方法。
119.Dセグメント(VまたはJセグメントではない。)を捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットと前記ライブラリを接触させることを含む、段落1〜117の何れかの方法。
120.Jセグメント(VまたはDセグメントではない。)を捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットと前記ライブラリを接触させることを含む、段落1〜117の何れかの方法。
121.Vセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットと前記ライブラリを接触させることを含む、段落1〜117の何れかの方法。
122.Dセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットと前記ライブラリを接触させることを含む、段落1〜117または121の何れかの方法。
123.Jセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成するベイトセットと前記ライブラリを接触させることを含む、段落1〜117、121または122の何れかの方法。
124.VD、DJまたはVJ連結部にまたがる(1つまたは複数の)ベイトを含むベイトセットと前記ライブラリを接触させることを含む、段落1〜117または121〜123の何れかの方法。
125.再編成されたVDJまたはVJ配列にまたがる(1つまたは複数の)ベイトを含むベイトセットと前記ライブラリを接触させることを含む、段落1〜117または121〜124の何れかの方法。
126.核酸類似体、例えばロックド核酸(LNA)、ペプチド核酸(PNA)または二環式核酸(BNA)を含む(1つまたは複数の)ベイトを含むベイトセットと前記ライブラリを接触させることを含む、段落1〜125の何れかの方法。
127.機能的であるために十分に長いが、親和性最適化に十分短い(1つまたは複数の)ベイトを含むベイトセットと前記ライブラリを接触させることを含む、段落1〜126の何れかの方法。
128.前記対象区間がサブゲノム区間を含む、段落1〜127の何れかの方法。
129.前記対象区間が発現サブゲノム区間を含む、段落1〜127の何れかの方法。
130.サブゲノム区間の配列を得ることおよび発現サブゲノム区間の配列を得ることを含む、段落1〜127の何れかの方法。
131.サブゲノム区間のクローンプロファイルを評価することを含む、段落1〜130の何れかの方法。
132.発現サブゲノム区間のクローンプロファイルを評価することを含む、段落1〜130の何れかの方法。
133.サブゲノム区間のクローンプロファイルを評価することおよび発現サブゲノム区間のクローンプロファイルを評価することを含む、段落1〜130の何れかの方法。
134.サブゲノム区間に存在するシグネチャーの発現の出現またはレベルを評価することを含み、例えば、前記シグネチャー、例えば再編成、例えば転座が、対応するサブゲノム区間に存在する、段落1〜133の何れかの方法。
135.サブゲノム区間に存在するシグネチャーの発現の出現またはレベルを評価することを含み、例えば、前記シグネチャー、例えば再編成、例えば転座が、対応するサブゲノム区間における存在量の関数である、段落1〜134の何れかの方法。
136.評価することが、サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての、および発現サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての相対的存在量に対する値を提供することを含む、段落1〜135の何れかの方法。
137.前記対象区間の複数の出現のそれぞれの配列を得ることを含み;
段階(a)、(b)および(c)のうちの1つが、前記対象区間の第1の出現に対して、および前記対象区間の第2の出現に対して個別に行われ、例えば段階(a)、(b)および(c)のうち1つが、前記第1の出現に対して第1の反応混合物中で、および前記第2の出現に対して第2の反応混合物中で行われる、段落1〜136の何れかの方法。
138.(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または(a)、(b)および(c)が個別に行われる、段落137の方法。
139.前記対象区間の複数の固有のコピーの第1のコピーがサブゲノム区間を含む、段落137または138の方法。
140.前記対象区間の複数の固有のコピーの第2のコピーが、サブゲノム区間、例えば前記サブゲノム区間に対応する発現サブゲノム区間を含む、段落137〜139の何れかの方法。
141.前記複数のうち第1の出現がサブゲノム区間を含み、例えば前記サブゲノム区間が、VDJ配列、例えば、特定のVセグメント、特定のDセグメントおよび特定のJセグメントを含むVDJ配列を含み;
前記複数のうち第2の出現が発現サブゲノム区間を含み、例えば前記発現サブゲノム区間が、VDJ配列、例えば特定のVセグメント、特定のDセグメントおよび特定のJセグメントを含むVDJ配列を含む、段落137〜140の何れかの方法。
142.前記対象区間の第1の出現が、発現サブゲノム区間を含む、段落141の方法。
143.前記対象区間の第2の出現が、発現サブゲノム区間を含む、段落141または142の方法。
144.前記対象区間の複数の出現のそれぞれの配列を得ることを含み;
段階(a)、(b)および(c)のうちの少なくとも1つが、前記対象区間の第1の出現に対して、および対象区間の第2の出現に対して同じ反応混合物中で行われる、段落1〜136の何れかの方法。
145.(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが同じ反応混合物中で行われる、段落144の方法。
146.段階(b)において、前記対象区間の複数の出現の第1のコピーを第1のベイトセットと接触させ、
段階(b)において、前記対象区間の複数の出現の第2のコピーを第2のベイトセット、例えば、前記第1のベイトセット中の何れのベイトとも異なる配列を含むベイトを含む第2のベイトセットと接触させる、
段落137〜145の何れかの方法。
147.段階(b)において、前記対象区間の複数の固有のコピーの第1のコピーをベイトセットと接触させ;
段階(b)において、前記対象区間の複数の固有のコピーの第2のコピーを同じベイトセットと接触させ、例えば両方のベイトセットが同じ(1つまたは複数の)ベイトを含む、
段落137〜145の何れかの方法。
148.第1の対象区間および第2の異なる対象区間(異なるとは、異なる染色体位置から、を意味する。)の配列を得ることを含み、
(1つまたは複数の)段階(a)、(b)および(c)のうち1つが、前記第1の対象区間に対して第1の反応混合物、および前記第2の対象区間に対して第2の反応混合物中で行われる、
段落1〜147の何れかの方法。
149.(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが個別に行われる、段落148の方法。
150.前記第1の対象区間がサブゲノム区間を含む、段落148または149の方法。
151.前記第2の異なる対象区間がサブゲノム区間を含む、段落150の方法。
152.前記第1の対象区間が発現サブゲノム区間を含む、段落148または149の方法。
153.前記第2の異なる対象区間が発現サブゲノム区間を含む、段落152の方法。
154.前記第1の対象区間がサブゲノム区間を含み、前記第2の異なる対象区間が発現サブゲノム区間を含む、段落148または149の方法。
155.前記対象区間および第2の異なる対象区間(異なるとは、異なる染色体位置から、を意味する。)の配列を得ることを含み、
段階(a)、(b)および(c)のうち少なくとも1つが、前記第1の対象区間に対しておよび第2の対象区間に対して同じ反応混合物中で行われる、段落1〜154の何れかの方法。
156.(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが同じ反応混合物中で行われる、段落155の方法。
157.段階(b)において、第1の対象区間を第1のベイトセットと接触させ;
段階(b)において、第2の対象区間を第2のベイトセット、例えば、前記第1のベイトセット中の何れのベイトとも異なる配列を含むベイトを含む第2のベイトセットと接触させる、段落155または156の方法。
158.段階(b)において、第1の対象区間をベイトセットと接触させ;
段階(b)において、第2の対象区間を同じベイトセットと接触させ、例えば両方のベイトセットが(1つまたは複数の)同じベイトを含む、
段落155または156の方法。
159.段階(a)〜(d)を反復することを含む、段落1〜158の何れかの方法。
160.予め選択された期間の経過;
障害、例えば癌の遺伝子型における変化;
障害の発現における変化、例えば癌の場合、処置に対する攻撃性または耐性の変化、例えば癌の場合、転移の発現;
処置発現への反応性欠如;
疾患もしくは障害の進行、再燃、再発または持続性
の後に、段階(a)〜(d)を反復することを含む、段落159の方法。
161.前記ライブラリが染色体DNAから作製される、段落1〜160の何れかの方法。
162.前記ライブラリがRNA、例えばmRNAから作製される、段落1〜160の何れかの方法。
163.(a)染色体DNAから作製されたライブラリからのサブゲノム区間のクローンプロファイルを評価すること;
(b)RNA、例えばmRNAから作製されたライブラリからの発現サブゲノム区間のクローンプロファイルを評価すること;および
例えば対象区間の選択された配列、対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む、段落1〜162の何れかの方法。
164.段階(a)およびまたは(b)が、
(i)前記対象区間での対立遺伝子の分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)存在量または同一性、例えば、相対的存在量、対立遺伝子または前記対象区間での複数の対立遺伝子のそれぞれの相対的存在量についての値;または
(ii)前記対象区間でのシグネチャーの分布、発現(サブゲノムシグネチャーの転写コピーの出現またはレベル)存在量または同一性、例えば、相対的存在量、シグネチャー、または前記対象区間での複数のシグネチャーのそれぞれの相対的存在量についての値;または
(iii)シグネチャーまたは対象区間内の可変性、例えば体細胞高頻度変異についての値
を得ることを含む、
段落163の方法。
165.段階(a)が(i)を含み、段階(b)が(i)を含む;
段階(a)が(i)を含み、段階(b)が(ii)を含む;
段階(a)が(i)を含み、段階(b)が(iii)を含む;
段階(a)が(ii)を含み、段階(b)が(i)を含む;
段階(a)が(ii)を含み、段階(b)が(ii)を含む;
段階(a)が(ii)を含み、段階(b)が(iii)を含む;
段階(a)が(iii)を含み、段階(b)が(i)を含む;
段階(a)が(iii)を含み、段階(b)が(ii)を含む;または
段階(a)が(iii)を含み、段階(b)が(iii)を含む、段落164の方法。
166.前記ライブラリが、疾患状態組織から、例えば癌細胞から作製される、段落1〜165の何れかの方法。
167.前記ライブラリが、固形腫瘍、例えば本明細書中に記載の固形腫瘍からの細胞から作製される、段落1〜165の何れかの方法。
168.前記ライブラリが、浸潤固形腫瘍、例えば本明細書中に記載の固形腫瘍を有する細胞、例えばB細胞またはT細胞から作製される、段落1〜165の何れかの方法。
169.前記ライブラリが、血液悪性腫瘍、例えば、本明細書中に記載の血液悪性腫瘍からの細胞から作製される、段落1〜165の何れかの方法。
170.前記ライブラリが無細胞DNAから作製される、段落1〜165の何れかの方法。
171.前記ライブラリが非疾患状態の組織から作製される、段落1〜165の何れかの方法。
172.前記ライブラリが、末梢血、骨髄、腫瘍組織、腫瘍浸潤物、リンパ球、B細胞、プレB細胞、成熟B細胞、T細胞または無細胞DNAから作製される、段落1〜165の何れかの方法。
173.前記ライブラリが、腫瘍浸潤細胞、例えば腫瘍浸潤B細胞、プレB細胞、成熟B細胞またはT細胞から作製される、段落1〜165の何れかの方法。
174.前記ライブラリが、末梢B細胞、プレB細胞、成熟B細胞またはT細胞、例えばCD4+またはCD8+、T細胞から作製される、段落1〜165の何れかの方法。
175.非疾患状態組織、例えば腫瘍を付随しない細胞、例えば非腫瘍細胞、または末梢血リンパ球に対するクローンプロファイルを評価することを含む、段落1〜165の何れかの方法。
176.疾患状態組織、例えば腫瘍細胞または腫瘍浸潤細胞、または非癌性障害に対するクローンプロファイルを評価することを含む、段落1〜165の何れかの方法。
177.前記ライブラリがT細胞から作製され、前記サブゲノム区間がT細胞受容体、例えばアルファ/ベータまたはデルタ/ガンマ、TCR鎖をコードする配列を含む、段落1〜165の何れかの方法。
178.(a)第1の細胞タイプからの、例えば、前記第1の細胞タイプから作製される、例えば、前記第1の細胞タイプからの染色体DNAまたはRNA、例えばmRNAから作製されたライブラリからの、対象区間のクローンプロファイルを評価すること;
(b)第2の細胞タイプからの、例えば、前記第2の細胞タイプから作製される、例えば、前記第2の細胞タイプからの染色体DNAまたはRNA、例えばmRNAから作製されたライブラリからの、対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む、段落1〜177の何れかの方法。
179.(a)第1の細胞タイプからの対象区間のクローンプロファイルを評価すること;
(b)第2の細胞タイプからの対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む、段落1〜178の何れかの方法。
180.(a)染色体DNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;
(b)RNA、例えばmRNA、例えばcDNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む、段落1〜179の何れかの方法。
181.(a)第1の期間に対象区間のクローンプロファイルを評価すること;
(b)第2の期間に対象区間のクローンプロファイルを評価すること;および
例えば対象区間の対立遺伝子またはシグネチャーが発現されるか否かを判定するために、段階(a)および(b)で提供される評価を比較してもよいこと
を含む、段落1〜180の何れかの方法。
182.前記第1の期間が予め選択された事象の前であり、第2の期間が予め選択された事象の後であり、前記予め選択された事象が、感染、医学的または外科的手順、例えば移植を受けること、診断または処置、例えば第1選択の処置もしくは第二選択の処置の投与、再発または再燃または疾患を含み得る、段落181の方法。
183.疾患状態細胞からの対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること;および
第2の疾患状態細胞からの対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること
を含む、段落1〜182の何れかの方法。
184.疾患状態細胞からの第1の対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること;および
疾患状態細胞からの第2の異なる対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること
を含む、段落1〜183の何れかの方法。
185.前記対象が癌を有する、段落1〜184の何れかの方法。
186.前記対象が血液癌を有する、段落1〜184の何れかの方法。
187.前記対象が固形腫瘍を有する、段落1〜184の何れかの方法。
188.前記ライブラリがB細胞から作製され、前記対象がB細胞悪性腫瘍、例えばマントル細胞癌を有する、段落1〜187の何れかの方法。
189.前記対象が癌以外の障害を有する、段落1〜184の何れかの方法。
190.前記対象が、免疫障害、例えば自己免疫障害、免疫不全、例えば遺伝性または後天性免疫不全、例えばAIDSまたはHIV感染を有する、段落1〜184の何れかの方法。
191.前記対象が、移植片レシピエント、例えば、骨髄レシピエント、実質臓器レシピエントまたは皮膚移植片レシピエントである、段落1〜184の何れかの方法。
192.前記対象が、感染または感染性疾患、例えば、ウイルス性、細菌性、原生動物性または真菌性の感染もしくは疾患を有する、段落1〜184の何れかの方法。
193.前記対象区間が、クローン事象を代表する、ヌクレオチド位置または連結部または配列を含む、段落1〜192の何れかの方法。
194.前記対象区間が、T細胞クローンまたはB細胞クローンを代表する、ヌクレオチド位置または連結部または配列を含む、段落1〜193の何れかの方法。
195.段階(c)または前記方法が、メンバー中の標的/対象核酸との配列特異的相互作用に依存する方法によって、例えば、前記メンバー中の標的/対象核酸に結合するプライマーを用いて、前記複数のものの各メンバーを増幅することによって、前記複数のものの各メンバーまたは何れかのメンバーを増幅することを含まない、段落1〜194の何れかの方法。
196.段階(d)が、
前記ライブラリからのメンバー(またはライブラリキャッチ)からの対象区間に対するリードを得て;
複数のメンバーのそれぞれについて、前記対象区間内のヌクレオチド位置に対する前記リードからヌクレオチド値を割り当てること
を含む、段落1〜195の何れかの方法。
197.前記複数のメンバーの各メンバー中の対象からの核酸の5’または3’末端にアダプター配列を付着させる、例えば連結することを含む、段落1〜196の何れかの方法。
198.前記複数のメンバーの各メンバー中の対象からの核酸の5’および3’末端にアダプター配列を付着させる、例えば連結することを含む、段落1〜196の何れかの方法。
199.前記複数のメンバーの各メンバーが、5’から3’方向に、5’アダプター配列、対象配列(例えば、ゲノムまたは転写配列)および3’アダプターを含む、段落1〜196の何れかの方法。
200.前記複数のメンバーの各メンバーが、5’から3’方向に、5’アダプター配列、対象配列(例えば、ゲノムまたは転写配列)および3’アダプターを含み、前記アダプターのうち1つが、識別子、例えばバーコードとして機能し得る配列を含む、段落1〜196の何れかの方法。
201.前記複数のものの各メンバーが、前記アダプター配列に特異的なプライマーで増幅される、段落1〜200の何れかの方法。
202.前記複数のものの各メンバーが、前記5’アダプターに結合するプライマーまたは前記3’アダプターに結合するプライマーを含むプライマーセットを用いて増幅される、段落1〜201の何れかの方法。
203.前記複数のものの各メンバーが、前記5’アダプターに結合するプライマーを含むプライマーセットを用いて増幅される、段落1〜202の何れかの方法。
204.前記複数のものの各メンバーが、前記3’アダプターに結合するプライマーを含むプライマーセットを用いて増幅される、段落1〜202の何れかの方法。
205.前記複数のものの各メンバーが、前記アダプター配列に特異的なプライマーおよび前記メンバーにおける標的/対象核酸に特異的なプライマーを用いて増幅される、段落1〜200の何れかの方法。
206.段階(d)が、
例えば、配列決定を含む方法によって、例えば次世代配列決定法で、メンバー、例えば前記ライブラリまたはライブラリキャッチからの腫瘍メンバーからサブゲノム区間に対するリードを得て;
アライメント方法、例えば本明細書中に記載のアライメント方法によって前記リードをアライメントし;
予め選択されたヌクレオチド位置に対して前記リードからヌクレオチド値を割り当てる(例えば、ベイジアン法または本明細書中に記載の方法を用いて、例えば突然変異を呼び出す)ことを含む、段落1〜205の何れかの方法。
207.第2の対象区間、例えば表1〜4または表5A〜9から選択される、例えば本明細書中に記載の遺伝子からの配列を含む対象区間の配列を提供することをさらに含む、
段落1〜206の何れかの方法。
208.第2の対象区間、例えばmiRNA、プロモーターまたは他の要素をコードする配列を含む対象区間の配列を提供することをさらに含む、段落1〜207の何れかの方法。
209.免疫グロブリンまたはT細胞またはB細胞受容体遺伝子以外の遺伝子からのものである第2の対象区間の配列を提供することをさらに含む、段落1〜208の何れかの方法。
210.例えば表1〜4または表5A〜9から選択される、第3の、または少なくともX個のさらなる対象区間の配列を提供することを含み、Xが4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500と等しい、段落207〜209の何れかの方法。
211.前記第3の、またはX個のさらなる対象区間が、免疫グロブリン、B細胞受容体またはT細胞受容体遺伝子以外の遺伝子からのものである、段落210の方法。
212.Xが、5、10、20、30、40、50、100、150、200、250、300、350、400、450または500以上である、段落211の方法。
213.(a)第1の細胞タイプからの、例えば前記第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される第1の対象区間のクローンプロファイルを評価すること;および
(b)第2の細胞タイプからの、例えば前記第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば表1〜9から選択される第2の対象区間の配列を提供すること
を含む、段落1〜212の何れかの方法。
214.(a)第1の細胞タイプからの、例えば前記第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される第1の対象区間のクローンプロファイルを評価すること;および
(b)第2の細胞タイプからの、例えば前記第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば表1〜9から選択される、第2、第3または少なくともX個のさらなる対象区間の配列を提供すること(Xは、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500に等しい。)
を含む、段落1〜212の何れかの方法。
215.(a)第1の細胞タイプからの、例えば前記第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される、第1の、第2の、または少なくともX個のさらなる対象区間のクローンプロファイルを評価し(Xは、3、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500に等しい。);
(b)第2の細胞タイプからの、例えば前記第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば、表1〜9から選択される、(X+1)番目の対象区間の配列を提供すること
を含む、段落1〜212の何れかの方法。
216.(a)第1の細胞タイプからの、例えば前記第1の細胞タイプ、例えば非癌細胞または非悪性細胞(例えば腫瘍浸潤リンパ球)から作製されたライブラリからの、例えば表10から選択される1つ以上(例えば、2、3、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450、500、またはそれ以上)の対象区間のクローンプロファイルを評価すること;および
(b)第2の細胞タイプからの、例えば前記第2の細胞タイプ、例えば癌細胞または悪性細胞から作製されたライブラリからの、例えば表1〜9から選択される1つ以上(例えば、2、3、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450、500、またはそれ以上)の対象区間の配列を提供すること
を含む、段落1〜212の何れかの方法。
217.前記第1の細胞タイプまたは前記第1の細胞タイプから作製されたライブラリが、前記第2の細胞タイプまたは前記第2の細胞タイプから作製されたライブラリが得られる試料と同じ試料から得られる、段落213〜216の何れかの方法。
218.前記第1の細胞タイプまたは前記第1の細胞タイプから作製されたライブラリが、前記第2の細胞タイプまたは前記第2の細胞タイプから作製されたライブラリが得られる試料とは異なる試料から得られる、段落213〜216の何れかの方法。
219.(a)各メンバーが対象からの核酸を含む複数のメンバーを含む核酸ライブラリ、例えば段落1に記載のライブラリを得て;
(b)それぞれが前記第2の(または続く)対象区間を含む複数の選択メンバーまたはその一部(本明細書中でライブラリキャッチと呼ぶときがある。)を提供するために、例えば溶液または表面ハイブリダイゼーションの条件下で、前記ライブラリをベイトセットと接触させ;
(c)例えば前記メンバー中での標的/対象核酸との配列特異的相互作用に依存しない方法によって、例えば、前記メンバー中の標的/対象核酸に結合しないプライマーを用いて前記複数のものの各メンバーを増幅することによって、前記複数のものの各メンバーを増幅し;
(d)対象区間のそれぞれの配列を得ること
によって、前記第2の(または続く)対象区間の配列を提供することを含む、段落207〜218の何れかの方法。
220.段階(d)が、
(d)(i)例えば、配列決定を含む方法によって、例えば次世代配列決定法で、メンバー、例えば前記ライブラリまたはライブラリキャッチからの腫瘍メンバーからサブゲノム区間に対するリードを得て;
(d)(ii)アライメント方法、例えば本明細書中に記載のアライメント方法によって前記リードをアライメントし;
(d)(iii)予め選択されたヌクレオチド位置に対して前記リードからヌクレオチド値を割り当てる(例えばベイジアン法または本明細書中に記載の方法を用いて、例えば突然変異を呼び出す)こと
を含む、段落219の方法。
221.例えば、染色体腕の少なくとも5、10、20、30、40、50、60、70、80もしくは90%または全てを含む、全腕または大きな再編成、例えば再編成、例えば転座、複製、挿入または欠失の出現について対象を評価する方法であって;
(a)各メンバーが対象からの核酸を含む複数のメンバーを含む核酸ライブラリを得て;
(b)それぞれが対象区間を含む複数の選択メンバーまたはその一部(本明細書中でライブラリキャッチと呼ぶときがある。)を提供するために、例えば溶液ハイブリダイゼーションの条件下で前記ライブラリをベイトセットと接触させ;
(c)例えば前記メンバー中での標的/対象核酸との配列特異的相互作用に依存しない方法によって、例えば、前記メンバー中の標的/対象核酸に結合しないプライマーを用いて前記複数のものの各メンバーを増幅することによって、前記複数のものの各メンバーを増幅し;
(d)全腕または大きな再編成の決定を可能にすることなどのために、染色体上に配置される複数の対象区間の配列を得ること
を含む方法。
222.前記大きな再編成が、例えば染色体の少なくとも約5%、10%、20%、30%、40%もしくは50%、または染色体の腕(例えば長腕または短腕)の少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは100%に影響を及ぼす、段落221の方法。
223.対象を評価する方法であって、
(a)各メンバーが前記対象からの核酸を含む複数のメンバー、例えば血液癌試料からの複数の腫瘍メンバーを含む核酸ライブラリを得て;
(b)それぞれが対象区間を含む複数の選択されたメンバーまたはその一部(本明細書中でライブラリキャッチと呼ぶときがある。)を提供するために、例えば溶液ハイブリダイゼーションの条件下で、このライブラリをベイトセットと接触させ;
(c)例えば前記メンバー中での標的/対象核酸との配列特異的な相互作用に依存しない方法によって、例えば、前記メンバー中の標的/対象核酸に結合しないプライマーを用いて前記複数の選択されたメンバーの各メンバーを増幅することによって、前記複数の選択されたメンバーの各メンバーを増幅し;
(d)サブゲノム区間および発現サブゲノム区間の配列を得て
それによって対象を評価すること
を含み;
(i)前記方法が、サブゲノム区間および発現サブゲノム区間の両方を提供するベイトセットと前記ライブラリを接触させることを含み;
(ii)前記方法が、サブゲノム区間を提供する第1のベイトセットおよび発現サブゲノム区間を提供する第2のベイトセットと前記ライブラリを接触させることを含み;
(iii)前記ライブラリがゲノムDNAを含み、サブゲノム区間を提供するベイトセットと接触させられ、前記方法が、発現サブゲノム区間を提供するためにベイトセットと接触されるcDNAを含む第2のライブラリをさらに含み;
(iv)前記ライブラリがゲノムDNAを含み、サブゲノム区間を提供するベイトセットと接触させられ、前記方法が、発現サブゲノム区間を提供するために第2のベイトセットと接触させられるcDNAを含む第2のライブラリをさらに含み;
(v)前記方法が、第1の対象区間、例えばサブゲノム区間を提供するために第1の反応混合物中で、および例えばこのサブゲノム区間に対応する、第2の対象区間、例えば発現サブゲノム区間を提供するために、第2の反応混合液において、段階(a)、(b)および(c)のうち1つを行うことを含む。
224.(1つまたは複数の)段階(a);(b);(c);(a)および(b);(a)および(c);(b)および(c);または段階(a)、(b)および(c)の全てが個別に行われる、段落223の方法。
225.前記サブゲノム区間および発現サブゲノム区間が、独立して、表1〜4から選択される、段落223または224の方法。
226.少なくともX個の対象区間の配列を提供することを含み、Xが、2、3、4、5、10、20、30、40、50、100、150、200、250、300、350、400、450、500と等しいかまたはこれを超える、段落223〜225の何れかの方法。
227.前記サブゲノム区間および前記発現サブゲノム区間が、同じ対象区間に対応し、例えば、同じ遺伝子からの配列を含む、段落223〜226の何れかの方法。
腫瘍試料の多重遺伝子分析のための方法の実施形態のフローチャート図を図1で提供する。
例証
本発明を以下の実施例によってさらに説明するが、これらは本発明を限定するものとして解釈すべきではない。本願を通して引用される全ての参考文献、図面、配列リスト、特許および公開特許出願の内容は、参照により本明細書に組み込まれる。
[実施例1]腫瘍試料からの核酸単離
様々なタイプの試料、例えばホルマリン固定、パラフィン包埋(FFPE)、血液および骨髄穿刺(BMA)試料から核酸(DNAおよびRNA)を単離した。
例えば、FFPE試料からの単離ゲノムDNAに対して、ボルテックスすることによって、パラフィンブロックから切り出された3x20μm切片を400μLの緩衝液FTLと混合し、1.5mLの遠心管中で90℃にて15分間温置した。温置に対して88〜92℃の範囲が許容可能であった。次に、試料を20μLのプロテイナーゼKとともに55℃で6時間温置し、10μLのRNase(1mg/mL)とともに室温で5分間温置した。次に、460μLの緩衝液BLおよび500μLの無水エタノールを試料に添加した。得られた試料溶液をその後の使用まで室温で維持した。
DNA結合用のカラムを調製するために、100μLの平衡緩衝液をMicroEluteカラムに添加し、カラムを10,000xgで30秒間遠心した。上記の700μLの試料溶液をMicroEluteカラムに移し、カラムを10,000xgで1分間遠心した。流体がMicroEluteカラムを完全に通過しなかった場合、遠心段階を反復した。残りの試料溶液を上記と同じ方法でMicroEluteカラムに適用した。次いで、MicroEluteカラムを500μLの緩衝液HBで処理し、10,000xgで1分間遠心した。次に、エタノールで希釈した700μLのDNA洗浄緩衝液をMicroEluteカラムに添加し、カラムを10,000xgで1分間遠心した。エタノールで希釈した700μLのDNA洗浄緩衝液を用いてMicroEluteカラムを再び洗浄し、10,000xgで1分間遠心し、カラムを乾燥させるために、>13,000xgで3分間遠心した。上部を取り除いた標準的な1.5mL遠心管にMicroEluteカラムを置いた。70℃に予熱した50〜75μLの溶出緩衝液をカラムに添加し、室温で3分間温置した。>13,000xgで1分間、回収チューブ中でカラムを遠心した。70℃に予熱したさらなる50〜75μLの溶出緩衝液をMicroEluteカラムに添加し、室温で3分間温置した。>13,000xgで1分間、回収チューブ中でカラムを再び遠心した。溶液全体を新しい1.5mL遠心管に移し、−20℃で保存した。
E.Z.N.A.(商標)FFPE DNA Kit(OMEGA bio−tek,Norcross,GA;Cat.Nos.D3399−00,D3399−01およびD3399−02)において、FTL緩衝液、プロテイナーゼK、BL緩衝液、平衡緩衝液、MicroEluteカラム、緩衝液HB、DNA洗浄緩衝液および溶出緩衝液が提供された。
ホルムアルデヒドまたはパラホルムアルデヒド固定、パラフィン包埋(FFPE)組織から核酸(例えばDNA)を単離するためのさらなる方法は、例えばCronin M.ら、(2004)Am J Pathol.164(1):35−42;Masuda N.ら(1999)Nucleic Acids Res.27(22):4436−4443;Specht K.ら(2001)Am J Pathol.158(2):419−429,Ambion RecoverAll(商標)Total Nucleic Acid Isolation Protocol(Ambion,Cat.No.AM1975,September 2008),Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kit Technical Manual(Promega Literature #TM349,February 2011)およびQIAamp(登録商標)DNA FFPE Tissue Handbook(Qiagen,Cat.No.37625,October 2007)で開示されている。RecoverAll(商標)Total Nucleic Acid Isolation Kitは、高温でキシレンを使用して、パラフィン包埋試料とグラスファイバーフィルターを溶解させて核酸を捕捉する。Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kitは、FFPE組織の1〜10μm切片からのゲノムDNAの精製のために、Maxwell(登録商標)16機器とともに使用される。シリカ被覆常磁性粒子(PMP)を用いてDNAを精製し、低溶出体積で溶出させる。QIAamp(登録商標)DNA FFPE Tissue Kitは、ゲノムおよびミトコンドリアDNAの精製のために、QIAamp(登録商標)DNA Microテクノロジーを使用する。
FFPE、血液および骨髄穿刺液からの単離核酸(例えばRNAおよびDNA)に対するさらなる代表的な方法を以下のとおり記載する。Maxwell CSC(登録商標)(Promegaカタログ番号A1S1311)用のMaxwell(登録商標)16LEV simplyRNA Blood Kitを用いて、新鮮または凍結PAXgene(登録商標)RNA血液チューブからのRNAを抽出した。Maxwell CSC(登録商標)用のMaxwell(登録商標)16 LEV simplyRNA Blood Kit(Promegaカタログ#A1S1311)およびMaxwell(登録商標)CSC用のMaxwell(登録商標)16 Blood DNA Purification Kit(Promegaカタログ#AS1010)をそれぞれ用いて骨髄穿刺液からのRNAおよびDNAを抽出した。Maxwell(登録商標)16 CSC RNA FFPEキット(Promegaカタログ#AS1360)およびMaxwell 16 FFPE Tissue LEV DNAキット(Promegaカタログ#AS1130)をそれぞれ使用して、FFPE試料からのRNAおよびDNAを同時抽出した。FFPE試料の脱パラフィンは、CitriSolv(商標)Hybrid Solution(Fisher Scientific カタログ#04−355−121)を用いて行った。マクスウェルCSC(登録商標)用のMaxwell(登録商標)16 LEV simplyRNA Blood kit((Promegaカタログ#A1S1311)およびMaxwell(登録商標)CSC用のMaxwell(登録商標)16 Blood DNA Purification Kit(Promegaカタログ#AS1010)をそれぞれ用いて細胞株からのDNAおよびRNAを精製した。
[実施例2]単離核酸の定量
Quant−iT(商標)PicoGreen(登録商標)dsDNA試薬(Life Technologiesカタログ#P7581)を用いて単離DNAを定量した。Quant−iT(商標)RiboGreen(登録商標)RNA試薬(Life Technologiesカタログ#R11491)を用いて単離RNAを定量した。
[実施例3]DNAのせん断
循環式冷却器を備えたCovaris(商標)E210装置を4℃に設定した。機器水タンクに満水ライン上のレベル「6」まで蒸留/脱イオン水を充填した。SonoLab(商標)ソフトウェアを起動し、入力を要求されたときに、システムがホーミング配列を実行するようにした。試料をせん断する前に、機器タンク内の水を少なくとも45分間脱気した。
せん断のためにゲノムDNA試料を調製するために、マイクロプレートリーダー(Spectramax M2、Molecular Devices)上でPicoGreen(登録商標)アッセイ(Invitrogen)を用いて試料を最初に定量した。濃度に基づいて、低TE(10mM Tris、0.2mM EDTA、pH8.0)とともに120μLの所望のインプットDNA(2ng/μL)を実験に対して使用した。100μLの個々の試料を、チューブの蓋の隔壁を通じてCovaris MicroTUBE(Covarisカタログ#520045)にゆっくりとピペットで移した。次いで、Covaris MicroTUBEをCovaris Eシリーズチューブラックに置いた。200bpのせん断については、次のように設定した:10%デューティサイクル、5の強度、200サイクル/バースト、時間180秒および周波数掃引モード。せん断後、ミニ遠心分離機で適切なアダプターを用いてCovaris MicroTUBEを短時間スピンダウンし、せん断試料を清潔な1.5mL微量遠心管に移した。QIAGEN MinElute(登録商標)カラムを用いて、各せん断DNA試料を精製した。簡潔に述べると、5xQIAGEN PBI緩衝液を1.5mL微量遠心管中の試料に添加した(例えば、100μLの試料に500μLのPBI緩衝液を添加した。)。各試料をボルテックスし、短時間スピンダウンし、MinEluteスピンカラムに移した。MinEluteスピンカラムを13,000rpmで1分間遠心し、フロースルーを廃棄した。750μLのQIAGEN PE緩衝液をカラムに添加し、13,000rpmで1分間遠心分離し、フロースルーを廃棄した。スピンカラムを13,000rpmで1分間再び遠心し、清潔な1.5mL微量遠心管に移した。カラムを2〜3分間風乾した。最初の溶出のために、18μLのQIAGEN Elution Bufferを各カラムに添加し、2〜3分間温置し、次いで13,000rpmで1分間遠心した。2回目の溶出のために、15μLのQIAGEN Elution Bufferを添加し、1分間温置し、次いで13,000rpmで1分間遠心した。溶出物を回収し、スピンカラムを廃棄した。
典型的には、200ngをDNAせん断に使用するが、DNAの量は20〜200ngまたはそれを超える範囲であり得る。
[実施例4]DNAせん断に対する代替方法
この実施例は、実施例3からのDNAせん断の代替方法を記載する。
二本鎖ゲノムDNAを最初に変性させて1本鎖DNAにし、次にプライマー、DNAポリメラーゼ(例えばExo−DNAポリメラーゼ)、dNTPおよび少量のddNTPと混合する。プライマー配列は、ランダムヘキサマーまたは5’末端にアダプター配列でタグ付加されたランダムヘキサマーであり得る。少量のDNAをクローニングおよび配列決定するためのタグ付きランダムヘキサマー増幅を使用するための方法は、例えばWong K.K.ら、Nucleic Acids Res.1996;24(19):3778−83に記載されている。プライマー−鋳型アニーリングおよびDNA合成を可能にする条件下で反応を温置する。DNA合成は、ddNTPが新たに合成された第1鎖に組み込まれた際に終了する。合成された第1鎖DNAの長さは、dNTP対ddNTPの比によって調節し得る。例えば、dNTP対ddNTPのモル比は、少なくとも約1000:1、約5000:1または約10000:1である。第1鎖合成の後、短い断片(例えば、プライマーおよび短い合成第1鎖DNAおよびddNTPなど)は、サイズ選択(例えば、サイズ選択スピンカラムを使用)によって除去し得る。得られた第1鎖DNAをプライマー(例えば、ランダムヘキサマーまたはアダプター配列でタグ付加されたランダムヘキサマー)、DNAポリメラーゼ(例えばExo+DNAポリメラーゼ)およびdNTPと混合する。第1鎖DNAから末端3’−ddNTPを除去するために、または第2の開始部位にわたり平滑末端を生成させるためにも、Exo+DNAポリメラーゼを使用し得る。次いで、プライマー−鋳型アニーリングおよびDNA合成を可能にする条件下で反応系を温置する。第2鎖の合成後、得られた2本鎖DNA断片を精製し、ライブラリ構築において直接使用し得る。あるいは、アダプター配列が第1鎖および第2鎖合成のためのプライマーに含まれている場合には、これらのアダプター配列を含有するプライマーを用いて、2本鎖DNA断片をPCR増幅し得る。PCR増幅のためのプライマーはまた、配列全体および/またはバーコード配列も含み得る。
[実施例5]
cDNA合成
ライブラリ構築前に、単離RNAを2本鎖cDNAに変換し、これはアダプター連結配列決定ライブラリを作製するためのインプットとなった。
2本鎖cDNAは二段階工程で作製した。最初に、ランダムヘキサマー(N6)およびオリゴdT DNAプライマー(Integrated DNA Technologies(IDT))の混合物と全RNAをハイブリッド形成させた。鋳型としてRNA鎖を使用し、インプットRNAに相補的な1本鎖DNAを生成させる逆転写酵素(RT)(Promegaカタログ#M3683)によって、ハイブリッド形成プライマーを伸長させた。第1鎖合成(FSS)中に生成されたDNAの第1鎖は、反応終了時にRNA鋳型とハイブリッド形成したままであった。次に、DNAポリメラーゼ、DNAリガーゼおよびRNaseHを含有する混合物をDNA−RNAハイブリッド(New England BioLabs カタログ#E6111L)に添加したときに、第2鎖合成(SSS)が起こった。RNaseHはDNAに結合したRNAにニックを入れ、したがって、DNAポリメラーゼによって使用されたRNAプライマーを作製し、第1のDNA鎖を鋳型として用いて第2のDNA鎖の合成を開始させた。第2鎖合成の生成物は、ライブラリ構築に適合する2本鎖DNAであった。
インプットRNAの品質に基づくアッセイ設定および実行で相違が最小限である半自動ワークフローを使用して、高品質(例えば、適切に回収され、保存された新鮮凍結インプット(例えば細胞ペレット)、PAXgene RNA血液チューブ、RNAlater中の骨髄穿刺液)および低品質(例えばFFPEから精製されたRNA)インプットの両方の処理に対応するように、cDNA合成プロトコールを設計した。Bioanalyzer上でRNAの品質を分析した。明確なリボソームRNA(rRNA)のピークは、mRNAがほぼ完全長であることを示した。
低品質RNAインプットからの典型的なcDNA断片の長さは100〜500bpであり、ライブラリ構築を開始する前に追加の処理(例えば断片化)を必要としなかった。高品質のRNAインプットからの典型的なcDNA断片の長さは一般に500bpを超え(2〜3kbpまで)、ライブラリ構築のためのインプットとして使用する前にcDNAを断片化した。断片化は、ゲノムDNAに対して使用したものと同じプロトコール(実施例3)を使用して、超音波処理によって行った。
FFPE試料から単離された全RNAからcDNAを合成するためのさらなる代表的な方法を以下に記載する。例えば、Roche High Pureキットを使用して単一の5〜10μm FFPE組織切片から抽出した全RNAからcDNAを作製し、SuperScript(登録商標)III First−Strand Synthesis System(Invitrogen)によって、ランダムヘキサマープライマーを用いてcDNAに逆転写した。NEBNext(登録商標)mRNA Second Strand Synthesis Module(New England Biolabs)を用いて2本鎖cDNAを作製し、FFPE DNA試料に対するようにライブラリ構築、ハイブリッド捕捉および配列決定へのインプットとして使用した。発現レベルの分析は、分析ツールの組み合わせを用いて行った。
[実施例6]ライブラリ調製
エンドリペア反応
エンドリペア試薬(NEB #E6050L)を凍結融解し、エンドリペアマスター混合液を氷上で調製した。1試料あたり70μLのマスター混合液を調製するために、55μLのヌクレアーゼ不含水を10μLの10xエンドリペア反応緩衝液および5μLのエンドリペア酵素混合物と混合した。次いで、70μLのマスター混合液を氷上の96ウェルPCRプレート中の30μLの各せん断DNA試料に添加した。反応系を20℃でサーモサイクラー中で30分間温置した。QIAGEN MinElute(登録商標)カラムを用いて、各試料を精製した。簡潔に述べると、5xQIAGEN PBI緩衝液を1.5mLの微量遠心管中の試料に添加した(例えば、100μLの試料に500μLのPBI緩衝液を添加した。)。各試料をボルテックスし、短時間スピンダウンし、MinEluteスピンカラムに移した。MinEluteスピンカラムを13,000rpmで1分間遠心し、フロースルーを廃棄した。750μLのQIAGEN PE緩衝液をカラムに添加し、13,000rpmで1分間遠心分離し、フロースルーを廃棄した。スピンカラムを13,000rpmで1分間再び遠心し、清潔な1.5mL微量遠心管に移した。カラムを2〜3分間風乾した。最初の溶出のために、22μLのQIAGEN Elution Buffer(10mM Tris、pH8.5)を各カラムに添加し、2〜3分間温置し、次いで13,000rpmで1分間遠心した。2回目の溶出のために、22μLのQIAGEN Elution Bufferを添加し、1分間温置し、次いで13,000rpmで1分間遠心した。溶出物を回収し、スピンカラムを廃棄した。
3’A−塩基付加
A−塩基付加試薬(NEB#E6053L)を氷上で凍結融解し、A−塩基付加マスター混合液を氷上で調製した。1試料あたり10μLのマスター混合液を調製するために、2μLのヌクレアーゼ不含水を5μLの10xdA−テーリング反応緩衝液および3μLのKlenow断片(3’−>5’エクソ−)と混合した。10μLのマスター混合液を氷上の96ウェルPCRプレート中の40μLの各精製エンドリペア試料に添加した。反応系を37℃でサーモサイクラー中で30分間温置した。QIAGEN MinElute(登録商標)カラムを用いて、各試料を精製した。簡潔に述べると、5xQIAGEN PBI緩衝液を1.5mLの微量遠心管中で試料に添加した(例えば、50μLの試料に250μLのPBI緩衝液を添加した。)。各試料をボルテックスし、短時間スピンダウンし、MinEluteスピンカラムに移した。MinEluteスピンカラムを13,000rpmで1分間遠心し、フロースルーを廃棄した。750μLのQIAGEN PE緩衝液をカラムに添加し、13,000rpmで1分間遠心分離し、フロースルーを廃棄した。スピンカラムを13,000rpmで1分間再び遠心し、清潔な1.5mL微量遠心管に移した。カラムを2〜3分間風乾した。最初の溶出のために、13μLのQIAGEN Elution Buffer(10mM Tris、pH8.5)を各カラムに添加し、2〜3分間温置し、次いで13,000rpmで1分間遠心した。2回目の溶出のために、13μLのQIAGEN Elution Bufferを添加し、1分間温置し、次いで13,000rpmで1分間遠心した。溶出物を回収し、スピンカラムを廃棄した。
多重アダプターの連結
ライゲーション試薬(NEB #E6056L)を凍結融解し、ライゲーションマスター混合液を氷上で調製した。1試料あたり36μLのマスター混合液を調製するために、12μLの5xQuick Ligation反応緩衝液を3.3μLのIllumina Multiplex Adaptor(15μM、Illuminaカタログ#PE−400−1001に含まれる。)に添加した(3.3μLアダプター/1μg開始インプットDNAを使用した。)。例えば、500ngのインプットDNAの1つの試料に対して、最初にアダプターを水中で希釈し(2μLアダプター+2μL HO)、次いで、ライゲーション反応系に対して、3.3μLのこの希釈アダプター混合液、15.7μLのヌクレアーゼ不含水および5μLのQuickT4 DNAリガーゼを添加した。>1μgの出発材料に対して、>3.3μLのアダプターを使用した。したがって、希釈されたアダプター混合液およびヌクレアーゼ不含水の総体積を19μLに保つために、より少ない水を添加した。
36μLのマスター混合液および24μLの各dA尾部付加DNA試料を氷上の96ウェルPCRプレートのウェルに添加した。反応系を25℃でサーモサイクラー中で30分間温置した。QIAGEN MinElute(登録商標)カラムを用いて、各試料を精製した。簡潔に述べると、5xQIAGEN PBI緩衝液を1.5mLの微量遠心管中の試料に添加した(例えば、60μLの試料に300μLのPBI緩衝液を添加した。)。各試料をボルテックスし、短時間スピンダウンし、MinEluteスピンカラムに移した。MinEluteスピンカラムを13,000rpmで1分間遠心し、フロースルーを廃棄した。750μLのQIAGEN PE緩衝液をカラムに添加し、13,000rpmで1分間遠心分離し、フロースルーを廃棄した。スピンカラムを13,000rpmで1分間再び遠心し、清潔な1.5mL微量遠心管に移した。カラムを2〜3分間風乾した。最初の溶出のために、20μLのQIAGEN Elution Buffer(10mM Tris、pH8.5)を各カラムに添加し、2〜3分間温置し、次いで13,000rpmで1分間遠心した。2回目の溶出のために、20μLのQIAGEN Elution Bufferを添加し、1分間温置し、次いで13,000rpmで1分間遠心した。溶出物を回収し、スピンカラムを廃棄した。
PCR濃縮
PCR試薬を凍結融解し、PCRマスター混合液を氷上で調製した。1試料あたり62μLのマスター混合液に対して、HF緩衝液(Finnzyme、NEBカタログ番号F−531S)入りの50μLの2X Phusion High Fidelityマスター混合液、8μLのヌクレアーゼ不含水、2μLのIllumina Primer 1.0(25μM)および2μLのIllumina Primer 2.0(0.5μM)を使用した。次いで、96ウェルPCRプレート中で、適切なバーコード付きの2μLのIllumina Index Primer(25μM、Illuminaカタログ#PE−400−1001に含まれる。)および36μLの連結DNA試料と62μLのマスター混合液を混合した。反応系を以下のようにサーモサイクラー中で温置した:
1サイクル 98℃ 30秒
18サイクル 98℃ 10秒
65℃ 30秒
72℃ 30秒
1サイクル 72℃ 5分
4℃ 維持
1.8x体積のAMPureXPビーズ(Agencourt;Beckman Coulter Genomics Cat.#A6388)で各PCR反応物に対してサイズ選択を行った。簡潔に述べると、1.8xのAMPureXPビーズを1.5mLの微量遠心管中の試料に添加し(例えば、180μLのビーズを100μLの試料に添加した。)、ボルテックスし、転倒混合しながら5分間温置した。溶液が透明になるまで(2分間)、チューブをマグネットスタンド上に置いた。マグネット上に捕捉されたビーズを乱さずに上清を廃棄した。新たに作製した600μLの70%エタノールをビーズ(beards)に添加し、1分間温置し、続いてエタノールを除去した。新たに作製した600μLの70%エタノールの第2のアリコートをビーズに添加し、1分間温置し、エタノールを除去した。ビーズを再捕捉するために、チューブをマグネットスタンド上に1〜2分間戻した。残りのエタノールを全て除去し、ビーズを室温で5〜10分間風乾させた。30μLのQIAGEN溶出緩衝液をビーズに添加し、ボルテックスし、2分間温置した。溶液が透明になるまで(2分間)、チューブをマグネットスタンド上に戻した。上清を新しい1.5mLチューブに移し、ビーズを廃棄した。Q−PCRアッセイを用いて、溶出DNA試料を定量した。これらの定量化により、プールされたハイブリッド捕捉選択内の各ライブラリの等しい提示を確保するために等モルでプールすることが可能になる。
[実施例7]ハイブリッド選択
プール指標付き試料ライブラリ
Q−PCRによって、指標を付け、精製し、定量したライブラリのプール(12−plexまで)を氷上で作製した。各試料がハイブリッド選択工程において同等に示されたことを確実にするために、1.5mLの微量遠心管中で等モルのプールを調製した。これらのプールのそれぞれに対するDNAの総インプットは、2000ng〜500ngの範囲であり得る。通常、総インプットDNAは2000ngである。したがって、12個の試料をプールする場合、合計2000ngにするために、それぞれ166.67ngをプールし得る。2000ngのライブラリプールの最終体積は4μLとなるはずである。指標付きライブラリの濃度が様々であるがゆえに、何らかのより大きな体積でプールが作製され得るが、このプールはスピードバック(低熱使用)で乾燥させ、4μLのヌクレアーゼ不含水で再構成するべきである。
ライブラリ構築において収率が高いほど、ライブラリの複雑性が高まる。
プールしたDNAライブラリをビオチン化RNAベイトとハイブリッド形成させる。
この実験において、Agilent SureSelect Target Enrichment Paired Endキット(#G3360A−J)を使用した。ハイブリダイゼーション緩衝液#3、SureSelect Block#1、SureSelect Block#2、Paired End Primer 1.0ブロック、Index Primer 1−12ブロック、RNAseブロックおよびビオチン化RNAベイトを氷上で凍結融解させた。次のマスター混合液を調製した。
a.ハイブリダイゼーション緩衝混合液(反応あたり13μL):
i.ハイブリダイゼーション緩衝液#1(Agilent)−25μL
ii.ハイブリダイゼーション緩衝液#2(Agilent)−1μL
iii.ハイブリダイゼーション緩衝液#3(Agilent)−10μL
iv.ハイブリダイゼーション緩衝液#4(Agilent)−13μL
b.ブロッキング混合液(反応あたり8μL):
i.SureSelect Block#1(Agilent)−2.5μL
ii.SureSelect Block#2(Agilent)−2.5μL
iii.対となるエンドプライマー1.0ブロック(IDT、HOで200μMに再懸濁)−1.5μL
iv.インデックスプライマー1〜12ブロック(IDT、HOで200μMに再懸濁)−1.5μL
c.RNaseブロックの希釈
i.<3Mbの領域を有するカスタムビオチン化RNA−ベイトについて:1μLのRNase Block(Agilent)を9μLの水中で希釈した。
ii.>3Mbのベイト領域を有するカスタムベイトの場合:1μLのRNaseブロックを3μLの水中で希釈した(依然として7μLの捕捉反応あたり0.5μLのRNaseブロック)
d.ベイト混合物:(反応あたり7μL)
i.RNAベイト−2μL(>3Mbのベイト領域を有するベイトについて、5μLのベイトを使用した。)
ii.希釈RNaseブロック−5μL(>3Mbのベイト領域を有するベイトについて、上で示されるように希釈した2μLのRNaseブロックを使用した。)
ハイブリダイゼーション緩衝混合液、ブロッキング混合液およびベイト混合液を調製したら、ハイブリダイゼーション緩衝混合液をボルテックスし、スピンダウンし、加熱ブロック中で65℃に加熱した。ハイブリッド選択しようとする各プール試料ライブラリ4μLを、96ウェルPCRプレート中で8μLのブロッキング混合液と混合した。反応系を95℃でサーモサイクラー中で5分間温置し、次いで65℃で維持した。プール試料ライブラリ/ブロッキング混合液を95℃で5分間、次いで65℃で2.5分間温置していたときに、ベイト混合物(=ベイト/RNAseブロック混合液)を65℃のヒートブロックに2.5分間入れた。ハイブリダイゼーション緩衝液含有チューブを素早くスピンダウンし、次いですぐに65℃ヒートブロックに戻した。96ウェルプレートを65℃のサーモサイクラー中に残したまま、13μLの加熱したハイブリダイゼーション緩衝混合液を各試料ライブラリ/ブロック混合液にピペットで入れた。96ウェルプレートを65℃のサーモサイクラー中に残したまま、ベイト混合物を65℃で2.5分間温置した後、7μLのベイト混合物を各試料ライブラリ/ブロック/ハイブリダイゼーション緩衝混合液に添加した。反応系(全体積32μL)を、サーモサイクラー中、65℃で24時間温置した。
磁気ビーズの調製
SureSelect Wash Buffer#2は、ヒートブロック中で65℃で予熱した。Dynal MyOne Streptavidin T1ビーズ(Invitrogen)をボルテックスし、再懸濁した。50μLのDynalビーズあたり200μLのSureSelect Binding Bufferを添加することによってビーズを洗浄した(例えば、300μLのDynalビーズを調製するために1200μLのSureSelect Binding Bufferを使用した。)。ビーズを5秒間ボルテックスし、短時間スピンダウンした。ビーズを約15秒間または全ビーズが捕捉されるまでマグネットスタンド上に置いた。上清を除去し、廃棄した。SureSelect Binding Bufferでさらに2回洗浄を繰り返し、合計3回洗浄した。洗浄後、50μLのDynalビーズあたり200μLのSureSelect Binding Buffer中でビーズを再懸濁した(例えば、300μLのDynalビーズを調製するために1200μLのSureSelect Binding Bufferを使用した。)。再懸濁したビーズをボルテックスし、短時間スピンダウンした。200μLの再懸濁ビーズを個々の1.5mL微量遠心管に分注した。
ハイブリッド捕捉DNAの選択
24時間の温置後、65℃のサーモサイクラー中のPCRプレートからの各ハイブリッド形成試料を室温で200μLの調製済みビーズを含有するチューブに素早くピペットで入れた。試料およびビーズの混合物を5秒間ボルテックスし、的確な混合を確保するために室温で30分間回転子上で温置した。次いで、チューブを素早くスピンダウンした。ビーズをマグネット上で捕捉し(2分間)、上清を除去して廃棄した。低ストリンジェンシー洗浄の場合、ビーズを500μLのSureSelect Wash Buffer#1中で再懸濁した。試料を5秒間ボルテックスし、マグネットなしで室温で15分間温置した。試料を3〜5分ごとに5秒間ボルテックスした。チューブをすぐにスピンダウンした。次いで、ビーズをマグネットスタンド上で2分間捕捉し、上清を除去して廃棄した。非標的物質を除去するための高ストリンジェンシー洗浄の場合、65℃に予熱したSureSelect Wash Buffer#2でビーズを洗浄した。簡潔に述べると、500μLの予熱したSureSelect Wash Buffer#2中でビーズを再懸濁し、5秒間ボルテックス上で混合して、ビーズを再懸濁した。遠心分離機で短時間ビーズをスピンダウンし、室温で5秒間時おりボルテックスして混合しながら、ヒートブロック中で65℃で10分間温置した。次いで、ビーズを遠心分離機で短時間スピンダウンし、マグネット上で2分間捕捉した。予熱したSureSelect Wash Buffer#2で65℃にてさらに2回洗浄を繰り返し、全部で3回洗浄した。次いで、洗浄緩衝液を完全に除去し、50μLのSureSelect Elution Bufferをビーズに添加し、続いて、5秒間ボルテックスしてビーズを混合した。試料を室温で10分間温置し、ボルテックス混合を時おり5秒間行った。ビーズを遠心分離機中で短時間スピンダウンし、マグネットスタンド上で捕捉した。捕捉したDNAを含有する上清を新しい1.5mL微量遠心管にピペットで移した。50μLのSureSelect Neutralization Bufferを捕捉DNAに添加した。試料を5秒間ボルテックスし、遠心分離機で短時間スピンダウンし、1.8x体積のAMPureXPビーズを用いて精製した。40μLのヌクレアーゼ不含水中でDNAを溶出させた。
捕捉DNAのPCR濃縮
PCR試薬を凍結融解し、PCRマスター混合液を氷上で調製した。1試料あたり60μLのマスター混合液に対して、HF緩衝液入りの50μLの2X Phusion High Fidelityマスター混合液(NEB#F−531S)を、8μLのヌクレアーゼ不含水、1μLのQPCR Primer 1.1(HO中100μM)および1μL QPCR Primer2.1(HO中100μM)と混合した。Q−PCR用のプライマー配列は次のとおりである:
QPCR Primer1.1(IDTからHPLC精製):
5’AATGATACGGCGACCACCGAGAT3’(配列番号2)
QPCR Primer2.1(IDTからHPLC精製):
5’CAAGCAGAAGACGGCATACGA3’(配列番号3)
60μLのマスター混合液を96ウェルPCRプレート中の40μLの各精製捕捉DNA試料に添加した。反応系を以下のようにサーモサイクラー中で温置した:
1サイクル 98℃ 30秒
12サイクル 98℃ 10秒
65℃ 30秒
72℃ 30秒
1サイクル 72℃ 5分
4℃ 維持
各100μLのPCR反応液を1.8x体積のAMPureXPビーズで精製し、35μLの溶出緩衝液(10mM Tris、pH8.5)中で溶出させた。Q−PCRアッセイを用いて、ハイブリッド選択/捕捉DNA試料を定量した。Q−PCRアッセイはエンドアダプターを検出し、リードは、適切なクラスター密度を得るために各試料のどの程度を配列決定フローセルに載せるべきかを示した。
[実施例8]配列決定方法
次のものは、本実施例による変化を同定するために使用される方法および実験条件のある一定の実施形態を例示する。さらなる転座のスクリーニングは、例えば、予め選択された腫瘍試料から調製されたcDNAのqRT−PCR分析の何れかを用いて行い得る。
FFPE、血液および骨髄穿刺試料から単離された核酸を用いて遺伝子変化を同定するために、DNA配列決定(DNA−seq)およびRNA配列決定(RNA−seq)の両方を行った。例えば、保管された固定パラフィン包埋組織から単離されたDNAを用いて、ハイブリダイゼーション捕捉された、アダプターライゲーションに基づくライブラリ上で大規模並列DNA配列決定を行った。データを分析し、DNA変化呼び出しを割り当てるために、分析ツールの組み合わせを用いた。凍結腫瘍から調製したcDNAのqRT−PCR分析または保管FFPE検体のIHC評価の何れかを用いて、さらなる転座スクリーニングを行った。FFPE組織から単離されたRNAを用いて、両方の新規転座の発現を確認するために、大規模並行cDNA配列決定を行った。再編成の体細胞起源を確認するために、指標NSCLC患者について、血液からの適合した正常参照ゲノムDNAを配列決定した。
ゲノムDNA配列決定
保管ホルマリン固定パラフィン包埋(FFPE)腫瘍検体からのDNAを用いて、145種類の癌遺伝子の2574個のエクソンの配列決定を行ったが;24個はNSCLC患者由来であった。ゲノムDNAを用いたアダプターライゲーション法、続いて最適化RNAハイブリダイゼーション捕捉プローブ(Agilent SureSelectカスタムキット)によるハイブリダイゼーション選択によって、配列決定ライブラリを構築した。HiSeq2000装置(Illumina)での配列決定は、36x36対のリードを用いて平均デプス253Xまで行った。塩基置換、インデル、コピー数変化およびゲノム再編成のためのデータ処理および突然変異の割り当ては、腫瘍組織からの突然変異呼び出しのために最適化されたツールの組み合わせを用いて行った。
[実施例9]多重分析のための代表的な選択遺伝子および変異体
多重分析のために選択された代表的な遺伝子、変異体および癌のタイプを表1〜9に記載する。
[実施例10]臨床癌検体の次世代配列決定からの、体細胞ゲノム変化の高感度検出のためのベイジアン法
本明細書中に記載のベイジアン法を続く実施例で実行した。
このアプローチの有用性は、臨床背景に関連するより低い範囲の突然変異頻度での置換検出に対するデータ駆動事前分布(priors)の影響を説明する出力計算によって例証される。図2で示されるように、事前予測(例えば1e−6または10%事前分布(prior))および突然変異頻度(例えば1%、5%または15%突然変異)の値は、それぞれ「臨床癌検体の次世代配列決定からの、体細胞ゲノム変化の高感度検出のためのベイジアン法」の(i)および(ii)に記載の値に対応する。図2は、事前予測を組み込むことにより、例えば突然変異部位での必要なカバレッジデプスを小さくすることによって、または突然変異を検出するための推定出力(感度)を上昇させることによって、より稀な突然変異に対する検出力を向上させ得ることを示す。
様々な試料(例えば、構築された低純度マルチクローン試料、肺および結腸腫瘍試料および乳癌試料)に対する、および希少な変異を検出するためのベイジアン法の適用を示すさらなる例は、国際公開第2012/092426号パンフレットで開示されている。
[実施例11]個別に合成されたオリゴヌクレオチド捕捉プローブを用いた高性能の溶液ベースの標的選択
溶液ベースのゲノム標的選択技術が利用可能であることにより、標的配列決定アプリケーションの迅速な開発が可能になり、そのうちの一部が臨床配列決定試験の導入につながった。市販のハイブリダイゼーション捕捉試薬は、ビオチン化DNAまたはRNAプローブ(「ベイト」)に変換されるアレイ合成オリゴヌクレオチドに基づく。しかし、これらの複雑なプローブプールを作製する方法は、例えば高GC含量標的を捕捉することなど、性能面の課題に直面する。
57個の臨床的に関連し、実用可能な癌関連遺伝子に相当する約130kbの標的領域を捕捉するために個別に合成された5’−ビオチン化オリゴヌクレオチド(「オリゴ−ベイト」)を用いる代替的なアプローチを本明細書中で記載する。24時間のハイブリダイゼーション手順でこれらのオリゴベイトを用いて選択された指標付き配列決定ライブラリは、5000倍の標的濃縮をもたらした。50M 49x49対のエンドリードは、標準偏差568x(27%)で2100xの平均標的カバレッジを生じさせた。全ての標的が首尾よくカバーされ、>500xで標的塩基の99.95%がカバーされた。さらに、標的カバレッジにはGCバイアスが実質的になかった。GC含量>70%の標的は、平均すると1,975xカバレッジ、GC含量<35%の標的は平均すると1,996xカバレッジであった。
より短いハイブリダイゼーション時間を使用しても高い性能が維持され:標的塩基の99.3%が、2.5時間のハイブリダイゼーション後、>500xでカバーされた。
SSPE(サケ精子、PE)/デンハートの使用は、TEACl、TMAClおよび/または硫酸デキストランを含有するhyb/洗浄緩衝液よりも優れていた。
別の方法では捕捉が困難な(例えば高GC%)領域のカバレッジを拡大するために、または新しい遺伝子含量を迅速に追加するために、アレイ由来のベイトプールにオリゴ−ベイトを添加し得る。このアプローチは、高性能の標的臨床配列決定試験を開発するための非常に有効で拡張可能な方法をもたらす。
捕捉ベイトを最適化する代表的な方法およびベイトセットを評価するための実験条件は、国際公開第2012/092426号パンフレットで開示されている。
[実施例12]ホルマリン固定組織に由来するDNAの低インプットを用いた高感度腫瘍プロファイリングのための日常的な超ディープ配列決定
ハイスループットDNA配列決定技術の幅広い採用により、癌ゲノミクスにおける急速な進歩が促進された。しかし、ゲノム癌診断における標準治療は、依然として個々の遺伝子および特定の突然変異に焦点を当てた検査を含む。臨床的に実施可能な突然変異の数が増加するにつれて、特に組織検体が、生検の場合に一般的であるように、限定的である場合、試験の枠組みに対するこの単一の突然変異が実行不可能になる。腫瘍試料の包括的なゲノムプロファイリングに対する臨床的ニーズに対処するために、発明者らは、200+の癌関連遺伝子に対する大規模並列配列データを送達する臨床テストを開発した。さらに、この検査は臨床的に重要であることが示され、DNAインプットが50ng程度と低いホルマリン固定パラフィン包埋(FFPE)組織試料および11年間経過しているという古い試料から超ディープ配列決定データを生成させた。
多岐にわたる試料でのこの検査の性能を評価するために、経年ブロックセット由来の96個のFFPE検体からDNAを単離したが、これには、次の経過年数:1、3、5、7、9および11年にわたり各組織に対して均一に分布した、乳房、結腸、肺および腎組織のそれぞれからの12対の腫瘍/正常ペアが含まれていた。指標付加配列決定ライブラリを構築するために、200ngおよび/または50ngのインプットDNAを使用し、その後、溶液ベースのハイブリッド捕捉法を用いて200+個の癌関連遺伝子を濃縮し、Illumina HiSeq(商標)2000プラットフォーム上で配列決定した。
ライブラリ構築のために少なくとも200ngのDNAを生成させる76試料の場合、配列決定カバレッジは、PCR複製物の除去後に平均して1,000xであり、試料の>95%が>350xの中央値カバレッジを生じた。ライブラリ構築に対して50ngを使用した試料の場合、カバレッジの平均は450xであった。配列決定性能は、全ての試料組織タイプおよび経過年数にわたって一貫していた。このような超ディープ配列決定は、5〜10%程度の低い頻度で存在する突然変異の高信頼度検出を可能にする。
[実施例13]循環腫瘍細胞を用いた腫瘍ゲノムのプロファイリング
循環腫瘍細胞(CTC)は、低侵襲性の連続方式でヒト悪性腫瘍を試料採取するための優れた機会を提供する。癌ゲノムの分子の特徴評価のためのCTCの使用には、2つの重要な課題がある。第1に、CTCは血液から効率的に単離されなければならず、この場合、CTCは非腫瘍細胞よりも10倍以上少ないものであり得る。第2に、CTC試料中に存在する限られた数の腫瘍ゲノムは、物質の損失および偏りの導入を最小限に抑えながら、利用可能な形態で捕捉しなければならない。
以前のCTCの遺伝子解析は、対立遺伝子特異的PCRを使用しており;これらの方法は、野生型配列の≧10倍のバックグラウンドで非常に低いコピー数の特異的突然変異の検出を可能にする。CTCの存在量および捕捉効率の二重の課題に対処する一方で、このアプローチは、本質的に、選択された予め指定された変異体の狭い特徴評価に限定される。ゲノム時代に分子CTC解析を持ち込むために、発明者らは、単一CTC試料からの200個を超える癌関連遺伝子のディープ再配列決定を可能にする次世代プラットフォームと、数万ではなく僅か数百個の白血球細胞のバックグラウンドでCTCの回収を可能にする微小流体希少細胞捕捉系を結合させた。
対立遺伝子頻度(R約0.90)をほぼ維持しながら、10個以下の癌細胞株の複合混合物を使用して、全部で100個ほどの少ない細胞から高感度突然変異検出(対立遺伝子≧10%存在量に対して約94%)である。全血に添加された培養細胞を再捕捉することにより、10個程度の少ない癌細胞を含有する検体からの多重遺伝子突然変異プロフィールを得た。この感度レベルは、大多数の臨床CTC試料をNGS分析の範囲内に置く。乳癌患者からの一連の血液試料において、Her2Neu陽性細胞の頻度を体細胞突然変異陽性DNAの相対的存在量と比較することによって、潜在的なCTCの不均一性を調べた。
[実施例14]FFPE腫瘍試料の標的DNAおよびRNAのディープシークエンシングの統合を通じた癌関連突然変異、転座および遺伝子発現の変化の検出
個別化療法の癌への広範な適用には、腫瘍のゲノムおよびトランスクリプトームに存在する多様な逸脱の、包括的で、高感度で時宜を得た特徴評価が必要である。ホルマリン固定パラフィン包埋(FFPE)ブロックとして一般的に保存されている殆どの臨床癌試料からのRNAおよびDNAは、品質が低く、分子プロファイリングに対して使用することが困難であった。新たに出現した次世代DNA配列決定アッセイは、損傷があるDNAでうまく機能し、多くのタイプのゲノム逸脱を検出するのに十分に感度が高い。現在、FFPE腫瘍試料からのトランスクリプトームの包括的な分析のための同等のRNA配列決定プロトコールはない。
結果:
200を超える癌関連遺伝子における突然変異、再編成および発現変化の高感度検出のためのFFPE適合標的RNA配列決定および分析方法が開発された。プロトコールは細胞株RNA上で検証し、50個を超えるFFPE非小細胞肺癌(NSCLC)腫瘍を研究するためにこれを使用した。既知の突然変異および遺伝子融合(例えばBCR−ABL1)が細胞系で検出された。デジタル発現プロファイリングにおける技術的再現性は、細胞株およびFFPE RNAについてそれぞれR=0.99および>0.9を超えていた。癌ゲノムで予想されるように、RNA−seqから、既知の癌遺伝子を含む点突然変異および新規の再編成を含む、ゲノムにおける逸脱の証拠が提供された。EGFR、FGFR3、CDH5、KITおよびRETを含む癌遺伝子の非常に顕著な差次的発現が、様々な腫瘍にわたり2.5〜70倍の範囲で明らかになった。同一のFFPE試料上のRNAおよびDNA配列決定データの組み合わせは、ゲノム変化の機能的な結果を裏付け;例としては、突然変異TP53対立遺伝子の発現、およびDNAレベルでヘテロ接合性喪失を示した腫瘍におけるSTK11発現の減少が挙げられた。次世代配列決定技術をFFPE RNAに適用し、実存のDNA配列決定法と統合することで、臨床的に関連する癌生物学の理解が深まり、患者のケアを改善することが期待される。
方法:
製造者の指示に従い、Roche High Pure Paraffin Kitを用いて、FFPE組織切片、一般的には1または2個の10μmのカール(curl)からRNAを抽出する。抽出したRNAを−80℃で保存する。RNA収率および品質は、製造者の指示に従い、RiboGreen(Invitrogen)およびBioanalyzer RNA Pico Chip(Agilent)によってそれぞれ評価する。一般的な収率は500ng〜2μgであり、RINスコアは4未満である。
プライマーとして550pmolのランダムヘキサマーを用いて、製造者のプロトコールに従い、SuperScript III(Invitrogen)を使用して、20μLの反応系で100〜600ngのFFPE RNAから、相補的DNA(cDNA)の第1鎖を作製する。製造者のプロトコールに従い、60μLのNEBNext Second Strand Synthesis Module(New England Biolabs)マスター混合液を添加し、16℃で150分間温置することにより、第1鎖合成の直後に、完全な2本鎖cDNAを生成させるための第2鎖合成を行う。2本鎖cDNAの品質および収率は、それぞれPicoGreen(Invitrogen)およびBioanalyzer High Sensitivity Chip(Agilent)を用いて評価し得る。一般に、全cDNA合成収率は、標準的なFMIライブラリ構築プロトコールへのインプットとして使用される。
本明細書中に記載のFFPE DNAに対するものと同様のプロトコールを使用して対形成末端適合性配列決定ライブラリの構築およびその後のハイブリッド選択およびFFPE RNAから生成されたcDNAの配列決定を行うが、FFPE RNAが高度に断片化されていることによりせん断する必要がなくなるため、エンドリペア段階から直接開始する。
FFPE RNAからの配列決定データの分析は、当技術分野で公知の方法を用いて行い得る。例えば、FFPE RNAからの配列決定データの分析は、全てのリード対を参照ゲノム配列(hg19)および/または参照トランスクリプトーム(既知の転写産物の配列の全て、例えばRefSeq)に対してマッピングすることによって行い得る。次いで、遺伝子融合、遺伝子配列における突然変異、オルタナティブスプライシングを同定するために、および、例えばBergerら(2010) Genome Res.20(4):413−27(PMID 20179022)およびGarberら(2011)Nat Methods.8(6):469−77(PMID 21623353)による文献に記載されるように遺伝子発現を定量するために、マッピングされたリードを使用する。Levinら(2009)Genome Biol.10(10):R115(PMID 19835606)により明らかにされるように、選択された一連の遺伝子における突然変異検出および融合発見を改善するために、標的RNA−seqを使用し得、発現プロファイリングのための定量的情報を保存する。
[実施例15]臨床腫瘍試料の超ディープ配列決定による高感度で正確な突然変異呼び出し
癌ゲノミクスの理解の急速な進歩および利用可能な標的治療数の増加は、包括的な腫瘍プロファイリングに基づく有効な癌処置のための機会の拡大をもたらす。研究の場では次世代配列決定によって腫瘍ゲノムを分析するための実験的および計算論的アプローチにおける重要な進歩があったが、これらの技術の臨床への拡張は重大なさらなる課題がある。これらの中でも重要であるのは、幅広い範囲の臨床で使用できる可能性がある突然変異に対して高感度および高精度を提供するという要件と相まって、臨床検体の純度および不均一性が限定的であることである。
この課題に取り組むために、発明者らは、通例のFFPE腫瘍試料から200+個の癌関連遺伝子の超ディープ配列データ(>700x)を生成させることが可能な臨床テストおよび低い割合で存在する様々なタイプの突然変異に対して高レベルの感度および精度を提供するためにこのデプスを活用可能である計算ツールを開発した。発明者らの分析パイプラインは、既知の突然変異頻度を考慮したマッピング配列データにおける短い変異体を検出し、代替法によって見逃されることが多いより大きい挿入および欠失を同定するために、切断点検出およびローカルアセンブリを組み合わせる。さらに、重要な癌遺伝子を含むコピー数の変化および再編成が同定される。
発明者らの新規開発方法の分析性能を検証するために、発明者らは、20種類の正常なHapMap細胞株および28種類の個別に特徴評価された癌細胞株を含め、異種DNAにおける稀な事象に対するモデルとして、試料混合物の広範な研究を計画し、実施した。発明者らは、両者ともPPV>99%で、置換に対して100%の感度および混合物の>10%に存在する長さ1〜50bpのインデルに対して>90%の感度を報告する。発明者らの試験を227検体の黒色腫、前立腺、乳房、大腸および肺の腫瘍試料のコホートに適用したところ、427個の既知の有力な体細胞ドライバー変異が明らかになり、そのうち40%が20%を下回る試料画分に存在し、18%が10%を下回る分画に存在し、高感度の突然変異呼び出しの重要性が明確に示される。
切除縁における癌突然変異の検出のための方法は、国際公開第2012/092426号パンフレットに記載されている。
[実施例16]B細胞血液悪性腫瘍におけるハイブリッド捕捉に基づく次世代配列決定を用いた免疫グロブリン配列の包括的プロファイリング
免疫グロブリンをコードする遺伝子を配列決定することは、B細胞白血病、リンパ腫および多発性骨髄腫を含むリンパ性悪性腫瘍を有する患者におけるクローン細胞集団の検出ならびに予後および治療的判断を行うことにおいて非常に重要である。B細胞悪性腫瘍における再編成免疫グロブリン配列を同定するための現在のアッセイは、一般的に、保存的な免疫グロブリン(IG)領域の配列特異的PCRに基づく増幅に依存する。この例は、重鎖および軽鎖可変ドメイン、相補性決定領域(CDR)配列および体細胞高頻度変異(SHM)状態の同定を可能にする、免疫グロブリン鎖を配列決定するための新規のハイブリッド捕捉に基づくアプローチを記載する。
可変(V)、多様(D)、連結(J)およびクラスセグメントを含む生殖系列免疫グロブリン(IG)配列は、重鎖については14番染色体上で1MBにわたり、ラムダ軽鎖については22番染色体上で344kbにわたり、カッパ軽鎖については2番染色体上で477kbにわたり広がる。正常なB細胞発生中のVDJ組み換えの間に、1つの単一V−D−J(約320塩基)配列が生じる。2つの主要なストラテジーを試験した。第1のストラテジーは、D、Jおよびクラスセグメントのみを引き付けることを含んだ。このストラテジーはRNAで成功することが示された。第2のストラテジーには、Vセグメントの付加または単離において引き付けることが含まれた。このストラテジーによって、RNAおよびDNA中のIGHV配列の同定が可能となった。
方法:
7種類のマントル細胞リンパ腫細胞(MCL)株および53検体の臨床の慢性リンパ球性白血病(CLL)骨髄穿刺液を含む60検体からRNAおよびDNAが首尾よく抽出された。免疫グロブリン可変、連結およびクラスセグメントを標的とするカスタムベイトセットを用いた溶液ハイブリダイゼーションによって、アダプター連結DNAおよびcDNA配列決定ライブラリを捕捉した。全ての捕捉ライブラリは、CLIA認定研究室(Foundation Medicine)において高デプス(Illumina HiSeq)に対して配列決定を行った。
対になった末端配列決定リードは、免疫グロブリン可変ドメインの反復領域と同じ長さのスケール(約50塩基)であることが多い。個々のVドメインのフレームワークおよびCDR領域は、互いに既知の相同性を有する。したがって、フレームワーク領域に対する1つの50塩基対のリードは、いくつかの異なる可変セグメントにマッピングされ得る可能性がある。さらに、アライメントにおいて使用されるHg19参照配列には、既知の生殖系列可変セグメント配列の全てが含有される訳ではない。例えば、4個の対立遺伝子IGHV3−2101、IGHV3−2102、IGHV3−2103、IGHV3−2104があるが、Hg19はIGHV3−2101、すなわち第1の対立遺伝子を含有する。これらの問題を解決するために、以下に記載の分析方法を設計した。
下記のプログラムを用いてクローンおよびSHMを呼び出すための分析を行った。本プログラムは、例えば次の段階を含む:(1)IGクラスまたは連結セグメントに対するキメラリードを選択すること;(2)IGHV、IGKVまたはIGLVセグメントに向かうリードについてこれらのリードをフィルタリングすること;(3)段階(2)における各候補Vセグメントに対してVドメインコンセンサス配列を構築すること(例えば、1〜300塩基対長配列を構築するために、マッピングされたリードから各50塩基対を取り出すこと。);および(4)IgBlastプログラムを通じて、段階(3)で構築した配列を実行する(これはVドメインを同定し、%SHM(www.ncbi.nlm.nih.gov/igblast/)の計算を与える。)。IgBlastは、SHM%計算およびCDR3配列の同定を可能にするIGMT配列データベース中の最も近い生殖系列適合VDJに対する配列決定されたIG鎖のアライメントのための、周知の有効な業界標準ツールである。
上記の自動化呼び出しを確認するために、各候補の手動レビューを行った。手動レビュー(自動化し得る。)は、例えば、次の段階を含む:(1)アライメント長に対するIgBlast出力を選定すること(例えば、200塩基長を下回るアライメントは考慮しない。);および(2)例えばCDR3配列が所与のクローンに対してほぼ同一であり、snpsは所与のリードクラスターに対してほぼ同一であり、マッピングされたリードが概して固有であり、リードが非ギャップのFR1からCDR3領域全体に位置することを確認すること。
成熟B細胞に由来する腫瘍細胞は、再編成された可変および連結セグメントを有する可能性が高いので、この分析は、腫瘍純度が比較的低い(例えば約20%の純度)場合でも強いシグナルを与えた。
結果:
CLIA認定の商業的なPCRに基づくアッセイ(Invivoscribe)を用いてプロファイリングされた、7種類のMCL細胞株および53種類のCLL試料を用いて、捕捉に基づくアプローチを検証した。7種類のMCL細胞系に由来する免疫グロブリン配列は、公開されている重鎖および軽鎖可変ドメインおよびパーセントSHMの同定と100%一致した。以前に臨床的検査を行った53検体の試料と比較することから、クローン集団の存在を同定するための98%(52/53)の一致およびIGHVドメインの同定に対して100%(39/39)の一致が示された。SHMについて以前に検査した50検体のCLL試料との比較の結果、SHMなしの場合は94%(31/33)、SHMが存在する場合は100%(17/17)の一致で、全体では96%(48/50)の一致となった。さらに、二次クローンを11検体の試料で同定した。
健常血液試料および濃縮血液試料を陰性対照として使用した。これらの試料は、VDJ再編成を有すべきであるが、モノクローナル集団は有さない。3検体の正常全血試料について、腫瘍クローンは同定されなかった。濃縮B細胞集団には、IGHVクラスター呼び出しがあった。全てがポリクローナルであることが分かり、腫瘍クローンとは呼ばれなかった。6つの陰性腫瘍クローン試料との100%一致があった。
結論:
この研究から、クローン性腫瘍B細胞集団の免疫グロブリン配列を包括的に特徴評価するために、ハイブリッド捕捉に基づく標的DNAおよびRNA配列決定を使用し得ることが明らかになった。この能力により、SHMの定量および可変ドメイン、CDR3配列およびクラス制限の同定が可能になる。包括的なゲノムプロファイリングアプローチとのこの方法論との統合は、血液悪性腫瘍がある患者におけるこのようなアッセイの臨床的有用性を拡大し、固形腫瘍を有する患者を含む免疫療法に対する患者の免疫腫瘍学および反応における重要な洞察を提供し得る。
[実施例17]標的DNA配列決定およびRNA配列決定を用いた血液悪性腫瘍に対する多重遺伝子分析
この実施例は、多くの血液悪性腫瘍試料から抽出されたゲノムDNAおよび全RNA上で標的DNA配列決定(DNA−seq)およびRNA配列決定(RNA−seq)を組み合わせることによる、臨床的に関連する条件下での様々なクラスのゲノム変化の高感度で特異的な検出を記載する。試験したゲノム変化としては、例えば塩基置換(Subs)、挿入および欠失(インデル)、局限的なコピー数変化(CNA)およびゲノム再編成が挙げられる。典型的な血液悪性腫瘍試料、例えばFFPE、血液および骨髄穿刺液を試験した。
この実施例に記載の試験は、DNA−seqベイトセットを含み、標的RNA−seq成分を組み込む。標的RNA−seq成分は、gDNAではなく相補的DNA(cDNA)に変換されたRNAをインプットとして利用する。DNA−seq単独と比較した場合、DNA−seqおよびRNA−seqを組み合わせる統合アッセイは、ゲノム再編成の検出に対する感度の改善をもたらす。
ゲノム再編成は、例えば、hg19参照ヒトゲノムアセンブリ、ゲノム配列および構造と比較した場合、非参照生成物を生成させるためのヒトゲノムの2つ以上の異なる領域の連結から生じる変化の異種クラスを含む。ゲノム配列再編成の結果として、非参照配列RNA転写産物もまた転写され得る。ゲノム再編成は、参照配列(RefSeq)遺伝子の外側(すなわち遺伝子外)または遺伝子のイントロンおよびエクソン内(すなわち遺伝子内)で生じるものの何れかとして分類し得る。例えば、MYCおよびIGHを含むプロモーターまたはエンハンサー関連事象などの遺伝子外再編成は、所与のmRNA転写産物または経路の発現の制御に影響を及ぼし得るが、mRNA配列を必ずしも変化させない。遺伝子内再編成は、2つ以上の遺伝子のエクソンおよび/またはイントロンを含み、ゲノムの異なる遺伝子および/または領域(例えば、異なる染色体、同じ染色体の異なる鎖)に由来する配列から構成されるキメラmRNA転写産物を生成させ得る。遺伝子融合は、2つ以上の遺伝子からの特定の反復的に再編成されたイントロンにおいて生じるゲノム再編成によって生成され得る。イントロンは、サイズ(>1kb)および/または配列(例えば反復構造)の制約ゆえに、十分なデプスまでDNA−seqによりカバーすることが困難であり得る。さらに、関連する限界点が知られていない可能性があるか、または遺伝子融合mRNA転写産物が複雑な再編成から生じ得、そのためDNA−seqによって関連する融合パートナーを同定することができない可能性があり得る。RNA−seqは、イントロンの配列決定およびDNA配列データからのmRNA構造の推定に依存するというのではなく、遺伝子融合のmRNA産物を直接特徴評価することによって、検出感度を改善する。
それ自体、代表的なDNA−seqベイトセットは、464個の遺伝子の完全エクソンカバレッジ(表1)、癌において反復的に再編成された31個の遺伝子における選択イントロンのカバレッジ(表2)および91個のさらなる遺伝子の完全なエクソンカバレッジ(表4)を含み;代表的なRNA−seq構成要素は、血液悪性腫瘍において反復的に再編成されることが知られている333個の遺伝子のエクソンを標的とするためにRNA−seqベイトセットを使用する(表3)。
RNA−seqおよびDNA−seqベイトセット試薬の調製
表1〜4に列挙した遺伝子を標的とするベイト配列を設計した。このベイトはUltramer合成化学を用いてIntegrated DNA Technology(IDT)で合成された。RNA−seqおよびDNA−seqベイトセット試薬を作製するために、IDTから受領した適切なベイトセットサブプールの等モル混合物を調製した。次いで、ベイトセット試薬を一回使用アリコートに分割し、−20℃で保存した。DNA−seqベイトセットの性能は、標準自動ハイブリッド捕捉プロトコールを用いてHapMapライブラリを捕捉することにより確認した。標準プロトコールを用いてHapMapライブラリおよびユニバーサルヒト参照RNA(UHRR)ライブラリを捕捉することにより、RNA−seqベイトセットの性能を確認した。
DNA−seqワークフロー
ゲノムDNA抽出、定量、せん断、ライブラリ構築、ハイブリッド捕捉および配列決定の方法は、実施例1〜6に記載されている。
RNA−seqワークフロー
RNAワークフローは、通常、同じ試料から抽出された適合RNAおよびDNAにおけるDNA−seqワークフローと並行して実行された。例えば、抽出されたRNAを最初にRNA特異的蛍光色素であるRibogreenで定量し、高品質インプット(例えば血液、BMA)からの300ngまでのRNAまたは低品質インプット(例えばFFPE)からの500ngのRNAを、2段階cDNA合成プロトコールのためのインプットとして正規化した。cDNA合成の第1段階において、インプットRNAに相補的な1本鎖DNA鎖が生成された。cDNA合成の第2段階において、1本鎖cDNAを2本鎖DNAに変換した。次いで2本鎖cDNAをライブラリ構築のためのインプットとして使用した。cDNAを高品質RNAから合成した場合、挿入物長が配列決定と適合することを確保するために、ライブラリ構築において使用する前にcDNAをせん断した。ライブラリ構築、ハイブリッド捕捉、定量および配列決定段階は、RNA−seqベイトセット試薬および関連する分析ファイルおよびプロトコールの使用を除いて、全て標準DNA−seqライブラリと同様に行う。
DNA−seqアーチファクトデータベースの作成
DNA−seqワークフローで偽陽性の変化の呼び出しを最小限に抑えるために、正常なHapMap細胞株から潜在的な配列決定アーチファクトのデータベースを作成した。例えば、20個の個々のHapMap細胞株からの200ngのDNAを標準ライブラリ構築のためのインプットとして使用した。次に、各ライブラリ2μgをDNA配列ベイトセットで捕捉した。捕捉ライブラリの配列決定を行い、標準分析パイプラインを通じて全データを処理した後、遺伝子に存在するあらゆる変異体呼び出しに基づいてアーチファクトデータベースを作成した。試料は正常なHapMap細胞株由来であったため、遺伝子中で検出された何れの非SNP変化も、アーチファクトであると考えられ、試験データをフィルタリングするために使用される。
R2 RNA−seqアーチファクトデータベースの作成
RNA−seqワークフローを用いた偽陽性ゲノム再編成の検出を最小限に抑えるために、RNA−seqデータにおける潜在的な工程関連、配列決定および分析アーチファクトのデータベースを作成した。例えば、8検体の正常血液試料からの300ngのRNAを高品質cDNA合成プロトコール用のインプットとして使用し、6検体の正常FFPE試料からの500ngのRNAを、低品質cDNA合成プロトコール用のインプットとして使用した。cDNA反応の全収量をライブラリ構築に対するインプットとして使用した。次に、各ライブラリの2μgをRNA−seqベイトセットで捕捉した。捕捉ライブラリの配列決定を行い、RNA−seq分析パイプラインを通じ全てのデータを処理した後、ゲノム再編成のアーチファクトデータベースを作成した。血液およびFFPE試料は正常ドナー由来であったため、検出された何れのゲノム再編成も人為的現象または生殖系列事象であると考えられ、試験データをフィルタリングするために使用される。
検証
DNA−seqベイトセットは、塩基置換、短い挿入および欠失の検出、および非同定臨床試料での局限的なコピー数変化について、非常に均一なカバレッジおよび精度を達成した。DNA−seqおよびRNA−seqからの統合的な結果は、細胞株混合物におけるゲノム再編成/遺伝子融合の検出に対して高い感度および特異性を達成した。このアッセイは非常に再現性が高く、ワークフローは、FFPE、血液および骨髄穿刺液を含む通例の血液腫瘍学臨床試料と広く適合していた。その結果は、76個の非同定臨床試料から得られた標準治療CLIA認証試験結果ともよく一致していた。
このアッセイは、塩基置換、インデル、局限的なCNAおよびゲノム再編成/遺伝子融合の検出において高い精度を達成した。DNA−seqデータは、52検体の非同定臨床試料にわたる塩基置換、インデルおよび局限的なCNAの検出に対するCLIA認定のDNA−seqアッセイとよく一致していた(>97%)。DNA−seqおよびRNA−seqデータセットからの統合的な結果は、39個の細胞株混合物にわたるゲノム再編成の検出に対して高い感度および特異性を達成した。この結果は、臨床試料をアッセイするために通例使用される外部基準CLIA認定の試験によって検出された塩基置換、インデルおよびゲノム再編成ともまた99%(101個の変化のうち100個)一致した。
13検体の試料の5回の異なる実施にわたりこのアッセイにより観察された精度は、性能仕様に合格し;試験内の精度は97%、試験間の精度は97%であった。カバレッジ基準に合格した試料に対する精選された既知のおよび可能性が高い塩基置換、インデル、局限的CNAおよびゲノム再編成/遺伝子融合の試験間の比較に基づいて精度を評価した。
塩基置換、インデルおよびCNAに対するこのアッセイの感度は、52検体の非同定臨床試料にわたるDNA−seqの結果を、CLIA認定のDNA−seqアッセイで以前に得られた結果と比較することによって評価した。この結果は、97.7%の一致度(171のうち167;95%CI:94〜99%)であり、標準アッセイ結果から、このアッセイが、塩基置換、インデルおよびCNAの検出について標準アッセイと同じ高い感度を有することが明らかになった。
ゲノム再編成/遺伝子融合に対するこのアッセイの感度は、既知のゲノム再編成を伴う21種類の細胞株の39種類の混合物(10%〜50%の混合比)から構成されるモデル系を用いて決定した。このアッセイは、ゲノム再編成の検出に対する非常に高い感度を達成し、全ての混合物にわたり167のうち165(98.5%;95%CI:96〜99%)の再編成を検出し、10%混合物において66のうち64(97%;95%CI:89〜99)のゲノム再編成を検出した。
塩基置換、インデルおよびCNAに対するこのアッセイの特異性は、52検体の非同定臨床試料にわたるDNA−seqの結果を、CLIA認定のDNA−seqアッセイで以前に得られた結果と比較することによって評価した。この結果は、97.7%の一致度(171のうち167;95%CI:94〜99%)であり、標準アッセイ結果から、このアッセイが、塩基置換、インデルおよびCNAの検出について標準アッセイと同じ高い特異性を有することが明らかになった。
ゲノム再編成/遺伝子融合に対するこのアッセイの特異性は、既知のゲノム再編成を伴う21種類の細胞株の39種類の混合物(10%〜50%の混合比)から構成されるモデル系を用いて決定した。このアッセイはゲノム再編成の検出に対する非常に高い特異性を達成し、全ての混合物にわたり165の真の陽性再編成のうち4個の偽陽性再編成を呼び出した。
参照による組み込み
個々の刊行物、特許または特許出願のそれぞれが具体的かつ個別に参照により組み込まれることが示されるように、本明細書中で言及される刊行物、特許および特許出願は全て、それらの全体において参照により本明細書によって組み込まれる。矛盾する場合には、本明細書中のあらゆる定義を含め、本出願が支配する。
tigr.orgのワールドワイドウェブ上でThe Institute for Genomic Research(TIGR)および/またはncbi.nlm.nih.govのワールドワイドウェブ上でNational Center for Biotechnology Information(NCBI)によって維持されているものなどの公開データベースにおいてエントリーと相関する受託番号を参照するあらゆるポリヌクレオチドおよびポリペプチド配列もそれらの全体において参照により組み込まれる。
同等物
当業者は、本明細書中に記載の本発明の具体的な実施形態に対する多くの同等物を認識するか、または日常的な実験のみを用いて確認することができよう。このような同等物は、続く特許請求の範囲によって包含されるものとする。

Claims (21)

  1. 固形腫瘍を有するか、移植片レシピエントであるか、または、感染もしくは感染性疾患を有する対象における、対象区間のクローンプロファイルを評価または提供する方法であって、下記:
    (a)各メンバーが前記対象からの核酸分子を含む複数のメンバーを含む核酸ライブラリを得ること;
    (b)前記ライブラリをベイトセットと接触させ、それぞれの選択メンバーが前記対象区間を含む複数の選択メンバーまたはその一部を提供すること;
    (c)前記対象区間の1回以上の出現の配列を得て、それによって前記対象区間のクローンプロファイルを提供または評価すること
    を含み、
    前記ベイトセットが複数のベイトを含み、各ベイトが、親和性タグと、選択メンバーにハイブリッド形成する核酸分子とを含み、
    前記対象区間が、Igスーパーファミリー受容体もしくはその断片、または、抗体もしくはその断片をコードする配列を含む、方法。
  2. 下記(i)〜(vi)のうちの1または複数を含む、請求項1に記載の方法:
    (i)段階(a)が前記対象からの核酸を断片化することを含む、
    (ii)段階(b)が、溶液ハイブリダイゼーションの条件下で前記ライブラリを前記ベイトセットと接触させることを含む、
    (iii)段階(b)が、表面ベースのハイブリダイゼーションの条件下で前記ライブラリを前記ベイトセットと接触させることを含む、
    (iv)複数の選択メンバーを増幅すること、
    (v)段階(c)が、
    前記ライブラリからのメンバー(またはライブラリキャッチ)からの対象区間に対する読み取り(read)を得ること;および
    複数のメンバーのそれぞれについて、前記対象区間内のヌクレオチド位置に対する前記読み取り(read)からヌクレオチド値を割り当てること
    を含む、または
    (vi)段階(c)が、
    メンバーからサブゲノム区間に対する読み取り(read)を得ること;
    アライメント方法によって前記読み取り(read)をアライメントすること;および
    予め選択されたヌクレオチド位置に対して前記読み取り(read)からヌクレオチド値を割り当てること
    を含む。
  3. 前記対象区間での第1の対立遺伝子またはシグネチャーの配列を比較値と比較することを含む、請求項1または2に記載の方法。
  4. (d)下記:
    (d)(i)前記対象区間での配列、シグネチャーまたは対立遺伝子の分布、発現、存在量または同一性についての値;または
    (d)(ii)体細胞高頻度変異から生じる変性、VD、DJもしくはVJ連結から生じる配列可変性、または、シグネチャーもしくは対象区間内のCDR配列可変性についての値
    を得ることをさらに含む、請求項1〜3のいずれか1項に記載の方法。
  5. (i)第1の対象区間での、配列、対立遺伝子またはシグネチャーのクローンプロファイル、および
    (ii)(A)前記対象の表現型、または、(ii)(B)第2の対象区間での遺伝子型
    を提供する、請求項1〜4のいずれか1項に記載の方法。
  6. 段階(c)が、
    (i)前記対象区間の複数の出現のそれぞれの配列を得ること、または
    (ii)前記対象区間および第2の異なる対象区間の配列を得ること
    を含む、請求項1〜5のいずれか1項に記載の方法。
  7. 評価することが、下記(i)〜(xxv)のうちの1または複数を含む、請求項1〜6のいずれか1項に記載の方法:
    (i)癌のクローンに対するクローンプロファイルを提供すること、または
    (ii)癌のクローンに対するクローンプロファイルを提供すること、および、癌の第2のクローンに対するクローンプロファイルを提供すること、または
    (iii)癌の第2のクローンの存在量に対する、癌の第1クローンの存在量についての値を提供すること、または
    (iv)第1のVセグメントに対するクローンプロファイルを提供すること、または
    (v)第1のVセグメントに対するクローンプロファイル、および、第2のVセグメントに対するクローンプロファイルを提供すること、または
    (vi)第1のVセグメントおよび第2のVセグメントの相対的存在量についての値を提供すること、または
    (vii)第1のDセグメントに対するクローンプロファイルを提供すること、または
    (viii)第1のDセグメントに対するクローンプロファイルおよび第2のDセグメントに対するクローンプロファイルを提供すること、または
    (ix)第1のDセグメントおよび第2のDセグメントの相対的存在量についての値を提供すること、または
    (x)第1のJセグメントに対するクローンプロファイルを提供すること、または
    (xi)第1のJセグメントに対するクローンプロファイルおよび第2のJセグメントに対するクローンプロファイルを提供すること、または
    (xii)第1のJセグメントおよび第2のJセグメントの相対的存在量についての値を提供すること、または
    (xiii)第1のVDJまたはVJの組み合わせに対するクローンプロファイルを提供すること、または
    (xiv)第1のVDJまたはVJの組み合わせに対するクローンプロファイルおよび第2のVDJまたはVJの組み合わせに対するクローンプロファイルを提供すること、または
    (xv)第1のVDJまたはVJの組み合わせおよび第2のVDJまたはVJの組み合わせの相対的存在量についての値を提供すること、または
    (xvi)抗体軽鎖に対するクローンプロファイルを提供すること、または
    (xvii)抗体軽鎖に対するクローンプロファイルおよび抗体重鎖に対するクローンプロファイルを提供すること、または
    (xviii)抗体軽鎖および抗体重鎖の相対的存在量についての値を提供すること、または
    (xix)サブゲノム区間における配列、対立遺伝子またはシグネチャーに対するクローンプロファイルを提供すること、または
    (xx)発現サブゲノム区間における配列、対立遺伝子またはシグネチャーに対するクローンプロファイルを提供すること、または
    (xxi)サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての、および発現サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての、相対的存在量に対する値を提供すること、または
    (xxii)対象区間中の遺伝子座における高頻度変異に対する可変性を提供すること、または
    (xxiii)対象区間でVD、DJまたはVJ連結部から生じる可変性を提供すること、
    (xxiv)対象区間中のCDRにおける可変性を提供すること、または
    (xxv)下記のいずれかについての配列または当該配列を含む細胞に対するクローンプロファイルを提供すること。
    Figure 0006905934
  8. (d)(i)についての値を得ることを含む、請求項4に記載の方法。
  9. (1)前記(d)(i)の値が、比較値に対する、対象区間における配列、シグネチャーまたは対立遺伝子の存在量についての値を含む、
    (2)前記(d)(i)の値が、比較値に対する、対象区間における事象の存在量についての値を含む、
    (3)前記(d)(i)の値が、対象区間でX個の固有の配列、シグネチャーまたは対立遺伝子のそれぞれについての相対的存在量の値を含む(ここで、Xは3以上である)、または
    (4)前記方法が、前記(d)(i)の値を表示することをさらに含む、または
    (5)前記対象区間が、Igスーパーファミリー受容体からの配列を含む、または
    (6)前記対象区間が、Vセグメント、DセグメントまたはJセグメントからの配列を含む、または
    (7)前記対象区間が下記のいずれかの配列を含む、
    Figure 0006905934

    (8)前記方法が、Vセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、または
    (9)前記方法が、複数のVセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、または
    (10)前記方法が、Jセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、または
    (11)前記方法が、複数のJセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、または
    (12)前記方法が、Dセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、または
    (13)前記方法が、複数のDセグメント配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、または
    (14)前記方法が、クラススイッチ領域配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、または
    (15)前記方法が、複数のクラススイッチ領域配列、シグネチャーまたは対立遺伝子についての相対的存在量を提供することを含む、請求項8に記載の方法。
  10. (d)(ii)についての値を得ることを含む、請求項4、8および9のいずれか1項に記載の方法。
  11. (1)前記方法が、体細胞高頻度変異からの可変性についての値を得ることを含む、または
    (2)前記方法が、VD、DJまたはVJ連結部から生じる可変性についての値を得ることを含む、または
    (3)前記方法が、CDRの可変性から生じる可変性についての値を得ることを含む、または
    (4)前記対象区間が下記のいずれかの配列を含む、または
    Figure 0006905934

    (5)前記方法が、前記対象区間の複数の固有のコピーの配列を得ることを含む、または
    (6)前記(d)(ii)における値が、前記対象区間に対する複数のシグネチャーにおける配列多様性についての値を含む、または
    (7)前記値が、前記対象区間における固有のシグネチャーの数を含む、または
    (8)前記値が、前記対象区間における固有のシグネチャーの表示、記録または一覧を含む、または
    (9)前記値が、固有のコピーの数の尺度を含む、または
    (10)前記可変性が、セグメント連結からの可変性を含む、または
    (11)前記可変性が、体細胞高頻度変異からの可変性を含む、または
    (12)前記核酸ライブラリが、B細胞から作製される、または
    (13)前記対象区間が、B細胞受容体からの、V、DもしくはJセグメントまたはVDもしくはDJ連結部をコードする配列を含む、または
    (14)前記方法が、可変性の量を比較値と比較することをさらに含み、前記比較値との予め選択された関係が、疾患の、転帰、予後またはステージを示す、請求項10に記載の方法。
  12. 前記核酸ライブラリを以下と接触させることを含む、請求項1〜11のいずれか1項に記載の方法:
    (i)単一のベイトセット、または
    (ii)複数のベイトセット、または
    (iii)前記対象区間での配列;もしくは
    前記対象区間でのシグネチャー;もしくは
    前記対象区間での対立遺伝子
    を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する、ベイトセット、または
    (iv)前記対象区間での第2の配列;もしくは
    前記対象区間での第2のシグネチャー;もしくは
    前記対象区間での第2の対立遺伝子
    を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する、第2のベイトセット、または
    (v)複数の固有のベイトセット
    (ここで、前記複数のベイトセットのそれぞれが、
    前記対象区間からの異なる配列;もしくは
    前記対象区間での異なるシグネチャー;もしくは
    前記対象区間での異なる対立遺伝子
    を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する)、または
    (vi)前記対象区間での第1の配列および第2の配列;もしくは
    前記対象区間での第1のシグネチャーおよび第2のシグネチャー;もしくは
    前記対象区間での第1の対立遺伝子および第2の対立遺伝子
    を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する、ベイトセット、または
    (vii)前記対象区間からの少なくともX個の配列;もしくは
    前記対象区間での少なくともX個のシグネチャー;もしくは
    前記対象区間での少なくともX個の対立遺伝子
    (ここでXが、独立に、2、3、4、5、6、7、8、9、10、50、100または200と同等である)
    を捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する、ベイトセット、または
    (viii)前記対象もしくは試料中において対象区間で存在しない、第1の配列、対立遺伝子またはシグネチャーを、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する、ベイトセット、または
    (ix)第1のV、DまたはJセグメントからの配列および第2のV、DまたはJセグメントからの配列を、捕捉する、特異的に捕捉する、予め選択された効率で捕捉する、捕捉するように最適化されている、またはそれとハイブリッド形成する、ベイトセット、または
    (x)DまたはJセグメントではなくVセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成する、ベイトセット、または
    (xi)VまたはJセグメントではなくDセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成する、ベイトセット、または
    (xii)VまたはDセグメントではなくJセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成する、ベイトセット、または
    (xiii)Vセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成する、ベイトセット、または
    (xiv)Dセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成する、ベイトセット、または
    (xv)Jセグメントを捕捉するように最適化されているかまたはそれとハイブリッド形成する、ベイトセット、または
    (xvi)VD、DJまたはVJ連結部にまたがる(1つまたは複数の)ベイトを含む、ベイトセット、または
    (xvii)再編成されたVDJまたはVJ配列にまたがる(1つまたは複数の)ベイトを含む、ベイトセット、または
    (xviii)核酸類似体を含む(1つまたは複数の)ベイトを含む、ベイトセット、または、
    (xix)機能的であるために十分に長いが、メンバーに対する最適化された親和性を有するのに十分短い(1つまたは複数の)ベイトを含む、ベイトセット。
  13. 以下を含む、請求項1〜12のいずれか1項に記載の方法:
    (i)サブゲノム区間の配列を得ることおよび発現サブゲノム区間の配列を得ること、または
    (ii)サブゲノム区間のクローンプロファイルを評価すること、または
    (iii)発現サブゲノム区間のクローンプロファイルを評価すること、または
    (iv)サブゲノム区間のクローンプロファイルを評価することおよび発現サブゲノム区間のクローンプロファイルを評価すること、または
    (v)サブゲノム区間に存在するシグネチャーの発現の出現またはレベルを評価すること、または
    (vi)サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての、および発現サブゲノム区間中の配列、対立遺伝子またはシグネチャーについての相対的存在量に対する値を提供すること、または
    (vii)前記対象区間の複数の出現のそれぞれの配列を得ること
    (ここで、請求項1の段階(a)、(b)または(c)のうちの少なくとも1つが、前記対象区間の第1の出現に対して、および前記対象区間の第2の出現に対して個別に行われる):または
    (viii)前記対象区間の複数の出現のそれぞれの配列を得ること
    (ここで、請求項1の段階(a)、(b)または(c)のうちの少なくとも1つが、前記対象区間の第1の出現に対して、および対象区間の第2の出現に対して同じ反応混合物中で行われる):または
    (ix)前記対象区間および第2の異なる対象区間の配列を得ること
    (ここで、請求項1の段階(a)、(b)または(c)のうち少なくとも1つが、前記第1の対象区間に対して第1の反応混合物、および前記第2の対象区間に対して第2の反応混合物中で行われる):または
    (x)予め選択された期間の経過;もしくは
    障害の遺伝子型における変化;もしくは
    障害の発現における変化;もしくは
    処置への反応性欠如;もしくは
    疾患もしくは障害の進行、再燃、再発または持続性
    の後に、請求項1の段階(a)〜(d)を反復すること;または
    (xiii)(a)染色体DNAから作製された核酸ライブラリからのサブゲノム区間のクローンプロファイルを評価すること;および(b)RNAから作製された核酸ライブラリからの発現サブゲノム区間のクローンプロファイルを評価すること。
  14. (i)前記核酸ライブラリが、染色体DNAから作製される、または
    (ii)前記核酸ライブラリが、RNAから作製される、または
    (iii)前記核酸ライブラリが、疾患状態組織から作製される、または
    (iv)前記核酸ライブラリが、固形腫瘍からの細胞から作製される、または
    (v)前記核酸ライブラリが、浸潤固形腫瘍を有する細胞から作製される、または
    (vi)前記核酸ライブラリが、血液悪性腫瘍からの細胞から作製される、または
    (vii)前記核酸ライブラリが無細胞DNAから作製される、または
    (viii)前記核酸ライブラリが、非疾患状態の組織から作製される、または
    (ix)前記核酸ライブラリが、末梢血、骨髄、腫瘍組織、腫瘍浸潤物、リンパ球、B細胞、プレB細胞、成熟B細胞、T細胞または無細胞DNAから作製される、または
    (x)前記核酸ライブラリが、腫瘍浸潤細胞、腫瘍浸潤B細胞、プレB細胞、成熟B細胞またはT細胞から作製される、または
    (xi)前記核酸ライブラリが、末梢B細胞、プレB細胞、成熟B細胞またはT細胞から作製される、または
    (xii)前記方法が、非疾患状態組織に対するクローンプロファイルを評価することを含む、または
    (xiii)前記方法が、疾患状態組織に対するクローンプロファイルを評価することを含むか、または
    (xiv)前記核酸ライブラリがT細胞から作製され、前記サブゲノム区間がT細胞受容体をコードする配列を含む、請求項1〜13のいずれか1項に記載の方法。
  15. 下記を含む、請求項1〜14のいずれか1項に記載の方法:
    (i)(a)第1の細胞タイプからの対象区間のクローンプロファイルを評価すること;および
    (b)第2の細胞タイプからの対象区間のクローンプロファイルを評価すること;
    (ii)(a)第1の細胞タイプからの対象区間のクローンプロファイルを評価すること;
    (b)第2の細胞タイプからの対象区間のクローンプロファイルを評価すること;および
    (c)(a)および(b)で提供される評価を比較すること、または
    (iii)(a)染色体DNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;および
    (b)RNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;または
    (iv)(a)染色体DNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;
    (b)RNAから作製されたライブラリからの対象区間のクローンプロファイルを評価すること;および
    (c)段階(a)および(b)で提供される評価を比較すること、または
    (vi)(a)第1の期間に対象区間のクローンプロファイルを評価すること;および
    (b)第2の期間に対象区間のクローンプロファイルを評価すること;または
    (vii)(a)第1の期間に対象区間のクローンプロファイルを評価すること;および
    (b)第2の期間に対象区間のクローンプロファイルを評価すること;および
    (c)段階(a)および(b)で提供される評価を比較すること、または
    (viii)疾患状態細胞からの第1の対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること;および、疾患状態細胞からの第2の異なる対象区間からの、配列、対立遺伝子またはシグネチャーのクローンプロファイルを評価すること。
  16. 前記対象が、固形腫瘍を有する、請求項1〜15のいずれか1項に記載の方法。
  17. 前記対象区間が、
    (i)下記のいずれかの配列、
    Figure 0006905934

    (ii)V、DまたはJセグメント、または
    (iii)クローン事象を代表する、ヌクレオチド位置または連結部または配列、または
    (iv)T細胞クローンまたはB細胞クローンを代表する、ヌクレオチド位置または連結部または配列
    を含む、請求項1〜16のいずれか1項に記載の方法。
  18. (i)前記方法が、前記複数のメンバーの各メンバー中の対象からの核酸の5’または3’末端にアダプター配列を付着させることを含む、または
    (ii)前記複数のメンバーの各メンバーが、5’から3’方向に、5’アダプター配列、対象配列および3’アダプターを含む、または
    (iii)前記複数のメンバーの各メンバーが、5’から3’方向に、5’アダプター配列、対象配列および3’アダプター配列を含み、前記アダプター配列のうち1つが、識別子を含む、または
    (iv)前記複数のものの各メンバーが、前記アダプター配列に特異的なプライマーで増幅される、または
    (v)前記複数のものの各メンバーが、前記5’アダプター配列に結合するプライマーまたは前記3’アダプター配列に結合するプライマーを含むプライマーセットを用いて増幅される、または
    (vi)前記複数のものの各メンバーが、前記5’アダプター配列に結合するプライマーを含むプライマーセットを用いて増幅される、または
    (vii)前記複数のものの各メンバーが、前記3’アダプター配列に結合するプライマーを含むプライマーセットを用いて増幅される、または
    (viii)前記複数のものの各メンバーが、前記アダプター配列に特異的なプライマーおよび前記メンバーにおける標的/対象核酸に特異的なプライマーを用いて増幅される、
    請求項1〜17のいずれか1項に記載の方法。
  19. 下記を含む、請求項1〜18のいずれか1項に記載の方法:
    (i)(a)第1の細胞タイプからの第1の対象区間のクローンプロファイルを評価すること;および
    (b)第2の対象区間の配列を提供すること、または
    (ii)(a)前記第1の対象区間のクローンプロファイルを評価すること;および
    (b)第2の細胞タイプからの、第2、第3または少なくともX個のさらなる対象区間の配列を提供すること(ここでXは、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500に等しい。)、または
    (iii)(a)第1の細胞タイプからの、第1の、第2の、または少なくともX個のさらなる対象区間のクローンプロファイルを評価すること(ここでXは、3、4、5、6、7、8、9、10、50、100、150、200、250、300、350、400、450または500に等しい。);および
    (b)(X+1)番目の対象区間の配列を提供すること、または
    (iv)(a)1つ以上の対象区間のクローンプロファイルを評価すること;および
    (b)1つ以上の対象区間の配列を提供すること。
  20. 前記核酸ライブラリが、固形腫瘍からの細胞で作製されている、請求項1〜19のいずれか1項に記載の方法。
  21. 前記核酸ライブラリが、腫瘍浸潤リンパ球由来の核酸分子を含む、請求項1〜20のいずれか1項に記載の方法。
JP2017530219A 2014-12-05 2015-12-04 腫瘍試料の多重遺伝子分析 Active JP6905934B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021106868A JP7245872B2 (ja) 2014-12-05 2021-06-28 腫瘍試料の多重遺伝子分析

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462088457P 2014-12-05 2014-12-05
US62/088,457 2014-12-05
PCT/US2015/064044 WO2016090273A1 (en) 2014-12-05 2015-12-04 Multigene analysis of tumor samples

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021106868A Division JP7245872B2 (ja) 2014-12-05 2021-06-28 腫瘍試料の多重遺伝子分析

Publications (3)

Publication Number Publication Date
JP2018502563A JP2018502563A (ja) 2018-02-01
JP2018502563A5 JP2018502563A5 (ja) 2019-01-24
JP6905934B2 true JP6905934B2 (ja) 2021-07-21

Family

ID=56092542

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017530219A Active JP6905934B2 (ja) 2014-12-05 2015-12-04 腫瘍試料の多重遺伝子分析
JP2021106868A Active JP7245872B2 (ja) 2014-12-05 2021-06-28 腫瘍試料の多重遺伝子分析

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021106868A Active JP7245872B2 (ja) 2014-12-05 2021-06-28 腫瘍試料の多重遺伝子分析

Country Status (7)

Country Link
US (2) US11959141B2 (ja)
EP (2) EP4112738B1 (ja)
JP (2) JP6905934B2 (ja)
AU (2) AU2015357573B2 (ja)
CA (1) CA2967447A1 (ja)
HK (1) HK1245345A1 (ja)
WO (1) WO2016090273A1 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210131432A (ko) 2010-12-30 2021-11-02 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
EP3907297A1 (en) 2011-04-15 2021-11-10 The Johns Hopkins University Safe sequencing system
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
PL2912468T3 (pl) 2012-10-29 2019-04-30 Univ Johns Hopkins Test papanicolaou pod kątem raka jajnika i endometrium
EP3561072A1 (en) 2012-12-10 2019-10-30 Resolution Bioscience, Inc. Methods for targeted genomic analysis
US11959141B2 (en) 2014-12-05 2024-04-16 Foundation Medicine, Inc. Multigene analysis of tumor samples
KR20170125044A (ko) 2015-02-10 2017-11-13 더 차이니즈 유니버시티 오브 홍콩 암 스크리닝 및 태아 분석을 위한 돌연변이 검출법
SG10202106935UA (en) 2015-07-23 2021-08-30 Univ Hong Kong Chinese Analysis of fragmentation patterns of cell-free dna
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
CA3004435A1 (en) 2015-11-11 2017-05-18 Resolution Bioscience, Inc. High efficiency construction of dna libraries
EP3443149B1 (en) * 2016-04-15 2024-08-14 University Health Network (UHN) Hybrid-capture sequencing for determining immune cell clonality
JP7093764B2 (ja) * 2016-08-03 2022-06-30 セルジーン コーポレイション 骨髄異形成症候群の治療方法
KR102505122B1 (ko) 2016-08-25 2023-03-08 레졸루션 바이오사이언스, 인크. Dna 샘플 중 게놈 카피 변화의 검출을 위한 방법
CA3041647A1 (en) 2016-10-24 2018-05-03 The Chinese University Of Hong Kong Methods and systems for tumor detection
DK3574108T3 (da) 2017-01-25 2024-09-16 Univ Hong Kong Chinese Diagnostisk anvendelse ved brug af nukleinsyrefragment
WO2018156904A1 (en) * 2017-02-23 2018-08-30 University Of Iowa Research Foundation Methods for identification of driver mutations in a patient tumor by mutation processing based reconstruction of tumor developmental history
CA3064312A1 (en) 2017-05-30 2018-12-06 University Health Network Hybrid-capture sequencing for determining immune cell clonality
CN111868260A (zh) 2017-08-07 2020-10-30 约翰斯霍普金斯大学 用于评估和治疗癌症的方法和材料
TWI793151B (zh) 2017-08-23 2023-02-21 瑞士商諾華公司 3-(1-氧異吲哚啉-2-基)之氫吡啶-2,6-二酮衍生物及其用途
US11773449B2 (en) 2017-09-01 2023-10-03 The Hospital For Sick Children Profiling and treatment of hypermutant cancer
WO2019113563A1 (en) * 2017-12-09 2019-06-13 Viome, Inc. Methods for nucleic acid library creation
ES2983417T3 (es) 2018-01-29 2024-10-23 St Jude Childrens Res Hospital Inc Método para la amplificación de ácidos nucleicos
JP7217893B2 (ja) * 2018-02-06 2023-02-06 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・ミシガン 光学組織像の分析及び遠隔読影のためのシステム及び方法
AU2019249422A1 (en) 2018-04-02 2020-10-15 Grail, Llc Methylation markers and targeted methylation probe panels
CN110468201B (zh) * 2018-05-11 2023-08-11 中国医学科学院肿瘤医院 Escc频繁突变基因的靶向测序及其在获得判断escc预后的生物标记物中的应用
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
BR112020024727A2 (pt) * 2018-06-11 2021-03-23 Foundation Medicine, Inc. composições e métodos para avaliação de alterações genômicas
AR116109A1 (es) 2018-07-10 2021-03-31 Novartis Ag Derivados de 3-(5-amino-1-oxoisoindolin-2-il)piperidina-2,6-diona y usos de los mismos
US11192877B2 (en) 2018-07-10 2021-12-07 Novartis Ag 3-(5-hydroxy-1-oxoisoindolin-2-yl)piperidine-2,6-dione derivatives and uses thereof
EP3856903A4 (en) 2018-09-27 2022-07-27 Grail, LLC METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL
EP3997243A4 (en) * 2019-07-12 2023-08-30 Tempus Labs ADAPTIVE ORDER EXECUTION AND FOLLOW-UP PROCESSES AND SYSTEMS
CN110716044B (zh) * 2019-10-23 2023-04-18 郑州大学 一种用于食管鳞癌早期筛查和诊断的血清蛋白标志物、试剂盒及检测方法
CN113275053A (zh) 2020-02-03 2021-08-20 帝肯基因组学公司 试剂存储系统
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
EP4139477A4 (en) * 2020-04-21 2024-05-22 Tempus AI, Inc. TCR/BCR PROFILING
CN112322716B (zh) * 2020-11-25 2021-07-30 深圳泛因医学有限公司 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置
CN116064792B (zh) * 2022-08-11 2023-10-27 山东大学 一种用于结直肠癌诊断的多基因dna甲基化联合检测试剂盒及应用
CN116445478B (zh) * 2023-06-12 2023-09-05 北京旌准医疗科技有限公司 一种构建ighv基因文库的引物组合及其应用

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6495676B1 (en) 1993-04-13 2002-12-17 Naxcor Nucleic acid sequence detection employing probes comprising non-nucleosidic coumarin derivatives as polynucleotide-crosslinking agents
US20040161741A1 (en) 2001-06-30 2004-08-19 Elazar Rabani Novel compositions and processes for analyte detection, quantification and amplification
US20040022764A1 (en) 2002-07-31 2004-02-05 Hanan Polansky Inhibition of microcompetition with a foreign polynucleotide as treatment of chronic disease
ATE437945T1 (de) 2003-01-29 2009-08-15 454 Corp Verfahren zur amplifikation und sequenzierung von nukleinsäuren
US20050209787A1 (en) 2003-12-12 2005-09-22 Waggener Thomas B Sequencing data analysis
CA2557841A1 (en) 2004-02-27 2005-09-09 President And Fellows Of Harvard College Polony fluorescent in situ sequencing beads
TWI287041B (en) 2005-04-27 2007-09-21 Jung-Tang Huang An ultra-rapid DNA sequencing method with nano-transistors array based devices
US20060275779A1 (en) 2005-06-03 2006-12-07 Zhiyong Li Method and apparatus for molecular analysis using nanowires
US20070194225A1 (en) 2005-10-07 2007-08-23 Zorn Miguel D Coherent electron junction scanning probe interference microscope, nanomanipulator and spectrometer with assembler and DNA sequencing applications
US8383338B2 (en) 2006-04-24 2013-02-26 Roche Nimblegen, Inc. Methods and systems for uniform enrichment of genomic regions
US20080131887A1 (en) 2006-11-30 2008-06-05 Stephan Dietrich A Genetic Analysis Systems and Methods
CA2686211C (en) 2007-05-03 2018-08-21 One Lambda Inc. Methods of screening for binding interaction using sets of microparticles and unique probes
US8518640B2 (en) 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
WO2009099602A1 (en) 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
JP5955557B2 (ja) 2008-09-03 2016-07-20 ザ・ジョンズ・ホプキンス・ユニバーシティー 膵臓腫瘍形成の根底にある経路および遺伝性の膵癌遺伝子
US8628927B2 (en) * 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US8748103B2 (en) * 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US20110236903A1 (en) 2008-12-04 2011-09-29 Mcclelland Michael Materials and methods for determining diagnosis and prognosis of prostate cancer
CN101619350B (zh) 2009-01-23 2012-05-16 周宏灏 用于恶性肿瘤个体化用药相关基因突变检测的基因芯片及其应用
WO2010094772A1 (en) 2009-02-20 2010-08-26 Febit Holding Gmbh Synthesis of sequence-verified nucleic acids
US20100286143A1 (en) 2009-04-24 2010-11-11 Dora Dias-Santagata Methods and materials for genetic analysis of tumors
CA2764468C (en) 2009-06-05 2021-11-16 Myriad Genetics, Inc. Methods of detecting cancer comprising screening for mutations in the apc, egfr, kras, pten and tp53 genes
CN104673899A (zh) 2010-05-06 2015-06-03 赛昆塔公司 利用克隆型谱监测健康和疾病状态
KR20210131432A (ko) 2010-12-30 2021-11-02 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
SG2014012728A (en) * 2011-08-23 2014-06-27 Foundation Medicine Inc Novel kif5b-ret fusion molecules and uses thereof
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9279159B2 (en) * 2011-10-21 2016-03-08 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
DK2872629T3 (da) * 2012-07-03 2019-12-09 Integrated Dna Tech Inc Tm-forstærkede blokeringsoligonukleotider og lokkemidler til forbedret target-berigesle og reduceret off-target-udvælgelse
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
PT2893040T (pt) 2012-09-04 2019-04-01 Guardant Health Inc Métodos para deteção de mutações raras e de variação do número de cópias
WO2014130975A1 (en) 2013-02-22 2014-08-28 Bastian Boris C Fusion polynucleotides and fusion polypeptides associated with cancer and particularly melanoma and their uses as therapeutic and diagnostic targets
CA2904899A1 (en) * 2013-03-11 2014-10-09 Elim Biopharmaceuticals, Inc. Enrichment and next generation sequencing of total nucleic acid comprising both genomic dna and cdna
EP3795696B1 (en) 2013-03-15 2023-04-26 The Board of Trustees of the Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
EP2981624B1 (en) * 2013-04-05 2019-12-18 Myriad Genetics, Inc. Methods for assessing homologous recombination deficiency and predicting response to cancer treatment
EP2994847A4 (en) 2013-05-10 2017-04-19 Foundation Medicine, Inc. Analysis of genetic variants
US9708657B2 (en) * 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
EA034459B1 (ru) 2013-08-05 2020-02-11 Твист Байосайенс Корпорейшн Синтезированные de novo библиотеки генов
CN111534580B (zh) 2013-12-28 2024-06-04 夸登特健康公司 用于检测遗传变异的方法和系统
US11959141B2 (en) 2014-12-05 2024-04-16 Foundation Medicine, Inc. Multigene analysis of tumor samples
MX2018010362A (es) 2016-02-29 2019-03-28 Found Medicine Inc Metodos y sistemas para evaluar carga mutacional de tumores.
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
BR112020024727A2 (pt) 2018-06-11 2021-03-23 Foundation Medicine, Inc. composições e métodos para avaliação de alterações genômicas

Also Published As

Publication number Publication date
EP4112738B1 (en) 2024-07-24
AU2015357573A1 (en) 2017-05-25
US20170356053A1 (en) 2017-12-14
US11959141B2 (en) 2024-04-16
WO2016090273A1 (en) 2016-06-09
AU2022204826A1 (en) 2022-09-22
JP7245872B2 (ja) 2023-03-24
US20240327926A1 (en) 2024-10-03
EP3227464A1 (en) 2017-10-11
JP2018502563A (ja) 2018-02-01
AU2015357573B2 (en) 2022-04-07
JP2021166532A (ja) 2021-10-21
EP3227464B1 (en) 2022-04-20
HK1245345A1 (zh) 2018-08-24
EP4112738A1 (en) 2023-01-04
EP4112738C0 (en) 2024-07-24
AU2022204826B2 (en) 2024-05-23
EP3227464A4 (en) 2018-10-31
CA2967447A1 (en) 2016-06-09

Similar Documents

Publication Publication Date Title
JP7245872B2 (ja) 腫瘍試料の多重遺伝子分析
JP7317078B2 (ja) 腫瘍変異負荷を評価するための方法及びシステム
US20220056534A1 (en) Methods for analysis of circulating cells
JP6054303B2 (ja) 腫瘍試料の多重遺伝子分析の最適化
US20220243279A1 (en) Systems and methods for evaluating tumor fraction
US20200149097A1 (en) Compositions and methods for evaluating genomic alterations
US20220282305A1 (en) Methods of nucleic acid sample preparation
RU2811503C2 (ru) Способы выявления и мониторинга рака путем персонализированного выявления циркулирующей опухолевой днк

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181203

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210628

R150 Certificate of patent or registration of utility model

Ref document number: 6905934

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250