[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6991134B2 - 無細胞dnaを使用する集団ベースの処置レコメンダ - Google Patents

無細胞dnaを使用する集団ベースの処置レコメンダ Download PDF

Info

Publication number
JP6991134B2
JP6991134B2 JP2018517870A JP2018517870A JP6991134B2 JP 6991134 B2 JP6991134 B2 JP 6991134B2 JP 2018517870 A JP2018517870 A JP 2018517870A JP 2018517870 A JP2018517870 A JP 2018517870A JP 6991134 B2 JP6991134 B2 JP 6991134B2
Authority
JP
Japan
Prior art keywords
cancer
subject
genetic information
genetic
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018517870A
Other languages
English (en)
Other versions
JP2018537754A (ja
JP2018537754A5 (ja
Inventor
ヘルミー エルトーキー,
アミルアリ タラサズ,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Publication of JP2018537754A publication Critical patent/JP2018537754A/ja
Publication of JP2018537754A5 publication Critical patent/JP2018537754A5/ja
Priority to JP2021198384A priority Critical patent/JP7536738B2/ja
Application granted granted Critical
Publication of JP6991134B2 publication Critical patent/JP6991134B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/20Heterogeneous data integration
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Bioethics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

相互参照
本出願は、2015年10月9日に出願された米国仮出願番号第62/239,390号の利益を主張しており、この仮出願は、その全体が参考として本明細書中に援用される。
背景
個々の患者は、医療処置に異なる応答を示すが、これは部分的には、遺伝子発現に影響を与える遺伝子およびエピジェネティックな差異のためである。これらの差異は、正常宿主組織に存在する場合があり、または形質転換の際にがん細胞によって獲得される場合もある。そのような差異は、薬物の薬物動態(例えば、代謝または輸送)または薬力学(例えば、標的または酵素調節);放射線への宿主組織感受性;薬物および放射線を含む細胞傷害剤への悪性細胞の感受性;および侵入および転移する悪性細胞の能力を含む処置応答の多様な構成成分に影響を与える場合がある。
がんを処置することが非常に困難である理由の1つは、現在の検査方法がしばしば具体的ながんに有効な薬物処置を適合させる医師の役に立たないことである。さらに疾患状態自体が変動する標的である場合がある-がん細胞は絶えず変化および変異している。がん腫瘍は、持続的にそれらの固有のゲノム物質を血流に排出するが、不運にもこれらの決定的なゲノム「シグナル」は、非常に弱いため、次世代配列決定を含む現在のゲノム分析技術は、そのようなシグナルを、散発的にまたは末期的に高い腫瘍負荷を有する患者において検出できるだけである。これについての主な理由は、そのような技術が、がんに関連する新たな(de novo)ゲノム変化を確実に検出するために必要であるものよりも数桁高い場合がある誤差率およびバイアスによって悩まされていることである。したがって、がんに対する有効な処置を判定するためのシステムおよび方法の改善が必要である。
発明の要旨
本発明は、予測された治療応答に基づいてがん患者を分類するためのシステムおよび方法に関する。
一態様では本開示は、対象の疾患状態を分析するための方法であって、2回またはそれより多くの時点での対象の遺伝子情報を遺伝子分析機、例えばDNA配列決定装置で特徴付けるステップ;および2名もしくはそれより多くの人または2回もしくはそれより多くの時点からの情報を使用して、対象の遺伝子情報の特徴付けにおいて調整された検査結果を生成するステップによる、方法を提供する。
別の態様では、DNA配列決定装置を使用して、遺伝子情報を作成するステップ;疾患を有する複数の個体それぞれについての、(1)第1の時点で作成された個体由来の遺伝子情報、および(2)第2の、後の時点で判定された1つまたは複数の治療介入への個体の処置応答を含む訓練用データセットをコンピュータメモリに受け取るステップ;およびデータセットを使用して機械学習アルゴリズムを履行して、少なくとも1つのコンピュータ履行分類アルゴリズムを作成するステップであって、分類アルゴリズムが対象由来の遺伝子情報に基づいて、治療介入への対象の治療応答を予測する、ステップによって疾患を検出するためのシステムおよび方法が開示される。本明細書において使用される場合、治療応答は、具体的な治療介入への処置応答である。
別の態様では方法は、複数の時点でのがんポリヌクレオチドの出現頻度を決定するステップ;複数の時点それぞれでの出現頻度についての誤差範囲を決定するステップ;先と後との時点間で、誤差範囲が(1)重複、出現頻度の安定性を示している、(2)後の時点での誤差範囲外の増加、出現頻度における増加を示している、または(3)後の時点での誤差範囲外の減少、出現頻度における減少を示している、のいずれかを判定するステップによって、対象由来の試料中のがんポリヌクレオチドの量の経時的な傾向を検出する。
さらに別の態様では方法は、遺伝子分析機、例えばDNA配列決定装置で無細胞核酸を配列決定するステップ;後の(例えば、最新の)配列リードを少なくとも2回の時点からの過去の配列リードと比較するステップ、およびそれにより診断の確度指標を更新するステップ;および配列リードの診断の確度指標に基づいて、個体における遺伝子変化の存在もしくは不在および/または遺伝的変動の量を検出するステップによって、異常な細胞活性を検出する。遺伝子分析機は、遺伝子分析のための任意のシステム、例えば配列決定(DNA配列決定装置)またはハイブリダイゼーション(マイクロアレイ、蛍光インサイチュハイブリダイゼーション、バイオナノゲノミクス)によるなどを含む。
別の態様では方法は、遺伝子分析機、例えばDNA配列決定装置による後の(例えば、最新の)配列リードを過去の期間からの過去の配列リードと比較することによってコンセンサス配列を作成するステップ、および過去の配列リードに基づいて診断の確度指標を更新するステップであって、各コンセンサス配列はタグ付き親ポリヌクレオチドのセット中の固有のポリヌクレオチドに対応する、ステップ、ならびに対象中の細胞外ポリヌクレオチドの遺伝子プロファイルを作成するステップであって、遺伝子プロファイルが、コピー数多型または変異分析からもたらされる複数のデータを含む、ステップによって、対象から得られた無細胞または実質的に無細胞の試料における変異を検出する。
別の態様では、タグ付き親ポリヌクレオチドの少なくとも1つのセットを提供するステップ、およびタグ付き親ポリヌクレオチドの各セットについて;増幅された後代ポリヌクレオチドの対応するセットを作成するようにセット中のタグ付き親ポリヌクレオチドを増幅するステップ;遺伝子分析機、例えばDNA配列決定装置で、増幅された後代ポリヌクレオチドのセットのサブセットを配列決定して、配列決定リードのセットを作成するステップ;および配列決定リードのセットをたたんで、最新の配列リードを少なくとも1つの過去の期間からの過去の配列リードと比較することによってコンセンサス配列のセットを生成するステップ、およびそれにより診断の確度指標を更新するステップであって、各コンセンサス配列はタグ付き親ポリヌクレオチドのセット中の固有のポリヌクレオチドに対応する、ステップによって異常な細胞活性を検出するための方法が本明細書において開示される。
さらに別の態様では方法は、対象由来の身体試料からの細胞外ポリヌクレオチドを遺伝子分析機、例えばDNA配列決定装置で配列決定するステップ;細胞外ポリヌクレオチドそれぞれについて、複数の配列決定リードを作成するステップ;設定閾値に合致しないリードを除外するステップ;配列決定由来の配列リードを参照配列にマッピングするステップ;マッピング可能な各塩基位置で、参照配列の変種と配列比較されるマッピングされた配列リードのサブセットを特定するステップ;マッピング可能な各塩基位置について、(b)マッピング可能な各塩基位置についての配列リードの総数に対する(a)参照配列と比較した変種を含むマッピングされた配列リードの数の比を算出するステップ;および最新の配列リードを少なくとも1つの他の時点からの過去の配列リードと比較するステップ、およびそれにより診断の確度指標を更新するステップによって、対象から得られた無細胞または実質的に無細胞の試料における変異を検出する。
さらなる態様では、後の(例えば、最新の)配列リードを少なくとも1つの他の時点からの過去の配列リードと比較するステップ、およびそれにより診断の確度指標を更新するステップであって、各コンセンサス配列はタグ付き親ポリヌクレオチドのセット中の固有のポリヌクレオチドに対応する、ステップ、ならびに対象中の細胞外ポリヌクレオチドの遺伝子プロファイルを作成するステップであって、遺伝子プロファイルがコピー数多型または変異分析からもたらされる複数のデータを含む、ステップ、によって対象における異常状態の不均質性の特徴付け方法が本明細書において開示される。
上記のシステム/方法の履行は、次の1つまたは複数を含んでよい。方法は、対象中の細胞外ポリヌクレオチドの遺伝子プロファイルを作成するステップを含み、ここで遺伝子プロファイルは、コピー数多型または変異分析からもたらされる複数のデータを含む。方法は、第1の時点からの情報が第2の時点からの情報を確認する場合に、後続の特徴付けにおいて診断の確度指標を増加させるステップを含む。診断の確度指標は、第1の時点からの情報が第2の時点からの情報を確認する場合に、後続の特徴付けにおいて増加されてよい。方法は、第1の時点からの情報が第2の時点からの情報と矛盾する場合に、後続の特徴付けにおいて診断の確度指標を減少させるステップを含む。
上記システムの利点は、次の1つまたは複数を含んでよい。腫瘍由来コピー数異常、単一ヌクレオチド多型およびメチル化変化は、本発明を使用して検出でき、情報は精度を上げるために集団に適用されてよい。同様にシステムは、末梢血に放出された循環腫瘍細胞(CTC)および無細胞循環腫瘍DNA(ctDNA)での、治療標的および薬物耐性を付与する遺伝子変更の分析を含んで遺伝子的に類似の場合についての処置を特定できる。CTCおよびctDNAの両方は、集団での新規薬物および薬物組合せを評価する補完的な情報を提供する。液体バイオプシーコンセプトは、がんを有する患者での薬物耐性のより良い理解および臨床管理に寄与する。末梢血中の循環腫瘍細胞(CTC)の計数および特徴付けは、重要な予後情報を提供でき、治療の有効性をモニターすることを補助できる。現在のアッセイがアポトーシス性と生存可能なCTCとを識別できないことから、単一の上皮がん細胞からのタンパク質分泌/放出/排出を検出するフルオロEPISPOTアッセイは、乳房、結腸、前立腺、頭頸部および卵巣がんならびにメラノーマについて使用できる。システムは、診断用バイオマーカー発見-および体液での検証の特別な需要および課題に合致するようにあらゆるハイスループット技術(例えば、平面およびビーズマイクロアレイ、マイクロ流体定量的PCR、ルミネックスビーズ技術)を可能にする。4大がん実体(乳房、結腸、前立腺、肺)についての自己抗体およびDNAメチル化に基づく診断用マーカーパネルは、血清または血漿で実施できる。システムは、診断マトリクスとして血液、尿または唾液を扱うことができる。ゲノム分析技術構造は、次世代配列決定によって生じるノイズおよびひずみをほとんどゼロに低減する。デジタル配列決定は、がんにおける作用可能な腫瘍特異的ゲノム変化の超高忠実度、単一分子検出を比類ない特異性と広さを伴って可能にする。言い換えると、臨床医は現在、患者の全身でのがんのゲノムの広がり(dimension)を非侵襲性に観察できる。システムは、腫瘍バイオプシー外側の耐性および感受性変異を包括的に検出する。単純な採血は、SNV、CNV、インデル、および多数の塩基対にわたる再編成を含む多数の遺伝子を検査し、処置管理を補助する。システムはまた、がんのゲノムの広がりを患者に対する処置レジメンを導くために使用できるようにする。薬物処置有効性と患者試料での分子マーカーの存在または不在との間の相関は、処置を改善するために使用できる。得られる勧告および臨床レポートは、理解のために直感的であり、検査工程に基礎レベルの知識が必要であり、検査結果を記載するために使用される科学的用語を熟知している必要がある。これは、検査の指示および検査結果の解釈を説明する追加的な教育用材料を必要とすることなく行われる。検査室レポートは、情報を理解し、臨床診療に正しく適用するための処置専門家の能力を補助するための重要な情報に集中している。レポートは、複雑なDNA検査情報の正しい解釈を促進する。遺伝子検査結果の伝達の改善は、遺伝子検査結果の誤解釈の低減をもたらし、DNA配列決定結果に基づく介入または処置の送達を改善する。
一態様では本開示は、治療応答予測因子を作成するための方法であって、遺伝子分析機を使用して、遺伝子情報を作成するステップ;疾患を有する複数の個体それぞれについての、(1)第1の時点で作成された個体由来の遺伝子情報、および(2)第2の、後の時点で判定された1つまたは複数の治療介入への個体の処置応答を含む訓練用データセットをコンピュータメモリに受け取るステップ;およびデータセットを使用して機械学習アルゴリズムを履行して、少なくとも1つのコンピュータ履行分類アルゴリズムを作成するステップであって、分類アルゴリズムが対象由来の遺伝子情報に基づいて、対象の治療応答を予測する、ステップを含む、方法を提供する。
一部の実施形態では機械学習アルゴリズムは、サポートベクターマシン、ランダムフォレスト、最近隣分析、線形回帰、二分決定木、判別分析、ロジスティック分類指標およびクラスター分析から選択される教師ありまたは教師なし学習アルゴリズムからなる群から選択される。一部の実施形態では方法は、2回またはそれより多くの時点での検査に基づいて腫瘍発達の方向性を予測するステップを含む。一部の実施形態では作成された予測は、遠隔転移発達の確率を決定するステップを含む。一部の実施形態では訓練用データセットは、がんのステージ、外科的手技の種類、年齢、腫瘍のグレード、腫瘍浸潤の深度、術後合併症の発生および血管侵入の存在からなる群から選択される臨床データをさらに含む。一部の実施形態では遺伝子情報は、がん細胞のゲノム構成を定義する変数を含む。一部の実施形態では遺伝子情報は、単一の播種性がん細胞のゲノム構成を定義する変数を含む。一部の実施形態では方法は、訓練用データセットを前処理するステップを含む。一部の実施形態では訓練用データセットを前処理するステップは、提供されたデータをクラス条件付き確率に変換するステップを含む。
一部の実施形態では遺伝子情報は、個体由来の無細胞DNA中の1つまたは複数の遺伝子座からの配列または存在量データを含む。一部の実施形態では処置応答は、第2の、後の時点で作成された個体由来の遺伝子情報を含む。一部の実施形態では疾患状態は、がんであり、遺伝子分析機は、DNA配列決定装置である。
一態様では本開示は、遺伝子分析機を使用して、対象についての遺伝子情報を作成するステップ;遺伝子情報を含む検査データセットをコンピュータメモリに受け取るステップ;およびコンピュータ履行分類アルゴリズムを履行するステップであって、分類アルゴリズムが、遺伝子情報に基づいて、治療介入への対象の治療応答を予測する、ステップを含む方法を提供する。
一部の実施形態では方法は、腫瘍の発達を予測するステップを含む。一部の実施形態では方法は、遠隔転移の発達を予測するステップを含む。一部の実施形態では訓練用データセットは、がんのステージ、外科的手技の種類、年齢、腫瘍のグレード、腫瘍浸潤の深度、術後合併症の発生および血管侵入の存在からなる群から選択される変数をさらに含む。一部の実施形態では遺伝子情報は、がん細胞のゲノム構成を定義する変数を含む。一部の実施形態では遺伝子情報は、単一の播種性がん細胞のゲノム構成を定義する変数を含む。一部の実施形態では方法は、検査データセットを前処理するステップを含む。一部の実施形態では検査データセットを前処理するステップは、提供されたデータをクラス条件付き確率に変換するステップを含む。一部の実施形態では、20個またはそれより少ない変数が選択される。一部の実施形態では、10個またはそれより少ない変数が選択される。一部の実施形態では分類アルゴリズムは、人工神経ネットワークを用いる。一部の実施形態では人工神経ネットワークは、ベイジアン(Bayesian)フレームワークを使用して訓練される。
一態様では本開示は、対象の疾患状態を分析するための方法であって、2回またはそれより多くの時点での対象の遺伝子情報についてのデータを遺伝子分析機から受け取るステップ;2回またはそれより多くの時点からの情報を使用して、対象の遺伝子情報の特徴付けにおいて調整された検査結果を作成するステップ;遺伝子情報に適合している対象を集団から特定するステップ;および遺伝子情報に適合している対象の過去の処置に基づいて処置を勧告するステップを含む、方法を提供する。一部の実施形態では方法は、最新の配列リードを過去の配列リードと比較するステップおよびそれにより診断の確度指標を更新するステップを含む。一部の実施形態では方法は、最新の配列リードについての信頼区間を作成するステップを含む。一部の実施形態では方法は、信頼区間を1つまたは複数の過去の信頼区間と比較するステップおよび重複する信頼区間に基づいて疾患進行を判定するステップを含む。
一部の実施形態では方法は、第1の時点からの情報が第2の時点からの情報を確認する場合に、後続のまたは以前の特徴付けにおいて診断の確度指標を増加させるステップを含む。一部の実施形態では、特徴付けは、対象由来の試料中のDNAからの配列リードの収集物で検出される1つまたは複数の遺伝子変種の出現頻度を決定するステップを含み、調整された検査結果を作成するステップは、遺伝子情報に適合している対象につき2回またはそれより多くの時点での1つまたは複数の遺伝子変種の出現頻度を比較するステップを含む。一部の実施形態では、特徴付けは、適合している対象由来の試料中のDNAからの配列リードの収集物から検出される1つまたは複数の遺伝子座でのコピー数多型の量を決定するステップを含み、調整された検査結果を作成するステップは、2回またはそれより多くの時点での量を比較するステップを含む。一部の実施形態では、特徴付けは、健康または疾患の診断を行うステップを含む。
一部の実施形態では遺伝子情報は、疾患関連またはがん関連遺伝子変種を含むゲノムの一部分由来の配列データを含む。一部の実施形態では方法は、2回またはそれより多くの時点での対象由来の試料におけるポリヌクレオチドのリード深度を増大させることによって、遺伝子変種を検出する感度を上昇させるステップを含む。一部の実施形態では、特徴付けは、対象由来の試料中の疾患ポリヌクレオチドの存在の診断を行うステップを含み、同じ遺伝子変種が複数の試料採取例または時点のノイズ範囲に検出される場合に、調整が、陰性または不確定から陽性に診断を調整するステップを含む。一部の実施形態では、特徴付けは、対象由来の試料中の疾患ポリヌクレオチドの存在の診断を行うステップを含み、同じ遺伝子変種がより早い時点でノイズ範囲内に、および後の時点でノイズ範囲を超えて検出される場合に、調整が、より早い時点からの特徴付けにおいて陰性または不確定から陽性に診断を調整するステップを含む。一部の実施形態では、特徴付けは、対象由来の試料中の疾患ポリヌクレオチドの存在の診断を行うステップを含み、同じ遺伝子変種がより早い時点でノイズ範囲内に、および後の時点でノイズ範囲を超えて検出される場合に、調整が、より早い時点からの特徴付けにおいて陰性または不確定から陽性に診断を調整するステップを含む。
一態様では本開示は、a)対象由来の複数の核酸試料を提供するステップであって、試料が連続した時点で収集される、ステップ;b)試料由来のポリヌクレオチドを配列決定するステップ;c)各試料中のポリヌクレオチド内の複数の体細胞変異体それぞれの定量測定を決定するステップ;d)連続した時点の少なくとも1つでゼロではない量で存在するこれらの体細胞変異について連続した時点のそれぞれにおける体細胞変異体の相対量をグラフに表すステップ;およびe)遺伝子的に類似している対象の群由来の変異体を関連付け、遺伝子的に類似している対象についての過去の処置データに基づいて処置勧告を作成するステップを含む方法を提供する。
一態様では本開示は、遺伝子分析機によって作成されたデータからがん処置を勧告するための方法であって、がんを患っている人の集団から遺伝子プロファイルが適合している1人または複数人の対象を特定するステップおよび適合している対象由来の過去の処置データを検索するステップ;および適合している対象の前病歴に基づき、最良の処置選択肢を特定するステップ;紙のまたは電子的な患者検査レポートに勧告を与えるステップを含む、方法を提供する。一部の実施形態では方法は、疾患負担を推測するために体液に基づく検査で検出されたゲノム変化の大きさの組合せを使用するステップを含む。一部の実施形態では方法は、疾患負担を推測するために、検出された変異の対立遺伝子割合、対立遺伝子の不均衡、または遺伝子特異的適用範囲を使用するステップを含む。一部の実施形態では全体のスタック高は、個体における全体の疾患負担または疾患負担スコアを表している。一部の実施形態では各ゲノム変化を表すために異なる色が使用される。一部の実施形態では、検出された変化のサブセットだけがプロットされる。一部の実施形態ではサブセットは、ドライバーの変化である可能性、または処置への応答の増大もしくは低減との関連に基づいて選択される。一部の実施形態では方法は、ゲノム検査についての検査レポートを作成するステップを含む。一部の実施形態では非線形スケールは、それぞれの代表的なゲノム変化の高さまたは幅を表すために使用される。一部の実施形態では、以前の検査の点のプロットがレポートに表される。一部の実施形態では方法は、各検査結果の変化率および/または定量精度に基づいて疾患の進行または寛解を推定するステップを含む。一部の実施形態では方法は、介入検査点の間での治療介入を表示するステップを含む。
本発明は、例えば、以下の項目を提供する。
(項目1)
治療応答予測因子を作成するための方法であって、
遺伝子分析機を使用して、遺伝子情報を作成するステップ;
疾患を有する複数の個体それぞれについての、(1)第1の時点で作成された個体由来の遺伝子情報、および(2)第2の、後の時点で判定された1つまたは複数の治療介入への前記個体の処置応答を含む訓練用データセットをコンピュータメモリに受け取るステップ;および
前記データセットを使用して機械学習アルゴリズムを履行して、少なくとも1つのコンピュータ履行分類アルゴリズムを作成するステップであって、前記分類アルゴリズムが対象由来の遺伝子情報に基づいて、前記対象の治療応答を予測する、ステップ
を含む、方法。
(項目2)
前記機械学習アルゴリズムが、サポートベクターマシン、ランダムフォレスト、最近隣分析、線形回帰、二分決定木、判別分析、ロジスティック分類指標およびクラスター分析から選択される教師ありまたは教師なし学習アルゴリズムからなる群から選択される、項目1に記載の方法。
(項目3)
2回またはそれより多くの時点での検査に基づいて腫瘍発達の方向性を予測するステップを含む、項目1に記載の方法。
(項目4)
作成された予測が、遠隔転移発達の確率を決定するステップを含む、項目1に記載の方法。
(項目5)
前記訓練用データセットが、がんのステージ、外科的手技の種類、年齢、腫瘍のグレード、腫瘍浸潤の深度、術後合併症の発生および血管侵入の存在からなる群から選択される臨床データをさらに含む、項目1に記載の方法。
(項目6)
前記遺伝子情報が、がん細胞のゲノム構成を定義する変数を含む、項目1に記載の方法。
(項目7)
前記遺伝子情報が、単一の播種性がん細胞のゲノム構成を定義する変数を含む、項目1に記載の方法。
(項目8)
前記訓練用データセットを前処理するステップを含む、項目1に記載の方法。
(項目9)
前記訓練用データセットを前処理するステップが、提供されたデータをクラス条件付き確率に変換するステップを含む、項目8に記載の方法。
(項目10)
前記遺伝子情報が、前記個体由来の無細胞DNA中の1つまたは複数の遺伝子座からの配列または存在量データを含む、項目1に記載の方法。
(項目11)
前記処置応答が、第2の、後の時点で作成された前記個体由来の遺伝子情報を含む、項目1に記載の方法。
(項目12)
疾患状態が、がんであり、前記遺伝子分析機が、DNA配列決定装置である、項目1に記載の方法。
(項目13)
遺伝子分析機を使用して、対象についての遺伝子情報を作成するステップ;
前記遺伝子情報を含む検査データセットをコンピュータメモリに受け取るステップ;および
コンピュータ履行分類アルゴリズムを履行するステップであって、前記分類アルゴリズムが、前記遺伝子情報に基づいて、治療介入への前記対象の治療応答を予測する、ステップ
を含む方法。
(項目14)
腫瘍の発達を予測するステップを含む、項目13に記載の方法。
(項目15)
遠隔転移の発達を予測するステップを含む、項目13に記載の方法。
(項目16)
前記訓練用データセットが、がんのステージ、外科的手技の種類、年齢、腫瘍のグレード、腫瘍浸潤の深度、術後合併症の発生および血管侵入の存在からなる群から選択される変数をさらに含む、項目13に記載の方法。
(項目17)
前記遺伝子情報が、がん細胞のゲノム構成を定義する変数を含む、項目13に記載の方法。
(項目18)
前記遺伝子情報が、単一の播種性がん細胞のゲノム構成を定義する変数を含む、項目13に記載の方法。
(項目19)
前記検査データセットを前処理するステップを含む、項目13に記載の方法。
(項目20)
前記検査データセットを前処理するステップが、提供されたデータをクラス条件付き確率に変換するステップを含む、項目19に記載の方法。
(項目21)
20個またはそれより少ない変数が選択される、項目13に記載の方法。
(項目22)
10個またはそれより少ない変数が選択される、項目13に記載の方法。
(項目23)
前記分類アルゴリズムが、人工神経ネットワークを用いる、項目13に記載の方法。
(項目24)
前記人工神経ネットワークが、ベイジアンフレームワークを使用して訓練される、項目23に記載の方法。
(項目25)
対象の疾患状態を分析するための方法であって、
2回またはそれより多くの時点での対象の遺伝子情報についてのデータを遺伝子分析機から受け取るステップ;
前記2回またはそれより多くの時点からの前記情報を使用して、前記対象の遺伝子情報の特徴付けにおいて調整された検査結果を作成するステップ;
遺伝子情報に適合している対象を集団から特定するステップ;および
遺伝子情報に適合している対象の過去の処置に基づいて処置を勧告するステップ
を含む、方法。
(項目26)
最新の配列リードを過去の配列リードと比較するステップおよびそれにより診断の確度指標を更新するステップを含む、項目25に記載の方法。
(項目27)
最新の配列リードについての信頼区間を作成するステップを含む、項目25に記載の方法。
(項目28)
前記信頼区間を1つまたは複数の過去の信頼区間と比較するステップおよび重複する信頼区間に基づいて疾患進行を判定するステップを含む、項目25に記載の方法。
(項目29)
第1の時点からの情報が第2の時点からの情報を確認する場合に、後続のまたは以前の特徴付けにおいて診断の確度指標を増加させるステップを含む、項目25に記載の方法。
(項目30)
特徴付けが、前記対象由来の試料中のDNAからの配列リードの収集物で検出される1つまたは複数の遺伝子変種の出現頻度を決定するステップを含み、調整された検査結果を作成するステップが、遺伝子情報に適合している前記対象につき2回またはそれより多くの時点での前記1つまたは複数の遺伝子変種の出現頻度を比較するステップを含む、項目25に記載の方法。
(項目31)
特徴付けが、適合している対象由来の試料中のDNAからの配列リードの収集物から検出される1つまたは複数の遺伝子座でのコピー数多型の量を決定するステップを含み、調整された検査結果を作成するステップが、前記2回またはそれより多くの時点での量を比較するステップを含む、項目25に記載の方法。
(項目32)
特徴付けが、健康または疾患の診断を行うステップを含む、項目25に記載の方法。
(項目33)
遺伝子情報が、疾患関連またはがん関連遺伝子変種を含むゲノムの一部分由来の配列データを含む、項目25に記載の方法。
(項目34)
2回またはそれより多くの時点での前記対象由来の試料におけるポリヌクレオチドのリード深度を増大させることによって、遺伝子変種を検出する感度を上昇させるステップを含む、項目25に記載の方法。
(項目35)
特徴付けが、前記対象由来の試料中の疾患ポリヌクレオチドの存在の診断を行うステップを含み、同じ遺伝子変種が複数の試料採取例または時点のノイズ範囲に検出される場合に、調整が、陰性または不確定から陽性に診断を調整するステップを含む、項目25に記載の方法。
(項目36)
特徴付けが、前記対象由来の試料中の疾患ポリヌクレオチドの存在の診断を行うステップを含み、同じ遺伝子変種がより早い時点でノイズ範囲内に、および後の時点でノイズ範囲を超えて検出される場合に、調整が、より早い時点からの特徴付けにおいて陰性または不確定から陽性に診断を調整するステップを含む、項目25に記載の方法。
(項目37)
a)対象由来の複数の核酸試料を提供するステップであって、前記試料が連続した時点で収集される、ステップ;
b)前記試料由来のポリヌクレオチドを配列決定するステップ;
c)各試料中の前記ポリヌクレオチド内の複数の体細胞変異体それぞれの定量測定を決定するステップ;
d)前記連続した時点の少なくとも1つでゼロではない量で存在するような体細胞変異について連続した時点のそれぞれにおける体細胞変異体の相対量をグラフに表すステップ;および
e)遺伝子的に類似している対象の群由来の変異体を関連付け、前記遺伝子的に類似している対象についての過去の処置データに基づいて処置勧告を作成するステップ
を含む方法。
(項目38)
遺伝子分析機によって作成されたデータからがん処置を勧告するための方法であって、
がんを患っている人の集団から遺伝子プロファイルが適合している1人または複数人の対象を特定するステップおよび適合している対象由来の過去の処置データを検索するステップ;および
前記適合している対象の前病歴に基づき、最良の処置選択肢を特定するステップ;
紙のまたは電子的な患者検査レポートに勧告を与えるステップ
を含む、方法。
(項目39)
疾患負担を推測するために体液に基づく検査で検出されたゲノム変化の大きさの組合せを使用するステップを含む、項目38に記載の方法。
(項目40)
前記疾患負担を推測するために、検出された変異の対立遺伝子割合、対立遺伝子の不均衡、または遺伝子特異的適用範囲を使用するステップを含む、項目38に記載の方法。
(項目41)
全体のスタック高さが個体における全体の疾患負担または疾患負担スコアを表している、項目38に記載の方法。
(項目42)
各ゲノム変化を表すために異なる色が使用される、項目38に記載の方法。
(項目43)
検出された変化のサブセットだけがプロットされる、項目38に記載の方法。
(項目44)
サブセットが、ドライバーの変化である可能性、または処置への応答の増大もしくは低減との関連に基づいて選択される、項目43に記載の方法。
(項目45)
ゲノム検査についての検査レポートを作成するステップを含む、項目38に記載の方法。
(項目46)
非線形スケールが、それぞれの代表的なゲノム変化の高さまたは幅を表すために使用される、項目38に記載の方法。
(項目47)
以前の検査の点のプロットが、前記レポートに表される、項目38に記載の方法。
(項目48)
各検査結果の変化率または定量精度に基づいて疾患の進行または寛解を推定するステップを含む、項目38に記載の方法。
(項目49)
介入検査点の間での治療介入を表示するステップを含む、項目38に記載の方法。
本開示の他の目的は、後続の明細書および特許請求の範囲を読むことによって当業者に明らかになり得る。
参照による組込み
本明細書において述べられるすべての刊行物、特許および特許出願は、それぞれ個々の刊行物、特許または特許出願が参照により組み込まれることが具体的および個別に示されたのと同程度に参照により本明細書に組み込まれる。
本開示の新規な特徴は、添付の特許請求の範囲に具体的に記載される。本開示の特性および有利点のより良い理解は、本開示の原理が利用される例示的実施形態を記載する以下の詳細な記載および添付の図を参照することによって得られる。
図1Aは、例示的集団に基づく遺伝子がん処置システムを示す図である。
図1Bは、例示的レコメンダ集団に基づく遺伝子がん処置を示す図である。
図1Cは、検査結果に合わせて処置を勧告するための例示的システムを示す図である。
図1Dは、DNA配列のリーディングにおける誤差率およびバイアスを低減し、集団検査結果に基づいてユーザーのために遺伝レポートを作成するための例示的工程を示す図である。
図2A~2Bは、ユーザーに遺伝子検査結果をレポートし、集団データに基づいて処置を勧告するために例示的工程を示す図である。 図2A~2Bは、ユーザーに遺伝子検査結果をレポートし、集団データに基づいて処置を勧告するために例示的工程を示す図である。
図2C~2Iは、例示的遺伝子検査レポートから書かれている内容を示す図である。 図2C~2Iは、例示的遺伝子検査レポートから書かれている内容を示す図である。 図2C~2Iは、例示的遺伝子検査レポートから書かれている内容を示す図である。 図2C~2Iは、例示的遺伝子検査レポートから書かれている内容を示す図である。 図2C~2Iは、例示的遺伝子検査レポートから書かれている内容を示す図である。 図2C~2Iは、例示的遺伝子検査レポートから書かれている内容を示す図である。 図2C~2Iは、例示的遺伝子検査レポートから書かれている内容を示す図である。
図3A~3Bは、変異を検出し、検査結果をユーザーにレポートするための例示的工程を示す図である。 図3A~3Bは、変異を検出し、検査結果をユーザーにレポートするための例示的工程を示す図である。
発明の詳細な説明
がんは、がんの種類の多さおよび具体的な種類のがんが個体においてどのように顕在化するかの両方に関して特に不均質な疾患である。このため、所与の患者のための最良の処置過程を予測することは困難である。本開示は、がん患者に対する治療結果を改善するためのシステムおよび方法を提供する。
図1Aを参照して、集団に基づく遺伝子がん処置システムが示されている。一実施形態ではシステムは、がん対象または患者の集団から病歴無細胞DNA(cfDNA)を取り出す(2)。取り出すことは、処置を受けている患者からまたは健常者から捕捉された遺伝子データを使用して行われる。データの取り出しが行われると、システムは、過去の成果に基づいておよび対象/患者の遺伝子特徴に処置を適合させることによって処置を勧告できる。最初にシステムは、遺伝子特徴を含む対象判定基準を得る(4)。次にシステムは、類似の遺伝子特徴を有する類似の対象を特定する(6)。次いでシステムは、これらの類似する対象から成功する処置を特定する(8)。類似する対象に対する過去の処置および結果に基づいて、システムは現在の対象のために勧告される処置を特定する(10)。
次にシステムは、処置工程を反復的にモニターする。これは、後続の遺伝子のリーディングを通じて行われる(12)。リーディングに基づいてシステムは、最良の適合処置を特定し、成果および後続の遺伝子分析に基づいて処置を勧告する(14)。次いでシステムは、患者がポジティブな結果を有するかどうかを追跡する(16)。患者が治癒しない場合、追加的処置が12にループバックすることによる勧告に基づいて行われるか、そうでなければ患者は放免される(18)。
図1Bは、例示的レコメンダ(recommender)290を示す。このシステムでは、臨床情報210はデータベースアレイに保存される。例えばシステムは、医師および検査室からの患者情報をこのデータベースに保存できる。ゲノム配列などのテキストデータ220および各患者についての組織学的レポートも捕捉される。例えばデータは、多次元がんゲノムデータセットの双方向調査のためのオープンアクセスリソースであり、20のがん研究から5,000個を超える腫瘍試料由来のデータへのアクセスを現在提供しているcBio Cancer Genomics Portal(http://cbioportal.org)由来であってよい。cBio Cancer Genomics Portalは、複雑なゲノムデータと、分子プロファイルおよび大規模がんゲノミクスプロジェクト由来の臨床特性への迅速、直感的および高品質のアクセスを必要としているがん研究者らとの間の障壁を顕著に低下させており、研究者らがこれらの豊富なデータセットを生物学的洞察および臨床応用に転換できるようにしている。CTスキャンなどの画像データ230は、MRIスキャン、超音波スキャン、骨スキャン、PETスキャン、骨髄検査、バリウムX線、内視鏡検査、リンパ管造影、IVU(静脈性尿路造影)またはIVP(IV腎盂造影)、腰椎穿刺、膀胱鏡検査、免疫学的検査(抗マリグニン抗体スクリーニング)およびがんマーカー検査などの他の情報と共に捕捉されてよい。次いで特徴はエクストラクタ240によって抽出される。次いで特性は、神経ネットワーク250、ベクターマシン260および隠れマルコフマシン(HMM)270などの1つまたは複数の分類指標によって使用されてよい。一部の実施形態では神経ネットワークは、ベイジアンフレームワークを使用して訓練される。次いで分類指標の出力は、推論ユニットまたはエンジン280に提供される。結果はレコメンダ290の出力として提供され、その結果は図1Cのレポート作成器21によってレポートにおいて使用される。一部の実施形態では上記カテゴリーの2つまたはそれより多くからのデータは、単一のカテゴリーからのデータよりもさらに安定な分類を作成するために利用されてよい。
一部の実施形態では構築されていないテキストは、入手可能な組織学的レポートから取得される。テキストは、塩基多型を低減するために最初に正規化される:アクロニム、数および大きさの形式は標準化され、関連略号は展開され、異綴語は共通形式にマッピングされ、任意の無情報文字列は除去される。正規化ルールのセットは通常の表現を使用してコードされ、単純な検索置換操作を使用して履行される。
一部の実施形態は、塩基品質、マッピング品質、鎖バイアスおよびテール距離などの他の利用可能な情報から利益を得る一方で、検証された体細胞変異試料で訓練された特性に基づく分類指標を使用する。対での正常/腫瘍バムファイルが与えられると、実施形態は各候補部位が体細胞性である確率を出力する。本明細書に記載のシステムおよび方法を通じて、本開示は、治療介入への処置応答を分類し、次に所与の個体が具体的な分類(例えば、処置に応答性、処置に非応答性または完全応答性もしくは部分応答性などの応答の具体的なレベル)に該当するかどうかを判定する方法を提供する。
一部の実施形態では方法は、(a)複数の異なるクラスを提供するステップであって、各クラスが特徴(例えば、1つまたは複数のコホート由来)を共有する対象のセットを表す、ステップ;(b)クラスそれぞれに属する複数の試料それぞれ由来の無細胞DNA分子の代表的な多パラメーターモデルを提供するステップであって、それにより訓練用データセットを提供する、ステップ;および(c)1つまたは複数の訓練された分類指標を作るために訓練用データセットで学習アルゴリズムを訓練するステップであって、訓練された各分類指標が検査試料を複数のクラスの1つまたは複数に分類する、ステップを含む訓練された分類指標を作るために提供される。
例として、訓練された分類指標は、ランダムフォレスト、神経ネットワーク、サポートベクターマシンおよび線形分類指標からなる群から選択される学習アルゴリズムを使用できる。複数の異なるクラスそれぞれは、健常、乳がん、結腸がん、肺がん、膵臓がん、前立腺がん、卵巣がん、メラノーマおよび肝がんからなる群から選択されてよい。
訓練された分類指標は、対象由来の試料の分類方法に適用されてよい。この分類方法は、(a)対象由来の検査試料から無細胞DNA分子の代表的な多パラメーターモデルを提供するステップ;および(b)訓練された分類指標を使用して検査試料を分類するステップを含んでよい。検査試料が1つまたは複数のクラスに分類された後、対象での治療介入は試料の分類に基づいて実施されてよい。
一部の実施形態では訓練セットは、神経ネットワークまたはサポートベクターマシンなどの機械学習ユニットに提供される。訓練セットを使用して機械学習ユニットは、1つまたは複数の治療介入への処置応答に従って試料を分類するためのモデルを作成できる。これは、「呼び出し(calling)」とも称される。開発されたモデルは、検査ベクターの任意の部分からの情報を採用することができる。
一部の実施形態では、いくつかの個体の集団由来のDNAは、多重アレイのセットによって分析されてよい。各多重アレイについてのデータは、その具体的なアレイに含有される情報を使用して自己正規化されてよい。この正規化アルゴリズムは、2色チャネルにおいて観察された名目強度変動、チャネル間のバックグラウンド差異、および色素間のクロストーク可能性について調整されてよい。次いで各塩基位置の挙動は、SNP遺伝子型判定でのいくつかの生物学的経験則を組み込んでいるクラスター形成アルゴリズムを使用してモデル化されてよい。3個より少ないクラスターが観察される場合(例えば、低いマイナーな対立遺伝子出現頻度のため)、欠損しているクラスターの場所および形状は、神経ネットワークを使用して推定できる。クラスターの形状およびそれら相互の相対的距離に依存して、統計的スコアが考案できる(訓練スコア)。GenCall Scoreなどのスコアは、ヒト専門家の視覚的および経験的システムによって行われる評価を模倣するように設計される。さらに、これは上下鎖由来の遺伝子型判定データを使用して進化される。このスコアは、訓練スコアを作るためにいくつかのペナルティー項(例えば、低強度、既存と予測のクラスター間のミスマッチ)と組み合わされてよい。クラスター位置および各SNPについての形状と共に訓練スコアは、呼び出しアルゴリズムによる使用のために保存される。
治療応答を呼び出すために呼び出しアルゴリズムは、疾患または状態を有する複数の個体の遺伝子情報および処置応答を利用してよい。データは、(クラスター形成アルゴリズムについてと同じ手順を使用して)最初に正規化されてよい。呼び出し操作(分類)は、例えばベイジアンモデルを使用して実施されてよい。各呼び出しについてスコア、呼び出しスコアは、訓練スコアとデータ対モデルフィットスコアとの積であってよい。すべての処置応答をスコア化した後、アプリケーションは合成スコアを計算できる。
一部の実施形態では訓練用データセットは、がんのステージ、外科的手技の種類、年齢、腫瘍のグレード、腫瘍浸潤の深度、術後合併症の発生および血管侵入の存在からなる群から選択される臨床データを含む。一部の実施形態では訓練用データセットは、提供されたデータをクラス条件付き確率に変換することを含んで前処理される。
別の実施形態は、各患者についての組織学的レポートのコーパスにおけるワード出現に基づいて、各がんステージカテゴリーについての統計的分類指標、具体的にはサポートベクターマシンを訓練するために機械学習技法を使用する。次いで新規レポートは、最も可能性が高いステージに従って分類されてよく、集団ステージ分けデータの収集および分析を促進する。
・ サポートベクターマシン(SVM)パッケージの形式へのデータの変換
・ データ上でのスケーリング実施
・ RBFカーネルを考慮
・ 最良のパラメーターCおよびγを見出すためのクロス検証を使用
・ 訓練セット全体を訓練するために最良のパラメーターCおよびγを使用
・ 検査
・ 患者データでの始動
本実施形態は、Cでのサポートベクターマシン(SVM)のオープンソース実装であるSVMlightを使用する。プログラムの主な特性は次のとおり:
高速最適化アルゴリズム
実現可能な最急降下に基づいた作業設定選択
「縮小」発見的
カーネル評価のキャッシング
線形の場合でのフォールディングの使用
分類および回帰課題の解決。多変数および構造化された出力のためにSVMstructを使用
順位付け課題の解決(例えば、STRIVER検索エンジンでの検索機能を学習)。
誤差率、精度および再現率のXiAlpha推定を計算
誤差率、精度および再現率のLeave-One-Out推定を効率的に計算
ラージ変換SVM(TSVM)(スペクトルグラフ変換器も参照されたい)を近似的に訓練するためのアルゴリズムを含む
原価モデルおよび例依存的原価でSVMを訓練できる
双対変数の特定ベクターからの再起動を許可
数千のサポートベクターを扱う
数十万の訓練例を扱う
標準的カーネル関数を支持、およびユーザー自身のものをユーザーに定義させる
スパースベクター提示を使用
一部の実施形態では機械学習アルゴリズムは、サポートベクターマシン、ランダムフォレスト、最近隣分析、線形回帰、二分決定木、判別分析、ロジスティック分類指標およびクラスター分析から選択される教師ありまたは教師なし学習アルゴリズムからなる群から選択される。
次に図1Cを参照して、がん検査結果およびそれによる処置選択肢をレポートするためのレポート作成器21を含むシステムが模式的に例示される。レポート作成器システムは、通信回線を通じた遠隔データサイトまたは検査室22、医療行為/ヘルスケア提供者(処置専門家)24および/または患者/対象26、との直接通信を確立するように構成された中央データ処理システムであってよい。検査室22は、医療検査室、診断検査室、医療施設、医療行為、ポイントオブケア検査デバイスまたは対象臨床情報を作成できる任意の他の遠隔データサイトであってよい。対象臨床情報は、これだけに限らないが、臨床検査データ、X線データ、診察および診断を含む。ヘルスケア提供者または診療所26は、医師、看護師、在宅医療者、技師および医師の補助者などの医療サービス提供者を含み、診療所はヘルスケア提供者が配属された任意の医療ケア施設である。ある特定の場合では、ヘルスケア提供者/診療所は、遠隔データサイトでもある。がん処置実施形態では対象は、特にがんに罹患していてよい。
がん対象26についての他の臨床情報は、当業者が容易に特定できる具体的ながんに方向付けられた臨床検査、画像化または医学的手順の結果を含む。がんについての臨床情報の適切な提供源の一覧として、これだけに限らないが、CTスキャン、MRIスキャン、超音波スキャン、骨スキャン、PETスキャン、骨髄検査、バリウムX線、内視鏡検査、リンパ管造影、IVU(静脈性尿路造影)またはIVP(IV腎盂造影)、腰椎穿刺、膀胱鏡検査、免疫学的検査(抗マリグニン抗体スクリーニング)およびがんマーカー検査が挙げられる。
対象26の臨床情報は、検査室22から手動でまたは自動的に得ることができる。システムの簡潔さのために情報は、既定のまたは一定の時間間隔で自動的に得られる。一定の時間間隔は、検査室データの収集が時間、日、週、月、年などの時間測定に基づいて本明細書に記載の方法およびシステムによって自動的に行われる時間間隔を指す。本発明の一実施形態ではデータの収集および処理は、少なくとも1日1回行われる。一実施形態ではデータの伝達および収集は、毎月1回、2週間ごとまたは週に1回または2、3日に1回行われる。代替的に情報の検索は、既定のしかし一定ではない時間間隔で行われてよい。例えば第1の検索ステップは1週間後に行われてよく、第2の検索ステップは1ヵ月後に行われてよい。データの伝達および収集は、管理される障害の性質ならびに対象の必要とされる検査および診察の頻度に従ってカスタマイズされてよい。
図1Dは、腫瘍応答マップおよび関連する変化の概要を含む、遺伝レポートを作成するための例示的工程を示す。この工程は、がんに関連する新たなゲノム変化を確実に検出するために必要であるよりも数桁高い場合がある誤差率およびバイアスを低減する。工程は、最初に遺伝子材料の供給源として体液試料(例えば、血液、血清、血漿、尿、脳脊髄液、唾液、便、リンパ液、滑膜液、嚢胞液、腹水、胸水、羊水、絨毛膜絨毛試料、着床前胚由来の液、胎盤試料、洗浄および頸部膣液、間質液、頬スワブ試料、痰、気管支洗浄、Papスメア試料、または眼液)を収集することによって遺伝子情報を捕捉し、次いで工程は材料を配列決定する(71)。例えば試料中のポリヌクレオチドは、配列決定されてよく、複数の配列リードを作成する。ポリヌクレオチドを含む試料中の腫瘍負荷は、試料から生成された配列リードの総数に対する、変種を保有する配列リードの相対的な数として推定できる。同様に、コピー数変種の場合、腫瘍負荷は、検査および対照遺伝子座での配列リードの総数の相対的過剰(遺伝子重複の場合)または相対的欠乏(遺伝子削減の場合)として推定できる。そのため例えばランは、癌遺伝子遺伝子座にマッピングされた1000個のリードを作成でき、その900個は野生型に対応し、100個はこの遺伝子でのコピー数変種を示すがん変異体に対応する。一部の実施形態では遺伝子情報は、がん細胞のゲノム構成または単一の播種性がん細胞のゲノム構成を定義する変数を含む。一部の実施形態では遺伝子情報は、個体由来の無細胞DNA中の1つまたは複数の遺伝子座からの配列または存在量データを含む。例示的標本収集物および遺伝子材料の配列決定についてのさらなる詳細は、下の図3A~3Bに考察されている。
次に遺伝子情報は、処理される(72)。次いで遺伝子変種は、特定される。遺伝子変種は、配列変種、コピー数変種およびヌクレオチド修飾変種を含む。配列変種は、遺伝子ヌクレオチド配列における変動である。コピー数変種は、ゲノムの一部分のコピー数における野生型からの逸脱である。遺伝子変種は、例えば単一ヌクレオチド多型(SNP)、挿入、欠失、逆位、塩基転換、移行、遺伝子融合、染色体融合、遺伝子短縮化、コピー数多型(例えば、異数性、部分異数性、倍数性、遺伝子増幅)、核酸化学的修飾での異常な変化、エピジェネティックなパターンでの異常な変化および核酸メチル化での異常な変化を含む。次いで工程は、遺伝子材料を含有する試料中の遺伝子変種の出現頻度を決定する。この工程はノイズが多いことから、工程はノイズから情報を分離する(73)。遺伝子変種の検出感度は、ポリヌクレオチドのリード深度を増大させることによって上昇させることができる(例えば、2回またはそれより多くの時点での対象由来の試料においてより大きなリード深度で配列決定することによる)。
配列決定方法は、誤差率を有する。例えばIlluminaのmySeq systemは、1桁台前半の数字での誤差率パーセントを生じる場合がある。したがって1000個の配列リードの遺伝子座へのマッピングについて、約50個のリード(約5%)が誤差を含むことが予測され得る。WO2014/149134(TalasazおよびEltoukhy)に記載のものなどのある特定の方法論は、誤差率を顕著に低減できる。誤差は、試料中に低レベルで存在するがん由来のシグナルを不明瞭にし得るノイズを作る。したがって試料が腫瘍負荷を配列決定システム誤差率付近のレベル、例えばおよそ0.1%~5%で有する場合、がんによる遺伝子変種に対応するシグナルを、ノイズによるものと識別することは困難である可能性がある。
がんの診断は、ノイズの存在下であっても遺伝子変種を分析することによって行うことができる。分析は、配列変種の出現頻度またはCNVのレベルに基づくことができ(74)、ノイズ範囲で遺伝子変種を検出するための診断確度指標またはレベルは確立できる(75)。
次に工程は、診断確度を増加させる。これは、診断の確度を増加させるために複数の測定値を使用して(6)、または代替的にがんが進行している、寛解にあるもしくは安定しているかどうかを判定する複数の時点(例えば、2、3、4、5、6、7、8、9、10回またはそれより多くの時点)での測定値を使用して(77)行うことができる。診断的確度は、疾患状態を特定するために使用できる。例えば対象から採取された無細胞ポリヌクレオチドは、正常細胞由来のポリヌクレオチドおよびがん細胞などの疾患細胞由来のポリヌクレオチドを含む場合がある。がん細胞由来のポリヌクレオチドは、体細胞変異およびコピー数変種などの遺伝子変種を保有している場合がある。対象由来の試料からの無細胞ポリヌクレオチドを配列決定すると、これらのがんポリヌクレオチドは配列変種としてまたはコピー数変種として検出される。無細胞ポリヌクレオチドの試料中の腫瘍ポリヌクレオチドの相対量は、「腫瘍負荷」と称される。
パラメーターの測定は、それらがノイズ範囲にあるかどうかにかかわらず、信頼区間を有して提供されてよい。経時的に検査されると、信頼区間を経時的に比較することによってがんが進行している、安定しているまたは寛解にあるかどうかを判定できる。信頼区間が重複しない場合、これは疾患の方向性を示している。
次に工程は、遺伝レポート/診断を作成する。最初に工程は、類似する遺伝子プロファイルを有する集団から過去の処置を検索する(78)。工程は、変異傾向を示す複数の測定値について遺伝子グラフを作成すること(79)ならびに処置結果および選択肢を示すレポートを作成すること(80)を含む。
1つの適用は、がんの検出である。多数のがんが本明細書に記載の方法およびシステムを使用して検出できる。がん細胞は、多くの細胞と同様に、古い細胞が死に、より新しい細胞によって置き換えられる代謝回転速度によって特徴付けられ得る。一般に死細胞は、所与の対象の血管系との接触でDNAまたはDNAの断片を血流へ放出する場合がある。これは、疾患の種々のステージの際のがん細胞にも言える。がん細胞は、疾患のステージに応じて、コピー数多型および変異などの種々の遺伝子異常によっても特徴付けられる。この現象は、本明細書に記載の方法およびシステムを使用して個々のがんの存在または不在を検出するために使用できる。
例えばがんの危険を有する対象由来の血液は、採血され、無細胞ポリヌクレオチドの集団を生成するために本明細書に記載のとおり調製されてよい。一例ではこれは、無細胞DNAであってよい。本開示のシステムおよび方法は、そのある特定のがんに存在する可能性がある変異またはコピー数多型を検出するために用いられてよい。方法は、疾患の症状または他のホールマークの欠如にもかかわらず、身体におけるがん性細胞の存在の検出を補助できる。
本明細書において使用される場合、用語「がん」は、これだけに限らないが、種々の種類の悪性新生物を含み、その大部分が周囲の組織に侵入でき、異なる部位に転移する可能性がある(例えば、すべての目的のためにその全体が参照により本明細書に組み込まれるPDR Medical Dictionary、第1版(1995年)を参照されたい)。用語「新生物」および「腫瘍」は、正常よりさらに急速な細胞プロリファレーションによって増殖し、プロリファレーションを開始する刺激が除去された後も増殖し続ける異常組織を指す。そのような異常組織は、構造的構成および正常組織との機能的協調の部分的なまたは完全な欠如を示し、良性(良性腫瘍など)または悪性(悪性腫瘍など)のいずれかである可能性がある。がんの一般的カテゴリーの例として、これだけに限らないが、癌(例えば、一般的な形態の乳房、前立腺、肺および結腸のがんなどの上皮細胞由来の悪性腫瘍)、肉腫(結合組織または間葉系細胞由来の悪性腫瘍)、リンパ腫(造血細胞由来の悪性病変)、白血病(造血細胞由来の悪性病変)ならびに生殖細胞腫瘍(全能性細胞由来腫瘍、成人では精巣または卵巣において最もしばしば見出される;胎児、乳児および幼児では、身体正中、特に尾骨の先端で最もしばしば見出される)、芽細胞腫瘍(典型的には未成熟または胚性組織に似ている悪性腫瘍)などが挙げられる。本発明により包含されることが意図される新生物の種類の例として、これだけに限らないが、神経組織、造血組織、乳房、皮膚、骨、前立腺、卵巣、子宮、子宮頸部、肝臓、肺、脳、喉頭、胆嚢、膵臓、直腸、副甲状腺、甲状腺、副腎、免疫系、頭頸部、結腸、胃、気管支および/または腎臓のがんに伴う新生物が挙げられる。具体的な実施形態では、検出できるがんの種類および数として、これだけに限らないが、血液がん、脳がん、肺がん、皮膚がん、鼻がん、咽頭がん、肝がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形腫瘍、不均質腫瘍、均質腫瘍などが挙げられる。
がんの早期検出において、本明細書に記載のいずれのシステムおよび方法も、変異検出またはコピー数多型検出を含んでがんを検出するために利用できる。これらのシステムおよび方法は、がんを生じるまたはがんから生じる可能性がある多数の遺伝子異常を検出するために使用できる。これらは、これだけに限らないが、変異、変異、インデル、コピー数多型、塩基転換、移行、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変化、遺伝子融合、染色体融合、遺伝子短縮化、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸化学修飾における異常な変化、エピジェネティックパターンにおける異常な変化、核酸メチル化における異常な変化、感染およびがんを含むことができる。
追加的に本明細書に記載のシステムおよび方法は、ある特定のがんの特徴付けを補助するためにも使用できる。本開示のシステムおよび方法から作成された遺伝子データは、開業医ががんの具体的な形態をより良好に特徴付けられるようにできる場合がある。しばしばがんは、組成およびステージの両方で不均質である。遺伝子プロファイルデータは、具体的な亜型の診断または処置において重要である可能性があるがんの具体的な亜型の特徴付けを可能にする場合がある。この情報は、がんの具体的な種類の予後に関する手掛かりも対象または開業医に提供できる。
本明細書で提供するシステムおよび方法は、具体的な対象における既知のがん、または他の疾患をモニターするために使用できる。これは、対象または開業医のいずれかが処置選択肢を疾患の進行に応じて適合できるようにする場合がある。この例では本明細書に記載のシステムおよび方法は、具体的な対象の疾患の経過の遺伝子プロファイルを構築するために使用できる。一部の場合ではがんは、進行し、さらに攻撃的におよび遺伝子的に不安定になる場合がある。他の例ではがんは、良性、不活性または休止状態のままである場合がある。本開示のシステムおよび方法は、疾患進行を判定することにおいて有用であり得る。
さらに本明細書に記載のシステムおよび方法は、具体的な処置選択肢の有効性を判定することにおいて有用である場合がある。一例では、処置が成功すると、より多くのがんが死滅し、DNAが排出される場合があることから、良好な処置選択肢は対象の血液中で検出されるコピー数多型または変異の量を実際に増大させることができる。他の例では、これは生じない場合がある。別の例では、おそらくある特定の処置選択肢は、がんの遺伝子プロファイルと経時的に相関する場合がある。この相関は、治療を選択することにおいて有用である場合がある。追加的にがんが処置後に寛解にあると観察される場合、本明細書に記載のシステムおよび方法は、残った疾患または疾患の再発をモニターすることにおいて有用である場合がある。
本明細書に記載の方法およびシステムは、がんだけに関連する変異およびコピー数多型の検出だけに限定されなくてよい。種々の他の疾患および感染は、早期の検出およびモニタリングが好適である可能性がある他の種類の状態を生じる場合がある。例えばある特定の場合、遺伝性障害または感染性疾患は、対象内である特定の遺伝的モザイク現象を生じる場合がある。この遺伝的モザイク現象は、観察できるコピー数多型および変異を生じる場合がある。別の例では本開示のシステムおよび方法は、身体内の免疫細胞のゲノムをモニターするためにも使用できる。B細胞などの免疫細胞は、ある特定の疾患の存在で急速なクローン増殖を受ける場合がある。クローン増殖は、コピー数多型検出を使用してモニターでき、ある特定の免疫状態をモニターできる。この例ではコピー数多型分析は、具体的な疾患がどのように進行する可能性があるかのプロファイルを作成するために経時的に実施されてよい。
さらに本開示のシステムおよび方法は、細菌またはウイルスなどの病原体によってもたらされる場合に全身性感染自体をモニターするためにも使用できる。コピー数多型またはさらに変異検出は、病原体の集団が感染の経過の際にどのように変化するかを判定するために使用できる。これは、HIV/AIDsまたは肝炎感染などの慢性感染症の際に、ウイルスが感染の経過の際に生活環状態を変化させ、および/またはさらに病原性の形態に変異する場合があることから特に重要である可能性がある。
本開示のシステムおよび方法が使用される場合があるさらに別の例は、移植対象のモニタリングである。一般に移植組織は、移植において身体によってある程度の拒絶を受ける。本開示の方法は、免疫細胞が移植組織を破壊しようと試みる場合に、宿主の身体の拒絶活性を判定またはプロファイルするために使用されてよい。これは、移植組織の状況のモニタリングおよび処置の経過の変更または拒絶の予防において有用である可能性がある。
さらに本開示の方法は、対象における異常な状態の不均質性を特徴付けるために使用でき、方法は対象における細胞外ポリヌクレオチドの遺伝子プロファイルを作成するステップであって、遺伝子プロファイルがコピー数多型および変異分析から生じる複数のデータを含む、ステップを含む。これだけに限らないが、がんを含む一部の場合では、疾患は不均質である場合がある。疾患細胞は、同一でない場合がある。がんの例では一部の腫瘍は、異なる種類の腫瘍細胞、がんの異なるステージにある一部の細胞を含むことが公知である。他の例では不均質性は、疾患の複数の病巣を含む場合がある。さらにがんの例では、1つまたは複数の病巣がおそらく原発部位から拡がった転移(遠隔転移としても公知)の結果である、複数の腫瘍病巣がある場合がある。
本開示の方法は、不均質な疾患における異なる細胞由来の遺伝子情報の総和であるプロファイル、フィンガープリントまたはデータのセットを作成するために使用できる。このデータのセットは、コピー数多型および変異分析を単独または組合せで含んでよい。
追加的に本開示のシステムおよび方法は、がんまたは胎児期由来の他の疾患の診断、予測、モニターまたは観察のために使用できる。すなわちこれらの方法論は、そのDNAおよび他のポリヌクレオチドが母胎の分子と共に循環している可能性がある生まれる前の対象におけるがんまたは他の疾患の診断、予測、モニターまたは観察のために、妊娠中の対象において用いられてよい。
さらにこれらのレポートは、インターネットを介して電子的に提出され、アクセスされる。配列データの分析は、対象の場所以外のサイトで行われる。レポートは、作成され、対象の場所に伝達される。インターネット可能なコンピュータを介して対象は、その腫瘍負荷を示すレポートにアクセスする。
アノテートされた情報は、他の薬物処置選択肢を選択するためにおよび/または保険会社に薬物処置選択肢についての情報を提供するためにヘルスケア提供者によって使用されてよい。方法は、例えばthe NCCN Clinical Practice Guidelines in Oncology(商標)またはthe American Society of Clinical Oncology (ASCO)診療ガイドラインにある状態のために薬物処置選択肢をアノテートするステップを含んでよい。
レポートにおいて層別化される薬物処置選択肢は、追加的薬物処置選択肢を列挙することによってレポートでアノテートされてよい。追加的薬物処置は、承認適応症外使用のためのFDA承認薬であってよい。1993年包括的財政調整法(OBRA)の条項は、メディケアに標準医学一覧(standard medical compendia)に含まれる抗がん薬の承認適応症外使用を負担するように要求している。アノテートリストのために使用される薬物は、the National Comprehensive Cancer Network (NCCN) Drugs and Biologics Compendium(商標)、Thomson Micromedex DrugDex(登録商標)、Elsevier Gold Standard's Clinical Pharmacology compendiumおよびAmerican Hospital Formulary Service-Drug Information Compendium(登録商標)を含むCMS承認一覧に見出すことができる。
薬物処置選択肢は、具体的な状況の1つまたは複数の分子マーカーを有するがんを処置することにおいて有用である可能性がある実験的薬物を列挙することによってアノテートできる。実験的薬物は、in vitroデータ、in vivoデータ、動物モデルデータ、前臨床試験データまたは臨床試験データが入手可能である薬物であってよい。データは、例えば、American Journal of Medicine、Annals of Internal Medicine、Annals of Oncology、Annals of Surgical Oncology、Biology of Blood and Marrow Transplantation、Blood、Bone Marrow Transplantation、British Journal of Cancer、British Journal of Hematology、British Medical Journal、Cancer、Clinical Cancer Research、Drugs、European Journal of Cancer (以前はthe European Journal of Cancer and Clinical Oncology)、Gynecologic Oncology、International Journal of Radiation, Oncology, Biology, and Physics、The Journal of the American Medical Association、Journal of Clinical Oncology、Journal of the National Cancer Institute、Journal of the National Comprehensive Cancer Network (NCCN)、Journal of Urology、Lancet、Lancet Oncology、Leukemia、The New England Journal of MedicineおよびRadiation Oncologyを含むCMS Medicare Benefit Policy Manualに列挙される学術雑誌において見出される査読医学文献において発表されていてよい。
薬物処置選択肢は、列挙された薬物を薬物に関する科学的情報に繋ぐ電子ベースレポートにリンクを提供することによってアノテートされてよい。例えばリンクは、薬物についての臨床試験に関する情報のために提供されてよい(clinicaltrials.gov)。レポートがコンピュータまたはコンピュータウェブサイトを介して提供される場合、リンクは、脚注、ウェブサイトへのハイパーリンンク、ポップアップボックスまたは情報を含むフライオーバーボックスなどであってよい。レポートおよびアノテートされた情報は、印刷された書式で提供されてよく、アノテーションは、例えば参考文献への脚注であってよい。
レポートにおいて1つまたは複数の薬物処置選択肢をアノテートするための情報は、例えば科学的情報を保管している商業実体によって提供されてよい。ヘルスケア提供者は、がん対象などの対象をアノテートされた情報に列挙された実験的薬物で処置でき、ヘルスケア提供者はアノテートされた薬物処置選択肢にアクセスでき、科学的情報を検索でき(例えば、医学雑誌の論文を印刷する)、薬物処置の提供についての還付のための依頼書と共にそれを保険会社に提出(例えば、印刷された雑誌の論文)できる。医師は、還付を可能にするためのさまざまな診断関連群(DRG)コードのいずれも使用できる。
レポートにおける薬物処置選択肢は、薬物が影響を与える経路における他の分子構成成分に関する情報でアノテートされてもよい(例えば、薬物標的である細胞表面受容体の下流のキナーゼを標的化する薬物についての情報)。薬物処置選択肢は、1つまたは複数の他の分子経路構成成分を標的化する薬物についての情報でアノテートされてよい。経路に関する情報の特定および/またはアノテーションは、別の会社に外注または下請けに出されてよい。アノテートされた情報は、例えば薬物名(例えば、承認適応症外使用のためのFDA承認薬物;CMS承認一覧に見出される薬物、および/または科学(医学)雑誌論文に記載された薬物)、1つまたは複数の薬物処置選択肢に関する科学的情報、1つまたは複数の薬物に関する科学的情報への1つまたは複数のリンク、1つまたは複数の薬物に関する臨床試験情報(例えば、clinicaltrials.gov/からの情報)、薬物に関する科学的情報の引用のための1つまたは複数のリンクなどであってよい。アノテートされた情報は、レポートの任意の場所に挿入されてよい。アノテートされた情報は、レポートの複数の場所に挿入されてよい。アノテートされた情報は、階層化された薬物処置選択肢についてのセクション近くでレポートに挿入されてよい。アノテートされた情報は、階層化された薬物処置選択肢から離れた頁でレポートに挿入されてよい。階層化された薬物処置選択肢を含まないレポートは、情報でアノテートされてよい。
提供される方法は、対象(例えば、がん対象)から単離された試料(例えば、腫瘍細胞)への薬物の効果を調査するための手段も含んでよい。がん対象からの腫瘍を使用するin vitro培養は、当業者に公知の技法を使用して確立できる。提供される方法は、前記in vitro培養および/または異種移植モデルを使用するFDA承認適応症外使用薬物または実験的薬物のハイスループットスクリーニングを含む場合もある。提供される方法は、再発の検出のための腫瘍抗原をモニターするステップも含んでよい。
レポートは作成され、がんを有する対象についてゲノム位置およびコピー数多型をマッピングする。これらのレポートは、既知の結果を有する対象の他のプロファイルと比較して、具体的ながんが攻撃性であり、処置に耐性であることを示すことができる。対象は、ある期間モニターされ、再検査される。その期間の最後にコピー数多型プロファイルが劇的に増加し始めた場合、これは、現在の処置が働いていないことを示している可能性がある。比較は、他の前立腺対象の遺伝子プロファイルで行われる。例えば、コピー数多型におけるこの増加が、がんが進行していることを示すと判定されると、処方された元の処置レジメンがもはやがんを処置しておらず、新たな処置が処方される。
図2A~2Bは、遺伝レポートおよび診断を作成するための一実施形態をより詳細に示す。一履行では図2Bは、非CNVレポート変異体対立遺伝子出現頻度を処理するために図1Aのシステムによって実行される例示的疑似コードを示す。しかしシステムは、CNVレポート変異体対立遺伝子出現頻度も同様に処理できる。
次に図2Aを検討すると、工程はDNA配列決定装置から遺伝子情報を受け取る(30)。次いで工程は、特定の遺伝子変化およびその量を決定する(32)。次に腫瘍応答マップが作成される。マップを作成するために工程は、すべての検査点にわたってレンダーリングするために各遺伝子変化についての量を正規化し、次いで倍率を作成する(34)。本明細書において使用される場合、用語「正規化する」は、異なるスケールで測定された値を名目上共通のスケールに調整する手段を一般に指す。例えば異なる点で測定されたデータは、すべての値が共通のスケールにサイズ変更され得るように変換/調整される。本明細書において使用される場合、用語「倍率」は、ある量を計るまたは拡大する数を一般に指す。例えば、方程式y=Cxにおいて、Cはxについての倍率である。Cはxの係数でもあり、y対xの比例の定数と称される場合もある。値は、視覚的に分かりやすい共通スケールにプロットできるように正規化される。倍率は、プロットされる値に対応する正確な高さを知るために使用される(例えば10%変異体対立遺伝子出現頻度は、レポート上では例えば1cmを意味する)。倍率は、すべての検査点に適用され、それにより全体の倍率であると見なされる。各検査点について工程は、情報を腫瘍応答マップにレンダーリングする(36)。操作36では工程は、決定された倍率を使用して変化および相対的高さをレンダーリングし(42)、各変化について固有の視覚指標を割り当てる。応答マップに加えて工程は、変化および処置選択肢の概要を作成する。同様に具体的な遺伝子変化を補助できる臨床試験からの情報および他の有益な処置提案は、用語、検査方法論の説明と共に示され、他の情報はレポートに加えられ、ユーザーに提供される。
一履行ではコピー数多型は、グラフとしてレポートされてよく、ゲノム中の種々の位置およびそれぞれの位置でのコピー数多型の対応する増加または減少または維持を示している。追加的にコピー数多型は、無細胞ポリヌクレオチド試料中にどれだけの疾患材料(またはコピー数多型を有する核酸)が存在するかを示す百分率スコアをレポートするために使用されてよい。
これらのレポートは、インターネットを介して電子的に提出され、アクセスされる。配列データの分析は、対象の場所以外のサイトで行われる。レポートは、作成され、対象の場所に伝達される。インターネット可能なコンピュータを介して対象は、その腫瘍負荷を示すレポートにアクセスする。
次に、例示的遺伝子検査工程の詳細が開示される。次に図3Aを検討すると、例示的工程は、血液試料または他の身体試料から遺伝子材料を受け取る(102)。工程は、遺伝子材料からのポリヌクレオチドをタグ付き親ヌクレオチドに変換する(104)。タグ付き親ヌクレオチドは、増幅後代ポリヌクレオチドを産生するために増幅される(106)。増幅ポリヌクレオチドのサブセットは、配列リードを作成するために配列決定され(108、固有のタグ付き親ヌクレオチドからそれぞれ生成されるファミリーにグループ化される(110)。選択された遺伝子座で工程は、各ファミリー信頼スコアを各ファミリーに割り当てる(112)。次にコンセンサスが過去のリーディングを使用して決定される。これは、各ファミリーについての過去の信頼スコアを再検討することによって行われ、一致する過去の信頼スコアが存在する場合、それにより最新の信頼スコアは増加される(114)。過去の信頼スコアはあるがそれらが一致しない場合、一実施形態では最新の信頼スコアは変更されない(116)。他の実施形態では信頼スコアは、一致しない過去の信頼スコアについて既定の様式で調整される。これが、ファミリーが検出された最初の場合では、最新の信頼スコアは、それらが誤ったリーディングである可能性があることから、低減される場合がある(118)。工程は、タグ付き親ポリヌクレオチドのセット中の遺伝子座でのファミリーの出現頻度を信頼スコアに基づいて推測できる。次いで遺伝子検査レポートは上に考察したとおり作成される(120)。
一部の実施形態では、検出された変化のサブセットだけがプロットされる。一部の実施形態ではサブセットは、ドライバーの変化である可能性、または処置への応答の増大もしくは低減との関連に基づいて選択される。一部の実施形態では、疾患負担を推測するために体液に基づく検査で検出されたゲノム変化の大きさの組合せが使用される。一部の実施形態では、検出された変異の対立遺伝子割合、対立遺伝子の不均衡、または遺伝子特異的適用範囲は疾患負担を推測するために使用される。一部の実施形態では全体のスタック高は、対象における全体の疾患負担または疾患負担スコアを表している。一部の実施形態では各遺伝子変種を表すために異なる色が使用される。一部の実施形態では、検出された遺伝子変種のサブセットだけがプロットされる。一部の実施形態ではサブセットは、ドライバーの変化である可能性、または処置への応答の増大もしくは低減との関連に基づいて選択される。
変異またはコピー数多型検出のための情報を増強するために経時的な情報が図3A~3Bでは使用されたが、他の共通方法も適用できる。他の実施形態では歴史的比較が、遺伝的多型の例を検出するために具体的な参照配列への他のコンセンサス配列マッピングと共に使用される場合がある。具体的な参照配列へのコンセンサス配列マッピングは測定され、対照試料に対して正規化されてよい。参照配列への分子マッピングの測定は、コピー数が変動しているまたはヘテロ接合性が失われているゲノム中の領域を特定するためにゲノム全体で比較されてよい。共通方法は、例えばデジタル通信理論、情報理論または、バイオインフォマティクス由来のコンセンサス配列構築の線形または非線形方法(投票、平均化、統計的、最大事後もしくは最大尤度検出、動的プログラミング、ベイジアン、隠れマルコフまたはサポートベクターマシン方法など)を含む。配列リード適用範囲が判定された後、確率論的モデル化アルゴリズムは、各ウインドウ領域についての正規化核酸配列リード適用範囲を別々のコピー数状態に変換するために適用される。一部の場合では、このアルゴリズムは、次の:隠れマルコフモデル、動的プログラミング、サポートベクターマシン、ベイジアンネットワーク、トレリスデコーディング、ビタビデコーディング、期待値最大化、カールマンフィルタリング方法論および神経ネットワークの1つまたは複数を含んでよい。
人工神経ネットワーク(NNet)は脳の神経構造に基づいて「ニューロン」のネットワークを模倣する。それらは、記録を1度に1個ずつまたは一括様式で処理し、記録のそれらの分類(これは最初は大部分は無作為である)を記録の既知の実際の分類と比較することによって「学習」する。MLP-NNetでは、第1の記録の最初の分類からの誤差は、ネットワークにフィードバックされ、2回目にネットワークのアルゴリズムを修正するために使用され、多数の反復について同様。
神経ネットワークは、データケース(列)がネットワークに1回に1個ずつ提示される反復学習工程を使用し、入力値に関連するウエイトは毎回調整される。
すべてのケースが提示された後、工程はしばしば最初からもう一度やり直す。この学習フェーズの際に、ネットワークは、投入試料の正しい分類標識を予測できるようにウエイトを調整することによって学習する。神経ネットワーク学習は、ユニット間のコネクションから「コネクショニスト学習」とも称される。神経ネットワークの有利点として、ノイズの多いデータへのそれらの高い耐性および、それらが訓練されていないパターンを分類するそれらの能力が挙げられる。1つの神経ネットワークアルゴリズムは、レーベンバーグ・マカートなどの逆伝搬アルゴリズムである。ネットワークが具体的な適用のために構築されると、そのネットワークは訓練される準備ができている。この工程を開始するために初期ウエイトは無作為に選択される。次いで訓練または学習が始まる。
ネットワークは、隠れた層でウエイトおよび関数を使用して、訓練データ中の記録を1回に1個処理し、次いで得られた出力を望ましい出力と比較する。次いで誤差は、システムを通じて伝搬されて戻り、処理される次の記録への適用のためにシステムにウエイトを調整させる。ウエイトが継続的に微調整されることから、この工程は繰り返される。ネットワークの訓練の際にデータの同じセットは、接続ウエイトが継続的に改善されるように何度も処理される。
一実施形態では、訓練用データセットでの機械学習ユニットの訓練ステップは、検査試料に適用するための1つまたは複数の分類モデルを作成できる。これらの分類モデルは、治療介入への対象の応答を予測するために検査試料に適用されてよい。
図3Bに示すとおり、対照試料または参照配列との配列適用範囲の比較は、ウインドウにわたる正規化を補助できる。本実施形態では無細胞DNAは、血液などの容易に入手できる体液から抽出および単離される。例えば、無細胞DNAは、これだけに限らないが、イソプロパノール沈殿および/またはシリカベース精製を含む当技術分野において公知の種々の方法を使用して抽出されてよい。無細胞DNAは、がんを有さない対象、がんの危険を有する対象またはがんを有することが既知である対象(例えば他の手段を通じて)などの任意の数の対象から抽出されてよい。
単離/抽出ステップに続いて、任意の多数の異なる配列決定操作は、無細胞ポリヌクレオチド試料に実施されてよい。試料は、1つまたは複数の試薬(例えば、酵素、固有識別子(例えば、バーコード)、プローブなど)での配列決定前に処理されてよい。試料がバーコードなどの固有識別子で処理される一部の場合では、試料または試料の断片は、固有識別子で個々にまたはサブグループでタグ付けされてよい。次いでタグ付き試料は、個々の分子が親分子まで追跡され得る配列決定反応などの下流適用において使用できる。
無細胞ポリヌクレオチドは、具体的なポリヌクレオチドの後続の特定および由来を可能にするためにタグ付けまたは追跡されてよい。個々のまたはサブグループのポリヌクレオチドへの識別子(例えば、バーコード)の割り当ては、固有の同一性が個々の配列または配列の断片に割り当てられるようにできる場合がある。これは、個々の試料由来のデータの取得を可能にする場合があり、試料の平均に限定されない。一部の例では核酸または1本鎖由来の他の分子は、共通のタグまたは識別子を共有でき、それによりその鎖由来であることが後に特定できる。同様に、核酸の1本鎖由来のすべての断片は、同じ識別子またはタグでタグ付けされてよく、それにより親鎖由来の断片の後続の特定を可能にする。他の場合では遺伝子発現産生物(例えば、mRNA)は、バーコード、またはそれが付着している配列との組合せでのバーコードが計数され得ることから、発現を定量するためにタグ付けされてよい。さらに他の場合ではシステムおよび方法は、PCR増幅対照として使用できる。そのような場合ではPCR反応由来の複数の増幅産生物が同じタグまたは識別子でタグ付けされてよい。産生物が後に配列決定され、配列差異を実証した場合、同じ識別子を有する産生物内の差異は、PCR誤差が原因である可能性がある。追加的に個々の配列は、リード自体の配列データの特徴に基づいて特定できる。例えば、個々の配列決定リードの始め(開始)および最後(停止)部分での固有の配列データの検出は、単独でまたは個々の分子に固有の同一性を割り当てるための各配列リード固有配列の長さもしくは塩基対の数との組合せで使用されてよい。核酸の1本鎖由来の断片は、固有の同一性を割り当てられ、それにより親鎖由来の断片の後続の特定を可能にする場合がある。これは、変動を限定するための最初の出発遺伝子材料の制約と共に使用できる。
さらに、個々の配列決定リードの始め(開始)および最後(停止)部分での固有の配列データならびに配列決定リード長を使用することは、単独でまたはバーコードの使用との組合せで使用されてよい。一部の場合ではバーコードは、本明細書に記載のとおり固有であってよい。他の場合ではバーコード自体は、固有でなくてよい。この場合、個々の配列決定リードの始め(開始)および最後(停止)部分での配列データならびに配列決定リード長との組合せでの固有でないバーコードの使用は、個々の配列への固有の同一性の割り当てを可能にする場合がある。同様に、固有の同一性を割り当てられた核酸の1本鎖由来の断片は、それにより親鎖由来の断片の後続の特定を可能にする場合がある。
一般に本明細書で提供する方法およびシステムは、下流適用配列決定反応のための無細胞ポリヌクレオチド配列の調製のために有用である。しばしば配列決定方法は、古典的サンガー配列決定である。
本明細書において使用される場合、用語「配列決定」は、生体分子、例えばDNAまたはRNAなどの核酸の配列を決定するために使用される任意の多数の技術を指す。例示的配列決定方法として、これだけに限らないが、標的化配列決定、単分子リアルタイム配列決定、エクソン配列決定、電子顕微鏡ベース配列決定、パネル配列決定、トランジスタ媒介配列決定、直接配列決定、ランダムショットガン配列決定、サンガーダイデオキシターミネーション配列決定、全ゲノム配列決定、ハイブリダイゼーションによる配列決定、パイロシークエンシング、キャピラリー電気泳動、ゲル電気泳動、二重鎖配列決定、サイクル配列決定、単塩基伸長配列決定、固相配列決定、ハイスループット配列決定、超並列シグネチャー配列決定、エマルジョンPCR、低変性温度PCRでの同時増幅(COLD-PCR)、多重PCR、可逆的ダイターミネーターによる配列決定、ペアエンド配列決定、ニアターム配列決定、エクソヌクレアーゼ配列決定、ライゲーションによる配列決定、ショートリード配列決定、単一分子配列決定、合成による配列決定、リアルタイム配列決定、リバースターミネーター配列決定、ナノポア配列決定、454配列決定、Solexa Genome Analyzer配列決定、SOLiD(商標)配列決定、MS-PET配列決定、およびこれらの組合せが挙げられる。一部の実施形態では配列決定は、例えばIlluminaまたはApplied Biosystemsから商業的に入手できる遺伝子分析機などの遺伝子分析機によって実施されてよい。一部の実施形態では配列決定方法は、超並列配列決定であってよい、すなわちポリヌクレオチド分子少なくとも100個、1000個、10,000個、100,000個、100万個、1000万個、1億個または10億個の同時(または高速で連続した)配列決定である。
配列決定方法は、試料調製、配列リードを作成するための調製試料中のポリヌクレオチドの配列決定ならびに、試料について定量的および/または定性的遺伝子情報を作成するための配列リードのバイオインフォマティクス操作を典型的には含む。試料調製は、使用される配列決定プラットホームに適合する形態に試料中のポリヌクレオチドを変換することを典型的には含む。この変換は、ポリヌクレオチドをタグ付けすることを含んでよい。本発明のある特定の実施形態ではタグは、ポリヌクレオチド配列タグを含む。配列決定において使用される変換方法論は、効率が100%でない場合がある。例えば、試料中のポリヌクレオチドが変換効率約1~5%で変換される、すなわち試料中のポリヌクレオチドの約1~5%がタグ付きポリヌクレオチドに変換されることは珍しくない。タグ付き分子に変換されなかったポリヌクレオチドは、配列決定のためのタグ付きライブラリーに提示されない。したがって、開始遺伝子材料中に低出現頻度で提示される遺伝子変種を有するポリヌクレオチドは、タグ付きライブラリーで提示されない場合があり、したがって配列決定または検出されない場合がある。変換効率を上昇させることによって、開始遺伝子材料中のポリヌクレオチドがタグ付きライブラリーに提示され、その結果として配列決定によって検出される確率は上昇する。さらに、ライブラリー調製の低変換効率課題に直接取り組むよりも、今日までの大部分のプロトコールは1マイクログラムより多いDNAを投入材料として必要としている。しかし、投入試料材料が限られているまたは低提示でのポリヌクレオチドの検出が望ましい場合、高変換効率は、試料を効率的に配列決定できるおよび/またはそのようなポリヌクレオチドを適切に検出できる。
一般に変異検出は、精製および単離されたゲノムまたはトランスクリプトームの選択的に濃縮された領域で実施されてよい(302)。本明細書に記載の、これだけに限らないが遺伝子、癌遺伝子、腫瘍抑制遺伝子、プロモーター、制御配列エレメント、非コード領域、miRNA、snRNAなどを含み得る特定の領域は、無細胞ポリヌクレオチドの全集団から選択的に増幅できる。これは、本明細書に記載のとおり実施されてよい。一例では多重配列決定は、個々のポリヌクレオチド配列についてのバーコード標識を伴ってまたは伴わずに使用されてよい。他の例では配列決定は、当技術分野において公知の任意の核酸配列決定プラットホームを使用して実施されてよい。このステップは、複数のゲノム断片配列リードを作成する(304)。追加的に参照配列は、別の対象から採取された対照試料から得られる。一部の場合では対照対象は、公知の遺伝子異常または疾患を有さないことが既知である対象であってよい。一部の場合ではこれらの配列リードは、バーコード情報を含有できる。他の例ではバーコードは利用されない。
配列決定後、リードに品質スコアが割り当てられる。品質スコアは、これらのリードが後続の分析において有用であるかどうかを閾値に基づいて示す、リードの提示であり得る。一部の場合では一部のリードは、後続のマッピングステップを行うために十分な品質または長さでない。少なくとも90%、95%、99%、99.9%、99.99%または99.999%の品質スコアを有する配列決定リードは、データセットから除外される場合がある。他の場合では、少なくとも90%、95%、99%、99.9%、99.99%または99.999%の品質スコアが割り当てられた配列決定リードは、データセットから除外される場合がある。ステップ306では、指定の品質スコア閾値に合致するゲノム断片リードが参照ゲノムまたは変異を含有しないことが公知である参照配列にマッピングされる。配列比較をマッピングした後、配列リードはマッピングスコアを割り当てられる。マッピングスコアは、各位置が一意的にマッピング可能であるかどうかを示す参照配列にマッピングバックする提示またはリードであってよい。場合により、リードは変異分析に無関係な配列であってよい。例えば一部の配列リードは、混入ポリヌクレオチド由来であってよい。少なくとも90%、95%、99%、99.9%、99.99%または99.999%のマッピングスコアを有する配列決定リードは、データセットから除外される場合がある。他の場合では、少なくとも90%、95%、99%、99.9%、99.99%または99.999%未満のマッピングスコアが割り当てられた配列決定リードは、データセットから除外される場合がある。
マッピング可能な各塩基について、マッピング可能性についての最小閾値に合致しない塩基または低品質塩基は、参照配列中に見出される対応する塩基によって置き換えられる場合がある。
リード適用範囲が確認され得、各リード中の対照配列と比較した変種塩基が特定されると、変種塩基の出現頻度は、変種を含有するリードの数をリードの総数で割ることによって算出できる。これは、ゲノム中のマッピング可能な各位置についての比として表現できる。
各塩基位置について4個すべてのヌクレオチド、シトシン、グアニン、チミン、アデニンの出現頻度は、参照配列と比較して分析される。確率論的または統計学的モデル化アルゴリズムは、各塩基変種についての出現頻度状態を反映するためにそれぞれのマッピング可能な位置を正規化された比に変換するために適用される。一部の場合このアルゴリズムは、次の:隠れマルコフモデル、動的プログラミング、サポートベクターマシン、ベイジアンまたは確率的モデリング、トレリスデコーディング、ビタビデコーディング、期待値最大化、カールマンフィルタリング方法論および神経ネットワークの1つまたは複数を含む場合がある。
ステップ312では、各塩基位置の別々の変異状態は、参照配列のベースラインと比較して高出現頻度の変動を有する塩基変種を特定するために利用できる。一部の場合ではベースラインは、少なくとも0.0001%、0.001%、0.01%、0.1%、1.0%、2.0%、3.0%、4.0% 5.0%、10%または25%の出現頻度を表す場合がある。他の場合ではベースラインは、少なくとも0.0001%、0.001%、0.01%、0.1%、1.0%、2.0%、3.0%、4.0% 5.0%、10%または25%の出現頻度を表す場合がある。一部の場合では塩基変種または変異を有するすべての近接塩基位置は、変異の存在または不在をレポートするためにセグメントに統合されてよい。一部の場合では種々の位置は、それらが他のセグメントと統合される前にフィルターされてよい。
各塩基位置についての変動の出現頻度の算出後、参照配列と比較して対象由来の配列における特異的位置についての最も大きな偏差を有する変種は、変異として特定される。一部の場合では変異は、がん変異である場合がある。他の場合では変異は、疾患状態と相関する場合がある。
変異または変種は、これだけに限らないが、単塩基置換、またはスモールインデル、塩基転換、移行、逆位、欠失、短縮化もしくは遺伝子短縮化が挙げられる遺伝子異常を含む場合がある。一部の場合では変異は、最大で長さ1、2、3、4、5、6、7、8、9、10、15または20ヌクレオチドである場合がある。他の場合では変異は、長さ少なくとも1、2、3、4、5、6、7、8、9、10、15または20ヌクレオチドである場合がある。
次にコンセンサスが過去のリーディングを使用して判定される。これは、対応する塩基についての過去の信頼スコアを再検討することによって行われ、一致する過去の信頼スコアが存在する場合、それにより最新の信頼スコアは増加される(314)。過去の信頼スコアはあるがそれらが一致しない場合、一実施形態では最新の信頼スコアは変更されない(316)。他の実施形態では信頼スコアは、一致しない過去の信頼スコアについて既定の様式で調整される。これが、ファミリーが検出される最初の場合では、最新の信頼スコアは、それらが誤ったリーディングである可能性があることから、低減される場合がある(318)。次いで工程は、各塩基あたりの変動の出現頻度を各塩基位置について別々の変種状態に変換する(320)。
多数のがんが本明細書に記載の方法およびシステムを使用して検出できる。がん細胞は、多くの細胞と同様に、古い細胞が死に、より新しい細胞によって置き換えられる代謝回転速度によって特徴付けられ得る。一般に死細胞は、所与の対象の血管系との接触で、DNAまたはDNAの断片を血流へ放出する場合がある。これは、疾患の種々のステージの際のがん細胞にも言える。がん細胞は、疾患のステージに応じて、コピー数多型および変異などの種々の遺伝子異常によっても特徴付けられてよい。この現象は、本明細書に記載の方法およびシステムを使用して個々のがんの存在または不在を検出するために使用できる。
例えばがんの危険を有する対象由来の血液は、採血され、無細胞ポリヌクレオチドの集団を生成するために本明細書に記載のとおり調製されてよい。一例ではこれは、無細胞DNAであってよい。本開示のシステムおよび方法は、そのある特定のがんに存在する可能性がある変異またはコピー数多型を検出するために用いられてよい。方法は、疾患の症状または他のホールマークの欠如にもかかわらず、身体におけるがん性細胞の存在の検出を補助できる。
検出できるがんの種類および数として、これだけに限らないが、血液がん、脳がん、肺がん、皮膚がん、鼻がん、咽頭がん、肝がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形腫瘍、不均質腫瘍、均質腫瘍などが挙げられ得る。
システムおよび方法は、がんを生じるまたはがんから生じる可能性がある多数の遺伝子異常を検出するために使用できる。これらは、これだけに限らないが、変異、変異、インデル、コピー数多型、塩基転換、移行、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変化、遺伝子融合、染色体融合、遺伝子短縮化、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸化学修飾における異常な変化、エピジェネティックパターンにおける異常な変化、核酸メチル化における異常な変化、感染およびがんを含むことができる。
追加的に本明細書に記載のシステムおよび方法は、ある特定のがんの特徴付けを補助するためにも使用できる。本開示のシステムおよび方法から作成された遺伝子データは、開業医ががんの具体的な形態をより良好に特徴付けられるようにする場合がある。しばしばがんは、組成およびステージの両方で不均質である。遺伝子プロファイルデータは、具体的な亜型の診断または処置において重要である可能性があるがんの具体的な亜型の特徴付けを可能にする場合がある。この情報は、がんの具体的な種類の予後に関する手掛かりも対象または開業医に提供できる。
本明細書で提供するシステムおよび方法は、具体的な対象における既知のがん、または他の疾患をモニターするために使用できる。これは、対象または開業医のいずれかが処置選択肢を疾患の進行に応じて適合できるようにする場合がある。この例では本明細書に記載のシステムおよび方法は、具体的な対象の疾患の経過の遺伝子プロファイルを構築するために使用できる。一部の場合ではがんは、進行し、さらに攻撃的におよび遺伝子的に不安定になる場合がある。他の例ではがんは、良性、不活性または休止状態のままである場合がある。本開示のシステムおよび方法は、疾患進行を判定することにおいて有用である場合がある。
さらに本明細書に記載のシステムおよび方法は、具体的な処置選択肢の有効性を判定することにおいて有用である場合がある。一例では、処置が成功すると、より多くのがんが死滅し、DNAが排出される場合があることから、良好な処置選択肢は対象の血液中で検出されたコピー数多型または変異の量を実際に増大させることができる。他の例では、これは生じない場合がある。別の例では、おそらくある特定の処置選択肢は、がんの遺伝子プロファイルと経時的に相関する場合がある。この相関は、治療を選択することにおいて有用である場合がある。追加的にがんが処置後に寛解にあると観察される場合、本明細書に記載のシステムおよび方法は、残った疾患または疾患の再発をモニターすることにおいて有用である場合がある。
本明細書に記載の方法およびシステムは、がんだけに関連する変異およびコピー数多型の検出だけに限定されなくてよい。種々の他の疾患および感染は、早期の検出およびモニタリングが好適である可能性がある他の種類の状態を生じる場合がある。例えばある特定の場合、遺伝性障害または感染性疾患は、対象内である特定の遺伝的モザイク現象を生じる場合がある。この遺伝的モザイク現象は、観察できるコピー数多型および変異を生じる場合がある。別の例では本開示のシステムおよび方法は、身体内の免疫細胞のゲノムをモニターするためにも使用できる。B細胞などの免疫細胞は、ある特定の疾患の存在で急速なクローン増殖を受ける場合がある。クローン増殖は、コピー数多型検出を使用してモニターでき、ある特定の免疫状態はモニターできる。この例ではコピー数多型分析は、具体的な疾患がどのように進行する可能性があるかのプロファイルを作成するために経時的に実施されてよい。
さらに本開示のシステムおよび方法は、細菌またはウイルスなどの病原体によってもたらされる場合に全身性感染自体をモニターするためにも使用できる。コピー数多型またはさらに変異検出は、病原体の集団が感染の経過の際にどのように変化するかを判定するために使用できる。これは、HIV/AIDsまたは肝炎感染などの慢性感染症の際に、ウイルスが感染の経過の際に生活環状態を変化させ、および/またはさらに病原性の形態に変異する場合があることから特に重要である可能性がある。
本開示のシステムおよび方法が使用され得るさらに別の例は、移植対象のモニタリングである。一般に移植組織は、移植において身体によってある程度の拒絶を受ける。本開示の方法は、免疫細胞が移植組織を破壊しようと試みる場合に、宿主の身体の拒絶活性を判定またはプロファイルするために使用されてよい。これは、移植組織の状況のモニタリングおよび処置の経過の変更または拒絶の予防において有用である可能性がある。
さらに本開示の方法は、対象における異常な状態の不均質性を特徴付けるために使用でき、方法は対象における細胞外ポリヌクレオチドの遺伝子プロファイルを作成するステップであって、遺伝子プロファイルがコピー数多型および変異分析から生じる複数のデータを含む、ステップを含む。これだけに限らないががんを含む一部の場合では、疾患は不均質である場合がある。疾患細胞は、同一でない場合がある。がんの例では一部の腫瘍は、異なる種類の腫瘍細胞、がんの異なるステージにある一部の細胞を含むことが公知である。他の例では不均質性は、疾患の複数の病巣を含む場合がある。さらにがんの例では、1つまたは複数の病巣がおそらく原発部位から拡がった転移の結果である、複数の腫瘍病巣がある場合がある。
本開示の方法は、不均質な疾患における異なる細胞由来の遺伝子情報の総和であるフィンガープリントまたはデータのセットを作成またはプロファイルするために使用できる。このデータのセットは、コピー数多型および変異分析を単独または組合せで含んでよい。
追加的に本開示のシステムおよび方法は、がんまたは胎児期由来の他の疾患の診断、予測、モニターまたは観察のために使用できる。すなわちこれらの方法は、そのDNAおよび他のポリヌクレオチドが母胎の分子と共に循環している可能性がある生まれる前の対象におけるがんまたは他の疾患の診断、予測、モニターまたは観察のために、妊娠中の対象において用いられてよい。
さらにこれらのレポートは、インターネットを介して電子的に提出され、アクセスされる。配列データの分析は、対象の場所以外のサイトで行われる。レポートは、作成され、対象の場所に伝達される。インターネット可能なコンピュータを介して対象は、その腫瘍負荷を示すレポートにアクセスする。
アノテートされた情報は、他の薬物処置選択肢を選択するためにおよび/または保険会社に薬物処置選択肢についての情報を提供するためにヘルスケア提供者によって使用されてよい。方法は、例えばthe NCCN Clinical Practice Guidelines in Oncology(商標)またはthe American Society of Clinical Oncology (ASCO)診療ガイドラインにある状態のために薬物処置選択肢をアノテートするステップを含んでよい。
レポートにおいて層別化される薬物処置選択肢は、追加的薬物処置選択肢を列挙することによってレポートでアノテートされてよい。追加的薬物処置は、承認適応症外使用のためのFDA承認薬であってよい。1993年包括的財政調整法(OBRA)の条項は、メディケアに標準医学一覧に含まれる抗がん薬の承認適応症外使用を負担するように要求している。アノテートリストのために使用される薬物は、the National Comprehensive Cancer Network (NCCN) Drugs and Biologics Compendium(商標)、Thomson Micromedex DrugDex(登録商標)、Elsevier Gold Standard's Clinical Pharmacology compendiumおよびAmerican Hospital Formulary Service-Drug Information Compendium(登録商標)を含むCMS承認一覧に見出すことができる。
薬物処置選択肢は、具体的な状況の1つまたは複数の分子マーカーを有するがんを処置することにおいて有用である可能性がある実験的薬物を列挙することによってアノテートできる。実験的薬物は、in vitroデータ、in vivoデータ、動物モデルデータ、前臨床試験データまたは臨床試験データが入手可能である薬物であってよい。データは、例えば、American Journal of Medicine、Annals of Internal Medicine、Annals of Oncology、Annals of Surgical Oncology、Biology of Blood and Marrow Transplantation、Blood、Bone Marrow Transplantation、British Journal of Cancer、British Journal of Hematology、British Medical Journal、Cancer、Clinical Cancer Research、Drugs、European Journal of Cancer(以前はthe European Journal of Cancer and Clinical Oncology)、Gynecologic Oncology、International Journal of Radiation, Oncology, Biology, and Physics、The Journal of the American Medical Association、Journal of Clinical Oncology、Journal of the National Cancer Institute、Journal of the National Comprehensive Cancer Network (NCCN)、Journal of Urology、Lancet、Lancet Oncology、Leukemia、The New England Journal of MedicineおよびRadiation Oncologyを含むCMS Medicare Benefit Policy Manualに列挙される学術雑誌において見出される査読医学文献において発表されていてよい。
薬物処置選択肢は、列挙された薬物を薬物に関する科学的情報に繋ぐ電子ベースレポートにリンクを提供することによってアノテートされてよい。例えばリンクは、薬物についての臨床試験に関する情報のために提供されてよい(clinicaltrials.gov)。レポートがコンピュータまたはコンピュータウェブサイトを介して提供される場合、リンクは、脚注、ウェブサイトへのハイパーリンンク、ポップアップボックスまたは情報を含むフライオーバーボックスなどであってよい。レポートおよびアノテートされた情報は、印刷された書式で提供されてよく、アノテーションは、例えば参考文献への脚注であってよい。
レポートにおいて1つまたは複数の薬物処置選択肢をアノテートするための情報は、科学的情報を保管している商業実体によって提供されてよい。ヘルスケア提供者は、がん患者などの対象をアノテートされた情報に列挙された実験的薬物で処置でき、ヘルスケア提供者はアノテートされた薬物処置選択肢にアクセスでき、科学的情報を検索でき(例えば、医学雑誌の論文を印刷する)、薬物処置の提供についての還付のための依頼書と共にそれを保険会社に提出(例えば、印刷された雑誌の論文)できる。医師は、還付を可能にするためのさまざまな診断関連群(DRG)コードのいずれも使用できる。
レポートにおける薬物処置選択肢は、薬物が影響を与える経路における他の分子構成成分に関する情報でアノテートされてもよい(例えば、薬物標的である細胞表面受容体の下流のキナーゼを標的化する薬物についての情報)。薬物処置選択肢は、1つまたは複数の他の分子経路構成成分を標的化する薬物についての情報でアノテートされてよい。経路に関する情報の特定および/またはアノテーションは、別の会社に外注または下請けに出されてよい。
アノテートされた情報は、例えば薬物名(例えば、承認適応症外使用のためのFDA承認薬物;CMS承認一覧に見出される薬物、および/または科学(医学)雑誌論文に記載された薬物)、1つまたは複数の薬物処置選択肢に関する科学的情報、1つまたは複数の薬物に関する科学的情報への1つまたは複数のリンク、1つまたは複数の薬物に関する臨床試験情報(例えば、clinicaltrials.gov/からの情報)、薬物に関する科学的情報の引用のための1つまたは複数のリンクなどであってよい。
アノテートされた情報は、レポートの任意の場所に挿入されてよい。アノテートされた情報は、レポートの複数の場所に挿入されてよい。アノテートされた情報は、階層化された薬物処置選択肢についてのセクション近くでレポートに挿入されてよい。アノテートされた情報は、階層化された薬物処置選択肢から離れた頁でレポートに挿入されてよい。階層化された薬物処置選択肢を含まないレポートは、情報でアノテートされてよい。
システムは、対象(例えば、がん患者)から単離された試料(例えば、腫瘍細胞)への薬物の効果についてのレポートも含んでよい。がん患者からの腫瘍を使用するin vitro培養は、当業者に公知の技法を使用して確立できる。システムは、前記in vitro培養および/または異種移植モデルを使用するFDA承認適応症外使用薬物または実験的薬物のハイスループットスクリーニングを含む場合もある。システムは、再発の検出のための腫瘍抗原のモニタリングも含んでよい。
システムは、がんを有する対象のレポートのインターネット接続可能アクセスを提供できる。システムは、携帯用DNA配列決定装置または卓上型DNA配列決定装置を使用できる。DNA配列決定装置は、DNA配列決定工程を自動化するために使用される科学機器である。DNA試料を所与として、DNA配列決定装置は、4個の塩基:アデニン、グアニン、シトシンおよびチミンの順序を決定するために使用される。DNA塩基の順序は、リードと称されるテキスト文字列としてレポートされる。一部のDNA配列決定装置は、それらがヌクレオチドに付着された蛍光色素から生じる光シグナルを分析することから光学機器と見なされる場合もある。
DNA配列決定装置は、DNAの化学修飾に続く特異的塩基での切断に基づくギルバートの配列決定方法を応用できる、またはダイデオキシヌクレオチド鎖終結に基づくサンガーの技法を応用できる。サンガー方法は、その効率の増大および低放射活性のために普及した。DNA配列決定装置は、DNA増幅(ポリメラーゼ連鎖反応-PCR)を必要としない技法を使用でき、配列決定前の試料調製を迅速化し、誤差を低減する。付加的に配列決定データは、相補鎖でのヌクレオチド付加によって生じる反応からリアルタイムで収集される。例えばDNA配列決定装置は、蛍光色素を含有する酵素によってヌクレオチドが相補鎖に付加されるときに発光される光(カメラによって捕捉される)によって配列決定データが作成される、単一分子リアルタイム(SMRT)と称される方法を利用できる。代替的にDNA配列決定装置は、ナノポアセンシング技術に基づく電子システムを使用できる。
データは、DNA配列決定装置によって直接接続を通じてまたはインターネットを通じて処理のためのコンピュータに送られる。システムのデータ処理態様は、デジタル電子回路で、すなわちコンピュータハードウェア、ファームウェア、ソフトウェアもしくはこれらの組合せで履行されてよい。本発明のデータ処理装置は、プログラム可能なプロセッサによる実行のために機械可読保存デバイスに実体的に埋め込まれたコンピュータプログラム製品で履行されてよく;本発明のデータ処理方法ステップは、入力データを操作し、出力を作成することによって本発明の関数を実施するための説明プログラムを実行するプログラム可能なプロセッサによって実施されてよい。本発明のデータ処理態様は、データ保存システムからデータおよび説明を受け取るためならびにデータ保存システムにデータおよび説明を伝えるために連結された少なくとも1つのプログラム可能なプロセッサ、少なくとも1つの入力デバイス、ならびに少なくとも1つの出力デバイスを含むプログラム可能なシステムで実行可能である1つまたは複数のコンピュータプログラム中で有利に履行され得る。各コンピュータプログラムは、所望により高レベル手続き型もしくはオブジェクト指向プログラム言語で、またはアセンブリでもしくは機械語で実装されてよく;いずれの場合でも言語は、コンパイラ型またはインタープリタ型言語であってよい。好適なプロセッサとして、例示の方法により、一般的および特別な目的のマイクロプロセッサが挙げられる。一般にプロセッサは、読み取り専用メモリおよび/またはランダムアクセスメモリから説明およびデータを受け取る。実体的に埋め込まれたコンピュータプログラム説明およびデータのために好適な保存デバイスは、例示の方法により、EPROM、EEPROMおよびフラッシュメモリーデバイスなどの半導体メモリーデバイス;内蔵ハードディスクおよびリムーバブルディスクなどの磁気ディスク;光磁気ディスク;およびCD-ROMディスクが挙げられるすべての形態の不揮発性メモリを含む。任意の前述のものは、ASIC(特定用途向け集積回路)によって補完されるまたはそれに組み込まれてよい。
ユーザーとの相互作用を提供するために、本発明は、ユーザーに情報を表示するためのモニターまたはLCD(液晶ディスプレイ)スクリーンなどの表示デバイスおよび、ユーザーがコンピュータシステムに入力できるようにするキーボード、マウスもしくはトラックボールなどの二次元ポインティングデバイスまたはデータグローブもしくはジャイロマウスなどの三次元ポインティングデバイスなどの入力デバイスを有するコンピュータシステムの使用を実装されてよい。コンピュータシステムは、コンピュータプログラムがユーザーと相互作用するグラフィカルユーザーインターフェースを提供するようにプログラムされてよい。コンピュータシステムは、バーチャルリアリティ、三次元ディスプレイインターフェースを提供するようにプログラムされてよい。
本発明の好ましい実施形態は、本明細書に示され、記載されたが、そのような実施形態が例示の方法によってのみ提供されることは当業者に明らかである。多くの変動、変化および置き換えが、本発明から逸脱することなく当業者に見出される。本明細書に記載の本発明の実施形態への種々の変更を、本発明を実施する際に用いることができることは理解されるべきである。後続の特許請求の範囲が本発明の範囲を定義すること、ならびにこれらの特許請求の範囲内の方法および構造物ならびにそれらの等価物は、それにより網羅されることが意図される。

Claims (48)

  1. 治療応答予測因子を作成するための方法であって、
    遺伝子分析機を使用して、遺伝子情報を作成するステップ;
    疾患を有する複数の個体それぞれについての、(1)第1の時点で作成された個体由来の遺伝子情報であって、前記遺伝子情報が、個体由来の無細胞DNAポリヌクレオチドにおける1つまたは複数の遺伝子座からの配列または存在量データを含む、遺伝子情報、および(2)第2の、後の時点で判定された1つまたは複数の治療介入への前記個体の処置応答であって、前記処置応答が、前記第2の、後の時点で作成された前記個体由来の遺伝子情報を含む、処置応答を含む訓練用データセットをコンピュータメモリに受け取るステップ;および
    前記データセットを使用して機械学習アルゴリズムを履行して、少なくとも1つのコンピュータ履行分類アルゴリズムを作成するステップであって、前記分類アルゴリズムが対象由来の無細胞DNAポリヌクレオチドからの遺伝子情報に基づいて、前記対象の治療応答を予測し、前記予測された治療応答が、体細胞性である無細胞DNAポリヌクレオチドにおける候補部位の確率を含む、ステップ
    を含み、前記無細胞DNAポリヌクレオチドが、特定の無細胞DNAポリヌクレオチドの由来の後続の特定を可能にするためにタグ付けされている、方法。
  2. 前記機械学習アルゴリズムが、サポートベクターマシン、ランダムフォレスト、最近隣分析、線形回帰、二分決定木、判別分析、ロジスティック分類指標およびクラスター分析から選択される教師ありまたは教師なし学習アルゴリズムからなる群から選択される、請求項1に記載の方法。
  3. 2回またはそれより多くの時点での検査に基づいて腫瘍発達の方向性を予測するために、前記分類アルゴリズムを使用するステップを含む、請求項1に記載の方法。
  4. 作成された予測が、遠隔転移発達の確率を決定するステップを含む、請求項1に記載の方法。
  5. 前記訓練用データセットが、がんのステージ、外科的手技の種類、年齢、腫瘍のグレード、腫瘍浸潤の深度、術後合併症の発生および血管侵入の存在からなる群から選択される臨床データをさらに含む、請求項1に記載の方法。
  6. 前記遺伝子情報が、がん細胞のゲノム構成を定義する変数を含む、請求項1に記載の方法。
  7. 前記遺伝子情報が、単一の播種性がん細胞のゲノム構成を定義する変数を含む、請求項1に記載の方法。
  8. 前記訓練用データセットを前処理するステップを含む、請求項1に記載の方法。
  9. 前記訓練用データセットを前処理するステップが、提供されたデータをクラス条件付き確率に変換するステップを含む、請求項8に記載の方法。
  10. 前記遺伝子情報が、前記個体由来の無細胞DNA中の1つまたは複数の遺伝子座からの配列または存在量データを含む、請求項1に記載の方法。
  11. 疾患状態が、がんであり、前記遺伝子分析機が、DNA配列決定装置である、請求項1に記載の方法。
  12. 遺伝子分析機を使用して、対象についての無細胞DNAポリヌクレオチド由来の遺伝子情報を作成するステップであって、前記遺伝子情報が、個体由来の無細胞DNAポリヌクレオチドにおける1つまたは複数の遺伝子座からの配列または存在量データを含む、ステップ
    前記遺伝子情報を含む検査データセットをコンピュータメモリに受け取るステップであって、前記遺伝子情報が、第1の時点で作成された遺伝子情報および第2の、後の時点で作成された処置応答の遺伝子情報を含む、ステップ;および
    コンピュータ履行分類アルゴリズムを履行するステップであって、前記分類アルゴリズムが、前記遺伝子情報に基づいて、治療介入への前記対象の治療応答を予測し、前記予測された治療応答が、体細胞性である無細胞DNAポリヌクレオチドにおける候補部位の確率を含む、ステップ
    を含む方法であって、前記無細胞DNAポリヌクレオチドが、特定の無細胞DNAポリヌクレオチドの由来の後続の特定を可能にするためにタグ付けされている、方法
  13. 腫瘍の発達を予測するために、前記分類アルゴリズムを使用するステップを含む、請求項1に記載の方法。
  14. 遠隔転移の発達を予測するために、前記分類アルゴリズムをするステップを含む、請求項1に記載の方法。
  15. 前記訓練用データセットが、がんのステージ、外科的手技の種類、年齢、腫瘍のグレード、腫瘍浸潤の深度、術後合併症の発生および血管侵入の存在からなる群から選択される変数をさらに含む、請求項1に記載の方法。
  16. 前記遺伝子情報が、がん細胞のゲノム構成を定義する変数を含む、請求項1に記載の方法。
  17. 前記遺伝子情報が、単一の播種性がん細胞のゲノム構成を定義する変数を含む、請求項1に記載の方法。
  18. 前記検査データセットを前処理するステップを含む、請求項1に記載の方法。
  19. 前記検査データセットを前処理するステップが、提供されたデータをクラス条件付き確率に変換するステップを含む、請求項1に記載の方法。
  20. 20個またはそれより少ない変数が選択される、請求項1に記載の方法。
  21. 10個またはそれより少ない変数が選択される、請求項1に記載の方法。
  22. 前記分類アルゴリズムが、人工神経ネットワークを用いる、請求項1に記載の方法。
  23. 前記人工神経ネットワークが、ベイジアンフレームワークを使用して訓練される、請求項2に記載の方法。
  24. 遺伝子情報の適合を対象の疾患状態の指標とする方法であって、前記方法は、
    2回またはそれより多くの時点での無細胞DNAポリヌクレオチド由来の対象の遺伝子情報についてのデータを遺伝子分析機から受け取るステップであって、前記遺伝子情報が、個体由来の無細胞DNAポリヌクレオチドにおける1つまたは複数の遺伝子座からの配列または存在量データを含む、ステップ
    前記2回またはそれより多くの時点からの前記情報を使用して、前記対象の遺伝子情報の特徴付けにおいて調整された検査結果を作成するステップ;
    遺伝子情報に適合している対象を集団から特定するステップ;および
    遺伝子情報に適合している対象の過去の処置を、前記対象への処置の勧告の指標とするステップであって、前記勧告された処置が、体細胞性である無細胞DNAポリヌクレオチドにおける候補部位の確率と関連している、ステップ
    を含む、方法であって、前記無細胞DNAポリヌクレオチドが、特定の無細胞DNAポリヌクレオチドの由来の後続の特定を可能にするためにタグ付けされている、方法
  25. 最新の配列リードを過去の配列リードと比較するステップおよびそれにより診断の確度指標を更新するステップを含む、請求項2に記載の方法。
  26. 最新の配列リードについての信頼区間を作成するステップを含む、請求項2に記載の方法。
  27. 前記信頼区間を1つまたは複数の過去の信頼区間と比較するステップおよび重複する信頼区間に基づいて疾患進行を判定するステップを含む、請求項2に記載の方法。
  28. 第1の時点からの情報が第2の時点からの情報を確認する場合に、後続のまたは以前の特徴付けにおいて診断の確度指標を増加させるステップを含む、請求項2に記載の方法。
  29. 特徴付けが、前記対象由来の試料中のDNAからの配列リードの収集物で検出される1つまたは複数の遺伝子変種の出現頻度を決定するステップを含み、調整された検査結果を作成するステップが、遺伝子情報に適合している前記対象につき2回またはそれより多くの時点での前記1つまたは複数の遺伝子変種の出現頻度を比較するステップを含む、請求項2に記載の方法。
  30. 特徴付けが、適合している対象由来の試料中のDNAからの配列リードの収集物から検出される1つまたは複数の遺伝子座でのコピー数多型の量を決定するステップを含み、調整された検査結果を作成するステップが、前記2回またはそれより多くの時点での量を比較するステップを含む、請求項2に記載の方法。
  31. 特徴付けが、前記対象の遺伝子情報を健康または疾患の指標とするステップを含む、請求項2に記載の方法。
  32. 遺伝子情報が、疾患関連またはがん関連遺伝子変種を含むゲノムの一部分由来の配列データを含む、請求項2に記載の方法。
  33. 2回またはそれより多くの時点での前記対象由来の試料におけるポリヌクレオチドのリード深度を増大させることによって、遺伝子変種を検出する感度を上昇させるステップを含む、請求項2に記載の方法。
  34. 特徴付けが、前記対象の遺伝子情報を、前記対象由来の試料中の疾患ポリヌクレオチドの存在の指標とするステップを含み、同じ遺伝子変種が複数の試料採取例または時点のノイズ範囲に検出される場合に、調整が、陰性または不確定から陽性に疾患ポリヌクレオチドの存在を調整するステップを含む、請求項2に記載の方法。
  35. 特徴付けが、前記対象の遺伝子情報を、前記対象由来の試料中の疾患ポリヌクレオチドの存在の指標とするステップを含み、同じ遺伝子変種がより早い時点でノイズ範囲内に、および後の時点でノイズ範囲を超えて検出される場合に、調整が、より早い時点からの特徴付けにおいて陰性または不確定から陽性に疾患ポリヌクレオチドの存在を調整するステップを含む、請求項2に記載の方法。
  36. a)対象由来の無細胞DNAポリヌクレオチドを含む複数の核酸試料を提供するステップであって、前記試料が連続した時点で収集される、ステップ;
    b)前記試料由来のポリヌクレオチドを配列決定して、前記対象由来の無細胞DNAポリヌクレオチドにおける1つまたは複数の遺伝子座からの配列または存在量データを含む遺伝子情報を得るステップであって、前記無細胞DNAポリヌクレオチドが、特定の無細胞DNAポリヌクレオチドの由来の後続の特定を可能にするためにタグ付けされている、ステップ
    c)各試料中の前記ポリヌクレオチド内の複数の体細胞変異体それぞれの定量測定を決定するステップ;
    d)前記連続した時点の少なくとも1つでゼロではない量で存在するような体細胞変異について連続した時点のそれぞれにおける体細胞変異体の相対量をグラフに表すステップ;および
    e)遺伝子的に類似している対象の群由来の変異体を関連付け、前記遺伝子的に類似している対象についての過去の処置データに基づいて処置勧告を作成するステップであって、前記処置勧告が、予測された治療応答に基づいており、前記予測された治療応答が、体細胞性である無細胞DNAポリヌクレオチドにおける候補部位の確率を含む、ステップ
    を含む方法。
  37. 過去の処置データを遺伝子分析機によって作成されたデータからがん処置を勧告するための指標とする方法であって、前記方法は、
    がんを患っている人の集団から遺伝子プロファイルが適合している1人または複数人の対象を、少なくとも第1の時点および第2の、後の時点に対応する無細胞DNAポリヌクレオチドから作成された遺伝子情報に基づき特定するステップおよび適合している対象由来の過去の前記処置データを検索するステップであって、過去の前記処置データが、前記第2の、後の時点で作成された遺伝子情報を含む処置応答データを含み、前記遺伝子情報が、個体由来の無細胞DNAポリヌクレオチドにおける1つまたは複数の遺伝子座からの配列または存在量データを含み、前記無細胞DNAポリヌクレオチドが、特定の無細胞DNAポリヌクレオチドの由来の後続の特定を可能にするためにタグ付けされている、ステップ
    予測された治療応答に基づき、前記適合している対象の前病歴を、最良の処置選択肢を特定するための指標とするステップであって、前記予測された治療応答が、体細胞性である無細胞DNAポリヌクレオチドにおける候補部位の確率を含む、ステップ
    紙のまたは電子的な患者検査レポートに勧告を与えるステップ
    を含む、方法。
  38. 疾患負担を推測するために体液に基づく検査で検出されたゲノム変化の大きさの組合せを使用するステップを含む、請求項3に記載の方法。
  39. 前記疾患負担を推測するために、検出された変異の対立遺伝子割合、対立遺伝子の不均衡、または遺伝子特異的適用範囲を使用するステップを含む、請求項3に記載の方法。
  40. 全体のスタック高さが個体における全体の疾患負担または疾患負担スコアを表している、請求項3に記載の方法。
  41. 各ゲノム変化を表すために異なる色が使用される、請求項3に記載の方法。
  42. 検出された変化のサブセットだけがプロットされる、請求項3に記載の方法。
  43. サブセットが、ドライバーの変化である可能性、または処置への応答の増大もしくは低減との関連に基づいて選択される、請求項4に記載の方法。
  44. ゲノム検査についての検査レポートを作成するステップを含む、請求項3に記載の方法。
  45. 非線形スケールが、それぞれの代表的なゲノム変化の高さまたは幅を表すために使用される、請求項3に記載の方法。
  46. 以前の検査の点のプロットが、前記レポートに表される、請求項3に記載の方法。
  47. 各検査結果の変化率または定量精度を疾患の進行または寛解を推定するための指標とするステップを含む、請求項3に記載の方法。
  48. 介入検査点の間での治療介入を表示するステップを含む、請求項3に記載の方法。
JP2018517870A 2015-10-09 2016-10-07 無細胞dnaを使用する集団ベースの処置レコメンダ Active JP6991134B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021198384A JP7536738B2 (ja) 2015-10-09 2021-12-07 無細胞dnaを使用する集団ベースの処置レコメンダ

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562239390P 2015-10-09 2015-10-09
US62/239,390 2015-10-09
PCT/US2016/056131 WO2017062867A1 (en) 2015-10-09 2016-10-07 Population based treatment recommender using cell free dna

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021198384A Division JP7536738B2 (ja) 2015-10-09 2021-12-07 無細胞dnaを使用する集団ベースの処置レコメンダ

Publications (3)

Publication Number Publication Date
JP2018537754A JP2018537754A (ja) 2018-12-20
JP2018537754A5 JP2018537754A5 (ja) 2019-11-14
JP6991134B2 true JP6991134B2 (ja) 2022-01-12

Family

ID=58488667

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018517870A Active JP6991134B2 (ja) 2015-10-09 2016-10-07 無細胞dnaを使用する集団ベースの処置レコメンダ
JP2021198384A Active JP7536738B2 (ja) 2015-10-09 2021-12-07 無細胞dnaを使用する集団ベースの処置レコメンダ

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021198384A Active JP7536738B2 (ja) 2015-10-09 2021-12-07 無細胞dnaを使用する集団ベースの処置レコメンダ

Country Status (5)

Country Link
US (3) US11756655B2 (ja)
EP (2) EP3359694A4 (ja)
JP (2) JP6991134B2 (ja)
CN (2) CN116640849A (ja)
WO (1) WO2017062867A1 (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
EP3561072A1 (en) 2012-12-10 2019-10-30 Resolution Bioscience, Inc. Methods for targeted genomic analysis
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
JP6991134B2 (ja) * 2015-10-09 2022-01-12 ガーダント ヘルス, インコーポレイテッド 無細胞dnaを使用する集団ベースの処置レコメンダ
CA3004435A1 (en) 2015-11-11 2017-05-18 Resolution Bioscience, Inc. High efficiency construction of dna libraries
WO2017136603A1 (en) 2016-02-02 2017-08-10 Guardant Health, Inc. Cancer evolution detection and diagnostic
US20190085406A1 (en) 2016-04-14 2019-03-21 Guardant Health, Inc. Methods for early detection of cancer
US11384382B2 (en) 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
US20190287645A1 (en) * 2016-07-06 2019-09-19 Guardant Health, Inc. Methods for fragmentome profiling of cell-free nucleic acids
KR102505122B1 (ko) 2016-08-25 2023-03-08 레졸루션 바이오사이언스, 인크. Dna 샘플 중 게놈 카피 변화의 검출을 위한 방법
ES2840003T3 (es) 2016-09-30 2021-07-06 Guardant Health Inc Métodos para análisis multi-resolución de ácidos nucleicos libres de células
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
CN107437004B (zh) * 2017-08-07 2020-06-19 深圳华大基因研究院 一种用于肿瘤个体化基因检测智能解读的系统
JP2021500883A (ja) 2017-10-27 2021-01-14 ジュノ ダイアグノスティックス,インク. 超微量リキッドバイオプシーのためのデバイス、システム、および方法
US11972841B2 (en) 2017-12-18 2024-04-30 Personal Genome Diagnostics Inc. Machine learning system and method for somatic mutation discovery
AU2019244115A1 (en) * 2018-03-30 2020-11-19 Juno Diagnostics, Inc. Deep learning-based methods, devices, and systems for prenatal testing
AU2019253118B2 (en) 2018-04-13 2024-02-22 Freenome Holdings, Inc. Machine learning implementation for multi-analyte assay of biological samples
WO2019200398A1 (en) * 2018-04-13 2019-10-17 Dana-Farber Cancer Institute, Inc. Ultra-sensitive detection of cancer by algorithmic analysis
JP2019213473A (ja) * 2018-06-12 2019-12-19 国立大学法人 鹿児島大学 膵腫瘍摘出術後予後リスク判別法
US20210217493A1 (en) * 2018-07-27 2021-07-15 Seekin, Inc. Reducing noise in sequencing data
CN109344017A (zh) * 2018-09-06 2019-02-15 浪潮电子信息产业股份有限公司 一种基于机器学习预测内存故障的方法,设备及可读存储介质
WO2020077232A1 (en) * 2018-10-12 2020-04-16 Cambridge Cancer Genomics Limited Methods and systems for nucleic acid variant detection and analysis
CN109271374B (zh) * 2018-10-19 2021-01-26 国网江苏省电力有限公司信息通信分公司 一种基于机器学习的数据库健康度打分方法和打分系统
CN113272912A (zh) * 2018-10-22 2021-08-17 杰克逊实验室 使用似然比范式的用于表型驱动临床基因组的方法和装置
AU2019401636A1 (en) * 2018-12-18 2021-06-17 Grail, Llc Systems and methods for estimating cell source fractions using methylation information
US11875903B2 (en) 2018-12-31 2024-01-16 Tempus Labs, Inc. Method and process for predicting and analyzing patient cohort response, progression, and survival
AU2019418813A1 (en) * 2018-12-31 2021-07-22 Tempus Ai, Inc. A method and process for predicting and analyzing patient cohort response, progression, and survival
WO2020160414A1 (en) 2019-01-31 2020-08-06 Guardant Health, Inc. Compositions and methods for isolating cell-free dna
CN109829425B (zh) * 2019-01-31 2020-12-22 沈阳农业大学 一种农田景观小尺度地物分类方法及系统
SG11202110655UA (en) * 2019-03-28 2021-10-28 Phase Genomics Inc Systems and methods for karyotyping by sequencing
US11676727B2 (en) 2019-08-14 2023-06-13 Optum Technology, Inc. Cohort-based predictive data analysis
AU2020415384A1 (en) * 2019-12-27 2022-06-09 Vetology Innovations, Llc. Efficient artificial intelligence analysis of images with combined predictive modeling
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
CN111584002B (zh) * 2020-05-22 2022-04-29 至本医疗科技(上海)有限公司 用于检测肿瘤突变负荷的方法、计算设备和计算机存储介质
CN112185583B (zh) * 2020-10-14 2022-05-31 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
EP4244856A4 (en) * 2020-11-12 2024-09-11 Micronoma Inc SYSTEMS AND METHODS FOR IMPROVING THERAPEUTIC OUTCOMES
CN112466389B (zh) * 2020-12-04 2024-05-17 深圳市新合生物医疗科技有限公司 一种基于机器学习算法获取肿瘤标记物的方法和系统
US20220208348A1 (en) * 2020-12-29 2022-06-30 Kpn Innovations, Llc. Systems and methods for producing a homeopathic program for managing genetic disorders
CN114913986B (zh) * 2022-07-15 2022-10-14 四川大学华西医院 一种医疗对象聚类方法、装置、电子设备及存储介质
CN116525105B (zh) * 2023-06-29 2023-10-03 中国人民解放军总医院 一种心源性休克预后预测预警系统、设备及可存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536488A (ja) 2005-03-16 2008-09-11 シドニー キンメル キャンサー センター 遺伝子発現署名を使用する、癌による死亡および前立腺癌生存率を予測するための方法および組成物
JP2009505658A (ja) 2005-08-24 2009-02-12 ブリストル−マイヤーズ スクイブ カンパニー 上皮増殖因子受容体モデュレーターに対する感受性を決定するためのバイオマーカーおよび方法
US20110166030A1 (en) 2009-09-30 2011-07-07 Yixin Wang Prediction of response to docetaxel therapy based on the presence of TMPRSSG2:ERG fusion in circulating tumor cells

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020077756A1 (en) 1999-11-29 2002-06-20 Scott Arouh Neural-network-based identification, and application, of genomic information practically relevant to diverse biological and sociological problems, including drug dosage estimation
US20020029113A1 (en) * 2000-08-22 2002-03-07 Yixin Wang Method and system for predicting splice variant from DNA chip expression data
EP1394715A1 (en) * 2002-08-02 2004-03-03 Europroteome AG An expert system for clinicial outcome prediction
US7020593B2 (en) 2002-12-04 2006-03-28 International Business Machines Corporation Method for ensemble predictive modeling by multiplicative adjustment of class probability: APM (adjusted probability model)
US9342657B2 (en) * 2003-03-24 2016-05-17 Nien-Chih Wei Methods for predicting an individual's clinical treatment outcome from sampling a group of patient's biological profiles
US7769215B2 (en) 2003-11-28 2010-08-03 The University Of Chicago Method, system, and medium for prevalence-based computerized analysis of medical images and information
US9109256B2 (en) 2004-10-27 2015-08-18 Esoterix Genetic Laboratories, Llc Method for monitoring disease progression or recurrence
US20100041048A1 (en) * 2008-07-31 2010-02-18 The Johns Hopkins University Circulating Mutant DNA to Assess Tumor Dynamics
US8386401B2 (en) 2008-09-10 2013-02-26 Digital Infuzion, Inc. Machine learning methods and systems for identifying patterns in data using a plurality of learning machines wherein the learning machine that optimizes a performance function is selected
EP2427575B1 (en) 2009-05-07 2018-01-24 Veracyte, Inc. Methods for diagnosis of thyroid conditions
US20110312520A1 (en) 2010-05-11 2011-12-22 Veracyte, Inc. Methods and compositions for diagnosing conditions
NZ608459A (en) * 2010-09-15 2015-10-30 Almac Diagnostics Ltd Molecular diagnostic test for cancer
CN103492406B (zh) * 2010-12-09 2022-07-26 宾夕法尼亚大学董事会 嵌合抗原受体-修饰的t细胞治疗癌症的用途
EP2563937A1 (en) 2011-07-26 2013-03-06 Verinata Health, Inc Method for determining the presence or absence of different aneuploidies in a sample
KR20140089384A (ko) * 2011-11-10 2014-07-14 제넨테크, 인크. 알츠하이머병의 치료, 진단 및 모니터링 방법
US8768668B2 (en) * 2012-01-09 2014-07-01 Honeywell International Inc. Diagnostic algorithm parameter optimization
WO2013151677A1 (en) * 2012-04-02 2013-10-10 Broad Institute, Inc. Ddr2 mutations in cancer
US20150278438A1 (en) * 2012-04-23 2015-10-01 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Genetic predictors of response to treatment with crhr1 antagonists
EP2882867A1 (en) * 2012-08-10 2015-06-17 The Broad Institute, Inc. Methods and apparatus for analyzing and quantifying dna alterations in cancer
PT2893040T (pt) 2012-09-04 2019-04-01 Guardant Health Inc Métodos para deteção de mutações raras e de variação do número de cópias
WO2014149134A2 (en) 2013-03-15 2014-09-25 Guardant Health Inc. Systems and methods to detect rare mutations and copy number variation
EP3795696B1 (en) * 2013-03-15 2023-04-26 The Board of Trustees of the Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
EP3008214B1 (en) * 2013-06-11 2018-10-31 Dana-Farber Cancer Institute, Inc. Non-invasive blood based monitoring of genomic alterations in cancer
JP2016536303A (ja) * 2013-10-21 2016-11-24 ザ ジェネラル ホスピタル コーポレイション 末梢循環腫瘍細胞クラスターおよび癌処置に関する方法
EP3736344A1 (en) * 2014-03-13 2020-11-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
ES2925014T3 (es) 2014-09-12 2022-10-13 Univ Leland Stanford Junior Identificación y uso de ácidos nucleicos circulantes
WO2016094330A2 (en) 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
AU2015364605B2 (en) 2014-12-17 2021-01-28 Foundation Medicine, Inc. Computer-implemented system and method for identifying similar patients
US20170342500A1 (en) * 2014-12-19 2017-11-30 Danmarks Tekniske Universitet Method for identification of tissue or organ localization of a tumour
ES2923602T3 (es) 2014-12-31 2022-09-28 Guardant Health Inc Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas
JP6995625B2 (ja) 2015-05-01 2022-01-14 ガーダント ヘルス, インコーポレイテッド 診断方法
JP6991134B2 (ja) * 2015-10-09 2022-01-12 ガーダント ヘルス, インコーポレイテッド 無細胞dnaを使用する集団ベースの処置レコメンダ
EP3464644A4 (en) * 2016-06-07 2020-07-15 The Regents of The University of California PATTERNS OF ACELLULAR DNA METHYLATION FOR ANALYSIS OF DISEASES AND CONDITIONS

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536488A (ja) 2005-03-16 2008-09-11 シドニー キンメル キャンサー センター 遺伝子発現署名を使用する、癌による死亡および前立腺癌生存率を予測するための方法および組成物
JP2009505658A (ja) 2005-08-24 2009-02-12 ブリストル−マイヤーズ スクイブ カンパニー 上皮増殖因子受容体モデュレーターに対する感受性を決定するためのバイオマーカーおよび方法
US20110166030A1 (en) 2009-09-30 2011-07-07 Yixin Wang Prediction of response to docetaxel therapy based on the presence of TMPRSSG2:ERG fusion in circulating tumor cells

Also Published As

Publication number Publication date
US20240153593A1 (en) 2024-05-09
EP3359694A1 (en) 2018-08-15
JP7536738B2 (ja) 2024-08-20
JP2022043124A (ja) 2022-03-15
JP2018537754A (ja) 2018-12-20
US20180300456A1 (en) 2018-10-18
WO2017062867A1 (en) 2017-04-13
EP3359694A4 (en) 2019-07-17
CN108474040A (zh) 2018-08-31
US11756655B2 (en) 2023-09-12
US20200395100A1 (en) 2020-12-17
CN116640849A (zh) 2023-08-25
CN108474040B (zh) 2023-05-16
EP4462438A2 (en) 2024-11-13

Similar Documents

Publication Publication Date Title
JP7536738B2 (ja) 無細胞dnaを使用する集団ベースの処置レコメンダ
JP7458360B2 (ja) 疾患細胞不均一性を示す疾患の検出および処置、ならびに通信試験結果のためのシステムおよび方法
JP7368483B2 (ja) 相同組換え欠損を推定するための統合された機械学習フレームワーク
US11527323B2 (en) Systems and methods for multi-label cancer classification
US20210142904A1 (en) Systems and methods for multi-label cancer classification
JP6680680B2 (ja) 染色体変化の非侵襲性評価のための方法およびプロセス
US20140040264A1 (en) Method for estimation of information flow in biological networks
KR20020075265A (ko) 임상 진단 서비스를 제공하는 방법
US20240371466A1 (en) Method and system for newborn screening for genetic diseases by whole genome sequencing
US20240312561A1 (en) Optimization of sequencing panel assignments
US20240076744A1 (en) METHODS AND SYSTEMS FOR mRNA BOUNDARY ANALYSIS IN NEXT GENERATION SEQUENCING
US20240296920A1 (en) Redacting cell-free dna from test samples for classification by a mixture model
CA3221980A1 (en) Method and system for improved management of genetic diseases

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191003

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211207

R150 Certificate of patent or registration of utility model

Ref document number: 6991134

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150