[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4713138B2 - 遺伝子情報の表示方法及び表示装置及びプログラム - Google Patents

遺伝子情報の表示方法及び表示装置及びプログラム Download PDF

Info

Publication number
JP4713138B2
JP4713138B2 JP2004353068A JP2004353068A JP4713138B2 JP 4713138 B2 JP4713138 B2 JP 4713138B2 JP 2004353068 A JP2004353068 A JP 2004353068A JP 2004353068 A JP2004353068 A JP 2004353068A JP 4713138 B2 JP4713138 B2 JP 4713138B2
Authority
JP
Japan
Prior art keywords
dna fragment
length
microsatellite
unit
repetitions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004353068A
Other languages
English (en)
Other versions
JP2006163720A (ja
Inventor
俊子 松本
航 湯川
亮 中重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2004353068A priority Critical patent/JP4713138B2/ja
Priority to US11/285,061 priority patent/US20060122791A1/en
Priority to EP05025675A priority patent/EP1667044A3/en
Publication of JP2006163720A publication Critical patent/JP2006163720A/ja
Application granted granted Critical
Publication of JP4713138B2 publication Critical patent/JP4713138B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明は、個体の疾患や外形的特徴などの表現型に関与している遺伝子を特定するための解析作業に用いる遺伝子情報の表示方法および表示装置に関し、特に、解析対象の遺伝子が含まれるDNA断片をPCRや電気泳動などにより抽出し検出する際に、解析対象からのシグナルとノイズシグナルとを的確に判別し、ノイズシグナルが本来のシグナルに与える影響を取り除く補正を加えた解析結果を表示することができる方法および装置に関するものである。
ヒトゲノムの完全解読後、遺伝子の機能解析研究が活発に行われている。そのなかでも特定の疾患の有無、薬物の効果の程度、副作用の有無などの表現型に関与する遺伝子の探索での基盤となる、遺伝子型決定および遺伝子型頻度決定の自動化が特に注目されている。
マイクロサテライト
通常、同種の生物のゲノムはほぼ似通った塩基配列を有しているが、いくつかの個所では異なった塩基を有している。例えば、1つの遺伝子座において、ある個体はAを有しており、他の個体はTを有している場合などがある。このように個体間でゲノム上の単一の塩基に多型性が見られることをSNP(Single Nucleotide Polymorphism)と言う。
また、1つの遺伝子座において、ある個体はAを有しており、他の個体は有していない場合などがある。例えば、図12に示すように、個体Aのゲノムは塩基配列『NNNNNNNNNN』と塩基配列『MMMMMMMMMMM』との間に1塩基Aを有しているが、個体Bのゲノムはそれを有していないという場合である(図中、『NNNNNNNNNN』および『MMMMMMMMMMM』は任意の塩基配列を表している)。このとき、個体Aから見ると個体Bのゲノムは1塩基Aを欠いていることになるが、逆に個体Bから見ると個体Aのゲノムには1塩基Aが挿入されていることになる。このように、個体間で1つの遺伝子座において1塩基の有無が異なる多型のことを1塩基のin/del(insertion/deletionの略)と呼んでいる。
一方、生物のゲノム中には、2塩基から6塩基の短い塩基配列パターンが数回〜数十回繰り返されて表れる箇所が非常に多く(数万箇所以上)存在する。この特徴的な塩基配列パターンのことをマイクロサテライトと呼んでいる。ゲノム上に現れるマイクロサテライトの例を図13に示す。マイクロサテライトにおける繰り返し単位をunitと呼び、unitの塩基数をunit長と呼んでいる。例えば、図13に示すATATATAT...というマイクロサテライトでは、unitは『AT』であり、unit長は2塩基である。図13に示すように、マイクロサテライトは、個体間でunitおよびunit長が同じであっても、その繰り返し回数が個体によって異なることがある。以下では、繰り返し回数が個体によって異なることが既知であるマイクロサテライトのことを『多型性があるマイクロサテライト』と呼び、繰り返し回数が個体によらず同じであることが既知であるマイクロサテライトのことを『多型性がないマイクロサテライト』と呼ぶ。また、繰り返し回数が個体によって異なるかどうかが分からないマイクロサテライトのことを『多型性の有無が未知のマイクロサテライト』と呼ぶ。
上記したようにSNP、1塩基のin/del、及びマイクロサテライトは個体間で異なり得るので、ゲノム上で他の塩基配列と区別がしやすい部分であり、実験的にも検出が容易である。また、生物種によっては、ゲノム上のSNP、1塩基のin/del、及びマイクロサテライトが存在するおおよその位置が判っているので、ゲノム上の位置を示す指標として用いることができる。このような性質から、SNP、1塩基のin/del、多型性があるマイクロサテライトなどのことをDNAマーカーと呼んでいる。特に、多型性があるマイクロサテライトは複数の塩基を含んでいるので、SNPや1塩基のin/delよりも多くの情報量を有しており、DNAマーカーとして頻繁に用いられている。さらに、多型性があるマイクロサテライトには、後述するpooled typing実験により複数サンプルをまとめて実験することができるという利点もある。
ところで、図12及び図13に示すように、多くの生物の個体は、雌性配偶子と雄性配偶子に由来する1組のゲノム(相同染色体)を有している。1組のゲノム上の互いに対応する部位に存在する遺伝子を、それぞれ対立遺伝子(allele)と言い、これらの組み合わせを遺伝子型(genotype)と言う。上記したように、ゲノム上のSNP、1塩基のin/del、及び多型性があるマイクロサテライトは、個体間で塩基配列が異なり得る部分であるので、一般的に、SNPには2つ又は3つの対立遺伝子が存在し、1塩基のin/delには2つの対立遺伝子が存在し、多型性があるマイクロサテライトには数種類〜20種類以上の対立遺伝子が存在する。
図13に示す例では、個体Aは、『AT』というunitを5回繰り返したマイクロサテライトと7回繰り返したマイクロサテライトとを有しており、個体Bは、『AT』というunitを6回繰り返したマイクロサテライトを2つ有している。ここで、個体Aのように異なる種類の対立遺伝子を1つずつ持っている状態をヘテロ接合と言い、個体Bのように同じ種類の対立遺伝子を2つ持っている状態をホモ接合と言う。
PCRと電気泳動実験及びpooled typing実験
DNAマーカーとして多型性があるマイクロサテライトを用いる場合、ゲノム上のマイクロサテライトが現れている箇所を抽出して検出するための実験としてPCR(Polymerase Chain Reaction)や電気泳動などの実験が行われる。PCRは、マイクロサテライトの両端においてプライマー配列と呼ばれる一対の塩基配列を指定することで、それらの間にはさまれる部分のみをDNA断片として繰り返し複製することにより、一定量のサンプルを取得する実験技術である。電気泳動には、ゲル電気泳動やキャピラリ電気泳動などの手法があり、増幅したDNA断片を荷電された泳動路で泳動させて、長さの異なるDNA断片を分離する実験技術である。電気泳動は、DNA断片の長さによって泳動路における泳動速度が異なる(長いDNA断片ほど泳動速度が小さい)ことを利用したサンプル分離手法である。
図14は、PCR及びゲル電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。まず、対象となるマイクロサテライトを挟んで一対のプライマー配列1400及び1401を指定し、マイクロサテライト及びプライマー配列を含んだゲノム領域1402がPCR実験により増幅される。図14に示す例では、2本の相同染色体上でのマイクロサテライトの繰り返し回数が異なるヘテロ接合であり、それぞれマイクロサテライト部分の長さが異なるため、それぞれから長さの異なる2種類のPCR増幅産物すなわちDNA断片(66塩基及び58塩基)が得られる。これらを板状のゲル上で一定時間電気泳動させると、上記2種類のPCR増幅産物はそのDNA断片の長さの違いによって分離されることとなる。各DNA断片には蛍光色素をつけておき、電気泳動後に各DNA断片からの蛍光シグナルの強度及び位置を検出することにより、図14に示すように、横軸にDNA断片の長さ(すなわち泳動した距離)、縦軸に蛍光シグナル強度(すなわちDNA断片の存在量)をプロットしたグラフが得られる。また、PCR増幅産物とともに、長さがあらかじめ分かっているDNA断片(サイズマーカーと呼ばれる)を電気泳動させておき、これらの蛍光シグナルも検出すれば、サイズマーカーの検出位置を基準として各PCR増幅産物の長さを知ることができる。
尚、上記ではゲル電気泳動を用いた実験手法について述べたが、キャピラリ電気泳動によっても同様のことを行うことができる。キャピラリ電気泳動では、サンプルにゲルを詰めた細い管の中を泳動させ、各種サンプルが一定距離(通常はキャピラリの終端まで)を泳動し終わるまでに要した時間を計測して、DNA断片の長さを調べる手法である。キャピラリ電気泳動においては、ゲル中のサンプルからの蛍光シグナルをスキャンするのではなく、キャピラリ終端に備えた蛍光シグナル検出器によりサンプルを検出するのが一般的である。
図14のように、1個体のサンプルについてPCR及び電気泳動を行って実験することを「individual typing実験」と呼ぶ。また、individual typing実験により得られるグラフ(横軸にDNA断片の長さ、縦軸に蛍光シグナル強度をプロットしたグラフ)を「individual typing波形」と呼ぶ。これに対して、複数個体のサンプルをまとめたものについてPCR及び電気泳動を行って実験することを「pooled typing実験」と呼ぶ。また、pooled typing実験により得られるグラフ(上記同様のプロットを行ったもの)を「pooled typing」波形と呼ぶ。pooled typing実験によれば、一度の実験で、複数個体のサンプルにおける対立遺伝子の発現度数分布を得ることができる。
図15は、複数個体のサンプルをまとめたものについてPCR及び電気泳動を行うpooled typing実験の手順を模式的に表す図である。図15において、個体AのサンプルDNA断片は長さが58塩基と62塩基のヘテロ接合体であり、個体BのサンプルDNA断片は60塩基のホモ接合体であり、個体CのサンプルDNA断片は58塩基と60塩基のヘテロ接合体である。個体A〜Cそれぞれからサンプルを等量ずつ集めて混合し、pooledサンプルとする。このpooledサンプルには、個体A及び個体C由来の58塩基の対立遺伝子と、個体B及び個体C由来の60塩基の対立遺伝子と、個体A由来の62塩基の対立遺伝子が含まれている。個体BのサンプルDNA断片は60塩基の対立遺伝子のホモ接合体なので、pooledサンプルに含まれる個体B由来の60塩基の対立遺伝子は、個体C由来の60塩基の対立遺伝子の2倍の量となっている。PCRでの増幅及び電気泳動での蛍光シグナル検出において、これらの比はほぼ保たれる。したがって、PCR及び電気泳動によりpooledサンプルの波形を得ると、各塩基長の位置に現れるピークの高さは、その塩基長の対立遺伝子のpooledサンプルにおける存在量にほぼ比例する。図15の例では、それぞれのピークにおけるピークの高さの総和に対する割合は、58塩基の対立遺伝子のピークが33.2%、60塩基の対立遺伝子が50.0%、62塩基の対立遺伝子が16.7%となっている。3個体分のサンプルを混合したので対立遺伝子の発現度数の総和は2×3=6であることから、pooledサンプル中の各対立遺伝子の度数を計算することができる。Pooled typing実験は、PCR及び電気泳動を1度だけ行えばよいので、individual typing実験をサンプル数だけ繰り返す場合と比べて、実験に要する費用や時間を大きく削減することができる。
実際の実験における現象
上記の図14及び図15に示した実験結果は、PCR及び電気泳動実験が理想的な過程で行われた場合に得られるものであり、かつ、単純な多型性を示すDNAマーカーを仮定したものである。しかしながら、実際には、実験において様々なノイズが生じたり、多型が複合的に生じたりすることがある。そこで、以下において、PCR及び電気泳動実験の過程で生じる代表的なノイズピークであるStutterピークと、複合的に生じる多型について例を挙げて説明する。
複合的な多型を生じる遺伝子
上記した1塩基のin/del、多型性があるマイクロサテライトなどが複合的に現れているDNAマーカーは、コンパウンドマーカーと呼ばれている。コンパウンドマーカーについては、例えば、マイクロサテライトの繰り返し回数が同じであっても断片長が同じになるとは限らないなどといった、複雑な多型性が観察される。
図16は、コンパウンドマーカーの一例として、多型性があるマイクロサテライトを2種類含んだDNA断片を示す図である。このDNA断片では、各マイクロサテライトにおいて、unit長やunit繰り返し回数が異なり得るので、同じ長さのDNA断片であっても、異なった塩基配列となる可能性がある。例えば、個体AのDNA断片は、一方の対立遺伝子において『AT』の5回繰り返しからなるマイクロサテライトと『GT』の7回繰り返しからなるマイクロサテライトを含んでおり、他方の対立遺伝子において『AT』の7回繰り返しからなるマイクロサテライトと『GT』の5回繰り返しからなるマイクロサテライトとを含んでいる。これら2つの対立遺伝子は、2つのマイクロサテライトの長さの合計が同じであるため同じ塩基長となっているが、その塩基配列は異なっている。
図17は、コンパウンドマーカーの他の例として、多型性があるマイクロサテライトと1塩基のin/delとを含んだDNA断片を示す図である。このDNA断片では、マイクロサテライトのunit繰り返し回数が異なり得る上に、1塩基のin/delが存在するので、各対立遺伝子の塩基長は多様に異なり得る。したがって、PCR及び電気泳動実験をした結果は、ピークがunit長間隔で整然と現れないことが多い。
一般的に、DNA配列読み取り実験を行わない限り、DNA断片が『コンパウンドマーカーであるかどうか』や『コンパウンドマーカーである場合、どのような多型が含まれているのか』を知る方法は存在しない。ヒトゲノム配列は既に読み取られて公開されているが、公開されているヒトゲノム配列そのものから多型情報が分かる訳ではない。また、論文により多くの多型が報告されているが、その多くはPCR及び電気泳動実験のみを行い、DNA配列読み取り実験までは行っていないものであり、単に『断片長が個体によって異なっている』ことだけを述べたものに過ぎない。論文などで『コンパウンドマーカーである』と報告されている例はごく少数である。
PCR及び電気泳動実験において生じるノイズ
図18は、PCR及び電気泳動の実験過程で生じる代表的なノイズであるStutterピークについて模式的に示した図である。簡単のため、図18では、図14に示した長さ66塩基のDNA断片(『TA』が12回繰り返されたマイクロサテライトを含む)のみを例に挙げている。Stutterピークとは、PCR反応の際にslipped-strand mispairingが起こることによって、複製対象のDNA断片のうちマイクロサテライト部分の繰り返し回数が増加又は減少してしまう現象が原因で生じるノイズであり、電気泳動後の蛍光分析において繰り返し回数が増加又は減少したDNA断片がノイズピークとして観測されるものである。図18に示すように、『TA』が12回繰り返された正常なマイクロサテライトを含んだDNA断片1800のほか、『TA』が11回又は13回繰り返された異常なマイクロサテライトを含んだDNA断片1801又は1802が生成されて、蛍光分析においてStutterピークとして観測されることとなる。さらに多くの繰り返し回数の増減が起こることもあるので、PCRを行うことにより、複製元のDNA断片と同じ長さのDNA断片(66塩基)のほかに、マイクロサテライトのunit長の整数倍だけ長さが増加又減少したDNA断片が生成される可能性がある。
上記のStutterピークは、individual typing実験により個体の遺伝子型を調べる場合や、pooled typing実験によりサンプル集団の対立遺伝子の発現度数分布を調べる場合に問題となる。Individual typing実験においては、複製元のDNA断片の塩基長の位置に現れる本来観察されるべきピーク(以下、「真のピーク」と呼ぶ)とStutterピークとを識別し、真のピークのみを個体の遺伝子型を示す情報として採用しなくてはならない。一方、Pooled typing実験においては、1つの対立遺伝子から生じたStutterピークが周囲の対立遺伝子のピーク高に影響を与えてしまうため、真の対立遺伝子の度数分布から離れた結果となってしまうという問題が生じる。
図19を参照しながら、Pooled typing実験における上記の問題点について説明する。ここでは、図15に示す個体A(58塩基と62塩基のヘテロ接合体)、個体B(60塩基のホモ接合体)、個体C(58塩基と60塩基のヘテロ接合体)からのサンプルを用いて実験する場合を考える。それぞれの個体からサンプルを等量ずつ集めて混合し、pooledサンプルとする。PCRによりPooledサンプルを増幅する際、個体Aに含まれる58塩基の対立遺伝子と62塩基の対立遺伝子に加えて、56塩基、60塩基、64塩基などの対立遺伝子がslipped-strand mispairingにより現れる。同様に、個体Bや個体Cに含まれるDNA断片からも、slipped-strand mispairingにより、元々の塩基長とは異なる塩基長の対立遺伝子が現れる。電気泳動の結果得られる波形パターンは、これらのslipped-strand mispairingによる断片の影響を受け、図15に示す真の対立遺伝子の発現度数分布(58塩基と60塩基と62塩基が33.2%と50.0%と16.7%)から離れた結果となってしまう。図20は、同様の問題点を示す図であり、Pooledサンプルを増幅する際にマイクロサテライトの繰り返し回数が変化することと、DNA断片中に1塩基のin/delが含まれることとが複合的に影響する場合を示している。
Individual typing及びpooled typingのいずれにおいても、Stutterピークの影響を除いて正確な実験結果を得ることが重要である。このためStutterピークの特徴は広く研究されており、以下のような性質が知られている。
性質1 同じDNAマーカー、同じ個体(対立遺伝子)、同じ実験手法であれば、複数回実験しても、Stutterピークの相対的高さは同程度である(非特許文献1を参照)。
性質2 1つのDNAマーカー・1人の個体に着目した場合、Stutterピークは真のピークより低く、真のピークより離れるほどStutterピークの高さは低くなる(非特許文献2を参照)。
性質3 1つのDNAマーカーに着目した場合、マイクロサテライトunitの繰り返し回数とStutterピークの相対的高さ(Stutterピークの高さ÷真のピークの高さ)との間には線形の関係があり、この線形関係を表す直線は2塩基繰り返しのDNAマーカーであれば、どのDNAマーカーでも共通である(非特許文献3を参照)。
特願2004−192559号明細書等。 特願2004−262431号明細書等。 Perlin, M. W., et al., "Toward Fully Automated Genotyping: Allele Assignment, Pedigree Construction, Phase Determination, and Recombination Detection in Duchenne Muscular Dystrophy", Am. J. Hum. Genet. 55, 1994, p777-787 Perlin, M. W., et al., "Toward Fully Automated Genotyping: Genotyping Microsatellite Markers by Deconvolution", Am. J. Hum. Genet. 57, 1995, p1199-1210 Lipkin, E., et al., "Quantitative Trait Locus Mapping in Dairy Cattle by Means of Selective Milk DNA Pooling Using Dinucleotide Microsatellite Markers: Analysis of Milk Protein Percentage", Genetics 149, July 1998, p1557-1567
individual typing実験及びpooled typing実験それぞれにおいて、上記の性質1〜3を利用した実験結果の補正方法が提案されている。既存の補正方法はいずれも、補正の準備段階として予備的実験を行い、DNAマーカーについて『断片長からStutterピークの相対的高さを見積もる計算式』を求める。その後、individual typing実験の補正であれば、各ピークの相対的高さを考慮して真のピークを判定し、pooled typing実験の補正であれば、観察された波形からStutterピーク由来の成分を割り引く補正処理を行う。上記の『断片長からStutterピークの相対的高さを見積もる計算式』の求め方としては、以下の2つの方法が提案されている。
第1の方法は、数個体〜数十個体のサンプルDNAマーカーから、DNA配列読み取り実験により『コンパウンドマーカーであるかどうか』及び『コンパウンドマーカーである場合、どのような多型性を有するマイクロサテライトや1塩基のin/delが含まれているのか』を調べる方法である。DNA配列読み取り実験により、各DNAマーカーについて、その断片長とunitの繰り返し回数とが分かるので、DNAマーカー間で共通の『unit繰り返し回数とStutterピークの相対的高さとの線形関係を表す直線』と、上記DNA配列読み取り実験により求めた『断片長と繰り返し回数の関係』とから、『断片長からStutterピークの相対的高さを見積もる計算式』を得ることができる。
第2の方法は、数個体〜数十個体のサンプルDNAマーカーそれぞれについてindividual typing実験をすることにより、DNAマーカーの断片長とStutterピークの相対的高さとの関係を直接的に調べる方法である。ある個体について、individual typing実験で得られる波形からStutterピークの相対的高さを調べるためには、真のピークとそれに由来するStutterピークとを、その他のノイズピークから切り出す必要がある。ところが、ヘテロ接合体のDNAマーカーでは2つの真のピークが近接して現れる場合があり、このような場合には真のピーク、Stutterピーク及び他のノイズピークが複雑に重なり合った波形となるため、これらを切り分けることができない。この点を考慮しindividual typing実験をする個体数は多めに用意する必要がある。
一般的に、individual typing実験において実験結果の補正を行う場合には、第2の方法が利用されている。これは、第2の方法では既に行ったindividual typing実験の実験結果をそのまま転用することができ、追加的に予備的実験を行う必要がないという利点があるからである。しかしながら、individual typing実験に用いたサンプルDNAマーカーのうち、2つの真のピークが近接して現れるヘテロ接合体が多く含まれている場合には、上記した理由から、Stutterピークの相対的高さを十分な精度で見積もることができないという問題点がある。
一方、pooled typing実験では、第1の方法及び第2の方法の両方が用いられている。ところが、上記したindividual typing実験の場合とは異なり、いずれの方法を用いても、pooled typing実験以外の予備的実験(DNA配列読み取り実験またはindividual typing実験)を追加的に行うことが必要となる。
そこでこのような実情に鑑みて、本発明は、多型性を有するマイクロサテライトや1塩基のin/delを含んだDNAマーカーをPCR及び電気泳動実験により抽出して分析した結果を表示する方法及び装置に関して、individual typing実験及びpooled typing実験のいずれにおいても、追加の予備的実験を行うことなく、既に得られている実験結果を利用してStutterピークの相対的高さを高精度で見積もり、その見積もりの結果に基づいてStutterピークの影響を取り除く補正を行った実験結果等を表示することができる方法及び装置を提供しようとするものである。
上記解決課題に鑑みて、本発明者がコンパウンドマーカーについて調査を行った結果、以下のような規則性に関する情報を得た。
情報1 遺伝子配列の多型性についての研究が進んだ結果、いくつかのDNAマーカーについては、『コンパウンドマーカーかどうか』及び『もしコンパウンドマーカーであればどのような多型が含まれているのか』が解析され、公共のデータベース等にその情報が蓄積されつつある。
情報2 1塩基のin/delがあるかどうかは、DNA配列読み取り実験を行わなくても、pooled typing実験やindividual typing実験で得られる波形から判断できる。これは、1塩基のin/delを含まずマイクロサテライトのみを含んだDNAマーカーから得られる波形においては、図19に示すようにマイクロサテライトのunit長を単位としてピークが現れるのに対して、1塩基のin/delをも含んだDNAマーカーから得られる波形においては、図20に示すように1塩基間隔や(unit長-1)塩基の間隔でもピークが現れるからである。
情報3 経験的に、繰り返し回数が多いマイクロサテライトほど多型性が高い。例えば、unitが5回繰り返されるマイクロサテライトと、unitが20回繰り返されるマイクロサテライトとでは、後者の方が様々な多型を示すことが経験的に分かっている。
情報4 コンパウンドマーカーでないことが分かっているDNAマーカーは、コンパウンドマーカーであることが分かっているDNAマーカーより多い。このことから、コンパウンドマーカーかどうか未知のDNAマーカーのうち、コンパウンドマーカーでないものはコンパウンドマーカーであるものより多いと期待される。
情報5 1塩基のin/delを含んだコンパウンドマーカーであっても、マイクロサテライトのunit長が3塩基以上であれば、PCR増幅産物の断片長からマイクロサテライトの繰り返し回数を一意に計算できる。その方法を、図1に例示する。図1に示したように、公開されているヒトゲノム配列において、unit『ATGC』がn回繰り返しているマイクロサテライトを含んだDNAマーカー(その断片長をx塩基とする)のPCR増幅産物について考察する。このDNAマーカーが1塩基のin/delを含まない場合には、PCR増幅産物の断片長はx塩基、あるいはx塩基からunit長の整数倍を増減した塩基数になる。このときのPCR増幅産物の断片長とunit繰り返し回数との関係は、グラフ100のようになる。
一方、このDNAマーカーが1塩基のin/delを含んでおり、公開されているヒトゲノム配列が1塩基のinsertionを含んでいた場合には、PCR増幅産物の断片長はx塩基、又はx塩基からunit長の整数倍を増減した塩基数となるほか、それらの塩基数から1減じた塩基長をもとり得ることになる。このときのPCR増幅産物の断片長とunit繰り返し回数との関係は、グラフ101のようになる。反対に、このDNAマーカーが1塩基のin/delを含んでおり、公開されているヒトゲノム配列が1塩基のdeletionを含んでいた場合には、PCR増幅産物の断片長はx塩基、又はx塩基からunit長の整数倍を増減した塩基数となるほか、それらの塩基数から1加えた塩基長をもとり得ることになる。このときのPCR増幅産物の断片長とunit繰り返し回数との関係は、グラフ102のようになる。さらには、このDNAマーカーが1塩基のin/delを含んでいるが、insertionかdeletionかが分からない場合であっても、PCR増幅産物の断片長とunit繰り返し回数との関係は、グラフ103に示すような範囲内にとどまるものと予測される。このように、1塩基のin/delを含んだコンパウンドマーカーであっても、マイクロサテライトのunit長が3塩基以上であれば、PCR増幅産物の電気泳動実験結果から、PCR増幅産物の断片長とunit繰り返し回数との線形的関係を導き出すことができる。
情報6 同じunit長のマイクロサテライトを複数種類含むコンパウンドマーカー(それらのうち2以上が多型性があるマイクロサテライトである場合を含む)は、各個体の塩基配列が分からなくても、上記の性質3を利用することにより、Stutterピークの相対的高さを計算することができる。例えば、着目しているDNAマーカーにはunit長が2塩基で多型性があるかどうか未知のマイクロサテライトが2つ含まれており、公開されているヒトゲノム配列から1つ目のマイクロサテライトはn回繰り返し、2つ目のマイクロサテライトはn回繰り返しであることと、増幅元のDNAマーカーの長さがx塩基であることが分かったとする。上記の性質3で言う線形関係を表す式をr=a×m+bとする。ただし、rはStutterピークの相対的高さであり、mはunit繰り返し回数、a及びbは直線の傾き及び切片である。以上の仮定の下で、あるPCR増幅産物の長さがx+2×n塩基であったとすると、このPCR増幅産物における1つ目のマイクロサテライトの繰り返し回数n1’、2つ目のマイクロサテライトの繰り返し回数n2’に関してn1+n2+n=n1’+n2’が成り立つ。そうすると、この対立遺伝子におけるStutterピークの相対的高さは、
(a×n1’+b)+(a×n2’+b)
=a×(n1’+n2’)+2b
=a×(n1+n2+n)+2b
と計算することができる。すなわち、同じunit長のマイクロサテライトを複数種類含むコンパウンドマーカーでは、PCR増幅によりそれぞれのマイクロサテライトの繰り返し回数がどのように増減したか(n1’及びn2’の値)を把握できなくとも、PCR増幅を行ったサンプルDNA断片は公開されているヒトゲノム配列から(unit長×n)塩基分増減したものであるという情報さえ分かれば、その塩基長に対応するStutterピークの相対的高さを計算することができる。これは、PCR増幅産物の塩基配列を調べなくとも、Stutterピークの相対的高さを計算できることを意味している。
そこで、本発明者は上記の情報を考慮した上で、individual typing実験及びpooled typing実験の実験結果を補正するためにStutterピークの相対的高さを高精度で見積もり、追加の予備的実験を行う必要性をなくすために、以下のような機能を実現することに思い至った。
機能1 コンパウンドマーカーであることが既知のDNAマーカーでないことが既知のDNAマーカーとをデータベースに登録しておき、Stutterピークの相対的高さを見積もる際にこれを参照する。コンパウンドマーカーでないことが既知であるならば、ヒトゲノム等の配列情報を参照することにより、追加の予備的実験を行わなくても『断片長と繰り返し回数の関係』が分かる。反対に、コンパウンドマーカーであることが既知であっても、多くの個体のDNA配列読み取り実験の結果が利用可能であれば、それらを対比観察することにより『断片長と繰り返し回数の関係』が分かる。これにより、追加の予備的実験としてDNA配列読み取り実験を行わなくても、上記した『断片長からStutterピークの相対的高さを見積もる計算式』の第1の方法を利用することができる。この機能は上記の情報1に基づく。
機能2−1 pooled typing実験において、pooled typing波形のピーク間隔を調べることにより、1塩基のin/delを含むかどうか判断する。この機能は上記の情報2で説明した手順により実現できる。
機能2−2 individual typing実験において、individual typing波形のピーク間隔を調べることにより、1塩基のin/delを含むかどうか判断する。この機能は上記の情報2で説明した手順により実現できる。
機能3 公開されているヒトゲノム配列を参照して繰り返し回数が多いマイクロサテライトを複数含むかどうか調べることにより、コンパウンドマーカーであるかどうかを推定する。この機能は上記の情報3に基づく。
機能4 上記の機能1、機能2−1、機能2−2、機能3によっても、コンパウンドマーカーかどうか判断できないDNAマーカーについては、コンパウンドマーカーではないものと推定する。この機能は上記の情報4に基づく。
あるいは、上記の諸機能によっても、コンパウンドマーカーであるかどうかが未知であるDNAマーカーについては、コンパウンドマーカーかどうかを推定して処理を進めることができる。Individual typing実験では機能2−2、pooled typing実験では機能2−1を利用できる。これらの機能を用いてコンパウンドマーカーでないと推定された場合には、追加の予備的実験を行わなくても『断片長と繰り返し回数の関係』が推定される。反対に、コンパウンドマーカーであると推定された場合であっても、多くのDNAマーカーで、以下の機能5・機能6を用いることができる。
機能5 1塩基のin/delを含む、unit長が3塩基以上のコンパウンドマーカーに対し、DNAマーカー間で共通の線形回帰直線を1塩基調整してStutterピークの相対的高さを見積もる。この機能は上記の情報5に基づく。
機能6 多型性があるマイクロサテライトを複数含み、それらのunit長が同一のDNAマーカーに対し、複数の線形回帰直線を合併してStutterピークの相対的高さを見積もる。この機能は上記の情報6に基づく。
上記の機能5及び機能6により、コンパウンドマーカーであることは分かっているが個体のDNA配列読み取り実験の結果が利用できないDNAマーカーや、コンパウンドマーカーであると推定されたDNAマーカーの多くについて、追加の予備的実験としてDNA配列読み取り実験を行わなくても、上記の『断片長からStutterピークの相対的高さを見積もる計算式』を求める第1の方法を利用することができる。
機能7−表示機能
上記の機能1から6を用いてStutterピークの相対的高さを見積もった結果を画面表示する。これにより、ユーザに対してStutterピークの相対的高さを見積もった結果とその根拠となるデータを示すことができる。
以上のような機能を具体的に実現するものとして、本発明は、DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する装置であって、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定するコンパウンドマーカー判定処理部と、前記コンパウンドマーカー判定処理部による判定結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定する相対的高さ見積もり処理部と、前記相対的高さ見積もり処理部による判定結果を表示する表示処理部とを備えた装置を提供するものである。
本発明の装置は、コンパウンドマーカーについての既知の情報を保持する手段をさらに備えており、前記コンパウンドマーカー判定処理部は、前記既知の情報を利用して前記DNA断片がコンパウンドマーカーであるかどうかを判定し、前記相対的高さ見積もり処理部は、前記既知の情報を利用して前記真のピークの高さとstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定することを特徴とする。
本発明は、また、DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する装置であって、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定するコンパウンドマーカー判定処理部と、前記コンパウンドマーカー判定処理部による判定結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を見積もる相対的高さ見積もり処理部と、前記相対的高さ見積もり処理部による見積もり結果を表示する表示処理部とを備えた装置を提供するものである。
本発明は、また、DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する装置であって、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定するコンパウンドマーカー判定処理部と、前記コンパウンドマーカー判定処理部による判定結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を見積もる相対的高さ見積もり処理部と、前記相対的高さ見積もり処理部による見積もり結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルを補正する補正処理部と、前記補正された検出シグナルから前記DNA断片の長さを分析した結果を表示する表示処理部とを備えた装置を提供するものである。
本発明の装置は、コンパウンドマーカーについての既知の情報を保持する手段をさらに備えており、前記コンパウンドマーカー判定処理部は、前記既知の情報を利用して前記DNA断片がコンパウンドマーカーであるかどうかを判定し、前記相対的高さ見積もり処理部は、前記既知の情報を利用して前記真のピークの高さとstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定することを特徴とする。
本発明の装置において、前記コンパウンドマーカー判定処理部は、前記DNA断片のPCR増幅産物の検出シグナル波形のピーク間隔に基づいて、前記DNA断片が1塩基のin/delを含んでいるかどうかを判定することを特徴とする。
本発明の装置において、前記コンパウンドマーカー判定処理部は、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に含まれているマイクロサテライトのunit繰り返し回数に関する情報を取得することを特徴とする。
本発明の装置において、前記相対的高さ見積もり処理部は、前記DNA断片に1塩基のin/delが含まれている場合には、前記DNA断片の公開されているゲノム配列を参照し、DNA断片の長さとそこに含まれるマイクロサテライトのunit繰り返し回数との線形的関係に基づいて見積もり結果を調整することを特徴とする。
本発明の装置において、前記相対的高さ見積もり処理部は、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に複数のマイクロサテライトが含まれている場合には、DNA断片の長さとそこに含まれる各マイクロサテライトのunit繰り返し回数の合計との線形的関係に基づいて見積もり結果を調整する。
本発明の装置において、前記表示処理部は、前記相対的高さ見積もり処理部による見積もりの根拠とした情報を表示することを特徴とする。
本発明は、また、DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する方法であって、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定するコンパウンドマーカー判定ステップと、前記コンパウンドマーカー判定ステップによる判定結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定する相対的高さ見積もりステップと、前記相対的高さ見積もりステップによる判定結果を表示する表示ステップとを含む方法を提供するものである。
本発明の方法は、前記コンパウンドマーカー判定ステップの前に、コンパウンドマーカーについての既知の情報を取得するステップをさらに含んでおり、前記コンパウンドマーカー判定ステップでは、前記既知の情報を利用して前記DNA断片がコンパウンドマーカーであるかどうかを判定し、前記相対的高さ見積もりステップは、前記既知の情報を利用して前記真のピークの高さとstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定することを特徴とする。
本発明は、また、DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する方法であって、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定するコンパウンドマーカー判定ステップと、前記コンパウンドマーカー判定ステップによる判定結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を見積もる相対的高さ見積もりステップと、前記相対的高さ見積もりステップによる見積もり結果を表示する表示ステップとを含む方法を提供するものである。
本発明は、また、DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する方法であって、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定するコンパウンドマーカー判定ステップと、前記コンパウンドマーカー判定ステップによる判定結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を見積もる相対的高さ見積もりステップと、前記相対的高さ見積もりステップによる見積もり結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルを補正する補正ステップと、前記補正された検出シグナルから前記DNA断片の長さを分析した結果を表示する表示ステップとを含む方法を提供するものである。
本発明の方法は、前記コンパウンドマーカー判定ステップの前に、コンパウンドマーカーについての既知の情報を取得するステップをさらに含んでおり、前記コンパウンドマーカー判定ステップでは、前記既知の情報を利用して前記DNA断片がコンパウンドマーカーであるかどうかを判定し、前記相対的高さ見積もりステップは、前記既知の情報を利用して前記真のピークの高さとstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定することを特徴とする。
本発明の方法において、前記コンパウンドマーカー判定ステップでは、前記DNA断片のPCR増幅産物の検出シグナル波形のピーク間隔に基づいて、前記DNA断片が1塩基のin/delを含んでいるかどうかを判定することを特徴とする。
本発明の方法において、前記コンパウンドマーカー判定ステップでは、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に含まれているマイクロサテライトのunit繰り返し回数に関する情報を取得することを特徴とする。
本発明の方法において、前記相対的高さ見積もりステップでは、前記DNA断片に1塩基のin/delが含まれている場合には、前記DNA断片の公開されているゲノム配列を参照し、DNA断片の長さとそこに含まれるマイクロサテライトのunit繰り返し回数との線形的関係に基づいて見積もり結果を調整することを特徴とする。
本発明の方法において、前記相対的高さ見積もりステップでは、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に複数のマイクロサテライトが含まれている場合には、DNA断片の長さとそこに含まれる各マイクロサテライトのunit繰り返し回数の合計との線形的関係に基づいて見積もり結果を調整することを特徴とする。
本発明の方法において、前記表示ステップでは、前記相対的高さ見積もりステップにおいて見積もりの根拠とした情報を表示することを特徴とする。
本発明は、また、上記したいずれかの方法をコンピュータにおいて実行するためのプログラムを提供するものである。
以上、説明したように、本発明の遺伝子情報の表示方法及び表示装置によれば、多型性を有するマイクロサテライトや1塩基のin/delを含んだDNAマーカーをPCR及び電気泳動実験により抽出して分析した結果を表示する際に、individual typing実験及びpooled typing実験のいずれにおいても、追加の予備的実験を行うことなく、既に得られている実験結果を利用してStutterピークの相対的高さを高精度で見積もり、その見積もりに結果に基づいてStutterピークの影響を取り除く補正を行った実験結果等を表示することが可能となる。
特に、本発明の遺伝子情報の表示方法及び表示装置では、『断片長からStutterピークの相対的高さを見積もる計算式』を適用することにより、コンパウンドマーカーであるかどうかが分かっていないDNAマーカーのうち、(1)1塩基のin/del及びunit長が3塩基以上のマイクロサテライトの両方を含んだDNAマーカー、(2)unit長が同じである複数のマイクロサテライトを含んだDNAマーカー、並びに(3)実際にはコンパウンドマーカーでないDNAマーカーについて、追加実験を必要とすることなくStutterピークの相対的高さを見積もることができるようになっている。
以下、添付図面を参照しながら、本発明の公開されているゲノム配列の利用による遺伝子型頻度推定方式を利用した遺伝子情報の表示方法及び表示装置を実施するための最良の形態を詳細に説明する。図1〜図11は、本発明の実施の形態を例示する図であり、これらの図において、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。
遺伝子情報表示システムの構成
図2は、本発明の一実施形態として構築される遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。この遺伝子情報表示システムは、PCR及び電気泳動実験の後PCR増幅産物を蛍光分析した結果得られる波形データを保存した波形DB200、DNAマーカーの公開されているヒトゲノム配列の情報を保存したゲノム配列DB201、波形データと公開されているヒトゲノム配列データ及びその解析結果をグラフ表示するための表示装置202、表示されたデータに対して塩基配列や個体やピークを選択するなどの操作を行うためのキーボード203とマウスなどのポインティングデバイス204、必要な演算処理、制御処理等を行う中央処理装置205、中央処理装置205での処理に必要なプログラムを格納するプログラムメモリ206、中央処理装置205での処理に必要なデータを格納するデータメモリ207を備えている。
プログラムメモリ206は、上記の機能1、機能2−1、機能2−2、機能3及び機能4、すなわちコンパウンドマーカーかどうかを調べる機能を実現するコンパウンドマーカー判定処理部208と、上記の機能1、機能5及び機能6、すなわちStutterピークの相対的高さの見積もりを行う機能を実現するStutterピークの相対的高さ見積もり処理部209と、上記の機能7、すなわちコンパウンドマーカー判定処理部208及びStutterピークの相対的高さ見積もり処理部209の結果の表示を行う見積もり結果表示処理部210と、見積もりが可能であった場合にその結果と従来の手法とを用いて波形データの補正を行う実験結果補正処理部211とを含んでいる。
データメモリ207は、DNAマーカーごとの公開されているヒトゲノム配列データを含んだマーカーデータ212と、Pooled typing実験の結果得られる波形データを含んだPooled typingデータ213と、Individual typing実験の結果得られる波形データを含んだIndividual typingデータ214とを含んでいる。
図3は、データメモリ207に含まれるマーカーデータ212のデータ構造を示す図である。このデータ構造体MarkerData[]は、i個のDNAマーカーについて、各DNAマーカーごとのマーカー名300、ゲノム配列301、予備的実験を行うことなくStutterピークの相対的高さを見積もることが可能かどうかを示す見積もり不可能フラグ302、1塩基のin/delを含むかどうかを示す1塩基in/delありフラグ303、DNAマーカーが含む多型性があるマイクロサテライトそれぞれの位置及びunit長の組を列挙したunit長リスト304、断片長と繰り返し回数の関係305、断片長とStutterピークの相対的高さの関係306を示すデータを含んでいる。
データ302については、計算がまだ行われていない場合にはNULL値を持つ。データ303については、計算がまだ行われていない場合、又は1塩基in/delがあるかどうか未知である場合にはNULL値を持つ。データ304については、計算がまだ行われていない場合、又は、多型性があるマイクロサテライトを複数含むコンパウンドマーカーであるかどうかが未知である場合にはNULL値を持つ。また、データ305については、コンパウンドマーカーであることが既知であり、かつ、塩基配列の頻度情報が利用可能であるDNAマーカーについては、以下に示すデータ構造体FragmentSizeRepeatNumberData構造体の配列の形でデータを保持する。それ以外のDNAマーカーについては、データ305はNULL値を持つものとする。
データ構造体FragmentSizeRepeatNumberData[]は、1つのDNAマーカーが対立遺伝子として持つj個の断片長について、断片長307とその断片長に対応するマイクロサテライトの構成リスト308とを含んでいる。データ308については、以下に示すデータ構造体RepeatNumberData構造体の配列の形でデータを保持するものとする。データ構造体RepeatNumberData[]は、1つの対立遺伝子が持つk個のマイクロサテライトの構成について、集団内の割合309とマイクロサテライトの構成内容310とを含んでいる。図3に例示しているデータからは、同じ断片長を持つ対立遺伝子の中に、異なるマイクロサテライトの構成を持つものがk通りあり、そのうちの1番目は、ATの7回繰り返しとATGの7回繰り返しを持つもので、集団内でこの断片長を持つ対立遺伝子のうち、このマイクロサテライトの構成を持つものの割合は0.3であることが分かる。
図4は、データメモリ207に含まれるPooled typingデータ213のデータ構造を示す図である。このデータ構造体PooledTypingData[]は、Pooled typing実験を行ったl個のDNAマーカーのそれぞれについて、マーカー名400と、実験で得られた補正前波形データ401と、Stutterピークの相対的高さの見積もり結果及び従来手法を用いて補正前波形データ401を補正した結果得られた補正後波形データ402とを含んでいる。データ401及び402は、それぞれのピークの断片長と蛍光強度の組のリストの形でデータを保持する。Pooled typing実験を行わず、Individual typing実験のみ行った場合には、Pooled typingデータは空になる。
図5は、データメモリ207に含まれるIndividual typingデータ214のデータ構造を示す図である。このデータ構造体IndividualTypingData[]は、Individual typing実験を行ったm個のDNAマーカーのそれぞれについて、マーカー名500と、実験で得られた個体ごとのデータ501とを含んでいる。データ501については、以下に示すデータ構造体IndividualData[]の配列の形でデータを保持する。データ構造体IndividualData[]は、1つのDNAマーカーに関してindividual typing実験を行ったn人の個体について、各個体の個体ID502と、実験で得られた波形データ503と、Stutterピークの相対的高さの見積もり結果及び従来手法を用いて得られた真のピーク504とを含んでいる。データ503は、それぞれのピークの断片長と蛍光強度の組のリストの形でデータを保持する。Individual typing実験を行わず、Pooled typing実験のみ行った場合には、Individual typingデータは空になる。
遺伝子情報表示システムによる処理
次に、上記のように構成された本実施形態の遺伝子情報表示システムにおいて行われる処理について説明する。図6は、遺伝子情報表示システムによる処理の流れを概略的に示すフローチャートである。
図6において、まず、波形DB200及びゲノム配列DB201から、実験を行ったDNAマーカーについてデータを読み込む(ステップ600)。ここで読み込まれたデータは、データメモリ207においてマーカーデータ212、Pooled typingデータ213及びIndividual typingデータ214として保持されることとなる。Pooled typing実験又はIndividual typing実験のいずれかのみを行った場合には、データ213又は214のうち該当する方だけが読み込まれる。このDNAマーカーに1塩基のin/delがあるかどうかが既知である場合には、図3に示すデータ構造体MarkerData[]の1塩基in/delありフラグ303にTRUEまたはFALSEを格納する。また、このDNAマーカーが多型性あるマイクロサテライトを複数含んだコンパウンドマーカーであるかどうかが既知である場合には、マイクロサテライトそれぞれについて位置とunit長の組をunit長リスト304に格納する。また、このDNAマーカーがコンパウンドマーカーであることが既知であり、かつ、塩基配列の頻度情報が利用可能である場合には、断片長と繰り返し回数の関係305にその情報を格納する。
次に、コンパウンドマーカー判定処理部208により、対象DNAマーカーがコンパウンドマーカーであるかどうかを調べる(ステップ601)。この処理については、後に図7を参照しながら詳細に説明する。対象DNAマーカーがコンパウンドマーカーであるかどうかを調べた結果は、図3に示すデータ構造体MarkerData[]の1塩基in/delありフラグ303及びunit長リスト304に格納する。
次に、Stutterピークの相対的高さ見積もり処理部209により、対象DNAマーカーの波形データに現れるStutterピークの相対的高さを見積もる(ステップ602)。この処理については、後に図8を参照しながら詳細に説明する。Stutterピークの相対的高さを見積もることが不可能であると判断された場合には、図3に示すデータ構造体MarkerData[]の見積もり不可能フラグ302をTRUEにセットする。Stutterピークの相対的高さを見積もることができた場合には、その見積もり結果をデータ構造体MarkerData[]の断片長とStutterピークの相対的高さの関係306に格納する。ここで、見積もり不可能フラグがTRUEにセットされたかどうかによって、以下の処理が分岐する(ステップ603)。
まず、見積もり不可能フラグがTRUEにセットさなかった場合には、見積もり結果表示処理部210により、見積もった結果を画面表示する(ステップ604)。この画面表示については、後に図9及び図10を参照しながら詳細に説明する。次に、ステップ602で得られた見積もり結果を用いて、実験結果補正処理部211により、実験結果を補正する(ステップ605)。この実験結果補正処理は、従来技術により行うことができるので、ここでは説明を省略する。
一方、見積もり不可能フラグがTRUEにセットされた場合には、見積もり結果表示処理部210により、追加の予備的実験が必要である旨の画面表示を行う(ステップ606)。この画面表示については、後に図11を参照しながら詳細に説明する。その後、ユーザが行った追加の予備的実験のデータ(対象DNAマーカーの波形データにStutterピークの相対的高さに関するデータ)を本システムに入力すると、実験結果補正処理部211により、当該データを用いて実験結果を補正することができる(ステップ607)。この実験結果補正処理は、従来技術により行うことができるので、ここでは説明を省略する。
対象DNAマーカーがコンパウンドマーカーであるかどうかを調べる処理
次に、図6のステップ601で行われる、対象DNAマーカーがコンパウンドマーカーであるかどうかを調べる処理の詳細について、図7に示す詳細フローチャートを参照しながら説明する。このフローチャートは大きく2つの部分に分かれ、最初に、1塩基のin/delを含むコンパウンドマーカーであるかどうか調べ、次に、多型性があるマイクロサテライトを複数含むコンパウンドマーカーであるかどうかを調べる。まず、1塩基のin/delを含むコンパウンドマーカーであるかどうかが既知かどうかを調べる(ステップ700)。図3に示すデータ構造体MarkerData[]における、1塩基in/delありフラグ303がNULL値でなければこの条件に適合している。適合しない場合には以下の処理を行う。まず、図4に示すデータ構造体PooledTypingData[]が空でなく(Pooled typing実験を行っていて)、かつ、このデータ構造体において、1塩基や(unit長-1)塩基の間隔でピークが現れているかどうかを調べる(ステップ701)。現れているならば、機能2−1(情報2)により1塩基のin/delを含むことが分かるので、データ構造体MarkerData[]における、1塩基in/delありフラグ303にTRUEを格納する(ステップ702)。ステップ701において条件に適合しなかった場合には、図5に示すデータ構造体IndividualTypingData[]が空でなく(Individual typing実験を行っていて)、かつ、このデータ構造体における、1つ以上の個体データ501において、1塩基や(unit長-1)塩基の間隔でピークが現れているかどうかを調べる(ステップ703)。現れているならば、機能2−2(情報2)により1塩基のin/delを含むことが分かるので、データ構造体MarkerData[]における、1塩基in/delありフラグ303にTRUEを格納する(ステップ702)。ステップ703において条件に適合しなかった場合には、機能2−1及び2−2(情報2)により1塩基のin/delを含まないことが分かるので、データ構造体MarkerData[]における、1塩基in/delありフラグ303にFALSEを格納する(ステップ704)。次に、多型性があるマイクロサテライトを複数含むかどうかが既知かどうかを調べる(ステップ705)。データ構造体MarkerData[]における、unit長リスト304がNULL値でなければこの条件に適合している。適合しない場合には以下の処理を行う。まず、データ構造体MarkerData[]のゲノム配列301を参照し、繰り返し回数が多いマイクロサテライトが複数含まれているかどうかを調べる(ステップ706)。複数含まれている場合には、それぞれのマイクロサテライト毎に、マイクロサテライトの位置及びunit長さの組を、データ構造体MarkerData[]のunit長リスト304に格納する(ステップ707)。ステップ706において1つだけ含まれている場合には、そのマイクロサテライトの位置及びunit長の組を唯一の要素としてデータ構造体MarkerData[]のunit長リスト304に格納する(ステップ708)。
断片長とStutterピークの相対的高さの関係を求める処理
次に、図6のステップ602で行われる、断片長とStutterピークの相対的高さの関係を求める処理の詳細について、図8に示す詳細フローチャートを参照しながら説明する。まず、対象DNAマーカーがコンパウンドマーカーであることが既知であり、かつ、断片長と繰り返し回数の関係が利用可能であるか調べる(ステップ800)。図3に示すデータ構造体MarkerData[]における、断片長と繰り返し回数の関係305がNULL値でなければ、この条件に適合している。その場合には、断片長と繰り返し回数の関係を用いて、断片長とStutterピークの相対的高さの関係を求め、データ構造体MarkerData[]における、断片長とStutterピークの相対的高さの関係306に格納する(ステップ801)。これは、上記既知の性質3により既存技術を用いて求めることができる。そしてデータ構造体MarkerData[]における見積もり不可能フラグ302にFALSEを格納する(ステップ802)。ステップ800において条件に適合しなかった場合には以下の処理を行う。まず、データ構造体MarkerData[]におけるunit長リスト304に、異なる複数のunit長が登録されているか調べる(ステップ803)。たとえばunit長として2塩基が2回登録されている場合にはこの条件に適合しないが、unit長として2塩基と3塩基が1回ずつ登録されている場合には適合する。このような場合には、追加の予備的実験なしでStutterピークの相対的高さを見積もることは不可能なので、データ構造体MarkerData[]における見積もり不可能フラグ302にTRUEを格納する(ステップ804)。ステップ803において条件に適合しなかった場合には以下の処理を行う。まず、データ構造体MarkerData[]における1塩基in/delありフラグ303がTRUEかどうか調べる(ステップ805)。TRUEだった場合には以下の処理を行う。データ構造体MarkerData[]におけるunit長リスト304に登録されているunit長が3塩基未満であるかどうか調べる(ステップ806)。(ステップ803における分岐処理により、ここではunit長として一種類の塩基長のみ考えればよいことに注意。)unit長が3塩基未満だった場合には、追加の予備的実験なしでStutterピークの相対的高さを見積もることは不可能なので、データ構造体MarkerData[]における見積もり不可能フラグ302にTRUEを格納する(ステップ804)。ステップ806において、unit長が3塩基以上だった場合には、機能5(情報5)により、DNAマーカー間で共通の線形回帰直線を1塩基調整する(ステップ807)。ステップ805において1塩基in/delありフラグ303がFALSEであった場合には、以下の処理を行う。まず、多型性があるマイクロサテライトを複数個含むかどうかを調べる(ステップ808)。データ構造体MarkerData[]におけるunit長リスト304に複数のunit長が登録されている場合にはこの条件に適合する。条件に適合する場合には、機能6(情報6)により、複数の線形回帰直線を合併することにより、断片長とStutterピークの相対的高さの関係を求め、データ構造体MarkerData[]における、断片長とStutterピークの相対的高さの関係306に格納する(ステップ809)。その後、データ構造体MarkerData[]における見積もり不可能フラグ302にFALSEを格納する(ステップ810)。ステップ808において条件に適合しなかった場合には、機能4(情報4)により、DNAマーカー間で共通の線形回帰直線をそのまま用いることにより、断片長とStutterピークの相対的高さの関係を求め、データ構造体MarkerData[]における、断片長とStutterピークの相対的高さの関係306に格納する(ステップ811)。その後、データ構造体MarkerData[]における見積もり不可能フラグ302にFALSEを格納する(ステップ810)。
次に、図6のステップ604で行われる、追加の予備的実験を行わずにStutterピークの相対的高さを見積もった結果の画面表示の詳細について、図9に示す表示画面の例を参照しながら説明する。図3に示すデータ構造体MarkerData[]の断片長とStutterピークの相対的高さの関係306を参照しグラフ表示する(900)。このグラフにおける横軸の数値は断片長を塩基数で表した値であり、縦軸はStutterピークの相対的高さである。また、そのDNAマーカーが含む多型の情報を表示する(901)。ここで表示するものは多型の情報の概要であり、詳細表示ボタン902を押すことにより詳しい情報の画面表示を行うことができる。この詳細表示画面については、後に図10を参照しながら説明する。901で表示するものは、多型性があるマイクロサテライトの数のunit長別の表形式での表示(903)及び、そのDNAマーカーが含むマイクロサテライト以外の多型、すなわち、1塩基のin/delの情報の表示(904)である。
図10は、図9における詳細表示ボタン902を押すことにより表示される、詳細表示画面の例である。図3に示すデータ構造体MarkerData[]のゲノム配列301とunit長リスト304及び1塩基in/delありフラグ303を参照し、そのDNAマーカーが含む多型性があるマイクロサテライト及び1塩基のin/delの情報を表示する(1000)。また、コンパウンドマーカーであることが既知であり、かつ、塩基配列の頻度情報が利用可能であるDNAマーカーに対しては、データ構造体MarkerData[]の断片長と繰り返し回数の関係305を参照して断片長ごとのマイクロサテライトの構成内容を表示する(1001)。
次に、図6のステップ606で行われる、追加の予備的実験が必要である旨の画面表示の詳細について、図11に示す表示画面の例を参照しながら説明する。断片長とStutterピークの相対的高さの関係のグラフ表示1100において、追加の予備的実験を行わないとStutterピークの相対的高さを見積もれないこととその理由の表示を行う(1101)。そのDNAマーカーが含む多型の情報の表示(1102)と詳細表示ボタン(1103)と多型性があるマイクロサテライトの数のunit長別の表形式での表示(1104)及び、そのDNAマーカーが含むマイクロサテライト以外の多型、すなわち、1塩基のin/delの情報の表示(1105)については図9と同様である。上記した「Stutterピークの相対的高さを見積もれない理由」のほか、「1塩基のin/delがあるかどうかが不明である」という情報もまた、ユーザがどのような追加実験を行うかを判断する材料として有用な情報である。詳細表示ボタン1103を押して表示される詳細表示画面については図10と同様である。
尚、本明細書では、PCR及び電気泳動の実験過程で生じるノイズとしてStutterピークについてのみ考慮したが、+Aピークと呼ばれるノイズが生じる場合にも本発明を適用することできる。これは、機能1・機能3・機能4・機能5・機能6・機能7については波形データを用いないため+Aピークの影響を受けず、機能2−1・機能2−2についても以下に説明するように+Aピークの影響を受けないためである。特許文献1に記述されているとおり、1つのサンプルについて1度の実験で得られた波形の中では、+Aピークの現れ方(元のピークに対する+Aピークの相対的高さ)はほぼ一定である。したがって、unit長間隔でピークが現れていない場合、長さが1塩基離れた2つのピークの対における高さの比が一定ならば+Aピークが現れているのであって1塩基のin/delはない、高さの比が一定でないならば1塩基のin/delがあると判断できる。
以上、本発明の遺伝子情報の表示方法及び表示装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
尚、現在ヒトゲノムの配列情報は公開されているが、他の生物種についてはゲノム解読が未だ完了していないため利用できる配列情報は限られている。しかしながら、今後他の生物種についてもゲノムの配列情報が公開されれば、本発明の遺伝子情報の表示方法及び表示装置においてそのような情報を利用することが可能となるのは当然である。
本発明の遺伝子情報の表示方法及び表示装置は、記憶手段、入力手段、表示手段等を備えたコンピュータ上で実現され得るものであり、遺伝子解析実験の結果表示、ノイズピークの見積もり、見積もりに結果に基づく実験結果の補正などといった情報処理が上記の記憶手段、入力手段、表示手段等のハードウェア資源を用いて具体的に実現されるものであるから、産業上利用することができる発明である。
1塩基のin/delを含んだコンパウンドマーカーについて、PCR増幅産物の断片長からマイクロサテライトの繰り返し回数を一意に計算する方法を例示する図である。 本発明の遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。 図2に示すデータメモリに含まれるマーカーデータのデータ構造を示す図である。 図2に示すデータメモリに含まれるPooled typingデータのデータ構造を示す図である。 図2に示すデータメモリに含まれるIndividual typingデータのデータ構造を示す図である。 図2に示す遺伝子情報表示システムによる処理の流れを概略的に示すフローチャートである。 図6のステップ601におけるコンパウンドマーカー判定処理部による処理を詳細に示すフローチャートである。 図6のステップ602におけるStutterピークの相対的高さ見積もり処理部による処理を詳細に示すフローチャートである。 図6のステップ604における見積もり結果表示処理部による表示画面を示す図である。 図9において詳細表示ボタンを押すことにより表示される詳細表示画面を示す図である。 図6のステップ606における見積もり結果表示処理部による表示画面を示す図である。 個体間で1つの遺伝子座において1塩基の有無が異なる多型である「1塩基のin/del」の例を示す図である。 ゲノム上に表れるマイクロサテライトについて説明する図である。 PCR及び電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。 複数個体のサンプルをまとめたものについてPCR及び電気泳動を行うpooled typing実験の手順を模式的に表す図である。 コンパウンドマーカーの一例として、多型性があるマイクロサテライトを2種類含んだDNA断片を示す図である。 コンパウンドマーカーの他の例として、多型性があるマイクロサテライトと1塩基のin/delとを含んだDNA断片を示す図である。 PCR及び電気泳動の実験過程で生じる代表的なノイズであるStutterピークについて模式的に示した図である。 コンパウンドマーカーを用いたPooled typing実験における問題点について説明する図である。 コンパウンドマーカーを用いたPooled typing実験における問題点について説明する図である。
符号の説明
200 波形DB
201 ゲノム配列DB
202 表示装置
203 キーボード
204 ポインティングデバイス
205 中央処理装置
206 プログラムメモリ
207 データメモリ
208 コンパウンドマーカー判定処理部
209 Stutterピークの相対的高さ見積もり処理部
210 見積もり結果表示処理部
211 実験結果補正処理部
212 マーカーデータ
213 Pooled typingデータ
214 Individual typingデータ

Claims (21)

  1. DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する装置であって、
    前記DNA断片に対応するゲノム配列を含むゲノム配列データと、各ゲノム配列データが既知のコンパウンドマーカーであるか否かを示すunit長リストとを保持するデータメモリから前記DNA断片に対応するデータを読み出し、読み出された前記unit長リストにunit長が既に登録されているか又は前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているかに基づいて、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定し、前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているか否かを判定した場合には、前記データメモリの当該DNA断片に対応するunit長リストの領域に各マイクロサテライトの位置及び長さを登録するコンパウンドマーカー判定処理部と、
    前記DNA断片の長さと繰り返し回数の関係が前記データメモリに登録されている場合又は前記unit長リストに異なる複数のunit長が前記データメモリに登録されていない場合には、前記データメモリから読み出される前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を予備的実験無しに見積もることが可能であることを示すフラグをセットし、前記データメモリの前記unit長リストに異なる複数のunit長が登録されている場合には予備的実験無しでの前記見積もりが不可能であることを示すフラグをセットする相対的高さ見積もり処理部と、
    前記相対的高さ見積もり処理部による判定結果を表示する表示処理部と
    を備えた装置。
  2. 前記相対的高さ見積もり処理部は、前記DNA断片に含まれるマイクロサテライトの繰り返し回数と前記相対的関係との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトそれぞれの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記真のピークの高さとstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定する
    ことを特徴とする請求項1に記載の装置。
  3. DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する装置であって、
    前記DNA断片に対応するゲノム配列を含むゲノム配列データと、各ゲノム配列データが既知のコンパウンドマーカーであるか否かを示すunit長リストとを保持するデータメモリから前記DNA断片に対応するデータを読み出し、読み出された前記unit長リストにunit長が既に登録されているか又は前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているかに基づいて、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定し、前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているか否かを判定した場合には、前記データメモリの当該DNA断片に対応するunit長リストの領域に各マイクロサテライトの位置及び長さを登録するコンパウンドマーカー判定処理部と、
    前記DNA断片の長さと繰り返し回数の関係が前記データメモリに登録されている場合又は前記unit長リストに異なる複数のunit長が前記データメモリに登録されていない場合には、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係と、前記DNA断片に含まれるマイクロサテライトの繰り返し回数との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記相対的関係を見積もる相対的高さ見積もり処理部と、
    前記相対的高さ見積もり処理部による見積もり結果を表示する表示処理部と
    を備えた装置。
  4. DNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する装置であって、
    前記DNA断片に対応するゲノム配列を含むゲノム配列データと、各ゲノム配列データが既知のコンパウンドマーカーであるか否かを示すunit長リストとを保持するデータメモリから前記DNA断片に対応するデータを読み出し、読み出された前記unit長リストにunit長が既に登録されているか又は前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているかに基づいて、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定し、前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているか否かを判定した場合には、前記データメモリの当該DNA断片に対応するunit長リストの領域に各マイクロサテライトの位置及び長さを登録するコンパウンドマーカー判定処理部と、
    前記DNA断片の長さと繰り返し回数の関係が前記データメモリに登録されている場合又は前記unit長リストに異なる複数のunit長が前記データメモリに登録されていない場合には、前記データメモリから読み出される前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係と、前記DNA断片に含まれるマイクロサテライトの繰り返し回数との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記相対的関係を見積もる相対的高さ見積もり処理部と、
    前記相対的高さ見積もり処理部による見積もり結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルの高さと前記stutterピークの高さとの関係を補正する補正処理部と、
    前記補正された検出シグナルから前記DNA断片の長さを分析した結果を表示する表示処理部と
    を備えた装置。
  5. 前記相対的高さ見積もり処理部は、前記DNA断片に含まれるマイクロサテライトの繰り返し回数との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記真のピークの高さとstutterピークの高さとの相対的関係を見積もる
    ことを特徴とする請求項3又は4に記載の装置。
  6. 前記コンパウンドマーカー判定処理部は、前記データメモリから読み出される前記DNA断片のPCR増幅産物の検出シグナル波形のピーク間隔に基づいて、前記DNA断片が1塩基のin/delを含んでいるかどうかを判定する
    ことを特徴とする請求項1から5のいずれか1項に記載の装置。
  7. 前記コンパウンドマーカー判定処理部は、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に含まれているマイクロサテライトのunit繰り返し回数に関する情報を取得する
    ことを特徴とする請求項1から6のいずれか1項に記載の装置。
  8. 前記相対的高さ見積もり処理部は、前記DNA断片に1塩基のin/delが含まれている場合には、前記DNA断片の公開されているゲノム配列を参照し、DNA断片の長さとそこに含まれるマイクロサテライトのunit繰り返し回数との線形的関係を1塩基分調整する
    ことを特徴とする請求項3から7のいずれか1項に記載の装置。
  9. 前記相対的高さ見積もり処理部は、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に複数のマイクロサテライトが含まれている場合であって、当該DNA断片に1塩基のin/delが含まれており、かつ、前記unit長が3塩基以上の場合には、DNA断片の長さとそこに含まれる各マイクロサテライトのunit繰り返し回数の合計との線形的関係であって、前記マイクロサテライト間で共通する線形的関係を1塩基分調整する
    ことを特徴とする請求項3から8のいずれか1項に記載の装置。
  10. 前記表示処理部は、前記相対的高さ見積もり処理部による見積もりの根拠とした情報を表示する
    ことを特徴とする請求項3から9のいずれか1項に記載の装置。
  11. 中央処理装置がDNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する方法であって、
    前記中央処理装置が、前記DNA断片に対応するゲノム配列を含むゲノム配列データと、各ゲノム配列データが既知のコンパウンドマーカーであるか否かを示すunit長リストとを保持するデータメモリから前記DNA断片に対応するデータを読み出し、読み出された前記unit長リストにunit長が既に登録されているか又は前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているかに基づいて、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定し、前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているか否かを判定した場合には、前記データメモリの当該DNA断片に対応するunit長リストの領域に各マイクロサテライトの位置及び長さを登録するコンパウンドマーカー判定ステップと、
    前記中央処理装置が、前記DNA断片の長さと繰り返し回数の関係が前記データメモリに登録されていると判定した場合又は前記unit長リストに異なる複数のunit長が前記データメモリに登録されていないと判定した場合、前記データメモリから読み出される前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係を予備的実験無しに見積もることが可能であることを示すフラグをセットし、前記データメモリの前記unit長リストに異なる複数のunit長が登録されていると判定した場合、予備的実験無しでの前記見積もりが不可能であることを示すフラグをセットする相対的高さ見積もりステップと、
    前記中央処理装置が、前記相対的高さ見積もりステップによる判定結果を表示装置に表示する表示ステップと
    を含む方法。
  12. 前記相対的高さ見積もりステップにおいて、前記中央処理部は、前記DNA断片に含まれるマイクロサテライトの繰り返し回数と前記相対的関係との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記真のピークの高さとstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定する
    ことを特徴とする請求項11に記載の方法。
  13. 中央処理装置がDNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する方法であって、
    前記中央処理装置が、前記DNA断片に対応するゲノム配列を含むゲノム配列データと、各ゲノム配列データが既知のコンパウンドマーカーであるか否かを示すunit長リストとを保持するデータメモリから前記DNA断片に対応するデータを読み出し、読み出された前記unit長リストにunit長が既に登録されているか又は前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているかに基づいて、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定し、前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているか否かを判定した場合、前記データメモリの当該DNA断片に対応するunit長リストの領域に各マイクロサテライトの位置及び長さを登録するコンパウンドマーカー判定ステップと、
    前記中央処理装置が、前記DNA断片の長さと繰り返し回数の関係が前記データメモリに登録されていると判定した場合又は前記unit長リストに異なる複数のunit長が前記データメモリに登録されていないと判定した場合、前記データメモリから読み出される前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係と、前記DNA断片に含まれるマイクロサテライトの繰り返し回数との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記相対的関係を見積もる相対的高さ見積もりステップと、
    前記中央処理装置が、前記相対的高さ見積もりステップによる見積もり結果を表示装置に表示する表示ステップと
    を含む方法。
  14. 中央処理装置がDNA断片のPCR増幅産物の検出シグナルから当該DNA断片の長さを分析した結果を表示する方法であって、
    前記中央処理装置が、前記DNA断片に対応するゲノム配列を含むゲノム配列データと、各ゲノム配列データが既知のコンパウンドマーカーであるか否かを示すunit長リストとを保持するデータメモリから前記DNA断片に対応するデータを読み出し、読み出された前記unit長リストにunit長が既に登録されているか又は前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているかに基づいて、前記DNA断片が、多型性がある配列部分を複数有するコンパウンドマーカーであるかどうかを判定し、前記ゲノム配列データに繰り返し回数が多いマイクロサテライトが複数含まれているか否かを判定した場合には、前記データメモリの当該DNA断片に対応するunit長リストの領域に各マイクロサテライトの位置及び長さを登録するコンパウンドマーカー判定ステップと、
    前記中央処理装置が、前記DNA断片の長さと繰り返し回数の関係が前記データメモリに登録されていると判定した場合又は前記unit長リストに異なる複数のunit長が前記データメモリに登録されていないと判定した場合、前記データメモリから読み出される前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークの高さと、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピークの高さとの相対的関係と、前記DNA断片に含まれるマイクロサテライトの繰り返し回数との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記相対的関係を見積もる相対的高さ見積もりステップと、
    前記中央処理装置が、前記相対的高さ見積もりステップによる見積もり結果に基づいて、前記DNA断片のPCR増幅産物の検出シグナルの高さと前記stutterピークの高さとの関係を補正する補正ステップと、
    前記中央処理装置が、前記補正された検出シグナルから前記DNA断片の長さを分析した結果を表示装置に表示する表示ステップと
    を含む方法。
  15. 前記相対的高さ見積もりステップにおいて、前記中央処理部は、前記DNA断片に含まれるマイクロサテライトの繰り返し回数と前記相対的関係との間に線形関係が成立するという性質を利用し、前記データメモリから読み出された前記DAN断片に含まれる同一unit長の複数のマイクロサテライトの繰り返し回数ni(iは2以上の自然数)の和Σniと、前記DNA断片の長さに対する前記PCR増幅産物の長さの増減塩基数が前記unit長のn倍で与えられる場合における前記nとの和(=n+Σni)を変数項とする線形方程式の計算結果として前記真のピークの高さとstutterピークの高さとの相対的関係を見積もることが可能であるかどうかを判定する
    ことを特徴とする請求項13又は14に記載の方法。
  16. 前記コンパウンドマーカー判定ステップにおいて、前記中央処理部は、前記データメモリから読み出される前記DNA断片のPCR増幅産物の検出シグナル波形のピーク間隔に基づいて、前記DNA断片が1塩基のin/delを含んでいるかどうかを判定する
    ことを特徴とする請求項11から15のいずれか1項に記載の方法。
  17. 前記コンパウンドマーカー判定ステップにおいて、前記中央処理部は、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に含まれているマイクロサテライトのunit繰り返し回数に関する情報を取得する
    ことを特徴とする請求項11から16のいずれか1項に記載の方法。
  18. 前記相対的高さ見積もりステップにおいて、前記中央処理部は、前記DNA断片に1塩基のin/delが含まれている場合には、前記DNA断片の公開されているゲノム配列を参照し、DNA断片の長さとそこに含まれるマイクロサテライトのunit繰り返し回数との線形的関係を1塩基分調整する
    ことを特徴とする請求項13から17のいずれか1項に記載の方法。
  19. 前記相対的高さ見積もりステップにおいて、前記中央処理部は、前記DNA断片の公開されているゲノム配列を参照し、前記DNA断片に複数のマイクロサテライトが含まれている場合であって、当該DNA断片に1塩基のin/delが含まれており、かつ、前記unit長が3塩基以上の場合には、DNA断片の長さとそこに含まれる各マイクロサテライトのunit繰り返し回数の合計との線形的関係であって、前記マイクロサテライト間で共通する線形的関係を1塩基分調整する
    ことを特徴とする請求項13から18のいずれか1項に記載の方法。
  20. 前記表示ステップにおいて、前記中央処理部は、前記相対的高さ見積もりステップにおいて見積もりの根拠とした情報を表示する
    ことを特徴とする請求項13から19のいずれか1項に記載の方法。
  21. 請求項11から20のいずれか1項に記載の方法をコンピュータにおいて実行するためのプログラム。
JP2004353068A 2004-12-06 2004-12-06 遺伝子情報の表示方法及び表示装置及びプログラム Expired - Fee Related JP4713138B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004353068A JP4713138B2 (ja) 2004-12-06 2004-12-06 遺伝子情報の表示方法及び表示装置及びプログラム
US11/285,061 US20060122791A1 (en) 2004-12-06 2005-11-23 Method and apparatus for displaying gene information
EP05025675A EP1667044A3 (en) 2004-12-06 2005-11-24 Method and apparatus for displaying gene information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004353068A JP4713138B2 (ja) 2004-12-06 2004-12-06 遺伝子情報の表示方法及び表示装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2006163720A JP2006163720A (ja) 2006-06-22
JP4713138B2 true JP4713138B2 (ja) 2011-06-29

Family

ID=36124014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004353068A Expired - Fee Related JP4713138B2 (ja) 2004-12-06 2004-12-06 遺伝子情報の表示方法及び表示装置及びプログラム

Country Status (3)

Country Link
US (1) US20060122791A1 (ja)
EP (1) EP1667044A3 (ja)
JP (1) JP4713138B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4922646B2 (ja) * 2005-12-14 2012-04-25 株式会社日立ソリューションズ 遺伝子情報の表示方法及び表示装置
EP1862929A1 (en) * 2006-02-28 2007-12-05 Hitachi Software Engineering Co., Ltd. Genotyping result evaluation method and system
JP5065694B2 (ja) * 2006-02-28 2012-11-07 株式会社日立ソリューションズ 遺伝子型判定結果の評価方法及び評価システム
US20220230706A1 (en) 2019-05-31 2022-07-21 Nec Corporation Information processing apparatus, information processing method and information processing program
WO2021100204A1 (ja) * 2019-11-22 2021-05-27 日本電気株式会社 Dna増幅方法、dna増幅キット及び鑑定/診断方法
WO2022196041A1 (ja) * 2021-03-15 2022-09-22 日本電気株式会社 遺伝子情報処理システム、遺伝子情報処理方法、及び記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006017461A (ja) * 2004-06-30 2006-01-19 Hitachi Software Eng Co Ltd 遺伝子情報の表示方法及び表示装置
JP2006079334A (ja) * 2004-09-09 2006-03-23 Hitachi Software Eng Co Ltd 遺伝子情報の表示方法及び表示装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5580728A (en) * 1994-06-17 1996-12-03 Perlin; Mark W. Method and system for genotyping
US6274317B1 (en) * 1998-11-02 2001-08-14 Millennium Pharmaceuticals, Inc. Automated allele caller
US20020116135A1 (en) * 2000-07-21 2002-08-22 Pasika Hugh J. Methods, systems, and articles of manufacture for evaluating biological data
WO2002008469A2 (en) * 2000-07-21 2002-01-31 Applera Corporation Methods, systems, and articles of manufacture for evaluating biological data
US20020058265A1 (en) * 2000-09-15 2002-05-16 Promega Corporation Detection of microsatellite instability and its use in diagnosis of tumors
US6844152B1 (en) * 2000-09-15 2005-01-18 Promega Corporation Detection of microsatellite instability and its use in diagnosis of tumors

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006017461A (ja) * 2004-06-30 2006-01-19 Hitachi Software Eng Co Ltd 遺伝子情報の表示方法及び表示装置
JP2006079334A (ja) * 2004-09-09 2006-03-23 Hitachi Software Eng Co Ltd 遺伝子情報の表示方法及び表示装置

Also Published As

Publication number Publication date
JP2006163720A (ja) 2006-06-22
EP1667044A2 (en) 2006-06-07
US20060122791A1 (en) 2006-06-08
EP1667044A3 (en) 2007-06-20

Similar Documents

Publication Publication Date Title
Tsai et al. Discovery of rare mutations in populations: TILLING by sequencing
DK2823062T5 (en) SIZE-BASED ANALYSIS OF Fetal DNA FRACTION IN MOTHER PLASMA
CA2890441A1 (en) Methods and systems for identifying contamination in samples
Garud et al. Elevated linkage disequilibrium and signatures of soft sweeps are common in Drosophila melanogaster
Frisch et al. The length of the intact donor chromosome segment around a target gene in marker-assisted backcrossing
Galindo-González et al. Ion Torrent sequencing as a tool for mutation discovery in the flax (Linum usitatissimum L.) genome
US7783430B2 (en) Genotyping result evaluation method and system
US20090228213A1 (en) Display method and display apparatus of gene information
US11475980B2 (en) Methods of analyzing massively parallel sequencing data
JP4713138B2 (ja) 遺伝子情報の表示方法及び表示装置及びプログラム
US7912652B2 (en) System and method for mutation detection and identification using mixed-base frequencies
JP4922646B2 (ja) 遺伝子情報の表示方法及び表示装置
JP7170711B2 (ja) Dna分析のためのオフターゲット配列の使用
JP2009518051A (ja) 異なる個体の核酸を含む生体試料から遺伝子型を決定する方法
JP5065694B2 (ja) 遺伝子型判定結果の評価方法及び評価システム
JP4414823B2 (ja) 遺伝子情報の表示方法及び表示装置
JP7166638B2 (ja) 多型検出法
JP2021534803A (ja) 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム
JP5090766B2 (ja) 遺伝子情報の処理装置及び表示装置
Symons et al. ResqMi-a versatile algorithm and software for Resequencing Microarrays
WO2000032820A1 (en) Method for detecting target sequences in small proportions in heterogeneous samples
CA2961563A1 (en) Methods of analyzing massively parallel sequencing data
WO2024059487A1 (en) Methods for detecting allele dosages in polyploid organisms
Papenfuss et al. Bioinformatics Analysis of Sequence Data
JP2008237178A (ja) イタリアンライグラスの品種識別用のオルガネラゲノム由来1塩基多型プライマー対及び当該プライマーセットを用いたイタリアンライグラス品種の識別方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100819

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110324

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees