JP4286332B2 - Dna塩基配列に含まれるベクター部の自動除去方法および装置 - Google Patents
Dna塩基配列に含まれるベクター部の自動除去方法および装置 Download PDFInfo
- Publication number
- JP4286332B2 JP4286332B2 JP19200595A JP19200595A JP4286332B2 JP 4286332 B2 JP4286332 B2 JP 4286332B2 JP 19200595 A JP19200595 A JP 19200595A JP 19200595 A JP19200595 A JP 19200595A JP 4286332 B2 JP4286332 B2 JP 4286332B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- base sequence
- search key
- dna
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
Landscapes
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
【産業上の利用分野】
本発明はクローン、すなわち増産すべき遺伝子を含んだDNAの断片を、ベクターと呼ばれる環状DNA分子に化学的に結合させ、そのベクターを例えば大腸菌などの細胞内で増殖させることにより、目的のDNAの断片を増産するDNAクローニングにおいて、増産後のベクターから目的のDNA断片を取り出す時、取り出される断片の内部に含まれるベクターの一部を自動的に除去するベクター部自動除去方法に関する。
【0002】
【従来の技術】
核酸の構成単位はヌクレオチドであり、このヌクレオチドは塩基、糖、リン酸の3成分が結合したものである。ヌクレオチドはヌクレオシドにリン酸が結合したものでもあり、リン酸はヌクレオシドをはしかけして、ポリマーが作られ、DNA(デオキシリボ核酸)とRNA(リボ核酸)のいずれかが形成される。
【0003】
核酸を構成する塩基にはプリン塩基とピリミジン塩基の2種類があり、プリン塩基にはアデニンAとグアニンGがあり、またピリミジン塩基にはシトシンCとチミンTがある。
【0004】
ポリヌクレオチド鎖構造と呼ばれる構造を持つDNAは、前述の4つの塩基アデニンA、グアニンG、シトシンC、およびチミンTが一列に並んだ細長い糸のような構造を持っており、例えば1個のヒトの細胞の染色体からDNAを引き出し、それらを繋ぎ合わせると1mにもおよび、この上に30億個の塩基が並んでいると言われる。
【0005】
このようにDNAは塩基が一列、すなわち鎖状に結合した塩基一次配列の構造を持ち、その鎖は一般的に非常に長いが、遺伝子工学においては、多種類の遺伝子を持つDNAを切断して、切断結果としての多数のDNA断片の中から特定の遺伝子情報を持つものを選び出し、選び出されたDNA断片、すなわち目的DNA断片を多量に生成させる必要があることが多い。
【0006】
このような目的のために、目的DNA断片をベクターと呼ばれるDNA、一般に環状のDNAに化学結合によって連結させ、目的DNA断片とベクターDNAの結合物である組替えDNAを大腸菌などの適当な細胞に取り込ませ、その細胞を増殖させることにより組替えDNAを多量に生成し、結果として目的DNA断片を大量に生成するクローニングと言う操作が行われる。
【0007】
すなわち、一般に配列のユニークな目的DNA断片はその量が微量であることが多く、この目的DNA断片(DNAフラグメント)をベクターに組み込んでクローニングが行われる。ベクターは一般的に環状の二重らせん構造のDNAであり、この二重らせん構造のある特定の箇所を制限酵素と呼ばれる酵素で切断し、その切断箇所に目的DNAフラグメントが組み込まれる。制限酵素によるDNAの切断について説明するために、まずDNAの構造について更に説明する。
【0008】
DNAは、前述のように塩基が一列、すなわち鎖状に結合した塩基一次配列の構造を持っている。このDNA鎖には向きがあり、ATGCACGA→とATGCACGA←(すなわちAGCACGTA→)とは別のものである。
【0009】
このDNA鎖の両側、すなわち末端には名称がついており、糖の3′の位置に水酸基がついた末端は3′末端と呼ばれ、また他方の末端、すなわち糖の5′の位置にリン酸基がついた末端は5′末端と呼ばれる。そしてDNA鎖を記述する際には、一般に5′末端が左、3′末端が右となるように記述する。
【0010】
DNAは通常、向きが異なって相補的な2本の塩基配列がくっついた二重鎖の状態で存在する。この時2本の塩基配列において、お互いに向かい合う塩基の間には一定の関係があり、アデニンAはチミンTと、またグアニンGはシトシンCと向き合うようになっている。この例を次に示す(上下の塩基がペアとなっている)。
【0011】
【数1】
【0012】
このようにDNAは、相補鎖となる2本の塩基配列が組となって1つの遺伝的意味を持つが、制限酵素はこのような塩基配列のうちの4〜6個の塩基から成る塩基配列であって、その制限酵素に特有の塩基配列を識別し、その箇所でDNAを切断する。図21はこの制限酵素によるDNA塩基配列の切断の説明図である。同図において、例えばHpaIと呼ばれる制限酵素は、DNAの2本鎖の同一の位置でDNAを切断するが、EcoRIなどの場合は2本の鎖の切断位置が異なっている。
【0013】
図21に示されるように、多くの制限酵素が識別するヌクレオチド配列は塩基対6個であり、この識別領域、すなわち制限酵素サイトにおける2本の鎖のヌクレオチド配列は逆向きに同一である。多くの制限酵素は、それが切断する2本の鎖の切断位置が異なり、互い違いの末端、すなわちコヒーシブ末端を作り出すことになる。
【0014】
制限酵素で切断された位置に前述の目的DNA断片が組み込まれる。図22はこの目的DNA断片のベクターへの組み込みの説明図である。同図において、環状のプラスミドDNA分子が制限酵素によって切断され、コヒーシブ末端を持つ直線状プラスミドDNA分子となる。ここでプラスミドとは、例えばバクテリアなどの中に含まれ、染色体DNAとは異なって自律的に増殖する環状DNAである。この直線状プラスミドDNA分子と、目的DNA断片、すなわち染色体DNAを同じ制限酵素で切断して作った多種類のDNA断片の1つとが、塩基対形成、すなわちコヒーシブ末端のアニーリングによって環状のDNAとして結合しやすくなる。
【0015】
このように制限酵素によって作られるコヒーシブ末端は組替えDNA技術にとって重要であり、同じ制限酵素で切断することによりどんなDNA断片でも繋ぎ合わせることができる。最後に2本鎖DNAの1本鎖切断部を修復する酵素であるDNAリガーゼを作用させることにより、直線状プラスミドDNA分子と目的DNA断片とが結合され、染色体DNAを組み込んだプラスミドDNA分子が作られる。
【0016】
このようにして生成されたプラスミドDNA分子は細菌、または酵母の中で殖やすことができる。これがDNAクローニングである。
このDNAクローニングに用いられるベクターと、そのベクター内で多種の制限酵素によってそれぞれ切断される多くの制限酵素サイトが集中しているマルチクローニングサイトの例を図23に示す。同図では異なるマルチクローニングサイトを持つ2種のベクターが示されている。
【0017】
このDNAクローニングの結果として大量に生成されたプラスミドDNA分子から目的DNA断片を切り出す場合には、クローニングされたDNA断片のヌクレオチド配列を正確に決定し、不必要な部分の塩基を削除して、正確な構造を持つDNA断片を取り出す必要がある。このDNA断片のヌクレオチド配列を決定するために、DNA塩基配列を自動的に読み取る装置としてのDNAシーケンサが用いられる。
【0018】
DNAにおけるA,G,T、およびCの配列順序を知ることは、すなわち遺伝情報を解明することにつながり、この塩基配列を決めるシーケンス技術は他の分野の技術と互いに関連しながら進歩しており、その発展は制限酵素や核酸関連酵素の発見、DNAのクローニング、核酸化学などの技術分野の発展と大いに関連している。
【0019】
最近ではコンピュータ技術がシーケンス法の1つとして活用され、人間の能力を越えた膨大なデータの入力や蓄積が可能となり、塩基配列の決定にとってコンピュータは必須の道具として用いられるようになっている。
【0020】
DNAの塩基配列を自動的に読み取る装置であるDNAシーケンサにおいては、ジデオキシ法、またはサンガ法と呼ばれる方法が塩基配列決定のために用いられる。一般にDNAの二重鎖の一方の相補鎖の一部分を、DNA合成のきっかけとなるプライマーとしてDNA合成を行う際に、ジデオキシヌクレオチドと言うヌクレオチドが取り込まれると、そこでDNA合成がストップし、様々な長さのDNAの断片(フラグメント)が得られるが、プライマーを用いたDNA合成反応の際に、G,A,T、およびCの各塩基に対応するジデオキシヌクレオチドを加えることにより、それぞれの塩基の位置で鎖の伸びがストップした様々な長さのDNA断片が得られる。
【0021】
図24は特定のヌクレオチド、この場合アデニンAの所で切断されてできるDNA断片の作り方の説明図である。この場合にはDNA鎖から1個のヌクレオチド、すなわちアデニンAを取り除く程度の穏やかな化学処理が行われ、5′末端にリン酸基を持つ左側の断片のみが放射性の断片となり、これらの断片をゲル電気泳動させることにより、放射性の断片のみはその断片の長さ、例えば分子量に対応する位置で検出される。
【0022】
DNAシーケンサでは、ジデオキシ法の反応生成物としてのDNA断片が蛍光標識され、その結果としての蛍光標識されたいろいろの長さの鎖を持つDNA断片が、ゲル電気泳動によって分離される。ゲル内を泳動されてくるDNA断片に対してゲル上のある位置においてレーザ照射により蛍光色素を励起発光させ、この蛍光を光検出器で検出する。電気泳動と同時に経時的に蛍光を検出していくことにより、G,A,T、およびCの各塩基に対応するDNA断片の泳動パターンのデータを得ることができる。このようにして得られたデータがコンピュータによって解析され、塩基配列データに変換される。
【0023】
DNAシーケンサの出力データとしては、DNA塩基配列そのものと、配列の決定に使われた波形データがある。この波形データはゲル電気泳動パターンのデータに対応し、G,A,T、およびCの各波形において波形の蛍光強度のピークの位置がその塩基の存在する位置に対応する。
【0024】
しかしながら、前述のように一般にDNAの塩基配列における塩基の個数は非常に多いので、DNAシーケンサによって一度に塩基配列の全てを決定することはできず、一般に配列を決定したいDNAを複数の断片にフラグメント化して、各フラグメントの塩基配列を決定し、それらの塩基配列を結合することによって全体の塩基配列を決定する方法がとられている。
【0025】
【発明が解決しようとする課題】
以上のように、目的DNA断片をベクターに組み込み、DNAクローニングを行った後にDNAシーケンサを用いて塩基配列を決定し、不必要な塩基を削除して正確な目的DNA断片を生成することになるが、一般にシーケンサの出力としてのシーケンス結果には、目的DNA断片に加えてクローニングに用いたベクターの一部の塩基配列が含まれ、その一部の塩基を削除することが困難であると言う問題点があった。
【0026】
このようなベクターの一部の塩基としてのベクター部は、シーケンス結果の5′末端部、および3′末端部に混入する可能性が高く、正確な目的DNAフラグメントを生成するためには、これらのベクター部を確実に取り除く必要がある。従来は、目的DNAフラグメント塩基配列の前後にくる可能性があるベクター部の塩基配列を用いて、全ての塩基が完全に一致しなくても検索結果を出力する検索法としての、ホモロジーサーチを用いてベクター部を削除していた。しかしながら混入したベクター部の塩基配列が短かったり、3′末端側でのミスシーケンシング等の影響により混入したベクター部を的確に見つけ出すことができず、正しい構造の目的DNAフラグメントを生成することができないという問題点があった。
【0027】
本発明は、DNAシーケンス結果に混入したベクター部を高い確率で検索し、その検索結果からベクター部を自動的に削除することを目的とする。
【0028】
【課題を解決するための手段及び作用】
図1は本発明の機能ブロック図である。同図はベクター、例えば環状プラスミドDNA分子を切断し、その切断箇所に目的のDNA断片を組み込んでクローニングを行う、DNAクローニング結果のDNA塩基配列からベクター内の塩基配列の一部としてのベクター部を除去するベクター部自動除去方法の機能ブロック図である。
【0029】
図1において、1でベクターの種類とベクターの切断時に使用された制限酵素、および目的DNA断片を得るために使用された制限酵素とに応じて、クローニング結果のDNA塩基配列からベクター部塩基配列を検索するための検索キーとなる塩基配列が作成され、2でその作成された検索キーを用いてベクター部塩基配列が特定され、特定されたベクター部塩基配列の自動除去が行われる。
【0030】
前述の検索キーとしては、例えば前部検索キーと後部検索キーとが用いられる。これらの検索キーは、クローニング結果としてのDNA塩基配列のうちで、ベクター部と目的DNA断片とのそれぞれが対応する制限酵素によって切断された末端部を含み、かつベクター部と目的DNA断片のそれぞれの接合前の制限酵素サイトに対応する塩基配列を含む領域であって、目的DNA断片の前にあるものが前部検索キー、後にあるものが後部検索キーである。
【0031】
まずクローニング結果としてのDNA塩基配列に対する前部検索キーおよび後部検索キーを用いた検索において、あらかじめ設定された類似度以上となることを条件としてホモロジー検索が行われ、その検索結果がベクター・目的DNA断片接合部候補として求められる。このベクター・目的DNA断片接合部候補のうち前部検索キーに対応するものが5′側境界部位の1次候補とされ、後部検索キーに対応するものが3′側境界部位の1次候補とされる。
【0032】
これらの5′側、および3′側境界部位の1次候補は一般にそれぞれ複数となる可能性があるため、本発明においては更に第2の前部検索キーおよび第2の後部検索キーを用いた検索が行われる。第2の前部検索キー、第2の後部検索キーは、ベクターのマルチクローニングサイト内で前述の前部検索キー、または後部検索キーに対してそのキーの前または後で隣接すべき部分が追加されたものであり、この第2の前部検索キーと第2の後部検索キーとに対応して前述と同様にしてホモロジー検索が行われ、その検索結果を含んで検索結果の以前、または以後の全ての領域がベクター部の候補として特定される。
【0033】
更にこれらのベクター部候補が目的DNA断片の前および後でそれぞれ1つのみであり、かつ前のベクター部候補と後のベクター部候補とがオーバーラップしていない時、その特定されたベクター部候補がベクター部として自動除去される。
【0034】
以上のように本発明によれば、例えば制限酵素サイトの塩基配列が前部検索キー、および後部検索キーとして用いられて境界部位の1次候補が求められ、更に前部検索キー、後部検索キーのそれぞれ前、後の塩基配列の一部が追加された第2の前部検索キー、および第2の後部検索キーに基づくホモロジー検索によってベクター部の候補が求められ、求められたベクター部候補が適当である時にベクター部の自動除去が行われる。
【0035】
【実施例】
図2は本発明のベクター部自動除去方法の基本処理フローチャートである。同図において、まずステップS6で使用されたベクターの種類がベクターリストの中から選択されてベクターの入力が行われ、ステップS7で使用された制限酵素が制限酵素リストの中から選択されて制限酵素の入力が行われ、ステップS8でベクターと制限酵素の情報から検索キーが作成されてベクター部が検索される。すなわち検索キーとマルチクローニングサイトとのホモロジーがチェックされ、ベクター部の絞り込みを行うベクター部特定プログラムが実行され、ステップS9でこのベクター部特定プログラムによって特定されたベクター部が除去されて処理を終了する。
【0036】
図3は本発明のベクター部自動除去処理の全体フローチャートである。同図は、DNAシーケンサを用いて読み取られたDNA塩基配列、すなわちフラグメントからベクター部を自動的に削除する、ベクター部自動除去処理の全体フローチャートである。
【0037】
図3において、まずステップS11でベクター部自動除去の対象となるクローン(DNAフラグメント)が選択され、ステップS12で例えばディスプレイ上に表示されたメニューからユーザによってベクター部自動除去が選択され、それによってベクター部自動除去ダイアログ(対話形式メニュー)が表示され、ステップS13でそのダイアログを用いて、使用されたベクターがベクターリストから選択される。
【0038】
更にベクター部自動除去ダイアログを用いて、ステップS14〜S17でベクターの前部、後部の切断部、目的DNAの前部、後部の切断部の作成に使用された制限酵素、一般的には4種類の制限酵素が選択され、ステップS18でベクター部特定・除去プログラムが実行され、処理を終了する。
【0039】
ステップS18のベクター部特定・除去プログラムの詳細を説明する前に、その他のステップにおける処理を具体的に説明する。まずステップS11では、メインウィンドウに表示されたクローンのうちでベクターの自動除去を行うべきクローンが選択され、ステップS12でディスプレイ上に表示されたメニュー項目の中からベクター部自動除去メニューがユーザによって選択されると、ベクター・制限酵素選択用のダイアログが開く。このダイアログにはすでにベクターデータベースに登録されているベクター名がリストとして表示されており、ステップS13において実際に使用されたベクターがこのベクターリストから選択される。
【0040】
図4はベクターデータベース内に登録されているベクター名リストの例である。同図において本実施例ではPUC18が選択されたものとする。ベクターが選択されると、選択されたベクターのマルチクローニングサイトにおける塩基配列のデータ、および制限酵素サイトのデータが抽出され、マルチクローニングサイトの中に存在する制限酵素サイトに対応する制限酵素の名が表示される。
【0041】
図5はベクターデータベースに格納されているPUC18の塩基配列を示す。同図において、塩基配列の第5行目の最後から2番目のAから、第6行目の後から26番目のCまでの部分(アンダーライン部)が、マルチクローニングサイトである。
【0042】
ステップS13で選択されたベクター、ここではPUC18についてデータベースから、マルチクローニングサイトとその前後、それぞれ5つの塩基を含む塩基配列が抽出される。これは検索キーの文字列を少しでも多くしておくためである。またデータベースからは、このマルチクローニングサイトに含まれる制限酵素サイトのそれぞれに対応して、制限酵素情報、すなわち制限酵素の名称、塩基配列、制限酵素サイトの位置、および切断箇所のデータが抽出される。図6はこのようにして抽出されたマルチクローニングサイトと、制限酵素情報の例である。
【0043】
図3のステップS13で使用されたベクターが選択され、マルチクローニングサイトと制限酵素情報が抽出された後に、ステップS14〜S17でベクターと目的DNA断片のそれぞれについて、5′側と3′側でDNA鎖の切断に使用された制限酵素4つが選択される。この選択は、図7に示されるような制限酵素リストの中から、使用された制限酵素を指定することによって成される。図7はベクターとしてPUC18が選択された場合の制限酵素のリストを示し、これはベクターのマルチクローニングサイトに含まれる制限酵素サイトを切断する制限酵素のリストである。
【0044】
ステップS14〜S17で制限酵素4つが選択されると、ステップS18のベクター部特定プログラムにおいてベクター部削除のための検索に用いられる検索キーが特定される。一般的にはベクター側とDNA断片側とで異なる制限酵素を用いてDNA鎖の切断を行うことができるが、ここでは簡単のためベクター側とDNA断片側で同一の制限酵素を使用した場合を考える。すなわち本実施例ではベクターとDNA断片のそれぞれ5′側で同一の制限酵素としてHIND IIIを使用し、またベクターとDNA断片の3′側で同一の制限酵素、XBA Iを使用したものとする。これにより、図22で示したように、ベクターとDNA断片との結合部における塩基配列は、制限酵素サイトの塩基配列と同じになる。
【0045】
図8は図3のステップS18におけるベクター部特定プログラムの全体フローチャートである。同図において処理が開始されると、まずステップS21で検索キーの塩基配列が決定される。すなわちベクターの種類と制限酵素のデータから、5′側と3′側の2つの検索キー、すなわち前部検索キーと後部検索キーが作成され、ステップS22で前部検索キーと後部検索キーを用いたホモロジー検索が行われ、5′側と3′側でそれぞれベクターとDNA断片の境界を示す境界部位の1次候補のリストが作成される。一般にこの境界部位の1次候補は、5′側と3′側とでそれぞれ複数となることが多い。
【0046】
続いてステップS23で境界部位の2次候補のリストの作成が行われる。すなわち5′側の境界部位1次候補を含み、その前の領域、および3′側境界部位の1次候補を含み、その後の領域と、前部,後部検索キーを含むマルチクローニングサイトとのホモロジーチェックが行われ、境界部位の2次候補が求められる。ステップS24でそれぞれの境界部位の2次候補がユニーク(1つのみ)であることと、5′側の2次候補と3′側の2次候補との位置関係が調べられ、例えば位置関係に矛盾がなければステップS25で境界部位の2次候補が切断部位として決定されて処理を終了する。
【0047】
図9は制限酵素サイトとその切断後の制限酵素サイト内の領域の説明図である。制限酵素による制限酵素サイトの切断形式としては、一般的に二重鎖の同一の位置で切断されるとは限らず、(a) に示すように1本鎖領域が3′側についている場合と、(c) に示すように1本鎖領域が5′側についている場合と、(b) に示すように二重鎖が同じ位置で切断される場合とに分類される。なおここで1本鎖領域が3′側についているということは、前述の二重鎖のうちA鎖で考えて、(a) において領域B3は切断後に3′側に残るということを意味する。5′側についているという表現も含めて、以下同様の意味である。
【0048】
図9において、一般的に制限酵素サイト内で5′側に二重鎖の状態で残る部分を領域A(B鎖についても同様)、3′側に二重鎖の状態で残る部分を領域C、1本鎖として5′側についている部分を領域B5、1本鎖として3′側についている部分を領域B3と呼ぶことにする。一般的に、ベクターと目的DNA側で異なる制限酵素を用いて切断が行われても、領域Bの塩基配列が等しければベクターと目的DNAとを結合することができる。なお図9は切断前の制限酵素サイトを説明するものである。
【0049】
制限酵素サイトとその切断について、具体例を用いて更に説明する。前述のように一般的にはDNA二重鎖はA鎖1本で表され、例えば次のようになる。
ACTA^GT(^は切断個所を示す)
この表現ではA鎖とB鎖が次のように切断されることが表されている。
【0050】
これは図9(c) の場合に相当し、ACが領域A、TAが領域B5、GTが領域Cに該当し、領域B3に該当するものは存在しない。
【0051】
同様にA^CTAGTは以下のような切断形式を示す。
これは図9(a) に相当し、Aが領域A、CTAGが領域B3、Tが領域Cに相当し、領域B5に相当するものは存在しない。
【0052】
目的DNA断片のベクターへの組み込みに際しては、目的DNA断片の作成時の切断箇所、前後2箇所、およびベクターの切断箇所、前後2箇所、合計4箇所の制限酵素サイトが使用される。一般的には4箇所の切断箇所に対する制限酵素はそれぞれ独立に選択されることになり、切断された後の1本鎖領域がついている側と、それに対応して結合されるべき1本鎖領域の塩基配列が等しければ、2つの断片の末端部を結合することができる。
【0053】
例えば
ACTA^GT と TGTA^CA
ならば、1本鎖領域はそれぞれ5′側についており、1本鎖領域の塩基配列は“TA”と同じであるために、結合ができる。
【0054】
これに対して
ACTA^GT と TG^TACA
の場合には、1本鎖領域の配列は上の例と同様であるが、1本鎖領域のついている側が異なっているため、断片末端部を結合することはできない。
【0055】
図10はベクターと目的DNA断片とが接合された状態における制限酵素サイト同士の接合部の説明図である。同図ではベクター5側をV1、ベクター3′側をV2、目的DNA断片5′側をF1、目的DNA断片3′側をF2と呼び、例えばベクターの5′側の切断部の制限酵素サイトのA領域であればV1Aという記号で表している。
【0056】
このようにして表現すると、接合部分の塩基配列のうちで5′側の結合部配列は、1本鎖領域がベクター側にある場合[V1A]+[V1B5]+[F1C]、1本鎖領域が存在しない場合[V1A]+[F1C]、1本鎖領域が目的DNA断片側にある場合[V1A]+[F1B3]+[F1C]となる。また3′側の結合部配列は、1本鎖領域が目的DNA側にある場合[F2A]+[F2B5]+[V2C]、1本鎖領域が存在しない場合[F2A]+[V2C]、1本鎖領域がベクター側にある場合[F2A]+[V2B3]+[V2C]となる。
【0057】
本実施例においては、これらの5′側結合部塩基配列と3′側結合部塩基配列が、それぞれ5′側(前部)検索キー、3′側(後部)検索キーとして使用される。
【0058】
図11は5′側検索キー決定処理のフローチャートである。同図において処理が開始されると、まずステップS30でベクター5′側の制限酵素サイトの1本鎖領域が存在するか否か、存在する場合にはその1本鎖領域が5′側と3′側のいずれについているかが判定される。5′側についている場合には、ステップS31で目的DNA断片5′側の制限酵素サイトの1本鎖領域が5′側に存在するか否かが判定され、存在する場合にはステップS32でそれぞれの1本鎖領域の塩基配列[V1B5]と[F1B5]とが(5′側から読んで)等しいか否かが判定され、等しい場合は切断箇所の接合が可能となり、ステップS33で5′側検索キーが[V1A]+[V1B5]+[F1C]と決定されて、処理を終了する。
【0059】
これに対してステップS31で目的DNA断片5′側の1本鎖領域が5′側に存在しない場合、および5′側に存在してもステップS32で1本鎖領域の塩基配列が等しくないと判定された場合には、ステップS34で制限酵素の選択ミスと判定され、制限酵素選択処理に戻り、処理が繰り返される。
【0060】
ステップS30でベクター5′側の1本鎖領域が存在しないと判定されると、ステップS35で目的DNA断片5′側の制限酵素サイトの1本鎖領域も存在しないか否かが判定され、存在しない場合にはステップS36で5′側検索キーが[V1A]+[F1C]と決定されて処理を終了する。またステップS35で目的DNA断片の1本鎖領域が存在すると判定されると、ステップS34で制限酵素の選択ミスと判定され、制限酵素選択処理に戻り、処理が繰り返される。
【0061】
またベクター5′側の1本鎖領域が3′側についているとS30で判定されると、ステップS37で目的DNA断片5′側の制限酵素サイトの1本鎖領域が3′側に存在するか否かが判定され、存在する場合にはステップS38で1本鎖領域の塩基配列[V1B3]と[F1B3]が等しいか否かが判定され、等しい場合にはステップS39で5′側検索キーが[V1A]+[V1B3]+[F1C]として決定され、処理を終了する。これに対してステップS37で1本鎖領域が3′側に存在しない場合、または存在してもステップS38で1本鎖領域の2つの配列が等しくないと判定された時には、ステップS34で制限酵素の選択ミスと判定され、制限酵素選択処理へ戻り、処理が繰り返される。
【0062】
図12は3′側検索キー決定処理のフローチャートである。このフローチャートは5′側に対する図11とほぼ同様であるので詳細な説明を省略するが、ベクター3′側と目的DNA断片3′側の制限酵素サイトの1本鎖領域が共に5′側についている場合には[F2A]+[F2B5]+[V2C]が、また3′側の1本鎖領域が共に存在しない場合には[F2A]+[V2C]が、また共に3′側についている場合には[F2A]+[V2B3]+[V2C]が3′側検索キーとして決定される。
【0063】
本実施例におけるベクター部特定プログラムの詳細について、具体例を用いて更に説明する。図13は本実施例における前部検索キー、および後部検索キーの説明図である。ここでは図6で説明したベクターPUC18のマルチクローニングサイト内に目的DNA断片が組み込まれた場合を具体例として説明する。
【0064】
すなわちベクターと目的DNA断片の両方の5′側で同一の制限酵素としてHIND IIIが使用され、またベクターと目的DNAの両方の3′側で同一の制限酵素としてXBA Iが使用されたものとする。この場合、図13に示されるようにベクターと目的DNAとの結合部における制限酵素サイトに依存する塩基配列は制限酵素サイトの塩基配列と全く同じになる。従って前部検索キー、すなわち5′側検索キーは制限酵素サイトHIND IIIの塩基配列と等しくなり、後部検索キー、すなわち3′側検索キーは制限酵素サイトXBA Iの塩基配列と等しくなる。また図6に示したマルチクローニングサイトのうちで、目的DNA断片によって置き替えられた以外の部分を本実施例では残留マルチクローニングサイトと呼ぶことにする。
【0065】
図14は、図13の5′側検索キーを用いた5′側境界部位1次候補の検索処理のフローチャートである。同図において処理が開示されると、ステップS51で5′側検索キーを用いた対象クローンの塩基配列中のホモロジー検索が行われ、そしてステップS52で検索キーと一定値以上のホモロジー(例えば6個の塩基のうちで何個が一致するか)を示す領域として検索された結果が、境界部位の1次候補のリストとして獲得され、処理を終了する。
【0066】
図15は3′側境界部位1次候補の検索処理のフローチャートである。同図を図14と比較すると、検索キーとして後部検索キー、すなわち3′側検索キーを用いた検索が行われ、3′側の境界部位1次候補のリストが獲得される点のみが異なっている。
【0067】
図16は、図14によって得られた境界部位1次候補、一般には複数の1次候補の中から2次候補を絞り込む、2次候補検索処理のフローチャートである。同図において処理が開始されると、まずステップS61でベクターのマルチクローニングサイトの中で5′側の切断に使用された制限酵素サイトを含み、この制限酵素サイトから5′側の領域が5′側残留マルチクローニングサイト5MCSとして定義される。図13ではこの5MCSは5′側検索キーと同一となる。
【0068】
続いてステップS62で、ベクターデータベース内にマルチクローニングサイト以外の塩基配列も含まれる場合、すなわち図13のように5′側検索キー、ここでは5′側残留マルチクローニングサイトよりも5′側に更に5個の塩基の配列が含まれているが、このような場合には5MCSの5′側の5つの塩基を5MCSに追加したものが5′側残留ベクター領域5VAとして定義される。図13ではこの5VAは塩基配列GTGCCAAGCTTである。ベクターデータベース内にマルチクローニングサイトの塩基配列のみしか含まれない場合には5VAは5MCSと同一とされるが、一般的にはデータベース内にマルチクローニングサイトの前後の塩基配列は必ずといってよい程含まれるので、次に述べるホモロジーチェックが有効となる。
【0069】
この5′側残留ベクター領域5VAが求められた後に、図14によって求められた境界部位の1次候補のリストの要素全てについてステップS63〜S66の処理が行われ、ホモロジーチェックが実行される。まずステップS63で境界部位1次候補(LIST5)の各候補を含み、各候補より5′側のDNA塩基配列の配列領域がその候補に対するホモロジーチェック領域5HCAとして定義され、ステップS64で5VAの塩基数と、5HCAの塩基数、および20が比較され、一番少ない塩基数がホモロジーチェックのための塩基数HCBとして求められる。ステップS65で5VAの3′側からHCBの数だけの塩基が取り出され、5HCAの3′側からHCBの数だけの塩基とのホモロジーのチェックが行われ、一定値以上のホモロジーが得られた場合に、ステップS66でDNA塩基配列側のHCBの数だけの塩基が5′側境界部位2次候補とされて、処理を終了する。なお、このHCBを求めるときに比較される20は多くも少なくもない一定数を意味し、その値自体には特別の意味はない。
【0070】
図17はこの5′側の境界部位2次候補検索処理としてのホモロジーチェックの説明図である。同図において、クローンの塩基配列のうちで5′側境界部位1次候補を含み、それより5′側の領域がホモロジーチェックの対象となる領域5HCAとして定義され、その中で例えば5VAの塩基数と一致するHCBの個数の塩基が取り出され、ホモロジーチェックが行われて境界部位2次候補が決定される。
【0071】
図18は3′側における境界部位2次候補の決定処理のフローチャートであり、図19は3′側における2次候補検索処理の説明図である。これらは図16、および図17とほぼ同様であるので、その詳細な説明を省略する。
【0072】
図20はベクター部を除去するための最終的な切断部位の決定処理のフローチャートである。同図において処理が開始されると、まずステップS81で5′側と3′側の境界部位の2次候補がそれぞれ1つであるかどうかが判定され、それぞれ1つである場合にはステップS82で5′側の2次候補と3′側の2次候補がクローン塩基配列上でその相互の位置関係に矛盾がないか、すなわち3′側の2次候補が5′側の前にくるというような矛盾がないか、また2つの2次候補がお互いにオーバーラップするというような矛盾がないか否かが判定され、矛盾がない場合にはステップS83で5′側の2次候補と3′側の2次候補とがそれぞれ切断部位として決定されて、処理を終了する。
【0073】
一方、ステップS81で5′側と3′側の2次候補がそれぞれ1つでない場合、またはステップS82で2つの2次候補の位置関係に矛盾がある場合には、ステップS84でベクター部の特定は不可能であるとして処理を終了する。
【0074】
このようにして切断部位が決定されると、図3のステップS18におけるベクター部除去プログラムが実行される。このベクター部除去プログラムにおいては、図20で決定された切断部位を含んでベクター部が除去される。すなわち切断部位として決定された5′側境界部位2次候補を含む5′側の塩基配列と、3′側境界部位2次候補を含む3′側塩基配列とが共にベクター部として除去される。
【0075】
これに対して切断部位、すなわち制限酵素サイトの塩基配列を全て含む部位を削除するのでなく、制限酵素サイトについては制限酵素による切断位置からベクター部を除去することも可能であり、具体的な発明の実施方法が以上の記述に限定されないことは当然である。
【0076】
また以上の説明では記述しなかったが、例えば境界部位1次候補の検索結果や、境界部位2次候補の検索結果など、各種の検索結果をディスプレイ上で識別可能とし、削除すべきベクター部の同定を容易にすることも可能である。
【0077】
【発明の効果】
以上詳細に説明したように、本発明によればベクター部と目的DNA断片との境界部のごく短い塩基配列を検索キーとしてホモロジー検索を行うことにより、一般に複数の境界部位1次候補を求め、その1次候補について更にその前後でのホモロジーチェックを行うことによりベクター部の確実な特定が可能となる。特に一般的にシーケンサの出力において3′末端部側にシーケンシングミスが起こることがあるが、本発明によって3′末端部側に混入したベクター部を正確に削除することが可能となる。また検索結果をそれぞれ区別できる形式でディスプレイ上に表示することにより、自動削除できなかった部分に対してもユーザによるマニュアル削除の可能性を残すことができ、比較的短時間の検索によりベクター部の検索を高精度で行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の機能ブロック図である。
【図2】本発明のベクター部自動除去方法の基本処理フローチャートである。
【図3】本発明のベクター部自動除去処理の全体フローチャートである。
【図4】ベクターデータベース内に格納されているベクターリストの例を示す図である。
【図5】ベクターPUC18の塩基配列を示す図である。
【図6】ベクターPUC18のマルチクローニングサイトと制限酵素情報を説明する図である。
【図7】ベクターPUC18に対する制限酵素リストを示す図である。
【図8】ベクター部特定プログラムの全体処理フローチャートである。
【図9】制限酵素サイトの説明図である。
【図10】ベクターに組み込まれた目的DNA断片の説明図である。
【図11】5′側検索キー決定処理のフローチャートである。
【図12】3′側検索キー決定処理のフローチャートである。
【図13】ベクター部特定プログラムで用いられる、ホモロジー検索用検索キーを説明する図である。
【図14】5′側境界部位1次候補の検索処理フローチャートである。
【図15】3′側境界部位1次候補の検索処理フローチャートである。
【図16】5′側境界部位2次候補の検索処理フローチャートである。
【図17】5′側境界部位1次候補のホモロジーチェックの説明図である。
【図18】3′側境界部位2次候補の検索処理フローチャートである。
【図19】3′側境界部位1次候補のホモロジーチェックの説明図である。
【図20】ベクター部除去のための切断部位決定処理のフローチャートである。
【図21】制限酵素によるDNA塩基配列の切断例を説明する図である。
【図22】目的DNA断片を環状プラスミドDNA分子に結合させる操作を説明する図である。
【図23】ベクターとマルチクローニングサイトの例を示す図である。
【図24】DNA断片の作り方を説明する図である。
Claims (5)
- ベクターに目的DNA断片を組み込んでクローニングを行う、DNAクローニングの結果としてのDNA塩基配列から、ベクター内の塩基配列の一部としてのベクター部塩基配列を除去するベクター部の自動除去方法において、
前記ベクター部を前記クローニング結果のDNA塩基配列から検索するための検索キーとして、制限酵素サイトの塩基配列を前部検索キーおよび後部検索キーとし、
前記前部検索キーおよび後部検索キーを用いたホモロジー検索によって塩基が設定された類似度以上で一致する塩基配列をベクターとDNA断片の境界を示す境界部位候補として特定し、
前記前部検索キーまたは後部検索キーに対して、前記ベクターのマルチクローニングサイト内で前または後に隣接すべき部分を追加して第2の前部検索キーまたは第2の後部検索キーを作成し、
前記境界部位候補の中から該第2の前部検索キーおよび第2の後部検索キーを用いたホモロジー検索によって塩基が設定された類似度以上で一致する塩基配列をベクターとDNA断片の境界を示す境界部位として特定し、
該特定された境界部位の塩基配列を含むベクター部の塩基配列の自動除去を行うこと、
を特徴とするDNA塩基配列に含まれるベクター部の自動除去方法。 - 前記DNAクローニング結果としてのDNA塩基配列がDNAの塩基配列決定用シーケンサの出力であることを特徴とする請求項1記載のDNA塩基配列に含まれるベクター部の自動除去方法。
- 前記ベクター内で、前記マルチクローニングサイトの更に前または後で該マルチクローニングサイトに隣接すべき部分を更に追加して、前記第2の前部検索キーまたは第2の後部検索キーを作成することを特徴とする請求項1記載のDNA塩基配列に含まれるベクター部の自動除去方法。
- 前記特定された境界部位が、前記目的DNA断片の前および後でそれぞれ1つのみであり、かつ該目的DNA断片の前の境界部位と後の境界部位がオーバーラップしていない時、該特定された境界部位を除去することを特徴とする請求項1または3記載のDNA塩基配列に含まれるベクター部の自動除去方法。
- ベクターに目的DNA断片を組み込んでクローニングを行う、DNAクローニングの結果としてのDNA塩基配列から、ベクター内の塩基配列の一部としてのベクター部塩基配列を除去するベクター部の自動除去装置において、
前記ベクター部を前記クローニング結果のDNA塩基配列から検索するための検索キーとして、
制限酵素サイトの塩基配列を前部検索キーおよび後部検索キーとする手段と、
前記前部検索キーおよび後部検索キーを用いたホモロジー検索によって塩基が設定された類似度以上で一致する塩基配列をベクターとDNA断片の境界を示す境界部位候補として特定する手段と、
前記前部検索キーまたは後部検索キーに対して、前記ベクターのマルチクローニングサイト内で前または後に隣接すべき部分を追加して第2の前部検索キーまたは第2の後部検索キーを作成する手段と、
前記境界部位候補の中から該第2の前部検索キーおよび第2の後部検索キーを用いたホモロジー検索によって塩基が設定された類似度以上で一致する塩基配列をベクターとDNA断片の境界を示す境界部位として特定する手段と、
該特定された境界部位の塩基配列を含むベクター部の塩基配列の自動除去を行う手段とを備えることを特徴とするDNA塩基配列に含まれるベクター部の自動除去装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19200595A JP4286332B2 (ja) | 1995-07-27 | 1995-07-27 | Dna塩基配列に含まれるベクター部の自動除去方法および装置 |
GBGB9615560.1A GB9615560D0 (en) | 1995-07-27 | 1996-07-24 | Method and apparatus for automatically removing vector unit in a DNA base sequence |
GB9615805A GB2303703B (en) | 1995-07-27 | 1996-07-26 | Method and Apparatus for Automatically Removing Vector Unit in DNA Base Sequence |
US09/785,269 US6708119B2 (en) | 1995-07-27 | 2001-02-20 | Method and apparatus for automatically removing vector unit in DNA base sequence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19200595A JP4286332B2 (ja) | 1995-07-27 | 1995-07-27 | Dna塩基配列に含まれるベクター部の自動除去方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0937787A JPH0937787A (ja) | 1997-02-10 |
JP4286332B2 true JP4286332B2 (ja) | 2009-06-24 |
Family
ID=16284024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19200595A Expired - Fee Related JP4286332B2 (ja) | 1995-07-27 | 1995-07-27 | Dna塩基配列に含まれるベクター部の自動除去方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6708119B2 (ja) |
JP (1) | JP4286332B2 (ja) |
GB (2) | GB9615560D0 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1319202B1 (it) * | 2000-10-12 | 2003-09-26 | Nicox Sa | Farmaci per le malattie a base infiammatoria. |
US9268903B2 (en) | 2010-07-06 | 2016-02-23 | Life Technologies Corporation | Systems and methods for sequence data alignment quality assessment |
-
1995
- 1995-07-27 JP JP19200595A patent/JP4286332B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-24 GB GBGB9615560.1A patent/GB9615560D0/en active Pending
- 1996-07-26 GB GB9615805A patent/GB2303703B/en not_active Expired - Fee Related
-
2001
- 2001-02-20 US US09/785,269 patent/US6708119B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0937787A (ja) | 1997-02-10 |
GB2303703A (en) | 1997-02-26 |
US20020018736A1 (en) | 2002-02-14 |
GB2303703B (en) | 2000-08-23 |
US6708119B2 (en) | 2004-03-16 |
GB9615560D0 (en) | 1996-09-04 |
GB9615805D0 (en) | 1996-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676682B1 (en) | Methods for accurate sequence data and modified base position determination | |
US10984887B2 (en) | Systems and methods for detecting structural variants | |
TWI596493B (zh) | Dna序列之資料分析技術 | |
EP3169806B1 (en) | Systems and methods for detecting structural variants | |
US20100311598A1 (en) | System and method for editing and manipulating dna | |
US20210210164A1 (en) | Systems and methods for mapping sequence reads | |
Dominy et al. | Site-directed mutagenesis by inverse PCR | |
US5891632A (en) | Method and device for fragment trace data display in DNA base sequencing | |
JP4286332B2 (ja) | Dna塩基配列に含まれるベクター部の自動除去方法および装置 | |
CN111243666B (zh) | 一种基于Nextflow的环状核糖核酸自动化分析方法及系统 | |
US11021734B2 (en) | Systems and methods for validation of sequencing results | |
US20200327958A1 (en) | Functional sequence selection method and functional sequence selection system | |
JP3878503B2 (ja) | 核酸塩基配列決定方法 | |
US20220284986A1 (en) | Systems and methods for identifying exon junctions from single reads | |
US20230352120A1 (en) | System and method for predicting efficiency and outcome of base editor by using deep learning | |
CN116978444A (zh) | 利用深度学习的碱基编辑基因剪刀的效率和结果预测系统和方法 | |
WO2022125100A1 (en) | Methods for sequencing polynucleotide fragments from both ends | |
Tang | Retrotransposon Insertions in Cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050406 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090226 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090325 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130403 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140403 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |