[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2024138266A - 新規Cas12b酵素およびシステム - Google Patents

新規Cas12b酵素およびシステム Download PDF

Info

Publication number
JP2024138266A
JP2024138266A JP2024095510A JP2024095510A JP2024138266A JP 2024138266 A JP2024138266 A JP 2024138266A JP 2024095510 A JP2024095510 A JP 2024095510A JP 2024095510 A JP2024095510 A JP 2024095510A JP 2024138266 A JP2024138266 A JP 2024138266A
Authority
JP
Japan
Prior art keywords
sequence
cas12b
cell
guide
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2024095510A
Other languages
English (en)
Inventor
フェン チャン
ジョナサン ストレッカー
イアン スレイメイカー
サラ ジョーンズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology, Broad Institute Inc filed Critical Massachusetts Institute of Technology
Publication of JP2024138266A publication Critical patent/JP2024138266A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/22Cysteine endopeptidases (3.4.22)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】標的核酸のためのシステム、方法および組成物を提供する。【解決手段】本発明は、新規なRNAを標的とするCas12bエフェクタータンパク質およびガイドRNAまたはcrRNAのような少なくとも1種の標的核酸成分を含む非天然起源または遺伝子操作されたRNAを標的とするシステムを提供する。【選択図】なし

Description

[関連出願に対する相互参照]
本出願は、2018年8月7日付け米国仮特許出願第62/715,640号、2018年10月10日付け米国仮特許出願第62/744,080号、2018年10月26日付け米国仮特許出願第62/751,196号、2019年1月21日付け米国仮特許出願第62/794,929号、および2019年4月8日付け米国仮特許出願第62/831,028号の利益を主張する。上記に特定された出願の全内容は、参照により本明細書に完全に組み込まれる。
[連邦政府より資金提供を受けた研究に関する陳述]
本発明は、国立衛生研究所より授与された助成金番号MH110049およびHL141201の下で政府の支援を受けて実施された。政府は本発明に一定の権利を保有する。
[電子配列表の参照]
電子配列表(「BROD-2670_ST25.txt」;容量は879,558バイトであり、これは2019年7月25日に作成された)の内容は、参照によりその全体が本明細書に組み込まれる。
[技術分野]
本明細書に開示される主題は、一般に、クラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)およびその構成要素に関連するシステム、方法、および組成物に関する。本発明はまた、一般に、大量の有効量の送達に関連し、特に脂質粒子およびウイルス粒子を用いる新規の送達粒子および新規のウイルスキャプシドタンパク質を含み、これら両者は、例えばクラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)、CRISPRタンパク質(例えば、Cas、C2c1)、CRISPR-CasまたはCRISPRシステムあるいはCRISPR-Cas複合体、それらの構成成分、特に前述の全ておよびそれらの使用を含むベクターなどの核酸分子の大量の有効量の送達に適している。さらに、本発明は、CRISPR-Casシステムに基づく治療法または治療技術を開発あるいは設計する方法に関する。
ゲノム配列決定技術およびゲノム分析手法における最近の進歩は、多様な範囲の生物学的機能および疾患に関連する遺伝的要因を分類および解読する能力を著しく加速させてきた。個々の遺伝因子を選択的に摂動させて、因果関係のある遺伝的変異の体系的な逆行分析を可能にし、かつ合成生物学、生物工学、および医療への利用を進めるためには、高精度のゲノム標的化技術が必要とされる。遺伝子改変ジンクフィンガー、転写活性化因子様エフェクター(TALE)、ホーミングメガヌクレアーゼなどのゲノム編集技術を標的化ゲノムの摂動を生成するのに利用できるが、新規の手法および分子機構を用いてかつ真核生物のゲノム内の複数の位置を標的化するのに、経済性があり、設定が容易であり、拡張性が有り、かつ適応性がある新規のゲノム操作技術が依然必要とされている。この技術により、ゲノム工学およびバイオテクノロジーでの新規用途への主要な資源を提供することになる。
細菌および古細菌の適応免疫でのCRISPR-Casシステムは、タンパク質組成物およびゲノム遺伝子座構築物に非常に高い多様性を示す。このCRISPR-Casシステムの遺伝子座は50個を超える遺伝子ファミリーを有するが、遺伝子座構築物の急速な進展および非常に高い多様性を示す厳密に普遍的な遺伝子はない。現在のところ、多面的な取組みにより、93個のCasタンパク質に対して約395個の特徴を持つ包括的なCas遺伝子が見出されている。これらの分類として、シグネチャー遺伝子特性と遺伝子座構築物のシグネチャーの組合せが含まれる。CRISPR-Casシステムの新規分類が提案されており、これらのシステムは、大別して2種の部類に区分される。第1の部類は、多数のサブユニットエフェクター複合体を含み、第2の部類は、Cas9タンパク質などの単一のサブユニットエフェクターモジュールを含む。第2の部類のCRISPR-Casシステムに会合する新規のエフェクタータンパク質は、強力なゲノム操作ツールとして発展させてもよく、仮想の新規エフェクタータンパク質の予測およびそれらの遺伝子操作かつ最適化が重要となる。新規のCas12b相同分子種およびその使用が望ましい。
本出願中の任意の文献の引用あるいは特定は、その文献が本発明の先行技術として利用できると認めるものではない。
一側面では、本開示は、i)表1または表2に記載のCas12bエフェクタータンパク質、およびii)標的配列にハイブリダイズ可能なガイド配列を含むガイドを含む、非天然起源または遺伝子操作されたシステムを提供する。実施形態によっては、システムは、トランス活性化クリスパーRNA(tracr RNA)をさらに含む。
実施形態によっては、Cas12bエフェクタータンパク質は、アリシクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis)、バチルス属種V3-13(Bacillus sp. V3-13)、バチルス・ヒサシイ(Bacillus hisashii)、レンティスファエラ綱の細菌(Lentisphaeria bacterium)、およびラセエラ・セディミニス(Laceyella sediminis)からなる群から選択される細菌に由来する。実施形態によっては、tracr RNAは、直接反復の5’末端でクリスパーRNA(crRNA)に融合される。実施形態によっては、このシステムは、2つ以上のcrRNAを含む。実施形態によっては、ガイド配列は、原核細胞中で1つ以上の標的配列にハイブリダイズする。実施形態によっては、ガイド配列は、真核細胞中で1つ以上の標的配列にハイブリダイズする。実施形態によっては、Cas12bエフェクタータンパク質は、1つ以上の核局在化シグナル(NLS)を含む。実施形態によっては、Cas12bエフェクタータンパク質は、触媒的に不活性である。実施形態によっては、Cas12bエフェクタータンパク質は、1つ以上の機能ドメインに会合している。実施形態によっては、1つ以上の機能ドメインは、1つ以上の標的配列を切断する。実施形態によっては、機能ドメインは、1つ以上の標的配列の転写または翻訳を修飾する。実施形態によっては、Cas12bエフェクタータンパク質は、1つ以上の機能ドメインに会合し、かつCas12bエフェクタータンパク質は、リゾルバーゼ(RuvC)および/またはヌクレアーゼ(Nuc)ドメイン内に1つ以上の変異を含み、それによって、形成されたCRISPR複合体は、標的配列にまたは標的配列の近傍に、連続的発現の修飾因子、あるいは転写または翻訳の活性化シグナルもしくは抑制シグナルを送達可能である。実施形態によっては、Cas12bエフェクタータンパク質は、アデノシン脱アミノ酵素またはシチジン脱アミノ酵素と会合している。実施形態によっては、このシステムはさらに、組換え鋳型を含む。実施形態によっては、組換え鋳型は、相同指向性修復(HDR)によって挿入される。
別の側面では、本開示は、表1または表2に記載のCas12bエフェクタータンパク質をコードするヌクレオチド配列に操作可能に結合された第1の調節エレメント、およびi)a)ガイド配列をコードするヌクレオチド配列に操作可能に結合された第2の調節エレメントとb)tracr RNAをコードするヌクレオチド配列に操作可能に結合された第3の調節エレメント、あるいはii)ガイド配列およびtracr RNAをコードするヌクレオチド配列に操作可能に結合された第2の調節エレメントを含む1つ以上のベクターを含むCas12bベクターシステムを提供する。
実施形態によっては、Cas12bエフェクタータンパク質をコードするヌクレオチド配列は、真核細胞中での発現のためにコドン最適化されている。実施形態によっては、このシステムは単一のベクター中に含まれている。実施形態によっては、1つ以上のベクターは、ウイルスベクターを含む。実施形態によっては、1つ以上のベクターは、1つ以上のレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、または単純ヘルペスウイルスの各ベクターを含む。
別の側面では、本開示は、Cas12bエフェクタータンパク質、かつi)表1または表2に記載のCas12bエフェクタータンパク質、ii)1つ以上の標的配列にハイブリダイズが可能な3’ガイド配列、およびiii)tracrRNAを含む非天然起源または遺伝子操作された組成物の1つ以上の核酸成分を送達するように構成された送達システムを提供する。
実施形態によっては、この送達システムは、1つ以上のベクターまたは1つ以上のポリヌクレオチド分子を含み、この1つ以上のベクターまたはポリヌクレオチド分子は、Cas12bエフェクタータンパク質をコードする1つ以上のポリヌクレオチド分子、および非天然起源または遺伝子操作された組成物の1つ以上の核酸成分を含む。実施形態によっては、送達システムは、リポソーム、粒子、エキソソーム、微小胞、遺伝子銃、またはウイルスベクターを含む送達媒介物を含む。
別の側面では、本開示は、治療法に使用するための、本明細書の非天然起源または遺伝子操作されたシステム、本明細書のベクターシステム、あるいは本明細書の送達システムを提供する。
別の側面では、本開示は、関心のある1つ以上の標的配列を改変する方法を提供し、この方法は、1つ以上の標的配列を、i)表1または表2に記載のCas12bエフェクタータンパク質、ii)標的DNA配列にハイブリダイズが可能な3’ガイド配列、およびiii)tracr RNAを含む1つ以上の非天然起源または遺伝子操作された組成物と接触させて、それにより、crRNAとtracr RNAを複合化させたCas12bエフェクタータンパク質を含むCRISPR複合体を形成することを含み、このガイド配列は細胞内の1つ以上の標的配列に配列特異的結合を導いて、それにより1つ以上の標的配列の発現を改変する。実施形態によっては、標的遺伝子発現を改変することは、1つ以上の標的配列を切断することを含む。実施形態によっては、標的遺伝子発現を改変することは、1つ以上の標的配列の発現を増強あるいは減弱させることを含む。実施形態によっては、この組成物さらに、組換え鋳型を含み、1つ以上の標的配列を改変することは、組換え鋳型またはその一部の挿入を含む。実施形態によっては、1つ以上の標的配列は、原核生物細胞内にある。実施形態によっては、1つ以上の標的配列は、真核細胞内にある。
別の側面では、本開示は、1つ以上の改変された標的配列を含む細胞またはその後代を提供し、この1つ以上の標的配列は本明細書の方法により改変されていて、この細胞は、必要に応じて治療用T細胞あるいは抗体産生B細胞であり、あるいは植物細胞でもよい。実施形態によっては、細胞は原核細胞である。実施形態によっては、細胞は真核細胞である。実施形態によっては、1つ以上の標的配列の改変は、少なくとも1つの遺伝子産物に発現の変化を含む細胞、少なくとも1つの遺伝子産物の発現を増強させる少なくとも1つの遺伝子産物の発現の変化を含む細胞、少なくとも1つの遺伝子産物の発現を減弱させる少なくとも1つの遺伝子産物の発現の変化を含む細胞、および内因性または非内因性の生物由来の産物または化合物を産生かつ/あるいは分泌する細胞または集団をもたらす。実施形態によっては、この細胞は、哺乳動物細胞またはヒト細胞である。別の側面では、本開示は、本明細書の細胞の細胞株またはその細胞を含む細胞株、あるいはその後代の細胞株を提供する。
別の側面では、本開示は、本明細書の1つ以上の細胞を含む多細胞生物を提供する。
別の側面では、本開示は、本明細書の1つ以上の細胞を含む植物モデルまたは動物モデルを提供する。
別の側面では、本開示は、本明細書の細胞、細胞株、生物、あるいは植物モデルまたは動物モデルからの遺伝子産物を提供する。実施形態によっては、発現された遺伝子産物の量は、発現を変化させない細胞からの遺伝子産物の量よりも多いかあるいは少ない。
別の実施形態では、本開示は、表1または表2に記載の単離されたCas12bエフェクタータンパク質を提供する。
別の側面では、本開示は、Cas12bエフェクタータンパク質をコードする単離された核酸を提供する。実施形態によっては、単離された核酸はDNAであり、さらにcrRNAおよびtracr RNAをコードする配列を含む。
別の側面では、本開示は、本明細書の核酸またはCas12bタンパク質を含む単離された真核細胞を提供する。
別の側面では、本開示は、i)表1または表2に記載のCas12bエフェクタータンパク質をコードするメッセンジャーRNA(mRNA)、ii)ガイド配列、およびiii)tracr RNAを含む、非天然起源または遺伝子操作されたシステムを提供する。実施形態によっては、tracr RNAは、直接反復の5’末端でcrRNAに融合される。
別の側面では、本開示は、標的化ドメインおよびアデノシン脱アミノ酵素、シチジン脱アミノ酵素、またはそれらの触媒ドメインを含む部位特異的塩基編集のための遺伝子操作されたシステムを提供し、この標的化ドメインは、オリゴヌクレオチド結合活性を維持するCas12bエフェクタータンパク質またはその断片、およびガイド分子を含む。実施形態によっては、Cas12bエフェクタータンパク質は、触媒的に不活性である。実施形態によっては、Cas12bエフェクタータンパク質は、表1または表2から選択される。実施形態によっては、Cas12bエフェクタータンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セディミニスからなる群から選択される。
別の側面では、本開示は、本明細書の組成物を関心のある1つ以上の標的オリゴヌクレオチドに送達することを含む、1つ以上の標的オリゴヌクレオチド中のアデノシンまたはシチジンを改変する方法を提供する。実施形態によっては、本開示は、病原性のT→CまたはA→Gの点変異を含む転写物に起因する疾患の治療または予防に使用するために提供する。別の側面では、本開示は、本明細書の方法から得られ、かつ/あるいは本明細書の組成物を含む単離された細胞を提供する。実施形態によっては、前記真核細胞は、好ましくはヒトまたはヒト以外の動物細胞であり、必要に応じて治療T細胞または抗体産生B細胞であり、あるいはその細胞は植物細胞である。
別の側面では、本開示は、前記改変された細胞またはその後代を含むヒト以外の動物を提供する。
別の側面では、本開示は、本明細書の改変された細胞を含む植物を提供する。
別の側面では、本開示は、治療、好ましくは細胞治療に使用するための改変された細胞を提供する。
別の側面では、本開示は、標的オリゴヌクレオチドに、触媒的に不活性なCas12bタンパク質、直接反復に結合されたガイド配列を含むガイド分子、およびアデノシンまたはシチジン脱アミノ酵素タンパク質またはその触媒ドメインを送達することを含む、前記標的オリゴヌクレオチド中のアデニンまたはシトシンを改変する方法を提供し、前記アデノシンまたはシチジン脱アミノ酵素タンパク質またはその触媒ドメインは、前記触媒的に不活性なCas12bタンパク質または前記ガイド分子に共有結合または非共有結合しているか、あるいは送達後にそれに結合するように構成されていて、前記ガイド分子は、前記触媒的に不活性なCas12bとの複合体を形成し、かつ前記複合体を前記標的オリゴヌクレオチドに結合するように導き、前記ガイド配列は、前記標的オリゴヌクレオチド内の標的配列とハイブリダイズしてオリゴヌクレオチド二重鎖を形成できる。
実施形態によっては、(A)前記シトシンは、前記オリゴヌクレオチド二重鎖を形成する前記標的配列の外側にあり、前記シチジン脱アミノ酵素タンパク質またはその触媒ドメインは、前記RNA二重鎖の外側にある前記シトシンを脱アミノ化し、あるいは(B)前記シトシンは、前記RNA二重鎖を形成する前記標的配列内にあり、前記ガイド配列は、前記シトシンに対応する位置に非対合アデニンまたはウラシルを含み、前記オリゴヌクレオチド二重鎖中にC-AまたはC-Uの不適正をもたらし、かつシチジン脱アミノ酵素タンパク質またはその触媒ドメインは、非対合アデニンまたはウラシルの反対側のオリゴヌクレオチド二重鎖中のシトシンを脱アミノ化する。実施形態によっては、前記アデノシン脱アミノ酵素タンパク質またはその触媒ドメインは、オリゴヌクレオチド二本鎖中の前記アデニンまたはシトシンを脱アミノ化する。実施形態によっては、Cas12bエフェクタータンパク質は、表1または表2から選択される。実施形態によっては、Cas12bタンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セディミニスからなる群から選択される細菌に由来する。
別の側面では、本開示は、Cas12bタンパク質、標的配列と所定の程度の相補性を有するように設計され、かつCas12bと複合体を形成するように設計されたガイド配列を含む少なくとも1つのガイドポリヌクレオチド、および非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物を含む1つ以上のin vitro試料中の核酸標的配列の存在を検出するためのシステムを提供し、このCas12bは、側副核酸分解酵素活性を示し、かつ標的配列によって活性化されるとオリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する。
別の側面では、本開示は、Cas12bタンパク質、それぞれが1種以上の標的ポリペプチドのうちの1種に結合するように設計され、かつそれぞれがマスクされたプロンプター結合部位またはマスクされたプライマー結合部位およびトリガー配列鋳型を含む1つ以上の検出アプタマー、および非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物を含む1つ以上のin vitro試料中の1つ以上の標的ポリペプチドの存在を検出するためのシステムを提供する。
実施形態によっては、システムはさらに、標的配列またはトリガー配列を増幅するための核酸増幅試薬を含む。実施形態によっては、この核酸増幅試薬は、恒温増幅試薬である。実施形態によっては、Cas12bタンパク質は、表1または表2から選択される。実施形態によっては、Cas12bエフェクタータンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セディミニスからなる群から選択される細菌に由来する。
別の側面では、本開示は1つ以上のin vitro試料中の核酸配列を検出する方法を提供し、この方法は、1つ以上の試料をi)Cas12bタンパク質、ii)標的配列に対し所定の程度の相補性を有するように設計され、かつCas12bタンパク質と複合体を形成するように設計されたガイド配列を含む少なくとも1つのガイドポリヌクレオチド、およびiii)非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物と接触させることを含み、前記Cas12タンパク質は、側副核酸分解酵素活性を示し、かつオリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する。
実施形態によっては、Cas12bタンパク質は、表1または表2から選択される。実施形態によっては、Cas12bタンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セディミニスからなる群から選択される細菌に由来する。別の側面では、本開示は、酵素またはレポーター成分の不活性な第1の部分に結合されたCas12bタンパク質を含む非天然起源または遺伝子操作された組成物を提供し、この酵素またはレポーター成分は、酵素またはレポーター成分の相補部分と接触すると再構成される。実施形態によっては、酵素またはレポーター成分は、タンパク質分解酵素を含む。実施形態によっては、Cas12bタンパク質は、酵素またはレポーター成分の相補部分に結合された第1のCas12bタンパク質および第2のCas12bタンパク質を含む。実施形態によっては、組成物は、i)第1のCas12bタンパク質と複合体を形成し、標的核酸の第1の標的配列にハイブリダイズできる第1のガイド、およびii)第2のCas12bタンパク質と複合体を形成し、標的核酸の第2の標的配列にハイブリダイズできる第2のガイドをさらに含む。実施形態によっては、タンパク質分解酵素は、カスパーゼを含む。実施形態によっては、タンパク質分解酵素は、タバコエッチウイルス(TEV)を含む。
別の側面では、本開示は、標的オリゴヌクレオチドを含む細胞中にタンパク質分解活性を提供する方法を提供し、この方法は、a)細胞または細胞集団を、i)タンパク質分解酵素の不活性部分に結合した第1のCas12bエフェクタータンパク質、ii)タンパク質分解酵素の相補部分に結合し、タンパク質分解酵素の第1の部分と相補部分が接触するとタンパク質分解酵素のタンパク質分解活性が再構成される第2のCas12bエフェクタータンパク質、iii)第1のCas12bエフェクタータンパク質に結合し、標的オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、およびiv)第2のCas12bエフェクタータンパク質に結合し、標的オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイドと接触させることを含み、これにより、タンパク質分解酵素の第1の部分と相補部分が接触して、タンパク質分解酵素のタンパク質分解活性が再構成される。
実施形態によっては、タンパク質分解酵素は、カスパーゼである。実施形態によっては、タンパク質分解酵素はTEVプロテアーゼであり、TEVプロテアーゼのタンパク質分解活性が再構成され、それによりTEV基質が切断されかつ活性化される。実施形態によっては、TEV基質はTEV標的配列を含むように遺伝子操作されたプロカスパーゼであり、それによりTEVプロテアーゼによる切断がプロカスパーゼを活性化する。
別の側面では、本開示は、関心のあるオリゴヌクレオチドを含む細胞を識別する方法を提供し、この方法は、細胞内のオリゴヌクレオチドを、i)タンパク質分解酵素の不活性な第1の部分に結合した第1のCas12bエフェクタータンパク質、ii)タンパク質分解酵素の相補部分に結合し、タンパク質分解酵素の第1の部分と相補部分が接触するとタンパク質分解酵素の活性が再構成される、第2のCas12bエフェクタータンパク質、iii)第1のCas12bエフェクタータンパク質に結合し、オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、iv)第2のCas12bエフェクタータンパク質に結合し、オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド、およびv)検出可能に切断されるレポーターを含む組成物と接触させることを含み、関心のあるオリゴヌクレオチドが細胞内に存在するとタンパク質分解酵素の第1の部分と相補部分が接触して、それによりタンパク質分解酵素の活性が再構成され、かつレポーターを検出可能に切断する。
別の側面では、本開示は、関心のあるオリゴヌクレオチドを含む細胞を識別する方法を提供し、この方法は、細胞内のオリゴヌクレオチドを、i)レポーターの不活性な第1の部分に結合した第1のCas12bエフェクタータンパク質、ii)レポーターの相補部分に結合し、レポーターの第1の部分と相補部分が接触するとレポーターの活性が再構成される、第2のCas12bエフェクタータンパク質、iii)第1のCas12bエフェクタータンパク質に結合し、オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、iv)第2のCas12bエフェクタータンパク質に結合し、オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド、およびv)レポーターを含む組成物と接触させることを含み、関心のあるオリゴヌクレオチドが細胞内に存在するとレポーターの第1の部分と相補部分は接触して、それによりレポーターの活性が再構成される。実施形態によっては、レポーターは蛍光タンパク質または発光タンパク質である。
実施形態例のこれらおよびその他の側面、目的、特徴、および利点は、例示された実施形態例の以下の詳細な説明を考慮することで当業者には明白になる。
本発明の特徴および利点について、本発明の原理を利用できる例示的な実施形態を説明する以下の詳細な説明、およびそれらの添付図面を参照することで理解が進む。
図1は、フィシスファエラ細菌(Phycisphaerae bacterium)のCRISPR-C2c1遺伝子座を示している。小領域のRNAseqは、tracrRNAの位置および成熟crRNAの構造を明示している。
図2A~2Cは、予測されたtracrRNA(図2A)(配列番号1~11)およびTracer番号1(図2B)およびTracer番号5(図2C)(配列番号12、656、および13)の直接反復(赤色)を伴うトレーサー(緑色)の二重鎖の倍数予測を示す。
図3Aは、最も緩く予測されたPAMに対して提供されるSeqlogoでのPAM検査の結果を示し、図3Bは、最も厳格に予測されたPAMを示している。
図4は、TTH(HはA、TまたはC)としてPhbC2c1 PAMのin vivo確認を示している。細胞は、認識可能なプロトスペーサーの5’に位置する種々のPAM配列をコードするプラスミドDNAで形質転換された。
図5は、Cpf1ニッカーゼを使用する配列特異的ニッカーゼ増幅を示す。
図6は、アプタマーの色生成を示す。
図7は、プランクトミケス(Planctomycetes)のCRISPR-C2c1遺伝子座を示している。小領域のRNAseqは、tracrRNAの位置および成熟crRNAの構造を明示している。
図8Aは、最も緩く予測されたPAMに対して提供されるSeqlogoでのPAM検査の結果を示し、図8Bは、最も厳格に予測されたPAM (B)を示している。この検査では、プランクトミケスのPAMがTTR(RはGまたはA)であることを示している。
図9は、TTR(RはGまたはA)としてプランクトミケスのC2c1 PAMのin vivo確認を示している。細胞は、認識可能なプロトスペーサーの5’に位置する種々のPAM配列をコードするプラスミドDNAで形質転換された。
図10は、crRNA-tracrRNA複合体を用いてC2c1を単離するためのプラスミド例を示している。プラスミドには、PhyciC2c1および/またはtracrRNAおよび/またはCRISPR配列が含まれている。処理済みのcrRNAおよびtracrRNAをC2c1との複合体として、C2c1タンパク質(C2c1-RNA複合体)とともに共精製することができる。
図11Aは、タンパク質プルダウンアッセイでのPhyciC2c1およびPlancC2c1の帯域を示している。RNA分解酵素およびDNA分解酵素の消化実験を実施し、この実験では、図11BのようにRNAはPhysiC2c1タンパク質中に存在することが示された(PhyC2c1タンパク質は、RNA分解酵素の消化に感受性があったが、DNA分解酵素には感受性が無かった)。PhysiC2c1タンパク質中のRNAの存在を、図11Cのようにさらに確認した。共精製されたRNAのサイズはcrRNAに一致するものの、118ヌクレオチド長の予測されたtracrRNAよりも大きいと見受けられた。
図12は、in vitro切断実験の条件および結果を示し、これら結果は、PhysiC2c1-RNA複合体が、CRISPR配列の第1のガイドに一致するプロトスペーサー配列を含むDNAを切断できることを実証していた。
図13は、種々のsgRNAを示している。大腸菌内で発現したBhCas12b遺伝子座からの小領域RNA-seqは、tracrRNAおよびcrRNAを明示していた。sgRNA変異体(配列番号14~29)を形成するためのtracrRNAおよびcrRNAの融合の図を示す。
図14は、種々の標的部位について、プラスミド形質移入後に図13の種々のsgRNAにより得られた挿入欠失(indel)の百分率を示している。用いられたCas12bはバチルス・ヒサシイ株C4由来であった。HEK293細胞中でのBhCas12bおよびsgRNA変異体の発現は、複数のゲノム部位に挿入欠失変異を生成する。
図15A~15Cは、それぞれLs、Ak、およびBvからのCas12b相同分子種を使用した、精製されたタンパク質およびRNAによるPAM検出およびin vitro切断を示す(図15A:配列番号30および657、図15B:配列番号31および658、図15C:配列番号32および659)。図15D~15Eは、それぞれPhyciおよびPlancからのCas12b相同分子種を使用した精製タンパク質およびRNAによるin vitro切断を示している。
図16は、精製されたAmCas12b(AmC2C1)タンパク質、および小領域RNAseqとは異なる予測されたtracrRNAを用いたin vitro切断アッセイを示している。
図17A~17Eは、AmC2C1に対するsgRNAの設計を示している(図17A:配列番号33および660、図17B:配列番号34および661、図17C:配列番号35、図17D:配列番号36、図17E:配列番号37)。
図18は、sgRNAの効率の比較のためのAmC2C1によるin vitro切断を示す。
図19は、AmC2C1 RuvC変異体の活性を示す。
図20は、in vitroのPAM検査によるCas12b相同分子種のPAMの決定を示す。
図21Aは、小領域RNAseqのtracr予測を示す。図21Bは、in vivo検査からのBhC2C1(バチルス・ヒサシイのCas12b)PAMを示す。図21Cは、BhC2C1タンパク質精製を示す。図21Dは、それぞれ37°Cおよび48°CでのBhC2C1タンパク質および予測されたtracr RNAによるin vitro切断を示す。
図22A~22Dは、BhC2C1に対するsgRNAの設計を示す(図22A:配列番号38および662、図22B:配列番号39、図22C:配列番号40、図22D:配列番号41)。
図23は、BhC2C1を含む例示的な構築物のプラスミドマップを示す。
図24は、表12の種々の標的部位に対して、プラスミド形質移入後に表12の種々のsgRNAで得られた挿入欠失百分率を示す。用いたCas12bは、BvCas12bであった(配列番号42~47)。
図25は、BvCas12bを含む例示的な構築物のプラスミドマップを示す。
図26は、BhCas12bを含む例示的な構築物のプラスミドマップを示す。
図27は、EbCas12bを含む例示的な構築物のプラスミドマップを示す。
図28は、AkCas12bを含む例示的な構築物のプラスミドマップを示す。
図29は、PhyciCas12bを含む例示的な構築物のプラスミドマップを示す。
図30は、PlancCas12bを含む例示的な構築物のプラスミドマップを示す。
図31は、BvCas12bを含む例示的な構築物pZ143-pcDNA3-BvCas12bのプラスミドマップを示す。
図32は、BvCas12b sgRNA足場を含む例示的な構築物pZ147-BvCas12b-sgRNA-足場のプラスミドマップを示す。
図33は、BhCas12b sgRNA足場を含む例示的な構築物pZ148-BhCas12b-sgRNA-足場のプラスミドマップを示す。
図34は、S893、K846、およびE836に変異を有するBhCas12bを含む例示的な構築物pZ149-BhCas12b-S893R-K846R-E836Gのプラスミドマップを示す。
図35は、S893、K846、およびE836に変異を有するBhCas12bを含む例示的な構築物pZ150-pCDNA3-BhCas12b-S893R-K846R-E836Kのプラスミドマップを示す。
図36は、様々な条件でのBhCas12bでのPAM検出結果を示す。
図37は、様々な条件でのBvCas12bのPAM検出結果を示す。
図38は、種々の結合部位でのBhCas12b変異体の挿入欠失百分率を示す。
図39は、種々の結合部位での別のBhCas12b変異体の挿入欠失百分率を示す。
図40Aは、DNMT1-1(配列番号48~51)でのBhCas12b(実施例20の変異体4)およびBvCas12bによる切断を伴うHDRを示す。図40Bは、VEGFA-2(配列番号52~55)でのBhCas12b(実施例20の変異体4)およびBvCas12bによる切断を伴うHDRを示す。
図41Aは、TTTV PAMでのAsCas12aおよびBhCas12b変異体4およびBvCas12b ATTN PAMの挿入欠失百分率の比較を示す。図41Bは、種々のPAM配列でのBhCas12b変異体4およびBvCas12b活性の内訳を示している。
図42Aは、ssDNA供与体(配列番号56~59)で導入される所望の変化を含むVEGFA標的の概略図を示す。図42Bは、VEGFA標的部位での各ヌクレアーゼの挿入欠失活性を示す。図42Cは、VEGFA部位で所望の編集(2ヌクレオチド置換)を含む細胞の百分率を示す。図42Dは、ssDNA供与体(配列番号60~63)で導入される所望の変化を含むDNMT1標的の概略図を示す。図42Eは、DNMT1標的部位での各ヌクレアーゼの挿入欠失活性を示す。図42Fは、DNMT1部位で所望の編集(2ヌクレオチド置換)を含む細胞の百分率を示す。
図43の左の図は、CXCR4の標的化エクソンおよびBhCas12b(v4)およびBvCas12bのそれぞれ(配列番号64~77)により標的化されたCXCR4配列を示す。右の図は、2個の供与体からのT細胞でのCXCR4に対するBhCas12b(v4)およびBvCas12bの効果を示す挿入欠失百分率を示す。
図44A~44Eは、中温性Cas12bヌクレアーゼの識別を示す。図44Aは、Cas9、Cas12a、およびCas12bヌクレアーゼの差異を強調する遺伝子座の概略図およびタンパク質ドメイン構造、またSpCas9(PDB:4oo8)、AsCas12a(PDB:5b43)、およびAacCas12b(PDB:5u30)の結晶構造を示す。図44Bは、精製Cas12bタンパク質およびRNA-Seqにより識別された合成crRNAおよびtracrRNAによるCas12bシステムのin vitro再構成を示し、この反応は、指示温度で90分間および250 nMのCas12bタンパク質で実施した。図44Cおよび図44Dは、6個のsgRNA変異体を有する293T細胞でのAkCas12bおよびBhCas12bの挿入欠失活性を示す。誤差棒は4個の複製物からの標準偏差を表す。sgRNA配列については、図50Bおよび図50Cを参照のこと。図44Eは、BhCas12b sgRNA構造および試験した変異体(配列番号78)の位置の概略図を示す。
図45A~45Hは、BhCas12bの合理的な遺伝子操作を示す。図45Aは、種々に標識化されたDNA鎖とのin vitroのCas12b反応を示す。より遅い移動生成物は、未変性PAGE分離中に観察され、PAGEの変性による分離は、より低い温度で非標的鎖を切断するためのAkCas12bおよびBhCas12bに対する優先度を表している。図45Bは、標的鎖とRuvC活性部位(紫色)の間のポケット内の12個の試験された残基のうちの10個の位置を示す。BhCas12b残基は、非常に類似したBthCas12b(PDB:5wti)の構造中に強調表示されている。図45Cは、野生型(灰色記号)に対し正規化されたDNMT1標的4およびVEGFA標的2での268個のBhCas12b変異の挿入欠失活性を示す。誤差棒は2個の複製物からの標準偏差を表す。図45Dは、グリシンに変異した表面露出残基の位置を示す。図45Eは、野生型(灰色記号)に対し正規化されたDNMT1標的4およびVEGFA標的2での66個のBhCas12b変異の挿入欠失活性を示す。誤差棒は2個の複製物からの標準偏差を表す。図45Fは、BhCas12b過活性変異体の総括を示す。図45Gは、4個の標的部位でのBhCas12b変異体の挿入欠失活性を示す。誤差棒は3~6個の複製物からの標準偏差を表す。図45Hは、BhCas12b WTおよびv4変異体の濃度を増大させたin vitro切断を示す。ゲルは2回の実験からの代表画像である。
図46A~46Gは、BhCas12b v4およびBvCas12bがヒト細胞株でゲノム編集を媒介することを示す。図46Aは、28個のTTTV標的でのAsCpf1、33個のATTN標的でのBhCas12bv4、および37個のATTN標的でのBvCas12bの293T細胞での挿入欠失活性を示す。各点は、4個の複製物から平均された単一の標的部位を表す。図46Bは、30個の活性ガイドから平均されたCas12bゲノム編集からの平均挿入欠失長を示す。図46Cは、SpCas9およびCas12a/bヌクレアーゼならびにTGからCAへの変異およびPAM破壊変異(配列番号79~83)を含む120ヌクレオチド長のssODN供与体によって標的可能なDNMT1標的部位の概略図である。図46Dは、遺伝子座での各ヌクレアーゼの挿入欠失活性を示す。誤差棒は8個の複製物からの標準偏差を表す。図46Eは、標的鎖(T)または非標的鎖(NT)供与体を使用した相同性指向修復(HDR)の頻度を示す。灰色の棒はTGからCAへの変異の頻度を示し、赤色の棒は、変異を持たない図C中のHDR配列を含む完全な編集を示している。誤差棒は6個の複製物からの標準偏差を表す。図46Fは、30個の活性なBhCas12bガイド、45個の活性なAsCas12aガイド、および39個の活性なSpCas9ガイドを使用したゲノム編集中の平均挿入欠失長を示す。図46Gは、BhCas12b v4 RNPの送達後のCD4 +ヒトT細胞での挿入欠失活性を示す。各点は2個の個々のエレクトロポレーションを表す。原生データは、原生データファイルとして示される。
図47A~47Bは、BhCas12bv4およびBvCas12bが非常に特異的なヌクレアーゼであることを示す。図47Aは、Guide-Seq分析のために選択された9個の標的部位での293T細胞での挿入欠失活性を示す。誤差棒は4個の複製物からの標準偏差を表す。図47Bは、各ヌクレアーゼに対して検出された切断部位の数および相対比率を示すGuide-Seq分析の結果である。非特異的標的部位は薄灰色のくさび形として表示され、特異的標的部位は青色で強調表示され、特異的標的部の読取り値が小数でその下に示されている。非特異的標的は、SpCas9でのみ検出された。完全な分析結果については、図55を参照のこと。
図48A~48Eは、Cas12b相同分子種のPAM検出を示す。図48AはCas12b相同分子種の配列である。図48Bは、その配列に基づく亜型V-BエフェクターCas12bタンパク質の系統樹を示す。配列はGenbankタンパク質受託番号と種名で示されている。この検討で実験的に研究されたタンパク質は太字で示されている。37°Cで堅牢な編集活性を示し、詳細に研究された4個のタンパク質には下線が引かれている。図48Cは、大腸菌でのPAM検出アッセイの概略図を示す。図48Dは、枯渇したPAMが大腸菌中の14個のCas12bシステムのうち4個でのみ検出されたことを示している。枯渇の閾値として、log2比で3.32(点線表示)に設定され、但しEbCas12bでは閾値が2.32に設定された。枯渇したPAMは、配列情報を示す第1の5’塩基のホイールの中央から始まる配列モチーフならびにPAMホイール22として示される。図48Eは、亜型V-BエフェクターCas12bタンパク質の系統樹を示す。配列はGenbankタンパク質受託番号および種名で示されている。この検討で実験的に研究されたタンパク質は青色で強調表示されている。
図49A~49Fは、Cas12b RNA-Seqおよびin vitroの再構成を示す。図49A~49Dは、AkCas12b、BhCas12b、EbCas12b、およびLsCas12bの小領域RNA-Seq読取りの配列を示す。切断反応に使用されるtracrRNAの位置は、黄色で強調表示されている。図49Eは、この検討で使用された精製Cas12bタンパク質および商業的に生産されたAsCas12a(IDT)のクマシー染色されたSDS-PAGEゲルを示す。図49Fは、tracrRNAおよびcrRNAをv1 sgRNA足場との比較によるAkCas12bおよびBhCas12bを用いるin vitro切断反応を示す。
図50A~50Eは、哺乳動物細胞でのCas12b sgRNAの最適化を示す。図50Aは、哺乳動物細胞での発現構築物および挿入欠失活性のアッセイの概略図を示す。図50Bは、AkCas12b sgRNA変異体(配列番号84~89)を示す。図50Cは、BhCas12b sgRNA変異体(配列番号90~95)を示す。図50Dは、AkCas12b sgRNA構造および試験された変異体の位置(配列番号96)の概略図を示す。図50Eは、BhCas12bおよび様々なスペーサー長を有する293T細胞での挿入欠失活性を示す。誤差棒は2個の複製物からの標準偏差を表す。
図51A~51Jは、BhCas12bの論理的な遺伝子操作を示す。図51Aは、293T細胞中のBhCas12bと非常に類似したBthCas12bとの間の挿入欠失活性の比較を示す。誤差棒は2個の複製物からの標準偏差を表す。図51B~図51Eは、DNMT1標的4およびVEGFA標的2でのBhCas12b変異体の組合せの挿入欠失活性を示す。誤差棒は最少の2個の複製物からの標準偏差を表す。図51Fは、Pymol(Schrodinger社製)を用いてBthCas12bの構造中にモデル化されたBhCas12b v4変異を示す。図51Gは、精製したBhCas12b WTおよびv4タンパク質のクマシー染色されたSDS-PAGEゲルを示す。図51Hは、BhCas12bWTおよびv4変異体によるin vitro切断の経時的変化を示す。ゲルは3回の実験からの代表画像である。図51Iおよび図51Jは、図Hに示される反応からのdsDNA切断産物(図51I)および上部ニック産物(図51J)の定量結果を示す。誤差棒は3個の複製物からの標準偏差を表す。
図52A~52Jは、BvCas12bの特性評価を示す。図52Aは、図48Cおよび48Dに説明されるPAM検出を示す。図52Bは、BvCas12bの小領域RNA-Seqの読取りの配列を示す。切断反応で使用されるtracrRNAの位置は、黄色で強調表示されている。図52C~52Dは、精製タンパク質および合成RNAによるBvCas12のin vitro再構成反応が、指示温度で90分間かつ250 nMのBvCas12bタンパク質で実施されたことを示している。図52Eは、精製BvCas12bのクマシー染色されたSDS-PAGEのゲルを示す。図52Fは、BvCas12b sgRNA変異体(配列番号97~102)を示す。図52Gは、試験された変異体(配列番号103)のBvCas12b sgRNA構造および位置の概略図を示す。図52Hは、sgRNA変異体による293T細胞でのBvCas12bの挿入欠失活性を示す。誤差棒は4個の複製物からの標準偏差を表す。図52Iは、57個の標的での293T細胞中のBvCas12bの挿入欠失活性を示す。各点は、4個の複製物から平均された単一の標的部位を表す。図52Jは、一致した標的部位でのBhCas12b v4とBvCas12bの活性の相関を示す。原生データは、原生データファイルとして示す。
図53A~53Eは、BvCas12bの変異誘発を示す。図53Aは、強調表示位置に識別された標的鎖のBhCas12b位置およびBvCas12b中のそれらに対応するアミノ酸の配列を示す。図53Bは、図45Aに説明されるような種々に標識されたDNA鎖とのBvCas12bのin vitro反応を示す。図53Cは、残基Q635、D748、R849、H896、T909、I914およびI919を標的とする79個のBvCas12b変異の挿入欠失活性を示す。挿入欠失は、野生型(灰色記号)に対し正規化されたDNMT1標的6およびVEGFA標的5で測定された。誤差棒は2個の複製物からの標準偏差を表す。図53D~53Eは、DNMT1標的6およびVEGFA標的5でのBhCas12b変異の挿入欠失活性を示す。誤差棒は2個の複製物からの標準偏差を表す。
図54A~54Fは、BhCas12b v4およびBvCas12bがヒト細胞株中でのゲノム編集を媒介したことを示している。図54Aは、293T細胞中の56個の標的でのBhCas12b v4および57個の標的でのBvCas12bの挿入欠失活性を示す。各点は4個の複製物から平均された単一の標的部位を表す。図54Bは、一致する標的部位でのBhCas12b v4とBvCas12bの活性の相関を示す。図54Cは、第2部類のCRISPR-CasヌクレアーゼのPAM優先度の分析、またマスクされていないヒトコード配列内の各塩基から最近接のCas9またはCas12切断部位までの距離に対する質量での確率関数を示す。図54Dは、SpCas9およびCas12bヌクレアーゼ、ならびにTCからCAへの変異およびPAM破壊変異を含む120ヌクレオチド長のssODN供与体によって標的可能なVEGFA標的部位の概略図を示す(配列番号104~108)。図54Eは、遺伝子座での各ヌクレアーゼの挿入欠失活性を示す。誤差棒は3個の複製物からの標準偏差を表す。図54Fは、標的鎖(T)または非標的鎖(NT)供与体を使用した相同性指向修復(HDR)の頻度を示す。灰色の棒は、TCからCAへの変異の頻度を示し、青色の棒は、変異のない図DでのHDR配列を含む完全な編集を示している。誤差棒は3個の複製物からの標準偏差を表す。
図55A~55Cは、BhCas12b v4とBvCas12bの不一致の許容性および特異性を示す。図56Aは、各ヌクレアーゼに対し検出された切断部位の数および相対比率を示す不一致の標的のGuide-Seq分析を示す。非特異的標的は、薄灰色のくさび形として表示され、特異的標的部位は青色で強調表示され、特異的標的部の読取り値が小数でその下に示されている。完全な分析については図57を参照のこと。図55B~55Cは、不一致がガイドsgRNAと標的DNAの間に存在する場合の293T細胞中でのCas12bの挿入欠失活性を示す。不一致は、標的鎖に一致するように(すなわちCからG、AからT)sgRNA内に挿入された。BhCas12b v4はDNMT1標的6およびVEGFA標的2で試験され、BvCas12bはDNMT1標的6およびVEGFA標的5で試験された。誤差棒は4個の複製物からの標準偏差を表す。
図56は、一致したCRISPR-Casヌクレアーゼ標的の特異性分析を示す。図47Bで検出された非特異的標的の完全なGuide-Seq分析結果を示す。検出された切断部位の一覧(一標的あたり最大20個)を、各ヌクレアーゼについて、小さな箱形に記載された特異的標的部位とともに示している。以下の標的でのガイド配列との不一致が強調表示されていて、それら標的は、標的1:EMX1(配列番号109~130)、標的2:EMX1(配列番号131~152)、標的3:DNMT1(配列番号153~174)、標的4:CXCR4(配列番号175~176)、標的5:CXCR4(配列番号178~181)、標的6:CXCR4(配列番号182~186)、標的7:VEGFA(配列番号187~209)、標的8:GRIN2B(配列番号210~215)、標的9:CXCR4(配列番号216~221)、および標的10:HPRT1(配列番号222~225)である。
図57は、不一致のCRISPR-Casヌクレアーゼ標的の特異性分析を示す。図56の検出された非特異的標的の完全なGuide-Seq分析結果を示す。検出された切断部位(一標的あたり最大20個)の一覧を、各ヌクレアーゼについて、小さな箱形に記載された特異的標的部位とともに示している。以下の標的でのガイド配列との不一致が強調表示されていて、それら標的は、SpCas9不一致1:DNMT1(配列番号226)、SpCas9不一致2:EMX1(配列番号227~246)、SpCas9不一致3:VEGFA(配列番号247~248)、SpCas9不一致4:VEGFA(配列番号249~268)、SpCas9不一致5:VEGFA(配列番号269~288); SpCas9不一致6:GRIN2B(配列番号289~290)、AsCas12a不一致1:DNMT1(配列番号291)、AsCas12a不一致2:VEGFA(配列番号292~293)、AsCas12a不一致2:EMX1(配列番号294); AsCas12a不一致2:EMX1(配列番号295)、SpCas9不一致7:VEGFA(配列番号296~311)、SpCas9不一致8:EMX1(配列番号312~320)、SpCas9不一致9:GRIN2B(配列番号321~322)、SpCas9不一致10:TUBB(配列番号323~334)、BhCas12b v4不一致1:DNMT1-BvCas12b不一致8:DNMT1(配列番号335~353)、およびBhCas12b v4不一致9:CXCR4-BvCas12b不一致14:VEGFA(配列番号354~367)である。
図58は、(PDB構造5U30に基づく)Cas12中の構造的に予測されたssDNA経路を示す。
図59は、RESCUE変異体の用量応答がTモチーフで試験されたことを示す。
図60は、RESCUE変異体の用量応答がCおよびGモチーフで試験されたことを示す。
図61および62は、RESCUE v3、v6、v7、およびv8による内因性標的化を示す。
図63は、RESCUE v9に対する変異の選別が実行されたことを示す。
図64は、RESCUE v9に対する潜在的な変異が特定されたことを示す。
図65は、塩基フリップおよびモチーフ試験が実行されたことを示す。
図66は、RESCUE v9の効果が様々なモチーフフリップで試験されたことを示す。
図67は、50塩基対ガイドを備えるRESCUE v1~v8を用いて、B6とB12間の比較を示す。
図68は、30塩基対ガイドを備えるRESCUE v1~v8を用いて、B6とB12間の比較を示す。
図69は、選別されたRESCUE変異の総括を示す。
図70は、より良好なβカテニン変異体が選択された実験の結果を示すグラフである。
図71は、RESCUE round 12の結果を示すグラフである。
図72は、βカテニン遊走アッセイを示す概略図である。
図73は、βカテニンによって誘発された細胞遊走アッセイの結果を示すグラフである。
図74は、特異性変異がA~I非特異的標的を排除することを示すグラフである。
図75は、Stat1/3リン酸化部位を標的化することがシグナル伝達を低減させることを示すグラフである。
図76は、Stat1/3リン酸化部位を標的化することがシグナル伝達を減少させることを示すグラフであり、図64AはStat1による処理無しの結果を示し、図64BはStat1 IFNγ処理の結果を示す。
図77は、Stat1/3リン酸化部位を標的化することがシグナル伝達を減少させることを示すグラフであり、図65AはStat3 IL6による活性化の結果を示し、図65BはStat3による処理無しの結果を示す。
図78は、RESCUE round 12の結果を示すグラフである。
図79は、RESCUE round 13の結果を示すグラフである。
図80は、βカテニンによって誘発された細胞遊走アッセイの結果を示すグラフである。
図81は、CからTへの塩基編集能力を備えたBhv4切り詰め化を示す。触媒的に不活性なBhv4のC末端142アミノ酸(dBhv4 143:不活性化変異D574A、新規サイズ966アミノ酸)を除去し、リンカーとラットのApobecドメインをC末端に融合した後に、CからTへの塩基編集を非標的鎖のガイド塩基対位置14で最大10.95%の頻度により観察する。6.97%の編集効率をガイド位置15で検出する。この活性はガイド依存である。既存の構築物への融合または遊離発現のいずれかによるウラシル-DNAグリコシラーゼ阻害剤(UGI)ドメインの添加は、このCからTへの変換を増強させると予想される。列記されたガイド配列(大文字)は、HEK 293T細胞(配列番号368)中のGRIN2B内の領域を標的とする。
図82A~82Cにおいて、図82Aは、Guide-Seq分析用に選択された9個の標的部位での293T細胞中のCas9、Cas12b、およびCas12a(3個のTTTV PAM部位でのみ試験されたCas12aは除く)の挿入欠失活性の比較を示す。誤差棒は4個の複製物からの標準偏差を表す。図82Bは、各ヌクレアーゼに対して検出された切断部位の数と相対比率を表すGuide-Seq分析を示す。非特異的標的は薄灰色のくさび形として表示され、特異的標的部位は、紫色(SpCas9の場合)、暗青色(BhCas12b v4の場合)、または薄青色(AsCas12aの場合)で強調表示されて、特異的標的部の読取り値が小数でその下に示されている。非特異的標的は、試験されていないSpCas9 n.t.でのみ検出された。図82Cは、ガイドsgRNAと標的DNAの間に不一致が存在する場合の293T細胞中のBhCas12b挿入欠失活性を示す。不一致は、標的鎖に一致するようにsgRNA中に挿入された(すなわちCからG、AからT)。誤差棒は4個の複製物からの標準偏差を表す。
図83は、Cas12の切り詰め化、およびAPOBECとその塩基編集活性を用いたN末端およびC末端の融合の概略図を示す。
図84は、特定の実施形態例(配列番号369~375)に従うCas12塩基編集データを示す。
図85は、特定の実施形態例に従うCas12塩基編集データを提供する。
図86は、特定の実施形態例(配列番号376~377)に従うガイド表面でのCas12塩基編集を示す。
図87は、全長BhCas12b(配列番号378)を使用する例示的な塩基編集手法を示す。
図88A~88Cにおいて、図88Aは、BhCas12b v4と異なる相同分子種AaCas12bの挿入欠失活性の比較を示す。図88Bおよび88Cは、BhCas12b v4またはBhCas12bを発現するAAV1/2によるラットの神経細胞の形質導入を示している。
図89A~89Bにおいて、図89Aはpx602-bh-optimize-AAVのマップを示す。図89Bはpx602-bv-optimize-AAVのマップを示す。
本明細書の図は、例示のみを目的としており、必ずしも縮尺通りに描かれてはいない。
[実施形態例の詳細説明]
一般的定義
他に定義されない限り、本明細書で使用される技術用語および科学用語は、本開示が関連する当業者が一般に理解するのと同一の意味を有する。分子生物学での一般的な用語および技術の定義は、分子クローニング:実験室マニュアル第2版(Molecular Cloning:A Laboratory Manual、2nd edition)(1989)(Sambrook、Fritsch、and Maniatis)、分子クローニング:実験室マニュアル第4版(Molecular Cloning: A Laboratory Manual, 4thedition)(2012) (Green and Sambrook)、分子生物学での最新手法(Current Protocols in Molecular Biology)(1987) (F.M. Ausubel et al. eds.)、酵素学での一連の手法(the series Methods in Enzymology)(Academic Press, Inc.)、PCR2:実用手法(PCR 2: A Practical Approach)(1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.)、抗体:実験室マニュアル(Antibodies, A Laboratory Manual)(1988) (Harlow and Lane, eds.)、抗体:実験室マニュアル第2版(Antibodies A Laboratory Manual, 2ndedition)( 2013) (E.A. Greenfield ed.)、動物細胞の培養(Animal Cell Culture)(1987) (R.I. Freshney, ed.)、Benjamin Lewin, 遺伝子IX(Genes IX)Jones and Bartletから出版, 2008 (ISBN 0763752223)、Kendrew et al. (eds.), 分子生物学の百科事典(The Encyclopedia of Molecular Biology)Blackwell Science Ltd.から出版, 1994 (ISBN 0632021829)、Robert A. Meyers (ed.), 分子生物学および生物工学:総括的な参考書(Molecular Biology and Biotechnology: a Comprehensive Desk Reference), VCH Publishers, Inc.から出版, 1995 (ISBN 9780471185710)、Singleton et al., 微生物学および分子生物学の辞書第2版(Dictionary of Microbiology and Molecular Biology 2nd ed.), J. Wiley & Sons (New York, N.Y. 1994), March, 先進的有機化学反応、機構、および構造第4版(Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed.), John Wiley & Sons (New York, N.Y. 1992)、およびMarten H. Hofker and Jan van Deursen, 遺伝子導入マウスの方法および手法第2版(Transgenic Mouse Methods and Protocols, 2ndedition)(2011)に示される内容から引用されてもよい。
本明細書で使用される単数形「a」、「an」、および「the」は、文脈で別段に明示しない限り、単数および複数の両方の指示対象を含む。
用語「任意の」または「任意に」は、その後に説明される事象、状況、または置換が発生する場合もあり発生しない場合もあり、この説明には、事象または状況が発生する事例および発生しない事例が含まれることを意味する。
終端点による数値範囲の詳述は、それぞれの範囲内に含まれる全ての数値および小数値、ならびに詳述された終端点を含む。
パラメータ、量、持続時間などの測定値を指す際の本明細書で使用される用語「約」または「おおよそ」により、±10%以下、±5%以下、±1%以下、および±0.1%以下の変動などの特定値の変動および特定値からの変動を包含し、かつ特定値からのその変動が本開示の発明を実施するのに適切である範囲を包含することを意味する。修飾語「約」または「おおよそ」が指す数値それ自体も、明確にかつ好ましく開示されていることは当然である。
用語「例示的な」は、本明細書では、実施例、事例、または例示として機能することを意味するように使用される。本明細書で「例示的な」として説明される任意の側面または構想を、必ずしもその他の側面、実施形態、または構想よりも好ましい、あるいは有効であるとは解釈すべきではない。
本明細書で使用される「生体試料」は、全細胞および/または生細胞および/または細胞断片を含んでいてもよい。生体試料は、「体液」を含んでもよい(またはそれに由来してもよい)。本発明は、体液が、膜液、眼房水、硝子体液、胆汁、血清、乳汁、脳脊髄液、耳垢(耳糞)、乳糜、粥状液、内リンパ液、外リンパ液、滲出液、糞便、雌射精液、胃酸、胃液、リンパ液、(鼻腔廃液および痰を含む)粘液、心膜液、腹水、胸膜液、膿、粘膜分泌物、唾液、皮脂(皮膚油)、精液、痰、滑液、汗、涙、尿、膣分泌物、嘔吐物、およびそれらの1種以上の混合物から選択される実施形態を包含する。生体試料には、細胞培養物、体液、体液からの細胞培養物が含まれる。体液は、例えば穿刺または他の収集または採取手順によって、哺乳動物から得ることができる。
用語「対象」、「個体」、および「患者」は、本明細書では互換的に使用されて、脊椎動物、好ましくは哺乳動物、より好ましくはヒトを指す。哺乳動物として、限定はされないが、ネズミ、類人猿、ヒト、家畜、競技動物、およびペットが含まれる。in vivoで得られた、またはin vitroで培養された生体の組織、細胞、およびそれらの後代も含まれる。
様々な実施形態は、以下に説明する通りである。特定の実施形態は、包括的な説明として、または本明細書で検討されるより広い側面に対する制限として、意図するものではない。特定の実施形態に関連して説明される1つの側面は、必ずしもその実施形態に限定されるものではなく、その他の任意の実施形態でも実施することができる。本明細書全体を通して「一実施形態」、「実施形態」、「実施形態例」は、実施形態に関連して説明される特定の特徴、構造、または特性が、本発明の少なくとも1つの実施形態に含まれることを意味する。従って、本明細書全体の様々な場所での「一実施形態では」、「実施形態では」、または「実施形態例では」という語句の出現は、必ずしも全てが同一の実施形態を指すとは限らないが、同一の実施形態を指す場合があってもよい。さらに、特定の特徴、構造、または特性は、1つ以上の実施形態内に、本開示が当業者にとって明白となるように任意の適切な形態で組合せることができる。さらに本明細書に説明されるいくつかの実施形態に、その他の実施形態に含まれるその他の特徴をいくつか含むかまたは含まなくとも、異なる実施形態での特徴の組合せは、本発明の範囲内にあることを意味している。例えば、添付の特許請求の範囲では、請求される実施形態のいずれかを任意に組合せて使用することができる。
本明細書で引用される全ての刊行物、公開された特許文書、および特許出願は、それぞれの個別の刊行物、公開された特許文書、または特許出願が参照により組み込まれるように具体的かつ個別に示されたのと同じ程度に、参照により本明細書に組み込まれている。
[概要]
一態様では、本明細書に開示される実施形態は、遺伝子操作された、または単離されたCRISPR-Casエフェクタータンパク質および相同分子種を対象とする。特に、本発明は、Cas12bエフェクタータンパク質および相同分子種に関する。本明細書で使用される用語「Cas12b」は、C2c1と互換的に使用される。本発明はさらに、その相同分子種を含むCRISPR-Casシステム、ならびにその相同分子種またはシステムをコードするポリヌクレオチド配列、それを含むベクターまたはベクターシステム、およびそれを含む送達システムに関する。本発明はさらに、そのCas12bタンパク質、CRISPR-Casシステム、ポリ核酸配列、ベクター、ベクターシステム、送達システムを含む細胞または細胞株または生物に関する。本発明はさらに、そのタンパク質、CRISPR-Casシステム、ポリ核酸配列、ベクター、ベクターシステム、送達システム、細胞、細胞株などの医学的および非医学的な使用に関する。別の側面では、本明細書に開示される実施形態は、未改変のCRISPR-Casエフェクタータンパク質に対比して、結合部位へのCRISPR複合体の結合を増強し、かつ/あるいは野生型と比較して編集優先度を変更する少なくとも1つの改変を含む遺伝子操作されたCRISPR-Casエフェクタータンパク質を対象とする。特定の実施形態では、CRISPR-Casエフェクタータンパク質は、V型のエフェクタータンパク質、好ましくはV-B型である。特定の別の実施形態例では、V-B型のエフェクタータンパク質は、C2c1である。本明細書に開示される実施形態での使用に適するC2c1タンパク質の例を、以下でさらに詳細に述べる。別の側面では、開示の実施形態は、遺伝子操作されたガイドを含む遺伝子操作されたCRISPR-Casシステムに関する。本明細書で使用される用語「CRISPRエフェクター」または「CRISPRタンパク質」または「Cas(タンパク質またはエフェクター)」は、Cas12bタンパク質またはエフェクターと互換的に使用され、(点変異および/または切り詰め化などの)変異を受けたタンパク質、または野生型タンパク質であってもよい。
実施例によっては、本開示は、i)表1または表2に記載のCas12bエフェクタータンパク質、ii)a)1つ以上の標的配列に、特定の実施形態では1つ以上の標的DNA配列にハイブリダイズ可能な3’ガイド配列およびb)5’直接反復配列を含むcrRNA、およびiii)tracr RNAを含む非天然起源または遺伝子操作されたシステムを提供し、これにより、crRNAおよびtracrRNAと複合化したCas12bエフェクタータンパク質を含むCRISPR複合体が形成される。
実施例によっては、本開示は、i)表1または表2に記載のCas12bエフェクタータンパク質、およびii)標的配列にハイブリダイズ可能なガイド配列を含むガイドを含む非天然起源または遺伝子操作されたシステムを提供する。場合によっては、このシステムはさらにtracrRNAを含む。
別の側面では、本明細書に開示される実施形態は、C2c1を含むCRISPR-Casエフェクタータンパク質の送達のためのベクターに関する。特定の実施形態例では、ベクターは、単一のベクター内にCRISPR-Casエフェクタータンパク質の封入を可能にするように設計されている。また封入して、それにより標的化送達および組織特異性のためにより大量の導入遺伝子を発現する小型のプロモーターの設計に関心が高まっている。従って、別の側面では、本明細書に開示される特定の実施形態は、全身への送達のためにより大量の遺伝子を送達する送達ベクター、構築物、および方法に関する。
別の側面では、本発明は、CRISPR-Casシステムを開発または設計するための方法に関する。一側面では、本発明は、限定はされないが、治療促進、生物産出、ならびに植物および農業用途を含む広範囲の用途に最適化されたCRISPR-Casシステムを開発または設計するための方法に関する。特定の治療法または治療技術では、本発明は、特に、CRISPR-Casシステム、例えばCRISPR-Casシステムに基づく治療法または治療技術を改善するための方法に関する。CRISPR-Casシステムに基づく治療法や治療技術など、成功したCRISPR-Casシステムの主要な特徴には、高い特異性、高い効力、高い安全性が含まれる。非特異的標的効果の低減により、とりわけ高い特異性と高い安全性を達成できる。改善された特異性および効力は、同様に、植物および生物産出での応用
を改善するために使用されてもよい。
従って一側面では、本発明は、CRISPR-Casシステムに基づく治療法または治療技術などのCRISPR-Casシステムの特異性を高める方法に関する。さらなる側面では、本発明は、CRISPR-Casシステムに基づく治療法または治療技術などのCRISPR-Casシステムの効力を高める方法に関する。さらなる側面では、本発明は、CRISPR-Casシステムに基づく治療法または治療技術などのCRISPR-Casシステムの安全性を高める方法に関する。さらなる側面では、本発明は、CRISPR-Casシステムに基づく治療法または治療技術などのCRISPR-Casシステムの特異性、効力、および/または安全性、好ましくはそれら全てを高める方法に関する。
特定の実施形態では、CRISPR-Casシステムは、本明細書の他の部分で定義されるようなCRISPRエフェクターを含む。
本発明の方法は、特に、本明細書の他の部分でさらに説明されるように、CRISPR-Casシステムおよび/またはその機能に関連する選択されたパラメータまたは変数の最適化を含む。本明細書に説明される方法でのCRISPR-Casシステムの最適化は、治療標的などの標的、CRISPR-Casシステムに基づく治療標的調節、変更、または操作などのCRISPR-Casシステム調節の方式または型式、ならびにCRISPR-Casシステム成分の送達に依存していてもよい。1つ以上の標的は、遺伝子型および/または表現型の結果に応じて、選択してもよい。例えば、1つ以上の治療標的は、(遺伝的)疾患の病因または所望の治療結果に応じて、選択してもよい。(治療)標的は、単一の遺伝子、遺伝子座、または他のゲノム部位であってもよく、あるいは複数の遺伝子、遺伝子座、または他のゲノム部位であってもよい。当技術分野で知られているように、単一の遺伝子、遺伝子座、または他のゲノム部位は、複数のgRNAの使用などによって、複数回標的化されてもよい。
CRISPR-Casシステム設計などのCRISPR-Casシステム動作は、遺伝子ノックアウトへの到達などの標的変異などの標的破壊を含んでもよい。CRISPR-Casシステム設計などのCRISPR-Casシステム動作は、標的補正への到達など、特定の標的部位の置換を含んでもよい。CISPR-Casシステム設計は、標的排除への到達など、特定の標的部位の削除を含んでもよい。CRISPR-Casシステム動作は、例えば(転写および/または後成)遺伝子またはゲノム領域の活性化あるいは遺伝子またはゲノム領域のサイレンシングに繋がる、標的部位の活性や近接性などの標的部位の機能性の調節を含んでもよい。当業者には、本明細書の他の段落に説明されるように、標的部位の機能性の調節が、(例えば、触媒的に不活性なCRISPRエフェクターの生成などの)CRISPRエフェクターの変異および/または(例えば、CRISPRエフェクターの転写活性化因子または抑制因子などの異種機能ドメインとの融合などの)官能化を含んでもよいことが分かる。従って、別の側面では、本発明は、改変されたCRISPRエフェクタータンパク質および機能ドメインを含む部位特異的塩基編集のための遺伝子操作された組成物に関する。本発明の一実施形態では、RNA塩基編集が存在する。本発明の一実施形態では、DNA塩基編集が存在する。特定の実施形態では、機能ドメインは、シチジン脱アミノ酵素およびアデノシン脱アミノ酵素を含む脱アミノ酵素またはその触媒ドメインを含む。本明細書に開示される実施形態での使用に適する機能ドメインの例は、以下でさらに詳述される。
特定の実施形態例では、遺伝子操作されたCRISPR-Casエフェクタータンパク質は、ガイド配列を含む核酸と複合化してCRISPR複合体を形成し、CRISPR複合体では、核酸分子は1つ以上のポリヌクレオチド遺伝子座を標的とし、このタンパク質は、野生型と比較してCRISPR複合体の結合部位への結合を増強しかつ/あるいは編集の優先度を変更する、未改変タンパク質と対比して少なくとも1つの改変を含む。この編集の優先度は、挿入欠失形成に関連する場合がある。特定の実施形態例では、少なくとも1つの改変は、標的遺伝子座での1つ以上の特定の挿入欠失の形成を高めることができる。CRISPR-Casエフェクタータンパク質は、V型のCRISPR-Casエフェクタータンパク質であってもよい。特定の実施形態例では、CRISPR-Casタンパク質は、Cas12bとしても知られるC2c1、またはその相同分子種である。
本発明は、関心のある標的遺伝子座に会合する配列、またはその位置にある配列をゲノム編集または改変する方法を提供し、この方法は、C2c1エフェクタータンパク質複合体を任意の所望の細胞型、原核細胞、または真核細胞に導入することを含み、それによりC2c1エフェクタータンパク質複合体は、DNA挿入物を真核細胞または原核細胞のゲノム中に組み込むように効果的に機能する。好ましい実施形態では、細胞は真核細胞であり、ゲノムは哺乳動物ゲノムである。好ましい実施形態では、DNA挿入物の組み込みは、非相同末端結合(NHEJ)に基づく遺伝子挿入機構によって促進される。好ましい実施形態では、DNA挿入物は、外因的に導入されたDNA鋳型または修復鋳型である。好ましい一実施形態では、外因的に導入されたDNA鋳型または修復鋳型は、複合体成分の発現のために、C2c1エフェクタータンパク質複合体、または一成分、またはポリヌクレオチドベクターとともに送達される。より好ましい実施形態では、真核細胞は非分裂細胞である(例えば、HDRを介したゲノム編集が特に困難である非分裂細胞)。
本発明はまた、関心のある標的遺伝子座を改変する方法を提供し、この方法は、C2c1遺伝子座エフェクタータンパク質および1つ以上の核酸成分を含む非天然起源または遺伝子操作された組成物を前記遺伝子座に送達することを含み、このC2c1エフェクタータンパク質は、1つ以上の核酸成分と複合体を形成し、前記複合体が関心のある遺伝子座に結合すると、エフェクタータンパク質は、関心のある標的遺伝子座の改変を誘発する。一実施形態では、改変は鎖切断の導入である。鎖切断の後に、非相同末端結合が発生してもよい。別の実施形態では、修復鋳型が提供されて、切断の後に相同組換えが発生する。
本発明によると、核酸を改変する酵素が提供される。その一実施形態では、DNAの塩基編集が存在する。その別の実施形態では、RNAの塩基編集が存在する。より具体的には、本発明は、細胞内の核酸塩基を改変することが可能な脱アミノ酵素および脱アミノ酵素変異体を提供する。一実施形態では、脱アミノ酵素は、DNA/RNA二重鎖の不一致を標的とし、標的の不一致DNA塩基を編集する。別の実施形態では、脱アミノ酵素は、RNA/RNA二重鎖の不一致を標的とし、標的RNAを編集する。
この方法では、関心のある標的遺伝子座は、細胞内の核酸分子中に含まれていてもよい。細胞は、原核細胞または真核細胞であってもよい。細胞は哺乳動物細胞であってもよい。哺乳動物細胞は、ヒト以外の霊長類、ウシ、ブタ、げっ歯類、またはマウスの細胞であってもよい。細胞は、家禽、魚、またはエビなどの非哺乳動物の真核細胞であってもよい。細胞はまた、植物細胞であってもよい。植物細胞は、キャッサバ、トウモロコシ、ソルガム、小麦、またはイネなどの作物植物の細胞であってもよい。植物細胞はまた、藻類、樹木、または野菜の細胞であってもよい。本発明によって細胞に導入される改変は、細胞および細胞の後代が、抗体、デンプン、アルコール、またはその他の所望の細胞産物などの生物学的産物の産出を改善するために変更されるような改変であってもよい。本発明によって細胞に導入される改変は、細胞および細胞の後代が、産出される生物学的産物を変化させる変更を含むような改変であってもよい。
任意の説明された方法では、関心のある標的遺伝子座は、関心のあるゲノムまたはエピゲノムの遺伝子座であってもよい。任意の説明された方法では、複合体は、多重使用のための複数のガイドとともに送達されてもよい。任意の説明された方法では、複数のタンパク質を使用してもよい。
CRISPR-Casシステム
一般に、CRISPRシステムは、国際特許出願WO2014/093622(PCT/US2013/074667)号などの先行文献に使用されているシステムであってもよく、このシステムは、特にC2c1遺伝子などのCRISPR会合(「Cas」)遺伝子をコードする配列を含むCas遺伝子、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性な部分tracrRNA)、(内因性CRISPRシステムの文脈での「直接反復」およびtracrRNAで処理された部分直接反復を包含する)tracr-mate配列、(内因性CRISPRシステムの文脈では「スペーサー」とも呼ばれる)ガイド配列、またはその用語を本明細書に使用する(例えば、CRISPR RNAなどのC2c1を誘導するためのRNA、およびトランス活性化(tracr)RNAまたは単一ガイドRNA(sgRNA)(キメラRNA)などの)「RNA」、またはCRISPR遺伝子座からのその他の配列および転写物の発現に含まれ、あるいはそれらの活性を誘導する転写物および他の要素を集合的に指している。
一般に、CRISPRシステムは、(内因性のCRISPRシステムの文脈ではプロトスペーサーとも呼ばれる)標的配列の部位でCRISPR複合体の形成を促進する要素によって特徴付けられている。CRISPR複合体の形成の文脈では、「標的配列」は、ガイド配列が相補性を有するように設計される配列を指し、標的配列とガイド配列との間のハイブリダイズは、CRISPR複合体の形成を促進する。Cas12bタンパク質を含む実施形態で形成されるCRISPR複合体は、本明細書の他の段落に説明されているcrRNAおよびtracrRNAとの複合体を含んでもよい。標的配列への相補性が切断活性にとって重要であるガイド配列の一断片は、本明細書ではシード配列と呼ばれる。標的配列は、DNAポリヌクレオチドまたはRNAポリヌクレオチドなどの任意のポリヌクレオチドを含んでもよい。実施形態によっては、標的配列は、細胞の核または細胞質に位置していて、細胞内に存在するミトコンドリア、細胞小器官、小胞、リポソーム、または粒子内の核酸、あるいはそれらからの核酸を含んでもよい。実施形態によっては、特に核の無い細胞への適用では、NLSは好ましくない。実施形態によっては、CRISPRシステムは、1つ以上の核外搬出シグナル(NES)を含む。実施形態によっては、CRISPRシステムは、1つ以上のNLSおよび1つ以上のNESを含む。実施形態によっては、直接反復は、以下の基準のいずれかまたは全てを満たす反復モチーフを検索してコンピュータ上で識別できる。それら基準とは、1)II型のCRISPR遺伝子座に隣接するゲノム配列の2Kbウィンドウ内に指定される基準、2)20~50塩基対の全範囲での基準、および3)20~50塩基対内の一部範囲での基準である。実施形態によっては、これらの基準のうちの2個、例えば、1)および2)、2)および3)、または1)および3)を使用してもよい。実施形態によっては、3個全ての基準を使用してもよい。
一般に、CRISPRシステムは、標的配列の部位でのCRISPR複合体の形成を促進する要素によって特徴付けられている。CRISPR複合体の形成の文脈では、「標的配列」は、ガイド配列が相補性を持つように設計されている配列を指し、標的DNA配列とガイド配列との間のハイブリダイズは、CRISPR複合体の形成を促進する。
用語「ガイド分子」、「ガイドRNA」、および「ガイド」は、本明細書では互換的に使用されて核酸系の分子を指し、これらガイド等は、限定はされないが、CRISPR-Casタンパク質との複合体を形成可能であり、かつ標的核酸配列とハイブリダイズして複合体の標的核酸配列への配列特異的結合を導くために十分な標的核酸配列との相補性を有するガイド配列を含むRNA系の分子を含む。ガイド分子またはガイドRNAは、具体的には、本明細書に説明されるように、(例えば、2つのリボヌクレオチドを化学的に結合すること、あるいは1つ以上のリボヌクレオチドを1つ以上のデオキシリボヌクレオチドで置換することによる)1種以上の化学改変を有するRNA系の分子を包含する。
特定の実施形態では、標的配列は、PAM(プロトスペーサー隣接モチーフ)またはPFS(プロトスペーサー隣接配列または部位)と会合すべきであり、すなわち、CRISPR複合体によって認識される短配列である。CRISPR-Casタンパク質の性質に応じて、(本明細書では非標的配列とも呼ばれる)DNA二重鎖中のその相補配列がPAMの上流または下流になるように標的配列を選択すべきである。CRISPR-Casタンパク質がC2c1タンパク質である本発明の実施形態では、標的配列の相補配列は、PAMの下流またはその3’に存在する。PAMの正確な配列およびその長さの要件として、使用するC2c1タンパク質によって異なるが、PAMは通常、プロトスペーサーに隣接する2~5塩基対の配列(すなわち標的配列)である。種々のC2c1相同分子種での天然のPAM配列の例が本明細書で以下のように示され、当業者は、所定のC2c1タンパク質で使用するためのさらなるPAM配列を特定できる。
このシステムは、(例えば、細胞または細胞集団中の)1つ以上の標的配列の改変のために使用されてもよい。この改変は、少なくとも1つの遺伝子産物の発現に変化をもたらす可能性がある。例によっては、少なくとも1つの遺伝子産物の発現は増強されてもよい。例によっては、少なくとも1つの遺伝子産物の発現は減弱されてもよい。
例によっては、この改変は、細胞または細胞集団に実施されてもよく、改変は、内因性または非内因性の生体産物または化合物を産生かつ/あるいは分泌する細胞または細胞集団をもたらすことができる。化合物または生体産物は、低分子量化合物を含んでもよいが、より高分子量の化合物であってもよく、またはアンチセンス核酸、siRNAまたはshRNAなどのRNAi、CRISPR-Casシステム、ペプチド、ペプチド模倣体、受容体、リガンド、および抗体、アプタマー、ポリペプチド、核酸類似体またはそれらの変異体などの改変および非改変核酸を含む、所定の環境で有効な任意の有機分子または無機分子であってもよく、例えば、限定はされないが、タンパク質、オリゴヌクレオチド、リボザイム、DNAザイム、糖タンパク質、siRNA、リポタンパク質、アプタマー、およびそれらの改変物および組合せ物を含む核酸、アミノ酸、または炭水化物のオリゴマーが挙げられる。薬剤は、化学物質、小分子、核酸配列、核酸類似体、タンパク質、ペプチド、アプタマー、抗体、またはそれらの断片を含む群から選択されてもよい。核酸配列は、RNAまたはDNAであってもよく、一本鎖または二本鎖であってもよく、関心のあるタンパク質をコードする核酸、オリゴヌクレオチド、例えばペプチド-核酸(PNA)、疑似相補的PNA(pc-PNA)、ロックド核酸(LNA)、改変RNA(mod-RNA)、単一ガイドRNAなどの核酸類似体を含む群から選択されてもよい。この核酸配列として、限定はされないが、例えば転写抑制因子、アンチセンス分子、リボザイム、小分子阻害性核酸配列などとして作用するタンパク質をコードする核酸配列が挙げられ、また限定はされないが、例えばCRISPR酵素を特定のDNA標的配列などに標的化するRNAi、shRNAi、siRNA、マイクロRNAi(mRNAi)、アンチセンスオリゴヌクレオチド、CRISPRガイドRNAが挙げられる。タンパク質および/またはペプチドまたはその断片は、任意の関心のあるタンパク質であってもよく、例えば、限定はされないが、変異タンパク質、治療用タンパク質、および切り詰め型タンパク質であってもよく、このタンパク質は通常、細胞内に存在しないか、細胞内に低濃度で発現される。タンパク質はまた、変異タンパク質、遺伝子操作されたタンパク質、ペプチド、合成ペプチド、組換えタンパク質、キメラタンパク質、抗体、ミニボディ、ヒト化タンパク質、ヒト化抗体、キメラ抗体、改変タンパク質、およびそれらの断片を含む群から選択されてもよい。あるいは、薬剤は、細胞内への核酸配列の導入およびその転写の結果として細胞内に存在していてもよく、それにより、細胞内の遺伝子の核酸および/またはタンパク質活性調節因子が産生される。実施形態によっては、薬剤は、限定はされないが、合成および天然起源の非タンパク質物質を含む任意の化学物質または部分である。特定の実施形態では、薬剤は、化学部分を有する小分子である。薬剤は、所望の活性および/または特性を有する既知のものであるか、または多様な化合物のライブラリーから選択してもよい。
PAMの決定
出願人らは、PAMおよび耐性遺伝子の両方を含むプラスミドを異種の大腸菌中に導入し、次に対応する抗生物質表面に播種する。プラスミドにDNA切断が有った場合は、出願人らは生コロニーを観察できない。より詳細には、DNA標的について測定は以下の通りに実施する。この測定では、2個の大腸菌株を使用する。一方は、細菌株からの内因性エフェクタータンパク質遺伝子座をコードするプラスミドを保持する。他方の株は、空のプラスミドを保持する(例えばpACYC184、対照株)。考えられる全ての7または8塩基対のPAM配列は、抗生物質耐性プラスミド(アンピシリン耐性遺伝子を有するpUC19)に提供される。PAMは、プロトスペーサー1配列(内因性エフェクタータンパク質遺伝子座中の第1のスペーサーに対するDNA標的)に隣接して配置される。2つのPAMライブラリーがクローンされる。一方はプロトスペーサーの8個の無作為なbp5’を保有する(例えば、合計65536個の種々のPAM配列、すなわち複雑性あり)。他方のライブラリーには、プロトスペーサーの7個の無作為なbp3’を保有する(例えば、全体の複雑性は16384個の種々のPAMである)。両方のライブラリーは、考えられるPAM当たり平均500個のプラスミドを持つようにクローンされた。試験株と対照株は、5’のPAMおよび3’のPAMライブラリーで別々の形質転換物として形質転換され、形質転換された細胞はアンピシリン皿に個別に播種された。プラスミドによる認識およびそれに続く切断/干渉により、アンピシリンに対して脆弱な細胞となり、増殖が妨げられる。形質転換の約12時間後に、試験株および対照株により形成された全てのコロニーが採取され、プラスミドDNAが単離された。プラスミドDNAは、PCR増幅およびその後のディープ配列決定のための鋳型として使用された。形質転換されないライブラリー中の全てのPAMの表現型は、形質転換された細胞中に予測されるPAMの表現型を示していた。対照株に見られた全てのPAMの表現型は、実存する表現型を示していた。試験株中の全てのPAMの表現型は、どのPAMが酵素によって認識されないかを示しており、対照株との比較により、欠失したPAMの配列を抽出することができる。
現在までに識別されたC2c1相同分子種として、以下の2つのPAMが識別されている。アリシクロバチルス・アシドテレストリス(Alicyclobacillus acidoterrestris)ATCC 49025 C2c1p(AacC2c1)は、5’のTTN PAMが先行する標的部位を切断でき、この式中のNはA、C、G、またはTであり、より好ましくは、Nは、A、G、またはTである。バチルス・テルモアミロボランス(Bacillus thermoamylovorans)株B4166C2c1p(BthC2c1)は、ATTNが先行する部位を切断でき、式中のNはA、C、G、またはTである。
コドン最適化された核酸配列
エフェクタータンパク質が核酸として投与される場合に、本出願は、コドン最適化CRISPR-Cas V型タンパク質、より詳しくはC2c1をコードする核酸配列(場合によりタンパク質配列)の使用を想定している。コドン最適化配列の例として、ヒトなどの真核細胞動物での発現のために最適化された(すなわちヒトでの発現のために最適化されている)配列、または本明細書で説明されるような別の真核細胞動物または哺乳動物のために最適化された配列が挙げられる。コドン最適化配列の例として、例えば、国際特許出願WO 2014/093622(PCT/US2013/074667)号のSaCas9ヒトコドン最適化配列を参照のこと(当技術分野の情報および本開示により、特にエフェクタータンパク質(例えばC2c1)に関するコドン最適化コード核酸分子は、当業者の理解の範囲内にある)。この配列は好ましいものの、その他の例も可能であり、ヒト以外の宿主種のコドン最適化、または特定の器官のコドン最適化が知られていることも分かっている。実施形態によっては、DNA/RNA標的Casタンパク質をコードする酵素コード配列は、真核細胞などの特定の細胞中での発現のためにコドン最適化されている。真核細胞は、本明細書での説明のように、限定はされないが、ヒト、ヒト以外の真核細胞、あるいは、例えばマウス、ラット、ウサギ、イヌ、家畜、またはヒト以外の哺乳類もしくは霊長類を含む動物もしくは哺乳動物の細胞、あるいはそれらに由来する細胞を含んでもよい。実施形態によっては、ヒトの生殖系の遺伝的同一性を改変するプロセス、および/またはヒトまたは動物ならびにそのプロセスから生じる動物に、実質的な医学的な利益が得られずに、それらに苦痛をもたらす可能性のある動物の遺伝的同一性を改変するためのプロセスは、排除される場合がある。一般にコドン最適化は、未変性のアミノ酸配列を維持しながら、その宿主細胞の遺伝子中により頻繁にまたは最も頻繁に使用されるコドンにより、少なくとも1個のコドン(例えば、約1、2、3、4、5、10、15、20、25、50個、またはそれ以上のコドン)を置換して、関心のある宿主細胞中の発現を増強するために核酸配列を改変するプロセスを指す。様々な種では、特定のアミノ酸の特定のコドンに対して特定の偏向を示す。コドンの偏向(生物間のコドン使用での差異)は、メッセンジャーRNA(mRNA)の翻訳効率と相関することが多く、このことは、とりわけ翻訳されるコドンの特性および特定のトンスファーRNA(tRNA)分子の有効性に依存すると考えられる。細胞内で選択されるtRNAが優勢であると、一般に、ペプチド合成で最も頻繁に使用されるコドンが反映されることになる。従って遺伝子を、コドン最適化に基づいて、所定の生物中での最適な遺伝子発現のために設計することができる。コドン使用表は、例えば、www.kazusa.orjp/codon/で入手可能な「コドン使用データベース」から容易に取得でき、これらの表を、種々の方法で適合させることができる。Nakamura, Y., et al.の「国際的なDNA配列データベースから集計されたコドン使用頻度:2000年の状況(Codon usage tabulated from the international DNA sequence databases: status for the year 2000)」Nucl. Acids Res. 28:292 (2000)を参照。Gene Forge (Aptagen; Jacobus, PA)などの特定の宿主細胞での発現のための特定の配列を最適化するコドン用のコンピュータアルゴリズムもまた利用可能である。実施形態によっては、DNA/RNA標的化Casタンパク質をコードする配列中の1個以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50個、またはそれ以上、または全てのコドン)は、特定のアミノ酸に最も頻繁に使用されるコドンに対応する。酵母でのコドンの使用については、www.yeastgenome.org/community/codon_usage.shtmlで入手可能なオンラインの酵母ゲノムデータ表、または「酵母でのコドン選択(Codon selection in yeast)」, Bennetzen and Hall, J BiolChem. 1982 Mar 25;257(6):3026-31を参照。藻類を含む植物でのコドン使用については、「高等植物、緑藻、およびシアノバクテリアでのコドン使用(Codon usage in higher plants, green algae, and cyanobacteria)」, Campbell and Gowri, Plant Physiol. 1990 Jan; 92(1): 1-11.、ならびに「植物遺伝子でのコドン使用(Codon usage in plant genes)」, Murray et al, Nucleic Acids Res. 1989 Jan 25;17(2):477-98、または「種々の植物および藻類系統での葉緑体およびチアネル遺伝子のコドン偏向に関する選択(Selection on the codon bias of chloroplast and cyanelle genes in different plant and algal lineages)」, Morton BR, J Mol Evol. 1998 Apr;46(4):449-59を参照。
ガイド分子
V型またはVI型CRISPR-Cas遺伝子座エフェクタータンパク質の「crRNA」または「ガイドRNA」または「単一ガイドRNA」または「sgRNA」または「1つ以上の核酸成分」という本明細書で使用される用語は、標的核酸配列とハイブリダイズして、かつ標的核酸配列に核酸標的化複合体の配列特異的結合を導くのに十分な標的核酸配列との相補性を有する任意のポリヌクレオチド配列を含み、ここで適切な整列アルゴリズムを使用して最適に整列される際の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、またはそれ以上である。最適な整列は、配列を整列するための任意の適切なアルゴリズムを使用して決定することができ、そのアルゴリズムの例として、限定はされないが、the Smith-Waterman algorithm、the Needleman-Wunsch algorithm、algorithms based on the Burrows-Wheeler Transform(例えばthe Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies; www.novocraft.comで入手可能)、ELAND(Illumina, San Diego, CA)、SOAP(soap.genomics.org.cnで入手可能)、およびMaq(maq.sourceforge.netで入手可能)が挙げられる。(核酸標的化ガイドRNA内の)ガイド配列が標的核酸配列に核酸標的化複合体の配列特異的結合を誘導する能力は、任意の適切な測定法によって評価されてもよい。例えば、試験されるガイド配列を含み、かつ核酸標的化複合体を形成するのに十分な核酸標的化CRISPRシステムの成分は、核酸標的化複合体の成分をコードするベクターを用いる遺伝子導入などによって、またそれに続いて本明細書に説明のSurveyor assayなどの標的核酸配列内の優先標的化(例えば切断)の評価によって、対応する標的核酸配列を有する宿主細胞に提供されてもよい。同様に、標的核酸配列の切断は、標的核酸配列、および試験されるガイド配列ならびに試験ガイド配列とは異なる対照ガイド配列を含む核酸標的化複合体の成分を提供し、かつ試験ガイド配列反応と対照ガイド配列反応との間の標的配列での結合または切断速度を比較することにより、試験管内で評価してもよい。その他の測定法も可能性が有り、それらを当業者は実施できる。ガイド配列すなわち核酸標的化ガイドは、任意の標的核酸配列を標的化するように選択されてもよい。標的配列はDNAであってもよい。標的配列は、任意のRNA配列であってもよい。実施形態によっては、標的配列は、メッセンジャーRNA(mRNA)、プレmRNA、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、低分子核RNA(snRNA)、低分子核RNA(snoRNA)、二本鎖RNA(dsRNA)、非翻訳RNA(ncRNA)、長鎖非翻訳RNA(lncRNA)、および低分子細胞質RNA(scRNA)からなる群から選択されるRNA分子内の配列であってもよい。好ましい実施形態によっては、標的配列は、mRNA、プレmRNA、およびrRNAからなる群から選択されるRNA分子内の配列であってもよい。好ましい実施形態によっては、標的配列は、ncRNAおよびlncRNAからなる群から選択されるRNA分子内の配列であってもよい。好ましい実施形態によっては、標的配列は、mRNA分子またはプレmRNA分子内の配列であってもよい。脱アミノ酵素結合体の文脈では、標的核酸配列または標的配列は、本明細書では「標的アデノシン」とも呼ばれる、脱アミノ化される標的アデノシンを含む配列である。実施形態によっては、本明細書の上述の相補性には、本明細書に説明のdA-C不一致などの意図された不一致は除外する。ガイド配列は、原核細胞内の標的DNA配列にハイブリダイズしてもよい。ガイド配列は、真核細胞内の標的DNA配列にハイブリダイズしてもよい。
実施形態によっては、核酸標的化ガイドは、核酸標的化ガイド内の二次構造の程度を減弱するように選択される。実施形態によっては、核酸標的化ガイド中の約75%、50%、40%、30%、25%、20%、15%、10%、5%、1%、またはそれ以下のヌクレオチドが、最適に折り畳まれる際に、自己補完的な塩基対形成に関与する。最適な折り畳みは、任意の適切なポリヌクレオチド折り畳みアルゴリズムによって決定されてもよい。一部のプログラムは、Gibbsの最小自由エネルギーの計算に基づいている。このアルゴリズムの一例は、mFoldであり、それはZuker and Stiegler(Nucleic AcidsRes. 9 (1981), 133-148)によって説明されている。別の折り畳みアルゴリズムの例は、重心構造予測アルゴリズムを使用して、ウィーン大学の理論化学研究所で開発されたonline webserver RNAfoldである(例えば、A.R. Gruber et al., 2008, Cell 106(1): 23-24、およびPA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62を参照)。
特定の実施形態では、ガイドRNAまたはcrRNAは、直接反復(DR)配列およびガイド配列またはスペーサー配列を含んでもよく、本質的にそれらからなってもよく、またはそれらからなってもよい。特定の実施形態では、ガイドRNAまたはcrRNAは、ガイド配列またはスペーサー配列に融合または結合された直接反復配列を含んでもよく、本質的にそれからなってもよく、またはそれからなってもよい。特定の実施形態では、直接反復配列は、ガイド配列またはスペーサー配列の上流(すなわち5’)に位置してもよい。他の実施形態では、直接反復配列は、ガイド配列またはスペーサー配列の下流(すなわち3’)に位置してもよい。
実施形態によっては、ガイド分子は、ガイド配列と標的配列との間に形成されるヘテロ二本鎖が、標的配列の脱アミノ化のためにガイド配列内に標的Aに対向する非対合Cを含むように、標的配列と少なくとも1つの不一致を有するように設計されたガイド配列を含む。実施形態によっては、このA-Cの不一致は別として、相補性の程度は、適切な整列アルゴリズムを使用して最適に整列した場合に、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、またはそれ以上である。
特定の実施形態では、ガイド分子のガイド配列またはスペーサーの長さは、10~50ヌクレオチド長、より具体的には、15~35ヌクレオチド長である。特定の実施形態では、ガイドRNAのスペーサー長さは、少なくとも15ヌクレオチド長である。特定の実施形態では、スペーサー長さは、例えば、10、11、12、13、14、14の10~15ヌクレオチド長、例えば15、16、または17ヌクレオチド長の15~17ヌクレオチド長、例えば17、18、19、または20ヌクレオチド長の17~20ヌクレオチド長、例えば、20、21、22、23、または24ヌクレオチド長の20~24ヌクレオチド長、例えば、23、24、または25ヌクレオチド長の23~25ヌクレオチド長、例えば、24、25、26、または27ヌクレオチド長の24~27ヌクレオチド長、例えば27、28、29、または30ヌクレオチド長の27~30ヌクレオチド長、例えば30、31、32、33、34、または35ヌクレオチド長の30~35ヌクレオチド長、または35ヌクレオチド長以上である。特定の実施形態例では、ガイド配列は、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100ヌクレオチド長である。
CRISPR-Casシステムの実施形態によっては、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%以上、60%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97.5%以上、99%以上、または100%であってもよく、ガイドすなわちRNAまたはsgRNAは、約5以上、10以上、11以上、12以上、13以上、14以上、15以上、16以上、17以上、18以上、19以上、20以上、21以上、22以上、23以上、24以上、25以上、26以上、27以上、28以上、29以上、30以上、35以上、40以上、45以上、50以上、75以上、またはそれ以上のヌクレオチド長であってもよく、またはガイドすなわちRNAまたはsgRNAは、約75未満、50未満、45未満、40未満、35未満、30未満、25未満、20未満、15未満、12未満、またはそれ未満のヌクレオチド長であってもよく、好ましくは、tracrRNAは、30または50ヌクレオチド長である。しかし、本発明の一側面は、非特異的標的の相互作用を減弱させることであり、例えば、低い相補性を有する標的配列と相互作用するガイドを減少させることである。実際に例によっては、本発明は、例えば83%~84%または88~89%または94~95%の相補性などの80%超~約95%の相補性を有する非特異的標的配列と標的とを区別可能な(例えば、18ヌクレオチドを持つ標的と1、2、または3の不一致を持つ18ヌクレオチドの非特異的標的とを区別可能な)CRISPR-Casシステムをもたらす変異を含むことが示されている。従って、本発明の文脈では、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%超、または95%超、または95.5%超、または96%超、または96.5%超、または97%超、または97.5%超、または98%超、または98.5%超、または99%超、または99.5%超、または99.9%超、または100%である。非特異的標的の配列とガイド間の相補性は、100%未満、または99.9%未満、または99.5%未満、または99%未満、または99%未満、または98.5%未満、または98%未満、または97.5%未満、または97%未満、または96.5%未満、または96%未満、または95.5%未満、または95%未満、または94.5%未満、または94%未満、93%未満、または92%未満、または91%未満、または90%未満、または89%未満、または88%未満、または87%未満、または86%未満、または85%未満、または84%未満、または83%未満、または82%未満、または81%未満、または80%未満であり、好ましくは、非特異的標的の配列とガイド間の相補性は、100%、または99.9%、または99.5%、または99%、または99%、または98.5%、または98%、または97.5%、または97%、または96.5%、または96%、または95.5%、または95%、または94.5%である。
本発明による特に好ましい実施形態では、(Casを標的遺伝子座に誘導可能な)ガイドRNAは、(1)真核細胞中のゲノム標的遺伝子座にハイブリダイズ可能なガイド配列、(2)tracr配列、および(3)tracr mate配列を含んでもよい。(1)から(3)は全て、単一のRNA、すなわち(5’から3’の方向に配置された)sgRNAに存在してもよく、あるいはtracrRNAは、ガイドとtracr配列を含むRNAとは異なるRNAであってもよい。tracrはtracr mate配列にハイブリダイズし、CRISPR-Cas複合体を標的配列に導く。tracrRNAがガイドとtracr配列を含むRNAとは異なるRNAに存在する場合に、各RNAの長さは、それぞれの未変性の長さから短くなるように最適化され、各RNAは、細胞のRNA分解酵素による分解から保護するように、またはそうでないなら安定性を高めるように、独立して化学的に改変されてもよい。
「tracrRNA」配列または類似の用語は、ハイブリダイズするためにcrRNA配列と十分な相補性を有する任意のポリヌクレオチド配列を含む。実施形態によっては、最適に整列されたときの2つのうちの短い方の長さに沿ったtracrRNA配列とcrRNA配列との間の相補性の程度は、約25%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上、95%、97.5%以上、99%以上、またはそれ以上である。実施形態によっては、tracr配列は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、またはそれ以上のヌクレオチド長である。実施形態によっては、tracr配列およびcrRNA配列は、単一の転写物内に含まれ、その結果、2つの間のハイブリダイスは、ヘアピンなどの二次構造を有する転写物を生成する。本発明の一実施形態では、転写物または転写されたポリヌクレオチド配列は、少なくとも2個以上のヘアピンを有する。好ましい実施形態では、転写物は、2個、3個、4個、または5個のヘアピンを有する。本発明のさらなる実施形態では、転写物は、最大で5個のヘアピンを有する。ヘアピン構造では、最後の「N」の配列5’の部分とループの上流はtracr mate配列に対応し、ループの配列3’の部分はtracr配列に対応する。実施形態によっては、システムは、1個以上のcrRNAを含む。例えば、システムは、2個以上のcrRNAを含んでもよい。
一般に、相補性の程度は、2つの配列の内の短い方の長さに沿って、ガイド配列およびtracr配列の最適な配置に関連する。最適な配置は、任意の適切な配置アルゴリズムによって決定されてもよく、さらにsca配列またはtracr配列のいずれか配列内の自己相補性などの二次構造を占めていてもよい。実施形態によっては、最適に配置されたときの2つの内の短い方の長さに沿ったtracr配列とcrRNA配列との間の相補性の程度は、約25%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上、95%以上、97.5%以上、99%以上、またはそれ以上である。
本発明の一側面では、ガイドは、5’ハンドル、シード領域をさらに含むガイド区画、および3’末端を有する、C2c1の改変されたcrRNAを含む。実施形態によっては、改変されたガイドは、表1および表2に列記された相同分子種のうちのいずれか1種のC2c1とともに使用してもよい。
改変されたガイド
特定の実施形態では、本発明のガイドは、非天然起源の核酸および/または非天然起源のヌクレオチドおよび/またはヌクレオチド類似体、および/または化学改変を含む。非天然起源の核酸は、例えば、天然および非天然起源のヌクレオチドの混合物を含んでもよい。非天然起源のヌクレオチドおよび/またはヌクレオチド類似体は、リボース、リン酸、および/または塩基部分で改変されていてもよい。本発明の一実施形態では、ガイド核酸は、リボヌクレオチドおよび非リボヌクレオチドを含む。その一実施形態では、ガイドは、1つ以上のリボヌクレオチドおよび1つ以上のデオキシリボヌクレオチドを含む。本発明の実施形態では、ガイドは、1つ以上の非天然起源のヌクレオチド、またはホスホロチオ酸結合、ボラノリン酸結合、リボース環の2’と4’炭素の間のメチレン架橋を含むロックド核酸(LNA)ヌクレオチド、ペプチド核酸(PNA)、または架橋核酸(BNA)を有するヌクレオチ供与体などのヌクレオチド類似体を含む。改変ヌクレオチドのその他の例として、2’-O-メチル類似体、2’-デオキシ類似体、2-チオウリジン類似体、N6-メチルアデノシン類似体、または2’-フルオロ類似体が挙げられる。改変ヌクレオチドのさらなる例として、限定はされないが、ペプチド、核局在化配列(NLS)、ペプチド核酸(PNA)、ポリエチレングリコール(PEG)、トリエチレングリコール、またはテトラエチレングリコール(TEG)を含む2’位置での化学部分の結合が含まれる。改変塩基のさらなる例として、限定はされないが、2-アミノプリン、5-ブロモ-ウリジン、疑似ウリジン(Ψ)、N1-メチル疑似ウリジン(me1Ψ)、5-メトキシウリジン(5moU)、イノシン、7-メチルグアノシンが含まれる。ガイドRNAの化学改変の例として、1個以上の末端ヌクレオチドへの、限定はされないが、2’-O-メチル(M)、2’-O-メチル-3’-ホスホロチオ酸(MS)、ホスホロチオ酸(PS)、S-拘束エチル(cEt)、2’-O-メチル-3’-チオPACE(MSP)、または2’-O-メチル-3’-ホスホノ酢酸(MP)の取り込みを含む。この化学的に改変されたガイドは、未変性のガイドに比較して、安定性と活性の増強を含むことができるが、特異的標的と非特異的標的の特異性の比較は予測できない。(Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, published online 29 June 2015, Ragdarm et al., 0215, PNAS, E7110-E7111、Allerson et al., J. Med. Chem. 2005, 48:901-904、Bramsen et al., Front. Genet., 2012, 3:154、Deng et al., PNAS, 2015, 112:11870-11875、Sharma et al., MedChemComm., 2014, 5:1454-1471、Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989、Li et al., Nature Biomedical Engineering, 2017, 1, 0066 DOI:10.1038/s41551-017-0066、およびRyan et al., Nucleic Acids Res. (2018) 46(2): 792-803を参照)。
実施形態によっては、ガイドへの改変は、化学的改変、挿入、欠失、または分離である。実施形態によっては、化学改変には、限定はされないが、2’-O-メチル(M)類似体、2’-デオキシ類似体、2-チオウリジン類似体、N6-メチルアデノシン類似体、2’-フルオロ類似体、2-アミノプリン、5-ブロモ-ウリジン、疑似ウリジン(Ψ)、N1-メチル疑似ウリジン(me1Ψ)、5-メトキシウリジン(5moU)、イノシン、7-メチルグアノシン、2’-O-メチル-3’-ホスホロチオ酸(MS)、S-拘束エチル(cEt)、ホスホロチオ酸(PS)、2’-O-メチル-3’-チオPACE(MSP)、または2’-O-メチル-3’-ホスホノ酢酸(MP)の組み込みを含む。実施形態によっては、ガイドは、1つ以上のホスホロチオ酸改変を含む。特定の実施形態では、ガイド中の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、または25個のヌクレオチドは化学的に改変されている。実施形態によっては、全てのヌクレオチドは化学的に改変されている。特定の実施形態では、シード領域の1個以上のヌクレオチドは化学的に改変されている。特定の実施形態では、3’末端の1個以上のヌクレオチドは化学的に改変されている。特定の実施形態では、5’ハンドルのヌクレオチドのいずれも化学的に改変されていない。実施形態によっては、シード領域での化学改変は、2’-フルオロ類似体の組み込みなどの軽微な改変である。特定の実施形態では、シード領域の1個のヌクレオチドは、2’-フルオロ類似体で置換される。実施形態によっては、3’末端の5または10個のヌクレオチドは化学的に改変されている。Cpf1 CrRNAの3’末端でのこのような化学改変は、遺伝子の切断効率を改善する(Li, et al., Nature Biomedical Engineering, 2017, 1:0066を参照)。特定の実施形態では、3’末端の5個のヌクレオチドは2’-フルオロ類似体で置換されている。特定の実施形態では、3’末端の10個のヌクレオチドは2’-フルオロ類似体で置換されている。特定の実施形態では、3’末端の5個のヌクレオチドは2’-O-メチル(M)類似体で置換されている。実施形態によっては、3’および5’末端のそれぞれの3個ヌクレオチドは化学的に改変されている。特定の実施形態では、改変は、2’-O-メチルまたはホスホロチオ酸類似体を含む。特定の実施形態では、四塩基ループの12個のヌクレオチドおよびステムループ領域の16個のヌクレオチドは、2’-O-メチル類似体で置換されている。この化学改変は、in vivo編集および安定性を向上させる(Finn et al., Cell Reports (2018), 22: 2227-2235を参照)。
実施形態によっては、ガイドRNAの5’および/または3’末端は、蛍光色素、ポリエチレングリコール、コレステロール、タンパク質、または検出タグを含む様々な機能的部分によって改変されている。(Kelly et al., 2016, J. Biotech. 233:74-83を参照)。特定の実施形態では、ガイドは、標的DNAに結合する領域内のリボヌクレオチド、ならびにCas9、Cpf1、またはC2c1に結合する領域内の1個以上のデオキシリボヌクレオチドおよび/またはヌクレオチド類似体を含む。本発明の一実施形態では、デオキシリボヌクレオチドおよび/またはヌクレオチド類似体は、限定されないが、5’および/または3’末端、ステムループ領域、およびシード領域などの遺伝子操作されたガイド構造内に組み込まれている。特定の実施形態では、改変は、ステムループ領域の5’ハンドル中には存在しない。ガイドのステムループ領域の5’ハンドル中の化学改変により、その機能が失われる可能性がある(see Li, et al., Nature Biomedical Engineering, 2017, 1:0066を参照)。特定の実施形態では、ガイドの少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75個のヌクレオチドは、化学的に改変されている。実施形態によっては、ガイドの3’末端または5’末端のいずれかでの3~5個のヌクレオチドは、化学的に改変されている。実施形態によっては、2’-F改変などの軽微な改変のみがシード領域に導入されている。実施形態によっては、2’-F改変は、ガイドの3’末端に導入されている。特定の実施形態では、ガイドの5’および/または3’末端の3~5ヌクレオチドは、2’-O-メチル(M)、2’-O-メチル-3’-ホスホロチオ酸(MS)、S-拘束エチル(cEt)、2’-O-メチル-3’-チオPACE(MSP)、または2’-O-メチル-3’-ホスホノ酢酸(MP)により化学的に改変されている。このような改変は、ゲノム編集効率を高めることができる(Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989、および Ryan et al., Nucleic Acids Res. (2018) 46(2): 792-803を参照)。特定の実施形態では、ガイドの全てのホスホジエステル結合は、遺伝子破壊の程度を高めるためにホスホロチオ酸(PS)で置換されている。特定の実施形態では、ガイドの5’および/または3’末端の5個を超えるヌクレオチドは、2’-O-Me、2’-F、またはS拘束エチル(cEt)で化学的に改変されている。この化学的に改変されたガイドは、遺伝子破壊の程度の向上を媒介してもよい(Ragdarm et al., 0215, PNAS, E7110-E7111を参照)。本発明の一実施形態では、ガイドは、その3’および/または5’末端に化学部分を含むように改変されている。この部分には、限定はされないが、アミン、アジド、アルキン、チオ、ジベンゾシクロオクチン(DBCO)、ローダミン、ペプチド、核局在化配列(NLS)、ペプチド核酸(PNA)、ポリエチレングリコール(PEG)、トリエチレングリコール、またはテトラエチレングリコール(TEG)を含む。特定の実施形態では、化学部分は、アルキル鎖などのリンカーによってガイドに接合される。特定の実施形態では、改変されたガイドの化学的部分は、ガイドを使用して、DNA、RNA、タンパク質、またはナノ粒子などの別の分子に付着させることができる。この化学的に改変されたガイドを使用して、CRISPRシステムによって遺伝子編集された細胞を識別または濃縮できる(Lee et al., eLife, 2017, 6:e25312, DOI:10.7554を参照)。実施形態によっては、3’および5’末端のそれぞれの3個のヌクレオチドが化学的に改変されている。特定の実施形態では、改変は、2’-O-メチルまたはホスホロチオ酸類似体を含む。特定の実施形態では、四塩基ループの12個のヌクレオチドおよびステムループ領域の16個のヌクレオチドは、2’-O-メチル類似体で置換されている。この化学改変は、in vivoでの編集および安定性を向上させる(Finn et al., Cell Reports (2018), 22: 2227-2235を参照)。実施形態によっては、ガイドの60または70個を超えるヌクレオチドは、化学的に改変されている。実施形態によっては、この改変は、2’-O-メチルまたは2’-フルオロヌクレオチド類似体によるヌクレオチドの置換、またはホスホジエステル結合のホスホロチオ酸(PS)改変を含む。実施形態によっては、化学改変は、CRISPR複合体が形成される際のヌクレアーゼタンパク質の外側に延びるガイドヌクレオチドの2’-O-メチルまたは2’-フルオロ改変、またはガイドの3’-末端の20~30個以上のヌクレオチドのPS改変を含む。特定の実施形態では、化学改変は、ガイドの5’末端に2’-O-メチル類似体、またはシードおよびテール領域に2’-フルオロ類似体をさらに含む。このような化学改変は、ヌクレアーゼ分解に対する安定性を改善し、ゲノム編集活性または効率を維持または増強するが、全てのヌクレオチドの改変はガイドの機能を無効にする可能性がある(Yin et al., Nat. Biotech. (2018), 35(12): 1179-1187を参照)。このような化学改変は、限定された数のヌクレアーゼおよびRNA 2’-OH相互作用の情報を含む、CRISPR複合体の構造情報によって誘導してもよい(Yin et al., Nat. Biotech. (2018), 35(12): 1179-1187を参照)。実施形態によっては、1個以上のガイドRNAヌクレオチドは、DNAヌクレオチドで置換されていてもよい。実施形態によっては、5’末端テール/シードガイド領域の最大2、4、6、8、10、または12個のRNAヌクレオチドがDNAヌクレオチドで置換されている。特定の実施形態では、3’末端のガイドRNAヌクレオチドの大部分は、DNAヌクレオチドで置換されている。特定の実施形態では、3’末端の16個のガイドRNAヌクレオチドは、DNAヌクレオチドで置換されている。特定の実施形態では、5’末端テール/シード領域の8個のガイドRNAヌクレオチドおよび3’末端の16個のRNAヌクレオチドは、DNAヌクレオチドで置換されている。特定の実施形態では、CRISPR複合体が形成される際のヌクレアーゼタンパク質の外側に延びるガイドRNAヌクレオチドは、DNAヌクレオチドで置換されている。複数のRNAヌクレオチドのDNAヌクレオチドによるこのような置換により、非特異的標的活性を低下させるが、未変性のガイドと同等の特異的標的活性は維持する。ただし、3’末端の全てのRNAヌクレオチドを置換すると、ガイドの機能が喪失する可能性がある(Yin et al., Nat. Chem. Biol. (2018) 14, 311-316を参照)。この改変は、限定された数のヌクレアーゼおよびRNA 2’-OH相互作用の情報を含むCRISPR複合体の構造情報によって誘導されてもよい(Yin et al., Nat. Chem. Biol. (2018) 14, 311-316を参照)。
ガイド配列すなわち核酸標的化ガイドRNAは、任意の標的核酸配列を標的化するように選択されてもよい。標的配列はDNAであってもよい。標的配列はゲノムDNAであってもよい。標的配列はミトコンドリアDNAであってもよい。第2部類のV型CRISPR-Casタンパク質のガイド分子またはガイドRNAは、(内因性CRISPRシステムの文脈での「直接反復」を包含する)tracr-mate配列および(内因性CRISPRシステムの文脈で「スペーサー」とも呼ばれる)ガイド配列を含む。未変性のCas12b CRISPR-Casシステムはtracr配列を使用している。
特定の実施形態では、(C2c1を標的遺伝子座に誘導可能な)ガイド分子は、(1)標的遺伝子座にハイブリダイズが可能なガイド配列、および(2)tracr-mate配列すなわち直接反復配列を含み、それにより直接反復配列は、ガイド配列の上流(すなわち5’)に位置する。特定の実施形態では、C2c1ガイド配列のシード配列(すなわち、標的遺伝子座での配列に対する認識および/またはハイブリダイズに重要で必須の配列)は、ガイド配列の最初の10個のヌクレオチド内にほぼ位置している。特定の実施形態では、シード配列は、ガイド配列の5’末端の最初の5ヌクレオチド内にほぼ位置している。
実施形態によっては、ガイドの5’ハンドルのループが改変される。実施形態によっては、ガイドの5’ハンドルのループは、欠失、挿入、分離、または化学改変を持つように改変される。特定の実施形態では、改変されたループは、3、4、または5個のヌクレオチドを含む。特定の実施形態では、このループは、UCUU、UUUU、UAUU、またはUGUUの配列を含む。実施形態によっては、ガイド分子は、DNAまたはRNAであってもよい別々の非共有結合配列を有するステムループを形成する。
ステムループおよびヘアピン
核酸標的化複合体またはシステムに関して、crRNA配列およびキメラガイド配列は1個以上のステムループまたはヘアピンを含むのが好ましい。アプタマー改変ガイドを使用すると、アダプター含有タンパク質をガイドに結合させることができる。アダプターを任意の機能ドメインに融合でき、それによりガイドへの機能ドメインの接続が可能になる。2個の異なるアプタマーを使用すると、2個のガイドによる別々の標的化が可能になる。多数の、例えば10または20または30個などのその改変された核酸標的化ガイドRNAは、全て同時に使用してもよいが、エフェクタータンパク質分子のうちの1個のみ(または少なくとも最小数)を、比較的少数のタンパク質分子を多数の改変ガイドとともに使用できるように、送達する必要がある。アダプタータンパク質と活性化因子または抑制因子などの機能ドメインとの間の融合には、リンカーが含まれてもよい。例えば、GlySerリンカーGGGSを使用してもよい。それらを、3個の(GGGGS)3(配列番号393)、または6個(配列番号394)、9個(配列番号395)、または12個(配列番号396)、またはそれ以上の反復に使用して、必要に応じて適切な長さを提供してもよい。リンカーは、ガイドRNAと機能ドメイン(活性化因子または抑制因子)との間で、または核酸標的化Casタンパク質(Cas)と機能ドメイン(活性化因子または抑制因子)との間で使用してもよい。リンカーを使用して、適切な量の「機械的柔軟性」を操作する。
特定の実施形態では、ステムは、相補的なX配列およびY配列を含む少なくとも約4塩基対を含むが、例えばより多い5、6、7、8、9、10、11、または12塩基対、あるいはより少ない3、または2塩基対のステムも想定される。従って、例えば、X:2~10およびY:2~10(ここでXおよびYは、任意の相補的なヌクレオチドの組を表す)も考えられる。一側面では、XおよびYヌクレオチドからなるステムは、ループとともに、全体的な二次構造中に完全なヘアピンを形成し、かつこれは有益であって、この塩基対の量は、完全なヘアピンを形成する任意の量であってもよい。一側面では、ガイド分子全体の二次構造が保持されている限り、(例えば長さに関して)任意の相補的なX:Y塩基対配列は許容される。一側面では、X:Y塩基対からなるステムを接続するループは、ガイド分子の全体的な二次構造を妨害しない同一の長さ(例えば4または5個のヌクレオチド)またはそれ以上の長さの任意の配列であってもよい。一側面では、ステムループは、例えばMS2アプタマーをさらに含んでもよい。一側面では、ステムは、相補的なX配列およびY配列を含む約5~7塩基対を含むが、それより多いまたは少ない塩基対のステムもまた想定される。一側面では、非ワトソン-クリックの塩基対が想定され、この場合、その対合は、一般にその位置にステムループの構築物を保持する。
特定の実施形態では、ガイド分子の天然のヘアピンまたはステムループ構造は、伸長されるか、または伸長されたステムループによって置換される。特定の場合に、ステムの伸長により、ガイド分子とCRISPR-Casタンパク質との結合を促進できることが示されている(Chen et al. Cell. (2013); 155(7): 1479-1491)。特定の実施形態では、ステムループのステムは、少なくとも1、2、3、4、5個、またはそれ以上の相補的塩基対によって伸長される(すなわち、ガイド分子での2、4、6、8、10個またはそれ以上のヌクレオチドの付加に対応する)。特定の実施形態では、これら塩基対は、ステムループのループに隣接して、ステムの末端に位置する。
実施形態によっては、ガイド分子は、DNAまたはRNAであってもよい別々の非共有結合配列を有するステムループを形成する。特定の実施形態では、ガイドを形成する配列は、まず標準的なホスホラミダイト合成手順を用いて合成される(Herdewijn, P., ed., 分子生物学での手法(Methods in Molecular Biology)Col 288, オリゴヌクレオチド合成:方法および応用(Oligonucleotide Synthesis: Methods and Applications), Humana Press, New Jersey (2012))。実施形態によっては、これらの配列は、当技術分野で既知の標準手順を用いて、連結のための適切な官能基を含むように官能化されてもよい(Hermanson, G. T., 生体結合技術(Bioconjugate Techniques), Academic Press (2013))。官能基の例として、限定はされないが、ヒドロキシル、アミン、カルボン酸、カルボン酸ハロゲン化物、カルボン酸活性エステル、アルデヒド、カルボニル、クロロカルボニル、イミダゾリルカルボニル、ヒドロジド、セミカルバジド、チオセミカルバジド、チオール、マレイミド、ハロアルキル、スフォニル、アリル、プロパルギル、ジエン、アルキン、およびアジドが挙げられる。この配列が官能化されると、この配列と直接反復配列との間に共有化学結合または連結が形成される。化学結合の例として、限定はされないが、カルバミン酸、エーテル、エステル、アミド、イミン、アミジン、アミノトリジン、ヒドロゾン、ジスルフィド、チオエーテル、チオエステル、ホスホロチオ酸、ホスホロジチオ酸、スルホンアミド、スルホン酸、フルフォン、スルホキシド、尿素、チオ尿素、ヒドラジド、オキシム、トリアゾール、光不安定性結合、Diels-Alder環状付加対または閉環メタセシス対などのC-C結合形成基、およびMichael反応対に基づく結合が挙げられる。
実施形態によっては、これらのステムループ形成配列は、化学的に合成されてもよい。実施形態によっては、化学合成は、2’-アセトキシエチルオルトエステル(2'-ACE)(Scaringe et al., J. Am. Chem. Soc. (1998) 120: 11820-11821; Scaringe, Methods Enzymol. (2000) 317: 3-18)または2’-チオノカルバミン酸(2'-TC)(Dellinger et al., J. Am. Chem. Soc. (2011) 133: 11540-11546; Hendel et al., Nat. Biotechnol. (2015) 33:985-989)の化学作用による自動化された固相オリゴヌクレオチド合成装置を用いる。
RNA分解酵素の感受性の減弱
実施形態によっては、Cas12bによる切断などのRNA切断に対するガイド分子の感受性を減弱させることを目的とする。従って、特定の実施形態では、ガイド分子は、Cas12bまたは他のRNA切断酵素による切断を回避するように調節される。
特定の実施形態では、RNA分解酵素または発現の低下に対するガイド分子の感受性は、その機能に影響を及ぼさない程度のガイド分子の配列の微細な改変によって減弱させることができる。例えば、特定の実施形態では、U6 Pol-IIIの早期転写などの転写の早期完結は、ガイド分子配列中の仮想Pol-III終止因子(4つの連続するUの因子)を改変して排除することができる。ガイド分子のステムループ中にその配列改変が必要な場合には、その改変は、好ましくは塩基対フリップによって確実にできる。
二次構造の縮小
実施形態によっては、ガイド分子(直接反復および/またはスペーサー)の配列は、ガイド分子内の二次構造の程度を低減するように選択される。実施形態によっては、核酸標的化ガイドRNAの約75%、50%、40%、30%、25%、20%、15%、10%、5%、1%、またはそれ以下のヌクレオチドは、最適に折り畳まれた際の自己相補的な塩基対形成に関与する。最適な折り畳みは、任意の適切なポリヌクレオチド折り畳みアルゴリズムによって決定されてもよい。一部のプログラムは、Gibbsの最小自由エネルギーの計算に基づいている。そのアルゴリズムの一例は、ZukerおよびStiegler(Nucleic Acids Res. 9 (1981), 133-148)によって説明されているmFoldである。別の折り畳みアルゴリズムの例としては、重心構造予測アルゴリズムを用いてウィーン大学の理論化学研究所で開発されたオンラインのウェブサーバーRNAfoldである(例えば、A.R. Gruber et al., 2008, Cell 106(1): 23-24、およびPA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62を参照)。
結合tracr配列
実施形態によっては、ガイド分子は、非ホスホジエステル結合を介して化学的に連結または結合されたtracr配列およびtracr mate配列を含む。一側面では、ガイドは、非ヌクレオチドループを介して化学的に連結または結合されたtracr配列およびtracr mate配列を含む。実施形態によっては、tracr配列およびtracr mate配列は、非ホスホジエステル共有結合リンカーを介して結合される。共有結合リンカーの例として、限定はされないが、カルバミン酸、エーテル、エステル、アミド、イミン、アミジン、アミノトリジン、ヒドロゾン、ジスルフィド、チオエーテル、チオエステル、ホスホロチオ酸、ホスホロジチオ酸、スルホンアミド、スルホン酸、フルフォン、スルホキシド、尿素、チオ尿素、ヒドラジド、オキシム、トリアゾール、光不安定性結合、Diels-Alder環状付加対または閉環メタセシス対などのC-C結合形成基、およびMichael反応対からなる群から選択される化学的部分が挙げられる。
実施形態によっては、tracr配列およびtracr mate配列は、まず標準的なホスホルアミダイト合成手順を用いて合成される(Herdewijn, P., ed., 分子生物学での手法(Methods in Molecular Biology)Col 288, オリゴヌクレオチド合成:方法および応用(Oligonucleotide Synthesis: Methods and Applications), Humana Press, New Jersey (2012))。実施形態によっては、tracr配列およびtracr mate配列は、当技術分野で知られている標準手順を用いて、連結のための適切な官能基を含むように官能化されてもよい(Hermanson, G. T., 生体結合技術(Bioconjugate Techniques), Academic Press (2013))。官能基の例として、限定はされないが、ヒドロキシル、アミン、カルボン酸、カルボン酸ハロゲン化物、カルボン酸活性エステル、アルデヒド、カルボニル、クロロカルボニル、イミダゾリルカルボニル、ヒドロジド、セミカルバジド、チオセミカルバジド、チオール、マレイミド、ハロアルキル、スフォニル、アリル、プロパルギル、ジエン、アルキン、およびアジドが挙げられる。tracr配列およびtracrmate配列が官能化されると、2つのオリゴヌクレオチド間に共有化学結合または連結が形成される。化学結合の例として、限定はされないが、カルバミン酸、エーテル、エステル、アミド、イミン、アミジン、アミノトリジン、ヒドロゾン、ジスルフィド、チオエーテル、チオエステル、ホスホロチオ酸、ホスホロジチオ酸、スルホンアミド、スルホン酸、フルフォン、スルホキシド、尿素、チオ尿素、ヒドラジド、オキシム、トリアゾール、光不安定性結合、Diels-Alder環状付加対または閉環メタセシス対などのC-C結合形成基、およびMichael反応対に基づく結合が挙げられる。
実施形態によっては、tracr配列およびtracr mate配列を化学的に合成してもよい。実施形態によっては、化学合成は、2’-アセトキシエチルオルトエステル(2'-ACE)(Scaringe et al., J. Am. Chem. Soc. (1998) 120: 11820-11821; Scaringe, Methods Enzymol. (2000) 317: 3-18)または2’-チオノカルバミン酸(2'-TC)(Dellinger et al., J. Am. Chem. Soc. (2011) 133: 11540-11546; Hendel et al., Nat. Biotechnol. (2015) 33:985-989)の化学作用による自動化された固相オリゴヌクレオチド合成装置を用いる。
実施形態によっては、tracr配列およびtracr mate配列を、糖、ヌクレオチド間ホスホジエステル結合、プリン残基、およびピリミジン残基の改変を介して、様々な生物結合反応、ループ、架橋、および非ヌクレオチド連結を用いて共有結合してもよい。Sletten et al., Angew. Chem. Int. Ed. (2009) 48:6974-6998、Manoharan, M. Curr. Opin. Chem. Biol. (2004) 8: 570-9、Behlke et al., Oligonucleotides (2008) 18: 305-19、Watts, et al., Drug. Discov. Today (2008) 13: 842-55、およびShukla, et al., ChemMedChem (2010) 5: 328-49を参照。
実施形態によっては、tracr配列およびtracr mate配列を、クリックケミストリーを用いて共有結合してもよい。実施形態によっては、tracr配列およびtracr mate配列を、トリアゾールリンカーを用いて共有結合してもよい。実施形態によっては、tracr配列およびtracr mate配列を、アルキンおよびアジドを含むHuisgen 1,3-双極環化付加反応を用いて共有結合して、非常に安定なトリアゾールリンカーを生成してもよい(He et al., ChemBioChem (2015) 17: 1809-1812; WO2016/186745)。実施形態によっては、tracr配列およびtracr mate配列を、5’-ヘキシンtracrRNAおよび3’-アジドcrRNAを連結して共有結合する。実施形態によっては、5’-ヘキシンtracrRNAおよび3’-アジドcrRNAの一方または両方は、2’-アセトキシエチルオルトエステル(2’-ACE)基で保護されていてもよく、これは、その後にDharmaconの手順を用いて除去されてもよい(Scaringe et al., J. Am. Chem. Soc. (1998) 120: 11820-11821; Scaringe, Methods Enzymol. (2000) 317: 3-18)。
実施形態によっては、tracr配列およびtracr mate配列を、スペーサー、付加物、生体結合物、発色団、レポーター基、色素標識RNA、および非天然起源ヌクレオチド類似体などの部分を含むリンカー(例えば非ヌクレオチドループ)を介して共有結合してもよい。より具体的には、本発明の目的に適するスペーサーには、限定はされないが、ポリエーテル(例えば、ポリエチレングリコール、ポリアルコール、ポリプロピレングリコール、またはエチレングリコールとプロピレングリコールの混合物)、ポリアミン基(例えば、スペニン、スペルミジン、およびそれらのポリマー誘導体)、ポリエステル(例えば、ポリアクリル酸エチル)、ポリホスホジエステル、アルキレン、およびそれらの組合せが含まれる。適切な付加物には、限定はされないが、リンカーに追加の特性を付加するためにリンカーに付加できる蛍光標識などの任意の部分を含んでもよい。適切な生体結合物には、限定はされないが、ペプチド、グリコシド、脂質、コレステロール、リン脂質、ジアシルグリセロールおよびジアルキルグリセロール、脂肪酸、炭化水素、酵素基質、ステロイド、ビオチン、ジゴキシゲニン、炭水化物、多糖類が含まれる。適切な発色団、レポーター基、および色素標識RNAには、限定はされないが、フルオレセインおよびローダミンなどの蛍光色素、化学発光、電気化学発光、および生物発光の各マーカー化合物が含まれる。2つのRNA成分を結合するリンカー例の設計はまた、国際特許出願WO2004/015075号に説明されている。
リンカー(例えば、非ヌクレオチドループ)は、任意の長さであってもよい。実施形態によっては、リンカーは、約0~16個のヌクレオチドに相当する長さを有する。実施形態によっては、リンカーは、約0~8個のヌクレオチドに相当する長さを有する。実施形態によっては、リンカーは、約0~4個のヌクレオチドに相当する長さを有する。実施形態によっては、リンカーは、約2個のヌクレオチドに相当する長さを有する。リンカー設計の例はまた、国際特許出願WO2011/008730号に説明されている。
典型的なCas9 sgRNAは、(5’→3’方向に)ガイド配列、ポリU路、第1の相補的伸長(「反復」)、ループ(四塩基ループ)、第2の相補的伸長(反復に相補的な「アンチ反復」)、ステム、さらにステムループとステム、およびポリA(RNAでは多くはポリU)テール(終止因子)を含む。典型的なCas12b sgRNAは同様の成分を含むが、方向が逆、すなわち3’→5’の方向である。直接反復(DR)は、tracrRNAとハイブリダイズしてcrRNA:tracrRNA二重鎖を形成し、これは、Cas12bに負荷されて、DNAの認識および切断を誘導する。Cas12bは、プロトスペーサー配列の5’末端にあるT富化PAMを認識して、DNA干渉を媒介する。特定の実施形態では、tracrの5’末端は、ステムループを形成する。特定の実施形態では、tracrRNAおよび5’DRのヌクレオチドは、反復:アンチ反復の二重鎖を形成する。特定の実施形態では、sgRNA構築物は、Shmakov et al., 2015, Molecular Cell 60, 385-397によって予測された構造と一致する。特定の実施形態では、sgRNA構築物は、Liu et al., 2017, Molecular Cell 65, 310-322によって予測された構造と一致する。好ましい実施形態では、ガイド構築物の特定の側面が保持され、ガイド構築物の特定の側面は、例えば、機能の追加、削除、または置換によって改変されてもよいが、ガイド構築物の他の特定の側面は維持される。限定はされないが、挿入、欠失、および置換を含む、遺伝子操作されたsgRNA改変の好ましい位置には、CRISPRタンパク質および/または標的、例えば四塩基ループおよび/またはループ2と複合体を形成するときに露出するsgRNAのガイド末端および領域が含まれる。
特定の実施形態では、本発明のガイドは、アダプタータンパク質に対する特異的結合部位(例えばアプタマー)を含み、これは、(例えば融合タンパク質を介する)1個以上の機能ドメインを含んでもよい。このガイドがCRISPR複合体(すなわちガイドおよび標的に結合するCRISPR酵素)を形成する場合に、アダプタータンパク質は結合し、アダプタータンパク質に会合する機能ドメインは、属性機能を有効にするのに有益な空間的な方向に配置される。例えば、機能ドメインが転写活性化因子(例えば、VP64またはp65)である場合に、転写活性化因子は、それが標的の転写に影響を与えることを可能にする空間的な方向に配置される。同様に、転写抑制因子は、標的の転写に影響を与えるように有効に配置され、ヌクレアーゼ(例えばFok1)は、標的を切断または部分的に切断するように有効に配置される。
当業者は、アダプター+機能ドメインの結合を可能にするが(例えば、CRISPR複合体の三次元構造内の立体障害により)アダプター+機能ドメインの適切な配置を可能にしないガイドへの改変が意図しない改変であることを分かっている。1個以上の改変ガイドは、本明細書に説明されるように、四塩基ループ、ステムループ1、ステムループ2、またはステムループ3で、好ましくは四塩基ループまたはステムループ2のいずれかで、最も好ましくは四塩基ループおよびステムループ2の両方で改変されてもよい。
反復:アンチ反復の二重鎖は、sgRNAの二次構造から明白になる。典型的なCas9 sgRNAでは、その二重鎖は通常、(5’→3’方向の)ポリU路の後かつ四塩基ループの前の第1の相補的な伸長部、および(5’→3’方向の)四塩基ループの後かつポリA路の前の第2の相補的な伸長部であってもよい。第1の相補的な伸長部(「反復」)は、第2の相補的な伸長部(「アンチ反復」)に相補的である。特定の実施形態では、Cas12b sgRNAの構築物は、Shmakov et al., 2015, Molecular Cell 60, 385-397によって予測される構造と一致する。特定の実施形態では、Cas12b sgRNAの構築物は、Liu et al., 2017, Molecular Cell 65, 310-322によって予測される構造と一致する。このように、それらのsgRNAは、ワトソン-クリック塩基対を含んで、互いに折り畳まれる際にdsRNAの二重鎖を形成する。このように、アンチ反復配列は、A-UまたはC-Gの塩基対の観点から、またアンチ配列がステムループまたは他の構築形態のために逆方向にあるという事実の観点から、反復の相補的な配列となる。
本発明の一実施形態では、ガイド構築物の改変は、ステムループ2中の塩基を置換することを含む。例えば、実施形態によっては、ステムループ2中の「actt」(RNAでは「acuu」)塩基および「aagt」(RNAでは「aagu」)塩基は、「cgcc」および「gcgg」で置換される。実施形態によっては、ステムループ2中の「actt」塩基および「aagt」塩基は、4個のヌクレオチドの相補的なGCリッチ領域で置換される。実施形態によっては、4個のヌクレオチドの相補的なGCリッチ領域は、(両方とも5’→3’方向での)「cgcc」および「gcgg」である。実施形態によっては、4個のヌクレオチドの相補的なGCリッチ領域は、(両方とも5’→3’方向での)「gcgg」および「cgcc」である。4個のヌクレオチドの相補的なGCリッチ領域中のCとGの他の組合せは、CCCCとGGGGを含むのが明白である。
一側面では、ステムループ2、例えば「ACTTgtttAAGT」(配列番号397)は、任意の「XXXXgtttYYYY」(配列番号398)によって置換されてもよく、例えば、式中のXXXXおよびYYYYは、共に互いに塩基対となってステムを形成する任意のヌクレオチド組を表す。
一側面では、ステムは、相補的なX配列およびY配列を含む少なくとも約4塩基対を含むが、例えばより多い5、6、7、8、9、10、11、または12個の塩基対、あるいは例えばより少ない3、2個の塩基対もまた想定される。従って、例えば、X:2~12およびY:2~12(XおよびYは、任意の相補的なヌクレオチド組を表す)が想定されてもよい。一側面では、XおよびYヌクレオチドからなるステムは、「gttt」と共に、全体的な二次構造中に完全なヘアピンを形成し、このステムは有益であって、塩基対の量は、完全なヘアピンを形成する任意の量であってもよい。一側面では、sgRNA全体の二次構造が保持されている限り、(例えば長さに関して)任意の相補的なX:Y塩基対配列は許容される。一側面では、ステムは、DR:tracr二重鎖および3個のステムループを有するという点で、sgRNA全体の二次構造を破壊しないX:Y塩基対形成の形態であってもよい。一側面では、ACTTとAAGT(またはX:Y塩基対からなる任意の代替ステム)を接続する「gttt」四塩基ループは、sgRNAの全体の二次構造を分断しない同じ長さ(例えば4塩基対)以上の任意の配列であってもよい。一側面では、ステムループは、ステムループ2をさらに伸長するものであってもよく、例えばMS2アプタマーであってもよい。一側面では、ステムループ3「GGCACCGagtCGGTGC」(配列番号399)は、同様に「XXXXXXXagtYYYYYYY」(配列番号400)形態を取ってもよく、例えば、X:7およびY:7は、共に互いに対し塩基対となってステムを形成する任意の相補的なヌクレオチド組を表す。一側面では、ステムは、相補的なX配列およびY配列を含む約7塩基対を含むが、より多い、またはより少ない塩基対のステムもまた想定される。一側面では、XおよびYヌクレオチドからなるステムは、「agt」とともに、全体的な二次構造中に完全なヘアピンを形成する。一側面では、sgRNA全体の二次構造が保持されている限り、任意の相補的X:Y塩基対配列が許容される。一側面では、ステムは、DR:tracr二重鎖および3つのステムループを有するという点で、sgRNA全体の二次構造を破壊しないX:Y塩基対形成の形態であってもよい。一側面では、ステムループ3の「agt」配列は、伸長されるか、またはMS2アプタマーなどのアプタマー、またはその他の方法で一般にステムループ3の構築物を保持する配列によって置換されてもよい。代替ステムループ2および/または3の1つの側面では、XおよびYの各対は任意の塩基対を指していてもよい。一側面では、非ワトソン-クリック塩基対が想定されており、この場合に、その対は、その他の方法で一般にその位置でステムループの構築物を保持する。
一側面では、DR:tracrRNA二本鎖は、(ヌクレオチドの標準IUPAC命名法を用いて)gYYYYag(N)NNNNxxxxNNNN(AAN)uuRRRRu(配列番号401)の形態で置換されてもよく、式中、(N)および(AAN)は二重鎖のバルジの一部を表し、「xxxx」はリンカー配列を表す。直接反復のNNNNは、それがtracrRNAの対応するNNNN部分と塩基対を形成する限り、どんなものでもよい。一側面では、DR:tracrRNA二重鎖は、それが全体的な構造を変化させない限り、任意の長さ(xxxx…)かつ任意の塩基組成物のリンカーによって結合されていてもよい。
一側面では、sgRNAの構造的要件は、二重鎖および3個のステムループを有することである。殆どの側面では、多くの特定の塩基要件での現実的な配列要件は、DR:tracrRNA二重鎖の構築物を保持すべきであるという点で制限は緩く、構築物を形成する配列、すなわちステム、ループ、バルジは、変更されていてもよい。
第1のアプタマー/RNA結合タンパク質の対を有する1つのガイドは、活性化因子に連結または融合することができ、第2のアプタマー/RNA結合タンパク質の対を有する第2のガイドは、抑制因子に連結または融合することができる。ガイドは異なる標的(遺伝子座)を対象とするので、これにより1つの遺伝子を活性化して1つの遺伝子を抑制できる。例えば、次の系統図はその方式を示している。
ガイド1:MS2アプタマー------- MS2 RNA結合タンパク質------- VP64活性化因子、および
ガイド2:PP7アプタマー------- PP7 RNA結合タンパク質------- SID4x抑制因子。
本発明はまた、オルソゴナル(直交;orthogonal)PP7/MS2遺伝子の標的化に関する。この例では、異なる遺伝子座を標的とするsgRNAは、それぞれ標的遺伝子座を活性化および抑制するMS2-VP64またはPP7-SID4Xを動員するために、個別のRNAループで改変されている。PP7は、バクテリオファージであるシュードモーナス属のRNA結合外皮タンパク質である。MS2と同様に、それは特定のRNA配列および二次構造に結合する。PP7 RNA認識モチーフは、MS2のモチーフとは異なる。その結果、PP7およびMS2を多重化して、異なるゲノム遺伝子座で同時に異なる効果を媒介できる。例えば、遺伝子座Aを標的とするsgRNAをMS2ループで改変してMS2-VP64活性化因子を動員し、遺伝子座Bを標的とする別のsgRNAをPP7ループで改変してPP7-SID4X抑制因子ドメインを動員できる。従って、同じ細胞内で、dC2c1はオルソゴナルである遺伝子座特異的改変を媒介できる。この原理を拡張して、Q-betaなどの他のオルソゴナルRNA結合タンパク質を組み込むことができる。
オルソゴナル抑制のための別の選択は、相互作用の抑制機能を有する非翻訳RNAループをガイド中に(ガイド中に組み込まれたMS2/PP7ループと同様の位置またはガイドの3’末端のいずれかに)組み込むことを含む。例えば、ガイドは(抑制的であることは知られているが)非翻訳RNAループにより(例えば、哺乳類細胞中のRNAポリメラーゼIIに干渉する(RNA内の)Alu抑制因子を使用して)設計された。Alu RNA配列は、本明細書で使用される(例えば、四塩基ループおよび/またはステムループ2での)MS2 RNA配列に代えて配置され、かつ/あるいはガイドの3’末端に配置された。これにより、四塩基ループ位置および/またはステムループ2位置でMS2、PP7、またはAluの可能な組み合わせが得られ、任意にガイドの3’末端にAluが(リンカーの有無にかかわらず)付加される。
2つの異なるアプタマー(別々のRNA)を使用すると、異なるガイドと共に、活性化因子-アダプタータンパク質融合および抑制因子-アダプタータンパク質融合を使用して、1つの遺伝子の発現を活性化する一方で、別の遺伝子を抑制することが可能になる。これらアプタマーは、これらの異なるガイドとともに、多重化された手法で、共にあるいは実質的に共に付与することができる。例えば10または20または30個などの多数のこの改変されたガイドを同時に使用してもよいが、比較的少数のC2c1として送達される1個のみ(または少なくとも最小数)のC2c1は、多数の改変されたガイドとともに使用してもよい。アダプタータンパク質は、1個以上の活性化因子または1個以上の抑制因子に会合(好ましくは結合または融合)してもよい。例えば、アダプタータンパク質は、第1の活性化因子および第2の活性化因子と会合してもよい。第1および第2の活性化因子は同一であってもよいが、これらは、好ましくは異なる活性化因子である。例えば、一方はVP64であってもよく他方はp65であってもよいが、これらは単なる例であり、他の転写活性化因子が想定される。3個以上さらに4個以上の活性化因子(または抑制因子)を使用してもよいが、封入サイズは、その数が5個を超える異なる機能ドメインにより制限される場合がある。リンカーは、好ましくは、アダプタータンパク質への直接融合よりも多く使用され、この場合は、2個以上の機能ドメインがアダプタータンパク質に会合している。適切なリンカーとして、GlySerリンカーを含んでもよい。
酵素-ガイド複合体は、全体として、2個以上の機能ドメインと会合してもよいこともまた想定されている。例えば、酵素に会合する2個以上の機能ドメインがあってもよく、あるいは(1個以上のアダプタータンパク質を介して)ガイドに会合する2個以上の機能ドメインがあってもよく、あるいは酵素に会合する1個以上の機能ドメインおよび(1個以上のアダプタータンパク質を介して)ガイドに会合する1個以上の機能ドメインがあってもよい。
アダプタータンパク質と活性化因子または抑制因子との間の融合は、リンカーを含んでもよい。例えば、GlySerリンカーGGGSを使用してもよい。それらリンカーは、必要に応じて適切な長さを提供するために、3個の((GGGGS)3)または6、9、さらには12個、またはそれ以上の反復で使用してもよい。リンカーは、RNA結合タンパク質と機能ドメイン(活性化因子または抑制因子)の間に、またはCRISPR酵素(C2c1)と機能ドメイン(活性化因子または抑制因子)の間に使用してもよい。リンカーを使用して、適切な量の「機械的柔軟性」を操作する。
エスコートガイドおよび誘導ガイド
好ましい実施形態では、直接反復は、1個以上のタンパク質結合RNAアプタマーを含むように改変されてもよい。特定の実施形態では、最適化された二次構造の一部などの1個以上のアプタマーを含んでもよい。これらのアプタマーは、本明細書でさらに詳述されるように、バクテリオファージ外皮タンパク質に結合できる可能性がある。
特定の実施形態では、ガイドは、エスコートされたガイドである。「エスコートされた」とは、Cas12b CRISPR-Casシステムまたは複合体またはガイドが指定の時間でまたは細胞内の場所に送達されることを意味し、その結果、Cas12b CRISPR-Casシステムまたは複合体またはガイドの活性は、空間的または時間的に制御される。例えば、Cas12b CRISPR-Casシステムまたは複合体またはガイドの活性および目的地は、細胞表面タンパク質または他の局在化した細胞成分などのアプタマーリガンドに対して結合親和性を有するエスコートRNAアプタマー配列によって制御されてもよい。あるいは、エスコートアプタマーは、例えば、特定の時間に細胞に適用される外部エネルギー源の一時的エフェクターなどの、細胞表面または細胞内のアプタマーエフェクターに応答してもよい。
エスコートされたCas12b CRISPR-Casシステムまたは複合体は、ガイド分子構造、構築物、安定性、遺伝子発現、またはそれらの任意の組合せを改善するように設計された機能的構造を備えるガイド分子を有する。この構造は、アプタマーを含んでもよい。
アプタマーは、例えば、指数関数的な濃縮によるリガンドの系統的進化と呼ばれる技術を使用して、他のリガンドに強固に結合するように設計または選択されることが可能な生体分子である(SELEX; Tuerk C, Gold L:「指数関数的濃縮によるリガンドの系統的進化:バクテリオファージT4 DNAポリメラーゼに対するRNAリガンド」“Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase.” Science 1990, 249:505-510)。核酸アプタマーは、例えば、無作為配列オリゴヌクレオチドの集合から選択されてもよく、生物医学的に関連する広範囲の標的に対して高い結合親和性および特異性を有して、アプタマーの幅広い治療的有用性を示唆している(Keefe, Anthony D., Supriya Pai, and Andrew Ellington.「治療薬としてのアプタマー」"Aptamers as therapeutics." Nature Reviews Drug Discovery 9.7 (2010): 537-550)。これらの特徴はまた、薬物送達媒体としてのアプタマーの幅広い使用を示唆している(Levy-Nissenbaum, Etgar, et al.「ナノテクノロジーおよびアプタマー:薬物送達への応用」"Nanotechnology and aptamers: applications in drug delivery." Trends in biotechnology 26.8 (2008): 442-449、およびHicke BJ, Stephens AW.「エスコートアプタマー:診断と治療のための送達サービス」“Escort aptamers: a delivery service for diagnosis and therapy.” J Clin Invest 2000, 106:923-928.)。アプタマーは、分子スイッチとして機能するように構築され、蛍光体に結合して緑色蛍光タンパク質の活性を模倣するRNAアプタマーなどの変化特性に応答する(Paige, Jeremy S., Karen Y. Wu, and Samie R. Jaffrey.「緑色蛍光タンパク質のRNA模倣物」"RNA mimics of green fluorescent protein." Science 333.6042 (2011): 642-646)。アプタマーは、例えば細胞表面タンパク質を標的とする標的化されたsiRNA治療送達システムの成分として使用されてもよいことも示唆されている(Zhou, Jiehua, and John J. Rossi.「アプタマー標的化細胞特異的RNA干渉」"Aptamer-targeted cell-specific RNA interference." Silence 1.1 (2010): 4)。
従って、特定の実施形態では、ガイド分子は、例えば、細胞膜を貫通して細胞内区画に、または核内に送達することを含む、ガイド分子の送達を改善するように設計された1個以上のアプタマーによって改変される。この構造は、1個以上のアプタマーに加えて、またはその1個以上のアプタマーを含まずに、選択されたエフェクターにガイド分子を送達可能、誘導可能、または応答可能にするような部分を含んでもよい。従って、本発明は、限定はされないが、pH、低酸素、O濃度、温度、タンパク質濃度、酵素濃度、脂質構造、露光量、機械的破壊(例えば超音波)、磁界、電界、または電磁放射を含む、正常または病理学的かつ生理学的な状態に応答するガイド分子を包含する。
誘導性システムの光応答性は、クリプトクロム-2およびCIB1の活性化および結合を介して達成されてもよい。青色光刺激は、クリプトクロム-2に活性な高次構造変化を誘発して、その結合相手であるCIB1の動員をもたらす。この結合は高速かつ可逆的であり、パルス刺激後に15秒未満で飽和して、刺激の終止後に15分未満で基準線に戻る。これらの迅速な結合動態は、誘導剤の取込みおよび排出ではなく、転写/翻訳および転写物/タンパク質の分解の速度によってのみ一時的に結合されるシステムをもたらす。クリプトクロム-2の活性化もまた非常に感度が高く、低光度による刺激の使用を可能にし、光毒性のリスクを軽減する。さらに、無処置の哺乳動物の脳などの環境では、可変光強度を使用して刺激領域のサイズを制御でき、ベクター送達のみが提供するよりも高い精度を可能にする。
本発明では、ガイドを誘導するために、電磁放射、音響エネルギー、または熱エネルギーなどのエネルギー源が考えられる。好ましくは、電磁放射は可視光の構成要素である。好ましい実施形態では、光は、約450~約495 nmの波長を有する青色光である。特に好ましい実施形態では、波長は約488 nmである。別の好ましい実施形態では、光刺激はパルス状である。光出力は、約0~9m W/cm2の範囲であってもよい。好ましい実施形態では、15秒毎に0.25秒という短い刺激構造が最大の活性化をもたらすはずである。
化学的またはエネルギー感受性のガイドは、化学原料の結合によって、あるいはガイドとして作用しかつC2c1 CRISPR-Casシステムまたは複合的な機能をもつことを可能とするエネルギーによって誘導されると、高次構造変化を受ける可能性がある。本発明は、ガイド機能およびC2c1 CRISPR-Casシステムまたは複合的な機能を有するように、化学原料またはエネルギーを使用すること、および必要に応じて、ゲノム遺伝子座の発現が変化していることをさらに決定することを含んでもよい。
この化学的誘導性システムには、いくつかの種々の方式が存在する。これら方式は、1)アブシジン酸(ABA)によって誘導可能なABI-PYL系システム(例えば、stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2を参照)、2)ラパマイシン(またはラパマイシンに基づく関連化学物質)によって誘導されるFKBP-FRB系システム(例えば、www.nature.com/nmeth/journal/v2/n6/full/nmeth763.htmlを参照)、および3)ジベレリン(GA)によって誘導可能なGID1-GAI系システム(例えば、www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.htmlを参照)である。
化学的誘導性システムは、4-ヒドロキシタモキシフェン(4OHT)によって誘導可能なエストロゲン受容体(ER)系システムであってもよい(例えば、www.pnas.org/content/104/3/1027.abstractを参照)。ERT2と呼ばれるエストロゲン受容体の変異したリガンド結合ドメインは、4-ヒドロキシタモキシフェンの結合時に細胞の核内に移動する。本発明のさらなる実施形態では、任意の核内受容体、甲状腺ホルモン受容体、レチノイン酸受容体、エストロゲン受容体、エストロゲン関連受容体、グルココルチコイド受容体、プロゲステロン受容体、およびアンドロゲン受容体の任意の天然起源または遺伝子操作された誘導体を、ER系の誘導性システムに類似した誘導性システムに使用してもよい。
別の誘導性システムは、エネルギー、熱、または電波によって誘導可能な一過性受容体電位(TRP)イオンチャネル系システムを使用する方式に基づく(例えば、www.sciencemag.org/content/336/6081/604を参照)。これらのTRPファミリータンパク質は、光および熱などの様々な刺激に応答する。このタンパク質が光または熱によって活性化されると、イオンチャネルが開き、カルシウムなどのイオンが原形質膜に進入することができる。このイオンの流入は、C2c1 CRISPR-Cas複合体またはシステムのガイドおよび他の成分を含むポリペプチドに連結された細胞内イオン相互作用相手に結合し、この結合はポリペプチドの細胞内局在化の変化を誘発して、ポリペプチド全体の細胞核への進入を導く。核内に入ると、C2c1 CRISPR-Cas複合体のガイドタンパク質およびその他の成分が活性になり、細胞内の標的遺伝子の発現を調節する。
光活性化は有効な実施形態ではあるものの、特に光が皮膚または他の器官を透過しない可能性があるin vivo用途にとっては、不都合な場合がある。この場合には、エネルギー活性化のその他の方法、特に同様の効果を有する電界エネルギーおよび/または超音波が考えられる。
電界エネルギーは、好ましくは、in vivo条件下で約1 V/cm~約10 kV/cmの1つ以上の電気パルスを使用して、当技術分野に説明されるように実質的に印加される。パルスに代えて、またはパルスに加えて、電界は連続的な方法で送達されてもよい。電気パルスを、1マイクロ秒~500ミリ秒、好ましくは1マイクロ秒~100ミリ秒で適用してもよい。電界を、連続的に、またはパルス方式で約5分間印加してもよい。
本明細書で使用される「電界エネルギー」は、細胞が曝露される電気エネルギーである。好ましくは、電界は、in vivo条件下で約1 V/cm~約10 kV/cmまたはそれ以上の強度を有する(国際特許出願WO97/49450号を参照)。
本明細書で使用される用語「電場」は、可変静電容量および電圧で、指数関数波および/または矩形波および/または変調波および/または変調矩形波の形態を含む1つ以上のパルスを含む。電界および電気についての記載は、細胞の環境での電位差の存在の記載を含むと解釈すべきである。この環境は、当技術分野で知られるように、静電気、交流(AC)、直流(DC)などによって設定してもよい。電界は、均一、不均一、またはその他の形態であってもよく、時間に依存して強度および/または方向が変化してもよい。
電場の単一または複数の印加、ならびに超音波の単一または複数の印加もまた、任意の順序および任意の組合せにより可能である。超音波および/または電場は、単一または複数の連続的な印加として、またはパルスとして送達されてもよい(脈動送達)。
エレクトロポレーション(電気穿孔)は、生細胞に異物を導入するために、in vitroおよびin vivoの両方の手順で使用されてきた。in vitro適用では、生細胞の試料はまず関心のある薬剤と混合されて、平行平板などの電極の間に配置される。次に、電極は細胞/移植物の混合物に電界を印加する。in vitroエレクトロポレーションを実行するシステム例として、Electro Cell ManipulatorECM600、およびElectroSquare Porator T820があげられ、どちらもGenetronics、IncのBTX部門によって製造されている(米国特許第5,869,326号を参照)。
(in vitroおよびin vivo両方の)既知のエレクトロポレーション技術を、治療領域の周りに配置された電極に短い高電圧パルスを印加して機能させる。電極間に発生する電界により、細胞膜が一時的に多孔質になり、関心のある薬剤分子が細胞に進入する。既知のエレクトロポレーション用途では、この電界は、1000 V/cmで約100マイクロ秒の持続時間の単一の矩形波パルスを含む。このパルスは、例えば、Electro Square Porator T820の既知の適用法により生成してもよい。
好ましくは、電界は、in vitro条件下で約1 V/cm~約10 kV/cmの強度を有する。従って、電界は、1 V/cm、2 V/cm、3 V/cm、4 V/cm、5 V/cm、6 V/cm、7 V/cm、8 V/cm、9 V/cm、10 V/cm、20 V/cm、50 V/cm、100 V/cm、200 V/cm、300 V/cm、400 V/cm、500 V/cm、600 V/cm、700 V/cm、800 V/cm、900 V/cm、1 kV/cm、2 kV/cm、5 kV/cm、10 kV/cm、20 kV/cm、50 kV/cm、またはそれ以上の強度を有してもよい。より好ましくは、in vitro条件下で約0.5 kV/cm~約4.0 kV/cmである。好ましくは、電界は、in vivo条件下で約1 V/cm~約10 kV/cmの強度を有する。しかし、標的部位に送達されるパルスの数を増加させる場合には、電界強度は低下させてもよい。従って、より低い電界強度での電界の脈動送達が想定される。
好ましくは、電場の印加は、同一強度および静電容量の二重パルス、または様々な強度および/または静電容量の連続パルスなどの複数のパルス形態である。本明細書で使用される用語「パルス」は、可変静電容量および電圧で、指数波および/または矩形波および/または変調波/矩形波形を含む1つ以上の電気パルスを含む。
好ましくは、電気パルスは、指数波形、矩形波形、変調波形、および変調矩形波から選択される波形として送達される。
好ましい実施形態では、低電圧の直流を使用する。従って、出願人らは、100ミリ秒以上、好ましくは15分以上の期間にわたって、1 V/cm~20 V/cmの電界強度で細胞、組織、または組織塊に印加される電界の使用を開示する。
超音波は、約0.05 W/cm2~約100 W/cm2の電力水準で有効に付与される。診断用または治療用の超音波、またはそれらの組合せを使用してもよい。
本明細書で使用される用語「超音波」は、周波数が非常に高くヒトの可聴範囲を超える機械的振動からなるエネルギーの形態を指す。超音波スペクトルの下限周波数は、一般に約20 kHzと見做すことができる。超音波の多くの診断への応用には、1~15 MHzの範囲の周波数を使用する(医療診断での超音波(Ultrasonics in Clinical Diagnosis), P. N. T. Wells, ed., 2nd. Edition, Publ. Churchill Livingstone [Edinburgh, London & NY, 1977]を参照)。
超音波は、診断および治療の両方の用途で使用されてきた。診断手段(「診断用超音波」)として使用する場合に、超音波は通常、最大約100 mW/cm2のエネルギー密度範囲(FDA推奨)で使用されるが、最大750 mW/cm2のエネルギー密度が使用されてきた。理学療法では、超音波は通常、最大約3~4 W/cm2の範囲(WHO推奨)のエネルギー源として使用される。他の治療用途では、より高い強度の超音波、例えば、100 W/cm2~1 kW/cm2(またはそれ以上)のHIFUを短時間で使用してもよい。本明細書で使用される用語「超音波」は、診断用超音波、治療用超音波、および集束超音波を包含することを意図している。
集束超音波(FUS)は、侵襲性プローブを使用せずに熱エネルギーを送達することを可能にする(Morocz et al 1998 Journal of Magnetic Resonance Imaging Vol.8, No. 1, pp.136-142を参照)。集束超音波の別の形態は、Moussatov et al in Ultrasonics (1998) Vol.36, No.8, pp.893-900およびTranHuuHue et al in Acustica (1997) Vol.83, No.6, pp.1103-1106に説明される高強度集束超音波(HIFU)である。
好ましくは、診断用超音波と治療用超音波の組合せを使用する。しかしながら、この組合せは限定を意図するものではなく、当業者には、超音波の任意の様々な組合せを使用できることが分かる。さらに、エネルギー密度、超音波の周波数、および曝露期間を変更してもよい。
好ましくは、超音波エネルギー源への曝露は、約0.05~約100 W/cm2の出力密度である。さらに好ましくは、超音波エネルギー源への曝露は、約1~約15 W/cm2の出力密度である。
好ましくは、超音波エネルギー源への曝露は、約0.015~約10.0 MHzの周波数である。より好ましくは、超音波エネルギー源への曝露は、約0.02~約5.0 MHzまたは約6.0 MHzの周波数である。最も好ましくは、超音波は3 MHzの周波数で適用される。
好ましくは、曝露時間は、約10ミリ秒~約60分である。好ましくは、曝露時間は、約1秒~約5分である。より好ましくは、超音波は約2分間印加される。しかし分解すべき特定の標的細胞に応じて、曝露はより長い期間、例えば15分間であってもよい。
好ましくは、標的組織は、約0.05 W/cm2~約10 W/cmの音波出力密度、かつ約0.015~約10 MHzの範囲の周波数の超音波エネルギー源に曝露される(国際特許出願WO98/52609号を参照)。ただし別の条件として、例えば、100 W/cm2を超える音波出力密度での超音波エネルギー源への曝露、また例えば1000 W/cm2でミリ秒などの短時間の曝露も可能である。
好ましくは、超音波の適用は、複数のパルス形態であり、従って、連続波とパルス波の両方(超音波の脈動送達)を任意に組合せて使用してもよい。例えば、連続波の超音波を印加して、続いてパルス波の超音波を印加してもよく、またはそれらを逆にして印加してもよい。この印加は、任意の順序および組合せで、任意の回数を繰返してもよい。パルス波の超音波を、連続波の超音波をバックグラウンドとして印加してもよく、任意のパルス数を任意の数の群として使用してもよい。
好ましくは、超音波は、パルス波の超音波を含んでもよい。非常に好ましい実施形態では、超音波は、連続波として0.7 W/cm2または1.25 W/cm2の出力密度で印加される。パルス波の超音波を使用する場合は、より高い出力密度を使用してもよい。
超音波の使用は、光のように、それを標的に正確に合焦できるので有効である。さらに、超音波は、光とは異なり、組織内により深く合焦できるので有効である。従って、(限定はされないが、肝臓の葉部などの)組織全体への浸透、あるいは(限定はされないが、肝臓全体または心臓などの筋肉全体などの)臓器全体の治療に適している。別の重要な利点は、超音波が非侵襲的な刺激であり、様々な診断用途および治療用途で使用されることである。一例として、超音波は、医療用の画像技術、さらには整形外科治療では周知である。さらに、対象である脊椎動物への超音波の印加に適する機器は、広範囲に利用可能であり、またそれらの使用は当技術分野では周知である。
本発明の迅速な転写応答および内因性の標的化は、転写の動力学の研究のための理想的なシステムとなる。例えば、本発明は、標的遺伝子の発現が誘導された際の変異体産生の動力学を研究するのに使用されてもよい。転写サイクルの他方の目的として、多数の遺伝子に発現水準の変化をもたらす強力な細胞外刺激に応答するmRNA分解の研究が実施されることも多い。本発明を利用して、内因性標的の転写を可逆的に誘導することができ、その後に、点刺激を停止して、固有標的の分解動態を追跡できる。
本発明の経時的な精度は、実験操作に呼応する遺伝子調節の時間を測定する能力を提供できる。例えば、長期増強(LTP)に関与している疑いのある標的は、器官型の神経細胞培養物または解離される神経細胞培養物中で調節されてもよいが、細胞の正常な発達を妨げることを避けるため、LTPを誘発する刺激中のみに調節されてもよい。同様に、疾患の表現型を示す細胞モデルでは、特定の治療法の有効性に関与していると疑われる標的は、治療中のみに調節されてもよい。逆に、遺伝性の標的は、病理学的な刺激中にのみ調節されてもよい。外部の実験刺激に対する遺伝的なきっかけの時機が関連する任意の数の実験により、本発明の有用性から潜在的に利益が得られる可能性がある。
in vivoの環境では、本発明が遺伝子発現を制御するための均等に十分な機会が提供される。光誘導性は、空間精度について潜在能力を提供できる。オプトロード(optrode)技術の発展を利用して、刺激用の光ファイバー導線を高精度に脳領域に配置することができる。次に、刺激領域のサイズを光の強度によって調整してもよい。この調整は、本発明のC2c1 CRISPR-Casシステムまたは複合体の送達とともに実施することができ、または遺伝子組換えのC2c1動物の場合に、本発明のガイドRNAを送達することができ、オプトロード技術は、高精度な脳領域での遺伝子発現の調節を可能とする。透明なC2c1発現生物では、それに投与された本発明のガイドRNAを保持することができ、次いで、非常に高精度なレーザーに誘導された局所遺伝子発現変化が発生する。
宿主細胞を培養するための培地には、特に、M199-earle base、Eagle MEM(E-MEM)、Dulbecco MEM(DMEM)、SC-UCM102、UP-SFM(GIBCO BRL)、EX-CELL302(ニチレイ)、EX-CELL293-S(ニチレイ)、TFBM-01(ニチレイ)、ASF104などの組織培養に一般的に用いられる培地が含まれる。特定の細胞型に適する培地は、米国培養細胞系統保存機関(ATCC)または欧州培養細胞系統保存機関(ECACC)から入手できる。培地には、L-グルタミンなどのアミノ酸、塩、Fungizone(R)、ペニシリン-ストレプトマイシン、動物血清などの抗真菌剤または抗菌剤を補充してもよい。細胞培養培地は、場合によっては無血清であってもよい。
本発明はまた、価値のあるin vivoでの経時的精度を提供できる。本発明を用いて、増殖の特定の段階中に遺伝子発現を改変してもよい。本発明を用いて、特定の実験ウィンドウへの遺伝的なきっかけの時間を測定してもよい。例えば、学習に関与する遺伝子は、未処置のげっ歯類または霊長類の脳の高精度な領域での学習刺激中にのみ過剰発現または抑制されてもよい。さらに、本発明を用いて、疾患発症の特定の段階中にのみ遺伝子発現の変化を誘発してもよい。例えば、癌遺伝子は、腫瘍が特定のサイズまたは転移段階に達した時にのみ過剰発現されてもよい。逆に、アルツハイマー病の発症に疑いのあるタンパク質は、動物の生涯中の指定の時点でのみ、かつ特定の脳領域内でのみ抑制されてもよい。これらの例は、本発明の潜在的な用途を網羅的に列記していないが、本発明が強力な技術となる可能性があるいくつかの分野を強調している。
保護ガイド
特定の実施形態では、ガイド分子は、CRISPR-Casシステムの特異性を高めるために二次構造によって改変されていて、この二次構造は、エキソヌクレアーゼ活性から保護でき、本明細書で保護ガイド分子とも呼ばれるガイド配列への5’付加を可能にする。
一側面では、本発明は、「プロテクターRNA」をガイド分子の配列にハイブリダイズすること開示し、「プロテクターRNA」は、ガイド分子の3’末端に相補的なRNA鎖であり、それにより部分二本鎖ガイドRNAを生成する。本発明の一実施形態では、不一致塩基(すなわちガイド配列の一部を形成しないガイド分子の塩基)を完全に相補的なプロテクター配列で保護すると、標的DNAが3’末端で不一致塩基対に結合する可能性を低下させる。本発明の特定の実施形態では、伸長された長さを含む追加の配列がさらに、ガイドがガイド分子内にプロテクター配列を含むように、ガイド分子内に存在してもよい。この「プロテクター配列」では、ガイド分子が(標的配列にハイブリダイズするガイド配列の一部を含む)「露出された配列」に加えて「保護された配列」を含むことが確実である。特定の実施形態では、ガイド分子は、ヘアピンなどの二次構造を含むようにプロテクターガイドの存在によって改変される。好都合なことに、保護された配列、ガイド配列、またはその両方に対して相補性を有する3個または4個~30個以上、例えば、約10個以上の連続する塩基対が存在する。好都合なことに、保護部分は、その標的と相互作用するCRISPR-Casシステムの熱力学を妨害しない。部分二本鎖のガイド分子を含むそのような伸長を提供して、ガイド分子は保護されていると見做され、特定の活性を維持しながら、CRISPR-Cas複合体に特異的結合の改善をもたらす。
ゲノム標的に一致するガイドRNA(gRNA)伸長は、gRNAの保護を提供し、かつ特異性を増強する。個々のゲノム標的のスペーサーシード部の末端から遠位にある一致配列を有するgRNAの伸長は、特異性を増強するように想定される。特異性を増強する一致gRNAの伸長は、切り詰めされていない細胞で観察されている。これらの安定な長さへの伸長に伴うgRNA構造の予測は、安定した形態が保護状態から生じることを示しており、スペーサー伸長部とスペーサーシード部中の相補配列により、伸長によりgRNAシードとともに閉ループを形成する。これらの結果は、保護されたガイドの概念として、20merのスペーサー結合領域の遠位にあるゲノム標的配列に一致する配列も含むことを示している。熱力学的予測を用いて、保護されたgRNA状態をもたらす完全に一致または部分的に一致するガイド伸長を予測できる。これにより、保護gRNAの概念がXとZの間の相互作用に拡張され、ここで、Xの長さは通常17~20ヌクレオチド長であり、Zの長さは1~30ヌクレオチド長である。熱力学的予測を使用して、Zの最適な伸長状態を決定し、Zに少数の不一致を導入して、XとZの間の保護された立体構造の形成を促進する可能性がある。本出願の全体を通して、用語「X」および「シード長(SL)」は、標的DNAが結合するために利用可能なヌクレオチドの数を示す露出長(EpL)という用語と互換的に使用され、用語「Y」および「プロテクターの長さ(PL)」は、プロテクターの長さを表すように互換的に使用され、また用語「Z」、「E」、「E’」および「EL」は、標的配列が伸長されるヌクレオチドの数を表す用語「伸長長さ(ExL)」に対応するように互換的に使用される。
伸長長さ(ExL)に対応する伸長配列は、場合によっては、保護されるガイド配列の3’末端でガイド配列に直接付加されてもよい。伸長配列は、2~12ヌクレオチド長であってもよい。好ましくは、ExLは、0、2、4、6、8、10、または12ヌクレオチド長として示されてもよい。好ましい実施形態では、ExLは、0または4ヌクレオチド長として示されている。より好ましい実施形態では、ExLは4ヌクレオチド長である。伸長配列は、標的配列に相補的であってもよく、相補的でなくてもよい。
伸長配列はさらに、場合によっては、保護されるガイド配列の5’末端のガイド配列、ならびに保護する配列の3’末端に直接接合されてもよい。結果として、伸長配列は、保護される配列と保護する配列との間の連結する配列として機能する。理論に拘束されることを望まないが、このような連結は、保護する配列の保護される配列への結合を改善するために、保護する配列を保護される配列の近傍に配置してもよい。シード、プロテクター、および伸長の上述の関係は、例えばCasシステムで機能するガイドなどのガイドの遠位端(すなわち標的端部)が5’末端である場合に成り立つことが分かる。ガイドの遠位端が3’末端である実施形態では、その関係は逆になる。この実施形態では、本発明は、「プロテクターRNA」をガイド配列にハイブリダイズすることを開示し、「プロテクターRNA」は、ガイドRNA(gRNA)の3’末端に相補的なRNA鎖であり、それにより部分的に二重鎖gRNAを生成する。
gRNAの遠位端へのgRNA不一致の付加により、特異性を増強できることが示される。Y中の保護されていない遠位での不一致の導入、または遠位の不一致(Z)を伴うgRNAの伸長により、特異性を増強できることが示される。前述のこの概念は、保護されたgRNAで使用されるX、Y、およびZ成分に関連付けられている。保護されていない不一致の概念は、保護されたガイドRNAに関し説明されるX、Y、およびZの概念へ、さらに一般化することができる。
tru-ガイド
特定の実施形態では、切り詰め型ガイド(tru-guide)、すなわち標準的なガイド配列長さに対して長さが切り詰められたガイド配列を含むガイド分子が用いられる。Nowak et al.(Nucleic Acids Res (2016) 44 (20): 9555-9564)によって説明されているように、このようなガイドは、触媒的に活性なCRISPR-Cas酵素が標的DNAを切断することなくその標的に結合することを可能にする。特定の実施形態では、標的の結合を可能にするが、CRISPR-Cas酵素のニッカーゼ活性のみを保持する切り詰め型ガイドが用いられる。
特定の実施形態では、ガイド分子は、直接反復配列に結合されたガイド配列、または直接反復配列およびtracr配列に結合されたガイド配列を含み、ここで、直接反復配列、crRNA配列、および/またはtracr配列は、1個以上のステムループまたは最適化された二次構造を含む。特定の実施形態では、直接反復は、16ヌクレオチド長の最小長および単一のステムルーフ゜を有する。さらなる実施形態では、直接反復は、16ヌクレオチド長を超える、好ましくは17ヌクレオチド長を超える長さを有し、2個以上のステムループまたは最適化された二次構造を有する。特定の実施形態では、ガイド分子は、天然の直接反復配列の全部または一部に結合されたガイド配列を含むか、またはそれからなる。典型的なV-B型C2c1/Cas12bガイド分子は(3’→5’方向に)、ガイド配列、およびtracrの3’末端に相補的な相補伸長部(「反復」)を含む。反復およびtracrは、第2の相補的伸長部(反復に相補的であるtracrの「アンチ反復」)およびポリA(RNAではポリUの場合が多い)テール(ターミネーター)を含むステムループ(ループは通常4または5ヌクレオチド長)を形成するように設計された領域を含むキメラガイド中に結合されてもよい。特定の実施形態では、ガイド構築物の特定の側面は、例えば、形質の追加、排除、または置換によって改変できるが、ガイド構築物の特定の他の側面は維持される。遺伝子操作されたガイド分子改変での好ましい位置には、限定はされないが、例えば直接反復配列のステムループなどのC2c1タンパク質および/または標的と複合体を形成する際に露出されるガイド末端およびガイド分子の領域を含む、挿入、欠失、および置換を含む。
キメラガイド
本発明は、様々なCas12bシステムガイドを提供する。特定の実施形態では、ガイドは、2つのハイブリダイズ可能な部分を含み、第1の部分の3’末端は、第2の部分の5’末端と少なくとも部分的に相補的であり、ハイブリダイズ可能である。特定の実施形態では、2つの部分は結合されている。すなわち、ガイド配列に対応する5’末端の第1の区画および天然のCas12bガイドの直接反復を含み、Cas12b tracr配列に対応する3’末端の第2の区画に結合された単一のガイド(「キメラガイド」)を使用できる。2つの区画は、第1の区画の3’末端および第2の区画の5’末端の相補配列が、例えばステムループ構造中でハイブリダイズできるように結合される。
死滅ガイド
一側面では、本発明は、CRISPR複合体の形成および標的への結合の成功を可能にする方法で改変されたガイド配列を提供するが、同時にヌクレアーゼ活性を成功することは不可能である(すなわち、ヌクレアーゼ活性は無く、挿入欠失活性も無い)。説明によっては、この改変されたガイド配列は、「死滅ガイド(dead guide)」または「死滅ガイド配列(dead guide sequence)」と呼ばれる。これらの死滅ガイドまたは死滅ガイド配列は、ヌクレアーゼ活性に関して触媒的に不活性であるか、または立体配座的に不活性であると考えることができる。ヌクレアーゼ活性は、当技術分野で一般的に用いられるSURVEYOR分析またはディープ配列決定、好ましくはSURVEYOR分析を使用して測定できる。同様に、死滅ガイド配列は、触媒活性を促進する能力、または特異的標的および非特異的標的の結合活性を区別する能力に関する塩基対の形成に十分に関与できない。簡潔に説明すると、SURVEYOR分析では、遺伝子のCRISPR標的部位を精製および増幅し、CRISPR標的部位を増幅するプライマーとともにヘテロ二本鎖を形成することを含む。再アニール後に、産物は製造者の推奨手順に従って、SURVEYORヌクレアーゼおよびSURVEYORエンハンサーS(Transgenomics社製)で処理され、ゲルで分析されて、相対的な帯域強度に基づいて定量化される。
従って、関連する側面では、本発明は、本明細書に説明の機能的Cas12bを含む非天然起源または遺伝子操作された組成物であるC2c1 CRISPR-Casシステム、およびgRNAが死滅ガイド配列を含むガイドRNA(gRNA)を提供し、それにより、Cas12b CRISPR-Casシステムが、SURVEYOR分析により検出されるシステムの非変異型Cas12b酵素のヌクレアーゼ活性に起因する検出可能な挿入欠失活性は含まずに細胞内の関心のあるゲノム遺伝子座に誘導されるように、gRNAは標的配列にハイブリダイズが可能となる。簡潔に言うと、Cas12b CRISPR-Casシステムが、SURVEYOR分析によって検出されたシステムの非変異Cas12b酵素のヌクレアーゼ活性に起因する検出可能な挿入欠失活性を含まずに細胞内の関心のあるゲノム遺伝子座に誘導されるように、標的配列にハイブリダイズが可能である死滅ガイド配列を含むgRNAは、本明細書では「死滅gRNA」と言う用語で呼ばれる。本明細書の他の段落に説明される本発明によるgRNAのうちのいずれかは、以下に説明されるような死滅gRNA/死滅ガイド配列を含むgRNAとして使用されてもよいことは理解できる。本明細書の他の段落に記載される方法、製品、組成物、および使用のいずれもが、以下でさらに詳述するように、死滅gRNA/死滅ガイド配列を含むgRNAに同等に適用可能である。さらなる解説として、以下の特定の側面および実施形態が提供される。
CRISPR複合体の標的配列への配列特異的結合を誘導する死滅ガイド配列の能力は、任意の適切な測定法によって評価されてもよい。例えば、試験される死滅ガイド配列を含む、CRISPR複合体を形成するのに十分なCRISPRシステムの成分は、CRISPR配列の成分をコードするベクターによる遺伝子導入などによって、対応する標的配列を有する宿主細胞に提供され、続いて、本明細書に説明のSURVEYOR分析などによって標的配列内の優先的な切断を評価してもよい。同様に、標的ポリヌクレオチド配列の切断は、標的配列、ならびに試験される死滅ガイド配列および試験される死滅ガイド配列とは異なる対照ガイド配列を含むCRISPR複合体の成分を提供し、かつ試験ガイド配列の反応と対照ガイド配列の反応の間の標的配列の結合度または切断率を比較することによって、試験管内で評価されてもよい。当業者が思い付くような他の分析法も可能である。死滅ガイド配列は、任意の標的配列を標的にするように選択してもよい。実施形態によっては、標的配列は、細胞のゲノム内の配列である。
本明細書でさらに説明されるように、いくつかの構造パラメータは、適切なフレームワークがその死滅ガイドに到達することを可能にする。死滅ガイド配列は、それぞれのガイド配列よりも短く、活性なCas12b固有の挿入欠失をもたらす。死滅ガイドは、同一のCas12bに導かれるそれぞれのガイドよりも5%、10%、20%、30%、40%、50%短く、活性なCas12b固有の挿入欠失形成に繋がる。
以下に説明され、かつ当技術分野で知られているように、gRNA-C2c1特異性の一側面は、そのガイドに適切に連結される直接反復配列である。特にこのことは、直接反復配列がC2c1の起源に依存して設計されることを意味する。従って、検証済みの死滅ガイド配列に利用できる構造データは、C2c1固有の同等物を設計するために使用できる。例えば、2個以上のC2c1エフェクタータンパク質の相同性のあるヌクレアーゼドメインRuvC間の構造的類似性を使用して、設計が同等の死滅ガイドを移送することができる。従って、本明細書での死滅ガイドを、長さおよび配列を適切に改変して、そのようなC2c1特異的同等物を反映させて、CRISPR複合体の形成および標的への結合を成功させてもよいが、同時にヌクレアーゼ活性を成功させることはできない。
本明細書の文脈ならびに最新の技術での死滅ガイドの使用は、in vitro、ex vivoの両方、およびin vivoの用途でのネットワーク生物学および/またはシステム生物学のために意外でかつ予想外のプラットフォームを提供し、多重遺伝子標的、特に双方向の多重遺伝子標的を可能にする。死滅ガイドを使用する以前は、例えば遺伝子活性の活性化、抑制、および/またはサイレンシングのために複数の標的に対処することは困難であり、場合によっては不可能であった。死滅ガイドの使用により、複数の標的、従って複数の活性を、例えば、同一の細胞、同一の動物、または同一の患者で対処できる。このような多重化は、同時に起こる場合もあれば、所望の時間枠でずれて起こる場合もある。
例えば、死滅ガイドは、ヌクレアーゼ活性の結果が無くとも、遺伝子標的化のための手段として最初にgRNAを使用することを可能にするとともに、活性化または抑制を誘導する手段を提供する。死滅ガイドを含むガイドRNAは、遺伝子活性の活性化または抑制を可能にする方法で、要素を、特に遺伝子エフェクター(例えば、活性化因子または抑制因子)の機能的な配置を可能にする本明細書の他の段落に記載されるタンパク質アダプター(例えばアプタマー)をさらに含むように改変されてもよい。一例として、本明細書および最新の技術で説明されるように、アプタマーの組込みが挙げられる。死滅ガイドを含むgRNAを遺伝子操作してタンパク質相互作用アプタマーを組み込むことによって(参照により本明細書に組み込まれているKonermann et al.,「遺伝子操作されたCRISPR-Cas9複合体によるゲノム規模での転写活性化」“Genome-scale transcription activation by an engineered CRISPR-Cas9 complex,” doi:10.1038/nature14136)、複数の異なるエフェクタードメインからなる合成転写活性化複合体を組み立ててもよい。これは、自然な転写活性化プロセスの後にモデル化してもよい。例えば、エフェクター(例えば、活性化因子または抑制因子;活性化因子または抑制因子との融合タンパク質としての二量体化MS2バクテリオファージ外皮タンパク質)に選択的に結合するアプタマー、またはそれ自体がエフェクター(例えば、活性化因子または抑制因子)に結合するタンパク質を、死滅gRNA四塩基ループおよび/またはステムループ2に付加してもよい。MS2の場合に、融合タンパク質MS2-VP64は、四塩基ループおよび/またはステムループ2に結合し、続いて例えばNeurog2の転写性の発現上昇を媒介する。他の転写活性化因子は、例えばVP64、P65、HSF1、およびMyoD1である。この概念の単なる例として、PP7に相互作用するステムループによるMS2ステムループの置換を用いて、抑制要素を動員してもよい。
従って1つの側面は、死滅ガイドを含む本発明のgRNAであり、このgRNAは、本明細書に説明されるように、遺伝子活性化または抑制を提供する改変をさらに含む。死滅gRNAは1個以上のアプタマーを含んでもよい。アプタマーは、遺伝子エフェクター、遺伝子活性化因子、または遺伝子抑制因子に特異的であってもよい。あるいは、アプタマーは、特定の遺伝子エフェクター、遺伝子活性化因子、または遺伝子抑制因子に特異的であり、かつそれらを動員/結合するタンパク質に特異的であってもよい。活性化因子または抑制因子の動員のための複数の部位が存在する場合に、これらの部位は、活性化因子または抑制因子のいずれかに特異的であることが好ましい。活性化因子または抑制因子の結合のために複数の部位が存在する場合に、これらの部位は、同一の活性化因子または同一の抑制因子に特異的であってもよい。これらの部位はまた、異なる活性化因子または異なる抑制因子に特異的であってもよい。遺伝子エフェクター、遺伝子活性化因子、遺伝子抑制因子は、融合タンパク質の形態で存在してもよい。
一実施形態では、本明細書に説明の死滅gRNAまたは本明細書に説明のC2c1 CRISPR-Cas複合体は、2個以上のアダプタータンパク質を含む非天然起源または遺伝子操作された組成物を含み、各タンパク質は1個以上の機能ドメインと会合していて、アダプタータンパク質は、死滅gRNAの少なくとも1個のループ中に挿入された個別のRNA配列に結合する。
従って、一側面は、細胞内の関心のあるゲノム遺伝子座の標的配列にハイブリダイズが可能な死滅ガイド配列を含むガイドRNA(gRNA)を含む、非天然起源または遺伝子操作された組成物を提供する。この死滅ガイド配列は、本明細書で定義されるように、少なくとも1つ以上の核局在化配列を含むC2c1であり、C2c1は、場合によっては、死滅gRNAの少なくとも1個のループが、1個以上のアダプタータンパク質に結合する個別のRNA配列の挿入によって改変される少なくとも1つの変異を含む。アダプタータンパク質は1個以上の機能ドメインに会合し、または、死滅gRNAは少なくとも1個の非翻訳機能ループを有するように改変され、この組成物は、2個以上のアダプタータンパク質を含み、各タンパク質は1個以上の機能ドメインに会合している。
特定の実施形態では、アダプタータンパク質は、機能ドメインを含む融合タンパク質であり、融合タンパク質は、場合によっては、アダプタータンパク質と機能ドメインとの間にリンカーを含み、リンカーは、場合によっては、GlySerリンカーを含む。
特定の実施形態では、死滅gRNAの少なくとも1個のループは、2個以上のアダプタータンパク質に結合する個別のRNA配列の挿入による改変はされていない。
特定の実施形態では、アダプタータンパク質に会合される1個以上の機能ドメインは、転写活性化ドメインである。
特定の実施形態では、アダプタータンパク質に会合される1個以上の機能ドメインは、VP64、p65、MyoD1、HSF1、RTA、またはSET7/9を含む転写活性化ドメインである。
特定の実施形態では、アダプタータンパク質に会合される1個以上の機能ドメインは、転写抑制因子ドメインである。
特定の実施形態では、転写抑制因子ドメインは、KRABドメインである。
特定の実施形態では、転写抑制因子ドメインは、NuEドメイン、NcoRドメイン、SIDドメイン、またはSID4Xドメインである。
特定の実施形態では、アダプタータンパク質に会合される1個以上の機能ドメインのうちの少なくとも1個は、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、DNA組込み活性、RNA切断活性、DNA切断活性、または核酸結合活性を含む1つ以上の活性を有する。
特定の実施形態では、DNA切断活性は、Fok1ヌクレアーゼに帰因する。
特定の実施形態では、死滅gRNAは、死滅gRNAがアダプタータンパク質に結合しさらにC2c1および標的に結合した後に、機能ドメインがその属性機能により作用することを可能にする空間的な方向となるように改変される。
特定の実施形態では、死滅gRNAの少なくとも1個のループは、四塩基ループおよび/またはループ2である。特定の実施形態では、死滅gRNAの四塩基ループおよびループ2は、個別のRNA配列の挿入によって改変される。
特定の実施形態では、1個以上のアダプタータンパク質に結合する個別のRNA配列の挿入により、アプタマー配列となる。特定の実施形態では、アプタマー配列は、同じアダプタータンパク質に特異的な2個以上のアプタマー配列である。特定の実施形態では、アプタマー配列は、異なるアダプタータンパク質に特異的な2個以上のアプタマー配列である。
特定の実施形態では、アダプタータンパク質は、MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、またはPRR1を含む。
特定の実施形態では、細胞は真核細胞である。特定の実施形態では、真核細胞は、哺乳動物細胞、場合によってはマウス細胞である。特定の実施形態では、哺乳動物細胞はヒト細胞である。
特定の実施形態では、第1のアダプタータンパク質は、p65ドメインに会合し、第2のアダプタータンパク質は、HSF1ドメインに会合する。
特定の実施形態では、組成物は、少なくとも3つの機能ドメインを有するC2c1 CRISPR-Cas複合体を含み、そのうちの少なくとも1つはC2c1に会合し、少なくとも2つは死滅gRNAに会合する。
特定の実施形態では、組成物は第2のgRNAをさらに含み、第2のgRNAは、C2c1 CRISPR-Casシステムが、システムのC2c1酵素のヌクレアーゼ活性から生じる第2のゲノム遺伝子座に位置する、検出可能な挿入欠失活性を持つ細胞中の第2の関心のあるゲノム遺伝子座に誘導されるように、第2の標的配列にハイブリダイズが可能な生gRNAである。
特定の実施形態では、組成物は、複数の死滅gRNAおよび/または複数の生gRNAをさらに含む。
本発明の一側面は、gRNA足場のモジュール性およびカスタマイズ可能性を利用して、個別の型のエフェクターをオルソゴナル的に動員するための異なる結合部位(特にアプタマー)を有する一連のgRNA足場を構築することである。繰り返しになるが、より広い概念の例およびその例示のために、PP7相互作用ステムループによるMS2ステムループの置換を利用し、抑制要素を結合/動員して、多重化された双方向転写制御を可能とする。従って、一般に、死滅ガイドを含むgRNAを使用して、多重転写制御および好適な双方向転写制御を提供してもよい。この転写制御は遺伝子には最も好ましい。例えば、死滅ガイドを含む1個以上のgRNAを、1つ以上の標的遺伝子の活性化を標的化するために使用してもよい。同時に、死滅ガイドを含む1個以上のgRNAを、1つ以上の標的遺伝子の抑制を標的化するために使用してもよい。このような配列は、様々な異なる組合せに適用されてもよく、その組合せとして、例えば、標的遺伝子がまず抑制され、次に適切な期間で他の標的が活性化される、あるいは選択遺伝子が活性化されると同時に選択遺伝子が抑制され、その後にさらに活性化および/または抑制されるなどが挙げられる。結果として、1つ以上の生体システムの複数の成分が、有効に共に処理されてもよい。
一側面では、本発明は、死滅gRNAまたはC2c1 CRISPR-Cas複合体または本明細書に説明の組成物をコードする核酸分子を提供する。
一側面では、本発明は、本明細書に定義の死滅ガイドRNAをコードする核酸分子を含むベクターシステムを提供する。特定の実施形態では、ベクターシステムは、C2c1をコードする核酸分子をさらに含む。特定の実施形態では、ベクターシステムは、(生)gRNAをコードする核酸分子をさらに含む。特定の実施形態では、核酸分子またはベクターは、ガイド配列(gRNA)をコードする核酸分子かつ/あるいはC2c1および/または任意の核局在化配列をコードする核酸分子に操作可能に結合された、真核細胞中で操作可能な調節エレメントをさらに含む。
別の実施形態では、構造解析を用いて、死滅ガイドとDNA結合を可能にするがDNA切断を可能にしない活性C2c1ヌクレアーゼとの間の相互作用を検討できる。このように、C2c1のヌクレアーゼ活性に重要なアミノ酸が決定される。このようなアミノ酸の改変により、遺伝子編集に使用されるC2c1酵素の改善が可能になる。
別の側面は、本明細書に説明されならびに当技術分野で知られるように、本明細書で説明の死滅ガイドの使用を、本明細書で説明のCRISPRの他の用途と組み合わせる。例えば、標的多重遺伝子活性または抑制または標的多重双方向遺伝子活性/抑制のための死滅ガイドを含むgRNAは、本明細書で説明のように、ヌクレアーゼ活性を維持するガイドを含むgRNAと組み合わせてもよい。ヌクレアーゼ活性を維持するガイドを含むこのgRNAは、遺伝子活性の抑制を可能にする改変(例えばアプタマー)をさらに含んでもよいか、あるいは含まなくてもよい。ヌクレアーゼ活性を維持するガイドを含むこのgRNAは、遺伝子活性の活性化を可能にする改変(例えばアプタマー)をさらに含んでもよいか、あるいは含まなくてもよい。このように、多重遺伝子制御のための別の手段が導入される(例えば、ヌクレアーゼ活性の無い/挿入欠失活性の無い多重遺伝子標的活性化は、ヌクレアーゼ活性を伴う遺伝子標的抑制と同時に、またはそれと組み合わせて提供されてもよい)。
例えば、1)1つ以上の遺伝子を標的とし、かつ遺伝子活性化因子の動員のために適切なアプタマーでさらに改変された死滅ガイドを含む(例えば、1~50個、1~40個、1~30個、1~20個、好ましくは1~10個、より好ましくは1~5個の)1個以上のgRNAを使用して、2)1つ以上の遺伝子を標的とし、かつ遺伝子抑制因子の動員のために適切なアプタマーでさらに改変された死滅ガイドを含む(例えば、1~50個、1~40個、1~30個、1~20個、好ましくは1~10個、より好ましくは1~5個の)1個以上のgRNAと組み合わせる。次に1)および/または2)を、3)1つ以上の遺伝子を標的とする(例えば、1~50個、1~40個、1~30個、1~20個、好ましくは1~10個、より好ましくは1~5個の)1個以上のgRNAと組み合わせてもよい。次にこの組合せでは、1)+2)+3)、さらに4)1つ以上の遺伝子を標的とし、かつ遺伝子活性化因子の動員のために適切なアプタマーでさらに改変された(例えば、1~50個、1~40個、1~30個、1~20個、好ましくは1~10個、より好ましくは1~5個の)1個以上のgRNA、の順番で実施してもよい。次にこの組合せでは、1)+2)+3)+4)、さらに5)1つ以上の遺伝子を標的とし、かつ遺伝子抑制因子の動員のために適切なアプタマーでさらに改変された(例えば、1~50個、1~40個、1~30個、1~20個、好ましくは1~10個、より好ましくは1~5個の)1個以上のgRNA、の順番で実施してもよい。結果として、様々な使用および組合せが本発明に含まれる。例えばそれらの組合せは、1)+2)の組合せ、1)+3)の組合せ、2)+3)の組合せ、1)+2)+3)の組合せ、1)+2)+3)+4)の組合せ、1)+3)+4)の組合せ、2)+3)+4)の組合せ、1)+2)+4)の組合せ、1)+2)+3)+4)+5)の組合せ、1)+3)+4)+5)の組合せ、2)+3)+4)+5)の組合せ、1)+2)+4)+5)の組合せ、1)+2)+3)+5)の組合せ、1)+3)+5)の組合せ、2)+3)+5)の組合せ、および1)+2)+5)の組合せである。
一側面では、本発明は、C2c1 CRISPR-Casシステムを標的遺伝子座に導くための死滅ガイドRNA標的配列(死滅ガイド配列)を設計、評価、または選択するためのアルゴリズムを提供する。特に、死滅ガイドRNAの特異性は、i)GC含量およびii)標的配列の長さの変更に関連し、それにより最適化できることが確認されている。一側面では、本発明は、死滅ガイドRNAの非特異的標的結合または相互作用を最小化する死滅ガイドRNA標的配列を設計または評価するためのアルゴリズムを提供する。本発明の実施形態では、CRISPRシステムを生物中の遺伝子座に誘導するための死滅ガイドRNA標的配列を選択するアルゴリズムは、a)遺伝子座中の1個以上のCRISPRモチーフの位置を特定すること、b)i)配列のGC含量を決定し、かつii)生物のゲノム内にCRISPRモチーフに最も近い15個の下流ヌクレオチドの非特異的標的一致があるかどうかを判断して、各CRISPRモチーフの下流の20ヌクレオチド長の配列を分析すること、およびc)配列のGC含量が70%以下でありかつ非特異的標的が検出されない場合に、死滅ガイドRNAで使用する15個のヌクレオチド配列を選択することを含む。一実施形態では、GC含量が60%以下である場合に、その配列は標的配列として選択される。特定の実施形態では、GC含量が55%以下、50%以下、45%以下、40%以下、35%以下、または30%以下である場合に、その配列は標的配列として選択される。一実施形態では、遺伝子座の2つ以上の配列が分析されて、最小のGC含量、または次に小さいGC含量、または次に小さいGC含量を有する配列を選択する。一実施形態では、生物のゲノム中で非特異的標的一致が検出されない場合に、その配列は標的配列として選択される。一実施形態では、ゲノムの調節配列中に非特異的標的一致が検出されない場合に、標的配列が選択される。
一側面では、本発明は官能化されたCRISPRシステムを生物中の遺伝子座に導くための死滅ガイドRNA標的配列を選択する方法を提供し、この方法は、a)遺伝子座中の1個以上のCRISPRモチーフの位置を特定すること、b)i)配列のGC含量を決定し、かつii)生物のゲノム内に配列の最初の15ヌクレオチド長の非特異的標的一致があるかどうかを判断して、各CRISPRモチーフの下流の20ヌクレオチド長の配列を分析すること、およびc)配列のGC含量が70%以下でありかつ非特異的標的が検出されない場合に、ガイドRNAで使用する配列を選択することを含む。一実施形態では、GC含量が50%以下である場合にその配列は選択される。一実施形態では、GC含量が40%以下である場合にその配列は選択される。一実施形態では、GC含量が30%以下である場合にその配列は選択される。一実施形態では、2つ以上の配列を分析して、最小のGC含量を有する配列を選択する。一実施形態では、非特異的標的一致を、生物の調節配列中で決定する。一実施形態では、遺伝子座は調節領域である。一側面は、前述の方法に従って選択された標的配列を含む死滅ガイドRNAを提供する。
一側面では、本発明は、官能化されたCRISPRシステムを生物中の遺伝子座に標的化するための死滅ガイドRNAを提供する。本発明の一実施形態では、死滅ガイドRNAは標的配列を含み、標的配列のGC含量は70%以下であり、標的配列の最初の15ヌクレオチド長は、生物中の別の遺伝子座の調節配列中のCRISPRモチーフの下流の非特異的標的配列と一致しない。特定の実施形態では、標的配列のGC含量は、60%以下、55%以下、50%以下、45%以下、40%以下、35%以下、または30%以下である。特定の実施形態では、標的配列のGC含量は、70%~60%、または60%~50%、または50%~40%、または40%~30%である。一実施形態では、標的配列は、遺伝子座の潜在的な標的配列の中で最小のGC含量を有する。
本発明の一実施形態では、死滅ガイドの最初の15ヌクレオチド長は標的配列と一致する。別の実施形態では、死滅ガイドの最初の14ヌクレオチド長は標的配列と一致する。別の実施形態では、死滅ガイドの最初の13ヌクレオチド長は標的配列と一致する。別の実施形態では、死滅ガイドの最初の12ヌクレオチド長は標的配列と一致する。別の実施形態では、死滅ガイドの最初の11ヌクレオチド長は標的配列と一致する。別の実施形態では、死滅ガイドの最初の10ヌクレオチド長は標的配列と一致する。本発明の一実施形態では、死滅ガイドの最初の15ヌクレオチド長は、別の遺伝子座の調節領域中のCRISPRモチーフの下流の非特異的標的配列と一致しない。他の実施形態では、死滅ガイドの最初の14ヌクレオチド長もしくは最初の13ヌクレオチド長、またはそのガイドの最初の12ヌクレオチド長、または死滅ガイドの最初の11ヌクレオチド長、または死滅ガイドの最初の10ヌクレオチド長は、別の遺伝子座の調節領域中のCRISPRモチーフの下流の非特異的標的配列と一致しない。他の実施形態では、死滅ガイドの最初の15ヌクレオチド長、または14ヌクレオチド長、または13ヌクレオチド長、または12ヌクレオチド長、または11ヌクレオチド長は、ゲノム中のCRISPRモチーフの下流の非特異的標的配列と一致しない。
特定の実施形態では、死滅ガイドRNAは、標的配列と一致しない3’末端に追加のヌクレオチドを含む。従って、CRISPRモチーフの下流に最初の15ヌクレオチド長、または14ヌクレオチド長、または13ヌクレオチド長、または12ヌクレオチド長、または11ヌクレオチド長を含む死滅ガイドRNAは、3’末端で12ヌクレオチド長、13ヌクレオチド長、14ヌクレオチド長、15ヌクレオチド長、16ヌクレオチド長、17ヌクレオチド長、18ヌクレオチド長、19ヌクレオチド長、20ヌクレオチド長、またはそれ以上まで長さを伸長できる。
本発明は、限定はされないが、死滅C2c1(dC2c1)または(官能化されたC2c1または官能化されたガイドを含んでもよい)官能化されたC2c1システムを含むC2c1 CRISPR-Casシステムを遺伝子座に誘導する方法を提供する。一側面では、本発明は、死滅ガイドRNA標的配列を選択し、かつ官能化されたCRISPRシステムを生物中の遺伝子座に誘導する方法を提供する。一側面では、本発明は、死滅ガイドRNA標的配列を選択し、かつ官能化されたC2c1 CRISPR-Casシステムによって標的遺伝子座の遺伝子調節を実施する方法を提供する。特定の実施形態では、この方法を用いて、非特異的標的効果を最小限に抑えながら、標的遺伝子調節を実施する。一側面では、本発明は、2個以上の死滅ガイドRNA標的配列を選択し、かつ官能化されたC2c1 CRISPR-Casシステムによって2個以上の標的遺伝子座の遺伝子調節を実施する方法を提供する。特定の実施形態では、この方法を用いて、非特異的標的効果を最小限に抑えながら、2個以上の標的遺伝子座の調節を実施する。
一側面では、本発明は、官能化C2c1を生物中の遺伝子座に誘導するための死滅ガイドRNA標的配列を選択する方法を提供し、この方法は、a)遺伝子座中の1個以上のCRISPRモチーフの位置を特定すること、b)i)CRISPRモチーフに隣接する10~15ヌクレオチド長を選択しかつii)配列のGC含量を決定して、各CRISPRモチーフの下流の配列を分析すること、およびc)配列のGC含量が40%以上の場合に、ガイドRNAに使用する標的配列として10~15ヌクレオチド長の配列を選択することを含む。一実施形態では、GC含量が50%以上である場合に、その配列を選択する。一実施形態では、GC含量が60%以上である場合に、その配列を選択する。一実施形態では、GC含量が70%以上である場合に、その配列を選択する。一実施形態では、2つ以上の配列が分析され、最高のGC含量を有する配列が選択される。一実施形態では、この方法は、CRISPRモチーフの下流の配列と一致しない選択された配列の3’末端にヌクレオチドを追加することをさらに含む。一側面は、前述の方法に従って選択された標的配列を含む死滅ガイドRNAを提供する。
一側面では、本発明は、官能化されたCRISPRシステムを生物中の遺伝子座に誘導するための死滅ガイドRNAを提供し、死滅ガイドRNAの標的配列は、遺伝子のCRISPRモチーフに隣接する10~15ヌクレオチドからなり、標的配列のCG含量は50%以上である。特定の実施形態では、死滅ガイドRNAは、遺伝子座のCRISPRモチーフの下流の配列と一致しない標的配列の3’末端に付加されたヌクレオチドをさらに含む。
一側面では、本発明は、1個以上のまたは2個以上の遺伝子座に誘導される単一のエフェクターを提供する。特定の実施形態では、エフェクターは、C2c1に会合し、1個以上のまたは2個以上の選択された死滅ガイドRNAを使用して、C2c1会合エフェクターを1個以上のまたは2個以上の選択された標的遺伝子座に誘導する。特定の実施形態では、エフェクターは、1個以上のまたは2個以上以上の選択された死滅ガイドRNAと会合し、C2c1酵素と複合体を形成すると、それぞれの選択された死滅ガイドRNAは、その会合エフェクターを死滅ガイドRNA標的に局在化させる。そのCRISPRシステムの1つの非限定例は、同一の転写因子による調節の対象となる1個以上のまたは2個以上の遺伝子座の活性を調節する。
一側面では、本発明は、1個以上の遺伝子座に誘導される2個以上のエフェクターを提供する。特定の実施形態では、2個以上の死滅ガイドRNAが使用され、2個以上のエフェクターのそれぞれは、選択された死滅ガイドRNAに会合し、2個以上のエフェクターのそれぞれは、その死滅ガイドRNAの選択された標的に局在化する。このCRISPRシステムの1つの非限定例は、異なる転写因子による調節の対象となる1個以上のまたは2個以上の遺伝子座の活性を調節する。従って、1つの非限定の実施形態では、2つ以上の転写因子は、単一の遺伝子の異なる調節配列に局在化する。別の非限定の実施形態では、2つ以上の転写因子は、異なる遺伝子の異なる調節配列に局在化する。特定の実施形態では、1つの転写因子は、活性化因子である。特定の実施形態では、1つの転写因子は阻害因子である。特定の実施形態では、1つの転写因子は活性化因子であり、別の転写因子は阻害因子である。特定の実施形態では、同一の調節経路の異なる成分を発現する遺伝子座は調節される。特定の実施形態では、異なる調節経路の成分を発現する遺伝子座は調節される。
一側面では、本発明はまた、活性なC2c1 CRISPR-Casシステムによって媒介される標的DNAの切断または標的結合および遺伝子調節に特異的な死滅ガイドRNAを設計および選択するための方法およびアルゴリズムを提供する。特定の実施形態では、C2c1 CRISPR-Casシステムは、ある遺伝子座で標的DNAを切断し、同時に別の遺伝子座に結合してその調節を促進する活性なC2c1を用いるオルソゴナル遺伝子制御を提供する。
一側面では、本発明は、官能化されたCas12bを切断せずに生物中の遺伝子座に誘導するための死滅ガイドRNA標的配列を選択する方法を提供する。特定の実施形態では、この方法は、a)遺伝子座中の1個以上のCRISPRモチーフの位置を特定すること、b)i)CRISPRモチーフに隣接する10~15ヌクレオチド長を選択しかつii)配列のGC含有量を決定して、各CRISPRモチーフの下流の配列を分析すること、およびc)配列のGC含量が30%以上、40%以上の場合に、死滅ガイドRNA中で使用する標的配列として10~15ヌクレオチド長の配列を選択することを含む。特定の実施形態では、標的配列のGC含量は、35%以上、40%以上、45%以上、50%以上、55%以上、60%以上、65%以上、または70%以上である。特定の実施形態では、標的配列のGC含有量は、30%~40%、または40%~50%、または50%~60%、または60%~70%である。本発明の一実施形態では、遺伝子座内の2つ以上の配列が分析され、最大のGC含量を有する配列が選択される。
本発明の一実施形態では、GC含量が評価される標的配列の部分は、PAMに最も近い15個の標的ヌクレオチドのうちの10~15個の連続するヌクレオチドである。本発明の実施形態では、GC含量が考慮に入れられるガイド部分は、PAMに最も近い15個の連続ヌクレオチドの内の10~11ヌクレオチド、または11~12ヌクレオチド、または12~13ヌクレオチド、または13、または14、または15ヌクレオチドである。
一側面では、本発明はさらに、機能的活性化または阻害を回避しながら、CRISPRシステム遺伝子座の切断を促進する死滅ガイドRNAを識別するためのアルゴリズムを提供する。16~20ヌクレオチドの死滅ガイドRNA中のGC含量の増加は、DNA切断の増加および機能的活性化の減少と一致することが観察されている。
官能化されたCas12bの効率は、CRISPRモチーフの下流の標的配列に一致しないガイドRNAの3’末端にヌクレオチドを付加して増大させることができる。例えば、長さが11~15ヌクレオチド長の死滅ガイドRNAでは、ガイドが短いと標的の切断が促進される可能性は低くなるが、CRISPRシステムの結合および機能制御を促進する効率もまた低下する。特定の実施形態では、死滅ガイドRNAの3’末端に標的配列と一致しないヌクレオチドの付加は、望ましくない標的切断を増加させずに、活性化効率を増大させる。一側面では、本発明はまた、DNA切断を促進することなく、DNAを結合および遺伝子を調節するCRISPRシステム機能を効果的に促進する死滅ガイドRNAの改善を識別するための方法およびアルゴリズムを提供する。従って、特定の実施形態では、本発明は、CRISPRモチーフの下流の最初の15ヌクレオチド長、または14ヌクレオチド長、または13ヌクレオチド長、または12ヌクレオチド長、または11ヌクレオチド長を含み、かつ3’末端での長さが標的に不一致であるヌクレオチドにより12ヌクレオチド長、13ヌクレオチド長、14ヌクレオチド長、15ヌクレオチド長、16ヌクレオチド長、17ヌクレオチド長、18ヌクレオチド長、19ヌクレオチド長、20ヌクレオチド長、またはそれ以上に伸長される死滅ガイドRNAを提供する。
一側面では、本発明は、選択的オルソゴナル遺伝子制御を実施する方法を提供する。本明細書の開示から分かるように、本発明による死滅ガイドの選択は、ガイド長およびGC含量を考慮して、機能的Cas12b CRISPR-Casシステムによる効果的かつ選択的な転写制御を提供して、例えば、活性化または阻害によって遺伝子座の転写を調節し、非特異的標的効果を最小限に抑える。従って、個々の標的遺伝子座の効果的な調節を提供して、本発明はまた、2個以上の標的遺伝子座の効果的なオルソゴナル調節を提供する。
特定の実施形態では、オルソゴナル遺伝子制御は、2個以上の標的遺伝子座の活性化または阻害に基づく。特定の実施形態では、オルソゴナル遺伝子制御は、1個以上の標的遺伝子座の活性化または阻害、および1個以上の標的遺伝子座に基づく。
一側面では、本発明は、本明細書に説明の方法またはアルゴリズムに従って開示あるいは産出された1個以上の死滅ガイドRNAを含む非天然起源のCas12b CRISPR-Casシステムを含む細胞を提供し、これら1個以上の遺伝子産物の発現は改変されている。本発明の一実施形態では、2個以上の遺伝子産物の細胞内での発現は改変されている。本発明はまた、その細胞からの細胞株を提供する。
一側面では、本発明は、本明細書に説明の方法またはアルゴリズムに従って開示あるいは産出された1個以上の死滅ガイドRNAを含む非天然起源のCas12b CRISPR-Casシステムを含む1個以上の細胞を含む多細胞生物を提供する。一側面では、本発明は、本明細書に説明の方法またはアルゴリズムに従って開示あるいは産出された1個以上の死滅ガイドRNAを含む非天然起源のCas12b CRISPR-Casシステムを含む細胞、細胞株、または多細胞生物からの産物を提供する。
本発明のさらなる側面は、本明細書に説明の死滅ガイドを含むgRNAの使用であり、場合によっては、本明細書に説明あるいは最新技術のガイドを含むgRNAと組み合わせた使用であり、あるいはCas12bの過剰発現または好ましくはCas12bのノックインのいずれかにより遺伝子操作された細胞、遺伝子導入動物、遺伝子導入マウス、誘導性遺伝子導入動物、誘導性遺伝子導入マウスなどのシステムと組み合わせた使用である。結果として、単一のシステム(例えば、遺伝子導入動物、細胞)は、システム/ネットワーク生物学での多重遺伝子改変の基礎として役立ててもよい。死滅ガイドの寄与により、このシステムは、現在、in vitro、ex vivoの両方、およびin vivoで可能となっている。
例えば、Cas12bが提供されると、1個以上の死滅gRNAを提供して、多重遺伝子調節、好ましくは多重双方向遺伝子調節を誘導できる。1個以上の死滅gRNAは、必要な場合または所望の場合に、空間的および時間的に適切な方法で提供されてもよい(例えば、Cas12b発現の組織特異的誘導)。遺伝子導入/誘導性Cas12bが関心のある細胞、組織、動物に提供される(例えば発現される)ために、死滅ガイドを含むgRNAまたはガイドを含むgRNAの両方が同等に効果的である。同様に、本発明のさらなる側面は、本明細書に説明の死滅ガイドを含むgRNAの使用であり、場合によっては、本明細書に説明あるいは最新技術のガイドを含むgRNAと組み合わせた使用であり、あるいはノックアウトCas12b CRISPR-Casにより遺伝子操作された(細胞、遺伝子導入動物、遺伝子導入マウス、誘導性遺伝子導入動物、誘導性遺伝子導入マウスなどの)システムと組み合わせた使用である。
結果として、本明細書に説明の死滅ガイドと、本明細書に説明のCRISPR処理および当技術分野で既知のCRISPR処理との組合せは、システムの多重選別のための非常に効率的かつ正確な手段をもたらす(例えば、ネットワーク生物学)。この選別は、例えば、疾患、特に遺伝子関連疾患の原因となる遺伝子を認識するための遺伝子活性の特定の組合せ(例えば、特異的/非特異的の組合せ)の識別を可能にする。この選別の好ましい用途は癌である。同様に、その疾患の治療のための選別が本発明に含まれる。細胞または動物は、疾患または疾患に近い影響をもたらす異常な状態に曝される可能性がある。候補の組成物が提供されて、所望の多重環境中での影響に対して選別されてもよい。例えば、患者の癌細胞は、どの遺伝子の組合せがそれら細胞を死滅させるかに関して選別され、次にこの情報を使用して適切な治療法を確立してもよい。
一側面では、本発明は、本明細書に説明の1つ以上の構成要素を含むキットを提供する。キットは、本明細書に説明のガイドを伴いあるいはガイドを伴わずに本明細書に説明の死滅ガイドを含んでもよい。
本明細書に提供の構造情報は、標的DNAおよびCas12bとの死滅gRNA相互作用の調査を可能にし、死滅gRNA構造の遺伝子操作または改変を可能にして、Cas12b CRISPR-Casシステム全体の機能性を最適化する。例えば、死滅gRNAのループは、RNAに結合できるアダプタータンパク質の挿入によってCas12bタンパク質と相反することなく伸長できる。これらのアダプタータンパク質は、1個以上の機能ドメインを含むエフェクタータンパク質または融合体をさらに動員できる。
好ましい実施形態によっては、機能ドメインは、転写活性化ドメイン、好ましくはVP64である。実施形態によっては、機能ドメインは、転写抑制ドメイン、好ましくはKRABである。実施形態によっては、転写抑制ドメインは、SID、またはSIDの鎖状体(例えばSID4X)である。実施形態によっては、機能ドメインは、後成的改変酵素が提供されるように、後成的改変ドメインである。実施形態によっては、機能ドメインは、P65活性化ドメインであってもよい活性化ドメインである。実施形態によっては、Cas12bエフェクタータンパク質は、1個以上の機能ドメインに会合している。またCas12bエフェクタータンパク質は、RuvCおよび/またはNucドメイン内に1つ以上の変異を含み、それによって形成されたCRISPR複合体は後成的改変因子または転写または翻訳の活性化シグナルまたは抑制シグナルを送達することが可能である。
本発明の一側面は、上記の要素が単一の組成物に含まれるか、または個々の組成物に含まれることである。これらの組成物は、ゲノムレベルでの機能的効果を引き出すために宿主に効果的に適用されてもよい。
一般に、死滅gRNAは、(例えば融合タンパク質を介する)結合のための1個以上の機能ドメインを含むアダプタータンパク質に特異的結合部位(例えばアプタマー)を提供するように改変される。改変された死滅gRNAは、死滅gRNAがCRISPR複合体(すなわち死滅gRNAおよび標的に結合するCas12b)を形成すると、アダプタータンパク質が結合しかつアダプタータンパク質の機能ドメインが属性機能を効果的とするのに都合のよい空間的な方向に配置されるように改変される。例えば、機能ドメインが転写活性化因子(例えばVP64またはp65)である場合に、転写活性化因子は、それが標的の転写に影響を与えることを可能にする空間的な方向に配置される。同様に、転写抑制因子は、標的の転写に影響を与えるように都合よく配置され、ヌクレアーゼ(例えばFok1)は、標的を切断または部分的に切断するように都合よく配置される。
当業者は、アダプターと機能ドメインの結合を可能にするがアダプターと機能ドメインの適切な配置を可能にしない死滅gRNAに対する改変は、(例えばCRISPR複合体の三次元構造内の立体障害のために)意図しない改変であることを分かっている。
本明細書で説明するように、機能ドメインは、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性、および(例えば光誘導性の)分子スイッチからなる群からの1個以上のドメインであってもよい。場合によっては、さらに少なくとも1つのNLSが提供されることが都合がよい。場合によっては、NLSをN末端に配置することが都合がよい。複数の機能ドメインが含まれている場合に、機能ドメインは同じであっても、異なっていてもよい。
死滅gRNAは、同じまたは異なるアダプタータンパク質に特異的な複数の結合認識部位(例えばアプタマー)を含むように設計されてもよい。死滅gRNAは、転写開始部位(すなわちTSS)の上流のプロモーター領域-1000-+1の核酸、好ましくは-200の核酸に結合するように設計されてもよい。この配置により、遺伝子の活性化(転写活性化因子など)または遺伝子阻害(転写抑制因子など)に影響を及ぼす機能ドメインが改善される。改変された死滅gRNAは、組成物中に含まれる1個以上の標的遺伝子座を標的とする1個以上の改変された死滅gRNA(例えば、少なくとも1個のgRNA、少なくとも2個のgRNA、少なくとも5個のgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA 、少なくとも50個のgRNA)であってもよい。
アダプタータンパク質は、改変された死滅gRNA中に導入されたアプタマーまたは認識部位に結合し、かつ死滅gRNAがCRISPR複合体に組み込まれていると、1個以上の機能ドメインの適切な配置を可能にして属性機能を有する標的に影響を及ぼす任意の数のタンパク質であってもよい。本出願での詳細な説明のように、そのタンパク質は、外皮タンパク質、好ましくはバクテリオファージ外皮タンパク質であってもよい。このアダプタータンパク質に(例えば融合タンパク質の形態で)会合する機能ドメインは、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性、および(例えば光誘導性の)分子スイッチからなる群からの1個以上のドメインを含んでもよい。好ましいドメインは、Fok1、VP64、P65、HSF1、またはMyoD1である。機能ドメインが転写活性化因子または転写抑制因子である場合に、少なくともNLSがさらに、好ましくはN末端に提供されることが好都合である。複数の機能ドメインが含まれている場合に、その機能ドメインは同じであっても異なっていてもよい。アダプタータンパク質は、既知のリンカーを利用してその機能ドメインを付加してもよい。
従って、改変された死滅gRNA、(不活化された)Cas12b(機能ドメインを伴っても伴わなくてもよい)、および1個以上の機能ドメインを有する結合タンパク質は、それぞれ個別に組成物中に含まれ、個々にまたは集合的に宿主に投与されてもよい。あるいは、これらの成分は、宿主に投与するために単一の組成物で提供されてもよい。宿主への投与は、当業者に知られている、または宿主への送達について本明細書に説明のウイルスベクター(例えば、レンチウイルスベクター、アデノウイルスベクター、AAVベクター)を介して実施してもよい。本明細書で説明のように、(例えば、レンチウイルスgRNA選択のための)種々の選択マーカーおよび(例えば、複数のgRNAが使用されるかどうかにも依るが)種々のgRNA濃度の使用は、改善された効果を引き出すために有効な可能性がある。
この考え方に基づいて、いくつかの条件変更は、DNA切断、遺伝子活性化、または遺伝子非活性化を含むゲノム遺伝子座の事象を誘発するのに適切である。提供された組成物を使用して、当業者は、都合よくかつ具体的に、同じまたは異なる機能ドメインを有する単一または複数の遺伝子座を標的化して、1つ以上のゲノム遺伝子座事象を誘発することができる。この組成物を、細胞内のライブラリー中での選別およびin vivoでの機能モデル化(例えば、lincRNAの遺伝子活性化および機能の識別、機能獲得モデル化、機能喪失モデル化、最適化および選別の目的で細胞株および遺伝子導入動物を確立するための本発明の組成物の使用)のための多種多様な方法に応用してもよい。
本発明は、本発明または本出願の以前には考案されていなかった、条件付きのまたは誘導性のCRISPR遺伝子導入細胞/動物を確立しかつ利用するための本発明の組成物の使用を包含する。例えば、標的細胞は、条件付きでまたは誘導的に(例えばCre依存性構築物の形態での)Cas12b、および/または条件付きでまたは誘導的にアダプタータンパク質を含み、標的細胞に導入されたベクターが発現すると、このベクターは、標的細胞中でCas12bの発現および/またはアダプターの発現の条件を誘導しかつ引き起こす。CRISPR複合体を形成する既知の方法に本発明の教示および組成物を応用することにより、機能ドメインによって影響を受ける誘導性ゲノム事象もまた、本発明の一側面となる。この一例としては、CRISPRノックイン/条件付きの遺伝子導入動物(例えば、Lox-Stop-polyA-Lox(LSL)カセットを含むマウス)の創造、およびそれに続く本明細書に説明の1個以上の改変された(例えば、遺伝子活性化の目的で関心のある標的遺伝子のTSSに対して-200のヌクレオチドの)死滅gRNA(例えば、外皮タンパク質によって認識される1個以上のアプタマーを有する、MS2などの改変された死滅gRNA)を提供する1つ以上の組成物の送達、本明細書に記載される1個以上のアダプタータンパク質(1個以上のVP64に結合したMS2結合タンパク質)および条件付きの動物を誘導するための手段(例えば、Cas12b発現を誘導可能にするためのCre組換え酵素)が挙げられる。あるいは、アダプタータンパク質は、条件付きのまたは誘導性のCas12bとともに条件付きのまたは誘導性の要素として提供されて、選別の目的のために有効なモデルを提供でき、このタンパク質は、好都合なことには、多数の用途のための特定の死滅gRNAの最低限の設計および投与のみを必要とする。
別の実施形態では、死滅ガイドは、特異性を改善するようにさらに改変される。保護された死滅ガイドを合成してもよく、それによって二次構造が死滅ガイドの3’末端に導入され、その特異性が向上する。保護されたガイドRNA(pgRNA)は、細胞内の関心のあるゲノム遺伝子座中の標的配列にハイブリダイズが可能なガイド配列およびプロテクター鎖を含み、このプロテクター鎖は、場合によってはガイド配列に相補的であり、このガイド配列は、一部はプロテクター鎖にハイブリダイズできる。pgRNAには、場合によっては伸長配列が含まれる。pgRNA-標的DNAのハイブリダイズ化での熱力学は、ガイドRNAと標的DNAの間の相補的な塩基の数によって決定される。「熱力学的な保護」を用いて、プロテクター配列を付加して死滅gRNAの特異性を改善できる。例えば、ある方法では、死滅gRNA内のガイド配列の3’末端に様々な長さの相補的なプロテクター鎖を付加する。その結果として、プロテクター鎖は死滅gRNAの少なくとも一部に結合し、保護されたgRNA(pgRNA)を提供する。次に本明細書に例示の死滅gRNAは、説明済みの実施形態を用いて容易に保護でき、pgRNAをもたらす。プロテクター鎖は、死滅gRNAガイド配列の3’末端に結合した、個別のRNA転写産物、またはRNA鎖、またはキメラ型RNAのいずれであってもよい。
本発明者らは、本明細書で定義のCRISPR酵素として、活性を喪失することなく、2つ以上のRNAガイドが使用できることを示している。これにより、本明細書で定義の単一の酵素、システムまたは複合体を用いて、複数のDNA標的、遺伝子、または遺伝子座を標的化するために、本明細書で定義のCRISPR酵素、システム、または複合体の使用が可能になる。ガイドRNAは、場合によっては本明細書で定義の直接反復などのヌクレオチド配列によって分離されて、タンデム型に配置されていてもよい。種々のガイドRNAの位置として、タンデム型は活性に影響を及ぼさない。
多重型CRISPR-Casシステム
一側面では、本発明は、タンデム型すなわち多重型の標的化に用いられる非天然起源または遺伝子操作されたCRISPR酵素、好ましくは第2の部類のCRISPR酵素、好ましくは、限定はされないが本明細書の他の段落に説明のCas12bなどの本明細書に説明のV型またはVI型のCRISPR酵素を提供する。本明細書の他の段落に説明の本発明によるCRISPR(またはCRISPR-CasまたはCas)酵素、複合体、またはシステムのいずれかは、このような取組みに使用してもよいことは分かっている。本明細書の他の段落に説明の方法、製品、組成物、および使用のいずれもが、以下でさらに詳述する多重型すなわちタンデム型の標的化の取組みに等しく適用可能である。さらなる解説によって、以下の特定の側面および実施形態が示される。
一側面では、本発明は、複数の遺伝子座を標的とするための本明細書で定義のCas12b酵素、複合体、またはシステムの使用を提供する。一実施形態では、本発明は、複数の(タンデム型すなわち多重型の)ガイドRNA(gRNA)配列を使用して構築できる。
一側面では、本発明は、タンデム型すなわち多重型の標的化のために本明細書で定義のCas12b酵素、複合体、またはシステムの1つ以上の要素を使用する方法を提供し、前記CRISPシステムは複数のガイドRNA配列を含む。好ましくは、前記gRNA配列は、本明細書の他の段落で定義の直接反復などのヌクレオチド配列によって分離される。
本明細書で定義のCas12b酵素、システム、または複合体は、複数の標的ポリヌクレオチドを改変するための効果的な手段を提供する。本明細書で定義のCas12b酵素、システム、または複合体は、多数の細胞型中に1つ以上の標的ポリヌクレオチドの改変(例えば、欠失、挿入、転座、不活性化、活性化)を含む多種多様な効用を有する。従って、本発明の本明細書で定義のCas12b酵素、システム、または複合体は、単一のCRISPRシステム内の複数の遺伝子座を標的とすることを含む、例えば、遺伝子治療、薬物選別、疾患診断、および予後判断などに幅広い用途を有する。
一側面では、本発明は、本明細書で定義のCas12b酵素、システム、または複合体、すなわち、それに会合する少なくとも1つの不安定化ドメインを有するCas12bタンパク質、およびDNA分子などの複数の核酸分子を標的とする複数のガイドRNAを有するCas12b CRISPR-Cas複合体を提供し、それによって、前記複数のガイドRNAのそれぞれは、対応する核酸分子、例えば、DNA分子を特異的に標的とする。核酸分子の標的、例えばDNA分子のそれぞれは、遺伝子産物をコードするか、あるいは遺伝子座を含んでもよい。従って、複数のガイドRNAを使用すると、複数の遺伝子座または複数の遺伝子を標的することができる。実施形態によっては、Cas12b酵素は、遺伝子産物をコードするDNA分子を切断してもよい。実施形態によっては、遺伝子産物の発現は変化する。Cas12bタンパク質およびガイドRNAは、自然には共に存在しない。本発明は、タンデム型に配置されたガイド配列を含むガイドRNAを包含する。本発明はさらに、真核細胞での発現のためにコドン最適化されたCas12bタンパク質のコード配列を含む。好ましい実施形態では、真核細胞は、哺乳動物細胞、植物細胞、または酵母細胞であり、より好ましい実施形態では、哺乳動物細胞は、ヒト細胞である。遺伝子産物の発現は、減弱させてもよい。Cas12b酵素は、CRISPRシステムまたは複合体の一部を形成してもよく、かつ一連の2、3、4、5、6、7、8、9、10、15、25、25、30個、または30個を超えるガイド配列を含むタンデム型に配置されたガイドRNA(gRNA)をさらに含み、それぞれの酵素は、細胞内の関心のあるゲノム遺伝子座中の標的配列に特異的にハイブリダイズすることが可能である。実施形態によっては、機能的なCas12b CRISPRシステムまたは複合体は、複数の標的配列に結合する。実施形態によっては、機能的なCRISPRシステムまたは複合体は、複数の標的配列を編集してもよく、例えば、標的配列はゲノム遺伝子座を含んでもよく、実施形態によっては、遺伝子発現に変化があってもよい。実施形態によっては、機能的CRISPRシステムまたは複合体は、さらなる機能ドメインを含んでもよい。実施形態によっては、本発明は、複数の遺伝子産物の発現を改変または改変するための方法を提供する。この方法は、前記標的核酸、例えばDNA分子を含む細胞中に導入すること、あるいは標的核酸、例えばDNA分子を含有しかつ発現することを含んでもよい。例えば、標的核酸は、遺伝子産物をコードするか、あるいは遺伝子産物(例えば調節配列)の発現を提供してもよい。
好ましい実施形態では、多重標的化に使用されるCRISPR酵素はCas12bであるか、あるいはCRISPRシステムまたは複合体は、Cas12bを含む。実施形態によっては、多重標的化に用いられるCas12b酵素は、DNAの両方の鎖を切断して、二本鎖切断(DSB)を形成する。実施形態によっては、多重標的化に用いられるCRISPR酵素はニッカーゼである。実施形態によっては、多重標的化に用いられるCas12b酵素は、二重ニッカーゼである。実施形態によっては、多重標的化に用いられるCas12b酵素は、本明細書の他の段落で定義のDD Cas12b酵素などのCas12b酵素である。
一般的な実施形態によっては、多重標的化に用いられるCas12b酵素は、1個以上の機能ドメインに会合している。より具体的な実施形態によっては、多重標的化に用いられるCRISPR酵素は、本明細書の他の段落で定義の死滅Cas12bである。
一側面では、本発明は、本明細書で定義の複数の標的化に使用するCas12b酵素、システム、または複合体、あるいは本明細書で定義のポリヌクレオチドを送達する手段を提供する。その送達手段の非限定例は、例えば、複合体の成分を送達する粒子、および(例えば、CRISPR酵素をコードし、CRISPR複合体をコードするヌクレオチドを提供する)本明細書で説明のポリヌクレオチドを含むベクターである。実施形態によっては、ベクターは、AAVなどのプラスミドまたはウイルスベクター、あるいはレンチウイルスであってもよい。一過性のHEK細胞などへのプラスミドによる遺伝子導入は、特にAAVのサイズ制限がありかつCas12bはAAVに適合はするが付加するガイドRNAにより上限値に達する場合には、有効な場合がある。
さらに、多重標的化で使用する本明細書で使用されるCas12b酵素、複合体、またはシステムを構成的に発現するモデルが提供される。生物は、遺伝子導入生物であってもよく、かつ本発明のベクターで遺伝子導入されていてもよく、またはそのように遺伝子導入された生物の後代であってもよい。さらなる側面では、本発明は、本明細書に定義のCRISPR酵素、システム、および複合体、あるいは本明細書に説明のポリヌクレオチドまたはベクターを含む組成物を提供する。さらに、複数のガイドRNAを好ましくはタンデム型に配置された方式で含むCas12b CRISPRシステムまたは複合体を提供する。前記複数のガイドRNAは、直接反復などのヌクレオチド配列によって分離されていてもよい。
さらに、対象、例えばそれを必要とする対象を治療する方法が提供され、この方法は、Cas12b CRISPRシステムまたは複合体をコードするポリヌクレオチドまたは本明細書に説明の任意のポリヌクレオチドまたはベクターにより対象を形質転換して遺伝子編集を誘導すること、およびそれらを対象に投与することを含む。適切な修復鋳型がさらに提供されてもよく、例えば、前記修復鋳型を含むベクターによって送達されてもよい。さらに、対象、例えばそれを必要とする対象を治療する方法が提供され、この方法は、本明細書に説明のポリヌクレオチドまたはベクターにより対象を形質転換して複数の標的遺伝子座の転写活性化または抑制を誘導することを含み、前記ポリヌクレオチドまたはベクターは、好ましくはタンデム型に配置される複数のガイドRNAを含むCas12b酵素、複合体、またはシステムをコードするかあるいは含む。任意の治療がex vivoで、例えば細胞培養で実施される場合に、「対象」という用語は「細胞または細胞培養」という語句に置き換えられてもよいことが分かる。
本明細書の他の段落に定義の治療方法に用いるための、好ましくはタンデム型に配置された複数のガイドRNAを含むCas12b酵素、複合体、またはシステムを含む組成物、あるいは好ましくはタンデム型に配置された複数のガイドRNAを含む前記Cas12b酵素、複合体、またはシステムをコードするあるいは含むポリヌクレオチドまたはベクターが、さらに提供される。その組成物を含む部分を持つキットが提供されてもよい。その治療方法のための薬剤の製造への前記組成物の使用がまた提供される。例えば機能獲得選別などの選別でのCas12bCRISPRシステムの使用がまた、本発明によって提供される。遺伝子を人工的に過剰発現させる細胞は、例えば負帰還ループによって、経時的に遺伝子を下方制御(平衡を再構築)することができる。選別が始まる時までに、未調節の遺伝子は再度減弱するかもしれない。誘導性のCas12b活性化因子を使用すると、選別の直前に転写を誘導できるので、偽陰性の的中の可能性を最小限に抑えることが可能となる。従って、機能獲得選別などの選別での本発明の使用により、偽陰性の結果の可能性を最小限に抑えることができる。
一側面では、本発明は、Cas12bタンパク質および細胞内の遺伝子産物をコードするDNA分子をそれぞれ特異的に標的とする複数のガイドRNAを含む、遺伝子操作された非天然起源のCRISPRシステムを提供し、それによって、複数のガイドRNAはそれぞれ、遺伝子産物をコードするそれらの特定のDNA分子を標的とし、かつCas12bタンパク質は遺伝子産物をコードする標的DNA分子を切断し、それにより遺伝子産物の発現を変化させる。CRISPRタンパク質およびガイドRNAは、自然には共に存在しない。本発明は、好ましくは直接反復などのヌクレオチド配列によって分離された、場合によってはtracr配列に融合された複数のガイド配列を含む複数のガイドRNAを包含する。本発明の一実施形態では、CRISPRタンパク質は、V型またはVI型のCRISPR-Casタンパク質であり、より好ましい実施形態では、CRISPRタンパク質は、Cas12bタンパク質である。本発明はさらに、真核細胞での発現のためにコドン最適化されたCas12bタンパク質を包含する。好ましい実施形態では、真核細胞は哺乳動物細胞であり、より好ましい実施形態では、哺乳動物細胞はヒト細胞である。本発明のさらなる実施形態では、遺伝子産物の発現は減弱される。
標的配列の改変
特定の実施形態では、関心のある遺伝子座は、鋳型DNA配列を挿入すなわち「ノックイン」することによって、CRISPR-C2c1複合体によって改変される。特定の実施形態では、DNA挿入は、適切な方向にゲノム内に組み込まれるように設計される。好ましい実施形態では、関心のある遺伝子座は、相同性指向修復(HDR)機構を介するゲノム編集が特に困難となる非分裂細胞中でCRISPR-C2c1システムによって改変される(Chan et al., Nucleic acids research. 2011;39:5955-5966)。Maresca et al.(Genome Res. 2013 Mar; 23(3): 539-546)は、ジンクフィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)に適用可能な部位特異的かつ高精度の挿入の方法を説明していて、この方法では、5’オーバーハングを有する短い二本鎖DNAが相補的な末端に結合され、これによりヒト細胞株中の定義された遺伝子座に15-kbの外因性発現カセットを高精度に挿入可能となる。He et al.(Nucleic Acids Res. 2016 May 19; 44(9))は、GAPDH遺伝子座中への4.6kbのプロモーター不含ires-eGFP断片のCRISPR-Cas9誘導部位特異的ノックインが、体細胞系のLO2細胞中で20%までのGFP+細胞を産生し、かつNHEJ経路によって媒介されるヒト胚性幹細胞中で1.70%までのGFP+細胞を産生することを説明し、またNHEJに基づくノックインが、試験された全てのヒト細胞型でHDR媒介遺伝子標的化よりも効率的であることも報告していた。C2c1は5’オーバーハングにより千鳥状の切断部を生成するため、当業者はMeresca et al.およびHe et al.で説明されているのと同様の方法を用いて、本明細書に開示のCRISPR-C2c1システムにより関心のある遺伝子座に外因性DNAの挿入を形成できる。
特定の実施形態では、関心のある遺伝子座は、まずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、次いで、PAM配列の近傍でCRISPR-C2c1システムによって改変され、HDRを介して修復される。特定の実施形態では、関心のある遺伝子座は、HDRを介して外因性DNA配列の変異、欠失、または挿入を導入して、CRISPR-C2c1システムによって改変される。実施形態によっては、関心のある遺伝子座は、NHEJを介して外因性DNA配列の変異、欠失、または挿入を導入して、CRISPR-C2c1システムによって改変される。好ましい実施形態では、外因性DNAは、3’末端および5’末端の両方で単一のガイドDNA-PAM配列に隣接している。好ましい実施形態では、外因性DNAは、CRISPR-C2c1の切断後に放出される。Zhang et al., Genome Biology 201718:35; He et al., Nucleic Acids Research, 44: 9, 2016を参照。
鋳型
実施形態によっては、組換え鋳型がさらに提供される。組換え鋳型は、本明細書に説明の別のベクター成分であってもよく、別々のベクターに含まれてもよく、あるいは別々のポリヌクレオチドとして提供されてもよい。実施形態によっては、組換え鋳型は、核酸標的化複合体の一部としての核酸標的化エフェクタータンパク質によって刻み目を付けられまたは切断された標的配列内またはその近傍などで相同組換えでの鋳型として機能するように設計される。例によっては、システムは組換え鋳型を含む。組換え鋳型は、相同性指向修復(HDR)によって挿入されてもよい。
一実施形態では、鋳型核酸は、標的位置の配列を変更する。一実施形態では、鋳型核酸は、改変された塩基、または非天然起源の塩基の標的核酸への組込みをもたらす。
鋳型配列は、標的配列により媒介された破断または触媒された組換えを受けてもよい。一実施形態では、鋳型核酸は、C2c1媒介の切断事象によって切断される標的配列の部位に対応する配列を含んでもよい。一実施形態では、鋳型核酸は、第1のC2c1媒介事象で切断される標的配列の第1の部位、および第2のC2c1媒介事象で切断される標的配列の第2の部位の両方に対応する配列を含んでもよい。
特定の実施形態では、鋳型核酸は、翻訳された配列のコード配列に変化をもたらす配列、例えば、タンパク質産物中でアミノ酸の別のアミノ酸への置換をもたらす配列、例えば、変異対立遺伝子を野生型対立遺伝子に変換する配列、野生型対立遺伝子を変異対立遺伝子に変換する配列、および/または終止コドン、アミノ酸残基の挿入、アミノ酸残基の欠失、またはナンセンス変異を導入する配列を含んでもよい。特定の実施形態では、鋳型核酸は、非コード配列の変化、例えば、エクソンまたは5’もしくは3’の非翻訳または非転写領域の変化をもたらす配列を含んでもよい。その変化には、制御要素、例えばプロモーター、エンハンサーの変化、およびシス作用性またはトランス作用性の制御要素の変化が含まれる。
標的遺伝子中の標的位置と相同性を有する鋳型核酸を使用して、標的配列の構造を変更してもよい。鋳型配列を使用して、望ましくない構造、例えば、望ましくないヌクレオチドまたは変異ヌクレオチドを変更してもよい。鋳型核酸は、組み込まれると、陽性対照要素の活性の低下、陽性対照要素の活性の増大、陰性対照要素の活性の低下、陰性対照要素の活性の増大、遺伝子の発現の減弱、遺伝子の発現の増強、障害または病気に対する耐性の増強、ウイルス侵入に対する耐性の増強、変異の修正または望ましくないアミノ酸残基の変更、遺伝子産物の生物学的特性の付与、増強、排除、または低減、酵素の酵素活性の増強、あるいは遺伝子産物が別の分子と相互作用する能力の増強をもたらす配列を含んでもよい
鋳型核酸は、標的配列の1、2、3、4、5、6、7、8、9、10、11、12個またはそれ以上のヌクレオチドの配列の変化をもたらす配列を含んでもよい。
鋳型ポリヌクレオチドは、約10、15、20、25、50、75、100、150、200、500、1000、またはそれ以上のヌクレオチド長などの任意の適切な長さであってもよい。一実施形態では、鋳型核酸は、20±10、30±10、40±10、50±10、60±10、70±10、80 ±10、90±10、100±10、110±10、120±10、130±10、140 ±10、150±10、160±10、170±10、180±10、190±10、200±10、210±10、220±10のヌクレオチド長であってもよい。一実施形態では、鋳型核酸は、30±20、40±20、50±20、60±20、70±20、80±20、90±20、100±20、110±20、120±20、130±20、140±20、150±20、160±20、170±20、180±20、190±20、200±20、210±20、220±20のヌクレオチド長であってもよい。一実施形態では、鋳型核酸は、10~1000、20~900、30~800、40~700、50~600、50~500、50~400、50~300、50~200、または50~100のヌクレオチド長である。
実施形態によっては、鋳型ポリヌクレオチドは、標的配列を含むポリヌクレオチドの一部に相補的である。最適に整列された場合に、鋳型ポリヌクレオチドは、標的配列の1個以上のヌクレオチド(例えば、約1、5、10、15、20、25、30、35、40、45、50、60、70 、80、90、100個またはそれ以上のヌクレオチド)と重複する可能性がある。実施形態によっては、鋳型配列および標的配列を含むポリヌクレオチドが最適に整列される場合に、鋳型ポリヌクレオチドの最も近いヌクレオチドは、標的配列から約1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000個、またはそれ以上のヌクレオチド以内である。
外因性ポリヌクレオチド鋳型は、組み込まれる配列(例えば変異遺伝子)を含む。組込みのための配列は、細胞に対して内因性または外因性の配列であってもよい。組み込まれる配列の例として、タンパク質または非コードRNA(例えばマイクロRNA)をコードするポリヌクレオチドが含まれる。従って、組込みのための配列は、適切な制御配列に動作可能に結合されてもよい。あるいは、組み込まれる配列は、調節機能を提供してもよい。
上流または下流の配列は、約20塩基対~約2500塩基対、例えば、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、または2500塩基対を含んでもよい。方法によっては、上流または下流の配列の例として、約200塩基対~約2000塩基対、約600塩基対~約1000塩基対、またはより具体的には約700塩基対~約1000塩基対を有する。
上流または下流の配列は、約20塩基対~約2500塩基対、例えば、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、または2500塩基対を含んでもよい。方法によっては、上流または下流の配列の例として、約200塩基対~約2000塩基対、約600塩基対~約1000塩基対、またはより具体的には約700塩基対~約1000塩基対を有する。
特定の実施形態では、一方または両方の相同性アームを短縮して、特定の配列反復要素を含むことを回避してもよい。例えば、5’相同性アームを短縮して、配列反復要素を回避してもよい。他の実施形態では、3’相同性アームを短縮して、配列反復要素を回避してもよい。実施形態によっては、5’および3’相同性アームの両方を短縮して、特定の配列反復要素を含むことを回避してもよい。
方法によっては、外因性のポリヌクレオチド鋳型は、マーカーをさらに含んでもよい。このマーカーを使用すると、対象とする組込みを容易に選別できる。適切なマーカーの例として、制限部位、蛍光タンパク質、または選択可能なマーカーが挙げられる。本発明の外因性のポリヌクレオチド鋳型は、組換え技術を用いて構築できる(例えば、Sambrook et al., 2001 and Ausubel et al., 1996を参照)。
特定の実施形態では、変異を修正する鋳型核酸は、一本鎖オリゴヌクレオチドとして使用するために設計されてもよい。一本鎖オリゴヌクレオチドを使用する場合に、5’および3’相同性アームの長さは、最大約200塩基対、例えば、少なくとも25、50、75、100、125、150、175、または200塩基対の範囲であってもよい。
Suzukiら、CRISPR-Cas9の媒介による相同性に依存しない標的組込みを介するin vivoゲノム編集について説明している(2016, Nature 540:144-149)。
従って、本明細書でのCRISPRシステムについて、側面または実施形態によっては、CRISPRシステムは、(i)CRISPRタンパク質またはCRISPRエフェクタータンパク質をコードするポリヌクレオチド、および(ii)CRISPRタンパク質と複合化してCRISPR複合体を形成するように、かつ標的配列と複合化するように遺伝子操作される1個以上のポリヌクレオチドを含む。
実施形態によっては、治療は、in vivoまたはex vivoのいずれかでの真核細胞への送達(または投与)である。
実施形態によっては、CRISPRタンパク質は、標的配列の位置での一方または両方の鎖の切断を誘導するヌクレアーゼであるか、あるいはCRISPRタンパク質は、標的配列の位置での切断を誘導するニッカーゼである。
実施形態によっては、CRISPRタンパク質は、CRISPR-CasシステムのRNAポリヌクレオチド配列と複合化するC2c1タンパク質であり、このポリヌクレオチド配列は、a)標的HBV配列にハイブリダイズが可能なガイドRNAポリヌクレオチド、および(b)直接反復RNAポリヌクレオチドを含む。
実施形態によっては、CRISPRタンパク質はC2c1であり、システムは、I)CRISPR-CasシステムのRNAポリヌクレオチド配列を含み、このポリヌクレオチド配列は、(a)標的配列にハイブリダイズが可能なガイドRNAポリヌクレオチド、および(b)直接反復RNAポリヌクレオチドを含み、かつシステムは、I I)C2c1をコードするポリヌクレオチド配列、場合によっては少なくとも1つ以上の核局在化配列を含み、この直接反復配列は、ガイド配列にハイブリダイズし、かつCRISPR複合体の標的配列への配列特異的結合を誘導し、このCRISPR複合体は、(1)標的配列にハイブリダイズされるまたはハイブリダイズ可能なガイド配列、および(2)直接反復配列と複合化されるCRISPRタンパク質を含み、CRISPRタンパク質をコードするポリヌクレオチド配列は、DNAまたはRNAである。
本発明はまた、細胞を、本明細書に説明の遺伝子操作されたCRISPR酵素(例えば、遺伝子操作されたCasエフェクターモジュール)または組成物のいずれか、あるいは本明細書に説明のシステムまたはベクターシステムのいずれかと接触させることを含む、細胞中の関心のある遺伝子座を改変する方法を提供し、この細胞は、細胞内に存在する本明細書に説明のいずれかのCRISPR複合体を含む。これらの方法では、細胞は、原核生物または真核生物の細胞、好ましくは真核生物の細胞であってもよい。これらの方法では、生物はこの細胞を含んでもよい。これらの方法では、生物はヒトではなく、それ以外の動物であってもよい。特定の実施形態では、細胞は、A/T富化ゲノムを含んでもよい。実施形態によっては、細胞ゲノムは、T富化PAMを含む。特定の実施形態では、PAMは5’-TTN-3’または5’-ATTN-3’である。特定の実施形態では、PAMは5’-TTG-3’である。特定の実施形態では、細胞は熱帯熱マラリア原虫細胞である。
実施形態によっては、CRISPRエフェクタータンパク質は、C2c1タンパク質である。Cas9によって形成されたPAMの近位端での切断とは対照的に、C2c1はPAMの遠位端で二本鎖切断を形成する(Jinek et al., 2012; Cong et al., 2013)。Cpf1変異標的配列は、単一のgRNAによる反復切断を受けやすく、従ってHDRを介するゲノム編集でのCpf1の適用を促進する可能性があることが示されている(Front Plant Sci. 2016 Nov 14;7:1683)。Cpf1とC2c1はどちらも、構造の類似性を共有するV型のCRISPR-Casタンパク質である。PAMの近位端に平滑な切断部を形成するCas9とは異なり、Cpf1およびC2c1はPAMの遠位端に千鳥状の切断部を形成する。従って、特定の実施形態では、関心のある遺伝子座は、相同性指向修復(HRまたはHDR)を介してCRISPR-C2c1複合体によって改変される。特定の実施形態では、関心のある遺伝子座は、HRとは独立したCRISPR-C2c1複合体によって改変される。特定の実施形態では、関心のある遺伝子座は、非相同末端結合(NHEJ)を介してCRISPR-C2c1複合体によって改変される。
C2c1は、Cas9によって生成される平滑末端とは対照的に、5’オーバーハングを有する千鳥状の切断部を形成する(Garneau et al., Nature. 2010;468:67-71; Gasiunas et al., Proc Natl Acad Sci U S A. 2012;109:E2579-2586)。切断産物のこの構造は、哺乳動物ゲノムへの非相同末端結合(NHEJ)に基づく遺伝子挿入を促進するために特に有効な可能性がある(Maresca et al., Genome research. 2013;23:539-546)。
特定の実施形態では、関心のある遺伝子座は、鋳型DNA配列を挿入すなわち「ノックイン」して、CRISPR-C2c1複合体によって改変される。特定の実施形態では、DNA挿入は、適切な方向でゲノムに組み込まれるように設計されている。好ましい実施形態では、関心のある遺伝子座は、相同性指向修復(HDR)機構を介するゲノム編集が特に困難である場合に、非分裂細胞中でCRISPR-C2c1システムによって改変される(Chan et al., Nucleic acids research. 2011;39:5955-5966)。Maresca et al.(Genome Res. 2013 Mar; 23(3): 539-546)は、ジンクフィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)に適用可能な部位特異的かつ高精度の挿入の方法を説明していて、この方法では、5’オーバーハングを有する短い二本鎖DNAが相補的な末端に結合され、これによりヒト細胞株中の定義された遺伝子座に15-kbの外因性発現カセットを高精度に挿入可能となる。He et al.(Nucleic Acids Res. 2016 May 19; 44(9))は、GAPDH遺伝子座中への4.6kbのプロモーター不含ires-eGFP断片のCRISPR-Cas9誘導部位特異的ノックインが、体細胞性のLO2細胞中で20%までのGFP+細胞を産生し、かつNHEJ経路によって媒介されるヒト胚性幹細胞中で1.70%までのGFP+細胞を産生することを説明し、またNHEJに基づくノックインが、試験された全てのヒト細胞型でHDR媒介遺伝子標的化よりも効率的であることも報告していた。C2c1は5’オーバーハングにより千鳥状の切断部を生成するため、当業者はMeresca et al.およびHe et al.で説明されているのと同様の方法を用いて、本明細書に開示のCRISPR-C2c1システムにより関心のある遺伝子座に外因性DNAの挿入を形成できる。
特定の実施形態では、関心のある遺伝子座は、まずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、次いで、PAM配列の近傍のCRISPR-C2c1システムによって改変され、HDRを介して修復される。特定の実施形態では、関心のある遺伝子座は、HDRを介して外因性DNA配列の変異、欠失、または挿入を導入して、CRISPR-C2c1システムによって改変される。実施形態によっては、関心のある遺伝子座は、NHEJを介して外因性DNA配列の変異、欠失、または挿入を導入して、CRISPR-C2c1システムによって改変される。好ましい実施形態では、外因性DNAは、3’末端および5’末端の両方で単一ガイドDNA(sgDNA)-PAM配列に隣接している。好ましい実施形態では、外因性DNAは、CRISPR-C2c1の切断後に放出される。Zhang et al., Genome Biology201718:35およびHe et al., Nucleic Acids Research, 44: 9, 2016を参照。
実施形態によっては、CRISPRタンパク質は、アリシクロバチルス・アシドテレストリス(Alicyclobacillus acidoterrestri)ATCC 49025またはバチルス・テルモアミロボランス(Bacillus thermoamylovorans)株B4166からのC2c1である。
本発明はまた、本明細書に説明の方法または組成物のいずれかで、真核生物または真核細胞中での発現のためにコドン最適化されたエフェクタータンパク質をコードするヌクレオチド配列を提供する。本発明の一実施形態では、コドン最適化エフェクタータンパク質は、本明細書に説明の任意のC2c1であり、真核細胞または真核生物、例えば、本明細書の他の段落で説明の細胞または生物、例えば、限定はされないが、酵母細胞、あるいはマウス細胞、ラット細胞、およびヒト細胞または植物などの非ヒト真核生物を含む哺乳動物細胞または生物での操作性について対し最適化される。
実施形態によっては、CRISPRタンパク質は、CRISPRタンパク質の蓄積を生物の細胞核中に検出可能な量まで駆動が可能な1つ以上の核局在化シグナル(NLS)をさらに含む。
本発明の特定の実施形態では、少なくとも1つの核局在化シグナル(NLS)は、C2c1エフェクタータンパク質をコードする核酸配列に付加される。好ましい実施形態では、少なくとも1つ以上のC末端またはN末端NLSが付加されている(従って、C2c1エフェクタータンパク質をコードする核酸分子は、発現された産物が付加されたあるいは結合されたNLSを持つように、NLSをコードすることを含んでもよい)。好ましい実施形態では、真核細胞、好ましくはヒト細胞中での最適な発現および核標的化のために、C末端NLSが付加されている。好ましい実施形態では、コドン最適化エフェクタータンパク質はC2c1であり、ガイドRNAのスペーサー長は、15~35ヌクレオチド長である。特定の実施形態では、ガイドRNAのスペーサー長は、少なくとも17ヌクレオチド長などの少なくとも16ヌクレオチド長である。特定の実施形態では、スペーサー長は、15~17ヌクレオチド長、17~20ヌクレオチド長、20、21、22、23、または24ヌクレオチド長などの20~24ヌクレオチド長、23、24、または25ヌクレオチド長などの23~25ヌクレオチド長、24~27ヌクレオチド長、27~30ヌクレオチド長、30~35ヌクレオチド長、または35以上のヌクレオチド長である。本発明の特定の実施形態では、コドン最適化エフェクタータンパク質はC2c1であり、ガイドRNAの直接反復長は少なくとも16ヌクレオチド長である。特定の実施形態では、コドン最適化エフェクタータンパク質はC2c1であり、ガイドRNAの直接反復長は、16、17、18、19、または20ヌクレオチド長などの16~20ヌクレオチド長である。特定の好ましい実施形態では、ガイドRNAの直接反復長は、19ヌクレオチド長である。
実施形態によっては、CRISPRタンパク質は、1つ以上の変異を含む。
実施形態によっては、CRISPRタンパク質は、触媒ドメインに1つ以上の変異を有し、タンパク質は、1つ以上の機能ドメインをさらに含む。
実施形態によっては、CRISPRシステムは、送達システム内に含まれ、場合によっては、1つ以上のベクターを含むベクターシステム、場合によっては、ベクターは1つ以上のウイルスベクターを含み、場合によっては、1つ以上のウイルスベクターは、1つ以上のレンチウイルスベクター、アデノウイルスベクター、またはアデノ随伴ウイルス(AAV)ベクター、あるいは粒子または脂質粒子を含み、場合によっては、CRISPRタンパク質は、ポリヌクレオチドと複合化してCRISPR複合体を形成する。
実施形態によっては、システム、複合体、またはタンパク質は、関心のあるゲノム遺伝子座中の標的配列の操作によって、生物または非ヒト生物を改変する方法に使用される。
実施形態によっては、CRISPRシステムをコードするまたは提供する配列をコードするポリヌクレオチドは、リポソーム、粒子、細胞透過性ペプチド、エキソソーム、微小胞、または遺伝子銃を介して送達される。実施形態によっては、送達システムが含まれる。実施形態によっては、送達システムは、遺伝子操作されたポリヌクレオチドおよびCRISPRタンパク質をコードするポリヌクレオチドを含む1つ以上のベクターを含むベクターシステムを含み、場合によっては、ベクターは1つ以上のウイルスベクターを含み、場合によっては、1つ以上のウイルスベクターは、1つ以上のレンチウイルスベクター、アデノウイルスベクター、またはアデノ随伴ウイルス(AAV)ベクター、あるいはCRISPRシステムまたはCRISPR複合体を含む粒子または脂質粒子を含む。
実施形態によっては、組換え/修復鋳型が提供される。
本明細書に説明の本発明による方法は、本明細書に説明のベクターを細胞に送達することを含む、本明細書に説明の真核細胞(in vitroの、すなわち単離された真核細胞)に1つ以上の変異を誘導することを含む。この変異は、ガイドRNAまたはsgRNAを介する細胞の各標的配列での1つ以上のヌクレオチドの導入、欠失、または置換を含んでもよい。変異は、ガイドRNAまたはsgRNAを介する前記細胞の各標的配列での1~75個のヌクレオチドの導入、欠失、または置換を含んでもよい。変異は、ガイドRNAまたはsgRNAを介する前記細胞の各標的配列での1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75個のヌクレオチドの導入、欠失、または置換を含んでもよい。変異は、ガイドRNAまたはsgRNAを介する前記細胞の各標的配列での5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75個ヌクレオチドの導入、欠失、または置換を含んでもよい。変異は、ガイドRNAまたはsgRNAを介する前記細胞の各標的配列での10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75個ヌクレオチドの導入、欠失、または置換を含んでもよい。変異は、ガイドRNAまたはsgRNAを介する前記細胞の各標的配列での20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75個ヌクレオチドの導入、欠失、または置換を含んでもよい。変異は、ガイドRNAまたはsgRNAを介する前記細胞の各標的配列での40、45、50、75、100、200、300、400、または500個のヌクレオチドの導入、欠失、または置換を含んでもよい。
毒性および非特異的標的効果を最小化するために、送達されるCas mRNAおよびガイドRNAの濃度を制御することが重要となる可能性がある。Cas mRNAおよびガイドRNAの最適濃度は、細胞モデルまたは非ヒト真核動物モデル中で種々の濃度を試験して、かつディープ配列決定を使用して潜在的な非特異的標的ゲノム遺伝子座での改変の程度を分析して決定してもよい。あるいは、毒性と非特異的標的効果の水準を最小限に抑えるために、CasニッカーゼmRNA(例えば、D10A変異を持つ化膿性連鎖球菌Cas9)を、関心のある部位を標的とするガイドRNA対とともに送達してもよい。毒性および非特異的標的効果を最小限に抑えるためのガイド配列および手法は、国際特許出願WO2014/093622(PCT/US2013/074667)号のようにしてもよく、または本明細書のような変異を介してもよい。
典型的には、内因性CRISPRシステムの環境では、(標的配列にハイブリダイズし、かつ1つ以上のCasタンパク質と複合化されるガイド配列を含む)CRISPR複合体の形成は、標的配列内または標的配列の近傍(例えば、標的配列から1、2、3、4、5、6、7、8、9、10、20、50個、またはそれ以上の塩基対内)にある一方または両方の鎖の切断をもたらす。理論により拘束されることを望まないが、野生型tracr配列の全部または一部(例えば、約20、26、32、45、48、54、63、67、85個またはそれ以上の野生型tracr配列のヌクレオチド)を含んでもよいか、あるいはそれからなってもよいtracr配列は、tracr配列の少なくとも一部に沿ったガイド配列に操作可能に連結されているtracr mate配列の全てまたは一部へのハイブリダイズ化などによって、CRISPR複合体の一部を形成することもある。
遺伝子操作されたCRISPR-Casシステム
一般に、SPIDR(SPacer Interspersed Direct Repeats:スペーサー分散型直接反復)としても知られるCRISPR(クラスター化され規則的に間隔をおいた短鎖回文配列反復)は、通常は特定の細菌種に特異的であるDNA遺伝子座ファミリーを構成する。CRISPR遺伝子座は、大腸菌で認識された異なる部類の分散型短鎖配列反復(SSR)(Ishino et al., J. Bacteriol., 169:5429-5433 [1987]、およびNakata et al., J. Bacteriol., 171:3553-3556 [1989]を参照)、および関連する遺伝子を含む。
同様の分散型SSRは、ハロフラックス・メディテラネイ(Haloferax mediterranei)、化膿性連鎖球菌(Streptococcus pyogenes)、アナベナ属(Anabaena)、および結核菌(Mycobacterium tuberculosis)で確認されている(Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]、Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]、Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]、およびMojica et al., Mol. Microbiol., 17:85-93 [1995]を参照)。CRISPR遺伝子座は通常、反復の構造が他のSSRとは異なり、短い規則的間隔の反復(SRSR)と呼ばれている(Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]、およびMojica et al., Mol. Microbiol., 36:244-246 [2000]を参照)。一般に、反復は、実質的に一定の長さを有する固有の介在配列によって規則的に間隔をおいたクラスター中で発生する短い要素である(上述のMojica et al., [2000])。反復配列は株間で高度に保存されているが、分散型の反復数とスペーサー領域の配列は、通常、株ごとに異なる(van Embden et al., J. Bacteriol., 182:2393-2401 [2000])。CRISPR遺伝子座は、40個を超える原核生物中で確認されていて(例えば、Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]、およびMojica et al., [2005]を参照)、これら原核生物として、限定はされないが、アエロピルム属(Aeropyrum)、ピロバキュラム属(Pyrobaculum)、スルフォロブス属(Sulfolobus)、アルカエオグロブス属(Archaeoglobus)、ハロカルキュラ属(Halocarcula)、メタノバクテリウム属(Methanobacterium)、メタノコッカス属(Methanococcus)、メタノサルキナ属(Methanosarcina)、メタノピルス属(Methanopyrus)、ピロコッカス属(Pyrococcus)、ピクロフィルス属(Picrophilus)、テルモプラズマ属(Thermoplasma)、コリネバクテリウム属(Corynebacterium)、マイコバクテリウム属(Mycobacterium)、ストレプトマイセス属(Streptomyces)、アクイフェックス属(Aquifex)、ポルフィロモナス属(Porphyromonas)、クロモバクテリウム属(Chlorobium)、テルムス属(Thermus)、バチルス属(Bacillus)、リステリア属(Listeria)、スタフィロコッカス属(Staphylococcus)、クロストリジウム属(Clostridium)、テルモアナエロバクター属(Thermoanaerobacter)、マイコプラズマ属(Mycoplasma)、フソバクテリウム属(Fusobacterium)、アゾアルカス属(Azarcus)、クロモバクテリウム属(Chromobacterium)、ネイセリア属(Neisseria)、ニトロソモナス属(Nitrosomonas)、デスルフォビブリオ属(Desulfovibrio)、ジオバクター属(Geobacter)、ミキソコッカス属(Myxococcus)、カンピロバクター属(Campylobacter)、ウォリネラ属(Wolinella)、アシネトバクター属(Acinetobacter)、エルウィニア属(Erwinia)、エシェリヒア属(Escherichia)、レジオネラ属(Legionella)、メチロコッカス属(Methylococcus)、パスツレラ属(Pasteurella)、フォトバクテリウム属(Photobacterium)、サルモネラ属(Salmonella)、キサントモナス属(Xanthomonas)、エルシニア属(Yersinia)、トレポネーマ属(Treponema)、およびテルモトガ属(Thermotoga)が挙げられる。
側副(collateral)活性
Cas12酵素は、側副活性を有してもよく、すなわち、特定の環境では、活性化されたCas12酵素は、標的配列の結合後でも活性を維持し、非標的オリゴヌクレオチドを非特異的に切断し続ける。このガイド分子でプログラムされた側副切断活性は、Cas12bシステムを使用して、特定の標的オリゴヌクレオチドの存在を検出し、かつ読取りとして機能できるin vivoでのプログラム細胞死またはin vitroでの非特異的RNA分解を開始する機能を提供する。(Abudayyeh et al. 2016; East-Seletsky et al, 2016)。
RNAガイドC2c1のプログラムの可能性、特異性、および側副活性はまた、そのC2c1を核酸の非特異的切断のための理想的な交換可能なヌクレアーゼとする。一実施形態では、C2c1システムは、ssDNAなどの核酸の側副非特異的切断を提供かつ利用するように遺伝子操作されている。別の実施形態では、C2c1システムは、ssDNAの側副非特異的切断を提供かつ利用するように遺伝子操作されている。従って、遺伝子操作されたC2c1システムは、核酸検出およびトランスクリプトームの操作かつ細胞死の誘導のためのプラットフォームを提供する。C2c1は、哺乳類の転写産物のノックダウンおよび結合ツールとして使用するために開発されている。C2c1は、配列特異的な標的DNA結合によって活性化されると、RNAおよびssDNAの堅牢な側副切断を可能とする。
特定の実施形態では、C2c1は、in vitroシステムまたは細胞中で、提供されて一過性または安定的に発現され、細胞核酸を非特異的に切断するように標的化または誘発される。一実施形態では、C2c1は、ssDNA、例えばウイルスssDNAをノックダウンするように遺伝子操作されている。別の実施形態では、C2c1は、RNAをノックダウンするように遺伝子操作されている。このシステムは、ノックダウンが細胞またはin vitroシステム中に存在する標的DNAに依存するように、またはシステムまたは細胞への標的核酸の付加によって引き起こされるように工夫されていてもよい。
一実施形態では、C2c1システムは、例えば、異常なDNAの切断が完全でなくまたは効果がない可能性がある場合に、異常なDNA配列の存在によって識別可能な細胞の部分集合中でRNAを非特異的に切断するように操作される。1つの非限定例では、癌細胞中に存在し、かつ細胞の形質転換を駆動するDNA転座が標的とされる。染色体DNAおよび修復を受ける細胞の亜集団は生き残る可能性があるが、非特異的な側副リボヌクレアーゼ活性は、潜在的な生存物の細胞死に有効に誘導する。
側副活性は、最近、多くの臨床診断に有用であるSHERLOKと呼ばれる高感度で特異的な核酸検出プラットフォームに活用されている(Gootenberg, J. S. et al. 「CRISPR-Cas13a/C2c2による核酸検出」Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 356, 438-442 (2017))。
本発明によれば、遺伝子操作されたC2c1システムは、DNAまたはRNAエンドヌクレアーゼ活性について最適化され、哺乳動物細胞中で発現しかつ細胞内のレポーター分子または転写物を効果的にノックダウンするように標的化できる。
恒温増幅を伴う遺伝子操作されたC2c1の側副効果は、高感度および単一塩基不一致特異性を備えた迅速なDNAまたはRNA検出を提供するCRISPRに基づく診断を提供する。C2c1に基づく分子検出プラットフォームを用いて、ウイルスの特定の株を検出し、病原菌を識別し、ヒトDNAの遺伝子型を特定し、かつ無細胞腫瘍DNA変異を特定する。さらに反応試薬は、低温流通系に依存せずに、長期保存のために凍結乾燥が可能であり、現場での適用時に紙の上に簡単に再構成できる。
携帯型プラットフォーム上で高感度で核酸および単一塩基特異性を迅速に検出する能力は、疾患の診断および監視、疫学、および一般的な実験室作業に役立てることができる。核酸を検出する方法は複数存在するが、それら方法には、感度、特異性、簡潔性、コスト、および速度の間に相反関係がある。
微生物のクラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)およびCRISPR会合(CRISPR-Cas)適応免疫システムは、CRISPRに基づく診断(CRISPR-Dx)に活用できるプログラム可能なエンドヌクレアーゼを含む。(Cas12bとしても知られる)C2c1は、CRISPR RNA(crRNA)により再プログラムして、特定のDNA検出のためのプラットフォームを提供できる。そのDNA標的を認識すると、活性化されたC2c1は、近傍の非標的核酸(すなわちRNAおよび/またはssDNA)の「側副」切断に関与する。このcrRNAでプログラムされた側副切断活性により、C2c1は、プログラム細胞死の誘発によって、あるいは標識RNAまたはssDNAの非特異的分解によって、in vivoで特定のDNAの存在を検出できる。ここでは、核酸増幅および市販のレポーターRNAのC2c1を介する側副切断に基づく高感度のin vitro核酸検出プラットフォームについて説明しており、標的の即時検出を可能にする。
特定の実施形態例では、本明細書に開示される相同分子種は、診断組成物および測定法において、単独で、または他のCas12またはCas13相同分子種と組合せて用いられてもよい。例えば、本明細書に開示されるCas12b相同分子種は、標的配列を検出するための多重測定法で使用されてもよく、次いで、オリゴヌクレオチドに基づくレポーターの非特異的切断により、検出可能なシグナルを生成してもよい。
レポーター/マスキング構造
本明細書で使用される「マスキング構築物」は、本明細書に説明の活性化されたCRISPRシステムエフェクタータンパク質によって切断またはその他の方法で不活化されてもよい分子を指す。用語「マスキング構築物」は、代わりに「検出構築物」と呼ばれることもある。CRISPRエフェクタータンパク質のヌクレアーゼ活性に応じて、マスキング構築物は、RNAに基づくマスキング構築物またはDNAに基づくマスキング構築物であってもよい。核酸に基づくマスキング構築物は、CRISPRエフェクタータンパク質によって切断可能な核酸要素を含む。核酸要素の切断により、検出可能なシグナルの発生を可能にする媒体を放出するか、あるいは立体配座的な変化を生成する。検出可能シグナルの発生を防止またはマスクするための核酸要素の使用方法を示す構築物の例を以下に説明し、本発明の実施形態にはその変異体を含む。切断の前あるいはマスキング構築物が「活性な」状態にある場合に、マスキング構築物は正の検出可能信号の発生または検出を阻止する。特定の実施形態例では、最小の背景信号が、活性なマスキング構築物の存在で発生してもよいことが分かる。正の検出可能信号は、光学的、蛍光的、化学発光的、電気化学的な各方法、または当技術分野で既知の他の検出方法を用いて検出できる任意の信号であってもよい。用語「正の検出可能信号」は、マスキング構築物の存在で検出できる他の検出可能な信号と区別するために用いられる。例えば、特定の実施形態では、マスキング剤が存在するときに第1の信号(すなわち負の検出可能信号)が検出でき、次いで、活性化されたCRISPRエフェクタータンパク質によって標的分子が検出され、かつマスキング剤が切断または不活化されると、第1の信号は、第2の信号(例えば正の検出可能信号)に変換される。
特定の実施形態例では、マスキング構築物は、遺伝子産物の生成を抑制してもよい。遺伝子産物は、試料に付加されるレポーター構築物によってコードされていてもよい。マスキング構築物は、短いヘアピンRNA(shRNA)または低分子干渉RNA(siRNA)などのRNA干渉経路に関与する干渉RNAであってもよい。マスキング構築物はまた、マイクロRNA(miRNA)を含んでもよい。マスキング構築物は、存在する間は、遺伝子産物の発現を抑制する。遺伝子産物は、蛍光タンパク質またはその他のRNA転写物、あるいは、標識プローブ、アプタマー、またはマスキング構築物の存在がなかったら抗体によってその他の方法で検出可能なタンパク質であってもよい。エフェクタータンパク質が活性化されると、マスキング構築物が切断されるか、さもなければ発現停止され、正の検出可能信号としての遺伝子産物の発現および検出が可能になる。
特定の実施形態例では、マスキング構築物は、マスキング構築物からの1種以上の試薬の放出で正の検出可能信号が発生すように、正の検出可能信号を発生するために必要な1種以上の試薬を隔絶していてもよい。1種以上の試薬を組み合わせて、比色信号、化学発光信号、蛍光信号、または任意の他の検出可能信号を発生してもよく、あるいは、その目的に適うことが分かっている任意の試薬を含んでもよい。特定の実施形態例では、1種以上の試薬は、1種以上の試薬に結合するRNAアプタマーによって隔絶されている。標的分子の検出時にエフェクタータンパク質が活性化され、かつRNAアプタマーまたはDNAアプタマーが分解されると、1種以上の試薬が放出される。
特定の実施形態例では、マスキング構築物は、(以下でさらに定義される)個々に設定された容量で固体基板の表面に固定でき、単一の試薬を隔絶する。例えば、試薬は、色素を含むビーズであってもよい。固定された試薬によって隔絶される場合に、個々のビーズは散らばり過ぎて検出可能信号を発生できないが、マスキング構築物から解放されると、これらビーズは、例えば凝集または溶液濃度の単純な増加によって検出可能信号を発生できる。特定の実施形態例では、固定されたマスキング剤は、標的分子の検出時に活性化されたエフェクタータンパク質によって切断可能となるRNAまたはDNAに基づくアプタマーである。
特定の他の実施形態例では、マスキング構築物は、溶液中で固定された試薬に結合して、それにより、溶液中に遊離している個々の標識された結合相手に結合する試薬の能力を遮断する。従って、洗浄工程を試料に用いると、標的分子が存在しない場合は、標識された結合相手を試料から洗い流すことができる。しかしながら、エフェクタータンパク質が活性化されている場合には、マスキング構築物は、試薬に結合するマスキング構築物の能力を妨害するのに十分な程度まで切断されて、それにより、標識された結合相手が固定化試薬に結合することを可能にする。従って、標識された結合相手は、洗浄工程後も残留して、試料中に標的分子が存在することを示している。特定の側面では、固定された試薬に結合するマスキング構築物は、DNAアプタマーまたはRNAアプタマーである。固定された試薬はタンパク質であってもよく、標識記憶の相手は標識された抗体であってもよい。あるいは、固定された試薬はストレプトアビジンであってもよく、標識された結合相手は標識されたビオチンであってもよい。上述の実施形態で使用される結合相手表面の標識は、当技術分野で既知の任意の検出可能な標識であってもよい。さらに、他の既知の結合相手を、本明細書に説明の全体的な設計に従って用いてもよい。
特定の実施形態例では、マスキング構築物は、リボザイムを含んでもよい。リボザイムは、触媒特性を持つRNA分子である。リボザイムすなわち天然起源および遺伝子操作された両方のリボザイムは、本明細書に開示のエフェクタータンパク質によって標的化されてもよいRNAを含むか、またはそれからなる。リボザイムは、負の検出可能信号を発生するか、または正の制御信号の発生を妨げる反応を触媒するように選択されてもよく、あるいは操作されてもよい。活性化されたエフェクタータンパク質によりリボザイムが不活化されると、負の制御信号を発生するか、または正の検出可能信号の発生を妨げる反応は排除されて、それによって正の検出可能信号の発生が可能になる。一実施形態では、リボザイムは、比色反応を触媒して、溶液を第1の色として出現させることができる。リボザイムが不活化されると、溶液はその後に第2の色に変化し、この第2の色は正の検出可能信号である。リボザイムを用いて比色反応を触媒する方法の一例は、Zhao et al.「リボザイムglmSに基づくグルコサミン-6-リン酸の信号増幅」“Signal amplification of glucosamine-6-phosphate based on ribozyme glmS,” Biosens Bioelectron. 2014; 16:337-42に説明されていて、本明細書に開示の実施形態の環境でそのシステムがどのように改変されて作用するのかの例を提供している。あるいは、リボザイムは、存在する場合には、例えば、RNA転写物の切断産物を生成できる。従って、正の検出可能信号の検出は、リボザイムが存在しない場合にのみ生成される切断されていないRNA転写物の検出を含んでもよい。
特定の実施形態例では、1種以上の試薬は、比色信号、化学発光信号、または蛍光信号などの検出可能な信号の発生を促進できる酵素などのタンパク質であり、1種以上の試薬は、1つ以上のDNAアプタマーまたはRNAアプタマーがタンパク質に結合してタンパク質が検出可能信号を発生できないように阻害されているか、あるいは隔絶されている。本明細書に開示のエフェクタータンパク質が活性化されると、DNAアプタマーまたはRNAアプタマーは、これらアプタマーが検出可能信号を発生するタンパク質の能力をもはや阻害しない程度まで切断されるか、あるいは分解される。特定の実施形態例では、アプタマーは、トロンビン阻害剤アプタマーである。特定の実施形態例では、トロンビン阻害剤アプタマーは、GGGAACAAAGCUGAAGUACUUACCCの配列(配列番号439)を有する。このアプタマーが切断されると、トロンビンが活性になり、ペプチド比色基質または蛍光基質を切断する。特定の実施形態例では、比色基質は、トロンビンのペプチド基質に共有結合されたp-ニトロアニリド(pNA)である。トロンビンにより切断されると、pNAが放出されて、黄色になり、目に見え易くなる。特定の実施形態例では、蛍光基質は、蛍光検出器を用いて検出可能な青色蛍光色素である7-アミノ-4-メチルクマリンである。阻害性アプタマーはまた、西洋ワサビペルオキシダーゼ(HRP)、β-ガラクトシダーゼ、または子ウシアルカリホスファターゼ(CAP)に使用してもよく、上述の一般的な原理の範囲内で使用してもよい。
特定の実施形態では、RNA分解酵素またはDNA分解酵素の活性は、酵素阻害アプタマーの切断を介して比色分析により検出される。DNA分解酵素またはRNA分解酵素の活性を比色信号に変換する1種の可能性のある方式は、DNAアプタマーまたはRNAアプタマーの切断を、比色出力を生成可能な酵素の再活性化と結合させることである。RNAまたはDNAの切断がない場合には、無傷のアプタマーは、酵素の標的に結合し、かつその活性を阻害する。この出力システムの利点は、酵素がさらなる増幅工程を提供することであり、(C2c1の側副活性などの)側副活性を介してアプタマーから遊離すると、比色酵素は、比色生成物を生成し続けて信号の増殖が誘導される。
特定の実施形態では、比色出力により酵素を阻害する既存のアプタマーを使用する。比色出力と共に、トロンビン、タンパク質C、好中球エラスターゼ、スブチリシンなどのいくつかのアプタマー/酵素の対が存在する。これらのタンパク質分解酵素は、pNAに基づく比色基質を有し、市販されている。特定の実施形態では、一般的な比色酵素を標的とする新規のアプタマーが使用される。β-ガラクトシダーゼ、西洋ワサビペルオキシダーゼ、または子ウシ腸アルカリホスファターゼなどの一般的で堅牢な酵素は、SELEXなどの選択手法によって設計された遺伝子操作アプタマーによって標的とされる可能性がある。これらの手法は、ナノモルの結合効率を備えるアプタマーの迅速な選択を可能として、比色出力のためのさらなる酵素/アプタマー対の開発に使用できる可能性がある。
特定の実施形態では、RNA分解酵素またはDNA分解酵素の活性は、RNA繋留阻害剤の切断を介して比色分析により検出される。多くの一般的な比色酵素には、競争力のある可逆的な阻害剤があり、例えば、β-ガラクトシダーゼはガラクトースによって阻害される。これらの阻害剤の多くの効果は弱いが、それらの効果は局所濃度の増加によって増大させることができる。阻害剤の局所濃度をDNA分解酵素および/またはRNA分解酵素の活性に関連付けて、比色酵素と阻害剤の対をDNA分解酵素センサーおよびRNA分解酵素センサーに組み込むことができる。小分子阻害剤に基づく比色DNA分解酵素またはRNA分解酵素センサーには、比色酵素、阻害剤、および阻害剤および酵素の両方に共有結合し阻害剤を酵素に繋ぐ架橋RNAまたはDNAの3つの構成要素が含まれる。非切断の構成では、酵素は小分子の局所濃度の増加によって阻害され、DNAまたはRNAが(例えばCas13またはCas12の側副切断によって)切断されると、阻害剤が放出されて、比色酵素が活性化される。
特定の実施形態では、RNA分解酵素またはDNA分解酵素の活性は、グアニン四重鎖の生成および/または活性化を介して比色分析により検出される。DNAのグアニン四重鎖は、ヘム(鉄(III)-プロトポルフィリンIX)と複合体を形成して、ペルオキシダーゼ活性を持つDNAザイムを生成する。ペルオキシダーゼ基質(例えば、ABTS:(2,2’-アジノビス[3-エチルベンゾチアゾリン-6-スルホン酸]-ジアンモニウム塩))が供給されると、グアニン四重鎖-ヘム複合体は、過酸化水素の存在で基質が酸化され、その後溶液中で緑色を生成する。DNA配列を形成するグアニン四重鎖の例は、GGGTAGGGCGGGTTGGGA(配列番号440)である。本明細書で「ステープル」と呼ばれる追加のDNAまたはRNA配列をこのDNAアプタマーにハイブリダイズさせることにより、グアニン四重鎖構造の形成が制限される。側副活性化が起こると、ステープルが切断され、グアニン四重鎖が形成されてヘムが結合する。色の生成は酵素によるために、この手法は特に興味を引くものであり、すなわち側副活性化を超えてさらなる増幅があることを意味している。
特定の実施形態例では、マスキング構築物は、(以下でさらに定義される)個々の個別の容量で固体基板上に固定化されてもよく、かつ単一の試薬を隔離する。例えば、試薬は、色素を含むビーズであってもよい。固定された試薬によって隔離されると、個々のビーズは散在し過ぎて検出可能な信号を発生できないが、マスキング構築物から解放されると、例えば凝集または溶液濃度の単純な増加によって検出可能信号を発生できる。特定の実施形態例では、固定されたマスキング剤は、標的分子の検出時に活性化されたエフェクタータンパク質によって切断可能なDNAまたはRNAに基づくアプタマーである。
一実施形態例では、マスキング構築物は、検出剤が溶液中に凝集しているか分散しているかに応じて、色が変化する検出剤を含む。例えば、コロイド状の金などの特定のナノ粒子は、凝集体から分散粒子に移行すると、目に見える紫色から赤色への変化を受ける。従って、特定の実施形態例では、その検出剤は、1つ以上の架橋分子によって集合として保持されていてもよい。架橋分子の少なくとも一部は、RNAまたはDNAを含む。本明細書に開示のエフェクタータンパク質が活性化されると、架橋分子のRNA部分またはDNA部分が切断され、検出剤が分散して対応する色の変化がもたらされる。特定の実施形態例では、検出剤はコロイド状の金属である。コロイド状の金属材料は、液体、ヒドロゾル、または金属ゾルに分散された水不溶性の金属粒子または金属化合物を含んでもよい。コロイド状の金属は、周期律表のIA、IB、IIB、およびIIIB族の金属、ならびに遷移金属、特にVIII族の金属から選択することができる。好ましい金属として、金、銀、アルミニウム、ルテニウム、亜鉛、鉄、ニッケル、およびカルシウムが挙げられる。他の適切な金属としてはまた、リチウム、ナトリウム、マグネシウム、カリウム、スカンジウム、チタン、バナジウム、クロム、マンガン、コバルト、銅、ガリウム、ストロンチウム、ニオブ、モリブデン、パラジウム、インジウム、スズ、タングステン、レニウム、白金、およびガドリニウムが種々の酸化状態として挙げられる。金属は、好ましくは、適切な金属化合物、例えば、A13+、Ru3+、Zn2+、Fe3+、Ni2+、およびCa2+イオンに由来するイオン形態で提供される。
RNAまたはDNA架橋が活性化されたCRISPRエフェクターによって切断されると、前述の色の変化が観察される。特定の実施形態例では、粒子はコロイド状金属である。特定の別の実施形態例では、コロイド状金属はコロイド状の金である。特定の実施形態例では、コロイド状のナノ粒子は、15 nmの金ナノ粒子(AuNP)である。コロイド状の金ナノ粒子の独特の表面特性により、溶液に完全に分散した際に520 nmで最大の吸光度が観察され、肉眼では赤色に見える。AuNPは、凝集すると最大吸光度の赤方移動を示しかつ色が暗くなり、最終的には溶液から濃い紫色の凝集体として沈殿する。特定の実施形態例では、ナノ粒子は、ナノ粒子の表面から延びるDNAリンカーを含むように改変される。個々の粒子は、DNAリンカーの少なくとも一部分に両端でハイブリダイズする一本鎖RNA(ssRNA)架橋または一本鎖DNA架橋によって互いに結合される。従って、ナノ粒子は結合された粒子と凝集体の網状体を形成し、暗い沈殿物として出現する。本明細書に開示のCRISPRエフェクターが活性化されると、ssRNA架橋またはssDNA架橋が切断され、結合された網状体からAuNPが解放され、目に見える赤色が生成される。DNAリンカーおよび架橋配列の例を以下に示す。DNAリンカーの末端にあるチオールリンカーは、AuNPへの表面結合に使用できる。その他の形態の結合が使用されてもよい。特定の実施形態例では、各DNAリンカーに1つずつ、AuNPの2つの集団を生成してもよい。これにより、ssRNA架橋が適切な方向に適切に結合し易くなる。特定の実施形態例では、第1のDNAリンカーは3’末端によって結合され、第2のDNAリンカーは5’末端によって結合される。
Figure 2024138266000001
特定の別の実施形態例では、マスキング構築物は、検出可能な標識およびその検出可能な標識のマスキング剤が付加されているRNAまたはDNAオリゴヌクレオチドを含んでもよい。その検出可能な標識/マスキング剤の対の例は、蛍光体および蛍光体の消光剤である。蛍光体の消光は、蛍光体と別の蛍光体または非蛍光分子との間の非蛍光複合体の形成の結果として生じてもよい。この機構は、基底状態の複合体形成、静的消光、または接触消光として知られている。従って、RNAまたはDNAオリゴヌクレオチドは、蛍光体および消光剤が接触消光するのに十分な近接状態に設計されてもよい。蛍光体およびそれらの同族の消光剤は、当技術分野では知られており、当業者ならこの目的のために選択できるものである。特定の蛍光体/消光剤の対は、本発明の環境では必須ではなく、蛍光体/消光剤の対を選択すると、蛍光体のマスキングを確実にできるというだけである。本明細書に開示のエフェクタータンパク質が活性化されると、RNAまたはDNAオリゴヌクレオチドが切断されて、それにより、接触消光効果を維持するために必要な蛍光体と消光剤との間の近接性が切断される。従って、蛍光体の検出を用いて、試料中の標的分子の存在を判断できる。
特定の別の実施形態例では、マスキング構築物は、金ナノ粒子などの1つ以上の金属ナノ粒子が付着している1つ以上のRNAオリゴヌクレオチドを含んでもよい。実施形態によっては、マスキング構築物は、閉ループを形成する複数のRNAまたはDNAオリゴヌクレオチドによって架橋された複数の金属ナノ粒子を含む。一実施形態では、マスキング構築物は、閉ループを形成する3つのRNAまたはDNAオリゴヌクレオチドによって架橋された3つの金ナノ粒子を含む。実施形態によっては、CRISPRエフェクタータンパク質でRNAまたはDNAオリゴヌクレオチドを切断すると、金属ナノ粒子によって検出可能信号が生成される。
特定の別の実施形態例では、マスキング構築物は、1つ以上の量子ドットが付着している1つ以上のRNAまたはDNAオリゴヌクレオチドを含んでもよい。実施形態によっては、CRISPRエフェクタータンパク質によるRNAまたはDNAオリゴヌクレオチドの切断は、量子ドットによって生成される検出可能信号をもたらす。
一実施形態例では、マスキング構築物は、量子ドットを含んでもよい。量子ドットは、表面に複数のリンカー分子を付着させてもよい。リンカー分子の少なくとも一部分は、RNAまたはDNAを含む。リンカー分子は、量子ドットの消光が起こるのに十分な近接状態で消光剤が保持されるように、一端にある量子ドットに、かつリンカーの長さに沿ってまたは末端にある1つ以上の消光剤に付着している。リンカーは分岐していてもよい。上述のように、量子ドットと消光剤の対は必須ではなく、量子ドットと消光剤の対を選択すると、蛍光体のマスキングを確実にできるというだけである。量子ドットおよびそれらの同族の消光剤は、当技術分野で知られており、当業者ならこの目的のために選択できるものである。本明細書に開示のエフェクタータンパク質が活性化すると、リンカー分子のRNA部分またはDNA部分が切断され、それにより、量子ドットと消光効果を維持するのに必要な1つ以上の消光剤との間の近接性が排除される。特定の実施形態例では、量子ドットはストレプトアビジン結合体である。RNAまたはDNAはビオチンリンカーを介して結合し、各配列:/5Biosg/UCUCGUACGUUC/3IAbRQSp/(配列番号444)または/5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/(配列番号445)を有する消光分子を動員し、/5Biosg/はビオチンタグであり、/3lAbRQSp/はアイオワブラック消光剤である。切断されると、本明細書に開示の活性化されたエフェクターによって、量子ドットは可視的に蛍光を発する。
同様の方法で、蛍光エネルギー移動(FRET)を使用して、正の検出可能信号を発生することができる。FRETは、エネルギー励起された蛍光体(すなわち「供与体蛍光体」)からの光子が別の分子(すなわち「受容体」)内の電子のエネルギー状態を励起された一重項状態のより高い振動水準に上昇させる非放射プロセスである。供与体蛍光体は、その蛍光体に特徴的な蛍光を発することなく基底状態に戻る。受容体は、別の蛍光体または非蛍光分子であってもよい。受容体が蛍光体である場合に、伝達されたエネルギーは、その蛍光体に特徴的な蛍光として放射される。受容体が非蛍光分子の場合、吸収されたエネルギーは、熱としての損失となる。従って、本明細書に開示の実施形態の文脈では、蛍光体/消光剤の対は、オリゴヌクレオチド分子に付加された供与体蛍光体と受容体の対で置き換えられる。無傷の場合には、マスキング構築物は、受容体から放射される蛍光または熱によって検出されるような第1の信号(負の検出可能信号)を発生する。本明細書に開示のエフェクタータンパク質が活性化されると、RNAオリゴヌクレオチドが切断され、FRETが中断されて供与体蛍光体の蛍光(正の検出可能信号)が検出される。
特定の実施形態例では、マスキング構築物は、長いRNAまたはDNAの短いヌクレオチドへの切断に応答する、それらの吸光度を変化させる挿入色素の使用を含む。そのような色素がいくつか存在する。例えばピロニンYは、RNAと複合化して、572 nmに吸光度を持つ複合体を生成する。RNAが切断されると、吸光度が失われて色が変化する。メチレンブルーも類似の方法で使用してもよいが、RNA切断時に688 nmで吸光度が変化する。従って、特定の実施形態例では、マスキング構築物は、本明細書に開示のエフェクタータンパク質によるRNAの切断時に吸光度を変化させるRNAおよび挿入色素複合体を含む。
特定の実施形態例では、マスキング構築物は、HCR反応(ハイブリダイズ連鎖反応)のための開始剤を含んでもよい。例えば、Dirks and Pierce. PNAS 101, 15275-15728 (2004)を参照。HCR反応は、2つのヘアピン種の位置エネルギーを利用する。ヘアピンのうちの1つに対応する領域に相補的な部分を有する一本鎖開始剤が予め安定な混合物に放出されると、その開始剤は一方の種のヘアピンを開く。このプロセスは、次に他方の種のヘアピンを開く一本鎖領域を露出させる。このプロセスは、次に元の開始剤と同一の一本鎖領域を露出させる。得られた連鎖反応は、ヘアピンの供給が消失するまで成長する切れ目の入った二重螺旋の形成に導く可能性がある。得られた生成物の検出は、ゲルによりまたは比色分析により実施してもよい。比色検出法の例として、例えば、Lu et al.「ハイブリダイズ連鎖反応によって引き起こされる酵素カスケード増幅に基づく超高感度比色分析システム」“Ultra-sensitive colorimetric assay system based on the hybridization chain reaction-triggered enzyme cascade amplification ACS Appl Mater Interfaces, 2017, 9(1):167-175、Wang et al.「ハイブリダイズ連鎖反応増幅および分裂アプタマーを使用する酵素不含の比色分析」“An enzyme-free colorimetric assay using hybridization chain reaction amplification and split aptamers” Analyst 2015, 150, 7657-7662,、およびSong et al.「高感度DNA検出のためのハイブリダイズ連鎖反応と組合せたヘアピンDNAプローブの非共有結合蛍光標識」“Non covalent fluorescent labeling of hairpin DNA probe coupled with hybridization chain reaction for sensitive DNA detection.” Applied Spectroscopy, 70(4): 686-694 (2016)が挙げられる。
特定の実施形態例では、マスキング構築物は、HCR開始剤配列、および開始剤がHCR反応を開始することを妨げるループまたはヘアピンなどの切断可能な構造要素を含んでもよい。活性化されたCRISPRエフェクタータンパク質によって構造要素が切断されると、開始剤が放出されてHCR反応を始動させ、その検出により、試料内に1つ以上の標的が存在することが示される。特定の実施形態例では、マスキング構築物は、RNAループを備えたヘアピンを含む。活性化されたCRISRPエフェクタータンパク質がRNAループを切断すると、開始剤が放出されてHCR反応を始動させる
標的オリゴヌクレオチドの増幅
特定の実施形態例では、標的RNAおよび/またはDNAは、CRISPRエフェクタータンパク質を活性化する前に増幅されてもよい。任意の適切なRNAまたはDNA増幅技術を使用してもよい。特定の実施形態例では、RNAまたはDNA増幅は、等温増幅である。特定の実施形態例では、等温増幅は、核酸配列決定系増幅(NASBA)、リコンビナーゼポリメラーゼ増幅(RPA)、ループ媒介等温増幅(LAMP)、鎖置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、またはニッキング酵素増幅反応(NEAR)であってもよい。特定の実施形態例では、限定はされないが、PCR、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、または分岐増幅法(RAM)を含む非等温増幅法を使用してもよい。
特定の実施形態例では、RNAまたはDNA増幅は、NASBAであり、これは配列特異的逆プライマーによる標的RNAの逆転写により開始されて、RNA/DNA二重鎖を形成する。次に、RNA分解酵素Hを使用してRNA鋳型を分解し、T7プロモーターなどのプロモーターを含む順方向プライマーを結合させ相補鎖の伸長を開始して、二本鎖DNA産物を生成する。次に、RNAポリメラーゼプロモーターを媒介としたDNA鋳型の転写により、標的RNA配列のコピーが作成される。重要なことに、新規の標的RNAのそれぞれは、ガイドRNAによって検出できるため、測定の感度がさらに向上する。次に、ガイドRNAによる標的RNAの結合は、CRISPRエフェクタータンパク質の活性化に繋がり、この方法は上記の概説のように進行する。NASBA反応には、中程度の等温条件で、例えば約41°Cで進行できるというさらなる利点があり、臨床検査室から遠く離れた現場での早期かつ直接的な検出に展開されるシステムや機器に適している。
特定の別の実施形態例では、リコンビナーゼポリメラーゼ増幅(RPA)反応を使用して、標的核酸を増幅してもよい。RPA反応では、配列特異的プライマーを二本鎖DNA中の相同配列と対合できるリコンビナーゼを使用する。標的DNAが存在すると、DNA増幅が開始するが、熱サイクルや化学的融解などのその他の試料操作は必要ない。RPA増幅システムの全体は、乾燥製剤として安定していて、冷蔵せずとも安全に輸送できる。RPA反応はまた、37~42°Cの最適な反応温度により等温で実施できる。配列特異的プライマーは、検出すべき標的核酸配列を含む配列を増幅するように設計されている。特定の実施形態例では、T7プロモーターなどのRNAポリメラーゼプロモーターは、プライマーのうちの1つに添加される。これにより、標的配列およびRNAポリメラーゼプロモーターを含む増幅された二本鎖DNA産物が得られる。RPA反応の後に、または反応中に、二本鎖DNA鋳型からRNAを生成するRNAポリメラーゼが添加される。その後に増幅された標的RNAは、CRISPRエフェクターシステムによって検出できる。このようにして、本明細書に開示の実施形態を用いて、標的DNAを検出できる。RPA反応は、標的RNAの増幅にも使用できる。標的RNAは、まず逆転写酵素を使用してcDNAに変換され、続いて第2の鎖DNA合成が実施され、その時点でのRPA反応は上述のように進行する。
本発明の一実施形態では、ニッキング酵素はCRISPRタンパク質である。従って、dsDNA中へのニックの導入は、プログラム可能で配列特異的であってもよい。図5は、本発明の実施形態を示していて、これは、dsDNA標的の反対の鎖を標的とするように設計された2個のガイドで始まる。本発明によれば、ニッカーゼは、C2c1またはCpf1、C°Cと共同して使用されるC2c1であってもよい。他の実施形態では、等温増幅の温度は、異なる温度で操作可能なポリメラーゼ(例えば、Bsu、Bst、Phi29、クレノウ断片など)から選択されてもよい。
従って、ニック等温増幅技術が、ニック基質を配列の末端に付加するプライマーのアニーリングおよび伸長を可能にするために元のdsDNA標的の変性を必要とする(例えば、ニッキング酵素増幅反応またはNEARでの)一定の配列優先性を有するニッキング酵素を使用する場合に、ガイドRNAを介してニック部位をプログラムできるCRISPRニッカーゼを使用することは、変性工程が不要になり、反応全体を真に等温にすることが可能になることを意味している。ニック基質を付加するこれらのプライマーは、反応の後半で使用されるプライマーとは異なるため、このことはまた、反応を簡素化し、NEARは2組のプライマー(すなわち4個のプライマー)を必要とするが、C2c1のニック増幅は1組のプライマー組(すなわち2個のプライマー)のみを必要とすることを意味する。これにより、変性を実行してその等温温度まで冷却するための複雑な機器を使用せずに、ニックC2c1増幅をはるかに簡素にかつ簡単に操作できる。
従って、特定の実施形態例では、本明細書に開示のシステムは、増幅試薬を含んでもよい。核酸の増幅に有用な異なる成分または試薬が本明細書に説明されている。例えば、本明細書に説明の増幅試薬は、Tris緩衝液などの緩衝液を含んでもよい。Tris緩衝液は、例えば、限定はされないが、1 mM、2 mM、3 mM、4 mM、5 mM、6 mM、7 mM、8 mM、9 mM、10 mM、11 mM、12 mM、13 mM、14 mM、15 mM、25 mM、50 mM、75 mM、1Mなどの濃度を含む、所望の用途または使用に適切な任意の濃度で使用してもよい。当業者は、本発明で使用するためのTrisなどの緩衝液の適切な濃度を決定できる。
塩化マグネシウム(MgCl2)、塩化カリウム(KCl)、または塩化ナトリウム(NaCl)などの塩を、核酸断片の増幅を改善するために、PCRなどの増幅反応に含んでもよい。塩濃度は特定の反応および用途にも依るが、実施形態によっては、特定のサイズの核酸断片は、特定の塩濃度で最適な結果を生む可能性がある。より大きな産物は、望ましい結果を生み出すために、変更された塩濃度、通常より低い塩濃度を必要とするが、より小さな産物の増幅は、より高い塩濃度でより良い結果を生み出す可能性がある。当業者には、塩の存在および/または濃度が、塩濃度の変化につれて生体反応または化学反応の厳密性を変化させる可能性があり、従って、本発明の本明細書に説明の反応のためには、適切な条件を提供する任意の塩を使用してもよいことが分かっている。
生体反応または化学反応のその他の成分は、その内部の材料分析のために細胞を破壊するかまたは溶解するために、細胞溶解成分を含んでもよい。細胞溶解成分として、限定はされないが、界面活性剤、NaCl、KCl、硫酸アンモニウム[(NH4)2SO4]などの上述の塩、または他の成分を含んでもよい。本発明に適切である界面活性剤として、Triton X-100、ドデシル硫酸ナトリウム(SDS)、CHAPS(3-[(3-コラミドプロピル)ジメチルアンモニオ]-1-プロパンスルホン酸)、臭化エチルトリメチルアンモニウム、ノニルフェノキシポリエトキシルエタノール(NP-40)を挙げてもよい。界面活性剤の濃度は、特定の用途に依ってもよく、場合によっては反応に固有であってもよい。増幅反応は、限定はされないが、100 nM、150 nM、200 nM、250 nM、300 nM、350 nM、400 nM、450 nM、500 nM、550 nM、600 nM、650 nM、700 nM、750 nM、800 nM、850 nM、900 nM、950 nM、1 mM、2 mM、3 mM、4 mM、5 mM、6 mM、7 mM、8 mM、9 mM、10 mM、20 mM、30 mM、40 mM、50 mM、60 mM、70 mM、80 mM、90 mM、100 mM、150 mM、200 mM、250 mM、300 mM、350 mM、400 mM、450 mM、500mMなどの濃度を含む、本発明に適切な任意の濃度で使用されるdNTPおよび核酸プライマーを含んでもよい。同様に、本発明に従って有用なポリメラーゼは、当技術分野で知られていて、Taqポリメラーゼ、Q5ポリメラーゼなどを含む特定のまたは一般的なポリメラーゼであってもよい。
実施形態によっては、本明細書に説明の増幅試薬は、ホットスタート増幅での使用に適切であってもよい。ホットスタート増幅は、実施形態によっては、アダプター分子またはオリゴの二量体化を低減または排除し、あるいは望ましくない増幅産物または人工産物を防止しかつ所望の産物の最適な増幅を得るために有益である可能性がある。増幅に使用するための本明細書に説明の多くの成分は、ホットスタート増幅にも使用できる。実施形態によっては、ホットスタート増幅と共に使用するのに適切な試薬または成分は、必要に応じて、1つ以上の組成物成分に代えて使用されてもよい。例えば、特定の温度または他の反応条件で所望の活性を示すポリメラーゼまたは他の試薬を使用してもよい。実施形態によっては、ホットスタート増幅で使用するために設計または最適化された試薬を使用してもよく、例えば、ポリメラーゼは、転位後または特定の温度に到達した後に活性化してもよい。このポリメラーゼは、抗体系、またはアプタマー系であってもよい。本明細書に説明のポリメラーゼは当技術分野で知られている。この試薬の例には、限定はされないが、ホットスタートポリメラーゼ、ホットスタートdNTP、および光ケージ化dNTPが含まれてもよい。この試薬は知られており、当技術分野では入手可能である。当業者は、個々の試薬に適切な最適温度を決定できる。
核酸の増幅は、特定の熱サイクル機器または装置を使用して実施してもよく、任意の所望の反応数を同時に実施できるように、単一の反応または纏めて実施してもよい。実施形態によっては、増幅は、マイクロ流体装置またはロボット装置を用いて実施してもよく、または温度について手動変更を用いて実施して、所望の増幅を達成してもよい。実施形態によっては、最適化して、特定の用途または材料に対し最適な反応条件を得てもよい。当業者は、十分な増幅を得るために反応条件を理解して最適化できる。
特定の実施形態では、本発明の方法またはシステムによるDNAの検出は、検出の前に(増幅された)DNAのRNAへの転写を必要とする。
本発明の検出方法が、様々な組合せでの核酸増幅および検出手順を含んでもよいことは明白である。検出される核酸は、限定はされないが、DNAおよびRNAを含む任意の天然起源のまたは合成の核酸であってもよく、これらは任意の適切な方法によって増幅されて、検出可能な中間産物を提供する。中間産物の検出は、限定はされないが、直接活性または側副活性によって検出可能信号部分を生成するCRISPRタンパク質の結合および活性化を含む任意の適切な方法によって実施してもよい。
本明細書に開示のシステム、装置、および方法はまた、特異的に構成されたポリペプチド検出アプタマーの組込みを介して、核酸の検出に加えて、ポリペプチド(またはその他の分子)の検出に適合されてもよい。ポリペプチド検出アプタマーは、上述のマスキング構築物アプタマーとは異なる。まずアプタマーは、1つ以上の標的分子に特異的に結合するように設計されている。一実施形態例では、標的分子は標的ポリペプチドである。別の実施形態例では、標的分子は、標的治療分子などの標的化合物である。SELEXなどの所定の標的に特異性を有するアプタマーを設計および選択する方法は、当技術分野で知られている。所定の標的に対する特異性に加えて、アプタマーは、ポリメラーゼプロモーター結合部位を組み込むようにさらに設計されている。特定の実施形態例では、ポリメラーゼプロモーターは、T7プロモーターである。アプタマー結合を標的に結合する前に、ポリメラーゼ部位は、ポリメラーゼに接近可能ではないか、さもなければ認識可能ではない。しかしながら、アプタマーは、標的の結合時にアプタマーの構造は立体配座的な変化を受け、その結果、ポリメラーゼプロモーターが続いて露出されるように構成されている。ポリメラーゼプロモーターの下流のアプタマー配列は、RNAまたはDNAポリメラーゼによるトリガーオリゴヌクレオチドの生成の鋳型として機能する。従って、アプタマーの鋳型部分は、所定のアプタマーおよびその標的を識別するバーコードまたは他の識別配列をさらに組み込んでもよい。次に上述のガイドRNAは、これらの特定のトリガーオリゴヌクレオチド配列を認識するように設計されてもよい。ガイドRNAのトリガーオリゴヌクレオチドへの結合により、CRISPRエフェクタータンパク質が活性化し、それにより前述のようにマスキング構築物が不活化され、かつ正の検出可能信号が発生するように進行する。
従って、特定の実施形態例では、本明細書に開示の方法は、1つの試料または1組の試料を、それぞれがペプチド検出アプタマー、CRISPRエフェクタータンパク質、1つ以上のガイドRNA、マスキング構築物を含む個々の個別の容量の組中に分配し、かつ1つ以上の標的分子への検出アプタマーの結合を可能にするのに十分な条件で試料または試料組を培養する追加の工程を含み、対応する標的にアプタマーが結合すると、トリガーオリゴヌクレオチドの合成がRNAポリメラーゼプロモーター結合部位へのRNAポリメラーゼの結合によって開始されるように、ポリメラーゼプロモーターが露出する。
別の実施形態例では、アプタマーの結合は、アプタマーが標的ポリペプチドに結合すると、プライマー結合部位を露出させてもよい。例えば、アプタマーは、RPAプライマー結合部位を露出させてもよい。従ってプライマーは、次に、上記で概説のRPA反応などの増幅反応に添加または含有されるように供給される。
特定の実施形態例では、アプタマーは、立体配座切り替えアプタマーであってもよく、これは、関心のある標的に結合すると、二次構造を変化させ、かつ一本鎖DNAの新規領域を露出させることができる。特定の実施形態例では、一本鎖DNAのこれらの新規領域は、連結のための基質として用いてもよく、アプタマーを伸長して、本明細書に開示の実施形態を使用して特異的に検出できるより長いssDNA分子を形成する。アプタマーの設計は、グルコースなどの低エピトープ標的を検出するための三元系複合体とさらに組み合わせることができる(Yang et al. 2015: pubs.acs.org/doi/abs/10.1021/acs.analchem.5b01634)。立体配座シフトアプタマーおよび対応するガイドRNA(crRNA)の例を以下に示す。
Figure 2024138266000002
Figure 2024138266000003
CRISPRシステムの使用方法に関する一般的なコメント
特定の実施形態では、本明細書に説明の方法は、関心のある1つ以上のポリヌクレオチド標的を標的化することを含んでもよい。関心のあるポリヌクレオチド標的は、特定の疾患またはその治療に関連する、所定の関心のある形質の生成に関連する、または関心のある分子の産生に関連する標的であってもよい。「ポリヌクレオチド標的」の標的化について、この標的化は、翻訳領域、イントロン、プロモーター、および終結領域、リボソーム結合部位、エンハンサー、サイレンサーなどの他の任意の5’または3’調節領域の1つ以上を標的化することを含んでもよい。遺伝子は、関心のあるタンパク質またはRNAをコードしていてもよい。従って、標的は、mRNA、tRNA、またはrRNAに転写されてもよい翻訳領域であってもよいが、それらの複製、転写および調節に関与するタンパク質の認識部位でもあってもよい。
特定の実施形態では、本明細書に説明の方法は、1つ以上の関心のある遺伝子を標的とすることを含んでもよく、この少なくとも1つの関心のある遺伝子は、長鎖非翻訳RNA(lncRNA)をコードする。lncRNAは、細胞機能にとって重要であることが分かっているが、必須となるlncRNAは細胞型ごとに異なると分かっているので(C.P. Fulco et al., 2016, Science, doi:10.1126/science.aag2445; N.E. Sanjana et al., 2016, Science, doi:10.1126/science.aaf8325)、本明細書で提供の方法は、関心のある細胞の細胞機能に関連するlncRNAを決定する工程を含んでもよい。
外因性ポリヌクレオチド鋳型を組み込んで標的ポリヌクレオチドを改変するための例示的な方法では、二本鎖切断は、CRISPR複合体によってゲノム配列内に導入され、切断は、外因性ポリヌクレオチド鋳型の相同組換えを介して、その鋳型がゲノム中に組込まれるように修復される。二本鎖切断の存在は、鋳型の組込みを容易にする。
他の実施形態では、本発明は、真核細胞中でのポリヌクレオチドの発現を改変する方法を提供する。この方法は、ポリヌクレオチドに結合するCRISPR複合体を用いて、標的ポリヌクレオチドの発現を増強または減弱させることを含む。
方法によっては、標的ポリヌクレオチドは、細胞内での発現の改変をもたらすように不活化されてもよい。例えば、細胞内の標的配列へCRISPR複合体が結合すると、標的ポリヌクレオチドは、配列が転写されないように、コードされたタンパク質が生成されないように、または配列が野生型配列として機能しないように不活化される。例えば、タンパク質またはマイクロRNAコード配列は、タンパク質が産生されないように不活化されてもよい。
方法によっては、制御配列は、それがもはや制御配列として機能しないように不活化されてもよい。本明細書で使用される「制御配列」は、核酸配列の転写、翻訳、または到達可能性に影響を及ぼす任意の核酸配列を指す。制御配列の例として、プロモーター、転写ターミネーター、およびエンハンサーが挙げられる。不活化された標的配列は、欠失変異(すなわち1つ以上のヌクレオチドの欠失)、挿入変異(すなわち1つ以上のヌクレオチドの挿入)、またはナンセンス変異(すなわち停止コドンが導入されるように別のヌクレオチドへの単一ヌクレオチドの置換)を含んでもよい。方法によっては、標的配列の不活化は、標的配列の「ノックアウト」をもたらす。
複数の組合せた摂動を導入し、かつ観察されたゲノム的、遺伝的、プロテオミクス的、後成的、および/または表現型の各効果を単一細胞で検出された摂動と相関させることによって細胞相互作用を識別することを含む、「摂動配列決定(perturb-seq)」とも呼ばれる機能ゲノミクス方法もまた本明細書に提供される。一実施形態では、これらの方法は、単一細胞RNA配列決定(RNA-seq)とクラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)に基づく摂動とを組み合わせる(Dixit et al. 2016, Cell 167, 1853-1866、およびAdamson et al. 2016, Cell 167, 1867-1882)。一般に、これらの方法は、細胞集団内の各細胞が少なくとも1つの摂動を受ける複数の細胞に複数の組合せ摂動を導入することを含み、これら方法は、単一細胞内のゲノム的、遺伝的、プロテオミクス的、後成的、および/または表現型の各差異を、単一細胞内の摂動を受けなかった1つ以上の細胞と比較して検出すること、および測定された差異に対する共変量を説明するモデルを適用して、摂動に関連する測定された差異を判断することを含み、それにより、細胞間および/または細胞内のネットワークまたは回路が推測される。より具体的には、単一細胞の配列決定は、細胞バーコードを含み、それにより、各RNAの起源の細胞が記録される。より具体的には、単一細胞の配列決定は、固有の分子識別子(UMI)を含み、それにより単一細胞内の転写物コピー数またはプローブ結合事象などの測定された信号の捕捉率が決定される。
これらの方法は、細胞回路の組合せ探索、細胞回路の精査、分子経路の描写、および/または治療法開発のための関連標的の識別に使用できる。より具体的には、これらの方法は、それらの分子鑑定に基づく細胞群を識別するために用いられてもよい。(例えば疾患の)有機的状態と(例えば小分子による)誘発状態との間の遺伝子発現鑑定での類似性は、臨床的に有効な治療法を特定できる可能性がある。
従って、特定の実施形態では、本明細書で提供される治療方法は、対象から単離された細胞の集団について、上述の摂動配列決定を使用して、最適な治療標的および/または治療法を決定することを含む。
特定の実施形態では、本明細書の他の段落で説明の摂動配列決定法を使用して、単離された細胞または細胞株中で、関心のある分子の産生に影響を及ぼす可能性のある細胞回路を決定する。
さらなるCRISPR-Casの開発および使用に関する考察
本発明は、以下の各項目に述べるような、特にCRISPRタンパク質複合体の送達に関連するCRISPR-Cas9の開発および使用ならびに細胞および生物中でのRNAにガイドされたエンドヌクレアーゼの使用という側面に基づいて、さらに詳細に説明できる。
*「CRISPR-Casシステムを使用する多重ゲノム操作」Multiplex genome engineering using CRISPR/Cas systems. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., & Zhang, F. Science Feb 15;339(6121):819-23 (2013)、
*「CRISPR-Casシステムを使用する細菌ゲノムのRNAガイドによる編集」RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Jiang W., Bikard D., Cox D., Zhang F, Marraffini LA. Nat Biotechnol Mar;31(3):233-9 (2013)、
*「CRISPR-Cas媒介ゲノム操作による複数の遺伝子に変異を持つマウスの一段階産出」One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Wang H., Yang H., Shivalila CS., Dawlaty MM ., Cheng AW., Zhang F., Jaenisch R. Cell May 9;153(4):910-8 (2013)、
*「哺乳類の内因性転写状態および後成的状態の光学的制御」Optical control of mammalian endogenous transcription and epigenetic states. Konermann S, Brigham MD, Trevino AE, Hsu PD, Heidenreich M, Cong L, Platt RJ, Scott DA, Church GM, Zhang F. Nature. Aug 22;500(7463):472-6. doi: 10.1038/Nature12466. Epub 2013 Aug 23 (2013)、
*「ゲノム編集の特異性を向上するRNAガイドCRISPR-Cas9による二重ニッキング」Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity. Ran, FA., Hsu, PD., Lin, CY., Gootenberg, JS., Konermann, S., Trevino, AE., Scott, DA., Inoue, A., Matoba, S., Zhang, Y., & Zhang, F. Cell Aug 28. pii: S0092-8674(13)01015-5 (2013-A)、
*「RNAガイドCas9ヌクレアーゼの特異性を標的するDNA」DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013)、
*「CRISPR-Cas9システムを使用するゲノム操作」Genome engineering using the CRISPR-Cas9 system. Ran, FA., Hsu, PD., Wright, J., Agarwala, V., Scott, DA., Zhang, F. Nature Protocols Nov;8(11):2281-308 (2013-B)、
*「ヒト細胞のゲノム規模でのCRISPR-Cas9ノックアウト選別」Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print]、
*「ガイドRNAと標的DNAとの複合体でのCas9の結晶構造」Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27, 156(5):935-49 (2014)、
*「哺乳類細胞でのCRISPRエンドヌクレアーゼCas9のゲノム全域での結合」Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Wu X., Scott DA., Kriz AJ., Chiu AC., Hsu PD., Dadon DB., Cheng AW., Trevino AE., Konermann S., Chen S., Jaenisch R., Zhang F., Sharp PA. Nat Biotechnol. Apr 20. doi: 10.1038/nbt.2889 (2014)、
*「ゲノム編集および癌モデリング用のCRISPR-Cas9ノックインマウス」CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling. Platt RJ, Chen S, Zhou Y, Yim MJ, Swiech L, Kempton HR, Dahlman JE, Parnas O, Eisenhaure TM, Jovanovic M, Graham DB, Jhunjhunwala S, Heidenreich M, Xavier RJ, Langer R, Anderson DG, Hacohen N, Regev A, Feng G, Sharp PA, Zhang F. Cell 159(2): 440-455 DOI: 10.1016/j.cell.2014.09.014(2014)、
*「ゲノム操作のためのCRISPR-Cas9の開発および応用」Development and Applications of CRISPR-Cas9 for Genome Engineering, Hsu PD, Lander ES, Zhang F., Cell. Jun 5;157(6):1262-78 (2014)、
*「CRISPR-Cas9システムを用いるヒト細胞での遺伝子選別」Genetic screens in human cells using the CRISPR/Cas9 system, Wang T, Wei JJ, Sabatini DM, Lander ES., Science. January 3; 343(6166): 80-84. doi:10.1126/science.1246981 (2014)、
*「CRISPR-Cas9媒介による遺伝子不活化のための高活性sgRNAの合理的な設計」Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation, Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE., (published online 3 September 2014) Nat Biotechnol. Dec;32(12):1262-7 (2014)、
*「CRISPR-Cas9を使用する哺乳類の脳での遺伝子機能のin vivo調査」In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9, Swiech L, Heidenreich M, Banerjee A, Habib N, Li Y, Trombetta J, Sur M, Zhang F., (published online 19 October 2014) Nat Biotechnol. Jan;33(1):102-6 (2015)、
*「操作されたCRISPR-Cas9複合体によるゲノム規模での転写活性化」Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex, Konermann S, Brigham MD, Trevino AE, Joung J, Abudayyeh OO, Barcena C, Hsu PD, Habib N, Gootenberg JS, Nishimasu H, Nureki O, Zhang F., Nature. Jan 29;517(7536):583-8 (2015)、
*「誘導性ゲノム編集および転写調節のための分離したCas9構築物」A split-Cas9 architecture for inducible genome editing and transcription modulation, Zetsche B, Volz SE, Zhang F., (published online 02 February 2015) Nat Biotechnol. Feb;33(2):139-42 (2015)、
*「腫瘍の成長および転移のマウスモデルでのゲノム全域のCRISPR選別」Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis, Chen S, Sanjana NE, Zheng K, Shalem O, Lee K, Shi X, Scott DA, Song J, Pan JQ, Weissleder R, Lee H, Zhang F, Sharp PA. Cell 160, 1246-1260, March 12, 2015(マウスでの多重選別;multiplex screen in mouse)、
*「黄色ブドウ球菌Cas9を使用するin vivoゲノム編集」In vivo genome editing using Staphylococcus aureus Cas9, Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X, Makarova KS, Koonin EV, Sharp PA, Zhang F., (published online 01 April 2015), Nature. Apr 9;520(7546):186-91 (2015)、
*「CRISPR-Cas9を使用する高処理能機能ゲノミクス」“High-throughput functional genomics using CRISPR-Cas9, Shalem et al., Nature Reviews Genetics 16, 299-311 (May 2015)、
*「CRISPR sgRNA設計を改善する配列決定因子」“Sequence determinants of improved CRISPR sgRNA design,” Xu et al., Genome Research 25, 1147-1157 (August 2015)、
*「調節ネットワークを分析するための初代免疫細胞でのゲノム全域のCRISPR選別」“A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks,” Parnas et al., Cell 162, 675-686 (July 30, 2015)、
*「CRISPR-Cas9によるウイルスDNAの切断は、B型肝炎ウイルスを効率的に抑制する」“CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus,”Ramanan et al., Scientific Reports 5:10833. doi: 10.1038/srep10833 (June 2, 2015)、
*「黄色ブドウ球菌Cas9の結晶構造」“Crystal Structure of Staphylococcus aureus Cas9,” Nishimasu et al., Cell 162, 1113-1126 (Aug. 27, 2015)、
*「Cas9媒介のin situ飽和変異誘発によるBCL11Aエンハンサーの詳細解析」“BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis, Canver et al., Nature 527(7577):192-7 (Nov. 12, 2015) doi: 10.1038/nature15521. Epub 2015 Sep 16、
*「Cpf1は、第2部類のCRISPR-Casシステムの単一RNAガイドヌクレアーゼである」Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System, Zetsche et al., Cell 163, 759-71 (Sep 25, 2015)、
*「多様な第2部類のCRISPR-Casシステムの発見および機能特性」Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems, Shmakov et al., Molecular Cell, 60(3), 385-397 doi: 10.1016/j.molcel.2015.10.008 Epub October 22, 2015、
*「改善された特異性を備える合理的に遺伝子操作されたCas9ヌクレアーゼ」Rationally engineered Cas9 nucleases with improved specificity, Slaymaker et al., Science 2016 Jan 1 351(6268): 84-88 doi: 10.1126/science.aad5227. Epub 2015 Dec 1. [Epub ahead of print]、および
*「種々のPAM特異性を持つ遺伝子操作されたCpf1酵素」“Engineered Cpf1 Enzymes with Altered PAM Specificities,” Gao et al, bioRxiv 091611; doi: dx.doi.org/10.1101/091611 (Dec. 4, 2016)。
これら項目のそれぞれは、参照により本明細書に組み込まれ、本発明の実施において考慮されてもよく、以下にそれらを概説する。
* Congらは、真核細胞での使用のための高温性連鎖球菌Cas9と黄色ブドウ球菌Cas9の両方に基づくII型CRISPR-Casシステムを遺伝子操作し、Cas9ヌクレアーゼが短鎖RNAに誘導されて、ヒト細胞とマウス細胞内にDNAの高精度の切断を誘導できることを示した。彼らの研究はさらに、ニッキング酵素に変換されたCas9を使用して、最小限の変異原性活性により真核細胞中で相同性指向修復を促進できることを示した。さらに彼らの研究は、複数のガイド配列を単一のCRISPR配列にコードして、哺乳類ゲノム内の内因性ゲノム遺伝子座部位での複数の同時編集を可能にすることを示し、RNA誘導ヌクレアーゼ技術の容易なプログラム可能性および幅広い適用性を実証した。RNAを使用して細胞内の配列特異性のDNA切断をプログラムするこの能力により、新規領域のゲノム操作ツールを定義付けした。これらの研究はさらに、その他のCRISPR遺伝子座は、哺乳類細胞に移植可能である可能性が高く、さらに哺乳類のゲノム切断を媒介できることを示している。重要なことに、CRISPR-Casシステムのいくつかの側面はさらに改善されて、その効率性および汎用性を向上できると考えられる。
* Jiangらは、二本鎖RNAと複合体を形成したクラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)会合Cas9エンドヌクレアーゼを使用して、肺炎球菌および大腸菌のゲノムに高精度の変異を導入した。この手法は、標的ゲノム部位での二本鎖RNA:Cas9誘導の切断に依存して、未変異の細胞を死滅させ、かつ選択性マーカーまたは対抗選択システムの必要性を回避させた。この研究では、短いCRISPR RNA(crRNA)の配列を変更して、鋳型編集で単ヌクレオチドおよび多重ヌクレオチドの変更を実施して、二本鎖RNA:Cas9の特異性を再プログラミングすることが報告された。この研究は、2個のcrRNAの同時使用が多重変異誘発を可能にすることを示した。さらに、この手法を再結合処理と組み合わせて用いた場合には、肺炎球菌では、説明された手法で回収されたほぼ100%の細胞に所望の変異が含まれ、大腸菌では、回収された65%の細胞にその変異が含まれていた。
* Wangら(2013)は、CRISPR-Casシステムを使用して、胚性幹細胞での連続組換えおよび/または単一の変異を有するマウスの長時間の交配によって、従来は複数の段階により産出された複数の遺伝子の変異を有するマウスを一段階で産出した。CRISPR-Casシステムは、機能的に冗長な遺伝子と上位遺伝子との相互作用のin vivo研究を大幅に加速する。
* Konermannら(2013)は、CRISPR-Cas9酵素および転写活性化因子様エフェクターに基づくDNA結合ドメインの光学的調節および化学的調節を可能にする多用途で堅牢な技術の必要性に対処した。
* Ranら(2013-A)は、Cas9ニッカーゼ変異体とガイドRNA対を組み合わせて、標的となる二本鎖切断を導入する手法について説明している。この手法により、ガイド配列によって特定のゲノム遺伝子座を標的とする微生物CRISPR-CasシステムからのCas9ヌクレアーゼの問題点に対処し、これにより、DNA標的との特定の不一致を許容して、それによって望ましくない非特異的標的の変異誘発を促進できる。ゲノム内の個々のニックは高い忠実度で修復されるために、適切に位置をずらしたガイドRNAを介する同時ニッキングは、二本鎖切断に必要とされ、標的切断のために特異的に認識される塩基の数を増大する。この著者らは、対になったニッキングを使用すると、細胞株内で非特異的標的活性を50~1,500倍低減し、特異的標的の切断効率を犠牲にすることなくマウス接合子での遺伝子ノックアウトを促進できることを実証した。この多彩な手法により、高い特異性を要する多種多様なゲノム編集用途への対応が可能となる。
* Hsuら(2013)は、ヒト細胞でのSpCas9標的特異性を明らかにして、標的部位の選択に関する情報を提供し、非特異的標的の影響を回避した。この研究では、293T細胞および293FT細胞中の700個を超えるガイドRNA変異体、および100個を超える予測ゲノム非特異的標的遺伝子座でのSpCas9誘導の挿入欠失変異の程度を評価した。著者らは、SpCas9が、不一致の数、位置、および分布に敏感な配列依存的に異なる位置でのガイドRNAと標的DNAとの間の不一致を許容することを示した。著者らはさらに、SpCas9を媒介とする切断はDNAメチル化による影響を受けず、SpCas9およびgRNAの投与量を調整して非特異的標的の改変を最小限に抑えることができることを示した。さらに、哺乳類のゲノム操作を容易にするために、著者らは、標的配列の選択および検証ならびに非特異的標的分析を誘導するWebベースのソフトウェアツールを提供できることを報告した。
* Ranら(2013-B)は、哺乳類細胞での非相同末端結合(NHEJ)または相同性指向修復(HDR)を介するCas9を媒介するゲノム編集、ならびに下流での機能研究のための改変細胞株の生成のための一連のツールについて説明している。非特異的標的切断を最小限に抑えるために、著者らはさらに、Cas9ニッカーゼ変異体をガイドRNA対とともに使用した二重ニッキング手法について説明している。著者が提供する手順は、標的部位の選択、切断効率の評価、および非特異的標的活性の分析のためのガイドラインを実験的に導き出した。この研究によると、標的の設計から始めて、遺伝子の改変は僅か1~2週間で達成でき、改変されたクローン細胞株は2~3週間で誘導できることが示されている。
* Shalemらは、ゲノムの全域規模で遺伝子機能を調べる新しい方法を説明している。彼らの研究は、ゲノム規模のCRISPR-Cas9ノックアウト(GeCKO)ライブラリーの送達により、64,751個の固有のガイド配列を有する18,080個の遺伝子を標的とし、ヒト細胞での陰性および陽性の両方の選択検査が可能になることを示した。まず著者らは、GeCKOライブラリーを使用して、癌および多能性幹細胞の細胞生存率に不可欠な遺伝子を特定することを示した。次にメラノーマのモデルで、著者らは、変異タンパク質キナーゼBRAFを阻害する治療薬であるベムラフェニブに対する耐性でその喪失が関与している遺伝子を選別した。彼らの研究によると、最高ランクの候補として、過去に検証された遺伝子であるNF1とMED12、および新規の的中物であるNF2、CUL3、TADA2B、およびTADA1が含まれることを示した。著者らは、同一の遺伝子を標的とする独立したガイドRNA間の高水準の一貫性および高い的中率の確認を観察し、Cas9によるゲノム規模の選別の可能性を実証した。
* Nishimasuらは、2.5Åの分解能でsgRNAとその標的DNAとの複合体の化膿性連鎖球菌Cas9の結晶構造を報告した。この構造は、標的認識とヌクレアーゼ葉部で構成される二葉構造を明示し、それらの界面での正に帯電した溝にsgRNA:DNAヘテロ二本鎖が収容されている。認識葉部はsgRNAとDNAの結合には不可欠であるが、ヌクレアーゼ葉部にはHNHおよびRuvCヌクレアーゼドメインが含まれ、それぞれは、標的DNAの相補鎖および非相補鎖の切断のために適切に配置されている。ヌクレアーゼ葉部には、プロトスペーサー隣接モチーフ(PAM)との相互作用に関与するカルボキシル末端ドメインも含まれる。この高解像度の構造およびそれに伴う機能分析により、Cas9によるRNA誘導DNA標的化の分子機構が明らかになり、それにより新規で多彩なゲノム編集技術の合理的な設計への道が開拓された。
* Wuらは、マウス胚性幹細胞(mESC)に短鎖ガイドRNA(sgRNA)を負荷した化膿性連鎖球菌からの触媒的に不活なCas9(dCas9)のゲノム全域での結合部位の位置を解明した。著者らは、試験した4個のsgRNAのそれぞれが、sgRNAの5ヌクレオチド長のシード領域およびNGGプロトスペーサー隣接モチーフ(PAM)が頻繁に特定する数十~数千のゲノム部位にdCas9を標的化することを示した。クロマチンの非到達性により、シード配列が一致する他の部位へのdCas9の結合が減少し、従って、非特異的標的部位の70%は遺伝子に会合している。著者らは、触媒的に活性なCas9で遺伝子導入されたmESCの295個のdCas9結合部位の標的配列決定により、バックグラウンド水準を超えて変異した1つの部位のみが識別されることを示した。著者らは、Cas9の結合と切断の2つの状態モデルを提案し、これらのモデルでは、シードの一致が結合を誘発するが、切断には標的DNAとの広範な対合が必要となることを示した。
* Plattらは、Cre依存性のCas9ノックインマウスを構築した。著者らは、神経細胞、免疫細胞、および内皮細胞でのガイドRNAのアデノ随伴ウイルス(AAV)、レンチウイルス、または粒子が媒介する送達を使用するin vivoならびにex vivoのゲノム編集を提案した。
* Hsuら(2014)は、細胞の遺伝子選別を含む、ヨーグルトからゲノム編集までのCRISPR-Cas9の来歴を一般的に説明する総説を示している。
* Wangら(2014)は、ゲノム規模のレンチウイルスの単一ガイドRNA(sgRNA)ライブラリーを使用する陽性選択および陰性選択の両方に適する貯蔵された機能喪失型遺伝子選別手法に関わった。
* Doenchらは、sgRNAの貯蔵物を形成し、6個の内因性マウス遺伝子および3個の内因性ヒト遺伝子のパネルの全ての可能な標的部位をタイル化し、抗体染色と流動細胞計測法によって標的遺伝子のヌル対立遺伝子を産生するそれらの能力を定量的に評価した。著者らは、PAMの最適化により活性が向上し、またsgRNAを設計するためのオンラインツールも提供されることを示した。
* Swiechらは、AAVを媒介とするSpCas9ゲノム編集により、脳内の遺伝子機能の逆遺伝学的研究が可能になることを実証した。
* Konermannら(2015)は、リンカーの有無にかかわらず、ステムまたは四塩基ループなどのガイド上の適切な位置に、複数のエフェクタードメイン、例えば、転写活性化因子、機能的およびエピゲノム調節因子を付着させる能力について説明している。
* Zetscheらは、Cas9酵素を2つに分割でき、それにより活性化のためのCas9の集合を制御できることを示している。
* Chenらは、マウスのゲノム全域のin vivoでのCRISPR-Cas9選別により、肺転移を調節する遺伝子を明らかにする多重選別に関わった。
* Ranら(2015)は、SaCas9およびそのゲノム編集能力に関連し、それらは生化学的アッセイから推定できないことを示している。
* Shalemら(2015)は、触媒的に不活性なCas9(dCas9)融合が合成的に発現を抑制(CRISPRi)する、または発現を活性化(CRISPRa)するのに使用される方法を説明していて、これは配列による選別および蓄積による選別を含むゲノム全域での選別にCas9を使用する技術進歩、ゲノム遺伝子座を不活化するノックアウト手法、および転写活性を調節する手法を示している。
* Xuら(2015)は、CRISPRに基づく選別で単一ガイドRNA(sgRNA)の効率に寄与するDNA配列の特徴を評価した。著者らは、CRISPR-Cas9ノックアウトの効率および切断部位でのヌクレオチドの優先度を調査した。著者らはまた、CRISPR i/aの配列優先度がCRISPR-Cas9ノックアウトの優先度とは実質的に異なることを見出した。
* Parnasら(2015)は、ゲノム全域に蓄積されたCRISPR-Cas9ライブラリーを樹状細胞(DC)内に導入して、細菌性リポ多糖(LPS)による腫瘍壊死因子(Tnf)の誘導を制御する遺伝子を識別した。Tlr4シグナル伝達の既知の調節因子および従来不明であった候補因子を、特定しかつLPSへの標準的な応答に明確な影響を及ぼす3つの機能モジュールに分類した。
* Ramananら(2015)は、感染細胞中のウイルスエピソームDNA(cccDNA)の切断を実証した。HBVゲノムは、感染した肝細胞の核に、共有結合的に閉じた環状DNA(cccDNA)と呼ばれる3.2kbの二本鎖エピソームDNA種として存在し、この環状DNAは、現状の治療法では複製が阻害されないHBV寿命サイクルの重要な成分である。著者らは、HBVの高度に保存された領域を特異的に標的とするsgRNAが、ウイルス複製および欠失したcccDNAを強力に抑制することを示した。
* Nishimasuら(2015)は、5’-TTGAAT-3’ PAMおよび5’-TTGGGT-3’ PAMを含む単一ガイドRNA(sgRNA)およびその二本鎖DNA標的と複合化したSaCas9の結晶構造を報告した。SaCas9のSpCas9との構造比較は、構造の保存性および分岐性の両方を強調して、それらの明確なPAM特異性および相同分子種sgRNA認識を説明している。
* Canverら(2015)は、非コードゲノム要素のCRISPR-Cas9に基づく機能調査を示した。著者らは、蓄積されたCRISPR-Cas9ガイドRNAライブラリーを発展させて、ヒトおよびマウスのBCL11Aエンハンサーのin situ飽和変異誘発を実行し、エンハンサーの重要な機能を明らかにした。
* Zetscheら(2015)は、Cas9とは異なる特徴を持つフランシセラ・ノビシダ菌U112からの第2部類のCRISPRヌクレアーゼであるCpf1の特性を報告した。Cpf1は、tracrRNAを欠く単一のRNA誘導エンドヌクレアーゼであり、T富化プロトスペーサー隣接モチーフを利用し、かつ千鳥状のDNA二本鎖切断を介してDNAを切断する。
* Shmakovら(2015)は、3種の異なる第2部類のCRISPR-Casシステムを報告した。2つのシステムCRISPR酵素(C2c1およびC2c3)には、Cpf1に遠縁のRuvC様エンドヌクレアーゼドメインが含まれる。Cpf1とは異なり、C2c1はDNA切断に関してcrRNAおよびtracrRNAの両方に依存している。第3の酵素(C2c2)は、2つの予測されるHEPN RNA分解酵素ドメインを含み、かつtracrRNAに依存していない。
* Slaymakerら(2016)は、化膿性連鎖球菌Cas9(SpCas9)の特異性を改善するための構造誘導タンパク質操作の使用を報告した。著者らは、非特異的標的効果を低減しつつ堅牢な特異的標的切断を維持する「増強された特異性」のSpCas9(eSpCas9)変異体を開発した。
本明細書で提供の方法およびツールは、tracrRNAを使用しないII型ヌクレアーゼであるC2c1について例示されている。C2c1の相同分子種は、本明細書に記載のように異なる細菌種内で識別されている。類似の特性を有するさらなるII型ヌクレアーゼは、当技術分野で記載の方法(Shmakovら2015, 60:385-397; Abudayeh et al. 2016, Science, 5;353(6299))を使用して識別できる。特定の実施形態では、新規のCRISPRエフェクタータンパク質を識別するこの方法は、CRISPR-Cas遺伝子座の存在を識別するシードをコードするデータベースから配列を選択する工程、選択された配列中でオープン読み取り枠(ORF)を含むシードの10 kb内に位置する遺伝子座を識別する工程、および単一のORFのみが700個を超えるアミノ酸および既知のCRISPRエフェクターと90%以下の相同性を有する新規CRISPRエフェクターをコードするORFを含む遺伝子座を選択する工程を含む。特定の実施形態では、このシードは、Cas1などのCRISPR-Casシステムに共通のタンパク質である。さらなる実施形態では、CRISPR配列は、新規のエフェクタータンパク質を識別するためのシードとして使用される。
C2c1およびcrRNAを含む予め組立てられた組換えCRISPR-C2c1複合体は、例えばエレクトロポレーションによって遺伝子導入されてもよく、高い変異率および検出可能な非特異的標的変異の排除をもたらす。Hur, J.K. et al,「Cpf1リボ核タンパク質のエレクトロポレーションによるマウスの標的変異誘発」Targeted mutagenesis in mice by electroporation of Cpf1 ribonucleoproteins, Nat Biotechnol. 2016 Jun 6. doi: 10.1038/nbt.3596[印刷前に電子出版]を参照。Cpf1を使用する効率的な多重化システムは、本発明のtRNAを含む配列から処理されたgRNAを使用するショウジョウバエで実証されている。Port, F. et al,「tRNAに隣接するCas9およびCpf1 gRNAを有する動物中でのCRISPRツールボックスの伸長」Expansion of the CRISPR toolbox in an animal with tRNA-flanked Cas9 and Cpf1 gRNAs. doi: dx.doi.org/10.1101/046417を参照。Cpf1およびC2c1はどちらも、構造の類似性を共有するV型CRISPR-Casタンパク質である。C2c1と同様に、(PAMの近位端で平滑切断部を形成するCas9とは対照的に)Cpf1はPAMの遠位端で千鳥状の二本鎖切断を形成する。従って、C2c1を使用する同様の多重化システムが想定される。
また、「非常に特異的なゲノム編集のための二量体CRISPR RNA誘導FokIヌクレアーゼ」“Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing”, Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014)は、伸長配列を認識し、かつヒト細胞内で高効率に内因性遺伝子を編集できる二量体RNA誘導FokIヌクレアーゼに関する。
CRISPR-Casシステム、その成分、およびその成分の送達についての一般情報に関して、それらの方法、材料、送達媒体、ベクター、粒子、AAV、ならびにそれらの製造および使用を含み、かつその量および処方を含む本発明の実施に有用となる全ての情報として、以下の特許が参照される。それらの特許は、米国特許番号8,697,359、8,771,945、8,795,965、8,865,406、8,871,445、8,889,356、8,889,418、8,895,308、8,906,616、8,932,814、8,945,839、8,993,233、および8,999,641;米国特許公開US 2014-0310830(米国出願番号14/105,031)、US 2014-0287938 A1(14/213,991)、US 2014-0273234 A1(14/293,674)、US 2014-0273232 A1(14/290,575)、US 2014-0273231(14/259,420)、US 2014-0256046 A1(14/226,274)、US 2014-0248702 A1(14/258,458)、US 2014-0242700 A1(14/222,930)、US 2014-0242699 A1(14/183,512)、US 2014-0242664 A1(14/104,990)、US 2014-0234972 A1(14/183,471)、US 2014-0227787 A1(14/256,912)、US 2014-0189896 A1(14/105,035)、US 2014-0186958(14/105,017)、US 2014-0186919 A1(14/104,977)、US 2014-0186843 A1(14/104,900)、US 2014-0179770 A1(14/104,837)、US 2014-0179006 A1(14/183,486)、US 2014-0170753(14/183,429)、およびUS 2015-0184139(14/324,960);14/054,414欧州特許出願EP2 771 468(EP13818570.7)、EP 2 764 103(EP13824232.6)、およびEP 2 784 162(EP14170383.5);およびPCT特許公報(国際特許出願)WO 2014/093661(PCT/US2013/074743)、WO 2014/093694(PCT/US2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718(PCT/US2013/074825)、WO 2014/093709(PCT/US2013/074812)、WO 2014/093622(PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、WO 2014/093655(PCT/US2013/074736)、WO 2014/093712(PCT/US2013/074819)、WO 2014/093701(PCT/US2013/074800)、WO 2014/018423(PCT/US2013/051418)、WO 2014/204723(PCT/US2014/041790)、WO 2014/204724(PCT/US2014/041800)、WO 2014/204725(PCT/US2014/041803)、WO 2014/204726(PCT/US2014/041804)、WO 2014/204727(PCT/US2014/041806)、WO 2014/204728(PCT/US2014/041808)、WO 2014/204729(PCT/US2014/041809)、WO 2015/089351(PCT/US2014/069897)、WO 2015/089354(PCT/US2014/069902)、WO 2015/089364(PCT/US2014/069925)、WO 2015/089427(PCT/US2014/070068)、WO 2015/089462(PCT/US2014/070127)、WO 2015/089419(PCT/US2014/070057)、WO 2015/089465(PCT/US2014/070135)、WO 2015/089486(PCT/US2014/070175)、PCT/US2015/051691、PCT/US2015/051830である。出願日がそれぞれ、2013年1月30日、2013年3月15日、2013年3月28日、2013年4月20日、2013年5月6日、および2013年5月28日付けの米国仮特許出願61/758,468、61/802,174、61/806,375、61/814,263、61/819,803、および61/828,130も参照される。出願日が2013年6月17日付けの米国仮特許出願61/836,123も参照される。さらに、出願日がいずれも2013年6月17日付けの米国仮特許出願61/835,931、61/835,936、61/835,973、61/836,080、61/836,101、および61/836,127も参照される。さらに出願日が2013年8月5日付けの米国仮特許出願61/862,468および61/862,355、2013年8月28日付けの61/871,301、2013年9月25日付けの61/960,777、および2013年10月28日付けの61/961,980も参照される。さらに参照されるのは、出願日が2014年10月28日付けのPCT/US2014/62558、およびいずれも2013年12月12日付けの米国仮特許出願番号61/915,148、61/915,150、61/915,153、61/915,203、61/915,251、61/915,301、61/915,267、61/915,260、および61/915,397;それぞれ2013年1月29日および2013年2月25日付けの61/757,972および61/768,959;いずれも2014年6月11日付けの62/010,888および62/010,879;いずれも2014年6月10日付けの62/010,329、62/010,439および62/010,441;いずれも2014年2月12日付けの61/939,228および61/939,242;2014年4月15日付けの61/980,012;2014年8月17日付けの62/038,358;いずれも2014年9月25日付けの62/055,484、62/055,460および62/055,487;および2014年10月27日付けの62/069,243である。特に、出願日が2014年6月10日付けの米国を指定する国際出願番号PCT/US14/41806が参照される。出願日が2014年1月22日付けの米国仮特許出願61/930,214が参照される。特に、出願日が2014年6月10日の米国を指定する国際出願番号PCT/US14/41806が参照される。
さらに記述が以下にある:2015年6月17日付けの米国出願62/180,709「保護ガイドRNA」PROTECTED GUIDE RNAS (PGRNAS);2014年12月12日付けの米国出願62/091,455「保護ガイドRNA」PROTECTED GUIDE RNAS (PGRNAS);2014年12月24日付けの米国出願62/096,708「保護ガイドRNA」PROTECTED GUIDE RNAS (PGRNAS);2014年12月12日付けの米国出願62/091,462、2014年12月23日付けの62/096,324、2015年6月17日付けの62/180,681、および2015年10月5日付けの62/237,496「CRISPR転写因子のための死滅ガイド」DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS;2014年12月12日付けの米国出願62/091,456および2015年6月17日付けの62/180,692、「CRISPR-Casシステムのためのエスコートガイドおよび官能化ガイド」ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS;2014年12月12日付けの米国出願62/091,461「造血幹細胞(HSC)に関するゲノム編集のためのCRISPR-Casシステムおよび組成物の送達、使用、および治療的応用」DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS (HSCs);2014年12月19日付けの米国出願62/094,903「ゲノム全域の挿入捕捉配列決定による二本鎖切断およびゲノム再配列の不偏性識別」UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING;2014年12月24日付けの米国出願62/096,761「配列操作のためのシステム、方法、最適化された酵素およびガイド足場の遺伝子操作」ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION;2014年12月30日付けの米国出願62/098,059、2015年6月18日付けの62/181,641、および2015年6月18日付けの62/181,667「RNA標的システム」RNA-TARGETING SYSTEM;2014年12月24日付けの米国出願62/096,656および2015年6月17日62/181,151「不安定化ドメインを有する、またはそれに会合するCRISPR」CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS;2014年12月24日付けの米国出願62/096,697「AAVを有する、またはそれに会合するCRISPR」CRISPR HAVING OR ASSOCIATED WITH AAV;2014年12月30日付けの米国出願62/098,158「遺伝子操作されたCRISPR複合体挿入標的システム」ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS;2015年4月22日付けの米国出願62/151,052「細胞外エキソソーム報告のための細胞標的」CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING;2014年9月24日付けの米国出願62/054,490「粒子送達成分を使用して疾患および病気を標的とするためのCRISPR-Casシステムならびに組成物の送達、使用、および治療的応用」DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS;2014年2月12日付けの米国出願61/ 939,154「最適化された機能的CRISPR-Casシステムを用いる配列操作のためのシステム、方法、および組成物」SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年9月25日付けの米国出願62/055,484「最適化された機能的CRISPR-Casシステムを使用する配列操作のためのシステム、方法、および組成物」SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年12月4日付けの米国出願62/087,537「最適化された機能的CRISPR-CASシステムを使用した配列操作のためのシステム、方法、および組成物」SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年9月24日付けの米国出願62/054,651「複数の癌変異の競合をin vivoでモデル化するためのCRISPR-Casシステムならびに組成物の送達、使用、および治療的応用」DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO;2014年10月23日付けの米国出願62/067,886「複数の癌変異の競合をin vivoでモデル化するためのCRISPR-Casシステムならびに組成物の送達、使用、および治療的応用」DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO;2014年9月24日付けの米国出願62/054,675および2015年6月17日付けの62/181,002「神経細胞/組織中のCRISPR-Casシステムおよび組成物の送達、使用、および治療的応用」DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES;2014年9月24日付けの米国出願62/054,528「免疫疾患または免疫障害でのCRISPR-Casシステムおよび組成物の送達、使用、および治療的応用」DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS;2014年9月25日付けの米国出願62/055,454、「細胞透過性ペプチド(CPP)を使用して疾患および病気を標的するためのCRISPR-Casシステムおよび組成物の送達、使用、および治療的応用」DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES (CPP);2014年9月25日付けの米国出願62/055,460「多機能的CRISPR複合体および/または最適化された酵素結合した機能的CRISPR複合体」MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES;2014年12月4日付けの米国出願62/087,475および2015年6月18日付けの62/181,690「最適化された機能的CRISPR-Casシステムによる機能的選別」FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年9月25日付けの米国出願62/055,487「最適化された機能的CRISPR-Casシステムによる機能的選別」FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年12月4日付けの米国出願62/087,546および2015年6月18日付けの62/181,687「多機能的CRISPR複合体および/または最適化された酵素結合した機能的CRISPR複合体」MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES;および2014年12月30日付けの米国出願62/098,285「CRISPR媒介されたin vivoモデリングおよび腫瘍の成長および転移の遺伝子選別」CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASISである。
記述が、2015年6月18日付けの米国出願62/181,659および2015年8月19日付けの62/207,318「配列操作のためのCAS9相同分子種および変異体のシステム、方法、酵素、およびガイド足場の遺伝子操作および最適化」ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS, ENZYME AND GUIDE SCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATIONにある。記述が、2015年6月18日付けの米国出願62/181,663および2015年10月22日付けの62/245,264「新規CRISPR酵素およびシステム」NOVEL CRISPR ENZYMES AND SYSTEMS;2015年6月18日付けの米国出願62/181,675、2015年10月22日付けの62/285,349、2016年2月17日付けの62/296,522、および2016年4月8日62/320,231「新規CRISPR酵素およびシステム」NOVEL CRISPR ENZYMES AND SYSTEMS;2015年9月24日付けの米国出願62/232,067、2015年12月18日付けの米国出願14/975,085、2015年8月16日付けの欧州出願16150428.7および米国出願62/205,733、2015年8月5日付けの米国出願62/201,542、2015年7月16日付けの米国出願62/193,507、および2015年6月18日付けの米国出願62/181,739「新規CRISPR酵素およびシステム」NOVEL CRISPR ENZYMES AND SYSTEMS;および2015年10月22日付けの米国出願62/245,270「新規CRISPR酵素およびシステム」NOVEL CRISPR ENZYMES AND SYSTEMSにある。さらに記述が、2014年2月12日付けの米国出願61/939,256および2014年12月12日付けのWO 2015/089473(PCT/US2014/070152)「配列操作のための新規構築物を備えたシステム、方法、および最適化されたガイド組成物の操作」ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATIONにある。さらに記述が、それらの特許は、2015年8月15日付けのPCT/US2015/045504、2015年6月17日付けの米国出願62/180,699および2014年8月17日米国出願62/038,358「CAS9ニッカーゼを使用するゲノム編集」GENOME EDITING USING CAS9 NICKASESにある。
さらに、記述が以下にある:参照によって本明細書内に組込まれる(2014年9月24日付けの米国仮特許出願62/054,490、2014年6月10日付けの62/010,441、ならびにいずれも2013年12月12日付けの61/915,118、61/915,215、および61/915,148のうちの1つ以上または全てからの優先権を主張する)代理人参照番号が47627.99.2060およびBI-2013/107である国際特許出願PCT/US14/70057:名称は「粒子送達成分を用いて疾患および病気を標的するためのCRISPR-Casシステムおよび組成物の送達、使用、および治療的応用」(DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS)(「粒子送達PCT」“the Particle Delivery PCT”と呼ぶ)、および参照によって本明細書内に組込まれる(いずれも2013年12月12日付けの米国仮特許出願61/915,176、61/915,192、61/915,215、61/915,107、61/915,145、61/915,148、および61/915,153のうちの1つ以上または全てからの優先権を主張する)代理人参照番号が47627.99.2091およびBI-2013/101である国際特許出願PCT/US14/70127:名称は「ゲノム編集のためのCRISPR-Casシステムおよび組成物の送達、使用、および治療的応用」(DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING)(「注目PCT」“the Eye PCT”と呼ぶ)であり、これら特許は、sgRNAおよびCpf1タンパク質を含む混合物(場合によってはHDR鋳型)を、界面活性剤、リン脂質、生分解性ポリマー、リポタンパク質、およびアルコールを含む、またはそれらから本質的になる、またはそれらからなる混合物とさらに混合することを含むsgRNA-Cpf1タンパク質含有粒子を調製する方法、およびその方法による粒子に関連する。例えばこの方法では、Cpf1タンパク質およびsgRNAを、3:1~1:3、2:1~1:2、または1:1などの適切なモル比で、15~30°C、20~25°C、または室温などの適切な温度で、15~45分間など、例えば30分間の適切な時間で、有利には1X PBSなどの無菌のヌクレアーゼ不含緩衝液中で共に混合した。これとは別に、例えば1,2-ジオレオイル-3-トリメチルアンモニウム-プロパン(DOTAP)であるカチオン性脂質などの界面活性剤、ジミリストイルホスファチジルコリン(DMPC)などのリン脂質、エチレングリコールポリマーまたはPEGなどの生分解性ポリマー、および例えばコレステロールである低密度リポタンパク質などのリポタンパク質のような粒子成分またはそれらを含む粒子成分を、アルコール、有利にはメタノール、エタノール、2-プロパノールなどのC1~6アルキルアルコール、例えば100%エタノール中に溶解した。これら2つの溶液を共に混合して、Cas9-sgRNA複合体を含有する粒子を生成した。従って、sgRNAは、粒子内に複合体全体を処方する前に、Cpf1タンパク質と予め複合体を生成してもよい。製剤は、細胞内への核酸の送達を促進することが知られている異なる成分の異なるモル比により作製してもよい(例えば、1,2-ジオレオイル-3-トリメチルアンモニウム-プロパン(DOTAP)、1,2-ジテトラデカノイル-sn-グリセロ-3-ホスホコリン(DMPC)、ポリエチレングリコール(PEG)、およびコレステロール)。例えば、DOTAP:DMPC:PEG:コレステロールのモル比は、DOTAP;100、DMPC;0、PEG;0、コレステロール;0、またはDOTAP;90、DMPC;0、PEG;10、コレステロール;0、またはDOTAP;90、DMPC;0、PEG;5、コレステロール;5であってもよい。従って、この出願は、sgRNA、Cpf1タンパク質、および粒子を形成する成分の混合、ならびにその混合による粒子を包含する。本発明の側面は、粒子を含んでもよく、例えば、本発明のようなsgRNAおよび/またはCpf1を含む混合物と、例えば粒子送達PCTまたは注目PCT内の粒子を形成する成分とを混合して、この混合から得られる粒子(または当然ではあるが、本発明のようなsgRNAおよび/またはCpf1を含む他の粒子)を形成することによる粒子送達PCTまたは注目PCTの方法に類似した方法を使用する粒子を含んでもよい。Cpf1およびC2c1はどちらも、構造の類似性を共有するV型のCRISPR-Casタンパク質である。PAMの近位端で平滑な切断部を形成するCas9とは異なり、Cpf1およびC2c1はPAMの遠位端に千鳥状の切断部を形成する。従って、C2c1を備えた同様のシステムが想定されてもよい。
本発明は、結果またはデータを伝達する研究プログラムの一部として使用してもよい。コンピュータシステム(またはデジタル装置)を使用して、結果を受信、送信、表示、および/または保存し、データおよび/または結果を解析し、かつ/あるいは結果および/またはデータおよび/または解析の報告書を作成してもよい。コンピュータシステムは、(ソフトウェアなどの)媒体および/または(例えばインターネットからの)ネットワークポートからの命令を読み取ることができる論理装置として考えてもよく、場合によっては、このシステムは、固定媒体を有するサーバーに接続されていてもよい。コンピュータシステムは、1つ以上のCPU、ディスクドライブ、キーボードおよび/またはマウスなどの入力装置、および(モニターなどの)表示部を備えてもよい。指示書や報告書の送信などのデータ通信は、通信媒体を通して地方のまたは離れた場所にあるサーバーに対し達成できる。通信媒体は、データを送信および/または受信する任意の手段を含んでもよい。例えば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続であってもよい。この接続は、全世界網(World Wide Web)を介して通信を提供できる。本発明に関連するデータは、受信および/または受信者による検討のために、そのようなネットワークまたは接続(または限定はされないが、例えば印刷した物理的な報告書の郵送を含む情報を送信するための他の適切な手段)を介して送信できることが想定される。受信装置は、限定はされないが、個別システムまたは電子システム(例えば、1台以上のコンピュータおよび/または1台以上のサーバー)であってもよい。実施形態によっては、コンピュータシステムは、1台以上の処理装置を含む。処理装置は、コンピュータシステムの1つ以上の制御装置、計算装置、および/または他の装置に関連付けられてもよく、または必要に応じてファームウェアに埋込まれてもよい。ソフトウェアで実行される場合に、操作手順は、RAM、ROM、フラッシュメモリ、磁気ディスク、レーザーディスク、または他の適切な記憶媒体中など、任意のコンピュータ可読メモリに格納してもよい。同様に、このソフトウェアは、例えば、電話回線、インターネット、無線接続などの通信チャネルを介して、あるいは、コンピュータ可読ディスク、フラッシュドライブなどの可搬型媒体を介して、任意の既知の配信方法を介して計算装置に送達されてもよい。様々な工程は、種々のブロック、操作、ツール、モジュール、および技術として実行されてもよく、これらは、ハードウェア、ファームウェア、ソフトウェア、またはハードウェア、ファームウェア、および/またはソフトウェアの任意の組合せで実行されてもよい。ハードウェアで実行される場合に、ブロック、操作、技術などの一部または全ては、例えば、カスタム集積回路(IC)、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、プログラマブルロジックアレイ(PLA)などで実行されてもよい。本発明の実施形態では、顧客サーバーの関連データベース構築物を使用してもよい。顧客サーバー構築物は、ネットワーク上の各コンピュータまたはプロセスが顧客またはサーバーのいずれかであるネットワーク構築物である。サーバーコンピュータは通常、ディスクドライブ(ファイルサーバー)、印刷装置(印刷サーバー)、またはネットワーク通行(ネットワークサーバー)の管理を専用とする強力なコンピュータである。顧客コンピュータには、使用者がアプリケーションを実行するPC(パーソナルコンピュータ)またはワークステーション、ならびに例えば本明細書に開示の出力装置が含まれる。顧客コンピュータは、ファイル、装置、さらには処理能力などの供給源をサーバーコンピュータに依存している。本発明の実施形態によっては、サーバーコンピュータは、データベース機能の全てを処理する。顧客コンピュータには、全てのフロントエンドのデータ管理を処理するソフトウェアを搭載でき、また使用者からのデータ入力を受信できる。コンピュータ実行可能コードを含む機械可読媒体は、限定はされないが、有形記憶媒体、搬送波媒体、または物理的伝送媒体を含む多くの形態を取ってもよい。不揮発性記憶媒体は、例えば、図面に示されるデータベースなどを実行するために用いてもよい、任意のコンピュータ中などの任意の記憶装置などの光学ディスクまたは磁気ディスクを含む。揮発性記憶媒体には、そのようなコンピュータプラットフォームの主要メモリなどのダイナミックメモリが含まれる。有形の伝送媒体には、同軸ケーブル、すなわちコンピュータシステム内のバスを構成するワイヤを含む銅線および光ファイバーが含まれる。搬送波伝送媒体は、電気信号または電磁信号、あるいは無線周波数(RF)および赤外線(IR)データ通信中に生成される音響波または光波の形態を取ってもよい。従って、コンピュータ可読媒体の一般的な形態として、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、その他の磁気媒体、CD-ROM、DVD、またはDVD-ROM、その他の光学媒体、パンチカード、紙テープ、穴パターンを有する他の物理記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、その他のメモリチップまたはカートリッジ、データまたは命令を転送するキャリア波、そのキャリア波を転送するケーブルまたはリンク、またはコンピュータがプログラミングコードおよび/またはデータを読み取ることができるその他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、実行のための1つ以上の系統の1つ以上の命令をプロセッサへ搬送することを含んでもよい。従って、本発明は、本明細書で説明の任意の方法を実行すること、中間品を含む本明細書で説明の任意の方法からの産物とともに、データおよび/またはそれからの結果および/またはそれらの解析結果を保存かつ/あるいは送信することを包含する。
Cas12b(C2c1)
本発明は、C2c1(V-B型Cas12b)エフェクタータンパク質および相同分子種を提供する。用語「相同分子種(orthologue)」および「相同体(homologue)」は、当技術分野でよく知られている。さらなる説明によっては、本明細書で使用のタンパク質の「相同体」は、相同体となるタンパク質と同一または類似の機能を発揮する同一種のタンパク質である。相同タンパク質は、構造的に同族であってもよいが、必ずしもそうである必要はなく、または一部分のみが構造的に同族であってもよい。本明細書で使用のタンパク質の「相同分子種」は、相同分子種となるタンパク質と同一または類似の機能を発揮する異なる種のタンパク質である。相同分子種タンパク質は、構造的に同族であってもよいが、必ずしもそうである必要はなく、または一部分のみが構造的に同族であってもよい。相同体および相同分子種は、相同性モデリング(例えば、Greer, Science vol. 228 (1985) 1055、およびBlundell et al. Eur J Biochem vol 172 (1988), 513を参照)、あるいは「構造的BLAST」(Dey F, Cliff Zhang Q, Petrey D, Honig B.「機能を推測する構造的関係を使用する"構造的BLAST "に向けて」Toward a "structural BLAST": using structural relationships to infer function、Protein Sci. 2013 Apr;22(4):359-66. doi: 10.1002/pro.2225を参照)によって定義される。さらにCRISPR-Cas遺伝子座分野での応用のためのShmakovら(2015)を参照。相同タンパク質は、構造的に同族であってもよいが、必ずしもそうである必要はなく、または一部分のみが構造的に同族であってもよい。
C2c1遺伝子は、いくつかの多様な細菌ゲノム、典型的には、cas1、cas2、およびcas4遺伝子およびCRISPRカセットと同じ遺伝子座中に見出される。従って、この推定上の新規CRISPR-Casシステムの配置は、II-B型の配置と類似しているように見受けられる。さらにCas9と同様に、C2c1タンパク質には、活性なRuvC様ヌクレアーゼ、アルギニン富化領域、および(Cas9には存在しない)Znフィンガーが含まれる。
本発明は、V-B部分型として表示のC2c1遺伝子座に由来するC2c1(Cas12b)エフェクタータンパク質の使用を含む。本明細書では、そのエフェクタータンパク質は、「C2c1p」、例えばC2c1タンパク質とも呼ばれる(かつ、そのエフェクタータンパク質またはC2c1タンパク質またはC2c1遺伝子座に由来するタンパク質は、「CRISPR酵素」とも呼ばれる)。現状では、V-B部分型の遺伝子座には、cas1-Cas4融合、cas2、C2c1と呼ばれる個別の遺伝子、およびCRISPR配列が含まれる。C2c1(CRISPR会合タンパク質C2c1)は、Cas9の対応するドメインに相同なRuvC様ヌクレアーゼドメインを、Cas9の特徴的なアルギニン富化クラスターへの相対物とともに含む高分子のタンパク質(約1100~1300のアミノ酸)である。ただし、C2c1は全てのCas9タンパク質に存在するHNHヌクレアーゼドメインを欠いており、RuvC様ドメインは、HNHドメインを含む長い挿入物を含むCas9とは対照的に、C2c1配列内で連続している。従って、特定の実施形態では、CRISPR-Cas酵素は、RuvC様ヌクレアーゼドメインのみを含む。
(Cas12bとしても知られる)C2c1タンパク質は、RNA誘導ヌクレアーゼである。その切断は、tracrRNAに依存して、ガイド配列と直接反復を含むガイドRNAを動員し、このガイド配列は、標的ヌクレオチド配列とハイブリダイズしてDNA/RNAヘテロ二本鎖を形成する。現時点の研究に基づくと、C2c1ヌクレアーゼ活性はまた、PAM配列を必要とし、かつPAM配列の認識に依存する。C2c1 PAM配列は、T富化配列であってもよい。実施形態によっては、PAM配列は、5’ TTN 3’または5’ ATTN 3’であり、式中、Nは任意のヌクレオチドである。特定の実施形態では、PAM配列は5’ TTC 3’である。特定の実施形態では、PAMは熱帯熱マラリア原虫の配列内にある。
C2c1は、標的遺伝子座に、5’オーバーハングまたは標的配列のPAM遠位側にある「粘着末端」を有する千鳥状の切断を形成する。実施形態によっては、5’オーバーハングは7ヌクレオチド長である。Lewis and Ke, Mol Cell. 2017 Feb 2;65(3):377-379を参照。
本発明はまた、C2c1エフェクタータンパク質の使用を含むCRISPR-C2c1システムを提供する。実施形態によっては、このシステムは、I)(a)直接反復ポリヌクレオチドおよび(b)標的配列にハイブリダイズ可能なガイド配列ポリヌクレオチドを含むcrRNAを含むCRISPR-CasシステムRNAポリヌクレオチド配列、II)tracr RNAポリヌクレオチド、およびIII)場合によっては少なくとも1つ以上の核局在化配列を含む、C2c1をコードするポリヌクレオチド配列を含み、この直接反復配列は、ガイド配列にハイブリダイズしかつCRISPR複合体の標的配列への配列特異的結合を誘導し、このCRISPR複合体は、(1)標的配列にハイブリダイズされるまたはハイブリダイズ可能なガイド配列、および(2)直接反復配列と複合化されたCRISPRタンパク質を含み、このCRISPRタンパク質をコードするポリヌクレオチド配列は、DNAまたはRNAである。このtracrはcrRNAに融合してもよい。例えば、tracr RNAは直接反復の5’末端でcrRNAに融合してもよい。本明細書で使用される用語「crRNA」は、CRISPR RNAを指し、本明細書では、用語「gRNA」または用語「ガイドRNA」と互換的に使用されてもよい。tracrがgRNAのcrRNAに融合する場合に、これは単一ガイドRNAまたは合成ガイドRNA(sgRNA)と呼んでもよい。
C2c1は、Cas9によって形成されたPAMの近位端での切断とは対照的に、PAMの遠位端で二本鎖切断を形成する(Jinek et al., 2012; Cong et al., 2013)。Cpf1変異標的配列は、単一gRNAによる反復切断を受けやすく、それによりHDRを媒介とするゲノム編集でのCpf1の応用を促進する可能性があることが提案されている(Front Plant Sci. 2016 Nov 14;7:1683)。Cpf1とC2c1はどちらも、構造の類似性を共有するV型CRISPR-Casタンパク質である。C2c1と同様に、Cpf1は(PAMの近位端で平滑な切断部を形成するCas9とは対照的に)PAMの遠位端で千鳥状の二本鎖切断を形成するが、Cpf1とは異なりC2c1システムはtracrRNAを使用する。従って、特定の実施形態では、関心のある遺伝子座は、相同性指向修復(HRまたはHDR)を介してCRISPR-C2c1複合体によって改変される。特定の実施形態では、関心のある遺伝子座は、HRとは独立してCRISPR-C2c1複合体によって改変される。特定の実施形態では、関心のある遺伝子座は、非相同末端結合(NHEJ)を介してCRISPR-C2c1複合体によって改変される。
C2c1は、Cas9によって生成された平滑末端とは対照的に、5’オーバーハングを有する千鳥状の切断部を形成する(Garneau et al., Nature. 2010;468:67-71、およびGasiunas et al., Proc Natl Acad Sci U S A. 2012;109:E2579-2586)。切断産物のこの構造は、哺乳動物ゲノムへの非相同末端結合(NHEJ)に基づく遺伝子挿入を促進するために特に有利である可能性がある(Maresca et al., Genome research. 2013;23:539-546)。
特定の実施形態では、エフェクタータンパク質は、アリシクロバチルス(Alicyclobacillus)、デスルホビブリオ(Desulfovibrio)、デスルホナトロナム(Desulfonatronum)、オピツタセアエ(Opitutaceae)、ツベリバチルス(Tuberibacillus)、バチルス(Bacillus)、ブレビバチルス(Brevibacillus)、カンジダトゥス(Candidatus)、デスルファチルハブディウム(Desulfatirhabdium)、シトロバクター(Citrobacter)、エルシミクロビア(Elusimicrobia)、メチロバクテリウム(Methylobacterium)、オムニトロフィカ(Omnitrophica)、フィシスファエラエ(Phycisphaerae)、プランクトミケス(Planctomycetes)、スピロヘータ(Spirochaetes)、ベルコミクロビアセア(Verrucomicrobiaceae)、レンティスファエリア(Lentisphaeria)、ラセイラ(Laceyella)を含む属からの生物に由来するC2c1エフェクタータンパク質である。
さらなる特定の実施形態では、C2c1エフェクタータンパク質は、アリシクロバチルス・アシドテレストリス(Alicyclobacillus acidoterrestris:例えばATCC 49025)、アリシクロバチルス・コンタミナンス(Alicyclobacillus contaminans:例えばDSM 17975)、アリシクロバチルス・マクロスポランギイダス(Alicyclobacillus macrosporangiidus:例えばDSM 17980)、バチルス・ヒサシイ株(Bacillus hisashii strain)C4、カンジダトゥス・リンドウバクテリア細菌(Candidatus Lindowbacteria bacterium)RIFCSPLOWO2、デスルフォビブリオ・イノピナトゥス(Desulfovibrio inopinatus:例えばDSM 10711)、デスルフォナトロナム・チオディスムタンス(Desulfonatronum thiodismutans:例えばMLF-1株またはGenbank受託番号WP_031386437)、エルシミクロビア細菌(Elusimicrobia bacterium)RIFOXYA12、オムニトロフィカWOR_2細菌(Omnitrophica WOR_2 bacterium)RIFCSPHIGHO2、オピツタセアエ細菌(Opitutaceae bacterium:TAV5またはGenbank受託番号WP_009513281)、フィフィスファレア細菌(Phycisphaerae bacterium)ST-NAGAB-D1、プランクトマイセス細菌(Planctomycetes bacterium)RBG_13_46_10、スピロヘータ細菌(Spirochaetes bacterium)GWB1_27_13、ベルコミクロビアセア細菌(Verrucomicrobiaceae bacterium)UBA2429、ツベリバチルス・カリドゥス(Tuberibacillus calidus:例えばDSM 17572)、バチルス・テルモアミロボランス(Bacillus thermoamylovorans:例えばB4166株)、ブレビバチルス種(Brevibacillus sp.)CF112、バチルス種(Bacillus sp.)NSP2.1、デスルフェチルハブジウム・ブチラチボランス(Desulfatirhabdium butyrativorans:例えばDSM 18734またはGenbank受託番号WP_028326052)、アリシクロバチルス・ヘルバリウス(Alicyclobacillus herbarius:例えばDSM 13609)、シトロバクター・フロインデイ(Citrobacter freundii:例えばATCC 8090)、ブレビバチルス・アグリ(Brevibacillus agri:例えばBAB-2500)、メチロバクテリウム・ノデュランス(Methylobacterium nodulans:例えばORS 2060またはGenbank受託番号WP_043747912)、アリシクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis:例えばGenbank受託番号WP_067936067)、バチルス種V3-13(Bacillus sp. V3-13:例えばGenbank受託番号WP_101661451)、レンティスファエリア細菌(Lentisphaeria bacterium:例えばDCFZ01000012)、およびラセエラ・セディミニス(Laceyella_sediminis:例えばGenbank受託番号WP_106341859)から選択される種に由来する。
特定の実施形態では、C2c1エフェクタータンパク質は、アリシクロバチルス属、バチルス属、デスルファチルハブディウム属、デスルホナトロナム属、レンティスファエラ属、レーセイエラ属、メチロバクテリウム属、またはオピツタセア属から選択される種に由来するか、またはそれに由来する。
特定の実施形態では、C2c1エフェクタータンパク質は、アリシクロバチルス・カケガウェンシス、バチルス種V3-13、デスルフェチルハブジウム・ブチラチボランス、レンティスファエリア細菌、ラセエラ・セディミニス、メチロバクテリウム・ノデュランス、またはオピツタセアエ細菌から選択される種に由来する。
特定の実施形態では、C2c1エフェクタータンパク質は、その野生型配列はWP_067936067の配列に対応するアリシクロバチルス・カケガウェンシス、その野生型配列はWP_101661451の配列に対応するバチルス種V3-13、その野生型配列はWP_028326052の配列に対応するデスルフェチルハブジウム・ブチラチボランス、その野生型配列はWP_031386437の配列に対応するデスルフォナトロナム・チオディスムタンス、その野生型配列はDCFZ01000012の配列に対応するレンティスファエリア細菌、その野生型配列はWP_106341859の配列に対応するラセエラ・セディミニス、その野生型配列はWP_043747912の配列に対応するメチロバクテリウム・ノデュランス、またはその野生型配列はWP_009513281の配列に対応するオピツタセア細菌から選択される種に由来する。
特定の実施態様では、C2c1エフェクタータンパク質は表1から選択された種に由来し、表1に示すように野生型配列を持っている。当然のことだが、本明細書のどこかで述べるように変異または切り詰めCas12bタンパク質は示された配列から乖離している可能性がある。
Figure 2024138266000004
Figure 2024138266000005
Figure 2024138266000006
Figure 2024138266000007
Figure 2024138266000008
Figure 2024138266000009
Figure 2024138266000010
特定の実施態様では、C2c1エフェクタータンパク質は、レンティスファエリア綱またはラセエラ属から選ばれた種に由来する。
特定の実施態様では、C2c1エフェクタータンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、レンティスファエリア綱細菌、またはラセエラ・セディミニスから選ばれた種に由来する。
特定の実施態様では、C2c1エフェクタータンパク質は、アリシクロバチルス・カケガウェンシス(野生型配列はWP_067936067の配列に相当)、バチルス属種V3-13(野生型配列はWP_101661451の配列に相当)、レンティスファエリア綱細菌(野生型配列はDCFZ01000012の配列に相当)、またはラセエラ・セディミニス(野生型配列はWP_106341859の配列に相当)から選ばれた種に由来する。
特定の実施態様では、C2c1エフェクタータンパク質は表2から選ばれた種に由来し、表2に示すような野生型配列を持っている。当然のことだが、本明細書のどこかで述べるように変異または切り詰めCas12bタンパク質は示された配列から乖離している可能性がある。
Figure 2024138266000011
Figure 2024138266000012
Figure 2024138266000013
エフェクターは、第1のエフェクタータンパク質(例えば、C2c1)相同分子種からの第1の断片および第2のエフェクタータンパク質(例えば、C2c1)相同分子種からの第2の断片を含むキメラエフェクタータンパク質を含んでもよい。ここで第1のエフェクタータンパク質相同分子種と第2のエフェクタータンパク質相同分子種は異なっている。第1のエフェクタータンパク質(例えば、C2c1)相同分子種および第2のエフェクタータンパク質(例えば、C2c1)相同分子種のうちの少なくとも一方は、以下の生体由来のエフェクタータンパク質(例えば、C2c1)を含んでいてもよい:アリシクロバチルス、デスルフォビブリオ、デスルフォナトロヌム、オピツタセアエ科、ツベリバチルス、バチルス、ブレビバチルス、カンジダトゥス、デスルフェチルハブジウム、エルシミクロビウム門、シトロバクター、メチロバクテリウム、オムニトロフィカ、フィシスファエラ綱、プランクトミケス門、スピロヘータ門、ベルコミクロビア科、レンティスファエリア綱またはラセエラ属。例えば、キメラエフェクタータンパク質は第1の断片と第2の断片を含み、第1および第2の断片はそれぞれアリシクロバチルス、デスルフォビブリオ、デスルフォナトロヌム、オピツタセアエ科、ツベリバチルス、バチルス、ブレビバチルス、カンジダトゥス、デスルフェチルハブジウム、エルシミクロビウム門、シトロバクター、メチロバクテリウム、オムニトロフィカ、フィシスファエラ綱、プランクトミケス門、スピロヘータ門、ベルコミクロビア科、レンティスファエリア綱またはラセエラ属を含む生体のC2c1から選ばれ、第1の断片と第2の断片は同じバクテリア綱からのものではない。例えばキメラエフェクタータンパク質は第1の断片と第2の断片を含み、第1の断片と第2の断片はアリシクロバチルス・アシドテレストリス(例えば、ATCC 49025)、アリシクロバチルス・コンタミナンス(例えば、DSM 17975)、アリシクロバチルス・マクロスポランギイドゥス(Alicyclobacillus macrosporangiidus)(例えば、DSM 17980)、バチルス・ヒサシイ菌株C4、カンジダトゥス・リンドウバクテリア細菌RIFCSPLOWO2、硫黄還元細菌(例えば、DSM 10711)、デスルフォナトロヌム・チオディスムタンス(例えば、菌株MLF-1またはgenbank受託番号WP_031386437)、エルシミクロビウム門細菌RIFOXYA12、オムニトロフィカWOR_2細菌RIFCSPHIGHO2、オピツタセアエ科細菌TAV5またはgenbank受託番号WP_009513281、フィシスファエラ綱細菌ST-NAGAB-D1、プランクトミケス門細菌RBG_13_46_10、スピロヘータ門細菌GWB1_27_13、ベルコミクロビア科細菌UBA2429、ツベリバチルス・カリドゥス(例えば、DSM 17572)、バチルス・テルモアミロボランス(例えば、菌株B4166)、ブレビバチルス属CF112、バチルス属NSP2.1、デスルフェチルハブジウム・ブチラチボランス(例えば、DSM 18734またはgenbank受託番号WP_028326052)、アリシクロバチルス・ヘルバリウス(例えば、DSM 13609)、シトロバクター・フロインデイ菌(例えば、ATCC 8090)、ブレビバチルス・アグリ(例えば、BAB-2500)、メチロバクテリウム・ノデュランス(例えば、ORS 2060またはgenbank受託番号WP_043747912)、アリシクロバチルス・カケガウェンシス(例えばgenbank受託番号WP_067936067)、バチルス属V3-13(例えばgenbank受託番号WP_101661451)、レンティスファエリア綱細菌(例えばDCFZ01000012から)、ラセエラ・セディミニス(例えばgenbank受託番号WP_106341859)のC2c1から選ばれ、第1の断片と第2の断片は同じバクテリア綱由来ではない。Cas12タンパク質(例えば、Cas12b)がある種に由来する場合、そのタンパク質はその種の野生型Cas12タンパク質でも、その種の野生型Cas12タンパク質の相同体でもよい。その種中の野生型Cas12タンパク質の相同体であるCas12タンパク質はその種中の野生型Cas12タンパク質の1つ以上の変種(例えば、変異、切り詰め等)を含んでいてもよい。
より好ましい実施態様では、C2c1bは、アリシクロバチルス・アシドテレストリス(例えば、ATCC 49025)、アリシクロバチルス・コンタミナンス(例えば、DSM 17975)、アリシクロバチルス・マクロスポランギイドゥス(例えば、DSM 17980)、バチルス・ヒサシイ菌株C4、カンジダトゥス・リンドウバクテリア細菌RIFCSPLOWO2、硫黄還元細菌(例えば、DSM 10711)、デスルフォナトロヌム・チオディスムタンス(例えば、菌株MLF-1またはgenbank受託番号WP_031386437)、エルシミクロビウム門細菌RIFOXYA12、オムニトロフィカWOR_2細菌RIFCSPHIGHO2、オピツタセアエ科細菌TAV5またはgenbank受託番号WP_009513281、フィシスファエラ綱細菌ST-NAGAB-D1、プランクトミケス門細菌RBG_13_46_10、スピロヘータ門細菌GWB1_27_13、ベルコミクロビア科細菌UBA2429、ツベリバチルス・カリドゥス(例えば、DSM 17572)、バチルス・テルモアミロボランス(例えば、菌株B4166)、ブレビバチルス属CF112、バチルス属NSP2.1、デスルフェチルハブジウム・ブチラチボランス(例えば、DSM 18734またはgenbank受託番号WP_028326052)、アリシクロバチルス・ヘルバリウス(例えば、DSM 13609)、シトロバクター・フロインデイ菌(例えば、ATCC 8090)、ブレビバチルス・アグリ(例えば、BAB-2500)、メチロバクテリウム・ノデュランス(例えば、ORS S 2060またはgenbank受託番号WP_043747912)、アリシクロバチルス・カケガウェンシス(例えばgenbank受託番号WP_067936067)、バチルス属V3-13(例えばgenbank受託番号WP_101661451)、レンティスファエリア綱細菌(例えばDCFZ01000012から)、ラセエラ・セディミニス(例えばgenbank受託番号WP_106341859)から選ばれた細菌種に由来する。特定の実施態様では、C2c1pはアリシクロバチルス・アシドテレストリス(例えば、ATCC 49025)、アリシクロバチルス・コンタミナンス(例えば、DSM 17975)から選ばれた細菌種に由来する。
特定の実施態様では、ここに述べるC2c1の相同体または相同分子種は、野生型C2c1と少なくとも80%、より好ましくは少なくとも85%、それより好ましくは少なくとも90%、例えば少なくとも95%の配列相同性または同一性を持つ。さらなる実施態様では、ここに述べるC2c1の相同体または相同分子種は、野生型C2c1と少なくとも80%、より好ましくは少なくとも85%、それより好ましくは少なくとも90%、例えば少なくとも95%の配列同一性を持つ。ここで、C2c1は1種以上の変異を持ち、ここに述べるC2c1の相同体または相同分子種は、変異C2c1と少なくとも80%、より好ましくは少なくとも85%、それより好ましくは少なくとも90%、例えば少なくとも95%の配列同一性を持つ。
一実施態様では、C2c1タンパク質は以下に述べる属(これらに限定されるものではないが)の生体の相同分子種であってもよい:アリシクロバチルス、デスルフォビブリオ、デスルフォナトロヌム、オピツタセアエ、ツベリバチルス、バチルス、ブレビバチルス、カンジダトゥス、デスルフェチルハブジウム、エルシミクロビウム、シトロバクター、メチロバクテリウム、オムニトロフィカ、フィシスファエラ、プランクトミケス、スピロヘータ、ベルコミクロビア、レンティスファエリア、またはラセエラ。特定の実施態様では、V型Casタンパク質は以下に述べる種(これらに限定されるものではないが)の生体の相同分子種であってもよい:アリシクロバチルス・アシドテレストリス(例えば、ATCC 49025)、アリシクロバチルス・コンタミナンス(例えば、DSM 17975)、アリシクロバチルス・マクロスポランギイドゥス(例えば DSM 17980)、バチルス・ヒサシイ菌株C4、カンジダトゥス・リンドウバクテリア細菌RIFCSPLOWO2、硫黄還元細菌(例えば、DSM 10711)、デスルフォナトロヌム・チオディスムタンス(例えば、菌株MLF-1またはgenbank受託番号WP_031386437)、エルシミクロビウム門 細菌RIFOXYA12、オムニトロフィカWOR_2 細菌RIFCSPHIGHO2、オピツタセアエ科細菌TAV5またはgenbank受託番号WP_009513281、フィシスファエラ綱細菌ST-NAGAB-D1、プランクトミケス門細菌RBG_13_46_10、スピロヘータ門細菌GWB1_27_13、ベルコミクロビア科細菌UBA2429、ツベリバチルス・カリドゥス(例えば、DSM 17572)、バチルス・テルモアミロボランス(例えば、菌株B4166)、ブレビバチルス属CF112、バチルス属NSP2.1、デスルフェチルハブジウム・ブチラチボランス(例えば、DSM 18734またはgenbank受託番号WP_028326052)、アリシクロバチルス・ヘルバリウス(例えば、DSM 13609)、シトロバクター・フロインデイ菌(例えば、ATCC 8090)、ブレビバチルス・アグリ(例えば、BAB-2500)、メチロバクテリウム・ノデュランス(例えば、ORS 2060またはgenbank受託番号WP_043747912)、アリシクロバチルス・カケガウェンシス(例えばgenbank受託番号WP_067936067)、バチルス属V3-13(例えばgenbank受託番号WP_101661451)、レンティスファエリア綱細菌(例えばDCFZ01000012から)、ラセエラ・セディミニス(例えばgenbank受託番号WP_106341859)、バチルス属種V3-13(例えばgenbank受託番号WP_101661451)。特定の実施態様では、ここに述べるC2c1の相同体または相同分子種は、ここに開示したC2c1配列のうちの1つ以上と、少なくとも80%、より好ましくは少なくとも85%、それより好ましくは少なくとも90%、例えば少なくとも95%の配列相同性または同一性を持つ。さらなる実施態様では、ここに述べたC2c1の相同体または相同分子種は、野生型AacC2c1またはBthC2c1と少なくとも80%、より好ましくは少なくとも85%、それより好ましくは少なくとも90%、例えば少なくとも95%の配列同一性を持つ。
特定の実施態様では、本発明のC2c1タンパク質はAacC2c1またはBthC2c1と少なくとも60%、とりわけ少なくとも70%、例えば少なくとも80%、より好ましくは少なくとも85%、それより好ましくは少なくとも90%、例えば少なくとも95%の配列相同性または同一性を持つ。さらなる実施態様では、本明細書に述べるC2c1タンパク質は野生型AacC2c1と少なくとも60%、例えば少なくとも70%、とりわけ少なくとも80%、より好ましくは少なくとも85%、それより好ましくは少なくとも90%、例えば少なくとも95%の配列同一性を持つ。特定の実施態様では、本発明のC2c1タンパク質はAacC2c1と60%未満の配列同一性を持つ。これはタンパク質の切り詰め型を含み、それにより配列同一性は切り詰め型の鎖長を超えて決定されることを当業者は理解する。
特定の実施態様では、Cas12b相同分子種はある温度、例えば、約25°C、約26°C、約27°C、約28°C、約29°C、約30°C、約31°C、約32°C、約33°C、約34°C、約35°C、約36°C、約37°C、約38°C、約39°C、約40°C、約41°C、約42°C、約43°C、約44°C、約45°C、約46°C、約47°C、約48°C、約49°C、または約50°Cで活性(例えば、核酸(RNAまたはDNA)の切断活性)を持っていてもよい。所与のCas12b相同分子種はある温度範囲、例えば、30°Cから50°Cまで、30°Cから48°Cまで、37°Cから42°Cまで、または37°Cから48°Cまでに最適な活性を持つ。実施態様によっては、BvCas12bは約37°Cで活性を持つ。実施態様によっては、BhCas12b(例えば、ここに開示された変異体4)は約37°Cで活性を持つ。実施態様によっては、AkCas12bは約48°Cで活性を持つ。この活性は、真核細胞中のCas12b相同分子種の活性である。その代わりにあるいはそれに加えて、この活性は原核生物細胞中の相同分子種の活性である。実施態様によっては、このような活性は最適な活性である。
改変C2c1酵素
特定の実施態様では、本明細書に規定するように、遺伝子操作されたC2c1タンパク質を活用することは興味深いことである。このタンパク質はRNAを含む核酸分子と複合化して、CRISPR複合体を形成する。CRISPR複合体中で、核酸分子は1つ以上の標的ポリヌクレオチド遺伝子座を標的とし、このタンパク質は未改変C2c1タンパク質と比較して少なくとも1つの改変を含み、改変タンパク質を含むCRISPR複合体は未改変C2c1タンパク質を含む複合体と比較して改変された活性を持つ。当然のことだが、本明細書中でCRISPR「タンパク質」という場合に、C2c1タンパク質は好ましくは(例えば増強または減弱酵素活性(もしくは無酵素活性)を持つ)改変されたCRISPR酵素、例えば、限定はされないがC2c1である。用語「CRISPRタンパク質」は「CRISPR酵素」と互換的に使用してもよく、CRISPRタンパク質が改変されたか、例えば野生型のCRISPRタンパク質と比較して、酵素活性が増強または減弱されたか無活性化されたかは関係ない。
上記の変異に加えて、CRISPR-Casタンパク質はさらに改変されていてもよい。本明細書で使用される、CRISPR-Casタンパク質に関する用語「改変」は、CRISPR-Casタンパク質が由来する野生型Casタンパク質に比較して、通常1つ以上の改変または変異(点変異、切り詰め、挿入、欠失、キメラ、融合タンパク質などを含む)を持つCRISPR-Casタンパク質を意味する。「由来する」は、野生型酵素と高度の配列相同性を持つという意味で、生成された酵素が大部分は野生型酵素に基づいているが、当技術分野で知られる、あるいはここに記述された何らかの方法で変異(改変)されていることを意味する。
CRISPR-Casタンパク質のさらなる改変は、改変機能基を生じるかも知れないし、生じないかも知れない。例えば、特にCRISPR-Casタンパク質に関しては、改変機能基を生じない改変は、例えば特定の宿主への発現のためのコドン最適化、またはヌクレアーゼに(例えば可視化のための)特定のマーカーを提供することを含む。改変機能基を生じる改変は、変異、例えば点変異、挿入、欠失、(核酸分解酵素の開裂を含む)切り詰めなどを含む。融合タンパク質は例えば異種ドメインまたは機能性ドメイン(例えば局在化シグナル、触媒ドメイン等)を含むがそれらに限定されない。特定の実施態様では、種々の異なる改変が組み合わされてもよい(例えば触媒的に反応不活性な変異ヌクレアーゼ、およびさらに機能性ドメインに融合して、限定がされないが、例えば切断(例えば異なるヌクレアーゼ(ドメイン)による)、変異、欠失、挿入、置換、連結、消化、切断または再結合などのDNAメチル化または核酸改変を誘導する変異ヌクレアーゼ)。本明細書で使用される「改変機能基」は、(改変標的認識、特異性の増加(例えば「強化」Casタンパク質)もしくは減少、または改変PAM認識などの)改変特異性、(触媒的に反応不活性な核酸分解酵素またはニッカーゼを含む触媒活性の増加または減少などの)改変活性、および/または(非安定化ドメインとの融合などの)改変安定性を含むが、これらに限定はされない。適切な異種ドメインは、ヌクレアーゼ、リガーゼ、修復タンパク質、メチルトランスフェラーゼ、(ウイルスの)インテグラーゼ、組換え酵素、転移酵素、アルゴノート、シチジンデアミナーゼ、レトロン、グループIIイントロン、フォスファターゼ、ホスホリラーゼ、スルフリラーゼ、キナーゼ、ポリメラーゼ、エキソヌクレアーゼなどを含むが、これらに限定はされない。これらすべての改変例は当技術分野で知られている。当然のことだが、本明細書で述べる「改変」ヌクレアーゼ、特に「改変」Casまたは「改変」CRISPR-Casシステムまたは複合体は、好ましくは(例えばガイド分子との複合体中で)ポリ核酸と相互作用あるいは結合する能力を依然として持っている。このような改変Casタンパク質はここで述べるようなデアミナーゼタンパク質またはその活性ドメインと結合することができる。
特定の実施態様では、CRISPR-Casタンパク質は、活性および/または特異性の強化をもたらす1種以上の改変、例えば、標的または非標的鎖を安定化させる変異残基(例えばeCas9;「特異性の改善された合理的に改変されたCas9核酸分解酵素」、Slaymaker et al. (2016)、Science、351(6268):84-88、参照によりその全体が取り込まれる)を含んでいてもよい。特定の実施態様では、遺伝子操作CRISPRタンパク質の改変または改変活性は標的効率の増加または非特異的結合の減少を含む。特定の実施態様では、遺伝子操作CRISPRタンパク質の改変活性は改変切断活性を含む。特定の実施態様では、改変活性は、標的ポリヌクレオチド遺伝子座に関しては切断活性の増加を含む。特定の実施態様では、改変活性は、標的ポリヌクレオチド遺伝子座に関しては切断活性の減少を含む。特定の実施態様では、改変活性は、非特異的なポリヌクレオチド遺伝子座に関しては切断活性の減少を含む。特定の実施態様では、改変ヌクレアーゼの改変または改変活性は改変ヘリカーゼ動態を含む。特定の実施態様では、改変ヌクレアーゼは、タンパク質とRNAを含む核酸分子(Casタンパク質の場合)、または標的ポリヌクレオチド遺伝子座の鎖、または非特異的ポリヌクレオチド遺伝子座の鎖との会合を改変する改変を含む。本発明の一側面では、遺伝子操作CRISPRタンパク質はCRISPR複合体の形成を改変する改変を含む。特定の実施態様では、改変活性は非特異的なポリヌクレオチド遺伝子座に関しては切断活性の増加を含む。従って、特定の実施態様では、非特異的なポリヌクレオチド遺伝子座と比べて標的ポリヌクレオチド遺伝子座では特異性が増加する。他の実施態様では、ポリヌクレオチド遺伝子座に比べて標的ポリヌクレオチド遺伝子座では特異性が減少する。特定の実施態様では、変異は非特異的効果(例えば切断もしくは結合特性、活性、または動態)の減少、例えばCasタンパク質の場合の標的RNAとガイドRNA間の不一致に対する許容度の低下に繋がる。他の変異が非特異的効果(例えば切断もしくは結合特性、活性、または動態)の増加に繋がるかも知れない。他の変異が非特異的効果(例えば切断もしくは結合特性、活性、または動態)の増加または減少に繋がるかも知れない。特定の実施態様では、変異はヘリカーゼ活性の改変(増加または減少)、機能性ヌクレアーゼ複合体(例えばCRISPR-Cas複合体)の会合または結合に繋がる。特定の実施態様では、上述の通り、変異は改変PAMの認識に繋がる。言い換えれば、異なるPAMが未改変Casタンパク質との比較で(付加または置換部位に)認識される。特に好適な変異は、特異性を増強するために、正に帯電した残基および/または(漸進的な)保存残基、例えば正に帯電した保存残基を含む。特定の実施態様では、このような残基はアラニンのような非帯電残基に対する変異であってもよい。
C2c1の結晶構造から、もう一つのV型Casタンパク質であるCpf1(Cas12aとしても知られている)との類似が明らかになる。C2c1とCpf1はどちらもα-らせん認識ローブ (REC)とヌクレアーゼローブ(NUC)からなる。NUCローブはさらにオリゴヌクレオチド結合 (WED/OBD)ドメイン、RuvCドメイン、Nucドメイン、および架橋らせん(BH)を含み、構造の組換えと折り畳みによる未変化の三次元C2c1構造(Liuet al. Mol. Cell, 65、310-322)の形成を伴う。Nucドメイン中の特定の変異(例えばAsCpf1中のR1226A、BvCas12b中のR894A)によりCpf1は非標的鎖切断のためのニッカーゼになる。RuvCドメイン中の触媒残基の変異(例えばAsCpf1のD908、E933、D1263における変異)ヌクレアーゼとしてのCpf1の触媒活性を消失させる。さらに、Cpf1のPAM相互作用 (PI)ドメインの変異(例えばAsCpf1のS542、K548、N522、およびK607における変異)がCpf1特異性を改変、すなわち、非特異的切断の潜在的な増加または減少(See Gao et al., Cell Research (2016) 26、901-913 (2016)および Gao et al. Nature Biotechnology 35、789-792 (2017))をもたらすことが分かっている。C2c1の結晶構造からはC2c1が識別可能なPIドメインを欠き、C2c1が配座調整を受けてPAM認識とR-ループ形成のためのPAM近位二本鎖DNAの結合に順応させる。C2c1はWED/OBDとαらせんドメインを会合させ、主溝側と副溝側の両方からPAM二本鎖を認識させる(Yanget et al., Cell, 167、1814-1828 (2016))。
本発明に従えば、酵素の失活を起こすか二本鎖ヌクレアーゼをニッカーゼ活性に改変する、またはC2c1のPAM認識特異性を改変する変異体が生成される。特定の実施態様では、この情報を用いて非特異的な効果を減弱した酵素を開発する。
特定の実施態様では、編集の優先度は標的領域内の特異的挿入または欠失である。特定の実施態様では、少なくとも1種の改変により1つ以上の特異的挿入欠失の形成が増強される。特定の実施態様では、少なくとも1種の改変はC末端RuvC様ドメイン、NUCドメイン、N末端α-らせん領域、αおよびβ混合領域、またはそれらの組み合わせである。特定の実施態様では、改変編集の優先度は挿入欠失の形成である。特定の実施態様では、少なくとも1種の改変は1つ以上の特異的挿入の形成を増強することである。
特定の実施態様では、少なくとも1種の改変で1つ以上の特異的挿入の形成が増強される。特定の実施態様では、少なくとも1種の改変で標的領域中のA、T、G、またはCの隣にAが挿入される。他の実施態様では、少なくとも1種の改変で標的領域中のA、T、G、またはCの隣にTが挿入される。他の実施態様では、少なくとも1種の改変で標的領域中のA、T、G、またはCの隣にGが挿入される。他の実施態様では、少なくとも1種の改変で標的領域中のA、T、G、またはCの隣にCが挿入される。挿入は隣接ヌクレオチドに対して5’または3’であってもよい。一実施態様では、1種以上の改変により既存のTの隣にTを挿入する。特定の実施態様では、既存のTはガイド配列の結合領域中の4番目の位置に相当する。特定の実施態様では、1種以上の改変で上に述べたようなより精密な一塩基挿入または欠失を確実にする酵素が得られる。より詳しくは、1種以上の改変により、酵素による他の種類の挿入欠失の形成を減弱してもよい。一塩基挿入または欠失を生成する能力は、特に相同組換え修復が不可能な小さな欠失により起こる病気の遺伝子変異の修正などの、いくつかの応用、例えば、最も一般的な遺伝型の嚢胞性線維症である3つのTの挿入を意図する3つのsRNAの送達を介したCFTR中のF508del変異の修正、あるいは脳内のCDKL5におけるAlia Jafarの単一ヌクレオチド欠失の修正では興味深い。この編集方法は非相同末端結合のみを必要とするので、編集は脳のような分割終了細胞でも可能である。一塩基対挿入/欠失を生成する能力はゲノム全体のCRISPR-Cas陰性選択選抜に有用である。特定の実施態様では、少なくとも1種の改変は変異である。特定の他の実施態様では、1種以上の改変を、1種以上のさらなる改変または結合特異性を増強する改変および/もしくは非特異的な効果を減弱する改変を含む下記の変異と組み合わせてもよい。
特定の実施態様では、野生型と比較して編集の優先度を改変する少なくとも1種の改変を含む遺伝子操作CRISPR-Casエフェクターは、RNAまたは標的ポリペプチド遺伝子座を含む核酸分子に関して結合特性を改変する、核酸分子または標的分子または標的ポリヌクレオチドに関して結合動態を改変する、あるいは核酸分子に関して結合特異性を改変する1種以上のさらなる改変をさらに含んでもよい。このような改変の例を次の段落にまとめる。上記の情報に基づき、酵素の失活を引き起こす、あるいは二本鎖ヌクレアーゼをニッカーゼ活性に改変する変異体を生成することができる。代替の実施態様では、この情報を使用して非特異的効果の減弱した酵素を開発する。
改変ニッカーゼ
変異はヌクレアーゼ活性に関与するアミノ酸における隣接残基で行うことができる。実施態様によっては、RuvCドメインのみが失活され、他の実施態様では、もう一つの推定ヌクレアーゼドメインが失活されるが、ここでエフェクタータンパク質複合体はニッカーゼとして機能し一DNA鎖のみを切断する。実施態様によっては、2つの(ニッカーゼが異なる)C2c1変異体を使用して特異性を増強し、2つのニッカーゼ変異体を使用して標的にあるDNAを切断する(ここで両方のニッカーゼがDNA鎖を切断する一方で、一本だけのDNA鎖が切断され、次いで修復される非特異的な改変を最小にするか排除する)。好ましい実施態様では、C2c1エフェクタータンパク質は、2つのC2c1エフェクタータンパク質分子を含むホモ二量体としての関心のある標的遺伝子座と会合した配列またはその遺伝子座にある配列を切断する。好ましい実施態様では、ホモ二量体はそれらの対応するRuvCドメイン中の異なる変異を含む2つのC2c1エフェクタータンパク質分子を含んでいてもよい。
本発明は2種以上のニッカーゼを用いる方法、特に、双対的なニッカーゼ手法を目論んでいる。側面および実施態様によっては、単一型C2c1ニッカーゼ、例えば本明細書に記載される改変C2c1または改変C2c1ニッカーゼが供給されてもよい。その結果、標的DNAは2つのC2c1ニッカーゼにより束縛される。さらに、異なる相同分子種、例えば、DNAの一本鎖状のC2c1ニッカーゼ(例えば、コード鎖)と非コードすなわち反対側のDNA鎖上の相同分子種を用いてもよいことも想定される。相同分子種はSaCas9ニッカーゼまたはSpCas9ニッカーゼのようなCas9ニッカーゼであってもよいが、これらに限定されるものではない。異なるPAMを必要とし、異なるガイド要件を持ちうる2つの異なる相同分子種を使用するのが有利であり、利用者にとってはより十分な制御が可能となる。特定の実施態様では、DNA 切断は少なくとも4種のニッカーゼを含み、それぞれは標的DNAの異なる配列にガイドされ、各対は第1のニックを第1のDNA鎖に導入し、かつ第2のニックを第2のDNA鎖に導入する。このような方法では、少なくとも2対の単鎖切断が標的DNAに導入され、第1および第2の対の単鎖の切断の導入が起こると、第1のおよび第2の対の単鎖切断間の標的配列が切り取られる。特定の実施態様では、相同分子種の片方または両方が制御可能すなわち誘導可能である。
本発明に従う特定の方法では、CRISPR-Casタンパク質は、好ましくは対応する野生型酵素に関して、変異CRISPR-Casタンパク質が標的配列を含む標的遺伝子座の片方または両方のDNA鎖を切断する能力を欠くように変異されている。特定の実施態様では、C2c1タンパク質の1箇所以上の触媒ドメインは変異されて、標的配列の1本だけのDNA鎖を切断する変異Casタンパク質を生成する。
この方法の特定の実施態様では、CRISPR-Casタンパク質は、一本だけのDNA鎖を切断する変異CRISPR-Casタンパク質、すなわちニッカーゼである。具体的には、本発明の文脈では、ニッカーゼは非標的配列、すなわち、標的配列の反対側のDNA鎖にありPAM配列の3’である配列内の切断を確実にする。さらなるガイダンスにより、制限なしに、アリシクロバチルス・アシドテレストリスからのC2c1のNucメイン中のアルギニンからアラニンへの置換 (R911A)は、C2c1を両方の鎖をニッカーゼに切断する(単鎖を切断する)ヌクレアーゼから転換する。酵素がAacC2c1でない場合、変異は対応する位置内の残基によって行われうることを当業者なら分かっている。
特定の実施態様では、C2c1タンパク質はNucドメイン中の変異を含むC2c1ニッカーゼである。実施態様によっては、C2c1ニッカーゼはアリシクロバチルス・アシドテレストリスC2c1中のアミノ酸位置R911、R1000、またはR1015に対応する変異を含む。実施態様によっては、C2c1ニッカーゼはアリシクロバチルス・アシドテレストリスC2c1中のR911A、R1000A、またはR1015Aに対応する変異を含む。実施態様によっては、C2c1ニッカーゼはバチルス属V3-13 C2c1中のR894Aに対応する変異を含む。特定の実施態様では、C2c1タンパク質は、このタンパク質の未変異すなわち未改変型に比べて特異性が増強または減弱されたPAMを認識する。実施態様によっては、C2c1タンパク質はこのタンパク質の未変異すなわち未改変型に対して改変PAMを認識する。
失活/不活化C2c1タンパク質
C2c1タンパク質がヌクレアーゼ活性を持っている場合、このタンパク質のヌクレアーゼ活性を減弱する、例えば、野生型酵素と比べて、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、または100%のヌクレアーゼを失活するように改変してもよい。別の言い方をすれば、C2c1酵素が未変異または野生型C2c1酵素またはCRISPR 酵素のヌクレアーゼ活性の約0%を持つように、あるいは未変異または野生型C2c1酵素ヌクレアーゼ活性の約3%以下、約5%以下、または約10%以下を持つように改変してもよい。実施態様によっては、変異酵素のDNA切断活性がその酵素の未変異型のDNA切断活性の約25%以下、10%以下、5%以下、1%以下、0.1%以下、または0.01%以下のとき、CRISPR-Casタンパク質は実質的にすべてのDNA切断活性を欠いていると考えられる。そのような例は変異型のDNA切断活性が未変異型と比べて皆無か無視できる場合である。これらの実施態様では、CRISPR-Casタンパク質は一般のDNA結合タンパク質として用いられる。これは、変異をC2c1およびその相同分子種のヌクレアーゼドメインに導入することで可能である。
特定の実施態様では、CRISPR酵素は、遺伝子操作されてヌクレアーゼ活性を減じるか消失させる1種以上の変異を含むことができる。
特定の実施態様では、C2c1タンパク質はRuvCドメイン中に変異を含む触媒的に反応不活性なC2c1である。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、アリシクロバチルス・アシドテレストリスC2c1中のアミノ酸位置D570、E848、またはD977に対応する変異を含む。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、アリシクロバチルス・アシドテレストリスC2c1中のD570A、E848A、またはD977Aに対応する変異を含む。
実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス・ヒサシイC2c1中のアミノ酸位置D574、E828、またはD952に対応する変異を含む。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス・ヒサシイC2c1中のD574A、E828A、またはD952Aに対応する変異を含む。
実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス属V3-13 C2c1中のアミノ酸位置D567、E831、またはD963に対応する変異を含む。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス属V3-13 C2c1中のD567A、E831A、またはD963Aに対応する変異を含む。
特定の実施態様では、C2c1タンパク質はRuvCドメイン中に変異を含む触媒的に反応不活性なC2c1である。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、アリシクロバチルス・アシドテレストリスC2c1中のアミノ酸位置D570、E848、またはD977に対応する変異を含む。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、アリシクロバチルス・アシドテレストリスC2c1中のD570A、E848A、またはD977Aに対応する変異を含む。
実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス・ヒサシイC2c1中のアミノ酸位置D574、E828、またはD952に対応する変異を含む。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス・ヒサシイC2c1中のD574A、E828A、またはD952Aに対応する変異を含む。
実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス属V3-13 C2c1中のアミノ酸位置D567、E831、またはD963に対応する変異を含む。実施態様によっては、触媒的に反応不活性なC2c1タンパク質は、バチルス属V3-13 C2c1中のD567A、E831A、またはD963Aに対応する変異を含む。
特定の実施態様では、C2c1タンパク質はNucドメイン中に変異を含むC2c1ニッカーゼである。実施態様によっては、C2c1ニッカーゼは、アリシクロバチルス・アシドテレストリスC2c1中のアミノ酸位置R911、R1000、またはR1015に対応する変異を含む。実施態様によっては、C2c1ニッカーゼは、アリシクロバチルス・アシドテレストリスC2c1中のR911A、R1000A、またはR1015Aに対応する変異を含む。実施態様によっては、C2c1ニッカーゼは、バチルス属種V3-13 C2c1中のR894Aに対応する変異を含む。特定の実施態様では、C2c1タンパク質は、タンパク質の未変異または未改変型に比べて大きなまたは小さな特異性でPAMを認識する。実施態様によっては、C2c1タンパク質はこのタンパク質の未変異または未改変型との比較で改変PAMを認識する。
実施態様によっては、変異酵素のDNA切断活性が、酵素の未変異型のDNA切断活性の約25%以下、10%以下、5%以下、1%以下、0.1%以下、または0.01%以下であるとき、CRISPR-Casタンパク質は、実質的にすべてのDNA切断活性を欠いていると考えられる。その一例は変異型のDNA切断活性がその未変異型との比較で皆無か無視できる場合である。これらの実施態様では、CRISPR-Casタンパク質は一般的なDNA 結合タンパク質として使用される。変異は人工的に導入された変異または機能獲得型もしくは機能喪失型の変異であってもよい。
上記の変異に加えて、CRISPR-Casタンパク質はさらに改変されてもよい。本明細書で使用される、CRISPR-Casタンパク質に関する用語「改変」は、通常、野生型Casタンパク質に由来する改変との比較で、1種以上の改変または変異(点変異、切り詰め、挿入、欠失、キメラ、融合タンパク質等を含む)を持つCRISPR-Casタンパク質を意味する。「由来する」は、野生型酵素と高度の配列相同性を持つという意味で、生成された酵素は、大部分が野生型酵素に基づいているが、当技術分野で知られる、あるいはここに記述された何らかの方法で変異(改変)されていることを意味する。
不活性化C2c1 CRISPR酵素は、(例えば、融合タンパク質または適切なリンカーを介して)会合した1つ以上の機能ドメイン、例えばデアミナーゼ活性、メチラーゼ活性、デメチラーゼ活性、転写昂進活性、転写抑制活性、転写終結因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性、および分子スイッチ(例えば、光誘起性)を含む、本質的にそれらからなる、またはそれらからなる群からの1つ以上のドメインを持っていてもよい。本発明の方法で使用に適するリンカーは当業者には周知で、限定はされないが、直鎖状または分岐鎖状の炭素リンカー、複素環炭素リンカー、またはペプチドリンカーを含む。なお、本明細書で使用されるリンカーは共有結合(炭素-炭素結合または炭素-異種原子結合)であってもよい。特定の実施態様では、リンカーは標的ドメインとアデノシンデアミナーゼを、各タンパク質が要求される機能性を維持するのに十分な距離だけ分離するのに使用される。好適なペプチドリンカー配列は柔軟な伸張配座に適合し、規則的な二次構造を発達させる傾向を示さない。特定の実施態様では、リンカーは、単量体、二量体、多量体または重合体である化学部分であってもよい。好ましくは、リンカーはアミノ酸を含む。柔軟なリンカー中の典型的なアミノ酸はGly、AsnおよびSerを含む。従って、特定の実施態様では、リンカーGly、AsnおよびSerアミノ酸のうちの1種以上の組み合わせを含む。ThrおよびAlaなどの他のほぼ中性アミノ酸もリンカー配列中に使用されてもよい。典型的なリンカーはMaratea et al. (1985), Gene 40: 39-46; Murphy et al. (1986) Proc. Nat’l. Acad. Sci. USA 83: 8258-62、米国特許第4,935,233号、および米国特許第4,751,180号に開示されている。例えば、GlySerリンカーGGS、GGGS(配列番号402)またはGSGが使用できる。GGS、GSG、GGGSまたはGGGGS(配列番号403)リンカーは3つ、例えば(GGS)3(配列番号404)、(GGGGS)3(配列番号393)または5つ(配列番号405)、6つ(配列番号394)、7つ(配列番号406)、9つ(配列番号395)さらには12(配列番号396)以上の反復配列中に使用して適当な鎖長を提供することができる。特定の実施態様では、リンカー(GGGGS)3が本明細書中で好適に使用される。(GGGGS)6 (GGGGS)9または(GGGGS)12は代替物として好適に使用できる。他の好適な代替物は(GGGGS)1(配列番号403)、(GGGGS)2(配列番号407)、(GGGGS)4(配列番号408)、(GGGGS)5(配列番号405)、(GGGGS)7(配列番号406)、(GGGGS)8(配列番号409)、(GGGGS)10(配列番号410)、または(GGGGS)11(配列番号411)である。さらなる実施態様では、LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(配列番号412)がリンカーとして使用される。さらなる実施態様では、リンカーはXTENリンカーである。さらに、N-およびC-末端NLSもリンカー(例えば、PKKKRKVEASSPKKRKVEAS(配列番号413))として機能する。
リンカーの例を下表に示す。
Figure 2024138266000014
典型的な機能ドメインは (ADAD)ファミリーのメンバーであるFok1、VP64、P65、HSF1、MyoD1を含むアデノシンデアミナーゼドメインである。デアミナーゼがあれば、ガイド配列がガイド配列と標的配列の間に形成されたRNA二本鎖またはRNA/DNAヘテロ二本鎖中に1つ以上の不一致を導入するように意図されている点で有利である。特定の実施態様では、ガイド配列と標的配列の間の二本鎖はA-C不一致を含む。Fok1があれば、Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June (2014)に具体的に記載されているように、複数のFok1機能ドメインが機能性二量体を可能にするように提供され、かつ機能的使用(Fok1)のためにgRNAが適切な間隔を提供するように意図されている点で有利である。アダプタータンパク質はこのような機能ドメインに結合する既知のリンカーを利用してもよい。場合によってはさらに少なくとも1つのNLSが提供されるのが好ましい。場合によっては、N末端にNLSを配置するのが好ましい。2つ以上の機能ドメインが含まれる場合、これらの機能ドメインは同じでも異なっていてもよい。
一般に、不活性化C2c1酵素上への1つ以上の機能ドメインの配置は、機能ドメインの正確な空間定位を可能にし、帰属された機能効果を持つ標的に影響させる配置である。例えば、機能ドメインが転写活性化因子(例えば、VP64またはp65)の場合、その転写活性化因子は標的の転写に影響する空間定位に配置される。同様に、転写抑制因子は好ましくは標的の転写に影響するように配置され、かつヌクレアーゼ(例えば、Fok1)は好ましくは標的を切断または部分的に切断するように配置される。この配置はCRISPR酵素のN-/C-末端以外の配置を含んでいてもよい。機能ドメインは標的DNA配列の転写または翻訳を改変する。
実施態様によっては、Cas12bエフェクタータンパク質は1つ以上の機能ドメインと会合し、かつCas12bエフェクタータンパク質はRuvCおよび/またはNucドメイン中に1つ以上の変異を含み、それにより形成されたCRISPR複合体により、後成的な改変因子または転写もしくは翻訳活性化または抑制シグナルの送達が可能となる。
特定の実施態様では、本明細書に開示されたCRISPR-Casシステムは自己不活性化システムであり、Casエフェクタータンパク質は一過性に発現される。実施態様によっては、自己不活性化システムはアデノ随伴ウイルスベクターのようなウイルスのベクターを含む。実施態様によっては、自己不活性化システムは内因性標的配列と80%、81%、82%、83%、84%、85%、86%、97%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%の同一性を共有するDNA配列を含む。実施態様によっては、自己不活性化システムは2つ以上のベクターシステムを含む。実施態様によっては、自己不活性化システムは単一のベクターを含む。実施態様によっては、自己不活性化システムは、内因性DNA標的配列を同時に標的にするCasエフェクターとこのCasエフェクタータンパク質をコードするベクター配列を含む。実施態様によっては、自己不活性化システムは、内因性DNA標的配列を標的にするCasエフェクターとこのCasエフェクタータンパク質を順にコードするベクター配列を含む。実施態様によっては、Casエフェクターとガイド配列をコードするヌクレオチドは、単一ベクター上の分離調節エレメントに作動可能に連結されている。実施態様によっては、Casエフェクターとガイド配列をコードするヌクレオチドは、分離ベクター上の分離調節エレメントに作動可能に連結されている。実施態様によっては、調節エレメントは恒常的である。実施態様によっては、調節エレメントは誘導性である。
不安定化C2c1
特定の実施態様では、本発明に従うエフェクタータンパク質(CRISPR 酵素;C2c1)は不安定化ドメイン(DD)と会合または融合する。実施態様によっては、DDはER50である。このDDに関して対応する安定化リガンドは、実施態様によっては、4HTである。そのために、実施態様によっては、DDまたは複数のDDのうちの1つはER50であり、そのための安定化リガンドは4HTまたはCMP8である。実施態様によっては、DDはDHFR50である。このDDに関して対応する安定化リガンドは、実施態様によっては、TMPである。そのために、実施態様によっては、DDまたは複数のDDのうちの1つはDHFR50であり、そのための安定化リガンドはTMPである。実施態様によっては、DDはER50である。このDDに関して対応する安定化リガンドは、実施態様によっては、CMP8である。従ってCMP8はER50システムにおける4HTに対する代替安定化リガンドである。CMP8および4HTは使用に関して競合するが、細胞種によってはこれら2つのリガンドのうちの一方または他方により影響を受けやすい。この開示と当分野における知見から、当業者はCMP8および/または4HTを使用することができる。
実施態様によっては、1つまたは2つのDDがCRISPR酵素のN-末端に融合し、1つまたは2つのDDはCRISPR 酵素のC-末端に融合する。実施態様によっては、少なくとも2つのDDはCRISPR酵素と融合し、これらのDDは同じ、すなわち相同である。従って、複数のDDのうちの2つ以上がER50 DDであってもよい。実施態様によってはこのことが好ましい。あるいは、複数のDDのうちの2つ以上がDHFR50 DDであってもよい。実施態様によってはこのことが好ましい。実施態様によっては、少なくとも2つのDDはCRISPR酵素と融合し、これらのDDは異なり、すなわち異種性である。複数のDDのうちの1つはER50であり、複数のDDのうちの1つ以上または任意の他のDDはDHFR50であってもよい。異種性の2つ以上のDDを持つことは、高水準の分解制御を提供するので、有利な可能性がある。NまたはC末端における2つ以上のDDの並列融合は分解を促進し、このような並列融合は例えばER50-ER50-C2c1であってもよい。高水準の分解はいずれの安定化リガンドも存在しない場合に起こり、中程度の分解は1つの安定化リガンドが存在せずかつ他の安定化リガンドが存在する場合に起こり、低水準の分解は複数の安定化リガンドのうちの2つ以上が存在する場合に起こることが想定される。制御はN-末端ER50 DDおよびC-末端DHFR50 DDを持つことによって付与される。
実施態様によっては、CRISPR酵素とDDの融合はDDとCRISPR酵素間のリンカーを含む。実施態様によっては、リンカーはGlySerリンカーである。実施態様によっては、DD-CRISPR酵素はさらに少なくとも1つ核外輸送シグナル (NES)を含む。実施態様によっては、DD-CRISPR酵素は2つ以上のNESを含む。実施態様によっては、DD-CRISPR酵素は少なくとも1つの核局在化シグナル (NLS)を含む。このシグナルはNESに追加されていてもよい。実施態様によっては、CRISPR酵素は、CRISPR酵素とDDの間のリンカーまたはその一部としての局在化(核内または核外輸送)シグナルを含む、または実質的にそれからなる、またはそれからなる。HAすなわちFlagタグもリンカーとして本発明の範囲内にある。出願人達はNLSおよび/またはNESをリンカーとして使用し、GSから(GGGGS)3までの短いグリシンセリンリンカーも使用する。
不安定化ドメインは広範囲のタンパク質に不安定性を与えるという一般的な有用性を持つ(例えば、Miyazaki、J Am Chem Soc. Mar 7, 2012; 134(9): 3942-3945、参照として本明細書に取り込まれる)。CMP8すなわち4-ヒドロキシタモキシフェンは不安定化ドメインであってもよい。一般に、哺乳類DHFR (DHFRts)の温度感受性変異体(N-末端則による不安定化残基)は許容温度では安定だが37°Cで不安定であることが分かった。メトトレキサート(哺乳類DHFR用の高親和性リガンド)のDHFRtsを発現する細胞への添加はタンパク質の分解を部分的に阻止した。これは、小分子リガンドが細胞内での分解の標的となるタンパク質を安定化できるという重要な実証だった。ラパマイシン誘導体を使用して、mTORのFRBドメインの不安定な変異体(FRB*)を安定化し、融合キナーゼGSK-3β.6,7の機能を回復した。このシステムは、リガンド依存性の安定性が複雑な生物学的環境における特定のタンパク質の機能を調節する魅力的な方法であることを示した。タンパク質活性を制御するシステムは、FK506結合タンパク質とFKBP12のラパマイシン誘発二量体化によってユビキチン相補性が発生したときにDDが機能するようになることを含む可能性がある。ヒトFKBP12またはecDHFRタンパク質の変異体は、それぞれ高親和性リガンドであるShield-1またはトリメトプリム (TMP)がない場合に代謝的に不安定になるように改変することができる。これらの変異体は、本発明の実施に有用な可能性のある不安定化ドメイン (DD)のうちのいくつかであり、CRISPR酵素と融合する場合のDDの不安定性は、プロテアソームによる融合タンパク質全体のCRISPRタンパク質分解に繋がる。Shield-1とTMPは、用量依存的にDDに結合して安定化する。エストロゲン受容体リガンド結合ドメイン(ERLBD、ERS1の残基305-549)も不安定化ドメインとして操作することができる。エストロゲン受容体シグナル伝達経路は乳がんなどのさまざまな疾患に関与しているため、この経路は広く研究されており、エストロゲン受容体の多くの作動薬と拮抗薬が開発されている。従って、ERLBDと薬物の互換性のある対が知られている。ERLBDの野生型ではなく変異体に結合するリガンドがある。3つの変異(L384M、M421G、G521R)12をコードするこれらの変異ドメインの1つを使用することにより、内因性エストロゲン感受性ネットワークを摂動させないリガンドを用いて、ERLBD由来のDDの安定性を調節することができる。追加の変異(Y537S)を導入して、ERLBDをさらに不安定にし、潜在的なDDの候補として構成することができる。この四変異遺伝子(tetra-mutant)は有利なDD開発である。変異体ERLBDはCRISPR酵素に融合させることができ、その安定性はリガンドを用いて調節または摂動させることができ、それによってCRISPR酵素はDDを持つ。別のDDは、Shield1リガンドによって安定化された変異FKBPタンパク質に基づく12 kDa(107アミノ酸)のタグである(例えば、Nature Methods 5, (2008)を参照)。例えば、DDは合成の生物学的に不活性な小分子であるShield-1に結合し、それによって可逆的に安定化される改変FK506結合タンパク質12(FKBP12)である可能性がある(例えば、Banaszynski LA, Chen LC, Maynard-Smith LA, Ooi AG, Wandless TJ, A rapid, reversible, and tunable method to regulate protein function in living cells using synthetic small molecules(合成小分子を用いて生細胞のタンパク質機能を調節するための、迅速で可逆的かつ調整可能な方法). Cell. 2006; 126:995-1004; Banaszynski LA、Sellmyer MA、Contag CH、Wandless TJ、Thorne SH. Chemical control of protein stability and function in living mice(生きているマウスにおけるタンパク質の安定性と機能の化学的制御)Nat Med. 2008;14:1123-1127; Maynard-Smith LA, Chen LC, Banaszynski LA, Ooi AG, Wandless TJ. A directed approach for engineering conditional protein stability using biologically silent small molecules(生物学的にサイレントな小分子を使用して条件付きタンパク質の安定性を操作するための指示された手法)The Journal of biological chemistry. 2007;282:24866-24872;およびRodriguez, Chem Biol. Mar 23, 2012; 19(3): 391-398を参照-これらはすべて参照により本明細書に組み込まれ、本発明の実施ではCRISPR酵素と結合するために選択されたDDでは本発明を実施するのに使用することができる)。以上のように、当技術分野の知識は、いくつかのDDを含み、DDは、例えば、リンカーと会合、有利には、CRISPR酵素に融合し、それにより、DDは、リガンドの存在下で安定化される。リガンドが存在しない場合、DDは不安定化する可能性があり、それによってCRISPR酵素が完全に不安定化するか、DDがリガンドの非存在下で安定化され、リガンドの存在下で不安定化する可能性がある。DDにより、CRISPR酵素、従ってCRISPR-Cas複合体またはシステムを制御でき、いわばオンまたはオフになり、それによって、例えばin vivoまたはin vitro環境でシステムを制御する手段が提供される。例えば、関心のあるタンパク質がDDタグとの融合体として発現される場合、それは細胞内で不安定化され、例えばプロテアソームによって急速に分解される。従って、安定化リガンドが存在しない場合は、D会合Casが分解される。新しいDDが関心のあるタンパク質に融合すると、DDの不安定性により関心のあるタンパク質も不安定になり、融合タンパク質全体が急速に分解される。Casに対するピーク活性は、非特異的な効果を減弱することがある。従って、高活動の短いバーストが好ましい。本発明は、そのようなピークを提供することができる。ある意味で、システムは誘導性である。他のいくつかの意味では、システムは安定化リガンドの非存在下で抑制され、安定化リガンドの存在下で抑制解除された。
分割設計
C2c1は安定した核酸検出も可能である。特定の実施態様では、C2c1は、そのヌクレアーゼ活性の不活性化によって、核酸結合タンパク質(「死滅C2c1すなわちdC2c1)」に変換される。核酸結合タンパク質に変換されると、C2c1は他の機能成分を局在化して配列依存的に核酸を標的にするのに有用となる。成分は天然でも合成でもよい。本発明によれば、dC2c1は、(i)エフェクターモジュールを特定の核酸に運搬し、機能または転写を調節し、これは、合成調節回路の大規模なスクリーニング、構築および他の目的に使用できる;(ii)特定の核酸に蛍光タグを付けて、それらの輸送および/または局在化を視覚化する;(iii)特定の細胞内区画に親和性を持つドメインを介して核酸の局在を改変する;かつ(iv)特定の核酸を捕捉して(dC2c2の直接プルダウン、またはdC2c2を用いるビオチンリガーゼ活性の局在化により)、RNAやタンパク質などの近位分子パートナーを富化する、のに使用される。dC2c1は、i)細胞の成分を組織化し、ii)細胞の成分または活動を作動または休止させ、かつ、iii)細胞内に存在する特定の転写産物の存在または量に基づいて細胞の状態を制御するのに使用できる。典型的な実施態様では、本発明は、分割酵素およびレポーター分子を提供し、その一部は核酸結合CRISPRエフェクター(C2c1などであるがこれらに限定されない)を含むハイブリッド分子内に提供される。細胞内の核酸の存在下で近接させると、分割レポーターまたは酵素の活性が再構成され、次に活性を測定することができる。そのような方法で再構成された分割酵素は、細胞成分および/または経路(内因性成分もしくは経路または外因性成分もしくは経路を含むがこれらに限定されない)に検出可能に作用することができる。そのような方法で再構成された分割レポーターは、検出可能なシグナル(蛍光または他の検出可能な部分などであるがこれらに限定されない)を提供することができる。特定の実施態様では、再構成されたときに1つ以上の成分(内因性または外因性)に検出可能な方法で作用する分割タンパク質分解酵素が提供される。典型的な一実施態様では、細胞内の核酸種の検出時にプログラムされた細胞死を誘導する方法が提供される。例えば、細胞内のウイルスの存在に基づいて、そのような方法を使用して細胞の集団を切除することができる方法は明らかである。
本発明によれば、関心のある核酸を含む細胞内に細胞死を誘導する方法が提供される。この方法は、細胞内の核酸を、細胞死を誘導することができるタンパク質分解酵素の第1の不活性部分に連結された第1のCRIPSRタンパク質、タンパク質の第1の部分と相補的部分が接触したときにタンパク質分解酵素の酵素活性が再構成される酵素の相補的部分に連結された第2のCRISPRタンパク質、および第1のCRISPRタンパク質に結合して核酸の第1の標的配列にハイブリダイズする第1のガイド、および第2のCRISPRタンパク質に結合して核酸の第2の標的配列にハイブリダイズする第2のガイドを含む組成物と接触させることを含む。関心のある標的核酸が存在する場合、タンパク質分解酵素の第1および第2の部分が接触し、酵素のタンパク質分解活性が再構成され、細胞死を誘導する。本発明のそのような一実施態様では、タンパク質分解酵素はカスパーゼである。別のそのような実施態様では、タンパク質分解酵素は、TEVプロテアーゼであり、ここで、TEVプロテアーゼのタンパク質分解活性が再構成されるとき、TEVプロテアーゼ基質は、切断および/または活性化される。本発明の一実施態様では、TEVプロテアーゼ基質は、TEVプロテアーゼが再構成されるとき、プロカスパーゼが切断されて活性化され、それによってアポトーシスが起こるように操作されたプロカスパーゼである。本発明の一実施態様では、タンパク質分解的に切断可能な転写因子を、選択した任意の下流レポーター遺伝子と組み合わせて、「転写共役」レポーターシステムを生成することができる。一実施態様では、分割プロテアーゼを使用して、検出可能な基質からデグロンを切断または露出させる。
本発明によれば、関心のある核酸を含む細胞をマーキングまたは同定する方法が提供され、この方法は、細胞内の核酸を、タンパク質分解酵素の不活性な第1の部分に連結された第1のCRIPSRタンパク質、酵素の相補的部分に連結された第2のCRISPRタンパク質(タンパク質の第1の部分と相補的部分が接触するとタンパク質分解酵素の酵素活性が再構成される)、第1のガイドCRISPRタンパク質に結合し、核酸の第1の標的配列にハイブリダイズする第1のガイド、第2のCRISPRタンパク質に結合し、核酸の第2の標的配列にハイブリダイズする第2のガイド、および再構成されたタンパク質分解酵素によって検出可能に切断される指示薬を含む組成物と接触させることを含む。関心のある核酸が細胞内に存在する場合、タンパク質分解酵素の第1の部分と第2の部分が接触し、それによってタンパク質分解酵素の活性が再構成され、指示薬が検出可能に切断される。そのような一実施態様では、検出可能な指示薬は、緑色蛍光タンパク質などの蛍光タンパク質であるがこれに限定されない。本発明の別のそのような実施態様では、検出可能な指示薬は、ルシフェラーゼなどの発光タンパク質であるがそれに限定されない。一実施態様では、分割レポーターは、Renilla reniformisルシフェラーゼ (Rluc)の分割断片の再構成に基づいている。本発明の一実施態様では、分割レポーターは、黄色蛍光タンパク質 (YFP)の2つの非蛍光断片間の相補性に基づく。
転写と調節
一側面では、本発明は、細胞または組織中の特定の核酸の存在または水準に基づいて、細胞または組織の状態を識別、測定、および/または調節する方法を提供する。一実施態様では、本発明は選択された目的核酸種の存在に基づいて、細胞システムまたは成分の存在および/または活性を調節するように設計されたCRISPRに基づく制御システムを提供するが、この制御システムは天然または合成システムあるいは合成成分でもよい。一般に、制御システムは、選択された目的核酸種が存在する場合に再構成される不活性化されたタンパク質、酵素、または活性を特徴とする。本発明の一実施態様では、不活性化されたタンパク質、酵素、または活性を再構成することは、不活性な成分をまとめて活性複合体に組み立てることを含む。
分割アポトーシス構築物
特定の細胞型の役割を研究するための基本的な生物学的用途、または癌もしくは感染細胞クリアランスなどの治療的用途のいずれかのために、異常な内因性または外来DNAの存在に基づいて細胞を枯渇または死滅させることがしばしば望ましい(Baker, D.J., Childs, B.G., Durik, M., Wijers, M.E., Sieben, C.J., Zhong, J., Saltness, R.A., Jeganathan, K.B., Verzosa, G.C., Pezeshki, A., et al. (2016), Naturally occurring p16(Ink4a)-positive cells shorten healthy lifespan(天然起源のp16(Ink4a) 陽性細胞は健康寿命を短くする. Nature 530, 184-189)。この標的細胞死は、分割したアポトーシスドメインをC2c1タンパク質に融合することによって達成され、C2c1タンパク質は、DNAに結合すると再構成され、標的遺伝子または数組の遺伝子を特異的に発現する細胞死につながる。特定の実施態様では、アポトーシスドメインは、分割カスパーゼ3であってもよい(Chelur, D.S., and Chalfie, M. (2007). Targeted cell killing by reconstituted caspases(再構成カスパーゼによる標的細胞死). Proc. Natl. Acad. Sci. U. S. A. 104, 2283-2288.)。他の可能性は、C2c1結合を介して近接している2つのカスパーゼ8(Pajvani, U.B., Trujillo, M.E., Combs, T.P., Iyengar, P., Jelicks, L., Roth, K.A., Kitsis, R.N., and Scherer, P.E. (2005). Fat apoptosis through targeted activation of caspase 8: a new mouse model of inducible and reversible lipoatrophy(カスパーゼ8の標的活性化による脂肪アポトーシス:誘導性および可逆性脂肪萎縮症の新しいマウスモデル). Nat. Med. 11, 797-803.)またはカスパーゼ9(Straathof, K.C., Pule, M.A., Yotnda, P., Dotti, G., Vanin, E.F., Brenner, M.K., Heslop, H.E., Spencer, D.M., and Rooney, C.M. (2005). An inducible caspase 9 safety switch for T-cell therapy(T細胞療法用の誘導性カスパーゼ9安全スイッチ). Blood 105, 4247-4254.)エフェクターのようなカスパーゼの会合体である。転写産物へのC2c1結合を介して分割TEVを再構成することも可能である(Gray, D.C., Mahrus, S., and Wells, J.A. (2010). Activation of specific apoptotic caspases with an engineered small-molecule-activated protease(遺伝子操作された小分子活性化プロテアーゼを用いる特定のアポトーシスカスパーゼの活性化). Cell 142, 637-646.)。この分割TEVは、発光および蛍光の読み取り(Wehr, M.C., Laage, R., Bolz, U., Fischer, T.M., Grunewald, S., Scheek, S., Bach, A., Nave, K.-A., and Rossner, M.J. (2006). Monitoring regulated protein-protein interactions using split TEV(分割TEVを用いた調節されたタンパク質間相互作用のモニタリング). Nat. Methods 3, 985-993.)を含むさまざまな読み取りに使用できる。一実施態様は、改変されたプロカスパーゼ3またはプロカスパーゼ7を切断するためのこの分割TEVの再構成(Gray, D.C., Mahrus, S., and Wells, J.A. (2010). Activation of specific apoptotic caspases with an engineered small-molecule-activated protease(遺伝子操作された小分子活性化プロテアーゼを用いる特定のアポトーシスカスパーゼの活性化). Cell 142, 637-646)を含み、細胞死に至る。
誘導性アポトーシス。本発明によれば、ガイドを使用してアポトーシスを誘導するための機能的ドメインを有するC2c1複合体を見つけることができる。C2c1は任意の相同分子種でよい。一実施態様では、機能ドメインは、タンパク質のC末端で融合されている。C2c1は、例えばヌクレアーゼ活性をノックアウトする変異を介して触媒的に不活性である。システムの適応性は、様々なカスパーゼ活性化方法を採用し、標的核酸に沿ったガイド間隔を最適化することで実証できる。カスパーゼ8およびカスパーゼ9(別名「イニシエーター」カスパーゼ)活性は、C2c1複合体形成により誘導され、C2c1に会合したカスパーゼ8またはカスパーゼ9酵素をまとめることができる。あるいは、カスパーゼ3およびカスパーゼ7(別名「エフェクター」カスパーゼ)活性は、タバコエッチングウイルス (TEV)のN末端およびC末端部分(「スニッパー」)を持つC2c1複合体が近くに維持されるときに誘導され、TEVプロテアーゼを活性化し、かつカスパーゼ3またはカスパーゼ7プロタンパク質の切断と活性化につながる。このシステムは、標的核酸に結合したC2c1複合体への結合によるカスパーゼ3部分のヘテロ二量体化を伴う分割カスパーゼ3を採用することができる。典型的なアポトーシス成分を、以下の表3に記載する。
Figure 2024138266000015
Figure 2024138266000016
Figure 2024138266000017
分割-検出構築物
本発明のシステムは、細胞または組織に存在し得る目的転写物上の連結された酵素部分を有するCRISPRタンパク質を局在化するためのガイドをさらに含む。従って、このシステムは、第1のCRISPRタンパク質に結合して関心のある転写物にハイブリダイズする第1のガイドと、第2のCCRISPRタンパク質に結合して関心のある核酸にハイブリダイズする第2のガイドとを含む。ほとんどの実施態様では、第1および第2のガイドは、隣接する位置で関心のある核酸にハイブリダイズすることが好ましい。その位置は直接隣り合うかあるいはいくつかのヌクレオチド、例えば1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、6ヌクレオチド、7ヌクレオチド、8ヌクレオチド、9ヌクレオチド、10ヌクレオチド、11ヌクレオチド、または12ヌクレオチドまたはそれ以上だけ離れていてもよい。特定の実施態様では、第1および第2のガイドは、予想されるステムループによって核酸上で分離された位置に結合することができる。鎖状核酸に沿って分離されているが、核酸は、ガイド標的配列を近接させる二次構造をとることができる。
本発明の一実施態様では、タンパク質分解酵素はカスパーゼを含む。本発明の一実施態様では、タンパク質分解酵素は、限定されないが、カスパーゼ8またはカスパーゼ9などのイニシエーターカスパーゼを含む。イニシエーターカスパーゼは、一般に、モノマーとして不活性であり、ホモ二量体化時に活性を獲得する。本発明の一実施態様では、タンパク質分解酵素は、カスパーゼ3またはカスパーゼ7などであるがこれらに限定されないエフェクターカスパーゼを含む。このようなイニシエーターカスパーゼは、通常、断片に切断されるまで不活性である。切断されると、切断片は会合して活性酵素を形成する。典型的な一実施態様では、タンパク質分解酵素の第1の部分は、カスパーゼ3p12を含み、タンパク質分解酵素の相補的部分は、カスパーゼ3p17を含む。
本発明の一実施態様では、タンパク質分解酵素は特定のアミノ酸配列を標的とするように選択され、基質はそれに応じて選択または操作される。そのようなプロテアーゼの非限定的な例はタバコエッチウイルス (TEV)プロテアーゼである。従って、TEVプロテアーゼ(いくつかの実施態様で切断可能なように操作される)によって切断可能な基質は、プロテアーゼによって作用されるシステムの成分として機能する。一実施態様では、NEVプロテアーゼ基質は、プロカスパーゼおよび1つ以上のTEV切断部位を含む。プロカスパーゼは、例えば、再構成されたTEVプロテアーゼによって切断可能なように操作されたカスパーゼ3またはカスパーゼ7である。切断されると、プロカスパーゼフラグメントは自由に有効な確認を行うことができる。
本発明の一実施態様では、TEV基質は蛍光タンパク質およびTEV切断部位を含む。別の実施態様では、TEV基質は発光タンパク質およびTEV切断部位を含む。特定の実施態様では、TEV切断部位は基質タンパク質の蛍光または発光特性が切断時に失われるように、基質の切断を提供する。特定の実施態様では、蛍光または発光タンパク質は、例えば、TEVプロテアーゼが再構成されるときに切断される蛍光または発光を妨害する部分を付加することによって改変される。
本発明によれば、関心のある核酸を含む細胞内にタンパク質分解活性を提供する方法が提供され、これは、細胞内の核酸を、タンパク質分解酵素の不活性な第1の部分に連結された第1のCRIPSRタンパク質とタンパク質分解酵素の相補的部分に連結された第2のCRISPRタンパク質を含む組成物と接触させることを含む。タンパク質の第1の部分および相補的部分が接触するとタンパク質分解酵素の活性が再構成され、さらに第1のガイドは第1のCRISPRタンパク質に結合して核酸の第1の標的配列にハイブリダイズし、第2のガイドは第2のCRISPRタンパク質に結合して核酸の第2の標的配列にハイブリダイズする。関心のある標的核酸が存在する場合、タンパク質分解酵素の第1および第2の部分が接触し、酵素のタンパク質分解活性が再構成され、酵素の基質が切断される。
分割蛍光体構築物は、2つのC2c1タンパク質が転写物に結合する際の分割蛍光体の再構成を介した低ノイズ画像化に有用である。これらの分割タンパク質には、iSplit(Filonov, G.S., and Verkhusha, V.V. (2013). A near-infrared BiFC reporter for in vivo imaging of protein-protein interactions(タンパク質間相互作用のin vivo画像化用の近赤外BiFCレポーター). Chem. Biol. 20, 1078-1086.)、分割ビーナス(Wu, B., Chen, J., and Singer, R.H. (2014). Background free imaging of single mRNAs in live cells using split fluorescent proteins(分割蛍光タンパク質を用いた生細胞内の単一mRNAのノイズのない画像化). Sci. Rep. 4, 3615.)、および分割超肯定的GFP GFP (Blakeley, B.D., Chapman, A.M., and McNaughton, B.R. (2012). Split-superpositive GFP reassembly is a fast, efficient, and robust method for detecting protein-protein interactions in vivo(スプリット超肯定的GFP再構成は、in vivoでのタンパク質間相互作用を検出するための高速、効率的かつ堅牢な方法である). Mol. Biosyst. 8, 2036-2040.)を含む。このようなタンパク質を以下の表4に示す。
Figure 2024138266000018
dCasによる標的富化
特定の例示的な実施態様では、標的RNAまたはDNAは、標的RNAまたはDNAの検出または増幅の前に、最初に富化されてもよい。特定の例示的な実施態様では、この富化は、CRISPRエフェクターシステムによる標的核酸の結合によって達成されてもよい。
現在の標的特異的富化プロトコルは、プローブとのハイブリダイゼーションの前に一本鎖核酸を必要とする。様々な利点の中で、本実施態様は、この工程を飛ばして、二本鎖DNA(部分的または完全に二本鎖のいずれか)に直接標的化することができる。さらに、本明細書に開示される実施態様は、等温富化を可能にするより高い反応速度とより容易な作業手順を提供する酵素駆動型標的化方法である。特定の例示的な実施態様では、富化は、20~37℃という低い温度で起こり得る。特定の例示的な実施態様では、異なる標的核酸に対する一組のガイドRNAを検定で使用し、複数の標的および/または単一の標的の複数の変異体の検出ができる。
特定の例示的な実施態様では、死滅CRISPRエフェクタータンパク質は、溶液中の標的核酸に結合し、その後、前記溶液から単離されてもよい。例えば、標的核酸に結合した死滅CRISPRエフェクタータンパク質は、死滅CRISPRエフェクタータンパク質に特異的に結合する抗体またはアプタマーなどの他の分子を使用して、溶液から単離される。
他の例示的な実施態様では、死滅CRISPRエフェクタータンパク質は、固体基質に結合していてもよい。固定基質は、ポリペプチドまたはポリヌクレオチドの付着に適切であるか、または適切であるように改変することができる任意の材料であればよい。可能な基質には、ガラスおよび変性官能化ガラス、プラスチック(アクリル、ポリスチレン、およびスチレンと他の材料の共重合体、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、TeflonTMなどを含む)、多糖類、ナイロンまたはニトロセルロース、セラミック、樹脂、シリカまたはシリコンおよび変性シリコンを含むシリカ系材料、炭素、金属、無機ガラス、プラスチック、光ファイバ束、およびその他のさまざまなポリマーが含まれるが、これらに限定されない。実施態様によっては、固体支持体は、秩序だったパターンで分子を固定化するのに適したパターン化された表面を意味する。特定の実施態様では、パターン化された表面は、固体支持体の露出層の中または上の異なる領域の配置を意味する。実施態様によっては、固体支持体は、表面のウェルまたはくぼみの配列を含む。固体支持体の組成と形状は、その用途によって異なる。実施態様によっては、固体支持体は、スライド、チップ、マイクロチップ、および/またはそれらを配列したものなどの平面構造である。従って、基質の表面は、平面層の形態である。実施態様によっては、固体支持体は、フローセルの1つ以上の表面を含む。本明細書で使用される「フローセル」という用語は、1種以上の流体試薬が流れることができる固体表面を含む小室を意味する。本開示の方法で容易に使用することができる例示的なフローセルおよび関連する流体システムおよび検出プラットフォームは、例えば、Bentley et al. Nature 456:53-59 (2008), WO04/0918497, U.S. 7,057,026; WO91/06678; WO07/123744; US 7,329,492; US 7,211,414; US 7,315,019; U.S. 7,405,281, およびUS 2008/0108082に記載されている。実施態様によっては、固体支持体またはその表面は、管または容器の内面または外面などの非平面である。実施態様によっては、固体支持体は、微小球またはビーズを含む。「微小球」、「ビーズ」、「粒子」は、固体基質の文脈内で、プラスチック、セラミック、ガラス、およびポリスチレンを含むがこれらに限定されない様々な材料で作られた小さな離散粒子を意味することを意図する。特定の実施態様では、微小球は、磁性微小球またはビーズである。その代わりまたはそれに加えて、ビーズは多孔性であってもよい。ビーズのサイズはナノメートル例えば100 nmからミリメートル例えば1 mmの範囲にある。
次に、標的核酸を含む、または含むと思われる試料を基質に曝露して、標的核酸を結合した死滅CRISPRエフェクタータンパク質に結合することができる。次に、非標的分子を洗い流してもよい。特定の例示的な実施態様では、標的核酸は、本明細書に開示される方法を用いるさらなる検出のために、CRISPRエフェクタータンパク質/ガイドRNA複合体から解放されてもよい。特定の例示的な実施態様では、標的核酸は、本明細書に記載されるように最初に増幅されてもよい。
特定の例示的な実施態様では、CRISPRエフェクターは、結合タグで標識されてもよい。特定の例示的な実施態様では、CRISPRエフェクターは、化学的にタグ付けされる。例えば、CRISPRエフェクターは化学的にビオチン化されている可能性がある。別の例示的な実施態様では、融合は、融合をコードする追加の配列をCRISPRエフェクターに追加することで作成される。このような融合の一例は、AviTagTMである。これは、ユニークな15アミノ酸のペプチドタグ上に単一のビオチンの高度に標的化された酵素的結合を採用している。特定の実施態様では、CRISPRエフェクターは、GST、Myc、血球凝集素 (HA)、緑色蛍光タンパク質 (GFP)、フラグ、Hisタグ、TAPタグ、およびFcタグなどであるがこれらに限定されない捕捉タグで標識される。結合タグは、融合タグ、化学タグ、捕獲タグのいずれであっても、標的核酸に結合した後、CRISPRエフェクターシステムをプルダウンするか、CRISPRエフェクターシステムを固体基質に固定するのに使用できる。
特定の例示的な実施態様では、ガイドRNAは、結合タグで標識されてもよい。特定の例示的な実施態様では、ガイドRNA全体は、ビオチン化ウラシルなどの1つ以上のビオチン化ヌクレオチドを組み込んだin vitro転写 (IVT)を用いて標識される。実施態様によっては、ビオチンは、ガイドRNAの3’末端への1つ以上のビオチン基の付加など、ガイドRNAに化学的または酵素的に付加される。結合タグは、例えば、ガイドRNA/標的核酸をストレプトアビジン被覆された固体基質に曝露することで、結合が起こった後にガイドRNA/標的核酸複合体をプルダウンするために使用される。
切り詰め
特定の例示的な実施態様では、Cas12タンパク質は切り詰められてもよい。特定の例示的な実施態様では、切り詰められた型は、不活性化または死滅Cas12タンパク質である。 Cas12タンパク質は、N末端、C末端、またはその両方で改変されている可能性がある。例示的な一実施態様では、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150個のアミノ酸が、N末端、C末端、またはそれらの組み合わせから除去される。別の例示的な実施態様では、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150個のアミノ酸がC末端から除去される。特定の例示的な実施態様では、1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、1~100、1~110、1~120、1~130、1~140、1~150、1~160、1~170、1~180、1~190、1~200、1~220、1~230、1~240、1~250、200~250、100~200、110~200、120~200、130~200、140~200、150~200、160~200、170~200、180~200、190~200、10~100、20~100、30~100、40~100、50~100、60~100、70~100、80~100、90~100、または150~250個のアミノ酸が、N末端、C末端、またはそれらの組み合わせから除去される。特定の例示的実施態様では、アミノ酸位置は、BhCas12bの位置またはそれに対応する相同分子種のアミノ酸である。特定の例示的な実施態様では、切り詰めは、ヌクレオチドデアミナーゼに融合または他の方法で付着され、以下により詳細に開示される塩基編集の実施態様で使用される。
塩基編集
特定の例示的な実施態様では、Cas12b、例えば、dCas12bは、塩基編集の目的で、アデノシンデアミナーゼまたはシチジンデアミナーゼと融合される。
アデノシンデアミナーゼ
本明細書で使用される用語「アデノシンデアミナーゼ」または「アデノシンデアミナーゼタンパク質」は、タンパク質、ポリペプチド、または、以下に示すように、アデニン(または分子のアデニン部分)をヒポキサンチン(または分子のヒポキサンチン部分)に転換する加水分解性脱アミノ化反応を触媒することができるタンパク質もしくはポリペプチドの1つ以上の機能ドメインを意味する。実施態様によっては、アデニン含有分子はアデノシン (A)であり、ヒポキサンチン含有分子はイノシン (I)である。アデニン含有分子は、デオキシリボ核酸(DNA)またはリボ核酸 (RNA)であってもよい。
本開示によれば、本開示に関連して使用することができるアデノシンデアミナーゼには、RNA (ADAR)に作用するアデノシンデアミナーゼとして知られる酵素ファミリーのメンバー、tRNA (ADAT)に作用するアデノシンデアミナーゼとして知られるファミリーのメンバー、およびその他のアデノシンデアミナーゼドメイン含有(ADAD)ファミリーのメンバー、が含まれるが、これらに限定されない。実際、Zheng et al. (Nucleic Acids Res. 2017, 45(6): 3369-3377)は、ADARがRNA/DNAおよびRNA/RNA二重鎖でアデノシンからイノシンへの編集反応を実行できることを示している。特定の実施態様では、アデノシンデアミナーゼは、本明細書で以下に詳述するように、RNA二重鎖のRNA/DNAヘテロ二本鎖のDNAを編集するその能力を高めるように改変されている。
実施態様によっては、アデノシンデアミナーゼは、哺乳動物、鳥、カエル、イカ、魚、ハエ、および虫を含むがこれらに限定されない、1つ以上の後生動物種に由来する。実施態様によっては、アデノシンデアミナーゼは、ヒト、イカ、またはショウジョウバエのアデノシンデアミナーゼである。
実施態様によっては、アデノシンデアミナーゼは、hADAR1、hADAR2、hADAR3を含むヒトADARである。実施態様によっては、アデノシンデアミナーゼは、ADR-1およびADR-2を含むカエノラブディティス・エレガンス(Caenorhabditis elegans)のADARタンパク質である。実施態様によっては、アデノシンデアミナーゼは、dAdarを含むショウジョウバエのADARタンパク質である。実施態様によっては、アデノシンデアミナーゼは、イカのロリゴペアリ(Loligo pealeii)のADARタンパク質であり、sqADAR2aおよびsqADAR2bを含む。実施態様によっては、アデノシンデアミナーゼは、ヒトADATタンパク質である。実施態様によっては、アデノシンデアミナーゼは、ショウジョウバエのADATタンパク質である。実施態様によっては、アデノシンデアミナーゼは、TENR (hADAD1)およびTENRL (hADAD2)を含むヒトADADタンパク質である。
実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAなどのTadAタンパク質である。Kim et al., Biochemistry 45:6407-6416 (2006); Wolf et al., EMBO J. 21:3841-3851 (2002)を参照。実施態様によっては、アデノシンデアミナーゼは、マウスADAである。Grunebaum et al., Curr. Opin. Allergy Clin. Immunol. 13:630-638 (2013)を参照。実施態様によっては、アデノシンデアミナーゼは、ヒトADAT2である。Fukui et al., J. Nucleic Acids 2010:260512 (2010)を参照。実施態様によっては、デアミナーゼ(例えば、アデノシンまたはシチジンデアミナーゼ)は、Cox et al., Science. 2017, November 24; 358(6366): 1019-1027; Komore et al., Nature. 2016 May 19;533(7603):420-4; およびGaudelli et al., Nature. 2017 Nov 23;551(7681):464-471に記載されているもののうちの1種以上である。
実施態様によっては、アデノシンデアミナーゼタンパク質は、二本鎖核酸基質中の1つ以上の標的アデノシン残基を認識し、イノシン残基に変換する。実施態様によっては、二本鎖核酸基質は、RNA-DNAハイブリッド二本鎖である。実施態様によっては、アデノシンデアミナーゼタンパク質は、二本鎖基質上の結合ウィンドウを認識する。実施態様によっては、結合ウィンドウは、少なくとも1つの標的アデノシン残基を含む。実施態様によっては、結合ウィンドウは、約3塩基対から約100塩基対の範囲にある。実施態様によっては、結合ウィンドウは、約5塩基対から約50塩基対の範囲にある。実施態様によっては、結合ウィンドウは、約10塩基対から約30塩基対の範囲にある。実施態様によっては、結合ウィンドウは、約1塩基対、2塩基対、3塩基対、5塩基対、7塩基対、10塩基対、15塩基対、20塩基対、25塩基対、30塩基対、40塩基対、45塩基対、50塩基対、55塩基対、60塩基対、65塩基対、70塩基対、75塩基対、80塩基対、85塩基対、90塩基対、95塩基対、または100塩基対である。
実施態様によっては、アデノシンデアミナーゼタンパク質は、1つ以上のデアミナーゼドメインを含む。特定の理論に拘束されることを意図するものではないが、デアミナーゼドメインは、二本鎖核酸基質に含まれる1つ以上の標的アデノシン(A)残基を認識してイノシン (I)残基に変換するように機能すると考えられる。実施態様によっては、デアミナーゼドメインは、活性中心を含む。実施態様によっては、活性中心は亜鉛イオンを含む。実施態様によっては、AからIへの編集プロセス中に、標的アデノシン残基での塩基対形成が破壊され、標的アデノシン残基が二重らせんから「反転」して、アデノシンデアミナーゼによりアクセス可能になる。実施態様によっては、活性中心内またはその近傍のアミノ酸残基は標的アデノシン残基の5'側の1つ以上のヌクレオチドと相互作用する。実施態様によっては、活性中心内またはその近傍のアミノ酸残基は標的アデノシン残基の3’側の1つ以上のヌクレオチドと相互作用する。実施態様によっては、活性中心内またはその近傍のアミノ酸残基は反対側の鎖上の標的アデノシン残基に相補的なヌクレオチドとさらに相互作用する。実施態様によっては、アミノ酸残基はヌクレオチドの2’ヒドロキシル基と水素結合を形成する。
実施態様によっては、アデノシンデアミナーゼは、ヒトADAR2完全タンパク質 (hADAR2)またはそのデアミナーゼドメイン (hADAR2-D)を含む。実施態様によっては、アデノシンデアミナーゼは、hADAR2またはhADAR2-Dに相同であるADARファミリーメンバーである
特に、実施態様によっては、相同ADARタンパク質は、ヒトADAR1 (hADAR1)またはそのデアミナーゼドメイン(hADAR1-D)である。実施態様によっては、hADAR1-Dのグリシン1007は、グリシン487 hADAR2-Dに対応し、hADAR1-Dのグルタミン酸1008は、hADAR2-Dのグルタミン酸488に対応する。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dの野生型アミノ酸配列を含む。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dの編集効率、および/または基質編集優先度が特定の必要性に従って変更されるように、hADAR2-D配列中に1つ以上の変異を含む。
hADAR1およびhADAR2タンパク質の特定の変異は、Kuttan et al., Proc Natl Acad Sci U S A. (2012) 109(48):E3295-304、Want et al. ACS Chem Biol. (2015) 10(11):2512-9、およびZheng et al. Nucleic Acids Res. (2017) 45(6):3369-337に記載されており、それぞれは、参照によりその全体が本明細書に組み込まれる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のグリシン336または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置336のグリシン残基はアスパラギン酸残基(G336D)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のグリシン487または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置487のグリシン残基は比較的小さな側鎖を有する非極性アミノ酸残基で置換されている。例えば、実施態様によっては、位置487のグリシン残基はアラニン残基(G487A)で置換されている。実施態様によっては、位置487のグリシン残基はバリン残基(G487V)で置換されている。実施態様によっては、位置487のグリシン残基は比較的大きな側鎖を有するアミノ酸残基で置換されている。実施態様によっては、位置487のグリシン残基はアルギニン残基(G487R)で置換されている。実施態様によっては、位置487のグリシン残基はリジン残基(G487K)で置換されている。実施態様によっては、位置487のグリシン残基はトリプトファン残基(G487W)で置換されている。実施態様によっては、位置487のグリシン残基はチロシン残基(G487Y)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のグルタミン酸488または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置488のグルタミン酸残基はグルタミン残基(E488Q)で置換されている。実施態様によっては、位置488のグルタミン酸残基はヒスチジン残基(E488H)で置換されている。実施態様によっては、位置488のグルタミン酸残基はアルギニン残基(E488R)で置換されている。実施態様によっては、位置488のグルタミン酸残基はリジン残基(E488K)で置換されている。実施態様によっては、位置488のグルタミン酸残基はアスパラギン残基(E488N)で置換されている。実施態様によっては、位置488のグルタミン酸残基はアラニン残基(E488A)で置換されている。実施態様によっては、位置488のグルタミン酸残基はメチオニン残基(E488M)で置換されている。実施態様によっては、位置488のグルタミン酸残基はセリン残基(E488S)で置換されている。実施態様によっては、位置488のグルタミン酸残基はフェニルアラニン残基(E488F)で置換されている。実施態様によっては、位置488のグルタミン酸残基はリジン残基(E488L)で置換されている。実施態様によっては、位置488のグルタミン酸残基はトリプトファン残基(E488W)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のスレオニン490または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置490のスレオニン残基はシステイン残基(T490C)で置換されている。実施態様によっては、位置490のスレオニン残基はセリン残基(T490S)で置換されている。実施態様によっては、位置490のスレオニン残基はアラニン残基(T490A)で置換されている。実施態様によっては、位置490のスレオニン残基はフェニルアラニン残基(T490F)で置換されている。実施態様によっては、位置490のスレオニン残基はチロシン残基(T490Y)で置換されている。実施態様によっては、位置490のスレオニン残基はセリン残基(T490R)で置換されている。実施態様によっては、位置490のスレオニン残基はアラニン残基(T490K)で置換されている。実施態様によっては、位置490のスレオニン残基はフェニルアラニン残基(T490P)で置換されている。実施態様によっては、位置490のスレオニン残基はチロシン残基(T490E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のバリン493または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置493のバリン残基はアラニン残基(V493A)で置換されている。実施態様によっては、位置493のバリン残基はセリン残基(V493S)で置換されている。実施態様によっては、位置493のバリン残基はスレオニン残基(V493T)で置換されている。実施態様によっては、位置493のバリン残基はアルギニン残基(V493R)で置換されている。実施態様によっては、位置493のバリン残基はアスパラギン酸残基(V493D)で置換されている。実施態様によっては、位置493のバリン残基はプロリン残基(V493P)で置換されている。実施態様によっては、位置493のバリン残基はグリシン残基(V493G)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアラニン589または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置589のアラニン残基はバリン残基(A589V)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアスパラギン597または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置597のアスパラギン残基はリジン残基(N597K)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置597に変異を含む。実施態様によっては、位置597のアスパラギン残基はアルギニン残基(N597R)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置597に変異を含む。実施態様によっては、位置597のアスパラギン残基はアラニン残基(N597A)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置597に変異を含む。実施態様によっては、位置597のアスパラギン残基はグルタミン酸残基(N597E)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置597に変異を含む。実施態様によっては、位置597のアスパラギン残基はヒスチジン残基(N597H)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置597に変異を含む。実施態様によっては、位置597のアスパラギン残基はグリシン残基(N597G)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置597に変異を含む。実施態様によっては、位置597のアスパラギン残基はチロシン残基(N597Y)で置換されている。実施態様によっては位置597のアスパラギン残基はフェニルアラニン残基(N597F)で置換されている。実施態様によっては、アデノシンデアミナーゼは変異N597Iを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Lを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Vを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Mを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Cを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Pを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Tを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Sを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Wを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Qを含む。実施態様によっては、アデノシンデアミナーゼは変異N597Dを含む。特定の例示的な実施態様では、上記のN597での変異はE488Qバックグラウンドの状況でさらに行われる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のセリン599または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置599のセリン残基はスレオニン残基(S599T)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアスパラギン613または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置613のアスパラギン残基はリジン残基(N613K)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置613に変異を含む。実施態様によっては、位置613のアスパラギン残基はアルギニン残基(N613R)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置613に変異を含む。実施態様によっては、位置613のアスパラギン残基はアラニン残基(N613A)で置換されている。実施態様によっては、アデノシンデアミナーゼは野生型配列にアスパラギン残基を有するアミノ酸配列の位置613に変異を含む。実施態様によっては、位置613のアスパラギン残基はグルタミン酸残基(N613E)で置換されている。実施態様によっては、アデノシンデアミナーゼは変異N613Iを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Lを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Vを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Fを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Mを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Cを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異N613Pを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Tを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Sを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Yを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Wを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Qを含む。実施態様によっては、アデノシンデアミナーゼは変異N613Hを含む。実施態様によっては、アデノシンデアミナーゼは、変異N613Dを含む。いくつかの実施態様では、上記のN613での変異は、E488Q変異と組み合わせてさらに作られる。
実施態様によっては、編集効率を改善するために、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異、すなわちG336D、G487A、G487V、E488Q、E488H、E488R、E488N、E488A、E488S、E488M、T490C、T490S、V493T、V493S、V493A、V493R、V493D、V493P、V493G、N597K、N597R、N597A、N597E、N597H、N597G、N597Y、A589V、S599T、N613K、N613R、N613A、N613E、および上記に対応する相同ADARタンパク質の変異のうちの1つ以上を含んでもよい。
実施態様によっては、編集効率を下げるために、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異、すなわちE488F、E488L、E488W、T490A、T490F、T490Y、T490R、T490K、T490P、T490E、N597F、および上記に対応する相同ADARタンパク質の変異のうちの1つ以上を含んでもよい。特定の実施態様では、低効力のアデノシンデアミナーゼ酵素を用いて非特異的効果を低減することが興味深い場合がある。
実施態様によっては、非特異的効果を低減するために、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異、すなわちR348、V351、T375、K376、E396、C451、R455、N473、R474、K475、R477、R481、S486、E488、T490、S495、R510、および上記に対応する相同ADARタンパク質の変異のうちの1つ以上を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、変異E488、ならびにR348、V351、T375、K376、E396、C451、R455、N473、R474、K475、R477、R481、S486、T490、S495、R510から選択される1つ以上のさらなる位置での変異を含む。実施態様によっては、アデノシンデアミナーゼは、T375での変異、および必要に応じて1つ以上のさらなる位置での変異を含む。実施態様によっては、アデノシンデアミナーゼは、N473での変異、および必要に応じて1つ以上のさらなる位置での変異を含む。実施態様によっては、アデノシンデアミナーゼは、V351での変異、ならびに必要に応じて1つ以上のさらなる位置での変異を含む。実施態様によっては、アデノシンデアミナーゼは、E488およびT375での変異、ならびに必要に応じて1つ以上のさらなる位置での変異を含む。実施態様によっては、アデノシンデアミナーゼは、E488およびN473、ならびに必要に応じて1つ以上のさらなる位置での変異を含む。いくつかの実施態様では、アデノシンデアミナーゼは、変異E488およびV351、ならびに必要に応じて1つ以上のさらなる位置での変異を含む。実施態様によっては、アデノシンデアミナーゼは、E488、ならびにT375、N473、およびV351のうちの1つ以上に変異を含む。
実施態様によっては、非特異的効果を低減するために、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づくR348E、V351L、T375G、T375S、R455G、R455S、R455E、N473D、R474E、K475Q、R477E、R481E、S486T、E488Q、T490A、T490S、S495T、およびR510Eから選択される変異、および上記に対応する相同ADARタンパク質の変異のうちの1つ以上を含む。実施態様によっては、アデノシンデアミナーゼは、変異E488Q、ならびにR348E、V351L、T375G、T375S、R455G、R455S、R455E、N473D、R474E、K475Q、R477E、R481E、S486T、T490A、T490S、S495TおよびR510Eから選択される1つ以上のさらなる変異を含む。実施態様によっては、アデノシンデアミナーゼは、変異T375GまたはT375S、および必要に応じて1つ以上のさらなる変異を含む。実施態様によっては、アデノシンデアミナーゼは、変異N473D、および必要に応じて1つ以上のさらなる変異を含む。実施態様によっては、アデノシンデアミナーゼは、変異V351L、および必要に応じて1つ以上のさらなる変異を含む。実施態様によっては、アデノシンデアミナーゼは、変異E488Q、およびT375GまたはT375G、ならびに必要に応じて1つ以上のさらなる変異を含む。実施態様によっては、アデノシンデアミナーゼは、変異E488QおよびN473D、ならびに必要に応じて1つ以上のさらなる変異を含む。実施態様によっては、アデノシンデアミナーゼは、変異E488QおよびV351L、ならびに必要に応じて1つ以上のさらなる変異を含む。実施態様によっては、アデノシンデアミナーゼは、変異E488Q、およびT375G/S、N473DおよびV351Lのうちの1つ以上を含む。
特定の例では、アデノシンデアミナーゼタンパク質またはその触媒ドメインは、hADAR2-Dアミノ酸配列のE488、好ましくはE488Q、または相同ADARタンパク質の対応する位置での変異を含むように改変されており、かつ/あるいはアデノシンデアミナーゼタンパク質またはその触媒ドメインは、hADAR2-Dアミノ酸配列のT375、好ましくはT375G、または相同ADARタンパク質の対応する位置での変異を含むように改変されている。特定の例では、アデノシンデアミナーゼタンパク質またはその触媒ドメインは、hADAR1dアミノ酸配列のE1008、好ましくはE1008Q、または相同ADARタンパク質の対応する位置での変異を含むように改変されている。
二本鎖RNAに結合したヒトADAR2デアミナーゼドメインの結晶構造から、改変部位の5’側でRNAに結合するタンパク質ループが明らかとなる。この5’結合ループは、ADARファミリーメンバー間の基質特異性の違いの1つの要因である。Wang et al., Nucleic Acids Res., 44(20):9872-9880 (2016)を参照、その内容は、参照によりその全体が本明細書に組み込まれる。さらに、ADAR2特異的RNA結合ループが酵素活性部位の近くに同定された。Mathews et al., Nat. Struct. Mol. Biol., 23(5):426-33 (2016)参照、その内容は、参照によりその全体が本明細書に組み込まれる。実施態様によっては、アデノシンデアミナーゼは、編集の特異性および/または効率を上げるために、RNA結合ループに1つ以上の変異を含む。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアラニン454、または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置454のアラニン残基はセリン残基(A454S)で置換されている。実施態様によっては、位置454のアラニン残基はシステイン残基(A454C)で置換されている。実施態様によっては、位置454のアラニン残基はアスパラギン酸残基(A454D)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアルギニン455、または相同ADAR質の対応する位置に変異を含む。実施態様によっては、位置455のアルギニン残基はアラニン残基(R455A)で置換されている。実施態様によっては、位置455のアルギニン残基はバリン残基(R455V)で置換されている。実施態様によっては、位置455のアルギニン残基はヒスチジン残基(R455H)で置換されている。実施態様によっては、位置455のアルギニン残基はグリシン残基(R455G)で置換されている。実施態様によっては、位置455のアルギニン残基はセリン残基(R455S)で置換されている。実施態様によっては、位置455のアルギニン残基はグルタミン酸残基(R455E)で置換されている。実施態様によっては、アデノシンデアミナーゼは、変異R455Cを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Iを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Kを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Mを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Nを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Qを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Fを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Wを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Pを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Yを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異R455Dを含む。実施態様によっては、上記のR455での変異は、E488Q変異と組み合わせてさらに作られる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のイソロイシン456、または相同ADAR質の対応する位置に変異を含む。実施態様によっては、位置456のイソロイシン残基はバリン残基(I456V)で置換されている。実施態様によっては、位置456のイソロイシン残基はロイシン残基(I456L)で置換されている。実施態様によっては、位置456のイソロイシン残基はアスパラギン酸残基(I456D)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のフェニルアラニン457、または相同ADAR質の対応する位置に変異を含む。実施態様によっては、位置457のフェニルアラニン残基はチロシン残基(F457Y)で置換されている。実施態様によっては、位置457のフェニルアラニン残基はアルギニン残基(F457R)で置換されている。実施態様によっては、位置457のフェニルアラニン残基はグルタミン酸残基(F457E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のセリン458または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置458のセリン残基はバリン残基(S458V)で置換されている。実施態様によっては、位置458のセリン残基はフェニルアラニン残基(S458F)で置換されている。実施態様によっては、位置458のセリン残基はプロリン残基(S458P)で置換されている。実施態様によっては、アデノシンデアミナーゼは変異S458Iを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Lを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Mを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Cを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Aを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Gを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Tを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Yを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Wを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Qを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Nを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Hを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Eを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Dを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Kを含む。実施態様によっては、アデノシンデアミナーゼは変異S458Rを含む。実施態様によっては、上記のS458での変異はE488Q変異と組み合わせてさらに行われる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のプロリン459または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置459のプロリン残基はシステイン残基(P459C)で置換されている。実施態様によっては、位置459のプロリン残基はヒスチジン残基(P459H)で置換されている。実施態様によっては、位置459のプロリン残基はトリプトファン残基(P459W)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のヒスチジン460または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置460のヒスチジン残基はアルギニン残基(H460R)で置換されている。実施態様によっては、位置460のヒスチジン残基はイソロイシン残基(H460I)で置換されている。実施態様によっては、位置460のヒスチジン残基はプロリン残基(H460P)で置換されている。実施態様によっては、アデノシンデアミナーゼは、変異H460Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Vを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Fを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Mを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Cを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Aを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Tを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Yを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Wを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Qを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Nを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異H460Kを含む。実施態様によっては、上記のH460での変異は、E488Q変異と組み合わせてさらに行われる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のプロリン462または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置462のプロリン残基はセリン残基(P462S)で置換されている。実施態様によっては、位置462のプロリン残基はトリプトファン残基(P462W)で置換されている。実施態様によっては、位置462のプロリン残基はグルタミン酸残基(P462E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアスパラギン酸469または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置469のアスパラギン酸残基はグルタミン残基(D469Q)で置換されている。実施態様によっては、位置469のアスパラギン酸残基はセリン残基(D469S)で置換されている。実施態様によっては、位置469のアスパラギン酸残基はチロシン残基(D469Y)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアルギニン470または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置470のアルギニン残基はアラニン残基(R470A)で置換されている。実施態様によっては、位置470のアルギニン残基はイソロイシン残基(R470I)で置換されている。実施態様によっては、位置470のアルギニン残基はアスパラギン酸残基(R470D)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のヒスチジン471または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置471のヒスチジン残基はリジン残基(H471K)で置換されている。実施態様によっては、位置471のヒスチジン残基はスレオニン残基(H471T)で置換されている。実施態様によっては、位置471のヒスチジン残基はバリン残基(H471V)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のプロリン472または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置472のプロリン残基はリジン残基(P472K)で置換されている。実施態様によっては、位置472のプロリン残基はスレオニン残基(P472T)で置換されている。実施態様によっては、位置472のプロリン残基はアスパラギン酸残基(P472D)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアスパラギン473または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置473のアスパラギン残基はアルギニン残基(N473R)で置換されている。実施態様によっては、位置473のアスパラギン残基はトリプトファン残基(N473W)で置換されている。実施態様によっては、位置473のアスパラギン残基はプロリン残基(N473P)で置換されている。実施態様によっては、位置473のアスパラギン残基はアスパラギン酸残基(N473D)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアルギニン474または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置474のアルギニン残基はリジン残基(R474K)で置換されている。実施態様によっては、位置474のアルギニン残基はグリシン残基(R474G)で置換されている。実施態様によっては、位置474のアルギニン残基はアスパラギン酸残基(R474D)で置換されている。実施態様によっては、位置474のアルギニン残基はグルタミン酸残基(R474E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のリジン475または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置475のリジン残基はグルタミン残基(K475Q)で置換されている。実施態様によっては、位置475のリジン残基はアスパラギン残基(K475N)で置換されている。実施態様によっては、位置475のリジン残基はアスパラギン酸残基(K475D)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアラニン476または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置476のアラニン残基はセリン残基(A476S)で置換されている。実施態様によっては、位置476のアラニン残基はアルギニン残基(A476R)で置換されている。実施態様によっては、位置476のアラニン残基はグルタミン酸残基(A476E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアルギニン477または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置477のアルギニン残基はリジン残基(R477K)で置換されている。実施態様によっては、位置477のアルギニン残基はスレオニン残基(R477T)で置換されている。実施態様によっては、位置477のアルギニン残基はフェニルアラニン残基(R477F)で置換されている。実施態様によっては、位置474のアルギニン残基はグルタミン酸残基(R477E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のグリシン478または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置478のグリシン残基はアラニン残基(G478A)で置換されている。実施態様によっては、位置478のグリシン残基はアルギニン残基(G478R)で置換されている。実施態様によっては、位置478のグリシン残基はチロシン残基(G478Y)で置換されている。実施態様によっては、アデノシンデアミナーゼは、変異G478Iを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Vを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Fを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Mを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Cを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Pを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Tを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Wを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Qを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Nを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Hを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478Kを含む。いくつかの実施態様では、上記のG478での変異は、E488Q変異と組み合わせてさらに行われる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のグルタミン479または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置479のグルタミン残基はアスパラギン残基(Q479N)で置換されている。実施態様によっては、位置479のグルタミン残基はセリン残基(Q479S)で置換されている。実施態様によっては、位置479のグルタミン残基はプロリン残基(Q479P)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のアルギニン348または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置348のアルギニン残基はアラニン残基(R348A)で置換されている。実施態様によっては、位置348のアルギニン残基はグルタミン酸残基(R348E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のバリン351または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置351のバリン残基はロイシン残基(V351L)で置換されている。実施態様によっては、アデノシンデアミナーゼは、変異V351Yを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Mを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Tを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Aを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Fを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Iを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Cを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Hを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Pを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Kを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Nを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Wを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Qを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異V351Rを含む。実施態様によっては、上記のV351での変異は、E488Q変異と組み合わせてさらに行われる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のスレオニン375または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置375のスレオニン残基はグリシン残基(T375G)で置換されている。実施態様によっては、位置375のスレオニン残基はセリン残基(T375S)で置換されている。実施態様によっては、アデノシンデアミナーゼは、変異T375Hを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Qを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Cを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Nを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Mを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Aを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Wを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Vを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Rを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Kを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Fを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Iを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Pを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375Yを含む。実施態様によっては、上記のT375Yでの変異は、E488Q変異と組み合わせてさらに行われる。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のArg481または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置481のアルギニン残基はグルタミン酸残基(R481E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のSer486または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置486のセリン残基はスレオニン残基(S486T)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のThr490または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置490のスレオニン残基はアラニン残基(T490A)で置換されている。実施態様によっては、位置490のスレオニン残基はセリン残基(T490S)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のSer495または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置495のセリン残基はスレオニン残基(S495T)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のArg510または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置510のアルギニン残基はグルタミン残基(R510Q)で置換されている。実施態様によっては、位置510のアルギニン残基はアラニン残基(R510A)で置換されている。実施態様によっては、位置510のアルギニン残基はグルタミン酸残基(R510E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のGly593または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置593のグリシン残基はアラニン残基(G593A)で置換されている。実施態様によっては、位置593のグリシン残基はグルタミン酸残基(G593E)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列のLys594または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置594のリジン残基はアラニン残基(K594A)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列の位置A454、R455、I456、F457、S458、P459、H460、P462、D469、R470、H471、P472、N473、R474、K475、A476、R477、G478、Q479、R348、R510、G593、K594、または相同ADARタンパク質の対応する位置のうちの任意の1つ以上の位置に変異を含む。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列の位置A454S、A454C、A454D、R455A、R455V、R455H、I456V、I456L、I456D、F457Y、F457R、F457E、S458V、S458F、S458P、P459C、P459H、P459W、H460R、H460I、H460P、P462S、P462W、P462E、D469Q、D469S、D469Y、R470A、R470I、R470D、H471K、H471T、H471V、P472K、P472T、P472D、N473R、N473W、N473P、R474K、R474G、R474D、K475Q、K475N、K475D、A476S、A476R、A476E、R477K、R477T、R477F、G478A、G478R、G478Y、Q479N、Q479S、Q479P、R348A、R510Q、R510A、G593A、G593E、K594A、または相同ADARタンパク質の対応する位置のうちの任意の1つ以上の位置に変異を含む。
特定の実施態様では、アデノシンデアミナーゼは、活性をシチジンデアミナーゼに変換するために変異される。従って、実施態様によっては、アデノシンデアミナーゼは、E396、C451、V351、R455、T375、K376、S486、Q488、R510、K594、R348、G593、S397、H443、L444、Y445、F442、E438、T448、A353、V355、T339、P539、T339、P539、V525、I520、P462およびN579から選択される位置に1つ以上の変異を含む。特定の実施態様では、アデノシンデアミナーゼは、V351、L444、V355、V525およびI520から選択される位置に1つ以上の変異を含む。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づくE488、V351、S486、T375、S370、P462、N597の変異、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。
実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Qおよび上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、および上記に対応するADARタンパク質相同体における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T、および上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。例によっては、本明細書で提供されるのは、変異アデノシンデアミナーゼ、例えば、死滅Cas12bタンパク質またはCas12ニッカーゼと融合したE488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661Tのうちの1つ以上の変異を含むアデノシンデアミナーゼである。特定の例では、本明細書で提供されるのは、変異アデノシンデアミナーゼ、例えば、死滅Cas12bタンパク質またはCas12ニッカーゼと融合したE488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、およびS661Tを含むアデノシンデアミナーゼである。
実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488の変異と組み合わせて、hADAR2-Dアミノ酸配列の位置T375、V351、G478、S458、H460のいずれか1つ以上の位置、または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488Qと組み合わせて、T375G、T375C、T375H、T375Q、V351M、V351T、V351Y、G478R、S458F、H460Iから選択される1つ以上の変異を含む。
実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488Qと組み合わせて、T375H、T375Q、V351M、V351Y、H460Pから選択される1つ以上の変異を含む。
実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488Qと組み合わせて、変異T375SおよびS458Fを含む。
実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488の変異と組み合わせて、hADAR2-Dアミノ酸配列の位置T375、N473、R474、G478、S458、P459、V351、R455、R455、T490、R348、Q479、または相同ADARタンパク質の対応する位置のうちの2つ以上の位置に変異を含む。実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488Qと組み合わせて、T375G、T375S、N473D、R474E、G478R、S458F、P459W、V351L、R455G、R455S、T490A、R348E、Q479Pから選択される2つ以上の変異を含む。
実施態様によっては、アデノシンデアミナーゼは、変異T375GおよびV351Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375GおよびR455Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375GおよびR455Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375GおよびT490Aを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375GおよびR348Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375SおよびV351Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375SおよびR455Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375SおよびR455Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375SおよびT490Aを含む。実施態様によっては、アデノシンデアミナーゼは、変異T375SおよびR348Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異N473DおよびV351Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異N473DおよびR455Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異N473DおよびR455Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異N473DおよびT490Aを含む。実施態様によっては、アデノシンデアミナーゼは、変異N473DおよびR348Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異R474EおよびV351Lを含む。実施態様によっては、アデノシンデアミナーゼは、変異R474EおよびR455Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異R474EおよびR455Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異R474EおよびT490Aを含む。実施態様によっては、アデノシンデアミナーゼは、変異R474EおよびR348Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異S458FおよびT375Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異S458FおよびT375Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異S458FおよびN473Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異S458FおよびR474Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異S458FおよびG478Rを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478RおよびT375Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478RおよびT375Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478RおよびN473Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異G478RおよびR474Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異P459WおよびT375Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異P459WおよびT375Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異P459WおよびN473Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異P459WおよびR474Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異P459WおよびG478Rを含む。実施態様によっては、アデノシンデアミナーゼは、変異P459WおよびS458Fを含む。実施態様によっては、アデノシンデアミナーゼは、変異Q479PおよびT375Gを含む。実施態様によっては、アデノシンデアミナーゼは、変異Q479PおよびT375Sを含む。実施態様によっては、アデノシンデアミナーゼは、変異Q479PおよびN473Dを含む。実施態様によっては、アデノシンデアミナーゼは、変異Q479PおよびR474Eを含む。実施態様によっては、アデノシンデアミナーゼは、変異Q479PおよびG478Rを含む。実施態様によっては、アデノシンデアミナーゼは、変異Q479PおよびS458Fを含む。実施態様によっては、アデノシンデアミナーゼは、変異Q479PおよびP459Wを含む。この段落で説明されているすべての変異は、E488Q変異と組み合わせてさらに行うこともできる。
実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488での変異と組み合わせて、hADAR2-Dアミノ酸配列の位置K475、Q479、P459、G478、S458のいずれか1つ以上の位置、または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488Qと組み合わせて、K475N、Q479N、P459W、G478R、S458P、S458Fから選択される1つ以上の変異を含む。
実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488での変異と組み合わせて、hADAR2-Dアミノ酸配列の位置T375、V351、R455、H460、A476のいずれか1つ以上の位置、または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、アデノシンデアミナーゼは、必要に応じてE488Qと組み合わせて、T375G、T375C、T375H、T375Q、V351M、V351T、V351Y、R455H、H460P、H460I、A476Eから選択される1つ以上の変異を含む。
特定の実施態様では、編集の改善および非特異的改変の低減は、gRNAの化学改変によって達成される。gRNAはVogel et al. (2014), Angew Chem Int Ed, 53:6267-6271, doi:10.1002/anie.201402634(参照によりその全体が本明細書に組み込まれる)に例示されているように化学的に改変されており、非特異的活性を低減するが特異的効率を改善する。2’-O-メチルおよびホスホチオエート改変ガイドRNAは、一般に細胞内の編集効率を向上させる。
ADARは、編集されたAのいずれかの側の隣接ヌクレオチドに対する優先度を示すことが知られている(www.nature.com/nsmb/journal/v23/n5/full/nsmb.3203.html, Matthews et al. (2017), Nature Structural Mol Biol, 23(5): 426-433、参照によりその全体が本明細書に組み込まれる)。従って、特定の実施態様では、gRNA、標的、および/またはADARは、モチーフの優先度に最適化されて選択される。
好ましくないモチーフの編集を可能にするための意図的な不一致がin vitroで実証されている(academic.oup.com/nar/article-lookup/doi/10.1093/nar/gku272; Schneider et al (2014), Nucleic Acid Res, 42(10):e87;Fukuda et al. (2017), Scientific Reports, 7, doi:10.1038/srep41478、参照によりその全体が本明細書に組み込まれる)。従って、特定の実施態様では、好ましくない5’または3’隣接塩基でのRNA編集効率を高めるために、隣接塩基に意図的な不一致が導入される。
実施態様によっては、アデノシンデアミナーゼは、tRNA特異的アデノシンデアミナーゼまたはその変異体であってもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異W23L、W23R、R26G、H36L、N37S、P48S、P48T、P48A、I49V、R51L、N72D、L84F、S97C、A106V、D108N、H123Y、G125A、A142N、S146C、D147Y、R152H、R152P、E155V、I156F、K157N、およびK161T、ならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異D108Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106VおよびD108Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、およびE155Vならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106VおよびD108Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、およびI156Fならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、およびA142Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、およびK157Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、およびP48Sならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、およびA142Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、およびP48Aならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、およびA142Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、およびR152Pならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上を含んでもよい。実施態様によっては、アデノシンデアミナーゼは、大腸菌TadAのアミノ酸配列位置変異に基づく変異A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、R152P、およびA142Nならびに上記に対応する相同デアミナーゼタンパク質における変異のうちの1つ以上を含んでもよい。
結果は、ADARデアミナーゼドメインの標的窓におけるCに向き合うAが、他の塩基よりも優先的に編集されることを示唆している。さらに、標的塩基の数塩基内のUと塩基対合したAは、Cas12b-ADAR融合による編集レベルが低いことを示しており、酵素が複数のAを編集する柔軟性があることを示唆している。これらの2つの観察結果は、Cas12b-ADAR融合の活動的な窓内の複数のAが、編集されるすべてのAをCと一致させないことにより、編集用に指定できることを示唆している。従って、特定の実施態様では、活動的な窓内の複数のA:C不一致は、複数のA:I編集を作成するように設計されている。特定の実施態様では、活動的な窓での潜在的な非特異的編集を抑制するために、非標的Aは、AまたはGと対合している。
「編集特異性」および「編集優先度」という用語は、本明細書では交換可能に使用され、二本鎖基質の特定のアデノシン部位でのAからIへの編集の程度を指す。いくつかの実施態様では、基質編集の優先度は、標的アデノシン残基の5'最近傍および/または3’最近傍によって決定される。実施態様によっては、アデノシンデアミナーゼは、U>A>C>Gとして格付けされた基質の5’最近傍を優先する(「>」は、より高い優先度を示す)。実施態様によっては、アデノシンデアミナーゼは、G>C≒A>Uとして格付けされた基質の3’最近傍を優先する(「>」はより高い優先度を示し、「≒」は同様の優先度を示す)。実施態様によっては、アデノシンデアミナーゼは、G>C>U≒Aとして格付けされた基質の3’最近傍を優先する(「>」はより高い優先度を示し、「≒」は同様の優先度を示す)。実施態様によっては、アデノシンデアミナーゼは、G>C>A>Uとして格付けされた基質の3’最近傍を優先する(「>」は、より高い優先度を示す)。実施態様によっては、アデノシンデアミナーゼは、C≒G≒A>Uとして格付けされた基質の3’最近傍を優先する(「>」はより高い優先度を示し、「≒」は同様の優先度を示す)。実施態様によっては、アデノシンデアミナーゼは、TAG>AAG>CAC>AAT>GAA>GACとして格付けされた標的アデノシン残基を含む三連配列を優先し(「>」はより高い優先度を示す)、中心Aは標的アデノシン残基である。
実施態様によっては、アデノシンデアミナーゼの基質編集優先度は、アデノシンデアミナーゼタンパク質中の核酸結合ドメインの有無によって影響を受ける。実施態様によっては、基質編集優先度を改変するために、デアミナーゼドメインは、二本鎖RNA結合ドメイン(dsRBD)または二本鎖RNA結合モチーフ(dsRBM)と接続される。実施態様によっては、dsRBDまたはdsRBMは、hADAR1またはhADAR2などのADARタンパク質に由来してもよい。実施態様によっては、少なくとも1つのdsRBDおよびデアミナーゼドメインを含む全長ADARタンパク質が使用される。実施態様によっては、1つ以上のdsRBMまたはdsRBDは、デアミナーゼドメインのN末端にある。他の実施態様では、1つ以上のdsRBMまたはdsRBDは、デアミナーゼドメインのC末端にある。
実施態様によっては、アデノシンデアミナーゼの基質編集優先度は、酵素の活性中心の近くまたは中心内のアミノ酸残基によって影響を受ける。実施態様によっては、基質編集選考を改変するために、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異G336D、G487R、G487K、G487W、G487Y、E488Q、E488N、T490A、V493A、V493T、V493S、N597K、N597R、A589V、S599T、N613K、およびN613Rならびに上記に対応する相同ADARタンパク質の変異のうちの1つ以上の変異を含んでもよい。
特に、実施態様によっては、編集特異性を低減するために、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異E488Q、V493A、N597K、およびN613Kならびに上記に対応する相同ADARタンパク質の変異のうちの1つ以上の変異を含んでもよい。実施態様によっては、編集特異性を高めるために、アデノシンデアミナーゼは変異T490Aを含んでいてもよい。
実施態様によっては、中心Aが標的アデノシン残基である三連配列GACを含む基質などの、すぐ後に5'Gを有する標的アデノシン(A)の編集優先度を高めるために、アデノシンデアミナーゼは、hADAR2-Dのアミノ酸配列位置に基づく変異G336D、E488Q、E488N、V493T、V493S、V493A、A589V、N597K、N597R、S599T、N613K、およびN613Rならびに上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。
特に、実施態様によっては、アデノシンデアミナーゼは、変異E488Qまたは中心Aが標的アデノシン残基である三連配列GAC、GAA、GAU、GAG、CAU、AAU、UACを含む基質を編集するための相同ADARタンパク質の対応する変異を含む。
実施態様によっては、アデノシンデアミナーゼは、hADAR1-Dの野生型アミノ酸配列を含む。実施態様によっては、アデノシンデアミナーゼは、hADAR1-Dの編集効率、および/または基質編集優先度が特定の必要性に従って変更されるように、hADAR1-D配列に1つ以上の変異を含む。
実施態様によっては、アデノシンデアミナーゼは、hADAR1-Dアミノ酸配列のグリシン1007に、または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置1007のグリシン残基は比較的小さな側鎖を有する非極性アミノ酸残基で置換されている。例えば、実施態様によっては、位置1007のグリシン残基はアラニン残基(G1007A)で置換されている。実施態様によっては、位置1007のグリシン残基はバリン残基(G1007V)で置換されている。実施態様によっては、位置1007のグリシン残基は比較的大きな側鎖を有するアミノ酸残基で置換されている。実施態様によっては、位置1007のグリシン残基はアルギニン残基(G1007R)で置換されている。実施態様によっては、位置1007のグリシン残基はリジン残基(G1007K)で置換されている。実施態様によっては、位置1007のグリシン残基はトリプトファン残基(G1007W)で置換されている。実施態様によっては、位置1007のグリシン残基はチロシン残基(G1007Y)で置換されている。さらに、他の実施態様では、位置1007のグリシン残基はロイシン残基(G1007L)で置換されている。他の実施態様では、位置1007のグリシン残基はスレオニン残基(G1007T)で置換されている。他の実施態様では、位置1007のグリシン残基はセリン残基(G1007S)で置換されている。
実施態様によっては、アデノシンデアミナーゼは、hADAR1-Dアミノ酸配列のグルタミン酸1008に、または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、位置1008のグルタミン酸残基は比較的大きな側鎖を有する極性アミノ酸残基で置換されている。実施態様によっては、位置1008のグルタミン酸残基はグルタミン残基(E1008Q)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はヒスチジン残基(E1008H)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はアルギニン残基(E1008R)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はリジン残基(E1008K)で置換されている。実施態様によっては、位置1008のグルタミン酸残基は非極性または小さな極性アミノ酸残基で置換されている。実施態様によっては、位置1008のグルタミン酸残基はフェニルアラニン残基(E1008F)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はトリプトファン残基(E1008W)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はグリシン残基(E1008G)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はイソロイシン残基(E1008I)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はバリン残基(E1008V)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はプロリン残基(E1008P)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はセリン残基(E1008S)で置換されている。他の実施態様では、位置1008のグルタミン酸残基はアスパラギン残基(E1008N)で置換されている。他の実施態様では、位置1008のグルタミン酸残基はアラニン残基(E1008A)で置換されている。他の実施態様では、位置1008のグルタミン酸残基はメチオニン残基(E1008M)で置換されている。実施態様によっては、位置1008のグルタミン酸残基はロイシン残基(E1008L)で置換されている。
実施態様によっては、編集効率を改善するために、アデノシンデアミナーゼは、hADAR1-Dのアミノ酸配列位置に基づく変異E1007S、E1007A、E1007V、E1008Q、E1008R、E1008H、E1008M、E1008N、およびE1008Kならびに上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。
実施態様によっては、編集効率を低下させるために、アデノシンデアミナーゼは、hADAR1-Dのアミノ酸配列位置に基づく変異E1007R、E1007K、E1007Y、E1007L、E1007T、E1008G、E1008I、E1008P、E1008V、E1008F、E1008W、E1008S、E1008N、およびE1008Kならびに上記に対応する相同ADARタンパク質における変異のうちの1つ以上の変異を含んでもよい。
実施態様によっては、アデノシンデアミナーゼの基質編集優先度、効率および/または選択性は、酵素の活性中心の近くまたは中のアミノ酸残基によって影響を受ける。実施態様によっては、アデノシンデアミナーゼは、hADAR1-D配列中のグルタミン酸1008に、または相同ADARタンパク質の対応する位置における変異を含む。実施態様によっては、変異は、E1008Rまたは相同ADARタンパク質の対応する変異である。実施態様によっては、E1008R変異体は、反対側の鎖に不一致のG残基を有する標的アデノシン残基の編集効率が向上している。
実施態様によっては、アデノシンデアミナーゼタンパク質は、二本鎖核酸基質を認識して結合するための1つ以上の二本鎖RNA (dsRNA)結合モチーフ (dsRBM)またはドメイン(dsRBD)をさらに含むか、またはそれらに接続される。実施態様によっては、アデノシンデアミナーゼと二本鎖基質との間の相互作用は、CRISPR/CASタンパク質因子を含む1つ以上の追加のタンパク質因子によって媒介される。実施態様によっては、アデノシンデアミナーゼと二本鎖基質との間の相互作用は、ガイドRNAを含む1つ以上の核酸成分によってさらに媒介される。
CからUへの脱アミノ化活性を有する改変アデノシンデアミナーゼ
特定の実施態様例では、定向進化を用いて、アデニンのヒポキサンチンへの脱アミノ化の他に、追加の反応を触媒できる改変ADARタンパク質を設計してもよい。例えば、改変ADARタンパク質は、シチジンのウラシルへの脱アミノ化を触媒可能であってもよい。特定の理論には拘束されないが、CからUへの活性を改善する変異は、結合ポケットの形状を変化させて、より小さなシチジン塩基をより受容し易くする可能性がある。
実施態様によっては、CからUへの脱アミノ化活性を有する改変アデノシンデアミナーゼは、hADAR2-Dアミノ酸配列の位置V351、T375、R455、およびE488のいずれか1つ以上の位置、または相同ADARタンパク質の対応する位置に変異を含む。実施態様によっては、アデノシンデアミナーゼは、E488Qの変異を含む。実施態様によっては、アデノシンデアミナーゼは、V351I、V351L、V351F、V351M、V351C、V351A、V351G、V351P、V351T、V351S、V351Y、V351W、V351Q、V351N、V351H、V351E、V351D、V351K、V351R、T375I、T375L、T375V、T375F、T375M、T375C、T375A、T375G、T375P、T375S、T375Y、T375W、T375Q、T375N、T375H、T375E、T375D、T375K、T375R、R455I、R455L、R455V、R455F、R455M、R455C、R455A、R455G、R455P、R455T、R455S、R455Y、R455W、R455Q、R455N、R455H、R455E、R455D、およびR455Kから選択される1つ以上の変異を含む。実施態様によっては、アデノシンデアミナーゼは、E488Qの変異を含み、さらに、V351I、V351L、V351F、V351M、V351C、V351A、V351G、V351P、V351T、V351S、V351Y、V351W、V351Q、V351N、V351H、V351E、V351D、V351K、V351R、T375I、T375L、T375V、T375F、T375M、T375C、T375A、T375G、T375P、T375S、T375Y、T375W、T375Q、T375N、T375H、T375E、T375D、T375K、T375R、R455I、R455L、R455V、R455F、R455M、R455C、R455A、R455G、R455P、R455T、R455S、R455Y、R455W、R455Q、R455N、R455H、R455E、R455D、およびR455Kから選択される1つ以上の変異を含む。
CからUへの脱アミノ化活性を有する前述の改変ADARタンパク質に関連して、本明細書に説明の本発明はまた、標的RNAまたはDNAに本明細書に開示のAD機能化組成物を送達することを含む、関心のある標的RNA配列中のCを脱アミノ化する方法に関する。
特定の実施態様例では、標的RNA配列中のCを脱アミノ化する方法は、前記標的RNAに、(a)触媒的に不活性な(死滅)Cas、(b)直接反復配列に連結されたガイド配列を含むガイド分子、および(c)CからUへの脱アミノ化活性を有する改変ADARタンパク質またはその触媒ドメインを送達することを含む。ここで前記改変ADARタンパク質またはその触媒ドメインは、前記死滅Casタンパク質または前記ガイド分子に共有結合または非共有結合するか、または送達後にそれに結合するように構成されていて、ガイド分子は、前記死滅Casタンパク質と複合体を形成しかつ前記複合体を関心のある前記標的RNA配列に結合させるように導き、前記ガイド配列は、前記Cを含む標的配列とハイブリダイズしてRNA二重鎖を形成することができ、場合によっては、前記ガイド配列は、前記Cに対応する位置に非対合のAまたはUを含み形成されたRNA二重鎖に不一致をもたらし、また前記改変ADARタンパク質またはその触媒ドメインは、前記RNA二本鎖中の前記Cを脱アミノ化する。
CからUへの脱アミノ化活性を有する前述の改変ADARタンパク質に関連して、本明細書に説明の本発明はさらに、関心のある標的遺伝子座中のCを脱アミノ化するのに適する遺伝子操作された非天然起源のシステムに関し、このシステムは、(a)直接反復配列に連結されたガイド配列を含むガイド分子、または前記ガイド分子をコードするヌクレオチド配列、(b)触媒的に不活性なCas13タンパク質、または前記触媒的に不活性なCas13タンパク質をコードするヌクレオチド配列、および(c)CからUへの脱アミノ化活性を有する改変ADARタンパク質またはその触媒ドメイン、または前記改変ADARタンパク質またはその触媒ドメインをコードするヌクレオチド配列を含む。ここで前記改変ADARタンパク質またはその触媒ドメインは、前記Cas13タンパク質または前記ガイド分子に共有結合または非共有結合するか、または送達後にそれに結合するように構成されていて、前記ガイド配列は、Cを含む標的RNA配列とハイブリダイズして、RNA二重鎖を形成でき、場合によっては、前記ガイド配列は、前記Cに対応する位置に非対合のAまたはUを含み形成されたRNA二重鎖に不一致をもたらす。場合によっては、このシステムは、(a)前記ガイド配列を含む前記ガイド分子をコードするヌクレオチド配列に操作可能に連結された第1の調節エレメント、(b)前記触媒的に不活性なCas13タンパク質をコードするヌクレオチド配列に操作可能に連結された第2の調節エレメント、および(c)前記第1または第2の調節エレメントの制御下にあるか、または第3の調節エレメントに操作可能に連結されている、CからUへの脱アミノ化活性を有する改変ADARタンパク質またはその触媒ドメインをコードするヌクレオチド配列を含む1つ以上のベクターを含むベクターシステムである。ここで改変ADARタンパク質またはその触媒ドメインをコードする前記ヌクレオチド配列が第3の調節エレメントに操作可能に連結される場合に、前記改変ADARタンパク質またはその触媒ドメインは、発現後に前記ガイド分子または前記Cas13タンパク質に連結するように構成され、(a)、(b)および(c)の構成要素は、システムの同一のまたは異なるベクター上に位置し、場合によっては、前記第1、第2、および/または第3の調節エレメントは誘導性プロモーターである。
本発明の一実施態様では、アデノシンデアミナーゼの基質は、ガイド分子がそのDNA標的に結合すると形成されるRNA/DNAヘテロ二本鎖であり、次いで、その基質はCRISPR-Cas酵素とCRISPR-Cas複合体を形成する。RNA/DNAまたはDNA/RNAヘテロ二本鎖は、本明細書では「RNA/DNA混成物」、「DNA/RNA混成物」または「二本鎖基質」とも呼ばれる。
本発明によれば、アデノシンデアミナーゼの基質は、ガイド分子がそのDNA標的に結合すると形成されるRNA/DNAn RNA二重鎖であり、次いで、その基質はCRISPR-Cas酵素とCRISPR-Cas複合体を形成する。アデノシンデアミナーゼの基質はまた、ガイド分子がそのRNA標的に結合すると形成されるRNA/RNA二重鎖であってもよく、次いで、その基質はCRISPR-Cas酵素とCRISPR-Cas複合体を形成する。RNA/DNAまたはDNA/RNAn RNA二重鎖は、本明細書では「RNA/DNA混成物」、「DNA/RNA混成物」または「二本鎖基質」とも呼ばれる。ガイド分子とCRISPR-Cas酵素の特定の機能を以下に詳述する。
本明細書で使用される用語「編集選択率」は、二本鎖基質上でアデノシンデアミナーゼによって編集される全ての部位の比率を指す。理論に拘束されることなく、アデノシンデアミナーゼの編集選択率は、二本鎖基質の長さ、および不一致な塩基、バルジ、および/または内部ループの存在などの二次構造によって影響を受けると考えられる。
実施態様によっては、基質が50塩基対より長い完全に塩基対合した二重鎖である場合に、アデノシンデアミナーゼは、二重鎖内の複数のアデノシン残基(例えば、全てのアデノシン残基のうちの50%)を脱アミノ化することができる可能性がある。実施態様によっては、基質が50塩基対より短い場合に、アデノシンデアミナーゼの編集選択率は、標的アデノシン部位での不一致の存在によって影響を受ける。特に、実施態様によっては、反対側の鎖上に不一致のシチジン(C)残基を有するアデノシン(A)残基は、高効率で脱アミノ化される。実施態様によっては、反対側の鎖上に不一致のグアノシン(G)残基を有するアデノシン(A)残基は、編集されずに無視される。
特定の実施態様では、アデノシンデアミナーゼタンパク質またはその触媒ドメインは、細胞に送達されるか、あるいは細胞内で別々のタンパク質として発現されるが、C2c1タンパク質またはガイド分子のいずれかに連結できるように改変される。特定の実施態様では、これは、バクテリオファージ外皮タンパク質の多様性の範囲内に存在するオルソゴナルRNA結合タンパク質またはアダプタータンパク質/アプタマーの組合せを用いることで確実になる。この外皮タンパク質の例として、限定はされないが、MS2、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、およびPRR1が挙げられる。アプタマーは、特定の標的に結合するために、in vitro選択またはSELEX(指数関数的濃縮によるリガンドの系統的進化)の繰り返し回数を通して遺伝子操作された天然起源または合成のオリゴヌクレオチドであってもよい。
特定の実施態様では、ガイド分子は、アダプタータンパク質を動員できる1つ以上の異なるRNAループまたは異なる配列を備えている。ガイド分子は、異なるRNAループまたは異なる配列に結合できるアダプタータンパク質を動員できる異なるRNAループまたは異なる配列の挿入によって、C2c1タンパク質と衝突することなく伸長させることができる。改変されたガイドの例、およびエフェクタードメインをC2c1複合体に動員する際のそれらの使用は、Konermann(Nature 2015, 517(7536): 583-588)に説明されている。特定の実施態様では、アプタマーは、哺乳動物細胞中の二量体化MS2バクテリオファージ外皮タンパク質に選択的に結合し、かつステムループ中および/または四塩基ループ中などのガイド分子に導入される最小のヘアピンアプタマーである。これらの実施態様では、アデノシンデアミナーゼタンパク質は、MS2に融合されている。次に、アデノシンデアミナーゼタンパク質は、C2c1タンパク質および対応するガイドRNAと共に同時送達される。
実施態様によっては、本明細書に説明のC2c1-ADAR塩基編集システムは、(a)触媒的に不活性であるかまたはニッカーゼであるC2c1タンパク質、(b)ガイド配列を含むガイド分子、および(c)アデノシンデアミナーゼタンパク質またはその触媒ドメインを含む。ここでアデノシンデアミナーゼタンパク質またはその触媒ドメインは、C2c1タンパク質またはガイド分子に共有結合または非共有結合で連結しているか、または送達後にそれらに結合するように構成され、ガイド配列は、標的配列に実質的に相補的であるが、脱アミノ化の標的となるAに対応する非対合のCを含み、ガイド配列および標的配列によって形成されるDNA-RNA二重鎖またはRNA-RNA二重鎖にA-C不一致をもたらす。真核細胞中に適用する場合に、C2c1タンパク質および/またはアデノシンデアミナーゼは、NLSタグ付であることが好ましい。
実施態様によっては、構成要素(a)、(b)、および(c)は、リボ核タンパク質複合体として細胞に送達される。リボ核タンパク質複合体は、1つ以上の脂質ナノ粒子を介して送達されてもよい。
実施態様によっては、構成要素(a)、(b)、および(c)は、1つ以上のガイドRNA、およびC2c1タンパク質、アデノシンデアミナーゼタンパク質、および場合によってはアダプタータンパク質をコードする1つ以上のmRNA分子などの1つ以上のRNA分子として細胞に送達される。RNA分子は、1つ以上の脂質ナノ粒子を介して送達されてもよい。
実施態様によっては、構成要素(a)、(b)および(c)は、1つ以上のDNA分子として細胞に送達される。実施態様によっては、1つ以上のDNA分子は、ウイルスベクター(例えばAAV)などの1つ以上のベクター内に含まれる。実施態様によっては、1つ以上のDNA分子は、C2c1タンパク質、ガイド分子、およびアデノシンデアミナーゼタンパク質またはその触媒ドメインを発現するように操作可能に構成された1つ以上の調節エレメントを含み、場合によっては、1つ以上の調節エレメントは誘導性プロモーターを含む。
実施態様によっては、ガイド分子は、標的遺伝子座の第1のDNA鎖またはRNA鎖内で脱アミノ化されるアデニンを含む標的配列とハイブリダイズして、前記アデニンの反対側の非対合のシトシンを含むDNA-RNA二重鎖またはRNA-RNA二重鎖を形成することが可能である。二本鎖が形成されると、ガイド分子は、C2c1タンパク質と複合体を形成し、かつ関心のある標的遺伝子座で前記第1のDNA鎖または前記RNA鎖に結合するようにその複合体を誘導する。C2c1-ADAR塩基編集システムのガイドの側面を以下に詳述する。
実施態様によっては、標準的な長さ(例えば、AacC2c1については約20ヌクレオチド長)を有するC2c1ガイドRNAを使用して、標的DNAまたはRNAとのDNA-RNA二重鎖またはRNA-RNA二重鎖を形成する。実施態様によっては、標準的な長さより長いC2c1ガイド分子(例えば、AacC2c1については20超のヌクレオチド長)を使用して、C2c1-ガイドRNA-標的DNA複合体の外部を含み、標的DNAまたはRNAとのDNA-RNA二重鎖またはRNA-RNA二重鎖を形成する。特定の実施態様例では、ガイド配列は、前記標的配列とのDNA-RNA二重鎖またはRNA-RNA二重鎖を形成できる約29~53ヌクレオチド長を有する。特定の他の実施態様例では、ガイド配列は、前記標的配列とのDNA-RNA二重鎖またはRNA-RNA二重鎖を形成できる約40~50ヌクレオチド長を有する。特定の実施態様例では、前記非対合のCと前記ガイド配列の5’末端との間の距離は、20~30ヌクレオチドである。特定の実施態様例では、前記非対合のCと前記ガイド配列の3’末端との間の距離は、20~30ヌクレオチドである。
少なくとも第1の設計では、C2c1-ADARシステムは、(a)触媒的に不活性であるかまたはニッカーゼであるC2c1タンパク質に融合または連結されたアデノシンデアミナーゼ、および(b)ガイド配列と標的配列の間に形成されたDNA-RNA二重鎖またはRNA-RNA二重鎖にA-C不一致を導入するように設計されたガイド配列を含むガイド分子を含む。実施態様によっては、C2c1タンパク質および/またはアデノシンデアミナーゼは、N末端またはC末端のいずれかに、あるいはその両方にNLSタグ付けされている。
少なくとも第2の設計では、C2c1-ADARシステムは、(a)触媒的に不活性であるかまたはニッカーゼであるC2c1タンパク質、(b)ガイド配列と標的配列の間に形成されたDNA-RNA二重鎖またはRNA-RNA二重鎖にA-C不一致を導入するように設計されたガイド配列を含むガイド分子、およびアダプタータンパク質(例えば、MS2被覆タンパク質またはPP7外皮タンパク質)に結合できるアプタマー配列(例えば、MS2 RNAモチーフまたはPP7 RNAモチーフ)、および(c)アダプタータンパク質に融合または連結されたアデノシンデアミナーゼを含む。ここでアプタマーとアダプタータンパク質の結合は、ガイド配列と標的配列の標的配列との間に形成されたDNA-RNA二重鎖またはRNA-RNA二重鎖に、A-C不一致のAでの標的脱アミノ化のためにアデノシンデアミナーゼを動員する。実施態様によっては、アダプタータンパク質および/またはアデノシンデアミナーゼは、N末端またはC末端のいずれかに、あるいはその両方にNLSタグ付けされている。C2c1タンパク質はまた、NLSタグ付けされていてもよい。
異なるアプタマーおよび対応するアダプタータンパク質の使用により、さらにオルソゴナル遺伝子編集を実施することが可能になる。アデノシンデアミナーゼをシチジンデアミナーゼと組合せてオルソゴナル遺伝子編集/脱アミノ化のために使用する一例では、MS2-アデノシンデアミナーゼおよびPP7-シチジンデアミナーゼ(またはPP7-アデノシンデアミナーゼおよびMS2-シチジンデアミナーゼ)のそれぞれを動員するために、異なる遺伝子座を標的とするsgRNAを異なるRNAループで改変して、それぞれ関心のある標的遺伝子座でのAまたはCのオルソゴナル脱アミノ化をもたらすことができる。PP7は、シュードモナス属バクテリオファージのRNA結合外皮タンパク質である。MS2と同様に、PP7は特定のRNA配列および二次構造に結合する。PP7 RNA認識モチーフは、MS2のモチーフとは異なる。その結果として、PP7およびMS2を多重化して、異なるゲノム遺伝子座で同時に異なる効果を媒介できる。例えば、遺伝子座Aを標的とするsgRNAは、MS2ループで改変されてMS2-アデノシンデアミナーゼを動員でき、遺伝子座Bを標的とする別のsgRNAは、PP7ループで改変されてPP7-シチジンデアミナーゼを動員できる。従って、同じ細胞内でオルソゴナルする遺伝子座固有の改変が実現される。この原理を拡張して、他のオルソゴナルRNA結合タンパク質を組み込むことができる。
少なくとも第3の設計では、C2c1-ADAR CRISPRシステムは、(a)触媒的に不活性であるかまたはニッカーゼであるC2c1タンパク質の内部ループまたは非構造化領域内に挿入されたアデノシンデアミナーゼ、および(b)ガイド配列と標的配列との間に形成されたDNA-RNA二重鎖またはRNA-RNA二重鎖にA-C不一致を導入するように設計されたガイド配列を含むガイド分子を含む。
アデノシンデアミナーゼの挿入に適するC2c1タンパク質分割部位は、結晶構造の助けを借りて識別できる。例えば、AacC2c1変異体に関して、例えば、配列の整列においてどの位置が対応するかは容易に明白になるはずである。他のC2c1タンパク質について、相同分子種と目的のC2c1タンパク質との間に比較的高度な相同性が存在する場合には、その相同分子種の結晶構造を使用できる。
分割位置は、領域またはループ内に位置してもよい。好ましくは、分割位置は、アミノ酸配列の中断が構造的特徴(例えば、α螺旋またはβ薄板)の部分的または完全な破壊をもたらさない場合に発生する。未構造化領域(これらの領域は結晶内で「凍結」されるのに十分に構造化していないために、結晶構造内に現出しなかった領域)が、選択肢として好ましい場合が多い。本発明の実施では、C2c1の表面に露出している全ての非構造化領域内での分割が想定されている。非構造化領域または外側のループ内の位置は、正確に上記に示された数である必要はない可能性はあるが、分割位置が依然外側ループの非構造化領域内にある限り、ループのサイズに応じて上記の位置のいずれかの側で、例えば、1、2、3、4、5、6、7、8、9個、さらに10個のアミノ酸により変化していてもよい。
本明細書に説明のC2c1-ADARシステムを使用して、脱アミノ化のためにDNA配列内の特定のアデニンを標的することができる。例えば、ガイド分子は、C2c1タンパク質と複合体を形成して、その複合体を誘導して関心のある標的遺伝子座で標的配列に結合できる。ガイド配列は非対合Cを持つように設計されているために、ガイド配列と標的配列との間に形成されるヘテロ二本鎖は、A-C不一致を含み、アデノシンデアミナーゼを非対合Cの反対側のAに接触させて脱アミノ化するように誘導し、それをイノシン(I)に変換する。イノシン(I)塩基はCと対合し細胞プロセスでGのように機能するので、本明細書に説明のAの標的脱アミノ化は、望ましくないG-AおよびC-T変異の修正、ならびに望ましいA-GおよびT-C変異の生成に有用である。
塩基除去修復阻害剤
実施態様によっては、AD機能化CRISPRシステムは、塩基除去修復(BER)阻害剤をさらに含む。特定の理論に拘束されることを望まないが、I:T対合の存在に対する細胞のDNA修復応答は、細胞での核酸塩基の編集効率の低下の原因となる可能性がある。(DNA-3-メチルアデニングリコシラーゼ、3-アルキルアデニンDNAグリコシラーゼ、またはN-メチルプリンDNAグリコシラーゼとしても知られている)アルキルアデニンDNAグリコシラーゼは、細胞内のDNAからのヒポキサンチンの除去を触媒し塩基除去修復を開始でき、結果としてI:T対をA:T対に戻す。
実施態様によっては、BER阻害剤は、アルキルアデニンDNAグリコシラーゼの阻害剤である。実施態様によっては、BER阻害剤は、ヒトアルキルアデニンDNAグリコシラーゼの阻害剤である。実施態様によっては、BER阻害剤は、ポリペプチド阻害剤である。実施態様によっては、BER阻害剤は、ヒポキサンチンに結合するタンパク質である。実施態様によっては、BER阻害剤は、DNA中のヒポキサンチンに結合するタンパク質である。実施態様によっては、BER阻害剤は、触媒的に不活性なアルキルアデニンDNAグリコシラーゼタンパク質またはその結合ドメインである。実施態様によっては、BER阻害剤は、触媒的に不活性なアルキルアデニンDNAグリコシラーゼタンパク質またはその結合ドメインであり、これらはDNAからヒポキサンチンを除去しない。アルキルアデニンDNAグリコシラーゼ塩基除去修復酵素を阻害する(例えば立体的に遮断する)ことが可能な他のタンパク質は、本開示の範囲内である。さらに、塩基除去修復を遮断または阻害する任意のタンパク質もまた、本開示の範囲内である。
特定の理論に拘束されることを望まないが、塩基除去修復は、編集された鎖に結合し、編集された塩基を遮断し、アルキルアデニンDNAグリコシラーゼを阻害し、塩基除去修復を阻害し、編集された塩基を保護し、かつ/あるいは編集されていない鎖の固定を促進する分子によって阻害されてもよい。本明細書に説明のBER阻害剤の使用は、AからIへの変化を触媒可能なアデノシンデアミナーゼの編集効率を向上できると考えられている。
従って、上記に説明のAD機能化CRISPRシステムの第1の設計では、CRISPR-Casタンパク質またはアデノシンデアミナーゼは、BER阻害剤(例えば、アルキルアデニンDNAグリコシラーゼの阻害剤)に融合または連結されていてもよい。実施態様によっては、BER阻害剤は、以下の構造のうちの1つに含まれてもよい(nC2c1はC2c1ニッカーゼであり、dC2c1は死滅C2c1である):[AD]-[任意のリンカー]-[nC2c1/dC2c1]-[任意のリンカー]-[BER阻害剤];[AD]-[任意のリンカー]-[BER阻害剤]-[任意のリンカー]-[nC2c1/dC2c1];[BER阻害剤]-[任意のリンカー]-[AD]-[任意のリンカー]-[nC2c1/dC2c1];[BER阻害剤]-[任意のリンカー]-[nC2c1/dC2c1]-[任意のリンカー]-[AD];[nC2c1/dC2c1]-[任意のリンカー]-[AD]-[任意のリンカー]-[BER阻害剤];[nC2c1/dC2c1]-[任意のリンカー]-[BER阻害剤]-[任意のリンカー]-[AD]。
同様に、上記に説明のAD機能化CRISPRシステムの第2の設計では、CRISPR-Casタンパク質、アデノシンデアミナーゼ、またはアダプタータンパク質は、BER阻害剤(例えば、アルキルアデニンDNAグリコシラーゼの阻害剤)に融合または連結されていてもよい。実施態様によっては、BER阻害剤は、以下の構造のうちの1つに含まれてもよい(nC2c1はC2c1ニッカーゼであり、dC2c1は死滅C2c1である):[nC2c1/dC2c1]-[任意のリンカー]-[BER阻害剤];[BER阻害剤]-[任意のリンカー]-[nC2c1/dC2c1];[AD]-[任意のリンカー]-[アダプター]-[任意のリンカー]-[BER阻害剤];[AD]-[任意のリンカー]-[BER阻害剤]-[任意のリンカー]-[アダプター];[BER阻害剤]-[任意のリンカー]-[AD]-[任意のリンカー]-[アダプター];[BER阻害剤]-[任意のリンカー]-[アダプター]-[任意のリンカー]-[AD];[アダプター]-[任意のリンカー]-[AD]-[任意のリンカー]-[BER阻害剤];[アダプター]-[任意のリンカー]-[BER阻害剤]-[任意のリンカー]-[AD]。
上記に説明のAD機能化CRISPRシステムの第3の設計では、BER阻害剤は、CRISPR-Casタンパク質の内部ループまたは非構造化領域に挿入されていてもよい。
シチジンデアミナーゼ
実施態様によっては、デアミナーゼは、シチジンデアミナーゼである。本明細書で使用される用語「シチジンデアミナーゼ」または「シチジンデアミナーゼタンパク質」は、タンパク質、ポリペプチド、またはタンパク質またはポリペプチドの1つ以上の機能ドメインを指し、これらは、以下に示すように、シトシン(または分子のシトシン部分)をウラシル(または分子のウラシル部分)に変換する加水分解性脱アミノ化反応を触媒することができる。実施態様によっては、シトシン含有分子はシチジン(C)であり、ウラシル含有分子はウリジン(U)である。シトシン含有分子は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)であってもよい。
本開示によれば、本開示に関連して使用できるシチジンデアミナーゼには、限定はされないが、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーのデアミナーゼ、活性誘導デアミナーゼ (AID)、またはシチジンデアミナーゼ1 (CDA1)として知られる酵素ファミリーのメンバーが含まれる。特定の実施態様では、デアミナーゼは、APOBEC1デアミナーゼ、APOBEC2デアミナーゼ、APOBEC3Aデアミナーゼ、APOBEC3Bデアミナーゼ、APOBEC3Cデアミナーゼ、APOBEC3Dデアミナーゼ、APOBEC3Eデアミナーゼ、APOBEC3Fデアミナーゼ、APOBEC3Gデアミナーゼ、APOBEC3Hデアミナーゼ、またはAPOBEC4デアミナーゼである。
本発明の方法およびシステムでは、シチジンデアミナーゼは、DNA一本鎖中のシトシンを標的可能である。特定の実施態様例では、シチジンデアミナーゼは、結合成分、例えば結合Cas13の外側に存在する一本鎖で編集してもよい。他の実施態様例では、シチジンデアミナーゼは、標的編集部位であるがガイド配列での不一致によって形成される局所バブルなどの局所バブルで編集してもよい。特定の実施態様例では、シチジンデアミナーゼは、Kim et al., Nature Biotechnology (2017) 35(4):371-377 (doi:10.1038/nbt.3803に開示されるような活性を合焦するのを助ける変異を含んでもよい。
実施態様によっては、シチジンデアミナーゼは、限定はされないが、哺乳動物、鳥、カエル、イカ、魚、ハエ、および虫を含む1種以上の後生動物種に由来する。実施態様によっては、シチジンデアミナーゼは、ヒト、霊長類、ウシ、イヌ、ラット、またはマウスのシチジンデアミナーゼである。
実施態様によっては、シチジンデアミナーゼは、hAPOBEC1またはhAPOBEC3を含むヒトAPOBECである。実施態様によっては、シチジンデアミナーゼはヒトAIDである。
実施態様によっては、シチジンデアミナーゼタンパク質は、RNA二本鎖の一本鎖バブル中の1つ以上の標的シトシン残基を認識し、かつウラシル残基に変換する。実施態様によっては、シチジンデアミナーゼタンパク質は、RNA二本鎖の一本鎖バブル上の結合ウィンドウを認識する。実施態様によっては、結合ウィンドウは、少なくとも1つの標的シトシン残基を含む。実施態様によっては、結合ウィンドウは、約3塩基対~約100塩基対の範囲内にある。実施態様によっては、結合ウィンドウは、約5塩基対~約50塩基対の範囲内にある。実施態様によっては、結合ウィンドウは、約10塩基対~約30塩基対の範囲内にある。実施態様によっては、結合ウィンドウは、約1塩基対、2塩基対、3塩基対、5塩基対、7塩基対、10塩基対、15塩基対、20塩基対、25塩基対、30塩基対、40塩基対、45塩基対、50塩基対、55塩基対、60塩基対、65塩基対、70塩基対、75塩基対、80塩基対、85塩基対、90塩基対、95塩基対、または100塩基対である。
実施態様によっては、シチジンデアミナーゼタンパク質は、1つ以上のデアミナーゼドメインを含む。理論に拘束されることを意図しないが、デアミナーゼドメインは、RNA二本鎖の一本鎖バブルに含まれる1つ以上の標的シトシン(C)残基を認識し、ウラシル(U)残基に変換するように機能すると考えられる。実施態様によっては、デアミナーゼドメインは活性中心を含む。実施態様によっては、活性中心は亜鉛イオンを含む。実施態様によっては、活性中心内またはその近傍のアミノ酸残基は、標的シトシン残基の5’側の1つ以上のヌクレオチドと相互作用する。実施態様によっては、活性中心内またはその近傍のアミノ酸残基は、標的シトシン残基の3’側の1つ以上のヌクレオチドと相互作用する。
実施態様によっては、シチジンデアミナーゼは、ヒトAPOBEC1完全タンパク質 (hAPOBEC1)またはそのデアミナーゼドメイン (hAPOBEC1-D)またはそのC末端切り詰め形態 (hAPOBEC-T)を含む。実施態様によっては、シチジンデアミナーゼは、hAPOBEC1、hAPOBEC-D、またはhAPOBEC-Tに相同であるAPOBECファミリーのメンバーである。実施態様によっては、シチジンデアミナーゼは、ヒトAID1完全タンパク質(hAID)またはそのデアミナーゼドメイン(hAID-D)またはそのC末端切り詰め形態 (hAID-T)を含む。実施態様によっては、シチジンデアミナーゼは、hAID、hAID-D、またはhAID-Tに相同であるAIDファミリーのメンバーである。実施態様によっては、hAID-Tは、約20個のアミノ酸によってC末端が切り詰められたhAIDである。
実施態様によっては、シチジンデアミナーゼは、シトシンデアミナーゼの野生型アミノ酸配列を含む。実施態様によっては、シチジンデアミナーゼは、シトシンデアミナーゼの編集効率および/または基質編集優先度が特定の必要性に従って変更されるように、シトシンデアミナーゼ配列中に1つ以上の変異を含む。
APOBEC1およびAPOBEC3タンパク質の特定の変異は、Kim et al., Nature Biotechnology (2017) 35(4):371-377 (doi:10.1038/nbt.3803)、およびHarris et al. Mol. Cell (2002) 10:1247-1253に説明されていて、これらのそれぞれは、参照によりその全体が本明細書に組み込まれている。
実施態様によっては、シチジンデアミナーゼは、ラットのAPOBEC1中のW90、R118、H121、H122、R126、またはR132に対応するアミノ酸位置に1つ以上の変異を含むAPOBEC1デアミナーゼ、あるいはヒトAPOBEC3G中のW285、R313、D316、D317X、R320、またはR326に対応するアミノ酸位置に1つ以上の変異を含むAPOBEC3Gデアミナーゼである。
実施態様によっては、シチジンデアミナーゼは、ラットのAPOBEC1アミノ酸配列のトリプトファン90での変異、またはAPOBEC3Gのトリプトファン285などの相同APOBECタンパク質中の対応する位置での変異を含む。実施態様によっては、位置90のトリプトファン残基は、チロシンまたはフェニルアラニン残基(W90YまたはW90F)によって置換されている。
実施態様によっては、シチジンデアミナーゼは、ラットのAPOBEC1アミノ酸配列のアルギニン118での変異、または相同APOBECタンパク質中の対応する位置での変異を含む。実施態様によっては、位置118のアルギニン残基は、アラニン残基(R118A)によって置換されている。
実施態様によっては、シチジンデアミナーゼは、ラットのAPOBEC1アミノ酸配列のヒスチジン121での変異、または相同APOBECタンパク質中の対応する位置での変異を含む。実施態様によっては、位置121のヒスチジン残基は、アルギニン残基 (H121R)によって置換されている。
実施態様によっては、シチジンデアミナーゼは、ラットのAPOBEC1アミノ酸配列のヒスチジン122での変異、または相同APOBECタンパク質中の対応する位置での変異を含む。実施態様によっては、位置122のヒスチジン残基は、アルギニン残基 (H122R)によって置換されている。
実施態様によっては、シチジンデアミナーゼは、ラットのAPOBEC1アミノ酸配列のアルギニン126での変異、またはAPOBEC3Gのアルギニン320などの相同APOBECタンパク質中の対応する位置での変異を含む。実施態様によっては、位置126のアルギニン残基は、アラニン残基 (R126A)またはグルタミン酸 (R126E)によって置換されている。
実施態様によっては、シチジンデアミナーゼは、APOBEC1アミノ酸配列のアルギニン132での変異、または相同APOBECタンパク質中の対応する位置での変異を含む。実施態様によっては、位置132のアルギニン残基は、グルタミン酸残基 (R132E)によって置換されている。
実施態様によっては、編集ウィンドウの幅を狭くするために、シチジンデアミナーゼは、ラットのAPOBEC1のアミノ酸配列位置に基づく変異:W90Y、W90F、R126E、およびR132E、ならびに上記に対応する相同APOBECタンパク質中の変異のうちの1つ以上の変異を含んでもよい。
実施態様によっては、編集効率を低下させるために、シチジンデアミナーゼは、ラットのAPOBEC1のアミノ酸配列位置に基づく変異:W90A、R118A、およびR132E、ならびに上記に対応する相同APOBECタンパク質中の変異のうちの1つ以上の変異を含んでもよい。特定の実施態様では、非特異的標的効果を低減するために、効力が低下したシチジンデアミナーゼ酵素を使用することが興味深い場合がある。
実施態様によっては、シチジンデアミナーゼは、野生型ラットのAPOBEC1 (rAPOBEC1)、またはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、rAPOBEC1の編集効率および/または基質編集優先度が特定の必要性に応じて変更されるように、rAPOBEC1配列中に1つ以上の変異を含む。
rAPOBEC1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(配列番号433)
実施態様によっては、シチジンデアミナーゼは、野生型ヒトAPOBEC1 (hAPOBEC1)またはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、hAPOBEC1の編集効率および/または基質編集優先度が特定の必要性に応じて変更されるように、hAPOBEC1配列中に1つ以上の変異を含む。
APOBEC1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR(配列番号434)
実施態様によっては、シチジンデアミナーゼは、野生型ヒトAPOBEC3G (hAPOBEC3G)またはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、hAPOBEC3Gの編集効率および/または基質編集優先度が特定の必要性に応じて変更されるように、hAPOBEC3G配列中に1つ以上の変異を含む。
hAPOBEC3G:
MELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN(配列番号435)
実施態様によっては、シチジンデアミナーゼは、野生型ヤツメウナギCDA1 (pmCDAl)またはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、pmCDAlの編集効率および/または基質編集優先度が特定の必要性に応じて変更されるように、pmCDAl配列中に1つ以上の変異を含む。
pmCDAl:
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV(配列番号436)
実施態様によっては、シチジンデアミナーゼは、野生型ヒトAID (hAID)またはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、pmCDAlの編集効率および/または基質編集優先度が特定の必要性に応じて変更されるように、pmCDAl配列中に1つ以上の変異を含む。
hAID:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPYLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGLLD(配列番号437)
実施態様によっては、シチジンデアミナーゼは、hAIDの切り詰め形態 (hAID-DC)またはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、hAID-DCの編集効率および/または基質編集優先度が特定の必要性に応じて変更されるように、hAID-DC配列中に1つ以上の変異を含む。
hAID-DC:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILL(配列番号438)
シチジンデアミナーゼのさらなる実施態様は、名称が「核酸塩基エディターおよびその使用」である国際特許出願WO2017/070632号に開示されていて、その全体が参照により本明細書に組み込まれている。
実施態様によっては、シチジンデアミナーゼは、脱アミノ化編集を受け易いヌクレオチドを封入する効率的な脱アミノ化ウィンドウを有する。従って実施態様によっては、「編集ウィンドウ幅」は、シチジンデアミナーゼの編集効率がその標的部位の最大値の半分を超える、所定の標的部位でのヌクレオチド位置の数を指している。実施態様によっては、シチジンデアミナーゼは、約1~約6個のヌクレオチドの範囲の編集ウィンドウ幅を有する。実施態様によっては、シチジンデアミナーゼの編集ウィンドウ幅は、1、2、3、4、5、または6個のヌクレオチドである。
理論に拘束されることを意図しないが、実施態様によっては、リンカー配列の長さが編集ウィンドウ幅に影響を及ぼすことが考えられる。実施態様によっては、編集ウィンドウ幅は、リンカーの長さが伸長する(例えば、約3~約21個のアミノ酸)につれて増加する(例えば、約3~約6個のヌクレオチド)。非限定的な例では、16個の残基のリンカーは、約5個のヌクレオチドの効率的な脱アミノ化ウィンドウを提供する。実施態様によっては、ガイドRNAの長さは、編集ウィンドウの幅に影響を及ぼす。実施態様によっては、ガイドRNAを短縮すると、シチジンデアミナーゼの効率的な脱アミノ化ウィンドウは狭くなる。
実施態様によっては、シチジンデアミナーゼへの変異は、編集ウィンドウ幅に影響を及ぼす。実施態様によっては、CD機能化CRISPRシステムのシチジンデアミナーゼ成分は、シチジンデアミナーゼの触媒効率を低下させる1つ以上の変異を含み、その結果、デアミナーゼでは、DNA結合事象ごとの複数のシチジンの脱アミノ化を防ぐ。実施態様によっては、APOBEC1の残基90 (W90)でのトリプトファンまたは相同配列中の対応するトリプトファン残基は変異している。実施態様によっては、触媒的に不活性なCas13は、W90YまたはW90F変異を含むAPOBEC1変異体に融合または連結される。実施態様によっては、APOBEC3Gの残基285 (W285)のトリプトファン、または相同配列中の対応するトリプトファン残基が変異している。実施態様によっては、触媒的に不活性なCas13は、W285YまたはW285F変異を含むAPOBEC3G変異体に融合または連結される。
実施態様によっては、CD機能化CRISPRシステムのシチジンデアミナーゼ成分は、デアミナーゼ活性部位へのシチジンの非最適な提供に対する耐性を低下させる1つ以上の変異を含む。実施態様によっては、シチジンデアミナーゼは、デアミナーゼ活性部位の基質結合活性を変化させる1つ以上の変異を含む。実施態様によっては、シチジンデアミナーゼは、デアミナーゼ活性部位によって認識され、かつ結合されるDNAの立体構造を変化させる1つ以上の変異を含む。実施態様によっては、シチジンデアミナーゼは、デアミナーゼ活性部位への基質の到達性を変化させる1つ以上の変異を含む。実施態様によっては、APOBEC1の残基126 (R126)のアルギニンまたは相同配列中の対応するアルギニン残基が変異している。実施態様によっては、触媒的に不活性なCas13は、R126AまたはR126E変異を含むAPOBEC1に融合または連結される。実施態様によっては、APOBEC3Gの残基320 (R320)のトリプトファン、または相同配列中の対応するアルギニン残基が変異している。実施態様によっては、触媒的に不活性なCas13は、R320AまたはR320E変異を含むAPOBEC3G変異体に融合または連結される。実施態様によっては、APOBEC1の残基132 (R132)のアルギニンまたは相同配列中の対応するアルギニン残基は変異している。実施態様によっては、触媒的に不活性なCas13は、R132E変異を含むAPOBEC1変異体に融合または連結される。
実施態様によっては、CD機能化CRISPRシステムのAPOBEC1ドメインは、W90Y、W90F、R126A、R126E、およびR132Eから選択される1つ、2つ、または3つの変異を含む。実施態様によっては、APOBEC1ドメインは、W90YおよびR126Eの2つの変異を含む。実施態様によっては、APOBEC1ドメインは、W90YおよびR132Eの2つの変異を含む。実施態様によっては、APOBEC1ドメインは、R126EおよびR132Eの2つの変異を含む。実施態様によっては、APOBEC1ドメインは、W90Y、R126E、およびR132Eの3つの変異を含む。
実施態様によっては、本明細書に開示のシチジンデアミナーゼ中の1つ以上の変異は、編集ウィンドウ幅を約2個のヌクレオチドに減少させる。実施態様によっては、本明細書に開示のシチジンデアミナーゼ中の1つ以上の変異は、編集ウィンドウ幅を約1個のヌクレオチドに減少させる。実施態様によっては、本明細書に開示のシチジンデアミナーゼ中の1つ以上の変異は、酵素の編集効率に最小限または中程度の影響を及ぼすだけの範囲内で、編集ウィンドウ幅を減少させる。実施態様によっては、本明細書に開示のシチジンデアミナーゼ中の1つ以上の変異は、酵素の編集効率を低下させることなく、編集ウィンドウ幅を減少させる。実施態様によっては、本明細書に開示のシチジンデアミナーゼ中の1つ以上の変異は、別の方法でシチジンデアミナーゼによって類似の効率で編集される隣接するシチジンヌクレオチドとの識別を可能とする。
実施態様によっては、シチジンデアミナーゼタンパク質はさらに、二本鎖核酸基質を認識して結合するための1つ以上の二本鎖RNA (dsRNA)結合モチーフ (dsRBM)またはドメイン (dsRBD)を含むか、あるいはそれらに結合される。実施態様によっては、シチジンデアミナーゼと基質との間の相互作用は、CRISPR/CASタンパク質因子を含む1つ以上のさらなるタンパク質因子によって媒介される。実施態様によっては、シチジンデアミナーゼと基質との間の相互作用は、ガイドRNAを含む1つ以上の核酸成分によってさらに媒介される。
本発明によれば、シチジンデアミナーゼの基質は、関心のあるシトシンを含むRNA二本鎖のDNA一本鎖バブルであり、ガイド分子がそのDNA標的に結合するとシチジンデアミナーゼに接近でき、次にCRISPR-Cas酵素とのCRISPR-Cas複合体を形成し、それによりシトシンデアミナーゼは、CRISPR-Cas複合体の1つ以上の成分、すなわちCRISPR-Cas酵素および/またはガイド分子に融合されるか、あるいは結合が可能になる。ガイド分子およびCRISPR-Cas酵素の特定の特性を以下に詳述する。
塩基編集ガイド分子設計の考察
実施態様によっては、ガイド配列は、長さが10~50ヌクレオチド長のRNA配列であるが、より具体的には、約20~30ヌクレオチド長、好ましくは約20ヌクレオチド長、23~25ヌクレオチド長、または24ヌクレオチド長のRNA配列である。塩基編集の実施態様では、ガイド配列は、脱アミノ化されるアデノシンを含む標的配列にそのガイド配列がハイブリダイズすることが確実になるように選択される。これについては、以下で詳述する。選択には、脱アミノ化の効力および特異性を高めるさらなる工程を含んでもよい。
実施態様によっては、ガイド配列は、約20ヌクレオチド長~約30ヌクレオチド長であり、標的アデノシン部位にdA-C不一致を有することを除いて、標的DNA鎖にハイブリダイズしてほぼ完全に一致する二重鎖を形成する。特に実施態様によっては、dA-C不一致は、標的配列の中心(すなわち、ガイド配列の標的配列へのハイブリダイズ時の二本鎖の中心)に近接して位置し、それにより、アデノシンデアミナーゼを狭い編集ウィンドウ(例えば約4塩基対の幅)に制限する。実施態様によっては、標的配列は、脱アミノ化される2つ以上の標的アデノシンを含んでもよい。さらなる実施態様では、標的配列は、標的アデノシン部位の3’に1つ以上のdA-C不一致をさらに含んでもよい。実施態様によっては、標的配列中の意図しないアデニン部位での標的外編集を回避するために、ガイド配列は、dA-G不一致を導入するために、前記意図しないアデニンに対応する位置に非対合のグアニンを含むように設計できるが、このガイド配列は、ADAR1およびADAR2などの特定のアデノシンデアミナーゼには触媒として好ましくない。参照によりその全体が本明細書に組み込まれるWong et al., RNA 7:846-858 (2001)を参照。
実施態様によっては、標準的な長さ(例えば、AacC2c1については約20ヌクレオチド長)を有するCas12bガイド配列を使用して、標的DNAと共にヘテロ二本鎖を形成する。実施態様によっては、標準的な長さより長い(例えば、AacC2c1については20ヌクレオチド長を超える)Cas12bガイド分子を使用して、Cas12bガイドRNA-標的DNA複合体の外側を含む標的DNAと共にヘテロ二本鎖を形成する。このガイド分子は、ヌクレオチドの所定の伸長範囲内の複数のアデニンの脱アミノ化を目的とする場合に対象としてもよい。別の実施態様では、標準的なガイド配列の長さの制限を維持することを対象とする。実施態様によっては、ガイド配列は、Cas12bガイドの標準的な長さの外側にdA-C不一致を導入するように設計されるが、このガイド配列は、Cas12bによる立体障害を低減させ、アデノシンデアミナーゼとdA-C不一致との間の接触の頻度を増大させることができる。
いくつかの塩基編集の実施態様では、不一致の核酸塩基(例えばシチジン)の位置は、DNA標的上のPAMが在ると思われる場所から計算される。実施態様によっては、不一致の核酸塩基は、PAMから12~21ヌクレオチド長、またはPAMから13~21ヌクレオチド長、またはPAMから14~21ヌクレオチド長、またはPAMから14~20ヌクレオチド長、またはPAMから15~20ヌクレオチド長、またはPAMから16~20ヌクレオチド長、またはPAMから14~19ヌクレオチド長、またはPAMから15~19ヌクレオチド長、またはPAMから16~19ヌクレオチド長、またはPAMから17~19ヌクレオチド長、または約PAMから20ヌクレオチド長、またはPAMから約19ヌクレオチド長、またはPAMから約18ヌクレオチド長、またはPAMから約17ヌクレオチド長、またはPAMから約16ヌクレオチド長、またはPAMから約15ヌクレオチド長、またはPAMから約14ヌクレオチド長に位置する。好ましい実施態様では、不一致の核酸塩基は、PAMから17~19ヌクレオチド長、または18ヌクレオチド長に位置する。
不一致の距離は、Cas12bスペーサーの3’末端と不一致の核酸塩基(例えばシチジン)との間の塩基の数であり、不一致塩基は、不一致の距離計算値の一部として含まれる。実施態様によっては、不一致の距離は、1~10ヌクレオチド長、または1~9ヌクレオチド長、または1~8ヌクレオチド長、または2~8ヌクレオチド長、または2~7ヌクレオチド長、または2~6ヌクレオチド長、または3~8ヌクレオチド長、または3~7ヌクレオチド長、または3~6ヌクレオチド長、または3~5ヌクレオチド長、または約2ヌクレオチド長、または約3ヌクレオチド長、または約4ヌクレオチド長、または約5ヌクレオチド長、または約6ヌクレオチド長、または約7ヌクレオチド長、または約8ヌクレオチド長である。好ましい実施態様では、不一致の距離は、3~5ヌクレオチド長または4ヌクレオチド長である。
実施態様によっては、本明細書に説明のCas12b-ADARシステムの編集ウィンドウは、PAMから12~21ヌクレオチド長、またはPAMから13~21ヌクレオチド長、またはPAMから14~21ヌクレオチド長、またはPAMから14~20ヌクレオチド長、またはPAMから15~20ヌクレオチド長、またはPAMから16~20ヌクレオチド長、またはPAMから14~19ヌクレオチド長、またはPAMから15~19ヌクレオチド長、またはPAMから16~19ヌクレオチド長、またはPAMから17~19ヌクレオチド長、またはPAMから約20ヌクレオチド長、またはPAMから約19ヌクレオチド長、またはPAMから約18ヌクレオチド長、またはPAMから約17ヌクレオチド長、またはPAMから約16ヌクレオチド長、または約PAMから15ヌクレオチド長、またはPAMから約14ヌクレオチド長である。実施態様によっては、本明細書に説明のCas12b-ADARシステムの編集ウィンドウは、Cas12bスペーサーの3’末端から1~10ヌクレオチド長、またはCas12bスペーサーの3’末端から1~9ヌクレオチド長、またはCas12bスペーサーの3’末端から1~8ヌクレオチド長、またはC2c1スペーサーの3’末端から2~8ヌクレオチド長、またはCas12bスペーサーの3’末端から2~7ヌクレオチド長、またはCas12bスペーサーの3’末端から2~6ヌクレオチド長、またはCas12bスペーサーの3’末端から3~8ヌクレオチド長、またはCas12bスペーサーの3’末端から3~7ヌクレオチド長、またはCas12bスペーサーの3’末端から3~6ヌクレオチド長、またはCas12bスペーサーの3’末端から3~5ヌクレオチド長、またはCas12bスペーサーの3’末端から約2ヌクレオチド長、またはCas12bスペーサーの3’末端から約3ヌクレオチド長、またはCas12bスペーサーの3’末端から約4ヌクレオチド長、またはCas12bスペーサーの3’端から約5ヌクレオチド長、またはCas12bスペーサーの3’端から約6ヌクレオチド長、またはCas12bスペーサーの3’端から約7ヌクレオチド長、またはCas12bスペーサーの3’末端から約8ヌクレオチド長である。
ベクター
一般にかつ本明細書全体を通して、用語「ベクター」は、それが連結されている別の核酸を輸送することができる核酸分子を指す。このベクターは、プラスミド、ファージ、またはコスミドなどの複製子であり、その中に、挿入された区画の複製をもたらすように別のDNA区画が挿入されてもよい。一般にベクターは、適切な制御エレメントに会合される場合に複製できる。
実施態様によっては、本開示は、CRISPR-Casシステムの1つ以上の構成要素をコードする1つ以上のポリヌクレオチドを含むベクターシステムを提供する。実施態様によっては、ベクターシステムは、1つ以上のベクターを含むCas12bベクターシステムであり、このベクターは、表1または表2からのCas12bエフェクタータンパク質をコードするヌクレオチド配列に操作可能に連結された第1の調節エレメント、ならびにi)a)crRNAをコードするヌクレオチド配列に操作可能に連結された第2の調節エレメントおよびb)tracr RNAをコードするヌクレオチド配列に操作可能に連結された第3の調節エレメント、あるいはii)crRNAおよびtracr RNAをコードするヌクレオチド配列に操作可能に連結された第2の調節エレメントを含む。場合によっては、ベクターシステムは1本のベクターを含む。あるいは、ベクターシステムは複数のベクターを含む。ベクターはウイルスベクターであってもよい。
ベクターには、限定はされないが、一本鎖、二本鎖、または部分的に二本鎖である核酸分子、1つ以上の自由端を含むかまたは自由端を含まない(例えば環状の)核酸分子、DNA、RNA、またはその両方を含む核酸分子、および当技術分野で既知の他の種類のポリヌクレオチドが含まれる。1種のベクターは「プラスミド」であり、これは、標準的な分子クローン技術などによって追加のDNA区画を挿入できる環状の二本鎖DNAループを指している。別種のベクターはウイルスベクターであり、ここでウイルス由来のDNA配列またはRNA配列は、(レトロウイルス、複製欠陥レトロウイルス、アデノウイルス、複製欠陥アデノウイルス、およびアデノ随伴ウイルスなどの)ウイルス中に封入するためにベクター内に存在する。ウイルスベクターには、宿主細胞への遺伝子導入のためにウイルスによって運ばれるポリヌクレオチドも含まれる。特定のベクター(例えば、細菌の複製起源を有する細菌ベクターおよびエピソーム哺乳動物ベクター)は、それらが導入される宿主細胞中で自律的な複製を可能とする。他のベクター(例えば、非エピソーム哺乳動物ベクター)は、宿主細胞への導入時に宿主細胞のゲノム中に組み込まれ、それにより、宿主ゲノムと共に複製される。さらに、特定のベクターは、それらが操作可能に連結されている遺伝子の発現を誘導することができる。このようなベクターは、本明細書では「発現ベクター」と呼ばれる。真核生物細胞での発現のための、かつ発現をもたらすベクターは、本明細書では「真核生物発現ベクター」と呼んでもよい。組換えDNA技術で有用な一般的な発現ベクターは、プラスミドの形態である場合が多い。
組換え発現ベクターは、宿主細胞中での核酸の発現に適する形態で本発明の核酸を含んでもよく、このことは、組換え発現ベクターが、発現に使用される宿主細胞の数に基づいて選択されてもよく、かつ発現される核酸配列に操作可能に連結されている1つ以上の調節エレメントを含むことを意味している。組換え発現ベクター内で、「操作可能に連結される」とは、関心のあるヌクレオチド配列を、ヌクレオチド配列の発現を可能にする方法で(例えば、in vitro転写/翻訳システムで、あるいはベクターが宿主細胞に導入される場合の宿主細胞内で)調節エレメントに連結する意味を意図している。有効なベクターとして、レンチウイルスおよびアデノ随伴ウイルスが含まれ、そのベクター種はまた、特定の細胞型を標的とするために選択されてもよい。
組換えおよびクローンの方法に関して、米国特許公開2004-0171156 A1号として2004年9月2日付けで公開された米国特許出願10/815,730号が述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。
「調節エレメント」という用語は、プロモーター、エンハンサー、内部リボソーム侵入部位 (IRES)、および他の発現制御エレメント(例えば、ポリアデニル化シグナルおよびポリ-U配列などの転写終結シグナル)を含むことを意図している。その調節エレメントは、例えば、Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY(発現技術:酵素学での方法)185, Academic Press, San Diego, Calif. (1990)に説明されている。調節エレメントには、多種の宿主細胞でヌクレオチド配列の直接構成的発現を誘導するエレメント、および特定の宿主細胞でのみヌクレオチド配列(例えば、組織特異的調節配列)の発現を誘導するエレメントが含まれる。組織特異的プロモーターは、主に、筋肉、神経細胞、骨、皮膚、血液、特定の器官(例えば肝臓、膵臓)、または特定の細胞型(例えばリンパ球)などの所望の関心のある組織での発現を誘導できる。調節エレメントはまた、細胞周期依存性または発達段階依存性の手法などの時間依存性の手法で発現を誘導でき、このエレメントは組織に特異的または細胞型に特異的であってもよく、あるいはそうでなくてもよい。実施態様によっては、ベクターは、1個以上のpol IIIプロモーター(例えば、1、2、3、4、5個、またはそれ以上のpol IIIプロモーター)、1個以上のpol IIプロモーター(例えば、1、2、3、4、5個、またはそれ以上のpol IIプロモーター)、1個以上のpol Iプロモーター(例えば、1、2、3、4、5個、またはそれ以上のpol Iプロモーター)、またはそれらの組合せを含む。pol IIIプロモーターの例として、限定はされないが、U6およびH1プロモーターが挙げられる。pol IIプロモーターの例として、限定はされないが、レトロウイルス性ラウス肉腫ウイルス (RSV) LTRプロモーター(場合によってはRSVエンハンサーを含む)、サイトメガロウイルス (CMV)プロモーター(場合によってはCMVエンハンサーを含む)(例えば、Boshart et al, Cell, 41:521-530 (1985)を参照)、SV40プロモーター、ジヒドロ葉酸還元酵素プロモーター、β-アクチンプロモーター、ホスホグリセロールキナーゼ (PGK)プロモーター、およびEF1αプロモーターが挙げられる。用語「調節エレメント」には、WPRE、CMVエンハンサー、HTLV-IのLTR中のR-U5’区画(Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988)、SV40エンハンサー、およびウサギβ-グロビンのエクソン2と3の間のイントロン配列(Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981)などのエンハンサーエレメントも含まれる。発現ベクターの設計が、形質転換される宿主細胞の選択、所望の発現水準などの要因に依存してもよいことは当業者なら分かっている。ベクターは、宿主細胞中に導入されて、それにより、本明細書に説明の核酸によってコードされる、融合タンパク質またはペプチドを含む転写産物、タンパク質、またはペプチド(例えば、クラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)転写産物、タンパク質、酵素、それらの変異型、それらの融合タンパク質など)を産出できる。調節配列に関しては、米国特許出願10/491,026号が述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。プロモーターに関しては、国際特許出願WO2011/028929号および米国特許出願12/511,940号が述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。
有効なベクターには、レンチウイルスおよびアデノ随伴ウイルスが含まれ、そのベクター種はまた、特定の細胞型を標的とするために選択されてもよい。
特定の実施態様では、ガイドRNAおよび(任意に改変または変異された)CRISPR酵素(例えばC2c1)のためのバイシストロン性ベクターが使用される。ガイドRNAおよび(任意に改変または変異された)CRISPR酵素のためのバイシストロン性発現ベクターが好ましい。この実施態様では、一般にかつ特に(任意に改変または変異された)CRISPR酵素は、好ましくはCBhプロモーターによって駆動される。RNAは、好ましくは、U6プロモーターなどのPol IIIプロモーターによって駆動されてもよい。理想的には、この2つが組み合わされる。
原核細胞または真核細胞でのCRISPR転写産物(例えば、核酸転写産物、タンパク質、または酵素)の発現のためのベクターを設計できる。例えば、CRISPR転写産物は、大腸菌、(バキュロウイルス発現ベクターを使用する)昆虫細胞、酵母細胞、または哺乳類細胞などの細菌細胞中で発現させることができる。適切な宿主細胞については、Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY (遺伝子発現技術:酵素学での方法)185, Academic Press, San Diego, Calif. (1990)にさらに説明される。あるいは、組換え発現ベクターを、例えば、T7プロモーター調節配列およびT7ポリメラーゼを用いて、in vitroで転写かつ翻訳することができる。
ベクターは、原核生物細胞または原核生物細胞中に導入され、かつ増殖されてもよい。実施態様によっては、原核生物は、真核細胞中に導入されるベクターの複製物を増幅するために用いられ、または(例えば、ウイルスベクターの封入システムの一部としてのプラスミドを増幅して)真核細胞中に導入されるベクターの産生での中間ベクターとして用いられる。実施態様によっては、原核生物を用いてベクターの複製物を増幅し、例えば宿主細胞または宿主生物への送達のための1つ以上のタンパク質の供給源を提供して、1種以上の核酸を発現する。原核生物でのタンパク質の発現は、殆どの場合に、融合タンパク質または非融合タンパク質のいずれかの発現を誘導する構成的なまたは誘導性のプロモーターを含むベクターを用いて大腸菌内で行われる。融合ベクターは、組換えタンパク質のアミノ末端など、その内部にコードされているタンパク質に複数のアミノ酸を付加する。このような融合ベクターは、次の1つ以上の目的に役立てることができる:(i)組換えタンパク質の発現を増強すること;(ii)組換えタンパク質の溶解度を増大すること;および(iii)親和性精製でのリガンドとして作用させて組換えタンパク質の精製を支援すること。多くの場合に、融合発現ベクターでは、タンパク質分解性の切断部位が融合部分と組換えタンパク質の接合部に導入されて、融合タンパク質の精製に続いて融合部分から組換えタンパク質を分離できるようにする。この酵素およびそれらの同族の認識配列として、第Xa因子、トロンビン、およびエンテロキナーゼが含まれる。融合発現ベクターの例として、グルタチオンS転移酵素 (GST)を融合するpGEX(Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40)、pMAL(New England Biolabs, Beverly, Mass.)およびpRIT5(Pharmacia, Piscataway, N.J.)、それぞれ目的の組換えタンパク質に対するマルトースE結合タンパク質またはプロテインAが挙げられる。適切な誘導性の非融合大腸菌発現ベクターの例として、pTrc(Amrann et al., (1988) Gene 69:301-315)およびpET 11d(Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY(発現技術:酵素学での方法)185, Academic Press, San Diego, Calif. (1990) 60-89)が挙げられる。実施態様によっては、ベクターは、酵母発現ベクターである。出芽酵母(Saccharomyces cerivisae)での発現のためのベクターの例として、pYepSec1(Baldari, et al., 1987. EMBO J. 6: 229-234)、pMFa(Kuijan and Herskowitz, 1982. Cell 30: 933-943)、pJRY88(Schultz et al., 1987. Gene 54: 113-123)、pYES2(Invitrogen Corporation, San Diego, Calif.)、およびpicZ(InVitrogen Corp, San Diego, Calif.)が挙げられる。実施態様によっては、ベクターは、バキュロウイルス発現ベクターを使用する昆虫細胞でのタンパク質発現を駆動する。培養昆虫細胞(例えばSF9細胞)でのタンパク質の発現に利用可能なバキュロウイルスベクターには、pAc系列(Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165)およびpVL系列(Lucklow and Summers, 1989. Virology 170: 31-39)が含まれる。
実施態様によっては、ベクターは、哺乳動物発現ベクターを使用して、哺乳動物細胞での1つ以上の配列の発現を駆動することができる。哺乳動物発現ベクターの例として、pCDM8(Seed, 1987. Nature 329: 840)およびpMT2PC(Kaufman, et al., 1987. EMBO J. 6: 187-195)が挙げられる。哺乳類細胞で使用される場合に、発現ベクターの制御機能は、通常1つ以上の調節エレメントによって提供される。例えば、一般的に使用されるプロモーターは、ポリオーマ、アデノウイルス2、サイトメガロウイルス、シミアンウイルス40、および本明細書に開示され当技術分野で既知のその他のウイルスに由来する。原核細胞と真核細胞の両方に適する他の発現システムについては、例えば、Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL(分子クローニング:実験室マニュアル). 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989の第16章および第17章を参照。
実施態様によっては、組換え哺乳動物発現ベクターは、特定の細胞型では優先的に核酸の発現を誘導することができる(例えば、組織特異的な調節エレメントを用いて核酸を発現する)。組織特異的な調節エレメントは当技術分野で知られている。適切な組織特異的プロモーターの非限定的な例として、アルブミンプロモーター(肝臓特異的;Pinkert, et al., 1987. Genes Dev. 1: 268-277)、リンパ系特異的プロモーター(Calame and Eaton, 1988. Adv. Immunol. 43: 235-275)、特にT細胞受容体(Winoto and Baltimore, 1989. EMBO J. 8: 729-733)および免疫グロブリン(Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748)のプロモーター、神経細胞特異的プロモーター(例えば神経細繊維プロモーター;Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477)、膵臓特異的プロモーター(Edlund, et al., 1985. Science 230: 912-916)、および乳腺特異的プロモーター(例えば乳清プロモーター;米国特許4,873,316号および欧州出願特許264,166号)が挙げられる。発達調節プロモーター、例えば、マウスhoxプロモーター(Kessel and Gruss, 1990. Science 249: 374-379)およびα-フェトプロテインプロモーター(Campes and Tilghman, 1989. Genes Dev. 3: 537-546)もまた包含される。これらの原核生物および真核生物のベクターに関して、米国特許6,750,059号が述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。本発明の他の実施態様は、ウイルスベクターの使用に関連してもよく、これに関しては、米国特許出願13/092,085号に述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。組織特異的調節エレメントは当技術分野で知られており、これに関しては米国特許7,776,321号に述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。実施態様によっては、調節エレメントは、CRISPRシステムの1つ以上の要素の発現を駆動するように、CRISPRシステムの1つ以上の要素に操作可能に連結されている。
実施態様によっては、核酸標的化システムの1つ以上の要素の発現を駆動する1つ以上のベクターは、核酸標的化システムの要素の発現が1つ以上の標的部位での核酸標的化複合体の形成を誘導するように、宿主細胞中に導入される。例えば、核酸標的化エフェクター酵素および核酸標的化ガイドRNAおよび/またはtracrは、それぞれ、別のベクターの別の調節エレメントに操作可能に連結できる。核酸標的化システムのRNAは、遺伝子導入核酸標的化エフェクタータンパク質の動物または哺乳動物、例えば、構成的にまたは誘導的にまたは条件付きで核酸標的化エフェクタータンパク質を発現する動物または哺乳動物、あるいは、他の方法で核酸標的化エフェクタータンパク質を発現している動物または哺乳動物、または核酸標的化エフェクタータンパク質を含む細胞を有する動物または哺乳動物に、例えば核酸標的化エフェクタータンパク質をコードする、かつそのタンパク質をin vivoで発現する1つ以上のベクターのその動物への事前投与によって送達することができる。あるいは、同一のまたは異なる調節エレメントから発現される2つ以上の要素を、第1のベクターに含まれない核酸標的化システムの任意の構成要素を提供する1つ以上の追加のベクターとともに単一のベクター内に組み込んでもよい。単一のベクター内に組み込まれる核酸標的化システム要素は、例えば、第2の要素に対する(その「上流」の)5’、または第2の要素に対する(その「下流」の)3’に配置される1つの要素のように、任意の適切な方向に配置されてもよい。1つの要素のコード配列は、第2の要素のコード配列の同一または反対の鎖上に位置し、同一または反対の方向に方向付けされてもよい。実施態様によっては、単一のプロモーターは、(例えば、それぞれが異なるイントロン内、2つ以上が少なくとも1つのイントロン内、または全てが1つのイントロン内にある)1つ以上のイントロン配列内に埋め込まれた、核酸標的化エフェクタータンパク質および核酸標的化ガイドRNAをコードする転写産物の発現を駆動する。実施態様によっては、核酸標的化エフェクタータンパク質および核酸標的化ガイドRNAは、同一プロモーターに操作可能に連結され、かつそれから発現されてもよい。核酸標的化システムの1つ以上の要素を発現させるための送達媒体、ベクター、粒子、ナノ粒子、製剤、およびそれらの成分は、国際特許出願WO 2014/093622 (PCT/US2013/074667)などの前述の文献内で使用されている通りである。実施態様によっては、ベクターは、(「クローン部位」とも呼ばれる)制限エンドヌクレアーゼ認識配列などの1つ以上の挿入部位を含む。実施態様によっては、1つ以上の挿入部位(例えば、約1、2、3、4、5、6、7、8、9、10、またはそれ以上の挿入部位)は、1つ以上のベクターの1つ以上の配列要素の上流および/または下流に位置する。複数の異なるガイド配列が使用される場合に、単一の発現構築物を用いて、細胞内の複数の異なる対応標的配列に核酸標的化活性を標的化することができる。例えば、単一のベクターは、約1、2、3、4、5、6、7、8、9、10、15、20、またはそれ以上のガイド配列を含んでもよい。実施態様によっては、約1、2、3、4、5、6、7、8、9、10、またはそれ以上のそのガイド配列を含有するベクターが提供されてもよく、かつ場合によっては細胞に送達されてもよい。実施態様によっては、ベクターは、核酸標的化エフェクタータンパク質をコードする酵素コード配列に操作可能に連結された調節エレメントを含む。核酸標的化エフェクタータンパク質または1つ以上の核酸標的化ガイドRNAは、別々に送達することができ、好ましくは、これらの少なくとも1つは、粒子複合体を介して送達される。核酸標的化エフェクタータンパク質mRNAは、核酸標的化ガイドRNAに先行して送達されて、核酸標的化エフェクタータンパク質が発現されるための時間を付与できる。核酸標的化エフェクタータンパク質mRNAは、核酸標的化ガイドRNAの投与の1~12時間(好ましくは約2~6時間)前に投与されてもよい。あるいは、核酸標的化エフェクタータンパク質mRNAおよび核酸標的化ガイドRNAは、同時に投与されてもよい。好ましくは、ガイドRNAの第2の促進用量は、核酸標的化エフェクタータンパク質mRNAおよびガイドRNAの初期投与の1~12時間(好ましくは約2~6時間)後に投与されてもよい。核酸標的エフェクタータンパク質mRNAおよび/またはガイドRNAの追加投与は、最も効率的な水準のゲノム改変を達成するために有用である可能性がある。
実施態様によっては、ベクターは、1つ以上の核局在化配列 (NLS)、例えば約1、2、3、4、5、6、7、8、9、10、またはそれ以上のNLSを含むC2c1エフェクタータンパク質をコードする。より具体的には、ベクターは、C2c1エフェクタータンパク質に天然に存在しない1つ以上のNLSを含む。最も具体的には、NLSはC2c1エフェクタータンパク質配列のベクターの5’および/または3’に存在する。実施態様によっては、RNA標的化エフェクタータンパク質は、アミノ末端またはその近傍に約1、2、3、4、5、6、7、8、9、10、またはそれ以上のNLS、カルボキシ末端またはその近傍に約1、2、3、4、5、6、7、8、9、10、またはそれ以上のNLS、あるいはこれらの組合せ(例えば、アミノ末端に0または少なくとも1つ以上のNLS、およびカルボキシ末端に0または1つ以上のNLS)を含む。複数のNLSが存在する場合に、それぞれが他とは独立して選択されてもよく、その結果、単一のNLSが複数の複製物中に存在してもよく、かつ/あるいは1つ以上の複製物中に存在する1つ以上の他のNLSとの組合せで存在してもよい。実施態様によっては、NLSの最も近いアミノ酸がN末端またはC末端からのポリペプチド鎖に沿って約1、2、3、4、5、10、15、20、25、30、40、50、またはそれ以上のアミノ酸以内にある場合に、NLSは、N末端またはC末端の近傍にあるものと見做される。NLSの非限定的な例として、以下に由来するNLS配列が挙げられる:アミノ酸配列PKKKRKV(配列番号462)を有するSV40ウイルスの大規模T抗原のNLS;ヌクレオプラスミン由来のNLS(例えば、配列KRPAATKKAGQAKKKK(配列番号463)を有するヌクレオプラスミン二連NLS);アミノ酸配列PAAKRVKLD(配列番号464)またはRQRRNELKRSP(配列番号465)を有するc-myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号466)を有するhRNPA1 M9 NLS;インポーチンαからのIBBドメインの配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号467);筋腫Tタンパク質の配列VSRKRPRP(配列番号468)およびPPKKARED(配列番号469);ヒトp53の配列PQPKKKPL(配列番号470);マウスc-abl IVの配列SALIKKKKKMAP(配列番号471);インフルエンザウイルスNS1の配列DRLRR(配列番号472)およびPKQKKRK(配列番号473);肝炎ウイルスδ抗原の配列RKLKKKIKKL(配列番号474);マウスMx1タンパク質の配列REKKKFLKRR(配列番号475);ヒトポリ(ADP-リボース)ポリメラーゼの配列KRKGDEVDGVDEVAKKKSKK(配列番号476);およびステロイドホルモン受容体(ヒト)糖質コルチコイドの配列RKCLQAGMNLEARKTKK(配列番号477)。一般に、1つ以上のNLSは、真核細胞の核内で検出可能な量のDNA/RNA標的化Casタンパク質の蓄積を促進するのに十分な強度を有する。一般に、核局在化活性の強度は、核酸標的化エフェクタータンパク質中のNLSの数、使用される特定のNLS、またはこれらの因子の組合せに由来する可能性がある。核内での蓄積の検出は、任意の適切な技術によって実施できる。例えば、検出可能マーカーは、核の位置を検出する手段(例えば、DAPIなどの核に特異的な染色)との組合せなどで細胞内の位置が視覚化できるように、核酸標的化タンパク質に融合されてもよい。細胞核はまた、細胞から単離されてもよく、その内容物は、その後に、免疫組織化学、ウエスタンブロット、または酵素活性測定などのタンパク質を検出するための任意の適切なプロセスによって分析されてもよい。核内の蓄積はまた、核酸標的化Casタンパク質または核酸標的化複合体に曝露されていない対照、あるいは1つ以上のNLSを欠く核酸標的化Casタンパク質に曝露された対照と比較して、核酸標的化複合体の形成効果の測定(例えば、標的配列でのDNAまたはRNAの切断あるいは変異の測定、またはDNAまたはRNA標的化複合体形成および/またはDNAまたはRNA標的化Casタンパク質活性によって影響を受ける改変された遺伝子発現活性の測定)などによって間接的に決定されてもよい。本明細書に説明のC2c1エフェクタータンパク質複合体およびシステムの好ましい実施態様では、コドン最適化C2c1エフェクタータンパク質は、タンパク質のC末端に付着したNLSを含む。特定の実施態様では、その他の局在化タグが、ミトコンドリア、プラスチド、葉緑体、小胞、ゴルジ、(核または細胞)膜、リボソーム、核小体、ER、細胞骨格、空胞、中心体、ヌクレオソーム、顆粒、中心粒などの、例えば細胞小器官の細胞内の特定部位にCasを局在化するために、限定はされないが、Casタンパク質に融合されてもよい。
本発明はまた、非天然起源または遺伝子操作された組成物、または前記組成物の成分をコードする1つ以上のポリヌクレオチド、または治療法での使用のために前記組成物の成分をコードする1つ以上のポリヌクレオチドを含むベクターシステムを提供する。この治療法は、遺伝子またはゲノム編集、または遺伝子治療を含んでもよい。
実施態様によっては、治療法は、標的生物の集団での治療または療法に基づいて設計されたガイド配列を含むCRISPR-Casシステムを含む。実施態様によっては、標的生物集団は、少なくとも1000個体、例えば少なくとも5000個体、例えば少なくとも10000個体、例えば少なくとも50000個体を含む。実施態様によっては、集団全体にわたって最小の配列変異を有する標的部位は、集団の少なくとも99%、好ましくは少なくとも99.9%、より好ましくは少なくとも99.99%が配列変異を含まないことを特徴としている。
本明細書で使用される用語「ハプロタイプ(半数体遺伝子型)」は、単一の親から共に遺伝する生物中での遺伝子群である。本明細書で使用される「ハプロタイプ頻度推定」(「フェージング」としても知られる)は、遺伝子型のデータからのハプロタイプの統計的推定のプロセスを意味する。Toshikazu et al. (Am J Hum Genet. 2003 Feb; 72(2): 384-398)は、本明細書に開示される本発明で使用されてもよいハプロタイプ頻度の推定のための方法を説明している。
本明細書に説明の核酸標的化システム、ベクターシステム、ベクター、および組成物は、タンパク質、核酸切断、核酸編集、核酸組換え、標的核酸の輸送、標的核酸の追跡、標的核酸の単離、標的核酸の視覚化などの遺伝子産物の合成を変更または改変する様々な核酸標的化用途に使用できる。
一般にかつ本明細書全体を通して、用語「ベクター」は、そのベクターが連結されている別の核酸を輸送することができる核酸分子を指す。ベクターには、限定はされないが、一本鎖、二本鎖、または部分的に二本鎖である核酸分子、1つ以上の自由端を含む、自由端を含まない(例えば環状の)核酸分子、DNA、RNA、またはその両方を含む核酸分子、および当技術分野で知られている他種のポリヌクレオチドが含まれる。1種のベクターは「プラスミド」であり、これは、標準的な分子クローン技術などによって、追加のDNA区画を挿入できる環状の二本鎖DNAループを指す。別種のベクターはウイルスベクターであり、ウイルス由来のDNAまたはRNA配列が、ウイルス(例えば、レトロウイルス、複製欠陥レトロウイルス、アデノウイルス、複製欠陥アデノウイルス、およびアデノ随伴ウイルス)に封入するためにベクター中に存在する。ウイルスベクターにはまた、宿主細胞中への遺伝子導入のためにウイルスが運ぶポリヌクレオチドも含まれる。特定のベクターは、それらが導入された宿主細胞中で自律的に複製できる(例えば、細菌の複製起点を有する細菌ベクターおよびエピソーム哺乳動物ベクター)。別のベクター(例えば、非エピソーム哺乳動物ベクター)は、宿主細胞への導入時に宿主細胞のゲノム中に組み込まれ、それにより、宿主ゲノムとともに複製される。さらに、特定のベクターは、それらが機能的に連結されている遺伝子の発現を誘導できる。このようなベクターは、本明細書では「発現ベクター」と呼ばれる。真核細胞中での発現のためのベクターおよび発現をもたらすベクターは、本明細書では「真核生物発現ベクター」と呼んでもよい。組換えDNA技術で有用な一般的な発現ベクターは、多くの場合、プラスミド形態である。
特定の実施態様では、ベクターシステムは、逆の順序でプロモーターガイド発現カセットを含む。
組換え発現ベクターは、宿主細胞での核酸の発現に適する形態の本発明の核酸を含むことができ、このことは、組換え発現ベクターが、発現される核酸配列に操作可能に連結されている、発現に用いられる宿主細胞に基づいて選択され得る1つ以上の調節エレメントを含むことを意味する。
有効なベクターには、レンチウイルスおよびアデノ随伴ウイルスが含まれ、この種のベクターがまた、特定の細胞種を標的とするために選ばれてもよい。
実施態様によっては、核酸標的化システムの1つ以上の要素の発現を駆動する1つ以上のベクターは、核酸標的化システムの要素の発現が1つ以上の標的部位での核酸標的化複合体の形成を誘導するように、宿主細胞中に導入される。例えば、核酸標的化エフェクターモジュールおよび核酸標的化ガイドRNAは、それぞれ、別のベクター上の別の調節エレメントに操作可能に連結できる。核酸標的化システムのRNAは、遺伝子導入核酸標的化エフェクターモジュールの動物または哺乳動物、例えば、構成的にまたは誘導的にまたは条件付きで核酸標的化エフェクターモジュールを発現する動物、あるいは、他の方法で核酸標的化エフェクターモジュールを発現している動物または哺乳動物、または核酸標的化エフェクターモジュールを含む細胞を有する動物または哺乳動物に、例えば核酸標的化エフェクターモジュールをコードするかつin vivoで発現する1つ以上のベクターのその動物への事前投与によって送達することができる。あるいは、同一のまたは異なる調節エレメントから発現される2つ以上の要素を、第1のベクターに含まれない核酸標的化システムの任意の構成要素を提供する1つ以上の追加のベクターとともに単一のベクター内に組み込んでもよい。単一のベクター内に組み込まれた核酸標的化システム要素は、例えば、第2の要素に対する(その「上流」の)5’、または第2の要素に対する(その「下流」の)3’に配置された1つの要素のように、任意の適切な方向に配置されてもよい。1つの要素のコード配列は、第2の要素のコード配列の同一または反対の鎖上に位置し、同一または反対の方向に方向付けされてもよい。実施態様によっては、単一のプロモーターは、(例えば、それぞれが異なるイントロン内、2つ以上が少なくとも1つのイントロン内、または全てが1つのイントロン内にある)1つ以上のイントロン配列内に埋め込まれた、核酸標的化エフェクターモジュールおよび核酸標的化ガイドRNAをコードする転写産物の発現を駆動する。実施態様によっては、核酸標的化エフェクターモジュールおよび核酸標的化ガイドRNAは、同一のプロモーターに操作可能に連結されてもよく、かつそれから発現されてもよい。
本発明はまた、複数の核酸成分を送達するための方法を包含し、それぞれの核酸成分は、異なる関心のある標的遺伝子座に特異的であり、それにより、複数の関心のある標的遺伝子座を改変する。複合体の核酸成分は、1つ以上のタンパク質結合RNAアプタマーを含んでもよい。1つ以上のアプタマーは、バクテリオファージ外皮タンパク質に結合できる可能性がある。バクテリオファージ外皮タンパク質は、Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、およびPRR1を含む群から選択してもよい。好ましい実施態様では、バクテリオファージ外皮タンパク質はMS2である。本発明はまた、30以上、40以上、または50以上のヌクレオチド長である複合体の核酸成分を提供する。
一側面では、本発明は、1つ以上のベクターを含むベクターシステムを提供し、1つ以上のベクターは、(a)本明細書に定義の遺伝子操作されたCRISPRタンパク質をコードするヌクレオチド配列に操作可能に連結された第1の調節エレメント、および場合によっては、(b)ガイド配列、直接反復配列を含むガイドRNAを含む1つ以上の核酸分子をコードする1つ以上のヌクレオチド配列に操作可能に連結された第2の調節エレメントを含み、場合によっては、構成要素(a)および(b)は同一または異なるベクター上に位置する。
本発明はまた、遺伝子操作された非天然起源のクラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)-CRISPR会合(Casエフェクターモジュール)(CRISPR-Casエフェクターモジュール)ベクターシステムを提供し、このベクターシステムは、(a)本明細書の本発明の構築物のいずれかの非天然起源のCRISPR酵素をコードするヌクレオチド配列に操作可能に連結された第1の調節エレメント、および(b)ガイド配列、直接反復配列を含む1つ以上のガイドRNAをコードする1つ以上のヌクレオチド配列に操作可能に連結された第2の調節エレメントを含み、構成要素(a)および(b)は、同一または異なるベクター上に位置し、CRISPR複合体が形成される。ガイドRNAは標的ポリヌクレオチド遺伝子座を標的とし、酵素はポリヌクレオチド遺伝子座を改変して、CRISPR複合体中の酵素は、未改変酵素と比較して、1つ以上の非特異的標的遺伝子座を改変する能力が低下している、かつ/あるいは、CRISPR複合体中の酵素は、未改変の酵素と比較して1つ以上の標的遺伝子座を改変する能力が向上している。
本明細書で使用されるCRISPR CasエフェクターモジュールまたはCRISRPエフェクターモジュールは、限定はされないがC2c1を含む。実施態様によっては、CRISPR-Casエフェクターモジュールは、遺伝子操作されていてもよい。
このシステムでは、構成要素(II)は、ガイド配列、直接反復配列を含むポリヌクレオチド配列に操作可能に連結された第1の調節エレメントを含んでもよく、構成要素(II)は、CRISPR酵素をコードするポリヌクレオチド配列に操作可能に連結された第2の調節エレメントを含んでもよい。このシステムでは、該当する場合は、ガイドRNAはキメラRNAを含んでもよい。
このシステムでは、構成要素(I)は、ガイド配列および直接反復配列に操作可能に連結された第1の調節エレメントを含んでもよく、構成要素(II)は、CRISPR酵素をコードするポリヌクレオチド配列に操作可能に連結された第2の調節エレメントを含んでもよい。このシステムは、複数のガイドRNAを含んでもよく、各ガイドRNAは、多重性が存在する異なる標的を有する。構成要素(a)および(b)は同一のベクター上にあってもよい。
ベクターを含む任意のこのシステムでは、1つ以上のベクターは、1つ以上のレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、または単純ヘルペスウイルスなどの1つ以上のウイルスベクターを含んでもよい。
調節エレメントを含む任意のこのシステムでは、前記調節エレメントのうちの少なくとも1つは、組織特異的プロモーターを含んでもよい。組織特異的プロモーターは、哺乳動物の血液細胞中で、哺乳動物の肝細胞中で、または哺乳動物の眼の中で発現を誘導してもよい。
上記の組成物またはシステムのいずれかで、直接反復配列は、1つ以上のタンパク質相互作用RNAアプタマーを含んでもよい。1つ以上のアプタマーは、四塩基ループ中に配置されてもよい。1つ以上のアプタマーは、MS2バクテリオファージ外皮タンパク質に結合できる可能性がある。
上記の組成物またはシステムのいずれかで、細胞は真核細胞または原核細胞であってもよい。CRISPR複合体は細胞内で操作可能であり、それによってCRISPR複合体中の酵素は、未改変の酵素と比較して、細胞の1つ以上の非特異的標的遺伝子座を改変する能力が低下している、かつ/あるいはCRISPR複合体中の酵素は、未改変の酵素と比較して、1つ以上の標的遺伝子座を改変する能力が向上している。
本発明はまた、上記の組成物のいずれかの、または上記のシステムのいずれかからのCRISPR複合体を提供する。
本発明はまた、細胞内の関心のある遺伝子座を改変する方法を提供し、この方法は、その細胞を本明細書に説明の遺伝子操作されたCRISPR酵素(例えば、遺伝子操作されたCasエフェクターモジュール)もしくは組成物のいずれかと、または本明細書に説明のシステムもしくはベクターシステムのいずれかと接触させることを含み、あるいはその細胞は、細胞内に存在する本明細書に説明のCRISPR複合体のいずれかを含む。この方法では、その細胞は、原核生物または真核生物の細胞、好ましくは真核生物の細胞であってもよい。この方法では、生物はその細胞を含んでいてもよい。この方法では、生物はヒトまたはその他の動物でなくてもよい。
特定の実施態様では、本発明はまた、非天然起源の遺伝子操作された組成物(例えば、AAVベクターに適合できるC2c1または任意のCasタンパク質)を提供する。参照により本明細書に組み込まれる米国特許8,697,359号の図19A、19B、19C、19D、および20A~Fを参照して、使用され得るその他のタンパク質の一覧および指針が提供される。
この方法はどれも、ex vivoまたはin vitroであってもよい。
特定の実施態様では、前記ガイドRNAまたはC2c1エフェクターモジュールのうちの少なくとも1つをコードするヌクレオチド配列は、関心のある遺伝子のプロモーターを含む調節エレメントと細胞内で操作可能に接続され、それにより、少なくとも1つのCRISPR-Casエフェクターモジュールシステム構成要素の発現は、関心のある遺伝子のプロモーターによって駆動される。「操作可能に接続される」とは、ガイドRNAおよび/またはCasエフェクターモジュールをコードするヌクレオチド配列が、本明細書の他の場所でも参照されるように、ヌクレオチド配列の発現を可能にする手法で調節エレメントに連結される意味を意図する。用語「調節エレメント」は、本明細書の他の場所でも説明されている。本発明によれば、調節エレメントは、好ましくは関心のある内因性遺伝子のプロモーターなどの関心のある遺伝子のプロモーターを含む。特定の実施態様では、プロモーターは、その内因性ゲノム位置に在る。そのような実施態様では、CRISPRおよび/またはCasエフェクターモジュールをコードする核酸は、その天然のゲノム位置で関心のある遺伝子のプロモーターの転写制御下にある。特定の他の実施態様では、プロモーターは、ベクターまたはプラスミドなどの(別の)核酸分子、または他の染色体外核酸上に提供され、すなわち、プロモーターは、その天然のゲノム位置には提供されない。特定の実施態様では、プロモーターは、非天然のゲノム位置にゲノムとして組み込まれている。
本発明はまた、哺乳動物細胞での関心のあるゲノム遺伝子座の発現を変更する方法を提供し、この方法は、細胞を、本明細書に説明の遺伝子操作されたCRISPR酵素(例えば、遺伝子操作されたCasエフェクターモジュール)、組成物、システム、またはCRISPR複合体と接触させること、それによりCRISPR-Casエフェクターモジュール(ベクター)を送達しかつCRISPR-Casエフェクターモジュール複合体を形成させて標的に結合させること、およびゲノム遺伝子座の発現が変化したか、例えば、発現が増強または減弱されたか、あるいは遺伝子産物が改変されたかを判断することを含む。
本発明はさらに、本明細書に説明の本発明によるCRISPR酵素の相同分子種であるCasエフェクターモジュールあるいは変異または改変されたCasエフェクターモジュールに変異を引き起こす方法を提供し、この方法は、その相同分子種がDNA、RNA、gRNAなどの核酸分子かつ/あるいは改変および/または変異のための本明細書に説明の本発明によるCRISPR酵素中の本明細書で特定されるアミノ酸に類似または対応するアミノ酸に近接しているか、または接触しているかについてアミノ酸を見極めること、ならびに改変および/または変異を含む、それらからなる、または本質的にそれらからなる相同分子種を合成または調製または発現すること、あるいは本明細書に説明のように変異させること、例えば中性のアミノ酸を例えばアラニンのような正に帯電した帯電アミノ酸に、例えば改変すること、例えば変更または変異させることを含む。そのように改変された相同分子種は、CRISPR-Casエフェクターモジュールシステムで使用でき、それを発現する核酸分子は、分子を送達するか、または本明細書で説明のCRISPR-Casエフェクターモジュールシステムの構成要素をコードするベクターシステム中で使用されてもよい。
一側面では、本発明は、本明細書に説明の1つ以上の構成要素を含むキットを提供する。実施態様によっては、このキットは、ベクターシステムおよびキットを使用するための説明書を含む。実施態様によっては、このベクターシステムは、(a)直接反復配列およびDR配列の下流に1つ以上のガイド配列を挿入するための1つ以上の挿入部位に操作可能に連結された第1の調節エレメントを含み、発現されると、ガイド配列は真核細胞内の標的配列へのCRISPR-Casエフェクターモジュール複合体の標的特異的結合を誘導し、CRISPR-Casエフェクターモジュール複合体は、(1)標的配列にハイブリダイズされるガイド配列、(2)DR配列、および(3)tracr配列と複合化したCasエフェクターモジュールを含み、このベクターシステムはかつ/あるいは(b)核局在化配列を含む前記Casエフェクターモジュールをコードする酵素コード配列に操作可能に連結された第2の調節エレメントを含み、好ましくは、これは分割Casエフェクターモジュールを含む。実施態様によっては、キットは、システムの同じまたは異なるベクターに配置された構成要素(a)および(b)を含む。実施態様によっては、構成要素(a)はさらに、第1の調節エレメントに操作可能に連結された2つ以上のガイド配列を含み、発現されると、2つ以上のガイド配列のそれぞれは、CRISPR-Casエフェクターモジュール複合体の真核細胞中の異なる標的配列への配列特異的結合を誘導する。tracrは、ガイド(スペーサー)および直接反復配列と同じポリヌクレオチドに融合(またはコード)されていても、されていなくてもよい。
一側面では、本発明は、真核細胞中の標的ポリヌクレオチドを改変する方法を提供する。実施態様によっては、この方法は、CRISPR-Casエフェクターモジュール複合体が標的ポリヌクレオチドに結合して前記標的ポリヌクレオチドの切断をもたらし、それにより標的ポリヌクレオチドを改変できることを含み、CRISPR-Casエフェクターモジュール複合体は、前記標的ポリヌクレオチド内の標的配列にハイブリダイズされたガイド配列と複合化されたCasエフェクターモジュールを含み、前記ガイド配列は直接反復配列に連結されている。実施態様によっては、前記切断は、前記Casエフェクターモジュールによって標的配列の位置で1本鎖または2本鎖を切断することを含み、この複合体には、分割されたCasエフェクターモジュールが含まれる。実施態様によっては、前記切断は、標的遺伝子の転写の減弱をもたらす。実施態様によっては、この方法はさらに、外因性鋳型ポリヌクレオチドとの相同組換えによって前記切断された標的ポリヌクレオチドを修復することを含み、前記修復は、前記標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失、または置換を含む変異をもたらす。実施態様によっては、前記変異は、標的配列を含む遺伝子から発現されるタンパク質に1つ以上のアミノ酸変化をもたらす。実施態様によっては、この方法はさらに、1つ以上のベクターを前記真核細胞に送達することを含み、1つ以上のベクターは、CasエフェクターモジュールおよびDR配列に連結されたガイド配列のうちの1つ以上の発現を駆動する。実施態様によっては、前記ベクターは、対象中の真核細胞に送達される。実施態様によっては、前記改変は、細胞培養物中の前記真核細胞内で起こる。実施態様によっては、この方法はさらに、前記改変に先立って前記真核細胞を対象から単離することを含む。実施態様によっては、この方法はさらに、前記真核細胞および/またはそれに由来する細胞を前記対象に戻すことを含む。一側面では、本発明は、真核細胞中の標的ポリヌクレオチドを改変または編集する方法を提供する。実施態様によっては、この方法は、CRISPR-Casエフェクターモジュール複合体が標的ポリヌクレオチドに結合してDNA塩基編集をもたらすことを含み、CRISPR-Casエフェクターモジュール複合体は、前記標的ポリヌクレオチド内の標的配列にハイブリダイズされたガイド配列と複合化したCasエフェクターモジュールを含み、前記ガイド配列は直接反復配列に連結されている。実施態様によっては、Casエフェクターモジュールは、触媒的に不活性なCRISPR-Casタンパク質を含む。実施態様によっては、ガイド配列は、標的配列とガイド配列との間に形成されたDNA/RNAヘテロ二本鎖に1つ以上の不一致を導入するように設計されている。特定の実施態様では、不一致はA-C不一致である。実施態様によっては、Casエフェクターは、1つ以上の機能ドメインと(例えば、融合タンパク質または適切なリンカーを介して)会合していてもよい。実施態様によっては、エフェクタードメインは、加水分解性脱アミノ化を介する内因性編集を媒介する1つ以上のシチジンデアミナーゼまたはアデノシンデアミナーゼを含む。
一側面では、本発明は、真核細胞中のポリヌクレオチドの発現を改変する方法を提供する。実施態様によっては、この方法は、CRISPR-Casエフェクターモジュール複合体がポリヌクレオチドに結合することを可能にし、その結果、前記結合が前記ポリヌクレオチドの発現の増強または減弱をもたらすことを含む。CRISPR-Casエフェクターモジュール複合体は、前記ポリヌクレオチド内の標的配列にハイブリダイズされたガイド配列と複合化したCasエフェクターモジュールを含み、前記ガイド配列は、直接反復配列に連結され、この複合体には、分割されたCasエフェクターモジュールが含まれてもよい。実施態様によっては、この方法はさらに、1つ以上のベクターを前記真核細胞に送達することを含み、1つ以上のベクターは、CasエフェクターモジュールおよびDR配列に連結されたガイド配列のうちの1つ以上の発現を駆動する。
一側面では、本発明は、真核細胞中の標的転写産物を改変または編集する方法を提供する。実施態様によっては、この方法は、CRISPR-Casエフェクターモジュール複合体が標的ポリヌクレオチドに結合してRNA塩基編集をもたらすことを含み、CRISPR-Casエフェクターモジュール複合体は、前記標的ポリヌクレオチド内の標的配列にハイブリダイズされたガイド配列と複合化したCasエフェクターモジュールを含み、前記ガイド配列は直接反復配列に連結されている。実施態様によっては、Casエフェクターモジュールは、触媒的に不活性なCRISPR-Casタンパク質を含む。実施態様によっては、ガイド配列は、標的配列とガイド配列との間に形成されたRNA/RNA二重鎖に1つ以上の不一致を導入するように設計されている。特定の実施態様では、不一致はA-C不一致である。実施態様によっては、Casエフェクターは、1つ以上の機能ドメインと(例えば、融合タンパク質または適切なリンカーを介して)会合していてもよい。実施態様によっては、エフェクタードメインは、加水分解性脱アミノ化を介する内因性編集を媒介する1つ以上のシチジンデアミナーゼまたはアデノシンデアミナーゼを含む。特定の実施態様では、エフェクタードメインは、RNA (ADAR)ファミリーの酵素に作用するアデノシンデアミナーゼを含む。特定の実施態様では、アデノシンデアミナーゼタンパク質またはその触媒ドメインは、RNA中のアデノシンまたはシチジンを脱アミノ化でき、またはRNA特異的アデノシンデアミナーゼであり、かつ/あるいは細菌、ヒト、頭足類、またはショウジョウバエのアデノシンデアミナーゼタンパク質またはその触媒ドメインであり、好ましくはTadA、より好ましくはADAR、場合によってはhuADAR、場合によっては(hu)ADAR1または(hu)ADAR2、好ましくはhuADAR2、あるいはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、ヒト、ラット、またはヤツメウナギのシチジンデアミナーゼである。実施態様によっては、シチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体 (APOBEC)ファミリーデアミナーゼ、活性化誘導デアミナーゼ (AID)、またはシチジンデアミナーゼ1 (CDA1)である。
本出願は、関心のある標的DNA配列を改変することに関する。
本発明のさらなる側面は、予防処置または治療処置で使用するために本明細書で想定される方法および組成物に関し、好ましくは、前記関心のある標的遺伝子座がヒトまたは動物内にあり、かつアデニンまたはシチジンを関心のある標的DNA配列内で改変する方法に関し、この方法は、前記標的DNAに上述の組成物を送達することを含む。特定の実施態様では、CRISPRシステムおよびアデノシンデアミナーゼ、またはその触媒ドメインは、1つ以上のポリヌクレオチド分子として、リボ核タンパク質複合体として、場合によっては粒子、小胞、または1つ以上のウイルスベクターを介して送達される。特定の実施態様では、この組成物は、病原性のG→AまたはC→T点変異を含む転写産物によって引き起こされる疾患の治療または予防に使用するものである。特定の実施態様では、従って、本発明は治療に使用する組成物を含む。これにより、これらの方法はin vivo、ex vivo、またはin vitroで実施できることを意味する。特定の実施態様では、これらの方法は、動物またはヒトの身体への処置方法ではなく、またはヒト細胞の生殖系の遺伝的同一性を改変するための方法でもない。特定の実施態様では、この方法を実施する場合に、標的DNAはヒトまたは動物の細胞内に含まれてはいない。特定の実施態様では、標的がヒトまたは動物の標的である場合に、この方法は、ex vivoまたはin vitroで実施される。
本発明のさらなる側面は、予防処置または治療処置で使用するために本明細書で想定される方法に関し、好ましくは前記関心のある標的がヒトまたは動物内にあり、かつ関心のある標的DNA配列中のアデニンまたはシチジンを改変する方法に関し、この方法は、前記標的RNAに上述の組成物を送達することを含む。特定の実施態様では、CRISPRシステムおよびアデノシンデアミナーゼ、またはその触媒ドメインは、1つ以上のポリヌクレオチド分子として、リボ核タンパク質複合体として、場合によっては粒子、小胞、または1つ以上のウイルスベクターを介して送達される。特定の実施態様では、この組成物は、病原性のG→AまたはC→T点変異を含む転写産物によって引き起こされる疾患の治療または予防に使用するものである。特定の実施態様では、本発明は治療に使用する組成物を含む。これにより、これらの方法はin vivo、ex vivo、またはin vitroで実施できることを意味する。特定の実施態様では、これらの方法は、動物またはヒトの身体への処置方法ではなく、またはヒト細胞の生殖系の遺伝的同一性を改変するための方法でもない。特定の実施態様では、この方法を実施する場合に、標的DNAはヒトまたは動物の細胞内に含まれてはいない。特定の実施態様では、標的がヒトまたは動物の標的である場合に、この方法は、ex vivoまたはin vitroで実施される。
本発明はまた、標的化された脱アミノ化により疾患を治療または予防する方法、または異形を誘発する疾患を治療または予防する方法に関する。例えば、Aの脱アミノ化により、病原性のG→AまたはC→T点変異を含む転写産物によって引き起こされる疾患を治療できる。本発明で治療または予防できる疾患の例として、癌、マイヤーゴーリン症候群、ゼッケル症候群4、ジュベール症候群5、レーバー先天性黒内障10、シャルコー・マリー・トゥース病2型、アッシャー症候群2C型、脊髄小脳失調症28、QT延長症候群2、シェーグレン・ラルソン症候群、遺伝性フルクトース尿症、神経芽細胞腫、カルマン症候群1、および異染性白質ジストロフィーが挙げられる。
一側面では、本発明は、変異した疾患遺伝子を含むモデル真核細胞を生成する方法を提供する。実施態様によっては、疾患遺伝子は、疾患を有するまたは発症するリスクの増大に関連する任意の遺伝子である。実施態様によっては、この方法は、(a)Casエフェクターモジュールおよび直接反復配列に連結されたガイド配列のうちの1つ以上の発現を駆動する1つ以上のベクターを真核細胞中に導入すること、および(b)CRISPR-Casエフェクターモジュール複合体が標的ポリヌクレオチドに結合して、前記疾患遺伝子内の標的ポリヌクレオチドの切断をもたらすことを含み、ここでCRISPR-Casエフェクターモジュール複合体は、(1)標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列、(2)DR配列、および(3)tracr配列と複合化したCasエフェクターモジュールを含み、それにより、変異した疾患遺伝子を含むモデル真核細胞を生成する。この複合体には、分割されたCasエフェクターモジュールを含む。実施態様によっては、前記切断は、前記Casエフェクターモジュールによって標的配列の位置で1本鎖または2本鎖を切断することを含む。好ましい実施態様では、鎖切断は、5’オーバーハングを伴うねじれ型の切断である。実施態様によっては、前記切断は、標的遺伝子の転写の減弱をもたらす。実施態様によっては、この方法はさらに、外因性鋳型ポリヌクレオチドとの相同組換えによって前記切断された標的ポリヌクレオチドを修復することを含み、前記修復は、前記標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失、または置換を含む変異をもたらす。実施態様によっては、前記変異は、標的配列を含む遺伝子からのタンパク質発現に1つ以上のアミノ酸変化をもたらす。実施態様によっては、モデル真核細胞は、変異した疾患遺伝子を含み、この変異は、5’オーバーハングを伴うねじれ型の二本鎖切断によって導入される。特定の実施態様では、5’オーバーハングは7ヌクレオチド長である。実施態様によっては、モデル真核細胞は、変異した疾患遺伝子を含み、この変異は、HDRを介してねじれ型の5’オーバーハングにDNA挿入物によって導入される。実施態様によっては、モデル真核細胞は、変異した疾患遺伝子を含み、この変異は、NHEJを介してねじれ型の5’オーバーハングにDNA挿入物によって導入される。実施態様によっては、モデル真核細胞は、CRISPR-C2c1システムによって導入された外因性DNA配列挿入を含む。特定の実施態様では、CRISPR-C2c1システムは、5’末端および3’末端の両方にガイド配列が隣接する外因性DNAを含む。実施態様によっては、モデル真核細胞は、変異した疾患遺伝子を含み、変異cは、特定の実施態様ではねじれ型の5’オーバーハングにDNA挿入物によって導入され、Casエフェクターモジュールは、C2c1タンパク質またはその触媒ドメインを含み、PAM配列はT富化配列である。特定の実施態様では、PAMは5’-TTNまたは5’-ATTNであり、ここでNは任意のヌクレオチドである。特定の実施態様では、PAMは5’-TTGである。特定の実施態様では、モデル真核細胞は、癌に関連する変異遺伝子を含む。特定の実施態様では、モデル真核細胞は、子宮頸部上皮内腫瘍 (CIN)中のヒトパピローマウイルス(HPV)駆動型の発癌に関連する変異疾患遺伝子を含む。他の特定の実施態様では、モデル真核細胞は、パーキンソン病、嚢胞性線維症、心筋症、および虚血性心疾患に関連する変異疾患遺伝子を含む。
一側面では、本発明は、1つ以上の細胞内の遺伝子に1つ以上の変異を導入して1つ以上の細胞を選択する方法を提供し、この方法は、1つ以上のベクターを細胞内に導入することを含み、1つ以上のベクターは、Casエフェクターモジュール、直接反復配列に連結されたガイド配列、および編集鋳型のうちの1つ以上の発現を駆動し、この編集鋳型は、Casエフェクターモジュールの切断を無効にする1つ以上の変異を含む。この方法はさらに、編集鋳型と細胞内の標的ポリヌクレオチドとの相同組換えを可能にすること、およびCRISPR-Casエフェクターモジュール複合体が標的ポリヌクレオチドに結合して、前記遺伝子内の標的ポリヌクレオチドの切断をもたらすことを含み、CRISPR-Casエフェクターモジュール複合体は、(1)標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列および(2)直接反復配列と複合化したCasエフェクターモジュールを含み、CasエフェクターモジュールすなわちCRISPR-Casエフェクターモジュール複合体の標的ポリヌクレオチドへの結合は細胞死を誘発し、それによって1つ以上の変異が導入された1つ以上の細胞が選択されることを可能にする。この複合体には、分割されたCasエフェクターモジュールが含まれる。本発明の別の好ましい実施態様では、選択された細胞は真核細胞であってもよい。本発明の側面は、選択マーカーまたは逆選択システムを含む2段階工程を必要とせずに、特定の細胞の選択を可能にする。
一側面では、本発明は、改変または編集された遺伝子を含む真核細胞を生成する方法を提供する。実施態様によっては、改変または編集された遺伝子は、疾患遺伝子である。実施態様によっては、この方法は、(a)1つ以上のベクターを真核細胞中に導入することを含み、1つ以上のベクターは、Casエフェクターモジュール、および直接反復配列に連結されたガイド配列のうちの1つ以上の発現を駆動し、Casエフェクターモジュールは、塩基編集を媒介する1つ以上のエフェクタードメインに会合し、かつこの方法は(b)CRISPR-Casエフェクターモジュール複合体が標的ポリヌクレオチドに結合して、前記疾患遺伝子内の標的ポリヌクレオチドの塩基編集をもたらすことを含み、CRISPR-Casエフェクターモジュール複合体は、標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列と複合化したCasエフェクターモジュールを含み、ガイド配列は、ガイド配列と標的配列との間に形成されたDNA/RNAヘテロ二本鎖またはRNA/RNA二重鎖間に1つ以上の不一致を導入するように設計されてもよい。特定の実施態様では、この不一致はA-C不一致である。実施態様によっては、Casエフェクターは、1つ以上の機能ドメインと(例えば、融合タンパク質または適切なリンカーを介して)会合していてもよい。実施態様によっては、エフェクタードメインは、加水分解性脱アミノ化を介する内因性編集を媒介する1つ以上のシチジンデアミナーゼまたはアデノシンデアミナーゼを含む。特定の実施態様では、エフェクタードメインは、RNA (ADAR)ファミリーの酵素に作用するアデノシンデアミナーゼを含む。特定の実施態様では、アデノシンデアミナーゼタンパク質またはその触媒ドメインは、RNA中のアデノシンまたはシチジンを脱アミノ化でき、またはRNA特異的アデノシンデアミナーゼであり、かつ/あるいは細菌、ヒト、頭足類、またはショウジョウバエアデノシンデアミナーゼタンパク質またはその触媒ドメイン、好ましくはTadA、より好ましくはADAR、場合によってはhuADAR、場合によっては(hu)ADAR1または(hu)ADAR2、好ましくはhuADAR2、あるいはその触媒ドメインである。実施態様によっては、シチジンデアミナーゼは、ヒト、ラット、またはヤツメウナギのシチジンデアミナーゼである。実施態様によっては、シチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体 (APOBEC)ファミリーデアミナーゼ、活性化誘導デアミナーゼ (AID)、またはシチジンデアミナーゼ1 (CDA1)である。
さらなる側面は、上記の方法から得られる、または得ることが可能な単離された細胞、かつ/あるいは上記の組成物または前記改変された細胞の後代を含む単離された細胞に関し、好ましくは、前記細胞は、この方法に供されていない対応する細胞に対比して、関心のある前記標的RNA中の前記アデニンの代わりにヒポキサンチンまたはグアニンを含む。特定の実施態様では、この細胞は真核細胞、好ましくはヒトまたはヒト以外の動物細胞であり、場合によっては治療用T細胞または抗体産生B細胞であり、あるいは前記細胞は植物細胞である。さらなる側面は、前記改変された細胞またはその後代を含むヒト以外の動物または植物を提供する。さらに別の側面は、治療、好ましくは細胞治療で使用するための上述のように改変された細胞を提供する。
実施態様によっては、改変された細胞は、CAR-T療法に適するT細胞などの治療用T細胞である。この改変は、限定はされないが、免疫チェックポイント受容体(例えばPDA、CTLA4)の発現の低下、HLAタンパク質(例えばB2M、HLA-A)の発現の低下、および内因性TCRの発現の低下を含む1つ以上の望ましい形質を治療用T細胞にもたらすことができる。
本発明はさらに、それを必要とする患者に本明細書に説明の改変された細胞を投与することを含む細胞療法のための方法に関し、改変された細胞の存在により患者の疾患を治療する。一実施態様では、細胞療法のための改変された細胞は、腫瘍細胞を認識および/または攻撃することができるCAR-T細胞である。別の実施態様では、細胞療法のための改変された細胞は、神経幹細胞、間葉系幹細胞、造血幹細胞、またはiPSC細胞などの幹細胞である。
好ましくは縦列に配置された複数のガイドRNAを含むCasエフェクターモジュール、複合体、またはシステムを含む組成物、あるいは好ましくは縦列に配置された複数のガイドRNAを含むCasエフェクターモジュール、複合体、またはシステムをコードする、またはそれらを含むポリヌクレオチドまたはベクターが、本明細書の他の場所に定義の治療方法での使用のために提供される。その組成物を含むキット部品が提供されてもよい。その治療方法のための薬剤の製造での前記組成物の使用もまた提供される。検査でのCasエフェクターモジュールCRISPRシステムの使用もまた本発明によって提供され、例えば、その検査は機能獲得型の検査である。遺伝子を人為的に過剰発現させる細胞は、例えば負帰還ループによって、時間の経過とともに遺伝子を下方制御することができる(平衡を再構築できる)。検査が始まる時点までに、未調節の遺伝子は再び減少してしまうかもしれない。誘導性Casエフェクターモジュール活性因子を使用すると、検査の直前に転写を誘導できるので、偽陰性の的中の可能性を最小限に抑えることができる。従って、検査、例えば機能獲得型の検査での本発明の使用により、偽陰性の結果の可能性を最小限に抑えることができる。
別の側面では、本発明は、1つ以上のベクターを含む遺伝子操作された非天然起源のベクターシステムを提供し、このベクターは、遺伝子産物をコードするDNA分子をそれぞれ特異的に標的とする複数のCas12b CRISPRシステムガイドRNAに操作可能に連結された第1の調節エレメント、およびCRISPRタンパク質をコードするように操作可能に連結された第2の調節エレメントを含む。両方の調節エレメントは、システムの同じベクターまたは異なるベクターに配置されてもよい。複数のガイドRNAは、細胞内で複数の遺伝子産物をコードする複数のDNA分子を標的とし、CRISPRタンパク質は、遺伝子産物をコードする複数のDNA分子を切断してもよく(一方または両方の鎖を切断してもよく、またはヌクレアーゼ活性を実質的に持たなくてもよく)、それによって複数の遺伝子産物の発現が変更される。ここでCRISPRタンパク質と複数のガイドRNAは自然には同時に発生しない。好ましい実施態様では、CRISPRタンパク質は、Cas12bタンパク質であり、場合によっては、真核細胞での発現のために最適化されたコドンである。好ましい実施態様では、真核細胞は、哺乳動物細胞、植物細胞、または酵母細胞であり、より好ましい実施態様では、哺乳動物細胞はヒト細胞である。本発明のさらなる実施態様では、複数の遺伝子産物のそれぞれの発現は、変更され、好ましくは減弱される。
一側面では、本発明は、1つ以上のベクターを含むベクターシステムを提供する。実施態様によっては、このシステムは、(a)直接反復配列に操作可能に連結された第1の調節エレメント、および直接反復配列の上流または下流(該当のどちらにも)に1つ以上のガイド配列を挿入するための1つ以上の挿入部位を含み、発現されると、1つ以上のガイド配列は、真核細胞内の1つ以上の標的配列へのCRISPR複合体の配列特異的結合を誘導し、CRISPR複合体は、1つ以上の標的配列にハイブリダイズされる1つ以上のガイド配列と複合化するCas12b酵素を含み、かつこのシステムは、(b)前記Cas12b酵素をコードする酵素コード配列に操作可能に連結され、好ましくは少なくとも1つの核局在化配列および/または少なくとも1つのNESを含む第2の調節エレメントを含み、構成要素(a)および(b)は、このシステムの同じまたは異なるベクターに配置される。該当する場合は、tracr配列も提供されてもよい。実施態様によっては、構成要素(a)はさらに、第1の調節エレメントに操作可能に連結された2つ以上のガイド配列を含み、発現されると、2つ以上のガイド配列のそれぞれは、Cas12b CRISPR複合体の真核細胞中の異なる標的配列への配列特異的結合を誘導する。実施態様によっては、CRISPR複合体は、真核細胞の核内または核外での前記Cas12b CRISPR複合体の検出可能な量の蓄積を駆動するのに十分な強度の1つ以上の核局在化配列および/または1つ以上のNESを含む。実施態様によっては、第1の調節エレメントは、ポリメラーゼIIIプロモーターである。実施態様によっては、第2の調節エレメントは、ポリメラーゼIIプロモーターである。実施態様によっては、ガイド配列のそれぞれは、少なくとも16、17、18、19、20、25ヌクレオチド長、または16~30、または16~25、または16~20ヌクレオチド長である。
組換え発現ベクターは、宿主細胞中での核酸の発現に適する形態で、本明細書に定義の複数の標的化に使用するためのCas12b酵素、システム、または複合体をコードするポリヌクレオチドを含むことができ、このことは、組換え発現ベクターが1つ以上の調節エレメントを含むことを意味し、このベクターは、発現される核酸配列に操作可能に連結されている、発現に用いられる宿主細胞に基づいて選択されてもよい。組換え発現ベクター内で、「操作可能に連結」とは、関心のあるヌクレオチド配列が、ヌクレオチド配列の発現を可能にする方式で(例えば、in vitro転写/翻訳システム内で、またはベクターが宿主細胞に導入される場合の宿主細胞内で)調節エレメントに連結されるとの意味を意図する。
実施態様によっては、宿主細胞は、本明細書に定義の複数の標的化で使用するためのCas12b酵素、システム、または複合体をコードするポリヌクレオチドを含む1つ以上のベクターにより一過的または非一過的に遺伝子導入される。実施態様によっては、細胞は、それが対象内で自然に発生するように遺伝子導入される。実施態様によっては、遺伝子導入された細胞は、対象から採取される。実施態様によっては、細胞は、細胞株など、対象から採取された細胞に由来する。組織培養のための多種多様な細胞株は、当技術分野で知られていて、本明細書の他の場所で例示されている。細胞株は、当業者には既知の様々な供給源から入手可能である(例えば、米国培養細胞系統保存機関(ATCC; Manassus, Va.)を参照)。実施態様によっては、本明細書に定義の複数の標的化で使用するためのCas12b酵素、システム、または複合体をコードするポリヌクレオチドを含む1つ以上のベクターにより遺伝子導入された細胞を用いて、1つ以上のベクター由来の配列を含む新規の細胞株を構築する。実施態様によっては、(例えば、1つ以上のベクターの一過的な遺伝子導入またはRNAでの遺伝子導入による)本明細書に説明の複数の標的化で使用するためのCas12b CRISPRシステムまたは複合体の成分により一過的に遺伝子導入され、かつCas12b CRISPRシステムまたは複合体の活性を介して改変された細胞を用いて、改変を含むが他の外因性配列を欠く細胞を含む新規の細胞株を構築する。実施態様によっては、本明細書に定義の複数の標的化で使用するためのCas12b酵素、システム、または複合体をコードするポリヌクレオチドを含む1つ以上のベクターにより一過的または非一過的に遺伝子導入された細胞、またはその細胞に由来する細胞株を、1つ以上の試験化合物の評価に使用する。
用語「調節エレメント」は、本明細書の他の場所に定義の通りである。
有利なベクターには、レンチウイルスおよびアデノ随伴ウイルスが含まれ、そのベクターの型はまた、特定の細胞型を標的とするために選択できる。
一側面では、本発明は真核生物宿主細胞を提供し、この細胞は、(a)直接反復配列に操作可能に連結された第1の調節エレメント、および直接反復配列の上流または下流(該当のどちらにも)に1つ以上のガイド配列を挿入するための1つ以上の挿入部位を含み、発現されると、ガイド配列は、真核細胞内のそれぞれの標的配列へのCas12b CRISPR複合体の配列特異的結合を誘導し、Cas12b CRISPR複合体は、それぞれの標的配列にハイブリダイズされる1つ以上のガイド配列と複合化するCas12b酵素を含み、かつ/あるいは、この細胞は(b)好ましくは少なくとも1つの核局在化配列および/またはNESを含む、前記Cas12b酵素をコードする酵素コード配列に操作可能に連結された第2の調節エレメントを含む。実施態様によっては、宿主細胞は、構成要素(a)および(b)を含む。該当する場合に、tracr配列も提供されてもよい。実施態様によっては、構成要素(a)、構成要素(b)、または構成要素(a)および(b)は、宿主真核細胞のゲノム中に安定的に組み込まれる。実施態様によっては、構成要素(a)はさらに、第1の調節エレメントに操作可能に連結され、場合によっては直接反復によって分離される2つ以上のガイド配列を含み、発現されると、2つ以上のガイド配列のそれぞれは、Cas12b CRISPR複合体の真核細胞内の異なる標的配列への配列特異的結合を誘導する。実施態様によっては、Cas12b酵素は、真核細胞の核内および/または核外での前記CRISPR酵素の検出可能な量の蓄積を駆動するのに十分な強度の1つ以上の核局在化配列および/または核外輸送配列すなわちNESを含む。
実施態様によっては、ガイド分子は、編集される少なくとも1つの標的アデノシン残基を含む標的DNA鎖とともに二重鎖を形成する。ガイドRNA分子が標的DNA鎖にハイブリダイズすると、アデノシンデアミナーゼは二本鎖に結合し、かつDNA-RNA二本鎖内に含まれる1つ以上の標的アデノシン残基の脱アミノ化を触媒する。
さらに、PAM相互作用 (PI)ドメインの遺伝子操作により、例えば、Kleinstiver BP et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities(PAM特異性が改変された遺伝子操作CRISPR-Cas9ヌクレアーゼ). Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592)にCas9について説明されるように、PAM特異性のプログラムを可能にし、標的部位認識忠実度を改善し、かつCRISPR-Casタンパク質の多様性を増大できる。本明細書にさらに詳述のように、当業者なら、C2c1タンパク質が同様に改変されてもよいことが分かる。
特定の実施態様では、ガイド配列は、脱アミノ化されるアデニンでのデアミナーゼの最適な効率を確実とするために選択される。C2c1ニッカーゼの切断部位に対する標的鎖でのアデニンの位置を考慮に入れてもよい。特定の実施態様では、ニッカーゼが、非標的鎖上の脱アミノ化されるアデニンの近傍で作用することを確実とすることを目的とする。例えば、特定の実施態様では、Cas12bニッカーゼは、PAMの下流の非標的鎖を切断し、脱アミノ化されるアデニンに対応するシトシンが、対応する非標的鎖の配列中のニッカーゼ切断部位の上流または下流の10塩基対内のガイド配列中に位置するように、ガイドを設計することを目的とする。
送達
実施態様によっては、CRISPR-Casシステムの構成要素は、DNA/RNAまたはRNA/RNAまたはタンパク質RNAの組合せなどの様々な形態で送達されてもよい。例えば、C2c1タンパク質は、DNAをコードするポリヌクレオチドまたはRNAをコードするポリヌクレオチドとして、あるいはタンパク質として送達されてもよい。ガイドは、DNAをコードするポリヌクレオチドまたはRNAとして送達されてもよい。送達の混合形態を含んで、考えうる全ての組合せが想定される。
側面によっては、本発明は、本明細書に説明の1つ以上のベクターなどの1つ以上のポリヌクレオチド、その1つ以上の転写産物、および/またはそれから転写される1つ以上のタンパク質を宿主細胞に送達することを含む方法を提供する。
送達媒体としてのベクター
組換え発現ベクターは、宿主細胞中の核酸の発現に適する形態で本発明の核酸を含むことができ、このことは、組換え発現ベクターが、発現される核酸配列に操作可能に連結される、発現に使用される宿主細胞に基づいて選択され得る1つ以上の調節エレメントを含むことを意味している。組換え発現ベクター内で、「操作可能に連結」とは、関心のあるヌクレオチド配列が、ヌクレオチド配列の発現を可能にする方式で(例えば、in vitro転写/翻訳システム内で、またはベクターが宿主細胞に導入される場合の宿主細胞内で)調節エレメントに連結されるとの意味を意図する。有利なベクターには、レンチウイルスおよびアデノ随伴ウイルスが含まれ、そのベクターの型はまた、特定の細胞型を標的とするために選択されてもよい。
組換え方法およびクローン方法に関しては、米国特許2004-0171156 A1号として2004年9月2日に公開の米国特許出願第10/815,730号に述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。
「調節エレメント」という用語は、プロモーター、エンハンサー、内部リボソーム侵入部位 (IRES)、および他の発現制御エレメント(例えば、ポリアデニル化シグナルおよびポリ-U配列などの転写終結シグナル)を含むことを意図している。その調節エレメントは、例えば、Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY(発現技術:酵素学での方法)185, Academic Press, San Diego, Calif. (1990)に説明されている。調節エレメントには、多種の宿主細胞でヌクレオチド配列の直接構成的発現を誘導するエレメント、および特定の宿主細胞でのみヌクレオチド配列(例えば、組織特異的調節配列)の発現を誘導するエレメントが含まれる。組織特異的プロモーターは、主に、筋肉、神経細胞、骨、皮膚、血液、特定の器官(例えば肝臓、膵臓)、または特定の細胞型(例えばリンパ球)などの所望の関心のある組織での発現を誘導できる。調節エレメントはまた、細胞周期依存性または発達段階依存性の方式などの時間依存性の方式で発現を誘導でき、このエレメントは組織に特異的または細胞型に特異的であってもよく、あるいはそうでなくてもよい。実施態様によっては、ベクターは、1個以上のpol IIIプロモーター(例えば、1、2、3、4、5個、またはそれ以上のpol IIIプロモーター)、1個以上のpol IIプロモーター(例えば、1、2、3、4、5個、またはそれ以上のpol IIプロモーター)、1個以上のpol Iプロモーター(例えば、1、2、3、4、5個、またはそれ以上のpol Iプロモーター)、またはそれらの組合せを含む。pol IIIプロモーターの例として、限定はされないが、U6およびH1プロモーターが挙げられる。pol IIプロモーターの例として、限定はされないが、レトロウイルス性ラウス肉腫ウイルス (RSV) LTRプロモーター(場合によってはRSVエンハンサーを含む)、サイトメガロウイルス (CMV)プロモーター(場合によってはCMVエンハンサーを含む)(例えば、Boshart et al, Cell, 41:521-530 (1985)を参照)、SV40プロモーター、ジヒドロ葉酸還元酵素プロモーター、β-アクチンプロモーター、ホスホグリセロールキナーゼ (PGK)プロモーター、およびEF1αプロモーターが挙げられる。用語「調節エレメント」には、WPRE、CMVエンハンサー、HTLV-IのLTR中のR-U5’区画(Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988)、SV40エンハンサー、およびウサギβ-グロビンのエクソン2と3の間のイントロン配列(Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981)などのエンハンサーエレメントも含まれる。発現ベクターの設計が、形質転換される宿主細胞の選択、所望の発現水準などの要因に依存してもよいことは当業者なら分かっている。ベクターは、宿主細胞中に導入されて、それにより、本明細書に説明の核酸によってコードされる、融合タンパク質またはペプチドを含む転写産物、タンパク質、またはペプチド(例えば、クラスター化され規則的に間隔をおいた短鎖回文配列反復(CRISPR)転写産物、タンパク質、酵素、それらの変異型、それらの融合タンパク質など)を産出できる。調節配列に関しては、米国特許出願10/491,026号が述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。プロモーターに関しては、国際特許出願WO2011/028929号および米国特許出願12/511,940号が述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。
有利なベクターには、レンチウイルスおよびアデノ随伴ウイルスが含まれ、そのベクターの型はまた、特定の細胞型を標的とするために選択できる。
特定の実施態様では、ガイドRNAおよびアデノシンデアミナーゼに融合された(場合によっては改変または変異された)CRISPR-Casタンパク質のためのバイシストロン性ベクターが使用される。ガイドRNAおよびアデノシンデアミナーゼに融合された(場合によっては改変または変異された)CRISPR-Casタンパク質のためのバイシストロン性発現ベクターが好ましい。一般にかつ特に、この実施態様では、アデノシンデアミナーゼに融合された(場合によっては改変または変異された)CRISPR-Casタンパク質は、好ましくは、CBhプロモーターによって駆動される。RNAは、好ましくは、U6プロモーターなどのPol IIIプロモーターによって駆動されてもよい。理想的には2つの組合せである。
原核細胞または真核細胞でのCRISPR転写産物(例えば、核酸転写産物、タンパク質、または酵素)の発現のためのベクターを設計できる。例えば、CRISPR転写産物は、大腸菌などの細菌細胞、(バキュロウイルス発現ベクターを使用する)昆虫細胞、酵母細胞、または哺乳類細胞で発現させることができる。適切な宿主細胞については、Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY(発現技術:酵素学での方法)185, Academic Press, San Diego, Calif. (1990)にさらに説明されている。あるいは、組換え発現ベクターは、例えば、T7プロモーター調節配列およびT7ポリメラーゼを使用して、in vitroで転写かつ翻訳することができる。
ベクターは、原核生物または原核細胞中に導入され、かつ増殖されてもよい。実施態様によっては、原核生物を使用して、真核細胞中に導入されるベクターの複製物を増幅する、あるいは原核生物を真核細胞中に導入されるベクターの生成での中間ベクターとして使用する(例えば、ウイルスベクター封入システムの一部としてのプラスミド増幅する)。実施態様によっては、原核生物を使用して、ベクターの複製物を増幅し、例えば、宿主細胞または宿主生物への送達のために1つ以上のタンパク質の供給源を提供するなど、1つ以上の核酸を発現する。原核生物でのタンパク質の発現は、殆どの場合に、融合タンパク質あるいは非融合タンパク質のいずれかの発現を誘導する構成的または誘導性プロモーターを含むベクターを用いて大腸菌内で行われる。融合ベクターは、その内部にコードされているタンパク質に、例えば組換えタンパク質のアミノ末端に複数のアミノ酸を付加する。このような融合ベクターは、次の1つ以上の目的に役立てることができる:(i)組換えタンパク質の発現を増強すること;(ii)組換えタンパク質の溶解度を増大すること;および(iii)親和性精製でのリガンドとして作用させて組換えタンパク質の精製を支援すること。多くの場合に、融合発現ベクターでは、タンパク質分解性の切断部位が融合部分と組換えタンパク質の接合部に導入されて、融合タンパク質の精製に続いて融合部分から組換えタンパク質を分離できるようにする。この酵素およびそれらの同族の認識配列として、第Xa因子、トロンビン、およびエンテロキナーゼが含まれる。融合発現ベクターの例として、グルタチオンS転移酵素 (GST)を融合するpGEX(Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40)、pMAL(New England Biolabs, Beverly, Mass.)およびpRIT5(Pharmacia, Piscataway, N.J.)、それぞれ目的の組換えタンパク質に対するマルトースE結合タンパク質またはプロテインAが挙げられる。適切な誘導性の非融合大腸菌発現ベクターの例として、pTrc(Amrann et al., (1988) Gene 69:301-315)およびpET 11d(Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY(発現技術:酵素学の方法) 185, Academic Press, San Diego, Calif. (1990) 60-89)が挙げられる。実施態様によっては、ベクターは、酵母発現ベクターである。出芽酵母(Saccharomyces cerivisae)での発現のためのベクターの例として、pYepSec1(Baldari, et al., 1987. EMBO J. 6: 229-234)、pMFa(Kuijan and Herskowitz, 1982. Cell 30: 933-943)、pJRY88(Schultz et al., 1987. Gene 54: 113-123)、pYES2(Invitrogen Corporation, San Diego, Calif.)、およびpicZ(InVitrogen Corp, San Diego, Calif.)が挙げられる。実施態様によっては、ベクターは、バキュロウイルス発現ベクターを使用する昆虫細胞でのタンパク質発現を駆動する。培養昆虫細胞(例えばSF9細胞)でのタンパク質の発現に利用可能なバキュロウイルスベクターには、pAc系列(Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165)およびpVL系列(Lucklow and Summers, 1989. Virology 170: 31-39)が含まれる。
実施態様によっては、ベクターは、哺乳動物発現ベクターを使用して、哺乳動物細胞中の1つ以上の配列の発現を駆動することができる。哺乳動物発現ベクターの例として、pCDM8(Seed, 1987. Nature 329: 840)およびpMT2PC((Kaufman, et al., 1987. EMBO J. 6: 187-195)が挙げられる。哺乳動物細胞で使用される場合に、発現ベクターの制御機能は、典型的には1つ以上の調節エレメントによって提供される。例えば、一般的に使用されるプロモーターは、ポリオーマ、アデノウイルス2、サイトメガロウイルス、シミアンウイルス40、および本明細書に開示かつ当技術分野で既知の他のウイルスに由来する。原核細胞と真核細胞の両方に適する他の発現システムについては、例えば、Chapters 16 and 17 of Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL(分子クローニング:実験室マニュアル). 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989を参照。
実施態様によっては、組換え哺乳動物発現ベクターは、特定の細胞型での優先的な核酸の発現を誘導できる(例えば、組織特異的調節エレメントを使用して核酸を発現する)。組織特異的調節エレメントは当技術分野で知られている。適切な組織特異的プロモーターの非限定的な例として、アルブミンプロモーター(肝臓特異的;Pinkert, et al., 1987. Genes Dev. 1: 268-277)、リンパ系特異的プロモーター(Calame and Eaton, 1988. Adv. Immunol. 43: 235-275)、特にT細胞受容体(Winoto and Baltimore, 1989. EMBO J. 8: 729-733)および免疫グロブリン(Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748)のプロモーター、神経細胞特異的プロモーター(例えば、神経細繊維プロモーター;Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477)、膵臓特異的プロモーター(Edlund, et al., 1985. Science 230: 912-916)、および乳腺特異的プロモーター(例えば、乳清プロモーター;米国特許4,873,316号および欧州出願特許264,166号)が挙げられる。発達調節プロモーター、例えば、マウスhoxプロモーター(Kessel and Gruss, 1990. Science 249: 374-379)およびα-フェトプロテインプロモーター(Campes and Tilghman, 1989. Genes Dev. 3: 537-546)もまた包含される。これらの原核生物および真核生物のベクターに関して、米国特許6,750,059号が述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。本発明の他の実施態様は、ウイルスベクターの使用に関連してもよく、これに関しては、米国特許出願13/092,085号に述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。組織特異的調節エレメントは当技術分野で知られており、これに関しては米国特許7,776,321号に述べられ、その内容は、参照によりその全体が本明細書に組み込まれる。実施態様によっては、調節エレメントは、CRISPRシステムの1つ以上の要素の発現を駆動するように、CRISPRシステムの1つ以上の要素に操作可能に連結されている。
実施態様によっては、核酸標的化システムの1つ以上の要素の発現を駆動する1つ以上のベクターは、核酸標的化システムの要素の発現が1つ以上の標的部位での核酸標的複合体の生成を誘導するように、宿主細胞中に導入される。例えば、核酸標的化エフェクター酵素および核酸標的化ガイドRNAは、それぞれ、別のベクターの別の調節エレメントに操作可能に連結されてもよい。核酸標的化システムのRNAは、遺伝子導入核酸標的化エフェクタータンパク質の動物または哺乳動物、例えば、構成的にまたは誘導的にまたは条件付きで核酸標的化エフェクタータンパク質を発現する動物または哺乳動物、あるいは、他の方法で核酸標的化エフェクタータンパク質を発現している動物または哺乳動物、または核酸標的化エフェクタータンパク質を含む細胞を有する動物または哺乳動物に、例えば核酸標的化エフェクタータンパク質をコードする、かつそのタンパク質をin vivoで発現する1つ以上のベクターのその動物への事前投与によって送達することができる。あるいは、同一のまたは異なる調節エレメントから発現される2つ以上の要素を、第1のベクターに含まれない核酸標的化システムの任意の構成要素を提供する1つ以上の追加のベクターとともに単一のベクター内に組み込んでもよい。単一のベクター内に組み込まれる核酸標的化システム要素は、例えば、第2の要素に対する(その「上流」の)5’、または第2の要素に対する(その「下流」の)3’に配置される1つの要素のように、任意の適切な方向に配置されてもよい。1つの要素のコード配列は、第2の要素のコード配列の同一または反対の鎖上に位置し、同一または反対の方向に方向付けされてもよい。実施態様によっては、単一のプロモーターは、(例えば、それぞれが異なるイントロン内、2つ以上が少なくとも1つのイントロン内、または全てが1つのイントロン内にある)1つ以上のイントロン配列内に埋め込まれた、核酸標的化エフェクタータンパク質および核酸標的化ガイドRNAをコードする転写産物の発現を駆動する。実施態様によっては、核酸標的化エフェクタータンパク質および核酸標的化ガイドRNAは、同一プロモーターに操作可能に連結され、かつそれから発現されてもよい。核酸標的化システムの1つ以上の要素を発現させるための送達媒体、ベクター、粒子、ナノ粒子、製剤、およびそれらの成分は、国際特許出願WO 2014/093622 (PCT/US2013/074667)号などの前述の文献内で使用されている通りである。実施態様によっては、ベクターは、(「クローン部位」とも呼ばれる)制限エンドヌクレアーゼ認識配列などの1つ以上の挿入部位を含む。実施態様によっては、1つ以上の挿入部位(例えば、約1、2、3、4、5、6、7、8、9、10、またはそれ以上の挿入部位)は、1つ以上のベクターの1つ以上の配列要素の上流および/または下流に位置する。複数の異なるガイド配列が使用される場合に、単一の発現構築物を用いて、細胞内の複数の異なる対応する標的配列に核酸標的化活性を標的化することができる。例えば、単一のベクターは、約1、2、3、4、5、6、7、8、9、10、15、20、またはそれ以上のガイド配列を含んでもよい。実施態様によっては、約1、2、3、4、5、6、7、8、9、10、またはそれ以上のそのガイド配列を含有するベクターが提供されてもよく、かつ場合によっては細胞に送達されてもよい。実施態様によっては、ベクターは、核酸標的化エフェクタータンパク質をコードする酵素コード配列に操作可能に連結された調節エレメントを含む。核酸標的化エフェクタータンパク質または1つ以上の核酸標的化ガイドRNAは、別々に送達することができ、好ましくは、これらの少なくとも1つは、粒子複合体を介して送達される。核酸標的化エフェクタータンパク質mRNAは、核酸標的化ガイドRNAに先行して送達されて、核酸標的化エフェクタータンパク質が発現されるための時間を付与できる。核酸標的化エフェクタータンパク質mRNAは、核酸標的化ガイドRNAの投与の1~12時間(好ましくは約2~6時間)前に投与されてもよい。あるいは、核酸標的化エフェクタータンパク質mRNAおよび核酸標的化ガイドRNAは、同時に投与されてもよい。好ましくは、ガイドRNAの第2の促進用量は、核酸標的化エフェクタータンパク質mRNAおよびガイドRNAの初期投与の1~12時間(好ましくは約2~6時間)後に投与されてもよい。核酸標的エフェクタータンパク質mRNAおよび/またはガイドRNAの追加投与は、最も効率的な水準のゲノム改変を達成するために有用である可能性がある。
従来からのウイルスおよび非ウイルスに基づく遺伝子導入法を用いて、哺乳動物の細胞または標的組織に核酸を導入できる。その方法を用いて、核酸標的化システムの構成要素をコードする核酸を、培養中の細胞または宿主生物中に投与できる。非ウイルスベクター送達システムには、DNAプラスミド、RNA(例えば、本明細書に説明のベクターの転写産物)、ネイキッド核酸、およびリポソームなどの送達媒体と複合化された核酸が含まれる。ウイルスベクター送達システムには、細胞への送達後にエピソームあるいは組込まれたゲノムのいずれかを有するDNAウイルスおよびRNAウイルスが含まれる。遺伝子治療手順の概要として、Anderson, Science 256:808-813 (1992)、Nabel & Felgner, TIBTECH 11:211-217 (1993)、Mitani & Caskey, TIBTECH 11:162-166 (1993)、Dillon, TIBTECH 11:167-175 (1993)、Miller, Nature 357:455-460 (1992)、Van Brunt, Biotechnology 6(10):1149-1154 (1988)、Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995)、Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995)、Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Bohm (eds) (1995)、およびYu et al., Gene Therapy 1:13-26 (1994)を参照。
核酸の非ウイルス送達の方法には、リポフェクション、ヌクレオフェクション、微量注入、遺伝子銃、ビロソーム、リポソーム、免疫リポソーム、ポリ陽イオンまたは脂質-核酸複合体、ネイキッドDNA、人工ウイルス粒子、および薬剤増強DNA取込みが含まれる。リポフェクションは、例えば、米国特許5,049,386号、4,946,787号、および4,897,355号に説明され、リポフェクション試薬は市販されている(例えば、TransfectamTMおよびLipofectinTM)。ポリヌクレオチドの効率的な受容体認識リポフェクションに適する陽イオン性および中性の脂質として、Felgnerからの国際特許出願WO91/17424号およびWO91/16024号が挙げられる。送達は、(例えば、in vitroまたはex vivo投与での)細胞への送達、あるいは(例えば、in vivo投与による)標的組織への送達であってもよい。
プラスミドの送達は、ガイドRNAをCRISPR-Casタンパク質発現プラスミドにクローンし、細胞培養物中にDNAを形質導入することを含む。プラスミド骨格は市販されていて、特別な設備の必要はない。それらはモジュール式であり、(より大きなサイズのタンパク質をコードするものを含む)異なるサイズのCRISPR-Casコード配列ならびに選択マーカーを保持できるという利点がある。プラスミドのこの両方の利点は、一過性ではあるが持続的な発現を保証できることにある。但し、プラスミドの送達は単純ではないため、その結果、in vivoでの効率は低くなることが多い。持続的な発現はまた、非特異的標的編集を増強するという点で不都合になる可能性がある。さらに、CRISPR-Casタンパク質の過剰な蓄積は、細胞に有毒となる可能性がある。最後に、プラスミドは、特に(特異的標的および非特異的標的で)二本鎖切断が生成されることを考慮すると、dsDNAが宿主ゲノムに無作為に組込まれるリスクを常に抱えている。
免疫脂質複合体などの標的化リポソームを含む脂質-核酸複合体の調製は、当業者に周知である(例えば、Crystal, Science 270:404-410 (1995)、Blaese et al., Cancer Gene Ther. 2:291-297 (1995)、Behr et al., Bioconjugate Chem. 5:382-389 (1994)、Remy et al., Bioconjugate Chem. 5:647-654 (1994)、Gao et al., Gene Therapy 2:710-722 (1995)、Ahmad et al., Cancer Res. 52:4817-4820 (1992)、米国特許4,186,183号、4,217,344号、4,235,871号、4,261,975号、4,485,054号、4,501,728号、4,774,085号、4,837,028号、および4,946,787号を参照)。これについては、以下に詳述する。
核酸の送達のためのRNAウイルスまたはDNAウイルスに基づくシステムの使用では、ウイルスを体内の特定細胞に標的化し、ウイルス負荷量を核に輸送するための高度に進化したプロセスを利用する。ウイルスベクターを、患者に(in vivoで)直接的に投与でき、またはそれらベクターを使用して細胞をin vitroで処理でき、改変された細胞は、場合によっては(ex vivoで)患者に投与できる。従来からのウイルスに基づくシステムには、遺伝子導入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、および単純ヘルペスウイルスの各ベクターが含まれる可能性がある。宿主ゲノムへの組込みは、レトロウイルス、レンチウイルス、およびアデノ随伴ウイルスの遺伝子導入法によって可能であり、挿入された導入遺伝子に長期の発現をもたらす場合が多い。さらに、高い遺伝子導入効率が、多くの種々の細胞型および標的組織内で観察されている。
レトロウイルスの指向性は、外来外膜タンパク質を組み込むことによって変更され、標的細胞の潜在的な標的集団を伸長できる。レンチウイルスベクターは、非分裂細胞に遺伝子導入または感染させることができ、かつ典型的には高いウイルス力価を生み出すレトロウイルスベクターである。従って、レトロウイルス遺伝子導入システムの選択は、標的組織に依存してもよい。レトロウイルスベクターは、最大6~10kbの外来配列の封入能力を備えたシス作用性の長末端反復配列から構成されている。最小のシス作用性LTRは、ベクターの複製と封入には十分であり、次にそれを使用して、治療遺伝子を標的細胞中に組み込んで永続的な導入遺伝子の発現を提供する。広く使用されているレトロウイルスベクターには、マウス白血病ウイルス (MuLV)、テナガザル白血病ウイルス(GaLV)、シミアン免疫不全ウイルス (SIV)、ヒト免疫不全ウイルス(HIV)、およびそれらの組合せに基づくベクターが含まれる(例えば、Buchscher et al., J. Virol. 66:2731-2739 (1992)、Johann et al., J. Virol. 66:1635-1640 (1992)、Sommnerfelt et al., Virol. 176:58-59 (1990)、Wilson et al., J. Virol. 63:2374-2378 (1989)、Miller et al., J. Virol. 65:2220-2224 (1991)、および国際特許出願PCT/US94/05700号を参照)。
一過性の発現が好ましい用途では、アデノウイルスに基づくシステムを使用してもよい。アデノウイルスに基づくベクターは、多くの細胞型で非常に高い遺伝子導入効率を達成でき、かつ細胞分裂を必要としない。このベクターの使用により、高い力価および発現水準が得られている。このベクターは、比較的簡潔な方法で大量に生成できる。アデノ随伴ウイルス(「AAV」)ベクターはまた、例えば、核酸およびペプチドのin vitroでの生成において、かつin vivoおよびex vivoでの遺伝子治療手順のために、標的核酸により細胞を形質導入するのに使用できる(例えば、West et al., Virology 160:38-47 (1987)、米国特許4,797,368号、国際特許出願WO 93/24641号、Kotin, Human Gene Therapy 5:793-801 (1994)、およびMuzyczka, J. Clin. Invest. 94:1351 (1994)を参照)。組換えAAVベクターの構築は、米国特許5,173,414号、Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985)、Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984)、Hermonat & Muzyczka, PNAS 81:6466-6470 (1984)、およびSamulski et al., J. Virol. 63:03822-3828 (1989)などの複数の出版物に説明されている。
本発明は、CRISPRシステムをコードする外因性核酸分子、例えば複数のカセットを含む、あるいは本質的にそれからなるAAVを提供する。例えばこの複数のカセットは、プロモーター、C2c1などのCRISPR会合 (Cas)タンパク質(推定ヌクレアーゼまたはヘリカーゼタンパク質)、ターミネーター、および好ましくは最大封入限界サイズの1つ以上のベクターをコードする核酸分子を含む、あるいは本質的にそれらからなる第1のカセットを含み、あるいはそのカセットからなり、例えば(第1のカセットを含む)合計5つのカセットは、プロモーター、ガイドRNA (gRNA)をコードする核酸分子、およびターミネーター、または2つ以上の個別のrAAVを含む、あるいは本質的にそれからなる(例えば、各カセットは、プロモーター-gRNA1-ターミネーター、プロモーター-gRNA2-ターミネーター・・・プロモーター-gRNA(N)-ターミネーターとして概略的に表され、式中のNは、ベクターの封入サイズ限界の上限にある挿入可能な数である)。2つ以上の個別のrAAVのそれぞれは、CRISPRシステムの1つ以上のカセットを含み、例えば第1のrAAVは、プロモーター、Cas (C2c1)などのCasをコードする核酸分子、およびターミネーターを含む、あるいは本質的にそれらからなる第1のカセットを含み、かつ第2のrAAVは、それぞれがプロモーター、ガイドRNA (gRNA)をコードする核酸分子、およびターミネーターを含む、あるいは本質的にそれらからなる1つ以上のカセット(例えば、プロモーター-gRNA1-ターミネーター、プロモーター-gRNA2-ターミネーター・・・プロモーター-gRNA(N)-ターミネーターとして概略的に表され、式中のNは、ベクターの封入サイズ限界の上限にある挿入可能な数である)を含む。あるいは、C2c1はその独自のcrRNA/gRNAを処理できるので、単一のcrRNA/gRNA配列を多重遺伝子編集に使用できる。従って、gRNAを送達するために複数のカセットを含む代わりに、rAAVは、プロモーター、複数のcrRNA/gRNA、およびターミネーターを含む、または本質的にそれらからなる単一のカセット(例えば、プロモーター-gRNA1-gRNA2・・・gRNA(N)-ターミネーターとして概略的に表され、式中のNは、ベクターの封入サイズ限界の上限にある挿入可能な数である)を含んでもよい。参照によりその全体が本明細書に組み込まれるZetsche et al Nature Biotechnology 35, 31-34 (2017)を参照。rAAVはDNAウイルスであるので、AAVまたはrAAVに関する本明細書の説明の核酸分子は、有利にはDNAである。プロモーターは、実施態様によっては、有利には、ヒトシナプシンIプロモーター (hSyn)である。核酸を細胞に送達するための別の方法は、当業者に知られている。例えば、参照により本明細書に組み込まれる米国特許公開20030087817号を参照。
別の実施態様では、球菌ベシクロウイルス外膜偽型レトロウイルスベクター粒子が想定される(例えば、Fred Hutchinson癌研究センターに譲渡された米国特許公開第20120164118号を参照)。球菌ウイルスはベシクロウイルス属に属し、哺乳類の水胞性口内炎の原因物質である。球菌ウイルスは、元々トリニダードのダニから単離され(Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964))、感染は、トリニダード、ブラジル、アルゼンチンで、昆虫、ウシ、およびウマから見出されている。哺乳類に感染するベシクロウイルスの多くは、自然に感染した節足動物から単離されていて、それらは節足動物媒介性であることを示唆している。ベシクロウイルスに対する抗体は、ウイルスが風土性である農村地域に住む人々の間で一般的であり、かつ実験室で取得され、ヒトへの感染では通常インフルエンザのような症状を引き起こす。球菌ウイルス外膜糖タンパク質は、アミノ酸水準でVSV-Gインディアナ株と71.5%の同一性を共有し、ベシクロウイルスの外膜遺伝子の系統発生的比較では、ベシクロウイルスの中のVSV-Gインディアナ株とは球菌ウイルスは血清学的に異なるものの、最も密接に関連していることを示している。Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964)、およびTravassos da Rosa et al., Am. J. Tropical Med. & Hygiene 33:999-1006 (1984)を参照。球菌ベシクロウイルス外膜偽型レトロウイルスベクター粒子には、例えば、レンチウイルス、αレトロウイルス、βレトロウイルス、γレトロウイルス、δレトロウイルス、およびεレトロウイルスの各ベクター粒子を含んでもよく、これらには、レトロウイルスのGag、Pol、および/または1つ以上の補助タンパク質、および球菌ベシクロウイルス外膜タンパク質を含んでもよい。これらの実施態様の特定の側面では、Gag、Pol、および補助タンパク質は、レンチウイルスおよび/またはγレトロウイルスである。
実施態様によっては、宿主細胞は、本明細書に記載される1つ以上のベクターで一過的または非一過的に形質導入される。実施態様によっては、細胞は、場合によってはその内部に再導入される対象内で自然発生するように形質導入される。実施態様によっては、形質導入された細胞は、対象から採取される。実施態様によっては、細胞は、細胞株など、対象から採取された細胞に由来する。組織培養のための多種多様な細胞株が当技術分野では知られている。細胞株の例として、限定はされないが、C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI- 231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1サル腎臓上皮細胞、BALB/3T3マウス胚繊維芽細胞、3T3 Swiss、3T3-L1、132-d5ヒト胎児繊維芽細胞、10.1マウス繊維芽細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr -/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II 、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、およびそれらの遺伝子導入種が挙げられる。細胞株は、当業者に知られている様々な供給源から入手可能である(例えば、米国培養細胞系統保存機関(ATCC; Manassus, Va.)を参照)。
特定の実施態様では、AD機能化CRISPRシステムの1つ以上の構成要素の一過性の発現および/またはその存在により、非特異的標的効果を低減することを目的とする。実施態様によっては、本明細書に説明の1つ以上のベクターで形質導入された細胞を使用して、1つ以上のベクター由来配列を含む新規の細胞株を構築する。実施態様によっては、(例えば、1つ以上のベクターの一過性の形質導入またはRNAによる形質導入によって)本明細書に説明のAD機能化CRISPRシステムの構成要素で一過的に形質導入され、かつCRISPR複合体の活性を介して改変される細胞を使用して、改変を含むが他の外因性配列を欠く細胞を含む新規の細胞株を構築する。実施態様によっては、本明細書に説明の1つ以上のベクターで一過的または非一過的に形質導入された細胞、またはその細胞に由来する細胞株は、1つ以上の試験化合物を評価する際に使用される。
実施態様によっては、RNAおよび/またはタンパク質を宿主細胞に直接的に導入することが想定される。例えば、CRISPR-Casタンパク質は、in vitroで転写されたガイドRNAとともにmRNAをコードするように送達できる。この方法は、CRISPR-Casタンパク質の効果を確定する時間を短縮でき、さらにCRISPRシステム成分の長期に亘る発現を防止できる。
実施態様によっては、本発明のRNA分子は、リポソーム製剤またはリポフェクチン製剤などで送達され、これは当業者に周知の方法によって調製できる。その方法は、例えば、米国特許5,593,972号、5,589,466号、および5,580,859号に説明され、これらは参照により本明細書に組み込まれる。特に哺乳動物細胞中へのsiRNA送達の増強および改善を目的とした送達システムが開発されていて(例えば、Shen et al FEBS Let. 2003, 539:111-114、Xia et al., Nat. Biotech. 2002, 20:1006-1010、Reich et al., Mol. Vision. 2003, 9: 210-216、Sorensen et al., J. Mol. Biol. 2003, 327: 761-766、Lewis et al., Nat. Gen. 2002, 32: 107-108、およびSimeoni et al., NAR 2003, 31, 11: 2717-2724を参照)、本発明に適用することができる。最近、siRNAの霊長類での遺伝子発現の阻害への使用にも成功している(例えば、本発明に適用され得るTolentino et al., Retina 24(4):660を参照)。
実際、RNA送達は、in vivo送達の有用な方法である。リポソームまたは粒子を使用して、CcC1、アデノシンデアミナーゼ、およびガイドRNAを細胞内に送達することが可能である。従って、C2c1などのCRISPR-Casタンパク質の送達、(CRISPR-Casタンパク質またはアダプタータンパク質に融合され得る)アデノシンデアミナーゼの送達、および/または本発明のRNAの送達は、RNA形態であってもよく、微小胞、リポソーム、粒子、またはナノ粒子を介してもよい。例えば、C2c1 mRNA、アデノシンデアミナーゼmRNA、およびガイドRNAは、in vivoでの送達のためにリポソーム粒子中に封入できる。Life Technologies製のリポフェクタミンなどのリポソーム形質導入試薬や市販のその他の試薬は、RNA分子を肝臓内に効果的に送達できる。
RNAの好ましい送達手段はまた、粒子(Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells(内皮細胞への低分子干渉RNA送達のための脂質様ナノ粒子), Advanced Functional Materials, 19: 3112-3118, 2010)またはエキソソーム(Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery (siRNA送達のための脂質系ナノ治療薬), Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641)を介するRNAの送達を含む。実際、エキソソームは、CRISPRシステムといくつかの類似点を備える、特にsiRNAの送達に有用であるシステムであることが示されている。例えば、El-Andaloussi Sら(“Exosome-mediated delivery of siRNA in vitro and in vivo.”(「in vitroおよびin vivoでのsiRNAのエキソソーム媒介送達」)Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. Epub 2012 Nov 15.)は、エキソソームが種々の生物学的障壁を越える薬物送達のためにいかに有望なツールであり、かつどのようにin vitroおよびin vivoでのsiRNAの送達に利用できるかを説明している。彼らの検討では、まずペプチドリガンドと融合したエキソソームタンパク質を含む発現ベクターの形質導入を通して標的エキソソームを生成する。次にエキソソームを、形質導入された細胞上清から精製しかつその特性を明らかにし、その後にRNAをエキソソーム中に詰め込む。本発明による送達または投与は、特に脳内とは限定はされないが、エキソソームを用いて実施できる。ビタミンE(α-トコフェロール)をCRISPR-Casと結合して、高密度リポタンパク質 (HDL)とともに、例えばUnoら(HUMAN GENE THERAPY(ヒト遺伝子療法)22:711-719 (June 2011))が脳への短鎖干渉RNA (siRNA)の送達の為に実施したのと類似の方法で脳に送達できる。マウスが、リン酸緩衝生理食塩水 (PBS)または遊離TocsiBACEまたはToc-siBACE/HDLで満たされた浸透圧ミニポンプ(model 1007D; Alzet, Cupertino, CA)を介して注入され、Brain Infusion Kit 3(Alzet)に接続された。脳注入排管は、背側の第三脳室への注入のために正中線の十字縫合部の約0.5mm後方に配置された。Unoらは、HDLを含むわずか3 nmolのToc-siRNAが、同じICV注入法によって同等程度に標的の減弱を誘発する可能性があることを発見した。α-トコフェロールに結合し脳を標的とするHDLとともに同時投与される類似の投与用量のCRISPR Casが、本発明でのヒトに対して想定することができ、例えば、脳を標的とする約3 nmol~約3 μmolのCRISPR Casが想定できる。Zouら(HUMAN GENE THERAPY(ヒト遺伝子療法)22:465-475 (April 2011))は、ラットの脊髄でのin vivoの遺伝子サイレンシングのために、PKCγを標的とする短ヘアピンRNAのレンチウイルス媒介による送達方法を説明している。Zouらは、くも膜下腔内カテーテルにより、1 x 109遺伝子導入単位 (TU)/mlの力価を有する約10 μlの組換えレンチウイルスを投与した。脳を標的とするレンチウイルスベクターで発現される類似の用量のCRISPR Casを、例えば本発明のヒトについて想定してもよく、1 x 109遺伝子導入単位 (TU)/mlの力価を有するレンチウイルスでの脳を標的とする約10~50 mlのCRISPR Casが想定されてもよい。
ベクターの投与用量
実施態様によっては、ベクター、例えば、プラスミドベクターまたはウイルスベクターは、例えば、筋肉内注射によって関心のある組織に送達され、その他の場合には、送達は、静脈内、経皮、鼻腔内、口腔内、粘膜内、または他の送達方法を介する。その送達は、単回投与あるいは複数回投与のいずれかであってもよい。当業者には、本明細書で送達される実際の用量は、ベクターの選択、標的細胞、生物、または組織、治療される対象の一般的な症状、必要とされる変容/改変の程度、投与経路、投与様式、必要とされる変容/改変の形態などの種々の因子に依って、大幅に変更してもよいことが分かっている。
その投与用量にはさらに、例えば、担体(水、生理食塩水、エタノール、グリセリン、乳糖、ショ糖、リン酸カルシウム、ゼラチン、デキストラン、寒天、ペクチン、ピーナッツ油、ゴマ油など)、希釈剤、薬学的に許容される担体(例えばリン酸緩衝生理食塩水)、薬学的に許容される賦形剤、および/または当技術分野で既知の他の化合物が含まれる。用量にはさらに、例えば、塩酸塩、臭化水素酸塩、リン酸塩、硫酸塩などの鉱酸塩、および酢酸塩、プロピオン酸塩、マロン酸塩、安息香酸塩などの有機酸塩の1つ以上の薬学的に許容される塩を含んでもよい。さらに、湿潤剤または乳化剤、pH緩衝物質、ゲルまたはゲル化材料、香料、着色剤、小球体、ポリマー、懸濁剤などの補助物質が、本発明中では存在してもよい。さらに、防腐剤、保湿剤、懸濁剤、界面活性剤、抗酸化剤、凝固防止剤、充填剤、キレート剤、被覆剤、化学安定剤などの1つ以上のその他の従来からの医薬成分もまた、特に剤形が再構成可能な形状である場合には、存在してもよい。適切な成分例として、微結晶性セルロース、カルボキシメチルセルロースナトリウム、ポリソルベート80、フェニルエチルアルコール、クロロブタノール、ソルビン酸カリウム、ソルビン酸、二酸化硫黄、没食子酸プロピル、パラベン、エチルバニリン、グリセリン、フェノール、パラクロロフェノール、ゼラチン、アルブミン、およびそれらの組合せが含まれる。薬学的に許容される賦形剤の詳細は、参照により本明細書に組み込まれるREMINGTON'S PHARMACEUTICAL SCIENCES(レミントンの薬科学)(Mack Pub. Co., N.J. 1991)に説明されている。
本明細書の一実施態様では、送達は、アデノウイルスを介し、この送達では、少なくとも1 x 105粒子(粒子単位;puとも呼ばれる)のアデノウイルスベクターを含む単回の促進用量であってもよい。本明細書の一実施態様では、この用量は、好ましくは少なくとも約1 x 106粒子(例えば、約1 x 106~1 x 1012粒子)、より好ましくは少なくとも約1 x 107粒子、より好ましくは少なくとも約1 x 108粒子(例えば、約1 x 108~1 x 1011粒子、または約1 x 108~1 x 1012粒子)、かつ最も好ましくは少なくとも約1 x 100粒子(例えば、約1 x 109~1 x 1010粒子、または約1 x 109~1 x 1012粒子)、あるいは少なくとも約1 x 1010粒子(例えば、約1 x 1010~1 x 1012粒子)のアデノウイルスベクターである。あるいは、この用量は、約1 x 1014粒子以下、好ましくは約1 x 1013粒子以下、さらにより好ましくは約1 x 1012粒子以下、さらにより好ましくは約1 x 1011粒子以下、かつ最も好ましくは、約1 x 1010粒子以下(例えば、約1 x 109粒子以下)である。従って、この用量は、例えば、約1 x 106粒子単位 (pu)、約2 x 106 pu、約4 x 106 pu、約1 x 107 pu、約2 x 107 pu、約4 x 107 pu、約1 x 108 pu、約2 x 108 pu、約4 x 108 pu、約1 x 109 pu、約2 x 109 pu、約4 x 109 pu、約1 x 1010 pu、約2 x 1010 pu、約4 x 1010 pu、約1 x 1011 pu、約2 x 1011 pu、約4 x 1011 pu、約1 x 1012 pu、約2 x 1012 pu、または約4 x 1012puのアデノウイルスベクターを有するアデノウイルスベクターの単回用量を含んでもよい。例えば、参照により本明細書に組み込まれる、Nabelらが2013年6月4日に出願した米国特許8,454,972 B2号の29列の36~58行目に示される用量のアデノウイルスベクターを参照。本明細書の一実施態様では、アデノウイルスは、複数回用量で送達される。
本明細書の一実施態様では、送達は、AAVを介する。ヒトへのAAVのin vivo送達のための治療有効用量は、約1 x 1010~約1 x 1010の機能AAV/ml溶液を含む約20~約50 mlの生理食塩水の範囲であると考えられる。用量は、治療効果と副作用が平衡するように調整されてもよい。本明細書の一実施態様では、AAV用量は、一般に、約1 x 105~1 x 1050のゲノムAAV、約1 x 108~1 x 1020のゲノムAAV、約1 x 1010~約1 x 1016のゲノムAAV、または約1 x1011~約1x1016のゲノムAAVの濃度範囲にある。ヒトへの用量は、約1 x 1013のゲノムAAVであってもよい。その濃度として、約0.001ml~約100 ml、約0.05 ml~約50 ml、または約10 ml~約25 mlの担体溶液により送達されてもよい。その他の有効な用量は、用量応答曲線を確立する日常的な試験を通して当業者なら容易に明確にできる。例えば、2013年3月26日にHajjarらが出願した米国特許8,404,658 B2号の27列の45~60行目を参照。
本明細書の一実施態様では、送達はプラスミドを介する。このプラスミド組成物では、用量を、応答を誘発するのに十分なプラスミドの量とすべきである。例えば、プラスミド組成物中のプラスミドDNAの適切な量は、70 kgの個体あたり約0.1~約2 mgまたは約1 μg~約10 μgであってもよい。本発明のプラスミドは、一般に、(i)プロモーター、(ii)前記プロモーターに操作可能に連結された、CRISPR-Casタンパク質をコードする配列、(iii)選択可能なマーカー、(iv)複製の起点、および(v)(ii)の下流にあり(ii)に操作可能に連結されている転写ターミネーターを含む。プラスミドは、CRISPR複合体のRNA成分をコードすることもできるが、代わりにこれらの1つ以上を別のベクターにコードしてもよい。
本明細書の用量は、平均として70 kgの個体に基づく。投与の頻度は、例えば、医師または獣医、あるいは当業者が決定する範囲内である。なお、実験で使用されるマウスは典型的には約20 gであり、マウス実験から70 kgの個体まで拡大できる。
本明細書に提供の組成物に使用される用量は、反復投与または反復投薬のための用量を含む。特定の実施態様では、投与は、数週間、数ヶ月、または数年の期間内で繰り返される。最適な投与計画を得るために、適切な測定を実施してもよい。反復投与により、より低用量を使用できるようになり、非特異的標的の改善に良好な影響を及ぼすことができる。
RNA送達
特定の実施態様では、RNAに基づく送達が使用される。これらの実施態様では、CRISPR-Casタンパク質のmRNA、(CRISPR-Casタンパク質またはアダプターに融合され得る)アデノシンデアミナーゼのmRNAは、in vitroで転写されたガイドRNAと共に送達される。Liangらは、RNAに基づく送達を使用する効率的なゲノム編集について説明している(Protein Cell. 2015 May; 6(5): 363-372)。実施態様によっては、C2c1および/またはアデノシンデアミナーゼをコードするmRNAは、化学的に改変でき、これは、プラスミドにコードされたC2c1および/またはアデノシンデアミナーゼと比較して、活性を改善できる。例えば、mRNA中のウリジンは、疑似ウリジン (Ψ)、N1-メチル疑似ウリジン (me1Ψ)、5-メトキシウリジン (5moU)で部分的にまたは完全に置換できる。参照によりその全体が本明細書に組み込まれるLi et al., Nature Biomedical Engineering 1, 0066 DOI:10.1038/s41551-017-0066 (2017)を参照。
送達手法の例示
RNP
特定の実施態様では、予め複合化されたガイドRNA、CRISPR-Casタンパク質、および(CRISPR-Casタンパク質またはアダプターに融合され得る)アデノシンデアミナーゼは、リボヌクレオタンパク質 (RNP)として送達される。RNPには、RNA法よりもさらに迅速な編集効果が得られるという利点があり、というのは、このプロセスでは転写が不要になるからである。重要な利点は、両方のRNPの送達は一過的なものであり、非特異的標的効果および毒性の問題が軽減されることである。種々の細胞型での効率的なゲノム編集は、Kim et al. (2014, Genome Res. 24(6):1012-9), Paix et al. (2015, Genetics 204(1):47-54)、Paix et al. (2015, Genetics 204(1):47-54)、Chu et al. (2016, BMC Biotechnol. 16:4)、およびWang et al. (2013, Cell. 9;153(4):910-8)によって観察されている。
特定の実施態様では、リボ核タンパク質は、国際特許出願WO2016161516号に説明されるように、ポリペプチドに基づくシャトル剤を介して送達される。WO2016161516号は、細胞透過性ドメイン (CPD)に、またはヒスチジン富化ドメインおよびCPDに操作可能に連結されたエンドソーム漏出ドメイン (ELD)を含む合成ペプチドを使用するポリペプチドカーゴの効率的な伝達を説明している。同様に、これらのポリペプチドを、真核細胞でのCRISPRエフェクターに基づくRNPの送達のために使用できる。
粒子
側面または実施態様によっては、送達粒子製剤を含む組成物を使用してもよい。側面または実施態様によっては、製剤は、CRISPR複合体、CRISPRタンパク質を含む複合体、およびCRISPR複合体の標的配列への配列特異的結合を誘導するガイドを含む。実施態様によっては、送達粒子は、脂質系の粒子、場合によっては脂質ナノ粒子、または陽イオン性脂質、および場合によっては生分解性ポリマーを含む。実施態様によっては、陽イオン性脂質は、1,2-ジオレオイル-3-トリメチルアンモニウム-プロパン (DOTAP)を含む。実施態様によっては、親水性ポリマーは、エチレングリコールまたはポリエチレングリコールを含む。実施態様によっては、送達粒子はさらに、リポタンパク質、好ましくはコレステロールを含む。実施態様によっては、送達粒子は、直径500 nm未満、場合によっては直径250 nm未満、場合によっては直径100 nm未満、場合によっては直径約35 nm~約60 nmである。
いくつかの種の粒子送達システムおよび/または製剤が、多様な範囲の生物医学的用途に有用であることが知られている。一般に、粒子は、その移動性と特性に関して全体単位として動作する小さな物体として定義される。粒子はさらに直径によって分類される。粗粒子は2,500~10,000 nmの範囲にある。微粒子は100~2,500 nmのサイズである。超微粒子またはナノ粒子は、一般に、1~100 nmのサイズである。100 nmの限界値は、塊の材料とは異なる粒子での新規の特性が、通常100nm未満の臨界長さ寸法で発生するという事実に基づいている。
本明細書で使用される場合に、粒子送達システム/製剤は、本発明による粒子を含む任意の生体送達システム/製剤として定義される。本発明による粒子は、(例えば直径で)100 μm未満の最大寸法を有する任意の物体である。実施態様によっては、本発明の粒子は、10 μm未満の最大寸法を有する。実施態様によっては、本発明の粒子は、2000 nm未満の最大寸法を有する。実施態様によっては、本発明の粒子は、1000 nm未満の最大寸法を有する。実施態様によっては、本発明の粒子は、900 nm、800 nm、700 nm、600 nm、500 nm、400 nm、300 nm、200 nm、または100 nm未満の最大寸法を有する。典型的には、本発明の粒子は、(例えば直径で)500 nm以下の最大寸法を有する。実施態様によっては、本発明の粒子は、(例えば直径で)250 nm以下の最大寸法を有する。実施態様によっては、本発明の粒子は、(例えば直径で)200 nm以下の最大寸法を有する。実施態様によっては、本発明の粒子は、(例えば直径で)150 nm以下の最大寸法を有する。実施態様によっては、本発明の粒子は、(例えば直径で)100 nm以下の最大寸法を有する。本発明の実施態様によっては、例えば、50 nm以下の最大寸法を有するより小さな粒子が使用される。実施態様によっては、本発明の粒子は、25 nm~200 nmの範囲の最大寸法を有する。
本発明に関して、CRISPR複合体の1つ以上の成分、例えば、CRISPR-Casタンパク質またはmRNA、あるいは(CRISPR-Casタンパク質またはアダプターに融合され得る)アデノシンデアミナーゼまたはmRNA、あるいはナノ粒子または脂質外膜を使用して送達されるガイドRNAを持つことが好ましい。その他の送達システムまたはベクターを、本発明の粒子の側面と組み合わせて使用してもよい。
一般に、「ナノ粒子」は、1000 nm未満の直径を有する任意の粒子を指す。特定の実施態様では、本発明のナノ粒子は、(例えば直径で)500 nm以下の最大寸法を有する。他の実施態様では、本発明のナノ粒子は、25 nm~200 nmの範囲の最大寸法を有する。他の実施態様では、本発明のナノ粒子は、100 nm以下の最大寸法を有する。他の実施態様では、本発明のナノ粒子は、35 nm~60 nmの範囲の最大寸法を有する。なお本明細書での粒子またはナノ粒子は、適切な場合には、互換的に述べられてもよい。
なお粒子のサイズは、そのサイズが充填の前あるいは後に測定されるかどうかに依って異なる。従って、特定の実施態様では、用語「ナノ粒子」は、充填前の粒子にのみ使用されてもよい。
本発明に包含される粒子は、異なる形態で、例えば、固形粒子(例えば、銀、金、鉄、チタンなどの金属、非金属、脂質系固体、ポリマー)、粒子の懸濁液、またはそれらの組合せとして提供されてもよい。金属、誘電体、および半導体の各粒子、ならびに混成物構造(例えば、コア-シェル粒子)を調製してもよい。半導体材料から作製される粒子は、電子エネルギー準位の量子化が発生する程度に十分に小さい(典型的には10 nm未満)場合には、量子ドットと標識してもよい。そのようなナノ寸法の粒子は、薬物担体または造影剤のような生体用途に使用され、本発明での類似の目的に適合できる。
半固形粒子および軟質粒子が製造されており、それらは本発明の範囲内である。半固形の性質の原形粒子はリポソームである。種々の種類のリポソーム粒子が、現在、抗癌剤やワクチンの送達システムとして臨床的に使用されている。一方の半分が親水性で他方の半分が疎水性の粒子はヤヌス粒子と呼ばれ、乳濁液を安定化するのに特に効果的である。それらは水/油の界面で自己組織化し、固形界面活性剤として機能できる。
(例えば、形態、寸法などの特性解析を含む)粒子の特性解析は、様々な異なる技術を用いて実施される。一般的な手法は、電子顕微鏡 (TEM、SEM)、原子間力顕微鏡 (AFM)、動的光散乱 (DLS)、X線光電子分光法 (XPS)、粉末X線回折 (XRD)、フーリエ変換赤外分光法(FTIR)、マトリックス支援レーザー脱離/イオン化飛行時間型質量分析 (MALDI-TOF)、紫外可視分光法、二面偏光干渉計、および核磁気共鳴 (NMR)である。特性解析(寸法測定)を、天然粒子(すなわち詰込み前)、またはカーゴ(本明細書でのカーゴは、例えば、CRISPR-Casシステムの1つ以上の成分、例えば、CRISPR-Casタンパク質またはmRNA、(CRISPR-Casタンパク質またはアダプターに融合し得る)アデノシンデアミナーゼまたはmRNA、あるいはガイドRNA、あるいはそれらの任意の組合せを指し、かつ追加の担体および/または賦形剤を含んでもよい)の詰込み後に実施して、本発明の任意のin vitro、ex vivo、および/またはin vivo適用での送達に最適なサイズの粒子を提供する。特定の好ましい実施態様では、粒子の寸法(例えば直径)の特性解析は、動的レーザー散乱 (DLS)を使用する測定に基づく。粒子、それらの製造方法および使用方法、ならびにその測定に関して、米国特許8,709,843号、米国特許6,007,845号、米国特許5,855,913号、米国特許5,985,309号、米国特許5,543,158号、および2014年5月11日にdoi:10.1038/nnano.2014.84でオンライン公開されたJames E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014)の刊行物に述べられている。
本発明の範囲内の粒子送達システムは、限定はされないが、固形、半固形、乳濁液、またはコロイドの各粒子を含む任意の形態で提供されてもよい。従って、限定はされないが、例えば、脂質系システム、リポソーム、ミセル、微小胞、エキソソーム、または遺伝子銃を含む本明細書に説明の送達システムのいずれかが、本発明の範囲内の粒子送達システムとして提供されてもよい。
CRISPR-Casタンパク質mRNA、(CRISPR-Casタンパク質またはアダプターに融合され得る)アデノシンデアミナーゼまたはmRNA、およびガイドRNAは、粒子または脂質外膜を用いて同時に送達されてもよい。例えば、本発明のCRISPR-Casタンパク質およびRNAは、例えば複合体として、Dahlmanらの国際特許出願WO2015089419 A2号、およびその中に引用された文献にあるような粒子、例えば7C1(例えば2014年5月11日にdoi:10.1038/nnano.2014.84でオンライン公開されたJames E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014)を参照)を介して送達されてもよい。例えば、送達粒子は、脂質またはリピドイド、および親水性ポリマー、例えばカチオン性脂質親水性ポリマーを含み、ここで例えばカチオン性脂質は、1,2-ジオレオイル-3-トリメチルアンモニウム-プロパン (DOTAP)、または1,2-ジテトラデカノイル-sn-グリセロ-3-ホスホコリン (DMPC)を含み、および/または親水性ポリマーは、エチレングリコールまたはポリエチレングリコール (PEG)を含み、かつ/あるいは、粒子はさらにコレステロールを含む(例えば、製剤番号1:DOTAP 100、DMPC 0、PEG 0、コレステロール0からの粒子、製剤番号2:DOTAP 90、DMPC 0、PEG 10、コレステロール0からの粒子、製剤番号3:DOTAP 90、DMPC 0、PEG 5、コレステロール5からの粒子など)。粒子は、まずエフェクタータンパク質とRNAを、例えば1:1のモル比で、例えば室温で、例えば30分間、例えば無菌のヌクレアーゼ不含の1X PBS中で混合し、製剤に適用可能なDOTAP、DMPC、PEG、およびコレステロールを個別に、アルコール、例えば100%エタノール中に溶解し、2つの溶液を共に混合して複合体を含有する粒子を形成する、効率的な多段階工程を使用して形成される。
核酸標的化エフェクタータンパク質(例えば、C2c1などのV型タンパク質)mRNAおよびガイドRNAは、粒子または脂質外膜を使用して同時に送達されてもよい。適切な粒子の例として、米国特許9,301,923号に説明される粒子が挙げられるが、これに限定はされない。
例えば、Su X、Fricke J、Kavanagh DG、およびIrvine DJ(“In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles”「脂質外膜pH応答性ポリマーナノ粒子を用いるin vitroおよびin vivo mRNA送達」Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. Epub 2011 Apr 1)は、リン脂質の二層シェルにより封入されたポリ(β-アミノエステル)(PBAE)コアを備えた生分解性コア-シェル構造粒子を説明している。これらは、in vivoでのmRNA送達のために開発された。pH応答性PBAE成分は、エンドソームの分解を促進するために選択され、脂質表面層は、ポリ陽イオンコアの毒性を最小限に抑えるように選択された。従って、この成分は本発明のRNAの送達用に好ましい。
一実施態様では、自己組織化生体接着性ポリマーに基づく粒子/ナノ粒子が想定され、これは、ペプチドの経口送達、ペプチドの静脈内送達、およびペプチドの経鼻送達に適用され、全てが脳への送達に適用されてもよい。疎水性薬物の経口吸収および眼内送達などの他の実施態様もまた想定される。分子外膜技術は、保護されかつ疾患部位に送達される操作されたポリマー外膜を含む(例えば、Mazza, M. et al. ACSNano, 2013. 7(2): 1016-1026、Siew, A., et al. Mol Pharm, 2012. 9(1):14-28、Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523-36、Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665-80、Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764-74、Garrett, N.L., et al. J Biophotonics, 2012. 5(5-6):458-68、Garrett, N.L., et al. J Raman Spect, 2012. 43(5):681-688、Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33、Uchegbu, I.F. Expert Opin Drug Deliv, 2006. 3(5):629-40、Qu, X.,et al. Biomacromolecules, 2006. 7(12):3452-9、およびUchegbu, I.F., et al. Int J Pharm, 2001. 224:185-199を参照)。標的組織に応じて、単回または複数回の投与で、約5 mg/kgの投与が想定される。
一実施態様では、MITのDan Andersonの研究室によって開発された腫瘍増殖を停止するためのRNAを癌細胞に送達できる粒子/ナノ粒子を使用でき、かつ/あるいは本発明のAD機能化CRISPR-Casシステムに適合させることができる。特に、Andersonの研究室は、新規の生体材料およびナノ製剤の合成、精製、特性解析、および製剤化のための完全に自動化された組合せのシステムを開発した。例えば、Alabi et al., Proc Natl Acad Sci U S A. 2013 Aug 6;110(32):12881-6、Zhang et al., Adv Mater. 2013 Sep 6;25(33):4641-5、Jiang et al., Nano Lett. 2013 Mar 13;13(3):1059-64、Karagiannis et al., ACS Nano. 2012 Oct 23;6(10):8484-7、Whitehead et al., ACS Nano. 2012 Aug 28;6(8):6922-9、およびLee et al., Nat Nanotechnol. 2012 Jun 3;7(6):389-93を参照。
米国特許公開20110293703号は、本発明のAD機能化CRISPR-Casシステムを送達するために適用できるポリヌクレオチドの投与でも特に有用であるリピドイド化合物に関する。一側面では、アミノアルコールリピドイド化合物を、細胞または対象に送達される薬剤と組み合わせて、ミクロ粒子、ナノ粒子、リポソーム、またはミセルを形成する。粒子、リポソーム、またはミセルによって送達される薬剤は、気体、液体、または固体の形態であってもよく、この薬剤は、ポリヌクレオチド、タンパク質、ペプチド、または小分子であってもよい。アミノアルコールリピドイド化合物を、他のアミノアルコールリピドイド化合物、(合成または天然の)ポリマー、界面活性剤、コレステロール、炭水化物、タンパク質、脂質などと組み合わせて、粒子を生成してもよい。これらの粒子を、続いて、場合によっては医薬賦形剤と組み合わせて、医薬組成物を生成してもよい。
米国特許公開20110293703号はまた、アミノアルコールリピドイド化合物を調製する方法を提供する。1当量以上のアミンを、適切な条件で1当量以上のエポキシド末端化合物と反応させて、本発明のアミノアルコールリピドイド化合物を生成できる。特定の実施態様では、アミンの全てのアミノ基は、エポキシド末端化合物と完全に反応して、第三級アミンを生成する。他の実施態様では、アミンの全てのアミノ基は、エポキシド末端化合物と完全に反応して第三級アミンを生成するのではなく、それによってアミノアルコールリピドイド化合物中に第一級アミンまたは第二級アミンが生じる。これらの第一級または第二級アミンはそのまま放置するか、別のエポキシド末端化合物などの別の求電子剤と反応させてもよい。当業者には分かっているように、アミンを過剰でない量のエポキシド末端化合物と反応させると、様々な数のテールを有する複数の異なるアミノアルコールリピドイド化合物が得られる。特定のアミンは、2つのエポキシド由来の化合物テールで完全に官能化されてもよいが、他の分子は、エポキシド由来の化合物テールで完全に官能化されていない。例えば、ジアミンまたはポリアミンは、第一級、第二級、および第三級アミンをもたらす分子の様々なアミノ部分から離れて、1つ、2つ、3つ、または4つのエポキシド由来の化合物を含んでもよい。特定の実施態様では、全てのアミノ基が完全に官能化されてはいない。特定の実施態様では、同一型のエポキシド末端化合物のうちの2つが使用される。他の実施態様では、2つ以上の異なるエポキシド末端化合物が使用される。アミノアルコールリピドイド化合物の合成は、溶媒の有無にかかわらず実行され、合成は、30~100°Cの範囲にある高い温度で、好ましくは約50~90°Cで実行されてもよい。調製されたアミノアルコールリピドイド化合物は、必要に応じて精製されてもよい。例えば、アミノアルコールリピドイド化合物の混合物を精製して、特定の数のエポキシド由来の化合物テールを有するアミノアルコールリピドイド化合物を生成してもよい。あるいは、混合物を精製して、特定の立体異性体または位置異性体を生成してもよい。アミノアルコールリピドイド化合物はまた、ハロゲン化アルキル(例えばヨウ化メチル)または他のアルキル化剤を使用してアルキル化してもよく、かつ/あるいはそれらをアシル化してもよい。
米国特許公開20110293703号はまた、本発明の方法によって調製されたアミノアルコールリピドイド化合物のライブラリーを提供する。これらのアミノアルコールリピドイド化合物を、液体ハンドラー、ロボット、マイクロタイタープレート、コンピュータなどを含む高速処理技術を使用して、調製かつ/あるいは選別することができる。特定の実施態様では、アミノアルコールリピドイド化合物を、ポリヌクレオチドまたは(タンパク質、ペプチド、小分子などの)その他の薬剤を細胞内に形質導入するそれらの能力について選別する。
米国特許公開20130302401号は、組合せ重合を使用して調製された一部類のポリ(β-アミノアルコール)(PBAA)に関する。本発明のPBAAは、被覆剤(医療用素子または移植片用のフィルムまたは多層フィルムの被覆剤など)、添加剤、材料、賦形剤、非生物付着剤、微細化剤、および細胞封入剤として、バイオテクノロジー用途および生物医学的用途に使用できる。これらのPBAAを表面被覆剤として使用した場合に、それらの化学構造に応じて、in vitroとin vivoの両方で種々の程度の炎症が誘発された。この部類の材料の広い化学的多様性により、in vitroでマクロファージの活性化を阻害するポリマー被覆剤を特定できた。さらに、これらの被覆剤は、カルボキシル化ポリスチレン微粒子の皮下移植後に、炎症細胞の動員を減弱しかつ線維症を低減する。これらのポリマーを用いて、細胞カプセル化のための高分子電解質複合カプセルを形成できる。本発明にはまた、抗菌被覆、DNAまたはsiRNAの送達、および幹細胞組織の操作などの他の多くの生物学的用途が存在する。米国特許公開第20130302401号の教示により、本発明のAD機能化CRISPR-Casシステムに適用できる。
C2c1、(C2c1またはアダプタータンパク質に融合され得る)アデノシンデアミナーゼ、およびガイドRNAを含む予め構築された組換えCRISPR-Cas複合体は、例えばエレクトロポレーション法によって形質導入されてもよく、高い変異率および検出可能な非特異的標的変異の排除をもたらす。Hur, J.K. et al, Targeted mutagenesis in mice by electroporation of C2c1 ribonucleoproteins(C2c1リボ核タンパク質のエレクトロポレーション法によるマウスでの標的変異誘発),Nat Biotechnol. 2016 Jun 6. doi: 10.1038/nbt.3596を参照。
脳への局所送達に関して、この送達は種々の方法で達成できる。例えば、材料を線条体内注射などによって送達できる。注射は、開頭術を介して定位固定法により実施できる。
実施態様によっては、糖に基づく粒子、例えばGalNAcを、本明細書に記載されるように、かつ(参照により本明細書に組み込まれる)国際特許出願WO2014118272号およびNair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961を参照として使用してもよく、これらでの教示を、特に他に明示のない限り、全ての粒子の送達に適用する。このGalNAcは、糖に基づく粒子であると見做すことができ、その他の粒子送達システムおよび/または製剤に関しては、本明細書にさらに詳述される。従って、GalNAcは、本明細書に説明のその他の粒子と同じ意味付けでの粒子であると見做すことができ、結果として、一般的な使用法および他の考慮事項、例えば、前記粒子の送達法は、GalNAc粒子にも適用される。例えば、液相複合手法を用いて、PFP(ペンタフルオロフェニル)エステルとして活性化された三本触覚性のGalNAcクラスター(分子量:約2000)を、5’-ヘキシルアミノ改変オリゴヌクレオチド(5’-HA ASO、分子量:約8000 Da、Oestergaard et al., Bioconjugate Chem., 2015, 26 (8), pp 1451-1455を参照)に付加してもよい。同様に、ポリ(アクリラート)ポリマーも、in vivo核酸送達について説明されている(参照により本明細書に組み込まれる国際特許出願WO2013158141号を参照)。さらに別の実施態様では、送達を改善するために、CRISPRナノ粒子(またはタンパク質複合体)の天然起源の血清タンパク質との事前混合を使用してもよい(Akinc A et al, 2010, Molecular Therapy vol. 18 no. 7, 1357-1364を参照)。
ナノクルー
さらに、AD機能化CRISPRシステムは、例えば、Sun W et al, Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery.(抗癌剤送達のための繭様自己分解性DNAナノクルー), J Am Chem Soc. 2014 Oct 22;136(42):14722-5. doi: 10.1021/ja5088024. Epub 2014 Oct 13.、またはSun W et al, Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9 for Genome Editing.(ゲノム編集用のCRISPR-Cas9の効率的な送達のための自己集合化DNAナノクルー), Angew Chem Int Ed Engl. 2015 Oct 5;54(41):12029-33. doi: 10.1002/anie.201506030. Epub 2015 Aug 27に説明されている。
脂質粒子
実施態様によっては、送達は、LNPなどの脂質粒子中へのC2c1タンパク質またはmRNAのカプセル化形態によって実施される。従って、実施態様によっては、各種の脂質粒子 (LNP)が想定される。抗トランスチレチン低分子干渉RNAは、脂質ナノ粒子にカプセル化されてヒトに送達されており(例えば、Coelho et al., N Engl J Med 2013;369:819-29を参照)、そのシステムを本発明のCRISPR Casシステムに適合・応用することができる。静脈内投与では、体重1 kgあたり約0.01~約1 mgの用量が想定される。注入関連反応のリスクを低減するために、デキサメタゾン、アセタンピノフェン、ジフェンヒドラミン、またはセチリジンなどの薬物療法が想定され、かつラニチジンが想定される。4週間ごとの5回の投与で、1 kgあたり約0.3mgの複数回投与も考えられる。
LNPは、肝臓へのsiRNAの送達に非常に効果的であることが示されており(例えば、Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470を参照)、従ってLNPでは、CRISPR CasをコードするRNAの肝臓への送達が想定される。2週間ごとの6 mg/kgでのLNPの約4回投与が想定されてもよい。Taberneroらは、腫瘍の退縮が0.7 mg/kgで投与されたLNPの最初の2サイクル後に観察され、6サイクルの終了までに、患者はリンパ節転移の完全な退縮および肝腫瘍の実質的な縮小を伴う部分的な応答を達成したことを示していた。この患者では、40回の投与後に完全な応答が得られ、26ヶ月を超えて投与を受けた後に、寛解を維持して治療を完了した。VEGF経路阻害剤による先行治療後に進行していた、腎臓、肺、リンパ節を含む腎細胞がん (RCC)および肝外部位疾患を有する2人の患者は、全ての部位で約8~12ヶ月間疾患は安定し、膵神経内分泌腫瘍 (PNET)および肝転移を有する患者では、18ヶ月間(36回投与)の延長検討で、疾患の安定性が継続した。
但し、LNPの電荷を考慮に入れる必要がある。陽イオン性脂質は、負に帯電した脂質と結合して、細胞内送達を促進する非二重層構造を誘導する。帯電したLNPは静脈内注射後に循環から急速に排除されるために、pKa値が7未満のイオン化可能な陽イオン性脂質が開発された(例えば、Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011を参照)。RNAなどの負に帯電したポリマーは、イオン化可能な脂質が正の帯電を示す低pH値(例えばpH 4)でLNP中に詰込まれてもよい。しかし生理的なpH値では、LNPはより長い循環時間と両立できる低い表面帯電を示す。4種のイオン化可能な陽イオン性脂質、すなわち1,2-ジリノイル-3-ジメチルアンモニウム-プロパン (DLinDAP)、1,2-ジリノレイルオキシ-3-N,N-ジメチルアミノプロパン (DLinDMA)、1,2-ジリノレイルオキシ-ケト-N,N-ジメチル-3-アミノプロパン (DLinK-DMA)、および1,2-ジリノレイル-4-(2-ジメチルアミノエチル)-[1,3]-ジオキソラン (DLinKC2-DMA)が注目されている。これらの脂質を含むLNP siRNAシステムは、肝細胞中で顕著に異なるin vivoでの遺伝子サイレンシング特性を示し、その効力は、第VII因子遺伝子サイレンシングモデルを用いると、DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAPの順に従って変化することが示されている(例えば、Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011を参照)。特にDLinKC2-DMAを含有する製剤の場合に、LNPあるいはLNP内のまたはLNPに会合するCRISPR-Cas RNAでは、1 μg/mlの用量が想定されてもよい。
LNPとCRISPR-Casとのカプセル化の調製には、Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011の説明内容を用いてもよく、かつ/あるいはそれを応用してもよい。陽イオン性脂質である1,2-ジリノイル-3-ジメチルアンモニウム-プロパン (DLinDAP)、1,2-ジリノレイルオキシ-3-N,N-ジメチルアミノプロパン (DLinDMA)、1,2-ジリノレイルオキシ-ケト-N,N-ジメチル-3-アミノプロパン (DLinKDMA)、1,2-ジリノレイル-4-(2-ジメチルアミノエチル)-[1,3]-ジオキソラン (DLinKC2-DMA)、(3-o-[2"-(メトキシポリエチレングリコール2000)スクシノイル]-1,2-ジミリストイル-sn-グリコール(PEG-S-DMG)、およびR-3-[(ω-メトキシ-ポリ(エチレングリコール)2000)カルバモイル]-1,2-ジミリスチロキシルプロピル-3-アミン(PEG-C-DOMG)は、Tekmira Pharmaceuticals (Vancouver, Canada)から取り寄せてもよく、合成してもよい。コレステロールはSigma (St Louis, MO)から購入してもよい。特定のCRISPR-Cas RNAは、(陽イオン性脂質:DSPC:CHOL:PEGS-DMGまたはPEG-C-DOMGのモル比が、40:10:40:10である)DLinDAP、DLinDMA、DLinK-DMA、およびDLinKC2-DMAを含有するLNP内にカプセル化されてもよい。必要に応じて、0.2%のSP-DiOC18(Invitrogen, Burlington, Canada)を組込んで、細胞への取込み、細胞内送達、および生体内分布を評価してもよい。カプセル化は、(40:10:40:10のモル比の)陽イオン性脂質:DSPC:コレステロール:PEG-C-DOMGから構成される脂質混合物をエタノール中に溶解して最終脂質濃度を10 mmol/lとすることにより実施してもよい。この脂質のエタノール溶液を、50 mmol/l、pH 4.0のクエン酸に滴下し、最終濃度30% (vol/vol)エタノールとして、多層小胞を形成してもよい。大単層小胞は、押出機(Northern Lipids, Vancouver, Canada)を使用して2層の80 nmのNucleporeポリカーボネートフィルターを通して多層小胞を押出した後に生成してもよい。カプセル化は、30% (vol/vol)エタノールを含む50 mmol/l、pH4.0のクエン酸塩中に2mg/mlで溶解したRNAを、押出し予備成形された大単層小胞に滴下し、0.06/1 (wt/wt)の最終RNA/脂質重量比まで一定に混合しつつ31°Cで30分間培養して達成してもよい。Spectra/Por 2再生セルロース透析膜を使用して、pH 7.4のリン酸緩衝生理食塩水 (PBS)に対して16時間透析することにより、エタノールの除去および製剤緩衝液の中和を実施した。ナノ粒子のサイズ分布は、NICOMP 370粒子分析計、小胞/強度モード、およびガウス分布近似(Gaussian fitting:Nicomp Particle Sizing, Santa Barbara, CA)を使用する動的光散乱によって決定してもよい。3種の全てのLNPシステムでの粒子寸法は、直径が約70 nmであってもよい。RNAカプセル化の効率は、透析の前後に採取された試料からVivaPureD MiniHカラム(Sartorius Stedim Biotech)を使用して遊離RNAを除去して決定してもよい。カプセル化されたRNAは、溶出された粒子から抽出され、かつ260 nmで定量される。脂質に対するRNAの比を、Wako Chemicals USA(Richmond, VA)のコレステロールE酵素測定法を使用して小胞中のコレステロール含量の測定によって決定した。LNPおよびPEG脂質の本明細書での考察と併せて、PEG化リポソームまたはLNPは、同様に、CRISPR-Casシステムまたはその成分の送達に適している。
脂質の予備混合溶液(20.4 mg/mlの総脂質濃度)を、50:10:38.5のモル比でDLinKC2-DMA、DSPC、およびコレステロールを含有するエタノール中で調製してもよい。酢酸ナトリウムを、0.75:1(酢酸ナトリウム:DLinKC2-DMA)のモル比で脂質の予備混合物に添加してもよい。続いて、激しく攪拌しながら1.85容量のクエン酸緩衝液(10 mmol/l、pH 3.0)とその混合物とを混ぜ合わせて脂質を水和し、35%のエタノールを含む水性緩衝液中で自発的にリポソームを生成してもよい。リポソーム溶液を37°Cで培養して、粒子サイズを経時的に増大させてもよい。動的光散乱(Zetasizer Nano ZS, Malvern Instruments, Worcestershire, UK)によるリポソームサイズの変化を調査するために、培養中の種々の時点で定分量を取り出してもよい。所望の粒子サイズが達成されたなら、水性PEG脂質溶液(原料溶液は、35% (vol/vol)エタノール中に10 mg/mlのPEG-DMGを含有)をリポソーム混合物に添加して、総脂質の3.5%の最終PEGモル濃度を得ることができる。PEG脂質を添加すると、リポソームはそのサイズとなり、さらなる成長が効率的に抑制される。次にRNAを空のリポソームに約1:10(wt:wt)のRNA:総脂質の比で添加してもよく、続いて37°Cで30分間培養して、詰め込まれたLNPを形成する。続いて混合物をPBS中で一晩透析して、0.45 μmのシリンジフィルターで濾過してもよい。
球状核酸(SNATM)構築物および他の粒子(特に金ナノ粒子)もまた、意図された標的にCRISPR-Casシステムを送達するための手段として想定されている。有意なデータとして、核酸で機能化された金ナノ粒子に基づくAuraSense TherapeuticsのSpherical Nucleic Acid(SNATM)構築物が有用であることが示されている。
本明細書の教示とともに使用し得る文献として、Cutler et al., J. Am. Chem. Soc. 2011 133:9254-9257、Hao et al., Small. 2011 7:3158-3162、Zhang et al., ACS Nano. 2011 5:6962-6970、Cutler et al., J. Am. Chem. Soc. 2012 134:1376-1391、Young et al., Nano Lett. 2012 12:3867-71、Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80、Mirkin, Nanomedicine 2012 7:635-638、Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691、Weintraub, Nature 2013 495:S14-S16、Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630、Jensen et al., Sci. Transl. Med. 5, 209ra152 (2013)、およびMirkin, et al., Small, 10:186-192が挙げられる。
RNAを有する自己集合性粒子は、ポリエチレングリコール (PEG)の遠位端に付着したArg-Gly-Asp (RGD)ペプチドリガンドでPEG化されたポリエチレンイミン (PEI)で構築されてもよい。このシステムは、例えば、インテグリンを発現する腫瘍血管新生を標的とし、血管内皮増殖因子受容体-2 (VEGF R2)の発現を阻害するsiRNAを送達し、それによって腫瘍血管新生を達成する手段として使用されてきた(例えば、Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19を参照)。ナノプレックスは、陽イオン性ポリマーと核酸の等容量の水溶液を混合し、リン酸塩(核酸)に対するイオン化可能な窒素(ポリマー)の正味モルを2~6の範囲で過剰にして調製できる。陽イオン性ポリマーと核酸の間の静電相互作用は、約100 nmの平均粒子サイズ分布を有するポリプレックスの形成をもたらすので、本明細書ではナノプレックスと呼ばれる。Schiffelersらの自己集合性粒子での送達には、約100~200 mgのCRISPR Casの用量が想定される。
Bartlettら(PNAS, September 25, 2007,vol. 104, no. 39)のナノプレックスもまた、本発明に適用されてもよい。Bartlettらのナノプレックスは、陽イオン性ポリマーと核酸の等量の水溶液を混合して、リン酸塩(核酸)に対するイオン化可能な窒素(ポリマー)の正味モルを2~6の範囲で過剰にして調製される。陽イオン性ポリマーと核酸の間の静電相互作用は、約100 nmの平均粒子サイズ分布を有するポリプレックスの生成をもたらすので、本明細書ではナノプレックスと呼ばれる。BartlettらのDOTA-siRNAは以下のように合成された。1,4,7,10-テトラアザシクロドデカン-1,4,7,10-テトラ酢酸モノ(N-ヒドロキシスクシンイミドエステル)(DOTA-NHS-ester)はMacrocyclics(Dallas, TX)から取り寄せた。炭酸緩衝液(pH 9)中の100倍のモル過剰のDOTA-NHS-エステルを有するアミン改変RNAセンス鎖をマイクロ遠心管に添加した。内容物を室温で4時間撹拌して反応させた。DOTA-RNAセンス複合体をエタノール沈殿させ、水中に再懸濁し、未改変のアンチセンス鎖にアニールしてDOTA-siRNAを生成した。全ての液体をChelex-100(Bio-Rad, Hercules, CA)で前処理して、微量金属汚染物質を除去した。Tf標的化および非標的化siRNA粒子は、シクロデキストリン含有ポリ陽イオンを使用して生成できる。典型的には、粒子は、3(+/-)の電荷比および0.5 g/lのsiRNA濃度に水中で生成された。標的粒子の表面のアダマンタン-PEG分子の1%は、Tf(アダマンタン-PEG-Tf)で改変された。この粒子は、注射用の5% (wt/vol)グルコース担体溶液中に懸濁された。
Davisら(Nature, Vol 464, 15 April 2010)は、標的ナノ粒子送達システム(臨床試験登録番号NCT00689065)を使用するRNA臨床試験を実施している。標準治療では難治性の固形癌の患者には、21日サイクルの1、3、8、および10日目に、30分の静脈内注入によって標的ナノ粒子の用量を投与する。ナノ粒子は、(1)鎖状のシクロデキストリン系ポリマー (CDP)、(2)癌細胞の表面でTF受容体 (TFR)と結合するナノ粒子の外側に表示されたヒトトランスフェリンタンパク質 (TF)標的リガンド、(3)親水性ポリマー(生体液中のナノ粒子の安定性を促進するように使用されるポリエチレングリコール (PEG))、および(4)RRM2の発現を低減するように設計されたsiRNA(臨床で使用される配列は、以前はsiR2B+5と表記されていた)を含む合成送達システムからなっている。TFRは悪性細胞中で上方制御されることが長い間知られており、RRM2は確立された抗癌標的である。(CALAA-01として示される臨床方式である)これらの粒子は、ヒト以外の霊長類での複数回投与の研究で十分に許容されることが示されている。1人の慢性骨髄性白血病の患者へのリポソーム送達によってsiRNAが投与されたが、Davisらの臨床試験は、標的送達システムでsiRNAを全身に送達して固形癌の患者を治療する最初のヒト試験である。標的送達システムがヒト腫瘍への機能的なsiRNAの効果的な送達を提供できるかどうかを確かめるために、Davisらは、3つの異なる投与群からの3人の患者での生検を調査した。患者A、B、およびCは、全員が転移性黒色腫を患っていて、それぞれ18、24、および30 mg/m2のsiRNAのCALAA-01用量を投与された。同様の用量を、本発明のCRISPR-Casシステムについて想定してもよい。本発明の送達は、鎖状のシクロデキストリン系ポリマー (CDP)、癌細胞の表面でTF受容体 (TFR)と結合する粒子の外側に表示されたヒトトランスフェリンタンパク質 (TF)標的リガンド、および/または親水性ポリマー(例えば、生体液中の粒子の安定性を促進するために使用されるポリエチレングリコール(PEG))を含む粒子により達成されてもよい。
参照により本明細書に組み込まれる米国特許8,709,843号は、組織、細胞、および細胞内区画への治療薬含有粒子の標的送達のための薬物送達システムを提供する。本発明は、界面活性剤に結合したポリマー、親水性ポリマー、または脂質を含む標的粒子を提供する。参照により本明細書に組み込まれる米国特許6,007,845号は、多機能化合物を1つ以上の疎水性ポリマーおよび1つ以上の親水性ポリマーと共有結合して形成されるマルチブロック共重合体のコアを有し、かつ生物学的に活性な材料を含む粒子を提供する。参照により本明細書に組み込まれる米国特許5,855,913号は、肺システムへの薬物送達のために、その表面に界面活性剤を組み込んだ、タップ密度が0.4 g/cm3未満で平均直径が5 μm~30 μmの空気力学的に軽い粒子を有する粒子組成物を提供する。参照により本明細書に組み込まれる米国特許5,985,309号は、肺システムへの送達のために、界面活性剤、および/または正または負に帯電した治療薬または診断薬と反対の電荷の帯電分子との親水性または疎水性の複合体を組み込んだ粒子を提供する。参照により本明細書に組み込まれる米国特許5,543,158号は、生物学的に活性な材料および表面にポリアルキレングリコール部分を含有する生分解性固体コアを有する生分解性の注射用粒子を提供する。参照により本明細書に組み込まれる国際特許出願WO2012135025号(US20120251560号としても公開)は、共役ポリエチレンイミン (PEI)ポリマーおよび共役アザ大環状化合物(総称して「共役リポマー」または「リポマー」と呼ばれる)を説明している。特定の実施態様では、そのような共役リポマーをCRISPR-Casシステムの環境で使用して、タンパク質発現の調節を含む遺伝子発現を改変するためのin vitro、ex vivo、およびin vivoでのゲノム摂動を達成できることが意図されてもよい。
一実施態様では、粒子は、エポキシド修飾脂質ポリマー、好ましくは7C1であってもよい(例えば、2014年5月11日にdoi:10.1038/nnano.2014.84でオンライン公開されたJames E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014)を参照)。C71を、C15エポキシド末端脂質をPEI600と14:1のモル比で反応させて合成し、かつC14PEG2000を配合して、安定な粒子(直径35~60 nm)をPBS溶液中で少なくとも40日かけて生成した。
エポキシド修飾脂質ポリマーを利用して、本発明のCRISPR-Casシステムを肺細胞、心臓血管細胞、または腎細胞に送達できるが、当業者ならこのシステムを他の標的臓器への送達に適合させることができる。約0.05~約0.6 mg/kgの範囲の用量が想定される。数日または数週間にわたる用量も想定され、総用量は約2 mg/kgである。
実施態様によっては、RNA分子を送達するためのLNPは、例えば、国際特許出願WO2005/105152 (PCT/EP2005/004920)号、WO2006/069782 (PCT/EP2005/014074)号、WO2007/121947 (PCT/EP2007/003496)号、およびWO2015/082080 (PCT/EP2014/003274)号に説明されている方法などの当技術分野で知られている方法によって調製され、これらは参照により本明細書に組み込まれる。哺乳動物細胞へのsiRNAの増強および改善された送達を特に目的とするLNPは、例えば、Aleku et al., Cancer Res., 68(23): 9788-98 (Dec. 1, 2008)、Strumberg et al., Int. J. Clin. Pharmacol. Ther., 50(1): 76-8 (Jan. 2012)、Schultheis et al., J. Clin. Oncol., 32(36): 4141-48 (Dec. 20, 2014)、およびFehring et al., Mol. Ther., 22(4): 811-20 (Apr. 22, 2014)に説明され、これらは参照により本明細書に組み込まれ、本技術に適用できる。
実施態様によっては、LNPは、WO2005/105152 (PCT/EP2005/004920)号、WO2006/069782 (PCT/EP2005/014074)号、WO2007/121947 (PCT/EP2007/003496)号、およびWO2015/082080 (PCT/EP2014/003274)号に開示されているいずれかのLNPを含む。
実施態様によっては、LNPは、式Iを有する少なくとも1つの脂質を含む。
式中、R1およびR2はそれぞれ、アルキルを含む群から独立して選択され、nは1~4の任意の整数であり、R3は、リシル、オルニチル、2,4-ジアミノブチリル、ヒスチジル、および式IIに従うアシル部分を含む群から選択されるアシルである。
式中、mは1~3の任意の整数であり、Yは薬学的に許容される陰イオンである。実施態様によっては、式Iによる脂質は、少なくとも2個の非対称のC原子を含む。実施態様によっては、式Iの鏡像異性体は、限定はされないが、R-R、S-S、R-S、およびS-R鏡像異性体を含む。
実施態様によっては、R1はラウリルであり、R2はミリスチルである。別の実施態様では、R1はパルミチルであり、R2はオレイルである。実施態様によっては、mは1または2である。実施態様によっては、Yは、ハロゲン化物、酢酸塩、またはトリフルオロ酢酸塩から選択される。
実施態様によっては、LNPは、以下から選択される1つ以上の脂質を含む。
-アルギニル-2,3-ジアミノプロピオン酸-N-パルミチル-N-オレイル-アミド三塩酸塩(式III):
-アルギニル-2,3-ジアミノプロピオン酸-N-ラウリル-N-ミリスチル-アミド三塩酸塩(式IV):
および
-アルギニル-リジン-N-ラウリル-N-ミリスチル-アミド三塩酸塩(式V):
実施態様によっては、LNPはまた、1つの成分を含む。限定はされないが、実施態様によっては、この成分は、例えばペプチド、タンパク質、オリゴヌクレオチド、ポリヌクレオチド、核酸、またはそれらの組合せから選択される。実施態様によっては、成分は、抗体、例えばモノクローナル抗体である。実施態様によっては、成分は、例えば、リボザイム、アプタマー、シュピーゲルマー、DNA、RNA、PNA、LNA、またはそれらの組合せから選択される核酸である。実施態様によっては、核酸は、ガイドRNAおよび/またはmRNAである。
実施態様によっては、LNPの成分は、CRIPSR-Casタンパク質をコードするmRNAを含む。実施態様によっては、LNPの成分は、II型またはV型のCRIPSR-Casタンパク質をコードするmRNAを含む。実施態様によっては、LNPの成分は、(CRISPR-Casタンパク質またはアダプタータンパク質に融合され得る)アデノシンデアミナーゼをコードするmRNAを含む。
実施態様によっては、LNPの成分はさらに、1つ以上のガイドRNAを含む。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを血管内皮に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを肺内皮に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを肝臓に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを肺に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを心臓に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを脾臓に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを腎臓に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを膵臓に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAを脳に送達するように構成される。実施態様によっては、LNPは、前述のmRNAおよびガイドRNAをマクロファージに送達するように構成される。
実施態様によっては、LNPはまた、少なくとも1つのヘルパー脂質を含む。実施態様によっては、ヘルパー脂質は、リン脂質およびステロイドから選択される。実施態様によっては、リン脂質は、リン酸のジエステルおよび/またはモノエステルである。実施態様によっては、リン脂質は、ホスホグリセリドおよび/またはスフィンゴ脂質である。実施態様によっては、ステロイドは、部分的に水素化されたシクロペンタ[a]フェナントレンに基づく天然起源および/または合成の化合物である。実施態様によっては、ステロイドは、21~30個のC原子を含む。実施態様によっては、ステロイドはコレステロールである。実施態様によっては、ヘルパー脂質は、1,2-ジフィタノイル-sn-グリセロ-3-ホスホエタノールアミン (DPhyPE)、セラミド、および1,2-ジオレイル-sn-グリセロ-3-ホスホエタノールアミン(DOPE)から選択される。
実施態様によっては、少なくとも1つのヘルパー脂質は、PEG部分、HEG部分、ポリヒドロキシエチルスターチ (polyHES)部分、およびポリプロピレン部分を含む群から選択される部分を含む。実施態様によっては、この部分は、約500~10,000 Daまたは約2000~5000 Daの分子量を有する。実施態様によっては、PEG部分は、1,2-ジステアロイル-sn-グリセロ-3-ホスホエタノールアミン、1,2-ジアルキル-sn-グリセロ-3-ホスホエタノールアミン、およびセラミド-PEGから選択される。実施態様によっては、PEG部分は、約500~10,000 Daまたは約2000~5000 Daの分子量を有する。実施態様によっては、PEG部分は、2000 Daの分子量を有する。
実施態様によっては、ヘルパー脂質は、組成物の総脂質含量の約20 mol%~80 mol%である。実施態様によっては、ヘルパー脂質成分は、LNPの総脂質含量の約35 mol%~65 mol%である。実施態様によっては、LNPは、LNPの総脂質含量の50 mol%の脂質および50 mol%のヘルパー脂質を含む。
実施態様によっては、LNPは、DPhyPEと組み合わせて、 -3-アルギニル-2,3-ジアミノプロピオン酸-N-パルミチル-N-オレイル-アミド三塩酸塩、 -アルギニル-2,3-ジアミノプロピオン酸-N-ラウリル-N-ミリスチル-アミド三塩酸塩、または -アルギニル-リジン-N-ラウリル-N-ミリスチル-アミド三塩酸塩のいずれかを含み、DPhyPEの含量は、LNPの総脂質含量の約80 mol%、65 mol%、50 mol%、および35 mol%である。実施態様によっては、LNPは、 -アルギニル-2,3-ジアミノプロピオン酸-N-パルミチル-N-オレイル-アミド三塩酸塩(脂質)および1,2-ジフィタノイル-sn-グリセロ-3-ホスホエタノールアミン(ヘルパー脂質)を含む。実施態様によっては、LNPは、 -アルギニル-2,3-ジアミノプロピオン酸-N-パルミチル-N-オレイル-アミド三塩酸塩(脂質)、1,2-ジフィタノイル-sn-グリセロ-3-ホスホエタノールアミン(第1のヘルパー脂質)、および1,2-ジステロイル-sn-グリセロ-3-ホスホエタノールアミン-PEG2000(第2のヘルパー脂質)を含む。
実施態様によっては、第2のヘルパー脂質は、総脂質含量の約0.05 mol%~4.9 mol%、または約1 mol%~3 mol%である。実施態様によっては、LNPは、脂質、第1のヘルパー脂質、および第2のヘルパー脂質の含量の総計が総脂質含量の100 mol%であり、第1のヘルパー脂質および第2のヘルパー脂質の総計が総脂質含量の50 mol%であり、かつ総脂質含量の約0.1 mol%~5 mol%、約1 mol%~4 mol%、または約2 mol%のPEG化された第2ヘルパー脂質が存在するという条件の下で、総脂質含量の約45 mol%~50 mol%の脂質、総脂質含量の約45 mol%~50 mol%の第1のヘルパー脂質を含む。実施態様によっては、LNPは、(a)50 mol%の -アルギニル-2,3-ジアミノプロピオン酸-N-パルミチル-N-オレイル-アミド三塩酸塩、48 mol%の1,2-ジフィタノイル-sn-グリセロ-3-ホスホエタノールアミン、および2 mol%の1,2-ジステアロイル-sn-グリセロ-3-ホスホエタノールアミン-PEG2000、あるいは(b)50 mol%の -アルギニル-2,3-ジアミノプロピオン酸-N-パルミチル-N-オレイル-アミド三塩酸塩、49 mol%の1,2-ジフィタノイル-sn-グリセロ-3-ホスホエタノールアミン、および1mol%のN(カルボニル-メトキシポリエチレングリコール-2000)-1,2-ジステアロイル-sn-グリセロ-3-ホスホエタノールアミンまたはそのナトリウム塩を含む。
実施態様によっては、LNPは、核酸骨格リン酸:陽イオン性脂質窒素原子の電荷比が約1:1.5~7または約1:4である核酸を含む。
実施態様によっては、LNPはまた、in vivo条件で脂質組成物から除去可能な遮蔽化合物を含む。実施態様によっては、遮蔽化合物は生物学的に不活性な化合物である。実施態様によっては、遮蔽化合物は、その表面またはその分子自体に電荷を持たない。実施態様によっては、遮蔽化合物は、ポリエチレングリコール (PEG)系ポリマー、ヒドロキシエチルグルコース (HEG)系ポリマー、ポリヒドロキシエチルスターチ (polyHES)、およびポリプロピレンである。実施態様によっては、PEG、HEG、polyHES、およびポリプロピレンの分子量は、約500~10,000 Daまたは約2000~5000 Daである。実施態様によっては、遮蔽化合物は、PEG2000またはPEG5000である。
実施態様によっては、LNPは、少なくとも1つの脂質、第1のヘルパー脂質、およびin vivo条件で脂質組成物から除去可能な遮蔽化合物を含む。実施態様によっては、LNPはまた、第2のヘルパー脂質を含む。実施態様によっては、第1のヘルパー脂質はセラミドである。実施態様によっては、第2のヘルパー脂質はセラミドである。実施態様によっては、セラミドは、6~10個の炭素原子の少なくとも1つの短い炭素鎖置換基を含む。実施態様によっては、セラミドは、8個の炭素原子を含む。実施態様によっては、遮蔽化合物はセラミドに付着している。実施態様によっては、遮蔽化合物は、セラミドに共有結合している。実施態様によっては、遮蔽化合物は、LNP内の核酸に付着している。実施態様によっては、遮蔽化合物は、核酸に共有結合している。実施態様によっては、遮蔽化合物は、リンカーによって核酸に付着している。実施態様によっては、リンカーは、生体条件で切断される。実施態様によっては、リンカーは、ssRNA、ssDNA、dsRNA、dsDNA、ペプチド、S-Sリンカー、およびpH感受性リンカーから選択される。実施態様によっては、リンカー部分は、核酸のセンス鎖の3’末端に付着している。実施態様によっては、遮蔽化合物は、pH感受性リンカーまたはpH感受性部分を含む。実施態様によっては、pH感受性リンカーまたはpH感受性部分は、陰イオン性リンカーまたは陰イオン性部分である。実施態様によっては、陰イオン性リンカーまたは陰イオン性部分は、酸性環境では陰イオン性がより低いか、あるいは中性である。実施態様によっては、pH感受性リンカーまたはpH感受性部分は、オリゴグルタミン酸、オリゴフェノラートおよびジエチレントリアミン五酢酸から選択される。
前の段落でのLNPの実施態様のいずれかで、LNPは、約50~600 mosmole/kg、約250~350 mosmole/kg、または約280~320 mosmole/kgのモル浸透圧濃度を有してもよく、かつ/あるいは、脂質および/または1個または2個のヘルパー脂質および遮蔽化合物によって形成されるLNPの粒径は、約20~200 nm、約30~100 nm、または約40~80 nmである。
実施態様によっては、遮蔽化合物は、in vivoでのより長い循環時間を提供し、LNPを含む核酸のより良好な生体内分布を可能にする。実施態様によっては、遮蔽化合物は、LNPが血清化合物または他の体液または細胞質膜の化合物、例えばLNPが投与される血管構造の内皮内層の細胞質膜との即時的な相互作用を防止する。さらに、またはあるいは、実施態様によっては、遮蔽化合物はまた、免疫系の要素がLNPと即時的に相互作用することを防止する。さらに、またはあるいは、実施態様によっては、遮蔽化合物は、抗オプソニン化化合物として作用する。いかなる機構または理論に拘束されることを望まないが、実施態様によっては、遮蔽化合物は、その環境との相互作用に利用可能なLNPの表面積を減少させる被膜または被覆物を形成する。さらに、またはあるいは、実施態様によっては、遮蔽化合物は、LNPの全体的な帯電を遮蔽する。
別の実施態様では、LNPは、式VIを有する少なくとも1つの陽イオン性脂質を含む。
式中、nは1、2、3、または4であり、mは1、2、または3であり、Yは陰イオンであり、R1およびR2のそれぞれは、鎖状C12~C18アルキルおよび鎖状C12~C18アルケニル、ステロール化合物、およびPEG化脂質からなる群から個別にかつ独立して選択され、ステロール化合物は、コレステロールおよびスチグマステロールからなる群から選択され、PEG化脂質はPEG部分を含み、PEG化脂質は、以下からなる群から選択される。
式VIIのPEG化ホスホエタノールアミン:
式中、R3およびR4は、個別にかつ独立して鎖状C13~C17アルキルであり、pは、15~130の任意の整数である;
式VIIIのPEG化セラミド:
式中、R5は鎖状C7~C15アルキルであり、qは15~130の任意の数である;および
式IXのPEG化ジアシルグリセロール:
式中、R6およびR7のそれぞれは、個別にかつ独立して鎖状のC11~C17アルキルであり、rは、15~130の任意の整数である。
実施態様によっては、R1およびR2は互いに異なる。実施態様によっては、R1はパルミチルであり、R2はオレイルである。実施態様によっては、R1はラウリルであり、R2はミリスチルである。実施態様によっては、R1およびR2は同じである。実施態様によっては、R1およびR2のそれぞれは、C12アルキル、C14アルキル、Cl6アルキル、Cl8アルキル、Cl2アルケニル、C14アルケニル、Cl6アルケニル、およびCl8アルケニルからなる群から個別にかつ独立して選択される。実施態様によっては、C12アルケニル、C14アルケニル、Cl6アルケニル、およびCl8アルケニルのそれぞれは、1つまたは2つの二重結合を含む。実施態様によっては、Cl8アルケニルは、C9とC10との間に1つの二重結合を有するCl8アルケニルである。実施態様によっては、C18アルケニルは、シス-9-オクタデシルである。
実施態様によっては、陽イオン性脂質は、式Xの化合物である:
実施態様によっては、Yは、ハロゲン化物、酢酸塩、およびトリフルオロ酢酸塩から選択される。実施態様によっては、陽イオン性脂質は、式IIIの -アルギニル-2,3-ジアミノプロピオン酸-N-パルミチル-N-オレイル-アミド三塩酸塩である。
実施態様によっては、陽イオン性脂質は、式IVの -アルギニル-2,3-ジアミノプロピオン酸-N-ラウリル-N-ミリスチル-アミド三塩酸塩である。
実施態様によっては、陽イオン性脂質は、式Vの -アルギニル-リジン-N-ラウリル-N-ミリスチル-アミド三塩酸塩である。
実施態様によっては、ステロール化合物はコレステロールである。実施態様によっては、ステロール化合物はスチグマステロールである。
実施態様によっては、PEG化脂質のPEG部分は、約800~5000 Daの分子量を有する。実施態様によっては、PEG化脂質のPEG部分の分子量は、約800 Daである。実施態様によっては、PEG化脂質のPEG部分の分子量は、約2000 Daである。実施態様によっては、PEG化脂質のPEG部分の分子量は、約5000 Daである。実施態様によっては、PEG化脂質は、式VIIのPEG化ホスホエタノールアミンであり、R3およびR4のそれぞれは、個別にかつ独立して鎖状C13~C17アルキルであり、pは、18、19、または20、あるいは44、45、または46、あるいは113、114、または115からの任意の整数である。実施態様によっては、R3およびR4は同じである。実施態様によっては、R3およびR4は異なる。実施態様によっては、R3およびR4のそれぞれは、C13アルキル、Cl5アルキル、およびCl7アルキルからなる群から個別にかつ独立して選択される。実施態様によっては、式VIIのPEG化ホスホエタノールアミンは、1,2-ジステアロイル-sn-グリセロ-3-ホスホエタノールアミン-N-[メトキシ(ポリエチレングリコール)-2000](アンモニウム塩)である。
実施態様によっては、式VIIのPEG化ホスホエタノールアミンは、1,2-ジステアロイル-sn-グリセロ-3-ホスホエタノールアミン-N-[メトキシ(ポリエチレングリコール)-5000](アンモニウム塩)である。
実施態様によっては、PEG化脂質は、式VIIIのPEG化セラミドであり、式中、R5は鎖状C7~C15アルキルであり、qは、18、19、または20、あるいは44、45、または46、あるいは113、114、または115からの任意の整数である。実施態様によっては、R5は鎖状C7アルキルである。実施態様によっては、R5は鎖状Cl5アルキルである。実施態様によっては、式VIIIのPEG化セラミドは、N-オクタノイル-スフィンゴシン-1-{スクシニル[メトキシ(ポリエチレングリコール)2000]}である。
実施態様によっては、式VIIIのPEG化セラミドは、N-パルミトイル-スフィンゴシン-1-{スクシニル[メトキシ(ポリエチレングリコール)2000]}である。
実施態様によっては、PEG化脂質は、式IXのPEG化ジアシルグリセロールであり、R6およびR7のそれぞれは、個別にかつ独立して鎖状Cl1~Cl7アルキルであり、rは、18、19、または20、あるいは44、45、または46、あるいは113、114、または115からの任意の整数である。実施態様によっては、R6およびR7は同じである。実施態様によっては、R6およびR7は異なる。実施態様によっては、R6およびR7のそれぞれは、鎖状Cl7アルキル、鎖状C15アルキル、および鎖状Cl3アルキルからなる群から個別にかつ独立して選択される。実施態様によっては、式IXのPEG化ジアシルグリセロールは、1,2-ジステアロイル-sn-グリセロール[メトキシ(ポリエチレングリコール)2000]である。
実施態様によっては、式IXのPEG化ジアシルグリセロールは、1,2-ジパルミトイル-sn-グリセロール[メトキシ(ポリエチレングリコール)2000]である。
実施態様によっては、式IXのPEG化ジアシルグリセロールは、以下の通りである。
実施態様によっては、LNPは、式III、IV、およびVから選択される少なくとも1つの陽イオン性脂質、コレステロールおよびスチグマステリンから選択される少なくとも1つのステロール化合物を含み、PEG化脂質は、式XIおよびXIIから選択される少なくとも1つである。実施態様によっては、LNPは、式III、IV、およびVから選択される少なくとも1つの陽イオン性脂質、コレステロールおよびスチグマステリンから選択される少なくとも1つのステロール化合物を含み、PEG化脂質は、式XIIIおよびXIVから選択される少なくとも1つである。実施態様によっては、LNPは、式III、IV、およびVから選択される少なくとも1つの陽イオン性脂質、コレステロールおよびスチグマステリンから選択される少なくとも1つのステロール化合物を含み、PEG化脂質は、式XVおよびXVIから選択される少なくとも1つである。実施態様によっては、LNPは、式IIIの陽イオン性脂質、ステロール化合物としてのコレステロールを含み、PEG化脂質は式XIである。
前段落のいずれかのLNPの実施態様では、陽イオン性脂質組成物の含量は約65 mol%~75 mol%であり、ステロール化合物の含量は約24 mol%~34 mol%であり、PEG化脂質の含量は約0.5 mol%~1.5 mol%であり、ここで脂質組成物に対する陽イオン性脂質、ステロール化合物、およびPEG化脂質の各含量の総計は100mol%である。実施態様によっては、陽イオン性脂質は約70 mol%であり、ステロール化合物の含量は約29 mol%であり、PEG化脂質の含量は約1 mol%である。実施態様によっては、LNPは、式IIIが70 mol%、コレステロールが29mol%、および式XIが1 mol%である。
エキソソーム
エキソソームは、RNAおよびタンパク質を移送し、かつRNAを脳および他の標的臓器に送達できる内因性ナノ小胞である。免疫原性を低減するために、Alvarez-Ervitiら(2011, Nat Biotechnol 29: 341)は、エキソソームの生成のために自己由来の樹状細胞を用いた。脳への標的化は、神経細胞に特異的なRVGペプチドに融合されるエキソソーム膜タンパク質であるLamp2bを発現するように樹状細胞を遺伝子操作することによって達成された。精製されたエキソソームには、エレクトロポレーション法によって外因性RNAが詰め込まれた。静脈内注射されたRVG標的のエキソソームは、GAPDH siRNAを脳内の神経細胞、小膠細胞、乏突起膠細胞に特異的に送達し、特定の遺伝子ノックダウンをもたらした。RVGエキソソームへの前曝露は、ノックダウンを減弱させず、他の組織中への非特異的な取込みは観察されなかった。エキソソームを介するsiRNA送達の治療能力は、アルツハイマー病での治療標的であるBACE1の強力なmRNA(60%)およびタンパク質(62%)のノックダウンによって実証された。
免疫学的に不活性なエキソソームの貯蔵物を得るために、Alvarez-Ervitiらは、均質な主要組織適合遺伝子複合体 (MHC)のハプロタイプを持つ近交系C57BL/6マウスから骨髄を採取した。未成熟樹状細胞は、MHC-IIやCD86などのT細胞活性化因子を欠く大量のエキソソームを産生するので、Alvarez-Ervitiらは、顆粒球/マクロファージコロニー刺激因子 (GM-CSF)を有する樹状細胞を7日間にわたって選別した。その翌日に、エキソソームを、確立された超遠心分離手法を使用して培養上清から精製した。生成されたエキソソームは、物理的に均質であり、直径80 nmにピークを持つサイズ分布を有し、これは粒子追跡分析 (NTA)および電子顕微鏡によって決定された。Alvarez-Ervitiらは、106個の細胞あたりに6~12 μgのエキソソーム(タンパク質濃度に基づいて測定)を取得した。
次に、Alvarez-Ervitiらは、ナノ寸法の応用に適合するエレクトロポレーション手順を使用して、改変されたエキソソームに外因性のカーゴを詰め込むことが可能かを調査した。ナノメートル寸法での膜粒子のエレクトロポレーションは十分に確立されていないので、非特異的なCy5標識RNAを、エレクトロポレーション手順を経験的に最適化するために使用した。カプセル化されたRNAの量を、エキソソームの超遠心分離および溶解の後に分析した。400 Vおよび125 μFでのエレクトロポレーションは、RNAを最大限に保持し、その後の全ての実験に使用された。
Alvarez-Ervitiらは、150 μgのRVGエキソソーム中にカプセル化された150 μgのBACE1 siRNAをそれぞれ正常なC57BL/6マウスに投与し、ノックダウン効率について、4種の対照、すなわち未処理マウス、RVGエキソソームのみを注入したマウス、in vivoの陽イオン性リポソーム試薬と複合化したBACE1 siRNAを注入したマウス、およびRVG-9Rと複合化したBACE1 siRNAを注入したマウスと比較した。このRVGペプチドは、静電的にsiRNAに結合する9個のD-アルギニンに接合されている。皮質組織試料を投与の3日後に分析したところ、siRNA-RVG-9R処理マウスとsiRNA RVGエキソソーム処理マウスの両方で有意なタンパク質のノックダウン(45%かつP<0.05対62%かつP<0.01)が観察され、これはBACE1 mRNA濃度の有意な減少(それぞれ66%±15%かつP<0.001、および61%±13%かつP<0.01)に起因していた。さらに、出願人らは、RVG-エキソソーム処理した動物では、アルツハイマー病態におけるアミロイド沈着物の主成分であるβ-アミロイド1-42の総濃度に有意な減少(55%かつP<0.05)があることを見出した。この観察された減少は、BACE1阻害剤の脳室内注入後に正常なマウスが示すβ-アミロイド1-40の減少よりも大きかった。Alvarez-Ervitiらは、BACE1切断産物にcDNA末端の5’-迅速増幅 (RACE)を実行し、これにより、siRNAによるRNAiを媒介とするノックダウンの確証が得られた。
最後に、Alvarez-Ervitiらは、RNA-RVGエキソソームがin vivoで免疫応答を誘導するかどうかを、IL-6、IP-10、TNFα、およびIFN-αの血清濃度を評価することにより調査した。エキソソーム処理後に、IL-6の分泌を強力に刺激するsiRNA-RVG-9Rとは対照的に、全てのサイトカインで顕著でない変化が、siRNA形質導入試薬処理と同様に記録されて、エキソソーム処理の免疫学的に不活性な特徴が確認できた。エキソソームがsiRNAの20%にしかカプセル化していないとすると、同等のmRNAノックダウンおよびより多量のタンパク質のノックダウンは、対応する水準の免疫刺激なしに5分の1と少ないsiRNAにより達成されるので、RVG-エキソソームによる送達は、RVG-9R送達よりも効率的であるように見受けられる。この実験は、神経変性疾患に関連する遺伝子の長期サイレンシングに潜在的に適するRVG-エキソソーム技術の治療能力を実証した。Alvarez-Ervitiらのエキソソーム送達システムを、本発明のAD機能化CRISPR-Casシステムを治療標的、特に神経変性疾患に送達するのに応用してもよい。本発明では、約100~1000 mgのRVGエキソソーム中にカプセル化された約100~1000 mgのCRISPR-Casの用量を想定してもよい。
El-Andaloussiら(Nature Protocols 7,2112-2126(2012))は、培養細胞に由来するエキソソームを利用して、in vitroおよびin vivoでRNAを送達する方法を開示している。この方法では、まずペプチドリガンドと融合したエキソソームタンパク質を含む発現ベクターの形質導入による標的エキソソームの生成を説明している。次に、El-Andaloussiらは、形質導入された細胞上清からエキソソームを精製かつ特性解析する方法を説明している。続いてEl-Andaloussiらは、エキソソーム中にRNAを詰め込む重要な工程を詳述している。最後にEl-Andaloussiらは、エキソソームを用いて、in vitroおよびin vivoでマウスの脳にRNAを効率的に送達する方法を概説している。エキソソームを媒介とするRNA送達が機能測定および画像化によって評価される予測結果の例も提供している。この方法は、全体で約3週間を要する。本発明による送達または投与は、自己由来樹状細胞から産生されたエキソソームを用いて実施してもよい。本明細書での教示から、これは本発明の実施に使用できる。
別の実施態様では、Wahlgrenらの血漿エキソソーム(Nucleic Acids Research, 2012, Vol. 40, No. 17 e130)が想定されている。エキソソームは、樹状細胞 (DC)、B細胞、T細胞、肥満細胞、上皮細胞、および腫瘍細胞などの多数の細胞型によって生成されるナノサイズの小胞(サイズは30~90 nm)である。これらの小胞は、後期エンドソームの内側への出芽によって生成され、次に原形質膜と融合すると細胞外の環境に放出される。エキソソームは自発的に細胞間でRNAを移送するので、この特性は、遺伝子治療に有用になる可能性があり、かつこの開示内容から本発明の実施に活用できる。
血漿からのエキソソームは、軟層を900 gで20分間遠心分離して血漿を単離し、続いて細胞上清を採取し、細胞を排除するように300 gで10分間遠心分離し、かつ16,500gで30分間遠心分離して、続いて0.22 mmフィルターにより濾過して調製できる。エキソソームを、120,000gで70分間の超遠心分離にかけてペレット化する。エキソソーム中へのsiRNAの化学的形質移入は、RNAi Human/Mouse Starter Kit(Quiagen製, Hilden, Germany)で製造元の指示書に従って実行される。siRNAを、100 mlのPBSに2 mmol/mlの最終濃度まで加える。HiPerFect形質移入試薬を加えた後に、混合液を室温で10分間培養する。過剰なミセルを取り除くために、アルデヒド/硫酸ラテックスビーズを使用してエキソソームを再単離する。エキソソーム中へのCRISPR-Casの化学的形質移入は、siRNAと同様に実施してもよい。エキソソームを、健康な提供者の末梢血から単離された単球およびリンパ球と共培養してもよい。従って、CRISPR-Casを含むエキソソームを、ヒトの単球およびリンパ球に導入し、かつヒト中に自己移植的に再導入することを想定してもよい。従って、本発明による送達または投与は、血漿エキソソームを用いて実施できる。
リポソーム
本発明による送達または投与は、リポソームを用いて実施できる。リポソームは、内側の水性区画を取り囲む単層または多層の脂質二重層および比較的不浸透性の外側の親油性リン脂質二重層から構成される球状の小胞構造である。リポソームは、生体適合性があり、毒性がなく、親水性および親油性の両方の薬物分子を送達し、血漿酵素による分解からそれらのカーゴを保護し、かつ生体膜および血液脳関門 (BBB)を越えてそれらの負荷を輸送できるために、リポソームは、薬物送達担体としてかなりの注目を集めている(例えば、Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679の総説を参照)。
リポソームは、いくつかの異なる脂質型から作製できるが、リン脂質を最も一般的に使用して薬物担体としてのリポソームを生成する。リポソームは、脂質膜が水溶液と混合されると自発的に生成されるが、破砕分散装置、超音波処理装置、または押出装置を用いて振盪の形態で力を加えて促進することもできる(例えば、Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679の総説を参照)。
それらの構造および特性を改変するために、いくつかの他の添加剤をリポソームに添加してもよい。例えば、コレステロールまたはスフィンゴミエリンのいずれかをリポソーム混合物に添加して、リポソーム構造の安定化を助け、かつリポソーム内部のカーゴの漏出を防止してもよい。さらに、リポソームを、水素化卵ホスファチジルコリンまたは卵ホスファチジルコリン、コレステロール、およびリン酸ジセチルから調製し、それらの平均小胞サイズを、約50および100 nmに調整した。(例えば、Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679の総説を参照)。
リポソーム製剤は、天然のリン脂質、および1,2-ジステアロリル-sn-グリセロ-3-ホスファチジルコリン(DSPC)、スフィンゴミエリン、卵ホスファチジルコリン、およびモノシアロガングリオシドなどの脂質から主に構成されてもよい。この製剤はリン脂質のみで構成されているために、リポソーム製剤は多くの課題に直面していて、その1つの課題は血漿中の不安定さである。これらの課題を克服するために、いくつかの検討が、特に脂質膜の取扱いについて進められてきた。これらの検討の1つとして、コレステロールの取扱いが注目された。従来からの製剤にコレステロールを添加すると、カプセル化された生物活性化合物の血漿への急速な放出が低減され、あるいは1,2-ジオレオイル-sn-グリセロ-3-ホスホエタノールアミン (DOPE)が安定性を向上させる(例えば、Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679の総説を参照)。
特に有利な実施態様では、(分子状トロイの木馬としても知られている)トロイの木馬リポソームが望ましく、その手順は、cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.longに見出すことができる。これらの粒子により、血管内注射後に脳全体への導入遺伝子の送達が可能になる。限定に拘束されることはないが、表面に結合した特定の抗体を有する中性脂質粒子は、細胞内取り込み作用を介して血液脳関門の通過が可能になると考えられている。トロイの木馬リポソームを使用して、CRISPRファミリーのヌクレアーゼを、血管内注射を介して脳まで送達でき、これにより、胚での操作は必要とせずに脳全体にまで遺伝子導入された動物が可能になると思われる。リポソームでのin vivo投与には、約1~5 gのDNAまたはRNAが想定されてもよい。
別の実施態様では、AD機能化CRISPR-Casシステムまたはその成分は、安定核酸脂質粒子(SNALP)などのリポソームで投与されてもよい(例えば、Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005を参照)。SNALP中に標的化された特定のCRISPR-Casの約1、3、または5 mg/kg/日での毎日の静脈内注射が想定される。毎日の処置は、約3日間を超えて実施され、その後は約5週間にわたって毎週実施される。別の実施態様では、約1または2.5 mg/kgの用量で静脈内注射によって投与される特定のCRISPR-Casをカプセル化したSNALPもまた想定される(例えば、Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006を参照)。SNALP製剤には、2:40:10:48のmol%比で、3-N-[(ω-メトキシポリ(エチレングリコール)2000)カルバモイル]-1,2-ジミリスチルオキシ-プロピルアミン (PEG-C-DMA)、1,2-ジリノレイルオキシ-N,N-ジメチル-3-アミノプロパン (DLinDMA)、1,2-ジステアロイル-sn-グリセロ-3-ホスホコリン (DSPC)、およびコレステロールの各脂質が含有されていてもよい(例えば、Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006を参照)。
別の実施態様では、安定核酸脂質粒子 (SNALP)は、高度に血管新生されたHepG2由来の肝腫瘍への効果的な送達分子であることが証明されているが、血管新生が不十分なHCT-116由来の肝腫瘍では証明されてはいない(例えば、Li, Gene Therapy (2012) 19, 775-780を参照)。SNALPリポソームは、25:1の脂質/siRNA比および48/40/10/2のモル比のコレステロール/D-Lin-DMA/DSPC/PEG-C-DMAを用いて、ジステアロイルホスファチジルコリン (DSPC)、コレステロール、およびsiRNAと共にD-Lin-DMAおよびPEG-C-DMAを処方して調製されてもよい。得られたSNALPリポソームのサイズは約80~100 nmである。
さらに別の実施態様では、SNALPは、合成コレステロール(Sigma-Aldrich製, St Louis, MO, USA)、ジパルミトイルホスファチジルコリン(Avanti Polar Lipids製, Alabaster, AL, USA)、3-N-[(ω-メトキシポリ(エチレングリコール)2000)カルバモイル]-1,2-ジミレスチルオキシプロピルアミン、および陽イオン性の1,2-ジリノレイルオキシ-3-N,N-ジメチルアミノプロパンを含んでもよい(例えば、Geisbert et al., Lancet 2010; 375: 1896-905を参照)。例えば、静脈内ボーラス注射として投与される用量あたり約2 mg/kgのCRISPR-Cas総量の投与が想定されてもよい。
さらに別の実施態様では、SNALPは、合成コレステロール(Sigma-Aldrich製)、1,2-ジステアロイル-sn-グリセロ-3-ホスホコリン(DSPC;Avanti Polar Lipids Inc.製)、PEG-cDMA、および1,2-ジリノレイルオキシ-3-(N,N-ジメチル)アミノプロパン(DLinDMA)を含んでもよい(例えば、Judge, J. Clin. Invest. 119:661-673 (2009)を参照)。in vivoでの検討に使用される製剤は、約9:1の最終脂質/RNAの質量比を含んでもよい。
RNAiナノ製剤の安全性特性は、Alnylam Pharmaceuticals社のBarrosandとGollobによって論評されている(例えば、Advanced Drug Delivery Reviews 64 (2012) 1730-1737を参照)。安定核酸脂質粒子 (SNALP)は、4種の異なる脂質、すなわち低pHで陽イオンのイオン性脂質 (DLinDMA)、中性ヘルパー脂質、コレステロール、および拡散性ポリエチレングリコール (PEG)脂質で構成されている。粒子の直径は約80 nmであり、生理学的pHは電荷中性である。処方中に、イオン性脂質は、粒子形成中に脂質を陰イオン性のRNAとともに凝縮させるように作用する。酸性度が強くなるエンドソーム条件で正に帯電すると、イオン性脂質はまた、SNALPとエンドソーム膜との融合を媒介して、細胞質中へのRNAの放出を可能にする。PEG脂質は、粒子を安定化し、製剤中の凝集を減少させ、続いて薬物動態特性を改善する中性の親水性外皮を提供する。
現在までに、RNAを含むSNALP製剤を使用して、2つの臨床プログラムが開始された。Tekmira Pharmaceuticals社は最近、LDLコレステロールが高い成人の希望者を対象としてSNALP-ApoBの第I相の単回投与試験を完了した。ApoBは、主に肝臓と空腸で発現し、VLDLとLDLの会合および分泌に必須である。17人の被験者は、SNALP-ApoBの単回投与を受けた(7種の投与濃度で用量を増大)。(前臨床試験に基づく潜在的な用量制限毒性として予測された)肝臓毒性の確証は見られなかった。最高用量の(2人の内の)1人の被験者が、免疫系刺激に一致するインフルエンザ様症状を発症して、試験の終了を決めた。
Alnylam Pharmaceuticals社も同様に、最新のALN-TTR01を有し、これは上述のSNALP技術を用い、変異型TTRおよび野生型TTRの両方の肝細胞での産生を標的としてTTRアミロイドーシス (ATTR)を治療する。3種のATTR症候群が報告されていて、それら症候群は、家族性アミロイド多発神経障害 (FAP)、家族性アミロイド心筋症(FAC)、および老人性全身アミロイドーシス (SSA)であり、FAPおよびFACのどちらもがTTRの常染色体の優性変異に起因し、SSAは野生型TTRに起因する。ALN-TTR01の偽薬対照試験および単回用量漸増第I相試験が、最近ATTR患者で完了した。ALN-TTR01を、31人の患者(23人が治験薬対象、8人が偽薬対象)に、0.01~1.0 mg/kg(重量はsiRNAに基づく)の用量範囲内で15分間のIV注入として投与した。治療は許容性が高く、肝機能検査に有意な増大は無かった。注入に関連する反応として、0.4 mg/kg以上で23人中3人の患者に認められ、全員が注入速度の減少に反応し、全員で検討を続けた。血清サイトカインであるIL-6、IP-10およびIL-1raの最小かつ一過性の上昇が、(前臨床およびNHP研究から予測されるように)1 mg/kgの最高用量で2人の患者に認められた。ALN-TTR01の予測される薬物動力学の効果である血清TTRの減少は、1 mg/kgで観察された。
さらに別の実施態様では、SNALPを、例えばエタノール中に、陽イオン性脂質、DSPC、コレステロール、およびPEG脂質を、例えばそれぞれ40:10:40:10のモル比で溶解して作製してもよい(Semple et al., Nature Niotechnology, Volume 28 Number 2 February 2010, pp. 172-177を参照)。この脂質混合物を水性緩衝液(50 mMのクエン酸塩、pH 4)に加え、最終のエタノールおよび脂質濃度をそれぞれ30% (vol/vol)および6.1 mg/mlになるように混合して、押出しの前に22°Cで2分間平衡化させた。この水和脂質は、動的光散乱分析によって決定される小胞直径が70~90 nmとなるまで、Lipex Extruder(Northern Lipids製)を使用して22°Cで2層の80 nmの孔径フィルター(Nuclepore)を通して押し出した。このためには、通常1~3回の通過が必要であった。(30%のエタノールを含有する50 mMクエン酸塩のpH 4の水溶液に溶解された)siRNAを、混合しながら約5 ml/minの速度で事前に(35°Cで)平衡化した小胞に添加した。最終的な標的siRNA/脂質の比が0.06 (wt/wt)に達した後に、混合物を35°Cでさらに30分間培養して、小胞の再構築およびsiRNAのカプセル化を可能とした。次にエタノールを除去して、透析または接線流透析濾過のいずれかにより、外部緩衝液をPBS(155 mMのNaCl、3 mMのNa2HPO4、1 mMのKH2PO4、pH 7.5)に置き換えた。siRNAを、制御された段階希釈プロセスを使用してSNALP中にカプセル化した。KC2-SNALPの脂質成分は、57.1:7.1:34.3:1.4のモル比で用いられたDLin-KC2-DMA(陽イオン性脂質)、ジパルミトイルホスファチジルコリン(DPPC;Avanti Polar Lipids製)、合成コレステロール(Sigma製)、およびPEG-C-DMAであった。詰め込まれた粒子が生成されると、SNALPをPBSに対して透析し、使用前に0.2 μmのフィルターを通してフィルター滅菌した。平均粒子径は75~85 nmであり、siRNAの90~95%は、脂質粒子内にカプセル化された。in vivoでの試験に使用された製剤での最終的なsiRNA/脂質の比は、約0.15 (wt/wt)であった。第VII因子のsiRNAを含むLNP-siRNAシステムを使用直前に滅菌PBS中で適切な濃度に希釈し、その製剤を総量10 ml/kgで側方の尾静脈を通して静脈内投与した。この方法およびこれらの送達システムは、本発明のAD機能化CRISPR-Casシステムに外挿することができる。
その他の脂質
アミノ脂質である2,2-ジリノレイル-4-ジメチルアミノエチル-[1,3]-ジオキソラン (DLin-KC2-DMA)などの他の陽イオン性脂質を利用して、例えばSiRNAに類似のCRISPR-Casまたはその成分またはそれをコードする核酸分子をカプセル化してもよく(例えば、Jayaraman, Angew. Chem. Int. Ed. 2012, 51, 8529 -8533を参照)、従って、この脂質を本発明の実施に使用してもよい。以下の脂質組成物を有する事前に生成された小胞が想定されてもよく、その組成物は、それぞれモル比として40/10/40/10のアミノ脂質、ジステアロイルホスファチジルコリン (DSPC)、コレステロール、および(R)-2,3-ビス(オクタデシルオキシ)プロピル-1-(メトキシポリ(エチレングリコール)2000)カルバミン酸プロピル(PEG脂質)であり、FVII siRNA/総脂質の比は約0.05 (w/w)である。70~90 nmの範囲の狭い粒子サイズ分布、および0.11+0.04(n=56)の低い多分散度指数を確実にするために、ガイドRNAを添加する前に粒子を80 nmの膜を通して最大3回押し出してもよい。非常に強力なアミノ脂質16を含む粒子を使用してもよく、この場合、4つの脂質成分である16、DSPC、コレステロール、およびPEG脂質のモル比は、in vivo活性を高めるためにさらに最適化されていてもよい(50/10/38.5/1.5)。
Michael S D Kormannら(”Expression of therapeutic proteins after delivery of chemically modified mRNA in mice”「マウスでの化学改変mRNAの送達後の治療用タンパク質の発現」:Nature Biotechnology, Volume:29, Pages: 154-157 (2011))は、RNAを送達するための脂質外膜の使用について説明している。脂質外膜の使用も本発明では好ましい。
別の実施態様では、脂質を、本発明のAD機能化CRISPR-Casシステムまたはその成分またはそれをコードする核酸分子を用いて処方して、脂質ナノ粒子(LNP)を生成してもよい。脂質には、限定はされないが、DLin-KC2-DMA4、C12-200が含まれ、かつ共脂質であるジステロイルホスファチジルコリン、コレステロール、およびPEG-DMGは、自発的な小胞生成手順を使用して、siRNAに代えてCRISPR-Casにより製剤化してもよい(例えば、Novobrantseva, Molecular Therapy-Nucleic Acids (2012) 1, e4; doi:10.1038/mtna.2011.3を参照)。成分のモル比は、約50/10/38.5/1.5(DLin-KC2-DMAまたはC12-200/ジステロイルホスファチジルコリン/コレステロール/PEG-DMG)であってもよい。DLin-KC2-DMAおよびC12-200脂質ナノ粒子 (LNP)の場合に、最終的な脂質:siRNAの重量比は、それぞれ約12:1および9:1としてもよい。製剤は、90%を超える捕捉効率で、平均粒子径が約80 nmであってもよい。3 mg/kgの用量が想定されてもよい。
Tekmira Pharmaceuticals社は、LNPおよびLNP製剤の様々な側面を対象とする、米国および海外の約95のファミリー特許群を有し(例えば、米国特許7,982,027号、7,799,565号、8,058,069号、8,283,333号、7,901,708号、7,745,651号、7,803,397号、8,101,741号、8,188,263号、7,915,399号、8,236,943号、および7,838,658号、ならびに欧州特許1766035号、1519714号、1781593号、および1664316号を参照)、これらは全て本発明に使用かつ/あるいは応用できる。
AD機能化CRISPR-Casシステムまたはその成分またはそれをコードする核酸分子は、米国公開特許20130252281号、20130245107号、および20130244279号(Moderna Therapeutics社に譲渡済み)にさらに説明されるようなPLGA小球体中にカプセル化され送達されてもよく、これら特許は、タンパク質、タンパク質前駆体、またはタンパク質またはタンパク質前駆体が部分的にまたは完全に処理された形態をコードし得る改変核酸分子を含む組成物の製剤化の側面に関する。製剤は、50:10:38.5:1.5~3.0(陽イオン性脂質:融合性脂質:コレステロール:PEG脂質)のモル比を有してもよい。PEG脂質は、PEG-c-DOMG、PEG-DMGから選択されてもよいが、これらに限定はされない。融合性脂質はDSPCであってもよい。Schrumらの名称がDelivery and Formulation of Engineered Nucleic Acids(遺伝子操作された核酸の送達および製剤化)である米国公開特許20120251618号も参照。
Nanomerics社の技術は、低分子量の疎水性薬物、ペプチド、および核酸系の治療薬(プラスミド、siRNA、miRNA)を含む、広範囲の治療薬の生体利用能の課題に対処している。この技術が明確な利点を示す特定の投与経路としては、経口経路、血液脳関門を通過する輸送、固形腫瘍への送達ならびに眼内への送達が含まれる。例えば、Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26、Uchegbu and Siew, 2013, J Pharm Sci. 102(2):305-10、およびLalatsa et al., 2012, J Control Release. 2012 Jul 20; 161(2):523-36を参照。
米国特許公開20050019923号は、ポリヌクレオチド分子、ペプチド、およびポリペプチド、かつ/あるいは医薬品などの生物活性分子を哺乳動物の体に送達するための陽イオン性デンドリマーを説明している。このデンドリマーは、例えば、肝臓、脾臓、肺、腎臓、または心臓(さらに脳)への生物活性分子の送達を目標とするのに適している。デンドリマーは、単純な分岐モノマー単位から段階的に調製される合成の三次元高分子であり、その性質と機能は容易に制御かつ変更できる。デンドリマーは、構成要素の反復付加から多機能のコアへ合成され(合成への分岐手法)、あるいは多機能のコアに向かって合成され(合成への収束手法)、構成要素の三次元シェルのそれぞれの付加は、デンドリマーの上位世代の生成に繋がる。ポリプロピレンイミンデンドリマーは、ジアミノブタンコアから出発し、このコアには、第一級アミンへのアクリロニトリルの2回のマイケル付加反応、かつそれに続くニトリルの水素付加反応によって、2倍のアミノ基の数が付加されている。これにより、2倍のアミノ基がもたらされる。ポリプロピレンイミンデンドリマーには、100%の陽子化可能な窒素、および最大64個の末端アミノ基(第5世代、DAB 64)が含まれる。陽子化可能な基とは、通常、中性のpHで陽子を受容できるアミン基である。遺伝子送達剤としてのデンドリマーの使用は、ポリアミドアミン、およびアミン/アミドまたはN--P(O2)Sの混合物をそれぞれ共役単位とするリン含有化合物の使用に多くは集中していて、遺伝子送達のための下位世代のポリプロピレンイミンデンドリマーの使用に関する研究は報告されていなかった。ポリプロピレンイミンデンドリマーはまた、薬物送達のための、かつ周辺のアミノ酸基によって化学的に改変された場合のゲスト分子のそれらのカプセル化のためのpH感受性徐放システムとして研究されてきた。ポリプロピルエニミンデンドリマーの細胞毒性およびDNAとのその相互作用、ならびにDAB 64の形質移入効力も検討されている。
米国特許公開20050019923号は、過去の報告とは逆に、ポリプロピレンイミンデンドリマーなどの陽イオン性デンドリマーが、遺伝物質などの生物活性分子の標的化送達に使用するために特定の標的化および低毒性などの適切な特性を示すという観察結果に基づいている。さらに、陽イオン性デンドリマーの誘導体はまた、生物活性分子の標的化送達に適する特性を示している。名称がBioactive Polymers(生活性ポリマー)である米国公開特許20080267903号も参照とし、この特許は、「陽イオン性のポリアミンポリマーおよびデンドリマーポリマーを含む種々のポリマーは、抗増殖活性を有することが示され、従って、新生物および腫瘍、(自己免疫疾患を含む)炎症性疾患、乾癬、およびアテローム性動脈硬化症などの望ましくない細胞増殖を特徴とする疾患の治療に使用できる」ことを開示している。このポリマーは、単独で活性剤として、あるいは薬物分子または遺伝子治療用の核酸などのその他の治療薬のための送達媒体として使用できる。この場合は、ポリマー自体の固有の抗腫瘍活性は、送達される薬剤の活性を補完することができる。これらの特許刊行物の開示は、AD機能化CRISPR-Casシステムまたはその成分またはそれをコードする核酸分子の送達のために、本明細書での教示と併せて使用してもよい。
過帯電タンパク質
過帯電タンパク質は、異常に高い正または負の正味の理論電荷を有する天然起源または遺伝子操作されたタンパク質の部類であり、AD機能化CRISPR-Casシステムまたはその成分またはそれをコードする核酸分子の送達に使用されてもよい。負に過帯電したタンパク質および正に過帯電したタンパク質は両方とも、熱的または化学的に誘発された凝集に耐える顕著な能力を示す。正に過帯電したタンパク質は、哺乳類の細胞にも浸透することができる。カーゴをプラスミドDNA、RNA、または他のタンパク質などのこれらのタンパク質に会合させることにより、in vitroおよびin vivoの両方で哺乳動物細胞中にこれらの高分子を機能的に送達できる。過帯電タンパク質の生成および特性解析は、2007年に報告されている(Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112)。
哺乳動物細胞中へのRNAおよびプラスミドDNAの非ウイルス送達は、研究用途および治療用途の両方にとって価値がある(Akinc et al., 2010, Nat. Biotech. 26, 561-569)。精製された+36 GFPタンパク質(または他の正に過帯電したタンパク質)は、適切な無血清培地中でRNAと混合されて、細胞に添加する前に複合体を形成できる。この段階で血清が混入すると、過帯電タンパク質-RNA複合体の形成が阻害され、治療の有効性が低下する。以下の手順は、様々な細胞株に有効であることが分かっている(McNaughton et al., 2009, Proc. Natl. Acad. Sci. USA 106, 6111-6116)(但し、タンパク質とRNAの用量を変化させる予備的実験を、特定の細胞株の手順を最適化するために実行する必要がある)。この手順は、(1)処理の1日前に48ウェルプレートにウェルあたり1 x105個の細胞を播種すること、(2)処理当日に精製された+36 GFPタンパク質を無血清培地で200 nMの最終濃度に希釈し、RNAを50 nMの最終濃度になるまで添加し、渦状に混合して室温で10分間培養すること、(3)培養中に細胞から培地を吸引してPBSで1回洗浄すること、(4)+36 GFPおよびRNAの培養後にタンパク質-RNA複合体を細胞に添加すること、(5)細胞を複合体とともに37°Cで4時間培養すること、(6)培養後に培地を吸引して20 U/mLのヘパリンPBSで3回洗浄し、活性の測定法に応じて細胞を血清含有培地とともにさらに48時間以上培養すること、(7)免疫ブロット、qPCR、表現型解析、またはその他の適切な方法により細胞を分析すること、から構成される。
+36 GFPは、ある範囲の細胞では効果的なプラスミド送達試薬であることがさらに見出された。プラスミドDNAはsiRNAよりも大きなカーゴであるので、プラスミドを効果的に複合化するには、それに比例してより多くの+36 GFPタンパク質が必要となる。効果的なプラスミド送達のために、出願人らは、インフルエンザウイルス血球凝集素タンパク質に由来する既知のエンドソーム破壊ペプチドである、C末端HA2ペプチドタグを保持する+36 GFPの変異体を開発した。以下の手順は様々な細胞に効果的であるが、上記のように、プラスミドDNAと過帯電タンパク質の用量は特定の細胞株および送達用途に対して最適化されることが推奨される。この手順は、(1)処理の1日前に48ウェルプレートにウェルあたり1 x 105個を播種すること、(2)処理当日に精製されたp36 GFPタンパク質を無血清培地で2 mMの最終濃度に希釈し、1 mgのプラスミドDNAを添加し、渦状に混合して室温で10分間培養すること、(3)培養中に細胞から培地を吸引してPBSで1回洗浄すること、(4)p36 GFPおよびプラスミドDNAの培養後に、タンパク質-DNA複合体を細胞に徐々に添加すること、(5)細胞を複合体とともに37°Cで4時間培養すること、(6)培養後に培地を吸引してPBSで洗浄し、細胞を血清含有培地中でさらに24~48時間培養すること、(7)必要に応じてプラスミドの送達を(例えば、プラスミド駆動型遺伝子発現によって)分析すること、から構成される。
さらに、例えば、McNaughton et al., Proc. Natl. Acad. Sci. USA 106, 6111-6116 (2009)、Cronican et al., ACS Chemical Biology 5, 747-752 (2010)、Cronican et al., Chemistry & Biology 18, 833-838 (2011)、Thompson et al., Methods in Enzymology 503, 293-319 (2012)、およびThompson, D.B., et al., Chemistry & Biology 19 (7), 831-843 (2012)を参照。過帯電タンパク質の方法は、本発明のAD機能化CRISPR-Casシステムの送達に使用かつ/あるいは応用できる。これらのシステムを、本明細書での教示と併せて、AD機能化CRISPR-Casシステムまたはその成分またはそれをコードする核酸分子の送達に使用できる。
細胞透過性ペプチド (CPP)
さらに別の実施態様では、細胞透過性ペプチド (CPP)が、AD機能化CRISPR-Casシステムの送達のために想定される。CPPは、(DNAのナノサイズ粒子から小さな化学分子や大きな断片まで)様々な分子カーゴの細胞への取込みを容易にする短いペプチドである。本明細書で使用される用語「カーゴ」には、限定はされないが、治療薬、診断プローブ、ペプチド、核酸、アンチセンスオリゴヌクレオチド、プラスミド、タンパク質、ナノ粒子などの粒子、リポソーム、発色団、小分子、および放射性物質からなる群が含まれる。本発明の側面では、カーゴはまた、AD機能化CRISPR-Casシステムの任意の成分またはAD機能化CRISPR-Casシステムの全体を含んでもよい。本発明の側面はさらに、所望のカーゴを対象内に送達する方法を提供し、この方法は、(a)本発明の細胞透過性ペプチドと所望のカーゴを含む複合体を調製し、(b)この複合体を、経口的に、関節腔内に、腹腔内に、髄腔内に、動脈内に、鼻腔内に、柔組織内に、皮下内に、筋肉内に、静脈内に、経皮的に、直腸内に、または局所的に対象に投与することを含む。カーゴは、共有結合による化学結合、または非共有相互作用による化学結合のいずれかを介してペプチドと会合される。
CPPの機能は、カーゴを細胞内に送達することであり、これは、生きている哺乳動物細胞のエンドソームにカーゴが送達される細胞内取込み作用を通して、通常に引き起こされるプロセスである。細胞透過性ペプチドは、サイズ、アミノ酸配列、および電荷が異なるが、全てのCPPには、原形質膜を移動させ、かつ細胞質または細胞小器官への種々の分子カーゴの送達を容易にする能力である1つの固有の特徴を有する。CPPの移動は、3種の主要な侵入過程に分類でき、それらの過程は、膜への直接浸透、細胞内取込み作用により媒介される侵入、および一過性の構造の形成による移動である。CPPでは、癌阻害剤およびウイルス阻害剤などの種々の疾患の治療における薬物送達剤として、ならびに細胞標識用の造影剤として、多くの医学用途が見出されている。後者の例として、GFP造影剤、MRI造影剤、または量子ドットの担体として機能することが含まれる。CPPは、研究や医療で使用するためのin vitroおよびin vivo送達ベクターとして大きな可能性を秘めている。CPPは典型的に、リジンやアルギニンなどの正に帯電したアミノ酸を比較的豊富に含むか、極性すなわち帯電したアミノ酸と非極性の疎水性アミノ酸の交互配置形態を含む配列を持つかのいずれかのアミノ酸組成物を有する。これらの2種の構造は、それぞれポリ陽イオン性または両親媒性と呼ばれる。CPPの第3の部類は、非極性残基のみを含み、正味電荷が低い疎水性ペプチドであるか、あるいは細胞への取込みに重要な疎水性アミノ酸基を有する。発見された初期のCPPの1つは、ヒト免疫不全ウイルス1 (HIV-1)からのトランス活性化転写活性化因子 (Tat)であり、HIV-1は、培養中の多数の細胞種によって周囲の培地から効率的に取り込まれることが分かった。それ以来、既知となるCPPの数は大幅に増加し、より効果的なタンパク質遺伝子導入特性を備えた小分子の合成類似体が生成されている。CPPには、限定はされないが、ペネトラチン、Tat (48-60)、トランスポータン、およびR-AhX-R4(Ahxはアミノヘキサノイルである)が含まれる。
米国特許8,372,951号は、高い細胞浸透効率および低い毒性を示す好酸球陽イオン性タンパク質(ECP)に由来するCPPを提供している。カーゴとともにCPPを脊椎動物対象に送達する側面もまた提供されている。CPPおよびその送達のさらなる側面は、米国特許第8,575,305号、8,614,194号、および8,044,019号に説明されている。CPPを用いて、AD機能化CRISPR-Casシステムまたはその成分を送達できる。CPPを用いてAD機能化CRISPR-Casシステムまたはその成分を送達できることはまた、Suresh Ramakrishna, Abu-Bonsrah Kwaku Dad, Jagadish Beloor, et al. Genome Res. 2014 Apr 2の名称が「Cas9タンパク質およびガイドRNAの細胞透過性ペプチドを媒介とする送達による遺伝子破壊」である論文に説明されていて、参照によりその全体が組み込まれ、CPP結合組換えCas9タンパク質およびCPP複合ガイドRNAによる処理は、ヒト細胞株での内因性遺伝子破壊を導くことが示されている。この論文では、Cas9タンパク質はチオエーテル結合を介してCPPに結合していたが、ガイドRNAはCPPと複合化し、凝縮した正に帯電した粒子を生成している。胚性幹細胞、皮膚線維芽細胞、HEK 293T細胞、HeLa細胞、および胚性癌細胞を含むヒト細胞を、改変されたCas9およびガイドRNAで同時に連続的に処理すると、効率的な遺伝子破壊がもたらされ、プラスミドの遺伝子導入に比較して非特異的標的変異が低減されることが示されていた。
エアロゾル送達
肺疾患を治療される対象は、例えば、自発呼吸中に気管支内に送達される、肺あたりで薬学的に有効な量のエアロゾル化されたAAVベクターシステムを受けてもよい。このように、エアロゾル化送達は、一般にAAVの送達に好ましい。アデノウイルス粒子またはAAV粒子を送達に使用してもよい。それぞれが1つ以上の調節配列に操作可能に連結されている適切な遺伝子構築物を、送達ベクターにクローンしてもよい。
封入およびプロモーター
CRISPR-Casタンパク質、および場合によっては核酸分子をコードする機能ドメイン(例えばアデノシンデアミナーゼ)の発現を駆動するために使用されるプロモーターは、プロモーターとして機能できるAAV ITRを含んでもよい。これは、(ベクター内の空間を占める可能性がある)追加のプロモーター要素の必要性を排除するのに有効である。解放された追加の空間は、追加の要素(gRNAなど)の発現を駆動するために使用できる。またITR活性は比較的弱いので、C2c1の過剰発現による潜在的な毒性を減弱するために使用できる。
随所での発現の場合に、使用できるプロモーターには、CMV、CAG、CBh、PGK、SV40、フェリチンの重鎖または軽鎖などが含まれる。脳または他の中枢神経系 (CNS)での発現の場合に、シナプシンIは全ての神経細胞に使用でき、CaMKIIαは興奮性神経細胞に使用でき、GAD67またはGAD65またはVGATは、GABA作動性神経細胞に使用できる。肝臓での発現には、アルブミンプロモーターを使用できる。肺での発現には、SP-Bを使用できる。内皮細胞には、ICAMを使用できる。造血細胞には、IFNβまたはCD45を使用できる。骨芽細胞には、OG-2を使用できる。
ガイドRNAを駆動するために使用されるプロモーターは、ガイドRNAを発現するために、U6またはH1などのPol IIIプロモーターを含んでもよく、ならびにPol IIプロモーターおよびイントロンカセットを使用してもよい。
特定の実施態様では、CRISPR-Casシステムは、アデノ随伴ウイルス (AAV)、白血病ウイルス (MuMLV)、レンチウイルス、アデノウイルス、または他のプラスミドまたはウイルスベクター型を使用して送達される。
アデノ随伴ウイルス (AAV)
CRISPR-Casタンパク質、アデノシンデアミナーゼ、および1つ以上のガイドRNAは、アデノ随伴ウイルス (AAV)、レンチウイルス、アデノウイルス、または他のプラスミドまたはウイルスベクター型を使用して、特に、例えば米国特許8,454,972号(アデノウイルスの製剤、用量)、8,404,658号(AAVの製剤、用量)、および5,846,946号(DNAプラスミドの製剤、用量)からの製剤および用量を使用して、ならびにレンチウイルス、AAV、およびアデノウイルスを含む臨床試験およびそれらを含む臨床試験に関する出版物からの製剤および用量を使用して送達できる。例えば、AAVの場合に、投与経路、製剤、および用量は、米国特許8,454,972号のようにしてもよく、かつAAVを含む臨床試験のようにしてもよい。アデノウイルスの場合に、投与経路、製剤、および用量は、米国特許8,404,658号のようにしてもよく、かつアデノウイルスを含む臨床試験のようにしてもよい。プラスミド送達の場合に、投与経路、製剤、および用量は、米国特許5,846,946号のようにしてもよく、かつプラスミドを含む臨床研究のようにしてもよい。用量は、平均70 kgの個体(例えば、成人男性)に基づくか、または外挿してもよく、異なる体重および種の患者、被験者、哺乳動物に合わせて調節してもよい。投与の頻度は、患者または対象の年齢、性別、一般的な健康状態、その他の状態、および対処される特定の病状または症状を含む通常の因子に応じて、医者または獣医が決定する範囲内とする。ウイルスベクターを、関心のある組織に注入できる。細胞型に特異的なゲノム改変の場合に、C2c1およびアデノシンデアミナーゼの発現は、細胞型特異的プロモーターによって駆動されてもよい。例えば、肝臓特異的発現は、アルブミンプロモーターを使用してもよく、(例えば、CNS障害を標的とするための)神経細胞特異的発現は、シナプシンIプロモーターを使用してもよい。
in vivo送達に関して、AAVは2つの理由で他のウイルスベクターよりも有利であり、それらの理由は、毒性が低いこと(この特性は、免疫応答を活性化できる細胞粒子の超遠心分離を必要としない精製方法に起因する可能性がある)、および挿入変異が宿主ゲノム内に組み込まれていないので、挿入変異を引き起こす可能性が低いことである。
AAVは、4.5または4.75 Kbの封入の限界を有する。これは、C2c1ならびにプロモーターおよび転写ターミネーターが全て同一のウイルスベクターに適合する必要があることを意味している。4.5または4.75 Kbを超える構築物は、ウイルス産生の大幅な減少をもたらす。SpCas9は極めて大きく、遺伝子自体は4.1 Kbを超えているので、AAV内に詰め込むことが困難になる。従って、本発明の実施態様は、より短いC2c1の相同体を利用することを含む。実施態様によっては、ウイルスキャプシドは、1つ以上のVP1、VP2、VP3の各キャプシドタンパク質を含む。
AAVについて、AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組合せであってもよい。標的とされる細胞に関連するAAVの中からAAVを選択してもよく、例えば、脳または神経細胞を標的とするために、AAV血清型1、2、5、あるいは混成キャプシドAAV1、AAV2、AAV5、またはそれらの任意の組合せを選択してもよく、かつ心臓組織を標的とするためにAAV4を選択してもよい。AAV8は肝臓への送達に有用である。本明細書でのプロモーターおよびベクターは、いずれも好ましい。これらの細胞に関する特定のAAV血清型の集計(Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)を参照)は以下の通りである。
Figure 2024138266000041
レンチウイルス
レンチウイルスは、有糸分裂細胞および有糸分裂後細胞の両方で、それらの遺伝子に感染しかつ発現する能力を有する複合レトロウイルスである。最も一般的に知られているレンチウイルスは、ヒト免疫不全ウイルス (HIV)であり、他のウイルスの外膜糖タンパク質を用いて、様々な種類の細胞型を標的とする。
レンチウイルスは、以下のように調製できる。(レンチウイルス移動プラスミド骨格を含む)pCasES10をクローンした後に、抗生物質を含まない10%のウシ胎児血清を有するDMEM中での形質移入の前日に、50%の集密度まで低継代(p=5)のHEK293FTをT-75フラスコに播種した。20時間後に、培地を(無血清の)OptiMEM培地に交換し、4時間後に形質移入を実施した。細胞に、10 μgのレンチウイルス移動プラスミド (pCasES10)、および5 μgのpMD2.G(VSV-g偽型)と7.5 μgのpsPAX2(gag/pol/rev/tat)である封入プラスミドを形質移入した。形質移入は、陽イオン性脂質送達剤(50 μLのリポフェクタミン2000および100 μlのプラス試薬)を有する4mLのOptiMEM中で実施した。6時間後に、培地を10%のウシ胎児血清を有する抗生物質不含のDMEMに交換した。これらの方法には、細胞培養中に血清を使用するが、無血清の方法の方が好ましい。
レンチウイルスは、以下のように精製できる。ウイルスの上清を48時間後に回収した。上清からまず破片を除去し、0.45 μmの低タンパク質結合(PVDF)フィルターにより濾過した。次に、それらを超遠心分離機内で24,000 rpmで2時間回転させた。ウイルスのペレットを50 μlのDMEM中に4°Cで一晩再懸濁した。次にそれらを等分量にして、直ちに-80°Cで凍結した。
別の実施態様では、特に眼の遺伝子治療のために、ウマ伝染性貧血ウイルス (EIAV)に基づく最小の非霊長類レンチウイルスベクターもまた想定される(例えば、Balagaan, J Gene Med 2006; 8: 275 - 285を参照)。別の実施態様では、加齢性黄斑変性症の網状形態の治療のために、網膜下注射を介して送達される血管新生抑制タンパク質であるエンドスタチンおよびアンギオスタチンを発現するウマ伝染性貧血ウイルスに基づくレンチウイルス遺伝子治療ベクターであるRetinoStat(R)もまた想定され(例えば、Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012))、このベクターは、本発明のAD機能化CRISPR-Casシステム用に改変できる。
別の実施態様では、HIV tat/revによって共有される共通のエキソン、核小体局在化デコイ、および抗CCR5特異的ハンマーヘッド型リボザイムを標的とするsiRNAを有する自己不活化レンチウイルスベクター(例えば、DiGiusto et al. (2010) Sci Transl Med 2:36ra43を参照)は、本発明のAD機能化CRISPR-Casシステムに使用かつ/あるいは応用することができる。患者体重の1 kgあたり最小で2.5 x 106個のCD34+細胞を採取し、かつ2 μmol/Lのグルタミン、幹細胞因子(100 ng/ml)、Flt-3リガンド (Flt-3L)(100 ng/ml)、および2 x 106細胞/mlの密度でのトロンボポエチン(10 ng/ml)(CellGenix製)を含むX-VIVO 15培地(Lonza製)中で16~20時間予備刺激してもよい。予備刺激された細胞は、フィブロネクチン(25 mg/cm2)で被覆された75 cm2の組織培養フラスコ(RetroNectin,Takara Bio Inc.製)中で、感染多重度を5として16~24時間レンチウイルスで形質導入された。
レンチウイルスベクターは、パーキンソン病の治療として開示されていて、例えば、米国特許公開20120295960号、および米国特許7303910号および7351585号を参照。レンチウイルスベクターはまた、眼疾患の治療について開示されていて、例えば、米国特許公開20060281180号、20090007284号、20110117189号、20090017543号、20070054961号、および20100317109号を参照。レンチウイルスベクターはまた、脳への送達について開示されていて、例えば、米国特許公開20110293571号、20110293571号、20040013648号、20070025970号、20090111106号、および米国特許7259015号を参照。
ポリマー系粒子
本明細書のシステムおよび組成物は、ポリマー系粒子(例えばナノ粒子)を使用して送達されてもよい。実施態様によっては、ポリマー系粒子は、膜融合のウイルス機構を模倣できる。ポリマー系粒子は、インフルエンザウイルス機構による合成的な複製であってもよく、細胞が細胞内取込み作用経路および酸性区画の形成を含むプロセスを介して取り込む種々の核酸型(siRNA、miRNA、プラスミドDNAまたはshRNA、mRNA)との形質移入複合体を形成してもよい。後期エンドソームでの低いpHは、粒子表面を疎水性にし、かつ膜の通過を促進する化学スイッチとして機能する。細胞基質に入ると、粒子は細胞作用のためのその有効量を放出する。この活性エンドソーム逸脱技術は、安全であり、かつ自然な取込み経路を使用しているので形質移入効率を最大化する。実施態様によっては、ポリマー系粒子は、アルキル化およびカルボキシアルキル化された分岐ポリエチレンイミンを含んでもよい。例によっては、ポリマー系粒子は、VIROMER、例えば、VIROMER RNAi、VIROMER RED、VIROMER mRNA、VIROMER CRISPRである。本明細書のシステムおよび組成物を送達する例示的な方法として、Bawage SS et al., Synthetic mRNA expressed Cas13a mitigates RNA virus infections(Cas13aで発現した合成mRNAは、RNAウイルス感染を軽減する), www.biorxiv.org/content/10.1101/370460v1.full doi: doi.org/10.1101/370460, Viromer(R) RED, a powerful tool for transfection of keratinocytes(ケラチン産生細胞の形質移入のための強力な手段). doi: 10.13140/RG.2.2.16993.61281, Viromer(R) Transfection - Factbook(Viromer(R)の形質移入-実情調査)2018: technology, product overview, users' data(技術、産物一覧、使用者データ)., doi:10.13140/RG.2.2.23912.16642に説明される方法が挙げられる。
一般的な応用
本開示は、標的核酸(例えばDNA)、または1つ以上の標的核酸の発現を本明細書の成分およびシステムで改変する方法を提供する。実施態様によっては、この方法は、標的核酸を本明細書の1つ以上の非天然起源または遺伝子操作された組成物またはシステムと接触させることを含む。例えば、本開示は、関心のある標的遺伝子を改変する方法を提供し、この方法は、標的DNAを、i)表1または2からのCas12bエフェクタータンパク質、ii)a)標的DNA配列にハイブリダイズできる3’ガイド配列およびb)5’直接反復配列を含むcrRNA、ならびにiii)tracr RNAを含む1つ以上の非天然起源または遺伝子操作された組成物と接触させることを含み、これにより、crRNAおよびtracr RNAと複合化したCas12bエフェクタータンパク質を含むCRISPR複合体を形成し、ガイド配列は細胞内の標的RNA配列への配列特異的結合を誘導し、これにより関心のある標的遺伝子座の発現が改変される。
この方法は、標的遺伝子の発現を改変するために使用されてもよい。この改変は、システムまたは組成物により処理しない、またはそれによる処理前の標的遺伝子の発現と比較して、標的遺伝子の発現を変化させることができる。この改変は、システムまたは組成物により処理しない、またはそれによる処理前の標的遺伝子の発現と比較して、標的遺伝子の発現を増強させることができる。この改変は、システムまたは組成物により処理しない、またはそれによる処理前の標的遺伝子の発現と比較して、標的遺伝子の発現を減弱させることができる。
実施態様によっては、この方法は、標的オリゴヌクレオチド中の1つ以上の塩基(例えば、アデニンまたはシトシン)を改変することを含んでもよい。そのような方法は、本明細書の塩基エディターの1つ以上の成分を標的オリゴヌクレオチドに送達することを含んでもよい。例によっては、方法は、前記標的オリゴヌクレオチドに、触媒的に不活性なCas12bタンパク質、直接反復に連結されたガイド配列を含むガイド分子、およびアデノシンまたはシチジンデアミナーゼタンパク質またはその触媒ドメインを送達することを含み、前記アデノシンまたはシチジンデアミナーゼタンパク質またはその触媒ドメインは、前記触媒的に不活性なCas12bタンパク質または前記ガイド分子に共有結合または非共有結合しているか、あるいは送達後にそれに結合するように構成され、前記ガイド分子は、前記触媒的に不活性なCas12bと複合体を形成し、かつ前記複合体を前記標的オリゴヌクレオチドに結合するように誘導し、前記ガイド配列は、前記標的オリゴヌクレオチド内の標的配列とハイブリダイズしてオリゴヌクレオチド二重鎖を形成することができる。実施態様によっては、シトシンは、オリゴヌクレオチド二重鎖を形成する標的配列の外側にあり、シトシンデアミナーゼタンパク質またはその触媒ドメインは、RNA二重鎖の外側にあるシトシンを脱アミノ化し、またはシトシンは、RNA二重鎖を形成する標的配列内にあり、ガイド配列は、シトシンに対応する位置に非対合のアデニンまたはウラシルを含み、RNA二重鎖にC-AまたはC-Uの不一致をもたらし、シトシンデアミナーゼタンパク質またはその触媒ドメインは、非対合のアデニンまたはウラシルの反対側のRNA二重鎖中のシトシンを脱アミノ化する。ガイド分子は、前記CRISPRエフェクタータンパク質と複合体を形成し、かつ前記複合体が関心のある標的オリゴヌクレオチド配列に結合するように誘導し、ガイド配列は、アデニンまたはシトシンを含む標的配列とハイブリダイズして、RNA二重鎖を形成することができ、アデノシンデアミナーゼタンパク質またはその触媒ドメインは、RNA二重鎖中のアデニンまたはシトシンを脱アミノ化する。
実施態様によっては、方法およびシステムは、1つ以上の試料中の核酸標的配列の存在を検出するために使用できる。実施態様によっては、1つ以上のin vitro試料中の核酸標的配列の存在を検出するためのシステムは、Cas12bタンパク質、標的配列と所定の程度の相補性を有するように設計され、かつCas12bと複合体を形成するように設計されたガイド配列を含む少なくとも1つのガイドポリヌクレオチド、および非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物を含んでもよく、Cas12bは側副ヌクレアーゼ活性を示し、かつ標的配列によって活性化されるとオリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する。特定の実施態様では、1つ以上のin vitro試料中の標的ポリペプチドの存在を検出するためのシステムは、Cas12bタンパク質、それぞれが1つ以上の標的ポリペプチドのうちの1つに結合するように設計され、かつそれぞれがマスクされたプロンプター結合部位またはマスクされたプライマー結合部位およびトリガー配列鋳型を含む1つ以上の検出アプタマー、および非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物を含む。1つ以上のin vitro試料中の核酸配列を検出するための方法は、1つ以上の試料を、i)Cas12bエフェクタータンパク質、ii)標的配列と所定の程度の相補性を有するように設計され、かつCas12bエフェクタータンパク質と複合体を形成するように設計されたガイド配列を含む少なくとも1つのガイドポリヌクレオチド、およびiii)非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物と接触させることを含み、前記Cas12エフェクタータンパク質は、側副ヌクレアーゼ活性を示し、かつオリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する。
別の側面では、本開示は、標的オリゴヌクレオチドを含む細胞中に酵素活性(例えばタンパク質分解活性)を提供するための方法を提供する。この方法は、細胞を、酵素の不活性部分に連結された第1のCasタンパク質および酵素の相補部分に連結された第2のCasタンパク質と接触させることを含んでもよい。酵素の不活性部分と相補部分が接触すると、酵素の活性が再構成される。実施態様によっては、標的オリゴヌクレオチドを含む細胞中にタンパク質分解活性を提供する方法は、a)細胞または細胞集団を、i)タンパク質分解酵素の不活性部分に連結された第1のCas12bエフェクタータンパク質、ii)タンパク質分解酵素の相補部分に連結された第2のCas12bエフェクタータンパク質、iii)第1のCas12bエフェクタータンパク質に結合し、かつRNAの第1の標的配列にハイブリダイズする第1のガイド、およびiv)第2のCas12bエフェクタータンパク質に結合し、かつRNAの第2の標的配列にハイブリダイズする第2のガイドと接触させることを含み、ここでタンパク質分解酵素の第1の部分と相補部分が接触すると、タンパク質分解酵素のタンパク質分解活性が再構成され、これにより、タンパク質分解酵素の第1の部分および第2の部分が接触して、タンパク質分解酵素のタンパク質分解活性が再構成される。
別の側面では、本開示は、関心のあるオリゴヌクレオチドを含む細胞を識別するための方法を提供する。この方法は、レポーターの不活性部分に連結された第1のCasタンパク質、およびレポーターの相補部分に連結された第2のCasタンパク質により細胞を識別することを含んでもよい。レポーターの不活性部分と相補部分が接触すると、レポーターの活性が再構成される。実施態様によっては、関心のあるオリゴヌクレオチドを含む細胞を識別する方法は、細胞内のオリゴヌクレオチドを、i)レポーターの不活性な第1の部分に連結された第1のCas12bエフェクタータンパク質、ii)レポーターの相補部分に連結された第2のCas12bエフェクタータンパク質、iii)第1のCas12bエフェクタータンパク質に結合し、かつオリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、iv)第2のCas12bエフェクタータンパク質に結合し、かつオリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド、及びv)レポーターを含む組成物と接触させることを含み、ここでレポーターの第1の部分と相補部分が接触するとレポーターの活性が再構成され、関心のあるオリゴヌクレオチドが細胞内に存在するとレポーターの第1の部分と第2の部分は接触し、それにより、レポーターの活性は再構成される。実施例によっては、レポーターは蛍光タンパク質または発光タンパク質である。
動物以外の生物への応用
C2c1-CRISPRシステムの植物および酵母への応用
一般に、「植物」という用語は、細胞分裂によって特徴的に生育し、葉緑体を含み、セルロースからなる細胞壁を有する、植物界の種々の光合成生物、真核生物、単細胞生物、または多細胞生物に関する。植物という用語は、単子葉植物および双子葉植物を包含する。具体的に植物は、限定はされないが、被子植物および裸子植物、例えば、アカシア、アルファルファ、アマランス、リンゴ、アンズ、アーティチョーク、トネリコ、アスパラガス、アボカド、バナナ、大麦、豆、ビート、カバノキ、ブナ、ブラックベリー、ブルーベリー、ブロッコリー、芽キャベツ、キャベツ、セイヨウアブラナ、カンタロープ、ニンジン、キャッサバ、カリフラワー、ヒマラヤスギ、穀物類、セロリ、栗、サクランボ、白菜、柑橘類、ミカン、クローバー、コーヒー、コーン、綿、ササゲ、キュウリ、イトスギ、ナス、ニレ、キクヂシャ、ユーカリ、ウイキョウ、イチジク、モミ、ゼラニウム、ブドウ、グレープフルーツ、落花生、ホオズキ、ドクニンジン、ヒッコリー、ケール、キウイフルーツ、コールラビ、カラマツ、レタス、ニラ、レモン、ライム、ニセアカシア、ホウライシダ、トウモロコシ、マンゴー、カエデ、メロン、キビ、キノコ、カラシナ、ナッツ、オーク、オート麦、アブラヤシ、オクラ、タマネギ、オレンジ、観賞用植物または花または木、パパイヤ、ヤシ、パセリ、アメリカボウフウ、エンドウ豆、モモ、ピーナッツ、ナシ、ピート、コショウ、柿、ハトエンドウ豆、マツ、パイナップル、オオバコ、プラム、ザクロ、ジャガイモ、カボチャ、赤チコリ、大根、菜種、ラズベリー、イネ、ライ麦、モロコシ、ベニバナ、サルヤナギ、大豆、ほうれん草、トウヒ、カボチャ、イチゴ、テンサイ、サトウキビ、ヒマワリ、サツマイモ、スイートコーン、タンジェリン、茶、タバコ、トマト、木、ライコムギ、芝草、カブ、つる植物、クルミ、クレソン、スイカ、小麦、ヤムイモ、イチイ、およびズッキーニなどを含むことを意図している。植物という用語はまた藻類も含み、藻類は主に、高等植物を特徴付ける根、葉、その他の器官の欠如によって主に統合された光合成独立栄養生物である。
本明細書に説明のC2c1システムを使用するゲノム編集のための方法は、本質的に任意の植物に所望の形質を付与するために使用できる。多種多様な植物および植物細胞システムは、本開示の核酸構築物および上記の様々な形質転換方法を使用して、本明細書に説明の所望の生理学的および農学的特性のために遺伝子操作されてもよい。好ましい実施態様では、遺伝子操作のための標的植物および植物細胞として、限定はされないが、例えば、穀物作物(例えば、小麦、トウモロコシ、イネ、キビ、大麦)、果物作物(例えば、トマト、リンゴ、ナシ、イチゴ、オレンジ)、飼料作物(例えば、アルファルファ)、根菜作物(例えば、ニンジン、ジャガイモ、テンサイ、ヤムイモ)、および葉野菜作物(例えば、レタス、ほうれん草)を含む作物、顕花植物(例えばペチュニア、バラ、菊)、針葉樹および松の樹木(例えば、松モミ、トウヒ)、植物環境修復に使用される植物(例えば、重金属蓄積植物)、油料作物(例えば、ヒマワリ、菜種)、および実験目的で使用される植物(例えば、シロイヌナズナ)などの単子葉植物および双子葉植物が挙げられる。従って、この方法およびCRISPR-Casシステムは、例えば、モクレン目 (Magniolales)、シキミ目 (Illiciales)、クスノキ目 (Laurales)、コショウ目 (Piperales)、ウマノスズクサ目 (Aristochiales)、スイレン目 (Nymphaeales)、キンポウゲ目 (Ranunculales)、ケシ目 (Papeverales)、サラセニア科 (Sarraceniaceae)、ヤマグルマ目 (Trochodendrales)、マンサク目 (Hamamelidales)、トチュウ目 (Eucomiales)、レイトネリア目(Leitneriales)、ヤマモモ目 (Myricales)、ブナ目 (Fagales)、モクマオウ目 (Casuarinales)、ナデシコ目 (Caryophyllales)、バテス目 (Batales)、タデ目 (Polygonales)、イソマツ目 (Plumbaginales)、ビワモドキ目 (Dilleniales)、ツバキ目 (Theales)、アオイ目 (Malvales)、イラクサ目 (Urticales)、サガリバナ目 (Lecythidales)、スミレ目 (Violales)、ヤナギ目 (Salicales)、フウチョウソウ目 (Capparales)、ツツジ目 (Ericales)、イワウメ目 (Diapensales)、カキノキ目 (Ebenales)、サクラソウ目 (Primulales)、バラ目 (Rosales)、マメ目 (Fabales)、カワゴケソウ目 (Podostemales)、アリノトウグサ目 (Haloragales)、テンニンカ目 (Myrtales)、ミズキ目 (Cornales)、ヤマモガシ目 (Proteales)、ビャクダン目 (Santales)、ラフレシア目 (Rafflesiales)、ニシキギ目 (Celastrales)、トウダイグサ目 (Euphorbiales)、クロウメモドキ目 (Rhamnales)、ムクロジ目 (Sapindales)、クルミ目 (Juglandales)、フクロソウ目 (Geraniales)、ヒメハギ目 (Polygalales)、セリ目 (Umbellales)、リンドウ目 (Gentianales)、ハナシノブ目 (Polemoniales)、シソ目 (Lamiales)、オオバコ目 (Plantaginales)、ゴマノハグサ目 (Scrophulariales)、キキョウ目 (Campanulales)、アカネ目 (Rubiales)、マツムシソウ目 (Dipsacales)、およびキク目 (Asterales)に属する双子葉植物などにより、広範囲の植物にわたって使用でき、この方法およびCRISPR-Casシステムは、例えば、オモダカ目(Alismatales)、トチカガミ目 (Hydrocharitales)、イバラモ目 (Najadales)、ホンゴウソウ目 (Triuridales)、ツユクサ目 (Commelinales)、ホシクサ目 (Eriocaulales)、レスティオ目 (Restionales)、イネ目 (Poales)、イグサ目 (Juncales)、カヤツリグサ目 (Cyperales)、ガマ目 (Typhales)、パイナップル目 (Bromeliales)、ショウガ目 (Zingiberales)、ヤシ目 (Arecales)、パナマソウ目 (Cyclanthales)、タコノキ目 (Pandanales)、サトイモ目 (Arales)、ユリ目 (Lilliales)、およびラン目 (Orchidales)に属する単子葉植物、あるいは、例えば、マツ目 (Pinales)、イチョウ目 (Ginkgoales)、ソテツ目 (Cycadales)、ナンヨウスギ目 (Araucariales)、ヒノキ目 (Cupressales)、およびグネツム目 (Gnetales)などの裸子植物に属する植物により使用できる。
本明細書に説明のCRISPR-C2c1システムおよび使用方法は、以下の属の双子葉植物、単子葉植物、または裸子植物の非限定的な一覧に含まれる広範囲の植物種にわたって使用できる:オオカミナスビ属 (Atropa)、クスノキ属 (Alseodaphne)、ラッカセイ属 (Arachis)、アカハダクスノキ属 (Beilschmiedia)、アブラナ属 (Brassica)、ベニバナ属 (Carthamus)、アオツヅラフジ属 (Cocculus)、ハズ属 (Croton)、キュウリ属 (Cucumis)、ミカン属 (Citrus)、スイカ属 (Citrullus)、トウガラシ属 (Capsicum)、ニチニチソウ属(Catharanthus)、ココヤシ属 (Cocos)、コーヒーノキ属 (Coffea)、カボチャ属 (Cucurbita)、ニンジン属 (Daucus)、ドグエテイア属 (Duguetia)、ハナビシソウ属 (Eschscholzia)、イチジク属 (Ficus)、オランダイチゴ属 (Fragaria)、ツノゲシ属 (Glaucium)、ダイズ属 (Glycine)、ワタ属 (Gossypium)、ヒマワリ属 (Helianthus)、パラゴムノキ属 (Hevea)、ヒヨス属 (Hyoscyamus)、アキノノゲシ属 (Lactuca)、ランドフィア属 (Landolphia)、アマ属 (Linum)、ハマビワ属 (Litsea)、トマト属 (Lycopersicon)、ルピナス属 (Lupinus)、イモノキ属 (Manihot)、ハナハッカ属 (Majorana)、リンゴ属 (Malus)、ウマゴヤシ属 (Medicago)、タバコ属 (Nicotiana)、オリーブ属 (Olea)、パルテニウム属 (Parthenium)、ケシ属 (Papaver)、ワニナシ属 (Persea)、インゲンマメ属 (Phaseolus)、カイノキ属 (Pistacia)、エンドウ属 (Pisum)、ナシ属 (Pyrus)、サクラ属 (Prunus)、ダイコン属 (Raphanus)、トウゴマ属 (Ricinus)、キオン属 (Senecio)、ツヅラフジ属 (Sinomenium)、ハスノハカズラ属 (Stephania)、シロガラシ属 (Sinapis)、ナス属 (Solanum)、カカオ属 (Theobroma)、ジャジクソウ属 (Trifolium)、レイリョウコウ属 (Trigonella)、ソラマメ属 (Vicia)、ツルニチニチソウ属 (Vinca)、ヴィリス属 (Vilis)、およびササゲ属 (Vigna)、ならびにネギ属 (Allium)、メリケンカルカヤ属 (Andropogon)、スズメガヤ属 (Aragrostis)、クサスギカズラ属 (Asparagus)、カラスムギ属 (Avena)、ギョウギシバ属 (Cynodon)、アブラヤシ属 (Elaeis)、ウシノケグサ属 (Festuca)、フェスツリウム属(Festulolium)、ワスレグサ属 (Heterocallis)、オオムギ属 (Hordeum)、アオウキクサ属 (Lemna)、ドクムギ属 (Lolium)、バショウ属 (Musa)、イネ属 (Oryza)、キビ属 (Panicum)、チカラシバ属 (Pannesetum)、アワガエリ属 (Phleum)、イチゴツナギ属 (Poa)、ライムギ属 (Secale)、モロコシ属 (Sorghum)、コムギ属 (Triticum)、トウモロコシ属 (Zea)、コウヨウザン属 (Cunninghamia)、マオウ属 (Ephedra)、トウヒ属 (Picea)、マツ属 (Pinus)、およびトガサワラ属 (Pseudotsuga)。
CRISPR-C2c1システムおよび使用方法はまた、例えば紅藻類(Rhodophyta)、緑藻類 (Chlorophyta)、褐藻類 (Phaeophyta)、珪藻類 (Bacillariophyta)、真核藻類 (Eustigmatophyta)、渦鞭毛藻類 (dinoflagellates)を含むいくつかの真核生物門、ならびに原核ラン藻類門(青緑藻類:phylum Cyanobacteria)から選択された藻類を含む、広範囲の「藻類」または「藻類細胞」にわたって使用できる。「藻類」という用語は、例えば、アンフォラ属 (Amphora)、アナベナ属 (Anabaena)、アンキストロデスムス属 (Anikstrodesmis)、ボツリオコッカス属 (Botryococcus)、キートケロス属 (Chaetoceros)、クラミドモナス属 (Chlamydomonas)、クロレラ属 (Chlorella)、クロロコックム属 (Chlorococcum)、キクロテラ属 (Cyclotella)、シリンドロテカ属 (Cylindrotheca)、ドナリエラ属 (Dunaliella)、エミリアーナ属 (Emiliana)、ユーグレナ属 (Euglena)、ヘモトコッカス属 (Hematococcus)、イソクリシス属 (Isochrysis)、モノクリシス属 (Monochrysis)、モノラフィジウム属 (Monoraphidium)、ナンノクロリス属 (Nannochloris)、ナンノクロロプシス属 (Nannnochloropsis)、ナヴィクラ属 (Navicula)、ネフロクロリス属 (Nephrochloris)、ネフロセミス属 (Nephroselmis)、ニッチア属 (Nitzschia)、ノジュラリア属 (Nodularia)、ノストック属 (Nostoc)、オクロモナス属 (Oochromonas)、オオキスティス属 (Oocystis)、オシラトリア属 (Oscillartoria)、パブロバ属 (Pavlova)、ファエオダクチルム属 (Phaeodactylum)、プラチモナス属 (Playtmonas)、プレウロクリシス属 (Pleurochrysis)、ポルフィラ属 (Porhyra)、プセウドアナベナ属 (Pseudoanabaena)、ピラミモナス属 (Pyramimonas)、スチココッカス属 (Stichococcus)、シネココッカス属 (Synechococcus)、シネコシスティス属 (Synechocystis)、テトラセルミス属 (Tetraselmis)、タラシオシーラ属 (Thalassiosira)、およびトリコデスミウム属 (Trichodesmium)から選択される藻類を含む。
植物の一部、すなわち「植物組織」を、本発明の方法に従って処理して、改良された植物を産出できる。植物組織はまた植物細胞を包含する。本明細書で使用される用語「植物細胞」は、in vitroでの組織培養物中で、培地または寒天表面で、または増殖培地または緩衝液の懸濁液中で成長した、無処理の全体植物形態または単離形態のいずれかの生きている植物の個々の単位、あるいは、例えば、植物組織、植物器官、または全体植物などのより高度に組織化された単位の一部を指す。
「原形質体」は、例えば、機械的または酵素的な手段を使用して、その保護細胞壁が完全にまたは部分的に取り除かれた植物細胞を指し、この細胞は、細胞壁を再生成し、増殖し、かつ適切な成長条件下で全体植物にまで再生・成長できる、生きている植物の無処理の生化学的に形質転換受容性のある単位をもたらす。
用語「形質転換」は、広い意味で、アグロバクテリウム (Agrobacterium)を用いて、または様々な化学的または物理的方法の内の1つを用いて、DNAの導入によって植物宿主が遺伝子改変されるプロセスを指す。本明細書で使用される用語「植物宿主」は、植物の任意の細胞、組織、器官、またはその後代を含む植物を指す。多くの適切な植物組織または植物細胞は、形質転換されてもよく、これらは、限定はされないが、原形質体、体細胞胚、花粉、葉、苗、茎、カルス、走根、微小塊茎、および若枝を含む。植物組織はまた、有性的または無性的に生成されたそのような植物、種子、後代、繁殖体の任意のクローン体、および挿し木または種子などのこれらのいずれかの派生体を指す。
本明細書で使用される用語「形質転換された」は、構築物などの外来DNA分子が導入された細胞、組織、器官、または生物を指す。導入されたDNA分子は、導入されたDNA分子がその後の後代に伝達されるように、受容体の細胞、組織、器官、または生物のゲノムDNA中に組み込まれてもよい。これらの実施態様では、「形質転換された」または「遺伝子導入の」細胞もしくは植物はまた、細胞もしくは植物の後代を含んでもよく、およびそのような形質転換植物を交配の親として使用しかつ導入されたDNA分子の存在に起因する変化した表現型を示す育種計画から産出された後代を含んでもよい。好ましくは、遺伝子導入植物は、繁殖力があり、かつ有性生殖を介して導入されたDNAを後代に伝達することができる。
遺伝子導入植物の後代などの用語「後代」は、植物または遺伝子導入植物から生まれる、生じる、または由来するものである。導入されたDNA分子はまた、導入されたDNA分子がその後の後代に受け継がれず、従って「遺伝子導入」とは見做されないように、受容体細胞に一過的に導入されてもよい。従って、本明細書で使用される「非遺伝子導入」植物または植物細胞は、そのゲノム中に安定的に組み込まれた外来DNAを含まない植物である。
本明細書で使用される用語「植物プロモーター」は、その起源が植物細胞であるかどうかにかかわらず、植物細胞中で転写を開始できるプロモーターである。適切な植物プロモーターの例として、限定はされないが、植物、植物ウイルス、および植物細胞中で発現される遺伝子を含むアグロバクテリウムまたはリゾビウム (Rhizobium)などの細菌から得られるものが挙げられる。
本明細書で使用される「真菌細胞」は、真菌界内の任意の真核細胞型を指す。真菌界の門には、子嚢菌門 (Ascomycota)、担子菌門 (Basidiomycota)、コウマクノウキン門 (Blastocladiomycota)、ツボカビ門 (Chytridiomycota)、グロムス門 (Glomeromycota)、微胞子虫門 (Microsporidia)、およびネオカリマスティクス門 (Neocallimastigomycota)が含まれる。真菌細胞には、酵母、カビ、および糸状菌を含んでもよい。実施態様によっては、真菌細胞は酵母細胞である。
本明細書で使用される用語「酵母細胞」は、子嚢菌門および担子菌門内の任意の真菌細胞を指す。酵母細胞には、出芽酵母細胞、分裂酵母細胞、およびカビ細胞を含んでもよい。これらの生物に限定されることなく、実験室および産業分野で使用される多くの種類の酵母は子嚢菌門の一部である。実施態様によっては、酵母細胞は、S.セルビシエ (S. cerervisiae)、クリュイベロミセス・マルシアヌス (Kluyveromyces marxianus)、またはイサチェンキア・オリエンタリス (Issatchenkia orientalis)の各細胞である。その他の酵母細胞として、限定はされないが、カンジダ属 (Candida spp.)(例えばカンジダ・アルビカンス (Candida albicans))、ヤロウイア属 (Yarrowia spp.)(例えばヤロウイア・リポリティカ (Yarrowia lipolytica))、ピキア属 (Pichia spp.)(例えばピキア・パストリス (Pichia pastoris))、クリベロミセス属 (Kluyveromyces spp.)(例えばクリベロミセス・ラクティス (Kluyveromyces lactis)およびクリュイベロミセス・マキシアヌス (Kluyveromyces marxianus))、ニューロスポラ属 (Neurospora spp.)(例えばニューロスポラ・クラッサ (Neurospora crassa))、フザリウム属 (Fusarium spp.)(例えばフザリウム・オキシスポルム (Fusarium oxysporum))、およびイサチェンキア属 (Issatchenkia spp.)(例えばイサチェンキア・オリエンタリス(Issatchenkia orientalis)、別名としてピキア・クドリアブゼビ (Pichia kudriavzevii)およびカンジダ・アシドテルモフィルム (Candida acidothermophilum))を含んでもよい。実施態様によっては、真菌細胞は糸状真菌細胞である。本明細書で使用される用語「糸状真菌細胞」は、糸状に増殖する任意の真菌細胞型、すなわち菌糸または菌糸体を指す。糸状真菌細胞の例には、限定はされないが、アスペルギルス属 (Aspergillus spp.)(例えばアスペルギルス・ニガー (Aspergillus niger))、トリコデルマ属 (Trichoderma spp.)(例えばトリコデルマ・リーゼイ (Trichoderma reesei))、リゾプス属 (Rhizopus spp.)(例えばリゾプス・オリーゼ (Rhizopus oryzae))、およびモリチェレラ属 (Mortierella spp.)(例えばモリチェレラ・イザベリーナ(Mortierella isabellina))を含んでもよい。
実施態様によっては、真菌細胞は、工業株である。本明細書で使用される「工業株」とは、工業プロセス、例えば、商業的または工業的規模での製品の生産に使用されるか、または工業プロセスから単離される真菌細胞の任意の株を指す。工業株は、工業プロセスで典型的に使用される真菌種を指してもよく、あるいは非工業目的(例えば実験室研究)にも使用され得る真菌種の分離株を指してもよい。工業プロセスの例には、(例えば、食品または飲料製品の製造での)発酵、蒸留、バイオ燃料の製造、化合物の製造、およびポリペプチドの製造が含まれてもよい。工業株の例として、限定はされないが、JAY270およびATCC4124が含まれてもよい。
実施態様によっては、真菌細胞は、倍数体細胞である。本明細書で使用される「倍数体」細胞とは、ゲノムが複数の複製物中に存在する任意の細胞を指してもよい。倍数体細胞は、倍数体状態で自然に見られる細胞型を指してもよく、または(例えば、減数分裂、細胞質分裂、またはDNA複製の特定の調節、変更、不活性化、活性化、または改変によって)倍数体状態で存在するように誘導された細胞を指してもよい。倍数体細胞は、ゲノム全体が倍数体である細胞を指してもよく、あるいは、関心のある特定のゲノム遺伝子座中の倍数体である細胞を指してもよい。理論に縛られることを望まないが、ガイドRNAの存在量は、一倍体細胞でのゲノム操作よりも倍数体細胞でのゲノム操作において律速成分となる可能性が高いと考えられ、従って、本明細書に説明のC2c1 CRISPRシステムを使用する方法では、特定の真菌細胞型の使用を利用してもよい。
実施態様によっては、真菌細胞は、二倍体細胞である。本明細書で使用される「二倍体」細胞は、ゲノムが2つの複製物中に存在する任意の細胞を指してもよい。二倍体細胞は、二倍体状態で自然に見られる細胞型を指してもよく、または(例えば、減数分裂、細胞質分裂、またはDNA複製の特定の調節、変更、不活性化、活性化、または改変によって)二倍体状態で存在するように誘導された細胞を指してもよい。例えば、S.セルビシエ株S228Cは、一倍体または二倍体状態で維持されてもよい。二倍体細胞は、ゲノム全体が二倍体である細胞を指してもよく、あるいは、関心のある特定のゲノム遺伝子座中の二倍体である細胞を指してもよい。実施態様によっては、真菌細胞は一倍体細胞である。本明細書で使用される「一倍体」細胞は、ゲノムが1つの複製物中に存在する任意の細胞を指してもよい。一倍体細胞は、一倍体状態で自然に見られる細胞型を指してもよく、または(例えば、減数分裂、細胞質分裂、またはDNA複製の特定の調節、変更、不活性化、活性化、または改変によって)一倍体状態で存在するように誘導された細胞を指してもよい。例えば、S.セルビシエ株S228Cは、一倍体または二倍体状態で維持されてもよい。一倍体細胞は、ゲノム全体が一倍体である細胞を指してもよく、あるいは、関心のある特定のゲノム遺伝子座中の一倍体である細胞を指してもよい。
本明細書で使用される「酵母発現ベクター」は、RNAおよび/またはポリペプチドをコードする1つ以上の配列を含む核酸、かつ核酸の発現を制御する任意の所望の要素ならびに酵母細胞内の発現ベクターの複製と維持を可能にする任意の要素をさらに含んでいてもよい核酸を指す。多くの適切な酵母発現ベクターおよびその特徴は当技術分野で知られていて、例えば、種々のベクターおよびその技術は、Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007)およびBuckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72に説明されている。酵母ベクターは、限定はされないが、動原体性 (CEN)配列、自律複製配列 (ARS)、関心のある配列または遺伝子に操作可能に連結されたRNAポリメラーゼIIIプロモーターなどのプロモーター、RNAポリメラーゼIIIターミネーターなどのターミネーター、複製起点、およびマーカー遺伝子(例えば、栄養要求性マーカー、抗生物質マーカー、またはその他の選択可能なマーカー)を含んでもよい。酵母で使用するための発現ベクターの例には、プラスミド、酵母人工染色体、2μプラスミド、酵母統合プラスミド、酵母複製プラスミド、シャトルベクター、およびエピソームプラスミドが含まれてもよい。
植物および植物細胞のゲノム中でのCRISPR-C2c1システム構成要素の安定な組込み
特定の実施態様では、CRISPR-C2c1システムの構成要素をコードするポリヌクレオチドを、植物細胞のゲノム中への安定な組込みのために導入することが想定される。これらの実施態様では、形質転換ベクターまたは発現システムの設計を、ガイドRNAおよび/またはC2c1遺伝子が発現する日時、場所、および条件に応じて調整できる。
特定の実施態様では、CRISPR-C2c1システムの構成要素を、植物細胞のゲノムDNA中に安定に導入することが想定される。さらに、またはあるいは、限定はされないが、色素体、ミトコンドリア、または葉緑体などの植物細胞小器官のDNA中への安定な組込みのために、CRISPR-C2c1システムの構成要素を導入することが想定される。
植物細胞のゲノム中への安定な組込みのための発現システムは、以下の要素のうちの1つ以上を含んでもよく、それらの要素は、植物細胞中でのRNAおよび/またはC2c1酵素の発現に用いることができるプロモーター要素、発現を増強するための5’非翻訳領域、単子葉植物細胞などの特定の細胞中で発現をさらに増強するイントロン要素、ガイドRNAおよび/またはC2c1遺伝子配列および他の所望の要素を挿入する簡便な制限部位を提供するための複数のクローン部位、および発現された転写産物の効率的な停止を提供する3’非翻訳領域である。
発現システムの要素は、プラスミドまたは形質転換ベクターのように環状であるか、あるいは鎖状二本鎖DNAのように非環状であるかのいずれかである1つ以上の発現構築物表面に存在してもよい。
特定の実施態様では、C2c1 CRISPR発現システムは、少なくとも
(a)植物中の標的配列とハイブリダイズし、かつガイド配列および直接反復配列を含むガイドRNA (gRNA)をコードするヌクレオチド配列、
(b)tracr RNAをコードするヌクレオチド配列、および
(c)C2c1タンパク質をコードするヌクレオチド配列を含み、
構成要素(a)または(b)または(c)は、同一のまたは異なる構築物表面に位置し、それにより、異なるヌクレオチド配列は、植物細胞中で操作可能な同一のまたは異なる調節エレメントの制御の下にあってもよい。tracr RNAはガイドRNAに融合していてもよい。
CRISPR-C2c1システムの構成要素を含むDNA構築物、および該当する場合には鋳型配列は、様々な従来技術によって、植物、植物部分、または植物細胞のゲノム中に導入されてもよい。このプロセスは、一般に、適切な宿主細胞または宿主組織を選択し、構築物をこの宿主細胞または宿主組織に導入して、植物細胞または植物をそれから再生する工程を含む。
特定の実施態様では、DNA構築物は、限定はされないが、植物細胞原形質体のエレクトロポレーション法、微量注入法、エアロゾルビーム注入法などの技術を使用して植物細胞に導入されてもよく、あるいはDNA構築物は、DNA粒子衝撃などの遺伝子銃の方法(Fu et al., Transgenic Res.2000 Feb;9(1):11-9を参照)を用いて植物組織に直接導入されてもよい。粒子衝撃の原理は、関心のある遺伝子で被覆された粒子を細胞に向かって加速することであり、その結果として、粒子が原形質に浸透してゲノム中に通常は安定的に組み込まれる(例えば、Klein et al, Nature (1987), Klein et ah, Bio/Technology (1992), Casas et ah, Proc. Natl. Acad. Sci. USA (1993)を参照)。
特定の実施態様では、CRISPR-C2c1システムの構成要素を含むDNA構築物は、アグロバクテリウムにより媒介される形質転換によって植物中に導入されてもよい。DNA構築物は、適切なT-DNA隣接領域と組み合わせて、従来型のアグロバクテリウム・ツメファシエンス (Agrobacterium tumefaciens)宿主ベクター中に導入されてもよい。外来DNAは、植物に感染させるか、あるいは植物の原形質体を1つ以上のTi(腫瘍誘導)プラスミドを含むアグロバクテリウム菌とともに培養して、植物のゲノム中に組み込んでもよい(例えば、Fraley et al., (1985), Rogers et al., (1987)および米国特許5,563,055号を参照)。
植物プロモーター
植物細胞での適切な発現を確実にするために、本明細書に説明のCRISPR-C2c1システムの構成要素は、典型的には、植物プロモーター、すなわち植物細胞中で操作可能なプロモーターの制御の下に配置される。異なるプロモーター型の使用も想定される。
構成型植物プロモーターは、植物の全てまたはほぼ全ての発育段階中に、全てまたはほぼ全ての植物組織中でそのプロモーターが制御する開放読み取り枠 (ORF)を発現できる(「構成型発現」と呼ばれる)プロモーターである。構成型プロモーターの非限定的な一例は、カリフラワーモザイクウイルス35Sプロモーターである。「調節されたプロモーター」は、構成的にではなく、時間的および/または空間的に調節される手法で遺伝子発現を誘導するプロモーターを指し、組織特異的な、組織優先的な、かつ誘導性のプロモーターを含む。異なるプロモーターは、異なる組織または細胞型で、あるいは異なる発達段階で、あるいは異なる環境条件に応答して、遺伝子の発現を誘導できる。特定の実施態様では、1つ以上のC2c1 CRISPR成分は、カリフラワーモザイクウイルス35Sプロモーターなどの構成型プロモーターの制御の下で発現され、好ましいプロモーターを利用して、特定の植物組織内の特定の細胞型、例えば、葉または根または種子の特定の細胞中の導管細胞での発現の増強を標的化することができる。CRISPR-C2c1システムで使用する特定のプロモーターの例を、Kawamata et al., (1997) Plant Cell Physiol 38:792-803、Yamamoto et al., (1997) Plant J 12:255-65、Hire et al, (1992) Plant Mol Biol 20:207-18、Kuster et al, (1995) Plant Mol Biol 29:759-72、およびCapana et al., (1994) Plant Mol Biol 25:681 -91に見出すことができる。
誘導性であり、かつ遺伝子編集または遺伝子発現の時空間制御を可能にするプロモーターの例として、ある形態のエネルギーを使用してもよい。エネルギーの形態には、限定はされないが、音響エネルギー、電磁放射エネルギー、化学エネルギー、および/または熱エネルギーが含まれてもよい。誘導性システムの例には、テトラサイクリン誘導性プロモーター(Tet-OnまたはTet-Off)、小分子二重混成転写活性化システム(FKBP、ABAなど)、または転写活性の変化を配列特異的に誘導する光誘導性転写エフェクター (LITE)などの光誘導性システム(フィトクロム、LOVドメイン、またはクリプトクロム)が含まれる。光誘導性システムの成分として、C2c1 CRISPR酵素、(例えばシロイヌナズナ由来の)光応答性シトクロムヘテロ二量体、および転写活性化/抑制ドメインを含んでもよい。誘導性DNA結合タンパク質およびそれらの使用方法のさらなる例は、米国特許出願61/736465号および61/721,283号に提供されており、これらは参照によりその全体が本明細書に組み込まれる。
特定の実施態様では、一過性または誘導性の発現は、例えば、化学的に調節されるプロモーターを使用して、すなわち外因性化学物質の応用によって遺伝子発現を誘導して達成できる。遺伝子発現の調節はまた、化学物質の応用により遺伝子発現を抑制する化学物質抑制性プロモーターによって達成できる。化学的誘導性プロモーターとして、限定はされないが、ベンゼンスルホンアミド除草剤の毒性緩和剤によって活性化されるトウモロコシln2-2プロモーター(De Veylder et al., (1997) Plant Cell Physiol 38:568-77)、発芽前除草剤として用いられる疎水性求電子性化合物によって活性化されるトウモロコシGSTプロモーター(GST-ll-27、国際特許出願WO93/01294号)、およびサリチル酸によって活性化されるタバコPR-1aプロモーター(Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7)が挙げられる。テトラサイクリン誘導性プロモーターおよびテトラサイクリン抑制性プロモーター(Gatz et al., (1991) Mol Gen Genet 227:229-37、米国特許5,814,618号および5,789,156号)などの抗生物質によって調節されるプロモーターも本明細書で使用できる。
特定の植物細胞小器官への移動および/またはその植物細胞小器官中での発現
発現システムは、特定の植物細胞小器官への移動および/またはその植物細胞小器官中での発現のための要素を含んでもよい。
葉緑体の標的化について、特定の実施態様では、CRISPR-C2c1システムを使用して、葉緑体遺伝子を特異的に改変するか、あるいは葉緑体での発現を確実にすることを意図する。この目的のために、葉緑体の形質転換方法、または葉緑体へのC2c1 CRISPR構成要素の仕分け方法を用いる。例えば、色素体ゲノムに遺伝子改変を導入すると、花粉を貫通する遺伝子の流動などの生物学的安全性の問題を低減できる。
葉緑体形質転換の方法は、当技術分野で知られており、粒子衝撃、PEG処理、および微量注入法を含む。さらに、核ゲノムから色素体への形質転換カセットの移動を含む方法を、国際特許出願WO2010061186号に説明されるように使用できる。
あるいは、1つ以上のC2c1 CRISPR構成要素を植物葉緑体に標的化することを意図する。これは、C2c1タンパク質をコードする配列の5’領域に操作可能に連結された、葉緑体輸送ペプチド (CTP)または色素体輸送ペプチドをコードする配列を発現構築物中に組み込むことによって達成される。CTPは、葉緑体への移動中の処理工程で除去される。発現されたタンパク質の葉緑体標的化は、当業者には周知である(例えば、Protein Transport into Chloroplasts(葉緑体中へのタンパク質輸送), 2010, Annual Review of Plant Biology,Vol. 61: 157-180を参照)。この実施態様では、ガイドRNAを植物葉緑体に標的化することもまた望ましい。葉緑体局在化配列によってガイドRNAを葉緑体中に移動させるのに用いることができる方法および構築物は、例えば、参照により本明細書に組み込まれる米国特許公開20040142476号に説明されている。構築物のそのような変異体を、C2c1-ガイドRNAを効率的に移動させるために本発明の発現システムに組み込むことができる。
藻類細胞へのCRISPR-C2c1システムをコードするポリヌクレオチドの導入
遺伝子導入藻類(または菜種などの他の植物)は、植物油またはアルコール(特にメタノールおよびエタノール)などのバイオ燃料または他の製品の生産に特に利用可能である。これらは、石油産業またはバイオ燃料産業で使用するために、高濃度の石油またはアルコールを発現または過剰発現するように遺伝子操作してもよい。
米国特許8945839号は、Cas9を用いて微細藻類(コナミドリムシ (Chlamydomonas reinhardtii)細胞)種を遺伝子操作する方法を説明している。同様の手段を用いて、本明細書で説明のCRISPR-C2c1システムの方法を、コナミドリムシ種やその他の藻類に応用できる。特定の実施態様では、C2c1およびガイドRNAを、Hsp70A-Rbc S2またはβ2-チューブリンなどの構成型プロモーターの制御の下でC2c1を発現するベクターを用いて発現される藻類に導入する。ガイドRNAは、場合によっては、T7プロモーターを含むベクターを用いて送達される。あるいは、C2c1 mRNAおよびin vitroで転写されたガイドRNAを、藻類細胞に送達できる。GeneArt(R) Chlamydomonas Engineering(コナミドリムシ遺伝子操作)キットの標準的な推奨手順などのエレクトロポレーション法の手順を、当業者は利用可能である。
特定の実施態様では、本明細書で使用されるエンドヌクレアーゼは、分割C2c1酵素である。分割C2c1酵素は、国際特許出願WO2015086795号でのCas9で説明されるように、標的ゲノム改変のために藻類で優先的に使用されている。C2c1分割システムの使用は、ゲノム標的化の誘導方法に特に適していて、藻類細胞内でのC2c1過剰発現の潜在的な毒性の影響を回避する。特定の実施態様では、前記C2c1分割ドメイン(RuvCドメイン)を、前記C2c1分割ドメインが藻類細胞内の標的核酸配列を処理するように、同時にまたは連続的に細胞内に導入できる。野生型C2c1と比較して分割されたC2c1のサイズは小さいことにより、本明細書に説明の細胞透過性ペプチドの使用など、細胞へのCRISPRシステムの送達について他の方法が可能になる。この方法は、遺伝子組み換え藻類の生成に特に興味深いものである。
酵母細胞へのC2c1構成要素をコードするポリヌクレオチドの導入
特定の実施態様では、本発明は、酵母細胞のゲノム編集のためのCRISPR-C2c1システムの使用に関する。CRISPR-C2c1システムの構成要素をコードするポリヌクレオチドを導入するために使用できる酵母細胞を形質転換する方法は、当業者には周知であり、Kawai et al., 2010, Bioeng Bugs. 2010 Nov-Dec; 1(6): 395-403)によって総説されている。非限定的な例として、(担体DNAおよびPEG処理をさらに含んでもよい)酢酸リチウム処理、衝撃、またはエレクトロポレーションによる酵母細胞の形質転換が含まれる。
植物および植物細胞でのC2c1 CRISPシステム構成要素の一過性発現
特定の実施態様では、ガイドRNAおよび/またはC2c1遺伝子が植物細胞中で一過的に発現すことが想定される。これらの実施態様では、CRISPR-C2c1システムは、ガイドRNAおよびC2c1タンパク質の両方が細胞内に存在する場合にのみ標的遺伝子の改変を確実にして、その結果、ゲノム改変をさらに制御できる。C2c1酵素の発現は一過性であるために、この植物細胞から再生された植物は、典型的には外来DNAを含まない。特定の実施態様では、C2c1酵素は、植物細胞によって安定的に発現され、ガイド配列は一過的に発現される。
特定の実施態様では、CRISPR-C2c1システムの構成要素を、植物ウイルスベクターを用いて植物細胞中に導入できる(Scholthof et al. 1996, Annu Rev Phytopathol. 1996;34:299-323)。さらに特定の実施態様では、前記ウイルスベクターは、DNAウイルスからのベクターであり、例えば、ジェミニウイルス(キャベツ葉巻ウイルス、豆黄化萎縮ウイルス、小麦萎縮ウイルス、トマト葉巻ウイルス、トウモロコシ線条ウイルス、タバコ葉巻ウイルス、またはトマトゴールデンモザイクウイルスなど)、あるいはナノウイルス(ソラマメ壊死性黄色ウイルスなど)である。他の特定の実施態様では、前記ウイルスベクターは、RNAウイルスからのベクターであり、例えば、トブラウイルス(タバコ茎壊疽ウイルス、タバコモザイクウイルスなど)、ポルテクスウイルス(ジャガイモウイルスXなど)、またはホルデイウイルス(ムギ斑葉モザイクウイルスなど)である。植物ウイルスの複製ゲノムは非統合型ベクターである。
特定の実施態様では、C2c1 CRISPR構築物の一過性発現に使用されるベクターは、例えば、原形質体でのアグロバクテリウムにより媒介される一過性発現(Sainsbury F. et al., Plant Biotechnol J. 2009 Sep;7(7):682-93)に適合させたpEAQベクターである。ゲノム位置の高精度の標的化は、CRISPR酵素を発現する安定な遺伝子導入植物中でgRNAを発現する改変キャベツ葉巻ウイルス (CaLCuV)ベクターを用いて実証された(Scientific Reports 5, Article number: 14926 (2015), doi:10.1038/srep14926)。
特定の実施態様では、ガイドRNAおよび/またはC2c1遺伝子をコードする二本鎖DNA断片を、植物細胞中に一過的に導入できる。その実施態様では、導入された二本鎖DNA断片は、細胞を改変するのに十分な量で提供されるが、所定の期間が経過した後には、または1回以上の細胞分裂後には持続しない。植物での直接的なDNA転移の方法は、当業者には知られている(例えば、Davey et al. Plant Mol Biol. 1989 Sep;13(3):273-85を参照のこと)。
他の実施態様では、C2c1タンパク質をコードするRNAポリヌクレオチドは、植物細胞中に導入され、次いで宿主細胞によって翻訳および処理され、(少なくとも1つのガイドRNAの存在下で)細胞を改変するのに十分な量のタンパク質を生成するが、所定の期間が経過した後には、または1回以上の細胞分裂の後には持続しない。一過性発現のために植物原形質体にmRNAを導入する方法は、当業者には知られている(例えば、Gallie, Plant Cell Reports (1993), 13;119-122を参照)。
上記の異なる方法の組合せも想定される。
C2c1 CRISPR構成要素の植物細胞への送達
特定の実施態様では、CRISPR-C2c1システムの1つ以上の構成要素を植物細胞に直接的に送達することを目的とする。これは、特に非遺伝子導入植物の生成を目的とする(以下を参照)。特定の実施態様では、1つ以上のC2c1構成要素は、植物または植物細胞の外側で調製されて、細胞に送達される。例えば、特定の実施態様では、C2c1タンパク質を、植物細胞に導入する前にin vitroで調製する。C2c1タンパク質は、当業者なら知っている様々な方法によって調製でき、かつ組換え産生を含む。発現後に、C2c1タンパク質を単離し、必要に応じて再折畳みを実施し、精製し、かつ必要に応じて処理してHisタグなど任意の精製タグを除去する。天然のままの、部分的に精製された、あるいはより完全に精製されたC2c1タンパク質が得られたら、そのタンパク質を植物細胞に導入してもよい。
特定の実施態様では、C2c1タンパク質を、関心のある遺伝子を標的とするガイドRNAと混合して、予め構築されたリボ核タンパク質を形成する。
個々の構成要素または予め構築されたリボヌクレオタンパク質は、エレクトロポレーション法を介して、C2c1を会合した遺伝子産物被覆粒子による衝撃によって、化学的形質導入によって、または細胞膜を通過するその他の輸送手段によって植物細胞中に導入できる。例えば、予め構築されたCRISPRリボ核タンパク質による植物原形質体の遺伝子導入は、植物ゲノムの標的改変を確実にすることが実証されている(Woo et al. Nature Biotechnology, 2015; DOI: 10.1038/nbt.3389に説明)。
特定の実施態様では、CRISPR-C2c1システムの構成要素を、粒子を使用して植物細胞中に導入する。タンパク質または核酸またはそれらの組合せのいずれかとしての構成要素を、(例えば、国際特許出願WO2008042156号および米国特許公開20130185823号での説明のように)粒子に載置または充填し、植物に組み込んでもよい。特に、本発明の実施態様は、国際特許出願WO2015089419号に説明されるように、C2c1タンパク質をコードするDNA分子、ガイドRNAおよび/または単離されたガイドRNAをコードするDNA分子が載置または充填された粒子を含む。
CRISPR-C2c1システムの1つ以上の構成要素を植物細胞に導入するさらなる手段は、細胞透過性ペプチド (CPP)を用いることによる。従って、特定の実施態様では、本発明は、C2c1タンパク質に連結された細胞透過性ペプチドを含む組成物を含む。本発明の特定の実施態様では、C2c1タンパク質および/またはガイドRNAを、1つ以上のCPPに結合して、それらを植物原形質体内に効果的に輸送する。Ramakrishna(ヒト細胞中のCas9のための20140ゲノム Res. 2014 Jun; 24(6):1020-7)を参照。他の実施態様では、C2c1遺伝子および/またはガイドRNAは、植物原形質体の送達のために1つ以上のCPPに結合する1つ以上の環状または非環状のDNA分子によってコードされる。次に植物原形質体は、植物細胞に、さらには植物に再生される。CPPは、一般に、タンパク質またはキメラ配列のいずれかに由来する35個のアミノ酸未満の短いペプチドとして説明されていて、受容体に依存しない方式で細胞膜を貫通して生体分子を輸送できる。CPPは、陽イオン性ペプチド、疎水性配列を有するペプチド、両親媒性ペプチド、プロリン富化の抗菌配列を有するペプチド、およびキメラペプチドまたは二分割ペプチドであってもよい(Pooga and Langel 2005)。CPPは、生体膜を貫通することができ、様々な生体分子の細胞膜を横切る細胞質への移動を誘発して細胞内経路を改善し、それによって生体分子と標的との相互作用を促進する。CPPの例として、特に、Tat、すなわちHIV型1、ペネトラチン、カポジ線維芽細胞成長因子 (FGF)シグナルペプチド配列、インテグリンβ3シグナルペプチド配列によるウイルス複製に必要な核転写活性化因子タンパク質、ポリアルギニンペプチドArgs配列、グアニン富化分子輸送体、スイートアローペプチドなどが挙げられる。
遺伝子改変された非遺伝子導入植物の産出のためのCRISPR-C2c1システムの使用
特定の実施態様では、本明細書に説明の方法を用いて、植物ゲノム中の外来DNAの存在を回避するように、内因性遺伝子を改変する、あるいはCRISPR構成要素をコードする遺伝子を含む植物ゲノム中への任意の外来遺伝子の恒久的な導入を実施せずにそれらの発現を改変する。非遺伝子導入植物の規制条件はそれほど厳格ではないので、この改変に着目できる。
特定の実施態様では、これは、C2c1 CRISPR構成要素の一過的な発現によって保証される。特定の実施態様では、1つ以上のCRISPR構成要素を、本明細書に説明の方法に従って関心のある遺伝子の改変を一貫して着実に確実とするのに十分なC2c1タンパク質およびガイドRNAを産生する1つ以上のウイルスベクター表面で発現する。
特定の実施態様では、C2c1 CRISPR構築物の一過的な発現は、植物原形質体中で確実になり、従ってゲノム中には組み込まれない。発現ウィンドウの限定を、CRISPR-C2c1システムが本明細書に説明のように標的遺伝子の改変を確実にすることを可能にするのに十分な範囲にできる。
特定の実施態様では、CRISPR-C2c1システムの異なる構成要素は、本明細書で上述の粒子またはCPP分子などの粒子送達分子の助けを借りて、別々にまたは混合して、植物細胞、原形質体、または植物組織中に導入される。
C2c1 CRISPR構成要素の発現は、C2c1ヌクレアーゼの直接活性および場合によっては鋳型DNAの導入によって、あるいは本明細書に説明のCRISPR-C2c1システムを用いて標的化された遺伝子の改変によって、ゲノムの標的化改変を誘発できる。上述の種々の手法により、C2c1 CRISPR構成要素を植物ゲノム中に導入することなく、C2c1を媒介とする標的化ゲノム編集が可能になる。植物細胞中に一過的に導入される構成要素は、通常は、交配時に取り除かれる。
植物ゲノム選択マーカーでの改変の検出
方法が植物ゲノムの内因性標的遺伝子の改変を含む特定の実施態様では、任意の適切な方法を使用して、植物、植物部分、または植物細胞がCRISPR-C2c1システムに感染あるいは形質導入された後に、遺伝子標的化または標的変異誘発が標的部位で発生したかどうかを決定することができる。方法が導入遺伝子の導入を含む場合に、形質転換された植物細胞、カルス、組織、または植物を、導入遺伝子の存在または導入遺伝子によってコードされた形質に関して、遺伝子操作された植物材料を選択または選別することにより識別かつ単離してもよい。物理的方法および生化学的方法を使用して、挿入された遺伝子構築物または内因性DNAの改変を含む植物または植物細胞の形質転換体を識別してもよい。これらの方法には、限定はされないが、1)組換えDNA挿入物または改変内因性遺伝子の構造を検出および決定するためのサザン解析法またはPCR増幅法、2)遺伝子構築物のRNA転写産物を検出および検査するためのノーザンブロット法、S1 RNA分解酵素保護法、プライマー伸長法、または逆転写酵素PCR増幅法、3)この遺伝子産物が遺伝子構築物によってコードされているか、あるいは発現が遺伝子改変によって影響を受けている場合の酵素またはリボザイム活性を検出するための酵素測定法、および4)遺伝子構築物または内因性遺伝子産物がタンパク質である場合のタンパク質のゲル電気泳動法、ウエスタンブロット技術、免疫沈降法、または酵素結合免疫測定法が含まれる。In situハイブリダイズ、酵素染色、および免疫染色などの追加の技術をまた使用して、組換え構築物の存在または発現を検出してもよく、あるいは特定の植物器官および組織での内因性遺伝子の改変を検出してもよい。これら全ての測定を実施する方法は、当業者に周知である。
さらに(またはあるいは)、C2c1 CRISPR構成要素をコードする発現システムは、典型的には、初期段階で大規模にCRISPR-C2c1システムを含む細胞、かつ/あるいはそのシステムによって改変された細胞を単離または効率的に選択する手段を提供する1つ以上の選択可能または検出可能なマーカーを含むように設計される。
アグロバクテリウムが媒介する形質転換の場合に、マーカーカセットは、隣接するT-DNA境界に隣接していてもよく、またはそれら境界の間にあってもよく、かつバイナリーベクター内に含まれてもよい。別の実施態様では、マーカーカセットは、T-DNAの外側にあってもよい。選択可能なマーカーカセットはまた、発現カセットと同じT-DNA境界内にあってもよく、または隣接していてもよく、あるいは(例えば2個のT-DNAシステムである)バイナリーベクター上の第2のT-DNA内のどこかにあってもよい。
粒子衝撃または原形質体の形質転換を伴う場合に、発現システムは、1つ以上の単離された鎖状断片を含んでもよく、あるいは細菌複製要素、細菌選択可能マーカー、または他の検出可能要素を含む可能性があるより大きな構築物の一部分であってもよい。ガイドおよび/またはC2c1をコードするポリヌクレオチドを含む発現カセットは、マーカーカセットに物理的に連結されていてもよく、あるいはマーカーカセットをコードする第2の核酸分子と混合されていてもよい。マーカーカセットは、形質転換細胞の効率的な選択を可能にする検出可能または選択可能なマーカーを発現するために必要な要素により構成されている。
選択可能なマーカーに基づく細胞の選択手順は、マーカー遺伝子の性質に依存する。特定の実施態様では、選択可能なマーカー、すなわち、マーカーの発現に基づいて細胞の直接的な選択を可能にするマーカーが使用される。選択可能なマーカーは、正または負の選択を付与することができ、外部基質の存在については条件を付ける場合、または付けない場合がある(Miki et al. 2004, 107(3): 193-232)。最も一般的には、抗生物質耐性遺伝子または除草剤耐性遺伝子がマーカーとして使用され、この場合の選択は、マーカー遺伝子が耐性を付与する抗生物質または除草剤の阻害量を含む培地で遺伝子操作された植物材料を成長させることで実施される。この遺伝子の例として、ハイグロマイシン (hpt)やカナマイシン (nptII)などの抗生物質に対して耐性を付与する遺伝子、およびホスフィノトリシン (bar)やクロロスルフロン (als)などの除草剤に対する耐性を付与する遺伝子が挙げられる。
形質転換された植物および植物細胞はまた、目視可能なマーカー、典型的には着色された基質(例えば、β-グルクロニダーゼ、ルシフェラーゼ、B遺伝子またはC1遺伝子)を処理できる酵素の活性を選別して識別できる。その選択および選別の各方法は、当業者には周知である。
植物の培養および再生
特定の実施態様では、改変されたゲノムを有し、かつ本明細書に説明の方法のいずれかによって産生または得られる植物細胞を培養して、形質転換または改変された遺伝子型、結果として所望の表現型を有する植物全体を再生できる。従来型の再生技術は当業者に周知である。そのような再生技術の特定の例は、組織培養増殖培地での特定の植物ホルモンの操作に依存し、典型的には、所望のヌクレオチド配列とともに導入された殺生物剤マーカーおよび/または除草剤マーカーに依存する。さらに特定の実施態様では、植物の再生は、培養された原形質体、植物カルス、外植片、器官、花粉、胚、またはそれらの一部から得られる(例えば、Evans et al. (1983), Handbook of Plant Cell Culture, Klee et al (1987) Ann. Rev. of Plant Physを参照)。
特定の実施態様では、本明細書に説明の形質転換または改良された植物は、自家受粉して本発明のホモ接合性改良植物(DNA改変に対しホモ接合性)の種子を提供でき、あるいは非遺伝子導入植物または異なる改良植物と交配してヘテロ接合性植物の種子を提供できる。組換えDNAが植物細胞中に導入された場合に、その交配の結果として生じる植物は、組換えDNA分子に対してヘテロ接合性である植物である。改良された植物から交配によって得られ、かつ(組換えDNAであってもよい)遺伝子改変を含むそのようなホモ接合性植物およびヘテロ接合性植物の両方は、本明細書では「後代」と呼ばれる。後代の植物は、元の遺伝子導入植物の系統を引き、かつゲノム改変または本明細書に提供の方法によって導入された組換えDNA分子を含む植物である。あるいは、遺伝子組み換え植物は、Cfp1酵素を用いて上述の方法のうちの1つによって得ることができ、ここでは外来DNAはゲノム中に組み込まれない。さらなる育種によって得られるこの植物の後代もまた、遺伝子組み換えを含んでもよい。育種は、種々の作物に一般的に用いられる育種方法によって実施される(例えば、Allard, Principles of Plant Breeding, John Wiley & Sons, NY, U. of CA, Davis, CA, 50-98 (1960))。
農学的形質が向上した植物の生成
本明細書に提供のC2c1に基づくCRISPRシステムは、標的化された二本鎖切断または一本鎖切断を導入し、かつ/あるいは遺伝子活性化因子および/または抑制因子システムを導入するために使用でき、限定はされないが、遺伝子標的化、遺伝子置換、標的変異誘発、標的化された欠失または挿入、標的化された反転、および/または標的化された転座のために使用できる。単一細胞で複数の改変を達成するように誘導された複数の標的化RNAを共発現させて、多重化ゲノム改変を確実にできる。この技術は、栄養価の向上、病気への耐性ならびに生物的および非生物的ストレスへの耐性の向上、および商業的に価値のある植物製品または異種化合物の生産の向上などの特性が改善された植物の高精度な遺伝子操作に使用できる。
特定の実施態様では、本明細書に説明のCRISPR-C2c1システムを使用して、内因性DNA配列中に標的化された二本鎖切断 (DSB)を導入する。このDSBは、細胞のDNA修復経路を活性化し、これを利用して切断部位の近傍で所望のDNA配列の改変を達成できる。これは、内因性遺伝子の不活性化または改変が、所望の形質を付与できる場合、あるいはその形質に寄与できる場合を対象とする。実施態様によっては、関心のある遺伝子を導入するために、鋳型配列による相同組換え (HR)が、DSBの部位で促進される。実施態様によっては、HR-非依存性組換えは、ねじれ型のDSBに関心のある配列または遺伝子を導入するために、DSBの部位で促進される。特定の実施態様では、CRISPR-C2c1システムは、5’オーバーハングを有するねじれ型のDSBを生成する。特定の実施態様では、CRISPR-C2c1システムは、ガイド配列中に挿入鋳型配列を含み、ねじれ型のDSBに特定のDNA挿入物を導入する。
特定の実施態様では、CRISPR-C2c1システムは、内因性植物遺伝子の活性化および/または抑制のために、機能ドメインに融合された、または機能ドメインに操作可能に連結された一般的な核酸結合タンパク質として使用されてもよい。機能ドメインの例として、限定はされないが、RNAまたはDNAデアミナーゼ、翻訳開始剤、翻訳活性化因子、翻訳抑制因子、特にリボヌクレアーゼであるヌクレアーゼ、スプライセオソーム、ビーズ、光誘導性/制御性ドメイン、または化学誘導性/制御性ドメインが含まれてもよい。典型的には、これらの実施態様では、C2c1タンパク質は、少なくとも1つの変異を持たないC2c1タンパク質の活性が5%以下となるように、少なくとも1つの変異を有する。ガイドRNAは、標的配列にハイブリダイズできるガイド配列を含む。
本明細書に説明の方法は、一般に、野生型植物と比較して1つ以上の望ましい形質を有するという観点での「改良された植物」の生成をもたらす。特定の実施態様では、得られる植物、植物細胞、または植物部分は、植物の細胞の全部または一部のゲノム中に組み込まれた外因性DNA配列を含む遺伝子導入植物である。特定の実施態様では、非遺伝子導入性の遺伝子改変植物、植物部分、または細胞は、外因性DNA配列が植物のいずれの植物細胞のゲノム中にも組み込まれていないという観点で得られたものである。そのような実施態様では、改良された植物は非遺伝子導入性である。内因性遺伝子の改変のみが保証され、かつ外来遺伝子が植物ゲノムに導入または保持されない場合に、結果として生じる遺伝子改変作物は、外来遺伝子を含まず、それにより基本的に非遺伝子導入性と見做すことができる。植物ゲノム編集のためのCRISPR-C2c1システムの様々な応用について、以下に詳しく説明する。
a)関心のある農学的形質を付与するための1つ以上の外来遺伝子の導入
本発明は、関心のある標的遺伝子座に会合する配列、またはその遺伝子座にある配列をゲノム編集または改変する方法を提供し、この方法は、C2c1エフェクタータンパク質複合体を植物細胞に導入することを含み、それにより、C2c1エフェクタータンパク質複合体は、植物細胞のゲノム中にDNA挿入物を組み込むように、例えば関心のある外来遺伝子をコードするように、効果的に機能する。実施態様によっては、DNA挿入物の組込みは、外因的に導入されたDNA鋳型または修復鋳型を用いるHRによって促進される。好ましい実施態様によっては、DNA挿入物の組込みは、HRに依存しない組込み(例えばNHEJ)によって促進される。典型的には、外因的に導入されたDNA鋳型または修復鋳型は、C2c1エフェクタータンパク質複合体、または1つの構成要素、または複合体の構成要素の発現のためのポリヌクレオチドベクターとともに送達される。
本明細書で提供のCRISPR-C2c1システムは、標的化された遺伝子の送達を可能にする。関心のある遺伝子を発現する効率は、ゲノム中への組込み位置によって大部分が決定されることが次第に明確になりつつある。本発明の方法は、外来遺伝子のゲノム内の所望の位置への標的化された組込みを可能にする。その位置は、過去に発生した事象の情報に基づいて選択でき、または本明細書の他の場所に開示された方法によって選択できる。
特定の実施態様では、本明細書で提供の方法は、(a)直接反復および植物細胞に対し内因性である標的配列にハイブリダイズするガイド配列を含むガイドRNAを含むC2c1 CRISPR複合体を細胞中に導入すること、(b)ガイド配列が標的配列にハイブリダイズし、かつガイド配列が標的とされる配列でまたはその近傍で二本鎖切断を誘発するときに、ガイドRNAと複合化するC2c1エフェクター分子を植物細胞中に導入すること、および(c)関心のある遺伝子をコードし、かつHDRの結果としてDS切断の位置に導入されるHDR修復鋳型をコードするヌクレオチド配列を細胞中に導入することを含む。特定の実施態様では、導入工程は、C2c1エフェクタータンパク質、ガイドRNA、および修復鋳型をコードする1つ以上のポリヌクレオチドを植物細胞に送達することを含んでもよい。特定の実施態様では、ポリヌクレオチドは、DNAウイルス(例えばジェミニウイルス)またはRNAウイルス(例えばトブラウイルス)によって細胞内に送達される。特定の実施態様では、導入工程は、C2c1エフェクタータンパク質、ガイドRNA、および修復鋳型をコードする1つ以上のポリヌクレオチド配列を含むT-DNAを植物細胞に送達することを含み、この送達はアグロバクテリウムを介する。C2c1エフェクタータンパク質をコードする核酸配列は、構成型プロモーター(例えばカリフラワーモザイクウイルス35Sプロモーター)などのプロモーター、または細胞特異性または誘導性プロモーターに操作可能に連結されていてもよい。特定の実施態様では、ポリヌクレオチドは、微小発射物の衝撃によって導入される。特定の実施態様では、この方法はさらに、修復鋳型、すなわち関心のある遺伝子が導入されたかどうかを決定するために、導入工程後に植物細胞を選別することを含む。特定の実施態様では、この方法は、植物細胞から植物を再生する工程を含む。さらなる実施態様では、この方法は、遺伝的に所望の植物系統を得るために植物を交配育種することを含む。関心のある形質をコードする外来遺伝子の例を以下に列記する。
b)関心のある農学的形質を付与する内因性遺伝子の編集
本発明は、対象の標的遺伝子座に会合するまたはその遺伝子座の位置にある配列をゲノム編集または改変する方法を提供し、この方法は、C2c1エフェクタータンパク質複合体を植物細胞中に導入することを含み、それによりC2c1複合体は、植物の内因性遺伝子の発現を改変する。この改変は、異なる方法により達成してもよい。特定の実施態様では、内因性遺伝子の発現の排除が望ましく、C2c1 CRISPR複合体を使用して、遺伝子発現を改変するように内因性遺伝子を標的化して切断する。これらの実施態様では、本明細書で提供の方法は、(a)直接反復および植物細胞のゲノム中の関心のある遺伝子内の標的配列にハイブリダイズするガイド配列を含むガイドRNAを含むC2c1 CRISPR複合体を植物細胞中に導入すること、および(b)C2c1エフェクタータンパク質を細胞中に導入することを含み、C2c1エフェクタータンパク質は、ガイドRNAに結合すると、標的配列にハイブリダイズするガイド配列を含み、かつガイド配列が標的化される配列でまたはその近傍で二本鎖切断を確実にする。特定の実施態様では、導入工程は、C2c1エフェクタータンパク質およびガイドRNAをコードする1つ以上のポリヌクレオチドを植物細胞に送達することを含んでもよい。
特定の実施態様では、ポリヌクレオチドは、DNAウイルス(例えばジェミニウイルス)またはRNAウイルス(例えばトブラウイルス)によって細胞中に送達される。特定の実施態様では、導入工程は、C2c1エフェクタータンパク質およびガイドRNAをコードする1つ以上のポリヌクレオチド配列を含むT-DNAを植物細胞に送達することを含み、この送達はアグロバクテリウムを介する。CRISPR-C2c1システムの構成要素をコードするポリヌクレオチド配列は、構成型プロモーター(例えば、カリフラワーモザイクウイルス35Sプロモーター)などのプロモーター、または細胞特異性または誘導性プロモーターに操作可能に連結されてもよい。特定の実施態様では、ポリヌクレオチドは、微小発射物の衝撃によって導入される。特定の実施態様では、この方法はさらに、導入工程後に植物細胞を選別して関心のある遺伝子の発現が改変されているかを決定することを含む。特定の実施態様では、この方法は、植物細胞から植物を再生する工程を含む。さらなる実施態様では、この方法は、遺伝的に所望の植物系統を得るために植物を交配育種することを含む。
上述の方法の特定の実施態様では、耐病性作物は、病害感受性遺伝子または植物防御遺伝子の負の調節因子(例えばMlo遺伝子)をコードする遺伝子の標的変異によって得られる。特定の実施態様では、除草剤耐性の作物は、アセト乳酸合成酵素 (ALS)およびプロトポルフィリノーゲン酸化酵素 (PPO)をコードする遺伝子などの植物遺伝子での特定のヌクレオチドの標的置換によって生成される。特定の実施態様では、この作物は、非生物的ストレス耐性の負の調節因子をコードする遺伝子の標的変異による耐干ばつ性および耐塩性の作物、ワキシー遺伝子の標的変異による低アミロース穀粒、アリューロン層中の主要な脂肪分解酵素遺伝子の標的変異によって酸敗が低減されたイネまたは他の穀粒などである。特定の実施態様では、関心のある形質をコードする内因性遺伝子の例を以下に列記する。
c)関心のある農学的形質を付与するCRISPR-C2c1システムによる内因性遺伝子の調節
また、本明細書で提供のC2c1タンパク質を用いて内因性遺伝子の発現を調節する(すなわち活性化または抑制する)ための方法が本明細書に提供される。この方法では、C2c1複合体によって植物ゲノムに標的化される別のRNA配列を利用する。より具体的には、別のRNA配列は、2つ以上のアダプタータンパク質(例えばアプタマー)に結合し、それにより各アダプタータンパク質は、1つ以上の機能ドメインに会合し、アダプタータンパク質に会合する1つ以上の機能ドメインの内の少なくとも1つは、デアミナーゼ活性、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、DNA組込み活性、RNA切断活性、DNA切断活性、または核酸結合活性を含む1つ以上の活性を有し、この機能ドメインを用いて、所望の形質を獲得するように内因性植物遺伝子の発現を調節する。典型的には、これらの実施態様では、C2c1タンパク質は、少なくとも1つの変異を持たないC2c1タンパク質の活性が5%以下となるように、少なくとも1つの変異を有する。
特定の実施態様では、本明細書に提供の方法は、(a)tracr RNAならびに直接反復および植物細胞に対して内因性である標的配列にハイブリダイズするガイド配列を含むガイドRNAを含むC2c1 CRISPR複合体を、細胞中に導入する工程、および(b)ガイド配列が標的配列にハイブリダイズするときにガイドRNAと複合化するC2c1エフェクター分子を、植物細胞中に導入する工程を含み、ガイドRNAは、機能ドメインに結合する別のRNA配列(アプタマー)結合を含むように改変され、かつ/あるいはC2c1エフェクタータンパク質は、それが機能ドメインに連結されるという形態で改変される。特定の実施態様では、導入工程は、(改変された)C2c1エフェクタータンパク質および(改変された)ガイドRNAをコードする1つ以上のポリヌクレオチドを植物細胞に送達することを含んでもよい。これらの方法で使用するCRISPR-C2c1システムの構成要素の詳細は、本書の他の場所に説明されている。
特定の実施態様では、ポリヌクレオチドは、DNAウイルス(例えばジェミニウイルス)またはRNAウイルス(例えばトブラウイルス)によって細胞中に送達される。特定の実施態様では、導入工程は、C2c1エフェクタータンパク質およびガイドRNAをコードする1つ以上のポリヌクレオチド配列を含むT-DNAを植物細胞に送達することを含み、この送達はアグロバクテリウムを介する。CRISPR-C2c1システムの1つ以上の構成要素をコードする核酸配列は、構成型プロモーター(例えば、カリフラワーモザイクウイルス35Sプロモーター)などのプロモーター、または細胞特異性または誘導性プロモーターに操作可能に連結されてもよい。特定の実施態様では、ポリヌクレオチドは、微小発射物の衝撃によって導入される。特定の実施態様では、この方法はさらに、導入工程後に植物細胞を選別して、関心のある遺伝子の発現が改変されているかを決定することを含む。特定の実施態様では、この方法は、植物細胞から植物を再生する工程を含む。さらなる実施態様では、この方法は、遺伝的に所望の植物系統を獲得するために植物を交配育種することを含む。関心のある形質をコードする内因性遺伝子のより広範な一覧を以下に列記する。
倍数体植物を改変するためのC2c1の使用
多くの植物は倍数体であり、このことは、これら植物はそれらのゲノムの複製物を保有し、時にはコムギのように6倍と多くなることを意味している。C2c1 CRISPRエフェクタータンパク質を利用する本発明による方法は、遺伝子の全ての複製物に影響を及ぼすように、または一度に数十の遺伝子を標的化するように「多重化」することができる。例えば、特定の実施態様では、本発明の方法を用いて、病気に対する防御の抑制の要因となる異なる遺伝子での機能変異の喪失が同時に確実になる。特定の実施態様では、本発明の方法を用いて、コムギ植物がウドンコ病に耐性を持つことを確実にするために、コムギ植物細胞でのTaMLO-A1、TaMLO-B1、およびTaMLO-D1核酸配列の発現を同時に抑制して、その細胞からコムギ植物を再生する(国際特許出願WO2015109752号も参照)。
農学的形質を付与する遺伝子例
上述のように、特定の実施態様では、本発明は、1つ以上の発現可能な植物遺伝子を含む、関心のあるDNAの挿入のための本明細書に説明のCRISPR-C2c1システムの使用を包含する。さらなる特定の実施態様では、本発明は、1つ以上の発現される植物遺伝子の部分的または完全な欠失のために、本明細書に説明のC2c1システムを使用する方法および手段を包含する。他のさらなる特定の実施態様では、本発明は、1つ以上のヌクレオチドの変異、置換、挿入による1つ以上の発現される植物遺伝子の改変を確実にするための本明細書に説明のC2c1システムを使用する方法および手段を包含する。他の特定の実施態様では、本発明は、本明細書に説明のCRISPR-C2c1システムを使用して、前記遺伝子の発現を誘導する1つ以上の調節エレメントの特異的改変によって、1つ以上の発現される植物遺伝子の発現の改変を確実にすることを包含する。
特定の実施態様では、本発明は、以下に列記されるように、外因性遺伝子の導入および/または内因性遺伝子およびそれらの調節エレメントの標的化を含む方法を包含する。
1.有害生物または疾患に対する抵抗性を付与する遺伝子
植物の疾患抵抗性遺伝子。クローン化された抵抗性遺伝子で植物を形質転換して、特定の病原体株に抵抗性をもつ植物を設計することができる。たとえば、Jones et al., Science 266: 789 (1994)(トマト葉かび病菌(Cladosporium fulvum)に対する抵抗性のためのトマトCf-9遺伝子のクローン化);Martin et al., Science 262: 1432 (1993)(トマト斑葉細菌病菌(Pseudomonas syringae pv. tomato)に対する抵抗性のためのトマトPto遺伝子はタンパク質キナーゼをコードする);Mindrinos et al., Cell 78: 1089 (1994)(アラビドプス(Arabidops)は、シュードモナス・シリンゲ(Pseudomonas syringae)に対する抵抗性のためのRSP2遺伝子である可能性がある)を参照のこと。病原体感染中に増加または減少する植物遺伝子を、病原体抵抗性のために遺伝子操作することができる。たとえば、Thomazella et al., bioRxiv 064824; doi: doi.org/10.1101/064824 Epub. July 23, 2016(通常は病原体感染中に増加するSlDMR6-1を欠失したトマト植物)を参照のこと。
ダイズシストセンチュウなどの有害生物に対する抵抗性を付与する遺伝子。たとえば、PCT出願WO96/30517号;PCT出願WO93/19181号を参照のこと。
バチルス・チューリンゲンシス(Bacillus thuringiensis)タンパク質。たとえば、Geiser et al., Gene 48:109 (1986)を参照のこと。
レクチン。たとえば、Van Damme et al., Plant Molec. Biol. 24:25 (1994)を参照のこと。
ビタミン結合タンパク質、たとえばアビジン。PCT出願US93/06487号を参照のこと。同出願は、アビジンおよびアビジン相同体を害虫に対する幼虫駆除剤として使用することを教示している。
酵素阻害剤、たとえば、プロテアーゼもしくはプロテイナーゼ阻害剤またはアミラーゼ阻害剤。たとえば、Abe et al., J. Biol. Chem. 262:16793 (1987)、Huub et al., Plant Molec. Biol. 21:985 (1993)、Sumitani et al., Biosci. Biotech. Biochem. 57:1243 (1993)、および米国特許第5,494,813号を参照のこと。
昆虫特異的ホルモンまたはフェロモン、たとえば、エクジステロイドもしくは幼若ホルモン、それらの多様体、それらに基づく模倣物、またはそれらの拮抗物質もしくは作用物質。たとえば、Hammock et al., Nature 344: 458 (1990)を参照のこと。
発現されると、影響を受けた有害生物の生理機能を破壊する、昆虫特異的ペプチドまたは神経ペプチド。たとえば、Regan, J. Biol. Chem. 269: 9 (1994)、およびPratt et al., Biochem. Biophys. Res. Comm. 163: 1243 (1989)を参照のこと。米国特許第5,266,317号も参照のこと。
ヘビ、スズメバチ、または他の任意の生物によって天然に産生される昆虫特異的毒液。たとえば、Pang et al., Gene 116: 165 (1992)を参照のこと。
殺虫活性を有するモノテルペン、セスキテルペン、ステロイド、ヒドロキサム酸、フェニルプロパノイド誘導体または別の非タンパク質分子の高蓄積に関与する酵素。
生物活性分子の改変(翻訳後修飾を含む)に関与する酵素、たとえば、天然のものであるか合成のものであるかにかかわらず、糖分解酵素、タンパク質分解酵素、脂肪分解酵素、ヌクレアーゼ、シクラーゼ、トランスアミナーゼ、エステラーゼ、ヒドロラーゼ、ホスファターゼ、キナーゼ、ホスホリラーゼ、ポリメラーゼ、エラスターゼ、キチナーゼ、およびグルカナーゼ。PCT出願WO93/02197、Kramer et al., Insect Biochem. Molec. Biol. 23:691 (1993)、およびKawalleck et al., Plant Molec. Biol. 21 :673 (1993)を参照のこと。
シグナル伝達を刺激する分子。たとえば、Botella et al., Plant Molec. Biol. 24:757 (1994)、およびGriess et al., Plant Physiol. 104:1467 (1994)を参照のこと。
ウイルス侵襲性タンパク質またはそれに由来する複合毒素。Beachy et al., Ann. rev. Phytopathol. 28:451 (1990)を参照のこと。
病原体または寄生虫によって天然に産生される発育抑制(developmental-arrestive)タンパク質。Lamb et al., Bio/Technology 10:1436 (1992)、およびToubart et al., Plant J. 2:367 (1992)を参照のこと。
植物によって天然に産生される発育抑制タンパク質。たとえば、Logemann et al., Bio/Technology 10:305 (1992)を参照のこと。
植物では、病原体は宿主に特異的であることが多い。たとえば、一部のフサリウム属(Fusarium)種はトマトの萎れを起こすが、トマトのみを攻撃し、別のフサリウム属種は小麦のみを攻撃する。植物は、ほとんどの病原体に抵抗するために存在し誘導される防御力を持つ。植物の世代にわたる変異および組換え事象は、感受性を引き起こす遺伝的変動をもたらす。というのも、特に病原体が植物よりも頻繁に繁殖するからである。植物では、非宿主抵抗性が存在する(たとえば、宿主と病原体が適合しない)可能性がある。、または、病原体のすべての種族に対する部分的な抵抗性(典型的には多くの遺伝子によって制御される)および/もしくは病原体の一部の種族に対する完全な抵抗性(他の品種に対してはない)が存在する可能性がある。このような抵抗性は、典型的にはわずかな遺伝子によって制御される。CRISPR-C2c1システムの方法および成分を用いて、現在、このことに関して予想される特異的変異を誘導するための新たな手段が存在する。したがって、抵抗性遺伝子の由来源のゲノムを解析することができ、所望の特性または形質を持つ植物で、CRISPR-C2c1システムの方法および成分を用いて抵抗性遺伝子の増加を誘導することができる。本システムは、これまでの変異原性物質よりも正確にそれを行うことができ、したがって、植物の育種計画を加速かつ改善することができる。
2.植物病害に関与する遺伝子
植物病害に関与する遺伝子。植物を、病害に感受性または関連のある遺伝子を改変するCRISPR-C2c1システムで形質転換して、特定の病原体株に抵抗性を持つ植物を設計することができる。たとえば、推定上の糖輸送体をコードする、植物のSWEET遺伝子は、イネ病原性のイネ白葉枯病菌(Xanthomonas oryzae)に由来するTALエフェクターによって誘導され、病原体感染の拡大を促進することが知られている。Streubel et al, New Phytologist, 2013 Nov;200(3):808-19. doi: 10.1111/nph.12411. Epub 2013 Jul 24を参照のこと。柑橘類のCsLOBは、柑橘類の病害、たとえば柑橘類潰瘍病に関与するTALエフェクターによって誘導されることが知られている。
本発明はさらに、植物細胞の目的の遺伝子座を改変する方法を提供する。この方法は、本明細書に記載の遺伝子操作されたCRISPR酵素(たとえば、遺伝子操作されたCasエフェクターモジュール)のいずれか、組成物、または本明細書に記載のシステムもしくはベクターシステムのいずれかに細胞を接触させることを含む、あるいは、細胞は、細胞内に存在する本明細書に記載のCRISPR複合体のいずれかを含む。特定の実施態様では、植物細胞は、A/Tに富むゲノムを含んでいてもよい。実施態様によっては、細胞ゲノムはTに富むプロトスペーサー隣接モチーフ(PAM)を含んでいてもよい。特定の実施態様では、PAMは5'-TTN-3'または5'-ATTN-3'である。特定の実施態様では、改変された遺伝子座は植物病害に関連する。特定の実施態様では、植物病害は病原体感受性に関連する。特定の実施態様では、改変された遺伝子座はSWEET遺伝子座またはCsLOB遺伝子座を含む。特定の実施態様では、植物病害は柑橘類潰瘍病またはイネ枯病である。実施態様によっては、細胞ゲノムはTに富むPAMを含む。特定の実施態様では、PAMは5'-TTN-3'または5'-ATTN-3'である。実施態様によっては、CRISPR-CasシステムはCRISPR-C2c1システムである。実施態様によっては、目的の遺伝子座は、5'末端が突出したねじれ型の切断を導入することによってC2c1エフェクタータンパク質で改変される。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、目的の遺伝子座は、単一のヌクレオチド欠失または変異によって改変される。実施態様によっては、目的の遺伝子座は50ヌクレオチド未満の変異または欠失によって改変される。実施態様によっては、目的の遺伝子座は、CRISPR-C2c1システムによって導入された5'末端が突出したねじれ型切断と相同性指向修復(HDR)とによって改変される。実施態様によっては、目的の遺伝子座は、CRISPR-C2c1システムによって導入された5'末端が突出したねじれ型切断と非相同性末端結合(NHEJ)とによって改変される。実施態様によっては、目的の遺伝子座は、PAMの遠位端にCRISPR-C2c1システムによって導入された5'末端が突出したねじれ型切断によって改変された後、HDRによって修復される。実施態様によっては、目的の遺伝子座は、5'末端の突出にCRISPR-C2c1システムによって導入された外来DNA配列の挿入と、HDRとによって改変される。好ましい実施態様では、目的の遺伝子座は、5'末端の突出にCRISPR-C2c1システムによって導入された外来DNA配列の挿入と、HDRとによって改変される。
植物病害に関与する遺伝子、たとえばWO 2013046247に列挙されている以下のもの。
イネの病害:イネいもち病菌(Magnaporthe grisea)、イネごま葉枯病菌(Cochliobolus miyabeanus)、リゾクトニア・ソラニ(Rhizoctonia solani)、イネばか苗病菌(Gibberella fujikuroi);小麦の病害:うどんこ病菌(Erysiphe graminis)、フサリウム・グラミネアルム(Fusarium graminearum)、F.アベナケウム(F. avenaceum)、F.クルモルム(F. culmorum)、ミクロドキウム・ニバレ(Microdochium nivale)、プッキニア・ストリイフォルミス(Puccinia striiformis)、P.グラミニス(P. graminis)、P.レコンディタ(P. recondita)、ミクロネクトリエラ・ニバレ(Micronectriella nivale)、ガマノホタケ属種(Typhula sp.)、裸黒穂病菌(Ustilago tritici)、ティレティア・カリエス(Tilletia caries)、シュードサーコスポレラ・エルポトリコイデス(Pseudocercosporella herpotrichoides)、コムギ葉枯病菌(Mycosphaerella graminicola)、スタゴノスポラ・ノドルム(Stagonospora nodorum)、ピレノフォラ・トリチシ・レペンティス(Pyrenophora tritici-repentis);大麦の病害:エリシフェ・グラミニス(Erysiphe graminis)、フサリウム・グラミネアルム(Fusarium graminearum)、F.アベナケウム(F. avenaceum)、F.クルモルム(F. culmorum)、ミクロドキウム・ニバレ(Microdochium nivale)、プッキニア・ストリイフォルミス(Puccinia striiformis)、P.グラミニス(P. graminis)、P.オルデイ(P. hordei)、ウスティラゴ・ヌダ(Ustilago nuda)、リンコスポリウム・セカリス(Rhynchosporium secalis)、網斑病菌(Pyrenophora teres)、コクリオボルス・サティブス(Cochliobolus sativus)、斑葉病菌(Pyrenophora graminea)、リゾクトニア・ソラニ;トウモロコシの病害:トウモロコシ黒穂病菌(Ustilago maydis)、トウモロコシごま葉枯病菌(Cochliobolus heterostrophus)、豹紋病菌(Gloeocercospora sorghi)、プッキニア・ポリソラ(Puccinia polysora)、サーコスポラ・ゼアエ・マイディス(Cercospora zeae-maydis)、リゾクトニア・ソラニ;
柑橘類の病害:ディアポルテ・キトリ(Diaporthe citri)、カンキツそうか病菌(Elsinoe fawcetti)、ミドリカビ病菌(Penicillium digitatum)、P.イタリクム(P. italicum)、フィトフトラ・パラシティカ(Phytophthora parasitica)、フィトフトラ・シトロフトラ(Phytophthora citrophthora);リンゴの病害:モニリニア・マリ(Monilinia mali)、リンゴ腐らん病菌(Valsa ceratosperma)、ポドスファエラ・レウコトリカ(Podosphaera leucotricha)、アルテルナリア・アルテルナータ(Alternaria alternata)リンゴ病原型、ベントゥリア・イナエクアリス(Venturia inaequalis)、多犯性炭疽病菌(Colletotrichum acutatum)、フィトフトラ・カクトルム(Phytophthora cactorum);
ナシの病害:ナシ黒星病菌(Venturia nashicola)、V.ピリナ、アルテルナリア・アルテルナータ和ナシ病原型、ジムノスポランギウム・アラエアヌム(Gymnosporangium haraeanum)、フィトフトラ・カクトルム;
モモの病害:灰星病菌(Monilinia fructicola)、黒星病菌(Cladosporium carpophilum)、ホモプシス属(Phomopsis)種;
ブドウの病害:ブドウ黒とう病菌(Elsinoe ampelina)、グロメレラ・シングラタ(Glomerella cingulata)、ブドウうどんこ病菌(Uncinula necator)、ファコプソラ・アンペロプシディス(Phakopsora ampelopsidis)、ブドウ黒腐病菌(Guignardia bidwellii)、ブドウべと病菌(Plasmopara viticola);
カキの病害:グロエスポリウム・カキ(Gloesporium kaki)、サーコスポラ・カキ(Cercospora kaki)、ミコスファエレラ・ナワエ(Mycosphaerella nawae);
ウリの病害:コレトトリクム・ラゲナリウム(Colletotrichum lagenarium)、スファエロテカ・フリギネア(Sphaerotheca fuliginea)、ミコスファエレラ・メロニス(Mycosphaerella melonis)、フサリウム・オキシスポルム(Fusarium oxysporum)、シュードペロノスポラ・クベンシス(Pseudoperonospora cubensis)、フィトフトラ属(Phytophthora)種、ピティウム属(Pythium)種;
トマトの病害:アルテルナリア・ソラニ(Alternaria solani)、トマト葉かび病菌、フィトフトラ・インフェスタンス(Phytophthora infestans);トマト斑葉細菌病菌(Pseudomonas syringae pv. Tomato);フィトフトラ・カプシキ(Phytophthora capsici);キサントモナス属(Xanthomonas);
ナスの病害:ナス褐紋病菌(Phomopsis vexans)、エリシフェ・キコラケアルム(Erysiphe cichoracearum);
アブラナ科野菜の病害:アルテルナリア・ジャポニカ(Alternaria japonica)、サーコスポレラ・ブラッシカエ(Cercosporella brassicae)、プラスモディオフォラ・ブラッシカエ(Plasmodiophora brassicae)、ペロノスポラ・パラシティカ(Peronospora parasitica);
ネギの病害:プッキニア・アリイ(Puccinia allii)、ネギべと病菌(Peronospora destructor);
ダイズの病害:サーコスポラ・キクチイ(Cercospora kikuchii)、エルシノエ・グリシネス(Elsinoe glycines)、ディアポルテ・ファセオロルム変種ソジャエ(Diaporthe phaseolorum var. sojae)、セプトリア・グリシネス(Septoria glycines)、サーコスポラ・ソジナ(Cercospora sojina)、ファコスポラ・パキリジ(Phakopsora pachyrhizi)、フィトフトラ・ソジャエ(Phytophthora sojae)、リゾクトニア・ソラニ、コリネスポラ・カシイコラ(Corynespora casiicola)、スクレロティニア・スクレロティオルム(Sclerotinia sclerotiorum);
インゲンマメの病害:コレトリクム・リンデンティアヌム(Colletrichum lindemthianum);
ピーナツの病害:サーコスポラ・ペルソナタ(Cercospora personata)、サーコスポラ・アラキディコラ(Cercospora arachidicola)、スクレロティウム・ロルフシイ(Sclerotium rolfsii);
エンドウの病害:エリシフェ・ピシ(Erysiphe pisi);
ジャガイモの病害:アルテルナリア・ソラニ(Alternaria solani)、フィトフトラ・インフェスタンス、フィトフトラ・エリスロセプティカ(Phytophthora erythroseptica)、スポンゴスポラ・スブテラネアン(Spongospora subterranean, f. sp. Subterranean);
イチゴの病害:スファエロテカ・ウムリ(Sphaerotheca humuli)、グロメレラ・シングラタ(Glomerella cingulata);
チャの病害:エキソバシディウム・レティクラトゥム(Exobasidium reticulatum)、エルシノエ・レウコスピラ(Elsinoe leucospila)、ペスタロティオプシス属(Pestalotiopsis)種、コレトトリクム・テアエ・シネンシス(Colletotrichum theae-sinensis);
タバコの病害:アルテルナリア・ロンギペス(Alternaria longipes)、エリシフェ・キコラケアルム(Erysiphe cichoracearum)、コレトトリクム・タバクム(Colletotrichum tabacum)、ペロノスポラ・タバキナ(Peronospora tabacina)、フィトフトラ・ニコチアナエ(Phytophthora nicotianae);
ナタネの病害:スクレロティニア・スクレロティオルム(Sclerotinia sclerotiorum)、リゾクトニア・ソラニ;
綿の病害:リゾクトニア・ソラニ;
ビートの病害:サーコスポラ・ベティコラ(Cercospora beticola)、タナテフォルス・ククメリス(Thanatephorus cucumeris)、タナテフォルス・ククメリス(Thanatephorus cucumeris)、アファノミケス・コクリオイデス(Aphanomyces cochlioides);
バラの病害:ディプロカルポン・ロザエ(Diplocarpon rosae)、スファエロテカ・パノサ(Sphaerotheca pannosa)、ペロノスポラ・スパルサ(Peronospora sparsa);
キクおよびキク科の病害:ブレミア・ラクトゥカ(Bremia lactuca)、セプトリア・クロサンテミ・インディシ(Septoria chrysanthemi-indici)、プッキニア・オリアナ(Puccinia horiana);
様々な植物の病害:ピティウム・アファニデルマトゥム(Pythium aphanidermatum)、ピティウム・デバリアヌム(Pythium debarianum)、ピティウム・グラミニコラ(Pythium graminicola)、ピティウム・イレグラレ(Pythium irregulare)、ピティウム・ウルティムム(Pythium ultimum)、ボトリティス・キネレア(Botrytis cinerea)、スクレロティニア・スクレロティオルム(Sclerotinia sclerotiorum);
ダイコンの病害:キャベツ黒すす病菌(Alternaria brassicicola);
シバの病害:スクレロティニア・オメオカルパ(Sclerotinia homeocarpa)、リゾクトニア・ソラニ;
バナナの病害:ミコスファエレラ・フィジエンシス(Mycosphaerella fijiensis)、ミコスファエレラ・ムジコラ(Mycosphaerella musicola);
ヒマワリの病害:プラスモパラ・アルステディイ(Plasmopara halstedii);
アスペルギルス属(Aspergillus)種、アオカビ属(Penicillium)種、フサリウム属種、ジベレラ属(Gibberella)種、トリコデルマ属(Tricoderma)種、ティエラビオプシス属(Thielaviopsis)種、クモノスカビ属(Rhizopus)種、ケカビ属(Mucor)種、コルティシウム属(Corticium)種、ロマ属(Rhoma)種、リゾクトニア属(Rhizoctonia)種、ディプロディア属(Diplodia)種などによって引き起こされる、様々な植物の種子の病害または成長初期の病害;
ポリミキサ属(Polymixa)種、オルピディウム属(Olpidium)種などによって媒介される、様々な植物のウイルス病害。
3.除草剤に対する抵抗性を付与する遺伝子の例:
成長点すなわち分裂組織を阻害する除草剤、たとえばイミダゾリノンまたはスルホニル尿素に対する抵抗性(たとえば、それぞれLee et al., EMBO J. 7:1241 (1988)、およびMiki et al., Theor. Appl. Genet. 80:449 (1990)による)。
グリホサート抵抗性(たとえば、変異型5-エノールピルビルシキミ酸-3-リン酸シンターゼ(EPSP)遺伝子、aroA遺伝子、およびグリホサートアセチルトランスフェラーゼ(GAT)遺伝子によってそれぞれ付与される抵抗性)、または他のホスホノ化合物に対する抵抗性、たとえばグルホシナートに対する抵抗性(ストレプトミセス・ヒグロスコピクス(Streptomyces hygroscopicus)、ストレプトミセス・ビリディクロモゲネス(Streptomyces viridichromogenes)などのストレプトミセス属(Streptomyces)種由来のホスフィノトリシンアセチルトランスフェラーゼ(PAT)遺伝子による)、ならびにピリジノキシもしくはフェノキシプロピオン酸およびシクロヘキソンへの抵抗性(ACCアーゼ阻害剤コード遺伝子による)。たとえば、米国特許第4,940,835号および米国特許第6,248,876号、米国特許第4,769,061号、EP 0 333 033、ならびに米国特許第4,975,374号を参照のこと。EP 0242246、DeGreef et al., Bio/Technology 7:61 (1989)、Marshall et al., Theor. Appl. Genet. 83:435 (1992)、WO 2005012515(Castleら)、およびWO 2005107437も参照のこと。
光合成を阻害する除草剤、たとえばトリアジンに対する抵抗性(psbAおよびgs+遺伝子)またはベンゾニトリルに対する抵抗性(ニトリラーゼ遺伝子)、およびグルタチオンSトランスフェラーゼ(Przibila et al., Plant Cell 3:169 (1991)、米国特許第4,810,648号、およびHayes et al., Biochem. J. 285: 173 (1992))。
除草剤を解毒する酵素、または阻害抵抗性を持つ変異型グルタミンシンターゼ酵素をコードする遺伝子(たとえば、米国特許出願第11/760,602号)。あるいは、解毒酵素はホスフィノトリシンアセチルトランスフェラーゼ(ストレプトミセス属種由来のbarまたはpatタンパク質など)をコードする酵素である。ホスフィノトリシンアセチルトランスフェラーゼは、たとえば米国特許第5,561,236号、第5,648,477号、第5,646,024号、第5,273,894号、第5,637,489号、第5,276,268号、第5,739,082号、第5,908,810号、および第7,112,665号に記載されている。
ヒドロキシフェニルピルビン酸ジオキシゲナーゼ(HPPD)阻害剤、すなわち天然のHPPD抵抗性酵素、または変異もしくはキメラHPPD酵素をコードする遺伝子(WO 96/38567、WO 99/24585、およびWO 99/24586、WO 2009/144079、WO 2002/046387、または米国特許第6,768,044号に記載)。
4.非生物的ストレス抵抗性に関与する遺伝子の例:
植物細胞または植物におけるポリ(ADP-リボース)ポリメラーゼ(PARP)遺伝子の発現および/または活性を低下させることができる導入遺伝子(WO 00/04173またはWO/2006/045633に記載)。
植物または植物細胞のPARGコード遺伝子の発現および/または活性を低下させることができる導入遺伝子(たとえばWO 2004/090140に記載)。
ニコチンアミドアデニンジヌクレオチド再合成経路の植物機能性酵素、たとえばニコチンアミダーゼ、ニコチン酸ホスホリボシルトランスフェラーゼ、ニコチン酸モノヌクレオチドアデニルトランスフェラーゼ、ニコチンアミドアデニンジヌクレオチドシンテターゼまたはニコチンアミドホスホリボシルトランスフェラーゼなどをコードする導入遺伝子(たとえば、EP 04077624.7、WO 2006/133827、PCT/EP07/002,433、EP 1999263、またはWO 2007/107326に記載)。
炭水化物生合成に関与する酵素としては、たとえば以下の文献:EP 0571427、WO 95/04826、EP 0719338、WO 96/15248、WO 96/19581、WO 96/27674、WO 97/11188、WO 97/26362、WO 97/32985、WO 97/42328、WO 97/44472、WO 97/45545、WO 98/27212、WO 98/40503、WO99/58688、WO 99/58690、WO 99/58654、WO 00/08184、WO 00/08185、WO 00/08175、WO 00/28052、WO 00/77229、WO 01/12782、WO 01/12826、WO 02/101059、WO 03/071860、WO 2004/056999、WO 2005/030942、WO 2005/030941、WO 2005/095632、WO 2005/095617、WO 2005/095619、WO 2005/095618、WO 2005/123927、WO 2006/018319、WO 2006/103107、WO 2006/108702、WO 2007/009823、WO 00/22140、WO 2006/063862、WO 2006/072603、WO 02/034923、EP 06090134.5、EP 06090228.5、EP 06090227.7、EP 07090007.1、EP 07090009.7、WO 01/14569、WO 02/79410、WO 03/33540、WO 2004/078983、WO 01/19975、WO 95/26407、WO 96/34968、WO 98/20145、WO 99/12950、WO 99/66050、WO 99/53072、米国特許第6,734,341号、WO 00/11192、WO 98/22604、WO 98/32326、WO 01/98509、WO 01/98509、WO 2005/002359、米国特許第5,824,790号、米国特許第6,013,861号、WO 94/04693、WO 94/09144、WO 94/11520、WO 95/35026もしくはWO 97/20936に記載の酵素、または、ポリフルクトース(特にイヌリンおよびレバン型のもの)の産生に関与する酵素(EP 0663956、WO 96/01904、WO 96/21023、WO 98/39460およびWO 99/24593に開示)、α-1,4-グルカンの産生に関与する酵素(WO 95/31553、US 2002031826、米国特許第6,284,479号、米国特許第5,712,107号、WO 97/47806、WO 97/47807、WO 97/47808、およびWO 00/14249に開示)、α-1,6分岐α-1,4-グルカンの産生に関与する酵素(WO 00/73422に開示)、アルテルナンの産生に関与する酵素(たとえばWO 00/47727、WO 00/73422、EP 06077301.7、米国特許第5,908,975号およびEP 0728213に開示)、ヒアルロナンの産生に関与する酵素(たとえばWO 2006/032538、WO 2007/039314、WO 2007/039315、WO 2007/039316、JP 2006304779、およびWO 2005/012529に開示)が挙げられる。
耐乾燥性を改善する遺伝子。たとえば、WO 2013122472には、機能性ユビキチン・タンパク質リガーゼタンパク質(UPL)(より詳細にはUPL3)が存在しない、または量が減少すると、その植物の水の必要性が低下する、または耐乾燥性が改善することが開示されている。耐乾燥性の向上した遺伝子組換え植物の他の例は、たとえばUS 2009/0144850、US 2007/0266453、およびWO 2002/083911に開示されている。US 2009/0144850には、DR02核酸の発現の変化により耐乾燥性表現型を示す植物について記載されている。US 2007/0266453には、DR03核酸の発現の変化により耐乾燥性表現型を示す植物について記載されており、WO 2002/083911には、孔辺細胞で発現するABC輸送体の活性の低下により乾燥ストレスに対する抵抗性の向上した植物について記載されている。別の例は、Kasugaと共同著者による研究(1999年)であり、彼らは、遺伝子組換え植物におけるDREB1 AをコードするcDNAの過剰発現によって通常の成長条件で多くのストレス抵抗性遺伝子の発現が活性化し、その結果、乾燥、塩分負荷、および凍結に対する抵抗性が改善したことを記載している。しかし、DREB1Aの発現により、通常の成長条件で深刻な成長の遅れも起こった(Kasuga (1999) Nat Biotechnol 17(3) 287-291)。
さらなる特定の実施態様では、特定の植物形質に影響を及ぼすことによって農作物を改良することができる。これは、たとえば、農薬抵抗性植物の開発、植物の耐病性の改善、植物の昆虫および線虫抵抗性の改善、植物の寄生雑草に対する抵抗性の改善、植物の耐乾燥性の改善、植物の栄養価の改善、植物のストレス抵抗性の改善、自家受粉の回避、植物飼料の消化率、バイオマス、穀物収量などの改善による。特定の非限定的な例を以下にいくつか示す。
単一の遺伝子の標的変異に加えて、C2c1 CRISPR複合体を設計して、植物の複数の遺伝子の標的変異、染色体断片の欠失、導入遺伝子の部位特異的な組込み、in vivoでの部位特異的な変異誘発、および正確な遺伝子置換もしくは対立遺伝子交換を可能にすることができる。したがって、本明細書に記載の方法は、遺伝子の発見および検証、変異による育種およびシスジェネシス(=同種または近縁種の遺伝子を導入すること)による育種、ならびに雑種育種において広範な用途を持つ。これらの用途は、様々な改善された農学的形質(除草剤抵抗性、耐病性、非生物的ストレス抵抗性、高収量、および優れた品質など)を持つ新世代の遺伝子改変作物の生産を促進する。
雄性不稔性植物を作るためのC2c1遺伝子の使用
雑種植物は、典型的には、近交系植物と比較して有利な農学的形質を持つ。ただし、自家受粉植物の場合、雑種の作成は困難である可能性がある。様々な植物の種類で、植物の稔性、特に雄性稔性に重要な遺伝子が特定されている。たとえば、トウモロコシでは、稔性に重要な少なくとも2つの遺伝子が特定されている(Amitabh Mohanty International Conference on New Plant Breeding Molecular Technologies Technology Development And Regulation, Oct 9-10, 2014, Jaipur, India; Svitashev et al. Plant Physiol. 2015 Oct;169(2):931-45; Djukanovic et al. Plant J. 2013 Dec;76(5):888-99)。本明細書で提供する方法を用いて雄性稔性に必要な遺伝子を標的とし、雑種の生成のために容易に交雑可能な雄性稔性植物を生成することができる。特定の実施態様では、本明細書で提示するCRISPR-C2c1システムをチトクロムP450様遺伝子(MS26)またはメガヌクレアーゼ遺伝子(MS45)の標的変異誘発のために用いることによりトウモロコシ植物に雄性稔性を付与する。このように遺伝子改変されたトウモロコシ植物を雑種育種計画に用いることができる。
植物の稔性期の延長
特定の実施態様では、本明細書で提示する方法を用いて植物(イネ植物など)の稔性期を延長する。たとえば、遺伝子に変異を起こすためにイネの稔性期遺伝子(Ehd3など)を標的にすることができ、再生植物の延長された稔性期について未発育の植物を選択することができる(CN 104004782に記載)。
目的の作物で遺伝的多様性を起こすためのC2c1の使用
農作物の野生の生殖質と遺伝的変種の利用可能性は農作物改良計画の鍵であるが、農作物由来の生殖質の利用可能な多様性は限られている。本発明は、目的の生殖質の多様な遺伝的変種を生成する方法を包含する。CRISPR-C2c1システムのこの用途では、植物ゲノムの様々な位置を標的とするガイドRNAのライブラリーが提供され、これをC2c1エフェクタータンパク質と共に植物細胞に導入する。このようにして、ゲノム規模の点変異および遺伝子欠損の一群を生成することができる。特定の実施態様では、方法は、そのようにして得た細胞から植物部分または植物を生成し、目的の形質について細胞を選別することを含む。標的遺伝子は、翻訳領域と非翻訳領域の両方を含み得る。特定の実施態様では、形質はストレス抵抗性であり、方法はストレス抵抗性の作物変種を生成するための方法である。
果実の熟成に影響を及ぼすためのC2c1の使用
熟成は果物および野菜の成熟過程の通常の段階である。熟成開始後、わずか数日で果物または野菜は食べられなくなる。この過程は、農家と消費者の両方に重大な損失をもたらす。特定の実施態様では、本発明の方法は、エチレン産生を減らすのに用いられる。これは、以下のうちの1つ以上を確実にすることによって保証される。a.ACCシンターゼ遺伝子の発現の抑制。ACC(1-アミノシクロプロパン-1-カルボン酸)シンターゼは、S-アデノシルメチオニン(SAM)のACCへの変換(エチレン生合成の最後から2番目の工程)に関与する酵素である。シンターゼ遺伝子のアンチセンス(「鏡像」)または切断型コピーを植物ゲノムに挿入すると、酵素の発現が妨げられる。b.ACCデアミナーゼ遺伝子の挿入。この酵素をコードする遺伝子は一般的な非病原性の土壌細菌であるシュードモナス・クロロラフィス(Pseudomonas chlororaphis)から得られる。これは、ACCを別の化合物に変換することで、エチレン産生に利用できるACCの量を減らす。c.SAMヒドロラーゼ遺伝子の挿入。この手法はACCデアミナーゼと似ており、前駆体代謝物の量が減るとエチレン産生が妨げられるが、この場合、SAMはホモセリンに変換される。この酵素をコードする遺伝子は大腸菌(E. coli)T3バクテリオファージから得られる。d.ACCオキシダーゼ遺伝子発現の抑制。ACCオキシダーゼは、ACCのエチレンへの酸化(エチレン生合成経路の最後の工程)を触媒する酵素である。本明細書に記載の方法を用いると、ACCオキシダーゼ遺伝子の発現減少によってエチレン産生が抑制され、それによって果実の熟成が遅れる。特定の実施態様では、上記の改変に加えて、またはそれらに代えて、本明細書に記載の方法を用いてエチレン受容体を改変して、果実が得るエチレンシグナルを妨害する。特定の実施態様では、エチレン結合タンパク質をコードするETR1遺伝子の発現を改変、より詳細には抑制する。特定の実施態様では、上記の改変に加えて、またはそれらに代えて、本明細書に記載の方法を用いて、植物の細胞壁の完全性を維持する物質であるペクチンの分解に関与する酵素、ポリガラクツロナーゼ(PG)をコードする遺伝子の発現を改変する。ペクチン分解は熟成過程の開始時に起こり、果実の軟化につながる。したがって、特定の実施態様では、本明細書に記載の方法を用いて、産生されるPG酵素の量を減らすことでペクチン分解を遅らせるために、PG遺伝子に変異を導入またはPG遺伝子の活性化を抑制する。
したがって、特定の実施態様では、方法は、上記のような植物細胞のゲノムの1つ以上の改変を確実にし、そこから植物を再生するためのCRISPR-C2c1システムの使用を包含する。特定の実施態様では、植物はトマト植物である。
植物の貯蔵寿命の延長
特定の実施態様では、本発明の方法は、植物全体または植物の部分の貯蔵寿命に影響を及ぼす化合物の産生に関与する遺伝子を改変するのに用いられる。より詳細には、改変は、ジャガイモ塊茎に還元糖が蓄積するのを防ぐ遺伝子の改変である。高温処理の際、これらの還元糖は遊離アミノ酸と反応し、褐色で苦味のある生成物を発生し、(発がん物質である可能性がある)アクリルアミド量を増加させる。特定の実施態様では、本明細書で提示する方法は、ショ糖をグルコースとフルクトースに分解するタンパク質をコードする液胞型インベルターゼ遺伝子(VInv)の発現を減少または阻害する(Clasen et al. DOI: 10.1111/pbi.12370)ために使用される。
付加価値のある形質を保証するためのCRISPR-C2c1システムの使用
特定の実施態様では、CRISPR-C2c1システムは、栄養改善された農作物を作るのに用いられる。特定の実施態様では、本明細書で提供する方法は、「機能性食品」(すなわち、それが含む従来の栄養素を超える健康上の利益を提供し得る改良された食品もしくは食品成分)、および/または「栄養補助食品」(すなわち、食品もしくは食品の一部と見なすことができる物質)を作るのに適しており、疾患の予防および治療などの健康上の利益を提供する。特定の実施態様では、栄養補助食品は、がん、糖尿病、循環器疾患、高血圧のうちの1つ以上を予防および/または治療するのに有用である。
栄養改善された作物の例としては、以下が挙げられる(Newell-McGloughlin, Plant Physiology, July 2008, Vol. 147, pp. 939-953):
タンパク質の質、含有量、および/またはアミノ酸組成の改良(たとえば、バヒアグラス(Luciani et al. 2005, Florida Genetics Conference Poster)、キャノーラ(Roesler et al., 1997, Plant Physiol 113 75-81)、トウモロコシ(Cromwell et al, 1967, 1969 J Anim Sci 26 1325-1331, O'Quin et al. 2000 J Anim Sci 78 2144-2149, Yang et al. 2002, Transgenic Res 11 11-20, Young et al. 2004, Plant J 38 910-922)、ジャガイモ(Yu J and Ao, 1997 Acta Bot Sin 39 329-334; Chakraborty et al. 2000, Proc Natl Acad Sci USA 97 3724-3729; Li et al. 2001, Chin Sci Bull 46 482-484)、イネ(Katsube et al. 1999, Plant Physiol 120 1063-1074)、ダイズ(Dinkins et al. 2001, Rapp 2002, In Vitro Cell Dev Biol Plant 37 742-747)、サツマイモ(Egnin and Prakash 1997, In Vitro Cell Dev Biol 33 52A)について記載されている);
必須アミノ酸含有量(たとえば、キャノーラ(Falco et al. 1995, Bio/Technology 13 577-582)、ルピナス(White et al. 2001, J Sci Food Agric 81 147-154)、トウモロコシ(Lai and Messing, 2002, Agbios 2008 GM crop database (March 11, 2008))、ジャガイモ(Zeh et al. 2001, Plant Physiol 127 792-802)、モロコシ(Zhao et al. 2003, Kluwer Academic Publishers, Dordrecht, The Netherlands, pp 413-416)、ダイズ(Falco et al. 1995 Bio/Technology 13 577-582; Galili et al. 2002 Crit Rev Plant Sci 21 167-204)について記載されている);
油および脂肪酸(たとえば、キャノーラ(Dehesh et al. (1996) Plant J 9 167-172 [PubMed] ; Del Vecchio (1996)INFORM International News on Fats, Oils and Related Materials 7 230-243; Roesler et al. (1997) Plant Physiol 113 75-81 [PMC無料文献] [PubMed]; Froman and Ursin (2002, 2003) Abstracts of Papers of the American Chemical Society 223 U35; James et al. (2003) Am J Clin Nutr 77 1140-1145 [PubMed]; Agbios (2008、上記))、綿(Chapman et al. (2001). J Am Oil Chem Soc 78 941-947; Liu et al. (2002) J Am Coll Nutr 21 205S-211S [PubMed]; O'Neill (2007) Australian Life Scientist. www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2 (June 17, 2008))、アマニ(Abbadi et al., 2004, Plant Cell 16: 2734-2748)、トウモロコシ(Young et al., 2004, Plant J 38 910-922)、油ヤシ(Jalani et al. 1997, J Am Oil Chem Soc 74 1451-1455; Parveez, 2003, AgBiotechNet 113 1-8)、イネ(Anai et al., 2003, Plant Cell Rep 21 988-992)、ダイズ(Reddy and Thomas, 1996, Nat Biotechnol 14 639-642; Kinney and Kwolton, 1998, Blackie Academic and Professional, London, pp 193-213)、ヒマワリ(Arcadia, Biosciences 2008)について記載されている);
炭水化物、たとえば、フルクタン(チコリー(Smeekens (1997) Trends Plant Sci 2 286-287, Sprenger et al. (1997) FEBS Lett 400 355-358, Sevenier et al. (1998) Nat Biotechnol 16 843-846)、トウモロコシ(Caimi et al. (1996) Plant Physiol 110 355-363)、ジャガイモ(Hellwege et al. ,1997 Plant J 12 1057-1065)、テンサイ(Smeekens et al. 1997 (上記))について記載されている)、イヌリン(ジャガイモ(Hellewege et al. 2000, Proc Natl Acad Sci USA 97 8699-8704)について記載されている)、デンプン(イネ(Schwall et al. (2000) Nat Biotechnol 18 551-554, Chiang et al. (2005) Mol Breed 15 125-143)について記載されている);
ビタミンおよびカロテノイド(たとえば、キャノーラ(ShintaniとDellaPenna (1998) Science 282 2098-2100)、トウモロコシ(Rocheford et al. (2002) . J Am Coll Nutr 21 191S-198S, Cahoon et al. (2003) Nat Biotechnol 21 1082-1087, Chen et al. (2003) Proc Natl Acad Sci USA 100 3525-3530)、カラシの種子(Shewmaker et al. (1999) Plant J 20 401-412)、ジャガイモ(Ducreux et al., 2005, J Exp Bot 56 81-89)、イネ(Ye et al. (2000)Science 287 303-305)、イチゴ(Agius et al. (2003), Nat Biotechnol 21 177-181)、トマト(Rosati et al. (2000) Plant J 24 413-419, Fraser et al. (2001) J Sci Food Agric 81 822-827, Mehta et al. (2002) Nat Biotechnol 20 613-618, Diaz de la Garza et al. (2004) Proc Natl Acad Sci USA 101 13720-13725, Enfissi et al. (2005) Plant Biotechnol J 3 17-27, DellaPenna (2007) Proc Natl Acad Sci USA 104 3675-3676)について記載されている);
機能性二次代謝物(たとえば、リンゴ(スチルベン、Szankowski et al. (2003) Plant Cell Rep 22: 141-149)、アルファルファ(レスベラトロール、Hipskind and Paiva (2000) Mol Plant Microbe Interact 13 551-562)、キウイフルーツ(レスベラトロール、Kobayashi et al. (2000) Plant Cell Rep 19 904-910)、トウモロコシおよびダイズ(フラボノイド、Yu et al. (2000) Plant Physiol 124 781-794)、ジャガイモ(アントシアニンおよびアルカロイド配糖体、Lukaszewicz et al. (2004) J Agric Food Chem 52 1526-1533)、イネ(フラボノイドおよびレスベラトロール、Stark-Lorenzen et al. (1997) Plant Cell Rep 16 668-673, Shin et al. (2006) Plant Biotechnol J 4 303-315)、トマト(+レスベラトロール、クロロゲン酸、フラボノイド、スチルベン、Rosati et al. (2000) (上記), Muir et al. (2001) Nature 19 470-474, Niggeweg et al. (2004) Nat Biotechnol 22 746-754, Giovinazzo et al. (2005) Plant Biotechnol J 3 57-69)、コムギ(カフェ酸およびフェルラ酸、レスベラトロール、United Press International (2002))について記載されている);ならびに
ミネラル利用性(たとえば、アルファルファ(フィターゼ、Austin-Phillips et al. (1999) www.molecularfarming.com/nonmedical.html)、レタス(鉄分、Goto et al. (2000)Theor Appl Genet 100 658-664)、イネ(鉄分、Lucca et al. (2002) J Am Coll Nutr 21 184S-190S)、トウモロコシ、ダイズ、およびコムギ(フィターゼ、Drakakaki et al. (2005) Plant Mol Biol 59 869-880, Denbow et al. (1998) Poult Sci 77 878-881, Brinch-Pedersen et al. (2000) Mol Breed 6 195-206)について記載されている)。
特定の実施態様では、付加価値のある形質は、植物に含まれる化合物の予想される健康上の利益に関連する。たとえば、特定の実施態様では、付加価値のある作物を、本発明の方法を利用して以下のうちの1種以上の化合物の改変を保証する、またはその合成を誘導/増進することによって得る。
カロテノイド、たとえばニンジンに含まれるα-カロテン(細胞に損傷を起こす可能性のある遊離基(フリーラジカル)を中和する)、または様々な果物や野菜に含まれるβ-カロテン(遊離基を中和する)。
緑色野菜に含まれるルテイン(健常な視力の維持に関与する)。
トマトやトマト製品に含まれるリコピン(前立腺がんのリスクを下げると考えられている)。
柑橘類やトウモロコシに含まれるゼアキサンチン(健常な視力の維持に関与する)。
食物繊維、たとえばコムギ糠に含まれる不溶性繊維(乳がんおよび/または大腸がんのリスクを下げる可能性がある)、カラスムギに含まれるβ-グルカン、サイリウムおよび全穀粒に含まれる可溶性繊維(循環器疾患(CVD)のリスクを下げる可能性がある)など。
脂肪酸、たとえばω3脂肪酸(CVDのリスクを下げ、精神機能および視覚機能を改善する可能性がある)、共役リノール酸(体組成を改善する可能性があり、特定のがんのリスクを下げる可能性がある)、ならびにγ-リノレン酸(GLA)(がんおよびCVDの炎症リスクを下げる可能性があり、体組成を改善する可能性がある)。
フラボノイド、たとえばコムギに含まれるヒドロキシケイ皮酸エステル(抗酸化のような作用を持ち、変性疾患のリスクを下げる可能性がある)、果物や野菜に含まれるフラボノール、カテキン、およびタンニン(遊離基を中和し、がんのリスクを下げる可能性がある)。
グルコシノラート、インドール、イソチオシアナート、たとえば、アブラナ科の野菜(ブロッコリー、ケール)やセイヨウワサビに含まれるスルフォラファン(遊離基を中和し、がんのリスクを下げる可能性がある)。
フェノール類、たとえばブドウに含まれるスチルベン(変性疾患、心疾患、およびがんのリスクを下げる可能性があり、寿命延長作用を持つ可能性がある)、野菜および柑橘類に含まれるカフェ酸およびフェルラ酸(抗酸化のような活性を持ち、変性疾患、心疾患、および眼疾患のリスクを下げる可能性がある)、カカオに含まれるエピカテキン(抗酸化のような活性を持ち、変性疾患および心疾患のリスクを下げる可能性がある)。
トウモロコシ、ダイズ、コムギ、木の油に含まれる植物性スタノール/ステロール(血中コレステロール値を下げることで冠状動脈性心疾患のリスクを下げる減らす可能性がある)
キクイモ、エシャロット、玉ねぎ粉末に含まれるフルクタン、イヌリン、フラクトオリゴ糖(胃腸の健康を増進する可能性がある)。
ダイズに含まれるサポニン(LDLコレステロールを低下させる可能性がある)。
ダイズに含まれるダイズタンパク質(心疾患のリスクを下げる可能性がある)。
植物エストロゲン、たとえばダイズに含まれるイソフラボン(ほてりなどの閉経期の症状を軽減する可能性があり、骨粗鬆症およびCVDを低減する可能性がある)、アマ、ライムギ、および野菜に含まれるリグナン(心疾患およびいくつかのがんから防御する可能性があり、LDLコレステロール、総コレステロールを下げる可能性がある)。
硫化物およびチオール、たとえばタマネギ、ニンニク、オリーブ、リーキ、および春タマネギに含まれる硫化ジアリル、ならびに三硫化アリルメチル、アブラナ科の野菜に含まれるジチオールチオン(LDLコレステロールを下げる可能性があり、健常な免疫系を維持するのに役立つ)。
タンニン、たとえばクランベリー、ココアに含まれるプロアントシアニジン(泌尿器の健康を改善する可能性があり、CVDおよび高血圧のリスクを下げる可能性がある)。
また、本発明の方法はさらに、タンパク質/デンプンの機能性、保存可能期間、味/美観、繊維品質、ならびにアレルギー誘発物質、反栄養素、および毒素低減形質を改変することを構想している。
したがって、本発明は、栄養面で付加価値を持つ植物を生産する方法を包含する。前記方法は、本明細書に記載のCRISPR-C2c1システムを用いて、付加栄養価値の成分の産生に関与する酵素をコードする遺伝子を植物細胞に導入することと、前記植物細胞から植物を再生することを含み、前記植物は、前記付加栄養価値の成分の発現の増加を特徴とする。特定の実施態様では、CRISPR-C2c1システムを用いて、これらの化合物の内因的合成を(たとえば、この化合物の代謝を制御する1つ以上の転写因子を改変することによって)間接的に改変する。目的の遺伝子を植物細胞に導入し、かつ/またはCRISPR-C2c1システムを用いて内在性遺伝子を改変する方法は、本明細書で前述したとおりである。
付加価値形質を付与するために改変された植物における改変のいくつかの特定の例は、たとえば、ステアリル-ACPデサチュラーゼのアンチセンス遺伝子で植物を形質転換して植物のステアリン酸含有量を増加させることで脂肪酸代謝を改変した植物である。Knultzon et al., Proc. Natl. Acad. Sci. U.S.A. 89:2624 (1992)を参照のこと。別の例としては、たとえば少量のフィチン酸を特徴とするトウモロコシ変異体の原因である可能性のある単一の対立遺伝子と会合したDNAをクローン化した後に再導入することでフィチン酸含有量を減少させることが挙げられる。Raboy et al, Maydica 35:383 (1990)を参照のこと。
同様に、トウモロコシ(Zea mays) Tfs C1およびR(強力なプロモーターの制御下でトウモロコシのアリューロン層のフラボノイド産生を調節する)の発現によって、シロイヌナズナ(Arabidopsis、Arabidopsis thaliana)のアントシアニン蓄積率が増加した。これは、おそらく経路全体の活性化による(Bruce et al., 2000, Plant Cell 12:65-80)。DellaPenna (Welsch et al., 2007 Annu Rev Plant Biol 57: 711-738)は、Tf RAP2.2とその相互作用パートナーであるSINAT2がシロイヌナズナの葉のカロテノイド生成を増進することを発見した。Tf Dof1の発現によって、遺伝子組換えシロイヌナズナの炭素骨格形成のための酵素をコードする遺伝子の発現上昇、アミノ酸含有量の著しい増加、およびGlc量の減少が誘導され(Yanagisawa, 2004Plant Cell Physiol 45: 386-391)、DOF Tf AtDof1.1 (OBP2)によって、シロイヌナズナのグルコシノラート生合成経路の全過程が増加した(Skirycz et al., 2006 Plant J 47: 10-24)。
植物のアレルギー誘発物質の低減
特定の実施態様では、本明細書で提供する方法は、アレルギー誘発物質の量を低減した植物を作り、植物を消費者にとってより安全にするために用いられる。特定の実施態様では、この方法は、植物アレルギー誘発物質の産生に関与する1つ以上の遺伝子の発現を改変することを含む。たとえば、特定の実施態様では、方法は、CRISPR-C2c1システムを送達して植物細胞(たとえばドクムギ植物細胞)でのLol p5遺伝子の発現を減少させることと、その細胞から植物を再生して前記植物の花粉のアレルギー誘発性を低減することを含む(Bhalla et al. 1999, Proc. Natl. Acad. Sci. USA Vol. 96: 11676-11680)。特定の実施態様では、CRISPR-C2c1システムは、1つ以上のねじれ型二本鎖切断(DSB)をLol p5遺伝子に導入する。他の特定の実施態様では、CRISPR-C2c1システムは、Lol p5遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは、Lol p5遺伝子に単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、Lol p5遺伝子の転写物に単一のヌクレオチド改変を導入する。
ピーナッツアレルギーおよびマメ科植物アレルギーは一般に、現実の深刻な健康上の懸念事項である。本発明のC2c1エフェクタータンパク質システムを用いて、このようなマメ科植物のアレルギー誘発タンパク質をコードする遺伝子を特定した後、それを編集または抑制することができる。このような遺伝子およびタンパク質に限定することなく、Nicolaouらはピーナッツ、ダイズ、レンズマメ、エンドウマメ、ルピナス、サヤマメ、およびリョクトウでアレルギー誘発タンパク質を特定している。Nicolaou et al., Current Opinion in Allergy and Clinical Immunology 2011;11(3):222を参照のこと。
目的の内在性遺伝子の選別方法
本明細書で提供する方法によってさらに、種、門、および植物界全体で、付加栄養価値の成分の産生に関与する酵素をコードする有用な遺伝子、または一般に目的の農学的形質に影響を及ぼす遺伝子を特定することができる。たとえば、本明細書に記載のCRISPR-C2c1システムを使用して植物の代謝経路の酵素をコードする遺伝子を選択的に標的化することにより、植物の特定の栄養面に関与する遺伝子を特定することができる。同様に、望ましい農学的形質に影響を及ぼす可能性のある遺伝子を選択的に標的化することにより、関連する遺伝子を特定することができる。したがって、本発明は、特定の栄養的価値および/または農学的形質を持つ化合物の産生に関与する酵素をコードする遺伝子の選別方法を包含する。
バイオ燃料におけるCRISPR-C2c1システムの使用
本明細書で使用する「バイオ燃料」という用語は、植物および植物由来の資源から作られた代替燃料である。再生可能なバイオ燃料を、炭素固定の過程によってエネルギーを得た有機物から抽出する、またはバイオマスの使用もしくは変換によって生成することができる。このバイオマスをバイオ燃料に直接使用することもできるし、熱変換、化学変換、および生化学的変換によって好都合なエネルギー含有物質に変換することもできる。このバイオマス変換によって固体、液体、または気体の形態の燃料を得ることができる。バイオ燃料には、バイオエタノールとバイオディーゼルの2種類がある。バイオエタノールは、多くの場合トウモロコシやサトウキビに由来するセルロース(デンプン)の糖発酵過程によって主に生産される。一方、バイオディーゼルはナタネ、ヤシ、ダイズなどの油料作物から主に生産される。バイオ燃料は主に輸送に使用される。
バイオ燃料生産用植物の特性の向上
特定の実施態様では、本明細書に記載のCRISPR-C2c1システムを用いる方法は、発酵される糖をより効率的に放出するのに重要な加水分解物質を到達しやすくするために、細胞壁の特性を変更するのに用いられる。特定の実施態様では、セルロースおよび/またはリグニンの生合成を改変する。セルロースは細胞壁の主成分である。セルロースとリグニンの生合成は同時調節されている。植物中のリグニンの割合を減らすことにより、セルロースの割合を増やすことができる。特定の実施態様では、本明細書に記載の方法は、植物のリグニン生合成を減少させて、発酵性炭水化物を増加させるために用いられる。より詳細には、本明細書に記載の方法は、4-クマル酸-3-ヒドロキシラーゼ(C3H)、フェニルアラニンアンモニアリアーゼ(PAL)、ケイヒ酸-4-ヒドロキシラーゼ(C4H)、ヒドロキシシンナモイルトランスフェラーゼ(HCT)、カフェ酸-O-メチルトランスフェラーゼ(COMT)、カフェオイル補酵素(Co)A3-O-メチルトランスフェラーゼ(CCoAOMT)、フェルラ酸-5-ヒドロキシラーゼ(F5H)、シンナミルアルコールデヒドロゲナーゼ(CAD)、シンナモイルCoA-レダクターゼ(CCR)、4-クマル酸-CoAリガーゼ(4CL)、モノリグノール-リグニン特異的グリコシルトランスフェラーゼ、およびアルデヒドデヒドロゲナーゼ(ALDH)(WO 2008064289 A2に開示)からなる群より選択される少なくとも第1のリグニン生合成遺伝子を発現低下させるために使用される。
特定の実施態様では、本明細書に記載の方法は、より少量の酢酸を発酵時に発生する植物集団を作るのに用いられる(WO 2010096488も参照のこと)。より詳細には、本明細書に開示する方法は、CaslLの相同体に変異を起こして多糖類のアセチル化を低減するのに用いられる。
バイオ燃料生産用の酵母の改変
特定の実施態様では、本明細書で提供するC2c1酵素は、組換え微生物によるバイオエタノール生産に用いられる。たとえば、C2c1を用いて酵母などの微生物を、発酵性糖からバイオ燃料または生体高分子を生成し、必要に応じて、発酵性糖の供給源として、農業廃棄物から得られる植物由来のリグノセルロースを分解することができるように操作する。より詳細には、本発明は、C2c1 CRISPR複合体を用いてバイオ燃料生産に必要な外来遺伝子を微生物に導入し、かつ/またはバイオ燃料合成を妨げる可能性のある内在性遺伝子を改変する方法を提供する。より詳細には、方法は、ピルビン酸のエタノールまたは別の目的生成物への変換に関与する酵素をコードする1つ以上のヌクレオチド配列を酵母などの微生物に導入することを含む。特定の実施態様では、この方法により、微生物をセルロースを分解することができるようにする1種以上の酵素(セルラーゼなど)の導入が保証される。さらに別の実施態様では、C2c1 CRISPR複合体はバイオ燃料生産経路と競合する内因性代謝経路を改変するのに用いられる。
したがって、より詳細な態様では、本明細書に記載の方法は以下の目的で微生物の改変に用いられる。
植物細胞壁分解酵素をコードする、少なくとも1つの異種核酸の導入または少なくとも1つの内在性核酸の発現の増加によって、前記微生物が前記核酸を発現し、かつ前記植物細胞壁分解酵素を産生・分泌することができるようにするため。
ピルビン酸をアセトアルデヒドに変換する酵素をコードする、少なくとも1つの異種核酸の導入または少なくとも1つの内在性核酸の発現の増加(必要に応じて、アセトアルデヒドをエタノールに変換する酵素をコードする少なくとも1つの異種核酸と組み合わせて)によって、前記宿主細胞が前記核酸を発現することができるようにするため。
前記宿主細胞の代謝経路の酵素をコードする少なくとも1つの核酸を改変するため(前記経路は、ピルビン酸からのアセトアルデヒドまたはアセトアルデヒドからのエタノール以外の代謝物を産生し、前記改変によって前記代謝物の産生量は減少する)、あるいは前記酵素の阻害物質をコードする少なくとも1つの核酸を導入するため。
植物油またはバイオ燃料生産用の藻類および植物の改変
遺伝子導入藻類または他の植物(アブラナなど)は、たとえば植物油またはアルコール(特にメタノールおよびエタノール)などのバイオ燃料の生産に特に有用な可能性がある。これらを、油またはバイオ燃料産業で用いるための多量の油またはアルコールを発現または過剰発現するように遺伝子操作してもよい。
本発明の特定の実施態様によれば、CRISPR-C2c1システムはバイオ燃料生産に有用な脂質豊富な珪藻を作成するのに用いられる。
特定の実施態様では、植物によって産生されるバイオマス生産に関連する遺伝子を特異的に改変することが想定される。特定の実施態様では、CRISPR-C2c1システムを用いて、テオシント分岐(tb)遺伝子またはその相同体を標的化して高バイオマス植物を作る。特定の実施態様では、CRISPR-C2c1システムは1つ以上のねじれ型二本鎖切断(DSB)をtb遺伝子に導入する。特定の実施態様では、CRISPR-C2c1システムは単一の変異をtb遺伝子に導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変をtb遺伝子の転写物に導入する。特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド変異をtb遺伝子またはその相同体に導入するための、アデノシンまたはシチジンデアミナーゼなどの機能ドメインと(たとえば融合タンパク質または好適なリンカーによって)会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムを用いて、tb1aおよびtb1b遺伝子を標的化し、単一のヌクレオチド変異を導入して高バイオマスのスイッチグラス植物を作る。Liu et. al, Plant Biotechnology Journal (doi:10.1111/pbi.12778)を参照のこと。
特定の実施態様では、藻類細胞によって産生される脂質の量および/または脂質の質の変更に関与する遺伝子を特異的に改変することが想定される。脂肪酸合成経路に関与する酵素をコードする遺伝子の例は、たとえば、アセチルCoAカルボキシラーゼ活性、脂肪酸シンターゼ活性、3-ケトアシル-アシル担体タンパク質シンターゼIII活性、グリセロール-3-リン酸デヒドロゲナーゼ(G3PDH)活性、エノイル-アシル担体タンパク質レダクターゼ(エノイル-ACPレダクターゼ)活性、グリセロール-3-リン酸アシルトランスフェラーゼ活性、リゾホスファチジン酸アシルトランスフェラーゼ活性またはジアシルグリセロールアシルトランスフェラーゼ活性、リン脂質:ジアシルグリセロールアシルトランスフェラーゼ活性、ホスファチジン酸ホスファターゼ活性、脂肪酸チオエステラーゼ(パルミトイルタンパク質チオエステラーゼなど)活性、またはリンゴ酸酵素活性を有するタンパク質をコードすることができる。さらなる実施態様では、脂質蓄積の増加した珪藻を作ることが想定される。これは、脂質の異化を減少させる遺伝子を標的化することによって達成可能である。本発明の方法での使用について特に有益なものは、トリアシルグリセロールと遊離脂肪酸の両方の活性化に関与する遺伝子、ならびに脂肪酸のβ酸化に直接関与する遺伝子(アシル-CoAシンテターゼ、3-ケトアシル-CoAチオラーゼ、アシル-CoAオキシダーゼ、およびホスホグルコムターゼ活性)である。本明細書に記載のCRISPR-C2c1システムおよび方法を用いて、珪藻のそのような遺伝子を特異的に活性化して、それらの脂質含有量を増加させることができる。
微細藻類などの生物は合成生物学に広く用いられている。Stovicekらの文献(Metab. Eng. Comm., 2015; 2:13)には、産業生産用の強い株を効率的に生産するための、産業用酵母、たとえば出芽酵母(Saccharomyces cerevisiae)のゲノム編集について記載されている。Stovicekは、内在性遺伝子の両方の対立遺伝子を同時に破壊し、かつ異種遺伝子を組み込むように酵母にコドンを最適化したCRISPR-Cas9システムを用いた。ゲノムまたはエピソーム(遺伝子副体)の2 μベースのベクター位置からCas9およびgRNAが発現した。著者らはさらに、Cas9とgRNAの発現量を最適化することで遺伝子破壊効率を改善することができることを示した。Hlavovaら(Biotechnol. Adv. 2015)は、CRISPRなどの技術を使用して核および葉緑体遺伝子を挿入変異および選別の標的とする微細藻類の種または株の開発について考察している。StovicekおよびHlavovaの方法を本発明のC2c1エフェクタータンパク質システムに応用してもよい。CRISPR-C2c1システムについて、実施態様によっては、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムはLol p5遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1 タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
US 8,945,839には、Cas9を用いて微細藻類(コナミドリムシ(Chlamydomonas reinhardtii)細胞型)を操作する方法が記載されている。同様の手段を用いて、本明細書に記載のCRISPR-C2c1システムの方法をクラミドモナス(Chlamydomonas)種および他の藻類に応用することができる。特定の実施態様では、C2c1およびガイドRNAを、C2c1を発現するベクターを用いて発現した藻類に構成的プロモーター(Hsp70A-Rbc S2またはβ2-チューブリン)の制御下で導入する。ガイドRNAは、T7プロモーターを含むベクターを用いて送達される。あるいは、C2c1 mRNAおよびin vitroで転写されたガイドRNAを藻類細胞に送達することができる。エレクトロポレーションの手順はGeneArtクラミドモナス操作キットの標準の推奨手順に従う。US 8,945,839の方法を本発明のC2c1エフェクタータンパク質システムに応用してもよい。CRISPR-C2c1システムについて、実施態様によっては、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
脂肪酸を産生することができる微生物の生成におけるC2c1の使用
特定の実施態様では、本発明の方法は、脂肪エステル、たとえば脂肪酸メチルエステル(「FAME」)および脂肪酸エチルエステル(「FAEE」)を産生することができる遺伝子操作された微生物を作るのに用いられる。
典型的には、チオエステラーゼをコードする遺伝子、アシルCoAシンターゼをコードする遺伝子、およびエステルシンターゼをコードする遺伝子の発現または過剰発現によって、培地に含まれる炭素源(アルコールなど)から脂肪エステルを産生するように宿主細胞を操作することができる。したがって、本明細書で提供する方法は、チオエステラーゼ遺伝子、アシルCoAシンターゼをコードする遺伝子、およびエステルシンターゼをコードする遺伝子を過剰発現または導入するように微生物を改変するのに用いられる。特定の実施態様では、チオエステラーゼ遺伝子は、tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl、またはfatAから選択される。特定の実施態様では、アシルCoAシンターゼをコードする遺伝子は、fadDJadK、BH3103、pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa39、または同じ特性を持つ酵素をコードする特定遺伝子から選択される。特定の実施態様では、エステルシンターゼをコードする遺伝子は、ホホバ(Simmondsia chinensis)、アシネトバクター属種(Acinetobacter sp.)ADP、アルカニヴォラックス・ボルクメンシス(Alcanivorax borkumensis)、緑膿菌(Pseudomonas aeruginosa)、フンディバクテル・ジャデンシス(Fundibacter jadensis)、シロイヌナズナ(Arabidopsis thaliana)、またはアルカリゲネス・ユートロフス(Alcaligenes eutrophus)、またはそれらの多様体に由来する、シンターゼ/アシル-CoA:ジアシルグリセロールアシルトランスフェラーゼをコードする遺伝子である。
それに加えて、またはその代わりに、本明細書で提供する方法は、アシル-CoAデヒドロゲナーゼをコードする遺伝子、外膜タンパク質受容体をコードする遺伝子、および脂肪酸生合成の転写制御因子をコードする遺伝子のうちの少なくとも1つの前記微生物での発現量を減少させるのに用いられる。特定の実施態様では、これらの遺伝子のうちの1つ以上は、たとえば変異の導入によって不活化されている。特定の実施態様では、アシル-CoAデヒドロゲナーゼをコードする遺伝子はfadEである。特定の実施態様では、脂肪酸生合成の転写制御因子をコードする遺伝子は、DNA転写抑制因子、たとえばfabRをコードする。
それに加えて、またはその代わりに、前記微生物はピルビン酸ギ酸リアーゼをコードする遺伝子、乳酸デヒドロゲナーゼをコードする遺伝子のうちの少なくとも一方、または両方の発現量を減少させるように改変される。特定の実施態様では、ピルビン酸ギ酸リアーゼをコードする遺伝子はpflBである。特定の実施態様では、乳酸デヒドロゲナーゼをコードする遺伝子はldhAである。特定の実施態様では、これらの遺伝子のうちの1つ以上は、たとえば変異の導入によって不活化されている。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。実施態様によっては、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
特定の実施態様では、微生物は、エスケリキア属(Escherichia)、バチルス属(Bacillus)、ラクトバチルス属(Lactobacillus)、ロドコッカス属(Rhodococcus)、シネココッカス属(Synechococcus)、シネコシスティス属(Synechocystis)、シュードモナス属(Pseudomonas)、アスペルギルス属(Aspergillus)、トリコデルマ属(Trichoderma)、ニューロスポラ属(Neurospora)、フサリウム属(Fusarium)、フミコラ属(Humicola)、リゾムコール属(Rhizomucor)、クリベロミセス属(Kluyveromyces)、ピキア属(Pichia)、ケカビ属(Mucor)、ミセリオフトラ属(Myceliophthora)、アオカビ属(Penicillium)、ファネロカエテ属(Phanerochaete)、ヒラタケ属(Pleurotus)、ホウロクタケ属(Trametes)、クリソスポリウム属(Chrysosporium)、サッカロミセス属(Saccharomyces)、ステノトロホモナス属(Stenotrophomonas)、シゾサッカロミセス属(Schizosaccharomyces)、ヤロウイア属(Yarrowia)、またはストレプトミセス属(Streptomyces)から選択される。
有機酸を産生することができる微生物の作成におけるC2c1の使用
本明細書で提供する方法はさらに、有機酸を(より詳細には五炭糖または六炭糖から)産生することができる微生物を設計するために用いられる。特定の実施態様では、方法は、微生物に外来性LDH遺伝子を導入することを含む。特定の実施態様では、それに加えて、またはその代わりに、前記微生物における有機酸産生を、目的の有機酸以外の代謝物を産生する内因性代謝経路、および/またはその有機酸を消費する内因性代謝経路に関与するタンパク質をコードする内在性遺伝子を不活化することによって増加させる。特定の実施態様では、この改変によって目的の有機酸以外の代謝物の産生が確実に減少する。特定の実施態様によれば、この方法を用いて、目的の有機酸が消費される内因性経路または目的の有機酸以外の代謝物を産生する内因性経路に関与する生成物をコードする遺伝子の少なくとも1つの操作された遺伝子欠失および/または不活化を導入する。特定の実施態様では、少なくとも1つの操作された遺伝子欠失または不活化は、ピルビン酸デカルボキシラーゼ(pdc)、フマル酸レダクターゼ、アルコールデヒドロゲナーゼ(adh)、アセトアルデヒドデヒドロゲナーゼ、ホスホエノールピルビン酸カルボキシラーゼ(ppc)、D-乳酸デヒドロゲナーゼ(d-ldh)、L-乳酸デヒドロゲナーゼ(l-ldh)、乳酸-2-モノオキシゲナーゼからなる群より選択される酵素をコードする1つ以上の遺伝子にある。さらなる実施態様では、少なくとも1つの操作された遺伝子欠失および/または不活化は、ピルビン酸デカルボキシラーゼ(pdc)をコードする内在性遺伝子にある。
さらなる実施態様では、微生物は乳酸を産生するように操作され、少なくとも1つの操作された遺伝子欠失および/または不活性化は、乳酸デヒドロゲナーゼをコードする内在性遺伝子にある。それに加えて、またはその代わりに、微生物は、チトクロムB2依存性L-乳酸デヒドロゲナーゼなどのチトクロム依存性乳酸デヒドロゲナーゼをコードする内在性遺伝子の少なくとも1つの操作された遺伝子欠失または不活性化を含む。

改良型キシロースまたはセロビオース利用酵母菌株の作成におけるC2c1の使用
特定の実施態様では、CRISPR-C2c1システムを、改良型キシロースまたはセロビオース利用酵母菌株を選択するために応用してもよい。エラーが発生しやすいPCRを使用して、キシロース利用またはセロビオース利用経路に関与する1つ(以上)の遺伝子を増幅することができる。キシロース利用経路およびセロビオース利用経路に関与する遺伝子の例としては、Ha, S.J., et al. (2011) Proc. Natl. Acad. Sci. USA 108(2):504-9およびGalazka, J.M., et al. (2010) Science 330(6000):84-6に記載されているものを挙げることができるが、これらに限定されない。選択されたこのような遺伝子に無作為な変異をそれぞれ含む二本鎖DNA分子から得られるライブラリーを、CRISPR-C2c1システムの成分と共に酵母株(たとえばS288C)に同時形質転換することができ、キシロースまたはセルビオース利用能の向上した株を選択することができる(WO2015138855に記載のとおり)。
イソプレノイド生合成に使用するための改良酵母株の生成におけるC2c1の使用
Tadas Jakociunasらは、多重CRISPR/Cas9システムを応用して、パン酵母である出芽酵母(Saccharomyces cerevisiae)中の一形質転換工程で最大5つの異なるゲノム遺伝子座のゲノム操作に成功し(Metabolic EngineeringVolume 28, March 2015, Pages 213-222)、産業上重要なイソプレノイド生合成経路の主要な中間体であるメバロン酸の産生量の多い株を得たことを記載している。特定の実施態様では、イソプレノイド合成に使用するためのさらなる高生産酵母株を特定するために、CRISPR-C2c1システムを本明細書に記載の多重ゲノム操作方法に応用してもよい。C2c1タンパク質について、実施態様によっては、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは7ヌクレオチドの5'末端に突出を有する1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
乳酸産生酵母株の作成におけるC2c1の使用
別の実施態様では、成功した多重CRISPR-C2c1システムの応用が包含される。Vratislav Stovicekら(Metabolic Engineering Communications, Volume 2, December 2015, Pages 13-22)と同様に、改良型乳酸産生株を1つの形質転換事象で設計し入手することができる。特定の実施態様では、異種性の乳酸デヒドロゲナーゼ遺伝子の挿入と2つの内在性遺伝子PDC1およびPDC5遺伝子の破壊を同時に行うためにCRISPR-C2c1を用いる。C2c1タンパク質について、実施態様によっては、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異をPDC1またはPDC5遺伝子に導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変をPDC1またはPDC5遺伝子の転写物に導入する。
植物におけるCRISPR-C2c1システムのさらなる応用
特定の実施態様では、本明細書に記載のCRISPRシステムおよび好ましくはCRISPR-C2c1システムを、遺伝要素の可視化のために用いることができる。たとえば、CRISPRイメージングは、反復ゲノム配列も非反復ゲノム配列も可視化し、テロメア長の変化やテロメア運動を報告し、細胞周期を通じて遺伝子座の動態を監視することができる(Chen et al., Cell, 2013)。これらの方法を植物にも応用してもよい。
本明細書に記載のCRISPRシステムおよび好ましくはCRISPR-C2c1システムのその他の応用は、in vitroおよびin vivoでの標的遺伝子破壊の正選択選別である(Malina et al., Genes and Development, 2013)。これらの方法を植物にも応用してもよい。
特定の実施態様では、不活性なC2c1エンドヌクレアーゼとヒストン改変酵素の融合によって、複雑なエピゲノムに所望の変化を起こすことができる(Rusk et al., Nature Method, 2014)。これらの方法を植物にも応用してもよい。
特定の実施態様では、本明細書に記載のCRISPRシステムおよび好ましくはCRISPR-C2c1システムを用いて染色質の特定の部分を精製し、関連タンパク質を特定することで、転写におけるそれらの調節的役割を解明することができる(Waldrip et al., Epigenetics, 2014)。これらの方法を植物にも応用してもよい。
特定の実施態様では、本発明はウイルスDNAとRNAの両方を切断することができるため、植物系のウイルス除去のための治療法として本発明を用いることができる。ヒトの系での過去の研究により、CRISPRを利用して一本鎖RNAウイルスであるC型肝炎ウイルスの標的化(A. Price, et al., Proc. Natl. Acad. Sci, 2015)および二本鎖DNAウイルスであるB型肝炎ウイルスの標的化(V. Ramanan, et al., Sci. Rep, 2015)に成功したことがわかっている。これらの方法を、植物でのCRISPR-C2c1システムの使用に適応させてもよい。
特定の実施態様では、本発明を用いてゲノムの複雑さを変えることができる。さらなる特定の実施態様では、本明細書に記載のCRISPRシステムおよび好ましくはCRISPR-C2c1システムを用いて、染色体を分裂させて染色体数を変え、一方の親からの染色体のみを含む一倍体植物を作成することができる。このような植物を、染色体重複を起こすように誘導してホモ接合性対立遺伝子のみを含む二倍体植物に変換することができる(Karimi-Ashtiyani et al., PNAS, 2015; Anton et al., Nucleus, 2014)。これらの方法を植物にも応用してもよい。
特定の実施態様では、本明細書に記載のCRISPR-C2c1システムを自己切断に使用することができる。これらの実施態様では、C2c1酵素およびgRNAのプロモーターは、構成的プロモーターであってもよく、第2のgRNAを同じ形質転換カセットに導入するが、誘導性プロモーターによって制御する。この第2のgRNAを、機能しないC2c1を作成するためにC2c1遺伝子の部位特異的切断を誘導するように指定することができる。さらなる特定の実施態様では、第2のgRNAは形質転換カセットの両端で切断を誘導し、その結果、宿主ゲノムからカセットが除去される。このシステムによって、細胞がCas酵素に暴露される時間が制御され、さらには非特異的な編集が最小限に抑えられる。さらに、CRISPR/Casカセットの両端の切断を利用して、導入遺伝子を含まない二対立遺伝子の変異を持つT0植物を作成することができる(Cas9についてたとえばMoore et al., Nucleic Acids Research, 2014; Schaeffer et al., Plant Science, 2015に記載のとおり)。Mooreらの方法を本明細書に記載のCRISPR-C2c1システムに応用してもよい。
Suganoら(Plant Cell Physiol. 2014 Mar;55(3):475-81. doi: 10.1093/pcp/pcu014. Epub 2014 Jan 18)は、苔類であるゼニゴケ(Marchantia polymorpha L.)の標的変異誘発へのCRISPR-Cas9の応用について報告している(ゼニゴケは陸生植物の進化を研究するためのモデル種として浮上している)。ゼニゴケのU6プロモーターを特定し、クローン化してgRNAを発現させた。gRNAの標的配列を、ゼニゴケのオーキシン受容因子(ARF1)をコードする遺伝子を破壊するように設計した。アグロバクテリウムを介した形質転換を利用して、Suganoらはゼニゴケの配偶体生成において安定した変異体を単離した。Cas9を発現するためにカリフラワーモザイクウイルス35SまたはゼニゴケEF1αプロモーターのいずれかを用いて、CRISPR-Cas9に基づくin vivoでの部位特異的変異誘発を達成した。オーキシン抵抗性の表現型を示す単離された変異個体はキメラ型ではなかった。さらに、T1植物の無性生殖によって安定した変異体を作成した。CRIPSR-Cas9に基づく標的変異誘発を用いて、複数のarf1対立遺伝子を容易に確立した。Suganoらの方法を本発明のC2c1エフェクタータンパク質システムに応用してもよい。
Kabadiら(Nucleic Acids Res. 2014 Oct 29;42(19):e147. doi: 10.1093/nar/gku749. Epub 2014 Aug 13)は、便利なGolden Gateクローン化法でベクターに組み込まれた独立のRNAポリメラーゼIIIプロモーターからCas9多様体とレポーター遺伝子と最大4つのsgRNAとを独立のRNAポリメラーゼIIIプロモーターを発現する単一のレンチウイルスシステムを開発した。各sgRNAは効率的に発現され、不死化初代ヒト細胞で多重の遺伝子編集と持続的な転写活性化を媒介することができる。Kabadiらの方法を本発明のC2c1エフェクタータンパク質システムに応用してもよい。
Lingら(BMC Plant Biology 2014, 14:327)は、pGreenまたはpCAMBIA骨格およびgRNAに基づくCRISPR-Cas9二成分ベクターセットを開発した。このツールキットはBsaI以外の制限酵素を必要とせず、トウモロコシコドンに最適化したCas9と1つ以上のgRNAとを有する最終構築物をわずか1つのクローン化工程で効率よく作成する。トウモロコシ原形質体、遺伝子組換えトウモロコシ系統、および遺伝子組換えシロイヌナズナ系統を用いてツールキットを検証し、高い効率と特異性を示すことがわかった。さらに重要なことに、このツールキットを用いて3つのシロイヌナズナ遺伝子の標的変異がT1世代の遺伝子組換え実生で検出された。また、複数遺伝子の変異は次世代に受け継がれる可能性がある。植物の多重ゲノム編集用ツールキットとしての(ガイドRNA)モジュールベクターセット。Linらのツールボックスを本発明のC2c1エフェクタータンパク質システムに応用してもよい。
CRISPR-C2c1を介した標的植物ゲノム編集の手順は、Methods in Molecular Biologyシリーズの第1284巻(pp 239-255 10 February 2015)でCRISPR-Cas9システムについて開示されているものに基づいて利用できる。シロイヌナズナ(Arabidopsis thaliana)およびベンサミアナタバコ(Nicotiana benthamiana)の原形質体のモデル細胞システムを用いた、植物コドン最適化Cas9(pcoCas9)によるゲノム編集のための二重gRNAを設計、構築、および評価する詳細な手順が記載されている。CRISPR-Cas9システムを応用して全植物の標的ゲノム改変を起こすための方策についても説明されている。その章に記載されている手順を本発明のC2c1エフェクタータンパク質システムに応用してもよい。
上記の方法および手順におけるC2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
Maら(Mol Plant. 2015 Aug 3;8(8):1274-84. doi: 10.1016/j.molp.2015.04.007)は、植物コドン最適化Cas9遺伝子を利用した、単子葉植物および双子葉植物の好都合かつ高効率な多重ゲノム編集のための強いCRISPR-Cas9ベクターシステムについて報告している。Maらは、多重sgRNA発現カセットを迅速に作成するためのPCRに基づく手順を設計した。Golden Gate連結またはGibson Assemblyによって1回のクローン化でこの発現カセットを二成分CRISPR-Cas9ベクターに組み込むことができる。このシステムを用いて、Maらはイネで46個の標的部位を編集した(変異率85.4%、主に二対立遺伝子・ホモ接合状態)。Maらは、複数(最大8)の遺伝子ファミリーメンバー、生合成経路の複数の遺伝子、または単一の遺伝子の複数部位を同時標的化することにより、T0イネ植物およびT1シロイヌナズナ植物の機能欠失型遺伝子変異の例を挙げている。Maらの方法を本発明のC2c1エフェクタータンパク質システムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。 実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
Lowderら(Plant Physiol. 2015 Aug 21. pii: pp.00636.2015)も、植物中に発現された、発現抑制された、または非翻訳領域の遺伝子の多重ゲノム編集および転写調節を行うことができるCRISPR-Cas9ツールボックスを開発した。このツールボックスにより、研究者らはGolden Gateクローン化法やGatewayクローン化法で迅速かつ効率よく単子葉植物および双子葉植物に機能性CRISPR-Cas9 T-DNA構築物を組み込むための手順および試薬を得られる。ツールボックスには植物の内在性遺伝子の多重遺伝子編集および転写活性化もしくは抑制など、機能の完全な一式が備わっている。T-DNAに基づく形質転換技術は、現代の植物の生物工学、遺伝学、分子生物学、および生理学の基本である。したがって、C2c1(WT、ニッカーゼ、またはdC2c1)とgRNAを目的のT-DNA最終ベクターに組み込んでもよい。組込み方法は、Golden Gate組込み法とMultiSite Gateway組換え法の両方に基づく。組込みには3つのモジュールが必要である。第1のモジュールはC2c1エントリーベクターであり、これにはプロモーターのないC2c1、またはattL1およびattR5部位に隣接するその派生遺伝子が含まれる。第2のモジュールはgRNAエントリーベクターであり、これにはattL5およびattL2部位に隣接するエントリーgRNA発現カセットが含まれる。第3のモジュールには、C2c1発現に最適なプロモーターを提供する、attR1~attR2を含む最終T-DNAベクターが含まれる。Lowderらのツールボックスを本発明のC2c1エフェクタータンパク質システムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
Wangら(bioRxiv 051342; doi: doi.org/10.1101/051342; Epub. May 12, 2016)は、単一のプロモーターの制御下にあるいくつかのgRNA-tRNAユニットを備えた多重遺伝子編集構築物を使用して、6倍体コムギの重要な農学的形質に影響を及ぼす4つの遺伝子の同祖コピーの編集を示している。
有利な実施態様では、植物は樹木であってもよい。本発明は、本明細書に記載のCRISPR Casシステムを草木系にも利用してもよい(たとえばBelhaj et al., Plant Methods 9: 39およびHarrison et al., Genes & Development 28: 1859-1872を参照のこと)。特に有利な実施態様では、本発明のCRISPR Casシステムは樹木の一塩基多型(SNP)を標的としてもよい(たとえばZhou et al., New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015を参照のこと)。Zhouらの研究では、著者らは事例研究として、CRISPR Casシステムを、4-クマル酸:CoAリガーゼ(4CL)遺伝子ファミリーを用いてポプラ属(Populus)の木に応用し、標的とした2つの4CL遺伝子について、100%の変異誘発効率を達成した。調査したすべての形質転換体は二対立遺伝子の改変を含んでいた。Zhouらの研究では、CRISPR-Cas9システムは一塩基多型(SNP)に非常に敏感であった。というのも、第3の4CL遺伝子の切断は標的配列のSNPが原因で無効になったからである。これらの方法を本発明のC2c1エフェクタータンパク質システムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
Zhouらの方法(New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015)を以下のように本発明に応用してもよい。リグニンおよびフラボノイドの生合成にそれぞれ関連する2つの4CL遺伝子、4CL1および4CL2がCRISPR-Cas9編集の標的である。形質転換に通常用いられるヨーロッパヤマナラシ×ギンドロ(Populus tremula × alba)のクローン717-1B4は、ゲノム配列決定したポプラ(Populus trichocarpa)とは異なる。そこで、基準ゲノムから設計した4CL1および4CL2のgRNAを社内の717 RNA-Seqデータを用いて調べ、Casの効率を制限する可能性のあるSNPがないことを確認する。4CL1のゲノム複製である4CL5のために設計された3番目のgRNAも含む。対応する717配列は、PAMの付近/内部の各対立遺伝子に1つのSNPを含み、いずれも4CL5-gRNAによる標的化を無効にすると予想される。3つのgRNA標的部位はすべて、第1エクソン内にある。717形質転換の場合、gRNAはMedicago U6.6プロモーターから、CaMV 35Sプロモーターの制御下にあるヒトコドン最適化Casと共に二成分ベクター内で発現される。Casのみのベクターによる形質転換は対象として機能することができる。無作為に選択した4CL1および4CL2株を増幅産物の配列決定の対象とする。次いでデータを処理し、すべての場合について二対立遺伝子の変異を確認する。これらの方法を本発明のC2c1エフェクタータンパク質システムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
植物では、病原体は宿主特異的であることが多い。たとえば、トマト萎凋病菌(Fusarium oxysporum f. sp. lycopersici)はトマトを萎れさせるが、トマトのみを攻撃し、カーネーション萎凋病菌(F. oxysporum f. sp. dianthi)、コムギ黒さび病菌(Puccinia graminis f. sp. tritici)はコムギのみを攻撃する。植物は、ほとんどの病原体に抵抗するために存在し誘導される防御力を持つ。植物の世代にわたる変異および組換え事象により、感受性を引き起こす遺伝的変動が起こる。というのも、特に病原体が植物よりも頻繁に繁殖するからである。植物では、非宿主抵抗性が存在する可能性がある(たとえば、宿主と病原体が適合しない)。水平抵抗性、たとえば病原体のすべての種に対する部分的な抵抗性(典型的には多くの遺伝子によって制御される)および垂直抵抗性、たとえば病原体の一部の種に対する完全な抵抗性(他の品種に対してはない。典型的にはわずかの遺伝子によって制御される)も存在する可能性がある。遺伝子対遺伝子のレベルでは、植物と病原体は共に進化し、一方の遺伝子変化は、他方の変化と均衡する。したがって、自然な変動を利用して、育種者は収量、品質、均一性、耐久力、抵抗性のために最も有用な遺伝子を組み合わせる。抵抗性遺伝子の由来源としては、天然または外来の変種、在来の変種、野生植物近縁種、および誘導された変異(たとえば変異誘発物質による植物材料の処理)が挙げられる。本発明を用いて、植物育種者には変異を誘導するための新たな手段が提供される。したがって、当業者は抵抗性遺伝子の由来源のゲノムを解析することができ、所望の特性または形質を持つ変種では、本発明を用いて以前の変異誘発物質よりも正確に抵抗性遺伝子の増加を誘導し、ひいては植物の育種計画を加速かつ改善することができる。
以下の表にさらなる参照文献、ならびに生物生産を改善するためにCRISPR-Cas複合体、改変エフェクタータンパク質、システム、および最適化方法を用いてもよい関連分野を示す。実施態様によっては、CRISPR-Cas複合体は、tracr RNAと複合化したC2c1タンパク質またはその触媒ドメインと、直接反復配列に結合したガイド配列を含むガイドRNAとを含み、ガイド配列は標的配列とハイブリダイズする。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
Figure 2024138266000042
Figure 2024138266000043
改良植物および酵母細胞
本発明はさらに、本明細書に記載の方法によって入手可能であり入手される植物および酵母細胞を提供する。本明細書に記載の方法によって得られる改良植物は、たとえば植物の害虫、除草剤、乾燥、低温もしくは高温、過剰な水などに対する抵抗性を保証する遺伝子の発現によって食物または飼料の生産に役立つ。
本明細書に記載の方法で得られた改良植物、特に作物および藻類は、たとえば、野生型に通常見られるよりも多量のタンパク質、炭水化物、栄養素、またはビタミンの発現により、食物もしくは飼料の生産に有用となる可能性がある。この点について、改良植物、特に豆類および塊茎が好ましい。
改良された藻類または他の植物(アブラナなど)は、たとえば植物油またはアルコール(特にメタノールおよびエタノール)などのバイオ燃料の生産に特に有用な可能性がある。これらを、油またはバイオ燃料産業で用いるための多量の油またはアルコールを発現または過剰発現するように遺伝子操作してもよい。
本発明はまた、植物の改良された部分を提供する。植物の部分としては、葉、茎、根、塊茎、種子、胚乳、胚珠、および花粉が挙げられるが、これらに限定しない。本明細書で想定している植物の部分は、生育可能、生育不能、再生可能、および/または再生不可能であってもよい。
一実施態様では、Soyk et al. (Nat Genet. 2017 Jan;49(1):162-168)に記載の、トマトで抑制因子SP5Gを標的とするCRISPR-Cas9による変異を用いて早期収穫トマトを作る方法を本発明で開示するCRISPR-Casシステムに合わせて変更してもよい。実施態様によっては、CRISPRタンパク質はC2c1であり、システムは、I. (a)標的配列にハイブリダイズすることが可能なガイドRNAポリヌクレオチドおよび(b)直接反復RNAポリヌクレオチドを含むCRISPR-CasシステムRNAポリヌクレオチド配列と、II. 少なくとも1つ以上の核局在化配列を任意に含む、C2c1をコードするポリヌクレオチド配列とを含む。ここで、直接反復配列はガイド配列にハイブリダイズし、標的配列へのCRISPR複合体の配列特異的結合を導く。CRISPR複合体は、(1)標的配列とハイブリダイズされる、またはハイブリダイズすることが可能なガイド配列および(2)直接反復配列と複合化されたCRISPRタンパク質を含み、CRISPRタンパク質をコードするポリヌクレオチド配列はDNAまたはRNAである。実施態様によっては、植物細胞ゲノムはTに富むPAMを含む。特定の実施態様では、PAMは5'-TTN-3'または5'-ATTN-3'である。特定の実施態様では、PAMは5'-TTG-3'である。実施態様によっては、CRISPRエフェクタータンパク質はC2c1タンパク質である。Cas9によって起こるPAMの近位末端の切断とは対照的に、C2c1はPAMの遠位末端に二本鎖切断を起こす(Jinek et al., 2012; Cong et al., 2013)。Cpf1変異標的配列は単一のg RNAによる反復的切断に影響されやすいかもしれないことが提唱されており、したがってHDRを介したゲノム編集へのCpf1の応用が促進されている(Front Plant Sci. 2016 Nov 14;7:1683)。Cpf1およびC2c1はいずれも構造の似たV型CRISPR Casタンパク質である。C2c1と同様に、(PAMの近位末端に平滑切断を起こすCas9とは対照的に)Cpf1はねじれ型二本鎖切断をPAMの遠位末端に起こす。したがって、特定の実施態様では、目的の遺伝子座は相同性指向修復(HRまたはHDR)を介してCRISPR-C2c1複合体によって改変される。特定の実施態様では、目的の遺伝子座はHRとは独立にCRISPR-C2c1複合体によって改変される。特定の実施態様では、目的の遺伝子座は非相同性末端結合(NHEJ)を介してCRISPR-C2c1複合体によって改変される。
本発明の方法によって生成された植物細胞および植物を提供することも本明細書に包含される。従来の育種法によって生産された、遺伝子改変を含む植物配偶子、種子、胚(接合性であっても体細胞性であっても)、子孫、または雑種も本発明の範囲に含まれる。そのような植物は、標的配列に挿入された、または標的配列の代わりに挿入された、異種すなわち外来のDNA配列を含んでいてもよい。あるいは、そのような植物は、1つ以上のヌクレオチドに変化(変異、欠失、挿入、置換)のみを含んでいてもよい。したがって、そのような植物は、特定の改変が存在する点でのみ、それらの前駆植物とは異なる。
したがって、本発明は、本発明の方法によって生産された植物、動物もしくは細胞、またはそれらの子孫を提供する。子孫は、生産された植物または動物のクローンであってもよいし、同じ種の他の個体と交配してさらに望ましい形質を子孫に導入することによる有性生殖によって得られてもよい。多細胞生物、特に動物または植物の場合、細胞はin vivoであってもex vivoであってもよい。
本明細書に記載のC2c1システムを用いたゲノム編集の方法を使用して、本質的に任意の植物、藻類、真菌、酵母などに所望の形質を付与することができる。多様な植物、藻類、真菌、酵母など、ならびに植物、藻類、真菌、酵母の細胞または組織系を、本開示の核酸構築物および上記の様々な形質転換法を使用して、本明細書に記載の所望の生理学的および農学的特徴を得るために操作してもよい。
特定の実施態様では、本明細書に記載の方法を用いて、植物ゲノム中に外来DNAが存在するのを避けるため、植物、藻類、真菌、酵母などのゲノムにいかなる外来遺伝子(CRISPR成分をコードするものを含む)をも永久に導入することなく内在性遺伝子を改変する、またはその発現を改変する。このことは、非遺伝子組換え植物の規制要件はさほど厳格ではないため、有益な可能性がある。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、機能ドメインはデアミナーゼ、好ましくはアデノシンデアミナーゼを含む。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
本明細書で提供するCRISPRシステムを、標的化された二本鎖もしくは一本鎖切断を導入し、かつ/または遺伝子活性因子および/もしくは抑制因子システムを導入するために使用することができ、限定はしないが、遺伝子標的化、遺伝子置換、標的変異誘発、標的欠失もしくは挿入、標的反転、および/もしくは標的転座に使用することができる。単一の細胞で複数の改変を達成するように指定された複数の標的化RNAを共発現させることにより、多重ゲノム改変を確実にすることができる。この技術を用いて、栄養品質の向上、疾患に対する抵抗性ならびに生物的および非生物的ストレスに対する抵抗性の向上、商業的に価値のある植物製品または異種化合物の生産量の増加など、改善された特徴を持つ植物を高精度に設計することができる。
一般に、本明細書に記載の方法によって、野生型植物と比較して1つ以上の望ましい形質を持つという点で「改良された植物、藻類、真菌、酵母など」が生成される。特定の実施態様では、得られた植物、藻類、真菌、酵母など、細胞、または部分は遺伝子組換えな植物であり、細胞の全部または一部のゲノムに組み込まれた外因性DNA配列を含む。特定の実施態様では、植物のどの細胞のゲノムにも外因性DNA配列が組み込まれていないという点で非遺伝子組換えな遺伝子改変植物、藻類、真菌、酵母など、部分、または細胞が得られる。そのような実施態様では、改良された植物、藻類、真菌、酵母などは非遺伝子組換えである。内在性遺伝子の改変のみが保証され、外来遺伝子が植物、藻類、真菌、酵母などのゲノムに導入または維持されない場合、得られた遺伝子改変作物は外来遺伝子を含まないため、基本的に非遺伝子組換えと見なすことができる。植物、藻類、真菌、酵母などのゲノム編集に関するCRISPR-C2c1システムの様々な用途としては、目的の農学的形質を付与するための1つ以上の外来遺伝子の導入、目的の農学的形質を付与するための内在性遺伝子の編集、目的の農学的形質を付与するためのCRISPR-C2c1システムによる内在性遺伝子の調節が挙げられるが、これらに限定しない。C2c1タンパク質は標的部位にねじれ型二本鎖切断(DSB)を起こすため、相同性指向修復(HR)の有無(たとえば、NHEJによる)にかかわらず外因性DNA配列を導入、すなわち組込んでもよい。農学的形質を付与する模範的な遺伝子としては、害虫または病害に対する抵抗性を付与する遺伝子、植物病害に関与する遺伝子(WO2013046247に列挙されているものなど)、除草剤、殺菌剤などに対する抵抗性を付与する遺伝子、(非生物的)ストレス抵抗性に関与する遺伝子などが挙げられるが、これらに限定されない。CRISPR-Casシステムの使用のその他の側面としては、(雄性)稔性植物を作成すること、植物/藻類などの稔性期を延長すること、目的の作物に遺伝的多様性を起こすこと、果実の成熟に影響を及ぼすこと、植物/藻類などの貯蔵寿命を延長すること、植物/藻類などのアレルギー誘発物質を減らすこと、付加価値のある形質(たとえば栄養の改善)を保証すること、目的の内在性遺伝子に関する選別方法、バイオ燃料、脂肪酸、有機酸などを生産することなどが挙げられるが、これらに限定しない。
C2c1エフェクタータンパク質複合体を動物以外の生物、たとえば藻類、真菌、酵母などに使用することができる
本明細書に記載のC2c1システムを用いたゲノム編集の方法を使用して、本質的に任意の植物、藻類、真菌、酵母などに所望の形質を付与することができる。多様な植物、藻類、真菌、酵母など、ならびに植物、藻類、真菌、酵母の細胞または組織系を、本開示の核酸構築物および上記の様々な形質転換法を使用して、本明細書に記載の所望の生理学的および農学的特徴を得るために操作してもよい。
褐変防止マッシュルーム(Agaricus bisporus)株を、ガイドRNAとCas9タンパク質とを含むCRISPR-Cas9システムをPEG形質転換でマッシュルーム細胞に送達してポリフェノールオキシダーゼ遺伝子に1~14ヌクレオチドの欠失を導入することで開発した。Yangら(news.psu.edu/story/432734/2016/10/19/academics/penn-state-developer-gene-edited-mushroom-wins-best-whats-new)を参照のこと。本明細書に記載のCRISPR-C2c1システムをYangらの方法と共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識する。実施態様によっては、PAMは5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。好ましい実施態様では、CRISPR-C2c1システムは外来性の鋳型DNAをねじれ型DSBにNHEJによって導入する。実施態様によっては、C2c1エフェクタータンパク質は1つ以上の変異を含む。実施態様によっては、C2c1エフェクタータンパク質はニッカーゼである。特定の実施態様によっては、CRISPR-C2c1システムは目的の標的遺伝座を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、本明細書に記載の方法を用いて、植物ゲノム中に外来DNAが存在するのを避けるため、植物、藻類、真菌、酵母などのゲノムにいかなる外来遺伝子(CRISPR成分をコードするものを含む)をも永久に導入することなく内在性遺伝子を改変する、またはその発現を改変する。このことは、非遺伝子組換え植物の規制要件はさほど厳格ではないため、有益な可能性がある。
本明細書で提供するCRISPRシステムを、標的化された二本鎖もしくは一本鎖切断を導入し、かつ/または遺伝子活性因子および/もしくは抑制因子システムを導入するために使用することができ、限定はしないが、遺伝子標的化、遺伝子置換、標的変異誘発、標的欠失もしくは挿入、標的反転、および/もしくは標的転座に使用することができる。単一の細胞で複数の改変を達成するように指定された複数の標的化RNAを共発現させることにより、多重ゲノム改変を確実にすることができる。この技術を用いて、栄養品質の向上、疾患に対する抵抗性ならびに生物的および非生物的ストレスに対する抵抗性の向上、商業的に価値のある植物製品または異種化合物の生産量の増加など、改善された特徴を持つ植物を高精度に設計することができる。
一般に、本明細書に記載の方法によって、野生型植物と比較して1つ以上の望ましい特性を持つという点で「改良された植物、藻類、真菌、酵母など」が生成される。特定の実施態様では、得られた植物、藻類、真菌、酵母など、細胞、または部分は遺伝子組換え植物であり、細胞の全部または一部のゲノムに組み込まれた外因性DNA配列を含む。特定の実施態様では、植物のどの細胞のゲノムにも外因性DNA配列が組み込まれていないという点で遺伝子組換えではない遺伝子改変植物、藻類、真菌、酵母など、部分、または細胞が得られる。そのような実施態様では、改良された植物、藻類、真菌、酵母などは遺伝子組換えではない。内在性遺伝子の改変のみが保証され、外来遺伝子が植物、藻類、真菌、酵母などのゲノムに導入または維持されない場合、得られた遺伝子改変作物は外来遺伝子を含まないため、基本的に遺伝子組換えではないと見なすことができる。植物、藻類、真菌、酵母などのゲノム編集に関するCRISPR-C2c1システムの様々な用途としては、目的の農学的形質を付与するための1つ以上の外来遺伝子の導入、目的の農学的形質を付与するための内在性遺伝子の編集、目的の農学的形質を付与するためのCRISPR-C2c1システムによる内在性遺伝子の調節が挙げられるが、これらに限定しない。農学的形質を付与する模範的な遺伝子としては、害虫または病害に対する抵抗性を付与する遺伝子、植物病害に関与する遺伝子(WO2013046247に列挙されているものなど)、除草剤、殺菌剤などに対する抵抗性を付与する遺伝子、(非生物的)ストレス抵抗性に関与する遺伝子などが挙げられるが、これらに限定されない。CRISPR-Casシステムの使用のその他の側面としては、(雄性)稔性植物を作成すること、植物/藻類などの稔性期を延長すること、目的の作物に遺伝的多様性を起こすこと、果実の成熟に影響を及ぼすこと、植物/藻類などの貯蔵寿命を延長すること、植物/藻類などのアレルギー誘発物質を減らすこと、付加価値のある形質(たとえば栄養の改善)を保証すること、目的の内在性遺伝子に関する選別方法、バイオ燃料、脂肪酸、有機酸などを生産することなどが挙げられるが、これらに限定されない。
ヒト以外の動物での用途
一側面では、本発明は、記載されている実施態様のいずれかによる真核宿主細胞を含むヒト以外の真核生物、好ましくは多細胞真核生物を提供する。他の側面では、本発明は、記載されている実施態様のいずれかによる真核宿主細胞を含む真核生物、好ましくは多細胞真核生物を提供する。これらの側面の実施態様によっては、生物は動物、たとえば哺乳動物であってもよい。また、生物は節足動物、たとえば昆虫であってもよい。本発明を他の農業用途、たとえば農業畜産動物に拡張してもよい。たとえば、ブタは生物医学(特に再生医学)モデルとして魅力的な多くの特徴を持っている。特に、重症複合免疫不全症(SCID)のブタは、再生医学、異種移植(本明細書の他の場所でも説明する)、腫瘍発達に有用なモデルとなる可能性があり、ヒトのSCID患者用の治療法を開発するのに役立つ。Leeら(Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5)は、レポーターで誘導された転写活性化因子様エフェクターヌクレアーゼ(TALEN)システムを利用して、体細胞で組換え活性化遺伝子(RAG)2の高効率な標的改変を起こした(両方の対立遺伝子に影響を及ぼしたものも含む)。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。 実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
Leeらの方法(Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5)を同様に以下のように本発明に応用してもよい。胎児線維芽細胞のRAG2の標的改変、続いてSCNTおよび胚移植を行い、変異ブタを作成する。CRISPR Casおよびレポーターをコードする構築物を胎児由来の線維芽細胞中にエレクトロポレーションする。48時間後、緑色蛍光タンパク質を発現する遺伝子導入細胞を1ウェルあたり1細胞の概算希釈率で96ウェルプレートの個々のウェルに分ける。任意のCRISPR Cas切断部位に隣接するゲノムDNA断片を増幅し、続いてPCR産物を配列決定して、RAG2の標的改変について選別する。選別し、非特異的変異がないことを確認した後、RAG2の標的改変を有する細胞をSCNTに用いる。おそらく中期IIプレートを含む、隣接する卵母細胞の細胞質の一部と共に極体を除去し、ドナー細胞を囲卵部に配置する。次に、再構築した胚をエレクトロポレーションして、ドナー細胞を卵母細胞と融合させ、次に化学的に活性化する。活性化された胚を0.5 μM Scriptaid(S7817; Sigma-Aldrich)を含むブタ接合体用培地3(PZM3)で14~16時間インキュベートする。次いで胚を洗浄してScriptaidを除去し、代理ブタの卵管に移すまでPZM3で培養する。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
本発明は、動物(実施態様によっては哺乳動物であり、実施態様によってはヒトである)の疾患または障害をモデル化するための基盤を作成するために使用される。特定の実施態様では、そのようなモデルおよび基盤はげっ歯類(非限定的な例ではラットまたはマウス)に基づく。このようなモデルおよび基盤は、近交系げっ歯類の系統間の区別および比較を利用することができる。特定の実施態様では、そのようなモデルおよび基盤は、霊長類、ウマ、ウシ、ヒツジ、ヤギ、ブタ、イヌ、ネコまたは鳥に基づいており、たとえば、そのような動物の疾患および障害を直接モデル化するため、またはそのような動物の改変かつ/または改善された系統を作成するためのものである。有利なことに、特定の実施態様では、ヒトの疾患または障害を模倣するために動物に基づく基盤またはモデルを作成する。たとえば、ブタとヒトは似ていることから、ブタはヒトの疾患をモデル化するための理想的な基盤である。げっ歯類モデルと比較して、ブタモデルの開発には費用と時間がかかる。一方、ブタや他の動物は、遺伝的、解剖学的、生理学的、病理生理学的にはるかによくヒトに似ている。本発明は、そのような動物基盤およびモデルに用いられる、標的化された遺伝子およびゲノム編集、遺伝子およびゲノム改変、ならびに遺伝子およびゲノム調節のための高効率な基盤を提供する。倫理基準によって、ヒトモデルおよび多くの場合はヒト以外の霊長類に基づくモデルの開発は阻止されているが、本発明は、ヒトの構造体、器官、および系の遺伝学、解剖学、生理学、病態生理学を模倣、モデル化、調査するためのin vitroシステム(細胞培養システム、三次元モデルおよびシステム、ならびに類器官が挙げられるが、これらに限定されない)で使用される。基盤およびモデルによって単一または複数の標的を操作することができる。
特定の実施態様では、本発明をSchombergら(FASEB Journal, April 2016; 30(1):Suppl 571.1)のような疾患モデルに応用することができる。遺伝性疾患の神経線維腫症1型(NF-1)をモデル化するために、SchombergはCRISPR-Cas9を用いて、ブタの胚にCRISPR/Cas9成分を細胞質微量注入することにより、ブタのニューロフィブロミン1遺伝子に変異を導入した。Cas9で標的切断する遺伝子内のエクソンの上流と下流の両方の部位を標的化する領域について、CRISPRガイドRNA(gRNA)を作成し、特異的な一本鎖オリゴデオキシヌクレオチド(ssODN)鋳型に修復を媒介させて2500 bpの欠失を導入した。また、CRISPR-Casシステムを用いて特定のNF-1変異または変異のクラスターを持つブタを操作した。さらに、CRISPR-Casシステムを用いて所定のヒト個体に特異的または代表的な変異を操作することができる。本発明は、ヒトの多遺伝子性疾患の動物モデル(ブタモデルが挙げられるがこれに限定されない)を開発するために同様に使用される。本発明によれば、1つの遺伝子または複数の遺伝子の複数の遺伝子座は、多重ガイドおよび必要に応じて1つ以上の鋳型を使用して同時に標的化される。
他の動物、たとえばウシのSNPを改変するために本発明を応用することができる。Tanら(Proc Natl Acad Sci U S A. 2013 Oct 8; 110(41): 16526-16531)は、プラスミド、rAAV、およびオリゴヌクレオチド鋳型を用いて、家畜遺伝子編集ツールボックスを、転写活性化因子様(TAL)エフェクターヌクレアーゼ(TALEN)およびクラスター化された規則的な配置の短い回文配列リピート(CRISPR)/Cas9で刺激した相同性指向修復(HDR)を含むように拡張した。遺伝子特異的gRNA配列を、彼らの方法(Mali P, et al. (2013) RNA-Guided Human Genome Engineering via Cas9 (RNA誘導下でのCas9によるヒトゲノム操作). Science 339(6121):823-826)に従い、Church lab gRNAベクター(Addgene ID: 41824)にクローン化した。Cas9ヌクレアーゼを、hCas9プラスミド(Addgene ID: 41815)の同時形質移入、またはRCIScript-hCas9から合成したmRNAによって得た。このRCIScript-hCas9は、hCas9プラスミド(hCas9 cDNAを含む)由来のXbaI-AgeI断片をRCIScriptプラスミドにサブクローン化することによって構築された。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物のSNP位置に導入する。
Heoら(Stem Cells Dev. 2015 Feb 1;24(3):393-402. doi: 10.1089/scd.2014.0278. Epub 2014 Nov 3)は、ウシ多能性細胞とクラスター化された規則的な配置の短い回文配列リピート(CRISPR)/Cas9ヌクレアーゼとを用いた高効率のウシゲノムの遺伝子標的化について報告した。まず、Heoらは、yamanaka因子の異所性発現とGSK3βおよびMEK阻害剤(2i)処理により、ウシ体細胞線維芽細胞から人工多能性幹細胞(iPSC)を生成する。Heoらは、これらのウシiPSCが奇形腫における遺伝子発現と発生能に関してナイーブ多能性幹細胞と非常によく似ていることを観察した。また、ウシNANOG遺伝子座に特異的なCRISPR-Cas9ヌクレアーゼは、ウシiPSCおよび胚でウシゲノムの高効率な編集を示した。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)をNANOG遺伝子座に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムはNANOG遺伝子座を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変をNANOG遺伝子座に対応する転写物に導入する。
Igenity(登録商標)は、経済的に重要な経済的形質(枝肉の組成、枝肉の品質、母体および繁殖形質、および平均日増体量など)を実行・伝達するために、ウシなどの動物の特性分析を提供する。包括的なIgenity(登録商標)特性の分析は、DNAマーカー(ほとんどの場合、一塩基多型すなわちSNP)の発見から始まる。Igenity(登録商標)特性の背後にあるすべてのマーカーは、たとえば、大学、研究組織、政府機関(USDAなど)などの研究機関の独立した科学者によって発見された。次に、検証母集団のIgenity(登録商標)でマーカーを分析する。Igenity(登録商標)は、様々な生産環境および生物学的種類を表す複数の資料母集団を使用し、多くの場合、牛肉産業界の種畜、ウシ繁殖、肥育場、および/または屠畜解体部門の業界パートナーと協力して、一般的に利用できない表現型を収集する。ウシのゲノムデータベースは広く利用可能である。たとえば、NAGRP Cattle Genome Coordination Program (www.animalgenome.org/cattle/maps/db.html)を参照のこと。したがって、ウシのSNPを標的化するのに本発明を応用してもよい。当業者は、SNPを標的化するために上記の手順を利用してもよく、たとえばTanらやHeoらが記載しているように、それらをウシのSNPに応用してもよい。
Qingjian Zouら(Journal of Molecular Cell Biology Advance Access published October 12, 2015)は、イヌのミオスタチン(MSTN)遺伝子(骨格筋量の負の調節因子)の第1エクソンを標的化することによってイヌの筋量が増えたことを示した。まず、MSTNを標的化するsgRNAをCas9ベクターと同時にイヌの胚線維芽細胞(CEF)に同時導入することにより、sgRNAの効率を検証した。その後、正常な形態を持つ胚をCas9 mRNAとMSTN sgRNAとの混合物と共に微量注入し、同じ雌イヌの卵管に接合子を自家移植することにより、MSTNを欠損した(KO)イヌを作成した。欠損型仔イヌは、同じ母親から産まれた野生型の雌イヌに比べて大腿部に明らかな筋肉表現型を示した。これを本明細書で提供するCRISPR-C2c1システムを用いて行うこともできる。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
家畜
家畜のウイルス標的としては、実施態様によっては、(たとえば、ブタマクロファージの)ブタCD163が挙げられる。CD163は、PRRSv(ブタ繁殖・呼吸障害症候群ウイルス、アルテリウイルス)による感染(ウイルス細胞の侵入によると考えられている)に関連する。PRRSvによる感染、特にブタ肺胞マクロファージ(肺に見られる)の感染は、家畜ブタに繁殖障害、体重減少、高い死亡率などの苦痛を引き起こす、以前は不治であったブタの症候群(「ブタミステリー病(Mystery swine disease)」または「青耳病(blue ear disase)」)につながる。流行性肺炎、髄膜炎、耳の浮腫などの日和見感染症は、マクロファージ活性の喪失による免疫不全が原因で見られることが多い。また、抗生物質の使用の増加と経済的損失(年間推定6億6000万ドル)により、経済的・環境的に重大な影響を及ぼす。
Kristin M WhitworthとDr Randall Pratherら(Nature Biotech 3434 (2015年12月7日にオンラインで公開))によって報告されたように、ミズーリ大学で、Genus Plcと共同で、CRISPR-Cas9を用いてCD163を標的化した。編集されたブタの子孫は、PRRSvに曝露したとき抵抗性があった。1匹の雄の初代動物と1匹の雌の初代動物(いずれもCD163のエクソン7に変異を持つ)とを繁殖させて子孫を作った。雄の初代動物は一方の対立遺伝子のエクソン7に11bpの欠失を持っていたため、ドメイン5のアミノ酸45でフレームシフト変異およびミスセンス翻訳が起こり、続いてアミノ酸64で中途終止コドンが生じた。もう一方の対立遺伝子はエクソン7に2bpの付加と、その前のイントロンに377bpの欠失を持っており、これによってドメイン5の最初の49アミノ酸が発現され、続いてアミノ酸85で中途終止コドンが生じると予測された。雌ブタは、翻訳されたときにドメイン5の最初の48アミノ酸を発現すると予測された一方の対立遺伝子に7bpの付加を持っており、続いてアミノ酸70で中途終止コドンを持っていた。雌ブタのもう一方の対立遺伝子は増幅できなかった。選択された子孫は、欠損動物(CD163_/_)、すなわちCD163欠損型であると予測された。
したがって、実施態様によっては、ブタ肺胞マクロファージをCRISPRタンパク質で標的化してもよい。実施態様によっては、ブタCD163をCRISPRタンパク質で標的化してもよい。実施態様によっては、DSBの誘導、あるいは上記のうちの1つ以上を含む、挿入もしくは欠失(たとえばエクソン7の標的欠失または改変)または遺伝子のその他の領域(たとえばエクソン5の欠失または改変)によってブタCD163を欠損させてもよい。
編集されたブタおよびその子孫、たとえばCD163欠損ブタも想定される。これは、畜産、育種、またはモデル化(すなわちブタモデル)の目的のためであってもよい。遺伝子欠損を含む精液も提供される。
CD163は、スカベンジャー受容体システインリッチ(SRCR)スーパーファミリーのメンバーである。in vitro研究に基づけば、このタンパク質のSRCRドメイン5はウイルスゲノムの脱殻(unpackaging)と放出に関与するドメインである。したがって、SRCRスーパーファミリーのその他のメンバーを他のウイルスに対する抵抗性を評価するために標的化してもよい。PRRSVは、哺乳類のアルテリウイルスグループのメンバーでもあり、これにはマウス乳酸デヒドロゲナーゼ上昇ウイルス、サル出血熱ウイルス、ウマ動脈炎ウイルスも含まれる。アルテリウイルスは、重要な病態形成特性、たとえばマクロファージの向性や重篤な疾患および持続感染の両方を引き起こす能力などを共有している。したがって、アルテリウイルス、特にマウス乳酸デヒドロゲナーゼ上昇ウイルス、サル出血熱ウイルスおよびウマ動脈炎ウイルスを、たとえばブタCD163または他の種のそれらの相同体を介して標的化してもよく、マウス、サル、ウマのモデルおよび欠損型も提供される。
実際、この手法をヒトに伝染する可能性のある他の家畜疾患を引き起こすウイルスまたは細菌(たとえばC型インフルエンザ、およびA型インフルエンザのH1N1、H1N2、H2N1、H3N1、H3N2、H2N3として知られる亜型を含むブタインフルエンザウイルス(SIV)株、ならびに上記の肺炎、髄膜炎、および浮腫)に拡張してもよい。
C2c1エフェクタータンパク質を上記の同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識してもよい。実施例によっては、PAMは5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)をCD163遺伝子座に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムはCD163を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、家畜のゲノムを改変することなく、単一のヌクレオチド改変をCD163転写物に導入する。
脱共役タンパク質1 (UCP1)はミトコンドリア内膜に局在し、ATP合成を内膜を通過するプロトン輸送から脱共役することによって熱を発生する。UCP1は、非ふるえ熱発生の重要な要素であり、体脂肪蓄積の調節に最も重要である可能性がある。機能性UCP1遺伝子を欠失したブタ(偶蹄目イノシシ科)は体温調節が不十分で、感冒にかかりやすい。ブタの脂肪蓄積もUCP1の欠如に関連している可能性があり、したがってブタの生産効率に影響を及ぼす。Zhengらは、CRISPR/Cas9を介した、相同組換え(HR)に依存しない手法を応用してマウスのアディポネクチン-UCP1をブタの内在性UCP1遺伝子座に効率的に挿入したことについて報告した。
UCP1組込み(KI)ブタは、急激な寒冷曝露中、より高い体温維持能力を示したが、生理活性水準または一日の総エネルギー支出(DEE)には変化がなかった。白色脂肪細胞(WAT)でのUCP1の異所性発現により、脂肪堆積量が4.89%、大幅に減少し(P<0.01)、その結果、除脂肪枝肉率(CLP)が増加した(P<0.05)。機構研究により、WATでのUCP1活性化による脂肪減少が脂肪分解に関連していたことが示された。本発明で開示するCRISPR-C2c1システムをZhengらの文献に記載されているような同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識してもよい。C2c1タンパク質について、実施態様によっては、PAMは5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。特定の実施態様では、CRISPR-C2c1システムを用いて外来性の鋳型DNA配列をUCP1遺伝子座のねじれ型DSBにHRまたはHRに依存しない機構(NHEJなど)によって導入してもよい。
Niuら(DOI: 10.1126/science.aan4187)は、CRISPR-Cas9システムを用いた体細胞核移植によりブタ内在性レトロウイルス(PERV)を不活化した家畜ブタについて報告した。異種移植は、ヒトへの移植用の臓器の不足を軽減するための有望な方策である。1つの主なリスクは、ブタには無害だがヒトには致命的となる可能性のあるブタ内在性レトロウイルス(PERV)の種間伝染である。CRISPR-Cas9を用いて、不死化したブタ細胞株のPERV活性を不活化し、体細胞核移植によってPERV不活化ブタを生成することが記載されている。Wuら(Scientific Reports 7, Article number: 10487 (2017) doi:10.1038/s41598-017-08596-5)は、PDX1遺伝子を標的とするCas9 mRNAおよび二重sgRNA(キメラに適応性のあるヒト多能性幹細胞と組み合わせると、ブタにおけるヒト組織および臓器の異種生成に適した基盤として機能する可能性がある)を胚に共送達することでブタ胚における膵臓形成を効率的に無効化することについて報告した。Zhouら(Hum Mutat 37:110-118, 2016)は、ブタ胚で一本鎖DNAを鋳型として用いてCRISPR-Cas9によって誘導したHDRを介して正確なオーソロガス(=遺伝子が共通祖先からの種分化に由来する)ヒト変異(Sox10 c.A325>T)を持つ遺伝子改変ブタが80%もの高効率で得られたことを報告した。本明細書で開示するCRISPR-C2c1システムをNiuら、Wuら、Zhouらの文献に記載されているのと似たシステムに応用して家畜ブタを作成してもよい。特定の実施態様では、CRISPR-C2c1システムはウイルス抵抗性関連遺伝子を改変する。実施態様によっては、CRISPR-C2c1システムは疾患関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜のバイオマス関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜の形質関連遺伝子を改変する。特定の実施態様では、形質関連遺伝子は体脂肪蓄積の調節に関与する。実施態様によっては、形質関連遺伝子は特定のタンパク質の発現の調節に関与し、このようなタンパク質は食物アレルギーに関連する。特定の実施態様では、CRISPR-C2c1システムはUCP1遺伝子座を改変する。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識する。実施態様によっては、PAMは5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは目的の標的遺伝子座を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、家畜のゲノムを改変することなく、CRISPR-C2c1システムは単一のヌクレオチド改変を目的の標的遺伝子座の転写物に導入する。
Gaoら(Genome Biology 201718:13, doi:10.1186/s13059-016-1144-4)は、ウシの選択された遺伝子座に単一のCRISPR-Cas9ニッカーゼ(Cas9n)を用いて遺伝子挿入を誘導した結核(TB)抵抗性家畜ウシについて報告した。触媒的に不活性なCas9タンパク質の主な結合部位を、クロマチン免疫沈降配列決定(ChIP-seq)を用いてウシ胎児線維芽細胞(BFF)で決定した。続いて、CRISPR-Cas9nによって誘導した一本鎖切断を用いて、天然の抵抗性関連マクロファージタンパク質1 (NRAMP1)遺伝子の挿入を刺激した。体細胞核移植によってTB抵抗性家畜を得た。Carlsonら(Nat Biotechnol. 2016 May 6;34(5):479-81. doi: 10.1038/nbt.3560) は、転写活性化因子様エフェクターヌクレアーゼ(TALEN)を用いてPOLLED遺伝子の対立遺伝子をウシ胚線維芽細胞のゲノムに挿入した後、体細胞核移植によって遺伝子操作された細胞株をクローン化し、胚をレシピエントウシに移植して角のない家畜乳牛を得たことについて報告した。本明細書に開示するCRISPR-C2c1システムを、家畜ウシの作成においてGaoらやCarlsonらの文献に記載されているのと似たシステムに応用してもよい。特定の実施態様では、CRISPR-C2c1システムはウイルス抵抗性関連遺伝子を改変する。実施態様によっては、CRISPR-C2c1システムは疾患関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜のバイオマス関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜の形質関連遺伝子を改変する。実施態様によっては、形質関連遺伝子は特定のタンパク質の発現の調節に関与し、このようなタンパク質は食物アレルギーに関連する。特定の実施態様では、形質関連遺伝子は体脂肪蓄積の調節に関与する。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識する。実施態様によっては、PAMは5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。実施態様によっては、C2c1エフェクタータンパク質は1つ以上の変異を含む。実施態様によっては、C2c1エフェクタータンパク質はニッカーゼである。特定の実施態様によっては、CRISPR-C2c1システムは目的の標的遺伝子座を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、家畜のゲノムを改変することなく、単一のヌクレオチド改変を目的の標的遺伝子座の転写物に導入する。
2つのニワトリ遺伝子、卵白アルブミン(OVA)およびオボムコイド(OVM)が卵白アレルギーに関連することが示されている。OVAおよびOVMの遺伝子破壊により、卵のアレルギー誘発性が低下し、それによって卵白を含む食品やワクチンなどの品目に敏感な個体の免疫反応を低下させる可能性がある。Oishiら(Scientific Reports 6, Article number: 23980 (2016) doi:10.1038/srep23980)は、CRISPR/Cas9を介したニワトリの遺伝子標的化について報告した。培養ニワトリ始原生殖細胞(PGC)で、Cas9をコードする環状プラスミドと、単一ガイドRNAと、薬剤抵抗性をコードする遺伝子とを導入して2つの卵白遺伝子、卵白アルブミンとオボムコイドを効率的(>90%)に変異誘発し、続いて一過性抗生物質選択を行った。CRISPRで誘導した変異型オボムコイドPGCをレシピエントニワトリ胚に移植し、3羽の生殖細胞系列のキメラ雄ニワトリ(G0)を確立した。すべての雄ニワトリはドナー由来の変異オボムコイド精子を有しており、ドナー由来の配偶子の伝達率が高い2羽から次世代(G1)のドナー由来子孫の約半数としてヘテロ接合性の変異オボムコイドニワトリが得られた。G1変異ニワトリを交配し、オボムコイドホモ接合型の変異子孫(G2)を作成した。
鳥類の遺伝子組換えの伝統的な方法は、胚盤葉のレトロウイルス感染または始原生殖細胞(PGC)のex vivo操作の後にレシピエント胚へ再び細胞注入することを含む。哺乳類系とは異なり、鳥類の胚性PGCは、それらが精子または卵子産生細胞になる性腺までの経路を血管系を通って移動する。Tyackら(Transgenic Res. 2013 Dec;22(6):1257-64. doi: 10.1007/s11248-013-9727-2)は、Tol2トランスポゾンおよびトランスポザーゼプラスミドと複合化したリポフェクタミン2000を用いてin vivoで安定にPGCを形質転換し、トランスポゾンが持つレポーター遺伝子を発現する遺伝子組換え子孫を作成する、PGCの形質転換方法について記載した。本明細書に開示するCRISPR-C2c1システムを家畜家禽類の作成においてOishiらの文献に記載されているのと似たシステムに応用してもよい。特定の実施態様では、CRISPR-C2c1システムはウイルス抵抗性関連遺伝子を改変する。実施態様によっては、CRISPR-C2c1システムは疾患関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜のバイオマス関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜の形質関連遺伝子を改変する。実施態様によっては、形質関連遺伝子は特定のタンパク質の発現の調節に関与し、このようなタンパク質は食物アレルギーに関連する。特定の実施態様では、形質関連遺伝子体脂肪蓄積の調節に関与する。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識する。実施態様によっては、PAMは5' TTN 3'または5' ATTN 3'(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5'末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。実施態様によっては、C2c1エフェクタータンパク質は1つ以上の変異を含む。実施態様によっては、C2c1エフェクタータンパク質はニッカーゼである。特定の実施態様によっては、CRISPR-C2c1システムは目的の標的遺伝子座を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、家畜のゲノムを改変することなく、単一のヌクレオチド改変を目的の標的遺伝子座の転写物に導入する。
動物モデル
本発明は、in vivo、ex vivo、およびin vitroの動物モデルおよび細胞モデルを開発するのに用いられてもよいCRISPR-Casシステムを提供する。
Niuら(Cell. 2014 Feb 13;156(4):836-43. doi: 10.1016/j.cell.2014.01.027)は、ヒトの疾患の研究や治療方策の開発にとって重要なモデル種として役立つ可能性のあるサルモデルを開発したが、CRISPR/Cas9システムを応用することで所望の標的部位で遺伝子改変された動物を作成することは難しいため、生物医学研究にサルを用いることは著しく妨げられてきた。そのシステムによって2つの標的遺伝子(Ppar-γおよびRag1)を一工程で同時破壊することができ、包括的解析で非特異的変異誘発は検出されなかった。
Wangら(Cell. 2013;153(4):910-8)は、受精した接合子にCas9mRNAおよびsgRNAを直接注入することで、単一変異マウスの場合は95%、または二重変異マウスの場合は70~80%の高効率で胚性幹細胞(ESC)遺伝子導入モデルを作成したことを記載した。マウス接合子細胞における様々なマウスモデルがYen et al, Dev Biol. 2014;393(1):3-9、Aida et al. Biol. 2015;16(1):87、Inui et al., Sci Rep. 2014;4:5396、Yang et al. Cell. 2013;154(6):1370-9に記載されている。幹細胞のex vivo改変を含む移植疾患モデルでは、たとえばEμ-Mycリンパ腫のp53を標的化するsgRNAを用いて生殖細胞変異を起こす代替方法が提供されている。Heckl et al, Nat Biotechnol. 2014;32(9):941-946、Chen et al. Cell. 2015;160(6):1246-1260を参照のこと。
一側面では、本発明は中枢神経系の腫瘍、特に神経線維腫症1型(NF1)神経遺伝病により誘導される腫瘍の治療を提供する。NF1を持つ個体はNF1遺伝子の生殖細胞変異を持って生まれるが、自閉症や注意欠陥から脳および末梢神経鞘腫瘍に至るまで、多くの様々な神経障害を発症する可能性がある。本発明を用いて、患者に特異的な疾患モデルを開発し、同質遺伝子の基礎環境で人工多能性幹細胞(iPSC)由来の疾患関連細胞を研究してもよい。人工多能性幹細胞またはiPSCとしても知られる胚性幹細胞(ESC)様細胞を成人患者の皮膚または血液細胞から作成することができる。最近の研究努力により、iPS細胞を中枢神経系および末梢神経系(CNSおよびPNS)の様々な細胞型(これらはNF1患者で影響を受ける)に分化させる培養手順の開発が開始されている。本発明のCRISPR C2c1システムを用いて、既存の変異遺伝子を修復する、または新たな変異を起こすことで特定の疾患遺伝子を遺伝的に編集してもよい。NF1研究の最前線に立つためには、Children's National Medical CenterのGilbert Family Neurofibromatosis Institute (GFNI)がこれらの最近の興味深い研究開発を調査し、患者に特異的なヒトNF1疾患モデルを体系的に開発し、個々のNF患者の薬物選別と評価のための手段を提供することが重要である。
一側面では、本発明は誘導可能な疾患モデルを開発する方法を提供する。
Plattら(Cell. 2014;159(2):440-55.)はCre依存性CAG-LSL-Cas9組込み導入遺伝子を開発し、「一体化型」のドキシサイクリン(dox)誘導性構築物を生成して、動物の生殖細胞系にsgRNAとCas9の両方を与えた。Cre依存モデルにより、CRISPRを介した標的化を既存のCreを介したシステムに単純に組み込むことができ、強力なCAGプロモーターの下流に強く広範なCas9発現が得られる。dox誘導性モデルにより、個々の組織または複数の組織のいずれも標的化することができ、このモデルは外来sgRNAを送達する能力によって制限されず、遺伝子改変後にCas9発現を消滅させる手段を提供する。いずれの手法も複数の組織で非常に高い単一または多重遺伝子改変効率を示し、従来の遺伝子欠損に見られる表現型の結果を再現する。それぞれが外因的または動物の生殖細胞系列を介したsgRNAの送達に適しているが、重要なことに、ゲノムへのCas9の安定した統合により、大きさが制限されたウイルスカセットに大きなCas9 cDNAを詰め込む複雑さが回避される。
CRISPR/Cas9ゲノム編集によってヒト疾患の一塩基多型(SNP)動物モデルを作成することは、現在はげっ歯類でよく行われている。これらのモデルによってヒト遺伝学について洞察することができ、有望な新治療法を開発することができる。たとえば、ヒトゲノムワイド関連解析(GWAS)により、ヒトの血小板分泌の調節因子であるSTXBP5遺伝子で、病原性である可能性のあるSNP(rs1039084 A > G)が特定された。その後、この変異は、ほぼ同じ血栓症表現型のマウスでCRISPRによって再現されており、ヒトにおけるこのSNPの因果関係を確認することができる(Zhu et al. Arterioscler Thromb Vasc Biol. 2017;37:264-270)。同様に、全ゲノム配列決定を用いて、エストニアの集団ベースのバイオバンクでGWAS が行われた。原因である可能性のある複数の多様体および根本的な機構が特定された。そのうちの1つは、好塩基球の産生に必要な調節要素であり、それはこの過程の間に特異的に作用し、転写因子CEBPAの発現を調節する。この転写促進因子を、造血幹細胞および前駆細胞でCRISPR/Cas9によって混乱させ、好塩基球分化中にCEBPA発現を特異的に調節することが実証された(Guo et al. Proc Natl Acad Sci. 2016;114:E327-E336. doi: 10.1073/pnas.1619052114)。本明細書に開示するCRISPR-C2c1システムをZhuら、Niuら、およびWangらなどの文献に記載されている混乱・破壊システムに記載されている方法と共に用いてもよい。実施態様によっては、動物モデルはヒト以外の真核細胞を含む。実施態様によっては、動物モデルはヒト以外の哺乳動物細胞を含む。実施態様によっては、動物モデルは霊長類細胞を含む。特定の実施態様では、動物モデルは魚、ゼブラフィッシュ、類人猿、チンパンジー、マカク、マウス、ウサギ、ラット、イヌ、ウシ、ヒツジ、ヤギ、またはブタの細胞が含まれる。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識する。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。好ましい実施態様では、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにNHEJによって導入する。実施態様によっては、C2c1エフェクタータンパク質は1つ以上の変異を含む。実施態様によっては、C2c1エフェクタータンパク質はニッカーゼである。特定の実施態様によっては、CRISPR-C2c1システムは目的の標的遺伝子座を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、家畜のゲノムを改変することなく、単一のヌクレオチド改変を目的の標的遺伝子座の転写物に導入する。
治療用途
明らかなことだが、本システムを用いて任意の目的ポリヌクレオチド配列を標的化することができると想定される。本発明は、標的細胞をin vivo、ex vivo、もしくはin vitroで改変するのに用いるための、非天然もしくは操作された組成物、または前記組成物の成分をコードする1つ以上のポリヌクレオチド、または前記組成物の成分をコードする1つ以上のポリヌクレオチドを含むベクターもしくは送達システムを提供する。本発明を、細胞を変化させ、一度改変されるとCRISPR改変細胞の子孫もしくは細胞株は変更された表現型を保持するような形で実行してもよい。改変された細胞および子孫は、所望の細胞型にCRISPRシステムをex vivoもしくはin vivoで応用した多細胞生物(たとえば植物もしくは動物)の一部分であってもよい。CRISPR発明は治療方法であってもよい。治療方法は、遺伝子もしくはゲノム編集、または遺伝子治療を含んでいてもよい。
細菌、真菌、寄生虫病原体などの病原体の処置
本発明を細菌、真菌、および寄生虫病原体の処置にも応用してもよい。ほとんどの研究努力を新たな抗生物質の開発に集中してきたが、一旦開発されると薬物抵抗性という同じ問題に直面する。本発明は、それらの困難を解決するCRISPRに基づく新たな代替物を提供する。さらに、既存の抗生物質とは異なり、CRISPRに基づく処置は病原体特異的に行うことができ、有益な細菌を避けながら標的病原体の細菌細胞死を誘導する。
Jiangら(“RNA-guided editing of bacterial genomes using CRISPR-Cas systems (RNA誘導下のCRISPR-Casシステムを用いた細菌ゲノムの編集),” Nature Biotechnology vol. 31, p. 233-9, March 2013)は、CRISPR-Cas9システムを用いて肺炎球菌(S. pneumoniae)および大腸菌(E. coli)を変異または死滅させた。ゲノムに正確な変異を導入したこの研究では標的ゲノム部位での二重RNA:Cas9による切断に頼って未変異の細胞を死滅させ、選択可能なマーカーまたは対抗選択システムの必要性が回避された。CRISPRシステムは、抗生物質抵抗性を逆転させ、株間の抵抗性の伝達を排除するために用いられてきた。Bickard らは、病原性遺伝子を標的とするように再プログラムされたCas9は、病原性の黄色ブドウ球菌(S. aureus)を死滅させるが非病原性の黄色ブドウ球菌は死滅させないことを示した。抗生物質抵抗性遺伝子を標的とするようにヌクレアーゼを再プログラムすると、抗生物質抵抗性遺伝子を含むブドウ球菌プラスミドが破壊され、プラスミド由来の抵抗性遺伝子の拡散に対して免疫化された(Bikard et al., “Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials (配列特異的な抗菌剤を作成するためのCRISPR-Casヌクレアーゼの利用),” Nature Biotechnology vol. 32, 1146-1150, doi:10.1038/nbt.3043(2014年10月5日にオンラインで公開)を参照のこと)。Bikardは、CRISPR-Cas9抗菌剤はマウスの皮膚コロニー形成モデルで黄色ブドウ球菌(S.aureus)を死滅させるようin vivoで機能することを示した。同様に、YosefらはCRISPRシステムを使用して、β-ラクタム系抗生物質への抵抗性を付与する酵素をコードする遺伝子を標的化した(Yousef et al., “Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria (抗生物質抵抗性の細菌を感作かつ死滅させるようプログラムされた溶原性・溶菌性バクテリオファージ),” Proc. Natl. Acad. Sci. USA, vol. 112, p. 7267-7272, doi: 10.1073/pnas.1500107112(2015年5月18日にオンラインで公開)を参照のこと)。
CRISPRシステムを用いて、他の遺伝学的手法には抵抗性のある寄生虫のゲノムを編集することができる。たとえば、CRISPR-Cas9システムはネズミマラリア原虫(Plasmodium yoelii)ゲノムで二本鎖切断を誘導することがわかった(Zhang et al., “Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 system,” mBio. vol. 5, e01414-14, Jul-Aug 2014)。Ghorbalら(“Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system (CRISPR-Cas9システムを用いたヒトマラリア寄生虫(熱帯熱マラリア原虫、Plasmodium falciparum)のゲノム編集),” Nature Biotechnology, vol. 32, p. 819-821, doi: 10.1038/nbt.2925(2014年6月1日にオンラインで公開))は、2つの遺伝子orc1およびkelch13(それぞれ、アルテミシニンに対する抵抗性の遺伝子抑制および発生の役割を果たすと推定される)を改変した。適切な部位で改変された寄生虫は、改変に関する直接的な選択がないにもかかわらず非常に高い効率で回収された。これは、このシステムを用いて中立または有害な変異さえ起こすことができることを示している。CRISPR-Cas9は、トキソプラズマ原虫(Toxoplasma gondii)などのその他の病原性寄生虫のゲノムを改変するためにも用いられる(Shen et al., “Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9 (CRISPR/CAS9を用いたトキソプラズマ原虫の様々な株における効率的な遺伝子破壊),” mBio vol. 5:e01114-14, 2014;およびSidik et al., “Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9 (CRISPR/Cas9を用いたトキソプラズマ原虫の効率的なゲノム操作),” PLoS One vol. 9, e100450, doi: 10.1371/journal.pone.0100450(2014年6月27日にオンラインで公開)を参照のこと)。
Vyasら(“A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families (カンジダ・アルビカンス(Candida albicans)のCRISPRシステムにより必須遺伝子および遺伝子ファミリーの遺伝子操作が可能である),” Science Advances, vol. 1, e1500248, DOI: 10.1126/sciadv.1500248, April 3, 2015)はCRISPRシステムを採用して、カンジダ・アルビカンス(C. albicans)の遺伝子操作にとって長期にわたる障壁を克服し、いくつかの異なる遺伝子の両方のコピーを一実験で効率的に変異させた。いくつかの機構が薬剤抵抗性に関与する生物で、Vyasは、ホモ接合性の二重変異体を作成したが、それらは親の臨床分離株Can90によるフルコナゾールもしくはシクロヘキシミドに対する過剰な抵抗性をもはや示さなかった。Vyasはさらに、条件付き対立遺伝子を作成することによってC.アルビカンスの必須遺伝子でホモ接合性の機能欠失変異を得た。リボソームRNA処理に必要なDCR1の欠損対立遺伝子は、低温では致死的であるが高温では生存可能である。Vyasは、ナンセンス変異を導入する修復鋳型を使用し、dcr1/dcr1変異体を単離したが、それらは16°Cで増殖することができなかった。
本発明は、染色体遺伝子座を破壊することによって熱帯熱マラリア原虫に使用するためのCRISPRシステムを提供する。Ghorbalら(“Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system (CRISPR-Cas9システムを用いたヒトマラリア寄生虫(熱帯熱マラリア原虫、Plasmodium falciparum)のゲノム編集)”, Nature Biotechnology, 32, 819-821 (2014), DOI: 10.1038/nbt.2925, June 1, 2014)はCRISPRシステムを採用して、マラリアのゲノムに特異的遺伝子欠損と1ヌクレオチドの置換を導入した。CRISPR-Cas9システムを熱帯熱マラリア原虫に適応させるため、GhorbalらはpUF1-Cas9エピソーム(薬剤選択性マーカーydhodhも有し、それによって熱帯熱マラリア原虫ジヒドロオロト酸デヒドロゲナーゼ(PfDHODH)阻害剤であるDSM1に対する抵抗性を付与する)でマラリア原虫の調節配列の制御下で発現するための発現ベクターを作成し、sgRNAの転写のために熱帯熱マラリア原虫U6核内低分子(sn)RNA調節配列を用い、ガイドRNAと相同組換え修復のためのドナーDNA鋳型とを同じプラスミドpL7に配置した。Zhang C.らの文献(“Efficient editing of malaria parasite genome using the CRISPR/Cas9 system (CRISPR/Cas9システムを用いたマラリア原虫ゲノムの効率的な編集)”, MBio, 2014 Jul 1; 5(4):E01414-14, doi: 10.1128/MbIO.01414-14)およびWagnerらの文献(“Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum (CRISPR-Cas9を介した熱帯熱マラリア原虫の効率的なゲノム編集), Nature Methods 11, 915-918 (2014), DOI: 10.1038/nmeth.3063)も参照のこと。
一側面では、本発明は、A/Tに富むゲノムを持つ生物(たとえば熱帯熱マラリア原虫)の染色体遺伝子座を破壊する方法を提供する。実施態様によっては、本発明のCRISPRシステムはCRISPR-C2c1システムを包含し、C2c1タンパク質は7ヌクレオチドのねじれ型切断を標的部位に起こし、PAM配列はTに富む配列である(Gardner et al., Nature. 2002;419:531-534)。当業者は、Jiangら、Bikardら、Yosefら、Vyasら、Ghoberら、Zhangら、およびWagnerらの文献に記載されているような方法を本明細書に開示するCRISPR-C2c1システムと共に用いてA/Tに富むゲノムに配列破壊を導入してもよい。
特定の実施態様では、CRISPR-C2c1複合体によって、目的の遺伝子座を鋳型DNA配列の挿入すなわち「組込み」によって改変する。特定の実施態様では、DNA挿入物は、適切な配向でゲノムに組み込まれるように設計される。好ましい実施態様では、目的の遺伝子座は相同性指向修復(HDR)機構を介したゲノム編集が特に難しい非分裂細胞でCRISPR-C2c1システムによって改変される(Chan et al., Nucleic acids research. 2011;39:5955-5966)。Marescaら(Genome Res. 2013 Mar; 23(3): 539-546)は、亜鉛フィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)と共に用いることができる部位特異的な正確な挿入の方法について記載した。ここで、5'末端に突出を有する短い二本鎖DNAが相補性末端に連結され、それによってヒト細胞株で指定の遺伝子座に15 kbの外来性発現カセットを正確に挿入することができる。Heら(Nucleic Acids Res. 2016 May 19; 44(9))は、CRISPR/Cas9で誘導してプロモーターなしの4.6kbのires-eGFP断片をGAPDH遺伝子座に部位特異的に組み込んだところ、NHEJ経路を介した最大20%のGFP陽性細胞が体細胞LO2細胞で得られ、1.70%のGFP陽性細胞がヒト胚性幹細胞で得られたと記載した。同文献はまた、NHEJに基づく組込みは調査したすべてのヒト細胞型において、HDRを介した遺伝子標的化よりも効率的であると報告した。C2c1は5'末端が突出したねじれ型切断を発生させるため、当業者は、本明細書に開示するCRISPR-C2c1システムを用いて目的の遺伝子座に外来DNAを挿入するためにMerescaらおよびHeらの文献に記載されているのと似た方法を用いることができる。
特定の実施態様では、目的の遺伝子座はまずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、PAM配列付近でCRISPR-C2c1システムによってさらに改変され、HDRによって修復される。特定の実施態様では、目的の遺伝子座は、変異、欠失、または外来DNA配列の挿入をHDRを介して導入することによってCRISPR-C2c1システムにより改変される。実施態様によっては、目的の遺伝子座は変異、欠失、または外来DNA配列の挿入をNHEJを介して導入することによってCRISPR-C2c1システムにより改変される。好ましい実施態様では、外来DNAは、3'末端と5'末端の両方で単一ガイドDNA(sgDNA)-PAM配列に隣接している。好ましい実施態様では、外来DNAはCRISPR-C2c1切断の後に放出される。
ウイルス病原体(HIVなど)などの病原体に対する治療
Casを介したゲノム編集を用いて、非遺伝性または複合疾患に対抗するために体細胞組織に保護的変異を導入してもよい。たとえば、リンパ球中のCCR5受容体をNHEJを介して不活化すること(Lombardo et al., Nat Biotechnol. 2007 Nov; 25(11):1298-306)はHIV感染を回避するための実行可能な方策である可能性があり、一方、PCSK9の欠失(Cohen et al., Nat Genet. 2005 Feb; 37(2):161-5)またはアンジオポエチンの欠失(Musunuru et al., N Engl J Med. 2010 Dec 2; 363(23):2220-7)によってスタチン抵抗性の高コレステロール血症または高脂質血症に対する治療効果が得られる可能性がある。これらの標的は、siRNAを介したタンパク質発現抑制を用いて対処することもできるが、NHEJを介した遺伝子不活化の独自の利点は、治療を継続する必要なく永続的な治療効果を達成できることである。もちろん、すべての遺伝子治療と同様に、提案された各治療用途が好ましい利益対リスク比を有すると証明することは重要である。
修復鋳型と共にCas9とガイドRNAをコードするプラスミドDNAをチロシン血症の成体マウスの肝臓に流体力学的に送達することにより、変異型Fah遺伝子を補正し、およそ250個に1個の細胞で野生型Fahタンパク質の発現から守ることができるとわかった(Nat Biotechnol. 2014 Jun; 32(6):551-3)。さらに、臨床試験では、ZFヌクレアーゼを用いてCCR5受容体をex vivoで欠損させてHIV感染に対抗することに成功した。すべての患者でHIVのDNAレベルが低下し、4人に1人の患者でHIV RNAが検出できなくなった(Tebas et al., N Engl J Med. 2014 Mar 6; 370(10):901-10)。これらの結果はいずれも、新しい治療基盤としてのプログラム可能なヌクレアーゼの可能性を示している。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質に関して、CRISPR-C2c1システムは5'TTN3 'または5'ATTN3'(Nは任意のヌクレオチドである)であるPAM配列を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
別の実施態様では、HIV tat/revが共有する共通のエクソンを標的化するsiRNAを持つ自己不活化レンチウイルスベクターと、核小体を局在化させるTARデコイと、抗CCR5に特異的なハンマーヘッド型のリボザイム(たとえばDiGiusto et al. (2010) Sci Transl Med 2:36ra43を参照のこと)とを本発明のCRISPR-Casシステムに使用し、かつ/または適応させてもよい。患者の体重1キログラムあたり最低2.5×106個のCD34陽性細胞を採取し、2 μmol/Lのグルタミン、幹細胞因子(100 ng/ml)、Flt-3リガンド(Flt-3L)(100 ng/ml)、およびトロンボポエチン(10 ng/ml)(CellGenix)を含むX-VIVO15培地(Lonza)で2×106細胞/mlの密度で16~20時間、前刺激してもよい。前刺激した細胞を、フィブロネクチン(25mg/cm2)を塗布した75cm2組織培養フラスコ(RetroNectin, Takara Bio Inc.)で、感染多重度5で16~24時間レンチウイルスで形質導入してもよい。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)であるPAM配列を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
当技術分野の知識と本開示の教示を用いて、当業者は免疫不全状態(HIV/AIDSなど)に関するHSCを補正することができ、この補正はCCR5を標的化し欠損させるCRISPR-C2c1システムにHSCを接触させることを含む。CCR5を標的化し欠損させるガイドRNA(および好都合には二重ガイド手法、たとえば異なるガイドRNAのペア(たとえば、初代ヒトCD4+T細胞およびCD34+造血幹細胞・前駆細胞(HSPC)で2つの臨床的に関連する遺伝子B2MおよびCCR5を標的化するガイドRNA)とC2c1タンパク質とを含む粒子をHSCと接触させる。このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。以下の文献も参照のこと:Kiem, “Hematopoietic stem cell-based gene therapy for HIV disease (造血幹細胞に基づくHIV疾患遺伝子療法),” Cell Stem Cell. Feb 3, 2012; 10(2): 137-147(同文献が引用する文献と共に参照により本明細書に組み込まれる); Mandal et al, “Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cells using CRISPR/Cas9 (CRISPR/Cas9を用いたヒト造血幹細胞およびエフェクター細胞における効率的な遺伝子切断),” Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014(同文献が引用する文献と共に参照により本明細書に組み込まれる)。Ebina, “CRISPR/Cas9 system to suppress HIV-1 expression by editing HIV-1 integrated proviral DNA (HIV-1組込みプロウイルスDNAの編集によりHIV-1発現を抑制するCRISPR/Cas9システム)” SCIENTIFIC REPORTS | 3 : 2510 | DOI: 10.1038/srep02510(同文献が引用する文献も併せて本明細書に組み込まれる)も、CRISPR-C2c1システムを用いたHIV/AIDSへの別の対抗手段として参照する。C2c1タンパク質について、CRISPR-C2c1システムは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)であるPAM配列を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
ゲノム編集のHIV治療に関する根拠は、ウイルスの細胞補助受容体であるCCR5の機能喪失変異についてホモ接合性である個体が感染に対して高い抵抗性を持ち、そうでなければ健康であるという所見に由来しており、ゲノム編集でこの変異を模倣することは安全かつ有効な治療方策であることが示唆される[Liu, R., et al. Cell 86, 367-377 (1996)]。この考えは、HIV感染患者が機能喪失CCR5変異についてホモ接合性のドナーから同種骨髄移植を受けたときに臨床的に検証され、検出不可能なレベルのHIVと正常なCD4 T細胞数の回復が得られた[Hutter, G., et al. The New England journal of medicine 360, 692-698 (2009)]。コストおよび移植片対宿主病の可能性が原因で、骨髄移植はほとんどのHIV患者にとって現実的な治療方策ではないが、患者自身のT細胞をCCR5に変換するHIV療法が望まれる。
ZFNとNHEJを用いてHIVのヒト化マウスモデルでCCR5を欠損させた初期の研究では、CCR5編集CD4 T細胞の移植によりウイルス負荷およびCD4 T細胞数が改善されることが示された[Perez, E.E., et al. Nature biotechnology 26, 808-816 (2008)]。重要なことに、これらのモデルは、HIV感染によってCCR5欠損細胞の選択が起こることも示しており、編集によって適応度の利点が得られ、編集された少数の細胞が治療効果を生じることができる可能性があると示唆している。
このことと他の有望な前臨床研究の結果として、患者のT細胞のCCR5を欠損させるゲノム編集療法が現在、ヒトで試験されている[Holt, N., et al. Nature biotechnology 28, 839-847 (2010); Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013)]。最近の第I相臨床試験では、HIV患者のCD4+T細胞を取り出し、CCR5遺伝子を欠損させるように設計されたZFNで編集し、患者に自家移植した[Tebas, P., et al. The New England journal of medicine 370, 901-910 (2014)]。
別の研究(Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014)では、CRISPR-Cas9はヒトCD4+細胞およびCD34+造血幹細胞・前駆細胞(HSPC)で2つの臨床的に関連する遺伝子B2MおよびCCR5を標的化している。単一RNAガイドを用いることにより、HSPCでは高効率な変異誘発が起こったが、T細胞では起こらなかった。二重ガイド手法によって両方の細胞型で遺伝子欠失の有効性が向上した。CRISPR-Cas9でゲノム編集したHSPCは多分化能を保持していた。予測された特異的および非特異的変異をHSPCでの標的捕捉配列決定によって調べ、少量の非特異的変異誘発が1つの部位でのみ観察された。これらの結果は、CRISPR-Cas9がHSPCで遺伝子を効率的に、最小限の非特異的変異誘発しか伴わずに切断できることを示している。これは、造血細胞に基づく治療に幅広く応用することができる。
Wangら(PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987)は、CRISPRと会合したタンパク質9(Cas9)および単一誘導RNA(ガイドRNA)とCas9およびCCR5ガイドRNAを発現するレンチウイルスベクターとを用いてCCR5を発現抑制した。Wangらは、Cas9およびCCR5ガイドRNAを発現するレンチウイルスベクターをHIV-1に感受性のあるヒトCD4+細胞に一回形質導入すると、高頻度のCCR5遺伝子破壊が得られることを示した。CCR5遺伝子を破壊された細胞はR5指向性HIV-1(伝達/初代(T/F)HIV-1分離株を含む)に抵抗性を持つだけでなく、R5指向性HIV-1感染中、CCR5を破壊されていない細胞に対し選択優位性を持っていた。安定に形質導入された細胞では、これらのCCR5ガイドRNAに高い相同性を持つ潜在的な非特異的部位でのゲノム変異は、形質導入の84日後でもT7エンドヌクレアーゼI検定で検出されなかった。
Fineら(Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777)は、化膿性連鎖球菌(S. pyogenes)Cas9 (SpCas9)タンパク質の複数の断片を発現する2カセットシステムを確認した。これらの断片を細胞内でスプライス(継ぎ合わせ)して、部位特異的DNA切断を行うことができる機能性タンパク質を形成する。特異的なCRISPRガイド鎖を用いて、Fineらは単一のCas9として、さらに一対のCas9ニッカーゼとして、ヒトHEK-293T細胞中のHBBおよびCCR5遺伝子の切断におけるこのシステムの有効性を示した。トランススプライスされたSpCas9(tsSpCas9)は、標準的な遺伝子導入用量で、野生型SpCas9(wtSpCas9)に比べて約35%のヌクレアーゼ活性を示したが、より少ない投与量では活性が大幅に低下した。wtSpCas9に比べてtsSpCas9の翻訳領域の長さが大幅に短縮されているため、組織特異的プロモーター、多重ガイドRNA発現、およびSpCas9へのエフェクタードメイン融合など、より複雑かつより長い遺伝子要素をAAVベクターに組み込むことができる可能性がある。
Liら(J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8)は、CRISPR-Cas9が細胞株のCCR5遺伝子座の編集を効率的に媒介し、細胞表面でのCCR5発現を欠損させることができることを実証した。次世代配列決定により、CCR5の予測される切断部位の周囲に様々な変異が導入されていることが明らかになった。分析された3つの最も効果的なガイドRNAのそれぞれについて、上位15の潜在的な部位では有意な非特異的作用は検出されなかった。CRISPR-Cas9成分を持つキメラAd5F35アデノウイルスを構築して、Liらは初代CD4+Tリンパ球を効率的に形質導入し、CCR5発現を破壊し、陽性に形質導入された細胞にHIV-1抗体性を付与した。
当業者は、本発明のCRISPR CasシステムでCCR5を標的化するために、上記の、たとえばHolt, N., et al. Nature biotechnology 28, 839-847 (2010)、Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013)、Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014、Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987)、Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777)、およびLi et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8)の研究を利用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列を5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)を認識してもよい。なお、Tに富むPAMによって本発明を非分裂細胞および組織に応用することができる。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を転写物に導入する。
ウイルス病原体(HBVなど)などの病原体に対する治療
本発明をB型肝炎ウイルス(HBV)に対する治療に応用してもよい。しかし、RNAiの欠点、たとえば内在性の低分子RNA経路を誇張するリスクなどを回避するように、たとえば用量および配列の最適化(たとえばGrimm et al., Nature vol. 441, 26 May 2006を参照のこと)により、CRISPR Casシステムを適応させなければならない。たとえば、ヒト1人あたり約1~10×1014個の粒子などの低用量が考えられる。別の実施態様では、HBVに対するCRISPR Casシステムをリポソームに入れて、たとえば安定核酸脂質粒子(SNALP)で投与してもよい(たとえば、Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005を参照のこと)。HBVのRNAを標的とするCRISPR CasをSNALPで約1、3、または5mg/kg/日、毎日静脈注射することが考えられる。毎日の治療を約3日間以上、次いで毎週の治療を約5週間にわたり行ってもよい。別の実施態様では、Chenらのシステム(Gene Therapy (2007) 14, 11-19)を本発明のCRISPR Casシステムに使用し、かつ/または適応させてもよい。Chenらは、二本鎖アデノ随伴ウイルス8型偽型ベクター(dsAAV2/8)を用いてshRNAを送達している。HBV特異的shRNAを持つdsAAV2/8ベクターの単回投与(マウス1匹あたり1×1012個のベクターゲノム)により、HBV遺伝子組換えマウスの肝臓中で一定量のHBVタンパク質、mRNA、および複製DNAを有効に抑制し、循環中HBV負荷が最大2~3log10低下した。有意なHBV抑制はベクター投与後少なくとも120日間持続した。shRNAの治療効果は標的配列依存的で、インターフェロンの活性化を伴わなかった。本発明について、HBVに向けられたCRISPR CasシステムをAAVベクター(dsAAV2/8ベクターなど)にクローン化し、たとえばヒト1人あたり約1×1015個~約1×1016個のベクターゲノムの投与量でヒトに投与してもよい。別の実施態様では、本発明のCRISPR CasシステムにWooddellらの方法(Molecular Therapy vol. 21 no. 5, 973-985 May 2013)を使用し、かつ/または適応させてもよい。Woodellらは、肝細胞を標的としたN-アセチルガラクトサミン結合メリチン様ペプチド(NAG-MLP)と凝固因子VII(F7)を標的とする肝臓指向性コレステロール結合siRNA(chol-siRNA)とを単純に共注入すると、マウスおよびヒト以外の霊長類で臨床化学の変化やサイトカインの誘導を伴わずに効率的にF7が効率的に発現抑制されることを示している。HBV感染の一過性遺伝子組換えマウスモデルを用いて、Wooddellらは、NAG-MLPと保存されたHBV配列を標的とする強力なchol-siRNAとを単回共注入することでウイルスRNA、タンパク質、およびウイルスDNAが相互(multilog)に抑制され、効果の持続期間が長いことを示している。本発明について、たとえば約6 mg/kgのNAG-MLPと6 mg/kgのHBV特異的CRISPR Casとを静脈内に共注入することが想定される。その代わりに、約3 mg/kgのNAG-MLPと3 mg/kgのHBV特異的CRISPR Casとを1日目に送達した後、約2~3 mg/kgのNAG-MLPと2~3 mg/kgのHBV特異的CRISPR Casとを2週間後に投与してもよい。
実施態様によっては、標的配列はHBV配列である。実施態様によっては、標的配列は、、エピソームウイルス核酸分子を操作するために生物のゲノムに組み込まれていないエピソームウイルス核酸分子に含まれる。実施態様によっては、エピソーム核酸分子は、二本鎖DNAポリヌクレオチド分子であるか、共有結合性閉環状DNA(cccDNA)である。実施態様によっては、CRISPR複合体は、生物の細胞内のエピソームウイルス核酸分子の量を、複合体を提供しない場合の生物の細胞内のエピソームウイルス核酸分子の量に比べて減少させることができる、またはエピソーム核酸分子の分解を促進するようにエピソームウイルス核酸分子を操作することができる。実施態様によっては、標的HBV配列は生物のゲノムに組み込まれる。実施態様によっては、細胞内で形成された場合、CRISPR複合体は組み込まれた核酸を、生物のゲノムから標的HBV核酸の全体または一部の除去を促すよう操作することができる。実施態様によっては、前記少なくとも1つの標的HBV核酸は、生物のゲノムに組み込まれた二本鎖DNAポリヌクレオチドcccDNA分子および/またはウイルスDNAに含まれ、CRISPR複合体は、ウイルスcccDNAおよび/または組み込まれたウイルスDNAを切断するように少なくとも1つの標的HBV核酸を操作する。実施態様によっては、前記切断は、ウイルスcccDNAに導入および/または組み込まれたウイルスDNAに導入された1つ以上の二本鎖切断を含み、必要に応じて少なくとも2つの二本鎖切断を含む。実施態様によっては、前記切断は、ウイルスcccDNAおよび/または組み込まれたウイルスDNAに導入された1つ以上の一本鎖切断を介し、必要に応じて少なくとも2つの一本鎖切断を介する。実施態様によっては、前記1つ以上の二本鎖切断または前記1つ以上の一本鎖切断により、1つ以上の挿入または欠失変異(INDEL)がウイルスcccDNA配列および/または組み込まれたウイルスDNA配列に発生する。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を目的の標的遺伝子に導入する。
Linら(Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38)は、遺伝子型AのHBVに対する8つのgRNAを設計した。HBV特異的なgRNAを用いて、CRISPR-Cas9システムは、HBV発現ベクターで遺伝子導入したHuh-7細胞におけるHBVコアおよび表面タンパク質の産生量を有意に減少させた。選別された8つのgRNAのうち、有効なものを2つ特定した。1つは、保存されたHBV配列を標的化する、異なる遺伝子型に作用するgRNAである。流体力学によるHBV持続性マウスモデルを用いて、Linらはさらに、このシステムが肝臓内のHBVゲノムを含むプラスミドを切断し、in vivoでのその排除を促すことにより血清中の表面抗原濃度を下げることができることを実証した。これらのデータは、CRISPR-Cas9システムがin vitroとin vivoのいずれにおいてもHBV発現鋳型を破壊することができることを示唆しており、持続性HBV感染を根絶する可能性を示している。
Dongら(Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3)は、CRISPR-Cas9システムを用いてHBVゲノムを標的化し、効率的にHBV感染を阻害した。DongらはHBVの保存領域を標的化する4つの単一ガイドRNA(ガイドRNA)を合成した。これらのガイドRNAがCas9と共に発現することにより、Huh-7細胞およびHBV複製細胞HepG2.2.15におけるウイルス産生量が減少した。Dongらはさらに、CRISPR-Cas9が遺伝子導入細胞のHBV cccDNAに起こった切断および切断を介した変異誘発を指示したことを実証した。HBV cccDNAを持つマウスモデルにガイドRNA-Cas9プラスミドを急速に尾静脈注射すると、cccDNAおよびHBVタンパク質の濃度は低くなった。
Liuら(J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22)は、様々なHBV遺伝子型の保存領域を標的化する、in vitroとin vivoのいずれにおいてもHBV複製を有意に阻害することができる8つのガイドRNA(gRNA)を設計し、CRISPR-Cas9システムを用いてHBV DNA鋳型を破壊する可能性を調査した。HBV特異的なgRNA/C2c1システムは細胞中で様々な遺伝子型のHBVの複製を阻害することができ、ウイルスDNAは単一gRNA/C2c1システムによって有意に減少し、様々なgRNA/C2c1システムの組み合わせによって排除された。
Wangら(World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554)は遺伝子型A~DのHBVに対して15個のgRNAを設計した。HBVの調節領域を含む上記の2つのgRNA(二重gRNA)の11種の組み合わせを選択した。HBV(遺伝子型A~D)複製の抑制に関する各gRNAおよび11種の二重gRNAの効率を、培養上清中のHBV表面抗原(HBsAg)またはe抗原(HBeAg)を測定して調べた。HBV発現ベクターの破壊を、二重gRNAおよびHBV発現ベクターで同時遺伝子導入したHuH7細胞でポリメラーゼ連鎖反応(PCR)および配列決定法を用いて調べ、cccDNAの破壊を、HepAD38細胞でKCl沈殿、プラスミドに安全なATP依存性DNase(PSAD)消化、ローリングサークル増幅、および定量的PCRを組み合わせた方法で調べた。これらのgRNAの細胞傷害性をミトコンドリアテトラゾリウム検定によって評価した。すべてのgRNAは、培養上清中のHBsAgまたはHBeAgの産生量を有意に減少させることができ、これはgRNAが対抗する領域に依存していた。すべての二重gRNAは遺伝子型A~DのHBVのHBsAgおよび/またはHBeAg産生を効率的に抑制することができ、HBsAgおよび/またはHBeAg産生の抑制における二重gRNAの有効性は、単独で使用した単一gRNAと比較して有意に増加した。さらに、PCR直接配列決定により、これらの二重gRNAが、使用した2つのgRNAの切断部位間の断片を除去することでHBV発現鋳型を特異的に破壊することができることを確認した。最も重要なことは、gRNA-5とgRNA-12の組み合わせはHBsAgおよび/またはHBeAgの産生が効率的に抑制することができるだけでなく、HepAD38細胞中に蓄積したcccDNAを破壊することができることである。
Karimovaら(Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734)は、遺伝子型間で保存されている、HBVゲノムのSおよびX領域のHBV配列を特定し、これらをCas9ニッカーゼによる特異的かつ効果的な切断の標的とした。この手法は、レポーター細胞株において、エピソームcccDNAおよび染色体に組み込まれたHBV標的部位を破壊するだけでなく、慢性的感染および新規感染の肝細胞腫の細胞株におけるHBV複製も妨害した。
当業者は、本発明のCRISPR CasシステムでHBVを標的化するために上記の、たとえばLinら(Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38)、Dongら(Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3)、Liuら(J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22)、Wangら(World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554)、およびKarimovaら(Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734)の研究を活用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を転写物に導入する。
慢性B型肝炎ウイルス(HBV)感染は蔓延しており、致命的であり、感染細胞にウイルスエピソームDNA(cccDNA)が持続するため、ほとんど治癒しない。Ramananら(Ramanan V, Shlomai A, Cox DB, Schwartz RE, Michailidis E, Bhatta A, Scott DA, Zhang F, Rice CM, Bhatia SN, .Sci Rep. 2015 Jun 2;5:10833. doi: 10.1038/srep10833、2015年6月2日にオンラインで公開)は、CRISPR/Cas9システムがHBVゲノムの保存領域を特異的に標的化して切断し、ウイルス遺伝子の発現および複製を強力に抑制することができることを示した。Cas9および適切に選択されたガイドRNAの持続的な発現により、Cas9によるcccDNAの切断と、cccDNAならびにウイルス遺伝子の発現および複製のその他の変数の両方の劇的な減少とが実証された。したがって、ウイルスのエピソームDNAを直接標的化することが、ウイルスを制御し、おそらくは患者を治癒させる新規な治療手法であることが示された。このことは、The Broad Instituteらの名前でWO2015089465 A1にも記載されており、その内容は参照により本明細書に組み込まれる。
このような標的化として、実施態様によってはHBVのウイルスエピソームDNAが好ましい。
本発明を病原体、たとえば細菌、真菌、および寄生虫病原体に対する治療に応用してもよい。ほとんどの研究努力を新たな抗生物質の開発に集中してきたが、一旦開発されると薬物抵抗性という同じ問題に直面する。本発明は、それらの困難を解決するCRISPRに基づく新たな代替物を提供する。さらに、既存の抗生物質とは異なり、CRISPRに基づく処置は病原体特異的に行うことができ、有益な細菌を避けながら標的病原体の細菌細胞死を誘導する。
本発明をC型肝炎ウイルス(HCV)に対する治療に応用してもよい。Roelvinkiらの方法(Molecular Therapy vol. 20 no. 9, 1737-1749 Sep 2012)をCRISPR Casシステムに応用してもよい。たとえば、AAV8などのAAVベクターが考えられるベクターであってもよく、たとえば体重1キログラムあたり約1.25×1011~1.25×1013のベクターゲノム(vg/kg)の投与量が考えられる。本発明を病原体、たとえば細菌、真菌、および寄生虫病原体に対する治療に応用してもよい。ほとんどの研究努力を新たな抗生物質の開発に集中してきたが、一旦開発されると薬物抵抗性という同じ問題に直面する。本発明は、それらの困難を解決するCRISPRに基づく新たな代替物を提供する。さらに、既存の抗生物質とは異なり、CRISPRに基づく治療は病原体特異的に行うことができ、有益な細菌を避けながら標的病原体の細菌細胞死を誘導する。実施態様によっては、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を転写物に導入する。
Jiangら(“RNA-guided editing of bacterial genomes using CRISPR-Cas systems (RNA誘導下のCRISPR-Casシステムを用いた細菌ゲノムの編集),” Nature Biotechnology vol. 31, p. 233-9, March 2013)は、CRISPR-Cas9システムを用いて肺炎球菌(S. pneumoniae)および大腸菌(E. coli)を変異または死滅させた。ゲノムに正確な変異を導入したこの研究では標的ゲノム部位での二重RNA:Cas9による切断に頼って未変異の細胞を死滅させ、選択可能なマーカーまたは対抗選択システムの必要性が回避された。CRISPRシステムは、抗生物質抵抗性を逆転させ、株間の抵抗性の伝達を排除するために用いられてきた。Bickardらは、病原性遺伝子を標的とするように再プログラムされたCas9は、病原性の黄色ブドウ球菌(S. aureus)を死滅させるが非病原性の黄色ブドウ球菌は死滅させないことを示した。抗生物質抵抗性遺伝子を標的とするようにヌクレアーゼを再プログラムすると、抗生物質抵抗性遺伝子を含むブドウ球菌プラスミドが破壊され、プラスミド由来の抵抗性遺伝子の拡散に対して免疫化された(Bikard et al., “Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials (配列特異的な抗菌剤を作成するためのCRISPR-Casヌクレアーゼの利用),” Nature Biotechnology vol. 32, 1146-1150, doi:10.1038/nbt.3043(2014年10月5日にオンラインで公開)を参照のこと)。Bikardは、CRISPR-Cas9抗菌剤はマウスの皮膚コロニー形成モデルで黄色ブドウ球菌(S.aureus)を死滅させるようin vivoで機能することを示した。同様に、YosefらはCRISPRシステムを使用して、β-ラクタム系抗生物質に抵抗性を付与する酵素をコードする遺伝子を標的化した(Yousef et al., “Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria (抗生物質抵抗性の細菌を感作かつ死滅させるようプログラムされた溶原性・溶菌性バクテリオファージ),” Proc. Natl. Acad. Sci. USA, vol. 112, p. 7267-7272, doi: 10.1073/pnas.1500107112(2015年5月18日にオンラインで公開)を参照のこと)。
本発明をノロウイルス感染症に治療の開発にも応用してもよい。ノロウイルスは、安全でない食品に由来する下痢性疾患の原因となる最も一般的な病原体の1つである。それはまた、食品由来の感染症における幼児および成人の主な死亡原因でもある。ノロウイルスは単なる食中毒ではない。最近のメタ解析では、ノロウイルスは散発性の状況でも集団発生の状況でも急性胃腸炎のすべての原因(個人間の感染を含む)のほぼ5分の1を占め、すべての年齢層に影響を及ぼしている。間違いなく、ノロウイルスは先進国でも発展途上国でも最も重要な公衆衛生上の懸念事項である。標的介入するには、ノロウイルスの病理生物学をより深く理解するための研究努力が必要である。中東呼吸器症候群コロナウイルスからジカウイルスまで、ウイルス感染を媒介するのに重要な宿主因子を特定する努力は常に研究の優先事項とされてきた。そのような情報によって、抗ウイルス介入における有望な治療標的が明らかになる。ノロウイルスウイルスと宿主の相互作用の研究は、過去20年間、強力な細胞培養モデルがないことによって妨げられてきた。2016年、ついにノロウイルスを幹細胞由来のエンテロイドまたはミニ腸と呼ばれる三次元のヒト腸様構造で培養することに成功している。Chanらは、参加者から採取した十二指腸生検から分離した腸幹細胞を続いてミニ腸に分化させ、これを用いた。欠損型CRISPRと機能獲得型CRISPR SAMを用いて、ノロウイルス感染に関与する遺伝子の最終候補を特定した。本発明で開示するC2c1-CRISPRシステムをChanらの文献に記載されているような同様のシステムに用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
本発明をヒトパピローマウイルス(HPV) 関連の悪性腫瘍およびHPVに誘発された子宮頸がんの治療にも応用してもよい。子宮頸がんは、世界の女性に2番目に多いがんである。高リスクのヒトパピローマウイルス(HR-HPV)、特にHPV16およびHPV18は、子宮頸がんの主要な原因物質と見なされている。がん遺伝子E6およびE7は、HPV感染の初期段階で発現し、それらの機能は、正常な細胞周期を妨害し、形質転換された悪性表現型を維持することである。たとえば、E7タンパク質はカリン2ユビキチンリガーゼ複合体に結合し、網膜芽細胞腫(pRb)腫瘍抑制因子のユビキチン化と分解を引き起こす。
Huら(Biomed Res Int. 2014;2014:612823. doi: 10.1155/2014/61283)は、CRISPR-Cas9システムを用いてHPV陽性細胞株中のHPV16-E7 DNAを標的とし、HPV16-E7単一ガイドRNA(sgRNA)で誘導されたCRISPR/Casシステムが特定部位でHPV16-E7 DNAを破壊することができ、HPV陽性のSiHaおよびCaski細胞ではアポトーシスおよび増殖阻害を誘導するが、HPV陰性のC33AおよびHEK293細胞では誘導しないことを示した。さらに、E7 DNAの破壊はE7タンパク質の発現低下と腫瘍抑制因子タンパク質pRbの発現上昇を直接引き起こす。HPV16-E7遺伝子を標的とするgRNAは、Maliらの手順に従って設計され、Genewiz Company(中国)で合成された。SSAルシフェラーゼレポーターpSSA Rep3-1をCRISPRシステムの送達の通知システムとして使用した。細胞に、24ウェルプレートで0.8 μgのCas9プラスミドおよび0.2 μgのgRNAプラスミドで同時遺伝子導入した。遺伝子導入の48時間後、それらを回収し、アネキシンV-FITCアポトーシス検出キット(KeyGen BioTech)を用いて、製造者の指示に従って、フルオレセインイソチオシアナート(FITC)結合アネキシンV(アネキシンV-FITC)およびヨウ化プロピジウム(PI)で二重染色した。CRISPR/Casシステムで処理した4つの細胞株すべてのアポトーシス率を、FACS Calibur(BD Bioscience)を用いて分析し、誘導細胞死を計算した。BD CellQuestソフトウェアを用いてデータを解析した。in vitroでの細胞増殖をCell Counting Kit-8(CCK-8; Beyotime)を用いて決定した。1×104細胞/ウェルのgRNA-4/Cas9プラスミドで遺伝子導入し、遺伝子導入の24時間後に細胞をトリプシン処理して96ウェルプレートに播いた。96ウェルプレートに播いてから0時間後、24時間後、48時間後、72時間後、および96時間後に、10 μLのCCK-8溶液を各ウェルに加え、続いて37°Cで2.5時間インキュベートした。本発明で開示するCRISPR-C2c1システムを同様のシステムに用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはPAM配列5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)を認識してもよい。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を転写物に導入する。
CRISPRシステムを用いて、他の遺伝学的手法には抵抗性のある寄生虫のゲノムを編集することができる。たとえば、CRISPR-Cas9システムはネズミマラリア原虫(Plasmodium yoelii)ゲノムで二本鎖切断を誘導することがわかった(Zhang et al., “Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 system,” mBio. vol. 5, e01414-14, Jul-Aug 2014を参照のこと)。Ghorbalら(“Genome editing in the human malaria parasite Plasmodium falciparumusing the CRISPR-Cas9 system (CRISPR-Cas9システムを用いたヒトマラリア寄生虫(熱帯熱マラリア原虫、Plasmodium falciparum)のゲノム編集),” Nature Biotechnology, vol. 32, p. 819-821, doi: 10.1038/nbt.2925(2014年6月1日にオンラインで公開))は、2つの遺伝子orc1およびkelch13(それぞれ、アルテミシニンに対する抵抗性の遺伝子抑制および発生の役割を果たすと推定される)を改変した。適切な部位で改変された寄生虫は、改変に関する直接的な選択がないにもかかわらず非常に高い効率で回収された。これは、このシステムを用いて中立な、さらには有害な変異さえ起こすことができることを示している。CRISPR-Cas9は、トキソプラズマ原虫(Toxoplasma gondii)などのその他の病原性寄生虫のゲノムを改変するためにも用いられる(Shen et al., “Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9 (CRISPR/CAS9を用いたトキソプラズマ原虫の様々な株における効率的な遺伝子破壊),” mBio vol. 5:e01114-14, 2014;およびSidik et al., “Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9 (CRISPR/Cas9を用いたトキソプラズマ原虫の効率的なゲノム操作),” PLoS One vol. 9, e100450, doi: 10.1371/journal.pone.0100450(2014年6月27日にオンラインで公開)を参照のこと)。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を転写物に導入する。
Vyasら(“A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families (カンジダ・アルビカンス(Candida albicans)のCRISPRシステムにより必須遺伝子および遺伝子ファミリーの遺伝子操作が可能である),” Science Advances, vol. 1, e1500248, DOI: 10.1126/sciadv.1500248, April 3, 2015)はCRISPRシステムを採用して、カンジダ・アルビカンスの遺伝子操作にとって長期にわたる障壁を克服し、いくつかの異なる遺伝子の両方のコピーを一実験で効率的に変異させた。いくつかの機構が薬剤抵抗性に関与する生物で、Vyasは、ホモ接合性の二重変異体を作成したが、それらは親の臨床分離株Can90によるフルコナゾールもしくはシクロヘキシミドに対する過剰な抵抗性をもはや示さなかった。Vyasはさらに、条件付き対立遺伝子を作成することによってC.アルビカンスの必須遺伝子でホモ接合性の機能欠失変異を得た。リボソームRNA処理に必要なDCR1の欠損対立遺伝子は、低温では致死的であるが高温では生存可能である。Vyasは、ナンセンス変異を導入する修復鋳型を使用し、dcr1/dcr1変異体を単離したが、それらは16°Cで増殖することができなかった。C2c1エフェクタータンパク質を同様のシステムに応用してもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変をDCR1の転写物に導入する。実施態様によっては、修復鋳型はPAM配列を含まない。
遺伝的または後成的側面を持つ疾患の治療
本発明のCRISPR-Casシステムを用いて、以前にTALENおよびZFNを用いて試みられたがほとんど成功しておらず、Cas9システムの有望な標的として特定されてきた(Cas9システムを用いて遺伝子座を標的化して遺伝子治療で疾患の治療に取り組む方法を記載しているEditas Medicineの公開された出願、たとえばGluckmannらのWO 2015/048577 CRISPR-RELATED METHODS AND COMPOSITIONS、GluckmannらのWO 2015/070083 CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNASなどに記載のもの)遺伝子変異を補正することができる。実施態様によっては、原発性開放隅角緑内障(POAG)の治療、予防または診断を提供する。標的は、好ましくはMYOC遺伝子である。これは、WO2015153780に記載されており、その開示は参照によって本明細書に組み込まれる。
MaederらのWO2015/134812 CRISPR/CAS-RELATED METHODS AND COMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA (アッシャー症候群および網膜色素変性症を治療するためのCRISPR/CAS関連方法および組成物)を参照する。本明細書の教示全体で、本発明は、本明細書の教示に関連して応用されるこれらの文書の方法および材料を包含する。視覚および聴覚の遺伝子治療の一態様では、アッシャー症候群および網膜色素変性症を治療するための方法および組成物を本発明のCRISPR-Casシステムに適合させてもよい(たとえばWO 2015/134812を参照のこと)。一態様では、WO 2015/134812はアッシャー症候群IIA型(USH2A、USH11A)および網膜色素変性症39(RP39)の発症または進行を遺伝子編集によって処置するまたは遅らせること(たとえば、CRISPR-Cas9を介してUSH2A遺伝子の2299位のグアニン欠失を補正する(たとえばUSH2A遺伝子の2299位の欠失したグアニン残基を置換する)方法)を含む。同様の効果をC2c1でも達成することができる。関連する側面では、1つ以上のヌクレアーゼ、1つ以上のニッカーゼ、またはそれらの組み合わせのいずれかで切断することによって変異を標的化して、たとえば点変異(たとえば単一のヌクレオチド(たとえばグアニン)の欠失)を補正するドナー鋳型でHDRを誘導する。変異USH2A遺伝子の改変または補正を任意の機構によって媒介することができる。変異HSH2A遺伝子の改変(たとえば補正)に関連する可能性のある模範的な機構としては、非相同性末端結合、マイクロホモロジー媒介末端結合(MMEJ)、相同性指向修復(たとえば内在性ドナー鋳型による)、SDSA(合成による鎖アニーリング)、一本鎖アニーリングまたは一本鎖侵入などが挙げられるが、これらに限定しない。一実施態様では、アッシャー症候群および網膜色素変性症を治療するために用いられる方法として、たとえばUSH2A遺伝子の適切な部分を配列決定することによって、患者が持つ変異に関する知識を得ることを含む可能性がある。
したがって、実施態様によっては、網膜色素変性症の治療、予防または診断を提供する。RP1、RP2など、多くの様々な遺伝子が網膜色素変性症に関連しているか、結果としてそれを引き起こすことが知られている。実施態様によっては、これらの遺伝子を標的化し、適切な鋳型を提供することによって欠損させる、または修復する。実施態様によっては、送達は注射で目に対して行われる。
実施態様によっては、1つ以上の網膜色素変性症遺伝子を、RP1(網膜色素変性症1)、RP2(網膜色素変性症2)、RPGR(網膜色素変性症3)、PRPH2(網膜色素変性症7)、RP9(網膜色素変性症9)、IMPDH1(網膜色素変性症10)、PRPF31(網膜色素変性症11)、CRB1(網膜色素変性症12、常染色体劣性)、PRPF8(網膜色素変性症13)、TULP1(網膜色素変性症14)、CA4(網膜色素変性症17)、HPRPF3(網膜色素変性症18)、ABCA4(網膜色素変性症19)、EYS(網膜色素変性症25)、CERKL(網膜色素変性症26)、FSCN2(網膜色素変性症30)、TOPORS(網膜色素変性症31)、SNRNP200(網膜色素変性症33)、SEMA4A(網膜色素変性症35)、PRCD(網膜色素変性症36)、NR2E3(網膜色素変性症37)、MERTK(網膜色素変性症38)、USH2A(網膜色素変性症39)、PROM1(網膜色素変性症41)、KLHL7(網膜色素変性症42)、CNGB1(網膜色素変性症45)、BEST1(網膜色素変性症50)、TTC8(網膜色素変性症51)、C2orf71(網膜色素変性症54)、ARL6(網膜色素変性症55)、ZNF513(網膜色素変性症58)、DHDDS(網膜色素変性症59)、BEST1(網膜色素変性症、求心性)、PRPH2(網膜色素変性症、二遺伝子性)、LRAT(網膜色素変性症、若年性)、SPATA7(網膜色素変性症、若年性、常染色体劣性)、CRX(網膜色素変性症、遅発性優性)、および/またはRPGR(網膜色素変性症、X連鎖性、および難聴の有無にかかわらず、副鼻腔呼吸器感染症)から選択することができる。
実施態様によっては、網膜色素変性症遺伝子はMERTK(網膜色素変性症38)またはUSH2A(網膜色素変性症39)である。
WO 2015/138510も参照し、本明細書の教示全体で、本発明(CRISPR-Cas9システムの使用)は、レーバー先天黒内障10型(LCA10)の治療を提供すること、またはその発症または進行を遅らせることを包含する。LCA10は、CEP290遺伝子の変異、たとえばc.2991+1655(イントロン26の潜在的なスプライス部位を生じさせる、CEP290遺伝子のアデニンからグアニンへの変異)によって引き起こされる。これはCEP290のイントロンの26のヌクレオチド1655の変異(たとえばAからGへの変異)である。CEP290は、CT87、MKS4、POC3、rd16、BBS14、JBTS5、LCAJO、NPHP6、SLSN6、および3H11Ag(たとえば、WO 2015/138510を参照のこと)。遺伝子治療の一側面では、本発明は、CEP290遺伝子の少なくとも1つの対立遺伝子のLCA標的位置(たとえばc.2991+1655;AからG)の部位の近くに1つ以上の切断を導入することを含む。LCA10標的位置をの改変は、(1)LCA10標的位置に近接する、またはそれを含む位置での切断によって誘導される挿入欠失の導入(本明細書ではNHEJを介した挿入欠失の導入ともいう)(たとえばc.2991+1655(AからG))、または(2)LCA10標的位置の変異(たとえばc.2991+1655(AからG))を含むゲノム配列の切断によって誘導される欠失(本明細書ではNHEJを介した欠失の導入ともいう)を指す。どちらの手法も、LCA10標的位置での変異によって起こる潜在的なスプライス部位の欠失または破壊を引き起こす。したがって、LCAの治療でのC2c1の使用が特に想定される。
研究者らは、広範な疾患の治療に遺伝子治療を採用することができるかどうかを考えている。C2c1エフェクタータンパク質に基づく本発明のCRISPRシステムは、このような治療的使用(さらに例示する標的領域、および以下のような送達方法によるものを含むが、これらに限定されない)を想定されている。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。本システムを用いて有用に治療される可能性のある状態または疾患のいくつかの例は、本明細書に含まれる遺伝子および参考文献の例に含まれ、現在それらの状態と関連付けられているものもそこに提示されている。例示する遺伝子および状態は網羅的ではない。
呼吸器系疾患の治療
本発明はCRISPR-Casシステム、特に本明細書に記載の新規なCRISPRエフェクタータンパク質システムを血液または造血幹細胞に送達することも想定している。Wahlgrenらの血漿エクソソーム(Nucleic Acids Research, 2012, Vol. 40, No. 17 e130)が以前に記載されており、これをCRISPR Casシステムを血液に送達するのに活用してもよい。本発明の核酸標的化システムはまた、地中海貧血症および鎌状赤血球症などのヘモグロビン症を治療すると考えられている。本発明のCRISPR Casシステムによって標的化してもよい可能性のある標的については、たとえば国際特許公開WO 2013/126794を参照のこと。
Drakopoulou, “Review Article, The Ongoing Challenge of Hematopoietic Stem Cell-Based Gene Therapy for β-Thalassemia(総説、β-地中海貧血症に対する造血幹細胞に基づく遺伝子治療の進行中の課題),” Stem Cells International, Volume 2011, Article ID 987980, 10 pages, doi:10.4061/2011/987980(参照により、その引用文献と共に、完全に明記されたかのように本明細書に組み込まれる)には、β-グロビンまたはγ-グロビンの遺伝子を送達するレンチウイルスを用いてHSCを改変することについて記載されている。レンチウイルスを用いるのとは対照的に、当技術分野の知識および本開示の教示により、当業者は、変異を標的化して補正するCRISPR-Casシステムを用いて(たとえばβ-グロビンまたはγ-グロビン、有利には非鎌状β-グロビンまたはγ-グロビンのコード配列を送達する適切なHDR鋳型を用いて)β-地中海貧血症に関してHSCを補正することができる。具体的には、ガイドRNAはβ-地中海貧血症を引き起こす変異を標的化することができ、HDRはβ-グロビンまたはγ-グロビンの適切な発現のためのコード化を起こすことができる。変異を標的化するガイドRNAとCasタンパク質とを含む粒子を、変異を持つHSCと接触させる。粒子は、β-グロビンまたはγ-グロビンの適切な発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。この点に関しては、Cavazzana, “Outcomes of Gene Therapy for β-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem Cells Transduced Ex Vivo with a Lentiviral βA-T87Q-Globin Vector(レンチウイルスβA-T87Q-グロビンベクターでexvivoで形質導入された自家造血幹細胞の移植を介した主要なβ-地中海貧血症の遺伝子治療の結果).” tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf; Cavazzana-Calvo, “Transfusion independence and HMGA2 activation after gene therapy of human β-thalassaemia(ヒトβ-地中海貧血症の遺伝子治療後の輸血非依存性とHMGA2活性化)”, Nature 467, 318-322 (16 September 2010) doi:10.1038/nature09328; Nienhuis, “Development of Gene Therapy for Thalassemia(地中海貧血症の遺伝子治療の開発), Cold Spring Harbor Perpsectives in Medicine, doi: 10.1101/cshperspect.a011833 (2012), LentiGlobin BB305, a lentiviral vector containing an engineered β-globin gene (βA-T87Q) (遺伝子操作されたβ-グロビン遺伝子(βA-T87Q)を含むレンチウイルスベクターBB305); およびXie et al., “Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9 and piggyback (CRISPR/Cas9とpiggybackを使用した患者特異的なiPSCにおけるβ-地中海貧血症変異のシームレスな遺伝子補正)” Genome Research gr.173427.114 (2014) www.genome.org/cgi/doi/10.1101/gr.173427.114 (Cold Spring Harbor Laboratory Press)も参照のこと。すなわち、ヒトのβ-地中海貧血症に関するCavazzanaの研究の主題およびXieの研究の主題はすべて参照によってそれらの引用文献または関連文献すべてと共に本明細書に組み込まれる。本発明では、HDR鋳型は、Xieの文献に記載されているように、操作されたβ-グロビン遺伝子(たとえばβA-T87Q)またはβ-グロビンを発現するHSCを提供することができる。
Xuら(Sci Rep. 2015 Jul 9;5:12065. doi: 10.1038/srep12065)は、グロビン遺伝子中のイントロン2の変異部位IVS2-654を直接標的化するためのTALENおよびCRISPR-Cas9を設計している。XuらはTALENおよびCRISPR-Cas9を用いてIVS2-654遺伝子座で異なる頻度の二本鎖切断(DSB)を観察し、TALENはpiggyBacトランスポゾンドナーと組み合わせた場合、CRISPR-Cas9に比べて高い相同遺伝子標的化効率を媒介した。また、TALENに比べてCRISPR-Cas9ではより明白な非特異的事象が観察された。最後に、TALENで補正されたiPSCクローンを選択し、OP9共培養システムを用いて赤芽球分化を確認したが、補正されていない細胞よりも比較的高いHBBの転写が検出された。
Songら(Stem Cells Dev. 2015 May 1;24(9):1053-65. doi: 10.1089/scd.2014.0347. Epub 2015 Feb 5)はCRISPR/Cas9を用いてβ-地中海貧血症のiPSCを補正した。ヒト胚性幹細胞(hESC)は非特異的作用を示さなかったため、遺伝子補正済み細胞は正常な核型と完全な多能性を示す。次に、Songらは遺伝子補正済みβ-地中海貧血症iPS細胞の分化効率を評価した。Songらは、血球分化中に、遺伝子補正済みβ-地中海貧血症iPSCが胚様体比および様々な造血前駆細胞の割合の増加を示すことを見出した。さらに重要なことに、遺伝子補正済みβ-地中海貧血症iPSC株は、未補正の群に比べてHBB発現を回復し、活性酸素種の産生を減少させた。Songらの研究は、一旦CRISPR-Cas9システムで補正するとβ-地中海貧血症iPSCの血球分化効率が大幅に改善されることを示唆した。本明細書に記載のCRISPR-Casシステム、たとえばC2c1エフェクタータンパク質を含むシステムを利用して同様の方法を実施してもよい。
鎌状赤血球貧血は、赤血球が鎌状になる常染色体劣性遺伝性疾患である。これは、11番染色体の短腕にあるβ-グロビン遺伝子の一塩基置換によって引き起こされる。その結果、グルタミン酸の代わりにバリンが生成され、鎌状赤血球ヘモグロビン(HbS)が生成される。この結果、歪んだ赤血球の形状が形成される。この異常な形状により、小血管が詰まり、骨、脾臓、および皮膚組織に深刻な損傷が起こる可能性がある。これによって痛み、頻繁な感染症、手足症候群、さらには多臓器不全が発症する可能性がある。歪んだ赤血球はさらに、深刻な貧血につながる溶血を起こしやすい。β-地中海貧血症の場合と同様に、鎌状赤血球貧血をCRISPR-CasシステムでHSCを改変して補正することができる。システムにより、細胞のDNAを切断した後それを自己修復させることにより、細胞のゲノムを特異的に編集することができる。Casタンパク質を挿入し、RNAガイドによって変異点を標的化すると、それはその点でDNAを切断する。同時に、正常な型の配列が挿入される。この配列は、細胞自体の修復システムによって、誘導された切断を修復するために使用される。このように、CRISPR-Casにより、以前に得られた幹細胞の変異を補正することができる。当技術分野の知識および本開示の教示により、当業者は、変異を標的化して補正するCRISPR-Casシステムを用いて(たとえばβ-グロビン、有利には非鎌状β-グロビンのコード配列を送達する適切なHDR鋳型を用いて)鎌状赤血球貧血に関してHSCを補正することができる。具体的には、ガイドRNAは鎌状赤血球貧血を引き起こす変異を標的化することができ、HDRはβ-グロビンの適切な発現のためのコード化を起こすことができる。変異を標的化するガイドRNAとCasタンパク質とを含む粒子を、変異を持つHSCと接触させる。粒子は、β-グロビンの適切な発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。HDR鋳型は、Xieの文献に記載されているように、操作されたβ-グロビン遺伝子(たとえばβA-T87Q)またはβ-グロビンを発現するHSCを提供することができる。
Williams, “Broadening the Indications for Hematopoietic Stem Cell Genetic Therapies (造血幹細胞遺伝子療法に関する徴候の拡張),” Cell Stem Cell 13:263-264 (2013)(参照により、その引用文献と共に、完全に明記されたかのように本明細書に組み込まれる)には、レンチウイルスを介したリソソーム蓄積症、異染性白質ジストロフィー疾患(MLD)(アリールスルファターゼA(ARSA)の欠損によって引き起こされ、神経の脱髄を引き起こす遺伝性疾患)の患者由来のHSC/P細胞への遺伝子導入、ならびにウィスコット・アルドリッチ症候群(WAS)患者(血球系統の細胞骨格機能を調節する小さなGTPアーゼCDC42のエフェクターであるWASタンパク質に欠損があり、それによって再発性感染症、自己免疫症状、および過度の出血と白血病やリンパ腫のリスクの増加を招く異常に小さな機能不全の血小板を伴う血小板減少症による免疫不全に罹っている患者)のHSCへのレンチウイルスを介した遺伝子導入が報告されている。レンチウイルスを用いるのとは対照的に、当技術分野の知識および本開示の教示により、当業者は、変異(アリールスルファターゼA(ARSA)の欠損)を標的化して補正するCRISPR-Casシステムを用いて(たとえばARSAのコード配列を送達する適切なHDR鋳型を用いて)MLD(アリールスルファターゼA(ARSA)の欠損)に関してHSCを補正することができる。具体的には、ガイドRNAはMLDを引き起こす変異(ARSAの欠損)を標的化することができ、HDRはARSAの適切な発現のためのコード化を起こすことができる。変異を標的化するガイドRNAとCasタンパク質とを含む粒子を、変異を持つHSCと接触させる。粒子は、ARSAの適切な発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。レンチウイルスを用いるのとは対照的に、当技術分野の知識および本開示の教示により、当業者は、変異(WASタンパク質の欠損)を標的化して補正するCRISPR-Casシステムを用いて(たとえばWASタンパク質のコード配列を送達する適切なHDR鋳型を用いて)WASに関してHSCを補正することができる。具体的には、ガイドRNAはWASを引き起こす変異(WASタンパク質の欠損)を標的化することができ、HDRはWASタンパク質の適切な発現のためのコード化を起こすことができる。変異を標的化するガイドRNAとC2c1タンパク質とを含む粒子を、変異を持つHSCと接触させる。粒子は、WASタンパク質の適切な発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。
Watts, “Hematopoietic Stem Cell Expansion and Gene Therapy (造血幹細胞の増殖と遺伝子療法)” Cytotherapy 13(10):1164-1171. doi:10.3109/14653249.2011.620748 (2011)(参照により、その引用文献と共に、完全に明記されたかのように本明細書に組み込まれる)には、造血幹細胞(HSC)遺伝子治療、たとえばウイルスを介したHSC遺伝子治療が、多くの障害、たとえば、血液学的状態、HIV/AIDSなどの免疫不全、リソソーム蓄積症のような他の遺伝的障害(SCID-X1、ADA-SCID、β-地中海貧血症、X連鎖性CGD、ウィスコット・アルドリッチ症候群、ファンコニ貧血、副腎白質ジストロフィー(ALD)、および異染性白質ジストロフィー(MLD)など)などに対する非常に魅力的な治療として考察されている。
Cellectisに譲渡された米国特許出願公開第20110225664、20110091441、20100229252、20090271881、および20090222937号はCREI多様体に関する。ここで、2つのI-CreIモノマーのうちの少なくとも一方は、I-CreIの26~40位および44~77にそれぞれ位置するLAGLIDADG(配列番号26)コアドメインの2つの機能的サブドメインのそれぞれに1つ、少なくとも2つの置換を有し、前記多様体は、一般的にサイトカイン受容体ガンマ鎖遺伝子またはガンマC遺伝子とも呼ばれるヒトインターロイキン2受容体ガンマ鎖(IL2RG)遺伝子からDNA標的配列を切断することができる。米国特許出願公開第20110225664号、20110091441号、20100229252号、20090271881号および20090222937号で特定された標的配列を本発明の核酸標的化システムに利用してもよい。
重症複合免疫不全症(SCID)は、Tリンパ球の成熟の異常によって起こり、常にBリンパ球の機能異常を伴う(Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109)。全体的な罹患率は新生児75000人につき1人と推定されている。未治療のSCIDの患者は、複数の日和見微生物感染症にかかり、通常1年以上は生きられない。SCIDは家族ドナーからの同種造血幹細胞移植によって治療することができる。ドナーとの組織適応度は大きく変動し得る。SCIDの形態の1つであるアデノシンデアミナーゼ(ADA)欠乏症の場合、組換えアデノシンデアミナーゼ酵素の注入により患者を治療することができる。
ADA遺伝子はSCID患者では変異していることがわかって(Giblett et al., Lancet, 1972, 2, 1067-1069)以来、SCIDに関与する他のいくつかの遺伝子が特定されている(Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109)。SCIDには4つの主な原因がある。(i)SCIDの最も頻繁な形態であるSCID-X1(X連鎖性SCIDまたはX-SCID)は、IL2RG遺伝子の変異によって引き起こされ、成熟Tリンパ球およびNK細胞の欠如につながる。IL2RGは、少なくとも5つのインターロイキン受容体複合体の共通成分であるガンマCタンパク質(Noguchi, et al., Cell, 1993, 73, 147-157)をコードする。これらの受容体は、JAK3キナーゼを介していくつかの標的を活性化し(Macchi et al., Nature, 1995, 377, 65-68)、これが不活性化するとガンマC不活性化と同じ症候群が起こる。(ii)ADA遺伝子の変異は、リンパ球前駆細胞にとって致命的なプリン代謝の異常を起こし、その結果、B細胞、T細胞、およびNK細胞がほぼなくなる。(iii)V(D)J組換えは、免疫グロブリンおよびTリンパ球受容体(TCR)の成熟に不可欠な工程である。この過程に関与する3つの遺伝子である組換え活性化遺伝子1および2(RAG1およびRAG2)ならびにArtemisの変異により、成熟したTリンパ球およびBリンパ球が存在しなくなる。(iv)T細胞特異的シグナル伝達に関与するその他の遺伝子(CD45など)の変異も報告されているが、これはごくわずかな症例にあたる(Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109)。それらの遺伝的基盤が特定されて以来、2つの主な理由から、異なるSCID形態が遺伝子治療の手法の規範となっている(Fischer et al., Immunol. Rev., 2005, 203, 98-109)。第一に、すべての血液疾患と同様に、ex vivoでの治療を想定することができる。造血幹細胞(HSC)は骨髄から採取することができ、数回の細胞分裂の間、その多能性を維持する。したがって、それらをin vitroで処理した後に患者に再注入し、そこで骨髄を再増殖させることができる。第二に、SCID患者ではリンパ球の成熟が損なわれるため、補正済み細胞には選択的な利点がある。したがって、少数の補正済み細胞は機能的な免疫系を回復することができる。この仮説は、以下によって何度か検証された:(i)SCID患者の変異の復帰に関連する免疫機能の部分的回復(Hirschhorn et al., Nat. Genet., 1996, 13, 290-295; Stephan et al., N. Engl. J. Med., 1996, 335, 1563-1567; Bousso et al., Proc. Natl., Acad. Sci. USA, 2000, 97, 274-278; Wada et al., Proc. Natl. Acad. Sci. USA, 2001, 98, 8697-8702; Nishikomori et al., Blood, 2004, 103, 4565-4572)、(ii)造血細胞におけるin vitroでのSCID-X1欠損の補正(Candotti et al., Blood, 1996, 87, 3097-3102; Cavazzana-Calvo et al., Blood, 1996, Blood, 88, 3901-3909; Taylor et al., Blood, 1996, 87, 3103-3107; Hacein-Bey et al., Blood, 1998, 92, 4090-4097)、(iii)SCID-X1(Soudais et al., Blood, 2000, 95, 3071-3077; Tsai et al., Blood, 2002, 100, 72-79)、JAK-3(Bunting et al., Nat. Med., 1998, 4, 58-64; Bunting et al., Hum. Gene Ther., 2000, 11, 2353-2364)およびRAG2(Yates et al., Blood, 2002, 100, 3942-3949)の欠損の動物モデルにおけるin vivoでの補正、(iv)遺伝子治療の臨床試験の結果(Cavazzana-Calvo et al., Science, 2000, 288, 669-672; Aiuti et al., Nat. Med., 2002; 8, 423-425; Gaspar et al., Lancet, 2004, 364, 2181-2187)。
Children’s Medical Center CorporationおよびPresident and Fellows of Harvard Collegeに譲渡された米国特許出願公開第20110182867は、BCL11Aの発現または活性の阻害剤(RNAiや抗体など)を介して造血前駆細胞における胎児ヘモグロビン発現(HbF)を調節する方法とその使用法に関する。米国特許出願公開第20110182867号に開示されている標的(BCL11Aなど)を、胎児ヘモグロビン発現を調節するために本発明のCRISPR Casシステムによって標的化してもよい。さらなるBCL11A標的については、Bauerらの文献(Science 11 October 2013: Vol. 342 no. 6155 pp. 253-257)およびXuらの文献(Science 18 November 2011: Vol. 334 no. 6058 pp. 993-996)も参照のこと。
当技術分野の知識および本開示の教示により、当業者は、本発明で開示するC2c1-CRISPRシステムおよび上記のCRISPR-Casシステムを用いて、遺伝性血液障害、たとえばβ-地中海貧血症、血友病、または遺伝性リソソーム蓄積症に関してHSCを補正してもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
HSC(造血幹細胞)への送達および編集ならびに特定の条件
「造血幹細胞」または「HSC」という用語は、ほとんどの骨の核に含まれる赤色骨髄に存在する、HSCと見なされる細胞(たとえば、残りのすべての血液細胞になり、中胚葉に由来する血液細胞)を広く含むことを意図する。本発明のHSCは、大きさが小さいこと、細胞系(lin)マーカーがないこと、および分化系列の一群に属するマーカーによって識別される、造血幹細胞の表現型を有する細胞(CD34、CD38、CD90、CD133、CD105、CD45、およびc-kit(幹細胞因子の受容体))が挙げられる。造血幹細胞は、分化系列決定の検出に用いられるマーカーに対して陰性であるため、Lin-と呼ばれる。FACSで精製中に、複数の最大14の異なる成熟血液系マーカー、たとえば、ヒトでは骨髄球のCD13およびCD33、赤芽球のCD71、B細胞のCD19、巨核球のCD61など、また、B細胞のB220(マウスCD45)、単球のMac-1(CD11b/CD18)、顆粒球のGr-1、赤血球細胞のTer119、T細胞のIl7Ra、CD3、CD4、CD5、CD8などがある。マウスのHSCマーカー:CD34lo/-、SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-、ヒトのHSCマーカー:CD34+、CD59+、Thy1/CD90+、CD38lo/-、C-kit/CD117+、lin-。HSCはマーカーで識別される。したがって、本明細書に記載の実施態様では、HSCは、CD34+細胞であってもよい。HSCは、CD34-/CD38-である造血幹細胞であってもよい。当技術分野でHSCとみなされている、細胞表面にc-kitがない可能性のある幹細胞、ならびに同じく当技術分野でHSCとみなされているCD133+細胞は本発明の範囲に含まれる。
CRISPR-Cas(たとえばC2c1)システムを、HSCの1つ以上の遺伝子座を標的化するように操作してもよい。Cas(たとえばC2c1)タンパク質、有利には真核細胞、特に哺乳動物細胞(たとえばHSCなどのヒト細胞など)にコドン最適化したものと、HSC内の1つ以上の遺伝子座(たとえば遺伝子EMX1)を標的とするsgRNAとを調製してもよい。これらを粒子によって送達してもよい。Cas(たとえばC2c1)タンパク質とgRNAとを混合することによって粒子を形成してもよい。gRNAとCas(たとえばC2c1)タンパク質との混合物を、たとえば、界面活性剤、リン脂質、生分解性ポリマー、リポタンパク質、およびアルコールを含む、またはそれらから本質的になる、またはそれらからなる、混合物と混合して、gRNAおよびCas(たとえばC2c1)タンパク質を含む粒子を形成してもよい。本発明は、したがって、粒子の作製およびそのような方法による粒子、ならびにそれらの使用を包含する。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
より一般的には、粒子を効率的な製法で形成してもよい。第一に、Cas(たとえばC2c1)タンパク質と遺伝子EMX1または対照遺伝子LacZを標的化するgRNAとを適切な、たとえば3:1~1:3または2:1~1:2もしくは1:1のモル比で、適切な温度、たとえば15~30℃、たとえば20~25℃(たとえば室温)で、適切な時間、たとえば、15~45分間(たとえば30分間)、有利にはヌクレアーゼを含まない無菌の緩衝液、たとえば1X PBS中で混ぜ合わせてもよい。これとは別に、以下のような、または以下を含む粒子成分:界面活性剤、たとえばカチオン性脂質(たとえば1,2-ジオレオイル-3-トリメチルアンモニウム-プロパン(DOTAP);リン脂質(たとえばジミリストイルホスファチジルコリン(DMPC);生分解性ポリマー(エチレングリコールポリマーまたはPEGなど);およびリポタンパク質、たとえば低密度リポタンパク質(たとえばコレステロール)を、アルコール、有利にはC1-6アルキルアルコール(メタノール、エタノール、イソプロパノール、たとえば100%エタノールなど)に溶解してもよい。2つの溶液を混ぜ合わせて、Cas(たとえばC2c1)-gRNA複合体を含む粒子を形成してもよい。特定の実施態様では、粒子はHDR鋳型を含むことができる。それは、gRNA+Cas(たとえばC2c1)タンパク質を含む粒子と同時投与される粒子であってもよい。すなわち、HSCをgRNA+Cas(たとえばC2c1)タンパク質を含む粒子と接触させることに加え、そのHSCをHDR鋳型を含む粒子と接触させる、あるいは、HSCを、gRNA、Cas(たとえばC2c1)、およびHDR鋳型をすべて含む粒子と接触させる。HDR鋳型を別のベクターを用いて投与してもよい。これにより、最初に粒子がHSC細胞に浸透し、別のベクターも細胞に浸透する。ここで、HSCゲノムはgRNA+Cas(たとえばC2c1)によって改変され、HDR鋳型も存在することにより、ゲノム遺伝子座がHDRによって改変される。たとえば、これにより変異が補正されてもよい。
粒子が形成された後、96ウェルプレート中のHSCに、1ウェルあたり15μgのCas(たとえばC2c1)タンパク質を遺伝子導入してもよい。遺伝子導入の3日後、HSCを回収し、EMX1遺伝子座における挿入および欠失(挿入欠失)の数を数値化してもよい。
これは、HSCの1つ以上の目的ゲノム遺伝子座を標的化するCRISPR-Cas(たとえばC2c1)を用いてHSCを改変することができる方法を例示している。改変されるHSCは、in vivo、すなわち、生物、たとえばヒトまたはヒト以外の真核生物(たとえば、動物、たとえば魚(たとえばゼブラフィッシュ)、哺乳動物(たとえば類人猿、チンパンジー、マカクなどの霊長類、たとえばマウス、ウサギ、ラットなどのげっ歯類、イヌ、家畜(ウシ、ヒツジ、ヤギまたはブタ)、たとえばニワトリなどの家禽類)の生体中にあってもよい。改変されるHSCは、in vitro、すなわちそのような生物の体外にあってもよい。また、改変HSCをex vivoで使用することができる。すなわち、そのような生物の1つ以上のHSCを生物から取得または単離することができ、必要に応じてHSCを増殖することができ、HSCをHSCの1つ以上の遺伝子座を標的化するCRISPR-Cas(たとえばC2c1)を含む組成物によって改変してもよい(たとえば、HSCを、CRISPR酵素とHSCの1つ以上の遺伝子座を標的化する1つ以上のgRNAとを含む粒子(たとえば、gRNAとCas(たとえばC2c1)タンパク質との混合物を、界面活性剤、リン脂質、生分解性ポリマー、リポタンパク質、およびアルコールを含む、または本質的にそれらからなる、またはそれらからなる混合物と混ぜ合わせることによって得られたもしくは得ることのできる粒子)を含む(ここで、1つ以上のgRNAはHSCの1つ以上の遺伝子座を標的化する)組成物と接触させ、得られた改変HSCを必要に応じて増殖させ、得られた改変HSCを生物に投与することによって)。場合によっては、単離または取得されたHSCは第1の生物(第2の生物と同じ種の生物など)のものであってもよく、第2の生物は、得られた改変HSCが投与される生物であってもよい。たとえば、第1の生物は第2の生物に対するドナー(親や兄弟のような親類など)であってもよい。改変HSCは、個体または対象または患者の疾患もしくは病気の状態の症状を解決または緩和または軽減するための遺伝子改変を有することができる。改変HSCは、たとえば、第1の生物が第2の生物のドナーである場合、HSCが1つ以上のタンパク質(たとえば表面マーカーまたは第2の生物のものにより近いタンパク質)を有するように遺伝子改変を有することができる。改変HSCは、個体または対象または患者の疾患もしくは病気の状態を模倣するための遺伝子改変を有することができ、これをヒト以外の生物に再投与して動物モデルを準備することが考えられる。HSCの増殖は、本開示および当技術分野の知識から、当業者の範囲内である。たとえば、Lee, “Improved ex vivo expansion of adult hematopoietic stem cells by overcoming CUL4-mediated degradation of HOXB4 (CUL4によるHOXB4の分解を克服することによる成体幹細胞のex vivo増殖の改善).” Blood. 2013 May 16;121(20):4082-9. doi: 10.1182/blood-2012-09-455204. Epub 2013 Mar 21を参照のこと。
活性を改善することが示されているように、複合体全体を粒子に製剤する前に、gRNAをCas(たとえばC2c1)タンパク質と予備複合してもよい。細胞への核酸の送達を促すことが知られている様々な成分(たとえば、1,2-ジオレオイル-3-トリメチルアンモニウム-プロパン(DOTAP)、1,2-ジテトラデカノイル-sn-グリセロ-3-ホスホコリン(DMPC)、ポリエチレングリコール(PEG)、およびコレステロール)を様々なモル比で用いて製剤を作製してもよい。たとえば、DOTAP:DMPC:PEG:コレステロールのモル比は、DOTAPが100、DMPCが0、PEGが0、コレステロールが0、またはDOTAPが90、DMPCが0、PEGが10、コレステロールが0、またはDOTAPが90、DMPCが0、PEGが5、コレステロールが5であってもよい。DOTAPが100、DMPCが0、PEGが0、コレステロールが0。したがって、本発明は、gRNAと、Cas(たとえばC2c1)タンパク質と、粒子を形成する成分とを混合すること、およびそのような混合による粒子を包含する。
好ましい実施態様では、Cas(たとえばC2c1)-gRNA複合体を含む粒子を、Cas(たとえばC2c1)タンパク質と1つ以上のgRNAとを、好ましくは1:1(酵素:ガイドRNA)のモル比で混ぜ合わせて形成してもよい。これとは別に、核酸の送達を促すことが知られている様々な成分(たとえば、DOTAP、DMPC、PEG、コレステロール)を、好ましくはエタノールに溶解する。2つの溶液を混ぜ合わせて、Cas(たとえばC2c1)-gRNA複合体を含む粒子を形成する。粒子を形成した後、Cas(たとえばC2c1)-gRNA複合体を細胞(たとえばHSC)に遺伝子導入してもよい。バーコードを利用してもよい。粒子すなわちCasおよび/またはgRNAにバーコードを付けてもよい。
一実施態様では、本発明は、gRNAおよびCas(たとえばC2c1)タンパク質を含む粒子を調製する方法を包含する。この方法は、gRNAとCas(たとえばC2c1)タンパク質の混合物を、界面活性剤、リン脂質、生分解性ポリマー、リポタンパク質、およびアルコールを含む、またはそれらから本質的になる、またはそれらからなる混合物と混合することを含む。一実施態様は、その方法から得たgRNAおよびCas(たとえばC2c1)タンパク質を含む粒子を包含する。一実施態様では、本発明は、ゲノムの目的遺伝子座を改変する方法、またはゲノムの目的遺伝子座の標的配列を操作することによる生物もしくはヒト以外の生物、における粒子の使用を包含する。この方法は、ゲノムの目的遺伝子座を含む細胞を粒子と接触させることを含み、gRNAがゲノムの目的遺伝子座を標的化する。あるいは、本発明はゲノムの目的遺伝子座を改変する方法、またはゲノムの目的遺伝子座の標的配列を操作することによる生物もしくはヒト以外の生物を包含する。これらは、ゲノムの目的遺伝子座を含む細胞を粒子と接触させることを含み、gRNAがゲノムの目的遺伝子座を標的化する。これらの実施態様では、ゲノムの目的の遺伝子座は、有利にはHSCのゲノム遺伝子座である。
治療用途に関する考慮事項:ゲノム編集療法における考慮事項は、C2c1ヌクレアーゼの多様体など、配列特異的なヌクレアーゼの選択である。各ヌクレアーゼ多様体は、独自の長所と短所の組み合わせを持つ可能性があり、その多くは、治療という観点から、治療効果を最大化するために均衡しなければならない。現在まで、ヌクレアーゼを用いた2つの治療編集手法、遺伝子破壊および遺伝子補正が著しく有望であることがわかっている。遺伝子破壊は、NHEJを刺激して遺伝要素に標的挿入欠失を起こすことを含み、多くの場合、これによって患者に有益な機能喪失変異が起こる。対照的に、遺伝子補正はHDRを用いて、疾患を引き起こす変異を直接逆転させ、補正した要素の生理学的調節を維持しながら機能を回復する。HDRを用いて、ゲノム内の決められた「避難港(safe harbor)」遺伝子座に治療用導入遺伝子を挿入し、欠落している遺伝子機能を回復することもできる。特異的編集療法が有効であるためには、疾患の症状を好転させるのに十分に高度な改変を標的細胞集団において達成しなければならない。この治療的補正の「閾値」は、治療後の編集済み細胞の適応度と、症状を好転させるのに必要な遺伝子産物の量によって決定される。適応度に関しては、編集により、処置した細胞には未編集の対応する細胞に比べて3つの結果、すなわち適応度が上がる、変わらない、または下がる可能性がある。適応度が上がった場合、たとえばSCID-X1の治療において、改変造血前駆細胞は未編集の対応物に比べて選択的に増殖する。SCID-X1はIL2RG遺伝子(その機能は造血リンパ球系統の適切な発達に必要である)の変異によって引き起こされる疾患である[Leonard, W.J., et al. Immunological reviews 138, 61-86 (1994); Kaushansky, K. & Williams, W.J. Williams hematology, (McGraw-Hill Medical, New York, 2010)]。SCID-X1のウイルス遺伝子治療を受けた患者を対象とした臨床試験、およびSCID-X1変異の自発的補正のまれな例では、補正された造血前駆細胞はこの発達阻害を克服し、罹患した対応物に比べて増殖し、治療を媒介することができる可能性がある[Bousso, P., et al. Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000); Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185-1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181-2187 (2004)]。この場合、編集された細胞が選択優位性を有する場合、編集された細胞の数が少ない場合でも増殖によって増やすことができ、患者に治療上の利益を提供する。対照的に、慢性肉芽腫症(CGD)のような他の造血器疾患に関する編集では、編集された造血前駆細胞の適応度の変化は誘導されず、治療的改変の閾値が増加する。CGDは、病原体を死滅させる活性酸素種を生成するために好中球によって通常用いられる食細胞オキシダーゼタンパク質をコードする遺伝子の変異によって起こる[Mukherjee, S. & Thrasher, A.J. Gene 525, 174-181 (2013)]。これらの遺伝子の機能不全は造血前駆細胞の適応度や発達には影響せず、成熟造血細胞型が感染症に対抗する能力にのみ影響を及ぼすため、この疾患では編集された細胞の選択的増殖はないと考えられる。実際、遺伝子治療試験では、CGDでは遺伝子補正細胞の選択優位性は観察されておらず、そのため長期的な細胞生着が困難である[Malech, H.L., et al. Proceedings of the National Academy of Sciences of the United States of America 94, 12133-12138 (1997); Kang, H.J., et al. Molecular therapy : the journal of the American Society of Gene Therapy 19, 2092-2101 (2011)]。したがって、CGDのように編集によって中立的な適応度の利点が生じる疾患を治療するには、編集によって標的細胞への適応度が上がる疾患よりも著しく高度な編集が必要である。がん細胞の腫瘍抑制遺伝子に機能を回復する場合のように、編集によって適応度の不利益が生じる場合、改変細胞はそれらの罹患した対応物に負け、編集率に対して治療の利益が低くなる。この後者の種類の疾患は、ゲノム編集療法で治療するのが特に難しいと考えられる。
細胞の適応度に加えて、疾患を治療するのに必要な遺伝子産物の量も、症状を好転させるために達成しなければならない治療的ゲノム編集の最小レベルに影響する。血友病Bは、遺伝子産物量がわずかに変化すると臨床成績が有意に変化する可能性がある1つの疾患である。この疾患は、通常は肝臓から血液中に分泌されるタンパク質である第IX因子(血中で凝固系の構成要素として機能する)をコードする遺伝子の変異によって起こる。血友病Bの臨床的重症度は第IX因子活性の量に関連する。重度の疾患は正常な活性の1%未満に関連しているのに対し、より軽度の形態の疾患は1%を超える第IX因子活性に関連している[Kaushansky, K. & Williams, W.J. Williams hematology, (McGraw-Hill Medical, New York, 2010); Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]。このことにより、第IX因子の発現をわずかな割合の肝臓細胞にでも回復させることができる編集療法が臨床成績に大きな影響を及ぼす可能性があると示唆されている。ZFNを用いて血友病Bのマウスモデルを出生直後に補正する研究では、3~7%の補正で疾患の症状を好転させるのに十分であり、この仮説の前臨床証拠が得られた[Li, H., et al. Nature 475, 217-221 (2011)]。
遺伝子産物量のわずかな変化が臨床成績に影響を及ぼす可能性のある障害や、編集された細胞に適応度の利点がある疾患はゲノム編集療法の理想的な標的である。というのも、現在の技術を前提として、成功の可能性を高くするのに十分に治療的改変閾値が低いからである。現在、これらの疾患を標的化することで、前臨床レベルおよび第 I 相臨床試験で編集療法が成功している。これらの有望な結果を、編集された細胞に中立的な適応度の利点がある疾患、または治療に大量の遺伝子産物が必要な疾患に拡張するには、DSB修復経路の操作およびヌクレアーゼ送達の改善が必要である。以下の表6は治療モデルへのゲノム編集の応用のいくつかの例を示しており、以下の表6の参照文献およびそれらの文献で引用されている文書は、参照によって完全に記載されているものとして本明細書に組み込まれる。
Figure 2024138266000044
CRISPR-Cas(たとえばC2c1)システムを用いてHDRを介した変異の補正またはHDRを介した正しい遺伝子配列の挿入のいずれかによって、有利には本明細書の送達システム(たとえば粒子送達システム)を介して標的化することにより、上の表の各状態に対処することは、本開示および当技術分野の知識から当業者の範囲内にある。したがって、一実施態様は、血友病B、SCID(たとえばSCID-X1、ADA-SCID)または遺伝性チロシン血症の変異を持つHSCを、gRNAおよびCas(たとえばC2c1)タンパク質を含み血友病B、SCID(たとえばSCID-X1、ADA-SCID)または遺伝性チロシン血症に関するゲノムの目的遺伝子座を標的とする粒子と接触させることを包含する(たとえばLi、Genovese、またはYinの文献に記載のように)。粒子は変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。この点に関して、血友病Bは、凝固系の重要な構成要素である第IX因子をコードする遺伝子の機能喪失型変異によって引き起こされるX連鎖性劣性遺伝疾患であると言われている。重度に罹患した個体の第IX因子活性を1%を超えるまで回復させると、そのような患者に組換え第IX因子を若者から予防的に注入してこのレベルを達成することで臨床的合併症が大幅に改善するため、疾患を著しく軽度の形態に変えることができる。当技術分野の知識および本開示の教示により、当業者は、変異(第IX因子をコードする遺伝子の機能欠失変異によって起こるX連鎖性劣性遺伝疾患)を標的化して補正するCRISPR-Cas(たとえばC2C1)システムを用いて(たとえば第IX因子のコード配列を送達する適切なHDR鋳型を用いて)血友病Bに関してHSCを補正することができる。具体的には、gRNAは血友病Bを引き起こす変異を標的化することができ、HDRは第IX因子の適切な発現のためのコード化を起こすことができる。変異を標的化するgRNAとCas(たとえばC2C1)タンパク質とを含む粒子を、変異を持つHSCと接触させる。粒子は、第IX因子の適切な発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。本明細書に記載されているように、このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。
Cartier, “MINI-SYMPOSIUM: X-Linked Adrenoleukodystrophypa, Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy (小シンポジウム:X連鎖性副腎白質ジストロフィー、X連鎖性副腎白質ジストロフィーにおける造血幹細胞移植および造血幹細胞遺伝子療法),” Brain Pathology 20 (2010) 857-862(参照により、その引用文献と共に、完全に明記されたものとして本明細書に組み込まれる)には、同種造血幹細胞移植(HSCT)を利用してハーラー病患者の脳に正常なリソソーム酵素を送達したという認識と、ALDを治療するためのHSC遺伝子療法についての考察が記載されている。2人の患者で、末梢CD34+細胞を顆粒球コロニー刺激因子(G-CSF)動員後に採取し、骨髄増殖性肉腫ウイルスエンハンサー(陰性対照領域を削除した、dl587revプライマー結合部位置換(MND)-ALDレンチウイルスベクター)を形質導入した。患者のCD34+細胞に、低濃度のサイトカインが存在する16時間の間にMND-ALDベクターを形質導入した。形質導入CD34+細胞を形質導入後に凍結し、細胞の5%に対し、特に3つの複製可能レンチウイルス(RCL)検定に含まれる様々な安全性試験を実施した。CD34+細胞の形質導入有効性は35%~50%の範囲であり、レンチウイルス組込みコピーの平均数は0.65~0.70であった。形質導入CD34+細胞を解凍した後、ブスルファンとシクロホスファミドを用いて完全に骨髄切除した後、患者に1 kgあたり4.106を超える形質導入CD34+細胞を再注入した。患者のHSCは、遺伝子補正HSCの生着を促すため、患者のHSCを切除した。2人の患者の血液学的回復は13日目から15日目の間に起こった。ほぼ完全な免疫学的回復は、第1の患者では12か月、第2の患者では9か月で起こった。レンチウイルスを用いるのとは対照的に、当技術分野の知識および本開示の教示により、当業者は、変異を標的化して補正するCRISPR-Cas (C2c1)システムを用いて(たとえば適切なHDR鋳型を用いて)ALDに関してHSCを補正することができる。具体的には、gRNAは、ALD(ペルオキシソームの膜輸送体タンパク質)をコードするX染色体に位置する遺伝子ABCD1の変異を標的化することができ、HDRはそのタンパク質の適切な発現のためのコード化を起こすことができる。変異を標的化するgRNAとCas (C2c1)タンパク質とを含む粒子を、変異を持つHSC(たとえばCD34+細胞)と接触させる(Cartierの文献に記載のとおり)。粒子は、ペルオキシソームの膜輸送体タンパク質の発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。このように接触させた細胞を必要に応じてCartierの文献に記載のように処理することができる。このように接触させた細胞をCartierの文献に記載のように投与することができる。
WO 2015/148860を参照し、本明細書の教示全体で、本発明は、本明細書の教示に関連して応用されるこれらの文書の方法および材料を包含する。血液関連疾患の遺伝子療法の側面では、β-地中海貧血症を治療するための方法および組成物を本発明のCRISPR-Casシステムに適合させてもよい(たとえばWO 2015/148860を参照のこと)。一実施態様では、WO 2015/148860は、たとえばB細胞CLL/リンパ腫11A(BCL11A)の遺伝子を改変することによるβ-地中海貧血症もしくはその症状の治療または予防を含む。BCL11A遺伝子は、B細胞CLL/リンパ腫11A、BCL11A-L、BCL11A-S、BCL11AXL、CTIP1、HBFQTL5、およびZNFとしても知られている。BCL11Aは、グロビン遺伝子発現の調節に関与する亜鉛フィンガータンパク質をコードする。BCL11A遺伝子(たとえばBCL11A遺伝子の一方または両方の対立遺伝子)を改変することにより、ガンマグロビンの量を増加させることができる。ガンマグロビンは、ヘモグロビン複合体のベータグロビンに代わって組織に酸素を効果的に運ぶことで、β-地中海貧血症の表現型を改善することができる。
WO 2015/148863も参照し、本明細書の教示全体で、本発明は、本発明のCRISPR-Casシステムに応用され得るこれらの文書の方法および材料を包含する。遺伝性血液疾患である鎌状赤血球症の治療および予防の側面では、WO 2015/148863はBCL11A遺伝子の改変を包含する。BCL11A遺伝子(たとえばBCL11A遺伝子の一方または両方の対立遺伝子)を改変することにより、ガンマグロビンの量を増加させることができる。ガンマグロビンは、ヘモグロビン複合体のベータグロビンに代わって組織に酸素を効果的に運ぶことで、鎌状赤血球症の表現型を改善することができる。
本発明の一側面では、標的核酸配列の編集、または標的核酸配列の発現の調節を含む方法および組成物、ならびにがん免疫療法に関連するそれらの応用が、本発明のCRISPR-Casシステムを適合させることによって包含される。WO2015/161276における遺伝子療法の応用について述べる。これは、1つ以上のT細胞発現遺伝子(たとえばFAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRACおよび/またはTRBC遺伝子のうちの1つ以上)を改変することによりT細胞の増殖、生存および/または機能に影響を及ぼすために用いることができる方法および組成物を包含する。関連する側面では、1つ以上のT細胞発現遺伝子(たとえばCBLBおよび/またはPTPN6遺伝子、FASおよび/またはBID遺伝子、CTLA4および/またはPDCDI、ならびに/あるいはTRACおよび/またはTRBC遺伝子)を改変することによってT細胞増殖に影響を及ぼすことができる。
キメラ抗原受容体(CAR)19 T細胞は、患者の悪性腫瘍に抗白血病効果を示す。しかし、白血病患者は採取するのに十分なT細胞を持っていないことが多く、すなわち治療にはドナーからの改変T細胞を必要とする。したがって、ドナーT細胞のバンクを確立することが関心の対象となっている。Qasimら(“First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL(B-ALLにおけるTalen操作汎用CAR19T細胞の最初の臨床応用)”ASH 57th Annual Meeting and Exposition, Dec. 5-8, 2015, Abstract 2046 (ash.confex.com/ash/2015/webprogram/Paper81653.html(2015年11月にオンラインで公開))は、CAR19 T細胞を改変してT細胞受容体の発現の崩壊とCD52標的化によって移植片対宿主病のリスクを排除することについて考察している。さらに、CD52細胞をアレムツズマブに対して非感受性になるように標的化したため、アレムツズマブは、宿主を介したヒト白血球抗原(HLA)ミスマッチCAR19 T細胞の拒絶反応を防ぐことができた。研究者らは、RQR8に連結した4g7 CAR19(CD19scFv-4-1BB-CD3ζ)をコードする第3世代の自己不活化レンチウイルスベクターを用い、次にT細胞受容体(TCR) α定常鎖の遺伝子座とCD52遺伝子の遺伝子座の両方を多重標的化するために2対のTALEN mRNAで細胞をエレクトロポレーションした。ex vivoで増殖させた後もTCRを発現する細胞をCliniMacs α/βによるTCR枯渇で枯渇させ、TCR発現が1%未満のT細胞産物(UCART19)を得た。そのうち85%がCAR19を発現し、64%がCD52陰性になった。改変CAR19 T細胞を患者の再発急性リンパ性白血病を治療するために投与した。本明細書で提供する教示により、改変された造血幹細胞およびその子孫(血液の骨髄およびリンパ系の細胞が挙げられるが限定されない。これらとしてはT細胞、B細胞、単球、マクロファージ、好中球、好塩基球、好酸球、赤血球、樹状細胞、巨核球または血小板、ならびにナチュラルキラー細胞およびその前駆細胞などが挙げられるがこれらに限定されない)を提供する効果的な方法が提供される。このような細胞を、標的を欠損、組込み、または他の方法で調節する、たとえば上記のCD52または他の標的(限定するわけではないが、CXCR4およびPD-1など)を除去または調節することで改変することができる。したがって、患者へのT細胞または他の細胞の投与の変形例に関連して、本発明の組成物、細胞、および方法を用いて免疫応答を調節し、悪性腫瘍、ウイルス感染、および免疫障害(これらに限定するわけではない)を治療することができる。
WO 2015/148670について述べる。本明細書の教示全体にわたり、本発明は、本明細書の教示に関連して応用される同特許文献の方法および材料を包含する。遺伝子治療の一側面では、ヒト免疫不全ウイルス(HIV)および後天性免疫不全症候群(AIDS)に関連または連動する標的配列を編集するための方法および組成物が包含される。関連する側面では、本明細書に記載の発明は、C-Cケモカイン受容体5型(CCR5)の遺伝子に1つ以上の変異を導入することによるHIV感染およびAIDSの予防および治療を包含する。CCR5遺伝子はCKR5、CCR-5、CD195、CKR-5、CCCKR5、CMKBR5、IDDM22、およびCC-CKR-5としても知られる。さらなる側面では、本明細書に記載の発明は、HIV感染の予防もしくは低減および/またはHIVの(たとえば既に感染している対象の)宿主細胞への侵入能力の予防もしくは低減を提供することを包含する。HIVの模範的な宿主細胞としては、CD4細胞、T細胞、腸管関連リンパ組織(GALT)、マクロファージ、樹状細胞、骨髄前駆細胞、および小膠細胞が挙げられるが、これらに限定されない。宿主細胞にウイルスが侵入するには、ウイルス糖タンパク質gp41およびgp120とCD4受容体および補助受容体(CCR5など)の両方との相互作用が必要である。共受容体、たとえばCCR5が宿主細胞の表面に存在しない場合、ウイルスは結合して宿主細胞に侵入することができない。したがって、疾患の進行が妨げられる。たとえば保護変異(CCR5Δ32変異など)を導入することで宿主細胞内のCCR5を欠損させる、または発現抑制することにより、HIVウイルスの宿主細胞への侵入を防ぐ。
X連鎖性慢性肉芽腫症(CGD)は、食細胞NADPHオキシダーゼの活性の欠如または低下による遺伝性の宿主防御障害である。変異(食細胞NADPHオキシダーゼの活性の欠如または低下)を標的化して補正するCRISPR-Cas (C2C1)システムを用いる(たとえば食細胞NADPHオキシダーゼのコード配列を送達する適切なHDR鋳型を用いる)。具体的には、gRNAはCGD(食細胞NADPHオキシダーゼの欠損)を引き起こす変異を標的化することができ、HDRは食細胞NADPHオキシダーゼの適切な発現のためのコード化を起こすことができる。変異を標的化するgRNAとCas (C2C1)タンパク質とを含む粒子を、変異を持つHSCと接触させる。粒子は、食細胞NADPHオキシダーゼの適切な発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。
ファンコニ貧血:少なくとも15個の遺伝子(FANCA、FANCB、FANCC、FANCD1/BRCA2、FANCD2、FANCE、FANCF、FANCG、FANCI、FANCJ/BACH1/BRIP1、FANCL/PHF9/POG、FANCM、FANCN/PALB2、FANCO/Rad51C、およびFANCP/SLX4/BTBD12)の変異がファンコニ貧血を引き起こす可能性がある。これらの遺伝子から生成されるタンパク質は、FA経路として知られる細胞過程に関与する。DNA複製と呼ばれるDNAの新しいコピーを作成する過程がDNA損傷を理由に阻害されると、FA経路が作動する(活性になる)。FA経路は、特定のタンパク質を損傷領域に送り、それによってDNA修復が誘発されることにより、DNA複製を継続することができる。FA経路は、鎖間架橋(ICL)として知られる特定の種類のDNA損傷に特に反応する。ICLは、DNAの対向する鎖にある2つのDNA構成要素(ヌクレオチド)が異常に結合または連結している場合に起こり、DNA複製の過程を停止させる。ICLは、体内で産生された有毒物質の蓄積によって、または特定のがん治療薬による治療によって引き起こされる可能性がある。ファンコニ貧血に関連する8種のタンパク質が集合してFAコア複合体として知られる複合体を形成する。FAコア複合体はFANCD2とFANCIと呼ばれる2つのタンパク質を活性化する。これらの2つのタンパク質の活性化により、DNA修復タンパク質がICLの領域に運ばれ、それによって架橋が除去されてDNA複製を継続することができる。FAコアタンパク質。より具体的には、FAコア複合体は、FANCA、FANCB、FANCC、FANCE、FANCF、FANCG、FANCL、およびFANCMからなる核内多タンパク質複合体であり、E3ユビキチンリガーゼとして機能し、ID複合体(FANCD2とFANCIで構成されるヘテロ二量体)の活性化を媒介する。一旦モノユビキチン化されると、それはFANCD1/BRCA2、FANCN/PALB2、FANCJ/BRIP1、FANCO/Rad51CなどのFA経路の下流にある古典的な腫瘍抑制因子と相互作用し、それによって相同組換え(HR)によるDNA修復に関与する。FA症例のうち80~90%は、FANCA、FANCC、およびFANCGの3つの遺伝子のうちのいずれかの変異によって起こる。これらの遺伝子は、FAコア複合体の成分を産生するための指示を与える。FAコア複合体に関連するそのような遺伝子の変異により、複合体は機能しなくなり、FA経路全体が崩壊する。その結果、DNA損傷は効率的に修復されず、ICLは時間の経過とともに蓄積する。Geiselhart, “Review Article, Disrupted Signaling through the Fanconi Anemia Pathway Leads to Dysfunctional Hematopoietic Stem Cell Biology: Underlying Mechanisms and Potential Therapeutic Strategies (総説:ファンコニ貧血経路を介して崩壊したシグナル伝達は造血幹細胞の生物学的機能障害につながる:根本的機構と可能性のある治療方策),” Anemia Volume 2012 (2012), Article ID 265790, dx.doi.org/10.1155/2012/265790 は、FAと、FANCC遺伝子をコードするレンチウイルスの大腿内注射によってin vivoでHSCを補正することを含む動物実験について考察している。FAに関連する1つ以上の変異を標的化するCRISPR-Cas (C2C1)システム(たとえば、FAを引き起こすFANCA、FANCC、またはFANCGの変異のうちの1つ以上をそれぞれ標的化してFANCA、FANCC、またはFANCGのうちの1つ以上の補正発現を起こすgRNAおよびHDR鋳型を有するCRISPR-Cas (C2C1)システム)を用いる。たとえば、gRNAはFANCCに関する変異を標的化することができ、HDRはFANCCの適切な発現のためのコード化を起こすことができる。変異(たとえば、FANCA、FANCCまたはFANCGのうちのいずれか1つ以上に関する変異など、FAに関与する1つ以上の変異)を標的化するgRNAとCas (C2C1)タンパク質とを含む粒子を、変異を持つHSCと接触させる。粒子は、FANCA、FANCC、またはFANCGのうちのいずれか1つ以上など、FAに関与するタンパク質のうちの1つ以上の適切な発現のために変異を補正するための適切なHDR鋳型を含むこともできる。または、HSCを、HDR鋳型を含むまたは送達する第2の粒子またはベクターと接触させることができる。このように接触させた細胞を投与、かつ必要に応じて処置/増殖することができる(Cartierの文献を参照のこと)。
本明細書で考察する(たとえば、gRNAとCas (C2C1)と必要に応じてHDR鋳型とを含む、またはHDR鋳型を含む)粒子(たとえば、血友病B、SCID、SCID-X1、ADA-SCID、遺伝性チロシン血症、β-地中海貧血症、X連鎖性CGD、ウィスコット・アルドリッチ症候群、ファンコニ貧血、副腎白質ジストロフィー(ALD)、異染性白質ジストロフィー(MLD)、HIV/AIDS、免疫不全障害、血液学的状態、または遺伝子リソソーム蓄積症に関するもの)を、gRNAとCas(たとえばC2c1)タンパク質の混合物(必要に応じてHDR鋳型を含む、または鋳型に関して別個の粒子が望ましい場合、HDR鋳型のみを含むこのような混合物)は、界面活性剤、リン脂質、生分解性ポリマー、リポタンパク質、およびアルコールを含む、またはそれらから本質的になる、またはそれらからなる混合物と混合することによって有利に得られる、または得られることができる(1つ以上のgRNAはHSCの遺伝子座を標的化する)。
実際、本発明は遺伝性造血器障害および免疫不全障害(遺伝性免疫不全障害など)をゲノム編集によって、特に本明細書で考察される粒子技術によって治療するのに特に好適である。遺伝性免疫不全は、本発明のゲノム編集介入が成功する可能性のある疾患である。理由としては以下が挙げられる。造血細胞(免疫細胞はその亜集合である)は治療に利用しやすい。それらを体から取り出し、自家移植または同種異系移植することができる。さらに、特定の遺伝性免疫不全(たとえば重症複合免疫不全症(SCID))は、免疫細胞に増殖の不利益を起こす。SCIDを引き起こす遺伝的病変の珍しい自然「復帰」変異による補正は、1つのリンパ球前駆細胞さえ補正すれば患者の免疫機能を回復するのに十分である可能性があることを示している(.../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporary Internet Files/Content.Outlook/GA8VY8LK/Treating SCID for Ellen.docx - _ENREF_1)。Bousso, P., et al. Diversity, functionality, and stability of the T cell repertoire derived in vivo from a single human T cell precursor (in vivoで単一のヒトT細胞前駆細胞から生じたT細胞レパートリーの多様性、機能、および安定性). Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000)を参照のこと。編集された細胞の選択的利点により、低度の編集でも治療効果が得られる。本発明のこの効果は、SCID、ウィスコット・アルドリッチ症候群、および本明細書で述べるその他の状態(ヘモグロビン欠乏が赤芽球前駆細胞の健康に悪影響を及ぼすα-およびβ-地中海貧血症など、その他の遺伝性造血器障害が挙げられる)で見られる。
NHEJおよびHDRによるDSB修復の活動は、細胞の種類および細胞の状態によって大きく異なる。NHEJは細胞周期によって高度に制御されておらず細胞型全体で効率的であるため、到達可能な標的細胞集団の高度な遺伝子破壊が可能である。対照的に、HDRは主にS/G2期に作用するため、活発に分裂している細胞に限定され、正確なゲノム改変を必要とする治療は有糸分裂細胞に限定される[Ciccia, A. & Elledge, S.J. Molecular cell 40, 179-204 (2010); Chapman, J.R., et al. Molecular cell 47, 497-510 (2012)]。注目すべきことに、C2c1タンパク質を含むCRISPR-C2c1システムは標的部位でねじれ型の切断を起こす。したがって、本発明では標的配列の切断、改変、および/または修復はHDRに依存してもしなくてもよい。特定の実施態様では、CRISPR-C2c1システムはNHEJによってねじれ型DSBの修復を導入する。特定の実施態様では、本発明のCRISPR-C2c1システムは、非分裂細胞(神経細胞など)においてNHEJによってねじれ型DSBの修復を導入する。
HDRを介した補正の効率を標的遺伝子座の後成的状態もしくは配列、または使用する特定の修復鋳型構成(一本鎖と二本鎖、長い相同性腕と短い相同性腕)によって制御してもよい[Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185-1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181-2187 (2004); Beumer, K.J., et al. G3 (2013)]。標的細胞におけるNHEJおよびHDR機構の相対的活性も遺伝子補正効率に影響を及ぼす可能性がある。というのも、これらの経路がDSBを解消するのに競合する可能性があるからである[Beumer, K.J., et al. Proceedings of the National Academy of Sciences of the United States of America 105, 19821-19826 (2008)]。HDRではさらに、NHEJでは見られない送達の課題が課せられる。というのも、それにはヌクレアーゼと修復鋳型とが同時に送達される必要があるからである。実際、これらの制約により、現在までは治療に関連する細胞型ではHDRの水準が低くなっている。したがって、臨床翻訳は疾患を治療するためにNHEJ方策に主に焦点を当ててきたが、現在、血友病Bおよび遺伝性チロシン血症のマウスモデルについて前臨床の概念実証HDR治療が記載されている[Li, H., et al. Nature 475, 217-221 (2011); Yin, H., et al. Nature biotechnology 32, 551-553 (2014)]。
任意のゲノム編集用途は、タンパク質、低分子RNA分子、および/または修復鋳型の組合わせを含んでいてもよく、これらの複数の部分の送達は小分子治療薬よりも実質的に難しくなる。ゲノム編集手段を送達するためのex vivoとin vivoの2つの主要な方策が開発されている。ex vivo治療では、罹患した細胞を体から取り出し、編集した後に患者に再び移植する。ex vivo編集には、標的細胞集団を明確に規定し、細胞に送達する治療用分子の特定の投与量を指定することができるという利点がある。非特異的改変が懸念される場合、後者の考慮事項は特に重要となる可能性がある。というのも、ヌクレアーゼの量を用量設定するとそのような変異が減少する可能性があるからである(Hsu et al., 2013)。ex vivoの手法の別の利点は、研究および遺伝子治療用途のための培養液中の細胞へのタンパク質および核酸の効率的な送達システムが開発されたことにより、達成できる編集速度が典型的に高いことである。
ex vivoの手法には、わずかな数の疾患に用途を制限する欠点がある可能性がある。たとえば、標的細胞は体外での操作に耐えることができなければならない。脳のような多くの組織にとって、体外で細胞を培養するのは大きな課題である。というのも、細胞は生存することができないか、in vivoの機能に必要な特性を失うからである。したがって、本開示および当技術分野の知識を考慮すると、CRISPR-Cas (C2c1)システムによる、ex vivo培養および操作に適した成体幹細胞集団を有する組織(造血系など)に関するex vivo治療が可能である[Bunn, H.F. & Aster, J. Pathophysiology of blood disorders, (McGraw-Hill, New York, 2011)]。
in vivoゲノム編集は、編集システムをそれらの天然組織の細胞型に直接送達することを含む。in vivo編集により、罹患した細胞集団がex vivo操作に適さない疾患を治療することができる。さらに、細胞にヌクレアーゼをin situで送達することにより、多くの組織および細胞型を治療することができる。これらの特性により、おそらく、in vivo治療をex vivo治療よりも広範囲の疾患に応用することができる。
現在まで、in vivo編集は規定された組織特異的向性を持つウイルスベクターの使用を通じて主に達成されてきた。このようなベクターは現在、積荷輸送能力と向性(tropism)の点で制限されており、この治療方法は、臨床的に有用なベクターによる形質導入が効率的である臓器系(肝臓、筋肉、眼など)に限定されている[Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445-451 (2014); Nguyen, T.H. & Ferry, N. Gene therapy 11 Suppl 1, S76-84 (2004); Boye, S.E., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 509-519 (2013)]。
in vivo送達の考えられる障害は、治療に必要な大量のウイルスに応答して起こる可能性のある免疫応答であるが、この現象はゲノム編集に特有のものではなく、ウイルスに基づくその他の遺伝子療法でも見られる[Bessis, N., et al. Gene therapy 11 Suppl 1, S10-17 (2004)]。編集用ヌクレアーゼ自体に由来のペプチドがMHCクラスI分子で提示されて免疫応答を刺激する可能性もあるが、前臨床レベルでこの出来事を裏付ける証拠はほとんどない。この治療方法の別の大きな障害は、in vivoでのゲノム編集用ヌクレアーゼの分布、ひいては投与量を制御することであり、予測が難しいかもしれない非特異的変異の特性につながる。しかし、本開示および当技術分野の知識(がんの治療に用いられる、ウイルスに基づく治療および粒子に基づく治療の使用など)を考慮すると、たとえば粒子またはウイルスのいずれかによる送達によるHSCのin vivo改変は当業者の範囲内である。
ex vivo編集療法:造血細胞の精製、培養、および移植に関する長年の臨床専門知識により、血液系に影響を及ぼす疾患(SCID、ファンコニ貧血、ウィスコット・アルドリッチ症候群、および鎌状赤血球貧血など)がex vivo編集療法の対象となっている。造血細胞に焦点を当てる別の理由は、血液障害の遺伝子療法を設計するためのこれまでの取り組みのおかげで、相対的に効率の高い送達システムが既に存在していることである。これらの利点により、編集済み細胞が適応度の利点を持つ疾患にこの治療方法を応用することができるため、わずかな数の移植された編集済み細胞が増殖して疾患を治療することができる。そのような病気の1つはHIVであり、感染はCD4+ T細胞の適応度に不利になる。
ex vivo編集療法は近年、遺伝子補正方策を含むように拡張されている。ex vivoでのHDRの障害は、SCID-X1に罹った患者から得た造血幹細胞(HSC)で変異IL2RG遺伝子の遺伝子補正を達成した近年のGenoveseと同僚の論文で克服された[Genovese, P., et al. Nature 510, 235-240 (2014)]。Genoveseらは、多角的な方策を用いてHSCの遺伝子補正を達成した。まず、IL2RGの治療用cDNAをコードするHDR鋳型を含む統合欠損型(integration-deficient)レンチウイルスを用いてHSCに形質導入した。形質導入後、細胞にIL2RGの変異ホットスポットを標的化するZFNをコードするmRNAをエレクトロポレーションし、HDRに基づく遺伝子補正を刺激した。HDR速度を上げるために、培養条件を小分子を用いてHSC分裂を促すように最適化した。最適化された培養条件、ヌクレアーゼ、およびHDR鋳型を用いて、SCID-X1患者由来の遺伝子補正HSCを培養液中で、治療に適切な速度で得た。同じ遺伝子補正手順を受けた罹患していない個体のHSCは、HSC機能の絶対的基準であるマウスで長期にわたり造血を維持することができた。HSCは、すべての造血細胞型を発生させることができ、自家移植することができることから、すべての遺伝性造血器障害にとって非常に価値のある細胞集団である[Weissman, I.L. & Shizuru, J.A. Blood 112, 3543-3553 (2008)]。原理上、遺伝子補正HSCを用いて広範囲の遺伝性血液障害を治療することができ、この研究は治療用のゲノム編集にとって興味深い大きな進歩である。
in vivo編集療法:本開示および当技術分野の知識から、in vivo編集を有利に用いることができる。送達が効率的である臓器系については既に多くの興味深い前臨床治療の成功がある。in vivo編集療法の成功の最初の例は、血友病Bのマウスモデルで実証された[Li, H., et al. Nature 475, 217-221 (2011)]。先に述べたように、血友病Bは、凝固系の重要な構成要素である第IX因子をコードする遺伝子の機能喪失型変異によって引き起こされるX連鎖性劣性遺伝疾患である。重度に罹患した個体の第IX因子活性を1%を超えるまで回復させると、疾患を著しく軽度の形態に変えることができる。というのも、そのような患者に組換え第IX因子を若者から予防的に注入してそのレベルを達成することで臨床的合併症が大幅に改善するからである[Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]。したがって、患者の臨床成績を変えるのに必要なのは低度のHDR遺伝子補正だけである。さらに、第IX因子は、編集システムをコードするウイルスベクターによって効率的に形質導入できる臓器である肝臓によって合成かつ分泌される。
ZFNをコードする肝臓指向性アデノ随伴ウイルス(AAV)血清型と、補正HDR鋳型とを用いて、マウス肝臓で変異型ヒト化第IX因子遺伝子の最大7%の遺伝子補正が達成された[Li, H., et al. Nature 475, 217-221 (2011)]。これによって凝固系の機能の尺度である血餅形成動態が改善し、in vivo編集療法が実行可能であるだけでなく効果的でもあることが初めて実証された。本明細書で考察するように、当業者は本明細書の教示および当技術分野の知識(たとえばLiの文献)から、HDR鋳型とX連鎖性劣性遺伝性障害の変異を標的化して機能欠失変異を逆転させるCRISPR-Cas (C2c1)システムとを含む粒子を用いて血友病Bを解消するところまできている。
この研究に基づいて、近年、他の集団はCRISPR-Casによる肝臓のin vivoゲノム編集を用いて、遺伝性チロシン血症のマウスモデルの治療に成功し、循環器疾患に対する防御となる変異を形成している。これらの2つの異なる用途は、肝機能障害を含む障害に関するこの手法の多様性を示している[Yin, H., et al. Nature biotechnology 32, 551-553 (2014); Ding, Q., et al. Circulation research 115, 488-492 (2014)]。この方策が広く利用可能であることを証明するには、他の臓器系にin vivo編集を応用する必要がある。現在、この治療方法で治療することができる障害の範囲を拡大するために、ウイルスベクターと非ウイルスベクターの両方を最適化する取組みが進行中である[Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445-451 (2014); Yin, H., et al. Nature reviews. Genetics 15, 541-555 (2014)]。本明細書で考察するように、当業者は本明細書の教示および当技術分野の知識(たとえばYinの文献)から、HDR鋳型と変異を標的化するCRISPR-Cas (C2c1)システムとを含む粒子を用いて遺伝性チロシン血症を解消するところまできている。
標的欠失、治療用途:遺伝子の標的欠失が好ましい場合がある。したがって、免疫不全障害、血液学的状態、または遺伝性リソソーム蓄積症、たとえば、血友病B、SCID、SCID-X1、ADA-SCID、遺伝性チロシン血症、β-地中海貧血症、X連鎖性CGD、ウィスコット・アルドリッチ症候群、ファンコニ貧血、副腎白質ジストロフィー(ALD)、異染性白質ジストロフィー(MLD)、HIV/AIDS、その他の代謝障害に関与する遺伝子、疾患に関与する誤って折り畳まれたタンパク質をコードする遺伝子、疾患に関与する機能喪失につながる遺伝子、一般に、本明細書に記載の任意の送達システムを用いてHSCにおいて標的化することができる変異が好ましく、粒子システムが有利だと考えられる。
本発明では、特にCRISPR酵素の免疫原性を、エリスロポエチンに関してTangriらの文献で最初に記載され後に開発された手法に従って低下させてもよい。したがって、定向進化または合理的設計を用いて宿主種(ヒトまたは他の種)においてCRISPR酵素(たとえばC2c1)の免疫原性を低下させてもよい。
ゲノム編集:本発明のCRISPR/Cas (C2c1)システムを用いて、以前にTALENおよびZFNならびにレンチウイルスを用いて試みられたがほとんど成功していない、本明細書に記載したものも含む遺伝子変異を補正することができる(WO2013163628も参照のこと)。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
脳、中枢神経および免疫系の疾患の治療
本発明はまた、CRISPR-Casシステムを脳または神経細胞に送達することも意図している。実施態様によっては、CRISPR-CasシステムはC2c1タンパク質を含む。実施態様によっては、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。好ましい実施態様では、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJ、好ましくはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。たとえば、RNA干渉(RNAi)により、ハンチントン病の原因遺伝子であるHTTの発現を低下させることによってこの障害の治療の可能性が得られる(たとえば、McBride et al., Molecular Therapy vol. 19 no. 12 Dec. 2011, pp. 2152-2162を参照のこと)。したがって、出願人はそれをCRISPR-Casシステムに使用し、かつ/または適合させてもよいと想定している。CRISPR-Casシステムをアルゴリズムを用いて生成し、アンチセンス配列の標的以外への作用の可能性を低減してもよい。CRISPR-Cas配列を、マウス、アカゲザル、またはヒトのいずれかのハンチンチンのエクソン52の配列を標的化しAAVなどのウイルスベクターで発現させてもよい。動物(ヒトを含む)に、半球あたり約3回(合計6回)の微量注射を注入してもよい。最初は前交連から1 mm吻側(12 μl)、残りの2回の注射(それぞれ12 μlと10 μl)は最初の注射から尾側に3 mmと6 mm空けて、1012 vg/mlのAAVで約1 μl/分の速度で行い、針をさらに5分間そのままにして注射液を針の先端から拡散させた。
DiFigliaら(PNAS, October 23, 2007, vol. 104, no. 43, 17204-17209)は、Httを標的化するsiRNAの成体線条体への単回投与によって変異型Httを発現抑制し、神経病態を弱め、HDの急速発症ウイルス遺伝子組換えマウスモデルに見られる異常な行動表現型を遅らせることができることを観察した。DiFigliaは、マウスの線条体内に10 μMのCy3標識付きcc-siRNA-Httまたは未結合のsiRNA-Httを2 μl、注射した。本発明では、ヒトの場合にも似た投与量のHtt標的化CRISPR Casを考えてもよく、たとえば10 μMのHtt標的化CRISPR Casを約5~10m l、線条体内注射してもよい。
別の例では、Boudreauら(Molecular Therapy vol. 17 no. 6 june 2009)はhtt特異的なRNAiウイルスを発現する組換えAAV血清型2/1ベクターを5 μl(4×1012ウイルスゲノム/ml)、線条体に注射している。本発明では、ヒトの場合にも似た投与量のHtt標的化CRISPR Casを考えてもよく、たとえば約10~20mlの4×1012ウイルスゲノム/ml)のHtt標的化CRISPR Casを線条体内注射してもよい。
別の例では、HTT標的化CRISPR Casを継続投与してもよい(たとえば、Yu et al., Cell 150, 895-908, August 31, 2012を参照のこと)。Yuらは、0.25 ml/hrを送達する浸透圧ポンプ(2004型)を利用して300 mg/日のss-siRNAまたはリン酸緩衝生理食塩水(PBS)(Sigma Aldrich)を28日間送達し、0.5 μl/時を送達するように設計されたポンプ(2002型)を利用して75 mg/日の陽性対照MOE ASOを14日間送達した。移植の前に、滅菌PBSで希釈した後37℃で24時間または48時間インキュベートしたss-siRNAまたはMOEをポンプ(Durect Corporation)に充填した(2004型)。マウスを2.5%イソフルランで麻酔し、頭蓋底に正中切開を行った。定位固定ガイドを用いてカニューレを右側脳室に留置し、Loctite接着剤で固定した。Alzet浸透圧ミニポンプに装着したカテーテルをカニューレに取り付け、ポンプを肩甲骨中央部の皮下に配置した。切込みを5.0ナイロン縫合糸で閉じた。本発明では、ヒトの場合にも似た投与量のHtt標的化CRISPR Casを考えてもよく、たとえば約500~1000 g/日のHtt 標的化CRISPR Casを投与してもよい。
継続注入の別の例では、Stilesら(Experimental Neurology 233 (2012) 463-471)はチタン製の針先付きの実質内カテーテルを右被殻に留置した。カテーテルを、腹部に皮下留置したSynchroMed(登録商標)IIポンプ(Medtronic Neurological、ミネソタ州ミネアポリス)に接続した。6 μL/日のリン酸緩衝生理食塩水を7日間注入した後、ポンプに試験品を再充填し、7日間の継続送達用にプログラムした。約2.3~11.52 mg/日のsiRNAを、約0.1~0.5 μL/分の様々な注入速度で注入した。本発明では、ヒトの場合にも似た投与量のHtt標的化CRISPR Casを考えてもよく、たとえば約20~200 mg/日のHtt標的化CRISPR Casを投与してもよい。別の例では、Sangamoに譲渡された米国特許出願公開第20130253040号の方法を、ハンチントン病を治療するためにTALESから本発明の核酸標的化システムに適合させてもよい。
別の例では、Sangamoに譲渡された米国特許出願公開第20130253040号(WO2013130824)の方法を、ハンチントン病を治療するためにTALESから本発明のCRISPR Casシステムに適合させてもよい。
The Broad InstituteらによるWO2015089354 A1(参照により本明細書に組み込まれる)には、ハンチントン病に関する標的(HP)が記載されている。ハンチントン病に関して、CRISPR複合体の考えられる標的遺伝子は、PRKCE、IGF1、EP300、RCOR1、PRKCZ、HDAC4、およびTGM2である。したがって、本発明の実施態様によっては、PRKCE、IGF1、EP300、RCOR1、PRKCZ、HDAC4、およびTGM2のうちの1つ以上をハンチントン病に関する標的として選択してもよい。
他の三塩基反復病。これらとしては、以下のいずれかを挙げることができる。すなわち、分類Iにはハンチントン病(HD)および脊髄小脳失調症が含まれる。分類IIでは、増殖は表現型が多様であり、一般に小規模だが遺伝子のエクソンにも見られる不均一な増殖を伴う。分類IIIには、脆弱X症候群、筋強直性ジストロフィー、脊髄小脳失調症2、若年ミオクローヌスてんかん、およびフリードライヒ運動失調症が含まれる。
本発明のさらなる側面は、ラフォラ病に関連すると特定されているEMP2AおよびEMP2B遺伝子の欠陥を補正するためにCRISPR-Casシステムを利用することに関する。ラフォラ病は進行性ミオクローヌスてんかんを特徴とする常染色体劣性遺伝病であり、青年期のてんかん発作として始まることがある。この疾患のいくつかの症例は、まだ特定されていない遺伝子の変異によって引き起こされている可能性がある。この疾患は、発作、筋肉のけいれん、歩行困難、認知症、そして最終的に死を引き起こす。現在、疾患の進行に対して有効だと証明されている治療法はない。てんかんに関連する他の遺伝的異常もCRISPR-Casシステムで標的化してもよく、基礎となる遺伝学については、Genetics of Epilepsy and Genetic Epilepsies(Giuliano Avanzini、Jeffrey L. Noebels編、Mariani Foundation Paediatric Neurology:20; 2009)にさらに記載されている。
Sangamo BioSciences, Inc.に譲渡された米国特許出願公開第20110158957号のT細胞受容体(TCR)遺伝子の不活化に関連する方法も、本発明のCRISPR Casシステムに合わせて変更してもよい。別の例では、Sangamo BioSciences, Inc.に譲渡された米国特許出願公開第20100311124号およびCellectisに譲渡された米国特許出願公開第20110225664号の方法(いずれもグルタミンシンターゼ遺伝子発現遺伝子の不活化に関連)の方法も、本発明のCRISPR Casシステムに合うよう変更してもよい。
脳への送達の選択肢としては、CRISPR酵素とDNAまたはRNAのいずれかの形態のガイドRNAとをリポソームに被包すること、および血液脳関門(BBB)送達のためにトロイの木馬分子(moleular Trojan horse)に結合させることが挙げられる。トロイの木馬分子は、ヒト以外の霊長類の脳へのB-gal発現ベクターの送達に効果的であることがわかっている。同じ手法を用いて、CRISPR酵素とガイドRNAとを含むベクターを送達することができる。たとえば、Xia CFおよびBoado RJ, Pardridge WM ("Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology (アビジン-ビオチン技術を用いた、ヒトインスリン受容体を介した抗体によるsiRNAの標的化)." Mol Pharm. 2009 May-Jun;6(3):747-51. doi: 10.1021/mp800194)は、受容体特異的モノクローナル抗体(mAb)とアビジン-ビオチン技術とを併用して培養液中およびin vivoで細胞に短鎖干渉RNA(siRNA)を送達することができる方法について記載している。著者らはまた、標的化用mAbとsiRNAとの間の結合がアビジン-ビオチン技術によって安定しているため、in vivoでは標的化したsiRNAの静脈内投与後に脳などの離れた部位でのRNAi作用が観察されることを報告している。
Zhangら(Mol Ther. 2003 Jan;7(1):11-8.)は、ルシフェラーゼなどのレポーターをコードする発現プラスミドを85nmのペグ化免疫リポソームで構成された「人工ウイルス」(ヒトインスリン受容体(HIR)に対するモノクローナル抗体(MAb)を用いてin vivoでアカゲザルの脳に向けられた)内に被包した方法について記載している。HIRMAbにより、外来遺伝子を運ぶリポソームは静脈内注射後に血液脳関門を通過する経細胞輸送および神経細胞膜を通過する飲食作用を受けることができる。脳内のルシフェラーゼ遺伝子発現のレベルは、ラットと比較してアカゲザルでは50倍高かった。霊長類の脳におけるβ-ガラクトシダーゼ遺伝子の広範囲な神経細胞発現が組織化学と共焦点顕微鏡の両方によって実証された。著者らは、この手法により24時間で可逆的な成体遺伝子組換え体を得ることができることを示している。したがって、免疫リポソームの使用が好ましい。これらを特定の組織または細胞表面タンパク質を標的化する抗体と併用してもよい。
アルツハイマー病
米国特許出願公開第20110023153号には、亜鉛フィンガーヌクレアーゼを用いてアルツハイマー病に関連する細胞、動物、およびタンパク質を改変することが記載されている。一旦改変された細胞および動物を既知の方法でさらに試験して、標的化された変異のAD発症および/または進行への影響についてADの研究に一般に用いられる尺度(限定するわけではないが、学習と記憶、不安、うつ状態、中毒、および感覚運動機能など)ならびに行動的、機能的、病理学的、代謝的、生化学的機能を測定する検定を用いて研究してもよい。
本開示は、ADに関連するタンパク質をコードする任意の染色体配列の編集を包含する。
実施態様によっては、本発明で開示されているシステムはC2c1-CRISPRシステムを含む。実施態様によっては、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異をAD関連遺伝子に導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変をAD関連遺伝子の転写物に導入する。AD関連タンパク質は、典型的にはAD関連タンパク質とAD障害との実験上の関連性に基づいて選択される。たとえば、AD障害を持つ集団のAD関連タンパク質の産生速度または循環濃度が、AD障害のない集団よりも高く、または低くてもよい。タンパク質濃度の差をプロテオミクス技術(ウエスタンブロット、免疫組織化学的染色、酵素結合免疫吸着検定(ELISA)、および質量分析が挙げられるがこれらに限定されない)を用いて評価してもよい。あるいは、AD関連タンパク質を、ゲノム技術(DNAマイクロアレイ解析、遺伝子発現の連続分析(SAGE)、および定量的実時間ポリメラーゼ連鎖反応(Q-PCR)が挙げられるがこれらに限定されない)によりタンパク質をコードする遺伝子の遺伝子発現特性を取得して特定してもよい。
アルツハイマー病関連タンパク質の例としては、たとえば、VLDLR遺伝子によってコードされる超低密度リポタンパク質受容体タンパク質(VLDLR)、UBA1遺伝子によってコードされるユビキチン様改変因子活性化酵素1 (UBA1)、またはUBA3遺伝子によってコードされるNEDD8活性化酵素E1触媒サブユニットタンパク質(UBE1C)が挙げられる。
非限定的な例として、ADに関連するタンパク質としては、以下に列挙したタンパク質が挙げられるがこれらに限定されない:染色体配列にコードされたタンパク質ALAS2Δ-アミノレブリン酸シンターゼ2 (ALAS2)、ABCA1 ATP結合カセット輸送体(ABCA1)、アンジオテンシンI変換酵素(ACE)、アポリポタンパク質E前駆体(APOE)、アミロイド前駆体タンパク質(APP)、アクアポリン1タンパク質(AQP1)、Mycボックス依存性相互作用タンパク質1または架橋統合因子1タンパク質(BIN1)、脳由来神経栄養因子(BDNF)、ブチロフィリン様タンパク質8 (BTNL8)、C1ORF49(染色体1翻訳領域49)、CDH4(カドヘリン4)、CHRNB2(神経細胞アセチルコリン受容体サブユニットβ2)、CKLF様MARVEL膜貫通ドメイン含有タンパク質2 (CKLFSF2)、C型レクチンドメインファミリー4、メンバーe (CLEC4E)、CLU(クラスタリンタンパク質)(アポリポタンパク質Jとしても知られる)、赤血球補体受容体1 (CR1)(CD35、C3b/C4b受容体、免疫付着受容体としても知られる)、赤血球補体受容体1 (CR1L)、顆粒球コロニー刺激因子3受容体(CSF3R)、CST3(シスタチンCまたはシスタチン3)、CYP2C(チトクロムP450 2C)、細胞死関連タンパク質キナーゼ1 (DAPK1)、ESR1(エストロゲン受容体1)、IgA受容体のFc断片(FCAR;CD89としても知られる)、IgGのFc断片、低親和性IIIb、受容体(FCGR3BまたはCD16b)、遊離脂肪酸受容体2 (FFA2)、FGA(フィブリノーゲン(第I因子))、GRB2関連結合タンパク質2 (GAB2)、GRB2関連結合タンパク質2 (GAB2)、GALP(ガラニン様ペプチド)、グリセルアルデヒド-3-リン酸デヒドロゲナーゼ精子形成タンパク質(GAPDHS)、GMPB、ハプトグロビン(HP)、HTR7(5-ヒドロキシトリプタミン(セロトニン)受容体7(アデニル酸シクラーゼ結合)、IDE(インスリン分解酵素)、IF127、αインターフェロン誘導型タンパク質6 (IFI6)、テトラトリコペプチド反復配列を持つインターフェロン誘導型タンパク質2 (IFIT2)、IL1RN(インターロイキン1受容体アンタゴニスト(IL-1RA)、インターロイキン8受容体α (IL8RAまたはCD181)、インターロイキン8受容体β (IL8RB)、Jagged 1 (JAG1)、カリウム内向き整流性チャンネル、サブファミリーJ、メンバー15 (KCNJ15)、低密度リポタンパク質受容体関連タンパク質6 (LRP6)、微小管関連タンパク質τ (MAPT)、MAP/微小管親和性調節キナーゼ4 (MARK4)、MPHOSPH1(M期リン酸化タンパク質1)、MTHFR(5,10-メチレンテトラヒドロ葉酸レダクターゼ)、MX2(インターフェロン誘導型GTP結合タンパク質)、ニブリン(NBNとしても知られる)、NCSTN(ニカストリン)、ナイアシン受容体2(NIACR2;GPR109Bとしても知られる)、NMNAT3(ニコチンアミドヌクレオチド アデニリルトランスフェラーゼ3)、NTM(ニューロトリミン;またはHNT)、オロソムコイド1 (ORM1)またはα1-酸性糖タンパク質1、P2Yプリン受容体13 (P2RY13)、ニコチンアミドホスホリボシルトランスフェラーゼ(NAmPRTaseまたはNampt;プレB細胞コロニー転写促進因子1 (PBEF1)またはビスファチンとしても知られる)、PCK1(ホスホエノールピルビン酸カルボキシキナーゼ)、ホスファチジルイノシトール結合クラスリン集合タンパク質(PICALM)、ウロキナーゼ型プラスミノーゲン活性化因子(PLAU)、プレキシンC1 (PLXNC1)、PRNP(プリオンタンパク質)、プレセニリン1タンパク質(PSEN1)、プレセニリン2タンパク質(PSEN2)、タンパク質チロシンホスファターゼ受容体A型タンパク質(PTPRA)、PHドメインおよびSH3結合モチーフ2を持つRal GEF (RALGPS2)、Gタンパク質シグナル伝達調節因子様タンパク質2 (RGSL2)、セレン結合タンパク質1 (SELNBP1)、SLC25A37(ミトフェリン1)、ソルチリン関連受容体L(DLRクラス)A反復を有するタンパク質(SORL1)、TF(トランスフェリン)、TFAM(ミトコンドリア転写因子A)、TNF(腫瘍壊死因子)、腫瘍壊死因子受容体スーパーファミリーメンバー10C (TNFRSF10C)、腫瘍壊死因子受容体スーパーファミリー(TRAIL)メンバー10a (TNFSF10)、ユビキチン様改変因子活性化酵素1 (UBA1)、UBA3(NEDD8活性化酵素E1触媒サブユニットタンパク質(UBE1C))、ユビキチンBタンパク質(UBB)、UBQLN1(ユビキリン1)、ユビキチンカルボキシル末端エステラーゼL1タンパク質(UCHL1)、ユビキチンカルボキシル末端ヒドロラーゼイソ酵素L3タンパク質(UCHL3)、超低密度リポタンパク質受容体タンパク質(VLDLR)。
模範的な実施態様では、染色体配列を編集したAD関連タンパク質は、VLDLR遺伝子によってコードされる超低密度リポタンパク質受容体タンパク質(VLDLR)、UBA1遺伝子によってコードされるユビキチン様改変因子活性化酵素1 (UBA1)、UBA3遺伝子によってコードされるNEDD8活性化酵素E1触媒サブユニットタンパク質(UBE1C)、AQP1遺伝子によってコードされるアクアポリン1タンパク質(AQP1)、UCHL1遺伝子によってコードされるユビキチンカルボキシル末端エステラーゼL1タンパク質(UCHL1)、UCHL3遺伝子によってコードされるユビキチンカルボキシル末端ヒドロラーゼイソ酵素L3タンパク質(UCHL3)、UBB遺伝子によってコードされるユビキチンBタンパク質(UBB)、MAPT遺伝子によってコードされる微小管関連タンパク質τ (MAPT)、PTPRA遺伝子によってコードされるタンパク質チロシンホスファターゼ受容体A型タンパク質(PTPRA)、PICALM遺伝子によってコードされるホスファチジルイノシトール結合クラスリン集合タンパク質(PICALM)、CLU 遺伝子によってコードされるクラスタリンタンパク質(アポリポタンパク質Jとしても知られる)、PSEN1遺伝子によってコードされるプレセニリン1タンパク質、PSEN2遺伝子によってコードされるプレセニリン2タンパク質、SORL1遺伝子によってコードされるソルチリン関連受容体L(DLRクラス)A反復を有するタンパク質(SORL1)、APP遺伝子によってコードされるアミロイド前駆体タンパク質(APP)、APOE遺伝子によってコードされるアポリポタンパク質E前駆体(APOE)、またはBDNF遺伝子によってコードされる脳由来神経栄養因子(BDNF)であってもよい。模範的な実施態様では、遺伝子改変動物はラットであり、AD関連タンパク質をコードする編集された染色体配列は以下のとおりである:アミロイド前駆体タンパク質(APP) NM_019288、アクアポリン1タンパク質(AQP1) NM_012778、脳由来神経栄養因子(BDNF) NM_012513、CLU(クラスタリンタンパク質;NM_053021アポリポタンパク質Jとしても知られる)、微小管関連タンパク質τ NM_017212 tau (MAPT)、ホスファチジルイノシトール結合NM_053554クラスリン集合タンパク質(PICALM)、プレセニリン1タンパク質(PSEN1) NM_019163、プレセニリン2タンパク質(PSEN2) NM_031087、タンパク質チロシンホスファターゼNM_012763受容体A型タンパク質(PTPRA)、ソルチリン関連受容体L(DLR NM_053519クラス)A反復XM_001065506を有するタンパク質(SORL1) XM_217115、ユビキチン様改変因子活性化NM_001014080酵素1(UBA1)、UBA3(NEDD8活性化酵素E1 NM_057205触媒サブユニットタンパク質(UBE1C)、ユビキチンBタンパク質(UBB) NM_138895、ユビキチンカルボキシル末端NM_017237エステラーゼL1タンパク質(UCHL1)、ユビキチンカルボキシル末端NM_001110165ヒドロラーゼイソ酵素L3タンパク質(UCHL3)、超低密度リポタンパク質NM_013155受容体タンパク質(VLDLR)。
動物または細胞は、AD関連タンパク質をコードする1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、またはそれ以上の破壊された染色体配列、およびAD関連タンパク質をコードする0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、またはそれ以上の染色体組込み配列を含んでいてもよい。
編集された、または組み込まれた染色体配列をADに関連する改変タンパク質をコードするように改変してもよい。ADに関連する染色体配列の多数の変異がADに関与している。たとえば、APPのV7171(すなわち717位のバリンがイソロイシンに変えられている)ミスセンス変異は家族性ADを引き起こす。プレセニリン1タンパク質の複数の変異、たとえばH163R(すなわち163位のヒスチジンがアルギニンに変えられている)、A246E(すなわち246位のアラニンがグルタミン酸に変えられている)、L286V(すなわち286位のロイシンがバリンに変えられている)、C410Y(すなわち410位のシステインがチロシンに変えられている)は家族性アルツハイマー病3型を引き起こす。プレセニリン2タンパク質の複数の変異、たとえばN141I(すなわち141位のアスパラギンがイソロイシンに変えられている)、M239V(すなわち239位のメチオニンがバリンに変えられている)、およびD439A(すなわち439位のアスパラギン酸がアラニンに変えられている)は、家族性アルツハイマー病4型を引き起こす。AD関連遺伝子の遺伝的多様体と疾患とのその他の関連性は当技術分野で公知である。たとえばWaring et al. (2008) Arch. Neurol. 65:329-334を参照のこと(同文献の開示内容全体が参照により本明細書に組み込まれる)。
セクレターゼ障害
米国特許出願公開第20110023146号には、亜鉛フィンガーヌクレアーゼを用いてセクレターゼ関連障害に関連する細胞、動物、およびタンパク質を改変することが記載されている。セクレターゼはタンパク質前駆体をその生物学的に活性な形態に処理するのに必須である。当業者は、本明細書に開示されている方法を米国特許出願公開第20010023146号に記載のものと似たシステムで本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
セクレターゼ経路の様々な構成要素の欠陥は、多くの障害、特に特徴的なアミロイド形成またはアミロイド斑を伴う障害(アルツハイマー病(AD)など)の一因となる。
セクレターゼ障害およびこれらの障害に関連するタンパク質は、多数の障害に対する感受性、障害の有無、障害の重症度、またはそれらの任意の組み合わせに影響を及ぼす多様なタンパク質の集合である。本開示は、セクレターゼ障害に関連するタンパク質をコードする任意の染色体配列を編集することを含む。セクレターゼ障害に関連するタンパク質は、典型的にはセクレターゼ関連タンパク質とセクレターゼ障害の発症との実験上の関連性に基づいて選択される。たとえば、セクレターゼ障害を持つ集団のセクレターゼ障害関連タンパク質の産生速度または循環濃度が、セクレターゼ障害のない集団よりも高く、または低くてもよい。タンパク質濃度の差をプロテオミクス技術(ウエスタンブロット、免疫組織化学的染色、酵素結合免疫吸着検定(ELISA)、および質量分析が挙げられるがこれらに限定されない)を用いて評価してもよい。あるいは、セクレターゼ障害関連タンパク質を、ゲノム技術(DNAマイクロアレイ解析、遺伝子発現の連続分析(SAGE)、および定量的実時間ポリメラーゼ連鎖反応(Q-PCR)が挙げられるがこれらに限定されない)を用いてタンパク質をコードする遺伝子の遺伝子発現特性を取得して特定してもよい。
非限定的な例として、セクレターゼ障害に関連するタンパク質としては以下が挙げられる:PSENEN (プレセニリンエンハンサー2相同体(線虫(C. elegans))、CTSB (カテプシンB)、PSEN1 (プレセニリン1)、APP (アミロイドβ(A4)前駆体タンパク質)、APH1B (前咽頭欠損1相同体B(線虫))、PSEN2 (プレセニリン2(アルツハイマー病4))、BACE1 (APP β部位切断酵素1)、ITM2B (膜内在性タンパク質2B)、CTSD (カテプシンD)、NOTCH1 (ノッチ相同体1、転座関連(ショウジョウバエ属(Drosophila))、TNF (腫瘍壊死因子(TNFスーパーファミリー、メンバー2))、INS (インスリン)、DYT10 (ジストニア10)、ADAM17 (ADAMメタロペプチダーゼドメイン17)、APOE (アポリポタンパク質E)、ACE (アンジオテンシンI変換酵素(ペプチジルジペプチダーゼA)1)、STN (スタチン)、TP53 (腫瘍タンパク質p53)、IL6 (インターロイキン6 (インターフェロンβ2))、NGFR (神経成長因子受容体(TNFRスーパーファミリーメンバー16))、IL1B (インターロイキン1β)、ACHE (アセチルコリンエステラーゼ(Yt血液型))、CTNNB1 (カテニン(カドヘリン関連タンパク質)β1、88kDa)、IGF1 (インスリン様成長因子1(ソマトメジンC))、IFNG (インターフェロンγ)、NRG1 (ニューレグリン1)、CASP3 (カスパーゼ3、アポトーシス関連システインペプチダーゼ)、MAPK1 (分裂促進因子活性化タンパク質キナーゼ1)、CDH1 (カドヘリン1、1型、E-カドヘリン(上皮))、APBB1 (アミロイドβ(A4)前駆体タンパク質結合タンパク質、ファミリーB、メンバー1(Fe65))、HMGCR (3-ヒドロキシ-3-メチルグルタリル-補酵素Aレダクターゼ)、CREB1 (cAMP応答配列結合タンパク質1)、PTGS2 (プロスタグランジンエンドペルオキシドシンターゼ2(プロスタグランジンG/Hシンターゼおよびシクロオキシゲナーゼ))、HES1 (ヘアリーアンドエンハンサーオブスプリット(hairy and enhancer of split)1(ショウジョウバエ))、CAT (カタラーゼ)、TGFB1 (形質転換成長因子β1)、ENO2 (エノラーゼ2(γ、神経))、ERBB4 (v-erb-a赤芽球性白血病ウイルスがん遺伝子相同体4(鳥類))、TRAPPC10 (輸送タンパク質粒子複合体10)、MAOB (モノアミンオキシダーゼB)、NGF (神経成長因子(β-ポリペプチド))、MMP12 (マトリックスメタロペプチダーゼ12 (マクロファージエラスターゼ))、JAG1 (jagged-1(アラジール症候群))、CD40LG (CD40リガンド)、PPARG (ペルオキシソーム増殖因子活性化受容体γ)、FGF2 (線維芽細胞成長因子2(塩基性))、IL3 (インターロイキン3 (マルチコロニー刺激因子))、LRP1 (低密度リポタンパク質受容体関連タンパク質1)、NOTCH4 (ノッチ相同体4(ショウジョウバエ属))、MAPK8 (分裂促進因子活性化タンパク質キナーゼ8)、PREP (プロリルエンドペプチダーゼ)、NOTCH3 (ノッチ相同体3(ショウジョウバエ属))、PRNP (プリオンタンパク質)、CTSG (カテプシンG)、EGF (上皮成長因子(β-ウロガストロン))、REN (レニン)、CD44 (CD44分子(インド式血液型))、SELP (セレクチンP(顆粒膜タンパク質140kDa、抗原CD62))、GHR (成長ホルモン受容体)、ADCYAP1 (アデニル酸シクラーゼ活性化ポリペプチド1(下垂体))、INSR (インスリン受容体)、GFAP (グリア線維酸性タンパク質)、MMP3 (マトリックスメタロペプチダーゼ3 (ストロメライシン1、プロゼラチナーゼ))、MAPK10 (分裂促進因子活性化タンパク質キナーゼ10)、SP1 (Sp1転写因子)、MYC (v-myc骨髄球腫症ウイルスがん遺伝子相同体(鳥類))、CTSE (カテプシンE)、PPARA (ペルオキシソーム増殖増殖因子活性化受容体α)、JUN(junがん遺伝子)、TIMP1 (TIMPメタロペプチダーゼ阻害因子1)、IL5 (インターロイキン5(好酸球コロニー刺激因子))、IL1A (インターロイキン1α)、MMP9 (マトリックスメタロペプチダーゼ9 (ゼラチナーゼ B、92kDaゼラチナーゼ、92kDa IV型コラゲナーゼ))、HTR4 (5-ヒドロキシトリプタミン(セロトニン)受容体4)、HSPG2 (ヘパラン硫酸プロテオグリカン2)、KRAS (v-Ki-ras2カーステンラット肉腫ウイルスがん遺伝子相同体)、CYCS (チトクロムc、体細胞)、SMG1 (SMG1相同体、ホスファチジルイノシトール3キナーゼ関連キナーゼ(線虫))、IL1R1 (インターロイキン1受容体、I型)、PROK1 (プロキネクチン1)、MAPK3 (分裂促進因子活性化タンパク質キナーゼ3)、NTRK1 (神経栄養性チロシンキナーゼ、受容体、1型)、IL13 (インターロイキン13)、MME (膜メタロエンドペプチダーゼ)、TKT (トランスケトラーゼ)、CXCR2 (ケモカイン(C-X-Cモチーフ)受容体2)、IGF1R (インスリン様成長因子1受容体)、RARA (レチノイン酸受容体α)、CREBBP (CREB結合タンパク質)、PTGS1 (プロスタグランジンエンドペルオキシドシンターゼ1(プロスタグランジンG/Hシンターゼおよびシクロオキシゲナーゼ))、GALT (ガラクトース1-リン酸ウリジリルトランスフェラーゼ)、CHRM1 (コリン作動性受容体、ムスカリン性1)、ATXN1 (アタキシン1)、PAWR (PRKC、アポトーシス、WT1、調節因子)、NOTCH2 (ノッチ相同体2(ショウジョウバエ属))、M6PR (マンノース-6-リン酸受容体(カチオン依存性))、CYP46A1 (チトクロムP450、ファミリー46、サブファミリーA、ポリペプチド1)、CSNK1 D (カゼインキナーゼ1Δ)、MAPK14 (分裂促進因子活性化タンパク質キナーゼ14)、PRG2 (プロテオグリカン2、骨髄(ナチュラルキラー細胞活性化因子、好酸球顆粒主要塩基性タンパク質))、PRKCA (タンパク質キナーゼCα)、L1 CAM (L1細胞接着分子)、CD40(CD40分子、TNF受容体スーパーファミリーメンバー5)、NR1I2 (核内受容体サブファミリー1、I群、メンバー2)、JAG2 (jagged-2)、CTNND1 (カテニン(カドヘリン関連タンパク質)、Δ1)、CDH2 (カドヘリン2、1型、N-カドヘリン(神経細胞))、CMA1 (キマーゼ1、肥満細胞)、SORT1 (ソルチリン1)、DLK1 (デルタ様1相同体(ショウジョウバエ属))、THEM4 (チオエステラーゼスーパーファミリーメンバー4)、JUP (接合プラコグロビン)、CD46 (CD46分子、補体調節タンパク質)、CCL11 (ケモカイン(C-Cモチーフ)リガンド11)、CAV3 (カベオリン3)、RNASE3 (リボヌクレアーゼ、RNase Aファミリー3(好酸球カチオン性タンパク質))、HSPA8 (熱ショック70kDaタンパク質8)、CASP9 (カスパーゼ9、アポトーシス関連システインペプチダーゼ)、CYP3A4 (チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド4)、CCR3 (ケモカイン(C-Cモチーフ)受容体3)、TFAP2A (転写因子AP-2α(活性化エンハンサー結合タンパク質2α))、SCP2 (ステロール担体タンパク質2)、CDK4 (サイクリン依存性キナーゼ4)、HIF1A (低酸素誘導性因子1、αサブユニット(塩基性ヘリックス・ループ・ヘリックス転写因子))、TCF7L2 (転写因子7様2(T細胞特異的、HMGボックス))、IL1R2 (インターロイキン1受容体、II型)、B3GALTL (β-1,3-ガラクトシルトランスフェラーゼ様)、MDM2 (Mdm2 p53結合タンパク質相同体(マウス))、RELA (v-rel細胞内皮症ウイルスがん遺伝子相同体A(鳥類))、CASP7 (カスパーゼ7、アポトーシス関連システインペプチダーゼ)、IDE (インスリン分解酵素)、FABP4 (脂肪酸結合タンパク質4、脂肪細胞)、CASK (カルシウム/カルモジュリン依存性セリンタンパク質キナーゼ(MAGUKファミリー))、ADCYAP1R1 (アデニル酸シクラーゼ活性化ポリペプチド1(下垂体)受容体I型)、ATF4 (活性化転写因子4 (tax応答性エンハンサー配列B67))、PDGFA (血小板由来成長因子αポリペプチド)、C21またはf33 (染色体21翻訳領域33)、SCG5 (セクレトグラニンV(7B2タンパク質))、RNF123 (リングフィンガータンパク質123)、NFKB1 (B細胞内κ軽鎖ポリペプチド遺伝子エンハンサー核内因子1)、ERBB2 (v-erb-b2赤芽球性白血病ウイルスがん遺伝子相同体2、神経/膠芽腫由来がん遺伝子相同体(鳥類))、CAV1 (カベオリン1、カベオラタンパク質、22kDa)、MMP7 (マトリックスメタロペプチダーゼ7(マトリライシン、子宮))、TGFA (形質転換成長因子α)、RXRA (レチノイドX受容体α)、STX1A (シンタキシン1A(脳))、PSMC4 (プロテアソーム(プロソーム、マクロパイン)26Sサブユニット、ATPアーゼ4)、P2RY2 (プリン作動性受容体P2Y、G-タンパク質共役型、2)、TNFRSF21 (腫瘍壊死因子受容体スーパーファミリー、メンバー21)、DLG1 (discs、大相同体1(ショウジョウバエ属))、NUMBL (numb相同体(ショウジョウバエ属)様)、SPN (シアロホリン)、PLSCR1 (リン脂質スクランブラーゼ1)、UBQLN2 (ユビキリン2)、UBQLN1 (ユビキリン1)、PCSK7 (プロタンパク質転換酵素スブチリシン/ケキシン7型)、SPON1 (スポンジン1、細胞外基質タンパク質)、SILV (silver相同体(マウス))、QPCT (グルタミニル-ペプチドシクロトランスフェラーゼ)、HESS (ヘアリーアンドエンハンサーオブスプリット5(ショウジョウバエ属))、GCC1 (GRIPおよびコイルドコイルドメイン含有1)、およびそれらの任意の組合わせ。
遺伝子改変動物または細胞は、セクレターゼ障害関連タンパク質をコードする1、2、3、4、5、6、7、8、9、10、またはそれ以上の破壊された染色体配列、および破壊されたセクレターゼ障害関連タンパク質をコードする0、1、2、3、4、5、6、7、8、9、10、またはそれ以上の染色体組込み配列を含んでいてもよい。
ALS
米国特許出願公開第20110023144号には、亜鉛フィンガーヌクレアーゼを用いて筋萎縮性側索硬化症(ALS)に関連する細胞、動物、およびタンパク質を遺伝子改変することが記載されている。ALSは、随意運動に関与する大脳皮質、脳幹、および脊髄の特定の神経細胞が徐々に着実に変性するのが特徴である。当業者は、本明細書に開示されている方法を米国特許出願公開第20110023144号に記載のものと似たシステムで本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。好ましい実施態様では、ねじれ型DSBはHRとは独立した機構、たとえばNHEJによって修復される。実施態様によっては、標的細胞は非分裂細胞である。特定の実施態様では、標的細胞は運動神経細胞である。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
運動神経細胞障害およびこれらの障害に関連するタンパク質は、運動神経細胞障害の発症に対する感受性、運動神経細胞障害の存在、運動神経細胞障害の重症度、またはそれらの任意の組合わせに影響を及ぼす多様なタンパク質の集合である。本開示は、特定の運動神経細胞障害であるALS障害に関連するタンパク質をコードする任意の染色体配列を編集することを含む。ALSに関連するタンパク質は、典型的にはALS関連タンパク質とALSとの実験上の関連性に基づいて選択される。たとえば、ALSを持つ集団のALS関連タンパク質の産生速度または循環濃度が、ALSのない集団よりも高く、または低くてもよい。タンパク質濃度の差をプロテオミクス技術(ウエスタンブロット、免疫組織化学的染色、酵素結合免疫吸着検定(ELISA)、および質量分析が挙げられるがこれらに限定されない)を用いて評価してもよい。あるいは、ALS関連タンパク質を、ゲノム技術(DNAマイクロアレイ解析、遺伝子発現の連続分析(SAGE)、および定量的実時間ポリメラーゼ連鎖反応(Q-PCR)が挙げられるがこれらに限定されない)によりタンパク質をコードする遺伝子の遺伝子発現特性を取得して特定してもよい。
非限定的な例として、ALSに関連するタンパク質としては以下のタンパク質が挙げられるが、これらに限定されない:SOD1 (スーパーオキシドジスムターゼ1)、ALS3 (筋萎縮性側索硬化症可溶性3)、SETX (セナタキシン)、ALS5 (筋萎縮性側索硬化症5)、FUS (肉腫融合)、ALS7 (筋萎縮性側索硬化症7)、ALS2 (筋萎縮性側索硬化症2)、DPP6 (ジペプチジル-ペプチダーゼ6)、NEFH (神経細線維、重鎖)、PTGS1 (プロスタグランジン-ポリペプチドエンドペルオキシドシンターゼ1)、SLC1A2 (溶質輸送体ファミリー1)、TNFRSF10B (腫瘍壊死因子 (膠細胞高親和性受容体スーパーファミリー、グルタミン酸輸送体)、メンバー10bメンバー2、PRPH (ペリフェリン)、HSP90AA1 (熱ショックタンパク質90kDa α (細胞基質)、クラスAメンバー1)、GRIA2 (グルタミン酸受容体)、IFNG (インターフェロンγ、向イオン性)、AMPA 2、S100B (S100カルシウム結合)、FGF2 (線維芽細胞成長因子2タンパク質B)、AOX1 (アルデヒドオキシダーゼ1)、CS (クエン酸シンターゼ)、TARDBP (TAR DNA結合タンパク質)、TXN (チオレドキシン)、RAPH1 (Ras関連)、MAP3K5 (分裂促進因子活性化 タンパク質 (RaIGDS/AF-6)およびキナーゼ5プレクストリン相同ドメイン1、NBEAL1 (ニューロビーチン様1)、GPX1 (グルタチオンペルオキシダーゼ1)、ICA1L (島細胞自己抗原)、RAC1 (ras関連C3ボツリヌス1.69kDa様毒素基質1)、MAPT (微小管関連)、ITPR2 (イノシトール1,4,5-タンパク質τ三リン酸受容体、2型)、ALS2CR4 (筋萎縮性側索硬化症2 (若年性)、染色体領域、候補4)、GLS (グルタミナーゼ)、ALS2CR8 (筋萎縮性側索硬化症2 (若年性)受容体)、染色体領域、候補8)、CNTFR (毛様体神経栄養因子)、ALS2CR11 (筋萎縮性側索硬化症2 (若年性)染色体領域、候補11)、FOLH1 (葉酸ヒドロラーゼ1)、FAM117B (配列類似性117を有するファミリー、メンバーB、βポリペプチド)、P4HB(プロリル4-ヒドロキシラーゼ)、CNTF (毛様体神経栄養因子)、SQSTM1 (セクエストソーム1)、STRADB (STE20関連キナーゼ)、NAIP (NLRファミリー、アポトーシスアダプターβ阻害タンパク質)、YWHAQ (チロシン3-モノオキシゲナーゼ/トリプトファン(アセチル-CoA輸送体)、5-モノオキシゲナーゼメンバー1活性化タンパク質、θポリペプチド)、SLC33A1 (溶質輸送担体ファミリー33)、TRAK2 (輸送タンパク質、相同体)、SAC1 (キネシン結合2脂質ホスファターゼドメイン含有)、NIF3L1 (NIF3 (NGG1相互作用神経細胞因子3)様1)、INA (インターネキシン中間径線維タンパク質、α)、PARD3B (par-3分配欠損型3相同体B)、COX8A (チトクロムcオキシダーゼサブユニットVIIIA)、CDK15 (サイクリン依存性キナーゼ15)、HECW1 (HECT、C2およびWWドメイン含有E3ユビキチンタンパク質リガーゼ1)、NOS1 (一酸化窒素合成酵素1)、MET (metがん原遺伝子)、SOD2 (スーパーオキシドジスムターゼ2)、HSPB1 (熱ショック27kDaミトコンドリアタンパク質1)、NEFL (神経細線維、軽鎖)、CTSB (カテプシンBポリペプチド)、ANG (アンジオゲニン)、HSPA8 (熱ショック70kDa Aタンパク質8ファミリー)、リボヌクレアーゼ (RNase)、5 VAPB (VAMP (小胞体関連膜タンパク質)関連タンパク質BおよびC)、ESR1 (エストロゲン受容体1)、SNCA (シヌクレイン、α)、HGF (肝細胞増殖因子)、CAT (カタラーゼ)、ACTB (アクチン、β)、NEFM (神経細線維、中間鎖)、TH (チロシンヒドロキシラーゼポリペプチド)、BCL2 (B細胞CLL/リンパ腫2)、FAS (Fas (TNF受容体スーパーファミリー、メンバー6))、CASP3 (カスパーゼ3、アポトーシス関連システインペプチダーゼ)、CLU (クラスタリン)、SMN1 (運動神経細胞生存1、テロメア)、G6PD (グルコース-6-リン酸デヒドロゲナーゼ)、BAX (BCL2関連X)、HSF1 (熱ショック転写タンパク質因子1)、RNF19A (リングフィンガータンパク質19A)、JUN (junがん遺伝子)、ALS2CR12 (筋萎縮性側索硬化症2 (若年性)、染色体領域、候補12)、HSPA5 (熱ショック70kDaタンパク質5)、MAPK14 (分裂促進因子活性化タンパク質キナーゼ14)、IL10 (インターロイキン10)、APEX1 (APEXヌクレアーゼ1)、TXNRD1 (チオレドキシンレダクターゼ(多機能性DNA修復酵素)1)、NOS2 (一酸化窒素合成酵素2)、TIMP1 (TIMPメタロペプチダーゼ 誘導性阻害因子1)、CASP9 (カスパーゼ9、アポトーシス関連システインペプチダーゼ)、XIAP (X連鎖性アポトーシス阻害因子)、GLG1 (ゴルジ糖タンパク質1)、EPO (エリスロポエチン)、VEGFA (血管内皮成長因子A)、ELN (エラスチン)、GDNF (膠細胞由来神経栄養因子)、NFE2L2 (核内因子(赤血球由来2)様2)、SLC6A3 (溶質輸送体ファミリー6、メンバー3)、HSPA4 (熱ショック70kDa (神経伝達物質タンパク質4輸送体、ドーパミン)、APOE (アポリポタンパク質E)、PSMB8 (プロテアソーム(プロソーム、マクロパイン)サブユニット、β型、8)、DCTN1 (ダイナクチン1)、TIMP3 (TIMPメタロペプチダーゼ阻害因子3)、KIFAP3 (キネシン関連タンパク質3)、SLC1A1 (溶質輸送体ファミリー1 (神経細胞/上皮高親和性輸送体、Xag系)、メンバー1)、SMN2 (運動神経細胞生存2)、CCNC (サイクリンC、セントロメア)、MPP4 (膜タンパク質、パルミトイル化4)、STUB1 (STIP1相同Uボックス含有タンパク質1)、ALS2 (アミロイドβ (A4))、PRDX6 (ペルオキシレドキシン6前駆体タンパク質)、SYP (シナプトフィジン)、CABIN1 (カルシニューリン結合タンパク質1)、CASP1 (カスパーゼ1、アポトーシス関連システインペプチダーゼ)、GART (ホスホリボシルグリシンアミドホルミルトランスフェラーゼ、ホスホリボシルグリシンアミドシンテターゼ、ホスホリボシルアミノイミダゾールシンテターゼ)、CDK5 (サイクリン依存性キナーゼ5)、ATXN3 (アタキシン3)、RTN4 (レティキュロン4)、C1QB (補体成分1、qサブ成分、B鎖)、
VEGFC (神経成長因子)、HTT (ハンチンチン受容体)、PARK7 (パーキンソン病7)、XDH (キサンチンデヒドロゲナーゼ)、GFAP (グリア細胞線維酸性タンパク質)、MAP2 (微小管関連タンパク質2)、CYCS (チトクロムc、体細胞)、FCGR3B (IgGのFc断片、低親和性IIIb)、CCS (スーパーオキシドジスムターゼの銅シャペロン)、UBL5 (ユビキチン様5)、MMP9 (マトリックスメタロペプチダーゼ9 (小胞アセチルコリン)、SLC18A3 (溶質輸送体ファミリー18、メンバー3)、TRPM7 (一過性受容体電位カチオンチャンネル、サブファミリーM、メンバー7)、HSPB2 (熱ショック27kDaタンパク質2)、AKT1 (v-aktマウス胸腺腫ウイルスがん遺伝子相同体1)、DERL1 (Der1様ドメインファミリー、メンバー1)、CCL2 (ケモカイン(C--Cモチーフ)リガンド2)、NGRN (ニューグリン、神経突起伸長関連)、GSR (グルタチオンレダクターゼ)、TPPP3 (チューブリン重合促進タンパク質ファミリーメンバー3)、APAF1 (アポトーシスペプチダーゼ活性化因子1)、BTBD10 (BTB (POZ)ドメイン含有10)、GLUD1 (グルタミン酸デヒドロゲナーゼ1)、CXCR4 (ケモカイン(C--X--Cモチーフ)受容体4)、SLC1A3 (溶質輸送体ファミリー1、メンバー3)、FLT1 (fms関連チロシン(膠細胞高親和性グルタミン輸送体)キナーゼ1)、PON1 (パラオキソナーゼ1)、AR (アンドロゲン受容体)、LIF (白血病阻害因子)、ERBB3 v-erb-b2 (赤芽球性白血病ウイルスがん遺伝子相同体3)、LGALS1 (レクチン、ガラクトシド結合、可溶性、1)、CD44 (CD44分子)、TP53 (腫瘍タンパク質p53)、TLR3 (toll様受容体3)、GRIA1 (グルタミン酸受容体、向イオン性、AMPA1)、GAPDH (グリセルアルデヒド-3-リン酸デヒドロゲナーゼ)、GRIK1 (グルタミン酸受容体、向イオン性、カイニン酸、1)、DES (デスミン)、CHAT (コリンアセチルトランスフェラーゼ)、FLT4 (fms関連チロシンキナーゼ4)、CHMP2B (クロマチン改変タンパク質2B)、BAG1 (BCL2関連athanogene遺伝子)、MT3 (メタロチオネイン3)、CHRNA4 (コリン作動性受容体、ニコチン、α4)、GSS (グルタチオンシンテターゼ)、BAK1 (BCL2拮抗物質/キラー1)、KDR (キナーゼ挿入ドメイン受容体)、GSTP1 (グルタチオンS-トランスフェラーゼ (III型π1チロシンキナーゼ)、OGG1 (8-オキソグアニンDNA
グリコシラーゼ)、IL6 (インターロイキン6 (インターフェロンβ2)。
動物または細胞は、ALS関連タンパク質をコードする1、2、3、4、5、6、7、8、9、10、またはそれ以上の破壊された染色体配列、および破壊されたALS関連タンパク質をコードする0、1、2、3、4、5、6、7、8、9、10、またはそれ以上の染色体組込み配列を含んでいてもよい。好ましいALSタンパク質としては、SOD1 (スーパーオキシドジスムターゼ1)、ALS2 (筋萎縮性側索硬化症2)、FUS (肉腫融合)、TARDBP (TAR DNA結合タンパク質)、VAGFA (血管内皮増殖因子A)、VAGFB (血管内皮増殖因子B)、およびVAGFC (血管内皮増殖因子C)、ならびにそれらの任意の組合わせが挙げられる。
自閉症
米国特許出願公開第20110023145号には、亜鉛フィンガーヌクレアーゼを用いて自閉症スペクトル障害 (ASD)に関連する細胞、動物、およびタンパク質を遺伝子改変することが記載されている。自閉症スペクトル障害 (ASD)は社会的相互作用および意思疎通の質的な障害、ならびに制限された反復的かつ常同的なパターンの行動、感心、および活動を特徴とする障害群である。自閉症、アスペルガー症候群 (AS)、および特定不能の広汎性発達障害(PDD-NOS)の3つの障害は、様々な程度の重症度、関連する知的機能および医学的状態を持つ同じ障害の連続体である。ASDは主に遺伝的に決定された障害であり、遺伝率は約90%である。
米国特許出願公開第20110023145号は、本発明のCRISPR Casシステムに応用してもよい、ASDに関連するタンパク質をコードする任意の染色体配列の編集を包含する。ASDに関連するタンパク質は、典型的にはASD関連タンパク質とASDの発生または徴候との実験上の関連性に基づいて選択される。たとえば、ASDを持つ集団のASD関連タンパク質の産生速度または循環濃度が、ASDのない集団よりも高く、または低くてもよい。タンパク質濃度の差をプロテオミクス技術(ウエスタンブロット、免疫組織化学的染色、酵素結合免疫吸着検定(ELISA)、および質量分析が挙げられるがこれらに限定されない)を用いて評価してもよい。あるいは、ASD関連タンパク質を、ゲノム技術(DNAマイクロアレイ解析、遺伝子発現の連続分析(SAGE)、および定量的実時間ポリメラーゼ連鎖反応(Q-PCR)が挙げられるがこれらに限定されない)によりタンパク質をコードする遺伝子の遺伝子発現特性を取得して特定してもよい。当業者は、本明細書に開示されている方法を米国特許出願公開第20110023145号に記載のものと似たシステムで本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
ASDに関連するタンパク質に関連する可能性のある病状または障害の非限定的な例としては、自閉症、アスペルガー症候群(AS)、特定不能の広汎性発達障害(PDD-NOS)、レット症候群、結節性硬化症、フェニルケトン尿症、スミス・レムリ・オピッツ症候群、および脆弱X症候群が挙げられる。非限定的なASD関連タンパク質の例としては、以下のタンパク質が挙げられるがこれらに限定されない:アミノリン脂質輸送ATPアーゼチロシンキナーゼ (ATP10C)、MET (MET受容体)、BZRAP1、MGLUR5 (GRM5) (代謝調節型グルタミン酸受容体5)、CDH10 (カドヘリン10)、MGLUR6 (GRM6) (代謝調節型グルタミン酸受容体 6)、CDH9 (カドヘリン9)、NLGN1 (ニューロリジン1)、CNTN4 (コンタクチン4)、NLGN2 (ニューロリジン2)、CNTNAP2 (コンタクチン関連タンパク質様2)、SEMA5A、ニューロリジン3、DHCR7 (7-デヒドロコレステロールレダクターゼ)、NLGN4X (ニューロリジン4X連鎖性)、DOC2A (二重C2様ドメイン含有タンパク質α)、NLGN4Y (ニューロリジン4Y連鎖性)、DPP6 (ジペプチジルアミノペプチダーゼ様6)、NLGN5 (ニューロリジン5)、EN2 (engrailed 2)、NRCAM (神経細胞接着分子)、MDGA2 (脆弱X精神遅滞)、NRXN1 (ニューレキシン1)、FMR2 (AFF2) (AF4/FMR2ファミリーメンバー2)、OR4M2 (嗅覚受容体4M2)、FOXP2 (フォークヘッドボックスタンパク質P2)、OR4N4 (嗅覚受容体4N4)、FXR1 (脆弱X精神遅滞、体細胞、相同体1)、OXTR (オキシトシン受容体)、FXR2 (脆弱X精神遅滞、体細胞、相同体2)、PAH (フェニルアラニンヒドロキシラーゼ)、GABRA1 (γアミノ酪酸受容体サブユニットα1)、PTEN (ホスファターゼおよびテンシン相同体)、GABRA5 (GABAA (γアミノ酪酸)受容体サブユニットα5)、PTPRZ1 (チロシンタンパク質ホスファターゼζ)、GABRB1 (γアミノ酪酸受容体サブユニットβ1)、RELN (リーリン)、GABRB3 (GABAA (γアミノ酪酸受容体β3サブユニット)、RPL10 60S (リボソームタンパク質タンパク質L10)、GABRG1 (γアミノ酪酸受容体サブユニットγ1)、SEMA5A (セマフォリン5A)、HIRIP3 (HIRA相互作用タンパク質3)、SEZ6L2 (てんかん関連6相同体(マウス)様2)、HOXA1 (ホメオボックスタンパク質Hox-A1)、SHANK3 (SH3および多重アンキリン反復ドメイン3)、IL6 (インターロイキン6)、SHBZRAP1 (SH3および多重アンキリン反復ドメイン3)、LAMB1 (ラミニンサブユニットβ1)、SLC6A4 (セロトニン輸送体)、MAPK3 (分裂促進因子活性化タンパク質キナーゼ3)、TAS2R1 (味覚受容体2型メンバー1)、MAZ (Myc関連亜鉛フィンガー)、TSC1 (結節性硬化症タンパク質1)、MDGA2 (MAMドメイン含有グリコシルホスファチジルイノシトールアンカー2)、TSC2 (結節性硬化症タンパク質2)、MECP2 (メチルCpG結合タンパク質2)、UBE3A (ユビキチンタンパク質リガーゼE3A)、MECP2 (メチルCpG結合タンパク質2)、WNT2 (無翅型MMTV統合部位ファミリーメンバー2)。
染色体配列を編集されるASD関連タンパク質の特定は変動する可能性があり、変動する。好ましい実施態様では、染色体配列を編集されるASD関連タンパク質は、BARAP1遺伝子によってコードされるベンゾジアザピン受容体(末梢)関連タンパク質1 (BZRAP1)、AFF2遺伝子によってコードされるAF4/FMR2ファミリーメンバー2タンパク質 (AFF2) (MFR2ともいう)、FXR1遺伝子によってコードされる脆弱X精神遅滞常染色体性相同体1タンパク質 (FXR1)、FXR2遺伝子によってコードされる脆弱X精神遅滞常染色体性相同体2タンパク質 (FXR2)、MDGA2遺伝子によってコードされるMAMドメイン含有グリコシルホスファチジルイノシトールアンカー2 (MDGA2)、MECP2遺伝子によってコードされるメチルCpG結合タンパク質2 (MECP2)、MGLUR5-1遺伝子によってコードされる代謝調節型グルタミン酸受容体5 (MGLUR5) (GRM5ともいう)、NRXN1遺伝子によってコードされるニューレキシン1タンパク質、またはSEMA5A遺伝子によってコードされるセマフォリン5Aタンパク質 (SEMA5A)であってもよい。模範的な実施態様では、遺伝子改変される動物は、ラットであり、ASD関連タンパク質をコードする編集される染色体配列は以下に列挙するものである:BZRAP1 (ベンゾジアザピン受容体、(末梢)関連タンパク質1) XM_002727789、XM_213427、XM_002724533、XM_001081125、AFF2 (FMR2) (AF4/FMR2ファミリーメンバー2) XM_219832、XM_001054673、FXR1 (脆弱X精神遅滞常染色体性相同体1) NM_001012179、FXR2 (脆弱X精神遅滞常染色体性相同体2) NM_001100647、MDGA2 (MAMドメイン含有グリコシルホスファチジルイノシトールアンカー2) NM_199269、MECP2 (メチルCpG結合タンパク質2) NM_022673、MGLUR5 (代謝調節型グルタミン酸受容体5) NM_017012、NRXN1 (ニューレキシン1) NM_021767、SEMA5A (セマフォリン5A) NM_001107659。
三塩基反復伸長病
米国特許出願公開第20110016540号には、亜鉛フィンガーヌクレアーゼを用いて三塩基反復伸長病に関連する細胞、動物、およびタンパク質を遺伝子改変することが記載されている。三塩基反復伸長病は、発達神経生物学に関連し、認知および感覚運動機能に影響を及ぼすことの多い複雑な進行性障害である。当業者は、本明細書に開示されている方法を米国特許出願公開第20110016540号に記載のものと似たシステムで本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
三塩基反復伸長タンパク質は、三塩基反復伸長病の発症に対する感受性、三塩基反復伸長病の存在、三塩基反復伸長病の重症度、またはそれらの任意の組合わせに影響を及ぼす多様なタンパク質の集合である。三塩基反復伸長病は、反復の種類によって決まる2つの分類に分かれる。最も一般的な反復は三塩基CAGであり、遺伝子の翻訳領域に存在する場合、アミノ酸のグルタミン(Q)をコードする。したがって、これらの障害はポリグルタミン(polyQ)障害と呼ばれ、以下の疾患、ハンチントン病(HD)、球脊髄性筋萎縮症(SBMA)、脊髄小脳失調症(SCA1、2、3、6、7、および17型)、および歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)で構成される。残りの三塩基反復伸長病は、CAG三塩基を含まないか、CAG三塩基が遺伝子の翻訳領域にないため、非ポリグルタミン障害と呼ばれる。非ポリグルタミン障害には脆弱X症候群(FRAXA)、脆弱XE精神遅滞(FRAXE)、フリードライヒ運動失調症(FRDA)、筋強直性ジストロフィー(DM)、および脊髄小脳失調症(SCA8および12型)が含まれる。
三塩基反復伸長病に関連するタンパク質は、典型的には三塩基反復伸長病に関連するタンパク質と三塩基反復伸長病との実験上の関連性に基づいて選択される。たとえば、三塩基反復伸長病を持つ集団の三塩基反復伸長病に関連するタンパク質の産生速度または循環濃度は、三塩基反復伸長病のない集団よりも高い、または低くてもよい。タンパク質濃度の差をプロテオミクス技術(ウエスタンブロット、免疫組織化学的染色、酵素結合免疫吸着検定(ELISA)、および質量分析が挙げられるがこれらに限定されない)を用いて評価してもよい。あるいは、三塩基反復伸長病に関連するタンパク質を、ゲノム技術(DNAマイクロアレイ解析、遺伝子発現の連続分析(SAGE)、および定量的実時間ポリメラーゼ連鎖反応(Q-PCR)が挙げられるがこれらに限定されない)によりタンパク質をコードする遺伝子の遺伝子発現特性を取得して特定してもよい。
三塩基反復伸長病に関連するタンパク質の非限定的な例としては、以下が挙げられる: AR (アンドロゲン受容体)、FMR1 (脆弱X精神遅滞1)、HTT (ハンチンチン)、DMPK (筋強直性ジストロフィータンパク質キナーゼ)、FXN (フラタキシン)、ATXN2 (アタキシン2)、ATN1 (アトロフィン1)、FEN1 (フラップ構造特異的エンドヌクレアーゼ1)、TNRC6A (三塩基反復含有6A)、PABPN1 (ポリ (A)結合タンパク質、核内1)、JPH3 (ジャンクトフィリン3)、MED15 (メディエーター複合体サブユニット15)、ATXN1 (アタキシン1)、ATXN3 (アタキシン3)、TBP (TATAボックス結合タンパク質)、CACNA1A (カルシウムチャンネル、電圧依存型、P/Q型、α1Aサブユニット)、ATXN80S (ATXN8対向鎖 (非タンパク質翻訳))、PPP2R2B (タンパク質ホスファターゼ2、調節サブユニットB、β)、ATXN7 (アタキシン7)、TNRC6B (三塩基反復含有6B)、TNRC6C (三塩基反復含有6C)、CELF3 (CUGBP、Elav様ファミリーメンバー3)、MAB21L1 (mab-21様1 (線虫))、MSH2 (mutS相同体2、大腸がん、非ポリープ型1 (大腸菌))、TMEM185A (膜貫通タンパク質185A)、SIX5 (SIXホメオボックス5)、CNPY3 (キャノピー3相同体 (ゼブラフィッシュ))、FRAXE (脆弱部位、葉酸型、稀、fra(X)(q28) E)、GNB2 (グアニンヌクレオチド結合タンパク質 (Gタンパク質)、βポリペプチド2)、RPL14 (リボソームタンパク質 L14)、ATXN8 (アタキシン8)、INSR (インスリン受容体)、TTR (トランスチレチン)、EP400 (E1A結合タンパク質p400)、GIGYF2 (GRB10相互作用GYFタンパク質 2)、OGG1 (8-オキソグアニンDNAグリコシラーゼ)、STC1 (スタニノカルシン1)、CNDP1 (カルノシンジペプチダーゼ1 (メタロペプチダーゼM20ファミリー))、C10orf2 (染色体10翻訳領域2)、MAML3 (mastermind様3 (ショウジョウバエ属)、DKC1 (先天性角化異常症1、ジスケリン)、PAXIP1 (PAX相互作用(転写活性化ドメインと)タンパク質1)、CASK (カルシウム/カルモジュリン依存型セリンタンパク質キナーゼ(MAGUKファミリー))、MAPT (微小管関連タンパク質τ)、SP1 (Sp1転写因子)、POLG (ポリメラーゼ (DNA指向性)、γ)、AFF2 (AF4/FMR2ファミリー、メンバー2)、THBS1 (トロンボスポンジン1)、TP53 (腫瘍タンパク質p53)、ESR1 (エストロゲン受容体1)、CGGBP1 (CGG三塩基反復結合タンパク質1)、ABT1 (基礎転写活性化因子1)、KLK3 (カリクレイン関連ペプチダーゼ3)、PRNP (プリオンタンパク質)、JUN (junがん遺伝子)、KCNN3 (中間/小コンダクタンスカルシウム活性化カリウムチャンネル、サブファミリーN、メンバー3)、BAX (BCL2関連Xタンパク質)、FRAXA (脆弱部位、葉酸型、稀、fra(X)(q27.3) A (巨精巣症、精神遅滞))、KBTBD10 (ケルチ反復およびBTB (POZ)ドメイン含有10)、MBNL1 (muscleblind様(ショウジョウバエ属))、RAD51 (RAD51相同体(RecA相同体、大腸菌) (出芽酵母)、NCOA3 (核内受容体活性化補助因子3)、ERDA1 (伸長反復ドメイン、CAG/CTG 1)、TSC1 (結節性硬化症1)、COMP (軟骨オリゴマー基質タンパク質)、GCLC (グルタミン酸-システインリガーゼ、触媒サブユニット)、RRAD (糖尿病に関連するRas関連)、MSH3 (mutS相同体3 (大腸菌))、DRD2 (ドーパミン受容体D2)、CD44 (CD44分子(インド式血液型))、CTCF (CCCTC結合因子(亜鉛フィンガータンパク質))、CCND1 (サイクリンD1)、CLSPN (クラスピン相同体 (アフリカツメガエル (Xenopus laevis))、MEF2A (筋細胞促進因子2A)、PTPRU (タンパク質チロシンホスファターゼ、受容体型、U)、GAPDH (グリセルアルデヒド-3-リン酸デヒドロゲナーゼ)、TRIM22 (三分子モチーフ含有22)、WT1 (ウィルムス腫瘍1)、AHR (アリール炭化水素受容体)、GPX1 (グルタチオンペルオキシダーゼ1)、TPMT (チオプリンS-メチルトランスフェラーゼ)、NDP (ノリー病 (偽神経膠腫))、ARX (aristaless関連ホメオボックス)、MUS81 (MUS81エンドヌクレアーゼ相同体 (出芽酵母))、TYR (チロシナーゼ(眼皮膚白皮症IA))、EGR1 (初期増殖応答1)、UNG (ウラシル-DNAグリコシラーゼ)、NUMBL (numb相同体 (ショウジョウバエ属)様)、FABP2 (脂肪酸結合タンパク質2、腸)、EN2 (Engrailedホメオボックス2)、CRYGC (クリスタリン、γC)、SRP14 (シグナル認識粒子14kDa (相同Alu RNA 結合タンパク質))、CRYGB (クリスタリン、γB)、PDCD1 (プログラム細胞死1)、HOXA1 (ホメオボックスA1)、ATXN2L (アタキシン2様)、PMS2 (PMS2減数分裂後分離増加2 (出芽酵母))、GLA (ガラクトシダーゼ、α)、CBL (Cas-Br-M (マウス)狭宿主性レトロウイルス形質転換配列)、FTH1 (フェリチン、重鎖ポリペプチド1)、IL12RB2 (インターロイキン12受容体、β2)、OTX2 (オルソデンティクルホメオボックス2)、HOXA5 (ホメオボックスA5)、POLG2 (ポリメラーゼ (DNA指向性)、γ2、アクセサリーサブユニット)、DLX2 (distal-lessホメオボックス2)、SIRPA (シグナル調節タンパク質α)、OTX1 (オルソデンティクルホメオボックス1)、AHRR (アリール炭化水素受容体抑制因子)、MANF (中脳由来神経栄養因子)、TMEM158 (膜貫通タンパク質158 (遺伝子/偽遺伝子))、およびENSG00000078687。
三塩基反復伸長病に関連する好ましいタンパク質としては、HTT (ハンチンチン)、AR (アンドロゲン受容体)、FXN (フラタキシン)、Atxn3 (アタキシン)、Atxn1 (アタキシン)、Atxn2 (アタキシン)、Atxn7 (アタキシン)、Atxn10 (アタキシン)、DMPK (筋強直性ジストロフィータンパク質キナーゼ)、Atn1 (アトロフィン1)、CBP (creb結合タンパク質)、VLDLR (超低密度リポタンパク質受容体)、およびそれらの任意の組合わせが挙げられる。
聴覚疾患の治療
本発明はさらに、CRISPR-Casシステムを片方または両方の耳に送達することを意図する。
研究者らは、遺伝子療法を用いて現在の難聴治療、すなわち人工内耳を補助することができるかどうかを調査している。難聴は多くの場合、信号を聴覚神経細胞に中継することができない喪失または損傷した有毛細胞によって引き起こされる。このような場合、人工内耳を用いて音に応答して電気信号を神経細胞に送ることができる。しかし、これらの神経細胞は多くの場合、変性して蝸牛から退縮する。というのも、障害のある有毛細胞が放出する成長因子が少ないからである。
米国特許出願第20120328580号には、たとえば注射器(たとえば単回投与注射器)を用いて耳、たとえば蝸牛管腔(たとえば中心階、前庭階、および鼓室階)に医薬組成物を注入すること(たとえば耳介投与)が記載されている。たとえば、本明細書に記載の1種以上の化合物を鼓室内注射(たとえば中耳へ)、ならびに/または外耳、中耳、および/もしくは内耳への注射により投与することができる。そのような方法は、たとえばステロイドおよび抗生物質をヒトの耳に投与するのに当技術分野で日常的に使用されている。注射は、たとえば耳の正円窓または蝸牛嚢(cochlear capsule)を介して行うことができる。他の内耳投与方法は当技術分野で公知である(たとえばSalt and Plontke, Drug Discovery Today, 10:1299-1306, 2005を参照のこと)。
別の投与方式では、医薬組成物をカテーテルまたはポンプを介してin situで投与することができる。カテーテルまたはポンプは、たとえば医薬組成物を耳の蝸牛管腔または正円窓および/もしくは結腸の管腔に向けることができる。本明細書に記載の化合物の1種以上を耳(たとえばヒトの耳)に投与するのに適した模範的な薬物送達装置および方法は、McKennaら(米国特許出願公開第2006/0030837号)およびJacobsenら(米国特許第7,206,639号)によって記載されている。実施態様によっては、カテーテルまたはポンプを外科的処置中に、たとえば患者の耳(たとえば外耳、中耳、および/または内耳)に配置することができる。実施態様によっては、カテーテルまたはポンプを、外科的処置を必要とすることなく、たとえば患者の耳(たとえば外耳、中耳、および/または内耳)に配置することができる。
その代わりに、またはそれに加えて、本明細書に記載の化合物の1種以上を、外耳に装着される機械装置(人工内耳または補聴器など)と組み合わせて投与することができる。本発明と共に使用するのに適した模範的な人工内耳がEdgeら(米国特許出願公開第2007/0093878号)に記載されている。
実施態様によっては、上記の投与方式を任意の順序で組み合わせてもよく、それらを同時または間隔を空けて行うことができる。
その代わりに、またはそれに加えて、食品医薬品局が承認した方法のいずれか(たとえば、CDER Data Standards Manual, version number 004 (fda.give/cder/dsm/DRG/drg00301.htmで利用することができる)に記載の方法)に従って本発明を投与してもよい。
一般に、米国特許出願第20120328580号に記載されている細胞療法を用いて、in vitroで細胞を内耳の成熟細胞型(たとえば有毛細胞)に完全に分化、またはそれに向かって部分的に分化するよう促すことができる。次に、このような方法で得た細胞をそのような治療を必要とする患者に移植することができる。これらの方法を実施するのに必要な細胞培養方法(適切な細胞型を特定し選択する方法、選択した細胞の完全または部分分化を促す方法、完全または部分的に分化した細胞型を特定する方法、および完全または部分的に分化した細胞を移植する方法を含む)について以下に説明する。
本発明に用いるのに適した細胞としては、本明細書に記載の化合物の1種以上とたとえばin vitroで接触させると内耳の成熟細胞型(たとえば有毛細胞(たとえば内有毛細胞および/または外有毛細胞)に完全または部分的に分化することができる細胞が挙げられるが、これらに限定されない。有毛細胞に分化することができる模範的な細胞としては、幹細胞(たとえば、内耳幹細胞、成体幹細胞、骨髄由来幹細胞、胚性幹細胞、間葉系幹細胞、皮膚幹細胞、iPS細胞、および脂肪由来幹細胞)、前駆細胞(たとえば内耳前駆細胞)、支持細胞(たとえばダイテルス細胞、柱細胞、内指節細胞、視蓋細胞およびヘンゼン細胞)、および/または生殖細胞が挙げられるが、これらに限定されない。内耳感覚細胞に置き換えるための幹細胞の使用がLiらの米国特許出願公開第2005/0287127号およびLiらの米国特許出願第11/953,797号に記載されている。内耳感覚細胞に置き換えるための骨髄由来幹細胞の使用がEdgeらのPCT/US2007/084654に記載されている。iPS細胞は、たとえばTakahashi et al., Cell, Volume 131, Issue 5, Pages 861-872 (2007)、TakahashiとYamanaka, Cell 126, 663-76 (2006)、Okita et al., Nature 448, 260-262 (2007)、Yu, J. et al., Science 318(5858):1917-1920 (2007)、Nakagawa et al., Nat. Biotechnol. 26:101-106 (2008)、およびZaehresとScholer, Cell 131(5):834-835 (2007)に記載されている。1つ以上の組織特異的な遺伝子の有無を(たとえば定性的または定量的に解析することにより、このような適切な細胞を特定することができる。たとえば、1つ以上の組織特異的な遺伝子のタンパク質産物を検出することにより遺伝子発現を検出することができる。タンパク質検出技術としては、適切な抗原に対する抗体を用いて(たとえば細胞抽出物または全細胞を用いて)タンパク質を染色することが含まれる。この場合、適切な抗原は組織特異的遺伝子発現によるタンパク質産物である。原則として、一次抗体(すなわち抗原に結合する抗体)を標識してもよいが、一次抗体(たとえば抗IgG)に対して産生された二次抗体を用いるのがより一般的である(また、より視認しやすい)。この二次抗体を、蛍光色素、または色反応に適した酵素、または金ビーズ(電子顕微鏡用)、あるいはビオチン-アビジンシステムのいずれかと結合させることにより、一次抗体すなわち抗原の位置を認識することができる。
本発明のCRISPR Cas分子を、米国特許出願公開第20110142917号を基に変形した組成物と共に医薬組成物を外耳に直接使用して耳に送達してもよい。実施態様によっては、医薬組成物を耳管に使用する。耳への送達を聴覚または視覚的送達ともいう場合がある。
当業者は、上記の特許刊行物と似たシステムで、本明細書に開示されている方法を本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
実施態様によっては、本発明のRNA分子をリポソームまたはリポフェクチン製剤などに入れて送達し、これを当業者に公知の方法で調製することができる。このような方法は、たとえば米国特許第5,593,972号、第5,589,466号、および第5,580,859号に記載されており、これらは参照により本明細書に組み込まれる。
哺乳動物細胞へのsiRNAの送達の強化および改善を特に目的とした送達システムが開発されており(たとえば、Shen et al FEBS Let. 2003, 539:111-114、Xia et al., Nat. Biotech. 2002, 20:1006-1010、Reich et al., Mol. Vision. 2003, 9: 210-216、Sorensen et al., J. Mol. Biol. 2003, 327: 761-766、Lewis et al., Nat. Gen. 2002, 32: 107-108、およびSimeoni et al., NAR 2003, 31, 11: 2717-2724を参照のこと)、それらを本発明に応用してもよい。siRNAは近年、霊長類における遺伝子発現の阻害のための使用が成功しており(たとえば、Tolentino et al., Retina 24(4):660を参照のこと)、これを本発明に応用してもよい。
Qiらは新規なタンパク質送達技術で無傷の正円窓を介して効率的に内耳にsiRNAを遺伝子導入する方法を開示しており、これを本発明の核酸標的化システムに応用してもよい(たとえば、Qi et al., Gene Therapy (2013), 1-9を参照のこと)。特に、Cy3標識siRNAを無傷の正円窓の透過を介して内耳の細胞(内有毛細胞および外有毛細胞、膨大部稜、卵形嚢斑、球形嚢斑など)に遺伝子導入することができるTAT二本鎖RNA結合ドメイン(TAT-DRBD)は、様々な内耳の病気の治療および聴覚機能の保存のためにin vivoで二本鎖siRNAを送達するのに成功している。耳への投与量として、10 mMのRNA約40 μlが考えられる。
Rejaliら(Hear Res. 2007 Jun;228(1-2):180-7)によれば、人工内耳の機能をらせん神経節の神経細胞(移植物による電気信号の標的である)の良好な保存により改善することができ、脳由来神経栄養因子(BDNF)は実験的に聴覚を失わせた耳でらせん神経節の生着を強化したことが以前にわかっている。Rejaliらは、BDNF遺伝子挿入を持つウイルスベクターによって形質導入された線維芽細胞の外被を含む、変形した設計の人工内耳電極を試験した。この種類のex vivo遺伝子導入を達成するために、Rejaliらは、BDNF遺伝子カセット挿入を持つアデノウイルスでモルモット線維芽細胞を形質導入し、これらの細胞がBDNFを分泌することを確認し、次にBDNF分泌細胞をアガロースゲルを介して人工内耳電極に付着させ、鼓室階に電極を移植した。Rejaliらは、BDNF発現電極が移植の48日後に蝸牛の基底回転のらせん神経節神経細胞を対照電極に比べて有意に多く保存できることを確認し、らせん神経節神経細胞の生着を強化するために人工内耳療法とex vivo遺伝子導入とを組み合わせる可能性を示した。このようなシステムを、耳への送達のために本発明の核酸標的化システムに応用してもよい。
Mukherjeaら(Antioxidants & Redox Signaling, Volume 13, Number 5, 2010)は、低分子干渉(short interfering = si) RNAを用いてNOX3を欠損させるとシスプラチンの聴器毒性が無効になり、それは損傷からOHCが保護されたことや聴性脳幹反応(ABR)の閾値変動が低減されたことによって裏付けられていることを記載している。異なる用量のsiNOX3(0.3、0.6、および0.9 μg)をラットに投与し、NOX3の発現を実時間(RT) PCRで評価した。使用した最低用量(0.3 μg)のNOX3 siRNAは、スクランブルsiRNAまたは未処理の蝸牛の鼓室内投与と比較した場合、NOX3 mRNAの阻害を示さなかった。しかし、これよりも高用量のNOX3 siRNA(0.6および0.9 μg)を投与すると、対照のスクランブルsiRNAと比較してNOX3の発現が減少した。このようなシステムを、ヒトへの投与のための約2 mg~約4 mgの投与量で本発明のCRISPR Casを鼓室内投与するように、本発明のCRISPR Casシステムに応用してもよい。
Jungら(Molecular Therapy, vol. 21 no. 4, 834-841 apr. 2013)は、卵形嚢中のHes5量がsiRNAの投与後に減少したこと、およびこれらの卵形嚢中の有毛細胞の数が対照治療後よりも有意に多かったことを実証している。データは、siRNA技術が内耳の修復および再生を誘導するのに役立つ可能性があること、ならびにノッチシグナル伝達経路が特定の遺伝子発現阻害に有用な標的である可能性があることを示唆している。Jungらは、凍結乾燥siRNAに滅菌生理食塩水を加えて調製した2 μl容量のHes5 siRNAを8 μg、耳の前庭上皮に注入した。このようなシステムを、ヒトへの投与のための約1~約30 mgの投与量で本発明のCRISPR Casを耳の前庭上皮に投与するように、本発明の核酸標的化システムに応用してもよい。当業者は、上記の特許刊行物と似たシステムで、本明細書に開示されている方法を本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
非分裂細胞(神経細胞および筋肉)における遺伝子標的化
非分裂の(特に非分裂の完全に分化した)細胞型は、たとえば相同組換え(HR)は一般にG1細胞周期相では抑制されるため、遺伝子標的化またはゲノム操作に関して問題を呈する。しかし、細胞が正常なDNA修復システムを制御する機構を研究中に、Durocherは、非分裂細胞でHRを「非作動」に保つ、それまで知られていなかったスイッチを発見し、このスイッチを作動に戻す方策を考案した。Orthweinら(カナダのオタワにあるMount Sinai HospitalのDaniel Durocherの研究室)は近年、HRの抑制を解除することができることを示し、腎臓(293T)および骨肉腫(U2OS)細胞の両方で遺伝子標的化を終了させるのに成功したと報告している。腫瘍抑制因子であるBRCA1、PALB2、およびBRAC2は、HRによるDNAのDSB修復を促すことが知られている。彼らは、PALB2-BRAC2とのBRCA1の複合体の形成がPALB2のユビキチン部位によって支配されており、その部位での作用はE3ユビキチン化酵素によるものであることを発見した。このE3ユビキチン化酵素は、カリン3 (CUL3)-RBX1と複合したKEAP1(PALB2相互作用タンパク質)で構成されている。PALB2のユビキチン化はPALB2のBRCA1との相互作用を抑制し、脱ユビキチン化酵素USP11(それ自体は細胞周期に制御されている)によって打ち消される。USP11またはKEAP1(pX459ベクターから発現)を対象としたCRISPR-Cas9に基づく遺伝子標的化検定を含む多くの方法で測定した場合、BRCA1とPALB2との相互作用の回復をDNA末端切除の活性化と組み合わせるとG1での相同組換えを誘導するのに十分である。しかし、BRCA1とPALB2との相互作用をKEAP1枯渇またはPALB2-KR変異体の発現のいずれかを用いて切除能力のあるG1細胞で回復させると、遺伝子標的化事象の強力な増加が検出された。
したがって、実施態様によっては、細胞、特に非分裂の完全に分化した細胞型におけるHRの再活性化が好ましい。実施態様によっては、BRCA1とPALB2との相互作用を促進するのが好ましい。実施態様によっては、標的細胞は非分裂細胞である。実施態様によっては、標的細胞は神経細胞または筋肉細胞である。実施態様によっては、標的細胞をin vivoで標的化する。実施態様によっては、細胞はG1にあり、HRが抑制される。実施態様によっては、KEAP1枯渇(たとえばKEAP1活性の発現の抑制)が好ましい。たとえばOrthweinらの文献に示されているように、siRNAを介してKEAP1の枯渇を達成してもよい。あるいは、PALB2-KR変異体(BRCA1相互作用ドメインの8つのLys残基すべてを欠失している)の発現をKEAP1の枯渇と組み合わせるか単独で用いるのが好ましい。PALB2-KRは、細胞周期の位置に関係なくBRCA1と相互作用する。したがって、特にG1細胞では、実施態様によってはBRCA1とPALB2との相互作用の促進または回復が好ましい(特に標的細胞が非分裂細胞である場合、または除去および復帰(ex vivo遺伝子標的化)が問題となる場合、たとえば神経細胞または筋肉細胞などの場合)。KEAP1 siRNAはThermoFischerから入手可能である。実施態様によっては、BRCA1-PALB2複合体をG1細胞に送達してもよい。実施態様によっては、PALB2の脱ユビキチン化をたとえば脱ユビキチン化酵素の発現増加により促進してもよく、したがって、脱ユビキチン化酵素USP11の発現または活性の促進または増加のために構築物を提供することが想定される。
眼の疾患の治療
本発明はさらに、CRISPR-Casシステムを片方または両方の眼に送達することを意図する。
本発明の特定の実施態様では、CRISPR-Casシステムを用いて、いくつかの遺伝子変異(Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012にさらに記載されている)によって起こる眼の異常を補正してもよい。
実施態様によっては、治療または標的化される状態は眼障害である。実施態様によっては、眼障害としては緑内障を挙げることができる。実施態様によっては、眼障害として網膜変性疾患が挙げられる。実施態様によっては、網膜変性疾患は、シュタルガルト病、バルデ・ビードル症候群、ベスト病、青錐体1色覚、全脈絡膜萎縮、錐体杆体ジストロフィー、先天性停止性夜盲症、S錐体増強症候群、若年性X連鎖性網膜分離症、レーバー先天黒内障、蜂巣状網膜ジストロフィー(Malattia Leventinesse)、ノリー病またはX連鎖性家族性滲出性硝子体網膜症、パターンジストロフィー、ソースビージストロフィー、アッシャー症候群、網膜色素変性症、色覚異常または黄斑ジストロフィーもしくは変性、網膜色素変性症、色覚異常、および加齢性黄斑変性から選択される。実施態様によっては、網膜変性疾患はレーバー先天黒内障(LCA)または網膜色素変性である。実施態様によっては、CRISPRシステムを必要に応じて硝子体内注射または網膜下注射によって、眼に送達する。
眼への投与の場合、レンチウイルスベクター、特にウマ伝染性貧血ウイルス(EIAV)が特に好ましい。
別の実施態様では、特に眼の遺伝子治療について、ウマ伝染性貧血ウイルス(EIAV)に基づく最小限の非霊長類レンチウイルスベクターも意図されている(たとえばBalagaan, J Gene Med 2006; 8: 275 - 285 (2005年11月21日にWiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845でオンライン公開)を参照のこと)。ベクターは、標的遺伝子の発現を駆動するサイトメガロウイルス(CMV)プロモーターを有すると意図される。前房内、網膜下、眼内および硝子体内注射がすべて意図される(たとえば、Balagaan, J Gene Med 2006; 8: 275 - 285 (2005年11月21日にWiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845でオンライン公開)を参照のこと)。手術顕微鏡を活用して眼内注射を行ってもよい。網膜下および硝子体内注射の場合、軽い指圧で眼を脱出させ、ガラス製顕微鏡スライドカバースリップで覆った角膜への接触媒質の液滴からなるコンタクトレンズシステムを用いて眼底を視覚化してもよい。網膜下注射の場合、直接可視化しながら、5 μlのハミルトン注射器に取り付けた10 mm、34ゲージの針の先端を赤道面より上方の強膜を貫通させ後極に向かって接線方向に、針の穴が網膜下腔内に見えるまで進めてもよい。次に、2 μlのベクター懸濁液を注入して上方に水疱性網膜剥離を起こし(これによりベクターの網膜下投与が確認される)てもよい。この手法により、自己封鎖性の強膜切開を行い、RPEに吸収されるまで(通常は手順から48時間以内)ベクター懸濁液を網膜下腔に保持することができる。この手順を下半球で繰り返して下網膜剥離を起こしてもよい。この方法により、神経感覚網膜およびRPEの約70%がベクター懸濁液に曝露される。硝子体内注射の場合、針先を角膜輪部の1 mm後方の強膜を貫通させて進め、2 μlのベクター懸濁液を硝子体腔に注入してもよい。前房内注射の場合、角膜輪部穿刺によって角膜中央に向けて針先を進め、2 μlのベクター懸濁液を注入してもよい。前房内注射の場合、角膜輪部穿刺によって角膜中央に向けて針先を進め、2 μlのベクター懸濁液を注入してもよい。これらのベクターを1.0~1.4×1010または1.0~1.4×109形質導入単位(TU) / mlのいずれかの力価で注入してもよい。
別の実施態様では、RetinoStat(登録商標)(抗血管新生タンパク質エンドスタチンおよびアンジオスタチンを発現し、加齢黄斑変性のクモの巣状の影の治療のために網膜下注射により送達される、ウマ伝染性貧血ウイルスに基づくレンチウイルス遺伝子治療ベクター)も意図される(たとえば、Binley et al., HUMAN GENE THERAPY 23:980-991 (2012年9月)を参照のこと)。このようなベクターを本発明のCRISPR-Casシステムに合わせて変更してもよい。各眼を、100 μlの全量中1.1×105形質導入単位/眼(TU / 眼)の用量のいずれかのRetinoStat(登録商標)で治療してもよい。
別の実施態様では、眼への送達のためにE1欠失、部分E3欠失、E4欠失型アデノウイルスベクターを考えてもよい。進行新生血管加齢性黄斑変性 (AMD)の患者28人に、ヒト色素上皮由来因子(AdPEDF.ll)を発現するE1欠失、部分E3欠失、E4欠失型アデノウイルスベクターを単回硝子体内注射した(たとえばCampochiaro et al., Human Gene Therapy 17:167-176 (2006年2月)を参照のこと)。106~109.5粒子単位(PU)の範囲の用量を調査したが、AdPEDF.llに関連する深刻な有害事象はなく、用量制限毒性もなかった(たとえばCampochiaro et al., Human Gene Therapy 17:167-176 (2006年2月)を参照のこと)。アデノウイルスベクターを介した眼の遺伝子導入は、眼障害の治療のための実行可能な手法だと思われ、CRISPRCasシステムに適用することができる。
別の実施態様では、RXi Pharmaceuticalsのsd-rxRNA(登録商標)システムをCRISPR Casシステムを眼に送達するために使用し、かつ/または適合させてもよい。このシステムでは、3 μgのsd-rxRNAを単回硝子体内投与すると、14日間、配列特異的にPPIB mRNA量が減少する。sd-rxRNA(登録商標)システムを、約3~20 mgの用量のCRISPRをヒトに投与することを意図して本発明の核酸標的化システムに応用してもよい。
Millington-Wardら(Molecular Therapy, vol. 19 no. 4, 642-649 (2011年4月))は、アデノ随伴ウイルス(AAV)ベクターがRNA干渉(RNAi)に基づくロドプシン抑制因子とRNAi標的部位の変性位置におけるヌクレオチド変更による抑制に抵抗するコドン改変ロドプシン置換遺伝子とを送達することを記載している。Millington-Wardらは6.0×108 vpまたは1.8×1010 vpのAAVを眼に網膜下注射した。Millington-WardらのAAVベクターを、約2×1011~約6×1013vpの用量をヒトに投与することを意図して本発明のCRISPR Casシステムに応用してもよい。
Dalkaraら(Sci Transl Med 5, 189ra76 (2013))も、眼の硝子体液に無害な注射をした後に網膜全体に野生型の欠陥遺伝子をAAVベクターを作るためのin vivoの定向進化に関連している。Dalkaraは、AAV1、2、4、5、6、8、および9のキャップ遺伝子のDNA組換えにより構築された7量体ペプチド提示ライブラリーおよびAAVライブラリーについて記載している。rcAAVライブラリーとCAGまたはRhoプロモーター下でGFPを発現するrAAVベクターとを一括して、定量的PCRでデオキシリボヌクレアーゼに対抗するゲノム力価を得た。ライブラリーをプールし、2回の進化を実行した。各回は、最初のライブラリーの多様化とそれに続く3つのin vivo選択工程とからなる。このような各工程で、P30 rho-GFPマウスに約1×1012 vg/mlのゲノム力価を持つ2mlのイオジキサノール精製リン酸緩衝生理食塩水(PBS)透析ライブラリーを硝子体内注射した。DalkaraらのAAVベクターを、約1×1015~約1×1016 vg/mlの用量をヒトに投与することを意図して本発明の核酸標的化システムに応用してもよい。
特定の実施態様では、網膜色素変性症(RP)の治療のためにロドプシン遺伝子を標的化してもよく、ここで、Sangamo BioSciences, Inc.に譲渡された米国特許出願公開第20120204282号のシステムを本発明のCRISPR Casシステムに従い変更してもよい。別の実施態様では、ヒトのロドプシン遺伝子の標的配列を切断する方法に関する、Cellectisに譲渡された米国特許出願公開第20130183282号を本発明の核酸標的化システムに合わせて変更してもよい。別の実施態様では、レーバー先天性黒内障10 (Lca10)の治療のためのCRISPR-Casに関連する方法および組成物に関する、Editas Medicineに譲渡された米国特許出願公開第20150252358号の方法を本発明の核酸標的化システムに合わせて変更してもよい。
別の実施態様では、アッシャー症候群および網膜色素変性の治療のためのCRISPR-Casに関連する方法および組成物に関する、Editas Medicineに譲渡された米国特許出願公開第20170073674号の方法を本発明の核酸標的化システムに合わせて変更してもよい。
実施態様によっては、CRISPRタンパク質はC2c1であり、システムは、I. CRISPR-CasシステムRNAポリヌクレオチド配列{(a) 標的配列にハイブリダイズ可能なtracr RNAポリヌクレオチドおよびガイドRNAポリヌクレオチド、ならびに(b)直接反復RNAポリヌクレオチドを含む}と、II. 必要に応じて少なくとも1つ以上の核局在化配列を含む、C2c1をコードするポリヌクレオチド配列とを含む。ここで、直接反復配列はガイド配列にハイブリダイズし、標的配列へのCRISPR複合体の配列特異的結合を導く。CRISPR複合体は、(1)標的配列とハイブリダイズされる、またはハイブリダイズすることが可能なガイド配列および(2)直接反復配列と複合化されたCRISPRタンパク質を含み、CRISPRタンパク質をコードするポリヌクレオチド配列はDNAまたはRNAである。
特定の実施態様では、C2c1エフェクタータンパク質はTに富むPAMを認識する。特定の実施態様では、PAMは5’-TTN-3’または5’-ATTN-3’である。特定の実施態様では、MPS Iに関連する目的の遺伝子座は、5'末端が突出したねじれ型切断を起こすことによりCRISPR-C2c1システムによって改変される。実施態様によっては、5'末端の突出は7ヌクレオチドである。実施態様によっては、ねじれ型切断の後にNHEJまたはHDRが起こる。特定の実施態様では、CRISPR-C2c1複合体によって、目的の遺伝子座を鋳型DNA配列の挿入すなわち「組込み」によって改変する。特定の実施態様では、DNA挿入物は、適切な配向でゲノムに組み込まれるように設計される。Marescaら(Genome Res. 2013 Mar; 23(3): 539-546)は、亜鉛フィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)と共に用いることができる部位特異的な正確な挿入の方法について記載した。ここで、5'末端に突出を有する短い二本鎖DNAが相補性末端に連結され、それによってヒト細胞株で指定の遺伝子座に15kbの外来性発現カセットを正確に挿入することができる。Heら(Nucleic Acids Res. 2016 May 19; 44(9))は、CRISPR/Cas9で誘導してプロモーターなしの4.6kbのires-eGFP断片をGAPDH遺伝子座に部位特異的に組み込んだところ、NHEJ経路を介した最大20%のGFP陽性細胞が体細胞LO2細胞で得られ、1.70%のGFP陽性細胞がヒト胚性幹細胞で得られたと記載した。同文献はまた、NHEJに基づく組込みは調査したすべてのヒト細胞型において、HDRを介した遺伝子標的化よりも効率的であると報告した。C2c1は5'末端が突出したねじれ型切断を発生させるため、当業者は、本明細書に開示するCRISPR-C2c1システムを用いて目的の遺伝子座に外来DNAを挿入するためにMerescaらおよびHeらの文献に記載されているのと似た方法を用いることができる。
特定の実施態様では、目的の遺伝子座はまずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、PAM配列付近でCRISPR-C2c1システムによってさらに改変され、HDRによって修復される。特定の実施態様では、目的の遺伝子座は、変異、欠失、または外来DNA配列の挿入をHDRを介して導入することによってCRISPR-C2c1システムにより改変される。実施態様によっては、目的の遺伝子座は変異、欠失、または外来DNA配列の挿入をNHEJを介して導入することによってCRISPR-C2c1システムにより改変される。好ましい実施態様では、外来DNAは、3'末端と5'末端の両方で単一ガイドDNA(sgDNA)-PAM配列に隣接している。好ましい実施態様では、外来DNAはCRISPR-C2c1切断の後に放出される。
Wu (Cell Stem Cell,13:659-62, 2013)は、Cas9をマウスの白内障を引き起こす一塩基対変異に誘導する(そこでCas9がDNA配列を切断する)ガイドRNAを設計した。次に、他の野生型対立遺伝子またはオリゴのいずれかを接合子修復機構に使用して、破壊された対立遺伝子の配列を補正し、変異マウスの白内障を引き起こす遺伝的欠陥を補正した。
米国特許出願公開第20120159653号には、亜鉛フィンガーヌクレアーゼを用いて黄斑変性(MD)に関連する細胞、動物、およびタンパク質を改変することが記載されている。黄斑変性(MD)は高齢者の視覚障害の主な原因であるが、発症年齢が早くも乳児期である小児神経変性疾患(シュタルガルト病、ソースビー眼底ジストロフィー、および致死性の小児疾患など)の特徴的な症状でもある。黄斑変性により、網膜の損傷が原因で視野の中心(黄斑)の視力が失われる。現在存在する動物モデルは、ヒトで観察されるその疾患の主な特徴を再現していない。MDに関連するタンパク質をコードする変異遺伝子を含む利用可能な動物モデルも、非常に多様な表現型を生むため、ヒトの疾患および治療の開発への変換が厄介になっている。
米国特許出願公開第20120159653号の一側面は、本発明の核酸標的化システムに応用してもよい、MDに関連するタンパク質をコードする任意の染色体配列の編集に関する。MDに関連するタンパク質は、典型的にはMD関連タンパク質とMD障害との実験上の関連性に基づいて選択される。たとえば、MD障害を持つ集団のMD関連タンパク質の産生速度または循環濃度が、MD障害のない集団よりも高く、または低くてもよい。タンパク質濃度の差をプロテオミクス技術(ウエスタンブロット、免疫組織化学的染色、酵素結合免疫吸着検定(ELISA)、および質量分析が挙げられるがこれらに限定されない)を用いて評価してもよい。あるいは、MD関連タンパク質を、ゲノム技術(DNAマイクロアレイ解析、遺伝子発現の連続分析(SAGE)、および定量的実時間ポリメラーゼ連鎖反応(Q-PCR)が挙げられるがこれらに限定されない)によりタンパク質をコードする遺伝子の遺伝子発現特性を取得して特定してもよい。
非限定的な例として、MD関連タンパク質としては、以下のタンパク質が挙げられるがこれらに限定されない:ABCA4 (ATP結合カセット、サブファミリーA (ABC1)、メンバー4)、ACHM1 (色覚異常(桿体1色覚)1)、ApoE (アポリポタンパク質E)、C1QTNF5 (CTRP5) (C1qおよび腫瘍壊死因子関連タンパク質5)、C2補体成分2 (C2)、C3補体成分(C3)、CCL2 (ケモカイン(C-Cモチーフ)リガンド2)、CCR2 (ケモカイン(C-Cモチーフ)受容体2、CD36 (表面抗原分類36)、CFB (補体因子B)、CFH (補体因子CFH)、H CFHR1 (補体因子H関連1)、CFHR3 (補体因子H関連3)、CNGB3 (環状ヌクレオチド感受性チャンネルβ3)、CP (セルロプラスミン)、CRP (C反応性タンパク質)、CST3 (シスタチンCまたはシスタチン3)、CTSD (カテプシンD)、CX3CR1 (ケモカイン(C-X3-Cモチーフ)受容体1)、ELOVL4 (超長鎖脂肪酸伸長4)、ERCC6 (除去修復相互補完、げっ歯類修復不全、相補群6)、FBLN5 (フィブリン5)、FBLN5 (フィブリン5)、FBLN6 (フィブリン6)、FSCN2 (ファスシン)、HMCN1 (ヘミセンチン1)、HMCN1 (ヘミセンチン1)、HTRA1 (HtrAセリンペプチダーゼ1)、HTRA1 (HtrAセリンペプチダーゼ1)、IL-6 (インターロイキン6)、IL-8 (インターロイキン8)、LOC387715 (仮説上のタンパク質)、PLEKHA1 (プレクストリン相同ドメイン含有ファミリーAメンバー1)、PROM1 (プロミニン1) (PROM1またはCD133)、PRPH2 (ペリフェリン2)、RPGR (網膜色素変性GTPアーゼ調節因子)、SERPING1 (セルピンペプチダーゼ阻害因子、系統群G、メンバー1 (C1阻害因子))、TCOF1 (トリークル)、TIMP3 (メタロプロテイナーゼ阻害因子3)、TLR3 (Toll様受容体3)。
染色体配列を編集されるMD関連タンパク質の特定は変動する可能性があり、変動する。好ましい実施態様では、染色体配列を編集されるMD関連タンパク質は、ABCR遺伝子によってコードされるATP結合カセット、サブファミリーA (ABC1)メンバー4タンパク質 (ABCA4)、APOE遺伝子によってコードされるアポリポタンパク質Eタンパク質 (APOE)、CCL2遺伝子によってコードされるケモカイン(C-Cモチーフ)リガンド2タンパク質 (CCL2)、CCR2遺伝子によってコードされるケモカイン(C-Cモチーフ)受容体2タンパク質 (CCR2)、CP遺伝子によってコードされるセルロプラスミンタンパク質 (CP)、CTSD遺伝子によってコードされるカテプシンDタンパク質 (CTSD)、またはTIMP3遺伝子によってコードされるメタロプロテイナーゼ阻害因子3タンパク質 (TIMP3)である。模範的な実施態様では、遺伝子改変される動物はラットであり、MD関連タンパク質をコードする編集される染色体配列は、以下であってもよい:ABCA4 (ATP結合カセット、サブファミリーA (ABC1)、NM_000350)、APOE (アポリポタンパク質E、NM_138828)、CCL2 (ケモカイン (C-Cモチーフ)リガンド2、NM_031530)、CCR2 (ケモカイン(C-Cモチーフ)受容体2、NM_021866)、CP (セルロプラスミン(CP) NM_012532)、CTSD (カテプシンD (CTSD)、NM_134334)、TIMP3 (メタロプロテイナーゼ阻害因子3、NM_012886)。動物または細胞は、MD関連タンパク質をコードする1、2、3、4、5、6、7、またはそれ以上の破壊された染色体配列、および破壊されたMD関連タンパク質をコードする0、1、2、3、4、5、6、7、またはそれ以上の染色体組込み配列を含んでいてもよい。
編集または組込みされる染色体配列を、MDに関連する改変タンパク質をコードするように変更してもよい。MD関連染色体配列のいくつかの変異がMDと関連づけられている。MDに関連する染色体配列の変異の非限定的な例としては、MDを引き起こす可能性のある以下を含むものが挙げられる:ABCRタンパク質のE471K (すなわち471位のグルタミン酸がリシンに変えられている)、R1129L (すなわち1129位のアルギニンがロイシンに変えられている)、T1428M (すなわち1428位のスレオニンがメチオニンに変えられている)、R1517S (すなわち1517位のアルギニンがセリンに変えられている)、I1562T (すなわち1562位のイソロイシンがスレオニンに変えられている)、およびG1578R (すなわち1578位のグリシンがアルギニンに変えられている);CCR2タンパク質のV64I (すなわち192位のバリンがイソロイシンに変えられている);CPタンパク質のG969B (すなわち969位のグリシンがアスパラギンまたはアスパラギン酸に変えられている);TIMP3タンパク質のS156C (すなわち156位のセリンがシステインに変えられている)、G166C (すなわち166位のグリシンがシステインに変えられている)、G167C (すなわち167位のグリシンがシステインに変えられている)、Y168C (すなわち168位のチロシンがシステインに変えられている)、S170C (すなわち170位のセリンがシステインに変えられている)、Y172C (すなわち172位のチロシンがシステインに変えられている)、およびS181C (すなわち181位のセリンがシステインに変えられている)。MD関連遺伝子の遺伝的多様体と疾患とのその他の関連性は当技術分野で公知である。
CRISPRシステムは、常染色体優性遺伝子によって起こる疾患を補正するのに有用である。たとえば、眼の受容体欠損を引き起こす常染色体優性遺伝子を除去するのにCRISPR/Cas9が用いられた(Bakondi, B. et al., In Vivo CRISPR/Cas9 Gene Editing Corrects Retinal Dystrophy in the S334ter-3 Rat Model of Autosomal Dominant Retinal Dystrophy.(in vivoのCRISPR/ Cas9遺伝子編集により常染色体優性遺伝性網膜色素変性のS334ter-3ラットモデルの網膜ジストロフィーが補正される), Molecular Therapy, 2015; DOI: 10.1038/mt.2015.220)。
当業者は、本明細書に開示されている方法を、上記と似たシステムで、本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMはいr悦は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
循環器疾患および筋疾患の治療
本発明は、本明細書に記載のCRISPR-Casシステム(たとえばC2c1エフェクタータンパク質システム)を心臓に送達することも意図する。心臓の場合、心筋指向性アデノ随伴ウイルス(AAVM)、特に心臓において優先的な遺伝子移入を示したAAVM41が好ましい(たとえば、Lin-Yanga et al., PNAS, March 10, 2009, vol. 106, no. 10を参照のこと)。投与は全身投与でも局所投与でもよい。全身投与の場合、約1~10×1014ベクターゲノムの投与量が意図される。たとえば、Eulalio et al. (2012) Nature 492: 376およびSomasuntharam et al. (2013) Biomaterials 34: 7790も参照のこと。
米国特許出願公開第20110023139号は、循環器疾患に関連する細胞、動物、およびタンパク質を遺伝子編集するための亜鉛フィンガーヌクレアーゼの使用について記載している。循環器疾患としては一般に、高血圧、心臓発作、心不全、脳卒中および一過性脳虚血発作(TIA)が挙げられる。循環器疾患に関与する任意の染色体配列または循環器疾患に関与する任意の染色体配列によってコードされるタンパク質を本開示に記載の方法において利用してもよい。循環器疾患関連タンパク質は、典型的には循環器関連タンパク質と循環器疾患の発症との実験上の関連性に基づいて選択される。たとえば、循環器障害を持つ集団の循環器関連タンパク質の産生速度または循環濃度が、循環器障害のない集団よりも高く、または低くてもよい。タンパク質濃度の差をプロテオミクス技術(ウエスタンブロット、免疫組織化学的染色、酵素結合免疫吸着検定(ELISA)、および質量分析が挙げられるがこれらに限定されない)を用いて評価してもよい。あるいは、循環器関連タンパク質を、ゲノム技術(DNAマイクロアレイ解析、遺伝子発現の連続分析(SAGE)、および定量的実時間ポリメラーゼ連鎖反応(Q-PCR)が挙げられるがこれらに限定されない)によりタンパク質をコードする遺伝子の遺伝子発現特性を取得して特定してもよい。
例として、染色体配列としては以下を包含することができるが、これらに限定されない:IL1B (インターロイキン1、β)、XDH (キサンチンデヒドロゲナーゼ)、TP53 (腫瘍タンパク質p53)、PTGIS (プロスタグランジン12(プロスタサイクリン)シンターゼ)、MB (ミオグロビン)、IL4 (インターロイキン4)、ANGPT1 (アンジオポエチン1)、ABCG8 (ATP結合カセット,サブファミリーG (WHITE)、メンバー8)、CTSK (カテプシンK)、PTGIR (プロスタグランジン12(プロスタサイクリン)受容体(IP))、KCNJ11 (内向き整流性カリウムチャンネル、サブファミリーJ、メンバー11)、INS (インスリン)、CRP (C反応性タンパク質、ペントラキシン関連)、PDGFRB (血小板由来成長因子受容体、βポリペプチド)、CCNA2 (サイクリンA2)、PDGFB (血小板由来成長因子βポリペプチド(サル肉腫ウイルス(v-sis)がん遺伝子相同体))、KCNJ5 (内向き整流性カリウムチャンネル、サブファミリーJ、メンバー5)、KCNN3 (中間/小コンダクタンスカルシウム活性化カリウムチャンネル、サブファミリーN、メンバー3)、CAPN10 (カルパイン10)、PTGES (プロスタグランジンEシンターゼ)、ADRA2B (アドレナリン作動性、α2B、受容体)、ABCG5 (ATP-結合カセット、サブファミリーG (WHITE)、メンバー5)、PRDX2 (ペルオキシレドキシン2)、CAPN5 (カルパイン5)、PARP14 (ポリ(ADP-リボース)ポリメラーゼファミリー、メンバー14)、MEX3C (mex-3相同体C (線虫))、ACE (アンジオテンシン変換酵素(ペプチジル-ジペプチダーゼA)1)、TNF (腫瘍壊死因子(TNFスーパーファミリー、メンバー2))、IL6 (インターロイキン6 (インターフェロン、β2))、STN (スタチン)、SERPINE1 (セルピンペプチダーゼ阻害因子、系統群E (ネキシン、プラスミノーゲン活性化因子 阻害因子1型)、メンバー1)、ALB (アルブミン)、ADIPOQ (アディポネクチン、C1Qおよびコラーゲンドメイン含有)、APOB (アポリポタンパク質B (Ag(x)抗原を含む))、APOE (アポリポタンパク質E)、LEP (レプチン)、MTHFR (5,10-メチレンテトラヒドロ葉酸レダクターゼ (NADPH))、APOA1 (アポリポタンパク質A-I)、EDN1 (エンドセリン1)、NPPB (ナトリウム利尿ペプチド前駆体B)、NOS3 (一酸化窒素合成酵素3(内皮細胞))、PPARG (ペルオキシソーム増殖剤活性化受容体γ)、PLAT (プラスミノーゲン活性化因子、組織)、PTGS2 (プロスタグランジン-エンドペルオキシドシンターゼ2 (プロスタグランジンG/Hシンターゼおよびシクロオキシゲナーゼ))、CETP (コレステリルエステル転送タンパク質、血漿)、AGTR1 (アンジオテンシンII受容体、1型)、HMGCR (3-ヒドロキシ-3-メチルグルタリル補酵素Aレダクターゼ)、IGF1 (インスリン様成長因子1(ソマトメジンC))、SELE (セレクチンE)、REN (レニン)、PPARA (ペルオキシソーム増殖剤活性化受容体α)、PON1 (パラオキソナーゼ1)、KNG1 (キニノーゲン1)、CCL2 (ケモカイン(C-Cモチーフ)リガンド2)、LPL (リポタンパク質リパーゼ)、VWF (フォン・ヴィルブランド因子)、F2 (凝固因子II (トロンビン))、ICAM1 (細胞間接着分子1)、TGFB1 (形質転換成長因子、β1)、NPPA (ナトリウム利尿ペプチド前駆体A)、IL10 (インターロイキン10)、EPO (エリスロポエチン)、SOD1 (スーパーオキシドジスムターゼ1、可溶性)、VCAM1 (血管細胞接着分子 1)、IFNG (インターフェロン、γ)、LPA (リポタンパク質、Lp(a))、MPO (ミエロペルオキシダーゼ)、ESR1 (エストロゲン受容体1)、MAPK1 (分裂促進因子活性化タンパク質キナーゼ1)、HP (ハプトグロビン)、F3 (凝固因子III (トロンボプラスチン、組織因子))、CST3 (シスタチンC)、COG2 (オリゴマーゴルジ複合体成分2)、MMP9 (マトリックスメタロペプチダーゼ9 (ゼラチナーゼB、92kDaゼラチナーゼ、92kDa IV型コラゲナーゼ))、SERPINC1 (セルピンペプチダーゼ阻害因子、系統群C (アンチトロンビン)、メンバー1)、F8 (凝固因子VIII、凝血原成分)、HMOX1 (ヘムオキシゲナーゼ(脱環化 (decycling)) 1)、APOC3 (アポリポタンパク質C-III)、IL8 (インターロイキン8)、PROK1 (プロキネチシン1)、CBS (シスタチオニンβシンターゼ)、NOS2 (一酸化窒素合成酵素2、誘導性)、TLR4 (toll様受容体4)、SELP (セレクチンP (顆粒膜タンパク質140kDa、抗原CD62))、ABCA1 (ATP結合カセット、サブファミリーA (ABC1)、メンバー1)、AGT (アンジオテンシノーゲン(セルピンペプチダーゼ阻害因子、系統群A、メンバー8))、LDLR (低密度リポタンパク質受容体)、GPT (グルタミン酸ピルビン酸トランスアミナーゼ(アラニンアミノトランスフェラーゼ))、VEGFA (血管内皮成長因子A)、NR3C2 (核内受容体サブファミリー3、C群、メンバー2)、IL18 (インターロイキン18 (インターフェロンγ誘導因子))、NOS1 (一酸化窒素合成酵素1 (神経細胞))、NR3C1 (核内受容体サブファミリー3、C群、メンバー1 (糖質コルチコイド受容体))、FGB (フィブリノーゲンβ鎖)、HGF (肝細胞増殖因子(ヘパポエチンA; 散乱因子))、IL1A (インターロイキン1、α)、RETN (レジスチン)、AKT1 (v-aktマウス胸腺腫ウイルスがん遺伝子相同体1)、LIPC (リパーゼ、肝臓)、HSPD1 (熱ショック60kDaタンパク質1 (シャペロニン))、MAPK14 (分裂促進因子活性化タンパク質キナーゼ14)、SPP1 (分泌型リンタンパク質1)、ITGB3 (インテグリン、β3 (血小板糖タンパク質111a、抗原CD61))、CAT (カタラーゼ)、UTS2 (ウロテンシン2)、THBD (トロンボモジュリン)、F10 (凝固因子X)、CP (セルロプラスミン(フェロキシダーゼ))、TNFRSF11B (腫瘍壊死因子受容体スーパーファミリー、メンバー11b)、EDNRA (エンドセリン受容体A型)、EGFR (上皮細胞成長因子受容体 (赤芽球性白血病ウイルス(v-erb-b) がん遺伝子相同体、鳥類))、MMP2 (マトリックスメタロペプチダーゼ2 (ゼラチナーゼA、72kDaゼラチナーゼ、72kDa IV型コラゲナーゼ))、PLG (プラスミノーゲン)、NPY (神経ペプチドY)、RHOD (ras相同体遺伝子ファミリー、メンバーD)、MAPK8 (分裂促進因子活性化タンパク質キナーゼ8)、MYC (v-myc骨髄球腫症ウイルスがん遺伝子相同体(鳥類))、FN1 (フィブロネクチン1)、CMA1 (キマーゼ1、肥満細胞)、PLAU (プラスミノーゲン活性化因子、ウロキナーゼ)、GNB3 (グアニンヌクレオチド結合タンパク質(Gタンパク質)、βポリペプチド3)、ADRB2 (アドレナリン作動性、β2、受容体、表面)、APOA5 (アポリポタンパク質A-V)、SOD2 (スーパーオキシドジスムターゼ2、ミトコンドリア)、F5 (凝固因子V (プロアクセレリン、不安定因子))、VDR (ビタミンD (1,25-ジヒドロキシビタミンD3)受容体)、ALOX5 (アラキドン酸-5-リポキシゲナーゼ)、HLA-DRB1 (主要組織適合複合体、クラスII、DRβ1)、PARP1 (ポリ(ADP-リボース)ポリメラーゼ1)、CD40LG (CD40リガンド)、PON2 (パラオキソナーゼ2)、AGER (終末糖化産物特異的受容体)、IRS1 (インスリン受容体基質1)、PTGS1 (プロスタグランジン-エンドペルオキシドシンターゼ1 (プロスタグランジンG/Hシンターゼおよびシクロオキシゲナーゼ))、ECE1 (エンドセリン変換酵素1)、F7 (凝固因子VII (血清プロトロンビン転化促進因子))、URN (インターロイキン1受容体拮抗物質)、EPHX2 (エポキシドヒドロラーゼ2、細胞質)、IGFBP1 (インスリン様成長因子結合タンパク質1)、MAPK10 (分裂促進因子活性化タンパク質キナーゼ10)、FAS (Fas (TNF受容体スーパーファミリー、メンバー6))、ABCB1 (ATP-結合カセット、サブファミリーB (MDR/TAP)、メンバー1)、JUN (junがん遺伝子)、IGFBP3 (インスリン様成長因子結合タンパク質3)、CD14 (CD14分子)、PDE5A (ホスホジエステラーゼ5A、cGMP特異的)、AGTR2 (アンジオテンシンII受容体、2型)、CD40 (CD40分子、TNF受容体スーパーファミリーメンバー5)、LCAT (レシチン・コレステロールアシルトランスフェラーゼ)、CCR5 (ケモカイン (C-Cモチーフ)受容体5)、MMP1 (マトリックスメタロペプチダーゼ1 (腸コラゲナーゼ))、TIMP1 (TIMPメタロペプチダーゼ阻害因子1)、ADM (アドレノメデュリン)、DYT10 (ジストニア10)、STAT3 (シグナル伝達兼転写活性化因子3 (急性期応答因子))、MMP3 (マトリックスメタロペプチダーゼ3 (ストロメライシン1、プロゼラチナーゼ))、ELN (エラスチン)、USF1 (上流転写因子1)、CFH (補体因子H)、HSPA4 (熱ショック70kDaタンパク質4)、MMP12 (マトリックスメタロペプチダーゼ12 (マクロファージエラスターゼ))、MME (膜メタロエンドペプチダーゼ)、F2R (凝固因子II(トロンビン)受容体)、SELL (セレクチンL)、CTSB (カテプシンB)、ANXA5 (アネキシンA5)、ADRB1 (アドレナリン作動性、β1-、受容体)、CYBA (チトクロムb-245、αポリペプチド)、FGA (フィブリノーゲンα鎖)、GGT1 (γ-グルタミルトランスフェラーゼ1)、LIPG (リパーゼ、内皮)、HIF1A (低酸素誘導因子1、αサブユニット(塩基性ヘリックス・ループ・ヘリックス転写因子))、CXCR4 (ケモカイン(C-X-Cモチーフ)受容体4)、PROC (タンパク質C (凝固因子VaおよびVIIIa不活化因子))、SCARB1 (スカベンジャー受容体クラスB、メンバー1)、CD79A (CD79a分子、免疫グロブリン関連α)、PLTP (リン脂質輸送タンパク質)、ADD1 (アデュシン1 (α))、FGG (フィブリノーゲンγ鎖)、SAA1 (血清アミロイドA1)、KCNH2 (電位依存性カリウムチャンネル、サブファミリーH (eag関連)、メンバー2)、DPP4 (ジペプチジルペプチダーゼ4)、G6PD (グルコース-6-リン酸デヒドロゲナーゼ)、NPR1 (ナトリウム利尿ペプチド受容体A/グアニル酸シクラーゼA (心房性ナトリウム利尿ペプチド受容体A))、VTN (ビトロネクチン)、KIAA0101 (KIAA0101)、FOS (FBJマウス骨肉腫ウイルスがん遺伝子相同体)、TLR2 (toll様受容体2)、PPIG (ペプチジルプロリルイソメラーゼG (シクロフィリンG))、IL1R1 (インターロイキン1受容体、I型)、AR (アンドロゲン受容体)、CYP1A1 (チトクロムP450、ファミリー1、サブファミリーA、ポリペプチド1)、SERPINA1 (セルピンペプチダーゼ阻害因子、系統群A (α1抗プロテイナーゼ、アンチトリプシン)、メンバー1)、MTR (5-メチルテトラヒドロ葉酸-ホモシステインメチルトランスフェラーゼ)、RBP4 (レチノール結合タンパク質4、血漿)、APOA4 (アポリポタンパク質A-IV)、CDKN2A (サイクリン依存性キナーゼ阻害因子2A (黒色腫、p16、CDK4を阻害))、FGF2 (線維芽細胞成長因子2 (塩基性))、EDNRB (エンドセリン受容体B型)、ITGA2 (インテグリン、α2 (CD49B、VLA-2受容体α2サブユニット))、CABIN1 (カルシニューリン結合タンパク質1)、SHBG (性ホルモン結合グロブリン)、HMGB1 (高移動度群ボックス1)、HSP90B2P (熱ショックタンパク質90kDa β (Grp94)、メンバー2 (偽遺伝子))、CYP3A4 (チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド4)、GJA1 (ギャップ結合タンパク質、α1、43kDa)、CAV1 (カベオリン1、カベオラタンパク質、22kDa)、ESR2 (エストロゲン受容体2 (ERβ))、LTA (リンホトキシンα (TNFスーパーファミリー、メンバー1))、GDF15 (増殖分化因子15)、BDNF (脳由来神経栄養因子)、CYP2D6 (チトクロムP450、ファミリー2、サブファミリーD、ポリペプチド6)、NGF (神経成長因子(βポリペプチド))、SP1 (Sp1転写因子)、TGIF1 (TGFB誘導性因子ホメオボックス1)、SRC (v-src肉腫(シュミット・ルピンA-2)ウイルスがん遺伝子相同体(鳥類))、EGF (上皮細胞成長因子(βウロガストロン))、PIK3CG (ホスホイノシチド-3-キナーゼ、触媒性、γポリペプチド)、HLA-A (主要組織適合複合体、クラスI、A)、KCNQ1 (電位依存性カリウムチャンネル、KQT様サブファミリー、メンバー1)、CNR1 (カンナビノイド受容体1 (脳))、FBN1 (フィブリリン1)、CHKA (コリンキナーゼα)、BEST1 (ベストロフィン1)、APP (アミロイドβ(A4) 前駆体タンパク質)、CTNNB1 (カテニン(カドヘリン関連タンパク質)、β1、88kDa)、IL2 (インターロイキン2)、CD36 (CD36分子(トロンボスポンジン受容体))、PRKAB1 (タンパク質キナーゼ、AMP活性化、β1非触媒性サブユニット)、TPO (甲状腺ペルオキシダーゼ)、ALDH7A1 (アルデヒドデヒドロゲナーゼ 7 ファミリー、メンバーA1)、CX3CR1 (ケモカイン (C-X3-Cモチーフ)受容体1)、TH (チロシンヒドロキシラーゼ)、F9 (凝固因子IX)、GH1 (成長ホルモン1)、TF (トランスフェリン)、HFE (ヘモクロマトーシス)、IL17A (インターロイキン17A)、PTEN (ホスファターゼ・テンシン相同体)、GSTM1 (グルタチ
オンS-トランスフェラーゼμ1)、DMD (ジストロフィン)、GATA4 (GATA結合タンパク質4)、F13A1 (凝固因子XIII、A1ポリペプチド)、TTR (トランスサイレチン)、FABP4 (脂肪酸結合タンパク質4、脂肪細胞)、PON3 (パラオキソナーゼ3)、APOC1 (アポリポタンパク質C-I)、INSR (インスリン受容体)、TNFRSF1B (腫瘍壊死因子受容体スーパーファミリー、メンバー1B)、HTR2A (5-ヒドロキシトリプタミン(セロトニン)受容体2A)、CSF3 (コロニー刺激因子3 (顆粒球))、CYP2C9 (チトクロムP450、ファミリー2、サブファミリーC、ポリペプチド9)、TXN (チオレドキシン)、CYP11B2 (チトクロムP450、ファミリー11、サブファミリーB、ポリペプチド2)、PTH (副甲状腺ホルモン)、CSF2 (コロニー刺激因子2 (顆粒球-マクロファージ))、KDR (キナーゼ挿入ドメイン受容体 (III型受容体チロシンキナーゼ))、PLA2G2A (ホスホリパーゼA2、IIA群(血小板、滑液))、B2M (β2ミクログロブリン)、THBS1 (トロンボスポンジン1)、GCG (グルカゴン)、RHOA (ras相同体遺伝子ファミリー、メンバーA)、ALDH2 (アルデヒドデヒドロゲナーゼ2ファミリー(ミトコンドリア))、TCF7L2 (転写因子7様2 (T細胞特異的、HMGボックス))、BDKRB2 (ブラジキニン受容体B2)、NFE2L2 (核内因子(赤血球由来2)様2)、NOTCH1 (ノッチ相同体1、転座関連(ショウジョウバエ属))、UGT1A1 (UDPグルクロノシルトランスフェラーゼ1ファミリー、ポリペプチドA1)、IFNA1 (インターフェロン、α1)、PPARD (ペルオキシソーム増殖剤活性化受容体Δ)、SIRT1 (サーチュイン(サイレント接合型情報調節2相同体) 1 (出芽酵母))、GNRH1 (性腺刺激ホルモン放出ホルモン1 (黄体化ホルモン放出ホルモン))、PAPPA (妊娠関連血漿タンパク質A、パッパリシン1)、ARR3 (アレスチン3、網膜(Xアレスチン))、NPPC (ナトリウム利尿ペプチド前駆体C)、AHSP (αヘモグロビン安定化タンパク質)、PTK2 (PTK2タンパク質チロシンキナーゼ2)、IL13 (インターロイキン13)、MTOR (ラパマイシン標的タンパク質(セリン/スレオニンキナーゼ))、ITGB2 (インテグリン、β2 (補体成分3受容体3および4サブユニット))、GSTT1 (グルタチオンS-トランスフェラーゼθ1)、IL6ST (インターロイキン6シグナル伝達因子 (gp130、オンコスタチンM受容体))、CPB2 (カルボキシペプチダーゼB2 (血漿))、CYP1A2 (チトクロムP450、ファミリー1、サブファミリーA、ポリペプチド2)、HNF4A (肝細胞核因子4、α)、SLC6A4 (溶質輸送体ファミリー6 (神経伝達物質輸送体、セロトニン)、メンバー4)、PLA2G6 (ホスホリパーゼA2、VI群(細胞質ゾル、カルシウム依存性))、TNFSF11 (腫瘍壊死因子(リガンド)スーパーファミリー、メンバー11)、SLC8A1 (溶質輸送体ファミリー8 (ナトリウム/カルシウム交換輸送体)、メンバー1)、F2RL1 (凝固因子II (トロンビン)受容体様1)、AKR1A1 (アルド・ケトレダクターゼファミリー1、メンバーA1 (アルデヒドレダクターゼ))、ALDH9A1 (アルデヒドデヒドロゲナーゼ 9 ファミリー、メンバーA1)、BGLAP (骨γカルボキシグルタミン酸(gla)タンパク質)、MTTP (ミクロソームトリグリセリド輸送タンパク質)、MTRR (5-メチルテトラヒドロ葉酸-ホモシステインメチルトランスフェラーゼレダクターゼ)、SULT1A3 (スルホトランスフェラーゼファミリー、細胞質ゾル、1A、フェノール選択性、メンバー3)、RAGE (腎腫瘍抗原)、C4B (補体成分4B (Chido式血液型)、P2RY12 (プリン作動性受容体P2Y、Gタンパク質共役型、12)、RNLS (レナラーゼ、FAD依存性アミンオキシダーゼ)、CREB1 (cAMP応答配列結合タンパク質1)、POMC (プロオピオメラノコルチン)、RAC1 (ras関連C3ボツリヌス毒素基質1 (rhoファミリー、低分子GTP結合タンパク質Rac1))、LMNA (ラミンNC)、CD59 (CD59分子、補体調節タンパク質)、SCN5A (ナトリウムチャンネル、電位依存性、V型、αサブユニット)、CYP1B1 (チトクロムP450、ファミリー1、サブファミリーB、ポリペプチド1)、MIF (マクロファージ遊走阻害因子(グリコシル化阻害因子))、MMP13 (マトリックスメタロペプチダーゼ13 (コラゲナーゼ3))、TIMP2 (TIMPメタロペプチダーゼ阻害因子2)、CYP19A1 (チトクロムP450、ファミリー19、サブファミリーA、ポリペプチド1)、CYP21A2 (チトクロムP450、ファミリー21、サブファミリーA、ポリペプチド2)、PTPN22 (タンパク質チロシンホスファターゼ、非受容体22型(リンパ系))、MYH14 (ミオシン、重鎖14、非筋肉)、MBL2 (マンノース結合レクチン(タンパク質C) 2、可溶性(オプソニン欠損))、SELPLG (セレクチンPリガンド)、AOC3 (アミンオキシダーゼ、銅含有3 (血管接着タンパク質1))、CTSL1 (カテプシンL1)、PCNA (増殖性細胞核抗原)、IGF2 (インスリン様成長因子2 (ソマトメジンA))、ITGB1 (インテグリン、β1 (フィブロネクチン受容体、βポリペプチド、抗原CD29はMDF2、MSK12を含む))、CAST (カルパスタチン)、CXCL12 (ケモカイン (C-X-Cモチーフ)リガンド12 (間質細胞由来因子1))、IGHE (免疫グロブリン重鎖定常ε)、KCNE1 (電位依存性カリウムチャンネル、Isk関連ファミリー、メンバー1)、TFRC (トランスフェリン受容体 (p90、CD71))、COL1A1 (コラーゲン、I型、α1)、COL1A2 (コラーゲン、I型、α2)、IL2RB (インターロイキン2受容体、β)、PLA2G10 (ホスホリパーゼA2、X群)、ANGPT2 (アンジオポエチン2)、PROCR (タンパク質C受容体、内皮(EPCR))、NOX4 (NADPHオキシダーゼ4)、HAMP (ヘプシジン抗菌ペプチド)、PTPN11 (タンパク質チロシンホスファターゼ、非受容体11型)、SLC2A1 (溶質輸送体ファミリー2 (促進性グルコース輸送体)、メンバー1)、IL2RA (インターロイキン2受容体、α)、CCL5 (ケモカイン(C-C モチーフ)リガンド5)、IRF1 (インターフェロン調節因子1)、CFLAR (CASP8およびFADD様アポトーシス調節因子)、CALCA (カルシトニン関連ポリペプチドα)、EIF4E (真核生物翻訳開始因子4E)、GSTP1 (グルタチオンS-トランスフェラーゼπ1)、JAK2 (ヤヌスキナーゼ2)、CYP3A5 (チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド5)、HSPG2 (ヘパラン硫酸プロテオグリカン2)、CCL3 (ケモカイン(C-Cモチーフ)リガンド3)、MYD88 (ミエロイド分化一次応答遺伝子(88))、VIP (血管作動性腸ペプチド)、SOAT1 (ステロールO-アシルトランスフェラーゼ1)、ADRBK1 (アドレナリン作動性、β、受容体キナーゼ1)、NR4A2 (核内受容体サブファミリー4、A型、メンバー2)、MMP8 (マトリックスメタロペプチダーゼ8 (好中球コラゲナーゼ))、NPR2 (ナトリウム利尿ペプチド受容体B/グアニル酸シクラーゼB (心房性ナトリウム利尿ペプチド受容体B))、GCH1 (GTPシクロヒドロラーゼ1)、EPRS (グルタミル-プロリル-tRNAシンテターゼ)、PPARGC1A (ペルオキシソーム増殖剤活性化受容体γ、活性化補助因子1α)、F12 (凝固因子XII (ハーゲマン因子))、PECAM1 (血小板/内皮細胞接着分子)、CCL4 (ケモカイン(C-Cモチーフ)リガンド4)、SERPINA3 (セルピンペプチダーゼ阻害因子、系統群A (α-1抗プロテイナーゼ、アンチトリプシン)、メンバー3)、CASR (カルシウム感知受容体)、GJA5 (ギャップ結合タンパク質、α5、40kDa)、FABP2 (脂肪酸結合タンパク質2、腸)、TTF2 (転写終結因子、RNAポリメラーゼ II)、PROS1 (タンパク質S(α))、CTF1 (カルジオトロフィン1)、SGCB (サルコグリカン、β(43kDaジストロフィン関連糖タンパク質))、YME1L1 (YME1様1 (出芽酵母))、CAMP (カテリシジン抗菌ペプチド)、ZC3H12A (亜鉛フィンガーCCCH型含有12A)、AKR1B1 (アルド・ケトレダクターゼファミリー1、メンバーB1 (アルドースレダクターゼ))、DES (デスミン)、MMP7 (マトリックスメタロペプチダーゼ7 (マトリライシン、子宮))、AHR (アリール炭化水素受容体)、CSF1 (コロニー刺激因子1 (マクロファージ))、HDAC9 (ヒストンデアセチラーゼ9)、CTGF (結合組織成長因子)、KCNMA1 (大コンダクタンスカルシウム活性化カリウムチャンネル、サブファミリーM、αメンバー1)、UGT1A (UDPグルクロノシルトランスフェラーゼ1ファミリー、ポリペプチドA複合体遺伝子座)、PRKCA (タンパク質キナーゼC、α)、COMT (カテコールβ-メチルトランスフェラーゼ)、S100B (S100カルシウム結合タンパク質B)、EGR1 (初期増殖応答1)、PRL (プロラクチン)、IL15 (インターロイキン15)、DRD4 (ドーパミン受容体D4)、CAMK2G (カルシウム/カルモジュリン依存性タンパク質キナーゼIIγ)、SLC22A2 (溶質輸送体ファミリー22 (有機カチオン輸送体)、メンバー2)、CCL11 (ケモカイン(C-Cモチーフ)リガンド11)、PGF (B321胎盤成長因子)、THPO (トロンボポエチン)、GP6 (糖タンパク質VI (血小板))、TACR1 (タキキニン受容体1)、NTS (ニューロテンシン)、HNF1A (HNF1ホメオボックスA)、SST (ソマトスタチン)、KCND1 (電位依存性カリウムチャンネル、Shal関連サブファミリー、メンバー1)、LOC646627 (ホスホリパーゼ阻害因子)、TBXAS1 (トロンボキサンAシンターゼ1 (血小板))、CYP2J2 (チトクロムP450、ファミリー2、サブファミリーJ、ポリペプチド 2)、TBXA2R (トロンボキサンA2受容体)、ADH1C (アルコールデヒドロゲナーゼ1C (クラスI)、γポリペプチド)、ALOX12 (アラキドン酸12-リポキシゲナーゼ)、AHSG (α-2-HS-糖タンパク質)、BHMT (ベタイン-ホモシステインメチルトランスフェラーゼ)、GJA4 (ギャップ結合タンパク質、α4、37kDa)、SLC25A4 (溶質輸送体ファミリー25 (ミトコンドリア輸送体; アデニンヌクレオチド輸送体)、メンバー4)、ACLY (ATPクエン酸リアーゼ)、ALOX5AP (アラキドン酸 5-リポキシゲナーゼ活性化タンパク質)、NUMA1 (核有糸分裂装置タンパク質1)、CYP27B1 (チトクロムP450、ファミリー27、サブファミリーB、ポリペプチド1)、CYSLTR2 (システイニルロイコトリエン受容体2)、SOD3 (スーパーオキシドジスムターゼ3、細胞外)、LTC4S (ロイコトリエンC4シンターゼ)、UCN (ウロコルチン)、GHRL (グレリン/オベスタチンプレプロペプチド)、APOC2 (アポリポタンパク質C-II)、CLEC4A (C型レクチンドメインファミリー4、メンバーA)、KBTBD10 (ケルチ反復配列およびBTB (POZ)ドメイン含有10)、TNC (テネイシンC)、TYMS (チミジル酸シンテターゼ)、SHCl (SHC (Src相同性2ドメイン含有)形質転換タンパク質1)、LRP1 (低密度リポタンパク質受容体関連タンパク質1)、SOCS3 (サイトカインシグナル抑制因子3)、ADH1B (アルコールデヒドロゲナーゼ1B (クラスI)、βポリペプチド)、KLK3 (カリクレイン関連ペプチダーゼ3)、HSD11B1 (水酸化ステロイド(11β)デヒドロゲナーゼ1)、VKORC1 (ビタミンKエポキシドレダクターゼ複合体、サブユニット1)、SERPINB2 (セルピンペプチダーゼ阻害因子、系統群B (オボアルブミン)、メンバー2)、TNS1 (テンシン1)、RNF19A (リングフィンガータンパク質19A)、EPOR (エリスロポエチン受容体)、ITGAM (インテグリン、αM (補体成分3受容体3サブユニット))、PITX2 (対様ホメオドメイン2)、MAPK7 (分裂促進因子活性化タンパク質キナーゼ 7)、FCGR3A (IgGのFc断片、低親和性111a、受容体 (CD16a))、LEPR (レプチン受容体)、ENG (エンドグリン)、GPX1 (グルタチオンペルオキシダーゼ1)、GOT2 (グルタミン酸オキサロ酢酸トランスアミナーゼ2、ミトコンドリア (アスパラギン酸アミノトランスフェラーゼ2))、HRH1 (ヒスタミン受容体H1)、NR112 (核内受容体サブファミリー1、I群、メンバー2)、CRH (コルチコトロピン放出ホルモン)、HTR1A (5-ヒドロキシトリプタミン(セロトニン)受容体1A)、VDAC1 (電位依存性アニオンチャンネル1)、HPSE (ヘパラナーゼ)、SFTPD (肺サーファクタントタンパク質D)、TAP2 (輸送体2、ATP結合カセット、サブファミリーB (MDR/TAP))、RNF123 (リングフィンガータンパク質123)、PTK2B (PTK2Bタンパク質チロシンキナーゼ2β)、NTRK2 (神経栄養チロシンキナーゼ、受容体、2型)、IL6R (インターロイキン6受容体)、ACHE (アセチルコリンエステラーゼ(Yt式血液型))、GLP1R (グルカゴン様ペプチド1受容体)、GHR (成長ホルモン受容体)、GSR (グルタチオンレダクターゼ)、NQO1 (NAD(P)Hデヒドロゲナーゼ、キノン1)、NR5A1 (核内受容体サブファミリー5、A型、メンバー1)、GJB2 (ギャップ結合タンパク質、β2、26kDa)、SLC9A1 (溶質輸送体ファミリー9 (ナトリウム/水素交換輸送体)、メンバー1)、MAOA (モノアミンオキシダーゼ A)、PCSK9 (プロタンパク質変換酵素スブチリ
シン/ケキシン9型)、FCGR2A (IgGのFc断片、低親和性IIa、受容体(CD32))、SERPINF1 (セルピンペプチダーゼ阻害因子、系統群F (α-2抗プラスミン、色素上皮由来因子)、メンバー1)、EDN3 (エンドセリン 3)、DHFR (ジヒドロ葉酸レダクターゼ)、GAS6 (成長停止特異的6)、SMPD1 (スフィンゴミエリンホスホジエステラーゼ1、酸、リソソーム)、UCP2 (非共役型タンパク質2 (ミトコンドリア、陽子輸送体))、TFAP2A (転写因子AP-2α (活性化エンハンサー結合タンパク質2α))、C4BPA (補体成分4結合タンパク質、α)、SERPINF2 (セルピンペプチダーゼ阻害因子、系統群F (α-2抗プラスミン、色素上皮由来因子)、メンバー2)、TYMP (チミジンホスホリラーゼ)、ALPP (アルカリホスファターゼ、胎盤(Reganアイソザイム))、CXCR2 (ケモカイン(C-X-Cモチーフ)受容体2)、SLC39A3 (溶質輸送体ファミリー39 (亜鉛輸送体)、メンバー3)、ABCG2 (ATP結合カセット、サブファミリーG (WHITE)、メンバー2)、ADA (アデノシンデアミナーゼ)、JAK3 (ヤヌスキナーゼ3)、HSPA1A (熱ショック70kDaタンパク質1A)、FASN (脂肪酸シンターゼ)、FGF1 (線維芽細胞成長因子1 (酸性))、F11 (凝固因子XI)、ATP7A (ATPアーゼ、Cu++輸送性、αポリペプチド)、CR1 (補体成分(3b/4b)受容体1 (Knops式血液型))、GFAP (グリア線維酸性タンパク質)、ROCK1 (Rho関連、コイルドコイル含有タンパク質キナーゼ1)、MECP2 (メチルCpG結合タンパク質2 (レット症候群))、MYLK (ミオシン軽鎖キナーゼ)、BCHE (ブチリルコリンエステラーゼ)、LIPE (リパーゼ、ホルモン感受性)、PRDX5 (ペルオキシレドキシン5)、ADORA1 (アデノシンA1受容体)、WRN (ウェルナー症候群、RecQヘリカーゼ様)、CXCR3 (ケモカイン(C-X-Cモチーフ)受容体3)、CD81 (CD81分子)、SMAD7 (SMADファミリーメンバー7)、LAMC2 (ラミニン、γ2)、MAP3K5 (分裂促進因子活性化タンパク質キナーゼ5)、CHGA (クロモグラニンA (副甲状腺分泌タンパク質1))、IAPP (膵島アミロイドポリペプチド)、RHO (ロドプシン)、ENPP1 (エクトヌクレオチドピロホスファターゼ/ホスホジエステラーゼ1)、PTHLH (副甲状腺ホルモン様ホルモン)、NRG1 (ニューレグリン1)、VEGFC (血管内皮成長因子C)、ENPEP (グルタミルアミノペプチダーゼ(アミノペプチダーゼA))、CEBPB (CCAAT/エンハンサー結合タンパク質(C/EBP)、β)、NAGLU (N-アセチルグルコサミニダーゼ、α-)、F2RL3 (凝固因子II (トロンビン)受容体様3)、CX3CL1 (ケモカイン(C-X3-Cモチーフ)リガンド1)、BDKRB1 (ブラジキニン受容体B1)、ADAMTS13 (トロンボスポンジンを持つADAMメタロペプチダーゼ1型モチーフ、13)、ELANE (エラスターゼ、好中球で発現)、ENPP2 (エクトヌクレオチドピロホスファターゼ/ホスホジエステラーゼ2)、CISH (サイトカイン誘導性SH2含有タンパク質)、GAST (ガストリン)、MYOC (ミオシリン、線維柱帯網誘導性糖質コルチコイド応答)、ATP1A2 (ATPase、Na+/K+輸送性、α2ポリペプチド)、NF1 (ニューロフィブロミン1)、GJB1 (ギャップ結合タンパク質、β1、32kDa)、MEF2A (筋細胞エンハンサー因子2A)、VCL (ビンキュリン)、BMPR2 (骨形態形成タンパク質受容体、II型(セリン/スレオニンキナーゼ))、TUBB (チューブリン、β)、CDC42 (細胞分裂周期42 (GTP結合タンパク質、25kDa))、KRT18 (ケラチン18)、HSF1 (熱ショック転写因子1)、MYB (v-myb骨髄芽球症ウイルスがん遺伝子相同体(鳥類))、PRKAA2 (タンパク質キナーゼ、AMP活性化、α2触媒性サブユニット)、ROCK2 (Rho関連、コイルドコイル含有タンパク質キナーゼ2)、TFPI (組織因子経路阻害因子(リポタンパク質関連凝固阻害因子))、PRKG1 (タンパク質キナーゼ、cGMP依存性、I型)、BMP2 (骨形態形成タンパク質2)、CTNND1 (カテニン(カドヘリン関連タンパク質)、Δ1)、CTH (シスタチオナーゼ(シスタチオニンγリアーゼ))、CTSS (カテプシンS)、VAV2 (vav2グアニンヌクレオチド交換因子)、NPY2R (神経ペプチドY受容体Y2)、IGFBP2 (インスリン様成長因子結合タンパク質2、36kDa)、CD28 (CD28分子)、GSTA1 (グルタチオンS-トランスフェラーゼα1)、PPIA (ペプチジルプロリルイソメラーゼA (シクロフィリンA))、APOH (アポリポタンパク質H (β2-糖タンパク質I))、S100A8 (S100カルシウム結合タンパク質A8)、IL11 (インターロイキン11)、ALOX15 (アラキドン酸15-リポキシゲナーゼ)、FBLN1 (フィビュリン1)、NR1H3 (核内受容体サブファミリー1、H群、メンバー3)、SCD (ステアロイルCoA不飽和酵素 (Δ-9-不飽和酵素))、GIP (胃抑制ポリペプチド)、CHGB (クロモグラニンB (セクレトグラニン1))、PRKCB (タンパク質キナーゼC、β)、SRD5A1 (ステロイド-5-α-レダクターゼ、αポリペプチド1 (3-オキソ-5α-ステロイドΔ4-デヒドロゲナーゼα1))、HSD11B2 (水酸化ステロイド(11β)デヒドロゲナーゼ2)、CALCRL (カルシトニン受容体様)、GALNT2 (UDP-N-アセチル-α-D-ガラクトサミン:ポリペプチドN-アセチルガラクトサミニルトランスフェラーゼ2 (GalNAc-T2))、ANGPTL4 (アンジオポエチン様4)、KCNN4 (中間/小コンダクタンスカルシウム活性化カリウムチャンネル、サブファミリーN、メンバー4)、PIK3C2A (ホスホイノシチド-3-キナーゼ、クラス2、αポリペプチド)、HBEGF (ヘパリン結合EGF様成長因子)、CYP7A1 (チトクロムP450、ファミリー7、サブファミリーA、ポリペプチド1)、HLA-DRB5 (主要組織適合複合体、クラスII、DRβ5)、BNIP3 (BCL2/アデノウイルスE1B 19kDa相互作用タンパク質3)、GCKR (グルコキナーゼ(ヘキソキナーゼ4)調節因子)、S100A12 (S100カルシウム結合タンパク質A12)、PADI4 (ペプチジルアルギニンデイミナーゼ、IV型)、HSPA14 (熱ショック70kDaタンパク質14)、CXCR1 (ケモカイン(C-X-Cモチーフ)受容体1)、H19 (H19、インプリント母性発現転写物(非タンパク質翻訳領域))、KRTAP19-3 (ケラチン関連タンパク質19-3)、IDDM2 (インスリン依存性糖尿病2)、RAC2 (ras関連C3ボツリヌス毒素基質2 (rhoファミリー、低分子GTP結合タンパク質Rac2))、RYR1 (リアノジン受容体1 (骨格))、CLOCK (clock相同体(マウス))、NGFR (神経成長因子受容体 (TNFRスーパーファミリー、メンバー16))、DBH (ドーパミンβ-ヒドロキシラーゼ(ドーパミンβ-モノオキシゲナーゼ))、CHRNA4 (コリン作動性受容体、ニコチン性、α4)、CACNA1C (カルシウムチャンネル、電位依存性、L型、α1Cサブユニット)、PRKAG2 (タンパク質キナーゼ、AMP活性化、γ2非触媒性サブユニット)、CHAT (コリンアセチルトランスフェラーゼ)、PTGDS (プロスタグランジンD2シンターゼ21kDa (脳))、NR1H2 (核内受容体サブファミリー1、H群、メンバー2)、TEK (TEKチロシンキナーゼ、内皮)、VEGFB (血管内皮成長因子B)、MEF2C (筋細胞エンハンサー因子2C)、MAPKAPK2 (分裂促進因子活性化タンパク質キナーゼ活性化タンパク質キナーゼ2)、TNFRSF11A (腫瘍壊死因子受容体スーパーファミリー、メンバー11a、NFKB活性化因子)、HSPA9 (熱ショック70kDaタンパク質9 (モルタリン))、CYSLTR1 (システイニルロイコトリエン受容体 1)、MAT1A (メチオニンアデノシルトランスフェラーゼI、α)、OPRL1 (アヘン受容体様1)、IMPA1 ((ミオ)イノシトール-1(または4)-モノホスファターゼ1)、CLCN2 (塩素チャンネル2)、DLD (ジヒドロリポアミドデヒドロゲナーゼ)、PSMA6 (プロテアソーム(プロソーム、マクロパイン)サブユニット、α型、6)、PSMB8 (プロテアソーム(プロソーム、マクロパイン)サブユニット、β型、8 (大型多機能ペプチダーゼ7))、CHI3L1 (キチナーゼ3様1 (軟骨糖タンパク質39))、ALDH1B1 (アルデヒドデヒドロゲナーゼ1ファミリー、メンバーB1)、PARP2 (ポリ (ADP-リボース)ポリメラーゼ2)、STAR (ステロイド産生急性調節タンパク質)、LBP (リポ多糖結合タンパク質)、ABCC6 (ATP結合カセット、サブファミリーC(CFTR/MRP)、メンバー6)、RGS2 (Gタンパク質シグナル調節因子2、24kDa)、EFNB2 (エフリンB2)、GJB6 (ギャップ結合タンパク質、β6、30kDa)、APOA2 (アポリポタンパク質A-II)、AMPD1 (アデノシン一リン酸デアミナーゼ1)、DYSF (ジスフェリン、肢帯型筋ジストロフィー2B (常染色体性劣性遺伝性))、FDFT1 (ファルネシル二リン酸ファルネシルトランスフェラーゼ1)、EDN2 (エンドセリン2)、CCR6 (ケモカイン(C-Cモチーフ)受容体6)、GJB3 (ギャップ結合タンパク質、β3、31kDa)、IL1RL1 (インターロイキン1受容体様1)、ENTPD1 (エクトヌクレオチド三リン酸ジホスホヒドロラーゼ1)、BBS4 (バルデ・ビードル症候群4)、CELSR2 (カドヘリン、EGF LAG 7貫通型G型受容体2 (flamingo相同体、ショウジョウバエ属))、F11R (F11受容体)、RAPGEF3 (Rapグアニンヌクレオチド交換因子 (GEF) 3)、HYAL1 (ヒアルロノグルコサミニダーゼ1)、ZNF259 (亜鉛フィンガータンパク質259)、ATOX1 (ATX1抗酸化タンパク質1相同体(酵母))、ATF6 (活性化転写因子6)、KHK (ケトヘキソキナーゼ(フルクトキナーゼ))、SAT1 (スペルミジン/スペルミンN1-アセチルトランスフェラーゼ1)、GGH (γ-グルタミルヒドロラーゼ(コンジュガーゼ、ホリルポリγグルタミルヒドロラーゼ))、TIMP4 (TIMPメタロペプチダーゼ阻害因子4)、SLC4A4 (溶質輸送体ファミリー4、炭酸水素ナトリウム共輸送体、メンバー4)、PDE2A (ホスホジエステラーゼ 2A、cGMP刺激性)、PDE3B (ホスホジエステラーゼ3B、cGMP阻害性)、FADS1 (脂肪酸不飽和酵素1)、FADS2 (脂肪酸不飽和酵素 2)、TMSB4X (チモシンβ4、X連鎖性)、TXNIP (チオレドキシン相互作用タンパク質)、LIMS1 (LIMおよび老化細胞抗原様ドメイン1)、RHOB (ras相同体遺伝子ファミリー、メンバーB)、LY96 (リンパ球抗原96)、FOXO1 (フォークヘッドボックスO1)、PNPLA2 (パタチン様ホスホリパーゼドメイン含有2)、TRH (チロトロピン放出ホルモン)、GJC1 (ギャップ結合タンパク質、γ1、45kDa)、SLC17A5 (溶質輸送体ファミリー17 (アニオン/糖輸送体)、メンバー5)、FTO (脂肪量および肥満関連)、GJD2 (ギャップ結合タンパク質、Δ2、36kDa)、PSRC1 (プロリン/セリンに富むコイルドコイル1)、CASP12 (カスパーゼ12 (遺伝子/偽遺伝子))、GPBAR1 (Gタンパク質共役型胆汁酸受容体1)、PXK (PXドメイン含有セリン/スレオニンキナーゼ)、IL33 (インターロイキン33)、TRIB1 (tribbles相同体1 (ショウジョウバエ属))、PBX4 (プレB細胞白血病ホメオボックス4)、NUPR1 (核内タンパク質、転写調節因子、1)、15-Sep(15kDaセレノタンパク質)、CILP2 (軟骨中間層タンパク質2)、TERC (テロメラーゼRNA成分)、GGT2 (γ-グルタミルトランスフェラーゼ2)、MT-CO1 (ミトコンドリアにコードされるチトクロムcオキシダーゼI)、およびUOX (尿酸オキシダーゼ、偽遺伝子)。これらの配列のうちの任意のものを、たとえば変異を解消するためにCRISPR-Casシステムの標的としてもよい。
さらなる実施態様では、染色体配列は、さらに以下から選択されてもよい:Pon1 (パラオキソナーゼ1)、LDLR (LDL受容体)、ApoE (アポリポタンパク質E)、Apo B-100 (アポリポタンパク質B-100)、ApoA (アポリポタンパク質(a))、ApoA1 (アポリポタンパク質A1)、CBS (シスタチオンBシンターゼ)、糖タンパク質IIb/IIb、MTHRF (5,10-メチレンテトラヒドロ葉酸レダクターゼ (NADPH)、およびそれらの組合せ。一反復では、CRISPR-Casシステムの標的として、染色体配列および染色体配列によってコードされる循環器疾患に関与するタンパク質をCacna1C、Sod1、Pten、Ppar(α)、Apo E、レプチン、およびそれらの組合せから選択してもよい。
当業者は、本明細書に開示されている方法を上記の方法に似たシステムにおいて、本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
肝臓および腎臓疾患の治療
本発明は、本明細書に記載のCRISPR-Casシステム(たとえばC2c1エフェクタータンパク質システム)を肝臓および/または腎臓に送達することも意図する。治療用核酸の細胞取込みを誘導するための送達方策としては、物理的力またはベクターシステム(ウイルス、脂質、もしくは複合体に基づく送達など)、またはナノ担体が挙げられる。核酸を流体力学的高圧全身注射で腎細胞に向けた、臨床的重要性の可能性が低い初期の投与以来、広範囲の遺伝子治療用ウイルスおよび非ウイルス担体が既に様々な動物のin vivo腎臓疾患モデルで転写後の事象を標的化するのに投与されてきた(Csaba Revesz and Peter Hamar (2011) Delivery Methods to Target RNAs in the Kidney (腎臓のRNAを標的化するための送達方法), Gene Therapy Applications, Prof. Chunsheng Kang (Ed.), ISBN: 978-953-307-541-9, InTech (www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidneyから入手可能))。腎臓への送達方法としては、Yuanら(Am J Physiol Renal Physiol 295: F605-F617, 2008)の文献に記載のものを挙げることができる。彼らは、アラキドン酸代謝の12/15-リポキシゲナーゼ(12/15-LO)経路を標的とする低分子干渉RNA (siRNA)のin vivo送達によって腎障害および糖尿病性腎症(DN)を寛解させることができるかどうかを、ストレプトゾトシンを注射した1型糖尿病のマウスモデルで調べた。腎臓でより多くのin vivoアクセスとsiRNA発現を達成するために、Yuanらはコレステロールと結合した二本鎖12/15-LOsiRNAオリゴヌクレオチドを用いた。約400 μgのsiRNAをマウスに皮下注射した。Yuangらの方法を、コレステロールと結合した1~2 gのCRISPR Casを腎臓への送達のためにヒトに皮下注射することを意図して本発明のCRISPR Casシステムに応用してもよい。
Molitorisら(J Am Soc Nephrol 20: 1754-1764, 2009)は近位尿細管細胞(PTC)を腎臓内のオリゴヌクレオチド再吸収部位として利用してアポトーシス経路の中心的タンパク質であるp53を標的化するsiRNAの有効性を試験し、腎臓の損傷を予防した。虚血性損傷の4時間後にp53に対する合成siRNAをそのまま静脈内注射すると、PTCおよび腎臓機能の両方が最大限に保護された。Molitorisらのデータは、近位尿細管細胞へのsiRNAの迅速な送達が静脈内投与後に起こることを示している。用量反応分析のために、ラットに0.33、1、3、または5 mg/kgの用量のsiP53を同じ4つの時点で注射したところ、累積用量はそれぞれ1.32、4、12、および20 mg/kgであった。PBSで処置した虚血性対照ラットと比較して、試験したすべてのsiRNA用量により1日目にSCr減少効果が得られ、高用量が約5日間にわたって有効であった。12および20 mg/kgの累積用量で最良の保護効果が得られた。Molitorisらの方法を、腎臓への送達のためにヒトに12および20 mg/kgの累積用量を投与することを意図して本発明の核酸標的化システムに応用してもよい。
Thompsonら(Nucleic Acid Therapeutics, Volume 22, Number 4, 2012)は、げっ歯類およびヒト以外の霊長類への静脈内投与後の合成低分子干渉RNA I5NPの毒物学的および薬物動態学的特性を報告している。I5NPは、RNA干渉(RNAi)経路を介して作用してアポトーシス促進性タンパク質p53の発現を一時的に阻害するように設計されており、急性虚血/再灌流障害(大きな心臓手術中に起こる可能性のある急性腎障害、および腎臓移植後に起こる可能性のある移植臓器機能障害など)から細胞を保護するために開発されている。有害作用を誘発するには、げっ歯類では800 mg/kgのI5NP、ヒト以外の霊長類では1,000 mg/kgのI5NPの用量が必要であり、有害作用はサルでは無症候性の補体活性化および凝固時間のわずかな延長などの血液への直接作用に限られていた。ラットでは、ラットのI5NP類似体でさらなる有害作用は観察されず、このことは、作用がI5NPの意図された薬理活性に関連する毒性ではなく、合成RNA二重鎖のクラス効果を表す可能性が高いことを示している。まとめると、これらのデータは、急性虚血/再灌流障害後の腎機能の維持のためのI5NPの静脈内投与の臨床試験を裏付けている。サルでは無毒性量(NOAEL)は500mg/kgであった。サルでは、25 mg/kgまでの用量レベルでの静脈内注射後、循環器、呼吸器、および神経学的パラメーターへの影響は観察されなかった。したがって、ヒトの腎臓に対するCRISPR Casを静脈内投与する場合にも同様の投与量が考えられる。
Shimizuら(J Am Soc Nephrol 21: 622-633、2010)は、ポリ(エチレングリコール)-ポリ(L-リシン)に基づくビヒクルを介した糸球体へのsiRNAの送達を目的とするシステムを開発した。siRNA/ナノ担体複合体は直径が約10~20 nmであり、有窓内皮を貫通して移動して糸球体間質に到達できる大きさであった。蛍光標識したsiRNA/ナノ担体複合体を腹腔内注射した後、Shimizuらは血液循環中のsiRNAを長時間にわたり検出した。分裂促進因子活性化タンパク質キナーゼ1(MAPK1)siRNA/ナノ担体複合体の反復腹腔内投与により、糸球体腎炎のマウスモデルでは糸球体MAPK1 mRNAおよびタンパク質発現が抑制された。siRNAの蓄積を調べるために、PICナノ担体(0.5 ml、5 nmolのsiRNA含有量)と複合化したCy5標識siRNA、そのままのCy5標識siRNA(0.5 ml、5 nmol)、またはHVJ-Eに内包したCy5標識siRNA(0.5 ml、5 nmolのsiRNA含有量)をBALBcマウスに投与した。Shimizuらの方法を、腹腔内投与および腎臓への送達のために、ヒトに約1~2リットルのナノ担体と複合化した約10~20 μmolのCRISPR Casの用量を意図して本発明の核酸標的化システムに応用してもよい。
当業者は、本明細書に開示されている方法をShimizuら、Thompsonら、およびMolitorisらの文献に記載の方法と共に、本明細書に開示されているC2c1-CRISPRシステムと共に用いてもよい。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
腎臓への送達方法は以下のように要約される:
Figure 2024138266000045
Figure 2024138266000046
Figure 2024138266000047
Figure 2024138266000048
肝臓または肝臓細胞の標的化
肝臓細胞の標的化が提供される。これはin vitroであってもin vivoであってもよい。肝細胞が好ましい。本明細書におけるCRISPRタンパク質 (C2c1など)の送達は、ウイルスベクター、特にAAV (特にAAV2/6)ベクターを介してもよい。これらを静脈内注射で投与してもよい。
肝臓の好ましい標的は、in vitroであれin vivoであれ、アルブミン遺伝子である。これはいわゆる「避難港(safe harbor)」である。というのも、アルブミンは非常に高い量で発現され、遺伝子編集が成功した後にアルブミン産生が多少減少しても許容されるからである。また、アルブミン遺伝子は、アルブミンプロモーター/エンハンサーから見て高レベルに発現することから、肝細胞のごく一部のみを編集した場合でも有用なレベルの正しい(すなわち導入遺伝子の)産生が(挿入されたドナー鋳型から)達成することができるため、好ましい。
アルブミンのイントロン1が適切な標的部位であるとWechslerらが示している(57th Annual Meeting and Exposition of the American Society of Hematologyにて報告(要約はオンラインでash.confex.com/ash/2015/webprogram/Paper86495.htmlより入手可能、2015年12月6日に掲載))。彼らの研究では、Znフィンガーを用いてこの標的部位でDNAを切断しており、適切なガイド配列を生成してCRISPRタンパク質による同じ部位での切断を誘導することができる。
Wechslerらが報告しているように、アルブミンなどの高発現遺伝子(高活性エンハンサー/プロモーターを持つ遺伝子)内の標的を使用すると、プロモーターなしのドナー鋳型を用いることができる可能性があり、これを肝臓の標的化以外にも広く応用することができる。高発現遺伝子のその他の例は公知である。
他の肝臓疾患
特定の実施態様では、本発明のCRISPRタンパク質は、肝障害、たとえばトランスサイレチンアミロイドーシス(ATTR)、α-1アンチトリプシン欠乏症、およびその他の肝臓に基づく先天性代謝異常などの治療に用いられる。FAPはトランスサイレチン(TTR)をコードする遺伝子の変異によって引き起こされる。これは常染色体性優性遺伝性疾患であるが、すべての保因者がこの疾患を発症するわけではない。この疾患に関連することが知られているTTR遺伝子には100を超える変異がある。一般的な変異の例としてはV30Mが挙げられる。遺伝子発現抑制に基づくTTR治療の原理は、iRNAを用いた研究で実証されている(Ueda et al. 2014 Transl Neurogener. 3:19)。ウィルソン病(WD)は、肝細胞にのみ見られるATP7Bをコードする遺伝子の変異によって引き起こされる。WDに関連する500以上の変異があり、東アジアなどの特定の地域で有病率が増加している。他の例は、A1ATD(SERPINA1遺伝子の変異によって引き起こされる常染色体性劣性遺伝性疾患)およびPKU(フェニルアラニンヒドロキシラーゼ(PAH)遺伝子の変異によって引き起こされる常染色体性劣性遺伝性疾患)である。
一実施態様では、本発明は、C2c1-CRISPRシステムの細胞への送達を含む、肝障害を治療する方法を提供する。C2c1-CRISPRシステムは、tracr RNA、ガイド配列を含むガイドRNA、および直接反復と複合化したC2c1-CRISPRを含む。ここで、ガイド配列は、肝障害に関与する遺伝子の標的配列とハイブリダイズし、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
肝臓関連血液障害、特に血友病、特に血友病B
肝細胞の遺伝子編集はマウス(in vitroとin vivoの両方)およびヒト以外の霊長類(in vivo)で成功しており、肝細胞の遺伝子編集/ゲノム操作による血液障害の治療が可能であることが示されている。特に、ヒトF9 (hF9)遺伝子の肝細胞での発現はヒト以外の霊長類でヒトの血友病Bの治療を意味することがわかっている。一側面では、本発明は細胞へのC2c1-CRISPRシステムの送達を含む、肝臓関連血液障害を治療する方法を提供する。C2c1-CRIPSRシステムは、tracr RNA、ガイド配列を含むガイドRNA、および直接反復と複合化したC2c1-CRISPRを含む。ここで、ガイド配列は肝障害に関与する遺伝子の標的配列とハイブリダイズし、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
Wechslerらは57th Annual Meeting and Exposition of the American Society of Hematology(要約は2015年12月6日に掲載され、オンラインでash.confex.com/ash/2015/webprogram/Paper86495.htmlより入手可能)で、in vivo遺伝子編集によりヒトF9 (hF9)をヒト以外の霊長類の肝細胞から発現させるのに成功したことを報告した。これは1) アルブミン遺伝子座のイントロン1を標的化する2つの亜鉛フィンガーヌクレアーゼ (ZFN)と2)ヒトF9ドナー鋳型構築物とを用いて達成された。ZFNおよびドナー鋳型は、静脈内注射された別々の肝臓指向性アデノ関連ウイルス血清型2/6 (AAV2/6)ベクターでコードされることにより、肝臓の肝細胞の一部のアルブミン遺伝子座にhF9遺伝子の補正済みコピーが標的挿入された。
アルブミン遺伝子座は「避難港」として選択された。というのも、この最も豊富な血漿タンパク質の産生量は10 g/日を超え、それらの量が適度に減少しても十分に許容されるからである。ゲノム編集した肝細胞は、高活性のアルブミンエンハンサー/プロモーターに駆動され、アルブミンではなく治療量の正常なhFIX (hF9)を産生した。アルブミン遺伝子座へのhF9導入遺伝子の標的組込み、およびアルブミン転写物へのこの遺伝子のスプライシングが示された。
マウスの研究: C57BL/6マウスにビヒクル(n=20)、またはマウス代用試薬をコードするAAV2/6ベクター(n=25)を1.0×1013ベクターゲノム(vg)/kgで尾静脈注射により投与した。治療したマウスの血漿hFIXをELISA分析したところ50~1053 ng/mLのピークレベルが示され、これは6ヶ月の研究期間中持続した。マウス血漿のFIX活性を分析し、発現レベルに見合った生物活性が確認された。
ヒト以外の霊長類(NHP)の研究: NHPを標的とするアルブミン特異的ZFNをコードするAAV2/6ベクターおよびヒトF9ドナーを1.2×1013 vg/kg(n=5/群)、単回静脈内同時注入すると、この大型動物モデルで>50ng/mL(正常値の>1%)が得られた。より高用量のAAV2/6(最大1.5×1014 vg/kg)を使用したところ、研究期間中(3ヶ月)、数匹の動物で最大1000 ng/ml(すなわち正常値の20%)、1匹の動物で最大2000 ng/ml(すなわち正常値の50%)の血漿hFIX濃度が見られた。
マウスおよびNHPでは治療は十分に許容され、治療用量ではいずれの種にもAAV2/6 ZFN+ドナーの治療に関する有意な毒性学的所見はなかった。Sangamo (米国カリフォルニア州)はその後FDAに申請し、in vivoゲノム編集の応用について世界初のヒト臨床治験を実施する許可が与えられた。これはEMEAがリポタンパク質リパーゼ欠損症のGlybera遺伝子療法による治療を承認したことに続くものである。
したがって、実施態様によっては、以下のうちのいずれかまたはすべてを用いることが好ましい:AAV (特にAAV2/6)ベクター(好ましくは静脈内注射により投与);導入遺伝子/鋳型の遺伝子編集/挿入の標的としてのアルブミン(特にアルブミンのイントロン1);ヒトF9ドナー鋳型;および/またはプロモーターなしのドナー鋳型。
血友病B
したがって、実施態様によっては、本発明を血友病Bの治療に用いることが好ましい。したがって、F9(IX因子)を適切なガイドRNAの供給により標的化することが好ましい。酵素およびガイドを共に送達することも別々に送達することもできるが、理想的にはF9が産生される肝臓を標的化してもよい。鋳型が供給され、実施態様によっては、これはヒトF9遺伝子である。当然ながら、治療が有効であるように、hF9鋳型はhF9の野生型または「補正」型を含む。実施態様によっては、2ベクターシステム(C2c1用の1つのベクターと修復鋳型用の1つのベクター)を用いてもよい。修復鋳型は、2つ以上の鋳型、たとえば異なる哺乳動物種由来の2つのF9配列を含んでもよい。実施態様によっては、マウスおよびヒトF9配列の両方が提供される。これをマウスに送達してもよい。第58回米国血液学会年次総会(2016年11月)に出席したYang Yang、John White、McMenamin Deirdre、およびPeter Bell(学術博士)は、これにより効力および精度が向上すると報告している。第2のベクターによりIX因子のヒト配列がマウスのゲノムに挿入された。実施態様によっては、標的挿入によりキメラ機能亢進型IX因子タンパク質が発現する。実施態様によっては、これは天然型マウスIX因子プロモーターの制御下にある。この2成分システム(ベクター1およびベクター2)を新生仔および成体の「欠損型」マウスに用量を増やしながら注射すると、4か月にわたり正常な(またはさらに高い)レベルの安定なIX因子の発現および活性が得られた。ヒトを治療する場合、天然型ヒトF9プロモーターを代わりに用いてもよい。実施態様によっては、野生型の表現型を回復させる。
代替的な実施態様では、F9の血友病Bの型を送達して血友病B表現型を持つまたは保有する(すなわち野生型F9を産生できない)モデル生物、細胞、または細胞株(たとえばマウスまたはヒト以外の霊長類モデル生物、細胞、または細胞株)を作ってもよい。
血友病A
実施態様によっては、F9 (IX因子)遺伝子を上記のF8 (VIII因子)遺伝子で置き換えて、(正しいF8遺伝子の提供による)血友病Aの治療および/または(誤った血友病A型のF8遺伝子の提供による)血友病Aモデル生物、細胞、または細胞株の作成を誘導してもよい。
血友病C
実施態様によっては、F9 (IX因子)遺伝子を上記のF11 (XI因子)遺伝子で置き換えて、(正しいF11遺伝子の提供による)血友病Cの治療および/または(誤った血友病C型のF11遺伝子の提供による)血友病Cモデル生物、細胞、または細胞株の作成を誘導してもよい。
トランスサイレチンアミロイドーシス
トランスサイレチンは肝臓で主に産生され血清中および脳脊髄液(CSF)中に存在する、チロキシンホルモンおよびレチノール(ビタミンA)に結合したレチノール結合タンパク質を輸送するタンパク質である。120種以上の様々な変異がトランスサイレチンアミロイドーシス(ATTR)(組織中、特に末梢神経系で変異型のタンパク質が凝集し、多発性神経炎を引き起こす遺伝性の遺伝子疾患)を引き起こす可能性がある。家族性アミロイド多発神経炎(FAP)は最も一般的なTTR障害であり、2014年には、欧州では10万人あたり47人が罹患していると考えられていた。TTR遺伝子の変異Val30Metが最も一般的な変異だと考えられており、FAP症例のうち推定50%の原因となっている。現在までに知られている唯一の治療法である肝臓移植がなければ、この疾患は通常、診断から10年以内に死を招く。症例の大部分は単一遺伝子性である。
ATTRのマウスモデルで用量依存的にCRISPR/Cas9を送達してTTR遺伝子を編集してもよい。実施態様によっては、C2c1をmRNAとして供給する。実施態様によっては、C2c1 mRNAとガイドRNAとをリポソームナノ粒子(LNP)に一括する。LNPに一括されたC2c1 mRNAとガイドRNAとを含むシステムにより、肝臓では最大60%の編集効率が達成され、血清中TTR量は最大80%減少した。したがって、実施態様によってはトランスサイレチン、特にVal30Metの補正を標的とする。したがって、実施態様によってはATTRを治療する。
α1アンチトリプシン欠乏症
α1アンチトリプシン(A1AT)は肝臓で産生され、肺で好中球エラスターゼ(結合組織を分解する酵素)の活性を低減するよう主に機能するタンパク質である。α1アンチトリプシン欠乏症(ATTD)は、A1ATをコードするSERPINA1遺伝子の変異により起こる疾患である。A1ATの産生障害により、肺の結合組織が徐々に分解され、肺気腫に似た症状が起こる。
いくつかの変異がATTDを起こす可能性があるが、最も一般的な変異はGlu342Lys (Z対立遺伝子といい、野生型をMという)またはGlu264Val (S対立遺伝子という)であり、各対立遺伝子は同等に病状に関与し、影響を受けた対立遺伝子が2つともある場合はより明白な病態生理につながる。これらの結果は、感受性臓器(肺など)の結合組織の分解につながるだけでなく、肝臓に変異体が蓄積するとタンパク質毒性につながる可能性がある。現在の治療は、献血されたヒトの血漿から得たタンパク質を注入することによる置換に集中している。重症の場合、肺および/または肝臓の移植を検討することがある。
この疾患の一般的な多様体も単一遺伝子性である。実施態様によっては、SERPINA1遺伝子を標的化する。実施態様によっては、Glu342Lys変異(Z対立遺伝子といい、野生型をMという)またはGlu264Val変異(S対立遺伝子という)を補正する。したがって、実施態様によっては、欠陥遺伝子を野生型の機能性遺伝子で置換する必要がある。実施態様によっては、欠損および修復手法が必要であり、したがって修復鋳型が提供される。両対立遺伝子の変異の場合、実施態様によっては、ホモ接合型変異については1つのガイドRNAのみが必要だが、ヘテロ接合型の変異の場合には2つのガイドRNAが必要である可能性がある。送達は、実施態様によっては肺または肝臓への送達である。
先天性代謝異常
先天性代謝異常(IEM)は、代謝過程に影響を及ぼす疾患の総称である。実施態様によっては、IEMが治療対象である。これらの疾患の大部分は、本来は単一遺伝子性であり(たとえばフェニルケトン尿症)、病態生理は本質的に有毒な物質の異常な蓄積、または必須物質を合成することができなくなる変異のいずれかによって生じる。IEMの性質に応じて、CRISPR/C2c1を用いて、遺伝子破壊を単独で、または修復鋳型を介した欠陥遺伝子の置換と組み合わせて促してもよい。CRISPR/C2c1技術から利益を得られる可能性のある模範的な疾患は、実施態様によっては、原発性高シュウ酸尿症1型(PH1)、アルギニノコハク酸リアーゼ欠損症、オルニチントランスカルバミラーゼ欠損症、フェニルケトン尿症(すなわちPKU)、およびメープルシロップ尿症である。
上皮および肺疾患の治療
本発明は本明細書に記載のCRISPR-Casシステム(たとえばC2c1エフェクタータンパク質システム)を一方または両方の肺に送達することも意図する。
AAV-2に基づくベクターは嚢胞性線維症膜コンダクタンス制御因子(CFTR)を嚢胞性線維症(CF)気道に送達するために最初に提案されたが、AAV-1、AAV-5、AAV-6、AAV-9などその他の血清型は肺上皮の様々なモデルで改善された遺伝子導入効率を示す(たとえばLi et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009を参照のこと)。AAV-1はAAV-5と同等の効率でin vivoでマウスの気管の気道上皮を形質導入したが、AAV-1はin vitroでのヒト気道上皮細胞の形質導入5ではAAV-2およびAAV-5よりも約100倍効率的であると実証された。他の研究では、AAV-5はin vitroでのヒト気道上皮(HAE)への遺伝子送達ではAAV-2よりも50倍効率的であり、in vivoのマウス肺気道上皮ではそれよりも有意に効率的であると示されている。AAV-6も、in vitroでのヒト気道上皮細胞およびin vivoでのマウス気道においてAAV-2よりも効率的であることがわかっている8。より最近の分離株であるAAV-9は、in vivoでのマウスの鼻および肺胞上皮において9ヶ月以上にわたって遺伝子発現が検出され、AAV-5よりも高い遺伝子伝達効率を示すことがわかった。このことは、AAVによってCFTR遺伝子送達ベクターにとって望ましい特性であるin vivoでの長期の遺伝子発現が可能になり得ると示唆している。さらに、AAV-9はCFTR発現を失うことなく、免疫上の因果関係を最小限に抑えてマウスの肺に再投与できることが実証された。CFおよび非CF HAE培養液を100μlのAAVベクターと共に頂端膜側に数時間かけて接種してもよい(see, e.g., Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009)。感染効率(MOI)はウイルス濃度と実験の目的に応じて1×103~4×105ベクターゲノム/細胞で変動してもよい。上記ベクターを本発明の送達および/または投与のために意図する。
Zamoraら(Am J Respir Crit Care Med Vol 183. pp 531-538, 2011)は、は、ヒトの感染症の治療へのRNA干渉治療の応用例と、さらには呼吸器合胞体ウイルス(RSV)に感染した肺移植レシピエントにおける抗ウイルス薬のランダム化試験を報告した。Zamoraらは、RSV気道感染症のLTXレシピエントでランダム化二重盲検プラセボ対照試験を実施した。患者はRSVの標準治療を受けることが許可された。エアロゾル化したALN-RSV01 (0.6 mg/kg)またはプラセボを3日間毎日投与した。この研究により、RSVを標的とするRNAi治療薬をRSV感染症のLTXレシピエントに安全に投与することができると実証される。ALN-RSV01を3日間毎日投与したところ、気道症状の悪化や肺機能の障害は起きず、サイトカインやC反応性タンパク質(CRP)の誘導などの全身性炎症誘発作用も示されなかった。薬物動態は、吸入後にわずかな一過性の全身曝露を示しただけであり、これは静脈内投与または吸入投与されたALN-RSV01がエクソヌクレアーゼを介した消化および腎排泄によって循環から急速に排除されることを示す前臨床動物データと一致している。Zamoraらの方法を、本発明の核酸標的化システムに応用してもよく、たとえば0.6 mg/kgの投与量のエアロゾル化したCRISPR Casを本発明のために意図してもよい。
肺疾患の治療を受けた対象は、自発呼吸中、肺内気管支に送達される各肺につき薬学的に有効な量のエアロゾル化されたAAVベクターシステムを受け取ることができる。したがって、一般的にAAV送達にはエアロゾル化送達が好ましい。アデノウイルスまたはAAV粒子を送達に用いてもよい。それぞれ1つ以上の調節配列に作動可能に連結されている適切な遺伝子構築物を送達ベクターにクローン化してもよい。この例では、以下の構築物、Cas (C2c1)用にはCbhまたはEF1aプロモーター、ガイドRNA用にはU6またはH1プロモーターが例として挙げられている。好ましい配置は、CFTRΔ508標的化ガイド(ΔF508変異に対する修復鋳型)とコドン最適化したC2c1酵素とを、必要に応じて1つ以上の核局在化シグナルまたは配列(NLS)(たとえば2つのNLS)と共に用いることである。NLSを含まない構築物も想定される。
筋肉系の疾患の治療
本発明は、本明細書に記載のCRISPR-Casシステム(たとえば、C2c1エフェクタータンパク質システム)を筋肉に送達することも意図している。
Bortolanzaら(Molecular Therapy vol. 19 no. 11, 2055-2064 Nov. 2011)は、RNA干渉発現カセットをFRG1マウスに顔面肩甲上腕型筋ジストロフィー(FSHD)の発症後に全身送達したところ、毒性の徴候を示すことなく、用量依存的に長期にわたりFRG1を発現抑制したことを示している。Bortolanzaらは、5×1012vgのrAAV6-sh1FRG1を単回静脈内注射することによりFRG1マウスの筋肉病理組織および筋肉機能が回復することを見出した。具体的には、生理溶液中に2×1012または5×1012 vgのベクターを含む200 μlを25ゲージのTerumo注射器で尾静脈に注入した。Bortolanzaらの方法をCRISPR Casを発現するAAVに応用し、約2×1015または2×1016vgのベクターの投与量でヒトに注入してもよい。
Dumonceauxら(Molecular Therapy vol. 18 no. 5, 881-887 May 2010)はミオスタチン受容体AcvRIIb mRNA (sh-AcvRIIb)に対するRNA干渉の技術を用いてミオスタチン経路を阻害している。準ジストロフィンの回復は、ベクター化したU7エクソンスキッピング技術(U7-DYS)により媒介される。sh-AcvrIIb構築物のみ、U7-DYS構築物のみ、または両方の構築物の組合せのいずれかを含むアデノ関連ウイルスベクターをジストロフィーmdxマウスの前脛骨筋(TA)に注入した。1011個のAAVウイルスゲノムで注入を行った。Dumonceauxらの方法をAAV発現CRISPR Casに応用し、たとえば約1014~約×1015vgのベクターの投与量でヒトに注入してもよい。
Kinouchiら(Gene Therapy (2008) 15, 1126-1130)は、化学改変されていないsiRNAをアテロコラーゲン(ATCOL)と共に粒子形成することによる正常または罹患マウスの骨格筋へのin vivoでのsiRNA送達の有効性を報告している。ミオスタチン(骨格筋成長の負の調節因子)を標的とするsiRNAをATCOLを介してマウスの骨格筋または静脈内に局所投与することにより、投与後数週間以内に筋肉量に著しい増加が起こった。これらの結果は、ATCOLを介したsiRNAの投与が筋萎縮症を含む疾患に対する将来の治療用途のための強力な手段であることを示唆している。MstsiRNA (最終濃度、10 mM)をATCOL (局所投与のための最終濃度、0.5%) (AteloGene、Kohken (日本、東京))と製造元の指示に従い混合した。ネンブタール(25 mg/kg、腹腔内)でマウス(20週齢の雄C57BL/6)を麻酔した後、Mst-siRNA/ATCOL複合体を咬筋および大腿二頭筋に注射した。Kinouchiらの方法をCRISPR Casシステムに応用して、たとえば約500~1000 mlの用量の40 μM溶液をヒトに筋肉内注射してもよい。Hagstromら(Molecular Therapy Vol. 10, No. 2, August 2004)は、哺乳動物の四肢の筋肉全体の筋肉細胞(筋線維)に効率的かつ反復可能に核酸を送達することができる、血管内の非ウイルス性の方法論を記載している。この手順では、止血帯または血圧計のカフで一時的に隔離された四肢の遠位静脈に、そのままのプラスミドDNAまたはsiRNAを注入する。筋線維への核酸の送達は、筋肉組織に核酸溶液が血管外漏出することができるのに十分な量の核酸を迅速に注射することにより促進される。骨格筋への高レベルの導入遺伝子発現が小動物と大動物の両方で最小の毒性で達成された。四肢の筋肉へのsiRNA送達の証拠も得られた。アカゲザルへのプラスミドDNA静脈内注射では、三方活栓を2つの注射器ポンプ(PHD 2000型; Harvard Instruments)に接続し、それぞれに1つの注射器を取り付けた。パパベリン注射の5分後、pDNA(40~100 ml生理食塩水中15.5~25.7 mg)を1.7または2.0 ml/sの速度で注射した。これを本発明のCRISPR Casを発現するプラスミドDNA用にスケールアップして、800~2000 ml生理食塩水中約300~500 mgをヒトに注射することができる。ラットへのアデノウイルスベクター注射では、3 mlの生理食塩水(NSS)中2×109の感染性粒子が注入された。これを本発明のCRISPR Casを発現するアデノウイルスベクター用にスケールアップして、10リットルのNSS中約1×1013の感染性粒子をヒトに注射することができる。siRNAについては、12.5 μgのsiRNAがラットの大伏在静脈に注入され、750 μgのsiRNAが霊長類の大伏在静脈に注入された。これを本発明のCRISPR Cas用にスケールアップして、たとえばヒトの大伏在静脈に約15~約50 mgを注射することができる。
たとえば、Duke Universityの公開出願であるWO2013163628 A2 (Genetic Correct ion of Mutated Genes (変異遺伝子の遺伝子補正))も参照のこと。この文献には、たとえば中途終止コドンおよび切断型遺伝子産物の原因となるフレームシフト変異(ヌクレアーゼを介した非相同性末端結合によって補正することができる)を補正する取組みが記載されている(たとえば、ジストロフィン遺伝子の変異によって起こる筋変性につながる劣性遺伝性の致死的なX連鎖性障害であるデュシェンヌ型筋ジストロフィー(「DMD」)の原因となる変異など)。DMDの原因となるジストロフィン変異の大部分は、ジストロフィン遺伝子のリーディングフレームを破壊し中途翻訳終結を引き起こすエクソン欠失である。ジストロフィンは、筋肉細胞の統合性および機能の調節に関与する細胞膜のジストログリカン複合体に構造的安定性をもたらす細胞質タンパク質である。本明細書で交換可能に使用されるジストロフィン遺伝子または「DMD遺伝子」は、2.2メガベースで遺伝子座Xp21に存在する。一次転写は約2,400 kbで、成熟mRNAは約14 kbである。79個のエクソンが3500アミノ酸以上のタンパク質をコードする。エクソン51は多くの場合、DMD患者のフレーム破壊性欠失に隣接しており、臨床試験でオリゴヌクレオチドに基づくエクソンスキップの対象とされてきた。エクソン51スキップ化合物エテプリルセンに関する臨床試験では、近年、平均47%のジストロフィン陽性線維で、48週間にわたって基線と比較して有意な機能的利益が報告されている。エクソン51の変異は、NHEJに基づくゲノム編集による永続的な補正に最適である。
Cellectisに譲渡された米国特許出願公開第20130145487号の、ヒトジストロフィン(DMD)遺伝子から標的配列を切断するメガヌクレアーゼ多様体に関する方法を本発明の核酸標的化システムに合わせて変更してもよい。好ましい実施態様では、核酸標的化システムはCRISPR-C2c1システムを含む。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
皮膚疾患の治療
本発明は、本明細書に記載のCRISPR-Casシステム(たとえばC2c1エフェクタータンパク質システム)を皮膚に送達することも意図している。
Hickersonらの文献(Molecular Therapy-Nucleic Acids (2013) 2, e129)は、自己送達(sd)-siRNAをヒトおよびマウスの皮膚に送達するための電動マイクロニードルアレイ皮膚送達装置に関する。siRNAに基づく皮膚治療薬を臨床に置き換える際の主な課題は、効果的な送達システムの開発である。様々な皮膚送達技術に多大な努力が費やされてきたが、成功したのはわずかであった。皮膚をsiRNAで治療する臨床研究では、皮下針での注射に伴う鋭い痛みにより試験への追加の患者の登録が妨げられ、強調されたのはより「患者に優しい」(すなわち、痛みがほとんどまたはまったくない)改善された送達手法の必要性であった。マイクロニードルは、siRNAを含む大きな帯電積荷を一次障壁である角質層を越えて送達する効率的な方法であり、一般に従来の皮下針よりも痛みが少ないと考えられている。Hickersonらが使用する電動化マイクロニードルアレイ(MMNA)を含む電動化「スタンプ型」マイクロニードル装置は、(i)化粧品業界で幅広く用いられていること、および(ii)限定的な試験でほぼすべての志願者がこの装置の使用はインフルエンザ予防接種よりもはるかに痛みが少ないと感じており、この装置を用いてsiRNAを送達した場合、皮下針注射を用いた以前の臨床試験で感じるよりもはるかに痛みが少ないと示唆されること、によって証明されるように、安全でありほとんどまたはまったく痛みがないことが無毛マウスの研究で示されている。MMNA装置(Bomtech Electronic Co.(韓国、ソウル)によりTriple-MまたはTri-Mとして市販)をマウスおよびヒトの皮膚へのsiRNA送達に適合させた。sd-siRNA溶液(最大300μl、0.1 mg/ml RNA)を使い捨て式のTri-M針カートリッジ(Bomtech)の容器に入れ、カートリッジを0.1mmの深度に設定した。ヒトの皮膚を治療するために、非特定化した(外科的処置の直後に得られた)皮膚を手で伸ばし、治療前にコルク台に固定した。すべての皮内注射は、28ゲージの0.5インチ針を備えたインスリン注射器を使用して実施された。HickersonらのMMNA装置および方法を、本発明のCRISPR Casをたとえば最大300 μl、0.1 mg/ml CRISPR Casの投与量で皮膚に送達するために使用および/または適合させることができる。
Leachmanらの文献(Molecular Therapy, vol. 18 no. 2, 442-446 Feb. 2010)は、珍しい皮膚障害である先天性厚硬膜(PC)(掌蹠角化症を含む常染色体優性症候群)の治療に関する、最初の短鎖干渉RNA(siRNA)に基づく皮膚治療薬を用いた第Ib相臨床試験に関する。TD101と呼ばれるこのsiRNAは、野生型K6a mRNAに影響を及ぼすことなく、ケラチン6a (K6a) N171K変異型mRNAを特異的かつ強力に標的化する。
Zhengら(PNAS, July 24, 2012, vol. 109, no. 30, 11975-11980)は、球状核酸粒子結合体(SNA-NC)(金のコアを、共有結合で固定化した高配向のsiRNAの高密度な殻で囲んだもの)が投与後数時間以内にin vitro、マウスの皮膚、およびヒトの表皮で角化細胞のほぼ100%を自由に浸透することを示している。Zhengらは、25 nMの上皮細胞成長因子受容体(EGFR) SNA-NCを60時間単回投与すると、ヒトの皮膚で効果的な遺伝子発現抑制が示されることを実証した。皮膚への投与に関しては、SNA-NCに固定化されたCRISPR Casについても同様の投与量が考えられる。Zhengら、Leachmanら、およびHickersonらの方法を本発明の核酸標的化システムに合わせて変更してもよい。好ましい実施態様では、核酸標的化システムはCRISPR-C2c1システムを含む。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
がん
実施態様によっては、がんの治療、予防、または診断が提供される。標的は、好ましくはFAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC、またはTRBC遺伝子のうちの1つ以上である。がんは、リンパ腫、慢性リンパ性白血病(CLL)、B細胞性急性リンパ性白血病(B-ALL)、急性リンパ性白血病、急性骨髄性白血病、非ホジキンリンパ腫(NHL)、びまん性大細胞型リンパ腫(DLCL)、多発性骨髄腫、腎細胞がん(RCC)、神経芽腫、大腸がん、去勢抵抗性前立腺がん、転移性腎細胞がん、転移性肺非小細胞がん、乳がん、膀胱がん、卵巣がん、黒色腫、肉腫、前立腺がん、肺がん、食道がん、肝細胞がん、膵臓がん、星細胞腫、中皮腫、頭頸部がん、および髄芽腫のうちの1つ以上であってもよい。これを、操作されたキメラ抗原受容体(CAR) T細胞を用いて実行してもよい。このことはWO2015161276(その開示内容は参照により本明細書に組み込まれる)に記載されており、本明細書において以下に記載される。
食道がん、浸潤性膀胱がん、ホルモン不応性前立腺がん、転移性腎細胞がん、転移性肺非小細胞がん、ステージIVの胃がん、ステージIVの鼻咽頭がん、ステージIVのT細胞リンパ腫、およびエプスタイン・バーウイルス関連悪性腫瘍などの多くのがんをCRISPR-Cas9システムを用いてPD-1欠損T細胞を生成することにより治療することが提案され記載された。以下の文献を参照のこと:Niu et al. Cell 2014, 156(4): 836-43; Rosenberg et al, Science 2015, 348 (6230): 62-8; Sharma et al, Cell 2015, 161(2): 205-14; Bidnur et al, Bladder Cancer, 2016, 2(1): 15-25; Kim et al, Investig Clin Urol. 2016, 57 Suppl 1: S98-S105; Argon-Ching et al, Future Oncol., 2016, 12(17): 2049-58; Festino et al, Drugs 2016, 76(9): 925-45; Zibelman et al, Future Oncl., 2016, 12(19): 2227-42; Doni et al., J. Urol., 2017 197(1): 14-22; Yi et al, Biochim Biophys Acta., 2016, 1866(2): 197-207; Taube et al, Oncoimmunology, 2014, 3(11)L e963413; Yatsuda et al, Nihon Rinsho, 2014, 72(12): 2174-8; Modena et al. Oncol Rev. 2016, 10(1): 293; Bishop et al. Oncotarget, 2015, 6(1): 234-42; Gandini et al, Crit Rev Oncol Hematol. 2016, 100:88-98; Koshikin et al, Expert Opin Pharmacother. 2016 17(9):1225-32; Hofmann et al., Eur J Cancer. 2016, 60:190-209; Gunturi et al, Curr Treat Options Oncol. 2014, 15(1):137-46; Bockorny et al., Expert Opin Biol Ther. 2013, 13(6):911-25; Garon et al, N Engl J Med 2015, 372(21)L 2018-28; Brahmer et al, N Eng J Med, 2015 373(2): 123-35; Borghaei et al, N Engl JH Med 2015, 373(17): 1627-39; Kim et al, Gastroenterology, 2015 148(1): 137-147; Quan et al, PloS One, 2015, 10(9): 30136476; Louis et al, J Immunother., 2010, 33(9): 983-90; Lloyd et al., Frot Immunol., 2013, 4:221; Su et al, Sci Rep. 2016, 6: 20070。研究室で、末梢血リンパ球を採取し、プログラム細胞死タンパク質1(PDCD1)遺伝子をCRISPR-Cas9で欠損させる(PD-1欠損T細胞)。リンパ球を選択し、ex vivoで増殖させ、患者に再注入する。1サイクルに合計2×107 /kgのPD-1欠損T細胞を注入する。各サイクルを3回の投与に分け、最初の投与で20%、2回目で30%、3回目で50%を注入する。進行食道がんおよび筋層浸潤性膀胱がんの治療の場合、細胞注入の前に単回用量20 mg/kgのシクロホスファミドを3日間静脈投与する。その後5日間インターロイキン-2 (IL-2)を720000国際単位 (IU)/Kg/日(許容可能であれば)投与する。患者は合計で2、3、4サイクルの治療を受ける。
がんの治療または予防に適切な標的遺伝子としては、実施態様によっては、WO2015048577(その開示内容は参照により本明細書に組み込まれる)に記載のものを挙げることができる。WO2015161276およびWO2015048577も本発明の核酸標的化システムに合わせて変更してもよい。
本明細書に開示されているCRISPR-C2c1システムを上記の方法と共にがん治療に応用してもよい。好ましい実施態様では、核酸標的化システムはCRISPR-C2c1システムを含む。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。PAMの近位末端の切断とは対照的に、C2c1はPAMの遠位末端に二本鎖切断を起こす(Jinek et al., 2012; Cong et al., 2013)。C2c1変異標的配列は単一のg RNAによる反復的切断に影響されやすいかもしれないことが提唱されており、したがってHDRを介したゲノム編集へのC2c1の応用が促進されている(Front Plant Sci. 2016 Nov 14;7:1683)。特定の実施態様では、目的の遺伝子座は相同性指向修復(HRまたはHDR)を介してCRISPR-C2c1複合体によって改変される。特定の実施態様では、目的の遺伝子座はHRとは独立にCRISPR-C2c1複合体によって改変される。特定の実施態様では、目的の遺伝子座は非相同性末端結合(NHEJ)を介してCRISPR-C2c1複合体によって改変される。
Cas9によって起こる平滑末端とは対照的に、C2c1は5'末端が突出したねじれ型二本鎖切断を起こす(Garneau et al., Nature. 2010;468:67-71; Gasiunas et al., Proc Natl Acad Sci U S A. 2012;109:E2579-2586)。この切断産物の構造は、非相同性末端結合(NHEJ)に基づく哺乳動物ゲノムへの遺伝子挿入を促すのに特に有利である(Maresca et al., Genome research. 2013;23:539-546)。実施態様によっては、CRISPR-C2c1システムは外来性DNA挿入物をHRまたはNHEJを介してねじれ型DSBに導入する。特定の実施態様では、目的の遺伝子座は鋳型DNA配列を「遺伝子組込み」することによりCRISPR-C2c1複合体で改変される。特定の実施態様では、DNA挿入物は適切な配向でゲノムに組み込まれるよう設計される。好ましい実施態様では、目的の遺伝子座は、相同性指向修復(HDR)機構が特に難しい非分裂細胞(Chan et al., Nucleic acids research. 2011;39:5955-5966)においてCRISPR-C2c1システムで改変される。Marescaら(Genome Res. 2013 Mar; 23(3): 539-546)は、亜鉛フィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)と共に用いることができる部位特異的な正確な挿入の方法について記載した。ここで、5'末端に突出を有する短い二本鎖DNAが相補性末端に連結され、それによってヒト細胞株で指定の遺伝子座に15kbの外来性発現カセットを正確に挿入することができる。Heら(Nucleic Acids Res. 2016 May 19; 44(9))は、CRISPR/Cas9で誘導してプロモーターなしの4.6kbのires-eGFP断片をGAPDH遺伝子座に部位特異的に組み込んだところ、NHEJ経路を介した最大20%のGFP陽性細胞が体細胞LO2細胞で得られ、1.70%のGFP陽性細胞がヒト胚性幹細胞で得られたと記載した。同文献はまた、NHEJに基づく組込みは調査したすべてのヒト細胞型において、HDRを介した遺伝子標的化よりも効率的であると報告した。C2c1は5'末端が突出したねじれ型切断を発生させるため、当業者は、本明細書に開示するCRISPR-C2c1システムを用いて目的の遺伝子座に外来DNAを挿入するためにMerescaらおよびHeらの文献に記載されているのと似た方法を用いて本明細書に開示されているCRISPR-C2c1システムで目的の遺伝子座に外来性DNA挿入を起こすことができる。
特定の実施態様では、目的の遺伝子座はまずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、PAM配列付近でCRISPR-C2c1システムによってさらに改変され、HDRによって修復される。特定の実施態様では、目的の遺伝子座は、変異、欠失、または外来DNA配列の挿入をHDRを介して導入することによってCRISPR-C2c1システムにより改変される。実施態様によっては、目的の遺伝子座は変異、欠失、または外来DNA配列の挿入をNHEJを介して導入することによってCRISPR-C2c1システムにより改変される。好ましい実施態様では、外来DNAは、3'末端と5'末端の両方で単一ガイドDNA(sgDNA)-PAM配列に隣接している。好ましい実施態様では、外来DNAはCRISPR-C2c1切断の後に放出される。Zhang et al., Genome Biology201718:35; He et al., Nucleic Acids Research, 44: 9, 2016を参照のこと。
アッシャー症候群または網膜色素変性症39
実施態様によっては、アッシャー症候群または網膜色素変性症39の治療、予防、または診断が提供される。標的は、好ましくはUSH2A遺伝子である。実施態様によっては、2299位のG欠失(2299delG)の補正が提供される。このことはWO2015134812A1に記載されており、その開示内容は参照により本明細書に組み込まれる。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
自己免疫および炎症性障害
実施態様によっては、自己免疫および炎症性障害を治療する。これらとしては、たとえば多発性硬化症(MS)または関節リウマチ(RA)が挙げられる。
嚢胞性線維症(CF)
実施態様によっては、嚢胞性線維症の治療、予防、または診断が提供される。標的は、好ましくはSCNN1AまたはCFTR遺伝子である。このことはWO2015157070に記載されており、その開示内容は参照により本明細書に組み込まれる。
Schwankら(Cell 幹細胞, 13:653-58, 2013)は、CRISPR-Cas9を用いてヒト幹細胞の嚢胞性線維症に関連する欠陥を補正した。このチームの標的はイオンチャンネルに関する遺伝子である嚢胞性線維症膜貫通伝導受容体(CFTR)である。嚢胞性線維症患者のCFTRにおける欠失により、タンパク質がミスフォールドする(誤って折り畳まれる)。嚢胞性線維症を持つ2人の児童の細胞試料から発育させた培養腸幹細胞を用いて、Schwankらは挿入する修復配列を含むドナープラスミドと共にCRISPRを用いて欠陥を補正することができた。次に研究者らは細胞を腸「類器官」すなわちミニチュア腸に成長させ、それらが正常に機能することを示した。この場合、クローン類器官の約半分が適切な遺伝子補正を受けた。
実施態様によっては、たとえば嚢胞性線維症を治療する。したがって、肺への送達が好ましい。好ましくはF508変異 (Δ-F508、完全名はCFTRΔF508またはF508del-CFTR)を補正する。実施態様によっては、標的はABCC7、CF、またはMRP7であってもよい。
別の実施態様では、嚢胞性線維症を治療するためのCrispr-Cas関連方法および組成物に関する、Editas Medicineに譲渡された米国特許出願公開第20170022507号を本発明で開示されているCRISPR-Casシステムに合わせて変更してもよい。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
デュシェンヌ型筋ジストロフィー
デュシェンヌ型筋ジストロフィー(DMD)は、新生男児5000人に約1人が罹患している伴性劣性遺伝性の筋消耗疾患である。ジストロフィン遺伝子の変異により、通常はジストロフィンが筋線維の細胞骨格を基底膜に繋ぐよう機能する骨格筋にジストロフィンが存在しなくなる。これらの変異が原因でジストロフィンが存在しないと、細胞体に過剰なカルシウム流入が起こり、それによりミトコンドリアが破裂して細胞が破壊される。現在の治療はDMDの症状を和らげることに集中しており、平均余命は約26年である。
特定の型のDMDの治療としてのCRISPR/Cas9の有効性はマウスモデルで実証されてきた。1つのこのような研究では、変異エクソンを欠損させることによりマウスの筋ジストロフィー表現型を部分的に補正して機能性タンパク質を得た(Nelson et al. (2016) Science, Long et al. (2016) ScienceおよびTabebordbar et al. (2016) Scienceを参照のこと)。
実施態様によっては、Crisprに関連するDMD治療方法に関する、Editas Medicineに譲渡された特許公開公報WO2016161380の方法を本発明のCRISPR-Casシステムの応用に合わせて変更してもよい。実施態様によっては、DMDを治療する。実施態様によっては、送達は注入による筋肉への送達である。実施態様によっては、CRISPRタンパク質はC2c1であり、システムは、I. CRISPR-CasシステムRNAポリヌクレオチド配列{(a) 標的配列にハイブリダイズ可能なtracr RNAポリヌクレオチドおよびガイドRNAポリヌクレオチド、ならびに(b)直接反復RNAポリヌクレオチドを含む}と、II. 必要に応じて少なくとも1つ以上の核局在化配列を含む、C2c1をコードするポリヌクレオチド配列とを含む。ここで、直接反復配列はガイド配列にハイブリダイズし、標的配列へのCRISPR複合体の配列特異的結合を導く。CRISPR複合体は、(1)標的配列とハイブリダイズされる、またはハイブリダイズすることが可能なガイド配列および(2)直接反復配列と複合化されたCRISPRタンパク質を含み、CRISPRタンパク質をコードするポリヌクレオチド配列はDNAまたはRNAである。
特定の実施態様では、CRISPR-C2c1システムはTに富むPAMを認識する。特定の実施態様では、PAMは5’-TTN-3’または5’-ATTN-3’である。特定の実施態様では、目的の遺伝子座は、CRISPR-C2c1複合体によって、目的の遺伝子座を鋳型DNA配列の挿入または「組込み」によって改変する。特定の実施態様では、DNA挿入物は、適切な配向でゲノムに組み込まれるように設計される。Marescaら(Genome Res. 2013 Mar; 23(3): 539-546)は、亜鉛フィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)と共に用いることができる部位特異的な正確な挿入の方法について記載した。ここで、5'末端に突出を有する短い二本鎖DNAが相補性末端に連結され、それによってヒト細胞株で指定の遺伝子座に15kbの外来性発現カセットを正確に挿入することができる。Heら(Nucleic Acids Res. 2016 May 19; 44(9))は、CRISPR/Cas9で誘導してプロモーターなしの4.6kbのires-eGFP断片をGAPDH遺伝子座に部位特異的に組み込んだところ、NHEJ経路を介した最大20%のGFP陽性細胞が体細胞LO2細胞で得られ、1.70%のGFP陽性細胞がヒト胚性幹細胞で得られたと記載した。同文献はまた、NHEJに基づく組込みは調査したすべてのヒト細胞型において、HDRを介した遺伝子標的化よりも効率的であると報告した。C2c1は5'末端が突出したねじれ型切断を発生させるため、当業者は、本明細書に開示するCRISPR-C2c1システムを用いて目的の遺伝子座に外来DNAを挿入するためにMerescaらおよびHeらの文献に記載されているのと似た方法を用いることができる。
特定の実施態様では、目的の遺伝子座はまずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、PAM配列付近でCRISPR-C2c1システムによってさらに改変され、HDRによって修復される。特定の実施態様では、目的の遺伝子座は、変異、欠失、または外来DNA配列の挿入をHDRを介して導入することによってCRISPR-C2c1システムにより改変される。実施態様によっては、目的の遺伝子座は変異、欠失、または外来DNA配列の挿入をNHEJを介して導入することによってCRISPR-C2c1システムにより改変される。好ましい実施態様では、外来DNAは、3'末端と5'末端の両方で単一ガイドDNA(sgDNA)-PAM配列に隣接している。好ましい実施態様では、外来DNAはCRISPR-C2c1切断の後に放出される。
糖原病(1a型を含む)
糖原病1a型は酵素グルコース-6-ホスファターゼの欠乏によって起こる遺伝病である。欠乏によって肝臓がグリコーゲンおよび糖新生から遊離グルコースを産生する能力が損なわれる。実施態様によっては、グルコース-6-ホスファターゼ酵素をコードする遺伝子を標的化する。実施態様によっては、糖原病1a型を治療する。実施態様によっては、送達はC2c1 (タンパク質またはmRNA形態)をLNPなどの脂質粒子に内包することによる肝臓への送達である。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
実施態様によっては、1a型を含む糖原病を、たとえば状態/疾患/感染に関連するポリヌクレオチドを標的化することにより標的とし、好ましくは治療する。関連するポリヌクレオチドとしては、DNA(遺伝子を含み得る。遺伝子は任意のコード配列および制御要素、たとえばエンハンサーまたはプロモーターを含む)。実施態様によっては、関連するポリヌクレオチドとしては、SLC2A2、GLUT2、G6PC、G6PT、G6PT1、GAA、LAMP2、LAMPB、AGL、GDE、GBE1、GYS2、PYGL、またはPFKM遺伝子を挙げることができる。
ハーラー症候群
ハーラー症候群(ムコ多糖症I型(MPS I)、ハーラー病としても知られる)は、グリコサミノグリカン(以前はムコ多糖類としても知られていた)の蓄積につながる遺伝障害であり、リソソーム中のムコ多糖類の分解に関与する酵素であるα-L-イズロニダーゼの欠乏が原因で起こる。ハーラー症候群はリソソーム蓄積症として分類されることが多く、臨床的にはハンター症候群に関連する。ハンター症候群はX連鎖性であるが、ハーラー症候群は常染色体性劣性遺伝性である。MPS I は、症状の重症度に基づき3つの亜型に分けられる。3つの型はすべて、α-L-イズロニダーゼ酵素が存在しないまたはその量が不十分であることによって起こる。MPS I Hすなわちハーラー症候群はMPS I 亜型のうち最も重症である。他の2つの型は、MPS I Sすなわちシャイエ症候群とMPS I H-Sすなわちハーラー・シャイエ症候群である。MPS Iの親から生まれる子は欠陥のあるIDUA遺伝子(染色体4の4p16.3部位にマッピングされている)を持つ。この遺伝子は、そのイズロニダーゼ酵素タンパク質産物を理由にIDUAと命名されている。2001年時点で、IDUA遺伝子の52種類の様々な変異がハーラー症候群を引き起こすことがわかっている。レトロウイルス、レンチウイルス、AAV、さらには非ウイルス性ベクターを介したイズロニダーゼ遺伝子の送達により、MPS Iのマウス、イヌ、およびネコモデルの治療に成功している。
実施態様によっては、α-L-イズロニダーゼ遺伝子を標的化し、好ましくは修復鋳型が提供される。実施態様によっては、CRISPRタンパク質はC2c1であり、システムは、I. CRISPR-CasシステムRNAポリヌクレオチド配列{(a) 標的配列にハイブリダイズ可能なガイドRNAポリヌクレオチド、および (b)直接反復RNAポリヌクレオチドを含む}と、II. 必要に応じて少なくとも1つ以上の核局在化配列を含む、C2c1をコードするポリヌクレオチド配列とを含む。ここで、直接反復配列はガイド配列にハイブリダイズし、標的配列へのCRISPR複合体の配列特異的結合を導く。CRISPR複合体は、(1)標的配列とハイブリダイズされる、またはハイブリダイズすることが可能なガイド配列および(2)直接反復配列と複合化されたCRISPRタンパク質を含み、CRISPRタンパク質をコードするポリヌクレオチド配列はDNAまたはRNAである。特定の実施態様では、C2c1エフェクタータンパク質はTに富むPAMを認識する。特定の実施態様では、PAMは5’-TTN-3’または5’-ATTN-3’である。特定の実施態様では、MPS Iに関連する目的の遺伝子座は、5'末端が突出したねじれ型切断を起こすことによりCRISPR-C2c1複合体によって改変される。実施態様によっては、5'末端の突出は7ヌクレオチドである。実施態様によっては、ねじれ型切断の後にNHEJまたはHDRがある。特定の実施態様では、CRISPR-C2c1複合体によって、目的の遺伝子座を鋳型DNA配列の挿入または「組込み」によって改変する。特定の実施態様では、DNA挿入物は、適切な配向でゲノムに組み込まれるように設計される。Marescaら(Genome Res. 2013 Mar; 23(3): 539-546)は、亜鉛フィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)と共に用いることができる部位特異的な正確な挿入の方法について記載した。ここで、5'末端に突出を有する短い二本鎖DNAが相補性末端に連結され、それによってヒト細胞株で指定の遺伝子座に15kbの外来性発現カセットを正確に挿入することができる。Heら(Nucleic Acids Res. 2016 May 19; 44(9))は、CRISPR/Cas9で誘導してプロモーターなしの4.6kbのires-eGFP断片をGAPDH遺伝子座に部位特異的に組み込んだところ、NHEJ経路を介した最大20%のGFP陽性細胞が体細胞LO2細胞で得られ、1.70%のGFP陽性細胞がヒト胚性幹細胞で得られたと記載した。同文献はまた、NHEJに基づく組込みは調査したすべてのヒト細胞型において、HDRを介した遺伝子標的化よりも効率的であると報告した。C2c1は5'末端が突出したねじれ型切断を発生させるため、当業者は、本明細書に開示するCRISPR-C2c1システムを用いて目的の遺伝子座に外来DNAを挿入するためにMerescaらおよびHeらの文献に記載されているのと似た方法を用いることができる。
特定の実施態様では、目的の遺伝子座はまずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、PAM配列付近でCRISPR-C2c1システムによってさらに改変され、HDRによって修復される。特定の実施態様では、目的の遺伝子座は、変異、欠失、または外来DNA配列の挿入をHDRを介して導入することによってCRISPR-C2c1システムにより改変される。実施態様によっては、目的の遺伝子座は変異、欠失、または外来DNA配列の挿入をNHEJを介して導入することによってCRISPR-C2c1システムにより改変される。好ましい実施態様では、外来DNAは、3'末端と5'末端の両方で単一ガイドDNA(sgDNA)-PAM配列に隣接している。好ましい実施態様では、外来DNAはCRISPR-C2c1切断の後に放出される。
HIVおよびAIDS
実施態様によっては、HIVおよびAIDSの治療、予防、または診断が提供される。標的は好ましくはHIVのCCR5遺伝子である。このことはWO2015148670A1に記載されており、その開示内容は参照により本明細書に組み込まれる。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
β地中海貧血症および鎌状赤血球症 (SCD)
実施態様によっては、β地中海貧血症の治療、予防、または診断が提供される。標的は好ましくはBCL11A遺伝子である。このことはWO2015148860に記載されており、その開示内容は参照により本明細書に組み込まれる。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
実施態様によっては、鎌状赤血球症(SCD)の治療、予防、または診断が提供される。標的は好ましくはHBBまたはBCL11A遺伝子である。このことはWO2015148863に記載されており、その開示内容は参照により本明細書に組み込まれる。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。特定の実施態様では、CRISPR-C2c1複合体によって、目的の遺伝子座を鋳型DNA配列の挿入すなわち「組込み」によって改変する。特定の実施態様では、DNA挿入物は、適切な配向でゲノムに組み込まれるように設計される。好ましい実施態様では、目的の遺伝子座は相同性指向修復(HDR)機構を介したゲノム編集が特に難しい非分裂細胞でCRISPR-C2c1システムによって改変される (Chan et al., Nucleic acids research. 2011;39:5955-5966)。Marescaら(Genome Res. 2013 Mar; 23(3): 539-546)は、亜鉛フィンガーヌクレアーゼ(ZFN)およびTaleヌクレアーゼ(TALEN)と共に用いることができる部位特異的な正確な挿入の方法について記載した。ここで、5'末端に突出を有する短い二本鎖DNAが相補性末端に連結され、それによってヒト細胞株で指定の遺伝子座に15kbの外来性発現カセットを正確に挿入することができる。Heら(Nucleic Acids Res. 2016 May 19; 44(9))は、CRISPR/Cas9で誘導してプロモーターなしの4.6kbのires-eGFP断片をGAPDH遺伝子座に部位特異的に組み込んだところ、NHEJ経路を介した最大20%のGFP陽性細胞が体細胞LO2細胞で得られ、1.70%のGFP陽性細胞がヒト胚性幹細胞で得られたと記載した。同文献はまた、NHEJに基づく組込みは調査したすべてのヒト細胞型において、HDRを介した遺伝子標的化よりも効率的であると報告した。C2c1は5'末端が突出したねじれ型切断を発生させるため、当業者は、本明細書に開示するCRISPR-C2c1システムを用いて目的の遺伝子座に外来DNAを挿入するためにMerescaらおよびHeらの文献に記載されているのと似た方法を用いることができる。
特定の実施態様では、目的の遺伝子座はまずPAM配列の遠位端でCRISPR-C2c1システムによって改変され、PAM配列付近でCRISPR-C2c1システムによってさらに改変され、HDRによって修復される。特定の実施態様では、目的の遺伝子座は、変異、欠失、または外来DNA配列の挿入をHDRを介して導入することによってCRISPR-C2c1システムにより改変される。実施態様によっては、目的の遺伝子座は変異、欠失、または外来DNA配列の挿入をNHEJを介して導入することによってCRISPR-C2c1システムにより改変される。好ましい実施態様では、外来DNAは、3'末端と5'末端の両方で単一ガイドDNA (sgDNA)-PAM配列に隣接している。好ましい実施態様では、外来DNAはCRISPR-C2c1切断の後に放出される。
単純ヘルペスウイルス1および2
ヘルペスウイルスは、75~200個の遺伝子を持つ直鎖二本鎖DNAゲノムで構成されるウイルスのファミリーである。遺伝子編集の目的のため、最も一般的に研究されているファミリーメンバーは単純ヘルペスウイルス1 (HSV-1)であり、これは他のウイルスベクターに対して多くの明らかな利点のあるウイルスである(Vannuciらの文献(2003年)で概説されている)。したがって、実施態様によっては、ウイルスベクターはHSVウイルスベクターである。実施態様によっては、HSVウイルスベクターはHSV-1である。
HSV-1は、約152 kbの二本鎖DNAの大きなゲノムを持つ。このゲノムは80を超える遺伝子で構成されており、その多くを置換または削除することができるため、30~150 kbの遺伝子挿入が可能である。HSV-1由来のウイルスベクターは一般に3つの群、すなわち複製能のある弱毒化ベクター、複製能のない組換えベクター、およびアンプリコンとして知られる欠陥のあるヘルパー依存性ベクターに分けられる。HSV-1をベクターとして使用する遺伝子導入は、たとえば神経障害性疼痛(たとえばWolfe et al. (2009) Gene Ther)および関節リウマチ(たとえばBurton et al. (2001) Stem Cell s)の治療について以前に実証されている。
したがって、実施態様によっては、ウイルスベクターはHSVベクターである。実施態様によっては、HSVウイルスベクターはHSV-1である。実施態様によっては、ベクターを1つ以上のCRISPR成分の送達に用いる。それは、C2c1および1つ以上のガイドRNA、たとえば2つ以上、3つ以上、または4つ以上のガイドRNAの送達に特に有用な可能性がある。したがって、実施態様によっては、ベクターは多重システムにおいて有用である。実施態様によっては、この送達は神経障害性疼痛または関節リウマチの治療のためである。
実施態様によっては、HSV-1 (単純ヘルペスウイルス1)の治療、予防、または診断が提供される。標的は好ましくはHSV-1のUL19、UL30、UL48、またはUL50遺伝子である。このことはWO2015153789に記載されており、その開示内容は参照により本明細書に組み込まれる。
他の実施態様では、HSV-2 (単純ヘルペスウイルス2)の治療、予防、または診断が提供される。標的は好ましくはHSV-2のUL19、UL30、UL48、またはUL50遺伝子である。このことはWO2015153791に記載されており、その開示内容は参照により本明細書に組み込まれる。
実施態様によっては、原発開放隅角緑内障(POAG)の治療、予防、または診断が提供される。標的は好ましくはMYOC遺伝子である。このことはWO2015153780に記載されており、その開示内容は参照により本明細書に組み込まれる。本発明を上記の方法と共に応用してもよい。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAM配列は5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
養子細胞療法
本発明は、本明細書に記載のCRISPR-Casシステム(たとえばC2c1エフェクタータンパク質システム)を用いて養子細胞療法用の細胞を改変することも意図している。
本明細書で用いる「ACT」、「養子細胞療法」、および「養子細胞移入」は、互換可能に用いられる場合がある。特定の実施態様では、養子細胞療法(ACT)は、機能および特性を細胞の移植によって新たな宿主に移行することを目的として患者に細胞を移入することを指す可能性がある(たとえばMettananda et al., Editing an α-globin enhancer in primary human hematopoietic stem cells as a treatment for β-thalassemia (β地中海貧血症の治療としての初代ヒト造血幹細胞のα-グロビンエンハンサーの編集), Nat Commun. 2017 Sep 4;8(1):424を参照のこと)。本明細書で用いる場合、「移植する」または「移植」という用語は、目的の組織にその組織の既存の細胞と接触させることによりin vivoで細胞を組み込む過程を指す。養子細胞療法(ACT)は、細胞(最も一般的には免疫由来細胞)を、免疫機能および特性を新たな宿主に移行することを目的として同じ患者に再移入する、または新たな受容宿主に移入することを指す可能性がある。可能であれば、自家細胞の使用が移植片対宿主病(GVHD)問題を最小限に抑えることでレシピエントの役に立つ。自家の腫瘍浸潤リンパ球(TIL)の養子移入(Besser et al., (2010) Clin. Cancer Res 16 (9) 2646-55、Dudley et al., (2002) Science 298 (5594): 850-4、およびDudley et al., (2005) Journal of Clinical Oncology 23 (10): 2346-57.)または遺伝的に再指示された末梢血単核球(Johnson et al., (2009) Blood 114 (3): 535-46、およびMorgan et al., (2006) Science 314(5796) 126-9)を用いて進行固形腫瘍(黒色腫および大腸がんなど)の患者、ならびにCD19発現性血液悪性腫瘍の患者の治療に成功している(Kalos et al., (2011) Science Translational Medicine 3 (95): 95ra73)。特定の実施態様では、同種免疫細胞を移入する(たとえばRen et al., (2017) Clin Cancer Res 23 (9) 2255-2266を参照のこと)。さらに本明細書に記載のとおり、同種細胞を編集して同種反応性を低減し、移植片対宿主病を予防することができる。したがって、同種細胞の使用により、診断後に患者由来の自家細胞を調製するのとは対照的に、健常なドナーから細胞を入手して患者に使用するために調製することができる。
実施態様によっては、本明細書に記載の発明は、CRISPRを用いてT細胞を少なくとも1つの遺伝子を調節するようにex vivoで編集し、その後にそれを必要とする患者に投与する、養子免疫治療の方法に関する。実施態様によっては、CRISPR編集は編集済みT細胞において少なくとも1つの標的遺伝子を欠損させる、または発現抑制することを含む。実施態様によっては、標的遺伝子の調節に加え、(1)キメラ抗原受容体(CAR)もしくはT細胞受容体(TCR)をコードする外来性遺伝子を組み込む、(2)免疫チェックポイント受容体を欠損させる、もしくは発現抑制する、(3)内在性TCRを欠損させる、もしくは発現抑制する、(4)ヒト白血球抗原クラスI (HLA-I)タンパク質を欠損させる、もしくは発現抑制する、かつ/または(5)外来性CARもしくはTCRが標的とする抗原をコードする内在性遺伝子を欠損させる、もしくは発現抑制するようにもT細胞をex vivoでCRISPRで編集する。
実施態様によっては、T細胞をex vivoで、CRISPRエフェクタータンパク質と、標的配列とハイブリダイズ可能なガイド配列、tracrメイト配列、およびtracrメイト配列とハイブリダイズ可能なtracr配列を含むガイド分子とをコードするアデノ関連ウイルス(AAV)ベクターと接触させる。実施態様によっては、T細胞をex vivoで(たとえばエレクトロポレーションで)、ガイド分子と複合化したCRISPRエフェクタータンパク質を含むリボヌクレオタンパク質(RNP)と接触させる。ここで、ガイド分子は、標的配列とハイブリダイズ可能なガイド配列、tracrメイト配列、およびtracrメイト配列とハイブリダイズ可能なtracr配列を含む。Rupp et al., Scientific Reports 7:737 (2017)、Liu et al., Cell Research 27:154-157 (2017)を参照のこと。実施態様によっては、T細胞をex vivoで(たとえばエレクトロポレーションで)、CRISPRエフェクタータンパク質と、標的配列とハイブリダイズ可能なガイド配列、tracrメイト配列、およびtracrメイト配列とハイブリダイズ可能なtracr配列を含むガイド分子とをコードするmRNAと接触させる。Eyquem et al., Nature 543:113-117 (2017)を参照のこと。実施態様によっては、T細胞はレンチウイルスまたはレトロウイルスベクターとはex vivoで接触されない。
実施態様によっては、この方法は、T細胞をCARをコードする外来性遺伝子を組み込むようにCRISPRによりex vivoで編集することを含み、それにより、編集T細胞は細胞表面に位置する特異的タンパク質に基づいてがん細胞を認識することができる。実施態様によっては、T細胞をTCRをコードする外来性遺伝子を組み込むようにCRISPRによりex vivoで編集し、それにより、編集T細胞はがん細胞の表面または内部に由来するタンパク質を認識することができる。実施態様によっては、方法はCARまたはTCRをコードする外来配列を、CRISPRガイド配列によって標的化されたゲノム遺伝子座に相同性指向修復(HDR)により組み込むことができるドナー配列として提供することを含む。実施態様によっては、外来性CARまたはTCRを内在性のTCRのα定常(TRAC)遺伝子座に向けることにより持続性のCARシグナルを低減し、抗原に1回または反復的に曝露された後のCARの効果的な内在化および再発現を促し、それによってエフェクターT細胞の分化および消耗を遅らせることができる。Eyquem et al., Nature 543:113-117 (2017)を参照のこと。
実施態様によっては、この方法は、T細胞を1種以上の免疫チェックポイント受容体を阻害してがん細胞による免疫抑制を低減するようにCRISPRによりex vivoで編集することを含む。実施態様によっては、T細胞を、プログラム細胞死1 (PD-1)シグナル経路に関与する内在性遺伝子(PD-1およびPD-L1など)を欠損させる、または発現抑制するようにCRISPRによりex vivoで編集する。実施態様によっては、T細胞をPdcd1遺伝子座またはCD274遺伝子座を変異させるようにCRISPRによりex vivoで編集する。実施態様によっては、PD-1の第1エクソンを標的化する1つ以上のガイド配列を用いてT細胞をCRISPRによりex vivoで編集する。Rupp et al., Scientific Reports 7:737 (2017); Liu et al., Cell Research 27:154-157 (2017)を参照のこと。
実施態様によっては、この方法は、T細胞を、可能性のある同種反応性TCRを排除して同種養子移入ができるようにCRISPRによりex vivoで編集することを含む。実施態様によっては、T細胞をTCR (たとえばαβ TCR)をコードする内在性遺伝子を欠損させる、または発現抑制して移植片対宿主病(GVHD)を回避するようにCRISPRによりex vivoで編集する。実施態様によっては、T細胞をTRAC遺伝子座を変異させるようにCRISPRによりex vivoで編集する。実施態様によっては、TRACの第1エクソンを標的化する1つ以上のガイド配列を用いてT細胞をCRISPRによりex vivoで編集する。Liu et al., Cell Research 27:154-157 (2017)を参照のこと。実施態様によっては、この方法は、内在性TCRを同時に(たとえばCAR cDNAに続く自己切断P2Aペプチドをコードするドナー配列を用いて)欠損させながらCARまたはTCRをコードする外来性遺伝子をTRAC遺伝子座に組み込むためにCRISPRを用いることを含む。Eyquem et al., Nature 543:113-117 (2017)を参照のこと。実施態様によっては、外来性遺伝子は、内在性TCRプロモーターの下流に作動可能に挿入される、プロモーターなしのCARコード配列またはTCRコード配列である。
実施態様によっては、この方法は、T細胞を、HLA-Iタンパク質をコードする内在性遺伝子を欠損させる、または発現抑制して編集T細胞の免疫原性を最小限に抑えるようにCRISPRによりex vivoで編集することを含む。実施態様によっては、T細胞をβ2-ミクログロブリン(B2M)遺伝子座を変異させるようにCRISPRによりex vivoで編集する。実施態様によっては、B2Mの第1エクソンを標的化する1つ以上のガイド配列を用いてT細胞をCRISPRによりex vivoで編集する。Liu et al., Cell Research 27:154-157 (2017)を参照のこと。実施態様によっては、方法は、内在性TCRを同時に(たとえばCAR cDNAに続く自己切断P2Aペプチドをコードするドナー配列を用いて)欠損させながらCARまたはTCRをコードする外来性遺伝子をB2M遺伝子座に組み込むためにCRISPRを用いることを含む。Eyquem et al., Nature 543:113-117 (2017)を参照のこと。実施態様によっては、外来性遺伝子は、内在性B2Mプロモーターの下流に作動可能に挿入される、プロモーターなしのCARコード配列またはTCRコード配列である。
実施態様によっては、この方法は、T細胞を、外来性CARもしくはTCRが標的とする抗原をコードする内在性遺伝子を欠損させる、もしくは発現抑制するようにCRISPRによりex vivoで編集することを含む。実施態様によっては、T細胞を、ヒトテロメラーゼ逆転写酵素(hTERT)、サバイビン、マウス二重微小染色体2相同体(MDM2)、チトクロムP450 1B 1 (CYP1B)、HER2/neu、ウィルムス腫瘍遺伝子1 (WT1)、リビン、αフェトタンパク質(AFP)、がん胎児抗原(CEA)、ムチン16 (MUC16)、MUC1、前立腺特異的膜抗原(PSMA)、p53またはサイクリン(DI) (WO2016/011210を参照のこと)から選択される腫瘍抗原を欠損させる、または発現抑制するようにCRISPRによりex vivoで編集する。実施態様によっては、T細胞を、B細胞成熟抗原(BCMA)、膜貫通活性化因子およびCAML相互作用因子(TACI)、またはB細胞活性化因子受容体(BAFF-R)、CD38、CD138、CS-1、CD33、CD26、CD30、CD53、CD92、CD100、CD148、CD150、CD200、CD261、CD262、またはCD362 (WO2017/011804を参照のこと)から選択される抗原を欠損させる、または発現抑制するようにCRISPRによりex vivoで編集する。
したがって、本発明の側面は免疫系細胞(選択された抗原に特異的なT細胞、たとえば腫瘍関連抗原など)の養子移入を含む(Maus et al., 2014, Adoptive Immunotherapy for Cancer or Viruses (がんまたはウイルスに対する養子免疫療法), Annual Review of Immunology, Vol. 32: 189-225、RosenbergおよびRestifo, 2015, Adoptive cell transfer as personalized immunotherapy for human cancer (ヒトのがんに対する個別化免疫療法としての養子細胞移入), Science Vol. 348 no. 6230 pp. 62-68、Restifo et al., 2015, Adoptive immunotherapy for cancer: harnessing the T cell response (がんに対する養子免疫療法:T細胞応答の利用). Nat. Rev. Immunol. 12(4): 269-281、ならびにJensonおよびRiddell, 2014, Design and implementation of adoptive therapy with chimeric antigen receptor-modified T cells (キメラ抗原受容体改変T細胞を用いた養子両方の設計および実行). Immunol Rev. 257(1): 127-144を参照のこと)。たとえば、様々な方策を用いて、たとえば選択されたペプチド特異性を持つ新たなTCRのαおよびβ鎖を導入することでT細胞受容体(TCR)の特異性を変更することにより、T細胞を遺伝子改変してもよい(米国特許第8,697,854号、PCT特許出願公開WO2003020763、WO2004033685、WO2004044004、WO2005114215、WO2006000830、WO2008038002、WO2008039818、WO2004074322、WO2005113595、WO2006125962、WO2013166321、WO2013039889、WO2014018863、WO2014083173、米国特許第8,088,379号を参照のこと)。
TCR改変の代わりに、またはそれに加えて、選択された標的(悪性細胞など)に特異的な免疫応答細胞、たとえばT細胞を作成するためにキメラ抗原受容体(CARs)を用いてもよく、広範な受容体キメラ構築物が記載されている(米国特許第5,843,728号、第5,851,828号、第5,912,170号、第6,004,811号、第6,284,240号、第6,392,013; 6,410,014号、第6,753,162号、第8,211,422号、およびPCT公開公報WO9215322を参照のこと)。B細胞のCD19などの白血病抗原に対するキメラ抗原受容体(CAR)を発現するよう設計された自家T細胞が再発または難治性B細胞悪性腫瘍の治療に有望な結果を示してきた。しかし、特に高度な前治療を受けた小集団のがん患者は、増殖の失敗によりこの高活性治療を受けることができない可能性がある。さらに、幼児のがん患者に有効な治療薬品を製造することは、血液量が少ないことから依然として困難である。一方、個別化された自家T細胞製造および広く「普及した」手法を含む自家CAR-T細胞療法に固有の特徴により、自家CAR-T細胞療法の産業化は困難である。1人以上の健康な無関係のドナーに由来するが移植片対宿主病(GVHD)を起こさず免疫原性を最小限に抑えることができる普遍的なCD19特異的CAR-T細胞(UCART019)は、間違いなく上記の問題に対処するための代替的な選択肢である。代替的なCAR構築物を連続した世代に属するとして特徴付けてもよい。第一世代のCARは、典型的には抗原に特異的な抗体の一本鎖可変断片(たとえば、特異的抗体のVHに連結したVLを含む)を可動性リンカー(たとえばCD8αヒンジドメインおよびCD8α膜貫通ドメイン)でCD3ζまたはFcRγの膜貫通および細胞内シグナルドメインに連結したものからなる(scFv-CD3ζまたはscFv-FcRγ; 米国特許第7,741,465号、米国特許第5,912,172号、米国特許第5,906,936号を参照のこと)。第二世代のCARは、1つ以上の共刺激分子、たとえばCD28、OX40 (CD134)、または4-1BB (CD137)の細胞内ドメインを内部ドメインに組み込んでいる(たとえばscFv-CD28 / OX40/4-1BB-CD3ζ;米国特許第8,911,993号、第8,916,381号、第8,975,071号、第9,101,584号、第9,102,760号、第9,102,761号を参照のこと)。第三世代のCARは、共刺激性内部ドメイン、たとえばCD3ζ鎖、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、またはCD28シグナル伝達ドメインの組合せを含む(たとえばscFv-CD28-4-1BB-CD3ζまたはscFv-CD28-OX40-CD3ζ;米国特許第8,906,682号、米国特許第8,399,645号、米国特許第5,686,281号、PCT公開公報WO2014134165、PCT公開公報WO2012079000を参照のこと)。あるいは、たとえば専門の抗原提示細胞上の抗原が天然のαβTCRに結合すると活性化し増殖するように選択された抗原特異的T細胞でCARを発現させることにより、付随する共刺激によって共刺激を調整してもよい。また、T細胞攻撃の標的化を改善し、かつ/または副作用を最小限に抑えるために、さらなる操作された受容体を免疫応答細胞に提供してもよい。Hanら(clinicaltrials, A Study Evaluating UCART019 in Patients with Relapsed or Refactory CD19+ Lukemia and Lymphoma (臨床試験、再発または難治性CD19+リンパ腫患者におけるUCART019を評価する試験)は、CARのレンチウイルスによる送達とCRISPR RNAエレクトロポレーションによる内在性TCRおよびB2M遺伝子の同時破壊とを組み合わせることにより、遺伝子破壊された同種CD19指向BBζ CAR-T細胞(UCART019と命名する)を生成しており、それが宿主による免疫を避け、GVHDを起こさずに抗白血病効果を提供することができるかどうかを試験する予定である。
別の技術、たとえば原形質融合、リポフェクション、形質移入またはエレクトロポレーションなどを用いて標的免疫応答細胞を形質転換してもよい。広範なベクター、たとえばレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、プラスミドまたはトランスポゾン(Sleeping Beautyトランスポゾンなど) (米国特許第6,489,458号、第7,148,203号、第7,160,682号、第7,985,739号、第8,227,432号を参照のこと)を用い、たとえばCD3ζとCD28またはCD137とによってシグナル伝達する第二世代の抗原特異的CARを用いて、CARを導入してもよい。ウイルスベクターとしては、たとえばHIV、SV40、EBV、HSVまたはBPVに基づくベクターを挙げることができる。
形質転換の対象となる細胞としては、たとえば、T細胞、ナチュラルキラー(NK)細胞、細胞傷害性Tリンパ球(CTL)、制御性T細胞、ヒト胚性幹細胞、腫瘍浸潤リンパ球(TIL)、またはリンパ球に分化し得る多能性幹細胞を挙げることができる。所望のCARを発現するT細胞を、たとえばγ線照射した活性化増殖細胞(AaPC)との共培養(がん抗原と共刺激分子とを共培養する)により選択してもよい。操作したCAR T細胞を、たとえば可溶性因子(IL-2およびIL-21など)の存在下でAaPC上で共培養して増殖させてもよい。この増殖を、たとえばメモリーCAR陽性T細胞(たとえば酵素を用いないデジタルアレイ(non-enzymatic digital array)および/または多重パネル流動細胞計測(multi-panel flow cytometry)により評価してもよい)が得られるように実行してもよい。このように、抗原を持つ腫瘍に対する特異的細胞傷害活性を(必要に応じて、インターフェロンγなどの所望のケモカインの産生と共に)持つCAR T細胞を提供してもよい。この種類のCAR T細胞をたとえば動物モデルに用いて、たとえば腫瘍異種移植片を治療してもよい。
一般に、CARは細胞外ドメイン、膜貫通ドメイン、および細胞内ドメインで構成され、細胞外ドメインは所定の標的に特異的な抗原結合ドメインを含む。CARの抗原結合ドメインは抗体または抗体断片(たとえば一本鎖可変断片scFv)である場合が多いが、結合ドメインは標的を特異的に認識するものであれば特に限定されない。たとえば、実施態様によっては、CARが受容体のリガンドに結合することができるよう、抗原結合ドメインは受容体を含んでもよい。あるいは、CARがリガンドの内在性受容体に結合することができるよう、抗原結合ドメインはリガンドを含んでもよい。
CARの抗原結合ドメインは一般に、ヒンジまたはスペーサーによって膜貫通ドメインから分離されている。スペーサーも特に限定されず、CARを可動性にするように設計される。たとえば、スペーサードメインは、ヒトFcドメインの一部(CH3ドメインの一部など)または任意の免疫グロブリン(IgA、IgD、IgE、IgG、もしくはIgM、またはその多様体)のヒンジ領域を含んでもよい。さらに、FcRまたは可能性のある他の干渉物による非特異的結合を防ぐようヒンジ領域を改変してもよい。たとえば、FcRへの結合を減らすために、ヒンジはS228P、L235E、および/またはN297Q(カバット式番号付けによる)変異を伴う、または伴わないIgG4 Fcドメインを含んでもよい。さらなるスペーサー/ヒンジとしては、CD4、CD8、およびCD28ヒンジ領域が挙げられるが、これらに限定されない。
CARの膜貫通ドメインは、天然源または合成源のいずれに由来してもよい。由来源が天然である場合、ドメインは任意の膜結合または膜貫通タンパク質に由来してもよい。本開示の特定の用途の膜貫通領域は、CD8、CD28、CD3、CD45、CD4、CD5、CDS、CD9、CD16、CD22、CD33、CD37、CD64、CD80、CD86、CD134、CD137、CD154、TCRに由来してもよい。あるいは、膜貫通ドメインは合成であってもよく、その場合、ロイシンおよびバリンなどの疎水性残基を主に含む。好ましくは、フェニルアラニン、トリプトファン、およびバリンの三残基が合成膜貫通ドメインの両端に見られる。必要に応じて、短いオリゴペプチドまたはポリペプチドリンカー(好ましくは2~10アミノ酸長)がCARの膜貫通ドメインと細胞質シグナル伝達ドメインとの連結を構成してもよい。グリシン-セリンの二残基は特に適切なリンカーとなる。
代替的なCAR構築物を連続した世代に属するとして特徴付けてもよい。第一世代のCARは、典型的には抗原に特異的な抗体の一本鎖可変断片(たとえば、特異的抗体のVHに連結したVLを含む)を可動性リンカー(たとえばCD8αヒンジドメインおよびCD8α膜貫通ドメイン)でCD3ζまたはFcRγの膜貫通および細胞内シグナルドメインに連結したものからなる(scFv-CD3ζまたはscFv-FcRγ; 米国特許第7,741,465号、米国特許第5,912,172号、米国特許第5,906,936号を参照のこと)。第二世代のCARは、1つ以上の共刺激分子、たとえばCD28、OX40 (CD134)、または4-1BB (CD137)の細胞内ドメインを内部ドメインに組み込んでいる(たとえばscFv-CD28/OX40/4-1BB-CD3ζ;米国特許第8,911,993号、第8,916,381号、第8,975,071号、第9,101,584号、第9,102,760号、第9,102,761号を参照のこと)。第三世代のCARは、共刺激性内部ドメイン、たとえばCD3ζ鎖、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、CD2、CD7、LIGHT、LFA-1、NKG2C、B7-H3、CD30、CD40、PD-1、またはCD28シグナル伝達ドメインの組合せを含む(たとえばscFv-CD28-4-1BB-CD3ζまたはscFv-CD28-OX40-CD3ζ;米国特許第8,906,682号、米国特許第8,399,645号、米国特許第5,686,281号、PCT公開公報WO2014134165、PCT公開公報WO2012079000を参照のこと)。特定の実施態様では、一次シグナル伝達ドメインは、CD3ζ、CD3γ、CD3Δ、CD3ε、共通FcRγ (FCERIG)、FcRβ(FcεR1b)、CD79a、CD79b、Fcγ RIIa、DAP10、およびDAP12からなる群より選択されるタンパク質の機能性シグナル伝達ドメインを含む。特定の好ましい実施態様では、一次シグナル伝達ドメインはCD3ζまたはFcRγの機能性シグナル伝達ドメインを含む。特定の実施態様では、1つ以上の共刺激シグナル伝達ドメインは、CD27、CD28、4-1BB (CD137)、OX40、CD30、CD40、PD-1、ICOS、リンパ球機能関連抗原1 (LFA-1)、CD2、CD7、LIGHT、NKG2C、B7-H3、CD83に特異的に結合するリガンド、CDS、ICAM-1、GITR、BAFFR、HVEM (LIGHTR)、SLAMF7、NKp80 (KLRF1)、CD160、CD19、CD4、CD8α、CD8β、IL2Rβ、IL2Rγ、IL7Rα、ITGA4、VLA1、CD49a、ITGA4、IA4、CD49D、ITGA6、VLA-6、CD49f、ITGAD、CD11d、ITGAE、CD103、ITGAL、CD11a、LFA-1、ITGAM、CD11b、ITGAX、CD11c、ITGB1、CD29、ITGB2、CD18、ITGB7、TNFR2、TRANCE/RANKL、DNAM1 (CD226)、SLAMF4 (CD244、2B4)、CD84、CD96 (触覚)、CEACAM1、CRTAM、Ly9 (CD229)、CD160 (BY55)、PSGL1、CD100 (SEMA4D)、CD69、SLAMF6 (NTB-A、Lyl08)、SLAM (SLAMF1、CD150、IPO-3)、BLAME (SLAMF8)、SELPLG (CD162)、LTBR、LAT、GADS、SLP-76、PAG/Cbp、NKp44、NKp30、NKp46、およびNKG2Dからなる群よりそれぞれ独立に選択されるタンパク質の機能性シグナル伝達ドメインを含む。特定の実施態様では、1つ以上の共刺激シグナル伝達ドメインは、4-1BB、CD27、およびCD28からなる群よりそれぞれ独立に選択されるタンパク質の機能性シグナル伝達ドメインを含む。特定の実施態様では、キメラ抗原受容体は米国特許第7,446,190号に記載のCD3ζ鎖の細胞内ドメイン (US 7,446,190の配列番号14に示されているヒトCD3ζのアミノ酸残基52~163など)と、CD28のシグナル伝達領域と、抗原結合要素(または部分もしくはドメイン;scFvなど)を含む設計を持っていてもよい。CD28部分は、ζ鎖部分と抗原結合要素との間にある場合、CD28の膜貫通およびシグナル伝達ドメイン(US 7,446,190の配列番号6に全長配列が示されている、配列番号10のアミノ酸残基114~220など;これらは、Genbank識別番号NM_006139に示されているCD28(配列の型1、2、または3)のうち以下の部分を含む可能性がある: IEVMYPPPYLDNEKSNGTIIHVKGKHLCPSPLFPGPSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS)を適切に含んでいてもよい(配列番号478)。あるいは、ζ鎖配列がCD28配列と抗原結合要素との間に存在する場合、CD28の細胞内ドメインを単独で用いることができる(US 7,446,190の配列番号9に示されているアミノ酸配列など)。したがって、特定の実施態様では、(a)ヒトCD3ζ鎖の細胞内ドメインを含むζ鎖部分と、(b)共刺激性シグナル伝達領域と、(c)抗原結合要素(または部分もしくはドメイン)とを含むCARを採用し、共刺激性シグナル伝達領域はUS 7,446,190の配列番号6によってコードされるアミノ酸配列を含む。
あるいは、たとえば専門の抗原提示細胞上の抗原が天然のαβTCRに結合すると活性化し増殖するように選択された抗原特異的T細胞でCARを発現させることにより、付随する共刺激によって共刺激を調整してもよい。また、T細胞攻撃の標的化を改善し、かつ/または副作用を最小限に抑えるために、さらなる操作された受容体を免疫応答細胞に提供してもよい。
たとえば、限定目的ではないが、Kochenderfer et al., (2009) J Immunother. 32 (7): 689-702は抗CD19キメラ抗原受容体(CAR)について記載した。FMC63-28Z CARは、FMC63マウスハイブリドーマ(Nicholson et al., (1997) Molecular Immunology 34: 1157-1165に記載)に由来のCD19を認識する一本鎖可変領域部分(scFv)と、ヒトCD28分子の部分と、ヒトTCR-ζ分子の細胞内成分とを含んでいた。FMC63-CD828BBZ CARは、FMC63 scFvと、CD8分子のヒンジおよび膜貫通領域と、CD28および4-1BBの細胞質部分と、TCR-ζ分子の細胞質成分とを含んでいた。FMC63-28Z CARに含まれるCD28分子の正確な配列は、Genbank識別番号NM_006139に対応しており、その配列は、アミノ酸配列IEVMYPPPYで始まりタンパク質のカルボキシ末端までずっと続くすべてのアミノ酸を含んでいた。ベクターの抗CD19 scFv成分をコードするために、著者らは過去に公開されたCARの一部に基づくDNA配列を設計した(Cooper et al., (2003) Blood 101: 1637-1644)。この配列は、5’末端から3’末端までインフレーム(翻訳領域内)に以下の成分:XhoI部位、ヒト顆粒球-マクロファージコロニー刺激因子(GM-CSF)受容体α鎖シグナル配列、FMC63軽鎖可変領域(Nicholsonらの上記文献と同様)、リンカーペプチド(Cooperらの上記文献と同様)、FMC63重鎖可変領域(Nicholsonらの上記文献と同様)、およびNotI部位をコードした。この配列をコードするプラスミドをXhoIおよびNotIで消化した。MSGV-FMC63-28Zレトロウイルスベクターを形成するために、FMC63 scFvをコードするXhoIおよびNotI消化断片を、MSGVレトロウイルス骨格をコードする第2のXhoIおよびNotI消化断片中に連結し(Hughes et al., (2005) Human Gene Therapy 16: 457-472と同様)、さらにはヒトCD28の細胞外部分の一部、ヒトCD28の膜貫通および細胞質部分全体、およびヒトTCR-ζ分子の細胞質部分(Maher et al., 2002, Nature Biotechnology 20: 70-75と同様)と連結した。FMC63-28Z CARは、特に悪性度の高い再発/難治性B細胞性非ホジキンリンパ腫(NHL)のためにKite Pharma, Inc.が開発中のKTE-C19 (アキシカブタゲンシロロイセル)抗CD19 CAR-T治療薬品に含まれていた。したがって、特定の実施態様では、養子細胞療法用の細胞、より詳細には免疫応答細胞(T細胞など)は、Kochenderferらの文献(上記)に記載のFMC63-28Z CARを発現してもよい。したがって、特定の実施態様では、養子細胞療法用の細胞、より詳細には免疫応答細胞(T細胞など)は、抗原に特異的に結合する細胞外抗原結合要素(または部分もしくはドメイン;scFvなど)と、CD3ζ鎖の細胞内ドメインを含む細胞内シグナル伝達ドメインと、CD28のシグナル伝達ドメインを含む共刺激性シグナル伝達ドメインとを含むCARを含んでもよい。好ましくは、CD28アミノ酸配列は、Genbank識別番号NM_006139 (配列の型1、2、または3)に示されている、アミノ酸配列IEVMYPPPYで始まりタンパク質のカルボキシ末端までずっと続く配列である。その配列を本明細書で再現する:IEVMYPPPYLDNEKSNGTIIHVKGKHLCPSPLFPGPSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS (配列番号479)。好ましくは、抗原はCD19であり、より好ましくは抗原結合要素は抗CD19 scFvであり、さらに好ましくはKochenderferらの文献(上記)に記載の抗CD19 scFvである。
さらなる抗CD19 CARがWO2015187528にさらに記載されている。より詳細には、WO2015187528の実施例1および表1(参照により本明細書に組み込まれる)は、完全ヒト抗CD19モノクローナル抗体(US20100104509に記載の47G4)およびマウス抗CD19モノクローナル抗体(Nicholsonらの文献に記載され上で説明したもの)に基づく抗CD19 CARの作成について実証している。シグナル配列(ヒトCD8-αまたはGM-CSF受容体)と、細胞外および膜貫通領域(ヒトCD8-α)と、細胞内T細胞シグナル伝達ドメイン(CD28-CD3ζ、4-1BB-CD3ζ、CD27-CD3ζ、CD28-CD27-CD3ζ、4-1BB-CD27-CD3ζ、CD27-4-1BB-CD3ζ、CD28-CD27-FceRI γ鎖、またはCD28-FceRI γ鎖)との様々な組合せが開示された。したがって、特定の実施態様では、養子細胞療法用の細胞、より詳細には免疫応答細胞(T細胞など)は、抗原に特異的に結合する細胞外抗原結合要素と、WO2015187528の表1に示す細胞外および膜貫通領域と、WO2015187528の表1に示す細胞内T細胞シグナル伝達ドメインとを含むCARを含んでもよい。WO2015187528の実施例1に記載されているように、好ましくは抗原はCD19であり、より好ましくは抗原結合要素は抗CD19 scFvであり、さらに好ましくはマウスまたはヒトの抗CD19 scFvである。特定の実施態様では、CARは、WO2015187528の表1に示された配列番号1、配列番号2、配列番号3、配列番号4、配列番号5、配列番号6、配列番号7、配列番号8、配列番号9、配列番号10、配列番号11、配列番号12、または配列番号13のアミノ酸配列を含む、本質的にそれからなる、またはそれからなる。
例として、限定されないが、CD70抗原を認識するキメラ抗原受容体がWO2012058460A2に記載されている(Park et al., CD70 as a target for chimeric antigen receptor Tcells in head and neck squamous cell carcinoma(頭頸部扁平上皮がんにおけるキメラ抗原受容体T細胞の標的としてのCD70), Oral Oncol. 2018 Mar;78:145-150およびJin et al., CD70, a novel target of CAR T細胞therapy for gliomas(神経膠腫に対するCAR T細胞療法の新たな標的CD70), Neuro Oncol. 2018 Jan 10;20(1):55-65も参照のこと)。CD70は、びまん性大B細胞型および濾胞性リンパ腫、さらにはホジキンリンパ腫、ワルデンストレーム高ガンマグロブリン血症、および多発性骨髄腫の悪性細胞、さらにはHTLV-1およびEBV関連悪性腫瘍によって発現される(Agathanggelou et al. Am.J.Pathol. 1995;147: 1152-1160、Hunter et al., Blood 2004; 104:4881. 26、Lens et al., J Immunol. 2005;174:6212-6219、Baba et al., J Virol. 2008;82:3843-3852を参照のこと)。また、CD70は非血液悪性腫瘍、たとえば腎細胞がんおよび膠芽腫によって発現される(Junker et al., J Urol. 2005;173:2150-2153、Chahlavi et al., Cancer Res 2005;65:5428-5438)。生理学的には、CD70発現は一過性であり、高活性化したT、B、および樹状細胞の部分集合に限られている。
例として、限定されないが、BCMAを認識するキメラ抗原受容体が記載されている。(たとえば、US20160046724A1、WO2016014789A2、WO2017211900A1、WO2015158671A1、US20180085444A1、WO2018028647A1、US20170283504A1、およびWO2013154760A1を参照のこと)。
本明細書に開示されているCRISPRシステムを養子細胞療法で標的化される抗原の標的化に用いてもよい。特定の実施態様では、疾患の(特に腫瘍またはがんの)養子細胞療法(TIL、CAR、またはTCR T細胞療法)で標的化される抗原(腫瘍抗原など)は、以下からなる群より選択されてもよい:B細胞成熟抗原(BCMA) (たとえば、Friedman et al., Effective Targeting of Multiple BCMA-Expressing Hematological Malignancies by Anti-BCMA CAR T Cells (抗BCMA CAR T細胞による多くのBCMA発現血液悪性腫瘍の効果的な標的化), Hum Gene Ther. 2018 Mar 8; Berdeja JG, et al. Durable clinical responses in heavily pretreated patients with relapsed/refractory multiple myeloma: updated results from a multicenter study of bb2121 anti-Bcma CAR T cell therapy. (重度に前治療を受けた再発/難治性多発性骨髄腫患者における持続的な臨床反応: bb2121抗Bcma CAR T細胞療法の多施設試験の最新の結果), Blood. 2017;130:740;ならびにMouhieddineおよびGhobrial, Immunotherapy in Multiple Myeloma: The Era of CAR T Cell Therapy (多発性骨髄腫の免疫療法: CAR T細胞療法の時代), Hematologist, May-June 2018, Volume 15, issue 3を参照のこと); PSA (前立腺特異的抗原); 前立腺特異的膜抗原(PSMA); PSCA (前立腺幹細胞抗原); チロシンタンパク質キナーゼ膜貫通受容体ROR1; 線維芽細胞活性化タンパク質(FAP); 腫瘍関連糖タンパク質72 (TAG72); がん胎児性抗原 (CEA); 上皮細胞接着分子 (EPCAM); メソテリン; ヒト上皮細胞成長因子受容体2 (ERBB2 (Her2/neu)); 前立腺プロスターゼ; 前立腺酸性ホスファターゼ(PAP); 伸長因子2変異体(ELF2M); インスリン様成長因子1受容体(IGF-1R); gplOO; BCR-ABL (切断点クラスター領域-エーベルソン); チロシナーゼ; ニューヨーク食道扁平上皮がん1 (NY-ESO-1); κ-軽鎖、LAGE (L抗原); MAGE (黒色腫抗原); 黒色腫関連抗原1 (MAGE-A1); MAGE A3; MAGE A6; レグマイン; ヒトパピローマウイルス(HPV) E6; HPV E7; プロステイン; サバイビン; PCTA1 (ガレクチン8); メランA/MART-1; Ras変異体; TRP-1 (チロシナーゼ関連タンパク質1、すなわちgp75); チロシナーゼ関連タンパク質2 (TRP2); TRP-2/INT2 (TRP-2/イントロン2); RAGE (腎臓抗原);終末糖化産物受容体1 (RAGE1); 腎臓遍在性1、2 (RU1, RU2); 腸カルボキシルエステラーゼ(iCE); 熱ショックタンパク質70-2 (HSP70-2)変異体; 甲状腺刺激ホルモン受容体 (TSHR); CD123; CD171; CD19; CD20; CD22; CD26; CD30; CD33; CD44v7/8 (表面抗原分類44、エクソン7/8); CD53; CD92; CD100; CD148; CD150; CD200; CD261; CD262; CD362; CS-1 (CD2サブセット1、CRACC、SLAMF7、CD319、および19A24); C型レクチン様分子1 (CLL-1); ガングリオシドGD3 (aNeu5Ac(2-8)aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer); Tn抗原(Tn Ag); Fms様チロシンキナーゼ3 (FLT3); CD38; CD138; CD44v6; B7H3 (CD276); KIT (CD117); インターロイキン13受容体サブユニットα-2 (IL-13Ra2); インターロイキン11受容体α(IL-11Ra); 前立腺幹細胞抗原 (PSCA); プロテアーゼセリン21 (PRSS21); 血管内皮成長因子受容体2 (VEGFR2); ルイス(Y)抗原; CD24; 血小板由来成長因子受容体β(PDGFR-β); 段階特異的胎児性抗原4 (SSEA-4); ムチン1、細胞表面結合(MUC1); ムチン16 (MUC16); 上皮細胞成長因子受容体 (EGFR); 上皮細胞成長因子受容体多様体III (EGFRvIII); 神経細胞接着分子(NCAM); 炭酸脱水酵素IX (CAIX); プロテアソーム(プロソーム、マクロパイン)サブユニット、β型、9 (LMP2); エフリンA型受容体2 (EphA2); エフリンB2; フコシルGM1; シアリルルイス接着分子(sLe); ガングリオシドGM3 (aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer); TGS5; 高分子量黒色腫関連抗原 (HMWMAA); o-アセチル-GD2ガングリオシド(OAcGD2); 葉酸受容体α; 葉酸受容体β; 腫瘍内皮マーカー1 (TEM1/CD248); 腫瘍内皮マーカー7関連(TEM7R); クローディン6 (CLDN6); Gタンパク質共役型受容体クラスC、グループ5、メンバーD (GPRC5D); X染色体翻訳領域61 (CXORF61); CD97; CD179a; 未分化リンパ腫キナーゼ(ALK); ポリシアル酸; 胎盤特異的1 (PLAC1); グロボHグリコセラミドの六糖部分(GloboH); 乳腺分化抗原(NY-BR-1); ウロプラキン2 (UPK2); A型肝炎ウイルス細胞受容体1 (HAVCR1); アドレナリン受容体β3 (ADRB3); pアネキシン3 (PANX3); Gタンパク質共役型受容体20 (GPR20); リンパ球 抗原6複合体, 遺伝子座K9 (LY6K); 嗅覚受容体51E2 (OR51E2); TCR Γ代替リーディングフレームタンパク質(TARP); ウィルムス腫瘍タンパク質(WT1); 染色体12pに位置するETS転座多様体遺伝子6 (ETV6-AML); 精子タンパク質17 (SPA17); X抗原ファミリー、メンバー1A (XAGE1); アンジオポエチン結合細胞表面受容体2 (Tie 2); CT (がん/精巣(抗原)); 黒色腫がん精巣抗原1 (MAD-CT-1); 黒色腫がん精巣抗原2 (MAD-CT-2); Fos関連抗原1; p53; p53変異体; ヒトテロメラーゼ逆転写酵素(hTERT);肉腫転座切断点; 黒色腫アポトーシス阻害因子(ML-IAP); ERG (膜貫通プロテアーゼ、セリン2 (TMPRSS2) ETS融合遺伝子); N-アセチルグルコサミニルトランスフェラーゼV (NA17); ペアードボックスタンパク質Pax-3 (PAX3); アンドロゲン受容体; サイクリンB1; サイクリンD1; v-mycトリ骨髄球腫症ウイルスがん遺伝子神経芽腫由来相同体(MYCN); Ras相同体ファミリーメンバーC (RhoC); チトクロムP450 1B1 (CYP1B1); CCCTC結合因子(亜鉛フィンガータンパク質)様 (BORIS); T細胞1または3が認識する扁平上皮がん抗原(SART1、SART3); ペアードボックスタンパク質Pax-5 (PAX5); プロアクロシン結合タンパク質sp32 (OY-TES1); リンパ球特異的タンパク質チロシンキナーゼ (LCK); Aキナーゼアンカータンパク質4 (AKAP-4); 滑膜肉腫、X切断点1、2、3または4 (SSX1、SSX2、SSX3、SSX4); CD79a; CD79b; CD72; 白血球関連免疫グロブリン様受容体1 (LAIR1); IgA受容体のFc断片 (FCAR); 白血球免疫グロブリン様受容体サブファミリーAメンバー2 (LILRA2); CD300 分子様ファミリーメンバーf (CD300LF); C型レクチンドメインファミリー12メンバーA (CLEC12A); 骨髄間質細胞抗原2 (BST2); EGF様モジュール含有ムチン様ホルモン受容体様2 (EMR2); リンパ球抗原75 (LY75); グリピカン3 (GPC3); Fc受容体様5 (FCRL5); マウス二重微小染色体2相同体 (MDM2); リビン; αフェトタンパク質(AFP); 膜貫通活性化因子およびCAML相互作用(TACI); B細胞活性化因子受容体 (BAFF-R); V-Ki-ras2カーステンラット肉腫ウイルスがん遺伝子 相同体(KRAS); 免疫グロブリンλ様ポリペプチド1 (IGLL1); 707-AP (707アラニン・プロリン); ART-4 (T4細胞によって認識される腺がん抗原); BAGE (B抗原; b-カテニン/m、b-カテニン/変異型); CAMEL (CTLに認識される黒色腫の抗原); CAP1 (がん胎児抗原ペプチド1); CASP-8 (カスパーゼ8); CDC27m (細胞分裂周期27変異型); CDK4/m (サイクリン依存性キナーゼ4変異型); Cyp-B (シクロフィリンB); DAM (分化抗原黒色腫); EGP-2 (上皮糖タンパク質2); EGP-40 (上皮糖タンパク質40); Erbb2、3、4 (赤芽球性白血病ウイルスがん遺伝子相同体2、3、4); FBP (葉酸結合タンパク質); fAchR (胎児アセチルコリン受容体); G250 (糖タンパク質250); GAGE (G抗原); GnT-V (N-アセチルグルコサミニルトランスフェラーゼV); HAGE (ヘリカーゼ抗原); ULA-A (ヒト白血球抗原A); HST2 (ヒト印環腫瘍2); KIAA0205; KDR (キナーゼ挿入ドメイン受容体); LDLR/FUT (低密度脂質受容体/GDP L-フコース: β-D-ガラクトシダーゼ/2-α-L-フコシルトランスフェラーゼ); L1CAM (L1細胞接着分子); MC1R (メラノコルチン1受容体); ミオシン/m (ミオシン変異型); MUM1、2、3 (黒色腫遍在性変異型1、2、3); NA88-A (患者のNA cDNAクローンM88); KG2D (ナチュラルキラーグループ2、メンバーD) リガンド; がん胎児抗原 (h5T4); p190マイナーbcr-abl (190KDのbcr-ablタンパク質); Pml/RARα (急性前骨髄球性白血病/レチノイン酸受容体α); PRAME (黒色腫優先発現抗原); SAGE (肉腫抗原); TEL/AML1 (転座Etsファミリー白血病/急性骨髄性白血病1); TPI/m (トリオースリン酸イソメラーゼ変異型); CD70; 栄養膜糖タンパク質(TPBG); ανβo インテグリン、B7-H3; B7-H6; CD20; CD44; コンドロイチン硫酸プロテオグリカン4 (CSPG4)、bDGalpNAc(l-4)[aNeu5Ac(2-8)aNeu5Ac(2-3)]bDGalp(l-4)bDGlcp(l-l)Cer (GD2)、aNeu5Ac(2-8)aNeu5Ac(2-3)bDGalp(l-4)bDGlcp(l-l)Cer (GD3); ヒト白血球抗原Al MAGEファミリーメンバーAl (HLA-A1+MAGEA1); ヒト白血球抗原A2 MAGEファミリーメンバーAl (HLA-A2+MAGEA1); ヒト白血球抗原A3 MAGEファミリーメンバーAl (HLA-A3+MAGEA1); MAGEA1; ヒト白血球抗原Alニューヨーク食道扁平上皮がん1 (FILA-Al+NY-ESO-l); ヒト白血球 抗原A2ニューヨーク食道扁平上皮がん1 (HLA-A2+NY-ESO-l)、λ軽鎖、κ軽鎖、腫瘍内皮マーカー5 (TEM5)、腫瘍内皮マーカー7 (TEM7)、腫瘍内皮マーカー8 (TEM8)、TEM5、TEM7、TEM8、IFN誘導性p78、メラノトランスフェリン(p97)、ヒトカリクレイン(huK2)、Axl、ROR2、FKBP11、KAMP3、ITGA8、FCRL5、LAGA-1、CD133、cD34、EBV核内抗原1 (EBNA1)、潜伏膜タンパク質1 (LMPl)およびLMP2A、CD75、gp100、MICA、MICB、MART1、がん胎児抗原、CA-125、MAGEC2、CTAG2、CTAG1、pd-l2、CLA、CD142、CD73、CD49c、CD66c、CD104、CD318、TSPAN8、CLEC14、ヒト免疫不全ウイルス1 (HIV-1)逆転写酵素(RT)、Cd16、BLTA、IL-2、IL-7、IL-15、IL-21,IL-12、CCR4、CCR2b、ヘパラナーゼ、CD137L、LEM、およびBcl-2、Msln、Cd8、IL-15、4-1BBL、OX40L、4- IBB、cd95、cd27、HVENM、CXCR4; ならびにそれらの任意の組合せ。実施例によっては、標的化される抗原はCXCRであってもよい。実施例によっては、標的化される抗原はPD-1であってもよい。
特定の実施態様では、疾患の(特に腫瘍またはがんの)養子細胞療法(CAR、またはTCR T細胞療法)で標的化される抗原(腫瘍抗原など)は腫瘍特異的抗原(TSA)である。
特定の実施態様では、疾患の(特に腫瘍またはがんの)養子細胞療法(CAR、またはTCR T細胞療法)で標的化される抗原(腫瘍抗原など)は新生抗原である。
特定の実施態様では、疾患の(特に腫瘍またはがんの)養子細胞療法(CAR、またはTCR T細胞療法)で標的化される抗原(腫瘍抗原など)は腫瘍関連抗原(TAA)である。
特定の実施態様では、疾患の(特に腫瘍またはがんの)養子細胞療法(TIL、CAR、またはTCR T細胞療法)で標的化される抗原(腫瘍抗原など)は普遍的な腫瘍抗原である。特定の好ましい実施態様では、普遍的な腫瘍抗原は、ヒトテロメラーゼ逆転写酵素(hTERT)、サバイビン、マウス二重微小染色体2相同体(MDM2)、チトクロムP450 1B 1 (CYP1B)、HER2/neu、ウィルムス腫瘍遺伝子1 (WT1)、リビン、αフェトタンパク質(AFP)、がん胎児抗原(CEA)、ムチン16 (MUC16)、MUC1、前立腺特異的膜抗原(PSMA)、p53、サイクリン(DI)、およびそれらの任意の組合せからなる群より選択される。
特定の実施態様では、疾患の(特に腫瘍またはがんの)養子細胞療法(CAR、またはTCR T細胞療法)で標的化される抗原(腫瘍抗原など)は、CD19、BCMA、CD70、CLL-1、MAGE A3、MAGE A6、HPV E6、HPV E7、WT1、CD22、CD171、ROR1、MUC16、およびSSX2からなる群より選択されてもよい。特定の好ましい実施態様では、抗原はCD19であってもよい。たとえば、血液悪性腫瘍、たとえばリンパ腫、より詳細にはB細胞性リンパ腫(限定しないが、びまん性大細胞型B細胞性リンパ腫、縦隔原発B細胞性リンパ腫など)、がん化した濾胞性リンパ腫、辺縁帯リンパ腫、マントル細胞リンパ腫、急性リンパ性白血病(成人および小児ALLを含む)、非ホジキンリンパ腫、低悪性非ホジキンリンパ腫、または慢性リンパ性白血病においてCD19を標的化してもよい。たとえば、多発性骨髄腫または形質細胞性白血病においてBCMAを標的化してもよい(たとえば、2018 American Association for Cancer Research (AACR) Annual meeting Poster: Allogeneic Chimeric Antigen Receptor T Cells Targeting B Cell Maturation Antigen (B細胞成熟抗原を標的化する同種キメラ抗原受容体T細胞)を参照のこと)。たとえば、急性骨髄性白血病においてCLL1を標的化してもよい。たとえば、固形腫瘍においてMAGE A3、MAGE A6、SSX2、および/またはKRASを標的化してもよい。たとえば、子宮頸がんまたは頭頸部がんにおいてHPV E6および/またはHPV E7を標的化してもよい。たとえば、急性骨髄性白血病(AML)、骨髄異形成症候群(MDS)、慢性骨髄性白血病(CML)、非小細胞肺がん、乳がん、膵臓がん、卵巣がん、大腸がん、または中皮腫においてWT1を標的化してもよい。たとえば、B細胞悪性腫瘍(非ホジキンリンパ腫、びまん性大細胞型B細胞性リンパ腫、または急性リンパ性白血病など)においてCD22を標的化してもよい。たとえば、神経芽腫、膠芽腫、または肺がん、膵臓がん、もしくは卵巣がんにおいてCD171を標的化してもよい。たとえば、ROR1陽性悪性腫瘍(非小細胞肺がん、三種陰性乳がん、膵臓がん、前立腺がん、ALL、慢性リンパ性白血病、またはマントル細胞リンパ腫など)においてROR1を標的化してもよい。たとえば、MUC16エクト陽性の卵巣上皮がん、卵管がん、または原発性腹膜がんにおいてMUC16を標的化してもよい。たとえば、血液悪性腫瘍および固形がん(腎細胞がん(RCC)、神経膠腫(たとえばGBM)、および頭頸部がん(HNSCC)など)の両方においてCD70を標的化してもよい。CD70は、血液悪性腫瘍と固形がんの両方で発現するが、正常組織での発現はリンパ系細胞型の部分集合に限られる(たとえば、2018 American Association for Cancer Research (AACR) Annual meeting Poster: Allogeneic CRISPR Engineered Anti-CD70 CAR-T Cells Demonstrate Potent Preclinical Activity Against Both Solid and Hematological Cancer Cells (CRISPR操作した同種の抗CD70 CAR-T細胞は固形がん細胞と血液がん細胞の両方に対して強力な前臨床活性を示す)を参照のこと)。
実施態様によっては、標的抗原はウイルス抗原である。HIV、HTLV、および他のウイルスなどのウイルスゲノムに由来のペプチドなど、多くのウイルス抗原標的が特定されており公知である(たとえば、Addo et al. (2007) PLoS ONE, 2, e321 ; Tsomides et al. (1994) J Exp Med, 180, 1283-93; Utz et al. (1996) J Virol, 70, 843-51を参照のこと)。模範的なウイルス抗原としては、以下に由来の抗原が挙げられるがこれらに限定されない:A型肝炎、B型肝炎(たとえば、HBVコア(HBVc)および表面抗原(HBVs)、C型肝炎(HCV)、エプスタイン・バーウイルス(たとえばEBVA)、ヒトパピローマウイルス(HPV;たとえばE6およびE7)、ヒト免疫不全ウイルス1型(HIV1)、カポジ肉腫ヘルペスウイルス(KSHV)、ヒトパピローマウイルス(HPV)、インフルエンザウイルス、ラッサウイルス、HTLN-i、HIN-1、HIN-IL CMN、EBN、またはHPN。実施態様によっては、標的タンパク質は細菌抗原または他の病原性抗原、たとえば結核菌(MT)抗原、トリパノソーマ類(たとえばクルーズトリパノソーマ(Tiypansoma cruzi, T. cruzi))、表面抗原(TSA)などの抗原、またはマラリア抗原などである。特異的な抗原もしくはエピトープまたは他の病原性抗原もしくはペプチドエピトープが公知である(たとえば、Addo et al. (2007) PLoS ONE, 2, e321; Anikeeva et al. (2009) Clin Immunol, 130, 98-109)を参照のこと[0133]。実施態様によっては、抗原は発がんウイルスなどのがん関連ウイルスに由来する抗原である。たとえば、発がんウイルスは特定のウイルスからの感染が様々な種類のがんの発症につながることが知られているウイルス、たとえば、A型肝炎、B型肝炎(HBV)、C型肝炎(HCV)、ヒトパピローマウイルス(HPV)、肝炎ウイルス感染症、エプスタイン・バーウイルス(EBV)、ヒトヘルペスウイルス8(HHV-8)、ヒトT細胞白血病ウイルス1(HTLV-1)、ヒトT細胞白血病ウイルス2(HTLV-2)、またはサイトメガロウイルス(CMV)抗原である。実施態様によっては、ウイルス抗原はHPV抗原であり、場合によっては子宮頸がんおよび/または頭頸部がんを発症するリスクが高くなる可能性がある。実施態様によっては、抗原はHPV-16抗原、HPV-18抗原、HPV-31抗原、HPV-33抗原、またはHPV-35抗原であってもよい。実施態様によっては、ウイルス抗原はHPV-16抗原(たとえば、HPV-16のEl、E2、E6またはE7タンパク質の血清反応性領域;たとえば、米国特許第6,531,127号を参照のこと)またはHPV-18抗原(たとえば、HPV-18のL1および/またはL2タンパク質の血清反応性領域(米国特許第5,840,306号に記載のものなど))である。
実施態様によっては、ウイルス抗原はHBVまたはHCV抗原であり、これにより場合によってはHBVまたはHCV陰性の対象よりも肝臓がんを発症するリスクが高くなる可能性がある。たとえば、実施態様によっては、異種抗原はHBV抗原、たとえばB型肝炎コア抗原またはB型肝炎エンベロープ抗原である(US2012/0308580)。
実施態様によっては、ウイルス抗原はEBV抗原であり、これにより場合によってはEBV陰性の対象よりもバーキットリンパ腫、上咽頭がん、およびホジキン病を発症するリスクが高くなる可能性がある。たとえば、EBVはヒトパピローマウイルスであり、これは場合によっては多様な由来組織の多くのヒト腫瘍と関連しているとみられる。最初は無症候性感染とみられるが、EBV陽性腫瘍はウイルス遺伝子産物(EBNA-1、LMP-1、およびLMP-2Aなど)の活発な発現を特徴とする可能性がある。実施態様によっては、異種抗原はEBV抗原であり、エプスタイン・バー核内抗原(EBNA)-l、EBNA-2、EBNA-3A、EBNA-3B、EBNA-3C、EBNAリーダータンパク質(EBNA-LP)、潜伏膜タンパク質LMP-1、LMP-2A、LMP-2B、EBV-EA、EBV-MA、またはEBV-VCAを挙げることができる[0137]。実施態様によっては、ウイルス抗原はHTLV-1またはHTLV-2抗原であり、これにより場合によってはHTLV-1またはHTLV-2陰性の対象よりもT細胞白血病を発症するリスクが高くなる可能性がある。実施態様によっては、異種抗原はHTLV抗原、たとえばTAXである。
実施態様によっては、ウイルス抗原はHHV-8抗原であり、場合によってはHHV-8陰性の対象よりもカポジ肉腫を発症するリスクが高くなる可能性がある。実施態様によっては、異種抗原はCMV抗原、たとえばpp65またはpp64である(米国特許第8361473号を参照のこと)。
実施態様によっては、ウイルス抗原はウイルス特異的表面抗原、たとえばHIV特異的抗原(HIV gp120など)、EBV特異的抗原、CMV特異的抗原、HPV特異的抗原、ラッサウイルス特異的抗原、インフルエンザウイルス特異的抗原など、およびこれらの表面マーカーの任意の誘導体もしくは多様体である。
一側面では、本発明は中枢神経系の腫瘍、特に神経線維腫症1型(NF1)神経遺伝病により誘導される腫瘍の治療を提供する。NF1を持つ個体はNF1遺伝子の生殖細胞変異を持って生まれるが、自閉症や注意欠陥から脳および末梢神経鞘腫瘍に至るまで、多くの様々な神経障害を発症する可能性がある。本発明を用いて、患者に特異的な疾患モデルを開発し、同質遺伝子の基礎環境で人工多能性幹細胞(iPSC)由来の疾患関連T細胞を研究してもよい。人工多能性幹細胞またはiPSCとしても知られる胚性幹細胞(ESC)様細胞を成人患者の皮膚または血液細胞から作成することができる。最近の研究努力により、iPS細胞を中枢神経系および末梢神経系(CNSおよびPNS)の様々な細胞型(これらはNF1患者で影響を受ける)に分化させる培養手順の開発が開始されている。本発明のCRISPR C2c1システムを用いて、既存の変異遺伝子を修復する、または新たな変異を起こすことで特定の疾患遺伝子を遺伝的に編集してもよい。NF1研究の最前線に立つためには、Children's National Medical CenterのGilbert Family Neurofibromatosis Institute (GFNI)がこれらの最近の興味深い研究開発を調査し、患者に特異的なヒトNF1疾患モデルを体系的に開発し、個々のNF患者の薬物選別と評価のための手段を提供することが重要である。
上記のような手法を改良し、たとえば選択された抗原に結合する受容体を認識する抗原を含む有効量の免疫応答細胞を投与することにより疾患(腫瘍など)を持つ対象を治療し、かつ/または生存期間を延長する方法を提供してもよい。ここで、結合により免疫応答細胞は活性化し、それにより疾患(腫瘍、病原感染、自己免疫障害、または同種移植反応など)が治療または予防される。CAR T細胞療法における用量設定は、たとえば106~109細胞/kgの投与を包含してもよく、たとえばシクロホスファミドによるリンパ球除去を伴っても伴わなくてもよい。
当業者は、本発明で開示されるCRISPR-C2c1システムを上記の似たシステムで用いてもよい。C2c1タンパク質について言えば、CRISPR-C2c1システムはTに富む配列であるPAM配列を認識してもよい。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を標的遺伝子に導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。特定の実施態様によっては、CRISPR-C2c1システムは標的遺伝子を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは単一のヌクレオチド改変を標的遺伝子の転写物に導入する。
一実施態様では、免疫抑制治療を受けている患者に治療を行うことができる。細胞または細胞集団を、少なくとも1種の免疫抑制剤に対する受容体をコードする遺伝子を不活性化することにより、その免疫抑制剤に抵抗するようにしてもよい。理論に拘束されないが、免疫抑制治療は患者体内で本発明による免疫応答性細胞またはT細胞が選択され増殖するよう促さなければならない。
本発明による細胞または細胞集団の投与は、噴霧剤吸入、注射、摂取、輸液、留置または移植を含む任意の好都合な方法により実施されてもよい。細胞または細胞集団を患者に皮下投与、皮内投与、腫瘍内投与、節内投与、髄腔内投与、筋肉内投与、静脈内またはリンパ内注射による投与、または腹腔内投与してもよい。一実施態様では、好ましくは静脈内注射により本発明の細胞組成物を投与する。
細胞または細胞集団の投与は、体重1kgあたり104~109個の細胞、好ましくは体重1kgあたり105~106個の細胞の投与で構成される可能性があり、それらの範囲内のすべての整数値の細胞数が含まれる。CAR T細胞療法における投薬は、たとえばシクロホスファミドによるリンパ枯渇の過程の有無にかかわらず、たとえば106~109細胞/kgの投与を含んでもよい。細胞または細胞集団を1回以上の用量で投与することができる。別の実施態様では、有効量の細胞を単回投与で投与する。別の実施態様では、有効量の細胞を一定期間に複数回の用量で投与する。投与のタイミングは管理する医師の判断の範囲内であり、患者の臨床状態に依存する。細胞または細胞の集団は、任意の供給源、たとえば血液バンクまたはドナーなどから得られてもよい。個々の要求は異なるが、特定の疾患または状態に対する所定の細胞型の有効量の最適範囲の決定は当業者の範囲内である。有効量は、治療上または予防上の利益をもたらす量を意味する。投与される投与量は、レシピエントの年齢、健康状態、および体重、併用治療の種類(あれば)、治療の頻度、ならびに所望の効果の性質に依存する。
別の実施態様では、有効量の細胞またはそれらの細胞を含む組成物を非経口投与する。投与は静脈内投与であってもよい。腫瘍内注射により投与を直接行ってもよい。
可能性のある有害反応を防ぐために、操作された免疫応答は、細胞を特定の信号への曝露に対して弱くする導入遺伝子の形で、遺伝子組換え安全スイッチを備えていてもよい。たとえば、単純ヘルペスウイルスチミジンキナーゼ(TK)遺伝子を、たとえば幹細胞移植後のドナーリンパ球注入として使用される同種Tリンパ球に導入することにより、このように使用してもよい(Greco, et al., Improving the safety of cell therapy with the TK-suicide gene (TK自殺遺伝子を用いて細胞療法の安全性を改善する). Front. Pharmacol. 2015; 6: 95)。このような細胞では、ヌクレオシドプロドラッグ、たとえばガンシクロビルまたはアシクロビルの投与により細胞死が起こる。代替的な安全スイッチ構築物としては誘導型カスパーゼ9、たとえば2つの機能しないcasp9分子を組み合わせて活性酵素を形成する小分子二量体を投与することにより誘発されるものが挙げられる。細胞増殖制御を実施するための広範な代替手法が記載されている(米国特許出願公開第20130071414号; PCT特許公開公報WO2011146862; PCT特許公開公報WO2014011987; PCT特許公開公報WO2013040371; ; Zhou et al. BLOOD, 2014, 123/25:3895 - 3905; Di Stasi et al., The New England Journal of Medicine 2011; 365:1673-1683; Sadelain M, The New England Journal of Medicine 2011; 365:1735-173; Ramos et al., Stem Cells 28(6):1107-15 (2010)を参照のこと)。
養子療法のさらなる改良では、本明細書に記載のCRISPR-Casシステムを用いたゲノム編集を用いて代替的な実施に合わせて免疫応答細胞を調整し、たとえば編集されたCAR T細胞を提供することができる(Poirot et al., 2015, Multiplex genome edited T-cell manufacturing platform for "off-the-shelf" adoptive T-cell immunotherapies (「既製の」養子T細胞免疫療法の基盤を作る多重ゲノム編集T細胞), Cancer Res 75 (18): 3853を参照のこと)。たとえば、HLAの II 型および/または I 型分子の一部またはすべての発現を削除する、あるいは所望の免疫応答を阻害する可能性のある選択された遺伝子(PD1遺伝子など)を欠損させるために免疫応答細胞を編集してもよい。
本明細書に記載の任意のCRISPRシステムおよびその使用方法を用いて細胞を編集してもよい。本明細書に記載の任意の方法でCRISPRシステムを免疫細胞に送達してもよい。好ましい実施態様では、細胞をex vivoで編集し、それを必要とする対象に移入する。免疫応答細胞、CAR T細胞、または養子細胞移入に用いられる任意の細胞を編集してもよい。潜在的な同種反応性T細胞受容体(TCR)を排除し、化学療法剤の標的を破壊し、免疫チェックポイントを遮断し、T細胞を活性化し、かつ/または機能消耗または機能不全CD8陽性細胞の分化および/または増殖を増やすために編集を行ってもよい(PCT特許公開公報WO2013176915、WO2014059173、WO2014172606、WO2014184744、およびWO2014191128を参照のこと)。編集により遺伝子が不活性化してもよい。
遺伝子の不活性化により、目的の遺伝子が機能性タンパク質の形で発現しないことが意図される。特定の実施態様では、CRISPRシステムは1つの標的遺伝子の切断を特異的に触媒することによりその標的遺伝子を不活性化する。引き起こされた核酸鎖切断は一般に、相同組換えまたは非相同末端結合(NHEJ)の異なる機構により修復される。ただし、NHEJは不完全な修復過程であり、切断部位のDNA配列が変化することがよくある。非相同末端結合(NHEJ)を介した修復は小さな挿入または欠失(挿入欠失)を起こすことが多く、特定の遺伝子欠損を起こすのに使用することができる。切断により誘導される変異誘発事象が起きた細胞を当技術分野で周知の方法により特定かつ/または選択することができる。
T細胞受容体(TCR)は抗原の提示に応答してT細胞の活性化に関与する細胞表面受容体である。TCRは一般に2つの鎖、αおよびβから作られ、これらは集合してヘテロ二量体を形成し、CD3伝達サブユニットと会合して、細胞表面に存在するT細胞受容体複合体を形成する。TCRの各αおよびβ鎖は、免疫グロブリンに似たN末端可変(V)および定常(C)領域、疎水性膜貫通ドメイン、および短い細胞質領域で構成されている。免疫グロブリン分子の場合、α鎖およびβ鎖の可変領域はV(D)J組換えによって作られ、これによりT細胞の集団内で非常に多様な抗原特異性が生まれる。しかし、未処置の抗原を認識する免疫グロブリンとは対照的に、T細胞はMHC分子と共同する処理済みペプチドにより活性化され、MHC制限として知られるT細胞による抗原認識に別の側面が取り入れられる。T細胞受容体を介したドナーとレシピエントとの間のMHC認識の格差は、T細胞の増殖および移植片対宿主病(GVHD)の発症の可能性につながる。TCRαまたはTCRβの不活性化により、T細胞の表面からTCRが排除され、同種抗原の認識、ひいてはGVHDが妨げられる可能性がある。しかし、TCRを破壊すると、一般にCD3シグナル伝達成分が排除され、さらなるT細胞増殖の手段が変化する。
同種細胞は宿主の免疫系により急速に拒絶される。非照射血液製剤に存在する同種白血球は、5~6日しか存続しないことが実証されている(Boni, Muranski et al. 2008 Blood 1;112(12):4746-54)。したがって、同種細胞の拒絶反応を防ぐために、通常、宿主の免疫系はある程度抑制されなければならない。しかし、養子細胞移入の場合、免疫抑制薬の使用は導入された治療用T細胞にも有害な影響を及ぼす。したがって、これらの条件で養子免疫療法の手法を有効に用いるには、導入細胞が免疫抑制治療に抵抗性を持つ必要がある。したがって、特定の実施態様では、本発明は、T細胞を免疫抑制剤に抵抗性を持つように改変する(好ましくは免疫抑制剤の標的をコードする少なくとも1つの遺伝子の不活性化によって)工程をさらに含む。免疫抑制剤はいくつかの作用機序のうちの1つにより免疫機能を抑制する薬剤である。免疫抑制剤は、カルシニューリン阻害因子、ラパマイシンの標的、インターロイキン2受容体α鎖阻害剤、イノシン一リン酸デヒドロゲナーゼ阻害因子、ジヒドロ葉酸レダクターゼ阻害因子、コルチコステロイド、または免疫抑制性抗代謝剤である可能性があるが、これらに限定されない。本発明により、T細胞中の免疫抑制剤の標的を不活性化して免疫抑制剤抵抗性をT細胞に付与することができる。非限定的な例として、免疫抑制剤の標的は免疫抑制剤の受容体、たとえばCD52、糖質コルチコイド受容体(GR)、FKBPファミリー遺伝子メンバー、およびシクロフィリンファミリー遺伝子メンバーである可能性がある。
免疫チェックポイントは、免疫反応を減速または停止し、免疫細胞の制御されていない活動による過度の組織損傷を防ぐ阻害経路である。特定の実施態様では、標的化される免疫チェックポイントは、プログラム死1(PD-1またはCD279)遺伝子(PDCD1)である。他の実施態様では、標的化される免疫チェックポイントは細胞傷害性Tリンパ球関連抗原(CTLA-4)である。さらなる実施態様では、標的化される免疫チェックポイントはCD28およびCTLA4 Igスーパーファミリーの別のメンバー、たとえばBTLA、LAG3、ICOS、PDL1、またはKIRである。またさらなる実施態様では、標的化される免疫チェックポイントはTNFRスーパーファミリーのメンバー、たとえばCD40、OX40、CD137、GITR、CD27、またはTIM-3である。
さらなる免疫チェックポイントとしては、Src相同性2ドメイン含有タンパク質チロシンホスファターゼ1 (SHP-1)が挙げられる(Watson HA, et al., SHP-1: the next checkpoint target for cancer immunotherapy? (SHP-1: がん免疫療法の新たな標的チェックポイント?) Biochem Soc Trans. 2016 Apr 15;44(2):356-62)。SHP-1は広く発現される阻害性タンパク質チロシンホスファターゼ (PTP)である。T細胞では、これは抗原依存的な活性化および増殖の負の制御因子である。これは細胞質タンパク質であり、したがって抗体による治療にとっては許容されないが、活性化および増殖におけるその役割から、養子移入方策(キメラ抗原受容体(CAR)など)における遺伝子操作の興味深い標的となっている。免疫チェックポイントとしては、IgならびにITIMドメイン(TIGIT/Vstm3/WUCAM/VSIG9)およびVISTA (Le Mercier I, et al., (2015) Beyond CTLA-4 and PD-1, the generation Z of negative checkpoint regulators (CTLA-4およびPD-1を超える負のチェックポイント制御因子のZ世代). Front. Immunol. 6:418)を持つT細胞免疫受容体も挙げることができる.
WO2014172606は、消耗したCD8陽性T細胞の増殖および/または活性を高め、CD8陽性T細胞の消耗を低減する(たとえば機能消耗した、または非反応性のCD8陽性T細胞を減らす)ためのMT1および/またはMT1阻害因子の使用に関する。特定の実施態様では、メタロチオネインが養子移入T細胞の遺伝子編集の標的である。
特定の実施態様では、遺伝子編集の標的は免疫チェックポイントタンパク質の発現に関与する少なくとも1つの標的遺伝子座であってもよい。このような標的としては以下が挙げられるが、これらに限定されない:CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS (CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、LAIR1、SIGLEC7、SIGLEC9、CD244 (2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、CD27、SHP-1、TIM-3、CEACAM-1、CEACAM-3、またはCEACAM-5。好ましい実施態様では、PD-1またはCTLA-4遺伝子の発現に関与する遺伝子座を標的化する。他の好ましい実施態様では、遺伝子の組合せ、たとえばPD-1とTIGITなど(ただしこれらに限定されない)を標的化する。
他の実施態様では、少なくとも2つの遺伝子を編集する。遺伝子の対としては以下を挙げることができるが、これらに限定しない:PD1とTCRα、PD1とTCRβ、CTLA-4とTCRα、CTLA-4とTCRβ、LAG3とTCRα、LAG3とTCRβ、Tim3とTCRα、Tim3とTCRβ、BTLAとTCRα、BTLAとTCRβ、BY55とTCRα、BY55とTCRβ、TIGITとTCRα、TIGITとTCRβ、B7H5とTCRα、B7H5とTCRβ、LAIR1とTCRα、LAIR1とTCRβ、SIGLEC10とTCRα、SIGLEC10とTCRβ、2B4とTCRα、2B4とTCRβ。
T細胞の改変の前でも後でも、一般に、たとえば米国特許第6,352,694号、第6,534,055号、第6,905,680号、第5,858,358号、第6,887,466号、第6,905,681号、第7,144,575号、第7,232,566号、第7,175,843号、第5,883,223号、第6,905,874号、第6,797,514号、第6,867,041号、および第7,572,631号に記載の方法でT細胞を活性化し増殖させることができる。T細胞はin vitroでもin vivoでも増殖させることができる。
本発明の実施では、特に指定しない限り、当技術分野の範囲内である従来の免疫学、生化学、化学、分子生物学、細胞生物学、ゲノム科学、および組換えDNAの技術を採用する。以下を参照のこと:MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989) (Sambrook, Fritsch and Maniatis); MOLECULAR CLONING: A LABORATORY MANUAL, 4th edition (2012) (Green and Sambrook); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (1987) (F. M. Ausubel, et al. eds.); the series METHODS IN ENZYMOLOGY (Academic Press, Inc.); PCR 2: A PRACTICAL APPROACH (1995) (M.J. MacPherson, B.D. Hames and G.R. Taylor eds.); ANTIBODIES, A LABORATORY MANUAL (1988) (Harlow and Lane, eds.); ANTIBODIES A LABORATORY MANUAL, 2nd edition (2013) (E.A. Greenfield ed.); およびANIMAL CELL CULTURE (1987) (R.I. Freshney, ed.)。
本発明の実施では、特に指定しない限り、従来の遺伝子改変マウス作成技術を採用する。Marten H. Hofker and Jan van Deursen, TRANSGENIC MOUSE METHODS AND PROTOCOLS, 2nd edition (2011)を参照のこと。
CRISPRシステムを用いた選別/診断/治療
がん
本発明の方法および組成物を用いて細胞の状態、成分、ならびに薬物耐性および疾患細胞の持続に関連する機構を特定することができる。Teraiら(Cancer Research, 19-Dec-2017, doi: 10.1158/0008-5472.CAN-17-1904)は、エルロチニブ/THZ1相乗作用を促進する複数の遺伝子ならびに相乗作用を抑制する成分および経路を特定するための、エルロチニブとTHZ1 (CDK7/12阻害因子)の併用療法で治療したEGFR依存性肺がんPC9細胞におけるゲノム全体のCRISPR/Cas9促進因子/抑制因子選別について報告している。Wangら(Cell Rep. 2017 Feb 7;18(6):1543-1557. doi: 10.1016/j.celrep.2017.01.031.; Krall et al., Elife. 2017 Feb 1;6. pii: e18970. doi: 10.7554/eLife.18970)は、ゲノム全体のCRISPR機能欠失選別を用いてMAPK阻害因子に対する抵抗性を媒介する物質を特定することについて報告した。Donovanら(PLoS One. 2017 Jan 24;12(1):e0170445. doi: 10.1371/journal.pone.0170445. eCollection 2017)は、CRISPRが媒介する手法を用いて変異誘発し、MAPKシグナル伝達経路遺伝子の新規な機能獲得および薬物抵抗対立遺伝子を特定した。Wangら(Cell. 2017 Feb 23;168(5):890-903.e15. doi: 10.1016/j.cell.2017.01.013. Epub 2017 Feb 2)は、ゲノム全体のCRISPR選別を用いて発がん性Rasとの遺伝子ネットワークおよび合成致死性の相互作用を特定した。Chowら(Nat Neurosci. 2017 Oct;20(10):1329-1341. doi: 10.1038/nn.4620. Epub 2017 Aug 14)は、膠芽腫における機能的抑制因子を特定するために、アデノ随伴ウイルスを介した自発的遺伝子CRISPR選別を開発した。Xueら(Nature. 2014 Oct 16;514(7522):380-4. doi: 10.1038/nature13589. Epub 2014 Aug 6)はCRISPRを介するマウスの肝臓におけるがん遺伝子の直接変異を採用した。
Chenら(J Clin Invest. 2017 Dec 4. pii: 90793. doi: 10.1172/JCI90793. [Epub ahead of print])はCRISPRに基づく選別を用いて、MYCN増幅型神経芽腫のEZH2依存性を特定した。MYCN増幅型神経芽腫の患者においてEZH2阻害因子の裏付け試験が行われた。
Vijaiら(Cancer Discov. 2016 Nov;6(11):1267-1275. Epub 2016 Sep 21)は、CRISPRを用いて乳腺上皮細胞株にヘテロ接合性の変異を起こして乳がんのリスクを評価することについて報告している。
Chakrabortyら(Sci Transl Med. 2017 Jul 12;9(398). pii: eaal5272. doi: 10.1126/scitranslmed.aal5272)はCRISPRに基づく選別を用いてEZH1を腎明細胞がんを治療するための有力な標的と特定した。
代謝疾患
本発明の方法および組成物は、肝臓の遺伝性代謝疾患(家族性高コレステロール血症、血友病、オルニチントランスカルバミラーゼ欠損症、遺伝性チロシン血症1型、およびα-1 アンチトリプシン欠乏症などが挙げられるがこれらに限定されない)従来の遺伝子療法に比べて利益を提供する。Bryson et al., Yale J. Biol. Med. 90(4):553-566, 19-Dec-2017を参照のこと。
Bompadaら(Int J Biochem細胞Biol. 2016 Dec;81(Pt A):82-91. doi: 10.1016/j.biocel.2016.10.022. Epub 2016 Oct 29)は、CRISPRを用いて膵臓β細胞のヒストンアセチルトランスフェラーゼを欠損させ、ヒストンアセチル化がグルコースによるTXNIP遺伝子発現の増加、ひいては糖毒性によるアポトーシスの重要な調節因子として機能することを実証したことを記載している。
視覚
本発明は、網膜の遺伝性および後天性眼疾患の効率的な治療を提供する。Holmgaardら(Mol. Ther. Nucleic Acids 9:89-99, 15-Dec-2017 doi: 10.1016/j.omtn.2017.08.016. Epub 2017 Sep 21)は、Vagfaを標的とするSpCas9をコードするSpCas9をレンチウイルスベクター(LV)で送達したときの高頻度の挿入欠失の形成について、また、形質導入細胞においてVEGFAの有意な減少があったことについて報告した。Duanら(J Biol Chem. 2016 Jul 29;291(31):16339-47. doi: 10.1074/jbc.M116.729467. Epub 2016 May 31)は、CRISPRを用いてヒトの初代網膜色素上皮細胞のMDM2ゲノム遺伝子座を編集することについて記載している。
本発明の方法および組成物は、加齢黄斑変性などの眼疾患の治療にも同様に応用することができる。
Huangら(Nat Commun. 2017 Jul 24;8(1):112. doi: 10.1038/s41467-017-00140-3)は、CRISPRを用いてVEGFR2を編集して血管形成関連疾患を治療した。
聴覚
Gaoら(Nature. 2017 Dec 20. doi: 10.1038/nature25164. [Epub ahead of print])は、CRISPR-Cas9を用いてマウスのTmc1遺伝子を標的化し、進行性の難聴および聴覚消失を低減するゲノム編集について報告している。
筋肉
Provenzanoら(Mol Ther Nucleic Acids. 9:337-348. 15-Dec-2017; doi: 10.1016/j.omtn.2017.10.006. Epub 2017 Oct 14)は、筋強直性ジストロフィー1患者の筋原細胞におけるCRISPR/Cas9を介したCTG伸長の除去および正常表現型への永続的な復帰について報告している。CTG伸長に限らず、ヌクレオチド反復障害に同様に本発明の方法および組成物を応用することができる。Tabebordbarら(2016 Jan 22;351(6271):407-411. doi: 10.1126/science.aad5177. Epub 2015 Dec 31)は、CRISPRを用いてDmdエクソン23遺伝子座を編集してDMDの破壊的変異を補正することについて報告している。Tabebordbarは、プログラム可能なCRISPR複合体を新生仔および成体マウスの最終分化した骨格筋線維および心筋細胞、ならびに筋サテライト細胞に局所的および全身的に送達することができ、そこで複合体は標的遺伝子の改変を媒介し、ジストロフィン発現を回復し、ジストロフィーの筋肉の機能障害を回復することを示している。Nelsonらの文献(Science. 2016 Jan 22;351(6271):403-7. doi: 10.1126/science.aad5143. Epub 2015 Dec 31)も参照のこと。
感染症
Sidikら(Cell. 2016 Sep 8;166(6):1423-1435.e12. doi: 10.1016/j.cell.2016.08.019. Epub 2016 Sep 2)およびPatelら(Nature. 2017 Aug 31;548(7669):537-542. doi: 10.1038/nature23477. Epub 2017 Aug 7)は、トキソプラズマのCRISPR選別および駆虫介入の拡大について記載している。
宿主と病原体との相互作用の根底にある成分および過程を特定するためのゲノム全体のCRISPR選別に関していくつかの報告がある。例としては、Blondelら(Cell Host Microbe. 2016 Aug 10;20(2):226-37. doi: 10.1016/j.chom.2016.06.010. Epub 2016 Jul 21)、Shapiroら(Nat Microbiol. 2018 Jan;3(1):73-82. doi: 10.1038/s41564-017-0043-0. Epub 2017 Oct 23)、およびParkら(Nat Genet. 2017 Feb;49(2):193-203. doi: 10.1038/ng.3741. Epub 2016 Dec 19)の文献が挙げられる。
Maら(Cell Host Microbe. 2017 May 10;21(5):580-591.e7. doi: 10.1016/j.chom.2017.04.005)は、ゲノム全体のCRISPR機能喪失選別を用いて、ウイルス形質転換により駆動される治療的介入の合成致死的な標的を特定した。
循環器疾患
血管疾患に関連する遺伝子または遺伝的多様体を特定するための手段としてCRISPRシステムを使用することができる。これは、有望な治療または予防標的を特定するのに役立つ。Xuら(Atherosclerosis, 2017 Sep. 21 pii: S0021-9150(17)31265-0. doi: 10.1016/j.atherosclerosis.2017.08.031. [Epub ahead of print])は、CRISPRを用いてANGPTL3遺伝子を欠損させ、血漿LDL-C濃度の調節におけるANGPTL3の役割を確認することについて報告している。Guptaら(Cell. 2017 Jul 27;170(3):522-533.e15. doi: 10.1016/j.cell.2017.06.049)は、CRISPRを用いて幹細胞由来内皮細胞を編集して血液疾患に関連する遺伝的多様体を特定することについて報告している。Beaudoinら(Arterioscler Thromb Vasc Biol. 2015 Jun;35(6):1472-1479. doi: 10.1161/ATVBAHA.115.305534. Epub 2015 Apr 2)は、CRISPRゲノム編集を用いて遺伝子座の転写因子MEF2の結合を破壊することについて報告している。これは、血管内皮におけるPHACTR1の機能がどのように冠状動脈疾患に影響を及ぼすかを調査するための土台である。Pashosら(Cell Stem Cell. 2017 Apr 6;20(4):558-570.e10. doi: 10.1016/j.stem.2017.03.017.)は、CRISPR技術を用いて多能性幹細胞および肝細胞様細胞を標的化して機能性多様体および脂質機能性遺伝子を特定することについて報告している。
CRISPRシステムは、標的を特定するための手段として使用されるだけでなく、既知の標的に関する循環器疾患を治療または予防するために直接使用されてもよい。Kheraら (Nat Rev Genet. 2017 Jun;18(6):331-344. doi: 10.1038/nrg.2016.160. Epub 2017 Mar 13)は、約60の遺伝子座を冠状動脈リスク(原因となるリスク因子をより深く理解できるようにするのに用いられ、)と結びつける一般的な多様体関連研究について記載しており、これは新たな治療薬の生物学的開発の基礎である。Kheraは、たとえばPCSK9の不活性化変異により循環LDLコレステロールが減少し、CADのリスクを下げたことからPCSK9阻害因子の開発に強い関心があると説明している。さらに、APOC3またはLPAの保護的変異を模倣するように設計されたアンチセンスオリゴヌクレオチドは、トリグリセリド濃度が約70%、循環リポタンパク質(a)濃度が80%、それぞれ減少した。また、Wangら(Arterioscler Thromb Vasc Biol. 2016 May;36(5):783-6. doi: 10.1161/ATVBAHA.116.307227. Epub 2016 Mar 3)およびDingら(Circ Res. 2014 Aug 15;115(5):488-92. doi: 10.1161/CIRCRESAHA.115.304351. Epub 2014 Jun 10.)は、循環器疾患の予防のためにCRISPRを用いて遺伝子Pcsk9を標的化することについて報告している。
本発明は、神経疾患および障害を調査および治療するための方法および組成物を提供する。Nakayamaら(Am J Hum Genet. 2015 May 7;96(5):709-19. doi: 10.1016/j.ajhg.2015.03.003. Epub 2015 Apr 9)は、CRISPRを用いてヒトのCNSの発症におけるPYCR2の役割を研究し、小頭症および白質形成不全の有望な標的を特定することについて報告している。Swiechら(Nat Biotechnol. 2015 Jan;33(1):102-6. doi: 10.1038/nbt.3055. Epub 2014 Oct 19)は、CRISPRを用いて成体マウスの脳においてin vivoで単一の遺伝子(Mecp2)および複数の遺伝子(Dnmt1, Dnmt3a and Dnmt3b)を標的化することについて報告している。Shinら(Hum Mol Genet. 2016 Oct 15;25(20):4566-4576. doi: 10.1093/hmg/ddw286)は、CRISPR
を用いてハンチントン病の変異を不活性化することについて記載している。Plattら(Cell Rep. 2017 Apr 11;19(2):335-350. doi: 10.1016/j.celrep.2017.03.052)は、CRISPR組込みマウスを用いて自閉症スペクトル障害におけるChd8の役割を特定することについて報告している。Seoら(J Neurosci. 2017 Oct 11;37(41):9917-9924. doi: 10.1523/JNEUROSCI.0621-17.2017. Epub 2017 Sep 14)は、CRISPRを用いて神経変性疾患のモデルを生成することについて記載している。Petersenら(Neuron. 2017 Dec 6;96(5):1003-1012.e7. doi: 10.1016/j.neuron.2017.10.008. Epub 2017 Nov 2)は、 demonstrate CRISPR knockout of activin A受容体型 I in乏突起膠細胞前駆細胞におけるアクチビンA受容体I型をCRISPRにより欠損させて再ミエリン化不全を伴う疾患の有望な標的を特定することを示している。本発明の方法および組成物を同様に応用することができる。
CRISPR技術のその他の用途
Rennevilleら(Blood. 2015 Oct 15;126(16):1930-9. doi: 10.1182/blood-2015-06-649087. Epub 2015 Aug 28)は、CRISPRを用いて胎児ヘモグロビン発現におけるEHMT1とEMHT2の役割を研究し、SCDの新しい治療標的を特定することについて報告している。
Tothovaら(Cell Stem Cell. 2017 Oct 5;21(4):547-555.e8. doi: 10.1016/j.stem.2017.07.015)は、CRISPRを造血幹細胞および前駆細胞において用いてヒト骨髄性疾患のモデルを作成することについて報告している。
Gianiら(Cell Stem Cell. 2016 Jan 7;18(1):73-78. doi: 10.1016/j.stem.2015.09.015. Epub 2015 Oct 22)は、ヒト多能性幹細胞においてCRISPR/Cas9ゲノム編集でSH2B3を不活性化したところ、分化を保存しつつ赤血球増殖を増強することができたと報告している。
Wakabayashiら(Proc Natl Acad Sci U S A. 2016 Apr 19;113(16):4434-9. doi: 10.1073/pnas.1521754113. Epub 2016 Apr 4)は、CRISPRを用いてGATA1転写活性への洞察を得、ヒト赤血球障害における非翻訳多様体の病原性を調査した。
Mandalら(Cell Stem Cell. 2014 Nov 6;15(5):643-52. doi: 10.1016/j.stem.2014.10.004. Epub 2014 Nov 6)は、初代ヒトCD4陽性T細胞ならびにCD34陽性造血幹細胞および前駆細胞(HSPC)において2つの臨床的に重要な遺伝子B2MおよびCCR5をCRISPR/Cas9で標的化することについて記載している。
Polfusら(Am J Hum Genet. 2016 Sep 1;99(3):785. doi: 10.1016/j.ajhg.2016.08.002. Epub 2016 Sep 1)はCRISPRを用いて、初代ヒト造血幹細胞および前駆細胞において造血細胞株を編集して標的発現抑制実験を追跡し、ヒトの造血におけるGFI1B多様体の役割を調査した。
Najmら(Nat Biotechnol. 2017 Dec 18. doi: 10.1038/nbt.4048. [Epub ahead of print])は、SaCas9とSpCas9の対を持つCRISPR複合体を用いて二重標的化を実現し、プールされた高度に複合化した二重欠損ライブラリーを作成し、複数の細胞型にかかる合成致死性かつ緩衝性の遺伝子対(MAPK経路遺伝子とアポトーシス遺伝子など)を特定することについて報告している。
Mangusoら(Nature. 2017 Jul 27;547(7664):413-418. doi: 10.1038/nature23270. Epub 2017 Jul 19.)はCRISPR選別を用いて新たな免疫療法標的を特定かつ/または確認することについて報告している。Rolandら(Proc Natl Acad Sci U S A. 2017 Jun 20;114(25):6581-6586. doi: 10.1073/pnas.1701263114. Epub 2017 Jun 12.)、Erbら(Nature. 2017 Mar 9;543(7644):270-274. doi: 10.1038/nature21688. Epub 2017 Mar 1.)、Hongら(Nat Commun. 2016 Jun 22;7:11987. doi: 10.1038/ncomms11987)、Feiら(Proc Natl Acad Sci U S A. 2017 Jun 27;114(26):E5207-E5215. doi: 10.1073/pnas.1617467114. Epub 2017 Jun 13.)、Zhangら(Cancer Discov. 2017 Sep 29. doi: 10.1158/2159-8290.CD-17-0532. [Epub ahead of print])の文献も参照のこと。
Joungら(Nature. 2017 Aug 17;548(7667):343-346. doi: 10.1038/nature23451. Epub 2017 Aug 9.)は、ゲノム全体の選別を用いて長鎖非翻訳RNA (lncRNA)を解析することについて報告している。Zhuら(Nat Biotechnol. 2016 Dec;34(12):1279-1286. doi: 10.1038/nbt.3715. Epub 2016 Oct 31)およびSanjanaらの文献(Science. 2016 Sep 30;353(6307):1545-1549)も参照のこと。
Barrowら(Mol Cell. 2016 Oct 6;64(1):163-175. doi: 10.1016/j.molcel.2016.08.023. Epub 2016 Sep 22.)は、ゲノム全体のCRISPR選別を用いてミトコンドリア病に関する治療標的を探すことについて報告している。Vafaiらの文献(PLoS One. 2016 Sep 13;11(9):e0162686. doi: 10.1371/journal.pone.0162686. eCollection 2016)も参照のこと。
Guoら(Elife. 2017 Dec 5;6. pii: e29329. doi: 10.7554/eLife.29329)はCRISPRを用いてヒト軟骨細胞を標的化し、ヒトの成長に関する生物学的機構を明らかにすることについて記載している。
Ramananら(Sci Rep. 2015 Jun 2;5:10833. doi: 10.1038/srep10833)はCRISPRを用いてHBVゲノムの保存領域を標的化し切断することについて報告している。
遺伝子ドライブ
本発明は、本明細書に記載のCRISPR-Casシステム(たとえばC2c1エフェクタータンパク質システム)をたとえばPCT特許公開公報WO 2015/105928に記載の遺伝子ドライブに似たシステムで用いて、RNAでガイドされる遺伝子ドライブを提供することも意図する。この種のシステムは、たとえば、RNAでガイドされるDNAヌクレアーゼおよび1つ以上のガイドRNAをコードする核酸配列を生殖細胞に導入することにより真核生物生殖細胞を改変する方法を提供してもよい。ガイドRNAを、生殖細胞のゲノムDNA上の1つ以上の標的位置に相補的であるように設計してもよい。RNAでガイドされるDNAヌクレアーゼをコードする核酸配列とガイドRNAをコードする核酸配列を、隣接配列間の構築物上に設けてもよく、生殖細胞がRNAでガイドされるヌクレアーゼとガイドRNAを、同じく隣接配列間に位置する任意の所望の積荷コード配列と共に発現し得るようにプロモーターを配置してもよい。隣接配列は、典型的には、選択された標的染色体上の対応する配列と同一の配列を含み、したがって隣接配列は構築物によってコードされる成分と共に作用して、外来核酸構築物配列をゲノムDNAの標的切断部位に相同組換えなどの機構により挿入し生殖細胞を外来性核酸配列とホモ接合性にするのを促す。このように、遺伝子ドライブシステムにより所望の積荷を育種集団全体に遺伝子移入することができる(Gantz et al., 2015, Highly efficient Cas9-mediated gene drive for population modification of the malaria vector mosquito Anopheles stephensi(マラリア媒介蚊ステフェンスハマダラカ(Anopheles stephensi)の集団改変のための高効率のCas9媒介性遺伝子ドライブ), PNAS 2015 (出版前に2015年11月23日に公開), doi:10.1073/pnas.1521077112; Esvelt et al., 2014, Concerning RNA-guided gene drives for the alteration of wild populations (野生型集団の改変のためのRNAでガイドされる遺伝子ドライブについて)eLife 2014;3:e03401)。実施態様によっては、本発明は、昆虫媒介性疾患、たとえばマラリア、ジカウイルス、ウエストナイルウイルス、日本脳炎ウイルス、およびデングウイルスなどを昆虫の育種集団全体に所望の積荷を遺伝子移入する遺伝子ドライブシステムにより制御する方法を提供する。実施態様によっては、遺伝子ドライブシステムはCRISPR-C2c1システムである。特定の実施態様では、昆虫は蚊である。選択された実施態様では、可能性のある非特異的部位がゲノム内にほとんどない標的配列を選択してもよい。複数のガイドRNAを用いて標的遺伝子座内の複数の部位を標的化すると、切断頻度が増加し、ドライブ抵抗性対立遺伝子の進化が妨げられる可能性がある。切断型ガイドRNAにより非特異的切断が低減する可能性がある。単一のヌクレアーゼの代わりに対になったニッカーゼ用いて特異性をさらに高めてもよい。遺伝子ドライブ構築物は、たとえば相同組換え遺伝子を活性化、かつ/または非相同末端結合を抑制するために転写調節遺伝子をコードする積荷配列を含んでいてもよい。非相同末端結合事象によりドライブ抵抗性対立遺伝子が得られるのではなく致死性が得られるように、必須遺伝子内で標的部位を選択してもよい。様々な温度で様々な宿主で機能するように遺伝子ドライブ構築物を設計することができる(Cho et al. 2013, Rapid and Tunable Control of Protein Stability in Caenorhabditis elegans Using a Small Molecule (小分子を用いた、線虫におけるタンパク質安定性の迅速かつ調節可能な制御), PLoS ONE 8(8): e72393. doi:10.1371/journal.pone.0072393)。本明細書で開示するCRISPR-C2c1システムを、GanzらおよびChoらの文献に記載の似た遺伝子ドライブ構築物およびシステムに応用してもよい。特定の実施態様では、CRISPR-C2c1システムは繁殖の調節に関与する遺伝子を改変する。実施態様によっては、CRISPR-C2c1システムは疾患関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜のバイオマス関連遺伝子を改変する。特定の実施態様では、CRISPR-C2c1システムは家畜の形質関連遺伝子を改変する。実施態様によっては、形質関連遺伝子は有害生物および真菌感染症の感受性に関与する。特定の実施態様では、CRISPR-C2c1システムを昆虫細胞に送達する。特定の実施態様では、昆虫細胞はミツバチの細胞である。実施態様によっては、CRISPR-C2c1システムを動物細胞に送達する。実施態様によっては、CRISPR-C2c1システムを非ヒト哺乳動物細胞に送達する。特定の実施態様では、形質関連遺伝子は体脂肪蓄積の調節に関与する。C2c1タンパク質について、CRISPR-C2c1システムはTに富むPAM配列を認識する。実施態様によっては、PAMは5’ TTN 3’または5’ ATTN 3’(Nは任意のヌクレオチド)である。実施態様によっては、CRISPR-C2c1システムは5’末端が突出した1つ以上のねじれ型二本鎖切断(DSB)を導入する。特定の実施態様では、5'末端の突出は7ヌクレオチドである。実施態様によっては、CRISPR-C2c1システムは外来性の鋳型DNA配列をねじれ型DSBにHRまたはNHEJによって導入する。実施態様によっては、C2c1エフェクタータンパク質は1つ以上の変異を含む。実施態様によっては、C2c1エフェクタータンパク質はニッカーゼである。特定の実施態様によっては、CRISPR-C2c1システムは目的の標的遺伝子座を改変する機能ドメインと会合した触媒的に不活性なC2c1タンパク質を含む。特定の実施態様では、CRISPR-C2c1システムは単一の変異を導入する。別の特定の実施態様では、CRISPR-C2c1システムは、家畜のゲノムを改変することなく、単一のヌクレオチド改変を目的の標的遺伝子座の転写物に導入する。
異種移植
本発明は、本明細書に記載のCRISPR-Casシステム(たとえばC2c1エフェクタータンパク質システム)を用いて、移植用の改変組織の提供に適した、RNAでガイドされるDNAヌクレアーゼを提供することも意図する。たとえば、RNAでガイドされるDNAヌクレアーゼを用いて、動物、たとえば遺伝子組換えブタ(ヒトヘムオキシゲナーゼ1遺伝子組換えブタ株など)の選択された遺伝子をたとえばヒト免疫系により認識されるエピトープを認識する遺伝子(すなわち異種抗原遺伝子)の発現を破壊することによりノックアウト(欠損させる)、ノックダウン(発現抑制する)、または破壊してもよい。破壊される候補のブタ遺伝子としては、たとえば、α(l,3)-ガラクトシルトランスフェラーゼおよびシチジン一リン酸-N-アセチルノイラミン酸ヒドロキシラーゼ遺伝子(PCT特許公開公報WO 2014/066505を参照のこと)を挙げることができる。また、内在性レトロウイルスをコードする遺伝子(たとえばすべてのブタ内在性レトロウイルスをコードする遺伝子)を破壊してもよい(Yang et al., 2015, Genome-wide inactivation of porcine endogenous retroviruses (PERVs) (ブタ内在性レトロウイルスのゲノム全体の不活性化), Science 27 November 2015: Vol. 350 no. 6264 pp. 1101-1104)。また、RNAでガイドされるDNAヌクレアーゼを用いて、異種移植ドナー動物においてさらなる遺伝子(ヒトCD55遺伝子など)を組み込むための部位を標的化して超急性拒絶反応に対する防御を改善してもよい。
遺伝子療法の一般的な考慮事項
疾患関連遺伝子およびポリヌクレオチドの例と疾患特異的情報は、ジョンズ・ホプキンズ大学(メリーランド州、ボルチモア)のマキュージック・ネイサン遺伝医学研究所(McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University)および米国国立医学図書館(メリーランド州、ベセスダ)の米国国立生物工学情報センター(National Center for Biotechnology Information, National Library of Medicine)(ウェブサイトで利用可能)から入手することができる。
これらの遺伝子および経路の変異により、機能に影響を及ぼす不適切なタンパク質または不適切な量のタンパク質が産生される可能性がある。遺伝子、疾患、およびタンパク質のさらなる例は、2012年12月12日出願の米国仮出願第61/736,527号から参照により本明細書に組み込まれる。このような遺伝子、タンパク質、および経路が本発明のCRISPR複合体の標的ポリヌクレオチドであってもよい。疾患関連遺伝子およびポリヌクレオチドの例を表7および8に示す。シグナル伝達生化学経路関連遺伝子およびポリヌクレオチドの例を表9に示す。
Figure 2024138266000049
Figure 2024138266000050
Figure 2024138266000051
Figure 2024138266000052
Figure 2024138266000053
Figure 2024138266000054
Figure 2024138266000055
Figure 2024138266000056
Figure 2024138266000057
Figure 2024138266000058
Figure 2024138266000059
Figure 2024138266000060
Figure 2024138266000061
Figure 2024138266000062
Figure 2024138266000063
Figure 2024138266000064
Figure 2024138266000065
本発明の実施態様は、遺伝子の欠損、遺伝子の増幅、ならびにDNA反復不安定および神経障害に関連する特定の変異の修復に関連する、方法および組成物にも関する(Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical)。縦列反復配列の特定の側面は、20を超えるヒトの疾患の原因であることがわかっている(New insights into repeat instability: role of RNA・DNA hybrids (反復不安定に関する新たな洞察: RNA-DNAハイブリッドの役割). McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8)。本エフェクタータンパク質システムを利用してゲノム不安定というこれらの欠陥を補正してもよい。
本発明のいくつかのさらなる側面は、広範な遺伝子疾患に関連する欠陥を補正することに関し、それらの遺伝子疾患は米国国立衛生研究所(National Institutes of Health)のウェブサイトに「遺伝子疾患」という論題の小節でさらに記載されている(health.nih.gov/topic/GeneticDisordersにあるウェブサイト)。遺伝子脳疾患としては、副腎白質ジストロフィー、脳梁欠損症、アイカルディ症候群、アルパース病、アルツハイマー病、バース症候群、バッテン病、CADASIL、小脳変性症、ファブリー病、ゲルストマン・シュトロイスラー・シャインカー病、ハンチントン病および他の三塩基反復病、リー症候群、レッシュ・ナイハン症候群、メンケス病、ミトコンドリア筋症、ならびにNINDS脳梁欠損症を挙げることができるが、これらに限定されない。これらの疾患は、米国国立衛生研究所のウェブサイトに「遺伝子脳障害」という小節でさらに記載されている。
本開示全体で、CRISPRもしくはCRISPR-Cas複合体またはシステムについて言及してきた。CRISPRシステムまたは複合体は核酸分子を標的化することができ、たとえば、CRISPR-C2c1複合体は標的DNA分子を標的化し切断する(すなわち切れ目を入れる)、または単に標的DNA分子上に位置することができる(C2c1がニッカーゼになる、または「死ぬ」ような変異を有するかどうかによる)。このようなシステムまたは複合体は、候補疾患遺伝子の組織特異的かつ時間制御された標的欠失を達成するのに適している。たとえば、障害の中でも特にコレステロールおよび脂肪酸代謝、アミロイド疾患、優性阻害性疾患、潜伏ウイルス感染、などに関与する遺伝子が挙げられるが、これらに限定されない。したがって、そのようなシステムまたは複合体の標的配列は、たとえば以下の候補疾患遺伝子に存在する可能性がある。
Figure 2024138266000066
したがって、CRISPRまたはCRISPR-Cas複合体に関して、本発明は造血器障害の補正を意図する。たとえば、重症複合免疫不全症(SCID)は、Tリンパ球の成熟の異常によって起こり、常にBリンパ球の機能異常を伴う(Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109)。SCIDの形態の1つであるアデノシンデアミナーゼ(ADA)欠乏症の場合、組換えアデノシンデアミナーゼ酵素の注入により患者を治療することができる。ADA遺伝子はSCID患者では変異していることがわかって(Giblett et al., Lancet, 1972, 2, 1067-1069)以来、SCIDに関与する他のいくつかの遺伝子が特定されている(Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109)。SCIDには4つの主な原因がある。(i)SCIDの最も頻繁な形態であるSCID-X1(X連鎖性SCIDまたはX-SCID)は、IL2RG遺伝子の変異によって引き起こされ、成熟Tリンパ球およびNK細胞の欠如につながる。IL2RGは、少なくとも5つのインターロイキン受容体複合体の共通成分であるガンマCタンパク質(Noguchi, et al., Cell, 1993, 73, 147-157)をコードする。これらの受容体は、JAK3キナーゼを介していくつかの標的を活性化し(Macchi et al., Nature, 1995, 377, 65-68)、これが不活性化するとガンマC不活性化と同じ症候群が起こる。(ii)ADA遺伝子の変異は、リンパ球前駆細胞にとって致命的なプリン代謝の異常を起こし、その結果、B細胞、T細胞、およびNK細胞がほぼなくなる。(iii)V(D)J組換えは、免疫グロブリンおよびTリンパ球受容体(TCR)の成熟に不可欠な工程である。この過程に関与する3つの遺伝子である組換え活性化遺伝子1および2(RAG1およびRAG2)ならびにArtemisの変異により、成熟したTリンパ球およびBリンパ球が存在しなくなる。(iv)T細胞特異的シグナル伝達に関与するその他の遺伝子(CD45など)の変異も報告されているが、これはごくわずかな症例にあたる(Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109)。CRISPRまたはCRISPR-Cas複合体システムに関する本発明の側面では、本発明は、それを用いていくつかの遺伝子変異(Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012にさらに記載されている)によって起こる眼の異常を補正してもよいことを意図する。補正される眼の異常の非限定的な例としては、黄斑変性(MD)、網膜色素変性症(RP)が挙げられる。眼の異常に関連する遺伝子およびタンパク質の非限定的な例としては、以下のタンパク質が挙げられるが、これらに限定されない:(ABCA4) ATP結合カセット、サブファミリーA (ABC1)、メンバー4、ACHM1 (色覚異常(桿体1色覚)1)、ApoE (アポリポタンパク質E)、C1QTNF5 (CTRP5) (C1qおよび腫瘍壊死因子関連タンパク質5)、C2補体成分2 (C2)、C3補体成分(C3)、CCL2 (ケモカイン(C-Cモチーフ)リガンド2)、CCR2 (ケモカイン(C-Cモチーフ)受容体2、CD36 (表面抗原分類36)、CFB (補体因子B)、CFH (補体因子CFH)、H CFHR1 (補体因子H関連1)、CFHR3 (補体因子H関連3)、CNGB3 (環状ヌクレオチド感受性チャンネルβ3)、CP (セルロプラスミン)、CRP (C反応性タンパク質)、CST3 (シスタチンCまたはシスタチン3)、CTSD (カテプシンD)、CX3CR1 (ケモカイン(C-X3-Cモチーフ)受容体1)、ELOVL4 (超長鎖脂肪酸伸長4)、ERCC6 (除去修復相互補完、げっ歯類修復不全、相補群6)、FBLN5 (フィブリン5)、FBLN5 (フィブリン5)、FBLN6 (フィブリン6)、FSCN2 (ファスシン)、HMCN1 (ヘミセンチン1)、HMCN1 (ヘミセンチン1)、HTRA1 (HtrAセリンペプチダーゼ1)、HTRA1 (HtrAセリンペプチダーゼ1)、IL-6 (インターロイキン6)、IL-8 (インターロイキン8)、LOC387715 (仮説上のタンパク質)、PLEKHA1 (プレクストリン相同ドメイン含有ファミリーAメンバー1)、PROM1 (プロミニン1) (PROM1またはCD133)、PRPH2 (ペリフェリン2)、RPGR (網膜色素変性GTPアーゼ調節因子)、SERPING1 (セルピンペプチダーゼ阻害因子、系統群G、メンバー1 (C1阻害因子))、TCOF1 (トリークル)、TIMP3 (メタロプロテイナーゼ阻害因子3)、TLR3 (Toll様受容体3)。CRISPRまたはCRISPR-Cas複合体に関して、本発明は、心臓への送達も意図する。心臓の場合、心筋指向性アデノ随伴ウイルス(AAVM)、特に心臓において優先的な遺伝子移入を示したAAVM41が好ましい(たとえば、Lin-Yanga et al., PNAS, March 10, 2009, vol. 106, no. 10を参照のこと)。米国特許出願公開第20110023139号は、循環器疾患に関連する細胞、動物、およびタンパク質を遺伝子編集するための亜鉛フィンガーヌクレアーゼの使用について記載している。循環器疾患としては一般に、高血圧、心臓発作、心不全、脳卒中および一過性脳虚血発作(TIA)が挙げられる。例として、染色体配列としては以下を包含することができるが、これらに限定されない:IL1B (インターロイキン1、β)、XDH (キサンチンデヒドロゲナーゼ)、TP53 (腫瘍タンパク質p53)、PTGIS (プロスタグランジン12(プロスタサイクリン)シンターゼ)、MB (ミオグロビン)、IL4 (インターロイキン4)、ANGPT1 (アンジオポエチン1)、ABCG8 (ATP結合カセット,サブファミリーG (WHITE)、メンバー8)、CTSK (カテプシンK)、PTGIR (プロスタグランジン12(プロスタサイクリン)受容体(IP))、KCNJ11 (内向き整流性カリウムチャンネル、サブファミリーJ、メンバー11)、INS (インスリン)、CRP (C反応性タンパク質、ペントラキシン関連)、PDGFRB (血小板由来成長因子受容体、βポリペプチド)、CCNA2 (サイクリンA2)、PDGFB (血小板由来成長因子βポリペプチド(サル肉腫ウイルス(v-sis)がん遺伝子相同体))、KCNJ5 (内向き整流性カリウムチャンネル、サブファミリーJ、メンバー5)、KCNN3 (中間/小コンダクタンスカルシウム活性化カリウムチャンネル、サブファミリーN、メンバー3)、CAPN10 (カルパイン10)、PTGES (プロスタグランジンEシンターゼ)、ADRA2B (アドレナリン作動性、α2B、受容体)、ABCG5 (ATP-結合カセット、サブファミリーG (WHITE)、メンバー5)、PRDX2 (ペルオキシレドキシン2)、CAPN5 (カルパイン5)、PARP14 (ポリ(ADP-リボース)ポリメラーゼファミリー、メンバー14)、MEX3C (mex-3相同体C (線虫))、ACE (アンジオテンシンI変換酵素(ペプチジル-ジペプチダーゼA)1)、TNF (腫瘍壊死因子(TNFスーパーファミリー、メンバー2))、IL6 (インターロイキン6 (インターフェロン、β2))、STN (スタチン)、SERPINE1 (セルピンペプチダーゼ阻害因子、系統群E (ネキシン、プラスミノーゲン活性化因子 阻害因子1型)、メンバー1)、ALB (アルブミン)、ADIPOQ (アディポネクチン、C1Qおよびコラーゲンドメイン含有)、APOB (アポリポタンパク質B (Ag(x)抗原を含む))、APOE (アポリポタンパク質E)、LEP (レプチン)、MTHFR (5,10-メチレンテトラヒドロ葉酸レダクターゼ(NADPH))、APOA1 (アポリポタンパク質A-I)、EDN1 (エンドセリン1)、NPPB (ナトリウム利尿ペプチド前駆体B)、NOS3 (一酸化窒素合成酵素3(内皮細胞))、PPARG (ペルオキシソーム増殖剤活性化受容体γ)、PLAT (プラスミノーゲン活性化因子、組織)、PTGS2 (プロスタグランジン-エンドペルオキシドシンターゼ2 (プロスタグランジンG/Hシンターゼおよびシクロオキシゲナーゼ))、CETP (コレステリルエステル転送タンパク質、血漿)、AGTR1 (アンジオテンシンII受容体、1型)、HMGCR (3-ヒドロキシ-3-メチルグルタリル補酵素Aレダクターゼ)、IGF1 (インスリン様成長因子1(ソマトメジンC))、SELE (セレクチンE)、REN (レニン)、PPARA (ペルオキシソーム増殖剤活性化受容体α)、PON1 (パラオキソナーゼ1)、KNG1 (キニノーゲン1)、CCL2 (ケモカイン(C-Cモチーフ)リガンド2)、LPL (リポタンパク質リパーゼ)、VWF (フォン・ヴィルブランド因子)、F2 (凝固因子II (トロンビン))、ICAM1 (細胞間接着分子1)、TGFB1 (形質転換成長因子、β1)、NPPA (ナトリウム利尿ペプチド前駆体A)、IL10 (インターロイキン10)、EPO (エリスロポエチン)、SOD1 (スーパーオキシドジスムターゼ1、可溶性)、VCAM1 (血管細胞接着分子 1)、IFNG (インターフェロン、γ)、LPA (リポタンパク質、Lp(a))、MPO (ミエロペルオキシダーゼ)、ESR1 (エストロゲン受容体1)、MAPK1 (分裂促進因子活性化タンパク質キナーゼ1)、HP (ハプトグロビン)、F3 (凝固因子III (トロンボプラスチン、組織因子))、CST3 (シスタチンC)、COG2 (オリゴマーゴルジ複合体成分2)、MMP9 (マトリックスメタロペプチダーゼ9 (ゼラチナーゼB、92kDaゼラチナーゼ、92kDa IV型コラゲナーゼ))、SERPINC1 (セルピンペプチダーゼ阻害因子、系統群C (アンチトロンビン)、メンバー1)、F8 (凝固因子VIII、凝血原成分)、HMOX1 (ヘムオキシゲナーゼ(脱環化 (decycling)) 1)、APOC3 (アポリポタンパク質C-III)、IL8 (インターロイキン8)、PROK1 (プロキネチシン1)、CBS (シスタチオニンβシンターゼ)、NOS2 (一酸化窒素合成酵素2、誘導性)、TLR4 (toll様受容体4)、SELP (セレクチンP (顆粒膜タンパク質140kDa、抗原CD62))、ABCA1 (ATP結合カセット、サブファミリーA (ABC1)、メンバー1)、AGT (アンジオテンシノーゲン(セルピンペプチダーゼ阻害因子、系統群A、メンバー8))、LDLR (低密度リポタンパク質受容体)、GPT (グルタミン酸ピルビン酸トランスアミナーゼ(アラニンアミノトランスフェラーゼ))、VEGFA (血管内皮成長因子A)、NR3C2 (核内受容体サブファミリー3、C群、メンバー2)、IL18 (インターロイキン18 (インターフェロンγ誘導因子))、NOS1 (一酸化窒素合成酵素1 (神経細胞))、NR3C1 (核内受容体サブファミリー3、C群、メンバー1 (糖質コルチコイド受容体))、FGB (フィブリノーゲンβ鎖)、HGF (肝細胞増殖因子(ヘパポエチンA; 散乱因子))、IL1A (インターロイキン1、α)、RETN (レジスチン)、AKT1 (v-aktマウス胸腺腫ウイルスがん遺伝子相同体1)、LIPC (リパーゼ、肝臓)、HSPD1 (熱ショック60kDaタンパク質1 (シャペロニン))、MAPK14 (分裂促進因子活性化タンパク質キナーゼ14)、SPP1 (分泌型リンタンパク質1)、ITGB3 (インテグリン、β3 (血小板糖タンパク質111a、抗原CD61))、CAT (カタラーゼ)、UTS2 (ウロテンシン2)、THBD (トロンボモジュリン)、F10 (凝固因子X)、CP (セルロプラスミン(フェロキシダーゼ))、TNFRSF11B (腫瘍壊死因子受容体スーパーファミリー、メンバー11b)、EDNRA (エンドセリン受容体A型)、EGFR (上皮細胞成長因子受容体 (赤芽球性白血病ウイルス(v-erb-b) がん遺伝子相同体、鳥類))、MMP2 (マトリックスメタロペプチダーゼ2 (ゼラチナーゼA、72kDaゼラチナーゼ、72kDa IV型コラゲナーゼ))、PLG (プラスミノーゲン)、NPY (神経ペプチドY)、RHOD (ras相同体遺伝子ファミリー、メンバーD)、MAPK8 (分裂促進因子活性化タンパク質キナーゼ8)、MYC (v-myc骨髄球腫症ウイルスがん遺伝子相同体(鳥類))、FN1 (フィブロネクチン1)、CMA1 (キマーゼ1、肥満細胞)、PLAU (プラスミノーゲン活性化因子、ウロキナーゼ)、GNB3 (グアニンヌクレオチド結合タンパク質(Gタンパク質)、βポリペプチド3)、ADRB2 (アドレナリン作動性、β2、受容体、表面)、APOA5 (アポリポタンパク質A-V)、SOD2 (スーパーオキシドジスムターゼ2、ミトコンドリア)、F5 (凝固因子V (プロアクセレリン、不安定因子))、VDR (ビタミンD (1,25-ジヒドロキシビタミンD3)受容体)、ALOX5 (アラキドン酸-5-リポキシゲナーゼ)、HLA-DRB1 (主要組織適合複合体、クラスII、DRβ1)、PARP1 (ポリ(ADP-リボース)ポリメラーゼ1)、CD40LG (CD40リガンド)、PON2 (パラオキソナーゼ2)、AGER (終末糖化産物特異的受容体)、IRS1 (インスリン受容体基質1)、PTGS1 (プロスタグランジン-エンドペルオキシドシンターゼ1 (プロスタグランジンG/Hシンターゼおよびシクロオキシゲナーゼ))、ECE1 (エンドセリン変換酵素1)、F7 (凝固因子VII (血清プロトロンビン転化促進因子))、URN (インターロイキン1受容体拮抗物質)、EPHX2 (エポキシドヒドロラーゼ2、細胞質)、IGFBP1 (インスリン様成長因子結合タンパク質1)、MAPK10 (分裂促進因子活性化タンパク質キナーゼ10)、FAS (Fas (TNF受容体スーパーファミリー、メンバー6))、ABCB1 (ATP-結合カセット、サブ
ファミリーB (MDR/TAP)、メンバー1)、JUN (junがん遺伝子)、IGFBP3 (インスリン様成長因子結合タンパク質3)、CD14 (CD14分子)、PDE5A (ホスホジエステラーゼ5A、cGMP特異的)、AGTR2 (アンジオテンシンII受容体、2型)、CD40 (CD40分子、TNF受容体スーパーファミリーメンバー5)、LCAT (レシチン・コレステロールアシルトランスフェラーゼ)、CCR5 (ケモカイン (C-Cモチーフ)受容体5)、MMP1 (マトリックスメタロペプチダーゼ1 (腸コラゲナーゼ))、TIMP1 (TIMPメタロペプチダーゼ阻害因子1)、ADM (アドレノメデュリン)、DYT10 (ジストニア10)、STAT3 (シグナル伝達兼転写活性化因子3 (急性期応答因子))、MMP3 (マトリックスメタロペプチダーゼ3 (ストロメライシン1、プロゼラチナーゼ))、ELN (エラスチン)、USF1 (上流転写因子1)、CFH (補体因子H)、HSPA4 (熱ショック70kDaタンパク質4)、MMP12 (マトリックスメタロペプチダーゼ12 (マクロファージエラスターゼ))、MME (膜メタロエンドペプチダーゼ)、F2R (凝固因子II(トロンビン)受容体)、SELL (セレクチンL)、CTSB (カテプシンB)、ANXA5 (アネキシンA5)、ADRB1 (アドレナリン作動性、β1-、受容体)、CYBA (チトクロムb-245、αポリペプチド)、FGA (フィブリノーゲンα鎖)、GGT1 (γ-グルタミルトランスフェラーゼ1)、LIPG (リパーゼ、内皮)、HIF1A (低酸素誘導因子1、αサブユニット(塩基性ヘリックス・ループ・ヘリックス転写因子))、CXCR4 (ケモカイン(C-X-Cモチーフ)受容体4)、PROC (タンパク質C (凝固因子VaおよびVIIIa不活化因子))、SCARB1 (スカベンジャー受容体クラスB、メンバー1)、CD79A (CD79a分子、免疫グロブリン関連α)、PLTP (リン脂質輸送タンパク質)、ADD1 (アデュシン1 (α))、FGG (フィブリノーゲンγ鎖)、SAA1 (血清アミロイドA1)、KCNH2 (電位依存性カリウムチャンネル、サブファミリーH (eag関連)、メンバー2)、DPP4 (ジペプチジルペプチダーゼ4)、G6PD (グルコース-6-リン酸デヒドロゲナーゼ)、NPR1 (ナトリウム利尿ペプチド受容体A/グアニル酸シクラーゼA (心房性ナトリウム利尿ペプチド受容体A))、VTN (ビトロネクチン)、KIAA0101 (KIAA0101)、FOS (FBJマウス骨肉腫ウイルスがん遺伝子相同体)、TLR2 (toll様受容体2)、PPIG (ペプチジルプロリルイソメラーゼG (シクロフィリンG))、IL1R1 (インターロイキン1受容体、I型)、AR (アンドロゲン受容体)、CYP1A1 (チトクロムP450、ファミリー1、サブファミリーA、ポリペプチド1)、SERPINA1 (セルピンペプチダーゼ阻害因子、系統群A (α1抗プロテイナーゼ、アンチトリプシン)、メンバー1)、MTR (5-メチルテトラヒドロ葉酸-ホモシステインメチルトランスフェラーゼ)、RBP4 (レチノール結合タンパク質4、血漿)、APOA4 (アポリポタンパク質A-IV)、CDKN2A (サイクリン依存性キナーゼ阻害因子2A (黒色腫、p16、CDK4を阻害))、FGF2 (線維芽細胞成長因子2 (塩基性))、EDNRB (エンドセリン受容体B型)、ITGA2 (インテグリン、α2 (CD49B、VLA-2受容体α2サブユニット))、CABIN1 (カルシニューリン結合タンパク質1)、SHBG (性ホルモン結合グロブリン)、HMGB1 (高移動度群ボックス1)、HSP90B2P (熱ショックタンパク質90kDa β (Grp94)、メンバー2 (偽遺伝子))、CYP3A4 (チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド4)、GJA1 (ギャップ結合タンパク質、α1、43kDa)、CAV1 (カベオリン1、カベオラタンパク質、22kDa)、ESR2 (エストロゲン受容体2 (ERβ))、LTA (リンホトキシンα (TNFスーパーファミリー、メンバー1))、GDF15 (増殖分化因子15)、BDNF (脳由来神経栄養因子)、CYP2D6 (チトクロムP450、ファミリー2、サブファミリーD、ポリペプチド6)、NGF (神経成長因子(βポリペプチド))、SP1 (Sp1転写因子)、TGIF1 (TGFB誘導性因子ホメオボックス1)、SRC (v-src肉腫(シュミット・ルピンA-2)ウイルスがん遺伝子相同体(鳥類))、EGF (上皮細胞成長因子(βウロガストロン))、PIK3CG (ホスホイノシチド-3-キナーゼ、触媒性、γポリペプチド)、HLA-A (主要組織適合複合体、クラスI、A)、KCNQ1 (電位依存性カリウムチャンネル、KQT様サブファミリー、メンバー1)、CNR1 (カンナビノイド受容体1 (脳))、FBN1 (フィブリリン1)、CHKA (コリンキナーゼα)、BEST1 (ベストロフィン1)、APP (アミロイドβ(A4) 前駆体タンパク質)、CTNNB1 (カテニン(カドヘリン関連タンパク質)、β1、88kDa)、IL2 (インターロイキン2)、CD36 (CD36分子(トロンボスポンジン受容体))、PRKAB1 (タンパク質キナーゼ、AMP活性化、β1非触媒性サブユニット)、TPO (甲状腺ペルオキシダーゼ)、ALDH7A1 (アルデヒドデヒドロゲナーゼ 7 ファミリー、メンバーA1)、CX3CR1 (ケモカイン (C-X3-Cモチーフ)受容体1)、TH (チロシンヒドロキシラーゼ)、F9 (凝固因子IX)、GH1 (成長ホルモン1)、TF (トランスフェリン)、HFE (ヘモクロマトーシス)、IL17A (インターロイキン17A)、PTEN (ホスファターゼ・テンシン相同体)、GSTM1 (グルタチオンS-トランスフェラーゼμ1)、DMD (ジストロフィン)、GATA4 (GATA結合タンパク質4)、F13A1 (凝固因子XIII、A1ポリペプチド)、TTR (トランスサイレチン)、FABP4 (脂肪酸結合タンパク質4、脂肪細胞)、PON3 (パラオキソナーゼ3)、APOC1 (アポリポタンパク質C-I)、INSR (インスリン受容体)、TNFRSF1B (腫瘍壊死因子受容体スーパーファミリー、メンバー1B)、HTR2A (5-ヒドロキシトリプタミン(セロトニン)受容体2A)、CSF3 (コロニー刺激因子3 (顆粒球))、CYP2C9 (チトクロムP450、ファミリー2、サブファミリーC、ポリペプチド9)、TXN (チオレドキシン)、CYP11B2 (チトクロムP450、ファミリー11、サブファミリーB、ポリペプチド2)、PTH (副甲状腺ホルモン)、CSF2 (コロニー刺激因子2 (顆粒球-マクロファージ))、KDR (キナーゼ挿入ドメイン受容体 (III型受容体チロシンキナーゼ))、PLA2G2A (ホスホリパーゼA2、IIA群(血小板、滑液))、B2M (β2ミクログロブリン)、THBS1 (トロンボスポンジン1)、GCG (グルカゴン)、RHOA (ras相同体遺伝子ファミリー、メンバーA)、ALDH2 (アルデヒドデヒドロゲナーゼ2ファミリー(ミトコンドリア))、TCF7L2 (転写因子7様2 (T細胞特異的、HMGボックス))、BDKRB2 (ブラジキニン受容体B2)、NFE2L2 (核内因子(赤血球由来2)様2)、NOTCH1 (ノッチ相同体1、転座関連(ショウジョウバエ属))、UGT1A1 (UDPグルクロノシルトランスフェラーゼ1ファミリー、ポリペプチドA1)、IFNA1 (インターフェロン、α1)、PPARD (ペルオキシソーム増殖剤活性化受容体Δ)、SIRT1 (サーチュイン(サイレント接合型情報調節2相同体) 1 (出芽酵母))、GNRH1 (性腺刺激ホルモン放出ホルモン1 (黄体化ホルモン放出ホルモン))、PAPPA (妊娠関連血漿タンパク質A、パッパリシン1)、ARR3 (アレスチン3、網膜(Xアレスチン))、NPPC (ナトリウム利尿ペプチド前駆体C)、AHSP (αヘモグロビン安定化タンパク質)、PTK2 (PTK2タンパク質チロシンキナーゼ2)、IL13 (インターロイキン13)、MTOR (ラパマイシン標的タンパク質(セリン/スレオニンキナーゼ))、ITGB2 (インテグリン、β2 (補体成分3受容体3および4サブユニット))、GSTT1 (グルタチオンS-トランスフェラーゼθ1)、IL6ST (インターロイキン6シグナル伝達因子 (gp130、オンコスタチンM受容体))、CPB2 (カルボキシペプチダーゼB2 (血漿))、CYP1A2 (チトクロムP450、ファミリー1、サブファミリーA、ポリペプチド2)、HNF4A (肝細胞核因子4、α)、SLC6A4 (溶質輸送体ファミリー6 (神経伝達物質輸送体、セロトニン)、メンバー4)、PLA2G6 (ホスホリパーゼA2、VI群(細胞質ゾル、カルシウム依存性))、TNFSF11 (腫瘍壊死因子(リガンド)スーパーファミリー、メンバー11)、SLC8A1 (溶質輸送体ファミリー8 (ナトリウム/カルシウム交換輸送体)、メンバー1)、F2RL1 (凝固因子II (トロンビン)受容体様1)、AKR1A1 (アルド・ケトレダクターゼファミリー1、メンバーA1 (アルデヒドレダクターゼ))、ALDH9A1 (アルデヒドデヒドロゲナーゼ 9 ファミリー、メンバーA1)、BGLAP (骨γカルボキシグルタミン酸(gla)タンパク質)、MTTP (ミクロソームトリグリセリド輸送タンパク質)、MTRR (5-メチルテトラヒドロ葉酸-ホモシステインメチルトランスフェラーゼレダクターゼ)、SULT1A3 (スルホトランスフェラーゼファミリー、細胞質ゾル、1A、フェノール選択性、メンバー3)、RAGE (腎腫瘍抗原)、C4B (補体成分4B (Chido式血液型)、P2RY12 (プリン作動性受容体P2Y、Gタンパク質共役型、12)、RNLS (レナラーゼ、FAD依存性アミンオキシダーゼ)、CREB1 (cAMP応答配列結合タンパク質1)、POMC (プロオピオメラノコルチン)、RAC1 (ras関連C3ボツリヌス毒素基質1 (rhoファミリー、低分子GTP結合タンパク質Rac1))、LMNA (ラミンNC)、CD59 (CD59分子、補体調節タンパク質)、SCN5A (ナトリウムチャンネル、電位依存性、V型、αサブユニット)、CYP1B1 (チトクロムP450、ファミリー1、サブファミリーB、ポリペプチド1)、MIF (マクロファージ遊走阻害因子(グリコシル化阻害因子))、MMP13 (マトリックスメタロペプチダーゼ13 (コラゲナーゼ3))、TIMP2 (TIMPメタロペプチダーゼ阻害因子2)、CYP19A1 (チトクロムP450、ファミリー19、サブファミリーA、ポリペプチド1)、CYP21A2 (チトクロムP450、ファミリー21、サブファミリーA、ポリペプチド2)、PTPN22 (タンパク質チロシンホスファターゼ、非受容体22型(リンパ系))、MYH14 (ミオシン、重鎖14、非筋肉)、MBL2 (マンノース結合レクチン(タンパク質C) 2、可溶性(オプソニン欠損))、SELPLG (セレクチンPリガンド)、AOC3 (アミンオキシダーゼ、銅含有3 (血管接着タンパク質1))、CTSL1 (カテプシンL1)、PCNA (増殖性細胞核抗原)、IGF2 (インスリン様成長因子2 (ソマトメジンA))、ITGB1 (インテグリン、β1 (フィブロネクチン受容体、βポリペプチド、抗原CD29はMDF2、MSK12を含む))、CAST (カルパスタチン)、CXCL12 (ケモカイン (C-X-Cモチーフ)リガンド12 (間質細胞由来因子1))、IGHE (免疫グロブリン重鎖定常ε)、KCNE1 (電位依存性カリウムチャンネル、Isk関連ファミリー、メンバー1)、TFRC (トランスフェリン受容体 (p90、CD71))、COL1A1 (コラーゲン、I型、α1)、COL1A2 (コラーゲン、I型、α2)、IL2RB (インターロイキン2受容体、β)、PLA2G10 (ホスホリパーゼA2、X群)、ANGPT2 (アンジオポエチン2)、PROCR (タンパク質C受容体、内皮(EPCR))、NOX4 (NADPHオキシダーゼ4)、HAMP (ヘプシジン抗菌ペプチド)、PTPN11 (タンパク質チロシンホスファターゼ、非受容体11型)、SLC2A1 (溶質輸送体ファミリー2 (促進性グルコース輸送体)、メンバー1)、IL2RA (インターロイキン2受容体、α)、CCL5 (ケモカイン(C-C モチーフ)リガンド5)、IRF1 (インターフェロン調節因子1)、CFLAR (CASP8およびFADD様アポトーシス調節因子)、CALCA (カルシトニン関連ポリペプチドα)、EIF4E (真核生物翻訳開始因子4E)、GSTP1 (グルタチオンS-トランスフェラーゼπ1)、JAK2 (ヤヌスキナーゼ2)、CYP3A5 (チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド5)、HSPG2 (ヘパラン硫酸プロテオグリカン2)、CCL3 (ケモカイン(C-Cモチーフ)リガンド3)、MYD88 (ミエロイド分化一次応答遺伝子(88))、VIP (血管作動性腸ペプチド)、SOAT1 (ステロールO-アシルトランスフェラーゼ1)、ADRBK1 (アドレナリン作動性、β、受容体キナーゼ1)、NR4A2 (核内受容体サブファミリー4、A型、メンバー2)、MMP8 (マトリックスメタロペプチダーゼ8 (好中球コラゲナーゼ))、NPR2 (ナトリウム利尿ペプチド受容体B/グアニル酸シクラーゼB (心房性ナトリウム利尿ペプチド受容体B))、GCH1 (GTPシクロヒドロラーゼ1)、EPRS (グルタミル-プロリル-tRNAシンテターゼ)、PPARGC1A (ペルオキシソーム増殖剤活性化受容体γ、活性化補助因子1α)、F12 (凝固因子XII (ハーゲマン因子))、PECAM1 (血小板/内皮細胞接着分子)、CCL4 (ケモカイン(C-Cモチーフ)リガンド4)、SERPINA3 (セルピンペプチダーゼ阻害因子、系統群A (α-1抗プロテイナーゼ、アンチトリプシン)、メンバー3)、CASR (カルシウム感知受容体)、GJA5 (ギャップ結合タンパク質、α5、40kDa)、FABP2 (脂肪酸結合タンパク質2、腸)、TTF2 (転写終結因子、RNAポリメラーゼ II)、PROS1 (タンパク質S(α))、CTF1 (カルジオトロフィン1)、SGCB (サルコグリカン、β(43kDaジストロフィン関連糖タンパク質))、YME1L1 (YME1様1 (出芽酵母))、CAMP
(カテリシジン抗菌ペプチド)、ZC3H12A (亜鉛フィンガーCCCH型含有12A)、AKR1B1 (アルド・ケトレダクターゼファミリー1、メンバーB1 (アルドースレダクターゼ))、DES (デスミン)、MMP7 (マトリックスメタロペプチダーゼ7 (マトリライシン、子宮))、AHR (アリール炭化水素受容体)、CSF1 (コロニー刺激因子1 (マクロファージ))、HDAC9 (ヒストンデアセチラーゼ9)、CTGF (結合組織成長因子)、KCNMA1 (大コンダクタンスカルシウム活性化カリウムチャンネル、サブファミリーM、αメンバー1)、UGT1A (UDPグルクロノシルトランスフェラーゼ1ファミリー、ポリペプチドA複合体遺伝子座)、PRKCA (タンパク質キナーゼC、α)、COMT (カテコールβ-メチルトランスフェラーゼ)、S100B (S100カルシウム結合タンパク質B)、EGR1 (初期増殖応答1)、PRL (プロラクチン)、IL15 (インターロイキン15)、DRD4 (ドーパミン受容体D4)、CAMK2G (カルシウム/カルモジュリン依存性タンパク質キナーゼIIγ)、SLC22A2 (溶質輸送体ファミリー22 (有機カチオン輸送体)、メンバー2)、CCL11 (ケモカイン(C-Cモチーフ)リガンド11)、PGF (B321胎盤成長因子)、THPO (トロンボポエチン)、GP6 (糖タンパク質VI (血小板))、TACR1 (タキキニン受容体1)、NTS (ニューロテンシン)、HNF1A (HNF1ホメオボックスA)、SST (ソマトスタチン)、KCND1 (電位依存性カリウムチャンネル、Shal関連サブファミリー、メンバー1)、LOC646627 (ホスホリパーゼ阻害因子)、TBXAS1 (トロンボキサンAシンターゼ1 (血小板))、CYP2J2 (チトクロムP450、ファミリー2、サブファミリーJ、ポリペプチド 2)、TBXA2R (トロンボキサンA2受容体)、ADH1C (アルコールデヒドロゲナーゼ1C (クラスI)、γポリペプチド)、ALOX12 (アラキドン酸12-リポキシゲナーゼ)、AHSG (α-2-HS-糖タンパク質)、BHMT (ベタイン-ホモシステインメチルトランスフェラーゼ)、GJA4 (ギャップ結合タンパク質、α4、37kDa)、SLC25A4 (溶質輸送体ファミリー25 (ミトコンドリア輸送体; アデニンヌクレオチド輸送体)、メンバー4)、ACLY (ATPクエン酸リアーゼ)、ALOX5AP (アラキドン酸 5-リポキシゲナーゼ活性化タンパク質)、NUMA1 (核有糸分裂装置タンパク質1)、CYP27B1 (チトクロムP450、ファミリー27、サブファミリーB、ポリペプチド1)、CYSLTR2 (システイニルロイコトリエン受容体2)、SOD3 (スーパーオキシドジスムターゼ3、細胞外)、LTC4S (ロイコトリエンC4シンターゼ)、UCN (ウロコルチン)、GHRL (グレリン/オベスタチンプレプロペプチド)、APOC2 (アポリポタンパク質C-II)、CLEC4A (C型レクチンドメインファミリー4、メンバーA)、KBTBD10 (ケルチ反復配列およびBTB (POZ)ドメイン含有10)、TNC (テネイシンC)、TYMS (チミジル酸シンテターゼ)、SHCl (SHC (Src相同性2ドメイン含有)形質転換タンパク質1)、LRP1 (低密度リポタンパク質受容体関連タンパク質1)、SOCS3 (サイトカインシグナル抑制因子3)、ADH1B (アルコールデヒドロゲナーゼ1B (クラスI)、βポリペプチド)、KLK3 (カリクレイン関連ペプチダーゼ3)、HSD11B1 (水酸化ステロイド(11β)デヒドロゲナーゼ1)、VKORC1 (ビタミンKエポキシドレダクターゼ複合体、サブユニット1)、SERPINB2 (セルピンペプチダーゼ阻害因子、系統群B (オボアルブミン)、メンバー2)、TNS1 (テンシン1)、RNF19A (リングフィンガータンパク質19A)、EPOR (エリスロポエチン受容体)、ITGAM (インテグリン、αM (補体成分3受容体3サブユニット))、PITX2 (対様ホメオドメイン2)、MAPK7 (分裂促進因子活性化タンパク質キナーゼ 7)、FCGR3A (IgGのFc断片、低親和性111a、受容体 (CD16a))、LEPR (レプチン受容体)、ENG (エンドグリン)、GPX1 (グルタチオンペルオキシダーゼ1)、GOT2 (グルタミン酸オキサロ酢酸トランスアミナーゼ2、ミトコンドリア (アスパラギン酸アミノトランスフェラーゼ2))、HRH1 (ヒスタミン受容体H1)、NR112 (核内受容体サブファミリー1、I群、メンバー2)、CRH (コルチコトロピン放出ホルモン)、HTR1A (5-ヒドロキシトリプタミン(セロトニン)受容体1A)、VDAC1 (電位依存性アニオンチャンネル1)、HPSE (ヘパラナーゼ)、SFTPD (肺サーファクタントタンパク質D)、TAP2 (輸送体2、ATP結合カセット、サブファミリーB (MDR/TAP))、RNF123 (リングフィンガータンパク質123)、PTK2B (PTK2Bタンパク質チロシンキナーゼ2β)、NTRK2 (神経栄養チロシンキナーゼ、受容体、2型)、IL6R (インターロイキン6受容体)、ACHE (アセチルコリンエステラーゼ(Yt式血液型))、GLP1R (グルカゴン様ペプチド1受容体)、GHR (成長ホルモン受容体)、GSR (グルタチオンレダクターゼ)、NQO1 (NAD(P)Hデヒドロゲナーゼ、キノン1)、NR5A1 (核内受容体サブファミリー5、A型、メンバー1)、GJB2 (ギャップ結合タンパク質、β2、26kDa)、SLC9A1 (溶質輸送体ファミリー9 (ナトリウム/水素交換輸送体)、メンバー1)、MAOA (モノアミンオキシダーゼ A)、PCSK9 (プロタンパク質変換酵素スブチリシン/ケキシン9型)、FCGR2A (IgGのFc断片、低親和性IIa、受容体(CD32))、SERPINF1 (セルピンペプチダーゼ阻害因子、系統群F (α-2抗プラスミン、色素上皮由来因子)、メンバー1)、EDN3 (エンドセリン 3)、DHFR (ジヒドロ葉酸レダクターゼ)、GAS6 (成長停止特異的6)、SMPD1 (スフィンゴミエリンホスホジエステラーゼ1、酸、リソソーム)、UCP2 (非共役型タンパク質2 (ミトコンドリア、陽子輸送体))、TFAP2A (転写因子AP-2α (活性化エンハンサー結合タンパク質2α))、C4BPA (補体成分4結合タンパク質、α)、SERPINF2 (セルピンペプチダーゼ阻害因子、系統群F (α-2抗プラスミン、色素上皮由来因子)、メンバー2)、TYMP (チミジンホスホリラーゼ)、ALPP (アルカリホスファターゼ、胎盤(Reganアイソザイム))、CXCR2 (ケモカイン(C-X-Cモチーフ)受容体2)、SLC39A3 (溶質輸送体ファミリー39 (亜鉛輸送体)、メンバー3)、ABCG2 (ATP結合カセット、サブファミリーG (WHITE)、メンバー2)、ADA (アデノシンデアミナーゼ)、JAK3 (ヤヌスキナーゼ3)、HSPA1A (熱ショック70kDaタンパク質1A)、FASN (脂肪酸シンターゼ)、FGF1 (線維芽細胞成長因子1 (酸性))、F11 (凝固因子XI)、ATP7A (ATPアーゼ、Cu++輸送性、αポリペプチド)、CR1 (補体成分(3b/4b)受容体1 (Knops式血液型))、GFAP (グリア線維酸性タンパク質)、ROCK1 (Rho関連、コイルドコイル含有タンパク質キナーゼ1)、MECP2 (メチルCpG結合タンパク質2 (レット症候群))、MYLK (ミオシン軽鎖キナーゼ)、BCHE (ブチリルコリンエステラーゼ)、LIPE (リパーゼ、ホルモン感受性)、PRDX5 (ペルオキシレドキシン5)、ADORA1 (アデノシンA1受容体)、WRN (ウェルナー症候群、RecQヘリカーゼ様)、CXCR3 (ケモカイン(C-X-Cモチーフ)受容体3)、CD81 (CD81分子)、SMAD7 (SMADファミリーメンバー7)、LAMC2 (ラミニン、γ2)、MAP3K5 (分裂促進因子活性化タンパク質キナーゼ5)、CHGA (クロモグラニンA (副甲状腺分泌タンパク質1))、IAPP (膵島アミロイドポリペプチド)、RHO (ロドプシン)、ENPP1 (エクトヌクレオチドピロホスファターゼ/ホスホジエステラーゼ1)、PTHLH (副甲状腺ホルモン様ホルモン)、NRG1 (ニューレグリン1)、VEGFC (血管内皮成長因子C)、ENPEP (グルタミルアミノペプチダーゼ(アミノペプチダーゼA))、CEBPB (CCAAT/エンハンサー結合タンパク質(C/EBP)、β)、NAGLU (N-アセチルグルコサミニダーゼ、α-)、F2RL3 (凝固因子II (トロンビン)受容体様3)、CX3CL1 (ケモカイン(C-X3-Cモチーフ)リガンド1)、BDKRB1 (ブラジキニン受容体B1)、ADAMTS13 (トロンボスポンジンを持つADAMメタロペプチダーゼ1型モチーフ、13)、ELANE (エラスターゼ、好中球で発現)、ENPP2 (エクトヌクレオチドピロホスファターゼ/ホスホジエステラーゼ2)、CISH (サイトカイン誘導性SH2含有タンパク質)、GAST (ガストリン)、MYOC (ミオシリン、線維柱帯網誘導性糖質コルチコイド応答)、ATP1A2 (ATPase、Na+/K+輸送性、α2ポリペプチド)、NF1 (ニューロフィブロミン1)、GJB1 (ギャップ結合タンパク質、β1、32kDa)、MEF2A (筋細胞エンハンサー因子2A)、VCL (ビンキュリン)、BMPR2 (骨形態形成タンパク質受容体、II型(セリン/スレオニンキナーゼ))、TUBB (チューブリン、β)、CDC42 (細胞分裂周期42 (GTP結合タンパク質、25kDa))、KRT18 (ケラチン18)、HSF1 (熱ショック転写因子1)、MYB (v-myb骨髄芽球症ウイルスがん遺伝子相同体(鳥類))、PRKAA2 (タンパク質キナーゼ、AMP活性化、α2触媒性サブユニット)、ROCK2 (Rho関連、コイルドコイル含有タンパク質キナーゼ2)、TFPI (組織因子経路阻害因子(リポタンパク質関連凝固阻害因子))、PRKG1 (タンパク質キナーゼ、cGMP依存性、I型)、BMP2 (骨形態形成タンパク質2)、CTNND1 (カテニン(カドヘリン関連タンパク質)、Δ1)、CTH (シスタチオナーゼ(シスタチオニンγリアーゼ))、CTSS (カテプシンS)、VAV2 (vav2グアニンヌクレオチド交換因子)、NPY2R (神経ペプチドY受容体Y2)、IGFBP2 (インスリン様成長因子結合タンパク質2、36kDa)、CD28 (CD28分子)、GSTA1 (グルタチオンS-トランスフェラーゼα1)、PPIA (ペプチジルプロリルイソメラーゼA (シクロフィリンA))、APOH (アポリポタンパク質H (β2-糖タンパク質I))、S100A8 (S100カルシウム結合タンパク質A8)、IL11 (インターロイキン11)、ALOX15 (アラキドン酸15-リポキシゲナーゼ)、FBLN1 (フィビュリン1)、NR1H3 (核内受容体サブファミリー1、H群、メンバー3)、SCD (ステアロイルCoA不飽和酵素 (Δ-9-不飽和酵素))、GIP (胃抑制ポリペプチド)、CHGB (クロモグラニンB (セクレトグラニン1))、PRKCB (タンパク質キナーゼC、β)、SRD5A1 (ステロイド-5-α-レダクターゼ、αポリペプチド1 (3-オキソ-5α-ステロイドΔ4-デヒドロゲナーゼα1))、HSD11B2 (水酸化ステロイド(11β)デヒドロゲナーゼ2)、CALCRL (カルシトニン受容体様)、GALNT2 (UDP-N-アセチル-α-D-ガラクトサミン:ポリペプチドN-アセチルガラクトサミニルトランスフェラーゼ2 (GalNAc-T2))、ANGPTL4 (アンジオポエチン様4)、KCNN4 (中間/小コンダクタンスカルシウム活性化カリウムチャンネル、サブファミリーN、メンバー4)、PIK3C2A (ホスホイノシチド-3-キナーゼ、クラス2、αポリペプチド)、HBEGF (ヘパリン結合EGF様成長因子)、CYP7A1 (チトクロムP450、ファミリー7、サブファミリーA、ポリペプチド1)、HLA-DRB5 (主要組織適合複合体、クラスII、DRβ5)、BNIP3 (BCL2/アデノウイルスE1B 19kDa相互作用タンパク質3)、GCKR (グルコキナーゼ(ヘキソキナーゼ4)調節因子)、S100A12 (S100カルシウム結合タンパク質A12)、PADI4 (ペプチジルアルギニンデイミナーゼ、IV型)、HSPA14 (熱ショック70kDaタンパク質14)、CXCR1 (ケモカイン(C-X-Cモチーフ)受容体1)、H19 (H19、インプリント母性発現転写物(非タンパク質翻訳領域))、KRTAP19-3 (ケラチン関連タンパク質19-3)、IDDM2 (インスリン依存性糖尿病2)、RAC2 (ras関連C3ボツリヌス毒素基質2 (rhoファミリー、低分子GTP結合タンパク質Rac2))、RYR1 (リアノジン受容体1 (骨格))、CLOCK (clock相同体(マウス))、NGFR (神経成長因子受容体 (TNFRスーパーファミリー、メンバー16))、DBH (ドーパミンβ-ヒドロキシラーゼ(ドーパミンβ-モノオキシゲナーゼ))、CHRNA4 (コリン作動性受容体、ニコチン性、α4)、CACNA1C (カルシウムチャンネル、電位依存性、L型、α1Cサブユニット)、PRKAG2 (タンパク質キナーゼ、AMP活性化、γ2非触媒性サブユニット)、CHAT (コリンアセチルトランスフェラーゼ)、PTGDS (プロスタグランジンD2シンターゼ21kDa (脳))、NR1H2 (核内受容体サブファミリー1、H群、メンバー2)、TEK (TEKチロシンキナーゼ、内皮)、VEGFB (血管内皮成長因子B)、MEF2C (筋細胞エンハンサー因子2C)、MAPKAPK2 (分裂促進因子活性化タンパク質キナーゼ活性化タンパク質キナーゼ2)、TNFRSF11A (腫瘍壊死因子受容体スーパーファミリー、メンバー11a、NFKB活性化因子)、HSPA9 (熱ショック70kDaタンパク質9 (モルタリン))、CYSLTR1 (システイニルロイコトリエン受容体 1)、MAT1A (メチオニンアデノシルトランスフェラーゼI、α)、OPRL1 (アヘン受容体様1)、IMPA1 ((ミオ)イノシトール-1(または4)-モノホスファターゼ1)、CLCN2 (塩素チャンネル2)、DLD (ジヒドロリポアミドデヒドロゲナーゼ)、PSMA6 (プロテアソーム(プロソーム、マクロパイン)サブユニット、α型
、6)、PSMB8 (プロテアソーム(プロソーム、マクロパイン)サブユニット、β型、8 (大型多機能ペプチダーゼ7))、CHI3L1 (キチナーゼ3様1 (軟骨糖タンパク質39))、ALDH1B1 (アルデヒドデヒドロゲナーゼ1ファミリー、メンバーB1)、PARP2 (ポリ (ADP-リボース)ポリメラーゼ2)、STAR (ステロイド産生急性調節タンパク質)、LBP (リポ多糖結合タンパク質)、ABCC6 (ATP結合カセット、サブファミリーC(CFTR/MRP)、メンバー6)、RGS2 (Gタンパク質シグナル調節因子2、24kDa)、EFNB2 (エフリンB2)、GJB6 (ギャップ結合タンパク質、β6、30kDa)、APOA2 (アポリポタンパク質A-II)、AMPD1 (アデノシン一リン酸デアミナーゼ1)、DYSF (ジスフェリン、肢帯型筋ジストロフィー2B (常染色体性劣性遺伝性))、FDFT1 (ファルネシル二リン酸ファルネシルトランスフェラーゼ1)、EDN2 (エンドセリン2)、CCR6 (ケモカイン(C-Cモチーフ)受容体6)、GJB3 (ギャップ結合タンパク質、β3、31kDa)、IL1RL1 (インターロイキン1受容体様1)、ENTPD1 (エクトヌクレオチド三リン酸ジホスホヒドロラーゼ1)、BBS4 (バルデ・ビードル症候群4)、CELSR2 (カドヘリン、EGF LAG 7貫通型G型受容体2 (flamingo相同体、ショウジョウバエ属))、F11R (F11受容体)、RAPGEF3 (Rapグアニンヌクレオチド交換因子 (GEF) 3)、HYAL1 (ヒアルロノグルコサミニダーゼ1)、ZNF259 (亜鉛フィンガータンパク質259)、ATOX1 (ATX1抗酸化タンパク質1相同体(酵母))、ATF6 (活性化転写因子6)、KHK (ケトヘキソキナーゼ(フルクトキナーゼ))、SAT1 (スペルミジン/スペルミンN1-アセチルトランスフェラーゼ1)、GGH (γ-グルタミルヒドロラーゼ(コンジュガーゼ、ホリルポリγグルタミルヒドロラーゼ))、TIMP4 (TIMPメタロペプチダーゼ阻害因子4)、SLC4A4 (溶質輸送体ファミリー4、炭酸水素ナトリウム共輸送体、メンバー4)、PDE2A (ホスホジエステラーゼ 2A、cGMP刺激性)、PDE3B (ホスホジエステラーゼ3B、cGMP阻害性)、FADS1 (脂肪酸不飽和酵素1)、FADS2 (脂肪酸不飽和酵素 2)、TMSB4X (チモシンβ4、X連鎖性)、TXNIP (チオレドキシン相互作用タンパク質)、LIMS1 (LIMおよび老化細胞抗原様ドメイン1)、RHOB (ras相同体遺伝子ファミリー、メンバーB)、LY96 (リンパ球抗原96)、FOXO1 (フォークヘッドボックスO1)、PNPLA2 (パタチン様ホスホリパーゼドメイン含有2)、TRH (チロトロピン放出ホルモン)、GJC1 (ギャップ結合タンパク質、γ1、45kDa)、SLC17A5 (溶質輸送体ファミリー17 (アニオン/糖輸送体)、メンバー5)、FTO (脂肪量および肥満関連)、GJD2 (ギャップ結合タンパク質、Δ2、36kDa)、PSRC1 (プロリン/セリンに富むコイルドコイル1)、CASP12 (カスパーゼ12 (遺伝子/偽遺伝子))、GPBAR1 (Gタンパク質共役型胆汁酸受容体1)、PXK (PXドメイン含有セリン/スレオニンキナーゼ)、IL33 (インターロイキン33)、TRIB1 (tribbles相同体1 (ショウジョウバエ属))、PBX4 (プレB細胞白血病ホメオボックス4)、NUPR1 (核内タンパク質、転写調節因子、1)、15-Sep(15kDaセレノタンパク質)、CILP2 (軟骨中間層タンパク質2)、TERC (テロメラーゼRNA成分)、GGT2 (γ-グルタミルトランスフェラーゼ2)、MT-CO1 (ミトコンドリアにコードされるチトクロムcオキシダーゼI)、およびUOX (尿酸オキシダーゼ、偽遺伝子)。さらなる実施態様では、染色体配列は、さらに以下から選択されてもよい:Pon1 (パラオキソナーゼ1)、LDLR (LDL受容体)、ApoE (アポリポタンパク質E)、Apo B-100 (アポリポタンパク質B-100)、ApoA (アポリポタンパク質(a))、ApoA1 (アポリポタンパク質A1)、CBS (シスタチオンBシンターゼ)、糖タンパク質IIb/IIb、MTHRF (5,10-メチレンテトラヒドロ葉酸レダクターゼ (NADPH)、およびそれらの組合せ。一反復では、染色体配列および染色体配列によってコードされる循環器疾患に関与するタンパク質をCacna1C、Sod1、Pten、Ppar(α)、Apo E、レプチン、およびそれらの組合せから選択してもよい。したがって、本明細書のテキストは、CRISPRもしくはCRISPR-Casシステムまたは複合体に関する模範的な標的を示す。
免疫オルソゴナル相同分子種
実施態様によっては、CRISPR酵素を対象の体内に発現または投与する必要がある場合、CRISPR酵素の免疫オルソゴナル相同分子種を対象の体内に連続的に発現または投与することによりCRISPR酵素の免疫原性を低減してもよい。本明細書で用いられる「免疫オルソゴナル(immune orthogonal)相同分子種」という用語は、機能または活性が似ている、または実質的に同じだが、互いが起こす免疫応答との交差反応性はない、または低い、オーソロガスなタンパク質を指す。このような相同分子種の連続的な発現または投与は、強力なまたは何らかの二次的な免疫応答を誘発しなくてもよい。免疫オルソゴナル相同分子種は、既存の抗体による中和を回避することができる。相同分子種を発現する細胞は、宿主の免疫系による(たとえば活性化した細胞傷害性Tリンパ球(CTL)による)排除を回避することができる。例によっては、異なる種に由来するCRISPR酵素相同分子種は免疫オルソゴナル相同分子種であってもよい。
候補相同分子種の集合の配列、構造、および免疫原性を解析することにより免疫オルソゴナル相同分子種を特定してもよい。例示の方法では、a)候補相同分子種(たとえば異なる種に由来の相同分子種)の集合の配列を比較して配列類似性の低い、またはない候補の部分集合を特定し、b)候補の部分集合のメンバー間の免疫重複を評価して免疫重複のない、または低い候補を特定することで免疫オルソゴナル相同分子種の集合を特定してもよい。場合によっては、候補間の免疫重複を、候補相同分子種とMHC(たとえばMHC I型および/またはMHC II)との間の結合(たとえば親和性)を決定することによって評価してもよい。その代わりに、またはそれに加えて、候補相同分子種のB細胞エピトープを決定することにより候補間の免疫重複を評価してもよい。一例では、Moreno AM et al., BioRxiv (2018年1月10日にオンラインで公開) doi: doi.org/10.1101/245985に記載されている方法を用いて免疫オルソゴナル相同分子種を特定してもよい。
本出願はまた、以下の番号が付けられた項目に記載されているような側面および実施態様を提供する。
1.i)表1または表2に記載のCas12bエフェクタータンパク質、およびii)標的配列にハイブリダイズ可能なガイド配列を含むガイド、を含む非天然起源または遺伝子操作されたシステム。
2.前記Cas12bエフェクタータンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セデミニスからなる群から選択される細菌に由来する、項目1のシステム。
3.トランス活性化型クリスパーRNA(tracr RNA)は直接反復配列の5’末端にあるクリスパーRNA(crRNA)に融合している、項目1または2のシステム。
4.2つの異なる標的配列または同じ標的配列の異なる領域をハイブリダイズさせることが可能な2つ以上のガイド配列を含む、先行する項目のうちのいずれか一項のシステム。
5.前記ガイド配列は原核細胞中の1つ以上の標的配列にハイブリダイズする、先行する項目のうちのいずれか一項のシステム。
6.前記ガイド配列は真核細胞中の1つ以上の標的配列にハイブリダイズする、先行する項目のうちのいずれか一項のシステム。
7.前記Cas12bエフェクタータンパク質は1つ以上の核局在化シグナル(NLS)を含む、先行する項目のうちのいずれか一項のシステム。
8.前記Cas12bエフェクタータンパク質は触媒的に不活性である、先行する項目のうちのいずれか一項のシステム。
9.前記Cas12bエフェクタータンパク質は1つ以上の機能ドメインと会合している、先行する項目のうちのいずれか一項のシステム。
10.前記1つ以上の機能ドメインは前記1つ以上の標的配列を切断する、項目9のシステム。
11.前記機能ドメインは前記1つ以上の標的配列の転写または翻訳を改変する、項目10のシステム。
12.前記Cas12bエフェクタータンパク質は1つ以上の機能ドメインと会合しており、かつ、前記Cas12bエフェクタータンパク質はリゾルバーゼ(RuvC)ドメインおよび/またはヌクレアーゼ(Nuc)ドメイン内に1つ以上の変異を含み、これにより、形成されたCRISPR複合体は、標的配列にあるか標的配列に隣接する後生修飾因子または転写もしくは翻訳活性化もしくは抑制シグナルを送達することができる、先行する項目のうちのいずれか一項のシステム。
13.前記Cas12bエフェクタータンパク質はアデノシン脱アミノ酵素またはシチジン脱アミノ酵素と会合している、先行する項目のうちのいずれか一項のシステム。
14.更に組換え鋳型を含む、先行する項目のうちのいずれか一項のシステム。
15.前記組換え鋳型は相同性指向修復(HDR)により挿入されている、項目14のシステム。
16.表1または表2に記載のCas12bエフェクタータンパク質をコードするヌクレオチド配列に操作可能に結合している第1の調節エレメント、ならびにi)a)ガイド配列をコードするヌクレオチド配列に操作可能に結合している第2の調節エレメント、およびb)前記tracr RNAをコードするヌクレオチド配列に操作可能に結合している第3の調節エレメント、またはii)前記ガイド配列および前記tracr RNAをコードするヌクレオチド配列に操作可能に結合している第2の調節エレメント、を含む1種以上のベクターを含む、Cas12bベクターシステム。
17.前記Cas12bエフェクタータンパク質をコードするヌクレオチド配列は真核細胞内での発現のために最適化されたコドンである、項目16のベクターシステム。
18.単一のベクター内に含まれる、項目16または17のベクターシステム。
19.前記1種以上のベクターはウイルスベクターを含む、項目17から18のいずれかのベクターシステム。
20.前記1種以上のベクターは、1種以上のレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ベクター、または単純ヘルペスウイルスベクターを含む、項目17から19のいずれかのベクターシステム。
21.i)表1または表2に記載のCas12bエフェクタータンパク質、ii)1つ以上の標的配列にハイブリダイズ可能なガイド配列、およびiii)tracr RNA
を含む、非天然起源または遺伝子操作された組成物のCas12bエフェクタータンパク質および1種以上の核酸成分を送達するように構成された送達システム。
22.前記非天然起源または遺伝子操作された組成物のCas12bエフェクタータンパク質および1種以上の核酸成分をコードする1種以上のベクターまたは1種以上のポリヌクレオチド分子を含む、項目21の送達システム。
23.リポソーム、粒子、エキソソーム、微少胞、遺伝子銃、またはウイルスベクターを含む送達媒介物を含む、項目21または22の送達システム。
24.治療に使用するための、項目1から15の非天然起源または遺伝子操作されたシステム、項目16から20のベクターシステム、もしくは項目21から23の送達システム。
25.1つ以上の関心のある標的配列を、i)表1または表2に記載のCas12bエフェクタータンパク質、ii)1つ以上の標的配列にハイブリダイズ可能なガイド配列、およびiii)tracr RNAを含む1種以上の非天然起源または遺伝子操作された組成物と接触させることを含み、これにより、前記crRNAおよびtracr RNAと複合化したCas12bエフェクタータンパク質を含むCRISPR複合体が形成され、前記ガイド配列は細胞中の1つ以上の標的配列への配列特異的結合を導き、それにより前記1つ以上の標的配列の発現を改変する、1つ以上の標的配列を改変する方法。
26.前記1つ以上の標的配列を改変することは前記1つ以上の標的配列を切断することを含む、項目25の方法。
27.前記1つ以上の標的配列を改変することは前記1つ以上の標的配列の発現を増強あるいは減弱させることを含む、項目25または26の方法。
28.前記組成物は組換え鋳型を更に含み、前記1つ以上の標的配列を改変することは組換え鋳型またはその一部の挿入を含む、項目25から27のいずれかの方法。
29.前記1つ以上の標的配列は原核細胞内にある、項目25から28のいずれかの方法。
30.前記1つ以上の標的配列は真核細胞内にある、項目25から29のいずれかの方法。
31.請求項25から30のいずれかの方法、必要に応じて治療用植物T細胞または抗体生成植物B細胞に従って改変された1つ以上の標的配列を含む細胞またはその後代。
32.前記細胞は原核細胞である、項目31の細胞。
33.前記細胞は真核細胞である、項目31の細胞。
34.前記1つ以上の標的配列の改変は、
少なくとも1つの遺伝子産物の発現の変化を含む細胞、
少なくとも1つの遺伝子産物の発現の変化を含み、この少なくとも1つの遺伝子産物の発現が増加した細胞、
少なくとも1つの遺伝子産物の発現の変化を含み、この少なくとも1つの遺伝子産物の発現が減少した細胞、または
内因性または非内因性の生物学的産物または化合物を産生および/または分泌する細胞または集団
をもたらす、項目31から33のいずれかに従う細胞。
35.前記細胞は哺乳動物の細胞またはヒト細胞である、項目31または34のいずれか1項に従う真核細胞。
36.項目31から35のいずれか1項に従う細胞の株もしくはその細胞を含む細胞株またはその後代。
37.項目31から35のいずれか1項に従う1つ以上の細胞を含む多細胞生物。
38.項目31から35のいずれか1項に従う1つ以上の細胞を含む植物または動物モデル。
39.項目31から35のいずれか1項の細胞、項目36の細胞株、項目37の生物、または項目38の植物もしくは動物モデルからの遺伝子産物。
40.前記発現された遺伝子産物の量は発現が変化していない細胞からの遺伝子産物の量より多いか少ない、項目39の遺伝子産物。
41.表1または表2に記載の単離されたCas12bエフェクタータンパク質。
42.項目41のCas12bエフェクタータンパク質をコードする単離された核酸。
43.前記単離された核酸はDNAであり、クリスパーRNAおよびトランス活性化型クリスパーRNAをコードする配列を更に含む、項目42に従う単離された核酸。
44.項目42もしくは43に従う核酸または項目41のCas12bを含む、単離された真核細胞。
45.i)表1または表2に記載のCas12bエフェクタータンパク質をコードするメッセンジャーRNA(mRNA)、ii)ガイド配列、およびiii)tracr RNA
を含む非天然起源または遺伝子操作されたシステム。
46.前記tracr RNAは直接反復配列の5’末端にあるcrRNAに融合している、項目45に従う非天然起源または遺伝子操作されたシステム。
47.標的ドメインおよびアデノシン脱アミノ酵素、シチジン脱アミノ酵素、またはそれらの触媒ドメインを含み、前記標的ドメインはCas12bエフェクタータンパク質またはオリゴヌクレオチド結合活性を維持するその断片、およびガイド分子を含む、部位指向塩基編集のための遺伝子操作された組成物。
48.前記Cas12bエフェクタータンパク質は触媒的に不活性である、項目47の組成物。
49.前記Cas12bエフェクタータンパク質は表1または表2から選択される、項目47または48の組成物。
50.前記Cas12bエフェクタータンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セデミニスからなる群から選択される細菌に由来する、項目47~49の組成物。
51.1種以上の関心のある標的オリゴヌクレオチドに項目47から50のいずれか1項に従う組成物を送達することを含む、前記1種以上の標的オリゴヌクレオチド中のアデノシンまたはシチジンを改変する方法。
52.病原性のT→CまたはA→Gの点変異を含む転写物によって発症する疾患の治療または予防に使用するための、項目51の方法。
53.項目51または52のいずれか1項の方法で得られた、および/または項目47から50のいずれか1項の組成物を含む、単離された細胞。
54.前記真核細胞、好適にはヒトまたは非ヒト動物細胞、必要に応じて治療用植物T細胞または抗体生成植物B細胞である、項目53の細胞またはその後代。
55.項目53または54の前記改変された細胞またはその後代を含む、非ヒト動物。
56.項目54の前記改変された細胞を含む植物。
57.治療用、好ましくは細胞治療に使用するための項目53または54に従う改変された細胞。
58.標的オリゴヌクレオチドに、触媒的に不活性なCas12bタンパク質、直接反復配列に結合したガイド配列を含むガイド分子、およびアデノシンもしくはシチジン脱アミノ酵素タンパク質またはその触媒ドメインを送達することを含み、前記アデノシンもしくはシチジン脱アミノ酵素タンパク質またはその触媒ドメインは前記触媒的に不活性なCas12bタンパク質に共有結合もしくは非共有結合されているか、あるいは前記ガイド分子は送達後にそれに適合もしくは結合されており、前記ガイド分子は前記触媒的に不活性なCas12bタンパク質と複合体を形成し、この複合体を前記標的オリゴヌクレオチドに結合させるように導き、前記ガイド配列は前記標的オリゴヌクレオチド内で標的配列とハイブリダイズしてオリゴヌクレオチド二重鎖を形成することが可能である、前記標的オリゴヌクレオチド中のアデノシンまたはシトシンを改変する方法。
59.(A)前記シトシンは前記オリゴヌクレオチド二本鎖を形成する前記標的配列の外側にあり、前記シチジン脱アミノ酵素タンパク質またはその触媒ドメインは前記オリゴヌクレオチド二本鎖の外側にある前記シトシンを脱アミノ化するか、あるいは(B)前記シトシンは前記オリゴヌクレオチド二本鎖を形成する前記標的配列内にあり、前記ガイド配列は前記オリゴヌクレオチド二本鎖内のC-AまたはC-U不適正塩基対をもたらす前記シトシンに相当する位置で非対合アデノシンまたはウラシルを含み、かつ前記シチジン脱アミノ酵素タンパク質またはその触媒ドメインは前記非対合アデノシンまたはウラシルと反対側のオリゴヌクレオチド二本鎖中のシトシンを脱アミノ化する、項目58の方法。
60.前記アデノシン脱アミノ酵素タンパク質またはその触媒ドメインはオリゴヌクレオチド二本鎖内の前記アデノシンまたはシトシンを脱アミノ化する、項目58または59の方法。
61.前記Cas12bタンパク質は表1または表2から選択される、項目58~60の方法。
62.前記Cas12bタンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セデミニスからなる群から選択される細菌に由来する、項目61の方法。
63.Cas12bタンパク質、1つ以上の標的配列と所定の程度の相補性を持ち、かつCas12bタンパク質と複合体を形成するように設計されたガイド配列を含む少なくとも1種のガイドポリヌクレオチド、および非標的配列を含む、オリゴヌクレオチドに基づくマスキング構築物を含み、前記Cas12bタンパク質は、側副核酸分解酵素活性を示し、かつ前記1つ以上の標的配列により活性化されると前記オリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する、
1つ以上のin vitro試料中の1つ以上の標的配列の存在を検出するシステム。
64.Cas12bタンパク質、それぞれが1種以上の標的ポリペプチドのうちの1種に結合するように設計され、マスクされたプロモーター結合部位もしくはマスクされたプライマー結合部位およびトリガー配列鋳型を含む1つ以上の検出アプタマー、および非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物を含む、1つ以上のin vitro試料中の標的ポリペプチドの存在を検出するシステム。
65.前記標的配列またはトリガー配列を増幅するための核酸増幅試薬を更に含む、項目64または65のシステム。
66.前記核酸増幅試薬は恒温増幅試薬である、項目652のシステム。
67.前記Cas12bタンパク質は表1または表2から選ばれる、項目63から66のいずれか1項のシステム。
68.前記Cas12bタンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セデミニスからなる群から選択される細菌に由来する、項目67のシステム。
69.1つ以上のin vitro試料をi)Cas12bエフェクタータンパク質、ii)1つ以上の標的配列と所定の程度の相補性を持ち、かつCas12bエフェクタータンパク質と複合体を形成するように設計されたガイド配列を含む少なくとも1種のガイドポリヌクレオチド、およびiii)非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物と接触させることを含み、前記Cas12エフェクタータンパク質は側副核酸分解酵素活性を示し、かつ前記オリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する、前記1つ以上のin vitro試料中の1つ以上の標的配列を検出する方法。
70.前記Cas12bエフェクタータンパク質は表1または表2から選ばれる、項目69の方法。
71.前記Cas12bエフェクタータンパク質は、アリシクロバチルス・カケガウェンシス、バチルス属種V3-13、バチルス・ヒサシイ、レンティスファエラ綱の細菌、およびラセエラ・セデミニスからなる群から選択される細菌に由来する、項目70の方法。
72.酵素またはレポーター成分の不活性な第1部分に結合したCas12bタンパク質を含む非天然起源または遺伝子操作された組成物であって、前記酵素またはレポーター成分は、前記酵素またはレポーター成分の相補部分に接触させたときに再構成される、組成物。
73.前記酵素またはレポーター成分はタンパク質分解酵素である、項目72の組成物
74.前記Cas12bタンパク質は酵素またはレポーター成分の相補部分に結合した第1のCas12bタンパク質および第2のCas12bタンパク質を含む、項目72または73の組成物。
75.i)前記第1のCas12bタンパク質と複合体を形成し、標的核酸の第1の標的配列にハイブリダイズすることが可能な第1のガイド、およびii)前記第2のCas12bタンパク質と複合体を形成し、前記標的核酸の第2の標的配列にハイブリダイズすることが可能な第2のガイドを更に含む、項目72~74のいずれか一項の組成物。
76.前記酵素はカスパーゼを含む、項目72~75のいずれか1項の組成物。
77.前記酵素はタバコエッチウイルス(TEV)を含む、項目72~75のいずれか一項の組成物。
78.a)単一の細胞または複数の細胞の集団を、i)タンパク質分解酵素の不活性部分に結合した第1のCas12bエフェクタータンパク質、ii)前記タンパク質分解酵素の相補部分に結合し、前記タンパク質分解酵素の前記第1の部分と前記相補部分が接触したときに前記タンパク質分解酵素のタンパク質分解活性が再構成される、第2のCas12bエフェクタータンパク質、iii)前記第1のCas12bエフェクタータンパク質に結合し、かつ前記標的オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、およびiv)前記第2のCas12bエフェクタータンパク質に結合し、かつ前記標的オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイドに接触させることを含み、これにより前記タンパク質分解酵素の前記第1の部分と前記相補部分を接触させて、前記タンパク質分解酵素のタンパク質分解活性を再構成する、標的オリゴヌクレオチドを含む細胞中のタンパク質分解活性を提供する方法。
79.前記酵素はカスパーゼである、項目78の方法。
80.前記タンパク質分解酵素はTEVプロテアーゼであり、このTEVプロテアーゼのタンパク質分解活性は再構成され、それによりTEV基質は切断され活性化される、項目79の方法。
81.前記TEV基質は、TEV標的配列を含み、それにより前記TEVプロテアーゼによる切断がプロカスパーゼを活性化するように遺伝子操作されたプロカスパーゼである、項目80の方法。
82.細胞中の関心のあるオリゴヌクレオチドを、i)タンパク質分解酵素の不活性な第1の部分に結合した第1のCas12bエフェクタータンパク質、ii)前記タンパク質分解酵素の相補部分に結合し、前記タンパク質分解酵素の前記第1の部分と前記相補部分が接触したときに前記タンパク質分解酵素の活性が再構成される、第2のCas12bエフェクタータンパク質、iii)前記第1のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、iv)前記第2のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド、およびV)検出可能に切断されたレポーターを含む組成物と接触させることを含み、前記関心のあるオリゴヌクレオチドが細胞中に存在すると前記タンパク質分解酵素の前記第1の部分と前記相補部分が接触して、前記タンパク質分解酵素の活性を再構成しかつ前記レポーターを検出可能に切断する、前記関心のあるオリゴヌクレオチドを含む細胞を同定する方法。
83. 細胞中の関心のあるオリゴヌクレオチドを、i)レポーターの不活性な第1の部分に結合した第1のCas12bエフェクタータンパク質、ii)前記レポーターの相補部分に結合し、前記レポーターの前記第1の部分と前記相補部分が接触したときに前記レポーターの活性が再構成される、第2のCas12bエフェクタータンパク質、iii)前記第1のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、iv)前記第2のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド、およびV)前記レポーターを含む組成物と接触させることを含み、前記関心のあるオリゴヌクレオチドが細胞中に存在すると前記レポーターの前記第1の部分と前記相補部分が接触して、前記レポーターの活性を再構成する、前記関心のあるオリゴヌクレオチドを含む細胞を同定する方法。
84.前記レポーターは蛍光タンパク質または発光タンパク質である、項目82または83の方法。
以下の実施例で本発明をさらに説明するが、これらの実施例は特許請求の範囲に記載の本発明の範囲を限定するものではない。
[実施例]
実施例1
表11は例示のC2c1相同分子種のアミノ酸配列を示す。
Figure 2024138266000067
Figure 2024138266000068
Figure 2024138266000069
Figure 2024138266000070
Figure 2024138266000071
Figure 2024138266000072
Figure 2024138266000073
Figure 2024138266000074
Figure 2024138266000075
Figure 2024138266000076
Figure 2024138266000077
Figure 2024138266000078
Figure 2024138266000079
表13は、Cas12b相同分子種のさらなる例を示す。
Figure 2024138266000080
実施例2:アデノシンデアミナーゼの選択と設計
異なる活性レベルを持つ複数のADを使用する。これらのADは、以下を含む:
1. ヒトADAR (hADAR1, hADAR2, hADAR3)
2. アメリカケンサキイカ(Loligo pealeii) ADAR (sqADAR2a, sqADAR2b)
3. ADAT (ヒトADAT、ショウジョウバエ属ADAT)
変異を用いて、DNA-RNAヘテロ二重鎖に反応するADARの活性を高めることもできる。たとえば、ヒトADAR遺伝子の場合、hADAR1d (E1008Q)またはhADAR2d (E488Q)変異を用いてDNA-RNA標的に対する活性を高める。
各ADARには異なるレベルの配列構成要件がある。たとえば、hADAR1d (E1008Q)の場合、tAgおよびaAg部位は効率的に脱アミノ化されるが、aAtおよびcAcは編集効率がより低く、gAaおよびgAcはさらに編集効率が低い。ただし、構成要件はADARごとに異なる。
システムの1つの型の概略図を図1に示す。例示のCpf1-AD融合タンパク質のアミノ酸配列を図2~4に示す。
実施例3:フィシスファエラ綱の菌ST-NAGAB-D1由来のC2c1 (Cas12b)の特性評価
大腸菌(Stbl3)を、フィシスファエラ綱の菌のCRISPR-C2c1遺伝子座の内在性ゲノム配列の一部を含む低コピープラスミド(pACYC184)で形質転換した。14時間培養した細胞から全RNAを抽出し、RNAを調製して低分子RNA配列決定により解析した。方法はZetscheらの文献(2015年)に記載されているとおりであった。
低分子RNA配列決定により、トレーサーRNAの位置と成熟crRNAの構造が明らかになった。成熟crRNAは、おそらく14ヌクレオチドの直接反復であり、その後に20~24ヌクレオチドのガイド配列が続く。読取り数の多い、可能性のあるtracr配列を図2に、配列を表12に示す。RNA折畳み予測に基づく直接反復(DR)を持つtracrRNA二重鎖の構造を図2に示す。
PAM選別をZetscheらの文献(2015年)のとおりに実行した。特に、Stbl3大腸菌を、認識可能なプロトスペーサーの5'に位置する異なるPAM配列をコードする10 ngのプラスミドDNAで形質転換し、コロニーの数を測定した。TTH PAM (H = A、T、C)ではコロニー形成の減少が確認された。
実施例4:比色検出
DNA四重鎖を用いて生体分子分析物を検出することができる(図6)。ある場合には、OTAアプタマー(青)がOTAを認識し、立体構造変化を起こして四重鎖(赤)を露出させヘミンに結合させる。ヘミン-四重鎖複合体はペルオキシダーゼ活性を持っており、これによりTMBを酸化させて着色形態(一般に溶液中で青色)にすることができる。したがって、四重鎖は、本明細書に記載のCRISPR付随的活性により分解される可能性がある。出願人らはさらに、本明細書に記載のCRISPR付随的活性の一環として分解される可能性のあるこれらの四重鎖のRNA形態を作成した。分解によりRNAアプタマーは消失し、それにより核酸標的の存在下での色シグナルは消失する。2つの模範的な設計を以下に示す。
1) rUrGrGrGrUrUrGrGrGrUrUrGrGrGrUrUrGrGrGrA (配列番号514)
2) rUrGrGrGrUrUrUrGrGrGrUrUrUrGrGrGrUrUrUrGrGrGrA (配列番号515)
グアニンは、四重鎖構造を生成する重要な塩基対を形成し、これがヘミン分子を結合する。2ヌクレオチドのデータはグアニンがあまり分解されないことを示しているため、出願人らは、グアニンとウリジン(太字で表示)の組を間隔を空けて配置し、四重鎖を分解することができるようにした。
比色分析を本明細書に記載の診断分析での使用に応用することができる。一実施態様では、適切な四重鎖を試験試料およびCas12システムと共にインキュベートする。別の実施態様では、適切な四重鎖を試験試料およびCas13システムと共にインキュベートする。たとえば、Cas13が標的配列を識別することができるようなインキュベーション時間の後、付随的活性によるアプタマーの分解のために基質を追加してもよい。次に吸光度を測定してもよい。他の実施態様では、四重鎖およびCRISPR Cas9、Cas12、またはCas13システムを用いた検定に基質が含まれる。
実施例5
図13は様々なsgRNAを示す。図14は、図13の様々なsgRNAを用いてプラスミドの遺伝子導入後に様々な標的部位について得られた挿入欠失率を示す。使用したCas12bはバチルス・ヒサシイ(Bacillus hisashii) C4株であった。
実施例6
表14はCas12bの模範的な相同分子種を示す。
Figure 2024138266000081
Figure 2024138266000082
Figure 2024138266000083
Figure 2024138266000084
Figure 2024138266000085
Figure 2024138266000086
Figure 2024138266000087
Figure 2024138266000088
Figure 2024138266000089
Figure 2024138266000090
Figure 2024138266000091
Figure 2024138266000092
Figure 2024138266000093
Figure 2024138266000094
Figure 2024138266000095
Figure 2024138266000096
Figure 2024138266000097
Figure 2024138266000098
Figure 2024138266000099
Figure 2024138266000100
Figure 2024138266000101
Figure 2024138266000102
表15は、表14に示すLs、Ak、Bv、Phyci、およびPlancのCas12b相同分子種に関する模範的なcrRNA、tracrRNA、およびsgRNAの配列を示す。図15A~15Cは、それぞれLs、Ak、およびBvでCas12b相同分子種を用いて精製タンパク質およびRNAをin vitroで切断したときのPAMの発見を示す。図15D~15Eは、それぞれPhyciおよびPlancのCas12B相同分子種を用いる精製タンパク質およびRNAのin vitro切断を示す。
Figure 2024138266000103
Figure 2024138266000104
実施例7
アリシクロバチルス・マクロスポランギイドゥスのCas12bに関する模範的な直接反復配列、crRNA配列、tracrRNA配列、およびsgRNAを下の表16に示す。
Figure 2024138266000105
図16は、精製AmCas12b (AmC2C1)タンパク質と、低分子RNA配列決定で得た様々な予測tracr RNAを用いたin vitro切断検定を示す。TTAはこの点でC2C1に共通のPAMであるため、TTTA PAMを使用した。
様々なsgRNA設計を図17A~17Eに示す。図17Aは全長AmC2C1直接反復配列(緑色)をtracr RNA(赤色)とアニールしたものを示す。Tracrは、低分子RNA配列決定で予測され、in vitroで確認された。青色の円は5’末端、赤色の円は3’末端である。図17Bは、AmC2C1直接反復配列の21ヌクレオチド(緑色)をtracr RNA (赤色)とアニールしたものを示す。Tracrは低分子RNA配列決定で予測され、in vitroで確認された。青色の円は5’末端、赤色の円は3’末端である。図17Cは、全長直接反復とtracrとをCTAループで融合したものを示す。図17Dは、直接反復の29ヌクレオチドとtracrとをCTAループで融合したものを示す。図17Eは、直接反復の21ヌクレオチドとtracrとをCTAループで融合したものを示す。
図18は、sgRNAの効率を比較するためのAmC2C1を用いたin vitroでの切断を示す。
AmC2C1 RuvCの変異体を作成し、それらの活性をHEK細胞可溶化液を用いて試験した(図19)。
Cas12b相同分子種のPAMをin vitroのPAM選別により決定した。簡潔に言えば、Cas12bタンパク質およびsgRNAをPAMライブラリープラスミドと共にインキュベートした。結果を図20に示した。
実施例8
バチルス・ヒサシイのCas12b (BhC2C1)を精製し、その活性を様々な温度で試験した。図21A~21Dは、低分子RNA配列決定によるtracr予測、in vivo選別で得たBhC2C1 (バチルス・ヒサシイのCas12b)のPAM、BhC2C1タンパク質精製、BhC2C1と予測tracr RNAとを用いた37°Cおよび48°Cでのin vitroでの切断をそれぞれ示す。
図22A~22DはBhC2C1のsgRNA設計を示す。たとえば、図22Aは20ヌクレオチドの直接反復(緑色)と予測tracr RNA (赤色)を示す。
BhC2C1の直接反復配列、tracr RNA配列、およびsgRNA配列を下の表17に示す。
Figure 2024138266000106
BhC2C1をプラスミドにクローン化した。プラスミドのマップを図23に示す。足場は以下のとおりである:
GTTCTGTCTTTTGGTCAGGACAACCGTCTAGCTATAAGTGCTGCAGGGTGTGAGAAACTCCTATTGCTGGACGACGCCTCTTACGAGGCGTTAGCACn23_スペーサー(配列番号565)。
実施例9
図24は、様々なsgRNAを用いてプラスミドの遺伝子導入後に様々な標的部位について得られた挿入欠失率を示す。使用したCas12bはバチルス属種V3-13 (WP_101661451)であった。タンパク質配列、sgRNA配列、および標的部位を下の表18に示す。
Figure 2024138266000107
Figure 2024138266000108
Figure 2024138266000109
実施例10
BvCas12b (バチルス属種V3-13のCas12b)をプラスミドにクローン化した(pcDNA3-BvCas12b)。プラスミドのマップを図25に示す。クローン化した構築物の配列を下の表19に示す。
Figure 2024138266000110
Figure 2024138266000111
Figure 2024138266000112
Figure 2024138266000113
実施例11
BhCas12b (バチルス・ヒサシイのCas12b)をプラスミドにクローン化した(pcDNA3-BhCas12b)。プラスミドのマップを図26に示す。クローン化した構築物の配列を下の表20に示す。
Figure 2024138266000114
Figure 2024138266000115
Figure 2024138266000116
Figure 2024138266000117
Figure 2024138266000118
実施例12
EbCas12b (エルシミクロビウム門の菌のCas12b)をプラスミドにクローン化した(pcDNA3-EbCas12b)。プラスミドのマップを図27に示す。クローン化した構築物の配列を下の表21に示す。
Figure 2024138266000119
Figure 2024138266000120
Figure 2024138266000121
Figure 2024138266000122
Figure 2024138266000123
実施例13
AkCas12b (アリシクロバチルス・カケガウェンシスのCas12b)をプラスミドにクローン化した(pcDNA3-AkCas12b)。プラスミドのマップを図28に示す。クローン化した構築物の配列を下の表22に示す。
Figure 2024138266000124
Figure 2024138266000125
Figure 2024138266000126
Figure 2024138266000127
実施例14
PhyciCas12b (フィシスファエラ綱の菌のCas12b)をプラスミドにクローン化した(pcDNA3-PhyciCas12b)。プラスミドのマップを図29に示す。クローン化した構築物の配列を下の表23に示す。
Figure 2024138266000128
Figure 2024138266000129
Figure 2024138266000130
実施例15
PlancCas12b (プランクトミセス門の菌のCas12b)をプラスミドにクローン化した(pcDNA3-PlancCas12b)。プラスミドのマップを図30に示す。クローン化した構築物の配列を下の表24に示す。
Figure 2024138266000131
Figure 2024138266000132
Figure 2024138266000133
実施例16
BvCas12bを含むプラスミドpZ143-pcDNA3-BvCas12bを作成した。プラスミドのマップを図31に示す。クローン化した構築物の配列を下の表25に示す。
Figure 2024138266000134
Figure 2024138266000135
Figure 2024138266000136
Figure 2024138266000137
Figure 2024138266000138
BvCas12b-sgRNA-足場を含むプラスミドpZ147-BvCas12b-sgRNA-足場を作成した。プラスミドのマップを図32に示し、クローン化した構築物の配列を下の表26に示す。
Figure 2024138266000139
Figure 2024138266000140
Figure 2024138266000141
実施例17
BhCas12b-sgRNA-足場を含むプラスミドpZ148-BhCas12b-sgRNA-足場を作成した。プラスミドのマップを図33に示し、クローン化した構築物の配列を下の表27に示す。
Figure 2024138266000142
Figure 2024138266000143
Figure 2024138266000144
S893、K846、およびE836に変異を持つBhCas12bを含むプラスミドpZ149-BhCas12b-S893R-K846R-E836Gを作成した。プラスミドのマップを図34に示し、クローン化した構築物の配列を下の表28に示す。
Figure 2024138266000145
Figure 2024138266000146
Figure 2024138266000147
Figure 2024138266000148
Figure 2024138266000149
S893、K846、およびE836に変異を持つBhCas12bを含むプラスミドpZ150-pCDNA3-BhCas12b-S893R-K846R-E836Kを作成した。プラスミドのマップを図35に示し、クローン化した構築物の配列を下の表29に示す。
Figure 2024138266000150
Figure 2024138266000151
Figure 2024138266000152
Figure 2024138266000153
Figure 2024138266000154
実施例18
BhCas12bに関する大腸菌のPAMを、様々な条件のin vitroのPAM選別により決定した。結果を図36に示す。
実施例19
BvCas12bに関する大腸菌のPAMを、様々な条件のin vitroのPAM選別により決定した。結果を図37に示す。
実施例20
BhCas12bの多様体を作成した。変異を下の表30に示す。
Figure 2024138266000155
多様体の活性を様々な結合部位の挿入欠失率を試験することにより評価した。試験の結果を図38に示す。
実施例21
さらなるBhCas12b多様体を作成し、それらの活性を試験し、実施例20で作成した多様体と比較した。
さらなる多様体は変異S893RおよびK846Rを含み、変異E837H、E837K、E837N、E837L、E837I、D533G、N644K、D680P、L741Q、L792Q、F881L、V895A、V980E、T984A、K1022E、またはM1073Iをさらに含んでいた。多様体の活性を様々な結合部位の挿入欠失率を試験することにより評価した。試験の結果を図39に示す。
実施例22
BhCas12b (実施例20の多様体4)および野生型BvCas12bによる切断のHDRを様々な部位で試験した。DNMT1-1におけるHDRの結果を図40A、VEGFA-2におけるHDRの結果を図40Bに示す。
実施例23
本実施例は、様々なPAMでのCas12b相同分子種の活性を試験するために293T細胞で行った実験と、ssODNドナーで行った実験を示す。
図41Aは、TTTV PAMにおけるAsCas12a、ならびにBhCas12b多様体4およびBvCas12bのATTN PAMにおける挿入欠失率の比較を示す。図41Bは、様々なPAM配列でのBhCas12b多様体4およびBvCas12b活性の概要を示す。
図42Aは、ssDNAドナーと共に導入される所望の変化を含むVEGFA標的の概略を示す。図42Bは、VEGFA標的部位での各ヌクレアーゼの挿入欠失活性を示す。図42Cは、VEGFA部位の所望の編集(2つのヌクレオチドの置換)を含む細胞の率を示す。図42Dは、ssDNAドナーと共に導入される所望の変化を含むDNMT1標的の概略を示す。図42Eは、DNMT1標的部位での各ヌクレアーゼの挿入欠失活性を示す。図42Eは、DNMT1部位の所望の編集(2つのヌクレオチドの置換)を含む細胞の率を示す。図42Cおよび42Eに関して、青色および赤色の棒で示した完全な編集は、概略図に示す所望の2つのヌクレオチドの置換を含み、両方のPAMの変異は追加の変異を含まない、完全に補正された遺伝子座を持つ細胞の率を示す。
実施例24
CXCR4遺伝子を標的化するsgRNAとのBhCas12b (v4)およびBvCas12bリボ核タンパク質(RNP)複合体をin vitroで組み立て、ヒトのCD4陽性T細胞にLonza 4D-Nucleofectorを用いてエレクトロポレーションした。2人の異なるドナーからヒトCD4陽性T細胞を得た。RNPを3μMの最終濃度で3×105個の細胞に送達した。エレクトロポレーションを受けた細胞を48時間後に回収し、挿入欠失変異を標的化ディープシーケンシング(=大規模配列決定)で読み出した。図43の左図は、CXCR4の標的化されたエクソンとBhCas12b (v4)およびBvCas12bでそれぞれ標的化されたCXCR4配列とを示す。図43の右図は、2人のドナーから得たT細胞中のCXCR4に対するBhCas12b(v4)およびBvCas12bの効果を示す挿入欠失率を示す。
実施例25:CRISPR-Cas12bを用いたゲノム編集
V型CRISPRエフェクターCas12b (C2c1としても知られる)は、ヒト細胞のゲノム編集のための開発が難しく、その原因の少なくとも一部は、特性評価されたファミリーメンバーの温度要件が高いことである。ここで、出願人らは、Cas12bファミリーの多様性を調査し、ヒト遺伝子編集用にバチルス・ヒサシイ由来の有望な候補BhCas12bを特定した。37°Cでは、野生型BhCas12bは二本鎖切断を形成するのではなく非標的DNA鎖を優先的に切断し、編集効率が下がる。手法の組合せにより、出願人らはこの制限を克服するBhCas12bの機能獲得変異を特定した。変異型BhCas12bはヒト細胞株中で、またex vivoでは初代ヒトT細胞中で、強力なゲノム編集を促し、化膿レンサ球菌のCas9に比べて高い特異性を示した。この研究により、Cas9およびCpf1/Cas12aに加え、ヒト細胞におけるゲノム編集のための第3のRNA誘導によるヌクレアーゼ基盤が確立される。
ここで、出願人らは、中温性のCas12b酵素を探索しバチルス・ヒサシイ由来の有望な候補BhCas12bを特定したが、これは37°Cで非標的DNA鎖を優先的に切断する。手法の組合せにより、出願人らはこの制限を克服して37°Cで両方のDNA鎖を切断するBhCas12b多様体を設計した。出願人らはさらに、バイキング宇宙探査機を組み立てた無菌室から単離された試料から配列決定された第2のバチルス属種相同分子種BvCas12bを特定した2。これは操作されたBhCas12b多様体に性質的に似ている。特性評価した両方のCas12bヌクレアーゼはヒト細胞中で効率的なゲノム編集を促し、Cas9に比べて高い特異性を示した。したがって、BhCas12bおよびBvCas12bの特性評価および設計により、ヒト細胞における高特異性のゲノム編集のための新たな手段が得られ、新たなクラスのCRISPR-Casシステムの可能性が明らかになる。
ゲノム編集手段は、再プログラム可能かつ高特異性であることが求められる場合があり、原核生物のクラスター化して規則的な配置の短い回文配列リピート(Clustered, Regularly Interspaced Short Palindromic Repeats)およびCRISPR関連タンパク質(CRISPR-Cas)システムにはもともとこれらの性質が備わっている3,4。現在のゲノム編集技術は、ゲノム切断用に単一のタンパク質エフェクターヌクレアーゼを含むクラス2のCRISPR-Casシステムに集中してきたが、現在まで、ヒト細胞のゲノム編集に利用されてきたクラス2ヌクレアーゼは2つのファミリー、すなわちCas95,6(tracrRNA7と共に機能してもよく、HNHとRuvCヌクレアーゼドメイン8,9の両方を含む)と、Cas12a10(短いcrRNAを使用し、単一のRuvCドメインを含む)のみである。ここで、出願人らはクラス2エンドヌクレアーゼの第3のファミリーであるCas12bに焦点を当てた。これは、単一のRuvCドメインを含みtracrRNAを必要とする11(図44a)。Cas12bタンパク質はCas9およびCas12aよりも低分子であることが多く、ゲノム編集に有望である可能性が高いように見えるが、最も十分に特性評価されたアリシクロバチルス・アシドテレストリス由来のCas12bヌクレアーゼ(AacCas12b)は48°Cで最適のDNA切断を示す1。十分に特性評価されたファミリー内のCasエフェクター10,12の多様な特性に鑑みて、出願人らは、それよりも低い温度で有効であり、したがってヒトのゲノム編集に適応させることができるCas12bファミリーメンバーを特定しようとした。
過去に検出されたCas12bタンパク質を問い合わせに用いて最新の配列データベースのBLAST探索を行い、V-B型遺伝子座内でコードされる約25のCas12bファミリーメンバーを特定した。V-B型システムは様々な細菌に広く散在しており、Cas12bの系統樹の形態(図48a)は、一般に細菌の分類に従っておらず、広範な水平移動性が示唆される。ただし、注目すべきことに、系統樹で強く支持された系統群を構成するV-B型遺伝子座の約半分は、細菌のバチルス目のメンバーに見られる。出願人らは、過去に記載のあるメンバーおよび認識されている好熱菌由来のメンバーを避け、多様な細菌から特性評価されていない14種のCas12b遺伝子を実験研究用に選択した(図48e)。既知のクラス2のDNA標的化CRISPR-Casヌクレアーゼはすべて、DNA切断にプロトスペーサー隣接モチーフ(PAM)を必要とし8,10、Cas12bファミリーの初期の特性評価により、標的部位の5'末端側のPAMが明らかになっている1。特定した遺伝子座が機能性CRISPR-Casシステムであることを確認し、14種の候補それぞれについてそれらのPAMを特定するために、出願人らは、それらの本来の隣接配列を持つヒトコドン最適化Cas12bを大腸菌で発現させ、形質転換細胞を無作為化した5'末端PAMライブラリーで攻撃した後、ディープシーケンシングを行った(図48bおよび48c)。出願人らは、試験したCas12bシステム14種のうちの4種(AkCas12b、BhCas12b、EbCas12b、およびLsCas12b)で枯渇を検出した。これは異種宿主における機能的DNA干渉を示す。枯渇したPAMはTに富みスペーサーから1~4 bpの位置にあり、過去に研究されたCas12bメンバーに見られた優先傾向11と合致している。出願人らは、大腸菌溶菌液で低分子RNA配列決定を行い、必要なRNA成分を特定し、Cas12bとCRISPRアレイとの間の領域にマッピングされる推定tracrRNAを発見した(図49a~49d)。
Cas12bを生化学的に特性評価するために、出願人らは、特定したPAMを含む標的に対して精製Cas12bタンパク質と予測tracrRNAおよびcrRNAとを用いてin vitroでの活性について試験した(図44b、図49e)。出願人らはEbCas12bおよびLsCas12bについては最小限の活性のみを観察したが、AkCas12bおよびBhCas12bはいずれも37°Cで強力な切断を示し、ヒトの細胞でさらに調査するに値した。細胞のゲノム編集は単一ガイドRNA (sgRNA)を用いる方が効率的である13ことを考慮し、出願人らはAkCas12bおよびBhCas12bの両方についてsgRNAを設計し、in vitroでそれらの活性を検証した(図49f)。出願人らは、U6プロモーターで駆動される、NLSタグ付きCas12bおよびsgRNAを発現するプラスミドを293T細胞に遺伝子導入し、標的ディープシーケンシングで挿入または欠失(挿入欠失)変異の形成によってヌクレアーゼ活性を監視した。両方のCas12bタンパク質について、観察された挿入欠失率は検出可能であったが、1%未満であった(図44cおよび44d)。効率を上げるために、出願人らはtracrRNAおよびcrRNAの連結を変更し、ヘアピンのミスマッチを除去し、5'末端開始部位およびスペーサー長を変更して、sgRNA足場の変化による効果を試験した(図44c~44e、図50)。AkCas12b sgRNAの変更はほとんど効果を持たなかったが、BhCas12b sgRNAの5'末端の5ヌクレオチドの切断により、複数の標的で活性が大きく改善した。
出願人らは、in vitroでの切断反応において、ゲル電気泳動中、Cas12bが二本鎖DNA (dsDNA)基質を切断することができることを示す遅い移動バンドを頻繁に観察しており、これはAkCas12bの場合に最も顕著に観察された(図44b)。様々に標識したDNA鎖と反応させることにより、AkCas12bおよびBhCas12bが非標的鎖を優先的に切断し、この挙動は低温のときにより顕著であることが明らかになった(図45a)。標的鎖を切断することができないことにより、ゲノム編集手段としてのBhCas12bの可能性は低くなるため、出願人らはタンパク質操作によりこの制限を解決しようとした。
標的鎖はBhCas12bのRuvC活性部位に接近しにくい可能性がある。出願人らは、BhCas12bのこのポケットの特性を変えることにより標的鎖の接近性とDNA切断が改善されるかどうかを試験した。出願人らは、AacCas12bとの整列により特定した12個のBhCas12b残基を変異させた。それらの残基は、バチルス・テルモアミロウォランス由来のほぼ同一のCas12b (BthCas12b)の構造でも保存されていた(BthCas12bも細胞内で活性を示したが、BhCas12bほど効率的ではなかった(図51a))15。出願人らは、合計268種のBhCas12b単一変異体について、2つの標的部位での挿入欠失活性を測定し、K846RおよびS893R(二重変異体として相加効果を示した)を含むいくつかの変異について活性が増加することを見出した(図45bおよび45c、図51bおよび51c)。陽性荷電したアルギニン側鎖は核酸の主鎖と相互作用することが多い16ため、変異体の増加したDNA結合親和性はRuvC活性部位に標的鎖を引き寄せ、DNA切断を促すのに役立つ。
オルソゴナル的な手法として、出願人らは、標的鎖切断の温度依存性を解決しようとした。出願人らは、表面に露出した66個の残基にグリシン置換を起こし、2つの標的部位での挿入欠失活性を再び試験した。注目すべきことに、出願人らは、ガイドRNA-DNA二重鎖とRuvC活性部位との間に位置する位置であるE837G多様体について野生型の2倍以上の改善を観察した(図45dおよび45e)。変異の組合わせを試験し、複数の標的にわたって最も高い活性を示したK846R/S893R/E837Gを含む最終的なBhCas12bv4変異体を持つ、累進的に活性を増す多様体を得た(図45fおよび45g)。ヒト細胞におけるこれらの結果と一致して、精製BhCas12b v4タンパク質は、37°CでのdsDNA切断活性の増加、および切断されたdsDNAの明らかな減少を示した(図45h、図51g~51j)。
出願人らの最初のCas12b酵素の選択では、選別された多様体の多様性を高めるために、同じ種由来の相同分子種を避けた。しかし、BhCas12bで良いゲノム編集結果が得られたため、出願人らはバチルス属種のメンバーを再検討し、バチルス属種V3-132由来の近年寄託されたゲノムでコードされる、バイキング宇宙探査機を組み立てた無菌室から単離されたCas12b相同分子種(BhCas12bとの配列同一性は41%)を見出した2。出願人らはこのタンパク質(本明細書ではBvCas12bと呼ぶ)を特性評価し、BvCas12bが37°CでATTN PAMで標的DNAを効率的に切断することを見出した(図52)。興味深いことに、BhCas12b v4変異K846RおよびS893RはそれぞれBvCas12bのR849およびH896に対応し(図53a)、BvCas12bが最適なdsDNA切断活性を自然に進化させた可能性があることを示唆している。この考えと一致して、出願人らはin vitroでBvCas12bによる切断産物を検出しなかった(図53b)。さらに、BhCas12b E837Gに対応するグリシン置換と同様に、BvCas12bの標的鎖ポケット内の標的変異はいずれも活性を低下させた(図53c~53e)。
強力なゲノム編集手段は、様々な標的にわたって有効かつ特異的であることが望まれる可能性がある。出願人らは、過去に研究されたCasヌクレアーゼに比べてより徹底的にCas12b活性を調査した。出願人らは、293T細胞で5つの遺伝子にわたる56の標的でBhCas12b v4およびBvCas12bを試験し、TTTV PAMでのAsCas12aを陽性対照として用いて、ATTN PAMでの強力な切断を見出した(図46a)。Cas12bによって形成された挿入欠失パターンの解析により、優勢な5~15bpの欠失が明らかになった(図46b)。また、出願人らはTTTNおよびGTTN PAMの部分集合で高いCas12b活性を観察したが、この活性はそれほど強力ではなかった(図54a)。出願人らは、一致した部位でのBhCas12b v4とBvCas12bの活性の間に弱い相関関係しか観察せず(R2=0.48)、2つのヌクレアーゼのうちの1つによって多数の標的がより効率的に切断された(図54b)。これらの発見は、複数の相同分子種の利点と、Casヌクレアーゼの標的化の法則の徹底的な調査が引き続き必要であることを強調している。ヒトゲノムにおけるATTN保有率の分析により、Cas12a酵素と似た標的化能力が明らかになった(図54c)。SpCas9およびAsCas12aとは対照的に、BhCas12bによって形成された挿入欠失パターンの分析により、5~15bpの顕著なより大きな欠失が明らかになった(図46f)。Cas12bヌクレアーゼを一本鎖オリゴヌクレオチド(ssODN)ドナーと同時遺伝子導入したところ、TTTC PAM標的でSpCas9およびAsCas12aと同等の編集効率が得られ(図46c~46e)、ATTC PAM標的でより高い編集効率が得られた(図54d~54f)。ヒト細胞におけるBhCas12b v4の有効性をさらに評価するために、出願人らは初代ヒトT細胞を編集するCas12bリボ核タンパク質(RNP)の能力を試験した。出願人らは、BhCas12b v4-sgRNA複合体を作成し、エレクトロポレーションによりそれらをヒトCD4陽性T細胞に送達した。BhCas12b v4のRNPは、試験した3つの標的全体で32~49%の挿入欠失率を示した(図46g)。総合すると、これらのデータは、BhCas12 v4およびBvCas12bが、治療に重要なヒト細胞型を含む様々なゲノム編集の状況で機能的かつプログラム可能なヌクレアーゼとして利用できることを示している。
次に、出願人らは、細胞内でCas12bの特異性を決定しようとした。出願人らは、様々なCasヌクレアーゼ間で同等の挿入欠失活性を持つ9つの標的部位を選択し(図47a)、これらの標的を用いてガイド配列決定19分析を行った。出願人らは、Cas12bヌクレアーゼとAsCas12aのいずれについても非標的部位を検出しなかったが、SpCas9は、試験した9つのガイドのうち6つで顕著な非特異的切断を起こし(図47b、図55)、これは既知の混乱13,20と合致している。たとえば、標的3について、出願人らはSpCas9で101個の挿入部位を検出し、読取りのうち10%のみが標的部位にマッピングされているが、2つのCas12b酵素のいずれでも非標的部位は検出されなかった。一致しない部位で追加のガイド配列決定実験を行ったところ、BhCas12b v4の14個の部位のうち2つの部位、またBvCas12bの15個の部位のうち1つの部位でのみ有意な非特異的切断が検出された(図56a、57)。これらの発見と一致して、出願人らは、ガイドRNAと標的DNAとの間の1~20位の二重ミスマッチについてわずかな挿入欠失活性を観察し、単一ミスマッチについてはさらに低い許容性を観察した(図56bおよび56c)。これらの結果は、報告されているin vitroでのAacCas12bの特異性21と一致し、細胞で観察される非特異的活性を低くするための分子機構を提供する。
ここで、出願人らは、V型CRISPR Cas12ファミリーのうちヒト細胞のゲノム編集に適した最初の2つのメンバーについて記載する。多くのCas12bヌクレアーゼが高温への強い優先性を示しているが、出願人らの大規模な選別により、このファミリーのうち37°Cで活性の高いメンバーを特定した。さらに、出願人らのBhCas12bの操作により、dsDNA切断の効率が大幅に上がり、他のCas12bヌクレアーゼのゲノム編集手段としての可能性を明らかにするための枠組みが提供される。BhCas12bおよびBvCas12bは比較的小型のタンパク質(それぞれ約1100アミノ酸)であり、したがって、アデノ随伴ウイルス(AAV)に効率的に詰め込むのに適している。それらの高い標的特異性との組合せにより、これらのCas12b酵素はin vivoのゲノム編集用の新たな手段として有望である。
補足情報:Cas12bファミリータンパク質の多重整列化
配列を受入番号で示す。バチルス属種V3-13 (WP 101661451.1)およびバチルス・ヒサシイ(WP_095142515.1)の配列を赤色で強調表示する。本研究で変異させた12残基をB.ヒサシイ(WP_095142515.1)配列中に赤色で強調表示する。置換がBhCas12v4変異体においてDNA切断効率に大きな影響を及ぼした残基を黄色で示し、赤色で強調表示する。
材料および方法
Cas12b配列整列および系統樹の再構築
MUSCLEプログラム(v 3.7)を用いて整列を構成した23。整列したものを、www.bioinformatics.org / sms2 / color_align_cons.htmサーバーを使用して、以下のアミノ酸群:GAVLI、FYW、CM、ST、KRH、DENQ、Pに対する100%の一致に従い色付けした。50%を超えるギャップのある位置を、系統樹の再構築に使う整列から取り除いた。PHYMLプログラム(v. 20120412)を用いて最大尤度の無根系統樹を作成した24。同じプログラムをさらに用いて、選択した枝について表示されるブートストラップ値を算出した。
Cas12b発現プラスミドの作成
Cas12b遺伝子座を合成し、大腸菌で発現させるためにpACYC184 (Genewiz)にクローン化した。Cas12b翻訳領域(ORF)を、ORFに隣接する上流および下流の配列を変更せずに、ヒトでの発現用にコドン最適化した。CRISPRアレイを3つの直接反復に省略し、最初の内在性スペーサーをFnCpf1プロトスペーサー1 (FnPSP1)配列(GAGAAGTCATTTAATAAGGCCACTGTTAAAA) (配列番号591)に置き換えた。
PAMの発見
以前に記載されている方法でPAMの特定を行った10。簡潔に言えば、pACYC184-Cas12bシステムを発現する大腸菌細胞をZ-competentキット(Zymo Research)で形質転換受容性にした。pACYC184-Cas12bまたは空のpACYC184を発現する細胞を、FnPSP1標的部位の5'側に無作為化された8N配列を持つPAMライブラリーで形質転換し、一晩、16時間増殖させた。プラスミドDNAを単離し、75サイクルのNextSeqキット(Illumina)を用いてライブラリーを配列決定した。ライブラリー内のPAMの表示をカスタムPythonスクリプトを用いて決定し、Cas12bと2つの独立した複製物を持つ対照とで比較した。Weblogoツール(weblogo.berkeley.edu)を用いて配列モチーフを作成した。Kronaプロット(github.com/marbl/Krona/wiki)を用いてPAMの車輪グラフを作成した22。
細菌RNAの配列決定
以前に記載されている方法で1,10低分子RNA配列決定を行った。簡潔に言えば、TRIzolを用いて大腸菌の溶菌液からRNAを調製した後、BeadBeater (BioSpecProducts)で均質化した。rRNAをRibo-Zeroキット(Illumina)で取り出し、NEBNext Small RNA Library Kit for Illumina (NEB)を用いてライブラリーを調製した。ライブラリーをペアエンド法で2x150bpのMiSeqラン(Illumina)で配列決定し、読取りをGeneious R9 (Biomatters)で整列化し、解析した。
Cas12bタンパク質の精製
Cas12b遺伝子を細菌発現プラスミド(T7-TwinStrep-SUMO-NLS-Cas12b-NLS-3xHA)にクローン化し、BL21(DE3)細胞(Novagen #70956のpLysS-tRNAプラスミドを含むNEB #C2527H)で発現した。細胞をTerrific Brothで対数増殖期中期まで増殖させ、温度を20°Cに下げた。0.25mMのイソプロピルチオガラクトシド(IPTG)を用いて0.6光学密度(OD)で16~20時間、発現を誘導してから、細胞を回収して-80°Cで凍結させた。細胞ペーストを、エチレンジアミン四酢酸(EDTA)を含まない完全なプロテアーゼ阻害因子(Roche)を添加した溶解緩衝液(50 mMのTRIS (pH8)、500 mMのNaCl、5%グリセロール、1mMのジチオスレイトール(DTT))に再懸濁した。LM20微小流体化装置(Microfluidics)を用いて細胞を溶解し、Strep-Tactin Superflow Plus樹脂(Qiagen)に結合した溶菌液を除去した。溶解緩衝液で樹脂を洗浄し、Cas12bタンパク質を5mMのデスチオビオチンを添加した溶解緩衝液で溶出した。プロテアーゼのCas12bに対する重量比が1:100の自家製SUMOプロテアーゼUlp1で4°Cで一晩消化することにより、TwinStrep-SUMOタグを除去した。切断されたCas12bタンパク質を200 mMのNaClに希釈し、HiTrapヘパリンHPカラムを用いて200 mM~1MのNaCl勾配でAKTA Pure 25L (GE Healthcare Life Sciences)で精製した。Cas12bを含む画分をプールして濃縮し、最終保存緩衝液(25 mMのTRIS (pH 8)、500 mMのNaCl、5%グリセロール、1mMのDTT)と共にSuperdex 200 Increaseカラム(GE Healthcare Life Sciences)に充填した。精製されたCas12bタンパク質を濃縮して5 μMまたは73 μMの原液にし、液体窒素で急速冷凍してから-80°Cで保存した。
in vitroでのRNA合成
すべてのRNAを、所望のRNAの逆相補鎖を含むDNAオリゴヌクレオチドを短いT7オリゴヌクレオチドとアニールすることで生成した。HiScribe T7 High Yield RNA合成キット(NEB)を用いて37°Cで8~12時間、in vitro転写を行い、Agencourt AMPure RNA Cleanビーズ(Beckman Coulter)を用いてRNAを精製した。
in vitroでの切断反応
DNA基質を、FnPSP1標的部位を含むpUC19プラスミドのPCR増幅により生成した。典型的な反応は、100 ngのDNA基質、250 nMのCas12bタンパク質、500 nMのRNA、および最終1倍反応緩衝液(20 mMのTRIS (pH 6.5)、6 mMのMgCl2)を含んでいた。反応を20mMのEDTAで停止し、RNAを5 μgのRNAse A (Qiagen)で37°Cで5分間消化し、PCR精製キット(Qiagen)を用いてDNA産物を精製した。反応を1倍TBE緩衝液(Thermo Fisher Scientific)中でNovex 10% TBE PAGEゲル上で行い、SYBR Gold (Thermo Fisher Scientific)で染色した。標識付きDNA基質を、IR700およびIR800結合DNAオリゴヌクレオチド(IDT)を用いて作成した。変性ゲルについては、DNAを等量の100%ホルムアミドと混合した後、95°Cで5分間熱変性させた。生成物を、60°Cに予熱した1倍TBE緩衝液中でNovex Urea-PAGEゲル(Thermo Fisher Scientific)で分離し、Odyssey CLx装置(LI-COR)で画像化した。該当する場合、DNA切断すなわちニッキングの定量化を式:100 × (1-sqrt(1 - (b+c)/(a+b+c)))で決定した。ここで、aは未消化生成物の積分強度である。bおよびcは、各切断すなわちニッキング生成物の積分強度である。
哺乳動物の発現構築物および変異誘発
Cas12b遺伝子を対応するpACYC184プラスミドから増幅し、N末端およびC末端のNLSタグとC末端の3×HAタグを含むpCDNA3.1にクローン化した。ガイド発現プラスミドを、U6プロモーターの後ろに2つの反転したBsmBI IIS型制限部位を持つsgRNA足場をクローン化することにより生成した。ガイドを、2つのアニールされた相補性オリゴヌクレオチドを用いたGolden Gateアセンブリで足場にクローン化した。特に記載しない限り、すべてのガイド長は23ヌクレオチドである。所望のCas12b変異をオリゴヌクレオチドに指示して2つの重複するCas12b PCR産物を生成し、これをGibson Assembly Master Mix (NEB)を用いて組み立てた。使用したガイド配列を下の表31に示す。
Figure 2024138266000156
Figure 2024138266000157
細胞培養および遺伝子導入
HEK293T細胞(ATCC)を、多量のグルコース、ピルビン酸ナトリウム、GlutaMAX (Thermo Fisher Scientific)、1×ペニシリン-ストレプトマイシン(Thermo Fisher Scientific)、および10%ウシ胎児血清(Seradigm)を含むダルベッコ改変イーグル培地で培養した。細胞を90%未満の集密度に維持し、MycoAlert検出キット(Lonza)を用いてマイコプラズマ陰性であることを試験した。挿入欠失解析のために、遺伝子導入時点で約75%の集密度になるよう、遺伝子導入の約16時間前に96ウェルプレートに17,500個/ウェルの細胞を播いた。各96ウェルを、0.6 μLのTransIt-LT1遺伝子導入試薬(Mirus)を含む20 μLのOpti-MEM (Thermo Fisher Scientific)に溶解した100 ngのヌクレアーゼ発現プラスミドと100 ngのガイドプラスミドとを用いて遺伝子導入した。遺伝子導入の72時間後、QuickExtract DNA抽出溶液(Lucigen)で細胞を回収した。
HDR実験については、96ウェルあたり100 ngのヌクレアーゼ、100 ngのガイド、および100ngのssODNを0.9 μLのTransIt-LT1遺伝子導入試薬(Mirus)を用いて遺伝子導入した。ssODNはUltramerDNAオリゴヌクレオチド(IDT)として注文され、各末端に3つのホスホロチオエート改変を含んでいた。
挿入欠失変異のディープシーケンシング
2ラウンドPCR方策を用いて、NEBNext High-Fidelity 2x PCR Master Mix (NEB)で目的のゲノム領域を増幅してIllumina P5アダプターおよび固有の試料特異的バーコードを追加することにより、標的挿入欠失解析を行った。ライブラリーを1×200サイクルのMiSeqラン(Illumina)で配列決定した。挿入欠失率をOutknocker2で測定した(www.outknocker.org/outknocker2.htm) 25。
非特異的解析
変形したライブラリー調製と共にガイド配列決定を用いて、非特異的切断部位を特定した。簡潔に言えば、細胞に、50 μLのOpti-MEMに溶解した75 ngのヌクレアーゼプラスミド、25 ngのガイドプラスミド、および100 ngのアニールされたdsDNAオリゴを、0.5 μLのGeneJuice Transfection Reagent (Millipore)と共に96ウェルプレートで遺伝子導入した。
F: /5phos/G*T*TGTGAGCAAGGGCGAGGAGGATAACGCCTCTCTCCCAGCGACT*A*T (配列番号644)
R: /5phos/A*T*AGTCGCTGGGAGAGAGGCGTTATCCTCCTCGCCCTTGCTCACA*A*C (配列番号645)
72時間後に細胞を回収し、各実験のために10個のウェルをプールした。1E6細胞を溶解し、ゲノムDNAにTn5をタグ付けした後、プラスミドmini-prepカラム(Qiagen)を用いて精製した。Tn5アダプター特異的なプライマーとDNAドナー内に入れ子になったプライマーとを用いて、KOD Hot Start DNAポリメラーゼ(Millipore)による2回のPCR増幅によりライブラリーを調製した。75サイクルのNextSeqキット(Illumina)を用いてライブラリーを配列決定した。BrowserGenome.orgを用いて読取りをヒトゲノム(hg38)にマッピングした26。
T細胞培養
ヒトCD4陽性T細胞(STEMCELL Technologies)を、5 mMのHEPES (pH 8.0) (Gibco)、50 μg/mLのペニシリン/ストレプトマイシン(Gibco)、50 μMの2-メルカプトエタノール(Sigma-Aldrich)、5 mMの MEM非必須アミノ酸(Gibco)、5 mMのピルビン酸ナトリウム(Gibco)、および10%FBS(Seradigm)を添加したRMPI 1640 (Glutamax Supplement, Gibco)で培養した。細胞を、解凍の5~7日後、10 μg/mLの抗CD3(UCHT1、eBioscience、Invitrogen)および抗CD28(CD28.2, eBioscience, Invitrogen)モノクローナル抗体でコートした皿に2日ごとに播くことにより、活性化させた。
RNP複合体化および送達
3'末端に3つの2'O-メチル改変を持つBhCas12b sgRNAを合成した(Integrated DNATechnologies)。10 mg/mLのタンパク質を50 μMのアニールしたRNAと1:1のモル比で37°Cで15分間インキュベートすることにより、RNPを形成した。RNPをエレクトロポレーションまで氷上で保存した。
Amaxa P3 Primary Cell 4D-Nucleofector X Kit (Lonza)を用いて細胞をエレクトロポレーションした。反応ごとに、3×105の刺激されたCD4陽性T細胞をペレット化し、20 μLのP3緩衝液に再懸濁した。crRNAおよびtracrRNAとあらかじめ複合体化した4.5 μMのCas9またはCas12bタンパク質を添加し、混合物をエレクトロポレーションキュベットに移した。Amaxa 4D-Nucleofector (Lonza)でプログラムEH-115を用いて細胞をエレクトロポレーションした。パルスの後すぐに80μLの予熱済み完全培地を細胞に添加し、キュベット内で細胞を37°Cで30分間インキュベートして回復させた。回収後、50 μLの細胞懸濁液を50 μLの完全培地+80 IU/mLのIL-2 (STEMCELL Technologies)に加え、最終濃度をIL-2が40 IU/mLになるようにした。細胞をCD3/CD28で予めコートした96ウェルプレートに播いた。挿入欠失解析のために48時間後に細胞を回収した。
[参考文献]
* 1 Shmakov, S. et al. Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems. Mol Cell 60, 385-397, doi:10.1016/j.molcel.2015.10.008 (2015).
* 2 Seuylemezian, A., Cooper, K., Schubert, W. & Vaishampayan, P. Draft Genome Sequences of 12 Dry-Heat-Resistant Bacillus Strains Isolated from the Cleanrooms Where the Viking Spacecraft Were Assembled. Genome announcements 6, doi:10.1128/genomeA.00094-18 (2018).
* 3 Knott, G. J. & Doudna, J. A. CRISPR-Cas guides the future of genetic engineering. Science 361, 866-869, doi:10.1126/science.aat5011 (2018).
* 4 Hsu, P. D., Lander, E. S. & Zhang, F. Development and Applications of CRISPR-Cas9 for Genome Engineering. Cell 157, 1262-1278, doi:10.1016/j.cell.2014.05.010 (2014).
* 5 Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339, 819-823, doi:10.1126/science.1231143 (2013).
* 6 Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science 339, 823-826, doi:10.1126/science.1232033 (2013).
* 7 Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607, doi:10.1038/nature09886 (2011).
* 8 Bolotin, A., Ouinquis, B., Sorokin, A. & Ehrlich, S. D. Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin. Microbiol-Sgm 151, 2551-2561, doi:10.1099/mic.0.28048-0 (2005).
* 9 Makarova, K. S., Grishin, N. V., Shabalina, S. A., Wolf, Y. I. & Koonin, E. V. A putative RNA-interference-based immune system in prokaryotes: computational analysis of the predicted enzymatic machinery, functional analogies with eukaryotic RNAi, and hypothetical mechanisms of action. Biol Direct 1, doi:Artn 710.1186/1745-6150-1-7 (2006).
* 10 Zetsche, B. et al. Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system. Cell 163, 759-771, doi:10.1016/j.cell.2015.09.038 (2015).
* 11 Shmakov, S. et al. Diversity and evolution of class 2 CRISPR-Cas systems. Nat Rev Microbiol 15, 169-182, doi:10.1038/nrmicro.2016.184 (2017).
* 12 Cox, D. B. T. et al. RNA editing with CRISPR-Cas13. Science 358, 1019-1027, doi:10.1126/science.aaq0180 (2017).
* 13 Hsu, P. D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol 31, 827-+, doi:10.1038/nbt.2647 (2013).
* 14 Yang, H., Gao, P., Rajashankar, K. R. & Patel, D. J. PAM-Dependent Target DNA Recognition and Cleavage by C2c1 CRISPR-Cas Endonuclease. Cell 167, 1814-1828 e1812, doi:10.1016/j.cell.2016.11.053 (2016).
* 15 Wu, D., Guan, X., Zhu, Y., Ren, K. & Huang, Z. Structural basis of stringent PAM recognition by CRISPR-C2c1 in complex with sgRNA. Cell Res 27, 705-708, doi:10.1038/cr.2017.46 (2017).
* 16 Suzuki, M. A framework for the DNA-protein recognition code of the probe helix in transcription factors: the chemical and stereochemical rules. Structure (London, England : 1993) 2, 317-326 (1994).
* 17 Mavromatis, K., Tsigos, I., Tzanodaskalaki, M., Kokkinidis, M. & Bouriotis, V. Exploring the role of a glycine cluster in cold adaptation of an alkaline phosphatase. Eur J Biochem 269, 2330-2335 (2002).
* 18 Saavedra, H. G., Wrabl, J. O., Anderson, J. A., Li, J. & Hilser, V. J. Dynamic allostery can drive cold adaptation in enzymes. Nature 558, 324-+, doi:10.1038/s41586-018-0183-2 (2018).
* 19 Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197, doi:10.1038/nbt.3117 (2015).
* 20 Fu, Y. F. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-+, doi:10.1038/nbt.2623 (2013).
* 21 Liu, L. et al. C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism. Mol Cell 65, 310-322, doi:10.1016/j.molcel.2016.11.040 (2017).
* 22 Leenay, R. T. et al. Identifying and Visualizing Functional PAM Diversity across CRISPR-Cas Systems. Molecular Cell 62, 137-147, doi:10.1016/j.molcel.2016.02.031 (2016).
* 23 Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res 32, 1792-1797, doi:10.1093/nar/gkh340 (2004).
* 24 Guindon, S. & Gascuel, O. A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Syst Biol 52, 696-704 (2003).
* 25 Schmid-Burgk, J. L. et al. OutKnocker: a web tool for rapid and simple genotyping of designer nuclease edited cell lines. Genome Res 24, 1719-1723, doi:10.1101/gr.176701.114 (2014).
* 26 Schmid-Burgk, J. L. & Hornung, V. BrowserGenome.org: web-based RNA-seq data analysis and visualization. Nat Methods 12, 1001, doi:10.1038/nmeth.3615 (2015).
* Jinek, M. et al. A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science 337, 816-821 (2012).
* Teng, F. et al. Repurposing CRISPR-Cas12b for mammalian genome engineering. Cell Discov 4, 63 (2018).
実施例26
図58は、Cas12b (C2c1)構造(PDB構造5U30に基づく)を示している。この図は、さらなるssDNAに達するための構造上予測されるssDNA経路、および部分的または全体的に除去される可能性のあるドメインを示す。
実施例27
ADAR活性に影響を及ぼすADARの変異を、酵母選別で選別した。選別を複数回実行した。各回の選別により候補の変異の組を得た。次に、候補の変異を哺乳類細胞で検証した。性能の高い変異を最新版の変異に追加し、再選別した。10回で選別した変異を下の表32に示す。n回目で特定された変異体を「RESCUE vn-1」と名付けた。本明細書で説明したとおり、RESCUEは、アデノシンデアミナーゼ活性をシチジンデアミナーゼ活性に変換する変異を指す。
Figure 2024138266000158
RESCUE変異体の用量応答をTモチーフ(図59)ならびにCおよびGモチーフ(図60)で試験した。RESCUE v3、v6、v7、およびv8を用いた内因性標的化を試験した(図61および62)。
RESCUE v9について変異の選別を行った(図63)。RESCUE v9について、可能性のある変異を特定した(図64)。塩基フリップおよびモチーフ試験を行った(図65)。様々なモチーフフリップでRESCUE v9の効果を試験した(図66)。データは、v9がCフリップガイドの場合により良く機能したことを示唆している。RESCUE v1およびv8を用いた場合のB6とB12との比較を、50 bpのガイド(図67)および30 bpのガイド(図68)を用いて行った。
実施例28
本実施例は、RESCUEの1回目~12回目の結果を要約する(図69~80を参照のこと)。試験した追加の表現型には、PCSK9、Stat3、IRS1、およびTFEBが含まれていた。PCSK9は、クローン化によりプロモーターが改良されることを示した。Stat3は各部位で約10%の編集を示した。シグナル伝達の阻害をルシフェラーゼレポーターで試験する。IRS1については、合成部位の標的化を脂肪細胞前駆細胞への移動の前に試験する。TFEBについては、転写因子→オートファジーの転座を引き起こすように標的化を設計してもよい。さらに、12の内在性リン酸部位標的および48の合成標的のパネルを試験する。S22Pを含むV11基礎環境で酵母での選別を継続する。的中した上位のものをV13のためにV12で選別し、新たな回の酵母の的中を評価する。特異性選別について、ルシフェラーゼでの選別で的中したさらに数百のものを評価し、Ade2編集を検証する。ライブラリーの複雑性および様々な酵母レポーターについて、遺伝子組換えも試験する。
実施例29
本実施例は、Cas12bおよびその多様体ならびにデアミナーゼを用いる模範的な塩基編集手法を示す。
図81、81~86は、CからTへの塩基編集機能によるCas12bのBhv4切断を示す。触媒的に不活性なBhv4のC末端の142個のアミノ酸を除去し(dBhv4Δ142、変異D574Aを不活性化し、新たな合計の大きさは966アミノ酸である)、リンカーおよびラットApobecドメインをC末端に融合した後、CからTへの塩基編集が、非標的鎖のガイド塩基対位置14で最大10.95%の頻度で観察された。ガイド位置15では6.97%の編集効率が検出された。この活性はガイドに依存していた。既存の構築物への融合または自由発現のいずれかによりウラシル-DNAグリコシラーゼ阻害因子(UGI)ドメインを追加すると、このCからTへの変換が増強される。列挙したガイド配列(大文字)は、HEK293T細胞のGRIN2B内の領域を標的化する。
図87は全長BhCas12bを用いた模範的な塩基編集手法を示す。第2のNLS配列をN末端のrApobecに付加してドメインを互いに離した。
実施例30
図88Aは、BhCas12b v4および別の相同分子種AaCas12b (Teng F. et al., Repurposing CRISPR-Cas12b for mammalian genome engineering in HEK293Tcells(HEK293T細胞における哺乳動物のゲノム操作へのCRISPR-Cas12bの転用)に記載のとおり)の挿入欠失活性の比較を示す。図88Bおよび88Cは、BhCas12b v4 またはBhCas12bを発現するAAV1/2のラット神経細胞への形質導入を示す。この設計は、挿入欠失活性で測定したところ、より高い活性を示した。最適化したベクター内でポリA配列を延長し、U6プロモーターおよびsgRNA足場を逆の鎖に移動した。
本試験における配列を下の表33に示す。px602-bh最適化AAVのマップを図89A、px602-bv最適化AAVのマップを図89Bに示す。
Figure 2024138266000159
Figure 2024138266000160
Figure 2024138266000161
Figure 2024138266000162
Figure 2024138266000163
Figure 2024138266000164
Figure 2024138266000165
Figure 2024138266000166
Figure 2024138266000167
* * *
記載した本発明の方法、医薬組成物、およびキットの様々な変形例および変更が、本発明の範囲および精神から逸脱することなく当業者には明らかである。特定の実施態様に関して本発明を説明したが、当然ながら、それをさらに変形することが可能であり、特許請求される本発明はそのような特定の実施態様に過度に限定されるべきではない。実際、当業者に明らかである、記載した本発明の実施方法に対する様々な変形例は、本発明の範囲内であると意図される。本出願は、一般に、本発明の原則に従い、また本開示からのそのような発展を含む、本発明が関連する技術における公知の慣行の範囲内にある本発明の任意の変更、使用、または適合を包含することを意図し、本出願を本明細書で先に述べた本質的な特徴に応用することができる。
[配列表]
SEQUENCE LISTING

<110> The Broad Institute, Inc.
Massachusetts Institute of Technology
Zhang, Feng
Strecker, Jonathan
Slaymaker, Ian
Jones, Sara

<120> Novel CAS12B Enzymes and Systems

<130> BROD-2670US

<150> 62/715,640
<151> 2018-08-07

<150> 62/744,080
<151> 2018-10-10

<150> 62/751,196
<151> 2018-10-26

<150> 62/794,929
<151> 2019-01-21

<150> 62/831,028
<151> 2019-04-08

<150> PCT/US2019/045582
<151> 2019-08-07

<160> 663

<170> PatentIn version 3.5

<210> 1
<211> 188
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 1
cgccuaucag ccaacaugcu cgcuuugcga aggcugacgg cccgcucuca uuuggcauug 60

ccgggagccg gaguuuucgg aagagagugu cgacgacugc ugaucuccgc auccgcgucc 120

uguucgccag gccgggucgg guguacggau caugcuggca gcagucuacg ccgagaacau 180

ucgcuuuu 188


<210> 2
<211> 60
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 2
cggaagagag ugucgacgac ugcugaucuc cgcauccgcg uccuguucgc caggccgggu 60


<210> 3
<211> 62
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 3
ccaacaugcu cgcuuugcga aggcugacgg cccgcucuca uuuggcauug ccgggagccg 60

ga 62


<210> 4
<211> 118
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 4
ucgcuuugcg aaggcugacg gcccgcucuc auuuggcauu gccgggagcc ggaguuuucg 60

gaagagagug ucgacgacug cugaucuccg cauccgcguc cuguucgcca ggccgggu 118


<210> 5
<211> 87
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 5
augcucgcuu ugcgaaggcu gacggcccgc ucucauuugg cauugccggg agccggaguu 60

uucggaagag agugucgacg acugcug 87


<210> 6
<211> 71
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 6
aguuuucgga agagaguguc gacgacugcu gaucuccgca uccgcguccu guucgccagg 60

ccgggucggg u 71


<210> 7
<211> 61
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 7
cgccuaucag ccaacaugcu cgcuuugcga aggcugacgg cccgcucuca uuuggcauug 60

c 61


<210> 8
<211> 87
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 8
cgccuaucag ccaacaugcu cgcuuugcga aggcugacgg cccgcucuca uuuggcauug 60

ccgggagccg gaguuuucgg aagagag 87


<210> 9
<211> 84
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 9
ugaucuccgc auccgcgucc uguucgccag gccgggucgg guguacggau caugcuggca 60

gcagucuacg ccgagaacau ucgc 84


<210> 10
<211> 91
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 10
auugccggga gccggaguuu ucggaagaga gugucgacga cugcugaucu ccgcauccgc 60

guccuguucg ccaggccggg ucggguguac g 91


<210> 11
<211> 83
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 11
tccgcatccg cgtcctgttc gccaggccgg gtcgggtgta cggatcatgc tggcagcagt 60

ctacgccgag aacattcgct ttt 83


<210> 12
<211> 60
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 12
cggaagagag ugucgacgac ugcugaucuc cgcauccgcg uccuguucgc caggccgggu 60


<210> 13
<211> 85
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 13
aguuuucgga agagaguguc gacgacugcu gaucuccgca uccgcguccu guucgccagg 60

ccgggucggg uccgcgaaug gacac 85


<210> 14
<211> 129
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 14
tagggaatat tatataatgg acttacgagg ttctgtcttt tggtcaggac aaccgtctag 60

ctataagtgc tgcagggtgt gagaaactcc tattgctgga cgatgtctct tgatacgagg 120

cattagcac 129


<210> 15
<211> 75
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 15
gacgtctagc tataagtgct gcagggtgtg agaaactcct attgctggac gatgtctctt 60

acgaggcatt agcac 75


<210> 16
<211> 106
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 16
acgaggttct gtcttttggt caggacaacc gtctagctat aagtgctgca gggtgtgaga 60

aactcctatt gctggacgat gtctctatga tacgaggcat tagcac 106


<210> 17
<211> 133
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 17
acgaggttct gtcttttggt caggacaacc gtctagctat aagtgctgca gggtgtgaga 60

aactcctatt gctggacgat gtctctttta tttctttttt gtagaaaaaa gaaatgatac 120

gaggcattag cac 133


<210> 18
<211> 97
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 18
gttctgtctt ttggtcagga caaccgtcta gctataagtg ctgcagggtg tgagaaactc 60

ctattgctgg acgatatctc ttacgaggca ttagcac 97


<210> 19
<211> 84
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 19
gtcaggacaa ccgtctagct ataagtgctg cagggtgtga gaaactccta ttgctggacg 60

atgtctctta cgaggcatta gcac 84


<210> 20
<211> 108
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 20
ggacttacga ggttctgtct tttggtcagg acaaccgtct agctataagt gctgcagggt 60

gtgagaaact cctattgctg gacgatgtct cttacgaggc attagcac 108


<210> 21
<211> 102
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 21
acgaggttct gtcttttggt caggacaacc gtctagctat aagtgctgca gggtgtgaga 60

aactcctatt gctggacgat gtctcttacg aggcattagc ac 102


<210> 22
<211> 129
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 22
tagggaatat tatataatgg acttacgagg ttctgtcttt tggtcaggac aaccgtctag 60

ctataagtgc tgcagggtgt gagaaactcc tattgctgga cgatgtctct ttatacgagg 120

cattagcac 129


<210> 23
<211> 121
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 23
attatatatt ggacttacga ggttctgtct tttggtcagg acaaccgtct agctataagt 60

gctgcagggt gtgagaaact cctattgctg gacgatgtct ctttatacga ggcattagca 120

c 121


<210> 24
<211> 113
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 24
atggacttac gaggttctgt cttttggtca ggacaaccgt ctagctataa gtgctgcagg 60

gtgtgagaaa ctcctattgc tggacgatgt ctctttatac gaggcattag cac 113


<210> 25
<211> 105
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 25
acgaggttct gtcttttggt caggacaacc gtctagctat aagtgctgca gggtgtgaga 60

aactcctatt gctggacgat gtctctttat acgaggcatt agcac 105


<210> 26
<211> 160
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 26
tagggaatat tatataatgg acttacgagg ttctgtcttt tggtcaggac aaccgtctag 60

ctataagtgc tgcagggtgt gagaaactcc tattgctgga cgatgtctca tttatttctt 120

aattgtccaa gaattaagaa atgatacgag gcattagcac 160


<210> 27
<211> 152
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 27
attatataat ggacttacga ggttctgtct tttggtcagg acaaccgtct agctataagt 60

gctgcagggt gtgagaaact cctattgctg gacgatgtct catttatttc ttaattgtcc 120

aagaattaag aaatgatacg aggcattagc ac 152


<210> 28
<211> 144
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 28
atggacttac gaggttctgt cttttggtca ggacaaccgt ctagctataa gtgctgcagg 60

gtgtgagaaa ctcctattgc tggacgatgt ctcatttatt tcttaattgt ccaagaatta 120

agaaatgata cgaggcatta gcac 144


<210> 29
<211> 136
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 29
acgaggttct gtcttttggt caggacaacc gtctagctat aagtgctgca gggtgtgaga 60

aactcctatt gctggacgat gtctcattta tttcttaatt gtccaagaat taagaaatga 120

tacgaggcat tagcac 136


<210> 30
<211> 80
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 30
tttgcctaaa gggcaaagaa tactgtgcgt gtgctaagga tggaaaaaat ccattcaacc 60

acaggattac attatttatc 80


<210> 31
<211> 89
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 31
gtcgtctata ggacggcgag gacaacggga actgccaatg tgctctttcc aagagcaaac 60

accccgttgg cttcaagatg accgctcgc 89


<210> 32
<211> 78
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 32
gacctatagg gtcaatgaat ctgtgcgtgt gccataagta attaaaaatt acccaccaca 60

ggattatctt atttctgc 78


<210> 33
<211> 97
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 33
uggcaacucg cccgcuagua caacuucggu ugccccacaa gugaggaccu uucucacgua 60

accguguagg gcaacuuaga cggcaggaua ucuagcc 97


<210> 34
<211> 97
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 34
uggcaacucg cccgcuagua caacuucggu ugccccacaa gugaggaccu uucucacgua 60

accguguagg gcaacuuaga cgccaggaua ucuagcc 97


<210> 35
<211> 138
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 35
gccgaucuau aggacggcag auucaacggg augugccaau gcacucuuuc caggagugaa 60

caccccguug gcuucaacau gaucgcccgc ucaacggucc cuagucggau cguugagcgg 120

gcgaucugag aagggcac 138


<210> 36
<211> 128
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 36
cacggugaag agucuagcgg gcgaguugca ucgcaacucg cccgcuagua caacuucggu 60

ugccccacaa gugaggaccu uucucacgua accguguagg gcaacuuaga ccgcaggaua 120

ucuagccg 128


<210> 37
<211> 112
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 37
cacggugaag agucuagcgg gauccccgcu aguacaacuu cgguugcccc acaagugagg 60

accuuucuca cguaaccgug uagggcaacu uagacggcag gauaucuagc cg 112


<210> 38
<211> 89
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 38
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuuuu 89


<210> 39
<211> 98
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 39
gagguucugu cuuuggucag gacaaccguc uagcuauaag ugcugcaggg ugugagaaac 60

uccuauugcu ggacgauguc ucuacgaggc auuagcac 98


<210> 40
<211> 106
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 40
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuauga uacgaggcau uagcac 106


<210> 41
<211> 102
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 41
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuuacg aggcauuagc ac 102


<210> 42
<211> 104
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 42
gacctatagg gtcaatgaat ctgtgcgtgt gccataagta attaaaaatt acccaccaca 60

ggattatctt atttctgcaa aagcagaaat aagatgattg gcac 104


<210> 43
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 43
ggtgacctat agggtcaatg aatctgtgcg tgtgccataa gtaattaaaa attacccacc 60

acaggattat cttatttctg caaaagcaga aataagatga ttggcac 107


<210> 44
<211> 101
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 44
ctatagggtc aatgaatctg tgcgtgtgcc ataagtaatt aaaaattacc caccacagga 60

ttatcttatt tctgcaaaag cagaaataag atgattggca c 101


<210> 45
<211> 88
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 45
gacctatagg gtcaatgaat ctgtgcgtgt gccataagta attaaaaatt acccaccaca 60

ggatcatctt aaaaaagatg attggcac 88


<210> 46
<211> 98
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 46
gacctatagg gtcaatgaat ctgtgcgtgt gccataagta attaaaaatt acccaccaca 60

ggatcatctt atttcaaaag aaataagatg attggcac 98


<210> 47
<211> 88
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 47
gacctatagg gtcaatgaat ctgtgcgtgt gccataagta attaaaaatt acccaccaca 60

ggagcacctg aaaacaggtg cttggcac 88


<210> 48
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 48
gccgtttccc tcactcctgc tcggtgaatt tggctc 36


<210> 49
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 49
gagccaaatt caccgagcag gagtgaggga aacggc 36


<210> 50
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 50
gccgttcccc tcactcctgc tcggcaaatt tagctc 36


<210> 51
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 51
gagctaaatt tgccgagcag gagtgagggg aacggc 36


<210> 52
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 52
gctgtttggg aggtcagaaa tagggggtcc aggagc 36


<210> 53
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 53
gctcctggac cccctatttc tgacctccca aacagc 36


<210> 54
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 54
gctgttaggg aggtcagaaa taggatgtcc aagagc 36


<210> 55
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 55
gctcttggac atcctatttc tgacctccct aacagc 36


<210> 56
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 56
ccaaattctt ctcccctggg aagcatccct ggacac 36


<210> 57
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 57
gtgtcgaggt gtgcttccca ggggagaagg atttgg 36


<210> 58
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 58
ccaaatcctt ctcccctggg aagcacacct cgacac 36


<210> 59
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 59
ggtttaggaa gaggggaccc ttcgtgtgga gctgtg 36


<210> 60
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 60
gccgtttccc tcactcctgc tcggtgaatt tggctc 36


<210> 61
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 61
gagccaaatt caccgagcaa gagtgaggga aacggc 36


<210> 62
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 62
gccgttcccc tcactcctgc tcggcaaatt tagctc 36


<210> 63
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 63
gagctaaatt tgccgagcag gagtgagggg aacggc 36


<210> 64
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 64
accatctact ccatcatctt cttaactggc attgtgggca atggattggt catcctggtc 60

atgggttacc agaagaaact gagaagcatg acggacaagt acaggct 107


<210> 65
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 65
agcctgtact tgtccgtcat gcttctcagt ttcttctggt aacccatgac caggatgacc 60

aatccattgc ccacaatgcc agttaagaag atgatggagt agatggt 107


<210> 66
<211> 36
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 66

Thr Ile Tyr Ser Ile Ile Phe Leu Thr Gly Ile Val Gly Asn Gly Leu
1 5 10 15


Val Ile Leu Val Met Gly Tyr Gln Lys Lys Leu Arg Ser Met Thr Asp
20 25 30


Lys Tyr Arg Leu
35


<210> 67
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 67
gcacctgtca gtggccgacc tcctctttgt catcacgctt cccttctggg cagttgatgc 60

cgtggcaaac tggtactttg ggaacttcct atgcaaggca gtccatg 107


<210> 68
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 68
catggactgc cttgcatagg aagttcccaa agtaccagtt tgccacggca tcaactgccc 60

agaagggaag cgtgatgaca aagaggaggt cggccactga caggtgc 107


<210> 69
<211> 35
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 69

His Leu Ser Val Ala Asp Leu Leu Phe Val Ile Thr Leu Pro Phe Trp
1 5 10 15


Ala Val Asp Ala Val Ala Asn Trp Tyr Phe Gly Asn Phe Leu Cys Lys
20 25 30


Ala Val His
35


<210> 70
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 70
tcatctacac agtcaacctc tacagcagtg tcctcatcct ggccttcatc agtctggacc 60

gctacctggc catcgtccac gccaccaaca gtcagaggcc aaggaag 107


<210> 71
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 71
cttccttggc ctctgactgt tggtggcgtg gacgatggcc aggtagcggt ccagactgat 60

gaaggccagg atgaggacac tgctgtagag gttgactgtg tagatga 107


<210> 72
<211> 36
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 72

Val Ile Tyr Thr Val Asn Leu Tyr Ser Ser Val Leu Ile Leu Ala Phe
1 5 10 15


Ile Ser Leu Asp Arg Tyr Leu Ala Ile Val His Ala Thr Asn Ser Gln
20 25 30


Arg Pro Arg Lys
35


<210> 73
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 73
ctgttggctg aaaaggtggt ctatgttggc gtctggatcc ctgccctcct gctgactatt 60

cccgacttca tctttgccaa cgtcagtgag gcagatgaca gatatat 107


<210> 74
<211> 107
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 74
atatatctgt catctgcctc actgacgttg gcaaagatga agtcgggaat agtcagcagg 60

agggcaggga tccagacgcc aacatagacc accttttcag ccaacag 107


<210> 75
<211> 36
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 75

Leu Leu Ala Glu Lys Val Val Tyr Val Gly Val Trp Ile Pro Ala Leu
1 5 10 15


Leu Leu Thr Ile Pro Asp Phe Ile Phe Ala Asn Val Ser Glu Ala Asp
20 25 30


Asp Arg Tyr Ile
35


<210> 76
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 76
ccgacttcat ctttgccaac gtc 23


<210> 77
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 77
tgggcaatgg attggtcatc ctg 23


<210> 78
<211> 122
<212> RNA
<213> Bacillus hisashii


<220>
<221> misc_feature
<222> (103)..(122)
<223> n is a, c, g, or u

<400> 78
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuuacg aggcauuagc acnnnnnnnn nnnnnnnnnn 120

nn 122


<210> 79
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 79
gccgtttccc tcactcctgc tcggtgaatt tggctc 36


<210> 80
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 80
gagccaaatt caccgagcag gagtgaggga aacggc 36


<210> 81
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 81
gccgttcccc tcactcctgc tcggcaaatt tagctc 36


<210> 82
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 82
gccgttcccc tcactcctgc tcggcaaatt tagctc 36


<210> 83
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 83
gagctaaatt tgccgagcag gagtgagggg aacggc 36


<210> 84
<211> 115
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 84
gucgucuaua ggacggcgag gacaacggga agugccaaug ugcucuuucc aagagcaaac 60

accccguugg cuucaagaug accgcucgaa aacgagcggu cugagaagug gcacu 115


<210> 85
<211> 113
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 85
gucgucuaua ggacggcgag gacaacggga agugccaaug ugcucuuucc aagagcaaac 60

accccguugg cuucucagac cgcucgaaaa cgagcggucu gagaaguggc acu 113


<210> 86
<211> 118
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 86
acagucgucu auaggacggc gaggacaacg ggaagugcca augugcucuu uccaagagca 60

aacaccccgu uggcuucaag augaccgcuc gaaaacgagc ggucugagaa guggcacu 118


<210> 87
<211> 112
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 87
gucuauagga cggcgaggac aacgggaagu gccaaugugc ucuuuccaag agcaaacacc 60

ccguuggcuu caagaugacc gcucgaaaac gagcggucug agaaguggca cu 112


<210> 88
<211> 111
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 88
gucgucuaua ggacggcgag gacaacgggg ugccaaugug cucuuuccaa gagcaaacac 60

cccguuggcu ucucagaccg cucgaaaacg agcggucuga gaaguggcac u 111


<210> 89
<211> 105
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 89
gucgucuaua ggacggcgag gacaacggga agugccaaug ugcucuuucc aagagcaaac 60

accccguugg cuucucagac cgaaaacggu cugagaagug gcacu 105


<210> 90
<211> 102
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 90
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuuacg aggcauuagc ac 102


<210> 91
<211> 97
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 91
guucugucuu uuggucagga caaccgucua gcuauaagug cugcagggug ugagaaacuc 60

cuauugcugg acgaugucuc uuacgaggca uuagcac 97


<210> 92
<211> 97
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 92
guucugucuu uuggucagga caaccgucua gcuauaagug cugcagggug ugagaaacuc 60

cuauugcugg acgacgccuc uuacgaggcg uuagcac 97


<210> 93
<211> 95
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 93
guucugucuu uuggucagga caaccgucua gcuauaagug cugcagggug ugagaaacuc 60

cuauugcugg acgacgccuu acgaggcguu agcac 95


<210> 94
<211> 92
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 94
guucugucuu uuggucagga caaccgucca gcuauaagug cugcagggug cagaaacucc 60

uauugcugga cgacgccuua cggcguuagc ac 92


<210> 95
<211> 115
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 95
guucugucuu uuggucagga caaccgucca gcuauaagug cugcagggug cagaaacucc 60

uauugcugga cgacgccuca uuuauuucaa aagaaauguu acgaggcguu agcac 115


<210> 96
<211> 135
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (116)..(135)
<223> n is a, c, g, or u

<400> 96
gucgucuaua ggacggcgag gacaacggga agugccaaug ugcucuuucc aagagcaaac 60

accccguugg cuucaagaug accgcucgaa aacgagcggu cugagaagug gcacunnnnn 120

nnnnnnnnnn nnnnn 135


<210> 97
<211> 104
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 97
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggauuaucuu auuucugcaa aagcagaaau aagaugauug gcac 104


<210> 98
<211> 107
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 98
ggugaccuau agggucaaug aaucugugcg ugugccauaa guaauuaaaa auuacccaac 60

acaggauuau cuuauuucug caaaagcaga aauaagauga uuggcac 107


<210> 99
<211> 101
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 99
cuauaggguc aaugaaucug ugcgugugcc auaaguaauu aaaaauuacc caccacagga 60

uuaucuuauu ucugcaaaag cagaaauaag augauuggca c 101


<210> 100
<211> 88
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 100
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggaucaucuu aaaaaagaug auuggcac 88


<210> 101
<211> 98
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 101
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggaucaucuu auuucaaaag aaauaagaug auuggcac 98


<210> 102
<211> 88
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 102
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggagcaccug aaaacaggug cuuggcac 88


<210> 103
<211> 124
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (105)..(124)
<223> n is a, c, g, or u

<400> 103
gaccuauagg gucaaaguau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggauuaucuu auuucugcaa aagcagaaau aagaugauug gcacnnnnnn nnnnnnnnnn 120

nnnn 124


<210> 104
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 104
ccaaattctt ctcccctggg aagcatccct ggacac 36


<210> 105
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 105
gtgtccaggg atgcttccca ggggagaaga atttgg 36


<210> 106
<211> 40
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t

<220>
<221> misc_feature
<222> (39)..(40)
<223> n is a, c, g, or t

<400> 106
nnccaaatcc ttctcccctg ggaagcacac ctcgacacnn 40


<210> 107
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 107
ccaaatcctt ctcccctggg aagcacacct cgacac 36


<210> 108
<211> 36
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 108
gtgtcgaggt gtgcttccca ggggagaagg atttgg 36


<210> 109
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 109
agagcactgg catggggatg ngg 23


<210> 110
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 110
ggaacactgg catggagatg ngg 23


<210> 111
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 111
agaacagtgg catggggatg ngg 23


<210> 112
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 112
tgaacactgg catggggaag ngg 23


<210> 113
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 113
gaagcactgc catgggaatg ngg 23


<210> 114
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 114
agagcactgg aatgggaatg ngg 23


<210> 115
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 115
ggagcgctgg catggggact ngg 23


<210> 116
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 116
tgaacactgg catggggctg ngg 23


<210> 117
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 117
agagcactgg caggaggatg ngg 23


<210> 118
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 118
ggagcactgg catgggatgt nga 23


<210> 119
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 119
gagcccctgg catggggatg ngg 23


<210> 120
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 120
caggcactgg catggggacc ngg 23


<210> 121
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 121
aggatacagg caggggaatg ngg 23


<210> 122
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 122
agaatactgg catgggaatg ngg 23


<210> 123
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 123
gaaggactgg cacggggatg ngg 23


<210> 124
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 124
ggagcactgg tagggggatg ngg 23


<210> 125
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 125
agagaactgc catgggaatg ngg 23


<210> 126
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 126
aaagcactgg ccatgggatg ngg 23


<210> 127
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 127
gaggcactgg catgggggtg ngg 23


<210> 128
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 128
agagcacggg catgaggatc ngg 23


<210> 129
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 129
attntagagc actggcatgg ggatggg 27


<210> 130
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 130
attntagagc actggcatgg ggatggg 27


<210> 131
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 131
tgctccagag gccccccttg ngg 23


<210> 132
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 132
ggctccagag gctccccttg nga 23


<210> 133
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 133
tgctccagag gctccccttg ngg 23


<210> 134
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 134
ggctccagag gcccccctgc ngg 23


<210> 135
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 135
agctccagag cccccccttg nga 23


<210> 136
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 136
tgccccagag gcccccctca ngg 23


<210> 137
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 137
ggctccagag gctcccctgt ngg 23


<210> 138
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 138
tgctccaggg acccccctct ngg 23


<210> 139
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 139
agctccagac actccccttg ngg 23


<210> 140
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 140
gtctccagag gctcccctga ngg 23


<210> 141
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 141
ggctccaaaa accccccttt ngg 23


<210> 142
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 142
tgctccaagg gccccccttg nag 23


<210> 143
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 143
aggtccagag gccacccttg ngg 23


<210> 144
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 144
atctccagag gcctccctgg ngg 23


<210> 145
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 145
cctgccccag aggtcccttg ngg 23


<210> 146
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 146
tgctccagag ctccccttct nga 23


<210> 147
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 147
ctatccagag gctcccctcc ngg 23


<210> 148
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 148
ctcctcagag gcccccctgg ngg 23


<210> 149
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 149
ggctccaggg gccccacttg ngg 23


<210> 150
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 150
ttttccagag gcccccctcc ngg 23


<210> 151
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 151
attnttgctc cagaggcccc ccttggg 27


<210> 152
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 152
attnttgctc cagaggcccc ccttggg 27


<210> 153
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 153
ggtgccagaa acaggggtga ngg 23


<210> 154
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 154
ggtaccagaa acagggggga ngg 23


<210> 155
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 155
gctgccagga acagaggtga ggg 23


<210> 156
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 156
ggttccagaa agaggggtga ngg 23


<210> 157
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 157
aatgccagga acaggggtgg ngg 23


<210> 158
<211> 22
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, or t

<400> 158
gggccagaaa caggggtgan gg 22


<210> 159
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 159
caagccagaa acaggggtga ngg 23


<210> 160
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 160
ggtatcagaa gcaggggtga ngg 23


<210> 161
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 161
gaggccagaa aaaggggtga ngg 23


<210> 162
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 162
ggtggcagga acaggggtgg ngg 23


<210> 163
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 163
agtgacagaa acaggaatga ngg 23


<210> 164
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 164
gaagccagaa gcaggggtga ngg 23


<210> 165
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 165
ggagccagaa gcaggggaga ngg 23


<210> 166
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 166
ggagccagaa acagggatgg ngg 23


<210> 167
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 167
agtaccagga acaggggagt ngg 23


<210> 168
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 168
agtgccagga gcaggggaga ngg 23


<210> 169
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 169
ggtaccaaaa aaaggggaga ngg 23


<210> 170
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 170
gatgccagag gcaggggaga ngg 23


<210> 171
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 171
agggccagaa acaggaggga ngg 23


<210> 172
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 172
ggtgccagga acgggggtga ngg 23


<210> 173
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 173
attnctggtg ccagaaacag gggtgac 27


<210> 174
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 174
attnctggtg ccagaaacag gggtgac 27


<210> 175
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 175
gggcttcaag caacttgtag cgg 23


<210> 176
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 176
attntgggct tcaagcaact tgtagtg 27


<210> 177
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 177
attntgggct tcaagcaact tgtagtg 27


<210> 178
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 178
gtaattggtt ctaccaaaga ngg 23


<210> 179
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 179
ttaattggtt ctaccaaaga ngg 23


<210> 180
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 180
attntgtaat tggttctacc aaagaag 27


<210> 181
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 181
attntgtaat tggttctacc aaagaag 27


<210> 182
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 182
gaggcggagg gcggcgtgcc ngg 23


<210> 183
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 183
aaggccgagg gcagcatgcc ngg 23


<210> 184
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 184
tgggcggagg gaggcgcacc ngg 23


<210> 185
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 185
attnagaggc ggagggcggc gtgcctg 27


<210> 186
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 186
attnagaggc ggagggcggc gtgcctg 27


<210> 187
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 187
agtgtccagg gatgcttccc ngg 23


<210> 188
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 188
catccccagg gaagcatccc ngg 23


<210> 189
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 189
agtggctagg gatgcttccc ngg 23


<210> 190
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 190
atagtccagg gatgcttcct ngg 23


<210> 191
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 191
cgtgaccagg gatgcttctc ngg 23


<210> 192
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 192
gctccccggg gaagcttccc nga 23


<210> 193
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 193
catgtccaga aatgcttccc ngg 23


<210> 194
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 194
agtgtccagg gatgcttccc nag 23


<210> 195
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 195
tcggtccagg gatgcttccc ntg 23


<210> 196
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 196
caagtccatg gatgcttccc ngg 23


<210> 197
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 197
ccagtccagg aaagcatccc ngg 23


<210> 198
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 198
cctggcctgg ggagcatccc nga 23


<210> 199
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 199
tgtgtgcagg gatgcttcct ngg 23


<210> 200
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 200
agactccagg gaagcttccc ngg 23


<210> 201
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 201
agggtccagg cacgcttccc ngg 23


<210> 202
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 202
tgtttccagg aatgcttccc ngg 23


<210> 203
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 203
agagtccagg aatgcttccc nga 23


<210> 204
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 204
atgtcacagg gattcttccc ngg 23


<210> 205
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 205
caagtccaga gatgcttcct ngg 23


<210> 206
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 206
agtgtccagg gaagcttcgc ngg 23


<210> 207
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 207
tttnggaagt gtccagggat gcttccc 27


<210> 208
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 208
tttnggaagt gtccagggat gcttccc 27


<210> 209
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 209
tttnggaagt gtccagggat gcttccc 27


<210> 210
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 210
ttcagcccaa gaacagtaca ngg 23


<210> 211
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 211
aacagtccaa gaacagtaca ngg 23


<210> 212
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 212
tatagctcaa gaacagtaca ngg 23


<210> 213
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 213
tttncttcag cccaagaaca gtacaag 27


<210> 214
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 214
tttncttcag cccaagaaca gtacaag 27


<210> 215
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 215
tttncttcag cccaagaaca gtacaag 27


<210> 216
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 216
gtgagtcgag gagaaacgac ngg 23


<210> 217
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 217
atgagccaag gagagacgaa ngg 23


<210> 218
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 218
atgagtagag gagaaaagac ngg 23


<210> 219
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 219
tttntctgtg agtcgaggag aaacgac 27


<210> 220
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 220
tttntctgtg agtcgaggag aaacgac 27


<210> 221
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 221
tttntctgtg agtcgaggag aaacgac 27


<210> 222
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 222
gggtgtgtta aaagtgacca ngg 23


<210> 223
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 223
tttncttggg tgtgttaaaa gtgacca 27


<210> 224
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 224
tttncttggg tgtgttaaaa gtgacca 27


<210> 225
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 225
tttncttggg tgtgttaaaa gtgacca 27


<210> 226
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 226
tcactcctgc tcggtgaatt ngg 23


<210> 227
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 227
gctacaggca gagacaaagg cgg 23


<210> 228
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 228
aggacaggca gagacaaagg cgg 23


<210> 229
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 229
agaacaggca gagacaaaga cgg 23


<210> 230
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 230
aagacaggca gagacaaagt cgg 23


<210> 231
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 231
gctagaggta gagacaaagg cgg 23


<210> 232
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 232
agaacaggca gagacaaagg cag 23


<210> 233
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 233
aggacaggca gagacaaagg cgg 23


<210> 234
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 234
aggacaggca gagacaaagt cgg 23


<210> 235
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 235
cggacaggca gagacaaagg cgg 23


<210> 236
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 236
acaacagcca gagacaaagg cgg 23


<210> 237
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 237
agaacaggca gagacaaagt cgg 23


<210> 238
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 238
cctagaggca gagacaaagt cgg 23


<210> 239
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 239
gctacagaca gagacaaagg cag 23


<210> 240
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 240
gctacaggca gagacaaagg cgg 23


<210> 241
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 241
actacaaaca gagacaaaga cgg 23


<210> 242
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 242
tctacagtca gagacaaagg cga 23


<210> 243
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 243
aagataggca gagacaaagg cgg 23


<210> 244
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 244
cctataggca gagacaaagc cgg 23


<210> 245
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 245
aagacaggca gagacaaagt cgg 23


<210> 246
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 246
aggacaggca gagacaaagg cag 23


<210> 247
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 247
aggtcagaaa tagggggtcc ngg 23


<210> 248
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 248
agggcacaaa taggaggtcc ngg 23


<210> 249
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 249
caggctgtga accttggtgg cgg 23


<210> 250
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 250
ctggctgtga actttggtgg cgg 23


<210> 251
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 251
aggactgtag accttggtgg cgg 23


<210> 252
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 252
atagctgtga acctaggtgg cgg 23


<210> 253
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 253
caggctgtga accttggtga cgg 23


<210> 254
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 254
cctgctatga accttggtgt cgg 23


<210> 255
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 255
ggggctgcgg accttggtgg cgg 23


<210> 256
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 256
aaagctgaga accttggtgg cgg 23


<210> 257
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 257
cttgctggga accttggtgg cgg 23


<210> 258
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 258
caggctgaga cccttggtgg cgg 23


<210> 259
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 259
caggctgtgc actttggtgg cgg 23


<210> 260
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 260
attgctgcaa accttggtgt cgg 23


<210> 261
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 261
taggctgtaa aacttggtgg cgg 23


<210> 262
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 262
aaagctggga accttggtgg cgg 23


<210> 263
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 263
aggcctgaga accttggtgg cag 23


<210> 264
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 264
caggctttga actttggtag cgg 23


<210> 265
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 265
caggctgtta cccttggtgg cgg 23


<210> 266
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 266
gcagcctgta gccttggtgg cgg 23


<210> 267
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 267
agggatgtga accttggtag cag 23


<210> 268
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 268
cctgctgcaa accttggtgt cgg 23


<210> 269
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 269
gaccccctcc accccgcctc ngg 23


<210> 270
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 270
ctgccccccc accccgccac ngg 23


<210> 271
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 271
gcccccaccc accccgcctc ngg 23


<210> 272
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 272
gcttccctcc accccgcatc ngg 23


<210> 273
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 273
tgcccctccc accccgcctc ngg 23


<210> 274
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 274
ctacccctcc accccgcctc ngg 23


<210> 275
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 275
gggcccctcc accccgcctc ngg 23


<210> 276
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 276
attccccccc accccgcctc ngg 23


<210> 277
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 277
gacccccccc accccgcccc ngg 23


<210> 278
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 278
acaccccccc accccgcctc ngg 23


<210> 279
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 279
gccccccacc accccacctc ngg 23


<210> 280
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 280
ctccccaccc accccgcctc ngg 23


<210> 281
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 281
tgcccccccc accccacctc ngg 23


<210> 282
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 282
taccccccac accccgcctc ngg 23


<210> 283
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 283
gtaccccacc accccgcccc ngg 23


<210> 284
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 284
gacaccttcc accccgtctc ngg 23


<210> 285
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 285
cctcccccac accccgcatc ngg 23


<210> 286
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 286
gacccctcac accccgcccc ngg 23


<210> 287
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 287
tccacccccc accccgcccc ngg 23


<210> 288
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 288
atccccctcc accccacccc ngg 23


<210> 289
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 289
tatctagcct cttctaagac ngg 23


<210> 290
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 290
tatctagcct cttctaaaac ngg 23


<210> 291
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 291
tttncctcac tcctgctcgg tgaattt 27


<210> 292
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 292
tttnggaggt cagaaatagg gggtcca 27


<210> 293
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 293
tttngcaggt cagaaatagg gagaggc 27


<210> 294
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 294
tttngatggc gacttcaggc acaggat 27


<210> 295
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 295
tttncttggg tgtgttaaaa gtgacca 27


<210> 296
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 296
tctcccctgg gaagcatccc ngg 23


<210> 297
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 297
catccccagg gaagcatccc ngg 23


<210> 298
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 298
gatcccctgt gaagcatccc ngg 23


<210> 299
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 299
tctccccggg gaaacatccc ngg 23


<210> 300
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 300
tctcccccag gaaccatccc ngg 23


<210> 301
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 301
cttcctctgg gaagcatccc ngg 23


<210> 302
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 302
cctccactgg aaagcatccc ngg 23


<210> 303
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 303
cctcctccgg gaagcacccc ngg 23


<210> 304
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 304
tggcccctgg gaagcacccc ngg 23


<210> 305
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 305
tctcccctgg gatgcatccc nga 23


<210> 306
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 306
actcccctgg gagctatccc ngg 23


<210> 307
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 307
cgtcctctgg gaggcatccc ngg 23


<210> 308
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 308
tctcccctag gaaacatacc ngg 23


<210> 309
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 309
actctcctgg gaagcatccc ngc 23


<210> 310
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 310
gctcccccgg gcggcatccc ngg 23


<210> 311
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 311
cctccccagg gaggcatcct ngg 23


<210> 312
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 312
tctcccctgg gaagcatccc ngg 23


<210> 313
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 313
gagttagagc agaagaagaa ngg 23


<210> 314
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 314
gagtctaagc agaagaagaa nag 23


<210> 315
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 315
gaggccgagc agaagaaaga ngg 23


<210> 316
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 316
gagtcctagc aggagaagaa nag 23


<210> 317
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 317
gagtccggga aggagaagaa ngg 23


<210> 318
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 318
acgtctgagc agaagaagaa ngg 23


<210> 319
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 319
gaatccaagc aggagaagaa nga 23


<210> 320
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 320
gagccggagc agaagaagga ngg 23


<210> 321
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 321
tatctagcct cttctaagac ngg 23


<210> 322
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 322
tatctagcct cttctaaaac ngg 23


<210> 323
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 323
ttttgggagt aagaaaaggt ngg 23


<210> 324
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 324
atttggtagt aagaaaaggt ngg 23


<210> 325
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 325
ggatgggagt gagaaaaggt ngg 23


<210> 326
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 326
agaagggagt aagaaaaagg ngg 23


<210> 327
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 327
gcatgggagt aagagaagga ngg 23


<210> 328
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 328
actggggaga aagaaaaggc ngg 23


<210> 329
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 329
ctgggggact aagaaaaggt ngg 23


<210> 330
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 330
taggaggagt aagaaaaggt ngg 23


<210> 331
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 331
ccgggggcgt aagaaaaggt ngg 23


<210> 332
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 332
agatgggagt aagagaaggt ntg 23


<210> 333
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 333
gttggggagt aagagaagga ngg 23


<210> 334
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or t

<400> 334
ctaagggagt aagaaaagga ngg 23


<210> 335
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 335
attncccttc agctaaaata aaggagg 27


<210> 336
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 336
attnggctca gcaggcacct gcctcag 27


<210> 337
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 337
attngggact ggagttgctt catgtac 27


<210> 338
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 338
attntctcca tgaaaaatac tggggtc 27


<210> 339
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 339
attnttcatg gagaaaatat tcagaat 27


<210> 340
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 340
attnttcatg aagaaaatat tcaggaa 27


<210> 341
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 341
attngcagct acaggcagag acaaagg 27


<210> 342
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 342
attncctgga aaccatccag gccttgt 27


<210> 343
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 343
attnggtcag ctgttaacat cagtacg 27


<210> 344
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 344
attncccttc agctaaaata aaggagg 27


<210> 345
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 345
attnggctca gcaggcacct gcctcag 27


<210> 346
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 346
attngggact ggagttgctt catgtac 27


<210> 347
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 347
attntctcca tgaaaaatac tggggtc 27


<210> 348
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 348
attntctcca taaaaaatac tagaaaa 27


<210> 349
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 349
attnttcatg gagaaaatat tcagaat 27


<210> 350
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 350
attnttcatg aagaaaatat tcagaaa 27


<210> 351
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 351
attngcagct acaggcagag acaaagg 27


<210> 352
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 352
attncctgga aaccatccag gccttgt 27


<210> 353
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 353
attnggtcag ctgttaacat cagtacg 27


<210> 354
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 354
attntcttca cggaaacagg gttcctt 27


<210> 355
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 355
attntcttcg cggaagcagg gttccgg 27


<210> 356
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 356
tttntggttg cccaccctag tcattgg 27


<210> 357
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 357
tttngatggc gacttcaggc acaggat 27


<210> 358
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 358
attntgcaga gcaaatacca gagataa 27


<210> 359
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 359
attntgtaca taaaatatca aagtaca 27


<210> 360
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 360
tttncctcac tcctgctcgg tgaattt 27


<210> 361
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 361
attntcttca cggaaacagg gttcctt 27


<210> 362
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 362
attntcttcg cggaagcagg gttccgg 27


<210> 363
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 363
tttntggttg cccaccctag tcattgg 27


<210> 364
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 364
tttngatggc gacttcaggc acaggat 27


<210> 365
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 365
attntgcaga gcaaatacca gagataa 27


<210> 366
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 366
attnctgacc tcccaaacag ctacata 27


<210> 367
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t

<400> 367
attntcagag ggacacactg tggcccc 27


<210> 368
<211> 44
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 368
tctctcattc tgcagagcaa ataccagaga taagagagta ggct 44


<210> 369
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 369
tctccatgaa aaatactggg gtc 23


<210> 370
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 370
cctggaaacc atccaggcct tgt 23


<210> 371
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 371
gcagctacag gcagagacaa agg 23


<210> 372
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 372
tgcagagcaa ataccagaga taa 23


<210> 373
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 373
ggtcagctgt taacatcagt acg 23


<210> 374
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 374
tcagagggac acactgtggc ccc 23


<210> 375
<211> 44
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 375
tctctcattc tgcagagcaa ataccagaga taagagagta ggct 44


<210> 376
<211> 44
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 376
tctctcattc tgcagagcaa ataccagaga taagagagta ggct 44


<210> 377
<211> 44
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 377
tggcacattg tcagagggac acactgtggc ccctgtgccc agcc 44


<210> 378
<211> 44
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 378
gctgtcattt cctggaaacc atccaggcct tgtagcctgc cctc 44


<210> 379
<211> 1147
<212> PRT
<213> Alicyclobacillus kakegawensis

<400> 379

Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Ser Glu Cys Pro
1 5 10 15


Asp Ile Leu Ala Gly Met Trp Gln Leu His Arg Ala Thr Asn Ala Gly
20 25 30


Val Arg Tyr Tyr Thr Glu Trp Val Ser Leu Met Arg Gln Glu Ile Leu
35 40 45


Tyr Ser Arg Gly Pro Asp Gly Gly Gln Gln Cys Tyr Met Thr Ala Glu
50 55 60


Asp Cys Gln Arg Glu Leu Leu Arg Arg Leu Arg Asn Arg Gln Leu His
65 70 75 80


Asn Gly Arg Gln Asp Gln Pro Gly Thr Asp Ala Asp Leu Leu Ala Ile
85 90 95


Ser Arg Arg Leu Tyr Glu Ile Leu Val Leu Gln Ser Ile Gly Lys Arg
100 105 110


Gly Asp Ala Gln Gln Ile Ala Ser Ser Phe Leu Ser Pro Leu Val Asp
115 120 125


Pro Asn Ser Lys Gly Gly Arg Gly Glu Ala Lys Ser Gly Arg Lys Pro
130 135 140


Ala Trp Gln Lys Met Arg Asp Gln Gly Asp Pro Arg Trp Val Ala Ala
145 150 155 160


Arg Glu Lys Tyr Glu Gln Arg Lys Ala Val Asp Pro Ser Lys Glu Ile
165 170 175


Leu Asn Ser Leu Asp Ala Leu Gly Leu Arg Pro Leu Phe Ala Val Phe
180 185 190


Thr Glu Thr Tyr Arg Ser Gly Val Asp Trp Lys Pro Leu Gly Lys Ser
195 200 205


Gln Gly Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala Leu Glu
210 215 220


Arg Leu Met Ser Trp Glu Ser Trp Asn Arg Arg Val Gly Glu Glu Tyr
225 230 235 240


Ala Arg Leu Phe Gln Gln Lys Met Lys Phe Glu Gln Glu His Phe Ala
245 250 255


Glu Gln Ser His Leu Val Lys Leu Ala Arg Ala Leu Glu Ala Asp Met
260 265 270


Arg Ala Ala Ser Gln Gly Phe Glu Ala Lys Arg Gly Thr Ala His Gln
275 280 285


Ile Thr Arg Arg Ala Leu Arg Gly Ala Asp Arg Val Phe Glu Ile Trp
290 295 300


Lys Ser Ile Pro Glu Glu Ala Leu Phe Ser Gln Tyr Asp Glu Val Ile
305 310 315 320


Arg Gln Val Gln Ala Glu Lys Arg Arg Asp Phe Gly Ser His Asp Leu
325 330 335


Phe Ala Lys Leu Ala Glu Pro Lys Tyr Gln Pro Leu Trp Arg Ala Asp
340 345 350


Glu Thr Phe Leu Thr Arg Tyr Ala Leu Tyr Asn Gly Val Leu Arg Asp
355 360 365


Leu Glu Lys Ala Arg Gln Phe Ala Thr Phe Thr Leu Pro Asp Ala Cys
370 375 380


Val Asn Pro Ile Trp Thr Arg Phe Glu Ser Ser Gln Gly Ser Asn Leu
385 390 395 400


His Lys Tyr Glu Phe Leu Phe Asp His Leu Gly Pro Gly Arg His Ala
405 410 415


Val Arg Phe Gln Arg Leu Leu Val Val Glu Ser Glu Gly Ala Lys Glu
420 425 430


Arg Asp Ser Val Val Val Pro Val Ala Pro Ser Gly Gln Leu Asp Lys
435 440 445


Leu Val Leu Arg Glu Glu Glu Lys Ser Ser Val Ala Leu His Leu His
450 455 460


Asp Thr Ala Arg Pro Asp Gly Phe Met Ala Glu Trp Ala Gly Ala Lys
465 470 475 480


Leu Gln Tyr Glu Arg Ser Thr Leu Ala Arg Lys Ala Arg Arg Asp Lys
485 490 495


Gln Gly Met Arg Ser Trp Arg Arg Gln Pro Ser Met Leu Met Ser Ala
500 505 510


Ala Gln Met Leu Glu Asp Ala Lys Gln Ala Gly Asp Val Tyr Leu Asn
515 520 525


Ile Ser Val Arg Val Lys Ser Pro Ser Glu Val Arg Gly Gln Arg Arg
530 535 540


Pro Pro Tyr Ala Ala Leu Phe Arg Ile Asp Asp Lys Gln Arg Arg Val
545 550 555 560


Thr Val Asn Tyr Asn Lys Leu Ser Ala Tyr Leu Glu Glu His Pro Asp
565 570 575


Lys Gln Ile Pro Gly Ala Pro Gly Leu Leu Ser Gly Leu Arg Val Met
580 585 590


Ser Val Asp Leu Gly Leu Arg Thr Ser Ala Ser Ile Ser Val Phe Arg
595 600 605


Val Ala Lys Lys Glu Glu Val Glu Ala Leu Gly Asp Gly Arg Pro Pro
610 615 620


His Tyr Tyr Pro Ile His Gly Thr Asp Asp Leu Val Ala Val His Glu
625 630 635 640


Arg Ser His Leu Ile Gln Met Pro Gly Glu Thr Glu Thr Lys Gln Leu
645 650 655


Arg Lys Leu Arg Glu Glu Arg Gln Ala Val Leu Arg Pro Leu Phe Ala
660 665 670


Gln Leu Ala Leu Leu Arg Leu Leu Val Arg Cys Gly Ala Ala Asp Glu
675 680 685


Arg Ile Arg Thr Arg Ser Trp Gln Arg Leu Thr Lys Gln Gly Arg Glu
690 695 700


Phe Thr Lys Arg Leu Thr Pro Ser Trp Arg Glu Ala Leu Glu Leu Glu
705 710 715 720


Leu Thr Arg Leu Glu Ala Tyr Cys Gly Arg Val Pro Asp Asp Glu Trp
725 730 735


Ser Arg Ile Val Asp Arg Thr Val Ile Ala Leu Trp Arg Arg Met Gly
740 745 750


Lys Gln Val Arg Asp Trp Arg Lys Gln Val Lys Ser Gly Ala Lys Val
755 760 765


Lys Val Lys Gly Tyr Gln Leu Asp Val Val Gly Gly Asn Ser Leu Ala
770 775 780


Gln Ile Asp Tyr Leu Glu Gln Gln Tyr Lys Phe Leu Arg Arg Trp Ser
785 790 795 800


Phe Phe Ala Arg Ala Ser Gly Leu Val Val Arg Ala Asp Arg Glu Ser
805 810 815


His Phe Ala Val Ala Leu Arg Gln His Ile Glu Asn Ala Lys Arg Asp
820 825 830


Arg Leu Lys Lys Leu Ala Asp Arg Ile Leu Met Glu Ala Leu Gly Tyr
835 840 845


Val Tyr Glu Ala Ser Gly Pro Arg Glu Gly Gln Trp Thr Ala Gln His
850 855 860


Pro Pro Cys Gln Leu Ile Ile Leu Glu Glu Leu Ser Ala Tyr Arg Phe
865 870 875 880


Ser Asp Asp Arg Pro Pro Ser Glu Asn Ser Lys Leu Met Ala Trp Gly
885 890 895


His Arg Gly Ile Leu Glu Glu Leu Val Asn Gln Ala Gln Val His Asp
900 905 910


Val Leu Val Gly Thr Val Tyr Ala Ala Phe Ser Ser Arg Phe Asp Ala
915 920 925


Arg Thr Gly Ala Pro Gly Val Arg Cys Arg Arg Val Pro Ala Arg Phe
930 935 940


Val Gly Ala Thr Val Asp Asp Ser Leu Pro Leu Trp Leu Thr Glu Phe
945 950 955 960


Leu Asp Lys His Arg Leu Asp Lys Asn Leu Leu Arg Pro Asp Asp Val
965 970 975


Ile Pro Thr Gly Glu Gly Glu Phe Leu Val Ser Pro Cys Gly Glu Glu
980 985 990


Ala Ala Arg Val Arg Gln Val His Ala Asp Ile Asn Ala Ala Gln Asn
995 1000 1005


Leu Gln Arg Arg Leu Trp Gln Asn Phe Asp Ile Thr Glu Leu Arg
1010 1015 1020


Leu Arg Cys Asp Val Lys Met Gly Gly Glu Gly Thr Val Leu Val
1025 1030 1035


Pro Arg Val Asn Asn Ala Arg Ala Lys Gln Leu Phe Gly Lys Lys
1040 1045 1050


Val Leu Val Ser Gln Asp Gly Val Thr Phe Phe Glu Arg Ser Gln
1055 1060 1065


Thr Gly Gly Lys Pro His Ser Glu Lys Gln Thr Asp Leu Thr Asp
1070 1075 1080


Lys Glu Leu Glu Leu Ile Ala Glu Ala Asp Glu Ala Arg Ala Lys
1085 1090 1095


Ser Val Val Leu Phe Arg Asp Pro Ser Gly His Ile Gly Lys Gly
1100 1105 1110


His Trp Ile Arg Gln Arg Glu Phe Trp Ser Leu Val Lys Gln Arg
1115 1120 1125


Ile Glu Ser His Thr Ala Glu Arg Ile Arg Val Arg Gly Val Gly
1130 1135 1140


Ser Ser Leu Asp
1145


<210> 380
<211> 1112
<212> PRT
<213> Bacillus species

<400> 380

Met Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr
1 5 10 15


Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln
35 40 45


Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile
50 55 60


Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His
65 70 75 80


Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu
85 90 95


Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly
100 105 110


Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys
115 120 125


Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu
130 135 140


Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg
145 150 155 160


Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr
165 170 175


Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile
180 185 190


Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys
195 200 205


Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp
210 215 220


Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu
225 230 235 240


Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys
245 250 255


Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala
260 265 270


Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly
275 280 285


Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser
290 295 300


Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser
305 310 315 320


Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu
325 330 335


Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala
340 345 350


Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala
355 360 365


Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr
370 375 380


Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys
385 390 395 400


Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser
405 410 415


Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro
420 425 430


Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly
435 440 445


Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp
450 455 460


Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys
465 470 475 480


Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe
485 490 495


Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg
500 505 510


Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe
515 520 525


Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn
530 535 540


Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly
545 550 555 560


Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val
565 570 575


Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys
580 585 590


Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg
595 600 605


Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys
610 615 620


Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln
625 630 635 640


Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro
645 650 655


Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser
660 665 670


Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu
675 680 685


Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu
690 695 700


Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile
705 710 715 720


Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala
725 730 735


Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu
740 745 750


Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg
755 760 765


Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln
770 775 780


Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met
785 790 795 800


Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys
805 810 815


Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn
820 825 830


Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser
835 840 845


Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met
850 855 860


Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr
865 870 875 880


Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His
885 890 895


Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg
900 905 910


Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys
915 920 925


Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu
930 935 940


Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile
945 950 955 960


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln
965 970 975


Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly
980 985 990


Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys Lys
995 1000 1005


Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln Glu
1010 1015 1020


Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr Asp
1025 1030 1035


Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile Ser
1040 1045 1050


Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu Thr
1055 1060 1065


Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr Trp
1070 1075 1080


Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile Lys
1085 1090 1095


Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu
1100 1105 1110


<210> 381
<211> 1489
<212> PRT
<213> Desulfatirhabdium butyrativorans

<400> 381

Met Pro Leu Ser Asn Asn Pro Pro Val Thr Gln Arg Ala Tyr Thr Leu
1 5 10 15


Arg Leu Arg Gly Ala Asp Pro Ser Asp Leu Ser Trp Arg Glu Ala Leu
20 25 30


Trp His Thr His Glu Ala Val Asn Lys Gly Ala Lys Val Phe Gly Asp
35 40 45


Trp Leu Leu Thr Leu Arg Gly Gly Leu Asp His Thr Leu Ala Asp Thr
50 55 60


Lys Val Lys Gly Gly Lys Gly Lys Pro Asp Arg Asp Pro Thr Pro Glu
65 70 75 80


Glu Arg Lys Ala Arg Arg Ile Leu Leu Ala Leu Ser Trp Leu Ser Val
85 90 95


Glu Ser Lys Leu Gly Ala Pro Ser Ser Tyr Ile Val Ala Ser Gly Asp
100 105 110


Glu Pro Ala Lys Asp Arg Asn Asp Asn Val Val Ser Ala Leu Glu Glu
115 120 125


Ile Leu Gln Ser Arg Lys Val Ala Lys Ser Glu Ile Asp Asp Trp Lys
130 135 140


Arg Asp Cys Ser Ala Ser Leu Ser Ala Ala Ile Arg Asp Asp Ala Val
145 150 155 160


Trp Val Asn Arg Ser Lys Val Phe Asp Glu Ala Val Lys Ser Val Gly
165 170 175


Ser Ser Leu Thr Arg Glu Glu Ala Trp Asp Met Leu Glu Arg Phe Phe
180 185 190


Gly Ser Arg Asp Ala Tyr Leu Thr Pro Met Lys Asp Pro Glu Asp Lys
195 200 205


Ser Ser Glu Thr Glu Gln Glu Asp Lys Ala Lys Asp Leu Val Gln Lys
210 215 220


Ala Gly Gln Trp Leu Ser Ser Arg Tyr Gly Thr Ser Glu Gly Ala Asp
225 230 235 240


Phe Cys Arg Met Ser Asp Ile Tyr Gly Lys Ile Ala Ala Trp Ala Asp
245 250 255


Asn Ala Ser Gln Gly Gly Ser Ser Thr Val Asp Asp Leu Val Ser Glu
260 265 270


Leu Arg Gln His Phe Asp Thr Lys Glu Ser Lys Ala Thr Asn Gly Leu
275 280 285


Asp Trp Ile Ile Gly Leu Ser Ser Tyr Thr Gly His Thr Pro Asn Pro
290 295 300


Val His Glu Leu Leu Arg Gln Asn Thr Ser Leu Asn Lys Ser His Leu
305 310 315 320


Asp Asp Leu Lys Lys Lys Ala Asn Thr Arg Ala Glu Ser Cys Lys Ser
325 330 335


Lys Ile Gly Ser Lys Gly Gln Arg Pro Tyr Ser Asp Ala Ile Leu Asn
340 345 350


Asp Val Glu Ser Val Cys Gly Phe Thr Tyr Arg Val Asp Lys Asp Gly
355 360 365


Gln Pro Val Ser Val Ala Asp Tyr Ser Lys Tyr Asp Val Asp Tyr Lys
370 375 380


Trp Gly Thr Ala Arg His Tyr Ile Phe Ala Val Met Leu Asp His Ala
385 390 395 400


Ala Arg Arg Ile Ser Leu Ala His Lys Trp Ile Lys Arg Ala Glu Ala
405 410 415


Glu Arg His Lys Phe Glu Glu Asp Ala Lys Arg Ile Ala Asn Val Pro
420 425 430


Ala Arg Ala Arg Glu Trp Leu Asp Ser Phe Cys Lys Glu Arg Ser Val
435 440 445


Thr Ser Gly Ala Val Glu Pro Tyr Arg Ile Arg Arg Arg Ala Val Asp
450 455 460


Gly Trp Lys Glu Val Val Ala Ala Trp Ser Lys Ser Asp Cys Lys Ser
465 470 475 480


Thr Glu Asp Arg Ile Ala Ala Ala Arg Ala Leu Gln Asp Asp Ser Glu
485 490 495


Ile Asp Lys Phe Gly Asp Ile Gln Leu Phe Glu Ala Leu Ala Glu Asp
500 505 510


Asp Ala Leu Cys Val Trp His Lys Asp Gly Glu Ala Thr Asn Glu Pro
515 520 525


Asp Phe Gln Pro Leu Ile Asp Tyr Ser Leu Ala Ile Glu Ala Glu Phe
530 535 540


Lys Lys Arg Gln Phe Lys Val Pro Ala Tyr Arg His Pro Asp Glu Leu
545 550 555 560


Leu His Pro Val Phe Cys Asp Phe Gly Lys Ser Arg Trp Lys Ile Asn
565 570 575


Tyr Asp Val His Lys Asn Val Gln Ala Pro Phe Tyr Arg Gly Leu Cys
580 585 590


Leu Thr Leu Trp Thr Gly Ser Glu Ile Lys Pro Val Pro Leu Cys Trp
595 600 605


Gln Ser Lys Arg Leu Thr Arg Asp Leu Ala Leu Gly Asn Asn His Arg
610 615 620


Asn Asp Ala Ala Ser Ala Val Thr Arg Ala Asp Arg Leu Gly Arg Ala
625 630 635 640


Ala Ser Asn Val Thr Lys Ser Asp Met Val Asn Ile Thr Gly Leu Phe
645 650 655


Glu Gln Ala Asp Trp Asn Gly Arg Leu Gln Ala Pro Arg Gln Gln Leu
660 665 670


Glu Ala Ile Ala Val Val Arg Asp Asn Pro Arg Leu Ser Glu Gln Glu
675 680 685


Arg Asn Leu Arg Met Cys Gly Met Ile Glu His Ile Arg Trp Leu Val
690 695 700


Thr Phe Ser Val Lys Leu Gln Pro Gln Gly Pro Trp Cys Ala Tyr Ala
705 710 715 720


Glu Gln His Gly Leu Asn Thr Asn Pro Gln Tyr Trp Pro His Ala Asp
725 730 735


Thr Asn Arg Asp Arg Lys Val His Ala Arg Leu Ile Leu Pro Arg Leu
740 745 750


Pro Gly Leu Arg Val Leu Ser Val Asp Leu Gly His Arg Tyr Ala Ala
755 760 765


Ala Cys Ala Val Trp Glu Ala Val Asn Thr Glu Thr Val Lys Glu Ala
770 775 780


Cys Gln Asn Val Gly Arg Asp Met Pro Lys Glu His Asp Leu Tyr Leu
785 790 795 800


His Ile Lys Val Lys Lys Gln Gly Ile Gly Lys Gln Thr Glu Val Asp
805 810 815


Lys Thr Thr Ile Tyr Arg Arg Ile Gly Ala Asp Thr Leu Pro Asp Gly
820 825 830


Arg Pro His Pro Ala Pro Trp Ala Arg Leu Asp Arg Gln Phe Leu Ile
835 840 845


Lys Leu Gln Gly Glu Glu Lys Asp Ala Arg Glu Ala Ser Asn Glu Glu
850 855 860


Ile Trp Ala Leu His Gln Met Glu Cys Lys Leu Asp Arg Thr Lys Pro
865 870 875 880


Leu Ile Asp Arg Leu Ile Ala Ser Gly Trp Gly Leu Leu Lys Arg Gln
885 890 895


Met Ala Arg Leu Asp Ala Leu Lys Glu Leu Gly Trp Ile Pro Ala Pro
900 905 910


Asp Ser Ser Glu Asn Leu Ser Arg Glu Asp Gly Glu Ala Lys Asp Tyr
915 920 925


Arg Glu Ser Leu Ala Val Asp Asp Leu Met Phe Ser Ala Val Arg Thr
930 935 940


Leu Arg Leu Ala Leu Gln Arg His Gly Asn Arg Ala Arg Ile Ala Tyr
945 950 955 960


Tyr Leu Ile Ser Glu Val Lys Ile Arg Pro Gly Gly Ile Gln Glu Lys
965 970 975


Leu Asp Glu Asn Gly Arg Ile Asp Leu Leu Gln Asp Ala Leu Ala Leu
980 985 990


Trp His Glu Leu Phe Ser Ser Pro Gly Trp Arg Asp Glu Ala Ala Lys
995 1000 1005


Gln Leu Trp Asp Ser Arg Ile Ala Thr Leu Ala Gly Tyr Lys Ala
1010 1015 1020


Pro Glu Glu Asn Gly Asp Asn Val Ser Asp Val Ala Tyr Arg Lys
1025 1030 1035


Lys Gln Gln Val Tyr Arg Glu Gln Leu Arg Asn Val Ala Lys Thr
1040 1045 1050


Leu Ser Gly Asp Val Ile Thr Cys Lys Glu Leu Ser Asp Ala Trp
1055 1060 1065


Lys Glu Arg Trp Glu Asp Glu Asp Gln Arg Trp Lys Lys Leu Leu
1070 1075 1080


Arg Trp Phe Lys Asp Trp Val Leu Pro Ser Gly Thr Gln Ala Asn
1085 1090 1095


Asn Ala Thr Ile Arg Asn Val Gly Gly Leu Ser Leu Ser Arg Leu
1100 1105 1110


Ala Thr Ile Thr Glu Phe Arg Arg Lys Val Gln Val Gly Phe Phe
1115 1120 1125


Thr Arg Leu Arg Pro Asp Gly Thr Arg His Glu Ile Gly Glu Gln
1130 1135 1140


Phe Gly Gln Lys Thr Leu Asp Ala Leu Glu Leu Leu Arg Glu Gln
1145 1150 1155


Arg Val Lys Gln Leu Ala Ser Arg Ile Ala Glu Ala Ala Leu Gly
1160 1165 1170


Ile Gly Ser Glu Gly Gly Lys Gly Trp Asp Gly Gly Lys Arg Pro
1175 1180 1185


Arg Gln Arg Ile Asn Asp Ser Arg Phe Ala Pro Cys His Ala Val
1190 1195 1200


Val Ile Glu Asn Leu Ala Asn Tyr Arg Pro Asp Glu Thr Arg Thr
1205 1210 1215


Arg Leu Glu Asn Arg Arg Leu Met Thr Trp Ser Ala Ser Lys Val
1220 1225 1230


His Lys Tyr Leu Ser Glu Ala Cys Gln Leu Asn Gly Leu Tyr Leu
1235 1240 1245


Cys Thr Val Ser Ala Trp Tyr Thr Ser Arg Gln Asp Ser Arg Thr
1250 1255 1260


Gly Ala Pro Gly Ile Arg Cys Gln Asp Val Ser Val Arg Glu Phe
1265 1270 1275


Met Gln Ser Pro Phe Trp Arg Lys Gln Val Lys Gln Ala Glu Ala
1280 1285 1290


Lys His Asp Glu Asn Lys Gly Asp Ala Arg Glu Arg Phe Leu Cys
1295 1300 1305


Glu Leu Asn Lys Thr Trp Lys Ala Lys Thr Pro Ala Glu Trp Lys
1310 1315 1320


Lys Ala Gly Phe Val Arg Ile Pro Leu Arg Gly Gly Glu Ile Phe
1325 1330 1335


Val Ser Ala Asp Ser Lys Ser Pro Ser Ala Lys Gly Ile His Ala
1340 1345 1350


Asp Leu Asn Ala Ala Ala Asn Ile Gly Leu Arg Ala Leu Thr Asp
1355 1360 1365


Pro Asp Trp Pro Gly Lys Trp Trp Tyr Val Pro Cys Asp Pro Val
1370 1375 1380


Ser Phe Glu Ser Lys Met Asp Tyr Val Lys Gly Cys Ala Ala Val
1385 1390 1395


Lys Val Gly Gln Pro Leu Arg Gln Pro Ala Gln Thr Asn Ala Asp
1400 1405 1410


Gly Ala Ala Ser Lys Ile Arg Lys Gly Lys Lys Asn Arg Thr Ala
1415 1420 1425


Gly Thr Ser Lys Glu Lys Val Tyr Leu Trp Arg Asp Ile Ser Ala
1430 1435 1440


Phe Pro Leu Glu Ser Asn Glu Ile Gly Glu Trp Lys Glu Thr Ser
1445 1450 1455


Ala Tyr Gln Asn Asp Val Gln Tyr Arg Val Ile Arg Met Leu Lys
1460 1465 1470


Glu His Ile Lys Ser Leu Asp Asn Arg Thr Gly Asp Asn Val Glu
1475 1480 1485


Gly



<210> 382
<211> 1194
<212> PRT
<213> Desulfonatronum thiodismutans

<400> 382

Met Val Leu Gly Arg Lys Asp Asp Thr Ala Glu Leu Arg Arg Ala Leu
1 5 10 15


Trp Thr Thr His Glu His Val Asn Leu Ala Val Ala Glu Val Glu Arg
20 25 30


Val Leu Leu Arg Cys Arg Gly Arg Ser Tyr Trp Thr Leu Asp Arg Arg
35 40 45


Gly Asp Pro Val His Val Pro Glu Ser Gln Val Ala Glu Asp Ala Leu
50 55 60


Ala Met Ala Arg Glu Ala Gln Arg Arg Asn Gly Trp Pro Val Val Gly
65 70 75 80


Glu Asp Glu Glu Ile Leu Leu Ala Leu Arg Tyr Leu Tyr Glu Gln Ile
85 90 95


Val Pro Ser Cys Leu Leu Asp Asp Leu Gly Lys Pro Leu Lys Gly Asp
100 105 110


Ala Gln Lys Ile Gly Thr Asn Tyr Ala Gly Pro Leu Phe Asp Ser Asp
115 120 125


Thr Cys Arg Arg Asp Glu Gly Lys Asp Val Ala Cys Cys Gly Pro Phe
130 135 140


His Glu Val Ala Gly Lys Tyr Leu Gly Ala Leu Pro Glu Trp Ala Thr
145 150 155 160


Pro Ile Ser Lys Gln Glu Phe Asp Gly Lys Asp Ala Ser His Leu Arg
165 170 175


Phe Lys Ala Thr Gly Gly Asp Asp Ala Phe Phe Arg Val Ser Ile Glu
180 185 190


Lys Ala Asn Ala Trp Tyr Glu Asp Pro Ala Asn Gln Asp Ala Leu Lys
195 200 205


Asn Lys Ala Tyr Asn Lys Asp Asp Trp Lys Lys Glu Lys Asp Lys Gly
210 215 220


Ile Ser Ser Trp Ala Val Lys Tyr Ile Gln Lys Gln Leu Gln Leu Gly
225 230 235 240


Gln Asp Pro Arg Thr Glu Val Arg Arg Lys Leu Trp Leu Glu Leu Gly
245 250 255


Leu Leu Pro Leu Phe Ile Pro Val Phe Asp Lys Thr Met Val Gly Asn
260 265 270


Leu Trp Asn Arg Leu Ala Val Arg Leu Ala Leu Ala His Leu Leu Ser
275 280 285


Trp Glu Ser Trp Asn His Arg Ala Val Gln Asp Gln Ala Leu Ala Arg
290 295 300


Ala Lys Arg Asp Glu Leu Ala Ala Leu Phe Leu Gly Met Glu Asp Gly
305 310 315 320


Phe Ala Gly Leu Arg Glu Tyr Glu Leu Arg Arg Asn Glu Ser Ile Lys
325 330 335


Gln His Ala Phe Glu Pro Val Asp Arg Pro Tyr Val Val Ser Gly Arg
340 345 350


Ala Leu Arg Ser Trp Thr Arg Val Arg Glu Glu Trp Leu Arg His Gly
355 360 365


Asp Thr Gln Glu Ser Arg Lys Asn Ile Cys Asn Arg Leu Gln Asp Arg
370 375 380


Leu Arg Gly Lys Phe Gly Asp Pro Asp Val Phe His Trp Leu Ala Glu
385 390 395 400


Asp Gly Gln Glu Ala Leu Trp Lys Glu Arg Asp Cys Val Thr Ser Phe
405 410 415


Ser Leu Leu Asn Asp Ala Asp Gly Leu Leu Glu Lys Arg Lys Gly Tyr
420 425 430


Ala Leu Met Thr Phe Ala Asp Ala Arg Leu His Pro Arg Trp Ala Met
435 440 445


Tyr Glu Ala Pro Gly Gly Ser Asn Leu Arg Thr Tyr Gln Ile Arg Lys
450 455 460


Thr Glu Asn Gly Leu Trp Ala Asp Val Val Leu Leu Ser Pro Arg Asn
465 470 475 480


Glu Ser Ala Ala Val Glu Glu Lys Thr Phe Asn Val Arg Leu Ala Pro
485 490 495


Ser Gly Gln Leu Ser Asn Val Ser Phe Asp Gln Ile Gln Lys Gly Ser
500 505 510


Lys Met Val Gly Arg Cys Arg Tyr Gln Ser Ala Asn Gln Gln Phe Glu
515 520 525


Gly Leu Leu Gly Gly Ala Glu Ile Leu Phe Asp Arg Lys Arg Ile Ala
530 535 540


Asn Glu Gln His Gly Ala Thr Asp Leu Ala Ser Lys Pro Gly His Val
545 550 555 560


Trp Phe Lys Leu Thr Leu Asp Val Arg Pro Gln Ala Pro Gln Gly Trp
565 570 575


Leu Asp Gly Lys Gly Arg Pro Ala Leu Pro Pro Glu Ala Lys His Phe
580 585 590


Lys Thr Ala Leu Ser Asn Lys Ser Lys Phe Ala Asp Gln Val Arg Pro
595 600 605


Gly Leu Arg Val Leu Ser Val Asp Leu Gly Val Arg Ser Phe Ala Ala
610 615 620


Cys Ser Val Phe Glu Leu Val Arg Gly Gly Pro Asp Gln Gly Thr Tyr
625 630 635 640


Phe Pro Ala Ala Asp Gly Arg Thr Val Asp Asp Pro Glu Lys Leu Trp
645 650 655


Ala Lys His Glu Arg Ser Phe Lys Ile Thr Leu Pro Gly Glu Asn Pro
660 665 670


Ser Arg Lys Glu Glu Ile Ala Arg Arg Ala Ala Met Glu Glu Leu Arg
675 680 685


Ser Leu Asn Gly Asp Ile Arg Arg Leu Lys Ala Ile Leu Arg Leu Ser
690 695 700


Val Leu Gln Glu Asp Asp Pro Arg Thr Glu His Leu Arg Leu Phe Met
705 710 715 720


Glu Ala Ile Val Asp Asp Pro Ala Lys Ser Ala Leu Asn Ala Glu Leu
725 730 735


Phe Lys Gly Phe Gly Asp Asp Arg Phe Arg Ser Thr Pro Asp Leu Trp
740 745 750


Lys Gln His Cys His Phe Phe His Asp Lys Ala Glu Lys Val Val Ala
755 760 765


Glu Arg Phe Ser Arg Trp Arg Thr Glu Thr Arg Pro Lys Ser Ser Ser
770 775 780


Trp Gln Asp Trp Arg Glu Arg Arg Gly Tyr Ala Gly Gly Lys Ser Tyr
785 790 795 800


Trp Ala Val Thr Tyr Leu Glu Ala Val Arg Gly Leu Ile Leu Arg Trp
805 810 815


Asn Met Arg Gly Arg Thr Tyr Gly Glu Val Asn Arg Gln Asp Lys Lys
820 825 830


Gln Phe Gly Thr Val Ala Ser Ala Leu Leu His His Ile Asn Gln Leu
835 840 845


Lys Glu Asp Arg Ile Lys Thr Gly Ala Asp Met Ile Ile Gln Ala Ala
850 855 860


Arg Gly Phe Val Pro Arg Lys Asn Gly Ala Gly Trp Val Gln Val His
865 870 875 880


Glu Pro Cys Arg Leu Ile Leu Phe Glu Asp Leu Ala Arg Tyr Arg Phe
885 890 895


Arg Thr Asp Arg Ser Arg Arg Glu Asn Ser Arg Leu Met Arg Trp Ser
900 905 910


His Arg Glu Ile Val Asn Glu Val Gly Met Gln Gly Glu Leu Tyr Gly
915 920 925


Leu His Val Asp Thr Thr Glu Ala Gly Phe Ser Ser Arg Tyr Leu Ala
930 935 940


Ser Ser Gly Ala Pro Gly Val Arg Cys Arg His Leu Val Glu Glu Asp
945 950 955 960


Phe His Asp Gly Leu Pro Gly Met His Leu Val Gly Glu Leu Asp Trp
965 970 975


Leu Leu Pro Lys Asp Lys Asp Arg Thr Ala Asn Glu Ala Arg Arg Leu
980 985 990


Leu Gly Gly Met Val Arg Pro Gly Met Leu Val Pro Trp Asp Gly Gly
995 1000 1005


Glu Leu Phe Ala Thr Leu Asn Ala Ala Ser Gln Leu His Val Ile
1010 1015 1020


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Arg Arg Phe Trp
1025 1030 1035


Gly Arg Cys Gly Glu Ala Ile Arg Ile Val Cys Asn Gln Leu Ser
1040 1045 1050


Val Asp Gly Ser Thr Arg Tyr Glu Met Ala Lys Ala Pro Lys Ala
1055 1060 1065


Arg Leu Leu Gly Ala Leu Gln Gln Leu Lys Asn Gly Asp Ala Pro
1070 1075 1080


Phe His Leu Thr Ser Ile Pro Asn Ser Gln Lys Pro Glu Asn Ser
1085 1090 1095


Tyr Val Met Thr Pro Thr Asn Ala Gly Lys Lys Tyr Arg Ala Gly
1100 1105 1110


Pro Gly Glu Lys Ser Ser Gly Glu Glu Asp Glu Leu Ala Leu Asp
1115 1120 1125


Ile Val Glu Gln Ala Glu Glu Leu Ala Gln Gly Arg Lys Thr Phe
1130 1135 1140


Phe Arg Asp Pro Ser Gly Val Phe Phe Ala Pro Asp Arg Trp Leu
1145 1150 1155


Pro Ser Glu Ile Tyr Trp Ser Arg Ile Arg Arg Arg Ile Trp Gln
1160 1165 1170


Val Thr Leu Glu Arg Asn Ser Ser Gly Arg Gln Glu Arg Ala Glu
1175 1180 1185


Met Asp Glu Met Pro Tyr
1190


<210> 383
<211> 1326
<212> PRT
<213> Unknown

<220>
<223> Lentisphaeria bacterium

<400> 383

Met Ala Val Glu Leu Asn Arg Ile Tyr Gln Gly Arg Val Asn His Val
1 5 10 15


Tyr Ile Phe Asp Glu Asn Gln Asn Gln Val Ser Val Asp Asn Gly Asp
20 25 30


Asp Leu Leu Phe Val His His Glu Leu Tyr Gln Asp Ala Ile Asn Tyr
35 40 45


Tyr Leu Val Ala Leu Ala Ala Met Ala Leu Asp Ser Lys Asp Ser Leu
50 55 60


Phe Gly Lys Phe Lys Met Gln Ile Arg Ala Val Trp Asn Asp Phe Tyr
65 70 75 80


Arg Asn Gly Gln Leu Arg Pro Gly Leu Lys His Ser Leu Ile Arg Ser
85 90 95


Leu Gly His Ala Ala Glu Leu Asn Thr Ser Asn Gly Ala Asp Ile Ala
100 105 110


Met Asn Leu Ile Leu Glu Asp Gly Gly Ile Pro Ser Glu Ile Leu Asn
115 120 125


Ala Ala Leu Glu His Leu Ala Glu Lys Cys Thr Gly Asp Val Ser Gln
130 135 140


Leu Gly Lys Thr Phe Phe Pro Arg Phe Cys Asp Thr Ala Tyr His Gly
145 150 155 160


Asn Trp Asp Val Asp Ala Lys Ser Phe Ser Glu Lys Lys Gly Arg Gln
165 170 175


Arg Leu Val Asp Ala Leu Tyr Ser Leu His Pro Val Gln Ala Val Gln
180 185 190


Glu Leu Ala Pro Glu Ile Glu Ile Gly Trp Gly Gly Val Lys Thr Gln
195 200 205


Thr Gly Lys Phe Phe Thr Gly Asp Glu Ala Lys Ala Ser Leu Lys Lys
210 215 220


Ala Ile Ser Tyr Phe Leu Gln Asp Thr Gly Lys Asn Ser Pro Glu Leu
225 230 235 240


Gln Glu Tyr Phe Ser Val Ala Gly Lys Gln Pro Leu Glu Gln Tyr Leu
245 250 255


Gly Lys Ile Asp Thr Phe Pro Glu Ile Ser Phe Gly Arg Ile Ser Ser
260 265 270


His Gln Asn Ile Asn Ile Ser Asn Ala Met Trp Ile Leu Lys Phe Phe
275 280 285


Pro Asp Gln Tyr Ser Val Asp Leu Ile Lys Asn Leu Ile Pro Asn Lys
290 295 300


Lys Tyr Glu Ile Gly Ile Ala Pro Gln Trp Gly Asp Asp Pro Val Lys
305 310 315 320


Leu Ser Arg Gly Lys Arg Gly Tyr Thr Phe Arg Ala Phe Thr Asp Leu
325 330 335


Ala Met Trp Glu Lys Asn Trp Lys Val Phe Asp Arg Ala Ala Phe Ser
340 345 350


Asp Ala Leu Lys Thr Ile Asn Gln Phe Arg Asn Lys Thr Gln Glu Arg
355 360 365


Asn Asp Gln Leu Lys Arg Tyr Cys Ala Ala Leu Asn Trp Met Asp Gly
370 375 380


Glu Ser Ser Asp Lys Lys Pro Pro Val Glu Pro Ala Asp Ala Asp Ala
385 390 395 400


Val Asp Glu Ala Ala Thr Ser Val Leu Pro Ile Leu Ala Gly Asp Lys
405 410 415


Arg Trp Asn Ala Leu Leu Gln Leu Gln Lys Glu Leu Gly Ile Cys Asn
420 425 430


Asp Phe Thr Glu Asn Glu Leu Met Asp Tyr Gly Leu Ser Leu Arg Thr
435 440 445


Ile Arg Gly Tyr Gln Lys Leu Arg Ser Met Met Leu Glu Lys Glu Glu
450 455 460


Lys Met Arg Ala Lys Thr Ala Asp Asp Glu Glu Ile Ser Gln Ala Leu
465 470 475 480


Gln Glu Ile Ile Ile Lys Phe Gln Ser Ser His Arg Asp Thr Ile Gly
485 490 495


Ser Val Ser Leu Phe Leu Lys Leu Ala Glu Pro Lys Tyr Phe Cys Val
500 505 510


Trp His Asp Ala Asp Lys Asn Gln Asn Phe Ala Ser Val Asp Met Val
515 520 525


Ala Asp Ala Val Arg Tyr Tyr Ser Tyr Gln Glu Glu Lys Ala Arg Leu
530 535 540


Glu Glu Pro Ile Gln Ile Thr Pro Ala Asp Ala Arg Tyr Ser Arg Arg
545 550 555 560


Val Ser Asp Leu Tyr Ala Leu Val Tyr Lys Asn Ala Lys Glu Cys Lys
565 570 575


Thr Gly Tyr Gly Leu Arg Pro Asp Gly Asn Phe Val Phe Glu Ile Ala
580 585 590


Gln Lys Asn Ala Lys Gly Tyr Ala Pro Ala Lys Val Val Leu Ala Phe
595 600 605


Ser Ala Pro Arg Leu Lys Arg Asp Gly Leu Ile Asp Lys Glu Phe Ser
610 615 620


Ala Tyr Tyr Pro Pro Val Leu Gln Ala Phe Leu Arg Glu Glu Glu Ala
625 630 635 640


Pro Lys Gln Ser Phe Lys Thr Thr Ala Val Ile Leu Met Pro Asp Trp
645 650 655


Asp Lys Asn Gly Lys Arg Arg Ile Leu Leu Asn Phe Pro Ile Lys Leu
660 665 670


Asp Val Ser Ala Ile His Gln Lys Thr Asp His Arg Phe Glu Asn Gln
675 680 685


Phe Tyr Phe Ala Asn Asn Thr Asn Thr Cys Leu Leu Trp Pro Ser Tyr
690 695 700


Gln Tyr Lys Lys Pro Val Thr Trp Tyr Gln Gly Lys Lys Pro Phe Asp
705 710 715 720


Val Val Ala Val Asp Leu Gly Gln Arg Ser Ala Gly Ala Val Ser Arg
725 730 735


Ile Thr Val Ser Thr Glu Lys Arg Glu His Ser Val Ala Ile Gly Glu
740 745 750


Ala Gly Gly Thr Gln Trp Tyr Ala Tyr Arg Lys Phe Ser Gly Leu Leu
755 760 765


Arg Leu Pro Gly Glu Asp Ala Thr Val Ile Arg Asp Gly Gln Arg Thr
770 775 780


Glu Glu Leu Ser Gly Asn Ala Gly Arg Leu Ser Thr Glu Glu Glu Thr
785 790 795 800


Val Gln Ala Cys Val Leu Cys Lys Met Leu Ile Gly Asp Ala Thr Leu
805 810 815


Leu Gly Gly Ser Asp Glu Lys Thr Ile Arg Ser Phe Pro Lys Gln Asn
820 825 830


Asp Lys Leu Leu Ile Ala Phe Arg Arg Ala Thr Gly Arg Met Lys Gln
835 840 845


Leu Gln Arg Trp Leu Trp Met Leu Asn Glu Asn Gly Leu Cys Asp Lys
850 855 860


Ala Lys Thr Glu Ile Ser Asn Ser Asp Trp Leu Val Asn Lys Asn Ile
865 870 875 880


Asp Asn Val Leu Lys Glu Glu Lys Gln His Arg Glu Met Leu Pro Ala
885 890 895


Ile Leu Leu Gln Ile Ala Asp Arg Val Leu Pro Leu Arg Gly Arg Lys
900 905 910


Trp Asp Trp Val Leu Asn Pro Gln Ser Asn Ser Phe Val Leu Gln Gln
915 920 925


Thr Ala His Gly Ser Gly Asp Pro His Lys Lys Ile Cys Gly Gln Arg
930 935 940


Gly Leu Ser Phe Ala Arg Ile Glu Gln Leu Glu Ser Leu Arg Met Arg
945 950 955 960


Cys Gln Ala Leu Asn Arg Ile Leu Met Arg Lys Thr Gly Glu Lys Pro
965 970 975


Ala Thr Leu Ala Glu Met Arg Asn Asn Pro Ile Pro Asp Cys Cys Pro
980 985 990


Asp Ile Leu Met Arg Leu Asp Ala Met Lys Glu Gln Arg Ile Asn Gln
995 1000 1005


Thr Ala Asn Leu Ile Leu Ala Gln Ala Leu Gly Leu Arg His Cys
1010 1015 1020


Leu His Ser Glu Ser Ala Thr Lys Arg Lys Glu Asn Gly Met His
1025 1030 1035


Gly Glu Tyr Glu Lys Ile Pro Gly Val Glu Pro Ala Ala Phe Val
1040 1045 1050


Val Leu Glu Asp Leu Ser Arg Tyr Arg Phe Ser Gln Asp Arg Ser
1055 1060 1065


Ser Tyr Glu Asn Ser Arg Leu Met Lys Trp Ser His Arg Lys Ile
1070 1075 1080


Leu Glu Lys Leu Ala Leu Leu Cys Glu Val Phe Asn Val Pro Ile
1085 1090 1095


Leu Gln Val Gly Ala Ala Tyr Ser Ser Lys Phe Ser Ala Asn Ala
1100 1105 1110


Ile Pro Gly Phe Arg Ala Glu Glu Cys Ser Ile Asp Gln Leu Ser
1115 1120 1125


Phe Tyr Pro Trp Arg Glu Leu Lys Asp Ser Arg Glu Lys Ala Leu
1130 1135 1140


Val Glu Gln Ile Arg Lys Ile Gly His Arg Leu Leu Thr Phe Asp
1145 1150 1155


Ala Lys Ala Thr Ile Ile Met Pro Arg Asn Gly Gly Pro Val Phe
1160 1165 1170


Ile Pro Phe Val Pro Ser Asp Ser Lys Asp Thr Leu Ile Gln Ala
1175 1180 1185


Asp Ile Asn Ala Ser Phe Asn Ile Gly Leu Arg Gly Val Ala Asp
1190 1195 1200


Ala Thr Asn Leu Leu Cys Asn Asn Arg Val Ser Cys Asp Arg Lys
1205 1210 1215


Lys Asp Cys Trp Gln Val Lys Arg Ser Ser Asn Phe Ser Lys Met
1220 1225 1230


Val Tyr Pro Glu Lys Leu Ser Leu Ser Phe Asp Pro Ile Lys Lys
1235 1240 1245


Gln Glu Gly Ala Gly Gly Asn Phe Phe Val Leu Gly Cys Ser Glu
1250 1255 1260


Arg Ile Leu Thr Gly Thr Ser Glu Lys Ser Pro Val Phe Thr Ser
1265 1270 1275


Ser Glu Met Ala Lys Lys Tyr Pro Asn Leu Met Phe Gly Ser Ala
1280 1285 1290


Leu Trp Arg Asn Glu Ile Leu Lys Leu Glu Arg Cys Cys Lys Ile
1295 1300 1305


Asn Gln Ser Arg Leu Asp Lys Phe Ile Ala Lys Lys Glu Val Gln
1310 1315 1320


Asn Glu Leu
1325


<210> 384
<211> 1090
<212> PRT
<213> Laceyella sediminis

<400> 384

Met Ser Ile Arg Ser Phe Lys Leu Lys Ile Lys Thr Lys Ser Gly Val
1 5 10 15


Asn Ala Glu Glu Leu Arg Arg Gly Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Asp Gly Ile Ala Tyr Tyr Met Asn Trp Leu Val Leu Leu Arg Gln
35 40 45


Glu Asp Leu Phe Ile Arg Asn Glu Glu Thr Asn Glu Ile Glu Lys Arg
50 55 60


Ser Lys Glu Glu Ile Gln Gly Glu Leu Leu Glu Arg Val His Lys Gln
65 70 75 80


Gln Gln Arg Asn Gln Trp Ser Gly Glu Val Asp Asp Gln Thr Leu Leu
85 90 95


Gln Thr Leu Arg His Leu Tyr Glu Glu Ile Val Pro Ser Val Ile Gly
100 105 110


Lys Ser Gly Asn Ala Ser Leu Lys Ala Arg Phe Phe Leu Gly Pro Leu
115 120 125


Val Asp Pro Asn Asn Lys Thr Thr Lys Asp Val Ser Lys Ser Gly Pro
130 135 140


Thr Pro Lys Trp Lys Lys Met Lys Asp Ala Gly Asp Pro Asn Trp Val
145 150 155 160


Gln Glu Tyr Glu Lys Tyr Met Ala Glu Arg Gln Thr Leu Val Arg Leu
165 170 175


Glu Glu Met Gly Leu Ile Pro Leu Phe Pro Met Tyr Thr Asp Glu Val
180 185 190


Gly Asp Ile His Trp Leu Pro Gln Ala Ser Gly Tyr Thr Arg Thr Trp
195 200 205


Asp Arg Asp Met Phe Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220


Ser Trp Asn Arg Arg Val Arg Glu Arg Arg Ala Gln Phe Glu Lys Lys
225 230 235 240


Thr His Asp Phe Ala Ser Arg Phe Ser Glu Ser Asp Val Gln Trp Met
245 250 255


Asn Lys Leu Arg Glu Tyr Glu Ala Gln Gln Glu Lys Ser Leu Glu Glu
260 265 270


Asn Ala Phe Ala Pro Asn Glu Pro Tyr Ala Leu Thr Lys Lys Ala Leu
275 280 285


Arg Gly Trp Glu Arg Val Tyr His Ser Trp Met Arg Leu Asp Ser Ala
290 295 300


Ala Ser Glu Glu Ala Tyr Trp Gln Glu Val Ala Thr Cys Gln Thr Ala
305 310 315 320


Met Arg Gly Glu Phe Gly Asp Pro Ala Ile Tyr Gln Phe Leu Ala Gln
325 330 335


Lys Glu Asn His Asp Ile Trp Arg Gly Tyr Pro Glu Arg Val Ile Asp
340 345 350


Phe Ala Glu Leu Asn His Leu Gln Arg Glu Leu Arg Arg Ala Lys Glu
355 360 365


Asp Ala Thr Phe Thr Leu Pro Asp Ser Val Asp His Pro Leu Trp Val
370 375 380


Arg Tyr Glu Ala Pro Gly Gly Thr Asn Ile His Gly Tyr Asp Leu Val
385 390 395 400


Gln Asp Thr Lys Arg Asn Leu Thr Leu Ile Leu Asp Lys Phe Ile Leu
405 410 415


Pro Asp Glu Asn Gly Ser Trp His Glu Val Lys Lys Val Pro Phe Ser
420 425 430


Leu Ala Lys Ser Lys Gln Phe His Arg Gln Val Trp Leu Gln Glu Glu
435 440 445


Gln Lys Gln Lys Lys Arg Glu Val Val Phe Tyr Asp Tyr Ser Thr Asn
450 455 460


Leu Pro His Leu Gly Thr Leu Ala Gly Ala Lys Leu Gln Trp Asp Arg
465 470 475 480


Asn Phe Leu Asn Lys Arg Thr Gln Gln Gln Ile Glu Glu Thr Gly Glu
485 490 495


Ile Gly Lys Val Phe Phe Asn Ile Ser Val Asp Val Arg Pro Ala Val
500 505 510


Glu Val Lys Asn Gly Arg Leu Gln Asn Gly Leu Gly Lys Ala Leu Thr
515 520 525


Val Leu Thr His Pro Asp Gly Thr Lys Ile Val Thr Gly Trp Lys Ala
530 535 540


Glu Gln Leu Glu Lys Trp Val Gly Glu Ser Gly Arg Val Ser Ser Leu
545 550 555 560


Gly Leu Asp Ser Leu Ser Glu Gly Leu Arg Val Met Ser Ile Asp Leu
565 570 575


Gly Gln Arg Thr Ser Ala Thr Val Ser Val Phe Glu Ile Thr Lys Glu
580 585 590


Ala Pro Asp Asn Pro Tyr Lys Phe Phe Tyr Gln Leu Glu Gly Thr Glu
595 600 605


Leu Phe Ala Val His Gln Arg Ser Phe Leu Leu Ala Leu Pro Gly Glu
610 615 620


Asn Pro Pro Gln Lys Ile Lys Gln Met Arg Glu Ile Arg Trp Lys Glu
625 630 635 640


Arg Asn Arg Ile Lys Gln Gln Val Asp Gln Leu Ser Ala Ile Leu Arg
645 650 655


Leu His Lys Lys Val Asn Glu Asp Glu Arg Ile Gln Ala Ile Asp Lys
660 665 670


Leu Leu Gln Lys Val Ala Ser Trp Gln Leu Asn Glu Glu Ile Ala Thr
675 680 685


Ala Trp Asn Gln Ala Leu Ser Gln Leu Tyr Ser Lys Ala Lys Glu Asn
690 695 700


Asp Leu Gln Trp Asn Gln Ala Ile Lys Asn Ala His His Gln Leu Glu
705 710 715 720


Pro Val Val Gly Lys Gln Ile Ser Leu Trp Arg Lys Asp Leu Ser Thr
725 730 735


Gly Arg Gln Gly Ile Ala Gly Leu Ser Leu Trp Ser Ile Glu Glu Leu
740 745 750


Glu Ala Thr Lys Lys Leu Leu Thr Arg Trp Ser Lys Arg Ser Arg Glu
755 760 765


Pro Gly Val Val Lys Arg Ile Glu Arg Phe Glu Thr Phe Ala Lys Gln
770 775 780


Ile Gln His His Ile Asn Gln Val Lys Glu Asn Arg Leu Lys Gln Leu
785 790 795 800


Ala Asn Leu Ile Val Met Thr Ala Leu Gly Tyr Lys Tyr Asp Gln Glu
805 810 815


Gln Lys Lys Trp Ile Glu Val Tyr Pro Ala Cys Gln Val Val Leu Phe
820 825 830


Glu Asn Leu Arg Ser Tyr Arg Phe Ser Tyr Glu Arg Ser Arg Arg Glu
835 840 845


Asn Lys Lys Leu Met Glu Trp Ser His Arg Ser Ile Pro Lys Leu Val
850 855 860


Gln Met Gln Gly Glu Leu Phe Gly Leu Gln Val Ala Asp Val Tyr Ala
865 870 875 880


Ala Tyr Ser Ser Arg Tyr His Gly Arg Thr Gly Ala Pro Gly Ile Arg
885 890 895


Cys His Ala Leu Thr Glu Ala Asp Leu Arg Asn Glu Thr Asn Ile Ile
900 905 910


His Glu Leu Ile Glu Ala Gly Phe Ile Lys Glu Glu His Arg Pro Tyr
915 920 925


Leu Gln Gln Gly Asp Leu Val Pro Trp Ser Gly Gly Glu Leu Phe Ala
930 935 940


Thr Leu Gln Lys Pro Tyr Asp Asn Pro Arg Ile Leu Thr Leu His Ala
945 950 955 960


Asp Ile Asn Ala Ala Gln Asn Ile Gln Lys Arg Phe Trp His Pro Ser
965 970 975


Met Trp Phe Arg Val Asn Cys Glu Ser Val Met Glu Gly Glu Ile Val
980 985 990


Thr Tyr Val Pro Lys Asn Lys Thr Val His Lys Lys Gln Gly Lys Thr
995 1000 1005


Phe Arg Phe Val Lys Val Glu Gly Ser Asp Val Tyr Glu Trp Ala
1010 1015 1020


Lys Trp Ser Lys Asn Arg Asn Lys Asn Thr Phe Ser Ser Ile Thr
1025 1030 1035


Glu Arg Lys Pro Pro Ser Ser Met Ile Leu Phe Arg Asp Pro Ser
1040 1045 1050


Gly Thr Phe Phe Lys Glu Gln Glu Trp Val Glu Gln Lys Thr Phe
1055 1060 1065


Trp Gly Lys Val Gln Ser Met Ile Gln Ala Tyr Met Lys Lys Thr
1070 1075 1080


Ile Val Gln Arg Met Glu Glu
1085 1090


<210> 385
<211> 1041
<212> PRT
<213> Methylobacterium nodulans

<400> 385

Met Tyr Glu Ala Ile Val Leu Ala Asp Asp Ala Asn Ala Gln Leu Ala
1 5 10 15


Asn Ala Phe Leu Gly Pro Leu Thr Asp Pro Asn Ser Ala Gly Phe Leu
20 25 30


Glu Ala Phe Asn Lys Val Asp Arg Pro Ala Pro Ser Trp Leu Asp Gln
35 40 45


Val Pro Ala Ser Asp Pro Ile Asp Pro Ala Val Leu Ala Glu Ala Asn
50 55 60


Ala Trp Leu Asp Thr Asp Ala Gly Arg Ala Trp Leu Val Asp Thr Gly
65 70 75 80


Ala Pro Pro Arg Trp Arg Ser Leu Ala Ala Lys Gln Asp Pro Ile Trp
85 90 95


Pro Arg Glu Phe Ala Arg Lys Leu Gly Glu Leu Arg Lys Glu Ala Ala
100 105 110


Ser Gly Thr Ser Ala Ile Ile Lys Ala Leu Lys Arg Asp Phe Gly Val
115 120 125


Leu Pro Leu Phe Gln Pro Ser Leu Ala Pro Arg Ile Leu Gly Ser Arg
130 135 140


Ser Ser Leu Thr Pro Trp Asp Arg Leu Ala Phe Arg Leu Ala Val Gly
145 150 155 160


His Leu Leu Ser Trp Glu Ser Trp Cys Thr Arg Ala Arg Asp Glu His
165 170 175


Thr Ala Arg Val Gln Arg Leu Glu Gln Phe Ser Ser Ala His Leu Lys
180 185 190


Gly Asp Leu Ala Thr Lys Val Ser Thr Leu Arg Glu Tyr Glu Arg Ala
195 200 205


Arg Lys Glu Gln Ile Ala Gln Leu Gly Leu Pro Met Gly Glu Arg Asp
210 215 220


Phe Leu Ile Thr Val Arg Met Thr Arg Gly Trp Asp Asp Leu Arg Glu
225 230 235 240


Lys Trp Arg Arg Ser Gly Asp Lys Gly Gln Glu Ala Leu His Ala Ile
245 250 255


Ile Ala Thr Glu Gln Thr Arg Lys Arg Gly Arg Phe Gly Asp Pro Asp
260 265 270


Leu Phe Arg Trp Leu Ala Arg Pro Glu Asn His His Val Trp Ala Asp
275 280 285


Gly His Ala Asp Ala Val Gly Val Leu Ala Arg Val Asn Ala Met Glu
290 295 300


Arg Leu Val Glu Arg Ser Arg Asp Thr Ala Leu Met Thr Leu Pro Asp
305 310 315 320


Pro Val Ala His Pro Arg Ser Ala Gln Trp Glu Ala Glu Gly Gly Ser
325 330 335


Asn Leu Arg Asn Tyr Gln Leu Glu Ala Val Gly Gly Glu Leu Gln Ile
340 345 350


Thr Leu Pro Leu Leu Lys Ala Ala Asp Asp Gly Arg Cys Ile Asp Thr
355 360 365


Pro Leu Ser Phe Ser Leu Ala Pro Ser Asp Gln Leu Gln Gly Val Val
370 375 380


Leu Thr Lys Gln Asp Lys Gln Gln Lys Ile Thr Tyr Cys Thr Asn Met
385 390 395 400


Asn Glu Val Phe Glu Ala Lys Leu Gly Ser Ala Asp Leu Leu Leu Asn
405 410 415


Trp Asp His Leu Arg Gly Arg Ile Arg Asp Arg Val Asp Ala Gly Asp
420 425 430


Ile Gly Ser Ala Phe Leu Lys Leu Ala Leu Asp Val Ala His Val Leu
435 440 445


Pro Asp Gly Val Asp Asp Gln Leu Ala Arg Ala Ala Phe His Phe Gln
450 455 460


Ser Ala Lys Gly Ala Lys Ser Lys His Ala Asp Ser Val Gln Ala Gly
465 470 475 480


Leu Arg Val Leu Ser Ile Asp Leu Gly Val Arg Ser Phe Ala Thr Cys
485 490 495


Ser Val Phe Glu Leu Lys Asp Thr Ala Pro Thr Thr Gly Val Ala Phe
500 505 510


Pro Leu Ala Glu Phe Arg Leu Trp Ala Val His Glu Arg Ser Phe Thr
515 520 525


Leu Glu Leu Pro Gly Glu Asn Val Gly Ala Ala Gly Gln Gln Trp Arg
530 535 540


Ala Gln Ala Asp Ala Glu Leu Arg Gln Leu Arg Gly Gly Leu Asn Arg
545 550 555 560


His Arg Gln Leu Leu Arg Ala Ala Thr Val Gln Lys Gly Glu Arg Asp
565 570 575


Ala Tyr Leu Thr Asp Leu Arg Glu Ala Trp Ser Ala Lys Glu Leu Trp
580 585 590


Pro Phe Glu Ala Ser Leu Leu Ser Glu Leu Glu Arg Cys Ser Thr Val
595 600 605


Ala Asp Pro Leu Trp Gln Asp Thr Cys Lys Arg Ala Ala Arg Leu Tyr
610 615 620


Arg Thr Glu Phe Gly Ala Val Val Ser Glu Trp Arg Ser Arg Thr Arg
625 630 635 640


Ser Arg Glu Asp Arg Lys Tyr Ala Gly Lys Ser Met Trp Ser Val Gln
645 650 655


His Leu Thr Asp Val Arg Arg Phe Leu Gln Ser Trp Ser Leu Ala Gly
660 665 670


Arg Ala Ser Gly Asp Ile Arg Arg Leu Asp Arg Glu Arg Gly Gly Val
675 680 685


Phe Ala Lys Asp Leu Leu Asp His Ile Asp Ala Leu Lys Asp Asp Arg
690 695 700


Leu Lys Thr Gly Ala Asp Leu Ile Val Gln Ala Ala Arg Gly Phe Gln
705 710 715 720


Arg Asn Glu Phe Gly Tyr Trp Val Gln Lys His Ala Pro Cys His Val
725 730 735


Ile Leu Phe Glu Asp Leu Ser Arg Tyr Arg Met Arg Thr Asp Arg Pro
740 745 750


Arg Arg Glu Asn Ser Gln Leu Met Gln Trp Ala His Arg Gly Val Pro
755 760 765


Asp Met Val Gly Met Gln Gly Glu Ile Tyr Gly Ile Gln Asp Arg Arg
770 775 780


Asp Pro Asp Ser Ala Arg Lys His Ala Arg Gln Pro Leu Ala Ala Phe
785 790 795 800


Cys Leu Asp Thr Pro Ala Ala Phe Ser Ser Arg Tyr His Ala Ser Thr
805 810 815


Met Thr Pro Gly Ile Arg Cys His Pro Leu Arg Lys Arg Glu Phe Glu
820 825 830


Asp Gln Gly Phe Leu Glu Leu Leu Lys Arg Glu Asn Glu Gly Leu Asp
835 840 845


Leu Asn Gly Tyr Lys Pro Gly Asp Leu Val Pro Leu Pro Gly Gly Glu
850 855 860


Val Phe Val Cys Leu Asn Ala Asn Gly Leu Ser Arg Ile His Ala Asp
865 870 875 880


Ile Asn Ala Ala Gln Asn Leu Gln Arg Arg Phe Trp Thr Gln His Gly
885 890 895


Asp Ala Phe Arg Leu Pro Cys Gly Lys Ser Ala Val Gln Gly Gln Ile
900 905 910


Arg Trp Ala Pro Leu Ser Met Gly Lys Arg Gln Ala Gly Ala Leu Gly
915 920 925


Gly Phe Gly Tyr Leu Glu Pro Thr Gly His Asp Ser Gly Ser Cys Gln
930 935 940


Trp Arg Lys Thr Thr Glu Ala Glu Trp Arg Arg Leu Ser Gly Ala Gln
945 950 955 960


Lys Asp Arg Asp Glu Ala Ala Ala Ala Glu Asp Glu Glu Leu Gln Gly
965 970 975


Leu Glu Glu Glu Leu Leu Glu Arg Ser Gly Glu Arg Val Val Phe Phe
980 985 990


Arg Asp Pro Ser Gly Val Val Leu Pro Thr Asp Leu Trp Phe Pro Ser
995 1000 1005


Ala Ala Phe Trp Ser Ile Val Arg Ala Lys Thr Val Gly Arg Leu
1010 1015 1020


Arg Ser His Leu Asp Ala Gln Ala Glu Ala Ser Tyr Ala Val Ala
1025 1030 1035


Ala Gly Leu
1040


<210> 386
<211> 1388
<212> PRT
<213> Unknown

<220>
<223> Opitutaceae bacterium

<400> 386

Met Ser Leu Asn Arg Ile Tyr Gln Gly Arg Val Ala Ala Val Glu Thr
1 5 10 15


Gly Thr Ala Leu Ala Lys Gly Asn Val Glu Trp Met Pro Ala Ala Gly
20 25 30


Gly Asp Glu Val Leu Trp Gln His His Glu Leu Phe Gln Ala Ala Ile
35 40 45


Asn Tyr Tyr Leu Val Ala Leu Leu Ala Leu Ala Asp Lys Asn Asn Pro
50 55 60


Val Leu Gly Pro Leu Ile Ser Gln Met Asp Asn Pro Gln Ser Pro Tyr
65 70 75 80


His Val Trp Gly Ser Phe Arg Arg Gln Gly Arg Gln Arg Thr Gly Leu
85 90 95


Ser Gln Ala Val Ala Pro Tyr Ile Thr Pro Gly Asn Asn Ala Pro Thr
100 105 110


Leu Asp Glu Val Phe Arg Ser Ile Leu Ala Gly Asn Pro Thr Asp Arg
115 120 125


Ala Thr Leu Asp Ala Ala Leu Met Gln Leu Leu Lys Ala Cys Asp Gly
130 135 140


Ala Gly Ala Ile Gln Gln Glu Gly Arg Ser Tyr Trp Pro Lys Phe Cys
145 150 155 160


Asp Pro Asp Ser Thr Ala Asn Phe Ala Gly Asp Pro Ala Met Leu Arg
165 170 175


Arg Glu Gln His Arg Leu Leu Leu Pro Gln Val Leu His Asp Pro Ala
180 185 190


Ile Thr His Asp Ser Pro Ala Leu Gly Ser Phe Asp Thr Tyr Ser Ile
195 200 205


Ala Thr Pro Asp Thr Arg Thr Pro Gln Leu Thr Gly Pro Lys Ala Arg
210 215 220


Ala Arg Leu Glu Gln Ala Ile Thr Leu Trp Arg Val Arg Leu Pro Glu
225 230 235 240


Ser Ala Ala Asp Phe Asp Arg Leu Ala Ser Ser Leu Lys Lys Ile Pro
245 250 255


Asp Asp Asp Ser Arg Leu Asn Leu Gln Gly Tyr Val Gly Ser Ser Ala
260 265 270


Lys Gly Glu Val Gln Ala Arg Leu Phe Ala Leu Leu Leu Phe Arg His
275 280 285


Leu Glu Arg Ser Ser Phe Thr Leu Gly Leu Leu Arg Ser Ala Thr Pro
290 295 300


Pro Pro Lys Asn Ala Glu Thr Pro Pro Pro Ala Gly Val Pro Leu Pro
305 310 315 320


Ala Ala Ser Ala Ala Asp Pro Val Arg Ile Ala Arg Gly Lys Arg Ser
325 330 335


Phe Val Phe Arg Ala Phe Thr Ser Leu Pro Cys Trp His Gly Gly Asp
340 345 350


Asn Ile His Pro Thr Trp Lys Ser Phe Asp Ile Ala Ala Phe Lys Tyr
355 360 365


Ala Leu Thr Val Ile Asn Gln Ile Glu Glu Lys Thr Lys Glu Arg Gln
370 375 380


Lys Glu Cys Ala Glu Leu Glu Thr Asp Phe Asp Tyr Met His Gly Arg
385 390 395 400


Leu Ala Lys Ile Pro Val Lys Tyr Thr Thr Gly Glu Ala Glu Pro Pro
405 410 415


Pro Ile Leu Ala Asn Asp Leu Arg Ile Pro Leu Leu Arg Glu Leu Leu
420 425 430


Gln Asn Ile Lys Val Asp Thr Ala Leu Thr Asp Gly Glu Ala Val Ser
435 440 445


Tyr Gly Leu Gln Arg Arg Thr Ile Arg Gly Phe Arg Glu Leu Arg Arg
450 455 460


Ile Trp Arg Gly His Ala Pro Ala Gly Thr Val Phe Ser Ser Glu Leu
465 470 475 480


Lys Glu Lys Leu Ala Gly Glu Leu Arg Gln Phe Gln Thr Asp Asn Ser
485 490 495


Thr Thr Ile Gly Ser Val Gln Leu Phe Asn Glu Leu Ile Gln Asn Pro
500 505 510


Lys Tyr Trp Pro Ile Trp Gln Ala Pro Asp Val Glu Thr Ala Arg Gln
515 520 525


Trp Ala Asp Ala Gly Phe Ala Asp Asp Pro Leu Ala Ala Leu Val Gln
530 535 540


Glu Ala Glu Leu Gln Glu Asp Ile Asp Ala Leu Lys Ala Pro Val Lys
545 550 555 560


Leu Thr Pro Ala Asp Pro Glu Tyr Ser Arg Arg Gln Tyr Asp Phe Asn
565 570 575


Ala Val Ser Lys Phe Gly Ala Gly Ser Arg Ser Ala Asn Arg His Glu
580 585 590


Pro Gly Gln Thr Glu Arg Gly His Asn Thr Phe Thr Thr Glu Ile Ala
595 600 605


Ala Arg Asn Ala Ala Asp Gly Asn Arg Trp Arg Ala Thr His Val Arg
610 615 620


Ile His Tyr Ser Ala Pro Arg Leu Leu Arg Asp Gly Leu Arg Arg Pro
625 630 635 640


Asp Thr Asp Gly Asn Glu Ala Leu Glu Ala Val Pro Trp Leu Gln Pro
645 650 655


Met Met Glu Ala Leu Ala Pro Leu Pro Thr Leu Pro Gln Asp Leu Thr
660 665 670


Gly Met Pro Val Phe Leu Met Pro Asp Val Thr Leu Ser Gly Glu Arg
675 680 685


Arg Ile Leu Leu Asn Leu Pro Val Thr Leu Glu Pro Ala Ala Leu Val
690 695 700


Glu Gln Leu Gly Asn Ala Gly Arg Trp Gln Asn Gln Phe Phe Gly Ser
705 710 715 720


Arg Glu Asp Pro Phe Ala Leu Arg Trp Pro Ala Asp Gly Ala Val Lys
725 730 735


Thr Ala Lys Gly Lys Thr His Ile Pro Trp His Gln Asp Arg Asp His
740 745 750


Phe Thr Val Leu Gly Val Asp Leu Gly Thr Arg Asp Ala Gly Ala Leu
755 760 765


Ala Leu Leu Asn Val Thr Ala Gln Lys Pro Ala Lys Pro Val His Arg
770 775 780


Ile Ile Gly Glu Ala Asp Gly Arg Thr Trp Tyr Ala Ser Leu Ala Asp
785 790 795 800


Ala Arg Met Ile Arg Leu Pro Gly Glu Asp Ala Arg Leu Phe Val Arg
805 810 815


Gly Lys Leu Val Gln Glu Pro Tyr Gly Glu Arg Gly Arg Asn Ala Ser
820 825 830


Leu Leu Glu Trp Glu Asp Ala Arg Asn Ile Ile Leu Arg Leu Gly Gln
835 840 845


Asn Pro Asp Glu Leu Leu Gly Ala Asp Pro Arg Arg His Ser Tyr Pro
850 855 860


Glu Ile Asn Asp Lys Leu Leu Val Ala Leu Arg Arg Ala Gln Ala Arg
865 870 875 880


Leu Ala Arg Leu Gln Asn Arg Ser Trp Arg Leu Arg Asp Leu Ala Glu
885 890 895


Ser Asp Lys Ala Leu Asp Glu Ile His Ala Glu Arg Ala Gly Glu Lys
900 905 910


Pro Ser Pro Leu Pro Pro Leu Ala Arg Asp Asp Ala Ile Lys Ser Thr
915 920 925


Asp Glu Ala Leu Leu Ser Gln Arg Asp Ile Ile Arg Arg Ser Phe Val
930 935 940


Gln Ile Ala Asn Leu Ile Leu Pro Leu Arg Gly Arg Arg Trp Glu Trp
945 950 955 960


Arg Pro His Val Glu Val Pro Asp Cys His Ile Leu Ala Gln Ser Asp
965 970 975


Pro Gly Thr Asp Asp Thr Lys Arg Leu Val Ala Gly Gln Arg Gly Ile
980 985 990


Ser His Glu Arg Ile Glu Gln Ile Glu Glu Leu Arg Arg Arg Cys Gln
995 1000 1005


Ser Leu Asn Arg Ala Leu Arg His Lys Pro Gly Glu Arg Pro Val
1010 1015 1020


Leu Gly Arg Pro Ala Lys Gly Glu Glu Ile Ala Asp Pro Cys Pro
1025 1030 1035


Ala Leu Leu Glu Lys Ile Asn Arg Leu Arg Asp Gln Arg Val Asp
1040 1045 1050


Gln Thr Ala His Ala Ile Leu Ala Ala Ala Leu Gly Val Arg Leu
1055 1060 1065


Arg Ala Pro Ser Lys Asp Arg Ala Glu Arg Arg His Arg Asp Ile
1070 1075 1080


His Gly Glu Tyr Glu Arg Phe Arg Ala Pro Ala Asp Phe Val Val
1085 1090 1095


Ile Glu Asn Leu Ser Arg Tyr Leu Ser Ser Gln Asp Arg Ala Arg
1100 1105 1110


Ser Glu Asn Thr Arg Leu Met Gln Trp Cys His Arg Gln Ile Val
1115 1120 1125


Gln Lys Leu Arg Gln Leu Cys Glu Thr Tyr Gly Ile Pro Val Leu
1130 1135 1140


Ala Val Pro Ala Ala Tyr Ser Ser Arg Phe Ser Ser Arg Asp Gly
1145 1150 1155


Ser Ala Gly Phe Arg Ala Val His Leu Thr Pro Asp His Arg His
1160 1165 1170


Arg Met Pro Trp Ser Arg Ile Leu Ala Arg Leu Lys Ala His Glu
1175 1180 1185


Glu Asp Gly Lys Arg Leu Glu Lys Thr Val Leu Asp Glu Ala Arg
1190 1195 1200


Ala Val Arg Gly Leu Phe Asp Arg Leu Asp Arg Phe Asn Ala Gly
1205 1210 1215


His Val Pro Gly Lys Pro Trp Arg Thr Leu Leu Ala Pro Leu Pro
1220 1225 1230


Gly Gly Pro Val Phe Val Pro Leu Gly Asp Ala Thr Pro Met Gln
1235 1240 1245


Ala Asp Leu Asn Ala Ala Ile Asn Ile Ala Leu Arg Gly Ile Ala
1250 1255 1260


Ala Pro Asp Arg His Asp Ile His His Arg Leu Arg Ala Glu Asn
1265 1270 1275


Lys Lys Arg Ile Leu Ser Leu Arg Leu Gly Thr Gln Arg Glu Lys
1280 1285 1290


Ala Arg Trp Pro Gly Gly Ala Pro Ala Val Thr Leu Ser Thr Pro
1295 1300 1305


Asn Asn Gly Ala Ser Pro Glu Asp Ser Asp Ala Leu Pro Glu Arg
1310 1315 1320


Val Ser Asn Leu Phe Val Asp Ile Ala Gly Val Ala Asn Phe Glu
1325 1330 1335


Arg Val Thr Ile Glu Gly Val Ser Gln Lys Phe Ala Thr Gly Arg
1340 1345 1350


Gly Leu Trp Ala Ser Val Lys Gln Arg Ala Trp Asn Arg Val Ala
1355 1360 1365


Arg Leu Asn Glu Thr Val Thr Asp Asn Asn Arg Asn Glu Glu Glu
1370 1375 1380


Asp Asp Ile Pro Met
1385


<210> 387
<211> 1108
<212> PRT
<213> Bacillus species

<400> 387

Met Ala Ile Arg Ser Ile Lys Leu Lys Leu Lys Thr His Thr Gly Pro
1 5 10 15


Glu Ala Gln Asn Leu Arg Lys Gly Ile Trp Arg Thr His Arg Leu Leu
20 25 30


Asn Glu Gly Val Ala Tyr Tyr Met Lys Met Leu Leu Leu Phe Arg Gln
35 40 45


Glu Ser Thr Gly Glu Arg Pro Lys Glu Glu Leu Gln Glu Glu Leu Ile
50 55 60


Cys His Ile Arg Glu Gln Gln Gln Arg Asn Gln Ala Asp Lys Asn Thr
65 70 75 80


Gln Ala Leu Pro Leu Asp Lys Ala Leu Glu Ala Leu Arg Gln Leu Tyr
85 90 95


Glu Leu Leu Val Pro Ser Ser Val Gly Gln Ser Gly Asp Ala Gln Ile
100 105 110


Ile Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly
115 120 125


Gly Lys Gly Thr Ser Lys Ala Gly Ala Lys Pro Thr Trp Gln Lys Lys
130 135 140


Lys Glu Ala Asn Asp Pro Thr Trp Glu Gln Asp Tyr Glu Lys Trp Lys
145 150 155 160


Lys Arg Arg Glu Glu Asp Pro Thr Ala Ser Val Ile Thr Thr Leu Glu
165 170 175


Glu Tyr Gly Ile Arg Pro Ile Phe Pro Leu Tyr Thr Asn Thr Val Thr
180 185 190


Asp Ile Ala Trp Leu Pro Leu Gln Ser Asn Gln Phe Val Arg Thr Trp
195 200 205


Asp Arg Asp Met Leu Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220


Ser Trp Asn Lys Arg Val Gln Glu Glu Tyr Ala Lys Leu Lys Glu Lys
225 230 235 240


Met Ala Gln Leu Asn Glu Gln Leu Glu Gly Gly Gln Glu Trp Ile Ser
245 250 255


Leu Leu Glu Gln Tyr Glu Glu Asn Arg Glu Arg Glu Leu Arg Glu Asn
260 265 270


Met Thr Ala Ala Asn Asp Lys Tyr Arg Ile Thr Lys Arg Gln Met Lys
275 280 285


Gly Trp Asn Glu Leu Tyr Glu Leu Trp Ser Thr Phe Pro Ala Ser Ala
290 295 300


Ser His Glu Gln Tyr Lys Glu Ala Leu Lys Arg Val Gln Gln Arg Leu
305 310 315 320


Arg Gly Arg Phe Gly Asp Ala His Phe Phe Gln Tyr Leu Met Glu Glu
325 330 335


Lys Asn Arg Leu Ile Trp Lys Gly Asn Pro Gln Arg Ile His Tyr Phe
340 345 350


Val Ala Arg Asn Glu Leu Thr Lys Arg Leu Glu Glu Ala Lys Gln Ser
355 360 365


Ala Thr Met Thr Leu Pro Asn Ala Arg Lys His Pro Leu Trp Val Arg
370 375 380


Phe Asp Ala Arg Gly Gly Asn Leu Gln Asp Tyr Tyr Leu Thr Ala Glu
385 390 395 400


Ala Asp Lys Pro Arg Ser Arg Arg Phe Val Thr Phe Ser Gln Leu Ile
405 410 415


Trp Pro Ser Glu Ser Gly Trp Met Glu Lys Lys Asp Val Glu Val Glu
420 425 430


Leu Ala Leu Ser Arg Gln Phe Tyr Gln Gln Val Lys Leu Leu Lys Asn
435 440 445


Asp Lys Gly Lys Gln Lys Ile Glu Phe Lys Asp Lys Gly Ser Gly Ser
450 455 460


Thr Phe Asn Gly His Leu Gly Gly Ala Lys Leu Gln Leu Glu Arg Gly
465 470 475 480


Asp Leu Glu Lys Glu Glu Lys Asn Phe Glu Asp Gly Glu Ile Gly Ser
485 490 495


Val Tyr Leu Asn Val Val Ile Asp Phe Glu Pro Leu Gln Glu Val Lys
500 505 510


Asn Gly Arg Val Gln Ala Pro Tyr Gly Gln Val Leu Gln Leu Ile Arg
515 520 525


Arg Pro Asn Glu Phe Pro Lys Val Thr Thr Tyr Lys Ser Glu Gln Leu
530 535 540


Val Glu Trp Ile Lys Ala Ser Pro Gln His Ser Ala Gly Val Glu Ser
545 550 555 560


Leu Ala Ser Gly Phe Arg Val Met Ser Ile Asp Leu Gly Leu Arg Ala
565 570 575


Ala Ala Ala Thr Ser Ile Phe Ser Val Glu Glu Ser Ser Asp Lys Asn
580 585 590


Ala Ala Asp Phe Ser Tyr Trp Ile Glu Gly Thr Pro Leu Val Ala Val
595 600 605


His Gln Arg Ser Tyr Met Leu Arg Leu Pro Gly Glu Gln Val Glu Lys
610 615 620


Gln Val Met Glu Lys Arg Asp Glu Arg Phe Gln Leu His Gln Arg Val
625 630 635 640


Lys Phe Gln Ile Arg Val Leu Ala Gln Ile Met Arg Met Ala Asn Lys
645 650 655


Gln Tyr Gly Asp Arg Trp Asp Glu Leu Asp Ser Leu Lys Gln Ala Val
660 665 670


Glu Gln Lys Lys Ser Pro Leu Asp Gln Thr Asp Arg Thr Phe Trp Glu
675 680 685


Gly Ile Val Cys Asp Leu Thr Lys Val Leu Pro Arg Asn Glu Ala Asp
690 695 700


Trp Glu Gln Ala Val Val Gln Ile His Arg Lys Ala Glu Glu Tyr Val
705 710 715 720


Gly Lys Ala Val Gln Ala Trp Arg Lys Arg Phe Ala Ala Asp Glu Arg
725 730 735


Lys Gly Ile Ala Gly Leu Ser Met Trp Asn Ile Glu Glu Leu Glu Gly
740 745 750


Leu Arg Lys Leu Leu Ile Ser Trp Ser Arg Arg Thr Arg Asn Pro Gln
755 760 765


Glu Val Asn Arg Phe Glu Arg Gly His Thr Ser His Gln Arg Leu Leu
770 775 780


Thr His Ile Gln Asn Val Lys Glu Asp Arg Leu Lys Gln Leu Ser His
785 790 795 800


Ala Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Glu Arg Lys Gln
805 810 815


Glu Trp Cys Ala Glu Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asn
820 825 830


Leu Ser Gln Tyr Arg Ser Asn Leu Asp Arg Ser Thr Lys Glu Asn Ser
835 840 845


Thr Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val His Met
850 855 860


Gln Ala Glu Pro Tyr Gly Ile Gln Ile Gly Asp Val Arg Ala Glu Tyr
865 870 875 880


Ser Ser Arg Phe Tyr Ala Lys Thr Gly Thr Pro Gly Ile Arg Cys Lys
885 890 895


Lys Val Arg Gly Gln Asp Leu Gln Gly Arg Arg Phe Glu Asn Leu Gln
900 905 910


Lys Arg Leu Val Asn Glu Gln Phe Leu Thr Glu Glu Gln Val Lys Gln
915 920 925


Leu Arg Pro Gly Asp Ile Val Pro Asp Asp Ser Gly Glu Leu Phe Met
930 935 940


Thr Leu Thr Asp Gly Ser Gly Ser Lys Glu Val Val Phe Leu Gln Ala
945 950 955 960


Asp Ile Asn Ala Ala His Asn Leu Gln Lys Arg Phe Trp Gln Arg Tyr
965 970 975


Asn Glu Leu Phe Lys Val Ser Cys Arg Val Ile Val Arg Asp Glu Glu
980 985 990


Glu Tyr Leu Val Pro Lys Thr Lys Ser Val Gln Ala Lys Leu Gly Lys
995 1000 1005


Gly Leu Phe Val Lys Lys Ser Asp Thr Ala Trp Lys Asp Val Tyr
1010 1015 1020


Val Trp Asp Ser Gln Ala Lys Leu Lys Gly Lys Thr Thr Phe Thr
1025 1030 1035


Glu Glu Ser Glu Ser Pro Glu Gln Leu Glu Asp Phe Gln Glu Ile
1040 1045 1050


Ile Glu Glu Ala Glu Glu Ala Lys Gly Thr Tyr Arg Thr Leu Phe
1055 1060 1065


Arg Asp Pro Ser Gly Val Phe Phe Pro Glu Ser Val Trp Tyr Pro
1070 1075 1080


Gln Lys Asp Phe Trp Gly Glu Val Lys Arg Lys Leu Tyr Gly Lys
1085 1090 1095


Leu Arg Glu Arg Phe Leu Thr Lys Ala Arg
1100 1105


<210> 388
<211> 658
<212> PRT
<213> Methylobacterium nodulans

<400> 388

Met Leu Thr Lys Gln Asp Lys Gln Gln Lys Ile Thr Tyr Cys Thr Asn
1 5 10 15


Met Asn Glu Val Phe Glu Ala Lys Leu Gly Ser Ala Asp Leu Leu Leu
20 25 30


Asn Trp Asp His Leu Arg Gly Arg Ile Arg Asp Arg Val Asp Ala Gly
35 40 45


Asp Ile Gly Ser Ala Phe Leu Lys Leu Ala Leu Asp Val Ala His Val
50 55 60


Leu Pro Asp Gly Val Asp Asp Gln Leu Ala Arg Ala Ala Phe His Phe
65 70 75 80


Gln Ser Ala Lys Gly Ala Lys Ser Lys His Ala Asp Ser Val Gln Ala
85 90 95


Gly Leu Arg Val Leu Ser Ile Asp Leu Gly Val Arg Ser Phe Ala Thr
100 105 110


Cys Ser Val Phe Glu Leu Lys Asp Thr Ala Pro Thr Thr Gly Val Ala
115 120 125


Phe Pro Leu Ala Glu Phe Arg Leu Trp Ala Val His Glu Arg Ser Phe
130 135 140


Thr Leu Glu Leu Pro Gly Glu Asn Val Gly Ala Ala Gly Gln Gln Trp
145 150 155 160


Arg Ala Gln Ala Asp Ala Glu Leu Arg Gln Leu Arg Gly Gly Leu Asn
165 170 175


Arg His Arg Gln Leu Leu Arg Ala Ala Thr Val Gln Lys Gly Glu Arg
180 185 190


Asp Ala Tyr Leu Thr Asp Leu Arg Glu Ala Trp Ser Ala Lys Glu Leu
195 200 205


Trp Pro Phe Glu Ala Ser Leu Leu Ser Glu Leu Glu Arg Cys Ser Thr
210 215 220


Val Ala Asp Pro Leu Trp Gln Asp Thr Cys Lys Arg Ala Ala Arg Leu
225 230 235 240


Tyr Arg Thr Glu Phe Gly Ala Val Val Ser Glu Trp Arg Ser Arg Thr
245 250 255


Arg Ser Arg Glu Asp Arg Lys Tyr Ala Gly Lys Ser Met Trp Ser Val
260 265 270


Gln His Leu Thr Asp Val Arg Arg Phe Leu Gln Ser Trp Ser Leu Ala
275 280 285


Gly Arg Ala Ser Gly Asp Ile Arg Arg Leu Asp Arg Glu Arg Gly Gly
290 295 300


Val Phe Ala Lys Asp Leu Leu Asp His Ile Asp Ala Leu Lys Asp Asp
305 310 315 320


Arg Leu Lys Thr Gly Ala Asp Leu Ile Val Gln Ala Ala Arg Gly Phe
325 330 335


Gln Arg Asn Glu Phe Gly Tyr Trp Val Gln Lys His Ala Pro Cys His
340 345 350


Val Ile Leu Phe Glu Asp Leu Ser Arg Tyr Arg Met Arg Thr Asp Arg
355 360 365


Pro Arg Arg Glu Asn Ser Gln Leu Met Gln Trp Ala His Arg Gly Val
370 375 380


Pro Asp Met Val Gly Met Gln Gly Glu Ile Tyr Gly Ile Gln Asp Arg
385 390 395 400


Arg Asp Pro Asp Ser Ala Arg Lys His Ala Arg Gln Pro Leu Ala Ala
405 410 415


Phe Cys Leu Asp Thr Pro Ala Ala Phe Ser Ser Arg Tyr His Ala Ser
420 425 430


Thr Met Thr Pro Gly Ile Arg Cys His Pro Leu Arg Lys Arg Glu Phe
435 440 445


Glu Asp Gln Gly Phe Leu Glu Leu Leu Lys Arg Glu Asn Glu Gly Leu
450 455 460


Asp Leu Asn Gly Tyr Lys Pro Gly Asp Leu Val Pro Leu Pro Gly Gly
465 470 475 480


Glu Val Phe Val Cys Leu Asn Ala Asn Gly Leu Ser Arg Ile His Ala
485 490 495


Asp Ile Asn Ala Ala Gln Asn Leu Gln Arg Arg Phe Trp Thr Gln His
500 505 510


Gly Asp Ala Phe Arg Leu Pro Cys Gly Lys Ser Ala Val Gln Gly Gln
515 520 525


Ile Arg Trp Ala Pro Leu Ser Met Gly Lys Arg Gln Ala Gly Ala Leu
530 535 540


Gly Gly Phe Gly Tyr Leu Glu Pro Thr Gly His Asp Ser Gly Ser Cys
545 550 555 560


Gln Trp Arg Lys Thr Thr Glu Ala Glu Trp Arg Arg Leu Ser Gly Ala
565 570 575


Gln Lys Asp Arg Asp Glu Ala Ala Ala Ala Glu Asp Glu Glu Leu Gln
580 585 590


Gly Leu Glu Glu Glu Leu Leu Glu Arg Ser Gly Glu Arg Val Val Phe
595 600 605


Phe Arg Asp Pro Ser Gly Val Val Leu Pro Thr Asp Leu Trp Phe Pro
610 615 620


Ser Ala Ala Phe Trp Ser Ile Val Arg Ala Lys Thr Val Gly Arg Leu
625 630 635 640


Arg Ser His Leu Asp Ala Gln Ala Glu Ala Ser Tyr Ala Val Ala Ala
645 650 655


Gly Leu



<210> 389
<211> 1147
<212> PRT
<213> Alicyclobacillus kakegawensis

<400> 389

Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Ser Glu Cys Pro
1 5 10 15


Asp Ile Leu Ala Gly Met Trp Gln Leu His Arg Ala Thr Asn Ala Gly
20 25 30


Val Arg Tyr Tyr Thr Glu Trp Val Ser Leu Met Arg Gln Glu Ile Leu
35 40 45


Tyr Ser Arg Gly Pro Asp Gly Gly Gln Gln Cys Tyr Met Thr Ala Glu
50 55 60


Asp Cys Gln Arg Glu Leu Leu Arg Arg Leu Arg Asn Arg Gln Leu His
65 70 75 80


Asn Gly Arg Gln Asp Gln Pro Gly Thr Asp Ala Asp Leu Leu Ala Ile
85 90 95


Ser Arg Arg Leu Tyr Glu Ile Leu Val Leu Gln Ser Ile Gly Lys Arg
100 105 110


Gly Asp Ala Gln Gln Ile Ala Ser Ser Phe Leu Ser Pro Leu Val Asp
115 120 125


Pro Asn Ser Lys Gly Gly Arg Gly Glu Ala Lys Ser Gly Arg Lys Pro
130 135 140


Ala Trp Gln Lys Met Arg Asp Gln Gly Asp Pro Arg Trp Val Ala Ala
145 150 155 160


Arg Glu Lys Tyr Glu Gln Arg Lys Ala Val Asp Pro Ser Lys Glu Ile
165 170 175


Leu Asn Ser Leu Asp Ala Leu Gly Leu Arg Pro Leu Phe Ala Val Phe
180 185 190


Thr Glu Thr Tyr Arg Ser Gly Val Asp Trp Lys Pro Leu Gly Lys Ser
195 200 205


Gln Gly Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala Leu Glu
210 215 220


Arg Leu Met Ser Trp Glu Ser Trp Asn Arg Arg Val Gly Glu Glu Tyr
225 230 235 240


Ala Arg Leu Phe Gln Gln Lys Met Lys Phe Glu Gln Glu His Phe Ala
245 250 255


Glu Gln Ser His Leu Val Lys Leu Ala Arg Ala Leu Glu Ala Asp Met
260 265 270


Arg Ala Ala Ser Gln Gly Phe Glu Ala Lys Arg Gly Thr Ala His Gln
275 280 285


Ile Thr Arg Arg Ala Leu Arg Gly Ala Asp Arg Val Phe Glu Ile Trp
290 295 300


Lys Ser Ile Pro Glu Glu Ala Leu Phe Ser Gln Tyr Asp Glu Val Ile
305 310 315 320


Arg Gln Val Gln Ala Glu Lys Arg Arg Asp Phe Gly Ser His Asp Leu
325 330 335


Phe Ala Lys Leu Ala Glu Pro Lys Tyr Gln Pro Leu Trp Arg Ala Asp
340 345 350


Glu Thr Phe Leu Thr Arg Tyr Ala Leu Tyr Asn Gly Val Leu Arg Asp
355 360 365


Leu Glu Lys Ala Arg Gln Phe Ala Thr Phe Thr Leu Pro Asp Ala Cys
370 375 380


Val Asn Pro Ile Trp Thr Arg Phe Glu Ser Ser Gln Gly Ser Asn Leu
385 390 395 400


His Lys Tyr Glu Phe Leu Phe Asp His Leu Gly Pro Gly Arg His Ala
405 410 415


Val Arg Phe Gln Arg Leu Leu Val Val Glu Ser Glu Gly Ala Lys Glu
420 425 430


Arg Asp Ser Val Val Val Pro Val Ala Pro Ser Gly Gln Leu Asp Lys
435 440 445


Leu Val Leu Arg Glu Glu Glu Lys Ser Ser Val Ala Leu His Leu His
450 455 460


Asp Thr Ala Arg Pro Asp Gly Phe Met Ala Glu Trp Ala Gly Ala Lys
465 470 475 480


Leu Gln Tyr Glu Arg Ser Thr Leu Ala Arg Lys Ala Arg Arg Asp Lys
485 490 495


Gln Gly Met Arg Ser Trp Arg Arg Gln Pro Ser Met Leu Met Ser Ala
500 505 510


Ala Gln Met Leu Glu Asp Ala Lys Gln Ala Gly Asp Val Tyr Leu Asn
515 520 525


Ile Ser Val Arg Val Lys Ser Pro Ser Glu Val Arg Gly Gln Arg Arg
530 535 540


Pro Pro Tyr Ala Ala Leu Phe Arg Ile Asp Asp Lys Gln Arg Arg Val
545 550 555 560


Thr Val Asn Tyr Asn Lys Leu Ser Ala Tyr Leu Glu Glu His Pro Asp
565 570 575


Lys Gln Ile Pro Gly Ala Pro Gly Leu Leu Ser Gly Leu Arg Val Met
580 585 590


Ser Val Asp Leu Gly Leu Arg Thr Ser Ala Ser Ile Ser Val Phe Arg
595 600 605


Val Ala Lys Lys Glu Glu Val Glu Ala Leu Gly Asp Gly Arg Pro Pro
610 615 620


His Tyr Tyr Pro Ile His Gly Thr Asp Asp Leu Val Ala Val His Glu
625 630 635 640


Arg Ser His Leu Ile Gln Met Pro Gly Glu Thr Glu Thr Lys Gln Leu
645 650 655


Arg Lys Leu Arg Glu Glu Arg Gln Ala Val Leu Arg Pro Leu Phe Ala
660 665 670


Gln Leu Ala Leu Leu Arg Leu Leu Val Arg Cys Gly Ala Ala Asp Glu
675 680 685


Arg Ile Arg Thr Arg Ser Trp Gln Arg Leu Thr Lys Gln Gly Arg Glu
690 695 700


Phe Thr Lys Arg Leu Thr Pro Ser Trp Arg Glu Ala Leu Glu Leu Glu
705 710 715 720


Leu Thr Arg Leu Glu Ala Tyr Cys Gly Arg Val Pro Asp Asp Glu Trp
725 730 735


Ser Arg Ile Val Asp Arg Thr Val Ile Ala Leu Trp Arg Arg Met Gly
740 745 750


Lys Gln Val Arg Asp Trp Arg Lys Gln Val Lys Ser Gly Ala Lys Val
755 760 765


Lys Val Lys Gly Tyr Gln Leu Asp Val Val Gly Gly Asn Ser Leu Ala
770 775 780


Gln Ile Asp Tyr Leu Glu Gln Gln Tyr Lys Phe Leu Arg Arg Trp Ser
785 790 795 800


Phe Phe Ala Arg Ala Ser Gly Leu Val Val Arg Ala Asp Arg Glu Ser
805 810 815


His Phe Ala Val Ala Leu Arg Gln His Ile Glu Asn Ala Lys Arg Asp
820 825 830


Arg Leu Lys Lys Leu Ala Asp Arg Ile Leu Met Glu Ala Leu Gly Tyr
835 840 845


Val Tyr Glu Ala Ser Gly Pro Arg Glu Gly Gln Trp Thr Ala Gln His
850 855 860


Pro Pro Cys Gln Leu Ile Ile Leu Glu Glu Leu Ser Ala Tyr Arg Phe
865 870 875 880


Ser Asp Asp Arg Pro Pro Ser Glu Asn Ser Lys Leu Met Ala Trp Gly
885 890 895


His Arg Gly Ile Leu Glu Glu Leu Val Asn Gln Ala Gln Val His Asp
900 905 910


Val Leu Val Gly Thr Val Tyr Ala Ala Phe Ser Ser Arg Phe Asp Ala
915 920 925


Arg Thr Gly Ala Pro Gly Val Arg Cys Arg Arg Val Pro Ala Arg Phe
930 935 940


Val Gly Ala Thr Val Asp Asp Ser Leu Pro Leu Trp Leu Thr Glu Phe
945 950 955 960


Leu Asp Lys His Arg Leu Asp Lys Asn Leu Leu Arg Pro Asp Asp Val
965 970 975


Ile Pro Thr Gly Glu Gly Glu Phe Leu Val Ser Pro Cys Gly Glu Glu
980 985 990


Ala Ala Arg Val Arg Gln Val His Ala Asp Ile Asn Ala Ala Gln Asn
995 1000 1005


Leu Gln Arg Arg Leu Trp Gln Asn Phe Asp Ile Thr Glu Leu Arg
1010 1015 1020


Leu Arg Cys Asp Val Lys Met Gly Gly Glu Gly Thr Val Leu Val
1025 1030 1035


Pro Arg Val Asn Asn Ala Arg Ala Lys Gln Leu Phe Gly Lys Lys
1040 1045 1050


Val Leu Val Ser Gln Asp Gly Val Thr Phe Phe Glu Arg Ser Gln
1055 1060 1065


Thr Gly Gly Lys Pro His Ser Glu Lys Gln Thr Asp Leu Thr Asp
1070 1075 1080


Lys Glu Leu Glu Leu Ile Ala Glu Ala Asp Glu Ala Arg Ala Lys
1085 1090 1095


Ser Val Val Leu Phe Arg Asp Pro Ser Gly His Ile Gly Lys Gly
1100 1105 1110


His Trp Ile Arg Gln Arg Glu Phe Trp Ser Leu Val Lys Gln Arg
1115 1120 1125


Ile Glu Ser His Thr Ala Glu Arg Ile Arg Val Arg Gly Val Gly
1130 1135 1140


Ser Ser Leu Asp
1145


<210> 390
<211> 1112
<212> PRT
<213> Bacillus species

<400> 390

Met Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr
1 5 10 15


Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln
35 40 45


Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile
50 55 60


Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His
65 70 75 80


Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu
85 90 95


Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly
100 105 110


Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys
115 120 125


Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu
130 135 140


Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg
145 150 155 160


Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr
165 170 175


Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile
180 185 190


Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys
195 200 205


Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp
210 215 220


Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu
225 230 235 240


Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys
245 250 255


Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala
260 265 270


Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly
275 280 285


Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser
290 295 300


Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser
305 310 315 320


Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu
325 330 335


Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala
340 345 350


Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala
355 360 365


Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr
370 375 380


Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys
385 390 395 400


Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser
405 410 415


Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro
420 425 430


Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly
435 440 445


Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp
450 455 460


Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys
465 470 475 480


Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe
485 490 495


Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg
500 505 510


Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe
515 520 525


Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn
530 535 540


Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly
545 550 555 560


Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val
565 570 575


Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys
580 585 590


Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg
595 600 605


Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys
610 615 620


Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln
625 630 635 640


Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro
645 650 655


Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser
660 665 670


Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu
675 680 685


Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu
690 695 700


Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile
705 710 715 720


Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala
725 730 735


Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu
740 745 750


Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg
755 760 765


Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln
770 775 780


Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met
785 790 795 800


Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys
805 810 815


Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn
820 825 830


Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser
835 840 845


Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met
850 855 860


Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr
865 870 875 880


Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His
885 890 895


Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg
900 905 910


Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys
915 920 925


Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu
930 935 940


Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile
945 950 955 960


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln
965 970 975


Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly
980 985 990


Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys Lys
995 1000 1005


Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln Glu
1010 1015 1020


Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr Asp
1025 1030 1035


Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile Ser
1040 1045 1050


Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu Thr
1055 1060 1065


Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr Trp
1070 1075 1080


Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile Lys
1085 1090 1095


Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu
1100 1105 1110


<210> 391
<211> 1326
<212> PRT
<213> Unknown

<220>
<223> Lentisphaeria bacterium

<400> 391

Met Ala Val Glu Leu Asn Arg Ile Tyr Gln Gly Arg Val Asn His Val
1 5 10 15


Tyr Ile Phe Asp Glu Asn Gln Asn Gln Val Ser Val Asp Asn Gly Asp
20 25 30


Asp Leu Leu Phe Val His His Glu Leu Tyr Gln Asp Ala Ile Asn Tyr
35 40 45


Tyr Leu Val Ala Leu Ala Ala Met Ala Leu Asp Ser Lys Asp Ser Leu
50 55 60


Phe Gly Lys Phe Lys Met Gln Ile Arg Ala Val Trp Asn Asp Phe Tyr
65 70 75 80


Arg Asn Gly Gln Leu Arg Pro Gly Leu Lys His Ser Leu Ile Arg Ser
85 90 95


Leu Gly His Ala Ala Glu Leu Asn Thr Ser Asn Gly Ala Asp Ile Ala
100 105 110


Met Asn Leu Ile Leu Glu Asp Gly Gly Ile Pro Ser Glu Ile Leu Asn
115 120 125


Ala Ala Leu Glu His Leu Ala Glu Lys Cys Thr Gly Asp Val Ser Gln
130 135 140


Leu Gly Lys Thr Phe Phe Pro Arg Phe Cys Asp Thr Ala Tyr His Gly
145 150 155 160


Asn Trp Asp Val Asp Ala Lys Ser Phe Ser Glu Lys Lys Gly Arg Gln
165 170 175


Arg Leu Val Asp Ala Leu Tyr Ser Leu His Pro Val Gln Ala Val Gln
180 185 190


Glu Leu Ala Pro Glu Ile Glu Ile Gly Trp Gly Gly Val Lys Thr Gln
195 200 205


Thr Gly Lys Phe Phe Thr Gly Asp Glu Ala Lys Ala Ser Leu Lys Lys
210 215 220


Ala Ile Ser Tyr Phe Leu Gln Asp Thr Gly Lys Asn Ser Pro Glu Leu
225 230 235 240


Gln Glu Tyr Phe Ser Val Ala Gly Lys Gln Pro Leu Glu Gln Tyr Leu
245 250 255


Gly Lys Ile Asp Thr Phe Pro Glu Ile Ser Phe Gly Arg Ile Ser Ser
260 265 270


His Gln Asn Ile Asn Ile Ser Asn Ala Met Trp Ile Leu Lys Phe Phe
275 280 285


Pro Asp Gln Tyr Ser Val Asp Leu Ile Lys Asn Leu Ile Pro Asn Lys
290 295 300


Lys Tyr Glu Ile Gly Ile Ala Pro Gln Trp Gly Asp Asp Pro Val Lys
305 310 315 320


Leu Ser Arg Gly Lys Arg Gly Tyr Thr Phe Arg Ala Phe Thr Asp Leu
325 330 335


Ala Met Trp Glu Lys Asn Trp Lys Val Phe Asp Arg Ala Ala Phe Ser
340 345 350


Asp Ala Leu Lys Thr Ile Asn Gln Phe Arg Asn Lys Thr Gln Glu Arg
355 360 365


Asn Asp Gln Leu Lys Arg Tyr Cys Ala Ala Leu Asn Trp Met Asp Gly
370 375 380


Glu Ser Ser Asp Lys Lys Pro Pro Val Glu Pro Ala Asp Ala Asp Ala
385 390 395 400


Val Asp Glu Ala Ala Thr Ser Val Leu Pro Ile Leu Ala Gly Asp Lys
405 410 415


Arg Trp Asn Ala Leu Leu Gln Leu Gln Lys Glu Leu Gly Ile Cys Asn
420 425 430


Asp Phe Thr Glu Asn Glu Leu Met Asp Tyr Gly Leu Ser Leu Arg Thr
435 440 445


Ile Arg Gly Tyr Gln Lys Leu Arg Ser Met Met Leu Glu Lys Glu Glu
450 455 460


Lys Met Arg Ala Lys Thr Ala Asp Asp Glu Glu Ile Ser Gln Ala Leu
465 470 475 480


Gln Glu Ile Ile Ile Lys Phe Gln Ser Ser His Arg Asp Thr Ile Gly
485 490 495


Ser Val Ser Leu Phe Leu Lys Leu Ala Glu Pro Lys Tyr Phe Cys Val
500 505 510


Trp His Asp Ala Asp Lys Asn Gln Asn Phe Ala Ser Val Asp Met Val
515 520 525


Ala Asp Ala Val Arg Tyr Tyr Ser Tyr Gln Glu Glu Lys Ala Arg Leu
530 535 540


Glu Glu Pro Ile Gln Ile Thr Pro Ala Asp Ala Arg Tyr Ser Arg Arg
545 550 555 560


Val Ser Asp Leu Tyr Ala Leu Val Tyr Lys Asn Ala Lys Glu Cys Lys
565 570 575


Thr Gly Tyr Gly Leu Arg Pro Asp Gly Asn Phe Val Phe Glu Ile Ala
580 585 590


Gln Lys Asn Ala Lys Gly Tyr Ala Pro Ala Lys Val Val Leu Ala Phe
595 600 605


Ser Ala Pro Arg Leu Lys Arg Asp Gly Leu Ile Asp Lys Glu Phe Ser
610 615 620


Ala Tyr Tyr Pro Pro Val Leu Gln Ala Phe Leu Arg Glu Glu Glu Ala
625 630 635 640


Pro Lys Gln Ser Phe Lys Thr Thr Ala Val Ile Leu Met Pro Asp Trp
645 650 655


Asp Lys Asn Gly Lys Arg Arg Ile Leu Leu Asn Phe Pro Ile Lys Leu
660 665 670


Asp Val Ser Ala Ile His Gln Lys Thr Asp His Arg Phe Glu Asn Gln
675 680 685


Phe Tyr Phe Ala Asn Asn Thr Asn Thr Cys Leu Leu Trp Pro Ser Tyr
690 695 700


Gln Tyr Lys Lys Pro Val Thr Trp Tyr Gln Gly Lys Lys Pro Phe Asp
705 710 715 720


Val Val Ala Val Asp Leu Gly Gln Arg Ser Ala Gly Ala Val Ser Arg
725 730 735


Ile Thr Val Ser Thr Glu Lys Arg Glu His Ser Val Ala Ile Gly Glu
740 745 750


Ala Gly Gly Thr Gln Trp Tyr Ala Tyr Arg Lys Phe Ser Gly Leu Leu
755 760 765


Arg Leu Pro Gly Glu Asp Ala Thr Val Ile Arg Asp Gly Gln Arg Thr
770 775 780


Glu Glu Leu Ser Gly Asn Ala Gly Arg Leu Ser Thr Glu Glu Glu Thr
785 790 795 800


Val Gln Ala Cys Val Leu Cys Lys Met Leu Ile Gly Asp Ala Thr Leu
805 810 815


Leu Gly Gly Ser Asp Glu Lys Thr Ile Arg Ser Phe Pro Lys Gln Asn
820 825 830


Asp Lys Leu Leu Ile Ala Phe Arg Arg Ala Thr Gly Arg Met Lys Gln
835 840 845


Leu Gln Arg Trp Leu Trp Met Leu Asn Glu Asn Gly Leu Cys Asp Lys
850 855 860


Ala Lys Thr Glu Ile Ser Asn Ser Asp Trp Leu Val Asn Lys Asn Ile
865 870 875 880


Asp Asn Val Leu Lys Glu Glu Lys Gln His Arg Glu Met Leu Pro Ala
885 890 895


Ile Leu Leu Gln Ile Ala Asp Arg Val Leu Pro Leu Arg Gly Arg Lys
900 905 910


Trp Asp Trp Val Leu Asn Pro Gln Ser Asn Ser Phe Val Leu Gln Gln
915 920 925


Thr Ala His Gly Ser Gly Asp Pro His Lys Lys Ile Cys Gly Gln Arg
930 935 940


Gly Leu Ser Phe Ala Arg Ile Glu Gln Leu Glu Ser Leu Arg Met Arg
945 950 955 960


Cys Gln Ala Leu Asn Arg Ile Leu Met Arg Lys Thr Gly Glu Lys Pro
965 970 975


Ala Thr Leu Ala Glu Met Arg Asn Asn Pro Ile Pro Asp Cys Cys Pro
980 985 990


Asp Ile Leu Met Arg Leu Asp Ala Met Lys Glu Gln Arg Ile Asn Gln
995 1000 1005


Thr Ala Asn Leu Ile Leu Ala Gln Ala Leu Gly Leu Arg His Cys
1010 1015 1020


Leu His Ser Glu Ser Ala Thr Lys Arg Lys Glu Asn Gly Met His
1025 1030 1035


Gly Glu Tyr Glu Lys Ile Pro Gly Val Glu Pro Ala Ala Phe Val
1040 1045 1050


Val Leu Glu Asp Leu Ser Arg Tyr Arg Phe Ser Gln Asp Arg Ser
1055 1060 1065


Ser Tyr Glu Asn Ser Arg Leu Met Lys Trp Ser His Arg Lys Ile
1070 1075 1080


Leu Glu Lys Leu Ala Leu Leu Cys Glu Val Phe Asn Val Pro Ile
1085 1090 1095


Leu Gln Val Gly Ala Ala Tyr Ser Ser Lys Phe Ser Ala Asn Ala
1100 1105 1110


Ile Pro Gly Phe Arg Ala Glu Glu Cys Ser Ile Asp Gln Leu Ser
1115 1120 1125


Phe Tyr Pro Trp Arg Glu Leu Lys Asp Ser Arg Glu Lys Ala Leu
1130 1135 1140


Val Glu Gln Ile Arg Lys Ile Gly His Arg Leu Leu Thr Phe Asp
1145 1150 1155


Ala Lys Ala Thr Ile Ile Met Pro Arg Asn Gly Gly Pro Val Phe
1160 1165 1170


Ile Pro Phe Val Pro Ser Asp Ser Lys Asp Thr Leu Ile Gln Ala
1175 1180 1185


Asp Ile Asn Ala Ser Phe Asn Ile Gly Leu Arg Gly Val Ala Asp
1190 1195 1200


Ala Thr Asn Leu Leu Cys Asn Asn Arg Val Ser Cys Asp Arg Lys
1205 1210 1215


Lys Asp Cys Trp Gln Val Lys Arg Ser Ser Asn Phe Ser Lys Met
1220 1225 1230


Val Tyr Pro Glu Lys Leu Ser Leu Ser Phe Asp Pro Ile Lys Lys
1235 1240 1245


Gln Glu Gly Ala Gly Gly Asn Phe Phe Val Leu Gly Cys Ser Glu
1250 1255 1260


Arg Ile Leu Thr Gly Thr Ser Glu Lys Ser Pro Val Phe Thr Ser
1265 1270 1275


Ser Glu Met Ala Lys Lys Tyr Pro Asn Leu Met Phe Gly Ser Ala
1280 1285 1290


Leu Trp Arg Asn Glu Ile Leu Lys Leu Glu Arg Cys Cys Lys Ile
1295 1300 1305


Asn Gln Ser Arg Leu Asp Lys Phe Ile Ala Lys Lys Glu Val Gln
1310 1315 1320


Asn Glu Leu
1325


<210> 392
<211> 1090
<212> PRT
<213> Laceyella sediminis

<400> 392

Met Ser Ile Arg Ser Phe Lys Leu Lys Ile Lys Thr Lys Ser Gly Val
1 5 10 15


Asn Ala Glu Glu Leu Arg Arg Gly Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Asp Gly Ile Ala Tyr Tyr Met Asn Trp Leu Val Leu Leu Arg Gln
35 40 45


Glu Asp Leu Phe Ile Arg Asn Glu Glu Thr Asn Glu Ile Glu Lys Arg
50 55 60


Ser Lys Glu Glu Ile Gln Gly Glu Leu Leu Glu Arg Val His Lys Gln
65 70 75 80


Gln Gln Arg Asn Gln Trp Ser Gly Glu Val Asp Asp Gln Thr Leu Leu
85 90 95


Gln Thr Leu Arg His Leu Tyr Glu Glu Ile Val Pro Ser Val Ile Gly
100 105 110


Lys Ser Gly Asn Ala Ser Leu Lys Ala Arg Phe Phe Leu Gly Pro Leu
115 120 125


Val Asp Pro Asn Asn Lys Thr Thr Lys Asp Val Ser Lys Ser Gly Pro
130 135 140


Thr Pro Lys Trp Lys Lys Met Lys Asp Ala Gly Asp Pro Asn Trp Val
145 150 155 160


Gln Glu Tyr Glu Lys Tyr Met Ala Glu Arg Gln Thr Leu Val Arg Leu
165 170 175


Glu Glu Met Gly Leu Ile Pro Leu Phe Pro Met Tyr Thr Asp Glu Val
180 185 190


Gly Asp Ile His Trp Leu Pro Gln Ala Ser Gly Tyr Thr Arg Thr Trp
195 200 205


Asp Arg Asp Met Phe Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220


Ser Trp Asn Arg Arg Val Arg Glu Arg Arg Ala Gln Phe Glu Lys Lys
225 230 235 240


Thr His Asp Phe Ala Ser Arg Phe Ser Glu Ser Asp Val Gln Trp Met
245 250 255


Asn Lys Leu Arg Glu Tyr Glu Ala Gln Gln Glu Lys Ser Leu Glu Glu
260 265 270


Asn Ala Phe Ala Pro Asn Glu Pro Tyr Ala Leu Thr Lys Lys Ala Leu
275 280 285


Arg Gly Trp Glu Arg Val Tyr His Ser Trp Met Arg Leu Asp Ser Ala
290 295 300


Ala Ser Glu Glu Ala Tyr Trp Gln Glu Val Ala Thr Cys Gln Thr Ala
305 310 315 320


Met Arg Gly Glu Phe Gly Asp Pro Ala Ile Tyr Gln Phe Leu Ala Gln
325 330 335


Lys Glu Asn His Asp Ile Trp Arg Gly Tyr Pro Glu Arg Val Ile Asp
340 345 350


Phe Ala Glu Leu Asn His Leu Gln Arg Glu Leu Arg Arg Ala Lys Glu
355 360 365


Asp Ala Thr Phe Thr Leu Pro Asp Ser Val Asp His Pro Leu Trp Val
370 375 380


Arg Tyr Glu Ala Pro Gly Gly Thr Asn Ile His Gly Tyr Asp Leu Val
385 390 395 400


Gln Asp Thr Lys Arg Asn Leu Thr Leu Ile Leu Asp Lys Phe Ile Leu
405 410 415


Pro Asp Glu Asn Gly Ser Trp His Glu Val Lys Lys Val Pro Phe Ser
420 425 430


Leu Ala Lys Ser Lys Gln Phe His Arg Gln Val Trp Leu Gln Glu Glu
435 440 445


Gln Lys Gln Lys Lys Arg Glu Val Val Phe Tyr Asp Tyr Ser Thr Asn
450 455 460


Leu Pro His Leu Gly Thr Leu Ala Gly Ala Lys Leu Gln Trp Asp Arg
465 470 475 480


Asn Phe Leu Asn Lys Arg Thr Gln Gln Gln Ile Glu Glu Thr Gly Glu
485 490 495


Ile Gly Lys Val Phe Phe Asn Ile Ser Val Asp Val Arg Pro Ala Val
500 505 510


Glu Val Lys Asn Gly Arg Leu Gln Asn Gly Leu Gly Lys Ala Leu Thr
515 520 525


Val Leu Thr His Pro Asp Gly Thr Lys Ile Val Thr Gly Trp Lys Ala
530 535 540


Glu Gln Leu Glu Lys Trp Val Gly Glu Ser Gly Arg Val Ser Ser Leu
545 550 555 560


Gly Leu Asp Ser Leu Ser Glu Gly Leu Arg Val Met Ser Ile Asp Leu
565 570 575


Gly Gln Arg Thr Ser Ala Thr Val Ser Val Phe Glu Ile Thr Lys Glu
580 585 590


Ala Pro Asp Asn Pro Tyr Lys Phe Phe Tyr Gln Leu Glu Gly Thr Glu
595 600 605


Leu Phe Ala Val His Gln Arg Ser Phe Leu Leu Ala Leu Pro Gly Glu
610 615 620


Asn Pro Pro Gln Lys Ile Lys Gln Met Arg Glu Ile Arg Trp Lys Glu
625 630 635 640


Arg Asn Arg Ile Lys Gln Gln Val Asp Gln Leu Ser Ala Ile Leu Arg
645 650 655


Leu His Lys Lys Val Asn Glu Asp Glu Arg Ile Gln Ala Ile Asp Lys
660 665 670


Leu Leu Gln Lys Val Ala Ser Trp Gln Leu Asn Glu Glu Ile Ala Thr
675 680 685


Ala Trp Asn Gln Ala Leu Ser Gln Leu Tyr Ser Lys Ala Lys Glu Asn
690 695 700


Asp Leu Gln Trp Asn Gln Ala Ile Lys Asn Ala His His Gln Leu Glu
705 710 715 720


Pro Val Val Gly Lys Gln Ile Ser Leu Trp Arg Lys Asp Leu Ser Thr
725 730 735


Gly Arg Gln Gly Ile Ala Gly Leu Ser Leu Trp Ser Ile Glu Glu Leu
740 745 750


Glu Ala Thr Lys Lys Leu Leu Thr Arg Trp Ser Lys Arg Ser Arg Glu
755 760 765


Pro Gly Val Val Lys Arg Ile Glu Arg Phe Glu Thr Phe Ala Lys Gln
770 775 780


Ile Gln His His Ile Asn Gln Val Lys Glu Asn Arg Leu Lys Gln Leu
785 790 795 800


Ala Asn Leu Ile Val Met Thr Ala Leu Gly Tyr Lys Tyr Asp Gln Glu
805 810 815


Gln Lys Lys Trp Ile Glu Val Tyr Pro Ala Cys Gln Val Val Leu Phe
820 825 830


Glu Asn Leu Arg Ser Tyr Arg Phe Ser Tyr Glu Arg Ser Arg Arg Glu
835 840 845


Asn Lys Lys Leu Met Glu Trp Ser His Arg Ser Ile Pro Lys Leu Val
850 855 860


Gln Met Gln Gly Glu Leu Phe Gly Leu Gln Val Ala Asp Val Tyr Ala
865 870 875 880


Ala Tyr Ser Ser Arg Tyr His Gly Arg Thr Gly Ala Pro Gly Ile Arg
885 890 895


Cys His Ala Leu Thr Glu Ala Asp Leu Arg Asn Glu Thr Asn Ile Ile
900 905 910


His Glu Leu Ile Glu Ala Gly Phe Ile Lys Glu Glu His Arg Pro Tyr
915 920 925


Leu Gln Gln Gly Asp Leu Val Pro Trp Ser Gly Gly Glu Leu Phe Ala
930 935 940


Thr Leu Gln Lys Pro Tyr Asp Asn Pro Arg Ile Leu Thr Leu His Ala
945 950 955 960


Asp Ile Asn Ala Ala Gln Asn Ile Gln Lys Arg Phe Trp His Pro Ser
965 970 975


Met Trp Phe Arg Val Asn Cys Glu Ser Val Met Glu Gly Glu Ile Val
980 985 990


Thr Tyr Val Pro Lys Asn Lys Thr Val His Lys Lys Gln Gly Lys Thr
995 1000 1005


Phe Arg Phe Val Lys Val Glu Gly Ser Asp Val Tyr Glu Trp Ala
1010 1015 1020


Lys Trp Ser Lys Asn Arg Asn Lys Asn Thr Phe Ser Ser Ile Thr
1025 1030 1035


Glu Arg Lys Pro Pro Ser Ser Met Ile Leu Phe Arg Asp Pro Ser
1040 1045 1050


Gly Thr Phe Phe Lys Glu Gln Glu Trp Val Glu Gln Lys Thr Phe
1055 1060 1065


Trp Gly Lys Val Gln Ser Met Ile Gln Ala Tyr Met Lys Lys Thr
1070 1075 1080


Ile Val Gln Arg Met Glu Glu
1085 1090


<210> 393
<211> 15
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 393

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15


<210> 394
<211> 30
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 394

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30


<210> 395
<211> 45
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 395

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30


Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45


<210> 396
<211> 60
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 396

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30


Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45


Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
50 55 60


<210> 397
<211> 12
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 397
acttgtttaa gt 12


<210> 398
<211> 12
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(4)
<223> n = any nucleotide that is complementary to nnnn at positions
9-12

<220>
<221> misc_feature
<222> (9)..(12)
<223> n = any nucleotide that is complementary to nnnn at positions 1-4

<400> 398
nnnngtttnn nn 12


<210> 399
<211> 16
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 399
ggcaccgagt cggtgc 16


<210> 400
<211> 17
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(7)
<223> n = any nucleotide that is complementary to nnnnnnn at positions
11 to 17

<220>
<221> misc_feature
<222> (11)..(17)
<223> n = any nucleotide that is complementary to nnnnnnn at positions
1 to 7

<400> 400
nnnnnnnagt nnnnnnn 17


<210> 401
<211> 30
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (2)..(5)
<223> y = t/u or c

<220>
<221> misc_feature
<222> (8)..(20)
<223> n = any nucleotide

<220>
<221> misc_feature
<222> (8)..(8)
<223> n= bulge in a duplex

<220>
<221> misc_feature
<222> (21)..(23)
<223> n= bulge in a duplex

<220>
<221> misc_feature
<222> (23)..(23)
<223> n = any nucleotide

<220>
<221> misc_feature
<222> (26)..(29)
<223> r = g or a

<400> 401
gyyyyagnnn nnnnnnnnnn aanuurrrru 30


<210> 402
<211> 4
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 402

Gly Gly Gly Ser
1


<210> 403
<211> 5
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 403

Gly Gly Gly Gly Ser
1 5


<210> 404
<211> 9
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 404

Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5


<210> 405
<211> 25
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 405

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25


<210> 406
<211> 35
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 406

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30


Gly Gly Ser
35


<210> 407
<211> 10
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 407

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10


<210> 408
<211> 20
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 408

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser
20


<210> 409
<211> 40
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 409

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30


Gly Gly Ser Gly Gly Gly Gly Ser
35 40


<210> 410
<211> 50
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 410

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30


Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45


Gly Ser
50


<210> 411
<211> 55
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 411

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15


Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30


Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45


Gly Ser Gly Gly Gly Gly Ser
50 55


<210> 412
<211> 32
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 412

Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15


Phe Ser Gln Ser Gly Ala Leu Thr Arg His Gln Arg Thr His Thr Arg
20 25 30


<210> 413
<211> 20
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 413

Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Ser Pro Lys Lys Arg Lys
1 5 10 15


Val Glu Ala Ser
20


<210> 414
<211> 9
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 414
ggtggtagt 9


<210> 415
<211> 27
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 415
ggtggtagtg gagggagcgg cggttca 27


<210> 416
<211> 72
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 416
ggtggaggag gctctggtgg aggcggtagc ggaggcggag ggtcgggtgg tagtggaggg 60

agcggcggtt ca 72


<210> 417
<211> 48
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 417
tcgggatctg agacgcctgg gacctcggaa tcggctacgc ccgaaagt 48


<210> 418
<211> 192
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 418
gtggataaca aatttaacaa agaaatgtgg gcggcgtggg aagaaattcg taacctgccg 60

aacctgaacg gctggcagat gaccgcgttt attgcgagcc tggtggatga tccgagccag 120

agcgcgaacc tgctggcgga agcgaaaaaa ctgaacgatg cgcaggcgcc gaaaaccggc 180

ggtggttctg gt 192


<210> 419
<211> 108
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 419
ggtggttctg ccggtggctc cggttctggc tccagcggtg gcagctctgg tgcgtccggc 60

acgggtactg cgggtggcac tggcagcggt tccggtactg gctctggc 108


<210> 420
<211> 284
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 420

Gly Phe Gly Asp Val Gly Ala Leu Glu Ser Leu Arg Gly Asn Ala Asp
1 5 10 15


Leu Ala Tyr Ile Leu Ser Met Glu Pro Cys Gly His Cys Leu Ile Ile
20 25 30


Asn Asn Val Asn Phe Cys Arg Glu Ser Gly Leu Arg Thr Arg Thr Gly
35 40 45


Ser Asn Ile Asp Cys Glu Lys Leu Arg Arg Arg Phe Ser Ser Leu His
50 55 60


Phe Met Val Glu Val Lys Gly Asp Leu Thr Ala Lys Lys Met Val Leu
65 70 75 80


Ala Leu Leu Glu Leu Ala Arg Gln Asp His Gly Ala Leu Asp Cys Cys
85 90 95


Val Val Val Ile Leu Ser His Gly Cys Gln Ala Ser His Leu Gln Phe
100 105 110


Pro Gly Ala Val Tyr Gly Thr Asp Gly Cys Pro Val Ser Val Glu Lys
115 120 125


Ile Val Asn Ile Phe Asn Gly Thr Ser Cys Pro Ser Leu Gly Gly Lys
130 135 140


Pro Lys Leu Phe Phe Ile Gln Ala Cys Gly Gly Glu Gln Lys Asp His
145 150 155 160


Gly Phe Glu Val Ala Ser Thr Ser Pro Glu Asp Glu Ser Pro Gly Ser
165 170 175


Asn Pro Glu Pro Asp Ala Thr Pro Phe Gln Glu Gly Leu Arg Thr Phe
180 185 190


Asp Gln Leu Asp Ala Ile Ser Ser Leu Pro Thr Pro Ser Asp Ile Phe
195 200 205


Val Ser Tyr Ser Thr Phe Pro Gly Phe Val Ser Trp Arg Asp Pro Lys
210 215 220


Ser Gly Ser Trp Tyr Val Glu Thr Leu Asp Asp Ile Phe Glu Gln Trp
225 230 235 240


Ala His Ser Glu Asp Leu Gln Ser Leu Leu Leu Arg Val Ala Asn Ala
245 250 255


Val Ser Val Lys Gly Ile Tyr Lys Gln Met Pro Gly Cys Phe Asn Phe
260 265 270


Leu Arg Lys Lys Leu Phe Phe Lys Thr Ser Val Asp
275 280


<210> 421
<211> 263
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 421

Ser Glu Ser Gln Thr Leu Asp Lys Val Tyr Gln Met Lys Ser Lys Pro
1 5 10 15


Arg Gly Tyr Cys Leu Ile Ile Asn Asn His Asn Phe Ala Lys Ala Arg
20 25 30


Glu Lys Val Pro Lys Leu His Ser Ile Arg Asp Arg Asn Gly Thr His
35 40 45


Leu Asp Ala Gly Ala Leu Thr Thr Thr Phe Glu Glu Leu His Phe Glu
50 55 60


Ile Lys Pro His Asp Asp Cys Thr Val Glu Gln Ile Tyr Glu Ile Leu
65 70 75 80


Lys Ile Tyr Gln Leu Met Asp His Ser Asn Met Asp Cys Phe Ile Cys
85 90 95


Cys Ile Leu Ser His Gly Asp Lys Gly Ile Ile Tyr Gly Thr Asp Gly
100 105 110


Gln Glu Ala Pro Ile Tyr Glu Leu Thr Ser Gln Phe Thr Gly Leu Lys
115 120 125


Cys Pro Ser Leu Ala Gly Lys Pro Lys Val Phe Phe Ile Gln Ala Cys
130 135 140


Gln Gly Asp Asn Tyr Gln Lys Gly Ile Pro Val Glu Thr Asp Ser Glu
145 150 155 160


Glu Gln Pro Tyr Leu Glu Met Asp Leu Ser Ser Pro Gln Thr Arg Tyr
165 170 175


Ile Pro Asp Glu Ala Asp Phe Leu Leu Gly Met Ala Thr Val Asn Asn
180 185 190


Cys Val Ser Tyr Arg Asn Pro Ala Glu Gly Thr Trp Tyr Ile Gln Ser
195 200 205


Leu Cys Gln Ser Leu Arg Glu Arg Cys Pro Arg Gly Asp Asp Ile Leu
210 215 220


Thr Ile Leu Thr Glu Val Asn Tyr Glu Val Ser Asn Lys Asp Asp Lys
225 230 235 240


Lys Asn Met Gly Lys Gln Met Pro Gln Pro Thr Phe Thr Leu Arg Lys
245 250 255


Lys Leu Val Phe Pro Ser Asp
260


<210> 422
<211> 147
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 422

Ser Gly Ile Ser Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met
1 5 10 15


Gly Leu Cys Ile Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly
20 25 30


Met Thr Ser Arg Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu
35 40 45


Thr Phe Arg Asn Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr
50 55 60


Arg Glu Glu Ile Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His
65 70 75 80


Ser Lys Arg Ser Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu
85 90 95


Gly Ile Ile Phe Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr
100 105 110


Asn Phe Phe Arg Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys
115 120 125


Leu Phe Ile Ile Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile
130 135 140


Glu Thr Asp
145


<210> 423
<211> 118
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 423

Gly Glu Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser
1 5 10 15


Thr Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu
20 25 30


Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe
35 40 45


Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe
50 55 60


Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg
65 70 75 80


Asp Met Ile Ile Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln
85 90 95


Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val
100 105 110


Thr Thr Asn Phe Gln Thr
115


<210> 424
<211> 101
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 424

Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser
1 5 10 15


Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly Gln
20 25 30


Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile
35 40 45


His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val
50 55 60


Pro Lys Asn Phe Met Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp
65 70 75 80


Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His
85 90 95


Lys Val Phe Met Val
100


<210> 425
<211> 939
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 425

Ala Thr Gly Gly Cys Ala Gly Ala Thr Gly Ala Thr Cys Ala Gly Gly
1 5 10 15


Gly Cys Thr Gly Thr Ala Thr Thr Gly Ala Ala Gly Ala Gly Cys Ala
20 25 30


Gly Gly Gly Gly Gly Thr Thr Gly Ala Gly Gly Ala Thr Thr Cys Ala
35 40 45


Gly Cys Ala Ala Ala Thr Gly Ala Ala Gly Ala Thr Thr Cys Ala Gly
50 55 60


Thr Gly Gly Ala Ala Ala Ala Thr Cys Thr Cys Thr Ala Cys Thr Thr
65 70 75 80


Cys Cys Ala Gly Gly Cys Thr Ala Ala Gly Cys Cys Ala Gly Ala Cys
85 90 95


Cys Gly Gly Thr Cys Cys Thr Cys Gly Thr Thr Thr Gly Thr Ala Cys
100 105 110


Cys Gly Thr Cys Cys Cys Thr Cys Thr Thr Cys Ala Gly Thr Ala Ala
115 120 125


Gly Ala Ala Gly Ala Ala Gly Ala Ala Ala Ala Ala Thr Gly Thr Cys
130 135 140


Ala Cys Cys Ala Thr Gly Cys Gly Ala Thr Cys Cys Ala Thr Cys Ala
145 150 155 160


Ala Gly Ala Cys Cys Ala Cys Cys Cys Gly Gly Gly Ala Cys Cys Gly
165 170 175


Ala Gly Thr Gly Cys Cys Thr Ala Cys Ala Thr Ala Thr Cys Ala Gly
180 185 190


Thr Ala Cys Ala Ala Cys Ala Thr Gly Ala Ala Thr Thr Thr Thr Gly
195 200 205


Ala Ala Ala Ala Gly Cys Thr Gly Gly Gly Cys Ala Ala Ala Thr Gly
210 215 220


Cys Ala Thr Cys Ala Thr Ala Ala Thr Ala Ala Ala Cys Ala Ala Cys
225 230 235 240


Ala Ala Gly Ala Ala Cys Thr Thr Thr Gly Ala Thr Ala Ala Ala Gly
245 250 255


Thr Gly Ala Cys Ala Gly Gly Thr Ala Thr Gly Gly Gly Cys Gly Thr
260 265 270


Thr Cys Gly Ala Ala Ala Cys Gly Gly Ala Ala Cys Ala Gly Ala Cys
275 280 285


Ala Ala Ala Gly Ala Thr Gly Cys Cys Gly Ala Gly Gly Cys Gly Cys
290 295 300


Thr Cys Thr Thr Cys Ala Ala Gly Thr Gly Cys Thr Thr Cys Cys Gly
305 310 315 320


Ala Ala Gly Cys Cys Thr Gly Gly Gly Thr Thr Thr Thr Gly Ala Cys
325 330 335


Gly Thr Gly Ala Thr Thr Gly Thr Cys Thr Ala Thr Ala Ala Thr Gly
340 345 350


Ala Cys Thr Gly Cys Thr Cys Thr Thr Gly Thr Gly Cys Cys Ala Ala
355 360 365


Gly Ala Thr Gly Cys Ala Ala Gly Ala Thr Cys Thr Gly Cys Thr Thr
370 375 380


Ala Ala Ala Ala Ala Ala Gly Cys Thr Thr Cys Thr Gly Ala Ala Gly
385 390 395 400


Ala Gly Gly Ala Cys Cys Ala Thr Ala Cys Ala Ala Ala Thr Gly Cys
405 410 415


Cys Gly Cys Cys Thr Gly Cys Thr Thr Cys Gly Cys Cys Thr Gly Cys
420 425 430


Ala Thr Cys Cys Thr Cys Thr Thr Ala Ala Gly Cys Cys Ala Thr Gly
435 440 445


Gly Ala Gly Ala Ala Gly Ala Ala Ala Ala Thr Gly Thr Ala Ala Thr
450 455 460


Thr Thr Ala Thr Gly Gly Gly Ala Ala Ala Gly Ala Thr Gly Gly Thr
465 470 475 480


Gly Thr Cys Ala Cys Ala Cys Cys Ala Ala Thr Ala Ala Ala Gly Gly
485 490 495


Ala Thr Thr Thr Gly Ala Cys Ala Gly Cys Cys Cys Ala Cys Thr Thr
500 505 510


Thr Ala Gly Gly Gly Gly Gly Gly Ala Thr Ala Gly Ala Thr Gly Cys
515 520 525


Ala Ala Ala Ala Cys Cys Cys Thr Thr Thr Thr Ala Gly Ala Gly Ala
530 535 540


Ala Ala Cys Cys Cys Ala Ala Ala Cys Thr Cys Thr Thr Cys Thr Thr
545 550 555 560


Cys Ala Thr Thr Cys Ala Gly Gly Cys Thr Thr Gly Cys Cys Gly Ala
565 570 575


Gly Gly Gly Ala Cys Cys Gly Ala Gly Cys Thr Thr Gly Ala Thr Gly
580 585 590


Ala Thr Gly Gly Cys Ala Thr Cys Cys Ala Gly Gly Cys Cys Gly Ala
595 600 605


Ala Ala Ala Thr Cys Thr Cys Thr Ala Cys Thr Thr Cys Cys Ala Gly
610 615 620


Thr Cys Gly Gly Gly Gly Cys Cys Cys Ala Thr Cys Ala Ala Thr Gly
625 630 635 640


Ala Cys Ala Cys Ala Gly Ala Thr Gly Cys Thr Ala Ala Thr Cys Cys
645 650 655


Thr Cys Gly Ala Thr Ala Cys Ala Ala Gly Ala Thr Cys Cys Cys Ala
660 665 670


Gly Thr Gly Gly Ala Ala Gly Cys Thr Gly Ala Cys Thr Thr Cys Cys
675 680 685


Thr Cys Thr Thr Cys Gly Cys Cys Thr Ala Thr Thr Cys Cys Ala Cys
690 695 700


Gly Gly Thr Thr Cys Cys Ala Gly Gly Cys Thr Ala Thr Thr Ala Cys
705 710 715 720


Thr Cys Gly Thr Gly Gly Ala Gly Gly Ala Gly Cys Cys Cys Ala Gly
725 730 735


Gly Ala Ala Gly Ala Gly Gly Cys Thr Cys Cys Thr Gly Gly Thr Thr
740 745 750


Thr Gly Thr Gly Cys Ala Ala Gly Cys Cys Cys Thr Cys Thr Gly Cys
755 760 765


Thr Cys Cys Ala Thr Cys Cys Thr Gly Gly Ala Gly Gly Ala Gly Cys
770 775 780


Ala Cys Gly Gly Ala Ala Ala Ala Gly Ala Cys Cys Thr Gly Gly Ala
785 790 795 800


Ala Ala Thr Cys Ala Thr Gly Cys Ala Gly Ala Thr Cys Cys Thr Cys
805 810 815


Ala Cys Cys Ala Gly Gly Gly Thr Gly Ala Ala Thr Gly Ala Cys Ala
820 825 830


Gly Ala Gly Thr Thr Gly Cys Cys Ala Gly Gly Cys Ala Cys Thr Thr
835 840 845


Thr Gly Ala Gly Thr Cys Thr Cys Ala Gly Thr Cys Thr Gly Ala Thr
850 855 860


Gly Ala Cys Cys Cys Ala Cys Ala Cys Thr Thr Cys Cys Ala Thr Gly
865 870 875 880


Ala Gly Ala Ala Gly Ala Ala Gly Cys Ala Gly Ala Thr Cys Cys Cys
885 890 895


Cys Thr Gly Thr Gly Thr Gly Gly Thr Cys Thr Cys Cys Ala Thr Gly
900 905 910


Cys Thr Cys Ala Cys Cys Ala Ala Gly Gly Ala Ala Cys Thr Cys Thr
915 920 925


Ala Cys Thr Thr Cys Ala Gly Thr Cys Ala Ala
930 935


<210> 426
<211> 861
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 426

Ala Thr Gly Gly Ala Gly Ala Ala Cys Ala Cys Thr Gly Ala Ala Ala
1 5 10 15


Ala Cys Thr Cys Ala Gly Thr Gly Gly Ala Thr Thr Cys Ala Ala Ala
20 25 30


Ala Thr Cys Cys Ala Thr Thr Ala Ala Ala Ala Ala Thr Thr Thr Gly
35 40 45


Gly Ala Ala Cys Cys Ala Ala Ala Gly Ala Thr Cys Ala Thr Ala Cys
50 55 60


Ala Thr Gly Gly Ala Ala Gly Cys Gly Ala Ala Thr Cys Ala Ala Thr
65 70 75 80


Gly Gly Ala Ala Ala Ala Thr Cys Thr Cys Thr Ala Cys Thr Thr Cys
85 90 95


Cys Ala Gly Thr Cys Thr Gly Gly Ala Ala Thr Ala Thr Cys Cys Cys
100 105 110


Thr Gly Gly Ala Cys Ala Ala Cys Ala Gly Thr Thr Ala Thr Ala Ala
115 120 125


Ala Ala Thr Gly Gly Ala Thr Thr Ala Thr Cys Cys Thr Gly Ala Gly
130 135 140


Ala Thr Gly Gly Gly Thr Thr Thr Ala Thr Gly Thr Ala Thr Ala Ala
145 150 155 160


Thr Ala Ala Thr Thr Ala Ala Thr Ala Ala Thr Ala Ala Gly Ala Ala
165 170 175


Thr Thr Thr Thr Cys Ala Thr Ala Ala Ala Ala Gly Cys Ala Cys Thr
180 185 190


Gly Gly Ala Ala Thr Gly Ala Cys Ala Thr Cys Thr Cys Gly Gly Thr
195 200 205


Cys Thr Gly Gly Thr Ala Cys Ala Gly Ala Thr Gly Thr Cys Gly Ala
210 215 220


Thr Gly Cys Ala Gly Cys Ala Ala Ala Cys Cys Thr Cys Ala Gly Gly
225 230 235 240


Gly Ala Ala Ala Cys Ala Thr Thr Cys Ala Gly Ala Ala Ala Cys Thr
245 250 255


Thr Gly Ala Ala Ala Thr Ala Thr Gly Ala Ala Gly Thr Cys Ala Gly
260 265 270


Gly Ala Ala Thr Ala Ala Ala Ala Ala Thr Gly Ala Thr Cys Thr Thr
275 280 285


Ala Cys Ala Cys Gly Thr Gly Ala Ala Gly Ala Ala Ala Thr Thr Gly
290 295 300


Thr Gly Gly Ala Ala Thr Thr Gly Ala Thr Gly Cys Gly Thr Gly Ala
305 310 315 320


Thr Gly Thr Thr Thr Cys Thr Ala Ala Ala Gly Ala Ala Gly Ala Thr
325 330 335


Cys Ala Cys Ala Gly Cys Ala Ala Ala Ala Gly Gly Ala Gly Cys Ala
340 345 350


Gly Thr Thr Thr Thr Gly Thr Thr Thr Gly Thr Gly Thr Gly Cys Thr
355 360 365


Thr Cys Thr Gly Ala Gly Cys Cys Ala Thr Gly Gly Thr Gly Ala Ala
370 375 380


Gly Ala Ala Gly Gly Ala Ala Thr Ala Ala Thr Thr Thr Thr Thr Gly
385 390 395 400


Gly Ala Ala Cys Ala Ala Ala Thr Gly Gly Ala Cys Cys Thr Gly Thr
405 410 415


Thr Gly Ala Cys Cys Thr Gly Ala Ala Ala Ala Ala Ala Ala Thr Ala
420 425 430


Ala Cys Ala Ala Ala Cys Thr Thr Thr Thr Thr Cys Ala Gly Ala Gly
435 440 445


Gly Gly Gly Ala Thr Cys Gly Thr Thr Gly Thr Ala Gly Ala Ala Gly
450 455 460


Thr Cys Thr Ala Ala Cys Thr Gly Gly Ala Ala Ala Ala Cys Cys Cys
465 470 475 480


Ala Ala Ala Cys Thr Thr Thr Thr Cys Ala Thr Thr Ala Thr Thr Cys
485 490 495


Ala Gly Gly Cys Cys Thr Gly Cys Cys Gly Thr Gly Gly Thr Ala Cys
500 505 510


Ala Gly Ala Ala Cys Thr Gly Gly Ala Cys Thr Gly Thr Gly Gly Cys
515 520 525


Ala Thr Thr Gly Ala Gly Ala Cys Ala Gly Ala Ala Ala Ala Thr Cys
530 535 540


Thr Cys Thr Ala Cys Thr Thr Cys Cys Ala Gly Ala Gly Thr Gly Gly
545 550 555 560


Thr Gly Thr Thr Gly Ala Thr Gly Ala Thr Gly Ala Cys Ala Thr Gly
565 570 575


Gly Cys Gly Thr Gly Thr Cys Ala Thr Ala Ala Ala Ala Thr Ala Cys
580 585 590


Cys Ala Gly Thr Gly Gly Ala Gly Gly Cys Cys Gly Ala Cys Thr Thr
595 600 605


Cys Thr Thr Gly Thr Ala Thr Gly Cys Ala Thr Ala Cys Thr Cys Cys
610 615 620


Ala Cys Ala Gly Cys Ala Cys Cys Thr Gly Gly Thr Thr Ala Thr Thr
625 630 635 640


Ala Thr Thr Cys Thr Thr Gly Gly Cys Gly Ala Ala Ala Thr Thr Cys
645 650 655


Ala Ala Ala Gly Gly Ala Thr Gly Gly Cys Thr Cys Cys Thr Gly Gly
660 665 670


Thr Thr Cys Ala Thr Cys Cys Ala Gly Thr Cys Gly Cys Thr Thr Thr
675 680 685


Gly Thr Gly Cys Cys Ala Thr Gly Cys Thr Gly Ala Ala Ala Cys Ala
690 695 700


Gly Thr Ala Thr Gly Cys Cys Gly Ala Cys Ala Ala Gly Cys Thr Thr
705 710 715 720


Gly Ala Ala Thr Thr Thr Ala Thr Gly Cys Ala Cys Ala Thr Thr Cys
725 730 735


Thr Thr Ala Cys Cys Cys Gly Gly Gly Thr Thr Ala Ala Cys Cys Gly
740 745 750


Ala Ala Ala Gly Gly Thr Gly Gly Cys Ala Ala Cys Ala Gly Ala Ala
755 760 765


Thr Thr Thr Gly Ala Gly Thr Cys Cys Thr Thr Thr Thr Cys Cys Thr
770 775 780


Thr Thr Gly Ala Cys Gly Cys Thr Ala Cys Thr Thr Thr Thr Cys Ala
785 790 795 800


Thr Gly Cys Ala Ala Ala Gly Ala Ala Ala Cys Ala Gly Ala Thr Thr
805 810 815


Cys Cys Ala Thr Gly Thr Ala Thr Thr Gly Thr Thr Thr Cys Cys Ala
820 825 830


Thr Gly Cys Thr Cys Ala Cys Ala Ala Ala Ala Gly Ala Ala Cys Thr
835 840 845


Cys Thr Ala Thr Thr Thr Thr Thr Ala Thr Cys Ala Cys
850 855 860


<210> 427
<211> 164
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 427

Met Ala Glu Gly Ser Val Ala Arg Gln Pro Asp Leu Leu Thr Cys Asp
1 5 10 15


Asp Glu Pro Ile His Ile Pro Gly Ala Ile Gln Pro His Gly Leu Leu
20 25 30


Leu Ala Leu Ala Ala Asp Met Thr Ile Val Ala Gly Ser Asp Asn Leu
35 40 45


Pro Glu Leu Thr Gly Leu Ala Ile Gly Ala Leu Ile Gly Arg Ser Ala
50 55 60


Ala Asp Val Phe Asp Ser Glu Thr His Asn Arg Leu Thr Ile Ala Leu
65 70 75 80


Ala Glu Pro Gly Ala Ala Val Gly Ala Pro Ile Thr Val Gly Phe Thr
85 90 95


Met Arg Lys Asp Ala Gly Phe Ile Gly Ser Trp His Arg His Asp Gln
100 105 110


Leu Ile Phe Leu Glu Leu Glu Pro Pro Gln Arg Gly Gly Ser Glu Val
115 120 125


Ser Ala Leu Glu Lys Glu Val Ser Ala Leu Glu Lys Glu Val Ser Ala
130 135 140


Leu Glu Lys Glu Val Ser Ala Leu Glu Lys Glu Val Ser Ala Leu Glu
145 150 155 160


Lys Gly Gly Ser



<210> 428
<211> 239
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 428

Met Gly Gly Ser Lys Val Ser Ala Leu Lys Glu Lys Val Ser Ala Leu
1 5 10 15


Lys Glu Lys Val Ser Ala Leu Lys Glu Lys Val Ser Ala Leu Lys Glu
20 25 30


Lys Val Ser Ala Leu Lys Glu Gly Gly Ser Pro Pro Gln Arg Asp Val
35 40 45


Ala Glu Pro Gln Ala Phe Phe Arg Arg Thr Asn Ser Ala Ile Arg Arg
50 55 60


Leu Gln Ala Ala Glu Thr Leu Glu Ser Ala Cys Ala Ala Ala Ala Gln
65 70 75 80


Glu Val Arg Lys Ile Thr Gly Tyr Asp Arg Val Met Ile Tyr Arg Phe
85 90 95


Ala Ser Asp Phe Ser Gly Glu Val Ile Ala Glu Asp Arg Cys Ala Glu
100 105 110


Val Glu Ser Lys Leu Gly Leu His Tyr Pro Ala Ser Thr Val Pro Ala
115 120 125


Gln Ala Arg Arg Leu Tyr Thr Ile Asn Pro Val Arg Ile Ile Pro Asp
130 135 140


Ile Asn Tyr Arg Pro Val Pro Val Thr Pro Tyr Leu Asn Pro Val Thr
145 150 155 160


Gly Arg Pro Ile Asp Leu Ser Phe Ala Ile Leu Arg Ser Val Ser Pro
165 170 175


Val His Leu Glu Phe Met Arg Asn Ile Gly Met His Gly Thr Met Ser
180 185 190


Ile Ser Ile Leu Arg Gly Glu Arg Leu Trp Gly Leu Ile Val Cys His
195 200 205


His Arg Thr Pro Tyr Tyr Val Asp Leu Asp Gly Arg Gln Ala Cys Glu
210 215 220


Leu Val Ala Gln Val Leu Ala Arg Gln Ile Gly Val Met Glu Glu
225 230 235


<210> 429
<211> 154
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 429

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15


Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30


Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Leu Ile
35 40 45


Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60


Leu Gly Tyr Gly Leu Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys
65 70 75 80


Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95


Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110


Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125


Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140


Asn Tyr Asn Ser His Asn Val Tyr Ile Thr
145 150


<210> 430
<211> 85
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 430

Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His
1 5 10 15


Asn Ile Glu Asp Gly Gly Val Gln Leu Ala Asp His Tyr Gln Gln Asn
20 25 30


Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu
35 40 45


Ser Tyr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His
50 55 60


Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
65 70 75 80


Asp Glu Leu Tyr Lys
85


<210> 431
<211> 156
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 431

Ser Lys Gly Glu Arg Leu Phe Arg Gly Lys Val Pro Ile Leu Val Glu
1 5 10 15


Leu Lys Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly
20 25 30


Lys Gly Asp Ala Thr Arg Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr
35 40 45


Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr
50 55 60


Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Lys His Met Lys Arg His
65 70 75 80


Asp Phe Phe Lys Ser Ala Met Pro Lys Gly Tyr Val Gln Glu Arg Thr
85 90 95


Ile Ser Phe Lys Lys Asp Gly Lys Tyr Lys Thr Arg Ala Glu Val Lys
100 105 110


Phe Glu Gly Arg Thr Leu Val Asn Arg Ile Lys Leu Lys Gly Arg Asp
115 120 125


Phe Lys Glu Lys Gly Asn Ile Leu Gly His Lys Leu Arg Tyr Asn Phe
130 135 140


Asn Ser His Lys Val Tyr Ile Thr Ala Asp Lys Arg
145 150 155


<210> 432
<211> 81
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 432

Lys Asn Gly Ile Lys Ala Lys Phe Lys Ile Arg His Asn Val Lys Asp
1 5 10 15


Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
20 25 30


Arg Gly Pro Val Leu Leu Pro Arg Asn His Tyr Leu Ser Thr Arg Ser
35 40 45


Lys Leu Ser Lys Asp Pro Lys Glu Lys Arg Asp His Met Val Leu Leu
50 55 60


Glu Phe Val Thr Ala Ala Gly Ile Lys His Gly Arg Asp Glu Arg Tyr
65 70 75 80


Lys



<210> 433
<211> 229
<212> PRT
<213> Rattus rattus

<400> 433

Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15


Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30


Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45


Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60


Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80


Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95


Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110


Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125


Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140


Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160


Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175


Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190


Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205


Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220


Ala Thr Gly Leu Lys
225


<210> 434
<211> 236
<212> PRT
<213> Homo sapiens

<400> 434

Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15


Arg Ile Glu Pro Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30


Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45


Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60


Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Asp Phe His Pro Ser Met
65 70 75 80


Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95


Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg His Pro Gly Val Thr Leu
100 105 110


Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Gln Asn Arg
115 120 125


Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140


Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160


Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175


Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190


Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Thr Phe Phe Arg Leu
195 200 205


His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220


Ala Thr Gly Leu Ile His Pro Ser Val Ala Trp Arg
225 230 235


<210> 435
<211> 325
<212> PRT
<213> Homo sapiens

<400> 435

Met Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
1 5 10 15


Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr
20 25 30


Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe
35 40 45


Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu
50 55 60


Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys
65 70 75 80


Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp
85 90 95


Glu Phe Gln His Cys Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu
100 105 110


Phe Glu Pro Trp Asn Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile
115 120 125


Met Leu Gly Glu Ile Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr
130 135 140


Phe Asn Phe Asn Asn Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr
145 150 155 160


Leu Cys Tyr Glu Val Glu Arg Met His Asn Asp Thr Trp Val Leu Leu
165 170 175


Asn Gln Arg Arg Gly Phe Leu Cys Asn Gln Ala Pro His Lys His Gly
180 185 190


Phe Leu Glu Gly Arg His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro
195 200 205


Phe Trp Lys Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr
210 215 220


Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile
225 230 235 240


Ser Lys Asn Lys His Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr
245 250 255


Asp Asp Gln Gly Arg Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala
260 265 270


Gly Ala Lys Ile Ser Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp
275 280 285


Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly
290 295 300


Leu Asp Glu His Ser Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu
305 310 315 320


Gln Asn Gln Glu Asn
325


<210> 436
<211> 208
<212> PRT
<213> Petromyzon marinus

<400> 436

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15


Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30


Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45


Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60


Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80


Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95


Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110


Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125


Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140


Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160


Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175


Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190


Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205


<210> 437
<211> 200
<212> PRT
<213> Homo sapiens

<400> 437

Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15


Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30


Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45


Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60


Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80


Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95


Phe Leu Arg Gly Asn Pro Tyr Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110


Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125


Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140


Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160


Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175


Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190


Phe Arg Thr Leu Gly Leu Leu Asp
195 200


<210> 438
<211> 181
<212> PRT
<213> Homo sapiens

<400> 438

Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15


Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30


Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45


Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60


Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80


Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95


Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110


Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125


Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140


Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160


Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175


Arg Arg Ile Leu Leu
180


<210> 439
<211> 25
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 439
gggaacaaag cugaaguacu uaccc 25


<210> 440
<211> 18
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 440
gggtagggcg ggttggga 18


<210> 441
<211> 25
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (25)..(25)
<223> 3' Thiol modification

<400> 441
ttataactat tcctaaaaaa aaaaa 25


<210> 442
<211> 26
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(1)
<223> 5' Thiol modification

<400> 442
aaaaaaaaaa ctcccctaat aacaat 26


<210> 443
<211> 45
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 443
ggguaggaau aguuauaauu ucccuuuccc auuguuauua gggag 45


<210> 444
<211> 12
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(1)
<223> 5・biotin modification

<220>
<221> misc_feature
<222> (12)..(12)
<223> 3・quencher

<400> 444
ucucguacgu uc 12


<210> 445
<211> 24
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(1)
<223> 5・biotin modification

<220>
<221> misc_feature
<222> (24)..(24)
<223> 3・quencher

<400> 445
ucucguacgu ucucucguac guuc 24


<210> 446
<211> 66
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 446
tgtggttggt gtggttggtt catggtcata ttggtttttt tttttttttc caaccacagt 60

ctctgt 66


<210> 447
<211> 35
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 447
ggttggtagt ctcgaattgc tctctttcac tggcc 35


<210> 448
<211> 48
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 448
gaaattaata cgactcacta tagggggttg gttcatggtc atattggt 48


<210> 449
<211> 57
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 449
gaaattaata cgactcacta tagggggttg gtgtggttgg ttcatggtca tattggt 57


<210> 450
<211> 31
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 450
ggccagtgaa agagagcaat tcgagactac c 31


<210> 451
<211> 64
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 451
gauuuagacu accccaaaaa cgaaggggac uaaaacccag ugaaagagag caauucgaga 60

cuac 64


<210> 452
<211> 64
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 452
gauuuagacu accccaaaaa cgaaggggac uaaaacaaag agagcaauuc gagacuacca 60

acca 64


<210> 453
<211> 64
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 453
gauuuagacu accccaaaaa cgaaggggac uaaaacagac uaccaaccac agagacugug 60

guug 64


<210> 454
<211> 106
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 454
gttagatcgc aagcatatca ttgcgcttgc gatctaactg ctgcgccgcc gggaaaatac 60

tgtacggtta gatcgcatag tctcgaattg ctctctttca ctggcc 106


<210> 455
<211> 71
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 455
gttagatcgc aagcatatca ttgcgcttgc gatctaactg ctgcgccgcc gggaaaatac 60

tgtacggtta g 71


<210> 456
<211> 35
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 456
atcgcatagt ctcgaattgc tctctttcac tggcc 35


<210> 457
<211> 50
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 457
gaaattaata cgactcacta tagggatcgc aagcatatca ttgcgcttgc 50


<210> 458
<211> 31
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 458
ggccagtgaa agagagcaat tcgagactat g 31


<210> 459
<211> 64
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 459
gauuuagacu accccaaaaa cgaaggggac uaaaacccag ugaaagagag caauucgaga 60

cuau 64


<210> 460
<211> 64
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 460
gauuuagacu accccaaaaa cgaaggggac uaaaacagag caauucgaga cuaugcgauc 60

uaac 64


<210> 461
<211> 64
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 461
gauuuagacu accccaaaaa cgaaggggac uaaaacacua ugcgaucuaa ccguacagua 60

uuuu 64


<210> 462
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 462

Pro Lys Lys Lys Arg Lys Val
1 5


<210> 463
<211> 16
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 463

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15


<210> 464
<211> 9
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 464

Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5


<210> 465
<211> 11
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 465

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10


<210> 466
<211> 38
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 466

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15


Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30


Arg Asn Gln Gly Gly Tyr
35


<210> 467
<211> 42
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 467

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15


Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30


Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40


<210> 468
<211> 8
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 468

Val Ser Arg Lys Arg Pro Arg Pro
1 5


<210> 469
<211> 8
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 469

Pro Pro Lys Lys Ala Arg Glu Asp
1 5


<210> 470
<211> 8
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 470

Pro Gln Pro Lys Lys Lys Pro Leu
1 5


<210> 471
<211> 12
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 471

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10


<210> 472
<211> 5
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 472

Asp Arg Leu Arg Arg
1 5


<210> 473
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 473

Pro Lys Gln Lys Lys Arg Lys
1 5


<210> 474
<211> 10
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 474

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10


<210> 475
<211> 10
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 475

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10


<210> 476
<211> 20
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 476

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15


Lys Ser Lys Lys
20


<210> 477
<211> 17
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 477

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15


Lys



<210> 478
<211> 107
<212> PRT
<213> Homo sapiens

<400> 478

Ile Glu Val Met Tyr Pro Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn
1 5 10 15


Gly Thr Ile Ile His Val Lys Gly Lys His Leu Cys Pro Ser Pro Leu
20 25 30


Phe Pro Gly Pro Ser Lys Pro Phe Trp Val Leu Val Val Val Gly Gly
35 40 45


Val Leu Ala Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe
50 55 60


Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn
65 70 75 80


Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr
85 90 95


Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser
100 105


<210> 479
<211> 107
<212> PRT
<213> Homo sapiens

<400> 479

Ile Glu Val Met Tyr Pro Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn
1 5 10 15


Gly Thr Ile Ile His Val Lys Gly Lys His Leu Cys Pro Ser Pro Leu
20 25 30


Phe Pro Gly Pro Ser Lys Pro Phe Trp Val Leu Val Val Val Gly Gly
35 40 45


Val Leu Ala Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe
50 55 60


Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn
65 70 75 80


Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr
85 90 95


Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser
100 105


<210> 480
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 480
gccaaattgg acgaccctcg 20


<210> 481
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 481
cgaggagacc cccgtttcgg 20


<210> 482
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 482
cccgccgccg ccgtggctcg 20


<210> 483
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 483
tgagctctac gagatccaca 20


<210> 484
<211> 1145
<212> PRT
<213> Alicyclobacillus macrosporangiidus

<400> 484

Met Val Ala Val Lys Ser Ile Lys Val Lys Leu Met Leu Gly His Leu
1 5 10 15


Pro Glu Ile Arg Glu Gly Leu Trp His Leu His Glu Ala Val Asn Leu
20 25 30


Gly Val Arg Tyr Tyr Thr Glu Trp Leu Ala Leu Leu Arg Gln Gly Asn
35 40 45


Leu Tyr Arg Arg Gly Lys Asp Gly Ala Gln Glu Cys Tyr Met Thr Ala
50 55 60


Glu Gln Cys Arg Gln Glu Leu Leu Val Arg Leu Arg Asp Arg Gln Lys
65 70 75 80


Arg Asn Gly His Thr Gly Asp Pro Gly Thr Asp Glu Glu Leu Leu Gly
85 90 95


Val Ala Arg Arg Leu Tyr Glu Leu Leu Val Pro Gln Ser Val Gly Lys
100 105 110


Lys Gly Gln Ala Gln Met Leu Ala Ser Gly Phe Leu Ser Pro Leu Ala
115 120 125


Asp Pro Lys Ser Glu Gly Gly Lys Gly Thr Ser Lys Ser Gly Arg Lys
130 135 140


Pro Ala Trp Met Gly Met Lys Glu Ala Gly Asp Ser Arg Trp Val Glu
145 150 155 160


Ala Lys Ala Arg Tyr Glu Ala Asn Lys Ala Lys Asp Pro Thr Lys Gln
165 170 175


Val Ile Ala Ser Leu Glu Met Tyr Gly Leu Arg Pro Leu Phe Asp Val
180 185 190


Phe Thr Glu Thr Tyr Lys Thr Ile Arg Trp Met Pro Leu Gly Lys His
195 200 205


Gln Gly Val Arg Ala Trp Asp Arg Asp Met Phe Gln Gln Ser Leu Glu
210 215 220


Arg Leu Met Ser Trp Glu Ser Trp Asn Glu Arg Val Gly Ala Glu Phe
225 230 235 240


Ala Arg Leu Val Asp Arg Arg Asp Arg Phe Arg Glu Lys His Phe Thr
245 250 255


Gly Gln Glu His Leu Val Ala Leu Ala Gln Arg Leu Glu Gln Glu Met
260 265 270


Lys Glu Ala Ser Pro Gly Phe Glu Ser Lys Ser Ser Gln Ala His Arg
275 280 285


Ile Thr Lys Arg Ala Leu Arg Gly Ala Asp Gly Ile Ile Asp Asp Trp
290 295 300


Leu Lys Leu Ser Glu Gly Glu Pro Val Asp Arg Phe Asp Glu Ile Leu
305 310 315 320


Arg Lys Arg Gln Ala Gln Asn Pro Arg Arg Phe Gly Ser His Asp Leu
325 330 335


Phe Leu Lys Leu Ala Glu Pro Val Phe Gln Pro Leu Trp Arg Glu Asp
340 345 350


Pro Ser Phe Leu Ser Arg Trp Ala Ser Tyr Asn Glu Val Leu Asn Lys
355 360 365


Leu Glu Asp Ala Lys Gln Phe Ala Thr Phe Thr Leu Pro Ser Pro Cys
370 375 380


Ser Asn Pro Val Trp Ala Arg Phe Glu Asn Ala Glu Gly Thr Asn Ile
385 390 395 400


Phe Lys Tyr Asp Phe Leu Phe Asp His Phe Gly Lys Gly Arg His Gly
405 410 415


Val Arg Phe Gln Arg Met Ile Val Met Arg Asp Gly Val Pro Thr Glu
420 425 430


Val Glu Gly Ile Val Val Pro Ile Ala Pro Ser Arg Gln Leu Asp Ala
435 440 445


Leu Ala Pro Asn Asp Ala Ala Ser Pro Ile Asp Val Phe Val Gly Asp
450 455 460


Pro Ala Ala Pro Gly Ala Phe Arg Gly Gln Phe Gly Gly Ala Lys Ile
465 470 475 480


Gln Tyr Arg Arg Ser Ala Leu Val Arg Lys Gly Arg Arg Glu Glu Lys
485 490 495


Ala Tyr Leu Cys Gly Phe Arg Leu Pro Ser Gln Arg Arg Thr Gly Thr
500 505 510


Pro Ala Asp Asp Ala Gly Glu Val Phe Leu Asn Leu Ser Leu Arg Val
515 520 525


Glu Ser Gln Ser Glu Gln Ala Gly Arg Arg Asn Pro Pro Tyr Ala Ala
530 535 540


Val Phe His Ile Ser Asp Gln Thr Arg Arg Val Ile Val Arg Tyr Gly
545 550 555 560


Glu Ile Glu Arg Tyr Leu Ala Glu His Pro Asp Thr Gly Ile Pro Gly
565 570 575


Ser Arg Gly Leu Thr Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly
580 585 590


Leu Arg Thr Ser Ala Ala Ile Ser Val Phe Arg Val Ala His Arg Asp
595 600 605


Glu Leu Thr Pro Asp Ala His Gly Arg Gln Pro Phe Phe Phe Pro Ile
610 615 620


His Gly Met Asp His Leu Val Ala Leu His Glu Arg Ser His Leu Ile
625 630 635 640


Arg Leu Pro Gly Glu Thr Glu Ser Lys Lys Val Arg Ser Ile Arg Glu
645 650 655


Gln Arg Leu Asp Arg Leu Asn Arg Leu Arg Ser Gln Met Ala Ser Leu
660 665 670


Arg Leu Leu Val Arg Thr Gly Val Leu Asp Glu Gln Lys Arg Asp Arg
675 680 685


Asn Trp Glu Arg Leu Gln Ser Ser Met Glu Arg Gly Gly Glu Arg Met
690 695 700


Pro Ser Asp Trp Trp Asp Leu Phe Gln Ala Gln Val Arg Tyr Leu Ala
705 710 715 720


Gln His Arg Asp Ala Ser Gly Glu Ala Trp Gly Arg Met Val Gln Ala
725 730 735


Ala Val Arg Thr Leu Trp Arg Gln Leu Ala Lys Gln Val Arg Asp Trp
740 745 750


Arg Lys Glu Val Arg Arg Asn Ala Asp Lys Val Lys Ile Arg Gly Ile
755 760 765


Ala Arg Asp Val Pro Gly Gly His Ser Leu Ala Gln Leu Asp Tyr Leu
770 775 780


Glu Arg Gln Tyr Arg Phe Leu Arg Ser Trp Ser Ala Phe Ser Val Gln
785 790 795 800


Ala Gly Gln Val Val Arg Ala Glu Arg Asp Ser Arg Phe Ala Val Ala
805 810 815


Leu Arg Glu His Ile Asp Asn Gly Lys Lys Asp Arg Leu Lys Lys Leu
820 825 830


Ala Asp Arg Ile Leu Met Glu Ala Leu Gly Tyr Val Tyr Val Thr Asp
835 840 845


Gly Arg Arg Ala Gly Gln Trp Gln Ala Val Tyr Pro Pro Cys Gln Leu
850 855 860


Val Leu Leu Glu Glu Leu Ser Glu Tyr Arg Phe Ser Asn Asp Arg Pro
865 870 875 880


Pro Ser Glu Asn Ser Gln Leu Met Val Trp Ser His Arg Gly Val Leu
885 890 895


Glu Glu Leu Ile His Gln Ala Gln Val His Asp Val Leu Val Gly Thr
900 905 910


Ile Pro Ala Ala Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro
915 920 925


Gly Ile Arg Cys Arg Arg Val Pro Ser Ile Pro Leu Lys Asp Ala Pro
930 935 940


Ser Ile Pro Ile Trp Leu Ser His Tyr Leu Lys Gln Thr Glu Arg Asp
945 950 955 960


Ala Ala Ala Leu Arg Pro Gly Glu Leu Ile Pro Thr Gly Asp Gly Glu
965 970 975


Phe Leu Val Thr Pro Ala Gly Arg Gly Ala Ser Gly Val Arg Val Val
980 985 990


His Ala Asp Ile Asn Ala Ala His Asn Leu Gln Arg Arg Leu Trp Glu
995 1000 1005


Asn Phe Asp Leu Ser Asp Ile Arg Val Arg Cys Asp Arg Arg Glu
1010 1015 1020


Gly Lys Asp Gly Thr Val Val Leu Ile Pro Arg Leu Thr Asn Gln
1025 1030 1035


Arg Val Lys Glu Arg Tyr Ser Gly Val Ile Phe Thr Ser Glu Asp
1040 1045 1050


Gly Val Ser Phe Thr Val Gly Asp Ala Lys Thr Arg Arg Arg Ser
1055 1060 1065


Ser Ala Ser Gln Gly Glu Gly Asp Asp Leu Ser Asp Glu Glu Gln
1070 1075 1080


Glu Leu Leu Ala Glu Ala Asp Asp Ala Arg Glu Arg Ser Val Val
1085 1090 1095


Leu Phe Arg Asp Pro Ser Gly Phe Val Asn Gly Gly Arg Trp Thr
1100 1105 1110


Ala Gln Arg Ala Phe Trp Gly Met Val His Asn Arg Ile Glu Thr
1115 1120 1125


Leu Leu Ala Glu Arg Phe Ser Val Ser Gly Ala Ala Glu Lys Val
1130 1135 1140


Arg Gly
1145


<210> 485
<211> 1108
<212> PRT
<213> Bacillus hisashii

<400> 485

Met Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
1 5 10 15


Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
20 25 30


Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
35 40 45


His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
50 55 60


Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
65 70 75 80


Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
85 90 95


Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
100 105 110


Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
115 120 125


Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
130 135 140


Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
145 150 155 160


Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
165 170 175


Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
180 185 190


Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
195 200 205


Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
210 215 220


Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
225 230 235 240


Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
245 250 255


Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
260 265 270


Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
275 280 285


Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
290 295 300


Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
305 310 315 320


Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
325 330 335


Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
340 345 350


Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
355 360 365


Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
370 375 380


His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
385 390 395 400


Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
405 410 415


Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
420 425 430


Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
435 440 445


Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
450 455 460


Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
465 470 475 480


Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
485 490 495


Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
500 505 510


Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
515 520 525


Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
530 535 540


Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
545 550 555 560


Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
565 570 575


Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
580 585 590


Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
595 600 605


Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
610 615 620


Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
625 630 635 640


Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
645 650 655


Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
660 665 670


Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
675 680 685


Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
690 695 700


Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
705 710 715 720


Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
725 730 735


Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
740 745 750


Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
755 760 765


Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
770 775 780


Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
785 790 795 800


Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
805 810 815


Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
820 825 830


Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
835 840 845


Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
850 855 860


Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
865 870 875 880


Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
885 890 895


Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
900 905 910


Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
915 920 925


Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
930 935 940


Lys Cys Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
945 950 955 960


Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
965 970 975


Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp
980 985 990


Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu
995 1000 1005


Lys Asp Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Leu Lys Ile
1010 1015 1020


Lys Lys Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser
1025 1030 1035


Asp Ile Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly
1040 1045 1050


Glu Lys Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro
1055 1060 1065


Ser Asp Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu
1070 1075 1080


Arg Ile Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr
1085 1090 1095


Ile Glu Asp Asp Ser Ser Lys Gln Ser Met
1100 1105


<210> 486
<211> 1364
<212> PRT
<213> Unknown

<220>
<223> Uncultured organism

<400> 486

Met Pro Arg Asp Asp Leu Asp Leu Leu Thr Asn Leu Asn Ser Thr Ala
1 5 10 15


Lys Gly Ile Arg Glu Arg Gly Lys Thr Lys Glu Gly Thr Asp Lys Lys
20 25 30


Lys Ser Gly Arg Lys Ser Ser Trp Pro Met Asp Lys Ala Ala Trp Glu
35 40 45


Thr Ala Lys Thr Ser Asp Ser Ser Ala His Phe Leu Glu Lys Leu Lys
50 55 60


Gln His Pro Asp Leu Lys Asp Ala Phe Gly Asn Leu Ser Ser Gly Gly
65 70 75 80


Ser Lys Lys Leu Glu Tyr Tyr Lys Lys Leu Ala Gly Ser Ala Pro Trp
85 90 95


Lys Glu Ser Gln Ser Val Ile Leu Glu Lys Ala Ala Arg Trp Lys Glu
100 105 110


Ala Lys Gln Glu Arg Glu Glu Lys Glu Gln Asp Ser Ser Glu His Gly
115 120 125


Ser Lys Ala Ala Tyr Arg Arg Leu Phe Asp Ala Gly Cys Leu Pro Met
130 135 140


Pro Glu Phe Ala Lys Tyr Ile Asp Glu Asn Gln Ile Glu Phe Gly Asp
145 150 155 160


Leu Lys Leu Ser Asp Cys Gly Ala Glu Trp Lys Arg Gly Met Trp Asn
165 170 175


Gln Ala Gly Gln Arg Val Arg Ser His Met Gly Trp Gln Arg Arg Arg
180 185 190


Glu Lys Glu Asn Ala Val Tyr Ser Leu Arg Lys Glu Leu Phe Glu Lys
195 200 205


Gly Gly Ala Ile Arg Arg Lys Lys Ser Glu Glu Leu Thr Pro Glu Asp
210 215 220


Ile Leu Pro Gly Lys Ala Ala Pro Asp Gln Asn Asp Trp Gln Glu Arg
225 230 235 240


Pro Ala Tyr Gly Asn Gln Met Trp Phe Ile Gly Leu Arg Ser Tyr Glu
245 250 255


Glu Asn Glu Met Ala Lys Tyr Ala Glu Glu Ala Gly Met Gly Ser Arg
260 265 270


Ser Ala Pro Arg Ile Arg Arg Gly Thr Ile Lys Gly Trp Ser Lys Leu
275 280 285


Arg Glu Arg Trp Leu Gln Ile Leu Lys Arg Asn Pro Gln Ala Thr Arg
290 295 300


Asp Asp Leu Ile Gly Glu Leu Asn Ala Leu Arg Ser Gln Asp Pro Arg
305 310 315 320


Ala Tyr Gly Asp Ala Arg Leu Phe Asp Trp Leu Ser Lys Thr Asp Gln
325 330 335


Arg Phe Leu Trp Asp Gly Phe Asp Ala Asp Gly Lys Ile Leu Cys Gly
340 345 350


Arg Asp Asp Arg Asp Cys Val Ser Ala Phe Val Ala Tyr Asn Glu Glu
355 360 365


Phe Ala Asp Glu Pro Ser Ser Ile Thr Leu Thr Glu Thr Asp Glu Arg
370 375 380


Leu His Pro Val Trp Pro Phe Phe Gly Glu Ser Ser Ala Val Pro Tyr
385 390 395 400


Glu Ile Glu Tyr Asp Leu Glu Thr Ala Cys Pro Thr Ala Ile Arg Leu
405 410 415


Pro Leu Leu Val Gly Lys Glu Asn Gly Gly Tyr Ala Glu Arg Gln Gly
420 425 430


Thr Arg Leu Pro Leu Ala Glu Tyr Ala Asp Leu Ala Ser Ser Phe Gln
435 440 445


Leu Pro Thr Pro Val Arg Leu Asp Val Leu Val Glu Ile Arg Glu Val
450 455 460


Thr Arg Ala Gly Arg Lys Val Thr Cys Pro Phe Ser Tyr Phe Lys Gln
465 470 475 480


Asn Gly Val Trp Tyr Val Arg Glu Gly Glu Ile Pro Ser Gly Glu Ser
485 490 495


Ile Gln Ile Lys Gln Thr Asp Arg Lys Ile Glu Asn Gly Lys Ile Phe
500 505 510


Ile Ser Ser Lys Leu Arg Met Ala Tyr Arg Asp Asp Leu Met Val Ser
515 520 525


Pro Ala Thr Gly Asp Phe Gly Ser Ile Lys Ile Leu Trp Glu Arg Ile
530 535 540


Glu Leu Ala Ser His Val Asp Gln Lys Lys Leu Pro Glu Thr Ala Pro
545 550 555 560


Ala Arg Ser Arg Val Phe Val Ser Phe Ser Cys Asn Val Val Glu Arg
565 570 575


Ala Pro Arg Lys Gln Leu Thr Arg Lys Pro Asp Ala Val Val Val Thr
580 585 590


Ile Pro Ser Gly Val Asp Gln Gly Leu Val Val Val Ser Thr Asp Val
595 600 605


Arg Thr Gly Lys Ser Lys Ser Ser Ser Ala Pro Pro Leu Pro Pro Gly
610 615 620


Ser Arg Leu Trp Pro Ala Asp Ala Val His Gly Asp Pro Pro Leu Arg
625 630 635 640


Ile Leu Ser Val Asp Leu Gly His Arg His Ser Ala Tyr Ala Val Trp
645 650 655


Glu Leu Gly Leu Gln Gln Lys Ser Trp Arg Ala Gly Val Leu Lys Gly
660 665 670


Ser Thr Gln Thr Pro Val Tyr Ala Asp Cys Thr Gly Thr Gly Leu Leu
675 680 685


Cys Leu Pro Gly Asp Gly Glu Asp Thr Pro Ala Glu Glu Glu Ser Leu
690 695 700


Arg Leu Arg Ser Arg Gln Ile Arg Arg Arg Leu Asn Leu Gln Asn Ser
705 710 715 720


Ile Leu Arg Val Ser Arg Leu Leu Ser Leu Asp Lys Phe Glu Lys Thr
725 730 735


Ile Phe Glu Gln Ser Asp Val Arg Asp Arg Pro Asn Lys Lys Gly Leu
740 745 750


Arg Ile Arg Arg Arg Cys Arg Thr Glu Lys Thr Pro Leu Ser Glu Ala
755 760 765


Glu Val Arg Lys Asn Cys Asp Lys Ala Ala Glu Ile Leu Ile Arg Trp
770 775 780


Ala Asp Thr Asp Ala Met Ala Lys Ser Leu Ala Ala Thr Gly Asn Ala
785 790 795 800


Asp Ile Ser Phe Trp Lys Tyr Met Ala Val Lys Asn Pro Pro Leu Ser
805 810 815


Ala Val Val Asp Val Ala Pro Ser Thr Ile Val Pro Asp Asp Gly Pro
820 825 830


Asp Arg Glu Thr Leu Lys Lys Lys Arg Gln Glu Glu Glu Glu Lys Phe
835 840 845


Ala Ser Ser Ile Tyr Glu Asn Arg Val Lys Leu Ala Gly Ala Leu Cys
850 855 860


Ser Gly Tyr Asp Ala Asp His Arg Arg Pro Ala Thr Gly Gly Leu Trp
865 870 875 880


His Asp Leu Asp Arg Thr Leu Ile Arg Glu Ile Ser Tyr Gly Asp Arg
885 890 895


Gly Gln Lys Gly Asn Pro Arg Lys Leu Asn Asn Glu Gly Ile Leu Arg
900 905 910


Leu Leu Arg Arg Pro Pro Arg Ala Arg Pro Asp Trp Arg Glu Phe His
915 920 925


Arg Thr Leu Asn Asp Ala Asn Arg Ile Pro Lys Gly Arg Thr Leu Arg
930 935 940


Gly Gly Leu Ser Met Gly Arg Leu Asn Phe Leu Lys Glu Val Gly Asp
945 950 955 960


Phe Val Lys Lys Trp Ser Cys Arg Pro Arg Trp Pro Gly Asp Arg Arg
965 970 975


His Ile Pro Pro Gly Gln Leu Phe Asp Arg Gln Asp Ala Glu His Leu
980 985 990


Glu His Leu Arg Asp Asp Arg Ile Lys Arg Leu Ala His Leu Ile Val
995 1000 1005


Ala Gln Ala Leu Gly Phe Glu Pro Asp Ile Arg Arg Gly Leu Trp
1010 1015 1020


Lys Tyr Val Asp Gly Ser Thr Gly Glu Ile Leu Trp Gln His Pro
1025 1030 1035


Glu Thr Arg Arg Phe Phe Ala Glu Gly Ala Ala Gly Glu Leu Arg
1040 1045 1050


Glu Val Ser Arg Pro Ala Glu Ile Asp Asp Asp Ala Ala Ala Arg
1055 1060 1065


Pro His Thr Val Ser Ala Pro Ala His Ile Val Val Phe Glu Asn
1070 1075 1080


Leu Ile Arg Tyr Arg Phe Gln Ser Asp Arg Pro Lys Thr Glu Asn
1085 1090 1095


Ala Gly Leu Met Gln Trp Ala His Arg Gln Ile Val His Phe Thr
1100 1105 1110


Lys Gln Val Ala Ser Leu Tyr Gly Leu Lys Val Ala Met Val Tyr
1115 1120 1125


Ala Ala Phe Ser Ser Lys Phe Cys Ser Arg Cys Gly Ser Pro Gly
1130 1135 1140


Ala Arg Val Ser Arg Phe Asp Pro Ala Trp Arg Asn Gln Glu Trp
1145 1150 1155


Phe Lys Arg Arg Thr Ser Asn Pro Arg Ser Lys Val Asp His Ser
1160 1165 1170


Leu Lys Arg Ala Ser Glu Asp Pro Thr Ala Asp Glu Thr Arg Pro
1175 1180 1185


Trp Val Leu Ile Glu Gly Gly Lys Glu Phe Val Cys Ala Asn Ala
1190 1195 1200


Lys Cys Ser Ala His Asp Glu Pro Leu Asn Ala Asp Glu Asn Ala
1205 1210 1215


Ala Ala Asn Ile Gly Leu Arg Phe Leu Arg Gly Val Glu Asp Phe
1220 1225 1230


Arg Thr Lys Val Asn Pro Ala Gly Ala Leu Lys Gly Lys Leu Arg
1235 1240 1245


Phe Glu Thr Gly Ile His Ser Phe Arg Pro Pro Val Ser Gly Ser
1250 1255 1260


Pro Phe Trp Ser Pro Met Ala Glu Pro Ala Gln Lys Lys Lys Ile
1265 1270 1275


Gly Ala Ala Ala Pro Gly Ala Asp Val Asp Glu Ala Gly Asp Ala
1280 1285 1290


Asp Glu Ser Gly Val Val Val Leu Phe Arg Asp Pro Ser Gly Ala
1295 1300 1305


Phe Arg Asn Lys Gln Tyr Trp Tyr Glu Gly Lys Ile Phe Trp Ser
1310 1315 1320


Asn Val Met Met Ala Val Glu Ala Lys Ile Ala Gly Ala Ser Val
1325 1330 1335


Gly Ala Lys Pro Val Ala Ala Ser Trp Gly Gln Ala Gln Pro Gln
1340 1345 1350


Ser Gly Pro Gly Leu Ala Lys Pro Gly Gly Asp
1355 1360


<210> 487
<211> 1364
<212> PRT
<213> Unknown

<220>
<223> Uncultured organism

<400> 487

Met Asn Arg Ile Tyr Gln Gly Arg Val Thr Lys Val Glu Val Pro Asp
1 5 10 15


Gly Lys Asp Glu Lys Gly Asn Ile Lys Trp Lys Lys Leu Glu Asn Trp
20 25 30


Ser Asp Ile Leu Trp Gln His His Met Leu Phe Gln Asp Ala Val Asn
35 40 45


Tyr Tyr Thr Leu Ala Leu Ala Ala Ile Ser Gly Ser Ala Val Gly Ser
50 55 60


Asp Glu Lys Ser Ile Ile Leu Arg Glu Trp Ala Val Gln Val Gln Asn
65 70 75 80


Ile Trp Glu Lys Ala Lys Lys Lys Ala Thr Val Phe Glu Gly Pro Gln
85 90 95


Lys Arg Leu Thr Ser Ile Leu Gly Leu Glu Gln Asn Ala Ser Phe Asp
100 105 110


Ile Ala Ala Lys His Ile Leu Arg Thr Ser Glu Ala Lys Pro Glu Gln
115 120 125


Arg Ala Ser Ala Leu Ile Arg Leu Leu Glu Glu Ile Asp Lys Lys Asn
130 135 140


His Asn Val Val Cys Gly Glu Arg Leu Pro Phe Phe Cys Pro Arg Asn
145 150 155 160


Ile Gln Ser Lys Arg Ser Pro Thr Ser Lys Ala Val Ser Ser Val Gln
165 170 175


Glu Gln Lys Arg Gln Glu Glu Val Arg Arg Phe His Asn Met Gln Pro
180 185 190


Glu Glu Val Val Lys Asn Ala Val Thr Leu Asp Ile Ser Leu Phe Lys
195 200 205


Ser Ser Pro Lys Ile Val Phe Leu Glu Asp Pro Lys Lys Ala Arg Ala
210 215 220


Glu Leu Leu Lys Gln Phe Asp Asn Ala Cys Lys Lys His Lys Glu Leu
225 230 235 240


Val Gly Ile Lys Lys Ala Phe Thr Glu Ser Ile Asp Lys His Gly Ser
245 250 255


Ser Leu Lys Val Pro Ala Pro Gly Ser Lys Pro Ser Gly Leu Tyr Pro
260 265 270


Ser Ala Ile Val Phe Lys Tyr Phe Pro Val Asp Ile Thr Lys Thr Val
275 280 285


Phe Leu Lys Ala Thr Glu Lys Leu Ala Met Gly Lys Asp Arg Glu Val
290 295 300


Thr Asn Asp Pro Ile Ala Asp Ala Arg Val Asn Asp Lys Pro His Phe
305 310 315 320


Asp Tyr Phe Thr Asn Ile Ala Leu Ile Arg Glu Lys Glu Lys Asn Arg
325 330 335


Ala Ala Trp Phe Glu Phe Asp Leu Ala Ala Phe Ile Glu Ala Ile Met
340 345 350


Ser Pro His Arg Phe Tyr Gln Asp Thr Gln Lys Arg Lys Glu Ala Ala
355 360 365


Arg Lys Leu Glu Glu Lys Ile Lys Ala Ile Glu Gly Lys Gly Gly Gln
370 375 380


Phe Lys Glu Ser Asp Ser Glu Asp Asp Asp Val Asp Ser Leu Pro Gly
385 390 395 400


Phe Glu Gly Asp Thr Arg Ile Asp Leu Leu Arg Lys Leu Val Thr Asp
405 410 415


Thr Leu Gly Trp Leu Gly Glu Ser Glu Thr Pro Asp Asn Asn Glu Gly
420 425 430


Lys Lys Thr Glu Tyr Ser Ile Ser Glu Arg Thr Leu Arg Ile Phe Pro
435 440 445


Asp Ile Gln Lys Gln Trp Ser Glu Leu Ala Glu Lys Gly Glu Thr Thr
450 455 460


Glu Gly Lys Leu Leu Glu Val Leu Lys His Glu Gln Thr Glu His Gln
465 470 475 480


Ser Asp Phe Gly Ser Ala Thr Leu Tyr Gln His Leu Ala Lys Pro Glu
485 490 495


Phe His Pro Ile Trp Leu Lys Ser Gly Thr Glu Glu Trp His Ala Glu
500 505 510


Asn Pro Leu Lys Ala Trp Leu Asn Tyr Lys Glu Leu Gln Tyr Glu Leu
515 520 525


Thr Asp Lys Lys Arg Pro Ile His Phe Thr Pro Ala His Pro Val Tyr
530 535 540


Ser Pro Arg Tyr Phe Asp Phe Pro Lys Lys Ser Glu Thr Glu Glu Lys
545 550 555 560


Glu Val Ser Lys Asn Thr His Ser Leu Thr Thr Ser Leu Ala Ser Glu
565 570 575


His Ile Lys Asn Ser Leu Gln Phe Thr Ala Gly Leu Ile Arg Lys Thr
580 585 590


Asn Val Gly Lys Lys Ala Ile Lys Ala Arg Phe Ser Tyr Ser Ala Pro
595 600 605


Arg Leu Arg Arg Asp Cys Leu Arg Ser Glu Asn Asn Glu Asn Leu Tyr
610 615 620


Lys Ala Pro Trp Leu Gln Pro Met Met Arg Ala Leu Gly Ile Asp Glu
625 630 635 640


Glu Lys Ala Asp Arg Gln Asn Phe Ala Asn Thr Arg Ile Thr Leu Met
645 650 655


Ala Lys Gly Leu Asp Asp Ile Gln Leu Gly Phe Pro Val Glu Ala Asn
660 665 670


Ser Gln Glu Leu Gln Lys Glu Val Ser Asn Gly Ile Ser Trp Lys Gly
675 680 685


Gln Phe Asn Trp Gly Gly Ile Ala Ser Leu Ser Ala Leu Arg Trp Pro
690 695 700


His Glu Lys Lys Pro Lys Asn Pro Pro Glu Gln Pro Trp Trp Gly Ile
705 710 715 720


Asp Ser Phe Ser Cys Leu Ala Val Asp Leu Gly Gln Arg Tyr Ala Gly
725 730 735


Ala Phe Ala Arg Leu Asp Val Ser Thr Ile Glu Lys Lys Gly Lys Ser
740 745 750


Arg Phe Ile Gly Glu Ala Cys Asp Lys Lys Trp Tyr Ala Lys Val Ser
755 760 765


Arg Met Gly Leu Leu Arg Leu Pro Gly Glu Asp Val Lys Val Trp Arg
770 775 780


Asp Ala Ser Lys Ile Asp Lys Glu Asn Gly Phe Ala Phe Arg Lys Glu
785 790 795 800


Leu Phe Gly Glu Lys Gly Arg Ser Ala Thr Pro Leu Glu Ala Glu Glu
805 810 815


Thr Ala Glu Leu Ile Lys Leu Phe Gly Ala Asn Glu Lys Asp Val Met
820 825 830


Pro Asp Asn Trp Ser Lys Glu Leu Ser Phe Pro Glu Gln Asn Asp Lys
835 840 845


Leu Leu Ile Val Ala Arg Arg Ala Gln Ala Ala Val Ser Arg Leu His
850 855 860


Arg Trp Ala Trp Phe Phe Asp Glu Ala Lys Arg Ser Asp Asp Ala Ile
865 870 875 880


Arg Glu Ile Leu Glu Ser Asp Asp Thr Asp Leu Lys Gln Lys Val Asn
885 890 895


Lys Asn Glu Ile Glu Lys Val Lys Glu Thr Ile Ile Ser Leu Leu Lys
900 905 910


Val Lys Gln Glu Leu Leu Pro Thr Leu Leu Thr Arg Leu Ala Asn Arg
915 920 925


Val Leu Pro Leu Arg Gly Arg Ser Trp Glu Trp Lys Lys His His Gln
930 935 940


Lys Asn Asp Gly Phe Ile Leu Asp Gln Thr Gly Lys Ala Met Pro Asn
945 950 955 960


Val Leu Ile Arg Gly Gln Arg Gly Leu Ser Met Asp Arg Ile Glu Gln
965 970 975


Ile Thr Glu Leu Arg Lys Arg Phe Gln Ala Leu Asn Gln Ser Leu Arg
980 985 990


Arg Gln Ile Gly Lys Lys Ala Pro Ala Lys Arg Asp Asp Ser Ile Pro
995 1000 1005


Asp Cys Cys Pro Asp Leu Leu Glu Lys Leu Asp His Met Lys Glu
1010 1015 1020


Gln Arg Val Asn Gln Thr Ala His Met Ile Leu Ala Glu Ala Leu
1025 1030 1035


Gly Leu Lys Leu Ala Glu Pro Pro Lys Asp Lys Lys Glu Leu Asn
1040 1045 1050


Glu Thr Cys Asp Met His Gly Ala Tyr Ala Lys Val Asp Asn Pro
1055 1060 1065


Val Ser Phe Ile Val Ile Glu Asp Leu Ser Arg Tyr Arg Ser Ser
1070 1075 1080


Gln Gly Arg Ser Pro Arg Glu Asn Ser Arg Leu Met Lys Trp Cys
1085 1090 1095


His Arg Ala Val Arg Asp Lys Leu Lys Glu Met Cys Glu Val Phe
1100 1105 1110


Phe Pro Leu Cys Glu Arg Arg Lys Ala Gly Ser Ala Trp Val Ser
1115 1120 1125


Leu Pro Pro Leu Leu Glu Thr Pro Ala Ala Tyr Ser Ser Arg Phe
1130 1135 1140


Cys Ser Arg Ser Gly Val Ala Gly Phe Arg Ala Val Glu Val Ile
1145 1150 1155


Pro Gly Phe Glu Leu Lys Tyr Pro Trp Ser Trp Leu Lys Asp Lys
1160 1165 1170


Lys Asp Lys Ala Gly Asn Leu Ala Lys Glu Ala Leu Asn Ile Arg
1175 1180 1185


Thr Val Ser Glu Gln Leu Lys Ala Phe Asn Gln Asp Lys Pro Glu
1190 1195 1200


Lys Pro Arg Thr Leu Leu Val Pro Ile Ala Gly Gly Pro Ile Phe
1205 1210 1215


Val Pro Ile Ser Glu Val Gly Leu Ser Ser Phe Gly Leu Lys Pro
1220 1225 1230


Gln Val Val Gln Ala Asp Ile Asn Ala Ala Ile Asn Leu Gly Leu
1235 1240 1245


Arg Ala Ile Ser Asp Pro Arg Ile Trp Glu Ile His Pro Arg Leu
1250 1255 1260


Arg Thr Glu Lys Arg Asp Gly Arg Leu Phe Ala Arg Glu Lys Arg
1265 1270 1275


Lys Tyr Gly Glu Glu Lys Val Glu Val Gln Pro Ser Lys Asn Glu
1280 1285 1290


Lys Ala Lys Lys Val Lys Asp Asp Arg Lys Pro Asn Tyr Phe Ala
1295 1300 1305


Asp Phe Ser Gly Lys Val Asp Trp Gly Phe Gly Asn Ile Lys Asn
1310 1315 1320


Glu Ser Gly Leu Thr Leu Val Ser Gly Lys Ala Leu Trp Trp Thr
1325 1330 1335


Ile Asn Gln Leu Gln Trp Glu Arg Cys Phe Asp Ile Asn Lys Arg
1340 1345 1350


His Ile Glu Asp Trp Ser Asn Lys Gln Lys Gln
1355 1360


<210> 488
<211> 1413
<212> PRT
<213> Unknown

<220>
<223> Uncultured organism

<400> 488

Met Asn Arg Ile Tyr Gln Gly Arg Val Thr Lys Val Glu Lys Leu Lys
1 5 10 15


Asn Gly Lys Ser Pro Asp Asp Arg Glu Glu Leu Lys Asp Trp Gln Thr
20 25 30


Ala Leu Trp Arg His His Glu Leu Phe Gln Asp Ala Val Ser Tyr Tyr
35 40 45


Thr Leu Ala Leu Ala Ala Met Ala Glu Gly Leu Pro Asp Lys His Pro
50 55 60


Ile Asn Val Leu Arg Lys Arg Met Glu Glu Ala Trp Glu Glu Phe Pro
65 70 75 80


Arg Lys Thr Val Thr Pro Ala Lys Asn Leu Arg Asp Ser Val Arg Pro
85 90 95


Trp Leu Gly Leu Ser Glu Ser Ala Ser Phe Gly Asp Ala Leu Lys Lys
100 105 110


Ile Leu Pro Pro Ala Pro Glu Asn Lys Glu Val Arg Ala Leu Ala Val
115 120 125


Ala Leu Leu Ala Glu Lys Ala Arg Thr Leu Lys Pro Gln Lys Thr Ser
130 135 140


Ala Ser Tyr Trp Gly Arg Phe Cys Asp Asp Leu Lys Lys Lys Pro Asn
145 150 155 160


Trp Asp Tyr Ser Glu Glu Glu Leu Ala Arg Lys Thr Gly Ser Gly Asp
165 170 175


Trp Val Ala Gly Leu Trp Ser Glu Asp Ala Leu Asn Lys Ile Asp Glu
180 185 190


Leu Ala Lys Ser Leu Lys Leu Ser Ser Leu Val Lys Cys Val Pro Asp
195 200 205


Gly Gln Ile Asn Pro Glu Gly Ala Arg Asn Leu Val Lys Glu Ala Leu
210 215 220


Asp His Leu Glu Gly Val Ser Asn Gly Thr Lys Lys Glu Lys Asn Asp
225 230 235 240


Pro Gly Pro Ala Lys Lys Thr Asn Asn Trp Leu Arg Gln His Ala Ser
245 250 255


Asp Val Arg Asn Phe Ile His Lys Asn Lys Asn Gln Phe Ser Ser Leu
260 265 270


Pro Asn Gly Arg Leu Ile Thr Glu Arg Ala Arg Gly Gly Gly Ile Asn
275 280 285


Ile Asn Lys Thr Tyr Ala Gly Val Leu Phe Lys Ala Phe Pro Cys Pro
290 295 300


Phe Thr Phe Asp Tyr Val Arg Ala Ala Val Pro Glu Pro Lys Val Lys
305 310 315 320


Lys Val Asp Gln Glu Lys Lys Ser Glu Gln Ser Ala Thr Trp Thr Glu
325 330 335


Leu Glu Lys Arg Ile Leu Arg Ile Gly Asp Asp Pro Ile Glu Leu Ala
340 345 350


Arg Lys Asn Asn Lys Pro Ile Phe Lys Ala Phe Thr Ala Leu Glu Lys
355 360 365


Trp Ser Asp Gln Asn Ser Lys Ser Cys Trp Ser Asp Phe Asp Lys Cys
370 375 380


Ala Phe Glu Glu Ala Leu Lys Thr Leu Asn Gln Phe Asn Gln Lys Thr
385 390 395 400


Glu Glu Arg Glu Lys Arg Arg Ser Glu Ala Glu Ala Glu Leu Lys Tyr
405 410 415


Met Met Asp Glu Asn Pro Glu Trp Lys Pro Lys Lys Glu Thr Glu Gly
420 425 430


Asp Asp Val Arg Glu Val Pro Ile Leu Lys Gly Asp Pro Arg Tyr Glu
435 440 445


Lys Leu Val Lys Leu Phe Gly Asp Leu Asp Glu Glu Gly Ser Glu His
450 455 460


Ala Thr Gly Lys Ile Tyr Gly Pro Ser Arg Ala Ser Leu Arg Gly Phe
465 470 475 480


Gly Lys Leu Arg Asn Glu Trp Val Asp Leu Phe Thr Lys Ala Asn Asp
485 490 495


Asn Pro Arg Glu Gln Asp Leu Gln Lys Ala Val Thr Gly Phe Gln Arg
500 505 510


Glu His Lys Leu Asp Met Gly Tyr Thr Ala Phe Phe Leu Lys Leu Cys
515 520 525


Glu Arg Asp Tyr Trp Asp Ile Trp Arg Asp Asp Thr Glu Val Glu Val
530 535 540


Lys Lys Ile Arg Glu Lys Arg Trp Val Lys Ser Val Val Tyr Ala Ala
545 550 555 560


Ala Asp Thr Arg Glu Leu Ala Glu Glu Leu Glu Arg Leu Gln Glu Pro
565 570 575


Val Arg Tyr Thr Pro Ala Glu Pro Gln Phe Ser Arg Arg Leu Phe Met
580 585 590


Phe Ser Asp Ile Lys Gly Lys Gln Gly Ala Lys His Ile Arg Glu Gly
595 600 605


Leu Val Glu Val Ser Leu Ala Val Lys Asp Gln Ser Gly Lys Tyr Gly
610 615 620


Thr Cys Arg Val Arg Leu His Tyr Ser Ala Pro Arg Leu Ile Arg Asp
625 630 635 640


His Leu Ser Asp Gly Ser Ser Ser Met Trp Leu Gln Pro Met Met Ala
645 650 655


Ala Leu Gly Leu Ser Ser Asp Ala Arg Gly Cys Phe Thr Arg Asp Ser
660 665 670


Lys Gly Asn Val Lys Glu Pro Ala Val Ala Leu Met Ser Asp Phe Val
675 680 685


Gly Arg Lys Arg Glu Leu Arg Met Leu Leu Asn Phe Pro Val Asp Leu
690 695 700


Asp Ile Ser Lys Leu Glu Glu Asn Ile Gly Lys Lys Ala Arg Trp Glu
705 710 715 720


Lys Gln Met Asn Thr Ala Tyr Glu Lys Asn Lys Leu Lys Gln Arg Phe
725 730 735


His Leu Ile Trp Pro Gly Met Glu Leu Lys Glu Thr Gln Glu Pro Gly
740 745 750


Gln Phe Trp Trp Asp Asn Pro Thr Ile Gln Lys Glu Gly Met Tyr Cys
755 760 765


Leu Ala Ile Asp Leu Ser Gln Arg Arg Ala Ala Asp Tyr Ala Leu Leu
770 775 780


His Ala Gly Val Asn Arg Asp Ser Lys Thr Phe Val Glu Leu Gly Gln
785 790 795 800


Ala Gly Gly Gln Ser Trp Phe Thr Lys Leu Cys Ala Ala Gly Ser Leu
805 810 815


Arg Leu Pro Gly Glu Asp Thr Glu Val Ile Arg Glu Gly Lys Arg Gln
820 825 830


Ile Glu Leu Ser Gly Lys Lys Gly Arg Asn Ala Thr Gln Ser Glu Tyr
835 840 845


Asp Gln Ala Ile Ala Leu Ala Lys Gln Leu Leu His Asn Glu Asn Ser
850 855 860


Ala Glu Leu Glu Ser Ala Ala Arg Asp Trp Leu Gly Asp Asn Ala Lys
865 870 875 880


Arg Phe Ser Phe Pro Glu Gln Asn Asp Lys Leu Ile Asp Leu Tyr Tyr
885 890 895


Gly Ala Leu Ser Arg Tyr Lys Thr Trp Leu Arg Trp Ser Trp Arg Leu
900 905 910


Thr Glu Gln His Lys Glu Leu Trp Asp Lys Thr Leu Asp Glu Ile Arg
915 920 925


Lys Val Pro Tyr Phe Ala Ser Trp Gly Glu Leu Ala Gly Asn Gly Thr
930 935 940


Asn Glu Ala Thr Val Gln Gln Leu Gln Lys Leu Ile Ala Asp Ala Ala
945 950 955 960


Val Asp Leu Arg Asn Phe Leu Glu Lys Ala Leu Leu His Ile Ala Tyr
965 970 975


Arg Ala Leu Pro Leu Arg Glu Asn Thr Trp Arg Trp Ile Glu Asn Gly
980 985 990


Lys Asp Gly Lys Gly Lys Pro Leu His Leu Leu Val Ser Asp Gly Gln
995 1000 1005


Ser Pro Ala Glu Ile Pro Trp Leu Arg Gly Gln Arg Gly Leu Ser
1010 1015 1020


Ile Ala Arg Ile Glu Gln Leu Glu Asn Phe Arg Arg Ala Val Leu
1025 1030 1035


Ser Leu Asn Arg Leu Leu Arg His Glu Ile Gly Thr Lys Pro Glu
1040 1045 1050


Phe Gly Ser Ser Thr Cys Gly Glu Ser Leu Pro Asp Pro Cys Pro
1055 1060 1065


Asp Leu Thr Asp Lys Ile Val Arg Leu Lys Glu Glu Arg Val Asn
1070 1075 1080


Gln Thr Ala His Leu Ile Ile Ala Gln Ser Leu Gly Val Arg Leu
1085 1090 1095


Lys Gly His Ser Leu Phe Thr Glu Glu Arg Glu Lys Ala Asp Met
1100 1105 1110


His Gly Glu His Glu Val Ile Pro Gly Arg Ser Pro Val Asp Phe
1115 1120 1125


Val Val Leu Glu Asp Leu Ser Arg Tyr Thr Thr Asp Lys Ser Arg
1130 1135 1140


Ser Arg Ser Glu Asn Ser Arg Leu Met Lys Trp Cys His Arg Lys
1145 1150 1155


Ile Asn Glu Lys Val Lys Leu Leu Ala Glu Pro Phe Gly Ile Pro
1160 1165 1170


Val Ile Glu Val Phe Ala Ser Tyr Ser Ser Lys Phe Asp Ala Arg
1175 1180 1185


Thr Gly Ala Pro Gly Phe Arg Ala Val Glu Val Thr Ser Glu Asp
1190 1195 1200


Arg Pro Phe Trp Arg Lys Thr Ile Glu Lys Gln Ser Val Ala Arg
1205 1210 1215


Glu Val Phe Asp Cys Leu Asp Asn Leu Val Gly Lys Gly Leu Asn
1220 1225 1230


Gly Ile His Leu Val Leu Pro Gln Asn Gly Gly Pro Leu Phe Ile
1235 1240 1245


Ala Ala Val Lys Glu Asp Gln Pro Leu Pro Ala Ile Arg Gln Ala
1250 1255 1260


Asp Ile Asn Ala Ala Val Asn Ile Gly Leu Arg Ala Ile Ala Gly
1265 1270 1275


Pro Ser Cys Tyr His Ala His Pro Lys Val Arg Leu Ile Lys Gly
1280 1285 1290


Glu Ser Gly Thr Asp Lys Gly Lys Trp Leu Pro Arg Lys Gly Lys
1295 1300 1305


Glu Ala Asn Lys Arg Glu Asn Ala Gln Phe Gly Asn Val Asp Leu
1310 1315 1320


Asp Leu Glu Val Lys Phe Asn Arg Leu Asp Ile Asp Ser Asp Val
1325 1330 1335


Leu Lys Gly Asp Asn Thr Asn Leu Phe His Asp Pro Leu Asn Ile
1340 1345 1350


Ala Cys Tyr Gly Phe Ala Thr Ile Gln Asn Leu Gln His Pro Phe
1355 1360 1365


Leu Ala His Ala Ser Ala Val Phe Ser Arg Gln Lys Gly Ala Val
1370 1375 1380


Ala Arg Leu Gln Trp Glu Val Cys Arg Ala Ile Asn Ser Arg Arg
1385 1390 1395


Leu Glu Ala Trp Gln Lys Lys Ala Glu Lys Ala Ala Val Lys Arg
1400 1405 1410


<210> 489
<211> 747
<212> PRT
<213> Unknown

<220>
<223> Bacterium in the Phycisphaerae family

<400> 489

Met Ala Thr Lys Ser Tyr Arg Ala Arg Ile Leu Thr Asp Ser Arg Leu
1 5 10 15


Ala Ala Ala Leu Asp Arg Thr His Val Val Phe Val Glu Ser Leu Lys
20 25 30


Gln Met Ile Asn Thr Tyr Leu Arg Met Gln Asn Gly Lys Phe Gly Pro
35 40 45


Asp His Lys Lys Leu Ala Gln Ile Met Leu Ser Arg Ser Asn Thr Phe
50 55 60


Ala His Gly Val Met Asp Gln Ile Thr Arg Asp Gln Pro Thr Ser Thr
65 70 75 80


Leu Asp Glu Glu Trp Thr Asp Leu Ala Arg Arg Ile His Lys Thr Thr
85 90 95


Gly Pro Leu Phe Leu Gln Ala Glu Arg Phe Ala Thr Val Lys Asn Arg
100 105 110


Ala Ile His Thr Lys Ser Arg Gly Lys Val Ile Pro Ser Pro Glu Thr
115 120 125


Leu Ala Val Pro Ala Lys Phe Trp His Gln Val Cys Asp Ser Ala Ser
130 135 140


Ala Tyr Ile Arg Ser Asn Arg Glu Leu Met Gln Gln Trp Arg Lys Asp
145 150 155 160


Arg Ala Ala Trp Leu Lys Asp Lys Asn Glu Trp Gln Gln Lys His Pro
165 170 175


Glu Phe Met Gln Phe Tyr Asn Gly Pro Tyr Gln Asn Phe Leu Lys Leu
180 185 190


Cys Asp Asp Asp Arg Ile Thr Ser Gln Leu Ala Ala Glu Gln Gln Pro
195 200 205


Thr Ala Ser Lys Asn Asn Arg Pro Arg Lys Thr Gly Lys Arg Phe Ala
210 215 220


Arg Trp His Leu Trp Tyr Lys Trp Leu Ser Glu Asn Pro Glu Ile Ile
225 230 235 240


Glu Trp Arg Asn Lys Ala Ser Ala Ser Asp Phe Lys Thr Val Thr Asp
245 250 255


Asp Val Arg Lys Gln Ile Ile Thr Lys Tyr Pro Gln Gln Asn Lys Tyr
260 265 270


Ile Thr Arg Leu Leu Asp Trp Leu Glu Asp Asn Asn Pro Glu Leu Lys
275 280 285


Thr Leu Glu Asn Leu Arg Arg Thr Tyr Val Lys Lys Phe Asp Ser Phe
290 295 300


Lys Arg Pro Pro Thr Leu Thr Leu Pro Ser Pro Tyr Arg His Pro Tyr
305 310 315 320


Trp Phe Thr Met Glu Leu Asp Gln Phe Tyr Lys Lys Ala Asp Phe Glu
325 330 335


Asn Gly Thr Ile Gln Leu Leu Leu Ile Asp Glu Asp Asp Asp Gly Asn
340 345 350


Trp Phe Phe Asn Trp Met Pro Ala Ser Leu Lys Pro Asp Pro Arg Leu
355 360 365


Val Pro Ser Trp Arg Ala Glu Thr Phe Glu Thr Glu Gly Arg Phe Pro
370 375 380


Pro Tyr Leu Gly Gly Lys Ile Gly Lys Lys Leu Ser Arg Pro Ala Pro
385 390 395 400


Thr Asp Ala Glu Arg Lys Ala Gly Ile Ala Gly Ala Lys Leu Met Ile
405 410 415


Lys Asn Asn Arg Ser Glu Leu Leu Phe Thr Val Phe Glu Gln Asp Cys
420 425 430


Pro Pro Arg Val Lys Trp Ala Lys Thr Lys Asn Arg Lys Cys Pro Ala
435 440 445


Asp Asn Ala Phe Ser Ser Asp Gly Lys Thr Arg Lys Pro Leu Arg Ile
450 455 460


Leu Ser Ile Asp Leu Gly Ile Arg His Ile Gly Ala Phe Ala Leu Thr
465 470 475 480


Gln Gly Thr Arg Asn Asp Ser Ala Trp Gln Thr Glu Ser Leu Lys Lys
485 490 495


Gly Ile Ile Asn Ser Pro Ser Ile Pro Pro Leu Arg Gln Val Arg Arg
500 505 510


His Asp Tyr Asp Leu Lys Arg Lys Arg Arg Arg His Gly Lys Pro Val
515 520 525


Lys Gly Gln Arg Ser Asn Ala Asn Leu Gln Ala His Arg Thr Asn Met
530 535 540


Ala Gln Asp Arg Phe Lys Lys Gly Ala Ser Ala Ile Val Ser Leu Ala
545 550 555 560


Arg Glu His Ser Ala Asp Leu Ile Leu Phe Glu Asn Leu His Ser Leu
565 570 575


Lys Phe Ser Ala Phe Asp Glu Arg Trp Met Asn Arg Gln Leu Arg Asp
580 585 590


Met Asn Arg Arg His Ile Val Glu Leu Val Ser Glu Gln Ala Pro Glu
595 600 605


Phe Gly Ile Thr Val Lys Asp Asp Ile Asn Pro Trp Met Thr Ser Arg
610 615 620


Ile Cys Ser Asn Cys Asn Leu Pro Gly Phe Arg Phe Ser Met Lys Lys
625 630 635 640


Lys Asn Pro Tyr Arg Glu Lys Leu Pro Arg Glu Lys Cys Thr Asp Phe
645 650 655


Gly Tyr Pro Val Trp Glu Pro Gly Gly His Leu Phe Arg Cys Pro His
660 665 670


Cys Asp His Arg Val Asn Ala Asp Ile Asn Ala Ala Ala Asn Leu Ala
675 680 685


Asn Lys Phe Phe Gly Leu Gly Tyr Trp Asn Asn Gly Leu Lys Tyr Asp
690 695 700


Ala Glu Thr Lys Thr Phe Thr Val His Thr Asp Lys Lys Thr Pro Pro
705 710 715 720


Leu Ile Phe Lys Pro Arg Pro Gln Phe Asp Leu Trp Ala Asp Ser Val
725 730 735


Lys Thr Arg Lys Gln Leu Gly Pro Asp Pro Phe
740 745


<210> 490
<211> 743
<212> PRT
<213> Unknown

<220>
<223> Member of the Planctomycetes phylum

<400> 490

Met Ser Val Arg Ser Phe Gln Ala Arg Val Glu Cys Asp Lys Gln Thr
1 5 10 15


Met Glu His Leu Trp Arg Thr His Lys Val Phe Asn Glu Arg Leu Pro
20 25 30


Glu Ile Ile Lys Ile Leu Phe Lys Met Lys Arg Gly Glu Cys Gly Gln
35 40 45


Asn Asp Lys Gln Lys Ser Leu Tyr Lys Ser Ile Ser Gln Ser Ile Leu
50 55 60


Glu Ala Asn Ala Gln Asn Ala Asp Tyr Leu Leu Asn Ser Val Ser Ile
65 70 75 80


Lys Gly Trp Lys Pro Gly Thr Ala Lys Lys Tyr Arg Asn Ala Ser Phe
85 90 95


Thr Trp Ala Asp Asp Ala Ala Lys Leu Ser Ser Gln Gly Ile His Val
100 105 110


Tyr Asp Lys Lys Gln Val Leu Gly Asp Leu Pro Gly Met Met Ser Gln
115 120 125


Met Val Cys Arg Gln Ser Val Glu Ala Ile Ser Gly His Ile Glu Leu
130 135 140


Thr Lys Lys Trp Glu Lys Glu His Asn Glu Trp Leu Lys Glu Lys Glu
145 150 155 160


Lys Trp Glu Ser Glu Asp Glu His Lys Lys Tyr Leu Asp Leu Arg Glu
165 170 175


Lys Phe Glu Gln Phe Glu Gln Ser Ile Gly Gly Lys Ile Thr Lys Arg
180 185 190


Arg Gly Arg Trp His Leu Tyr Leu Lys Trp Leu Ser Asp Asn Pro Asp
195 200 205


Phe Ala Ala Trp Arg Gly Asn Lys Ala Val Ile Asn Pro Leu Ser Glu
210 215 220


Lys Ala Gln Ile Arg Ile Asn Lys Ala Lys Pro Asn Lys Lys Asn Ser
225 230 235 240


Val Glu Arg Asp Glu Phe Phe Lys Ala Asn Pro Glu Met Lys Ala Leu
245 250 255


Asp Asn Leu His Gly Tyr Tyr Glu Arg Asn Phe Val Arg Arg Arg Lys
260 265 270


Thr Lys Lys Asn Pro Asp Gly Phe Asp His Lys Pro Thr Phe Thr Leu
275 280 285


Pro His Pro Thr Ile His Pro Arg Trp Phe Val Phe Asn Lys Pro Lys
290 295 300


Thr Asn Pro Glu Gly Tyr Arg Lys Leu Ile Leu Pro Lys Lys Ala Gly
305 310 315 320


Asp Leu Gly Ser Leu Glu Met Arg Leu Leu Thr Gly Glu Lys Asn Lys
325 330 335


Gly Asn Tyr Pro Asp Asp Trp Ile Ser Val Lys Phe Lys Ala Asp Pro
340 345 350


Arg Leu Ser Leu Ile Arg Pro Val Lys Gly Arg Arg Val Val Arg Lys
355 360 365


Gly Lys Glu Gln Gly Gln Thr Lys Glu Thr Asp Ser Tyr Glu Phe Phe
370 375 380


Asp Lys His Leu Lys Lys Trp Arg Pro Ala Lys Leu Ser Gly Val Lys
385 390 395 400


Leu Ile Phe Pro Asp Lys Thr Pro Lys Ala Ala Tyr Leu Tyr Phe Thr
405 410 415


Cys Asp Ile Pro Asp Glu Pro Leu Thr Glu Thr Ala Lys Lys Ile Gln
420 425 430


Trp Leu Glu Thr Gly Asp Val Thr Lys Lys Gly Lys Lys Arg Lys Lys
435 440 445


Lys Val Leu Pro His Gly Leu Val Ser Cys Ala Val Asp Leu Ser Met
450 455 460


Arg Arg Gly Thr Thr Gly Phe Ala Thr Leu Cys Arg Tyr Glu Asn Gly
465 470 475 480


Lys Ile His Ile Leu Arg Ser Arg Asn Leu Trp Val Gly Tyr Lys Glu
485 490 495


Gly Lys Gly Cys His Pro Tyr Arg Trp Thr Glu Gly Pro Asp Leu Gly
500 505 510


His Ile Ala Lys His Lys Arg Glu Ile Arg Ile Leu Arg Ser Lys Arg
515 520 525


Gly Lys Pro Val Lys Gly Glu Glu Ser His Ile Asp Leu Gln Lys His
530 535 540


Ile Asp Tyr Met Gly Glu Asp Arg Phe Lys Lys Ala Ala Arg Thr Ile
545 550 555 560


Val Asn Phe Ala Leu Asn Thr Glu Asn Ala Ala Ser Lys Asn Gly Phe
565 570 575


Tyr Pro Arg Ala Asp Val Leu Leu Leu Glu Asn Leu Glu Gly Leu Ile
580 585 590


Pro Asp Ala Glu Lys Glu Arg Gly Ile Asn Arg Ala Leu Ala Gly Trp
595 600 605


Asn Arg Arg His Leu Val Glu Arg Val Ile Glu Met Ala Lys Asp Ala
610 615 620


Gly Phe Lys Arg Arg Val Phe Glu Ile Pro Pro Tyr Gly Thr Ser Gln
625 630 635 640


Val Cys Ser Lys Cys Gly Ala Leu Gly Arg Arg Tyr Ser Ile Ile Arg
645 650 655


Glu Asn Asn Arg Arg Glu Ile Arg Phe Gly Tyr Val Glu Lys Leu Phe
660 665 670


Ala Cys Pro Asn Cys Gly Tyr Cys Ala Asn Ala Asp His Asn Ala Ser
675 680 685


Val Asn Leu Asn Arg Arg Phe Leu Ile Glu Asp Ser Phe Lys Ser Tyr
690 695 700


Tyr Asp Trp Lys Arg Leu Ser Glu Lys Lys Gln Lys Glu Glu Ile Glu
705 710 715 720


Thr Ile Glu Ser Lys Leu Met Asp Lys Leu Cys Ala Met His Lys Ile
725 730 735


Ser Arg Gly Ser Ile Ser Lys
740


<210> 491
<211> 1119
<212> PRT
<213> Unknown

<220>
<223> Member of the Spirochaetes phylum

<400> 491

Met Ser Phe Thr Ile Ser Tyr Pro Phe Lys Leu Ile Ile Lys Asn Lys
1 5 10 15


Asp Glu Ala Lys Ala Leu Leu Asp Thr His Gln Tyr Met Asn Glu Gly
20 25 30


Val Lys Tyr Tyr Leu Glu Lys Leu Leu Met Phe Arg Gln Glu Lys Ile
35 40 45


Phe Ile Gly Glu Asp Glu Thr Gly Lys Arg Ile Tyr Ile Glu Glu Thr
50 55 60


Glu Tyr Lys Lys Gln Ile Glu Glu Phe Tyr Leu Ile Lys Lys Thr Glu
65 70 75 80


Leu Gly Arg Asn Leu Thr Leu Thr Leu Asp Glu Phe Lys Thr Leu Met
85 90 95


Arg Glu Leu Tyr Ile Cys Leu Val Ser Ser Ser Met Glu Asn Lys Lys
100 105 110


Gly Phe Pro Asn Ala Gln Gln Ala Ser Leu Asn Ile Phe Ser Pro Leu
115 120 125


Phe Asp Ala Glu Ser Lys Gly Tyr Ile Leu Lys Glu Glu Asn Asn Asn
130 135 140


Ile Ser Leu Ile His Lys Asp Tyr Gly Lys Ile Leu Leu Lys Arg Leu
145 150 155 160


Arg Asp Asn Asn Leu Ile Pro Ile Phe Thr Lys Phe Thr Asp Ile Lys
165 170 175


Lys Ile Thr Ala Lys Leu Ser Pro Thr Ala Leu Asp Arg Met Ile Phe
180 185 190


Ala Gln Ala Ile Glu Lys Leu Leu Ser Tyr Glu Ser Trp Cys Lys Leu
195 200 205


Met Ile Lys Glu Arg Phe Asp Lys Glu Val Lys Ile Lys Glu Leu Glu
210 215 220


Asn Lys Cys Glu Asn Lys Gln Glu Arg Asp Lys Ile Phe Glu Ile Leu
225 230 235 240


Glu Lys Tyr Glu Glu Glu Arg Gln Lys Thr Phe Glu Gln Asp Ser Gly
245 250 255


Phe Ala Lys Lys Gly Lys Phe Tyr Ile Thr Gly Arg Met Leu Lys Gly
260 265 270


Phe Asp Glu Ile Lys Glu Lys Trp Leu Lys Glu Lys Asp Arg Ser Glu
275 280 285


Gln Asn Leu Ile Asn Ile Leu Asn Lys Tyr Gln Thr Asp Asn Ser Lys
290 295 300


Leu Val Gly Asp Arg Asn Leu Phe Glu Phe Ile Ile Lys Leu Glu Asn
305 310 315 320


Gln Cys Leu Trp Asn Gly Asp Ile Asp Tyr Leu Lys Ile Lys Arg Asp
325 330 335


Ile Asn Lys Asn Gln Ile Trp Leu Asp Arg Pro Glu Met Pro Arg Phe
340 345 350


Thr Met Pro Asp Phe Lys Lys His Pro Leu Trp Tyr Arg Tyr Glu Asp
355 360 365


Pro Ser Asn Ser Asn Phe Arg Asn Tyr Lys Ile Glu Val Val Lys Asp
370 375 380


Glu Asn Tyr Ile Thr Ile Pro Leu Ile Thr Glu Arg Asn Asn Glu Tyr
385 390 395 400


Phe Glu Glu Asn Tyr Thr Phe Asn Leu Ala Lys Leu Lys Lys Leu Ser
405 410 415


Glu Asn Ile Thr Phe Ile Pro Lys Ser Lys Asn Lys Glu Phe Glu Phe
420 425 430


Ile Asp Ser Asn Asp Glu Glu Glu Asp Lys Lys Asp Gln Lys Lys Ser
435 440 445


Lys Gln Tyr Ile Lys Tyr Cys Asp Thr Ala Lys Asn Thr Ser Tyr Gly
450 455 460


Lys Ser Gly Gly Ile Arg Leu Tyr Phe Asn Arg Asn Glu Leu Glu Asn
465 470 475 480


Tyr Lys Asp Gly Lys Lys Met Asp Ser Tyr Thr Val Phe Thr Leu Ser
485 490 495


Ile Arg Asp Tyr Lys Ser Leu Phe Ala Lys Glu Lys Leu Gln Pro Gln
500 505 510


Ile Phe Asn Thr Val Asp Asn Lys Ile Thr Ser Leu Lys Ile Gln Lys
515 520 525


Lys Phe Gly Asn Glu Glu Gln Thr Asn Phe Leu Ser Tyr Phe Thr Gln
530 535 540


Asn Gln Ile Thr Lys Lys Asp Trp Met Asp Glu Lys Thr Phe Gln Asn
545 550 555 560


Val Lys Glu Leu Asn Glu Gly Ile Arg Val Leu Ser Val Asp Leu Gly
565 570 575


Gln Arg Phe Phe Ala Ala Val Ser Cys Phe Glu Ile Met Ser Glu Ile
580 585 590


Asp Asn Asn Lys Leu Phe Phe Asn Leu Asn Asp Gln Asn His Lys Ile
595 600 605


Ile Arg Ile Asn Asp Lys Asn Tyr Tyr Ala Lys His Ile Tyr Ser Lys
610 615 620


Thr Ile Lys Leu Ser Gly Glu Asp Asp Asp Leu Tyr Lys Glu Arg Lys
625 630 635 640


Ile Asn Lys Asn Tyr Lys Leu Ser Tyr Gln Glu Arg Lys Asn Lys Ile
645 650 655


Gly Ile Phe Thr Arg Gln Ile Asn Lys Leu Asn Gln Leu Leu Lys Ile
660 665 670


Ile Arg Asn Asp Glu Ile Asp Lys Glu Lys Phe Lys Glu Leu Ile Glu
675 680 685


Thr Thr Lys Arg Tyr Val Lys Asn Thr Tyr Asn Asp Gly Ile Ile Asp
690 695 700


Trp Asn Asn Val Asp Asn Lys Ile Leu Ser Tyr Glu Asn Lys Glu Asp
705 710 715 720


Val Ile Asn Leu His Lys Glu Leu Asp Lys Lys Leu Glu Ile Asp Phe
725 730 735


Lys Glu Phe Ile Arg Glu Cys Arg Lys Pro Ile Phe Arg Ser Gly Gly
740 745 750


Leu Ser Met Gln Arg Ile Asp Phe Leu Glu Lys Leu Asn Lys Leu Lys
755 760 765


Arg Lys Trp Val Ala Arg Thr Gln Lys Ser Ala Glu Ser Ile Val Leu
770 775 780


Thr Pro Lys Phe Gly Tyr Lys Leu Lys Glu His Ile Asn Glu Leu Lys
785 790 795 800


Asp Asn Arg Val Lys Gln Gly Val Asn Tyr Ile Leu Met Thr Ala Leu
805 810 815


Gly Tyr Ile Lys Asp Asn Glu Ile Lys Asn Asp Ser Lys Lys Lys Gln
820 825 830


Lys Glu Asp Trp Val Lys Lys Asn Arg Ala Cys Gln Ile Ile Leu Met
835 840 845


Glu Lys Leu Thr Glu Tyr Thr Phe Ala Glu Asp Arg Pro Arg Glu Glu
850 855 860


Asn Ser Lys Leu Arg Met Trp Ser His Arg Gln Ile Phe Asn Phe Leu
865 870 875 880


Gln Gln Lys Ala Ser Leu Trp Gly Ile Leu Val Gly Asp Val Phe Ala
885 890 895


Pro Tyr Thr Ser Lys Cys Leu Ser Asp Asn Asn Ala Pro Gly Ile Arg
900 905 910


Cys His Gln Val Thr Lys Lys Asp Leu Ile Asp Asn Ser Trp Phe Leu
915 920 925


Lys Ile Val Val Lys Asp Asp Ala Phe Cys Asp Leu Ile Glu Ile Asn
930 935 940


Lys Glu Asn Val Lys Asn Lys Ser Ile Lys Ile Asn Asp Ile Leu Pro
945 950 955 960


Leu Arg Gly Gly Glu Leu Phe Ala Ser Ile Lys Asp Gly Lys Leu His
965 970 975


Ile Val Gln Ala Asp Ile Asn Ala Ser Arg Asn Ile Ala Lys Arg Phe
980 985 990


Leu Ser Gln Ile Asn Pro Phe Arg Val Val Leu Lys Lys Asp Lys Asp
995 1000 1005


Glu Thr Phe His Leu Lys Asn Glu Pro Asn Tyr Leu Lys Asn Tyr
1010 1015 1020


Tyr Ser Ile Leu Asn Phe Val Pro Thr Asn Glu Glu Leu Thr Phe
1025 1030 1035


Phe Lys Val Glu Glu Asn Lys Asp Ile Lys Pro Thr Lys Arg Ile
1040 1045 1050


Lys Met Asp Lys His Glu Lys Glu Ser Thr Asp Glu Gly Asp Asp
1055 1060 1065


Tyr Ser Lys Asn Gln Ile Ala Leu Phe Arg Asp Asp Ser Gly Ile
1070 1075 1080


Phe Phe Asp Lys Ser Leu Trp Val Asp Gly Lys Ile Phe Trp Ser
1085 1090 1095


Val Val Lys Asn Lys Met Thr Lys Leu Leu Arg Glu Arg Asn Asn
1100 1105 1110


Lys Lys Asn Gly Ser Lys
1115


<210> 492
<211> 1447
<212> PRT
<213> Unknown

<220>
<223> Member of the phylum Verrucomicrobiaceae

<400> 492

Met Pro Leu Ser Arg Ile Tyr Gln Gly Arg Thr Asn Ser Leu Ile Ile
1 5 10 15


Leu Thr Pro Thr Pro Gln Glu Pro Trp Asp His Lys Ala Leu Ala Arg
20 25 30


Phe Asp Ser Pro Leu Trp Arg His His Ala Leu Phe Gln Asp Ala Val
35 40 45


Asn Tyr Tyr Gln Leu Cys Leu Val Ala Leu Ala Ser Ser Asp Gly Thr
50 55 60


Arg Pro Leu Ser Lys Leu His Glu Gln Met Lys Ala Ser Trp Asp Glu
65 70 75 80


Ala Lys Thr Asp Thr Glu Asp Ser Trp Arg Val Arg Leu Ala Arg Arg
85 90 95


Leu Gly Ile Pro Ala Ala Ser Leu Phe Glu Ala Ala Leu Ala Lys Val
100 105 110


Leu Glu Gly Asn Glu Ala Pro Glu Arg Ala Arg Glu Leu Ala Gly Glu
115 120 125


Leu Leu Leu Asp Lys Ile Glu Gly Asp Ile Gln Gln Ala Gly Arg Gly
130 135 140


Tyr Trp Pro Arg Phe Cys Asp Pro Lys Ala Asn Pro Thr Tyr Asp Tyr
145 150 155 160


Ser Ala Thr Ala Arg Ala Ser Ala Ser Gly Leu Thr Lys Leu Ala Ala
165 170 175


Val Ile His Ala Glu Asn Val Thr Glu Glu Ala Leu Lys Gln Val Ala
180 185 190


Ala Glu Met Asp Leu Ser Trp Thr Val Lys Leu Gln Pro Asp Lys Asn
195 200 205


Phe Val Gly Ala Glu Ala Arg Ala Arg Leu Leu Glu Ala Ala His His
210 215 220


Phe Ile Lys Val Ala Glu Ser Pro Pro Thr Lys Leu Ala Glu Val Leu
225 230 235 240


Ala Arg Phe Pro Asp Gly Leu Ala Leu Trp Gln Ala Leu Pro Glu Lys
245 250 255


Ile Ala Ala Leu Pro Glu Glu Thr Gln Val Pro Arg Asn Arg Lys Ala
260 265 270


Ser Pro Asp Leu Thr Phe Ala Thr Leu Leu Phe Gln His Phe Pro Ser
275 280 285


Leu Phe Thr Ala Ala Val Leu Gly Leu Ser Val Gly Lys Pro Lys Ser
290 295 300


Val Lys Ala Pro Lys Val Val Glu Lys Val Ser Ala Arg Arg Lys Ala
305 310 315 320


Asn Ala Val Thr Gln Ala Val Val Ile Glu Glu Pro Glu Ile Asp Phe
325 330 335


Ala Glu Leu Gly Asp Asp Pro Ile Lys Leu Ala Arg Gly Glu Arg Gly
340 345 350


Phe Val Phe Pro Ala Phe Thr Ser Leu Ser Phe Trp Ala Val Pro Gly
355 360 365


Pro His Val Pro Val Trp Lys Glu Phe Asp Ile Ala Ala Phe Lys Glu
370 375 380


Ala Leu Lys Thr Val Asn Gln Phe Lys Leu Lys Thr Ser Glu Arg Asn
385 390 395 400


Ala Leu Leu Ala Glu Ala Gln Arg Arg Leu Asp Tyr Met Asp Glu Lys
405 410 415


Thr His Asp Trp Lys Thr Gly Asp Ser Asp Glu Pro Gly His Ile Pro
420 425 430


Pro Arg Leu Lys Ser Asp Pro Asn Phe Thr Leu Ile Gln Ala Leu Thr
435 440 445


Gln Asp Glu Gly Val Ser Asn Lys Ala Thr Gly Asp Gln His Ile Pro
450 455 460


Lys Gly Val Tyr Thr Gly Gly Leu Arg Gly Phe Tyr Ala Ile Lys Lys
465 470 475 480


Asp Trp Cys Glu Leu Trp Glu Arg Lys Ala Asp Lys Ser Gln Gly Thr
485 490 495


Pro Thr Glu Glu Glu Leu Ile Ser Ile Val Thr Asp Tyr Gln Arg Asp
500 505 510


His Val Tyr Asp Val Gly Asp Val Gly Leu Phe Arg Ala Leu Cys Glu
515 520 525


Pro Arg Phe Trp Pro Leu Trp Gln Pro Leu Thr Asp Glu Gln Glu Ala
530 535 540


Glu Arg Ile Lys Ala Gly Arg Ala Lys Asp Met Ile Ser Ala Tyr Arg
545 550 555 560


Val Trp Leu Glu Leu Gln Glu Asp Val Val Arg Leu Ala Gln Pro Ile
565 570 575


Arg Phe Thr Pro Ala His Ala Glu Asn Ser Arg Arg Leu Phe Met Phe
580 585 590


Ser Asp Ile Ser Gly Ser His Gly Ala Glu Phe Gly Ser Asp Gly Lys
595 600 605


Ser Leu Glu Val Ser Ile Ala Tyr Asp Val Asp Gly Lys Leu Gln Pro
610 615 620


Val Arg Ala Lys Leu Glu Phe Ser Ala Pro Arg Ala Ala Arg Asp Glu
625 630 635 640


Leu Glu Gly Leu Ser Gly Gly Ser Glu Ser Met Arg Trp Phe Gln Pro
645 650 655


Met Met Lys Ala Leu Asp Cys Pro Glu Val Glu Met Pro Ala Leu Glu
660 665 670


Lys Cys Ala Val Ser Leu Met Pro Asp Val Val Lys Lys Gly Gly Gly
675 680 685


Lys Trp Val Arg Leu Leu Leu Asn Phe Pro Ala Thr Leu Glu Pro Glu
690 695 700


Gly Leu Ile Arg His Ile Gly Lys Gln Ala Met Trp Tyr Lys Gln Phe
705 710 715 720


Asn Gly Thr Tyr Lys Pro Arg Thr Gln Gln Leu Asp Thr Gly Leu His
725 730 735


Leu Tyr Trp Pro Gly Leu Glu Lys Ala Pro Glu Ala Glu Asp Ala Ala
740 745 750


Ala Trp Trp Asn Arg Glu Glu Ile Arg Ala Lys Gly Phe Ser Val Leu
755 760 765


Ser Val Asp Leu Gly Gln Arg Asp Ala Gly Ala Trp Ala Leu Leu Glu
770 775 780


Ser Arg Ser Asp Lys Ala Phe Ser Arg Asn Arg Gln Pro Phe Ile Glu
785 790 795 800


Leu Gly Glu Ala Gly Gly Lys Leu Trp Ser Thr Ala Leu Leu Gly Leu
805 810 815


Gly Met Leu Arg Leu Pro Gly Glu Asp Ala Arg Thr Gly Ala Leu Asp
820 825 830


Asp Gln Gly Lys Arg Ala Val Glu Phe His Gly Lys Ala Gly Arg Asn
835 840 845


Ala Leu Glu Ala Glu Trp Gln Glu Ala Arg Glu Met Ala Leu Leu Phe
850 855 860


Gly Gly Glu Glu Ala Lys Ser Arg Leu Gly Pro Gly Phe Asp His Leu
865 870 875 880


Ser His Ser Lys Gln Asn Glu Glu Leu Leu Arg Ile Leu Ser Arg Ala
885 890 895


Gln Ser Arg Leu Ala Arg Phe His Arg Trp Ser Cys Arg Ile His Glu
900 905 910


Lys Pro Glu Ala Thr Gly Asp Asp Val Ile Asp Tyr Gly Gln Val Asp
915 920 925


Glu Leu Leu Thr Lys Thr Ala Glu Ala Met Leu Glu Asn Leu Lys Ala
930 935 940


Leu Tyr Thr Asn Ala Gly Gly Ile Leu Asp Ser Lys Ser Lys Gln Pro
945 950 955 960


Leu Thr Leu Val Gly Leu Arg Lys Lys Leu Glu Ala Gln Lys Val Glu
965 970 975


Pro Glu Lys Ile Ala Ala Val Leu Lys Pro His Ala Glu Ile Ile Phe
980 985 990


Gln Arg Leu Gly Thr Leu Ile Pro Glu Leu Lys Gln His Leu Arg Val
995 1000 1005


Ser Leu Glu Arg Leu Ala Asn Arg Glu Leu Pro Leu Arg His Arg
1010 1015 1020


Glu Trp Val Trp Asn Glu Ala Phe Glu Lys Leu Glu Gln Gly Asn
1025 1030 1035


Phe Lys Lys Glu Glu Asn Pro Lys Trp Ile Arg Gly Gln Arg Gly
1040 1045 1050


Leu Ser Met Ala Arg Ile Glu Gln Ile Glu Asn Leu Arg Lys Arg
1055 1060 1065


Phe Met Ser Leu Arg Arg Gln Met Ser Leu Ile Pro Gly Glu Gln
1070 1075 1080


Val Lys Gln Gly Val Glu Asp Lys Gly Gln Arg Gln Pro Glu Pro
1085 1090 1095


Cys Glu Asp Ile Leu Asn Lys Leu Asp Arg Met Lys Gln Gln Arg
1100 1105 1110


Val Asn Gln Thr Ala His Leu Ile Leu Ala Gln Ala Leu Gly Leu
1115 1120 1125


Arg Leu Arg Pro His Leu Ala Asn Asp Ala Glu Arg Glu Glu Lys
1130 1135 1140


Asp Ile His Gly Glu Tyr Glu Leu Ile Pro Gly Arg Lys Pro Val
1145 1150 1155


Asp Phe Ile Val Met Glu Asp Leu Ser Arg Tyr Leu Ser Ser Gln
1160 1165 1170


Gly Arg Ala Pro Ser Glu Asn Gly Arg Leu Met Lys Trp Cys His
1175 1180 1185


Arg Ala Val Leu Ala Lys Leu Lys Gln Met Cys Glu Pro Phe Gly
1190 1195 1200


Ile Pro Val Leu Glu Val Pro Ala Ala Tyr Ser Ser Arg Phe Cys
1205 1210 1215


Ala Leu Thr Gly Val Pro Gly Phe Arg Ala Val Glu Val His Asp
1220 1225 1230


Gly Asn Ala Glu Asp Phe Arg Trp Lys Arg Leu Ile Lys Lys Ala
1235 1240 1245


Glu Lys Asp Lys Ser Ser Lys Asp Ala Glu Ala Ala Ala Met Leu
1250 1255 1260


Phe Asp Gln Leu His Asp Leu Asn Ile Glu Ala Arg Glu Ala Arg
1265 1270 1275


Lys Gln Asp Lys Lys Leu Pro Leu Arg Thr Leu Phe Ala Pro Val
1280 1285 1290


Ala Gly Gly Pro Leu Phe Ile Pro Met Val Gly Gly Gly Pro Arg
1295 1300 1305


Gln Ala Asp Met Asn Ala Ala Ile Asn Leu Gly Leu Arg Ala Ile
1310 1315 1320


Ala Ser Pro Thr Cys Leu Arg Ala Arg Pro Lys Ile Arg Ala Glu
1325 1330 1335


Leu Lys Asp Gly Lys His Gln Ala Met Leu Gly Asn Lys Leu Glu
1340 1345 1350


Lys Ala Ala Ala Leu Thr Leu Glu Pro Pro Lys Glu Pro Thr Lys
1355 1360 1365


Glu Leu Ala Ala Gln Lys Arg Thr Asn Phe Phe Leu Asp Glu Lys
1370 1375 1380


Phe Val Gly Lys Phe Asp Thr Ala His Val Thr Thr Ser Gly Lys
1385 1390 1395


Lys Leu Arg Leu Ser Gly Gly Met Ser Leu Trp Lys Ala Ile Lys
1400 1405 1410


Asp Gly Ala Trp Gln Arg Val Lys Lys Ile Asn Asp Ala Arg Ile
1415 1420 1425


Ala Lys Trp Lys Asn Asn Pro Pro Pro Glu Pro Asp Pro Asp Asp
1430 1435 1440


Glu Ile Gln Phe
1445


<210> 493
<211> 1147
<212> PRT
<213> Alicyclobacillus kakegawensis

<400> 493

Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Ser Glu Cys Pro
1 5 10 15


Asp Ile Leu Ala Gly Met Trp Gln Leu His Arg Ala Thr Asn Ala Gly
20 25 30


Val Arg Tyr Tyr Thr Glu Trp Val Ser Leu Met Arg Gln Glu Ile Leu
35 40 45


Tyr Ser Arg Gly Pro Asp Gly Gly Gln Gln Cys Tyr Met Thr Ala Glu
50 55 60


Asp Cys Gln Arg Glu Leu Leu Arg Arg Leu Arg Asn Arg Gln Leu His
65 70 75 80


Asn Gly Arg Gln Asp Gln Pro Gly Thr Asp Ala Asp Leu Leu Ala Ile
85 90 95


Ser Arg Arg Leu Tyr Glu Ile Leu Val Leu Gln Ser Ile Gly Lys Arg
100 105 110


Gly Asp Ala Gln Gln Ile Ala Ser Ser Phe Leu Ser Pro Leu Val Asp
115 120 125


Pro Asn Ser Lys Gly Gly Arg Gly Glu Ala Lys Ser Gly Arg Lys Pro
130 135 140


Ala Trp Gln Lys Met Arg Asp Gln Gly Asp Pro Arg Trp Val Ala Ala
145 150 155 160


Arg Glu Lys Tyr Glu Gln Arg Lys Ala Val Asp Pro Ser Lys Glu Ile
165 170 175


Leu Asn Ser Leu Asp Ala Leu Gly Leu Arg Pro Leu Phe Ala Val Phe
180 185 190


Thr Glu Thr Tyr Arg Ser Gly Val Asp Trp Lys Pro Leu Gly Lys Ser
195 200 205


Gln Gly Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala Leu Glu
210 215 220


Arg Leu Met Ser Trp Glu Ser Trp Asn Arg Arg Val Gly Glu Glu Tyr
225 230 235 240


Ala Arg Leu Phe Gln Gln Lys Met Lys Phe Glu Gln Glu His Phe Ala
245 250 255


Glu Gln Ser His Leu Val Lys Leu Ala Arg Ala Leu Glu Ala Asp Met
260 265 270


Arg Ala Ala Ser Gln Gly Phe Glu Ala Lys Arg Gly Thr Ala His Gln
275 280 285


Ile Thr Arg Arg Ala Leu Arg Gly Ala Asp Arg Val Phe Glu Ile Trp
290 295 300


Lys Ser Ile Pro Glu Glu Ala Leu Phe Ser Gln Tyr Asp Glu Val Ile
305 310 315 320


Arg Gln Val Gln Ala Glu Lys Arg Arg Asp Phe Gly Ser His Asp Leu
325 330 335


Phe Ala Lys Leu Ala Glu Pro Lys Tyr Gln Pro Leu Trp Arg Ala Asp
340 345 350


Glu Thr Phe Leu Thr Arg Tyr Ala Leu Tyr Asn Gly Val Leu Arg Asp
355 360 365


Leu Glu Lys Ala Arg Gln Phe Ala Thr Phe Thr Leu Pro Asp Ala Cys
370 375 380


Val Asn Pro Ile Trp Thr Arg Phe Glu Ser Ser Gln Gly Ser Asn Leu
385 390 395 400


His Lys Tyr Glu Phe Leu Phe Asp His Leu Gly Pro Gly Arg His Ala
405 410 415


Val Arg Phe Gln Arg Leu Leu Val Val Glu Ser Glu Gly Ala Lys Glu
420 425 430


Arg Asp Ser Val Val Val Pro Val Ala Pro Ser Gly Gln Leu Asp Lys
435 440 445


Leu Val Leu Arg Glu Glu Glu Lys Ser Ser Val Ala Leu His Leu His
450 455 460


Asp Thr Ala Arg Pro Asp Gly Phe Met Ala Glu Trp Ala Gly Ala Lys
465 470 475 480


Leu Gln Tyr Glu Arg Ser Thr Leu Ala Arg Lys Ala Arg Arg Asp Lys
485 490 495


Gln Gly Met Arg Ser Trp Arg Arg Gln Pro Ser Met Leu Met Ser Ala
500 505 510


Ala Gln Met Leu Glu Asp Ala Lys Gln Ala Gly Asp Val Tyr Leu Asn
515 520 525


Ile Ser Val Arg Val Lys Ser Pro Ser Glu Val Arg Gly Gln Arg Arg
530 535 540


Pro Pro Tyr Ala Ala Leu Phe Arg Ile Asp Asp Lys Gln Arg Arg Val
545 550 555 560


Thr Val Asn Tyr Asn Lys Leu Ser Ala Tyr Leu Glu Glu His Pro Asp
565 570 575


Lys Gln Ile Pro Gly Ala Pro Gly Leu Leu Ser Gly Leu Arg Val Met
580 585 590


Ser Val Asp Leu Gly Leu Arg Thr Ser Ala Ser Ile Ser Val Phe Arg
595 600 605


Val Ala Lys Lys Glu Glu Val Glu Ala Leu Gly Asp Gly Arg Pro Pro
610 615 620


His Tyr Tyr Pro Ile His Gly Thr Asp Asp Leu Val Ala Val His Glu
625 630 635 640


Arg Ser His Leu Ile Gln Met Pro Gly Glu Thr Glu Thr Lys Gln Leu
645 650 655


Arg Lys Leu Arg Glu Glu Arg Gln Ala Val Leu Arg Pro Leu Phe Ala
660 665 670


Gln Leu Ala Leu Leu Arg Leu Leu Val Arg Cys Gly Ala Ala Asp Glu
675 680 685


Arg Ile Arg Thr Arg Ser Trp Gln Arg Leu Thr Lys Gln Gly Arg Glu
690 695 700


Phe Thr Lys Arg Leu Thr Pro Ser Trp Arg Glu Ala Leu Glu Leu Glu
705 710 715 720


Leu Thr Arg Leu Glu Ala Tyr Cys Gly Arg Val Pro Asp Asp Glu Trp
725 730 735


Ser Arg Ile Val Asp Arg Thr Val Ile Ala Leu Trp Arg Arg Met Gly
740 745 750


Lys Gln Val Arg Asp Trp Arg Lys Gln Val Lys Ser Gly Ala Lys Val
755 760 765


Lys Val Lys Gly Tyr Gln Leu Asp Val Val Gly Gly Asn Ser Leu Ala
770 775 780


Gln Ile Asp Tyr Leu Glu Gln Gln Tyr Lys Phe Leu Arg Arg Trp Ser
785 790 795 800


Phe Phe Ala Arg Ala Ser Gly Leu Val Val Arg Ala Asp Arg Glu Ser
805 810 815


His Phe Ala Val Ala Leu Arg Gln His Ile Glu Asn Ala Lys Arg Asp
820 825 830


Arg Leu Lys Lys Leu Ala Asp Arg Ile Leu Met Glu Ala Leu Gly Tyr
835 840 845


Val Tyr Glu Ala Ser Gly Pro Arg Glu Gly Gln Trp Thr Ala Gln His
850 855 860


Pro Pro Cys Gln Leu Ile Ile Leu Glu Glu Leu Ser Ala Tyr Arg Phe
865 870 875 880


Ser Asp Asp Arg Pro Pro Ser Glu Asn Ser Lys Leu Met Ala Trp Gly
885 890 895


His Arg Gly Ile Leu Glu Glu Leu Val Asn Gln Ala Gln Val His Asp
900 905 910


Val Leu Val Gly Thr Val Tyr Ala Ala Phe Ser Ser Arg Phe Asp Ala
915 920 925


Arg Thr Gly Ala Pro Gly Val Arg Cys Arg Arg Val Pro Ala Arg Phe
930 935 940


Val Gly Ala Thr Val Asp Asp Ser Leu Pro Leu Trp Leu Thr Glu Phe
945 950 955 960


Leu Asp Lys His Arg Leu Asp Lys Asn Leu Leu Arg Pro Asp Asp Val
965 970 975


Ile Pro Thr Gly Glu Gly Glu Phe Leu Val Ser Pro Cys Gly Glu Glu
980 985 990


Ala Ala Arg Val Arg Gln Val His Ala Asp Ile Asn Ala Ala Gln Asn
995 1000 1005


Leu Gln Arg Arg Leu Trp Gln Asn Phe Asp Ile Thr Glu Leu Arg
1010 1015 1020


Leu Arg Cys Asp Val Lys Met Gly Gly Glu Gly Thr Val Leu Val
1025 1030 1035


Pro Arg Val Asn Asn Ala Arg Ala Lys Gln Leu Phe Gly Lys Lys
1040 1045 1050


Val Leu Val Ser Gln Asp Gly Val Thr Phe Phe Glu Arg Ser Gln
1055 1060 1065


Thr Gly Gly Lys Pro His Ser Glu Lys Gln Thr Asp Leu Thr Asp
1070 1075 1080


Lys Glu Leu Glu Leu Ile Ala Glu Ala Asp Glu Ala Arg Ala Lys
1085 1090 1095


Ser Val Val Leu Phe Arg Asp Pro Ser Gly His Ile Gly Lys Gly
1100 1105 1110


His Trp Ile Arg Gln Arg Glu Phe Trp Ser Leu Val Lys Gln Arg
1115 1120 1125


Ile Glu Ser His Thr Ala Glu Arg Ile Arg Val Arg Gly Val Gly
1130 1135 1140


Ser Ser Leu Asp
1145


<210> 494
<211> 1112
<212> PRT
<213> Bacillus species

<400> 494

Met Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr
1 5 10 15


Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln
35 40 45


Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile
50 55 60


Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His
65 70 75 80


Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu
85 90 95


Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly
100 105 110


Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys
115 120 125


Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu
130 135 140


Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg
145 150 155 160


Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr
165 170 175


Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile
180 185 190


Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys
195 200 205


Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp
210 215 220


Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu
225 230 235 240


Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys
245 250 255


Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala
260 265 270


Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly
275 280 285


Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser
290 295 300


Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser
305 310 315 320


Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu
325 330 335


Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala
340 345 350


Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala
355 360 365


Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr
370 375 380


Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys
385 390 395 400


Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser
405 410 415


Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro
420 425 430


Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly
435 440 445


Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp
450 455 460


Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys
465 470 475 480


Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe
485 490 495


Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg
500 505 510


Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe
515 520 525


Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn
530 535 540


Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly
545 550 555 560


Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val
565 570 575


Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys
580 585 590


Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg
595 600 605


Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys
610 615 620


Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln
625 630 635 640


Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro
645 650 655


Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser
660 665 670


Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu
675 680 685


Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu
690 695 700


Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile
705 710 715 720


Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala
725 730 735


Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu
740 745 750


Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg
755 760 765


Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln
770 775 780


Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met
785 790 795 800


Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys
805 810 815


Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn
820 825 830


Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser
835 840 845


Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met
850 855 860


Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr
865 870 875 880


Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His
885 890 895


Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg
900 905 910


Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys
915 920 925


Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu
930 935 940


Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile
945 950 955 960


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln
965 970 975


Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly
980 985 990


Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys Lys
995 1000 1005


Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln Glu
1010 1015 1020


Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr Asp
1025 1030 1035


Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile Ser
1040 1045 1050


Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu Thr
1055 1060 1065


Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr Trp
1070 1075 1080


Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile Lys
1085 1090 1095


Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu
1100 1105 1110


<210> 495
<211> 1489
<212> PRT
<213> Desulfatirhabdium butyrativorans

<400> 495

Met Pro Leu Ser Asn Asn Pro Pro Val Thr Gln Arg Ala Tyr Thr Leu
1 5 10 15


Arg Leu Arg Gly Ala Asp Pro Ser Asp Leu Ser Trp Arg Glu Ala Leu
20 25 30


Trp His Thr His Glu Ala Val Asn Lys Gly Ala Lys Val Phe Gly Asp
35 40 45


Trp Leu Leu Thr Leu Arg Gly Gly Leu Asp His Thr Leu Ala Asp Thr
50 55 60


Lys Val Lys Gly Gly Lys Gly Lys Pro Asp Arg Asp Pro Thr Pro Glu
65 70 75 80


Glu Arg Lys Ala Arg Arg Ile Leu Leu Ala Leu Ser Trp Leu Ser Val
85 90 95


Glu Ser Lys Leu Gly Ala Pro Ser Ser Tyr Ile Val Ala Ser Gly Asp
100 105 110


Glu Pro Ala Lys Asp Arg Asn Asp Asn Val Val Ser Ala Leu Glu Glu
115 120 125


Ile Leu Gln Ser Arg Lys Val Ala Lys Ser Glu Ile Asp Asp Trp Lys
130 135 140


Arg Asp Cys Ser Ala Ser Leu Ser Ala Ala Ile Arg Asp Asp Ala Val
145 150 155 160


Trp Val Asn Arg Ser Lys Val Phe Asp Glu Ala Val Lys Ser Val Gly
165 170 175


Ser Ser Leu Thr Arg Glu Glu Ala Trp Asp Met Leu Glu Arg Phe Phe
180 185 190


Gly Ser Arg Asp Ala Tyr Leu Thr Pro Met Lys Asp Pro Glu Asp Lys
195 200 205


Ser Ser Glu Thr Glu Gln Glu Asp Lys Ala Lys Asp Leu Val Gln Lys
210 215 220


Ala Gly Gln Trp Leu Ser Ser Arg Tyr Gly Thr Ser Glu Gly Ala Asp
225 230 235 240


Phe Cys Arg Met Ser Asp Ile Tyr Gly Lys Ile Ala Ala Trp Ala Asp
245 250 255


Asn Ala Ser Gln Gly Gly Ser Ser Thr Val Asp Asp Leu Val Ser Glu
260 265 270


Leu Arg Gln His Phe Asp Thr Lys Glu Ser Lys Ala Thr Asn Gly Leu
275 280 285


Asp Trp Ile Ile Gly Leu Ser Ser Tyr Thr Gly His Thr Pro Asn Pro
290 295 300


Val His Glu Leu Leu Arg Gln Asn Thr Ser Leu Asn Lys Ser His Leu
305 310 315 320


Asp Asp Leu Lys Lys Lys Ala Asn Thr Arg Ala Glu Ser Cys Lys Ser
325 330 335


Lys Ile Gly Ser Lys Gly Gln Arg Pro Tyr Ser Asp Ala Ile Leu Asn
340 345 350


Asp Val Glu Ser Val Cys Gly Phe Thr Tyr Arg Val Asp Lys Asp Gly
355 360 365


Gln Pro Val Ser Val Ala Asp Tyr Ser Lys Tyr Asp Val Asp Tyr Lys
370 375 380


Trp Gly Thr Ala Arg His Tyr Ile Phe Ala Val Met Leu Asp His Ala
385 390 395 400


Ala Arg Arg Ile Ser Leu Ala His Lys Trp Ile Lys Arg Ala Glu Ala
405 410 415


Glu Arg His Lys Phe Glu Glu Asp Ala Lys Arg Ile Ala Asn Val Pro
420 425 430


Ala Arg Ala Arg Glu Trp Leu Asp Ser Phe Cys Lys Glu Arg Ser Val
435 440 445


Thr Ser Gly Ala Val Glu Pro Tyr Arg Ile Arg Arg Arg Ala Val Asp
450 455 460


Gly Trp Lys Glu Val Val Ala Ala Trp Ser Lys Ser Asp Cys Lys Ser
465 470 475 480


Thr Glu Asp Arg Ile Ala Ala Ala Arg Ala Leu Gln Asp Asp Ser Glu
485 490 495


Ile Asp Lys Phe Gly Asp Ile Gln Leu Phe Glu Ala Leu Ala Glu Asp
500 505 510


Asp Ala Leu Cys Val Trp His Lys Asp Gly Glu Ala Thr Asn Glu Pro
515 520 525


Asp Phe Gln Pro Leu Ile Asp Tyr Ser Leu Ala Ile Glu Ala Glu Phe
530 535 540


Lys Lys Arg Gln Phe Lys Val Pro Ala Tyr Arg His Pro Asp Glu Leu
545 550 555 560


Leu His Pro Val Phe Cys Asp Phe Gly Lys Ser Arg Trp Lys Ile Asn
565 570 575


Tyr Asp Val His Lys Asn Val Gln Ala Pro Phe Tyr Arg Gly Leu Cys
580 585 590


Leu Thr Leu Trp Thr Gly Ser Glu Ile Lys Pro Val Pro Leu Cys Trp
595 600 605


Gln Ser Lys Arg Leu Thr Arg Asp Leu Ala Leu Gly Asn Asn His Arg
610 615 620


Asn Asp Ala Ala Ser Ala Val Thr Arg Ala Asp Arg Leu Gly Arg Ala
625 630 635 640


Ala Ser Asn Val Thr Lys Ser Asp Met Val Asn Ile Thr Gly Leu Phe
645 650 655


Glu Gln Ala Asp Trp Asn Gly Arg Leu Gln Ala Pro Arg Gln Gln Leu
660 665 670


Glu Ala Ile Ala Val Val Arg Asp Asn Pro Arg Leu Ser Glu Gln Glu
675 680 685


Arg Asn Leu Arg Met Cys Gly Met Ile Glu His Ile Arg Trp Leu Val
690 695 700


Thr Phe Ser Val Lys Leu Gln Pro Gln Gly Pro Trp Cys Ala Tyr Ala
705 710 715 720


Glu Gln His Gly Leu Asn Thr Asn Pro Gln Tyr Trp Pro His Ala Asp
725 730 735


Thr Asn Arg Asp Arg Lys Val His Ala Arg Leu Ile Leu Pro Arg Leu
740 745 750


Pro Gly Leu Arg Val Leu Ser Val Asp Leu Gly His Arg Tyr Ala Ala
755 760 765


Ala Cys Ala Val Trp Glu Ala Val Asn Thr Glu Thr Val Lys Glu Ala
770 775 780


Cys Gln Asn Val Gly Arg Asp Met Pro Lys Glu His Asp Leu Tyr Leu
785 790 795 800


His Ile Lys Val Lys Lys Gln Gly Ile Gly Lys Gln Thr Glu Val Asp
805 810 815


Lys Thr Thr Ile Tyr Arg Arg Ile Gly Ala Asp Thr Leu Pro Asp Gly
820 825 830


Arg Pro His Pro Ala Pro Trp Ala Arg Leu Asp Arg Gln Phe Leu Ile
835 840 845


Lys Leu Gln Gly Glu Glu Lys Asp Ala Arg Glu Ala Ser Asn Glu Glu
850 855 860


Ile Trp Ala Leu His Gln Met Glu Cys Lys Leu Asp Arg Thr Lys Pro
865 870 875 880


Leu Ile Asp Arg Leu Ile Ala Ser Gly Trp Gly Leu Leu Lys Arg Gln
885 890 895


Met Ala Arg Leu Asp Ala Leu Lys Glu Leu Gly Trp Ile Pro Ala Pro
900 905 910


Asp Ser Ser Glu Asn Leu Ser Arg Glu Asp Gly Glu Ala Lys Asp Tyr
915 920 925


Arg Glu Ser Leu Ala Val Asp Asp Leu Met Phe Ser Ala Val Arg Thr
930 935 940


Leu Arg Leu Ala Leu Gln Arg His Gly Asn Arg Ala Arg Ile Ala Tyr
945 950 955 960


Tyr Leu Ile Ser Glu Val Lys Ile Arg Pro Gly Gly Ile Gln Glu Lys
965 970 975


Leu Asp Glu Asn Gly Arg Ile Asp Leu Leu Gln Asp Ala Leu Ala Leu
980 985 990


Trp His Glu Leu Phe Ser Ser Pro Gly Trp Arg Asp Glu Ala Ala Lys
995 1000 1005


Gln Leu Trp Asp Ser Arg Ile Ala Thr Leu Ala Gly Tyr Lys Ala
1010 1015 1020


Pro Glu Glu Asn Gly Asp Asn Val Ser Asp Val Ala Tyr Arg Lys
1025 1030 1035


Lys Gln Gln Val Tyr Arg Glu Gln Leu Arg Asn Val Ala Lys Thr
1040 1045 1050


Leu Ser Gly Asp Val Ile Thr Cys Lys Glu Leu Ser Asp Ala Trp
1055 1060 1065


Lys Glu Arg Trp Glu Asp Glu Asp Gln Arg Trp Lys Lys Leu Leu
1070 1075 1080


Arg Trp Phe Lys Asp Trp Val Leu Pro Ser Gly Thr Gln Ala Asn
1085 1090 1095


Asn Ala Thr Ile Arg Asn Val Gly Gly Leu Ser Leu Ser Arg Leu
1100 1105 1110


Ala Thr Ile Thr Glu Phe Arg Arg Lys Val Gln Val Gly Phe Phe
1115 1120 1125


Thr Arg Leu Arg Pro Asp Gly Thr Arg His Glu Ile Gly Glu Gln
1130 1135 1140


Phe Gly Gln Lys Thr Leu Asp Ala Leu Glu Leu Leu Arg Glu Gln
1145 1150 1155


Arg Val Lys Gln Leu Ala Ser Arg Ile Ala Glu Ala Ala Leu Gly
1160 1165 1170


Ile Gly Ser Glu Gly Gly Lys Gly Trp Asp Gly Gly Lys Arg Pro
1175 1180 1185


Arg Gln Arg Ile Asn Asp Ser Arg Phe Ala Pro Cys His Ala Val
1190 1195 1200


Val Ile Glu Asn Leu Ala Asn Tyr Arg Pro Asp Glu Thr Arg Thr
1205 1210 1215


Arg Leu Glu Asn Arg Arg Leu Met Thr Trp Ser Ala Ser Lys Val
1220 1225 1230


His Lys Tyr Leu Ser Glu Ala Cys Gln Leu Asn Gly Leu Tyr Leu
1235 1240 1245


Cys Thr Val Ser Ala Trp Tyr Thr Ser Arg Gln Asp Ser Arg Thr
1250 1255 1260


Gly Ala Pro Gly Ile Arg Cys Gln Asp Val Ser Val Arg Glu Phe
1265 1270 1275


Met Gln Ser Pro Phe Trp Arg Lys Gln Val Lys Gln Ala Glu Ala
1280 1285 1290


Lys His Asp Glu Asn Lys Gly Asp Ala Arg Glu Arg Phe Leu Cys
1295 1300 1305


Glu Leu Asn Lys Thr Trp Lys Ala Lys Thr Pro Ala Glu Trp Lys
1310 1315 1320


Lys Ala Gly Phe Val Arg Ile Pro Leu Arg Gly Gly Glu Ile Phe
1325 1330 1335


Val Ser Ala Asp Ser Lys Ser Pro Ser Ala Lys Gly Ile His Ala
1340 1345 1350


Asp Leu Asn Ala Ala Ala Asn Ile Gly Leu Arg Ala Leu Thr Asp
1355 1360 1365


Pro Asp Trp Pro Gly Lys Trp Trp Tyr Val Pro Cys Asp Pro Val
1370 1375 1380


Ser Phe Glu Ser Lys Met Asp Tyr Val Lys Gly Cys Ala Ala Val
1385 1390 1395


Lys Val Gly Gln Pro Leu Arg Gln Pro Ala Gln Thr Asn Ala Asp
1400 1405 1410


Gly Ala Ala Ser Lys Ile Arg Lys Gly Lys Lys Asn Arg Thr Ala
1415 1420 1425


Gly Thr Ser Lys Glu Lys Val Tyr Leu Trp Arg Asp Ile Ser Ala
1430 1435 1440


Phe Pro Leu Glu Ser Asn Glu Ile Gly Glu Trp Lys Glu Thr Ser
1445 1450 1455


Ala Tyr Gln Asn Asp Val Gln Tyr Arg Val Ile Arg Met Leu Lys
1460 1465 1470


Glu His Ile Lys Ser Leu Asp Asn Arg Thr Gly Asp Asn Val Glu
1475 1480 1485


Gly



<210> 496
<211> 1194
<212> PRT
<213> Desulfonatronum thiodismutans

<400> 496

Met Val Leu Gly Arg Lys Asp Asp Thr Ala Glu Leu Arg Arg Ala Leu
1 5 10 15


Trp Thr Thr His Glu His Val Asn Leu Ala Val Ala Glu Val Glu Arg
20 25 30


Val Leu Leu Arg Cys Arg Gly Arg Ser Tyr Trp Thr Leu Asp Arg Arg
35 40 45


Gly Asp Pro Val His Val Pro Glu Ser Gln Val Ala Glu Asp Ala Leu
50 55 60


Ala Met Ala Arg Glu Ala Gln Arg Arg Asn Gly Trp Pro Val Val Gly
65 70 75 80


Glu Asp Glu Glu Ile Leu Leu Ala Leu Arg Tyr Leu Tyr Glu Gln Ile
85 90 95


Val Pro Ser Cys Leu Leu Asp Asp Leu Gly Lys Pro Leu Lys Gly Asp
100 105 110


Ala Gln Lys Ile Gly Thr Asn Tyr Ala Gly Pro Leu Phe Asp Ser Asp
115 120 125


Thr Cys Arg Arg Asp Glu Gly Lys Asp Val Ala Cys Cys Gly Pro Phe
130 135 140


His Glu Val Ala Gly Lys Tyr Leu Gly Ala Leu Pro Glu Trp Ala Thr
145 150 155 160


Pro Ile Ser Lys Gln Glu Phe Asp Gly Lys Asp Ala Ser His Leu Arg
165 170 175


Phe Lys Ala Thr Gly Gly Asp Asp Ala Phe Phe Arg Val Ser Ile Glu
180 185 190


Lys Ala Asn Ala Trp Tyr Glu Asp Pro Ala Asn Gln Asp Ala Leu Lys
195 200 205


Asn Lys Ala Tyr Asn Lys Asp Asp Trp Lys Lys Glu Lys Asp Lys Gly
210 215 220


Ile Ser Ser Trp Ala Val Lys Tyr Ile Gln Lys Gln Leu Gln Leu Gly
225 230 235 240


Gln Asp Pro Arg Thr Glu Val Arg Arg Lys Leu Trp Leu Glu Leu Gly
245 250 255


Leu Leu Pro Leu Phe Ile Pro Val Phe Asp Lys Thr Met Val Gly Asn
260 265 270


Leu Trp Asn Arg Leu Ala Val Arg Leu Ala Leu Ala His Leu Leu Ser
275 280 285


Trp Glu Ser Trp Asn His Arg Ala Val Gln Asp Gln Ala Leu Ala Arg
290 295 300


Ala Lys Arg Asp Glu Leu Ala Ala Leu Phe Leu Gly Met Glu Asp Gly
305 310 315 320


Phe Ala Gly Leu Arg Glu Tyr Glu Leu Arg Arg Asn Glu Ser Ile Lys
325 330 335


Gln His Ala Phe Glu Pro Val Asp Arg Pro Tyr Val Val Ser Gly Arg
340 345 350


Ala Leu Arg Ser Trp Thr Arg Val Arg Glu Glu Trp Leu Arg His Gly
355 360 365


Asp Thr Gln Glu Ser Arg Lys Asn Ile Cys Asn Arg Leu Gln Asp Arg
370 375 380


Leu Arg Gly Lys Phe Gly Asp Pro Asp Val Phe His Trp Leu Ala Glu
385 390 395 400


Asp Gly Gln Glu Ala Leu Trp Lys Glu Arg Asp Cys Val Thr Ser Phe
405 410 415


Ser Leu Leu Asn Asp Ala Asp Gly Leu Leu Glu Lys Arg Lys Gly Tyr
420 425 430


Ala Leu Met Thr Phe Ala Asp Ala Arg Leu His Pro Arg Trp Ala Met
435 440 445


Tyr Glu Ala Pro Gly Gly Ser Asn Leu Arg Thr Tyr Gln Ile Arg Lys
450 455 460


Thr Glu Asn Gly Leu Trp Ala Asp Val Val Leu Leu Ser Pro Arg Asn
465 470 475 480


Glu Ser Ala Ala Val Glu Glu Lys Thr Phe Asn Val Arg Leu Ala Pro
485 490 495


Ser Gly Gln Leu Ser Asn Val Ser Phe Asp Gln Ile Gln Lys Gly Ser
500 505 510


Lys Met Val Gly Arg Cys Arg Tyr Gln Ser Ala Asn Gln Gln Phe Glu
515 520 525


Gly Leu Leu Gly Gly Ala Glu Ile Leu Phe Asp Arg Lys Arg Ile Ala
530 535 540


Asn Glu Gln His Gly Ala Thr Asp Leu Ala Ser Lys Pro Gly His Val
545 550 555 560


Trp Phe Lys Leu Thr Leu Asp Val Arg Pro Gln Ala Pro Gln Gly Trp
565 570 575


Leu Asp Gly Lys Gly Arg Pro Ala Leu Pro Pro Glu Ala Lys His Phe
580 585 590


Lys Thr Ala Leu Ser Asn Lys Ser Lys Phe Ala Asp Gln Val Arg Pro
595 600 605


Gly Leu Arg Val Leu Ser Val Asp Leu Gly Val Arg Ser Phe Ala Ala
610 615 620


Cys Ser Val Phe Glu Leu Val Arg Gly Gly Pro Asp Gln Gly Thr Tyr
625 630 635 640


Phe Pro Ala Ala Asp Gly Arg Thr Val Asp Asp Pro Glu Lys Leu Trp
645 650 655


Ala Lys His Glu Arg Ser Phe Lys Ile Thr Leu Pro Gly Glu Asn Pro
660 665 670


Ser Arg Lys Glu Glu Ile Ala Arg Arg Ala Ala Met Glu Glu Leu Arg
675 680 685


Ser Leu Asn Gly Asp Ile Arg Arg Leu Lys Ala Ile Leu Arg Leu Ser
690 695 700


Val Leu Gln Glu Asp Asp Pro Arg Thr Glu His Leu Arg Leu Phe Met
705 710 715 720


Glu Ala Ile Val Asp Asp Pro Ala Lys Ser Ala Leu Asn Ala Glu Leu
725 730 735


Phe Lys Gly Phe Gly Asp Asp Arg Phe Arg Ser Thr Pro Asp Leu Trp
740 745 750


Lys Gln His Cys His Phe Phe His Asp Lys Ala Glu Lys Val Val Ala
755 760 765


Glu Arg Phe Ser Arg Trp Arg Thr Glu Thr Arg Pro Lys Ser Ser Ser
770 775 780


Trp Gln Asp Trp Arg Glu Arg Arg Gly Tyr Ala Gly Gly Lys Ser Tyr
785 790 795 800


Trp Ala Val Thr Tyr Leu Glu Ala Val Arg Gly Leu Ile Leu Arg Trp
805 810 815


Asn Met Arg Gly Arg Thr Tyr Gly Glu Val Asn Arg Gln Asp Lys Lys
820 825 830


Gln Phe Gly Thr Val Ala Ser Ala Leu Leu His His Ile Asn Gln Leu
835 840 845


Lys Glu Asp Arg Ile Lys Thr Gly Ala Asp Met Ile Ile Gln Ala Ala
850 855 860


Arg Gly Phe Val Pro Arg Lys Asn Gly Ala Gly Trp Val Gln Val His
865 870 875 880


Glu Pro Cys Arg Leu Ile Leu Phe Glu Asp Leu Ala Arg Tyr Arg Phe
885 890 895


Arg Thr Asp Arg Ser Arg Arg Glu Asn Ser Arg Leu Met Arg Trp Ser
900 905 910


His Arg Glu Ile Val Asn Glu Val Gly Met Gln Gly Glu Leu Tyr Gly
915 920 925


Leu His Val Asp Thr Thr Glu Ala Gly Phe Ser Ser Arg Tyr Leu Ala
930 935 940


Ser Ser Gly Ala Pro Gly Val Arg Cys Arg His Leu Val Glu Glu Asp
945 950 955 960


Phe His Asp Gly Leu Pro Gly Met His Leu Val Gly Glu Leu Asp Trp
965 970 975


Leu Leu Pro Lys Asp Lys Asp Arg Thr Ala Asn Glu Ala Arg Arg Leu
980 985 990


Leu Gly Gly Met Val Arg Pro Gly Met Leu Val Pro Trp Asp Gly Gly
995 1000 1005


Glu Leu Phe Ala Thr Leu Asn Ala Ala Ser Gln Leu His Val Ile
1010 1015 1020


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Arg Arg Phe Trp
1025 1030 1035


Gly Arg Cys Gly Glu Ala Ile Arg Ile Val Cys Asn Gln Leu Ser
1040 1045 1050


Val Asp Gly Ser Thr Arg Tyr Glu Met Ala Lys Ala Pro Lys Ala
1055 1060 1065


Arg Leu Leu Gly Ala Leu Gln Gln Leu Lys Asn Gly Asp Ala Pro
1070 1075 1080


Phe His Leu Thr Ser Ile Pro Asn Ser Gln Lys Pro Glu Asn Ser
1085 1090 1095


Tyr Val Met Thr Pro Thr Asn Ala Gly Lys Lys Tyr Arg Ala Gly
1100 1105 1110


Pro Gly Glu Lys Ser Ser Gly Glu Glu Asp Glu Leu Ala Leu Asp
1115 1120 1125


Ile Val Glu Gln Ala Glu Glu Leu Ala Gln Gly Arg Lys Thr Phe
1130 1135 1140


Phe Arg Asp Pro Ser Gly Val Phe Phe Ala Pro Asp Arg Trp Leu
1145 1150 1155


Pro Ser Glu Ile Tyr Trp Ser Arg Ile Arg Arg Arg Ile Trp Gln
1160 1165 1170


Val Thr Leu Glu Arg Asn Ser Ser Gly Arg Gln Glu Arg Ala Glu
1175 1180 1185


Met Asp Glu Met Pro Tyr
1190


<210> 497
<211> 1326
<212> PRT
<213> Unknown

<220>
<223> Lentisphaeria bacterium

<400> 497

Met Ala Val Glu Leu Asn Arg Ile Tyr Gln Gly Arg Val Asn His Val
1 5 10 15


Tyr Ile Phe Asp Glu Asn Gln Asn Gln Val Ser Val Asp Asn Gly Asp
20 25 30


Asp Leu Leu Phe Val His His Glu Leu Tyr Gln Asp Ala Ile Asn Tyr
35 40 45


Tyr Leu Val Ala Leu Ala Ala Met Ala Leu Asp Ser Lys Asp Ser Leu
50 55 60


Phe Gly Lys Phe Lys Met Gln Ile Arg Ala Val Trp Asn Asp Phe Tyr
65 70 75 80


Arg Asn Gly Gln Leu Arg Pro Gly Leu Lys His Ser Leu Ile Arg Ser
85 90 95


Leu Gly His Ala Ala Glu Leu Asn Thr Ser Asn Gly Ala Asp Ile Ala
100 105 110


Met Asn Leu Ile Leu Glu Asp Gly Gly Ile Pro Ser Glu Ile Leu Asn
115 120 125


Ala Ala Leu Glu His Leu Ala Glu Lys Cys Thr Gly Asp Val Ser Gln
130 135 140


Leu Gly Lys Thr Phe Phe Pro Arg Phe Cys Asp Thr Ala Tyr His Gly
145 150 155 160


Asn Trp Asp Val Asp Ala Lys Ser Phe Ser Glu Lys Lys Gly Arg Gln
165 170 175


Arg Leu Val Asp Ala Leu Tyr Ser Leu His Pro Val Gln Ala Val Gln
180 185 190


Glu Leu Ala Pro Glu Ile Glu Ile Gly Trp Gly Gly Val Lys Thr Gln
195 200 205


Thr Gly Lys Phe Phe Thr Gly Asp Glu Ala Lys Ala Ser Leu Lys Lys
210 215 220


Ala Ile Ser Tyr Phe Leu Gln Asp Thr Gly Lys Asn Ser Pro Glu Leu
225 230 235 240


Gln Glu Tyr Phe Ser Val Ala Gly Lys Gln Pro Leu Glu Gln Tyr Leu
245 250 255


Gly Lys Ile Asp Thr Phe Pro Glu Ile Ser Phe Gly Arg Ile Ser Ser
260 265 270


His Gln Asn Ile Asn Ile Ser Asn Ala Met Trp Ile Leu Lys Phe Phe
275 280 285


Pro Asp Gln Tyr Ser Val Asp Leu Ile Lys Asn Leu Ile Pro Asn Lys
290 295 300


Lys Tyr Glu Ile Gly Ile Ala Pro Gln Trp Gly Asp Asp Pro Val Lys
305 310 315 320


Leu Ser Arg Gly Lys Arg Gly Tyr Thr Phe Arg Ala Phe Thr Asp Leu
325 330 335


Ala Met Trp Glu Lys Asn Trp Lys Val Phe Asp Arg Ala Ala Phe Ser
340 345 350


Asp Ala Leu Lys Thr Ile Asn Gln Phe Arg Asn Lys Thr Gln Glu Arg
355 360 365


Asn Asp Gln Leu Lys Arg Tyr Cys Ala Ala Leu Asn Trp Met Asp Gly
370 375 380


Glu Ser Ser Asp Lys Lys Pro Pro Val Glu Pro Ala Asp Ala Asp Ala
385 390 395 400


Val Asp Glu Ala Ala Thr Ser Val Leu Pro Ile Leu Ala Gly Asp Lys
405 410 415


Arg Trp Asn Ala Leu Leu Gln Leu Gln Lys Glu Leu Gly Ile Cys Asn
420 425 430


Asp Phe Thr Glu Asn Glu Leu Met Asp Tyr Gly Leu Ser Leu Arg Thr
435 440 445


Ile Arg Gly Tyr Gln Lys Leu Arg Ser Met Met Leu Glu Lys Glu Glu
450 455 460


Lys Met Arg Ala Lys Thr Ala Asp Asp Glu Glu Ile Ser Gln Ala Leu
465 470 475 480


Gln Glu Ile Ile Ile Lys Phe Gln Ser Ser His Arg Asp Thr Ile Gly
485 490 495


Ser Val Ser Leu Phe Leu Lys Leu Ala Glu Pro Lys Tyr Phe Cys Val
500 505 510


Trp His Asp Ala Asp Lys Asn Gln Asn Phe Ala Ser Val Asp Met Val
515 520 525


Ala Asp Ala Val Arg Tyr Tyr Ser Tyr Gln Glu Glu Lys Ala Arg Leu
530 535 540


Glu Glu Pro Ile Gln Ile Thr Pro Ala Asp Ala Arg Tyr Ser Arg Arg
545 550 555 560


Val Ser Asp Leu Tyr Ala Leu Val Tyr Lys Asn Ala Lys Glu Cys Lys
565 570 575


Thr Gly Tyr Gly Leu Arg Pro Asp Gly Asn Phe Val Phe Glu Ile Ala
580 585 590


Gln Lys Asn Ala Lys Gly Tyr Ala Pro Ala Lys Val Val Leu Ala Phe
595 600 605


Ser Ala Pro Arg Leu Lys Arg Asp Gly Leu Ile Asp Lys Glu Phe Ser
610 615 620


Ala Tyr Tyr Pro Pro Val Leu Gln Ala Phe Leu Arg Glu Glu Glu Ala
625 630 635 640


Pro Lys Gln Ser Phe Lys Thr Thr Ala Val Ile Leu Met Pro Asp Trp
645 650 655


Asp Lys Asn Gly Lys Arg Arg Ile Leu Leu Asn Phe Pro Ile Lys Leu
660 665 670


Asp Val Ser Ala Ile His Gln Lys Thr Asp His Arg Phe Glu Asn Gln
675 680 685


Phe Tyr Phe Ala Asn Asn Thr Asn Thr Cys Leu Leu Trp Pro Ser Tyr
690 695 700


Gln Tyr Lys Lys Pro Val Thr Trp Tyr Gln Gly Lys Lys Pro Phe Asp
705 710 715 720


Val Val Ala Val Asp Leu Gly Gln Arg Ser Ala Gly Ala Val Ser Arg
725 730 735


Ile Thr Val Ser Thr Glu Lys Arg Glu His Ser Val Ala Ile Gly Glu
740 745 750


Ala Gly Gly Thr Gln Trp Tyr Ala Tyr Arg Lys Phe Ser Gly Leu Leu
755 760 765


Arg Leu Pro Gly Glu Asp Ala Thr Val Ile Arg Asp Gly Gln Arg Thr
770 775 780


Glu Glu Leu Ser Gly Asn Ala Gly Arg Leu Ser Thr Glu Glu Glu Thr
785 790 795 800


Val Gln Ala Cys Val Leu Cys Lys Met Leu Ile Gly Asp Ala Thr Leu
805 810 815


Leu Gly Gly Ser Asp Glu Lys Thr Ile Arg Ser Phe Pro Lys Gln Asn
820 825 830


Asp Lys Leu Leu Ile Ala Phe Arg Arg Ala Thr Gly Arg Met Lys Gln
835 840 845


Leu Gln Arg Trp Leu Trp Met Leu Asn Glu Asn Gly Leu Cys Asp Lys
850 855 860


Ala Lys Thr Glu Ile Ser Asn Ser Asp Trp Leu Val Asn Lys Asn Ile
865 870 875 880


Asp Asn Val Leu Lys Glu Glu Lys Gln His Arg Glu Met Leu Pro Ala
885 890 895


Ile Leu Leu Gln Ile Ala Asp Arg Val Leu Pro Leu Arg Gly Arg Lys
900 905 910


Trp Asp Trp Val Leu Asn Pro Gln Ser Asn Ser Phe Val Leu Gln Gln
915 920 925


Thr Ala His Gly Ser Gly Asp Pro His Lys Lys Ile Cys Gly Gln Arg
930 935 940


Gly Leu Ser Phe Ala Arg Ile Glu Gln Leu Glu Ser Leu Arg Met Arg
945 950 955 960


Cys Gln Ala Leu Asn Arg Ile Leu Met Arg Lys Thr Gly Glu Lys Pro
965 970 975


Ala Thr Leu Ala Glu Met Arg Asn Asn Pro Ile Pro Asp Cys Cys Pro
980 985 990


Asp Ile Leu Met Arg Leu Asp Ala Met Lys Glu Gln Arg Ile Asn Gln
995 1000 1005


Thr Ala Asn Leu Ile Leu Ala Gln Ala Leu Gly Leu Arg His Cys
1010 1015 1020


Leu His Ser Glu Ser Ala Thr Lys Arg Lys Glu Asn Gly Met His
1025 1030 1035


Gly Glu Tyr Glu Lys Ile Pro Gly Val Glu Pro Ala Ala Phe Val
1040 1045 1050


Val Leu Glu Asp Leu Ser Arg Tyr Arg Phe Ser Gln Asp Arg Ser
1055 1060 1065


Ser Tyr Glu Asn Ser Arg Leu Met Lys Trp Ser His Arg Lys Ile
1070 1075 1080


Leu Glu Lys Leu Ala Leu Leu Cys Glu Val Phe Asn Val Pro Ile
1085 1090 1095


Leu Gln Val Gly Ala Ala Tyr Ser Ser Lys Phe Ser Ala Asn Ala
1100 1105 1110


Ile Pro Gly Phe Arg Ala Glu Glu Cys Ser Ile Asp Gln Leu Ser
1115 1120 1125


Phe Tyr Pro Trp Arg Glu Leu Lys Asp Ser Arg Glu Lys Ala Leu
1130 1135 1140


Val Glu Gln Ile Arg Lys Ile Gly His Arg Leu Leu Thr Phe Asp
1145 1150 1155


Ala Lys Ala Thr Ile Ile Met Pro Arg Asn Gly Gly Pro Val Phe
1160 1165 1170


Ile Pro Phe Val Pro Ser Asp Ser Lys Asp Thr Leu Ile Gln Ala
1175 1180 1185


Asp Ile Asn Ala Ser Phe Asn Ile Gly Leu Arg Gly Val Ala Asp
1190 1195 1200


Ala Thr Asn Leu Leu Cys Asn Asn Arg Val Ser Cys Asp Arg Lys
1205 1210 1215


Lys Asp Cys Trp Gln Val Lys Arg Ser Ser Asn Phe Ser Lys Met
1220 1225 1230


Val Tyr Pro Glu Lys Leu Ser Leu Ser Phe Asp Pro Ile Lys Lys
1235 1240 1245


Gln Glu Gly Ala Gly Gly Asn Phe Phe Val Leu Gly Cys Ser Glu
1250 1255 1260


Arg Ile Leu Thr Gly Thr Ser Glu Lys Ser Pro Val Phe Thr Ser
1265 1270 1275


Ser Glu Met Ala Lys Lys Tyr Pro Asn Leu Met Phe Gly Ser Ala
1280 1285 1290


Leu Trp Arg Asn Glu Ile Leu Lys Leu Glu Arg Cys Cys Lys Ile
1295 1300 1305


Asn Gln Ser Arg Leu Asp Lys Phe Ile Ala Lys Lys Glu Val Gln
1310 1315 1320


Asn Glu Leu
1325


<210> 498
<211> 1090
<212> PRT
<213> Laceyella sediminis

<400> 498

Met Ser Ile Arg Ser Phe Lys Leu Lys Ile Lys Thr Lys Ser Gly Val
1 5 10 15


Asn Ala Glu Glu Leu Arg Arg Gly Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Asp Gly Ile Ala Tyr Tyr Met Asn Trp Leu Val Leu Leu Arg Gln
35 40 45


Glu Asp Leu Phe Ile Arg Asn Glu Glu Thr Asn Glu Ile Glu Lys Arg
50 55 60


Ser Lys Glu Glu Ile Gln Gly Glu Leu Leu Glu Arg Val His Lys Gln
65 70 75 80


Gln Gln Arg Asn Gln Trp Ser Gly Glu Val Asp Asp Gln Thr Leu Leu
85 90 95


Gln Thr Leu Arg His Leu Tyr Glu Glu Ile Val Pro Ser Val Ile Gly
100 105 110


Lys Ser Gly Asn Ala Ser Leu Lys Ala Arg Phe Phe Leu Gly Pro Leu
115 120 125


Val Asp Pro Asn Asn Lys Thr Thr Lys Asp Val Ser Lys Ser Gly Pro
130 135 140


Thr Pro Lys Trp Lys Lys Met Lys Asp Ala Gly Asp Pro Asn Trp Val
145 150 155 160


Gln Glu Tyr Glu Lys Tyr Met Ala Glu Arg Gln Thr Leu Val Arg Leu
165 170 175


Glu Glu Met Gly Leu Ile Pro Leu Phe Pro Met Tyr Thr Asp Glu Val
180 185 190


Gly Asp Ile His Trp Leu Pro Gln Ala Ser Gly Tyr Thr Arg Thr Trp
195 200 205


Asp Arg Asp Met Phe Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220


Ser Trp Asn Arg Arg Val Arg Glu Arg Arg Ala Gln Phe Glu Lys Lys
225 230 235 240


Thr His Asp Phe Ala Ser Arg Phe Ser Glu Ser Asp Val Gln Trp Met
245 250 255


Asn Lys Leu Arg Glu Tyr Glu Ala Gln Gln Glu Lys Ser Leu Glu Glu
260 265 270


Asn Ala Phe Ala Pro Asn Glu Pro Tyr Ala Leu Thr Lys Lys Ala Leu
275 280 285


Arg Gly Trp Glu Arg Val Tyr His Ser Trp Met Arg Leu Asp Ser Ala
290 295 300


Ala Ser Glu Glu Ala Tyr Trp Gln Glu Val Ala Thr Cys Gln Thr Ala
305 310 315 320


Met Arg Gly Glu Phe Gly Asp Pro Ala Ile Tyr Gln Phe Leu Ala Gln
325 330 335


Lys Glu Asn His Asp Ile Trp Arg Gly Tyr Pro Glu Arg Val Ile Asp
340 345 350


Phe Ala Glu Leu Asn His Leu Gln Arg Glu Leu Arg Arg Ala Lys Glu
355 360 365


Asp Ala Thr Phe Thr Leu Pro Asp Ser Val Asp His Pro Leu Trp Val
370 375 380


Arg Tyr Glu Ala Pro Gly Gly Thr Asn Ile His Gly Tyr Asp Leu Val
385 390 395 400


Gln Asp Thr Lys Arg Asn Leu Thr Leu Ile Leu Asp Lys Phe Ile Leu
405 410 415


Pro Asp Glu Asn Gly Ser Trp His Glu Val Lys Lys Val Pro Phe Ser
420 425 430


Leu Ala Lys Ser Lys Gln Phe His Arg Gln Val Trp Leu Gln Glu Glu
435 440 445


Gln Lys Gln Lys Lys Arg Glu Val Val Phe Tyr Asp Tyr Ser Thr Asn
450 455 460


Leu Pro His Leu Gly Thr Leu Ala Gly Ala Lys Leu Gln Trp Asp Arg
465 470 475 480


Asn Phe Leu Asn Lys Arg Thr Gln Gln Gln Ile Glu Glu Thr Gly Glu
485 490 495


Ile Gly Lys Val Phe Phe Asn Ile Ser Val Asp Val Arg Pro Ala Val
500 505 510


Glu Val Lys Asn Gly Arg Leu Gln Asn Gly Leu Gly Lys Ala Leu Thr
515 520 525


Val Leu Thr His Pro Asp Gly Thr Lys Ile Val Thr Gly Trp Lys Ala
530 535 540


Glu Gln Leu Glu Lys Trp Val Gly Glu Ser Gly Arg Val Ser Ser Leu
545 550 555 560


Gly Leu Asp Ser Leu Ser Glu Gly Leu Arg Val Met Ser Ile Asp Leu
565 570 575


Gly Gln Arg Thr Ser Ala Thr Val Ser Val Phe Glu Ile Thr Lys Glu
580 585 590


Ala Pro Asp Asn Pro Tyr Lys Phe Phe Tyr Gln Leu Glu Gly Thr Glu
595 600 605


Leu Phe Ala Val His Gln Arg Ser Phe Leu Leu Ala Leu Pro Gly Glu
610 615 620


Asn Pro Pro Gln Lys Ile Lys Gln Met Arg Glu Ile Arg Trp Lys Glu
625 630 635 640


Arg Asn Arg Ile Lys Gln Gln Val Asp Gln Leu Ser Ala Ile Leu Arg
645 650 655


Leu His Lys Lys Val Asn Glu Asp Glu Arg Ile Gln Ala Ile Asp Lys
660 665 670


Leu Leu Gln Lys Val Ala Ser Trp Gln Leu Asn Glu Glu Ile Ala Thr
675 680 685


Ala Trp Asn Gln Ala Leu Ser Gln Leu Tyr Ser Lys Ala Lys Glu Asn
690 695 700


Asp Leu Gln Trp Asn Gln Ala Ile Lys Asn Ala His His Gln Leu Glu
705 710 715 720


Pro Val Val Gly Lys Gln Ile Ser Leu Trp Arg Lys Asp Leu Ser Thr
725 730 735


Gly Arg Gln Gly Ile Ala Gly Leu Ser Leu Trp Ser Ile Glu Glu Leu
740 745 750


Glu Ala Thr Lys Lys Leu Leu Thr Arg Trp Ser Lys Arg Ser Arg Glu
755 760 765


Pro Gly Val Val Lys Arg Ile Glu Arg Phe Glu Thr Phe Ala Lys Gln
770 775 780


Ile Gln His His Ile Asn Gln Val Lys Glu Asn Arg Leu Lys Gln Leu
785 790 795 800


Ala Asn Leu Ile Val Met Thr Ala Leu Gly Tyr Lys Tyr Asp Gln Glu
805 810 815


Gln Lys Lys Trp Ile Glu Val Tyr Pro Ala Cys Gln Val Val Leu Phe
820 825 830


Glu Asn Leu Arg Ser Tyr Arg Phe Ser Tyr Glu Arg Ser Arg Arg Glu
835 840 845


Asn Lys Lys Leu Met Glu Trp Ser His Arg Ser Ile Pro Lys Leu Val
850 855 860


Gln Met Gln Gly Glu Leu Phe Gly Leu Gln Val Ala Asp Val Tyr Ala
865 870 875 880


Ala Tyr Ser Ser Arg Tyr His Gly Arg Thr Gly Ala Pro Gly Ile Arg
885 890 895


Cys His Ala Leu Thr Glu Ala Asp Leu Arg Asn Glu Thr Asn Ile Ile
900 905 910


His Glu Leu Ile Glu Ala Gly Phe Ile Lys Glu Glu His Arg Pro Tyr
915 920 925


Leu Gln Gln Gly Asp Leu Val Pro Trp Ser Gly Gly Glu Leu Phe Ala
930 935 940


Thr Leu Gln Lys Pro Tyr Asp Asn Pro Arg Ile Leu Thr Leu His Ala
945 950 955 960


Asp Ile Asn Ala Ala Gln Asn Ile Gln Lys Arg Phe Trp His Pro Ser
965 970 975


Met Trp Phe Arg Val Asn Cys Glu Ser Val Met Glu Gly Glu Ile Val
980 985 990


Thr Tyr Val Pro Lys Asn Lys Thr Val His Lys Lys Gln Gly Lys Thr
995 1000 1005


Phe Arg Phe Val Lys Val Glu Gly Ser Asp Val Tyr Glu Trp Ala
1010 1015 1020


Lys Trp Ser Lys Asn Arg Asn Lys Asn Thr Phe Ser Ser Ile Thr
1025 1030 1035


Glu Arg Lys Pro Pro Ser Ser Met Ile Leu Phe Arg Asp Pro Ser
1040 1045 1050


Gly Thr Phe Phe Lys Glu Gln Glu Trp Val Glu Gln Lys Thr Phe
1055 1060 1065


Trp Gly Lys Val Gln Ser Met Ile Gln Ala Tyr Met Lys Lys Thr
1070 1075 1080


Ile Val Gln Arg Met Glu Glu
1085 1090


<210> 499
<211> 1041
<212> PRT
<213> Methylobacterium nodulans

<400> 499

Met Tyr Glu Ala Ile Val Leu Ala Asp Asp Ala Asn Ala Gln Leu Ala
1 5 10 15


Asn Ala Phe Leu Gly Pro Leu Thr Asp Pro Asn Ser Ala Gly Phe Leu
20 25 30


Glu Ala Phe Asn Lys Val Asp Arg Pro Ala Pro Ser Trp Leu Asp Gln
35 40 45


Val Pro Ala Ser Asp Pro Ile Asp Pro Ala Val Leu Ala Glu Ala Asn
50 55 60


Ala Trp Leu Asp Thr Asp Ala Gly Arg Ala Trp Leu Val Asp Thr Gly
65 70 75 80


Ala Pro Pro Arg Trp Arg Ser Leu Ala Ala Lys Gln Asp Pro Ile Trp
85 90 95


Pro Arg Glu Phe Ala Arg Lys Leu Gly Glu Leu Arg Lys Glu Ala Ala
100 105 110


Ser Gly Thr Ser Ala Ile Ile Lys Ala Leu Lys Arg Asp Phe Gly Val
115 120 125


Leu Pro Leu Phe Gln Pro Ser Leu Ala Pro Arg Ile Leu Gly Ser Arg
130 135 140


Ser Ser Leu Thr Pro Trp Asp Arg Leu Ala Phe Arg Leu Ala Val Gly
145 150 155 160


His Leu Leu Ser Trp Glu Ser Trp Cys Thr Arg Ala Arg Asp Glu His
165 170 175


Thr Ala Arg Val Gln Arg Leu Glu Gln Phe Ser Ser Ala His Leu Lys
180 185 190


Gly Asp Leu Ala Thr Lys Val Ser Thr Leu Arg Glu Tyr Glu Arg Ala
195 200 205


Arg Lys Glu Gln Ile Ala Gln Leu Gly Leu Pro Met Gly Glu Arg Asp
210 215 220


Phe Leu Ile Thr Val Arg Met Thr Arg Gly Trp Asp Asp Leu Arg Glu
225 230 235 240


Lys Trp Arg Arg Ser Gly Asp Lys Gly Gln Glu Ala Leu His Ala Ile
245 250 255


Ile Ala Thr Glu Gln Thr Arg Lys Arg Gly Arg Phe Gly Asp Pro Asp
260 265 270


Leu Phe Arg Trp Leu Ala Arg Pro Glu Asn His His Val Trp Ala Asp
275 280 285


Gly His Ala Asp Ala Val Gly Val Leu Ala Arg Val Asn Ala Met Glu
290 295 300


Arg Leu Val Glu Arg Ser Arg Asp Thr Ala Leu Met Thr Leu Pro Asp
305 310 315 320


Pro Val Ala His Pro Arg Ser Ala Gln Trp Glu Ala Glu Gly Gly Ser
325 330 335


Asn Leu Arg Asn Tyr Gln Leu Glu Ala Val Gly Gly Glu Leu Gln Ile
340 345 350


Thr Leu Pro Leu Leu Lys Ala Ala Asp Asp Gly Arg Cys Ile Asp Thr
355 360 365


Pro Leu Ser Phe Ser Leu Ala Pro Ser Asp Gln Leu Gln Gly Val Val
370 375 380


Leu Thr Lys Gln Asp Lys Gln Gln Lys Ile Thr Tyr Cys Thr Asn Met
385 390 395 400


Asn Glu Val Phe Glu Ala Lys Leu Gly Ser Ala Asp Leu Leu Leu Asn
405 410 415


Trp Asp His Leu Arg Gly Arg Ile Arg Asp Arg Val Asp Ala Gly Asp
420 425 430


Ile Gly Ser Ala Phe Leu Lys Leu Ala Leu Asp Val Ala His Val Leu
435 440 445


Pro Asp Gly Val Asp Asp Gln Leu Ala Arg Ala Ala Phe His Phe Gln
450 455 460


Ser Ala Lys Gly Ala Lys Ser Lys His Ala Asp Ser Val Gln Ala Gly
465 470 475 480


Leu Arg Val Leu Ser Ile Asp Leu Gly Val Arg Ser Phe Ala Thr Cys
485 490 495


Ser Val Phe Glu Leu Lys Asp Thr Ala Pro Thr Thr Gly Val Ala Phe
500 505 510


Pro Leu Ala Glu Phe Arg Leu Trp Ala Val His Glu Arg Ser Phe Thr
515 520 525


Leu Glu Leu Pro Gly Glu Asn Val Gly Ala Ala Gly Gln Gln Trp Arg
530 535 540


Ala Gln Ala Asp Ala Glu Leu Arg Gln Leu Arg Gly Gly Leu Asn Arg
545 550 555 560


His Arg Gln Leu Leu Arg Ala Ala Thr Val Gln Lys Gly Glu Arg Asp
565 570 575


Ala Tyr Leu Thr Asp Leu Arg Glu Ala Trp Ser Ala Lys Glu Leu Trp
580 585 590


Pro Phe Glu Ala Ser Leu Leu Ser Glu Leu Glu Arg Cys Ser Thr Val
595 600 605


Ala Asp Pro Leu Trp Gln Asp Thr Cys Lys Arg Ala Ala Arg Leu Tyr
610 615 620


Arg Thr Glu Phe Gly Ala Val Val Ser Glu Trp Arg Ser Arg Thr Arg
625 630 635 640


Ser Arg Glu Asp Arg Lys Tyr Ala Gly Lys Ser Met Trp Ser Val Gln
645 650 655


His Leu Thr Asp Val Arg Arg Phe Leu Gln Ser Trp Ser Leu Ala Gly
660 665 670


Arg Ala Ser Gly Asp Ile Arg Arg Leu Asp Arg Glu Arg Gly Gly Val
675 680 685


Phe Ala Lys Asp Leu Leu Asp His Ile Asp Ala Leu Lys Asp Asp Arg
690 695 700


Leu Lys Thr Gly Ala Asp Leu Ile Val Gln Ala Ala Arg Gly Phe Gln
705 710 715 720


Arg Asn Glu Phe Gly Tyr Trp Val Gln Lys His Ala Pro Cys His Val
725 730 735


Ile Leu Phe Glu Asp Leu Ser Arg Tyr Arg Met Arg Thr Asp Arg Pro
740 745 750


Arg Arg Glu Asn Ser Gln Leu Met Gln Trp Ala His Arg Gly Val Pro
755 760 765


Asp Met Val Gly Met Gln Gly Glu Ile Tyr Gly Ile Gln Asp Arg Arg
770 775 780


Asp Pro Asp Ser Ala Arg Lys His Ala Arg Gln Pro Leu Ala Ala Phe
785 790 795 800


Cys Leu Asp Thr Pro Ala Ala Phe Ser Ser Arg Tyr His Ala Ser Thr
805 810 815


Met Thr Pro Gly Ile Arg Cys His Pro Leu Arg Lys Arg Glu Phe Glu
820 825 830


Asp Gln Gly Phe Leu Glu Leu Leu Lys Arg Glu Asn Glu Gly Leu Asp
835 840 845


Leu Asn Gly Tyr Lys Pro Gly Asp Leu Val Pro Leu Pro Gly Gly Glu
850 855 860


Val Phe Val Cys Leu Asn Ala Asn Gly Leu Ser Arg Ile His Ala Asp
865 870 875 880


Ile Asn Ala Ala Gln Asn Leu Gln Arg Arg Phe Trp Thr Gln His Gly
885 890 895


Asp Ala Phe Arg Leu Pro Cys Gly Lys Ser Ala Val Gln Gly Gln Ile
900 905 910


Arg Trp Ala Pro Leu Ser Met Gly Lys Arg Gln Ala Gly Ala Leu Gly
915 920 925


Gly Phe Gly Tyr Leu Glu Pro Thr Gly His Asp Ser Gly Ser Cys Gln
930 935 940


Trp Arg Lys Thr Thr Glu Ala Glu Trp Arg Arg Leu Ser Gly Ala Gln
945 950 955 960


Lys Asp Arg Asp Glu Ala Ala Ala Ala Glu Asp Glu Glu Leu Gln Gly
965 970 975


Leu Glu Glu Glu Leu Leu Glu Arg Ser Gly Glu Arg Val Val Phe Phe
980 985 990


Arg Asp Pro Ser Gly Val Val Leu Pro Thr Asp Leu Trp Phe Pro Ser
995 1000 1005


Ala Ala Phe Trp Ser Ile Val Arg Ala Lys Thr Val Gly Arg Leu
1010 1015 1020


Arg Ser His Leu Asp Ala Gln Ala Glu Ala Ser Tyr Ala Val Ala
1025 1030 1035


Ala Gly Leu
1040


<210> 500
<211> 1388
<212> PRT
<213> Unknown

<220>
<223> Member of the phylum Opitutaceae

<400> 500

Met Ser Leu Asn Arg Ile Tyr Gln Gly Arg Val Ala Ala Val Glu Thr
1 5 10 15


Gly Thr Ala Leu Ala Lys Gly Asn Val Glu Trp Met Pro Ala Ala Gly
20 25 30


Gly Asp Glu Val Leu Trp Gln His His Glu Leu Phe Gln Ala Ala Ile
35 40 45


Asn Tyr Tyr Leu Val Ala Leu Leu Ala Leu Ala Asp Lys Asn Asn Pro
50 55 60


Val Leu Gly Pro Leu Ile Ser Gln Met Asp Asn Pro Gln Ser Pro Tyr
65 70 75 80


His Val Trp Gly Ser Phe Arg Arg Gln Gly Arg Gln Arg Thr Gly Leu
85 90 95


Ser Gln Ala Val Ala Pro Tyr Ile Thr Pro Gly Asn Asn Ala Pro Thr
100 105 110


Leu Asp Glu Val Phe Arg Ser Ile Leu Ala Gly Asn Pro Thr Asp Arg
115 120 125


Ala Thr Leu Asp Ala Ala Leu Met Gln Leu Leu Lys Ala Cys Asp Gly
130 135 140


Ala Gly Ala Ile Gln Gln Glu Gly Arg Ser Tyr Trp Pro Lys Phe Cys
145 150 155 160


Asp Pro Asp Ser Thr Ala Asn Phe Ala Gly Asp Pro Ala Met Leu Arg
165 170 175


Arg Glu Gln His Arg Leu Leu Leu Pro Gln Val Leu His Asp Pro Ala
180 185 190


Ile Thr His Asp Ser Pro Ala Leu Gly Ser Phe Asp Thr Tyr Ser Ile
195 200 205


Ala Thr Pro Asp Thr Arg Thr Pro Gln Leu Thr Gly Pro Lys Ala Arg
210 215 220


Ala Arg Leu Glu Gln Ala Ile Thr Leu Trp Arg Val Arg Leu Pro Glu
225 230 235 240


Ser Ala Ala Asp Phe Asp Arg Leu Ala Ser Ser Leu Lys Lys Ile Pro
245 250 255


Asp Asp Asp Ser Arg Leu Asn Leu Gln Gly Tyr Val Gly Ser Ser Ala
260 265 270


Lys Gly Glu Val Gln Ala Arg Leu Phe Ala Leu Leu Leu Phe Arg His
275 280 285


Leu Glu Arg Ser Ser Phe Thr Leu Gly Leu Leu Arg Ser Ala Thr Pro
290 295 300


Pro Pro Lys Asn Ala Glu Thr Pro Pro Pro Ala Gly Val Pro Leu Pro
305 310 315 320


Ala Ala Ser Ala Ala Asp Pro Val Arg Ile Ala Arg Gly Lys Arg Ser
325 330 335


Phe Val Phe Arg Ala Phe Thr Ser Leu Pro Cys Trp His Gly Gly Asp
340 345 350


Asn Ile His Pro Thr Trp Lys Ser Phe Asp Ile Ala Ala Phe Lys Tyr
355 360 365


Ala Leu Thr Val Ile Asn Gln Ile Glu Glu Lys Thr Lys Glu Arg Gln
370 375 380


Lys Glu Cys Ala Glu Leu Glu Thr Asp Phe Asp Tyr Met His Gly Arg
385 390 395 400


Leu Ala Lys Ile Pro Val Lys Tyr Thr Thr Gly Glu Ala Glu Pro Pro
405 410 415


Pro Ile Leu Ala Asn Asp Leu Arg Ile Pro Leu Leu Arg Glu Leu Leu
420 425 430


Gln Asn Ile Lys Val Asp Thr Ala Leu Thr Asp Gly Glu Ala Val Ser
435 440 445


Tyr Gly Leu Gln Arg Arg Thr Ile Arg Gly Phe Arg Glu Leu Arg Arg
450 455 460


Ile Trp Arg Gly His Ala Pro Ala Gly Thr Val Phe Ser Ser Glu Leu
465 470 475 480


Lys Glu Lys Leu Ala Gly Glu Leu Arg Gln Phe Gln Thr Asp Asn Ser
485 490 495


Thr Thr Ile Gly Ser Val Gln Leu Phe Asn Glu Leu Ile Gln Asn Pro
500 505 510


Lys Tyr Trp Pro Ile Trp Gln Ala Pro Asp Val Glu Thr Ala Arg Gln
515 520 525


Trp Ala Asp Ala Gly Phe Ala Asp Asp Pro Leu Ala Ala Leu Val Gln
530 535 540


Glu Ala Glu Leu Gln Glu Asp Ile Asp Ala Leu Lys Ala Pro Val Lys
545 550 555 560


Leu Thr Pro Ala Asp Pro Glu Tyr Ser Arg Arg Gln Tyr Asp Phe Asn
565 570 575


Ala Val Ser Lys Phe Gly Ala Gly Ser Arg Ser Ala Asn Arg His Glu
580 585 590


Pro Gly Gln Thr Glu Arg Gly His Asn Thr Phe Thr Thr Glu Ile Ala
595 600 605


Ala Arg Asn Ala Ala Asp Gly Asn Arg Trp Arg Ala Thr His Val Arg
610 615 620


Ile His Tyr Ser Ala Pro Arg Leu Leu Arg Asp Gly Leu Arg Arg Pro
625 630 635 640


Asp Thr Asp Gly Asn Glu Ala Leu Glu Ala Val Pro Trp Leu Gln Pro
645 650 655


Met Met Glu Ala Leu Ala Pro Leu Pro Thr Leu Pro Gln Asp Leu Thr
660 665 670


Gly Met Pro Val Phe Leu Met Pro Asp Val Thr Leu Ser Gly Glu Arg
675 680 685


Arg Ile Leu Leu Asn Leu Pro Val Thr Leu Glu Pro Ala Ala Leu Val
690 695 700


Glu Gln Leu Gly Asn Ala Gly Arg Trp Gln Asn Gln Phe Phe Gly Ser
705 710 715 720


Arg Glu Asp Pro Phe Ala Leu Arg Trp Pro Ala Asp Gly Ala Val Lys
725 730 735


Thr Ala Lys Gly Lys Thr His Ile Pro Trp His Gln Asp Arg Asp His
740 745 750


Phe Thr Val Leu Gly Val Asp Leu Gly Thr Arg Asp Ala Gly Ala Leu
755 760 765


Ala Leu Leu Asn Val Thr Ala Gln Lys Pro Ala Lys Pro Val His Arg
770 775 780


Ile Ile Gly Glu Ala Asp Gly Arg Thr Trp Tyr Ala Ser Leu Ala Asp
785 790 795 800


Ala Arg Met Ile Arg Leu Pro Gly Glu Asp Ala Arg Leu Phe Val Arg
805 810 815


Gly Lys Leu Val Gln Glu Pro Tyr Gly Glu Arg Gly Arg Asn Ala Ser
820 825 830


Leu Leu Glu Trp Glu Asp Ala Arg Asn Ile Ile Leu Arg Leu Gly Gln
835 840 845


Asn Pro Asp Glu Leu Leu Gly Ala Asp Pro Arg Arg His Ser Tyr Pro
850 855 860


Glu Ile Asn Asp Lys Leu Leu Val Ala Leu Arg Arg Ala Gln Ala Arg
865 870 875 880


Leu Ala Arg Leu Gln Asn Arg Ser Trp Arg Leu Arg Asp Leu Ala Glu
885 890 895


Ser Asp Lys Ala Leu Asp Glu Ile His Ala Glu Arg Ala Gly Glu Lys
900 905 910


Pro Ser Pro Leu Pro Pro Leu Ala Arg Asp Asp Ala Ile Lys Ser Thr
915 920 925


Asp Glu Ala Leu Leu Ser Gln Arg Asp Ile Ile Arg Arg Ser Phe Val
930 935 940


Gln Ile Ala Asn Leu Ile Leu Pro Leu Arg Gly Arg Arg Trp Glu Trp
945 950 955 960


Arg Pro His Val Glu Val Pro Asp Cys His Ile Leu Ala Gln Ser Asp
965 970 975


Pro Gly Thr Asp Asp Thr Lys Arg Leu Val Ala Gly Gln Arg Gly Ile
980 985 990


Ser His Glu Arg Ile Glu Gln Ile Glu Glu Leu Arg Arg Arg Cys Gln
995 1000 1005


Ser Leu Asn Arg Ala Leu Arg His Lys Pro Gly Glu Arg Pro Val
1010 1015 1020


Leu Gly Arg Pro Ala Lys Gly Glu Glu Ile Ala Asp Pro Cys Pro
1025 1030 1035


Ala Leu Leu Glu Lys Ile Asn Arg Leu Arg Asp Gln Arg Val Asp
1040 1045 1050


Gln Thr Ala His Ala Ile Leu Ala Ala Ala Leu Gly Val Arg Leu
1055 1060 1065


Arg Ala Pro Ser Lys Asp Arg Ala Glu Arg Arg His Arg Asp Ile
1070 1075 1080


His Gly Glu Tyr Glu Arg Phe Arg Ala Pro Ala Asp Phe Val Val
1085 1090 1095


Ile Glu Asn Leu Ser Arg Tyr Leu Ser Ser Gln Asp Arg Ala Arg
1100 1105 1110


Ser Glu Asn Thr Arg Leu Met Gln Trp Cys His Arg Gln Ile Val
1115 1120 1125


Gln Lys Leu Arg Gln Leu Cys Glu Thr Tyr Gly Ile Pro Val Leu
1130 1135 1140


Ala Val Pro Ala Ala Tyr Ser Ser Arg Phe Ser Ser Arg Asp Gly
1145 1150 1155


Ser Ala Gly Phe Arg Ala Val His Leu Thr Pro Asp His Arg His
1160 1165 1170


Arg Met Pro Trp Ser Arg Ile Leu Ala Arg Leu Lys Ala His Glu
1175 1180 1185


Glu Asp Gly Lys Arg Leu Glu Lys Thr Val Leu Asp Glu Ala Arg
1190 1195 1200


Ala Val Arg Gly Leu Phe Asp Arg Leu Asp Arg Phe Asn Ala Gly
1205 1210 1215


His Val Pro Gly Lys Pro Trp Arg Thr Leu Leu Ala Pro Leu Pro
1220 1225 1230


Gly Gly Pro Val Phe Val Pro Leu Gly Asp Ala Thr Pro Met Gln
1235 1240 1245


Ala Asp Leu Asn Ala Ala Ile Asn Ile Ala Leu Arg Gly Ile Ala
1250 1255 1260


Ala Pro Asp Arg His Asp Ile His His Arg Leu Arg Ala Glu Asn
1265 1270 1275


Lys Lys Arg Ile Leu Ser Leu Arg Leu Gly Thr Gln Arg Glu Lys
1280 1285 1290


Ala Arg Trp Pro Gly Gly Ala Pro Ala Val Thr Leu Ser Thr Pro
1295 1300 1305


Asn Asn Gly Ala Ser Pro Glu Asp Ser Asp Ala Leu Pro Glu Arg
1310 1315 1320


Val Ser Asn Leu Phe Val Asp Ile Ala Gly Val Ala Asn Phe Glu
1325 1330 1335


Arg Val Thr Ile Glu Gly Val Ser Gln Lys Phe Ala Thr Gly Arg
1340 1345 1350


Gly Leu Trp Ala Ser Val Lys Gln Arg Ala Trp Asn Arg Val Ala
1355 1360 1365


Arg Leu Asn Glu Thr Val Thr Asp Asn Asn Arg Asn Glu Glu Glu
1370 1375 1380


Asp Asp Ile Pro Met
1385


<210> 501
<211> 162
<212> DNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 501
caacatgctc gctttgcgaa ggctgacggc ccgctctcat ttggcattgc cgggagccgg 60

agttttcgga agagagtgtc gacgactgct gatctccgca tccgcgtcct gttcgccagg 120

ccgggtcggg tgtacggatc atgctggcag cagtctacgc cg 162


<210> 502
<211> 60
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 502
cggaagagag ugucgacgac ugcugaucuc cgcauccgcg uccuguucgc caggccgggu 60


<210> 503
<211> 62
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 503
ccaacaugcu cgcuuugcga aggcugacgg cccgcucuca uuuggcauug ccgggagccg 60

ga 62


<210> 504
<211> 118
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 504
ucgcuuugcg aaggcugacg gcccgcucuc auuuggcauu gccgggagcc ggaguuuucg 60

gaagagagug ucgacgacug cugaucuccg cauccgcguc cuguucgcca ggccgggu 118


<210> 505
<211> 87
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 505
augcucgcuu ugcgaaggcu gacggcccgc ucucauuugg cauugccggg agccggaguu 60

uucggaagag agugucgacg acugcug 87


<210> 506
<211> 71
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 506
aguuuucgga agagaguguc gacgacugcu gaucuccgca uccgcguccu guucgccagg 60

ccgggucggg u 71


<210> 507
<211> 61
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 507
cgccuaucag ccaacaugcu cgcuuugcga aggcugacgg cccgcucuca uuuggcauug 60

c 61


<210> 508
<211> 87
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 508
cgccuaucag ccaacaugcu cgcuuugcga aggcugacgg cccgcucuca uuuggcauug 60

ccgggagccg gaguuuucgg aagagag 87


<210> 509
<211> 84
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 509
ugaucuccgc auccgcgucc uguucgccag gccgggucgg guguacggau caugcuggca 60

gcagucuacg ccgagaacau ucgc 84


<210> 510
<211> 84
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 510
ugaucuccgc auccgcgucc uguucgccag gccgggucgg guguacggau caugcuggca 60

gcagucuacg ccgagaacau ucgc 84


<210> 511
<211> 83
<212> RNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 511
uccgcauccg cguccuguuc gccaggccgg gucgggugua cggaucaugc uggcagcagu 60

cuacgccgag aacauucgcu uuu 83


<210> 512
<211> 32
<212> DNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 512
ggcgcaaccc gcacacaacc gcgaatggac ac 32


<210> 513
<211> 14
<212> DNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 513
ccgcgaatgg acac 14


<210> 514
<211> 20
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 514
uggguugggu uggguuggga 20


<210> 515
<211> 23
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 515
uggguuuggg uuuggguuug gga 23


<210> 516
<211> 1129
<212> PRT
<213> Alicyclobacillus acidoterrestris

<400> 516

Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro
1 5 10 15


Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly
20 25 30


Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45


Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr
50 55 60


Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80


Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95


Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110


Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125


Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140


Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160


Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala
165 170 175


Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190


Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg
195 200 205


Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220


Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln
225 230 235 240


Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn
245 250 255


Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln
260 265 270


Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285


His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300


Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala
305 310 315 320


Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335


Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg
340 345 350


Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu
355 360 365


Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380


Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400


Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His
405 410 415


Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg
420 425 430


Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp
435 440 445


Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg
450 455 460


Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys
465 470 475 480


Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly
485 490 495


Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser
500 505 510


Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525


Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540


Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560


Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575


Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590


Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp
595 600 605


Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620


Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640


Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655


Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670


Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp
675 680 685


Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly
690 695 700


Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg
705 710 715 720


Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp
725 730 735


Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val
740 745 750


Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr
755 760 765


Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val
770 775 780


Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His
785 790 795 800


Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile
805 810 815


Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys
820 825 830


Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845


Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860


Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile
865 870 875 880


Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895


Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910


Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe
915 920 925


Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys
930 935 940


Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe
945 950 955 960


Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975


Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe
980 985 990


Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005


Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020


Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr
1025 1030 1035


Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050


Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065


Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080


Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095


Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110


Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125


Ile



<210> 517
<211> 1147
<212> PRT
<213> Alicyclobacillus kakegawensis

<400> 517

Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Ser Glu Cys Pro
1 5 10 15


Asp Ile Leu Ala Gly Met Trp Gln Leu His Arg Ala Thr Asn Ala Gly
20 25 30


Val Arg Tyr Tyr Thr Glu Trp Val Ser Leu Met Arg Gln Glu Ile Leu
35 40 45


Tyr Ser Arg Gly Pro Asp Gly Gly Gln Gln Cys Tyr Met Thr Ala Glu
50 55 60


Asp Cys Gln Arg Glu Leu Leu Arg Arg Leu Arg Asn Arg Gln Leu His
65 70 75 80


Asn Gly Arg Gln Asp Gln Pro Gly Thr Asp Ala Asp Leu Leu Ala Ile
85 90 95


Ser Arg Arg Leu Tyr Glu Ile Leu Val Leu Gln Ser Ile Gly Lys Arg
100 105 110


Gly Asp Ala Gln Gln Ile Ala Ser Ser Phe Leu Ser Pro Leu Val Asp
115 120 125


Pro Asn Ser Lys Gly Gly Arg Gly Glu Ala Lys Ser Gly Arg Lys Pro
130 135 140


Ala Trp Gln Lys Met Arg Asp Gln Gly Asp Pro Arg Trp Val Ala Ala
145 150 155 160


Arg Glu Lys Tyr Glu Gln Arg Lys Ala Val Asp Pro Ser Lys Glu Ile
165 170 175


Leu Asn Ser Leu Asp Ala Leu Gly Leu Arg Pro Leu Phe Ala Val Phe
180 185 190


Thr Glu Thr Tyr Arg Ser Gly Val Asp Trp Lys Pro Leu Gly Lys Ser
195 200 205


Gln Gly Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala Leu Glu
210 215 220


Arg Leu Met Ser Trp Glu Ser Trp Asn Arg Arg Val Gly Glu Glu Tyr
225 230 235 240


Ala Arg Leu Phe Gln Gln Lys Met Lys Phe Glu Gln Glu His Phe Ala
245 250 255


Glu Gln Ser His Leu Val Lys Leu Ala Arg Ala Leu Glu Ala Asp Met
260 265 270


Arg Ala Ala Ser Gln Gly Phe Glu Ala Lys Arg Gly Thr Ala His Gln
275 280 285


Ile Thr Arg Arg Ala Leu Arg Gly Ala Asp Arg Val Phe Glu Ile Trp
290 295 300


Lys Ser Ile Pro Glu Glu Ala Leu Phe Ser Gln Tyr Asp Glu Val Ile
305 310 315 320


Arg Gln Val Gln Ala Glu Lys Arg Arg Asp Phe Gly Ser His Asp Leu
325 330 335


Phe Ala Lys Leu Ala Glu Pro Lys Tyr Gln Pro Leu Trp Arg Ala Asp
340 345 350


Glu Thr Phe Leu Thr Arg Tyr Ala Leu Tyr Asn Gly Val Leu Arg Asp
355 360 365


Leu Glu Lys Ala Arg Gln Phe Ala Thr Phe Thr Leu Pro Asp Ala Cys
370 375 380


Val Asn Pro Ile Trp Thr Arg Phe Glu Ser Ser Gln Gly Ser Asn Leu
385 390 395 400


His Lys Tyr Glu Phe Leu Phe Asp His Leu Gly Pro Gly Arg His Ala
405 410 415


Val Arg Phe Gln Arg Leu Leu Val Val Glu Ser Glu Gly Ala Lys Glu
420 425 430


Arg Asp Ser Val Val Val Pro Val Ala Pro Ser Gly Gln Leu Asp Lys
435 440 445


Leu Val Leu Arg Glu Glu Glu Lys Ser Ser Val Ala Leu His Leu His
450 455 460


Asp Thr Ala Arg Pro Asp Gly Phe Met Ala Glu Trp Ala Gly Ala Lys
465 470 475 480


Leu Gln Tyr Glu Arg Ser Thr Leu Ala Arg Lys Ala Arg Arg Asp Lys
485 490 495


Gln Gly Met Arg Ser Trp Arg Arg Gln Pro Ser Met Leu Met Ser Ala
500 505 510


Ala Gln Met Leu Glu Asp Ala Lys Gln Ala Gly Asp Val Tyr Leu Asn
515 520 525


Ile Ser Val Arg Val Lys Ser Pro Ser Glu Val Arg Gly Gln Arg Arg
530 535 540


Pro Pro Tyr Ala Ala Leu Phe Arg Ile Asp Asp Lys Gln Arg Arg Val
545 550 555 560


Thr Val Asn Tyr Asn Lys Leu Ser Ala Tyr Leu Glu Glu His Pro Asp
565 570 575


Lys Gln Ile Pro Gly Ala Pro Gly Leu Leu Ser Gly Leu Arg Val Met
580 585 590


Ser Val Asp Leu Gly Leu Arg Thr Ser Ala Ser Ile Ser Val Phe Arg
595 600 605


Val Ala Lys Lys Glu Glu Val Glu Ala Leu Gly Asp Gly Arg Pro Pro
610 615 620


His Tyr Tyr Pro Ile His Gly Thr Asp Asp Leu Val Ala Val His Glu
625 630 635 640


Arg Ser His Leu Ile Gln Met Pro Gly Glu Thr Glu Thr Lys Gln Leu
645 650 655


Arg Lys Leu Arg Glu Glu Arg Gln Ala Val Leu Arg Pro Leu Phe Ala
660 665 670


Gln Leu Ala Leu Leu Arg Leu Leu Val Arg Cys Gly Ala Ala Asp Glu
675 680 685


Arg Ile Arg Thr Arg Ser Trp Gln Arg Leu Thr Lys Gln Gly Arg Glu
690 695 700


Phe Thr Lys Arg Leu Thr Pro Ser Trp Arg Glu Ala Leu Glu Leu Glu
705 710 715 720


Leu Thr Arg Leu Glu Ala Tyr Cys Gly Arg Val Pro Asp Asp Glu Trp
725 730 735


Ser Arg Ile Val Asp Arg Thr Val Ile Ala Leu Trp Arg Arg Met Gly
740 745 750


Lys Gln Val Arg Asp Trp Arg Lys Gln Val Lys Ser Gly Ala Lys Val
755 760 765


Lys Val Lys Gly Tyr Gln Leu Asp Val Val Gly Gly Asn Ser Leu Ala
770 775 780


Gln Ile Asp Tyr Leu Glu Gln Gln Tyr Lys Phe Leu Arg Arg Trp Ser
785 790 795 800


Phe Phe Ala Arg Ala Ser Gly Leu Val Val Arg Ala Asp Arg Glu Ser
805 810 815


His Phe Ala Val Ala Leu Arg Gln His Ile Glu Asn Ala Lys Arg Asp
820 825 830


Arg Leu Lys Lys Leu Ala Asp Arg Ile Leu Met Glu Ala Leu Gly Tyr
835 840 845


Val Tyr Glu Ala Ser Gly Pro Arg Glu Gly Gln Trp Thr Ala Gln His
850 855 860


Pro Pro Cys Gln Leu Ile Ile Leu Glu Glu Leu Ser Ala Tyr Arg Phe
865 870 875 880


Ser Asp Asp Arg Pro Pro Ser Glu Asn Ser Lys Leu Met Ala Trp Gly
885 890 895


His Arg Gly Ile Leu Glu Glu Leu Val Asn Gln Ala Gln Val His Asp
900 905 910


Val Leu Val Gly Thr Val Tyr Ala Ala Phe Ser Ser Arg Phe Asp Ala
915 920 925


Arg Thr Gly Ala Pro Gly Val Arg Cys Arg Arg Val Pro Ala Arg Phe
930 935 940


Val Gly Ala Thr Val Asp Asp Ser Leu Pro Leu Trp Leu Thr Glu Phe
945 950 955 960


Leu Asp Lys His Arg Leu Asp Lys Asn Leu Leu Arg Pro Asp Asp Val
965 970 975


Ile Pro Thr Gly Glu Gly Glu Phe Leu Val Ser Pro Cys Gly Glu Glu
980 985 990


Ala Ala Arg Val Arg Gln Val His Ala Asp Ile Asn Ala Ala Gln Asn
995 1000 1005


Leu Gln Arg Arg Leu Trp Gln Asn Phe Asp Ile Thr Glu Leu Arg
1010 1015 1020


Leu Arg Cys Asp Val Lys Met Gly Gly Glu Gly Thr Val Leu Val
1025 1030 1035


Pro Arg Val Asn Asn Ala Arg Ala Lys Gln Leu Phe Gly Lys Lys
1040 1045 1050


Val Leu Val Ser Gln Asp Gly Val Thr Phe Phe Glu Arg Ser Gln
1055 1060 1065


Thr Gly Gly Lys Pro His Ser Glu Lys Gln Thr Asp Leu Thr Asp
1070 1075 1080


Lys Glu Leu Glu Leu Ile Ala Glu Ala Asp Glu Ala Arg Ala Lys
1085 1090 1095


Ser Val Val Leu Phe Arg Asp Pro Ser Gly His Ile Gly Lys Gly
1100 1105 1110


His Trp Ile Arg Gln Arg Glu Phe Trp Ser Leu Val Lys Gln Arg
1115 1120 1125


Ile Glu Ser His Thr Ala Glu Arg Ile Arg Val Arg Gly Val Gly
1130 1135 1140


Ser Ser Leu Asp
1145


<210> 518
<211> 1146
<212> PRT
<213> Alicyclobacillus macrosporangiidus

<400> 518

Met Asn Val Ala Val Lys Ser Ile Lys Val Lys Leu Met Leu Gly His
1 5 10 15


Leu Pro Glu Ile Arg Glu Gly Leu Trp His Leu His Glu Ala Val Asn
20 25 30


Leu Gly Val Arg Tyr Tyr Thr Glu Trp Leu Ala Leu Leu Arg Gln Gly
35 40 45


Asn Leu Tyr Arg Arg Gly Lys Asp Gly Ala Gln Glu Cys Tyr Met Thr
50 55 60


Ala Glu Gln Cys Arg Gln Glu Leu Leu Val Arg Leu Arg Asp Arg Gln
65 70 75 80


Lys Arg Asn Gly His Thr Gly Asp Pro Gly Thr Asp Glu Glu Leu Leu
85 90 95


Gly Val Ala Arg Arg Leu Tyr Glu Leu Leu Val Pro Gln Ser Val Gly
100 105 110


Lys Lys Gly Gln Ala Gln Met Leu Ala Ser Gly Phe Leu Ser Pro Leu
115 120 125


Ala Asp Pro Lys Ser Glu Gly Gly Lys Gly Thr Ser Lys Ser Gly Arg
130 135 140


Lys Pro Ala Trp Met Gly Met Lys Glu Ala Gly Asp Ser Arg Trp Val
145 150 155 160


Glu Ala Lys Ala Arg Tyr Glu Ala Asn Lys Ala Lys Asp Pro Thr Lys
165 170 175


Gln Val Ile Ala Ser Leu Glu Met Tyr Gly Leu Arg Pro Leu Phe Asp
180 185 190


Val Phe Thr Glu Thr Tyr Lys Thr Ile Arg Trp Met Pro Leu Gly Lys
195 200 205


His Gln Gly Val Arg Ala Trp Asp Arg Asp Met Phe Gln Gln Ser Leu
210 215 220


Glu Arg Leu Met Ser Trp Glu Ser Trp Asn Glu Arg Val Gly Ala Glu
225 230 235 240


Phe Ala Arg Leu Val Asp Arg Arg Asp Arg Phe Arg Glu Lys His Phe
245 250 255


Thr Gly Gln Glu His Leu Val Ala Leu Ala Gln Arg Leu Glu Gln Glu
260 265 270


Met Lys Glu Ala Ser Pro Gly Phe Glu Ser Lys Ser Ser Gln Ala His
275 280 285


Arg Ile Thr Lys Arg Ala Leu Arg Gly Ala Asp Gly Ile Ile Asp Asp
290 295 300


Trp Leu Lys Leu Ser Glu Gly Glu Pro Val Asp Arg Phe Asp Glu Ile
305 310 315 320


Leu Arg Lys Arg Gln Ala Gln Asn Pro Arg Arg Phe Gly Ser His Asp
325 330 335


Leu Phe Leu Lys Leu Ala Glu Pro Val Phe Gln Pro Leu Trp Arg Glu
340 345 350


Asp Pro Ser Phe Leu Ser Arg Trp Ala Ser Tyr Asn Glu Val Leu Asn
355 360 365


Lys Leu Glu Asp Ala Lys Gln Phe Ala Thr Phe Thr Leu Pro Ser Pro
370 375 380


Cys Ser Asn Pro Val Trp Ala Arg Phe Glu Asn Ala Glu Gly Thr Asn
385 390 395 400


Ile Phe Lys Tyr Asp Phe Leu Phe Asp His Phe Gly Lys Gly Arg His
405 410 415


Gly Val Arg Phe Gln Arg Met Ile Val Met Arg Asp Gly Val Pro Thr
420 425 430


Glu Val Glu Gly Ile Val Val Pro Ile Ala Pro Ser Arg Gln Leu Asp
435 440 445


Ala Leu Ala Pro Asn Asp Ala Ala Ser Pro Ile Asp Val Phe Val Gly
450 455 460


Asp Pro Ala Ala Pro Gly Ala Phe Arg Gly Gln Phe Gly Gly Ala Lys
465 470 475 480


Ile Gln Tyr Arg Arg Ser Ala Leu Val Arg Lys Gly Arg Arg Glu Glu
485 490 495


Lys Ala Tyr Leu Cys Gly Phe Arg Leu Pro Ser Gln Arg Arg Thr Gly
500 505 510


Thr Pro Ala Asp Asp Ala Gly Glu Val Phe Leu Asn Leu Ser Leu Arg
515 520 525


Val Glu Ser Gln Ser Glu Gln Ala Gly Arg Arg Asn Pro Pro Tyr Ala
530 535 540


Ala Val Phe His Ile Ser Asp Gln Thr Arg Arg Val Ile Val Arg Tyr
545 550 555 560


Gly Glu Ile Glu Arg Tyr Leu Ala Glu His Pro Asp Thr Gly Ile Pro
565 570 575


Gly Ser Arg Gly Leu Thr Ser Gly Leu Arg Val Met Ser Val Asp Leu
580 585 590


Gly Leu Arg Thr Ser Ala Ala Ile Ser Val Phe Arg Val Ala His Arg
595 600 605


Asp Glu Leu Thr Pro Asp Ala His Gly Arg Gln Pro Phe Phe Phe Pro
610 615 620


Ile His Gly Met Asp His Leu Val Ala Leu His Glu Arg Ser His Leu
625 630 635 640


Ile Arg Leu Pro Gly Glu Thr Glu Ser Lys Lys Val Arg Ser Ile Arg
645 650 655


Glu Gln Arg Leu Asp Arg Leu Asn Arg Leu Arg Ser Gln Met Ala Ser
660 665 670


Leu Arg Leu Leu Val Arg Thr Gly Val Leu Asp Glu Gln Lys Arg Asp
675 680 685


Arg Asn Trp Glu Arg Leu Gln Ser Ser Met Glu Arg Gly Gly Glu Arg
690 695 700


Met Pro Ser Asp Trp Trp Asp Leu Phe Gln Ala Gln Val Arg Tyr Leu
705 710 715 720


Ala Gln His Arg Asp Ala Ser Gly Glu Ala Trp Gly Arg Met Val Gln
725 730 735


Ala Ala Val Arg Thr Leu Trp Arg Gln Leu Ala Lys Gln Val Arg Asp
740 745 750


Trp Arg Lys Glu Val Arg Arg Asn Ala Asp Lys Val Lys Ile Arg Gly
755 760 765


Ile Ala Arg Asp Val Pro Gly Gly His Ser Leu Ala Gln Leu Asp Tyr
770 775 780


Leu Glu Arg Gln Tyr Arg Phe Leu Arg Ser Trp Ser Ala Phe Ser Val
785 790 795 800


Gln Ala Gly Gln Val Val Arg Ala Glu Arg Asp Ser Arg Phe Ala Val
805 810 815


Ala Leu Arg Glu His Ile Asp Asn Gly Lys Lys Asp Arg Leu Lys Lys
820 825 830


Leu Ala Asp Arg Ile Leu Met Glu Ala Leu Gly Tyr Val Tyr Val Thr
835 840 845


Asp Gly Arg Arg Ala Gly Gln Trp Gln Ala Val Tyr Pro Pro Cys Gln
850 855 860


Leu Val Leu Leu Glu Glu Leu Ser Glu Tyr Arg Phe Ser Asn Asp Arg
865 870 875 880


Pro Pro Ser Glu Asn Ser Gln Leu Met Val Trp Ser His Arg Gly Val
885 890 895


Leu Glu Glu Leu Ile His Gln Ala Gln Val His Asp Val Leu Val Gly
900 905 910


Thr Ile Pro Ala Ala Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala
915 920 925


Pro Gly Ile Arg Cys Arg Arg Val Pro Ser Ile Pro Leu Lys Asp Ala
930 935 940


Pro Ser Ile Pro Ile Trp Leu Ser His Tyr Leu Lys Gln Thr Glu Arg
945 950 955 960


Asp Ala Ala Ala Leu Arg Pro Gly Glu Leu Ile Pro Thr Gly Asp Gly
965 970 975


Glu Phe Leu Val Thr Pro Ala Gly Arg Gly Ala Ser Gly Val Arg Val
980 985 990


Val His Ala Asp Ile Asn Ala Ala His Asn Leu Gln Arg Arg Leu Trp
995 1000 1005


Glu Asn Phe Asp Leu Ser Asp Ile Arg Val Arg Cys Asp Arg Arg
1010 1015 1020


Glu Gly Lys Asp Gly Thr Val Val Leu Ile Pro Arg Leu Thr Asn
1025 1030 1035


Gln Arg Val Lys Glu Arg Tyr Ser Gly Val Ile Phe Thr Ser Glu
1040 1045 1050


Asp Gly Val Ser Phe Thr Val Gly Asp Ala Lys Thr Arg Arg Arg
1055 1060 1065


Ser Ser Ala Ser Gln Gly Glu Gly Asp Asp Leu Ser Asp Glu Glu
1070 1075 1080


Gln Glu Leu Leu Ala Glu Ala Asp Asp Ala Arg Glu Arg Ser Val
1085 1090 1095


Val Leu Phe Arg Asp Pro Ser Gly Phe Val Asn Gly Gly Arg Trp
1100 1105 1110


Thr Ala Gln Arg Ala Phe Trp Gly Met Val His Asn Arg Ile Glu
1115 1120 1125


Thr Leu Leu Ala Glu Arg Phe Ser Val Ser Gly Ala Ala Glu Lys
1130 1135 1140


Val Arg Gly
1145


<210> 519
<211> 1108
<212> PRT
<213> Bacillus hisashii

<400> 519

Met Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
1 5 10 15


Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
20 25 30


Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
35 40 45


His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
50 55 60


Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
65 70 75 80


Ser Phe Thr His Glu Val Asp Lys Asp Glu Val Phe Asn Ile Leu Arg
85 90 95


Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
100 105 110


Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
115 120 125


Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
130 135 140


Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
145 150 155 160


Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
165 170 175


Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Tyr Thr Asp
180 185 190


Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
195 200 205


Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
210 215 220


Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
225 230 235 240


Tyr Glu Lys Val Glu Lys Glu Tyr Lys Thr Leu Glu Glu Arg Ile Lys
245 250 255


Glu Asp Ile Gln Ala Leu Lys Ala Leu Glu Gln Tyr Glu Lys Glu Arg
260 265 270


Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
275 280 285


Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
290 295 300


Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
305 310 315 320


Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
325 330 335


Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
340 345 350


Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
355 360 365


Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
370 375 380


His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
385 390 395 400


Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
405 410 415


Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
420 425 430


Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
435 440 445


Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
450 455 460


Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
465 470 475 480


Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
485 490 495


Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
500 505 510


Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
515 520 525


Ile His Arg Asp Asp Phe Pro Lys Val Val Asn Phe Lys Pro Lys Glu
530 535 540


Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
545 550 555 560


Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
565 570 575


Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
580 585 590


Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
595 600 605


Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
610 615 620


Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
625 630 635 640


Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
645 650 655


Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
660 665 670


Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
675 680 685


Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
690 695 700


Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
705 710 715 720


Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
725 730 735


Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
740 745 750


Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
755 760 765


Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
770 775 780


Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
785 790 795 800


Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
805 810 815


Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
820 825 830


Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
835 840 845


Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
850 855 860


Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
865 870 875 880


Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
885 890 895


Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
900 905 910


Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
915 920 925


Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
930 935 940


Lys Cys Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
945 950 955 960


Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
965 970 975


Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp
980 985 990


Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu
995 1000 1005


Lys Asp Gly Val Tyr Glu Trp Val Asn Ala Gly Lys Leu Lys Ile
1010 1015 1020


Lys Lys Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser
1025 1030 1035


Asp Ile Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly
1040 1045 1050


Glu Lys Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro
1055 1060 1065


Ser Asp Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu
1070 1075 1080


Arg Ile Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr
1085 1090 1095


Ile Glu Asp Asp Ser Ser Lys Gln Ser Met
1100 1105


<210> 520
<211> 1108
<212> PRT
<213> Bacillus species

<400> 520

Met Ala Ile Arg Ser Ile Lys Leu Lys Leu Lys Thr His Thr Gly Pro
1 5 10 15


Glu Ala Gln Asn Leu Arg Lys Gly Ile Trp Arg Thr His Arg Leu Leu
20 25 30


Asn Glu Gly Val Ala Tyr Tyr Met Lys Met Leu Leu Leu Phe Arg Gln
35 40 45


Glu Ser Thr Gly Glu Arg Pro Lys Glu Glu Leu Gln Glu Glu Leu Ile
50 55 60


Cys His Ile Arg Glu Gln Gln Gln Arg Asn Gln Ala Asp Lys Asn Thr
65 70 75 80


Gln Ala Leu Pro Leu Asp Lys Ala Leu Glu Ala Leu Arg Gln Leu Tyr
85 90 95


Glu Leu Leu Val Pro Ser Ser Val Gly Gln Ser Gly Asp Ala Gln Ile
100 105 110


Ile Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly
115 120 125


Gly Lys Gly Thr Ser Lys Ala Gly Ala Lys Pro Thr Trp Gln Lys Lys
130 135 140


Lys Glu Ala Asn Asp Pro Thr Trp Glu Gln Asp Tyr Glu Lys Trp Lys
145 150 155 160


Lys Arg Arg Glu Glu Asp Pro Thr Ala Ser Val Ile Thr Thr Leu Glu
165 170 175


Glu Tyr Gly Ile Arg Pro Ile Phe Pro Leu Tyr Thr Asn Thr Val Thr
180 185 190


Asp Ile Ala Trp Leu Pro Leu Gln Ser Asn Gln Phe Val Arg Thr Trp
195 200 205


Asp Arg Asp Met Leu Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220


Ser Trp Asn Lys Arg Val Gln Glu Glu Tyr Ala Lys Leu Lys Glu Lys
225 230 235 240


Met Ala Gln Leu Asn Glu Gln Leu Glu Gly Gly Gln Glu Trp Ile Ser
245 250 255


Leu Leu Glu Gln Tyr Glu Glu Asn Arg Glu Arg Glu Leu Arg Glu Asn
260 265 270


Met Thr Ala Ala Asn Asp Lys Tyr Arg Ile Thr Lys Arg Gln Met Lys
275 280 285


Gly Trp Asn Glu Leu Tyr Glu Leu Trp Ser Thr Phe Pro Ala Ser Ala
290 295 300


Ser His Glu Gln Tyr Lys Glu Ala Leu Lys Arg Val Gln Gln Arg Leu
305 310 315 320


Arg Gly Arg Phe Gly Asp Ala His Phe Phe Gln Tyr Leu Met Glu Glu
325 330 335


Lys Asn Arg Leu Ile Trp Lys Gly Asn Pro Gln Arg Ile His Tyr Phe
340 345 350


Val Ala Arg Asn Glu Leu Thr Lys Arg Leu Glu Glu Ala Lys Gln Ser
355 360 365


Ala Thr Met Thr Leu Pro Asn Ala Arg Lys His Pro Leu Trp Val Arg
370 375 380


Phe Asp Ala Arg Gly Gly Asn Leu Gln Asp Tyr Tyr Leu Thr Ala Glu
385 390 395 400


Ala Asp Lys Pro Arg Ser Arg Arg Phe Val Thr Phe Ser Gln Leu Ile
405 410 415


Trp Pro Ser Glu Ser Gly Trp Met Glu Lys Lys Asp Val Glu Val Glu
420 425 430


Leu Ala Leu Ser Arg Gln Phe Tyr Gln Gln Val Lys Leu Leu Lys Asn
435 440 445


Asp Lys Gly Lys Gln Lys Ile Glu Phe Lys Asp Lys Gly Ser Gly Ser
450 455 460


Thr Phe Asn Gly His Leu Gly Gly Ala Lys Leu Gln Leu Glu Arg Gly
465 470 475 480


Asp Leu Glu Lys Glu Glu Lys Asn Phe Glu Asp Gly Glu Ile Gly Ser
485 490 495


Val Tyr Leu Asn Val Val Ile Asp Phe Glu Pro Leu Gln Glu Val Lys
500 505 510


Asn Gly Arg Val Gln Ala Pro Tyr Gly Gln Val Leu Gln Leu Ile Arg
515 520 525


Arg Pro Asn Glu Phe Pro Lys Val Thr Thr Tyr Lys Ser Glu Gln Leu
530 535 540


Val Glu Trp Ile Lys Ala Ser Pro Gln His Ser Ala Gly Val Glu Ser
545 550 555 560


Leu Ala Ser Gly Phe Arg Val Met Ser Ile Asp Leu Gly Leu Arg Ala
565 570 575


Ala Ala Ala Thr Ser Ile Phe Ser Val Glu Glu Ser Ser Asp Lys Asn
580 585 590


Ala Ala Asp Phe Ser Tyr Trp Ile Glu Gly Thr Pro Leu Val Ala Val
595 600 605


His Gln Arg Ser Tyr Met Leu Arg Leu Pro Gly Glu Gln Val Glu Lys
610 615 620


Gln Val Met Glu Lys Arg Asp Glu Arg Phe Gln Leu His Gln Arg Val
625 630 635 640


Lys Phe Gln Ile Arg Val Leu Ala Gln Ile Met Arg Met Ala Asn Lys
645 650 655


Gln Tyr Gly Asp Arg Trp Asp Glu Leu Asp Ser Leu Lys Gln Ala Val
660 665 670


Glu Gln Lys Lys Ser Pro Leu Asp Gln Thr Asp Arg Thr Phe Trp Glu
675 680 685


Gly Ile Val Cys Asp Leu Thr Lys Val Leu Pro Arg Asn Glu Ala Asp
690 695 700


Trp Glu Gln Ala Val Val Gln Ile His Arg Lys Ala Glu Glu Tyr Val
705 710 715 720


Gly Lys Ala Val Gln Ala Trp Arg Lys Arg Phe Ala Ala Asp Glu Arg
725 730 735


Lys Gly Ile Ala Gly Leu Ser Met Trp Asn Ile Glu Glu Leu Glu Gly
740 745 750


Leu Arg Lys Leu Leu Ile Ser Trp Ser Arg Arg Thr Arg Asn Pro Gln
755 760 765


Glu Val Asn Arg Phe Glu Arg Gly His Thr Ser His Gln Arg Leu Leu
770 775 780


Thr His Ile Gln Asn Val Lys Glu Asp Arg Leu Lys Gln Leu Ser His
785 790 795 800


Ala Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Glu Arg Lys Gln
805 810 815


Glu Trp Cys Ala Glu Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asn
820 825 830


Leu Ser Gln Tyr Arg Ser Asn Leu Asp Arg Ser Thr Lys Glu Asn Ser
835 840 845


Thr Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val His Met
850 855 860


Gln Ala Glu Pro Tyr Gly Ile Gln Ile Gly Asp Val Arg Ala Glu Tyr
865 870 875 880


Ser Ser Arg Phe Tyr Ala Lys Thr Gly Thr Pro Gly Ile Arg Cys Lys
885 890 895


Lys Val Arg Gly Gln Asp Leu Gln Gly Arg Arg Phe Glu Asn Leu Gln
900 905 910


Lys Arg Leu Val Asn Glu Gln Phe Leu Thr Glu Glu Gln Val Lys Gln
915 920 925


Leu Arg Pro Gly Asp Ile Val Pro Asp Asp Ser Gly Glu Leu Phe Met
930 935 940


Thr Leu Thr Asp Gly Ser Gly Ser Lys Glu Val Val Phe Leu Gln Ala
945 950 955 960


Asp Ile Asn Ala Ala His Asn Leu Gln Lys Arg Phe Trp Gln Arg Tyr
965 970 975


Asn Glu Leu Phe Lys Val Ser Cys Arg Val Ile Val Arg Asp Glu Glu
980 985 990


Glu Tyr Leu Val Pro Lys Thr Lys Ser Val Gln Ala Lys Leu Gly Lys
995 1000 1005


Gly Leu Phe Val Lys Lys Ser Asp Thr Ala Trp Lys Asp Val Tyr
1010 1015 1020


Val Trp Asp Ser Gln Ala Lys Leu Lys Gly Lys Thr Thr Phe Thr
1025 1030 1035


Glu Glu Ser Glu Ser Pro Glu Gln Leu Glu Asp Phe Gln Glu Ile
1040 1045 1050


Ile Glu Glu Ala Glu Glu Ala Lys Gly Thr Tyr Arg Thr Leu Phe
1055 1060 1065


Arg Asp Pro Ser Gly Val Phe Phe Pro Glu Ser Val Trp Tyr Pro
1070 1075 1080


Gln Lys Asp Phe Trp Gly Glu Val Lys Arg Lys Leu Tyr Gly Lys
1085 1090 1095


Leu Arg Glu Arg Phe Leu Thr Lys Ala Arg
1100 1105


<210> 521
<211> 1108
<212> PRT
<213> Bacillus thermoamylovorans

<400> 521

Met Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
1 5 10 15


Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
20 25 30


Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
35 40 45


His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
50 55 60


Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
65 70 75 80


Ser Phe Thr His Glu Val Asp Lys Asp Val Val Phe Asn Ile Leu Arg
85 90 95


Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
100 105 110


Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
115 120 125


Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
130 135 140


Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
145 150 155 160


Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
165 170 175


Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Phe Thr Asp
180 185 190


Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
195 200 205


Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
210 215 220


Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
225 230 235 240


Tyr Glu Lys Val Glu Lys Glu His Lys Thr Leu Glu Glu Arg Ile Lys
245 250 255


Glu Asp Ile Gln Ala Phe Lys Ser Leu Glu Gln Tyr Glu Lys Glu Arg
260 265 270


Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
275 280 285


Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
290 295 300


Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
305 310 315 320


Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
325 330 335


Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
340 345 350


Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
355 360 365


Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
370 375 380


His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
385 390 395 400


Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
405 410 415


Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
420 425 430


Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
435 440 445


Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
450 455 460


Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
465 470 475 480


Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
485 490 495


Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
500 505 510


Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
515 520 525


Ile His Arg Asp Asp Phe Pro Lys Phe Val Asn Phe Lys Pro Lys Glu
530 535 540


Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
545 550 555 560


Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
565 570 575


Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
580 585 590


Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
595 600 605


Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
610 615 620


Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
625 630 635 640


Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
645 650 655


Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
660 665 670


Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
675 680 685


Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
690 695 700


Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
705 710 715 720


Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
725 730 735


Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
740 745 750


Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
755 760 765


Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
770 775 780


Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
785 790 795 800


Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
805 810 815


Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
820 825 830


Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
835 840 845


Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
850 855 860


Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
865 870 875 880


Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
885 890 895


Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
900 905 910


Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
915 920 925


Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
930 935 940


Lys Leu Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
945 950 955 960


Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
965 970 975


Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp
980 985 990


Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu
995 1000 1005


Lys Asp Gly Val Tyr Glu Trp Gly Asn Ala Gly Lys Leu Lys Ile
1010 1015 1020


Lys Lys Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser
1025 1030 1035


Asp Ile Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly
1040 1045 1050


Glu Lys Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro
1055 1060 1065


Ser Asp Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu
1070 1075 1080


Arg Ile Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr
1085 1090 1095


Ile Glu Asp Asp Ser Ser Lys Gln Ser Met
1100 1105


<210> 522
<211> 1112
<212> PRT
<213> Bacillus species

<400> 522

Met Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr
1 5 10 15


Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln
35 40 45


Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile
50 55 60


Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His
65 70 75 80


Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu
85 90 95


Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly
100 105 110


Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys
115 120 125


Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu
130 135 140


Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg
145 150 155 160


Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr
165 170 175


Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile
180 185 190


Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys
195 200 205


Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp
210 215 220


Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu
225 230 235 240


Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys
245 250 255


Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala
260 265 270


Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly
275 280 285


Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser
290 295 300


Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser
305 310 315 320


Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu
325 330 335


Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala
340 345 350


Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala
355 360 365


Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr
370 375 380


Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys
385 390 395 400


Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser
405 410 415


Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro
420 425 430


Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly
435 440 445


Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp
450 455 460


Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys
465 470 475 480


Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe
485 490 495


Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg
500 505 510


Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe
515 520 525


Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn
530 535 540


Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly
545 550 555 560


Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val
565 570 575


Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys
580 585 590


Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg
595 600 605


Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys
610 615 620


Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln
625 630 635 640


Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro
645 650 655


Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser
660 665 670


Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu
675 680 685


Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu
690 695 700


Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile
705 710 715 720


Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala
725 730 735


Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu
740 745 750


Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg
755 760 765


Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln
770 775 780


Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met
785 790 795 800


Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys
805 810 815


Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn
820 825 830


Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser
835 840 845


Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met
850 855 860


Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr
865 870 875 880


Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His
885 890 895


Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg
900 905 910


Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys
915 920 925


Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu
930 935 940


Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile
945 950 955 960


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln
965 970 975


Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly
980 985 990


Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys Lys
995 1000 1005


Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln Glu
1010 1015 1020


Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr Asp
1025 1030 1035


Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile Ser
1040 1045 1050


Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu Thr
1055 1060 1065


Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr Trp
1070 1075 1080


Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile Lys
1085 1090 1095


Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu
1100 1105 1110


<210> 523
<211> 1364
<212> PRT
<213> Unknown

<220>
<223> Member of the candidate phylum Lindowbacteriae

<400> 523

Met Pro Arg Asp Asp Leu Asp Leu Leu Thr Asn Leu Asn Ser Thr Ala
1 5 10 15


Lys Gly Ile Arg Glu Arg Gly Lys Thr Lys Glu Gly Thr Asp Lys Lys
20 25 30


Lys Ser Gly Arg Lys Ser Ser Trp Pro Met Asp Lys Ala Ala Trp Glu
35 40 45


Thr Ala Lys Thr Ser Asp Ser Ser Ala His Phe Leu Glu Lys Leu Lys
50 55 60


Gln His Pro Asp Leu Lys Asp Ala Phe Gly Asn Leu Ser Ser Gly Gly
65 70 75 80


Ser Lys Lys Leu Glu Tyr Tyr Lys Lys Leu Ala Gly Ser Ala Pro Trp
85 90 95


Lys Glu Ser Gln Ser Val Ile Leu Glu Lys Ala Ala Arg Trp Lys Glu
100 105 110


Ala Lys Gln Glu Arg Glu Glu Lys Glu Gln Asp Ser Ser Glu His Gly
115 120 125


Ser Lys Ala Ala Tyr Arg Arg Leu Phe Asp Ala Gly Cys Leu Pro Met
130 135 140


Pro Glu Phe Ala Lys Tyr Ile Asp Glu Asn Gln Ile Glu Phe Gly Asp
145 150 155 160


Leu Lys Leu Ser Asp Cys Gly Ala Glu Trp Lys Arg Gly Met Trp Asn
165 170 175


Gln Ala Gly Gln Arg Val Arg Ser His Met Gly Trp Gln Arg Arg Arg
180 185 190


Glu Lys Glu Asn Ala Val Tyr Ser Leu Arg Lys Glu Leu Phe Glu Lys
195 200 205


Gly Gly Ala Ile Arg Arg Lys Lys Ser Glu Glu Leu Thr Pro Glu Asp
210 215 220


Ile Leu Pro Gly Lys Ala Ala Pro Asp Gln Asn Asp Trp Gln Glu Arg
225 230 235 240


Pro Ala Tyr Gly Asn Gln Met Trp Phe Ile Gly Leu Arg Ser Tyr Glu
245 250 255


Glu Asn Glu Met Ala Lys Tyr Ala Glu Glu Ala Gly Met Gly Ser Arg
260 265 270


Ser Ala Pro Arg Ile Arg Arg Gly Thr Ile Lys Gly Trp Ser Lys Leu
275 280 285


Arg Glu Arg Trp Leu Gln Ile Leu Lys Arg Asn Pro Gln Ala Thr Arg
290 295 300


Asp Asp Leu Ile Gly Glu Leu Asn Ala Leu Arg Ser Gln Asp Pro Arg
305 310 315 320


Ala Tyr Gly Asp Ala Arg Leu Phe Asp Trp Leu Ser Lys Thr Asp Gln
325 330 335


Arg Phe Leu Trp Asp Gly Phe Asp Ala Asp Gly Lys Ile Leu Cys Gly
340 345 350


Arg Asp Asp Arg Asp Cys Val Ser Ala Phe Val Ala Tyr Asn Glu Glu
355 360 365


Phe Ala Asp Glu Pro Ser Ser Ile Thr Leu Thr Glu Thr Asp Glu Arg
370 375 380


Leu His Pro Val Trp Pro Phe Phe Gly Glu Ser Ser Ala Val Pro Tyr
385 390 395 400


Glu Ile Glu Tyr Asp Leu Glu Thr Ala Cys Pro Thr Ala Ile Arg Leu
405 410 415


Pro Leu Leu Val Gly Lys Glu Asn Gly Gly Tyr Ala Glu Arg Gln Gly
420 425 430


Thr Arg Leu Pro Leu Ala Glu Tyr Ala Asp Leu Ala Ser Ser Phe Gln
435 440 445


Leu Pro Thr Pro Val Arg Leu Asp Val Leu Val Glu Ile Arg Glu Val
450 455 460


Thr Arg Ala Gly Arg Lys Val Thr Cys Pro Phe Ser Tyr Phe Lys Gln
465 470 475 480


Asn Gly Val Trp Tyr Val Arg Glu Gly Glu Ile Pro Ser Gly Glu Ser
485 490 495


Ile Gln Ile Lys Gln Thr Asp Arg Lys Ile Glu Asn Gly Lys Ile Phe
500 505 510


Ile Ser Ser Lys Leu Arg Met Ala Tyr Arg Asp Asp Leu Met Val Ser
515 520 525


Pro Ala Thr Gly Asp Phe Gly Ser Ile Lys Ile Leu Trp Glu Arg Ile
530 535 540


Glu Leu Ala Ser His Val Asp Gln Lys Lys Leu Pro Glu Thr Ala Pro
545 550 555 560


Ala Arg Ser Arg Val Phe Val Ser Phe Ser Cys Asn Val Val Glu Arg
565 570 575


Ala Pro Arg Lys Gln Leu Thr Arg Lys Pro Asp Ala Val Val Val Thr
580 585 590


Ile Pro Ser Gly Val Asp Gln Gly Leu Val Val Val Ser Thr Asp Val
595 600 605


Arg Thr Gly Lys Ser Lys Ser Ser Ser Ala Pro Pro Leu Pro Pro Gly
610 615 620


Ser Arg Leu Trp Pro Ala Asp Ala Val His Gly Asp Pro Pro Leu Arg
625 630 635 640


Ile Leu Ser Val Asp Leu Gly His Arg His Ser Ala Tyr Ala Val Trp
645 650 655


Glu Leu Gly Leu Gln Gln Lys Ser Trp Arg Ala Gly Val Leu Lys Gly
660 665 670


Ser Thr Gln Thr Pro Val Tyr Ala Asp Cys Thr Gly Thr Gly Leu Leu
675 680 685


Cys Leu Pro Gly Asp Gly Glu Asp Thr Pro Ala Glu Glu Glu Ser Leu
690 695 700


Arg Leu Arg Ser Arg Gln Ile Arg Arg Arg Leu Asn Leu Gln Asn Ser
705 710 715 720


Ile Leu Arg Val Ser Arg Leu Leu Ser Leu Asp Lys Phe Glu Lys Thr
725 730 735


Ile Phe Glu Gln Ser Asp Val Arg Asp Arg Pro Asn Lys Lys Gly Leu
740 745 750


Arg Ile Arg Arg Arg Cys Arg Thr Glu Lys Thr Pro Leu Ser Glu Ala
755 760 765


Glu Val Arg Lys Asn Cys Asp Lys Ala Ala Glu Ile Leu Ile Arg Trp
770 775 780


Ala Asp Thr Asp Ala Met Ala Lys Ser Leu Ala Ala Thr Gly Asn Ala
785 790 795 800


Asp Ile Ser Phe Trp Lys Tyr Met Ala Val Lys Asn Pro Pro Leu Ser
805 810 815


Ala Val Val Asp Val Ala Pro Ser Thr Ile Val Pro Asp Asp Gly Pro
820 825 830


Asp Arg Glu Thr Leu Lys Lys Lys Arg Gln Glu Glu Glu Glu Lys Phe
835 840 845


Ala Ser Ser Ile Tyr Glu Asn Arg Val Lys Leu Ala Gly Ala Leu Cys
850 855 860


Ser Gly Tyr Asp Ala Asp His Arg Arg Pro Ala Thr Gly Gly Leu Trp
865 870 875 880


His Asp Leu Asp Arg Thr Leu Ile Arg Glu Ile Ser Tyr Gly Asp Arg
885 890 895


Gly Gln Lys Gly Asn Pro Arg Lys Leu Asn Asn Glu Gly Ile Leu Arg
900 905 910


Leu Leu Arg Arg Pro Pro Arg Ala Arg Pro Asp Trp Arg Glu Phe His
915 920 925


Arg Thr Leu Asn Asp Ala Asn Arg Ile Pro Lys Gly Arg Thr Leu Arg
930 935 940


Gly Gly Leu Ser Met Gly Arg Leu Asn Phe Leu Lys Glu Val Gly Asp
945 950 955 960


Phe Val Lys Lys Trp Ser Cys Arg Pro Arg Trp Pro Gly Asp Arg Arg
965 970 975


His Ile Pro Pro Gly Gln Leu Phe Asp Arg Gln Asp Ala Glu His Leu
980 985 990


Glu His Leu Arg Asp Asp Arg Ile Lys Arg Leu Ala His Leu Ile Val
995 1000 1005


Ala Gln Ala Leu Gly Phe Glu Pro Asp Ile Arg Arg Gly Leu Trp
1010 1015 1020


Lys Tyr Val Asp Gly Ser Thr Gly Glu Ile Leu Trp Gln His Pro
1025 1030 1035


Glu Thr Arg Arg Phe Phe Ala Glu Gly Ala Ala Gly Glu Leu Arg
1040 1045 1050


Glu Val Ser Arg Pro Ala Glu Ile Asp Asp Asp Ala Ala Ala Arg
1055 1060 1065


Pro His Thr Val Ser Ala Pro Ala His Ile Val Val Phe Glu Asn
1070 1075 1080


Leu Ile Arg Tyr Arg Phe Gln Ser Asp Arg Pro Lys Thr Glu Asn
1085 1090 1095


Ala Gly Leu Met Gln Trp Ala His Arg Gln Ile Val His Phe Thr
1100 1105 1110


Lys Gln Val Ala Ser Leu Tyr Gly Leu Lys Val Ala Met Val Tyr
1115 1120 1125


Ala Ala Phe Ser Ser Lys Phe Cys Ser Arg Cys Gly Ser Pro Gly
1130 1135 1140


Ala Arg Val Ser Arg Phe Asp Pro Ala Trp Arg Asn Gln Glu Trp
1145 1150 1155


Phe Lys Arg Arg Thr Ser Asn Pro Arg Ser Lys Val Asp His Ser
1160 1165 1170


Leu Lys Arg Ala Ser Glu Asp Pro Thr Ala Asp Glu Thr Arg Pro
1175 1180 1185


Trp Val Leu Ile Glu Gly Gly Lys Glu Phe Val Cys Ala Asn Ala
1190 1195 1200


Lys Cys Ser Ala His Asp Glu Pro Leu Asn Ala Asp Glu Asn Ala
1205 1210 1215


Ala Ala Asn Ile Gly Leu Arg Phe Leu Arg Gly Val Glu Asp Phe
1220 1225 1230


Arg Thr Lys Val Asn Pro Ala Gly Ala Leu Lys Gly Lys Leu Arg
1235 1240 1245


Phe Glu Thr Gly Ile His Ser Phe Arg Pro Pro Val Ser Gly Ser
1250 1255 1260


Pro Phe Trp Ser Pro Met Ala Glu Pro Ala Gln Lys Lys Lys Ile
1265 1270 1275


Gly Ala Ala Ala Pro Gly Ala Asp Val Asp Glu Ala Gly Asp Ala
1280 1285 1290


Asp Glu Ser Gly Val Val Val Leu Phe Arg Asp Pro Ser Gly Ala
1295 1300 1305


Phe Arg Asn Lys Gln Tyr Trp Tyr Glu Gly Lys Ile Phe Trp Ser
1310 1315 1320


Asn Val Met Met Ala Val Glu Ala Lys Ile Ala Gly Ala Ser Val
1325 1330 1335


Gly Ala Lys Pro Val Ala Ala Ser Trp Gly Gln Ala Gln Pro Gln
1340 1345 1350


Ser Gly Pro Gly Leu Ala Lys Pro Gly Gly Asp
1355 1360


<210> 524
<211> 1489
<212> PRT
<213> Desulfatirhabdium butyrativorans

<400> 524

Met Pro Leu Ser Asn Asn Pro Pro Val Thr Gln Arg Ala Tyr Thr Leu
1 5 10 15


Arg Leu Arg Gly Ala Asp Pro Ser Asp Leu Ser Trp Arg Glu Ala Leu
20 25 30


Trp His Thr His Glu Ala Val Asn Lys Gly Ala Lys Val Phe Gly Asp
35 40 45


Trp Leu Leu Thr Leu Arg Gly Gly Leu Asp His Thr Leu Ala Asp Thr
50 55 60


Lys Val Lys Gly Gly Lys Gly Lys Pro Asp Arg Asp Pro Thr Pro Glu
65 70 75 80


Glu Arg Lys Ala Arg Arg Ile Leu Leu Ala Leu Ser Trp Leu Ser Val
85 90 95


Glu Ser Lys Leu Gly Ala Pro Ser Ser Tyr Ile Val Ala Ser Gly Asp
100 105 110


Glu Pro Ala Lys Asp Arg Asn Asp Asn Val Val Ser Ala Leu Glu Glu
115 120 125


Ile Leu Gln Ser Arg Lys Val Ala Lys Ser Glu Ile Asp Asp Trp Lys
130 135 140


Arg Asp Cys Ser Ala Ser Leu Ser Ala Ala Ile Arg Asp Asp Ala Val
145 150 155 160


Trp Val Asn Arg Ser Lys Val Phe Asp Glu Ala Val Lys Ser Val Gly
165 170 175


Ser Ser Leu Thr Arg Glu Glu Ala Trp Asp Met Leu Glu Arg Phe Phe
180 185 190


Gly Ser Arg Asp Ala Tyr Leu Thr Pro Met Lys Asp Pro Glu Asp Lys
195 200 205


Ser Ser Glu Thr Glu Gln Glu Asp Lys Ala Lys Asp Leu Val Gln Lys
210 215 220


Ala Gly Gln Trp Leu Ser Ser Arg Tyr Gly Thr Ser Glu Gly Ala Asp
225 230 235 240


Phe Cys Arg Met Ser Asp Ile Tyr Gly Lys Ile Ala Ala Trp Ala Asp
245 250 255


Asn Ala Ser Gln Gly Gly Ser Ser Thr Val Asp Asp Leu Val Ser Glu
260 265 270


Leu Arg Gln His Phe Asp Thr Lys Glu Ser Lys Ala Thr Asn Gly Leu
275 280 285


Asp Trp Ile Ile Gly Leu Ser Ser Tyr Thr Gly His Thr Pro Asn Pro
290 295 300


Val His Glu Leu Leu Arg Gln Asn Thr Ser Leu Asn Lys Ser His Leu
305 310 315 320


Asp Asp Leu Lys Lys Lys Ala Asn Thr Arg Ala Glu Ser Cys Lys Ser
325 330 335


Lys Ile Gly Ser Lys Gly Gln Arg Pro Tyr Ser Asp Ala Ile Leu Asn
340 345 350


Asp Val Glu Ser Val Cys Gly Phe Thr Tyr Arg Val Asp Lys Asp Gly
355 360 365


Gln Pro Val Ser Val Ala Asp Tyr Ser Lys Tyr Asp Val Asp Tyr Lys
370 375 380


Trp Gly Thr Ala Arg His Tyr Ile Phe Ala Val Met Leu Asp His Ala
385 390 395 400


Ala Arg Arg Ile Ser Leu Ala His Lys Trp Ile Lys Arg Ala Glu Ala
405 410 415


Glu Arg His Lys Phe Glu Glu Asp Ala Lys Arg Ile Ala Asn Val Pro
420 425 430


Ala Arg Ala Arg Glu Trp Leu Asp Ser Phe Cys Lys Glu Arg Ser Val
435 440 445


Thr Ser Gly Ala Val Glu Pro Tyr Arg Ile Arg Arg Arg Ala Val Asp
450 455 460


Gly Trp Lys Glu Val Val Ala Ala Trp Ser Lys Ser Asp Cys Lys Ser
465 470 475 480


Thr Glu Asp Arg Ile Ala Ala Ala Arg Ala Leu Gln Asp Asp Ser Glu
485 490 495


Ile Asp Lys Phe Gly Asp Ile Gln Leu Phe Glu Ala Leu Ala Glu Asp
500 505 510


Asp Ala Leu Cys Val Trp His Lys Asp Gly Glu Ala Thr Asn Glu Pro
515 520 525


Asp Phe Gln Pro Leu Ile Asp Tyr Ser Leu Ala Ile Glu Ala Glu Phe
530 535 540


Lys Lys Arg Gln Phe Lys Val Pro Ala Tyr Arg His Pro Asp Glu Leu
545 550 555 560


Leu His Pro Val Phe Cys Asp Phe Gly Lys Ser Arg Trp Lys Ile Asn
565 570 575


Tyr Asp Val His Lys Asn Val Gln Ala Pro Phe Tyr Arg Gly Leu Cys
580 585 590


Leu Thr Leu Trp Thr Gly Ser Glu Ile Lys Pro Val Pro Leu Cys Trp
595 600 605


Gln Ser Lys Arg Leu Thr Arg Asp Leu Ala Leu Gly Asn Asn His Arg
610 615 620


Asn Asp Ala Ala Ser Ala Val Thr Arg Ala Asp Arg Leu Gly Arg Ala
625 630 635 640


Ala Ser Asn Val Thr Lys Ser Asp Met Val Asn Ile Thr Gly Leu Phe
645 650 655


Glu Gln Ala Asp Trp Asn Gly Arg Leu Gln Ala Pro Arg Gln Gln Leu
660 665 670


Glu Ala Ile Ala Val Val Arg Asp Asn Pro Arg Leu Ser Glu Gln Glu
675 680 685


Arg Asn Leu Arg Met Cys Gly Met Ile Glu His Ile Arg Trp Leu Val
690 695 700


Thr Phe Ser Val Lys Leu Gln Pro Gln Gly Pro Trp Cys Ala Tyr Ala
705 710 715 720


Glu Gln His Gly Leu Asn Thr Asn Pro Gln Tyr Trp Pro His Ala Asp
725 730 735


Thr Asn Arg Asp Arg Lys Val His Ala Arg Leu Ile Leu Pro Arg Leu
740 745 750


Pro Gly Leu Arg Val Leu Ser Val Asp Leu Gly His Arg Tyr Ala Ala
755 760 765


Ala Cys Ala Val Trp Glu Ala Val Asn Thr Glu Thr Val Lys Glu Ala
770 775 780


Cys Gln Asn Val Gly Arg Asp Met Pro Lys Glu His Asp Leu Tyr Leu
785 790 795 800


His Ile Lys Val Lys Lys Gln Gly Ile Gly Lys Gln Thr Glu Val Asp
805 810 815


Lys Thr Thr Ile Tyr Arg Arg Ile Gly Ala Asp Thr Leu Pro Asp Gly
820 825 830


Arg Pro His Pro Ala Pro Trp Ala Arg Leu Asp Arg Gln Phe Leu Ile
835 840 845


Lys Leu Gln Gly Glu Glu Lys Asp Ala Arg Glu Ala Ser Asn Glu Glu
850 855 860


Ile Trp Ala Leu His Gln Met Glu Cys Lys Leu Asp Arg Thr Lys Pro
865 870 875 880


Leu Ile Asp Arg Leu Ile Ala Ser Gly Trp Gly Leu Leu Lys Arg Gln
885 890 895


Met Ala Arg Leu Asp Ala Leu Lys Glu Leu Gly Trp Ile Pro Ala Pro
900 905 910


Asp Ser Ser Glu Asn Leu Ser Arg Glu Asp Gly Glu Ala Lys Asp Tyr
915 920 925


Arg Glu Ser Leu Ala Val Asp Asp Leu Met Phe Ser Ala Val Arg Thr
930 935 940


Leu Arg Leu Ala Leu Gln Arg His Gly Asn Arg Ala Arg Ile Ala Tyr
945 950 955 960


Tyr Leu Ile Ser Glu Val Lys Ile Arg Pro Gly Gly Ile Gln Glu Lys
965 970 975


Leu Asp Glu Asn Gly Arg Ile Asp Leu Leu Gln Asp Ala Leu Ala Leu
980 985 990


Trp His Glu Leu Phe Ser Ser Pro Gly Trp Arg Asp Glu Ala Ala Lys
995 1000 1005


Gln Leu Trp Asp Ser Arg Ile Ala Thr Leu Ala Gly Tyr Lys Ala
1010 1015 1020


Pro Glu Glu Asn Gly Asp Asn Val Ser Asp Val Ala Tyr Arg Lys
1025 1030 1035


Lys Gln Gln Val Tyr Arg Glu Gln Leu Arg Asn Val Ala Lys Thr
1040 1045 1050


Leu Ser Gly Asp Val Ile Thr Cys Lys Glu Leu Ser Asp Ala Trp
1055 1060 1065


Lys Glu Arg Trp Glu Asp Glu Asp Gln Arg Trp Lys Lys Leu Leu
1070 1075 1080


Arg Trp Phe Lys Asp Trp Val Leu Pro Ser Gly Thr Gln Ala Asn
1085 1090 1095


Asn Ala Thr Ile Arg Asn Val Gly Gly Leu Ser Leu Ser Arg Leu
1100 1105 1110


Ala Thr Ile Thr Glu Phe Arg Arg Lys Val Gln Val Gly Phe Phe
1115 1120 1125


Thr Arg Leu Arg Pro Asp Gly Thr Arg His Glu Ile Gly Glu Gln
1130 1135 1140


Phe Gly Gln Lys Thr Leu Asp Ala Leu Glu Leu Leu Arg Glu Gln
1145 1150 1155


Arg Val Lys Gln Leu Ala Ser Arg Ile Ala Glu Ala Ala Leu Gly
1160 1165 1170


Ile Gly Ser Glu Gly Gly Lys Gly Trp Asp Gly Gly Lys Arg Pro
1175 1180 1185


Arg Gln Arg Ile Asn Asp Ser Arg Phe Ala Pro Cys His Ala Val
1190 1195 1200


Val Ile Glu Asn Leu Ala Asn Tyr Arg Pro Asp Glu Thr Arg Thr
1205 1210 1215


Arg Leu Glu Asn Arg Arg Leu Met Thr Trp Ser Ala Ser Lys Val
1220 1225 1230


His Lys Tyr Leu Ser Glu Ala Cys Gln Leu Asn Gly Leu Tyr Leu
1235 1240 1245


Cys Thr Val Ser Ala Trp Tyr Thr Ser Arg Gln Asp Ser Arg Thr
1250 1255 1260


Gly Ala Pro Gly Ile Arg Cys Gln Asp Val Ser Val Arg Glu Phe
1265 1270 1275


Met Gln Ser Pro Phe Trp Arg Lys Gln Val Lys Gln Ala Glu Ala
1280 1285 1290


Lys His Asp Glu Asn Lys Gly Asp Ala Arg Glu Arg Phe Leu Cys
1295 1300 1305


Glu Leu Asn Lys Thr Trp Lys Ala Lys Thr Pro Ala Glu Trp Lys
1310 1315 1320


Lys Ala Gly Phe Val Arg Ile Pro Leu Arg Gly Gly Glu Ile Phe
1325 1330 1335


Val Ser Ala Asp Ser Lys Ser Pro Ser Ala Lys Gly Ile His Ala
1340 1345 1350


Asp Leu Asn Ala Ala Ala Asn Ile Gly Leu Arg Ala Leu Thr Asp
1355 1360 1365


Pro Asp Trp Pro Gly Lys Trp Trp Tyr Val Pro Cys Asp Pro Val
1370 1375 1380


Ser Phe Glu Ser Lys Met Asp Tyr Val Lys Gly Cys Ala Ala Val
1385 1390 1395


Lys Val Gly Gln Pro Leu Arg Gln Pro Ala Gln Thr Asn Ala Asp
1400 1405 1410


Gly Ala Ala Ser Lys Ile Arg Lys Gly Lys Lys Asn Arg Thr Ala
1415 1420 1425


Gly Thr Ser Lys Glu Lys Val Tyr Leu Trp Arg Asp Ile Ser Ala
1430 1435 1440


Phe Pro Leu Glu Ser Asn Glu Ile Gly Glu Trp Lys Glu Thr Ser
1445 1450 1455


Ala Tyr Gln Asn Asp Val Gln Tyr Arg Val Ile Arg Met Leu Lys
1460 1465 1470


Glu His Ile Lys Ser Leu Asp Asn Arg Thr Gly Asp Asn Val Glu
1475 1480 1485


Gly



<210> 525
<211> 1194
<212> PRT
<213> Desulfonatronum thiodismutan

<400> 525

Met Val Leu Gly Arg Lys Asp Asp Thr Ala Glu Leu Arg Arg Ala Leu
1 5 10 15


Trp Thr Thr His Glu His Val Asn Leu Ala Val Ala Glu Val Glu Arg
20 25 30


Val Leu Leu Arg Cys Arg Gly Arg Ser Tyr Trp Thr Leu Asp Arg Arg
35 40 45


Gly Asp Pro Val His Val Pro Glu Ser Gln Val Ala Glu Asp Ala Leu
50 55 60


Ala Met Ala Arg Glu Ala Gln Arg Arg Asn Gly Trp Pro Val Val Gly
65 70 75 80


Glu Asp Glu Glu Ile Leu Leu Ala Leu Arg Tyr Leu Tyr Glu Gln Ile
85 90 95


Val Pro Ser Cys Leu Leu Asp Asp Leu Gly Lys Pro Leu Lys Gly Asp
100 105 110


Ala Gln Lys Ile Gly Thr Asn Tyr Ala Gly Pro Leu Phe Asp Ser Asp
115 120 125


Thr Cys Arg Arg Asp Glu Gly Lys Asp Val Ala Cys Cys Gly Pro Phe
130 135 140


His Glu Val Ala Gly Lys Tyr Leu Gly Ala Leu Pro Glu Trp Ala Thr
145 150 155 160


Pro Ile Ser Lys Gln Glu Phe Asp Gly Lys Asp Ala Ser His Leu Arg
165 170 175


Phe Lys Ala Thr Gly Gly Asp Asp Ala Phe Phe Arg Val Ser Ile Glu
180 185 190


Lys Ala Asn Ala Trp Tyr Glu Asp Pro Ala Asn Gln Asp Ala Leu Lys
195 200 205


Asn Lys Ala Tyr Asn Lys Asp Asp Trp Lys Lys Glu Lys Asp Lys Gly
210 215 220


Ile Ser Ser Trp Ala Val Lys Tyr Ile Gln Lys Gln Leu Gln Leu Gly
225 230 235 240


Gln Asp Pro Arg Thr Glu Val Arg Arg Lys Leu Trp Leu Glu Leu Gly
245 250 255


Leu Leu Pro Leu Phe Ile Pro Val Phe Asp Lys Thr Met Val Gly Asn
260 265 270


Leu Trp Asn Arg Leu Ala Val Arg Leu Ala Leu Ala His Leu Leu Ser
275 280 285


Trp Glu Ser Trp Asn His Arg Ala Val Gln Asp Gln Ala Leu Ala Arg
290 295 300


Ala Lys Arg Asp Glu Leu Ala Ala Leu Phe Leu Gly Met Glu Asp Gly
305 310 315 320


Phe Ala Gly Leu Arg Glu Tyr Glu Leu Arg Arg Asn Glu Ser Ile Lys
325 330 335


Gln His Ala Phe Glu Pro Val Asp Arg Pro Tyr Val Val Ser Gly Arg
340 345 350


Ala Leu Arg Ser Trp Thr Arg Val Arg Glu Glu Trp Leu Arg His Gly
355 360 365


Asp Thr Gln Glu Ser Arg Lys Asn Ile Cys Asn Arg Leu Gln Asp Arg
370 375 380


Leu Arg Gly Lys Phe Gly Asp Pro Asp Val Phe His Trp Leu Ala Glu
385 390 395 400


Asp Gly Gln Glu Ala Leu Trp Lys Glu Arg Asp Cys Val Thr Ser Phe
405 410 415


Ser Leu Leu Asn Asp Ala Asp Gly Leu Leu Glu Lys Arg Lys Gly Tyr
420 425 430


Ala Leu Met Thr Phe Ala Asp Ala Arg Leu His Pro Arg Trp Ala Met
435 440 445


Tyr Glu Ala Pro Gly Gly Ser Asn Leu Arg Thr Tyr Gln Ile Arg Lys
450 455 460


Thr Glu Asn Gly Leu Trp Ala Asp Val Val Leu Leu Ser Pro Arg Asn
465 470 475 480


Glu Ser Ala Ala Val Glu Glu Lys Thr Phe Asn Val Arg Leu Ala Pro
485 490 495


Ser Gly Gln Leu Ser Asn Val Ser Phe Asp Gln Ile Gln Lys Gly Ser
500 505 510


Lys Met Val Gly Arg Cys Arg Tyr Gln Ser Ala Asn Gln Gln Phe Glu
515 520 525


Gly Leu Leu Gly Gly Ala Glu Ile Leu Phe Asp Arg Lys Arg Ile Ala
530 535 540


Asn Glu Gln His Gly Ala Thr Asp Leu Ala Ser Lys Pro Gly His Val
545 550 555 560


Trp Phe Lys Leu Thr Leu Asp Val Arg Pro Gln Ala Pro Gln Gly Trp
565 570 575


Leu Asp Gly Lys Gly Arg Pro Ala Leu Pro Pro Glu Ala Lys His Phe
580 585 590


Lys Thr Ala Leu Ser Asn Lys Ser Lys Phe Ala Asp Gln Val Arg Pro
595 600 605


Gly Leu Arg Val Leu Ser Val Asp Leu Gly Val Arg Ser Phe Ala Ala
610 615 620


Cys Ser Val Phe Glu Leu Val Arg Gly Gly Pro Asp Gln Gly Thr Tyr
625 630 635 640


Phe Pro Ala Ala Asp Gly Arg Thr Val Asp Asp Pro Glu Lys Leu Trp
645 650 655


Ala Lys His Glu Arg Ser Phe Lys Ile Thr Leu Pro Gly Glu Asn Pro
660 665 670


Ser Arg Lys Glu Glu Ile Ala Arg Arg Ala Ala Met Glu Glu Leu Arg
675 680 685


Ser Leu Asn Gly Asp Ile Arg Arg Leu Lys Ala Ile Leu Arg Leu Ser
690 695 700


Val Leu Gln Glu Asp Asp Pro Arg Thr Glu His Leu Arg Leu Phe Met
705 710 715 720


Glu Ala Ile Val Asp Asp Pro Ala Lys Ser Ala Leu Asn Ala Glu Leu
725 730 735


Phe Lys Gly Phe Gly Asp Asp Arg Phe Arg Ser Thr Pro Asp Leu Trp
740 745 750


Lys Gln His Cys His Phe Phe His Asp Lys Ala Glu Lys Val Val Ala
755 760 765


Glu Arg Phe Ser Arg Trp Arg Thr Glu Thr Arg Pro Lys Ser Ser Ser
770 775 780


Trp Gln Asp Trp Arg Glu Arg Arg Gly Tyr Ala Gly Gly Lys Ser Tyr
785 790 795 800


Trp Ala Val Thr Tyr Leu Glu Ala Val Arg Gly Leu Ile Leu Arg Trp
805 810 815


Asn Met Arg Gly Arg Thr Tyr Gly Glu Val Asn Arg Gln Asp Lys Lys
820 825 830


Gln Phe Gly Thr Val Ala Ser Ala Leu Leu His His Ile Asn Gln Leu
835 840 845


Lys Glu Asp Arg Ile Lys Thr Gly Ala Asp Met Ile Ile Gln Ala Ala
850 855 860


Arg Gly Phe Val Pro Arg Lys Asn Gly Ala Gly Trp Val Gln Val His
865 870 875 880


Glu Pro Cys Arg Leu Ile Leu Phe Glu Asp Leu Ala Arg Tyr Arg Phe
885 890 895


Arg Thr Asp Arg Ser Arg Arg Glu Asn Ser Arg Leu Met Arg Trp Ser
900 905 910


His Arg Glu Ile Val Asn Glu Val Gly Met Gln Gly Glu Leu Tyr Gly
915 920 925


Leu His Val Asp Thr Thr Glu Ala Gly Phe Ser Ser Arg Tyr Leu Ala
930 935 940


Ser Ser Gly Ala Pro Gly Val Arg Cys Arg His Leu Val Glu Glu Asp
945 950 955 960


Phe His Asp Gly Leu Pro Gly Met His Leu Val Gly Glu Leu Asp Trp
965 970 975


Leu Leu Pro Lys Asp Lys Asp Arg Thr Ala Asn Glu Ala Arg Arg Leu
980 985 990


Leu Gly Gly Met Val Arg Pro Gly Met Leu Val Pro Trp Asp Gly Gly
995 1000 1005


Glu Leu Phe Ala Thr Leu Asn Ala Ala Ser Gln Leu His Val Ile
1010 1015 1020


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Arg Arg Phe Trp
1025 1030 1035


Gly Arg Cys Gly Glu Ala Ile Arg Ile Val Cys Asn Gln Leu Ser
1040 1045 1050


Val Asp Gly Ser Thr Arg Tyr Glu Met Ala Lys Ala Pro Lys Ala
1055 1060 1065


Arg Leu Leu Gly Ala Leu Gln Gln Leu Lys Asn Gly Asp Ala Pro
1070 1075 1080


Phe His Leu Thr Ser Ile Pro Asn Ser Gln Lys Pro Glu Asn Ser
1085 1090 1095


Tyr Val Met Thr Pro Thr Asn Ala Gly Lys Lys Tyr Arg Ala Gly
1100 1105 1110


Pro Gly Glu Lys Ser Ser Gly Glu Glu Asp Glu Leu Ala Leu Asp
1115 1120 1125


Ile Val Glu Gln Ala Glu Glu Leu Ala Gln Gly Arg Lys Thr Phe
1130 1135 1140


Phe Arg Asp Pro Ser Gly Val Phe Phe Ala Pro Asp Arg Trp Leu
1145 1150 1155


Pro Ser Glu Ile Tyr Trp Ser Arg Ile Arg Arg Arg Ile Trp Gln
1160 1165 1170


Val Thr Leu Glu Arg Asn Ser Ser Gly Arg Gln Glu Arg Ala Glu
1175 1180 1185


Met Asp Glu Met Pro Tyr
1190


<210> 526
<211> 1364
<212> PRT
<213> Unknown

<220>
<223> Member of the phylum Elusimicrobia

<400> 526

Met Asn Arg Ile Tyr Gln Gly Arg Val Thr Lys Val Glu Val Pro Asp
1 5 10 15


Gly Lys Asp Glu Lys Gly Asn Ile Lys Trp Lys Lys Leu Glu Asn Trp
20 25 30


Ser Asp Ile Leu Trp Gln His His Met Leu Phe Gln Asp Ala Val Asn
35 40 45


Tyr Tyr Thr Leu Ala Leu Ala Ala Ile Ser Gly Ser Ala Val Gly Ser
50 55 60


Asp Glu Lys Ser Ile Ile Leu Arg Glu Trp Ala Val Gln Val Gln Asn
65 70 75 80


Ile Trp Glu Lys Ala Lys Lys Lys Ala Thr Val Phe Glu Gly Pro Gln
85 90 95


Lys Arg Leu Thr Ser Ile Leu Gly Leu Glu Gln Asn Ala Ser Phe Asp
100 105 110


Ile Ala Ala Lys His Ile Leu Arg Thr Ser Glu Ala Lys Pro Glu Gln
115 120 125


Arg Ala Ser Ala Leu Ile Arg Leu Leu Glu Glu Ile Asp Lys Lys Asn
130 135 140


His Asn Val Val Cys Gly Glu Arg Leu Pro Phe Phe Cys Pro Arg Asn
145 150 155 160


Ile Gln Ser Lys Arg Ser Pro Thr Ser Lys Ala Val Ser Ser Val Gln
165 170 175


Glu Gln Lys Arg Gln Glu Glu Val Arg Arg Phe His Asn Met Gln Pro
180 185 190


Glu Glu Val Val Lys Asn Ala Val Thr Leu Asp Ile Ser Leu Phe Lys
195 200 205


Ser Ser Pro Lys Ile Val Phe Leu Glu Asp Pro Lys Lys Ala Arg Ala
210 215 220


Glu Leu Leu Lys Gln Phe Asp Asn Ala Cys Lys Lys His Lys Glu Leu
225 230 235 240


Val Gly Ile Lys Lys Ala Phe Thr Glu Ser Ile Asp Lys His Gly Ser
245 250 255


Ser Leu Lys Val Pro Ala Pro Gly Ser Lys Pro Ser Gly Leu Tyr Pro
260 265 270


Ser Ala Ile Val Phe Lys Tyr Phe Pro Val Asp Ile Thr Lys Thr Val
275 280 285


Phe Leu Lys Ala Thr Glu Lys Leu Ala Met Gly Lys Asp Arg Glu Val
290 295 300


Thr Asn Asp Pro Ile Ala Asp Ala Arg Val Asn Asp Lys Pro His Phe
305 310 315 320


Asp Tyr Phe Thr Asn Ile Ala Leu Ile Arg Glu Lys Glu Lys Asn Arg
325 330 335


Ala Ala Trp Phe Glu Phe Asp Leu Ala Ala Phe Ile Glu Ala Ile Met
340 345 350


Ser Pro His Arg Phe Tyr Gln Asp Thr Gln Lys Arg Lys Glu Ala Ala
355 360 365


Arg Lys Leu Glu Glu Lys Ile Lys Ala Ile Glu Gly Lys Gly Gly Gln
370 375 380


Phe Lys Glu Ser Asp Ser Glu Asp Asp Asp Val Asp Ser Leu Pro Gly
385 390 395 400


Phe Glu Gly Asp Thr Arg Ile Asp Leu Leu Arg Lys Leu Val Thr Asp
405 410 415


Thr Leu Gly Trp Leu Gly Glu Ser Glu Thr Pro Asp Asn Asn Glu Gly
420 425 430


Lys Lys Thr Glu Tyr Ser Ile Ser Glu Arg Thr Leu Arg Ile Phe Pro
435 440 445


Asp Ile Gln Lys Gln Trp Ser Glu Leu Ala Glu Lys Gly Glu Thr Thr
450 455 460


Glu Gly Lys Leu Leu Glu Val Leu Lys His Glu Gln Thr Glu His Gln
465 470 475 480


Ser Asp Phe Gly Ser Ala Thr Leu Tyr Gln His Leu Ala Lys Pro Glu
485 490 495


Phe His Pro Ile Trp Leu Lys Ser Gly Thr Glu Glu Trp His Ala Glu
500 505 510


Asn Pro Leu Lys Ala Trp Leu Asn Tyr Lys Glu Leu Gln Tyr Glu Leu
515 520 525


Thr Asp Lys Lys Arg Pro Ile His Phe Thr Pro Ala His Pro Val Tyr
530 535 540


Ser Pro Arg Tyr Phe Asp Phe Pro Lys Lys Ser Glu Thr Glu Glu Lys
545 550 555 560


Glu Val Ser Lys Asn Thr His Ser Leu Thr Thr Ser Leu Ala Ser Glu
565 570 575


His Ile Lys Asn Ser Leu Gln Phe Thr Ala Gly Leu Ile Arg Lys Thr
580 585 590


Asn Val Gly Lys Lys Ala Ile Lys Ala Arg Phe Ser Tyr Ser Ala Pro
595 600 605


Arg Leu Arg Arg Asp Cys Leu Arg Ser Glu Asn Asn Glu Asn Leu Tyr
610 615 620


Lys Ala Pro Trp Leu Gln Pro Met Met Arg Ala Leu Gly Ile Asp Glu
625 630 635 640


Glu Lys Ala Asp Arg Gln Asn Phe Ala Asn Thr Arg Ile Thr Leu Met
645 650 655


Ala Lys Gly Leu Asp Asp Ile Gln Leu Gly Phe Pro Val Glu Ala Asn
660 665 670


Ser Gln Glu Leu Gln Lys Glu Val Ser Asn Gly Ile Ser Trp Lys Gly
675 680 685


Gln Phe Asn Trp Gly Gly Ile Ala Ser Leu Ser Ala Leu Arg Trp Pro
690 695 700


His Glu Lys Lys Pro Lys Asn Pro Pro Glu Gln Pro Trp Trp Gly Ile
705 710 715 720


Asp Ser Phe Ser Cys Leu Ala Val Asp Leu Gly Gln Arg Tyr Ala Gly
725 730 735


Ala Phe Ala Arg Leu Asp Val Ser Thr Ile Glu Lys Lys Gly Lys Ser
740 745 750


Arg Phe Ile Gly Glu Ala Cys Asp Lys Lys Trp Tyr Ala Lys Val Ser
755 760 765


Arg Met Gly Leu Leu Arg Leu Pro Gly Glu Asp Val Lys Val Trp Arg
770 775 780


Asp Ala Ser Lys Ile Asp Lys Glu Asn Gly Phe Ala Phe Arg Lys Glu
785 790 795 800


Leu Phe Gly Glu Lys Gly Arg Ser Ala Thr Pro Leu Glu Ala Glu Glu
805 810 815


Thr Ala Glu Leu Ile Lys Leu Phe Gly Ala Asn Glu Lys Asp Val Met
820 825 830


Pro Asp Asn Trp Ser Lys Glu Leu Ser Phe Pro Glu Gln Asn Asp Lys
835 840 845


Leu Leu Ile Val Ala Arg Arg Ala Gln Ala Ala Val Ser Arg Leu His
850 855 860


Arg Trp Ala Trp Phe Phe Asp Glu Ala Lys Arg Ser Asp Asp Ala Ile
865 870 875 880


Arg Glu Ile Leu Glu Ser Asp Asp Thr Asp Leu Lys Gln Lys Val Asn
885 890 895


Lys Asn Glu Ile Glu Lys Val Lys Glu Thr Ile Ile Ser Leu Leu Lys
900 905 910


Val Lys Gln Glu Leu Leu Pro Thr Leu Leu Thr Arg Leu Ala Asn Arg
915 920 925


Val Leu Pro Leu Arg Gly Arg Ser Trp Glu Trp Lys Lys His His Gln
930 935 940


Lys Asn Asp Gly Phe Ile Leu Asp Gln Thr Gly Lys Ala Met Pro Asn
945 950 955 960


Val Leu Ile Arg Gly Gln Arg Gly Leu Ser Met Asp Arg Ile Glu Gln
965 970 975


Ile Thr Glu Leu Arg Lys Arg Phe Gln Ala Leu Asn Gln Ser Leu Arg
980 985 990


Arg Gln Ile Gly Lys Lys Ala Pro Ala Lys Arg Asp Asp Ser Ile Pro
995 1000 1005


Asp Cys Cys Pro Asp Leu Leu Glu Lys Leu Asp His Met Lys Glu
1010 1015 1020


Gln Arg Val Asn Gln Thr Ala His Met Ile Leu Ala Glu Ala Leu
1025 1030 1035


Gly Leu Lys Leu Ala Glu Pro Pro Lys Asp Lys Lys Glu Leu Asn
1040 1045 1050


Glu Thr Cys Asp Met His Gly Ala Tyr Ala Lys Val Asp Asn Pro
1055 1060 1065


Val Ser Phe Ile Val Ile Glu Asp Leu Ser Arg Tyr Arg Ser Ser
1070 1075 1080


Gln Gly Arg Ser Pro Arg Glu Asn Ser Arg Leu Met Lys Trp Cys
1085 1090 1095


His Arg Ala Val Arg Asp Lys Leu Lys Glu Met Cys Glu Val Phe
1100 1105 1110


Phe Pro Leu Cys Glu Arg Arg Lys Ala Gly Ser Ala Trp Val Ser
1115 1120 1125


Leu Pro Pro Leu Leu Glu Thr Pro Ala Ala Tyr Ser Ser Arg Phe
1130 1135 1140


Cys Ser Arg Ser Gly Val Ala Gly Phe Arg Ala Val Glu Val Ile
1145 1150 1155


Pro Gly Phe Glu Leu Lys Tyr Pro Trp Ser Trp Leu Lys Asp Lys
1160 1165 1170


Lys Asp Lys Ala Gly Asn Leu Ala Lys Glu Ala Leu Asn Ile Arg
1175 1180 1185


Thr Val Ser Glu Gln Leu Lys Ala Phe Asn Gln Asp Lys Pro Glu
1190 1195 1200


Lys Pro Arg Thr Leu Leu Val Pro Ile Ala Gly Gly Pro Ile Phe
1205 1210 1215


Val Pro Ile Ser Glu Val Gly Leu Ser Ser Phe Gly Leu Lys Pro
1220 1225 1230


Gln Val Val Gln Ala Asp Ile Asn Ala Ala Ile Asn Leu Gly Leu
1235 1240 1245


Arg Ala Ile Ser Asp Pro Arg Ile Trp Glu Ile His Pro Arg Leu
1250 1255 1260


Arg Thr Glu Lys Arg Asp Gly Arg Leu Phe Ala Arg Glu Lys Arg
1265 1270 1275


Lys Tyr Gly Glu Glu Lys Val Glu Val Gln Pro Ser Lys Asn Glu
1280 1285 1290


Lys Ala Lys Lys Val Lys Asp Asp Arg Lys Pro Asn Tyr Phe Ala
1295 1300 1305


Asp Phe Ser Gly Lys Val Asp Trp Gly Phe Gly Asn Ile Lys Asn
1310 1315 1320


Glu Ser Gly Leu Thr Leu Val Ser Gly Lys Ala Leu Trp Trp Thr
1325 1330 1335


Ile Asn Gln Leu Gln Trp Glu Arg Cys Phe Asp Ile Asn Lys Arg
1340 1345 1350


His Ile Glu Asp Trp Ser Asn Lys Gln Lys Gln
1355 1360


<210> 527
<211> 1326
<212> PRT
<213> Unknown

<220>
<223> Member of the phylum Lentisphaeria

<400> 527

Met Ala Val Glu Leu Asn Arg Ile Tyr Gln Gly Arg Val Asn His Val
1 5 10 15


Tyr Ile Phe Asp Glu Asn Gln Asn Gln Val Ser Val Asp Asn Gly Asp
20 25 30


Asp Leu Leu Phe Val His His Glu Leu Tyr Gln Asp Ala Ile Asn Tyr
35 40 45


Tyr Leu Val Ala Leu Ala Ala Met Ala Leu Asp Ser Lys Asp Ser Leu
50 55 60


Phe Gly Lys Phe Lys Met Gln Ile Arg Ala Val Trp Asn Asp Phe Tyr
65 70 75 80


Arg Asn Gly Gln Leu Arg Pro Gly Leu Lys His Ser Leu Ile Arg Ser
85 90 95


Leu Gly His Ala Ala Glu Leu Asn Thr Ser Asn Gly Ala Asp Ile Ala
100 105 110


Met Asn Leu Ile Leu Glu Asp Gly Gly Ile Pro Ser Glu Ile Leu Asn
115 120 125


Ala Ala Leu Glu His Leu Ala Glu Lys Cys Thr Gly Asp Val Ser Gln
130 135 140


Leu Gly Lys Thr Phe Phe Pro Arg Phe Cys Asp Thr Ala Tyr His Gly
145 150 155 160


Asn Trp Asp Val Asp Ala Lys Ser Phe Ser Glu Lys Lys Gly Arg Gln
165 170 175


Arg Leu Val Asp Ala Leu Tyr Ser Leu His Pro Val Gln Ala Val Gln
180 185 190


Glu Leu Ala Pro Glu Ile Glu Ile Gly Trp Gly Gly Val Lys Thr Gln
195 200 205


Thr Gly Lys Phe Phe Thr Gly Asp Glu Ala Lys Ala Ser Leu Lys Lys
210 215 220


Ala Ile Ser Tyr Phe Leu Gln Asp Thr Gly Lys Asn Ser Pro Glu Leu
225 230 235 240


Gln Glu Tyr Phe Ser Val Ala Gly Lys Gln Pro Leu Glu Gln Tyr Leu
245 250 255


Gly Lys Ile Asp Thr Phe Pro Glu Ile Ser Phe Gly Arg Ile Ser Ser
260 265 270


His Gln Asn Ile Asn Ile Ser Asn Ala Met Trp Ile Leu Lys Phe Phe
275 280 285


Pro Asp Gln Tyr Ser Val Asp Leu Ile Lys Asn Leu Ile Pro Asn Lys
290 295 300


Lys Tyr Glu Ile Gly Ile Ala Pro Gln Trp Gly Asp Asp Pro Val Lys
305 310 315 320


Leu Ser Arg Gly Lys Arg Gly Tyr Thr Phe Arg Ala Phe Thr Asp Leu
325 330 335


Ala Met Trp Glu Lys Asn Trp Lys Val Phe Asp Arg Ala Ala Phe Ser
340 345 350


Asp Ala Leu Lys Thr Ile Asn Gln Phe Arg Asn Lys Thr Gln Glu Arg
355 360 365


Asn Asp Gln Leu Lys Arg Tyr Cys Ala Ala Leu Asn Trp Met Asp Gly
370 375 380


Glu Ser Ser Asp Lys Lys Pro Pro Val Glu Pro Ala Asp Ala Asp Ala
385 390 395 400


Val Asp Glu Ala Ala Thr Ser Val Leu Pro Ile Leu Ala Gly Asp Lys
405 410 415


Arg Trp Asn Ala Leu Leu Gln Leu Gln Lys Glu Leu Gly Ile Cys Asn
420 425 430


Asp Phe Thr Glu Asn Glu Leu Met Asp Tyr Gly Leu Ser Leu Arg Thr
435 440 445


Ile Arg Gly Tyr Gln Lys Leu Arg Ser Met Met Leu Glu Lys Glu Glu
450 455 460


Lys Met Arg Ala Lys Thr Ala Asp Asp Glu Glu Ile Ser Gln Ala Leu
465 470 475 480


Gln Glu Ile Ile Ile Lys Phe Gln Ser Ser His Arg Asp Thr Ile Gly
485 490 495


Ser Val Ser Leu Phe Leu Lys Leu Ala Glu Pro Lys Tyr Phe Cys Val
500 505 510


Trp His Asp Ala Asp Lys Asn Gln Asn Phe Ala Ser Val Asp Met Val
515 520 525


Ala Asp Ala Val Arg Tyr Tyr Ser Tyr Gln Glu Glu Lys Ala Arg Leu
530 535 540


Glu Glu Pro Ile Gln Ile Thr Pro Ala Asp Ala Arg Tyr Ser Arg Arg
545 550 555 560


Val Ser Asp Leu Tyr Ala Leu Val Tyr Lys Asn Ala Lys Glu Cys Lys
565 570 575


Thr Gly Tyr Gly Leu Arg Pro Asp Gly Asn Phe Val Phe Glu Ile Ala
580 585 590


Gln Lys Asn Ala Lys Gly Tyr Ala Pro Ala Lys Val Val Leu Ala Phe
595 600 605


Ser Ala Pro Arg Leu Lys Arg Asp Gly Leu Ile Asp Lys Glu Phe Ser
610 615 620


Ala Tyr Tyr Pro Pro Val Leu Gln Ala Phe Leu Arg Glu Glu Glu Ala
625 630 635 640


Pro Lys Gln Ser Phe Lys Thr Thr Ala Val Ile Leu Met Pro Asp Trp
645 650 655


Asp Lys Asn Gly Lys Arg Arg Ile Leu Leu Asn Phe Pro Ile Lys Leu
660 665 670


Asp Val Ser Ala Ile His Gln Lys Thr Asp His Arg Phe Glu Asn Gln
675 680 685


Phe Tyr Phe Ala Asn Asn Thr Asn Thr Cys Leu Leu Trp Pro Ser Tyr
690 695 700


Gln Tyr Lys Lys Pro Val Thr Trp Tyr Gln Gly Lys Lys Pro Phe Asp
705 710 715 720


Val Val Ala Val Asp Leu Gly Gln Arg Ser Ala Gly Ala Val Ser Arg
725 730 735


Ile Thr Val Ser Thr Glu Lys Arg Glu His Ser Val Ala Ile Gly Glu
740 745 750


Ala Gly Gly Thr Gln Trp Tyr Ala Tyr Arg Lys Phe Ser Gly Leu Leu
755 760 765


Arg Leu Pro Gly Glu Asp Ala Thr Val Ile Arg Asp Gly Gln Arg Thr
770 775 780


Glu Glu Leu Ser Gly Asn Ala Gly Arg Leu Ser Thr Glu Glu Glu Thr
785 790 795 800


Val Gln Ala Cys Val Leu Cys Lys Met Leu Ile Gly Asp Ala Thr Leu
805 810 815


Leu Gly Gly Ser Asp Glu Lys Thr Ile Arg Ser Phe Pro Lys Gln Asn
820 825 830


Asp Lys Leu Leu Ile Ala Phe Arg Arg Ala Thr Gly Arg Met Lys Gln
835 840 845


Leu Gln Arg Trp Leu Trp Met Leu Asn Glu Asn Gly Leu Cys Asp Lys
850 855 860


Ala Lys Thr Glu Ile Ser Asn Ser Asp Trp Leu Val Asn Lys Asn Ile
865 870 875 880


Asp Asn Val Leu Lys Glu Glu Lys Gln His Arg Glu Met Leu Pro Ala
885 890 895


Ile Leu Leu Gln Ile Ala Asp Arg Val Leu Pro Leu Arg Gly Arg Lys
900 905 910


Trp Asp Trp Val Leu Asn Pro Gln Ser Asn Ser Phe Val Leu Gln Gln
915 920 925


Thr Ala His Gly Ser Gly Asp Pro His Lys Lys Ile Cys Gly Gln Arg
930 935 940


Gly Leu Ser Phe Ala Arg Ile Glu Gln Leu Glu Ser Leu Arg Met Arg
945 950 955 960


Cys Gln Ala Leu Asn Arg Ile Leu Met Arg Lys Thr Gly Glu Lys Pro
965 970 975


Ala Thr Leu Ala Glu Met Arg Asn Asn Pro Ile Pro Asp Cys Cys Pro
980 985 990


Asp Ile Leu Met Arg Leu Asp Ala Met Lys Glu Gln Arg Ile Asn Gln
995 1000 1005


Thr Ala Asn Leu Ile Leu Ala Gln Ala Leu Gly Leu Arg His Cys
1010 1015 1020


Leu His Ser Glu Ser Ala Thr Lys Arg Lys Glu Asn Gly Met His
1025 1030 1035


Gly Glu Tyr Glu Lys Ile Pro Gly Val Glu Pro Ala Ala Phe Val
1040 1045 1050


Val Leu Glu Asp Leu Ser Arg Tyr Arg Phe Ser Gln Asp Arg Ser
1055 1060 1065


Ser Tyr Glu Asn Ser Arg Leu Met Lys Trp Ser His Arg Lys Ile
1070 1075 1080


Leu Glu Lys Leu Ala Leu Leu Cys Glu Val Phe Asn Val Pro Ile
1085 1090 1095


Leu Gln Val Gly Ala Ala Tyr Ser Ser Lys Phe Ser Ala Asn Ala
1100 1105 1110


Ile Pro Gly Phe Arg Ala Glu Glu Cys Ser Ile Asp Gln Leu Ser
1115 1120 1125


Phe Tyr Pro Trp Arg Glu Leu Lys Asp Ser Arg Glu Lys Ala Leu
1130 1135 1140


Val Glu Gln Ile Arg Lys Ile Gly His Arg Leu Leu Thr Phe Asp
1145 1150 1155


Ala Lys Ala Thr Ile Ile Met Pro Arg Asn Gly Gly Pro Val Phe
1160 1165 1170


Ile Pro Phe Val Pro Ser Asp Ser Lys Asp Thr Leu Ile Gln Ala
1175 1180 1185


Asp Ile Asn Ala Ser Phe Asn Ile Gly Leu Arg Gly Val Ala Asp
1190 1195 1200


Ala Thr Asn Leu Leu Cys Asn Asn Arg Val Ser Cys Asp Arg Lys
1205 1210 1215


Lys Asp Cys Trp Gln Val Lys Arg Ser Ser Asn Phe Ser Lys Met
1220 1225 1230


Val Tyr Pro Glu Lys Leu Ser Leu Ser Phe Asp Pro Ile Lys Lys
1235 1240 1245


Gln Glu Gly Ala Gly Gly Asn Phe Phe Val Leu Gly Cys Ser Glu
1250 1255 1260


Arg Ile Leu Thr Gly Thr Ser Glu Lys Ser Pro Val Phe Thr Ser
1265 1270 1275


Ser Glu Met Ala Lys Lys Tyr Pro Asn Leu Met Phe Gly Ser Ala
1280 1285 1290


Leu Trp Arg Asn Glu Ile Leu Lys Leu Glu Arg Cys Cys Lys Ile
1295 1300 1305


Asn Gln Ser Arg Leu Asp Lys Phe Ile Ala Lys Lys Glu Val Gln
1310 1315 1320


Asn Glu Leu
1325


<210> 528
<211> 1090
<212> PRT
<213> Laceyella sediminis

<400> 528

Met Ser Ile Arg Ser Phe Lys Leu Lys Ile Lys Thr Lys Ser Gly Val
1 5 10 15


Asn Ala Glu Glu Leu Arg Arg Gly Leu Trp Arg Thr His Gln Leu Ile
20 25 30


Asn Asp Gly Ile Ala Tyr Tyr Met Asn Trp Leu Val Leu Leu Arg Gln
35 40 45


Glu Asp Leu Phe Ile Arg Asn Glu Glu Thr Asn Glu Ile Glu Lys Arg
50 55 60


Ser Lys Glu Glu Ile Gln Gly Glu Leu Leu Glu Arg Val His Lys Gln
65 70 75 80


Gln Gln Arg Asn Gln Trp Ser Gly Glu Val Asp Asp Gln Thr Leu Leu
85 90 95


Gln Thr Leu Arg His Leu Tyr Glu Glu Ile Val Pro Ser Val Ile Gly
100 105 110


Lys Ser Gly Asn Ala Ser Leu Lys Ala Arg Phe Phe Leu Gly Pro Leu
115 120 125


Val Asp Pro Asn Asn Lys Thr Thr Lys Asp Val Ser Lys Ser Gly Pro
130 135 140


Thr Pro Lys Trp Lys Lys Met Lys Asp Ala Gly Asp Pro Asn Trp Val
145 150 155 160


Gln Glu Tyr Glu Lys Tyr Met Ala Glu Arg Gln Thr Leu Val Arg Leu
165 170 175


Glu Glu Met Gly Leu Ile Pro Leu Phe Pro Met Tyr Thr Asp Glu Val
180 185 190


Gly Asp Ile His Trp Leu Pro Gln Ala Ser Gly Tyr Thr Arg Thr Trp
195 200 205


Asp Arg Asp Met Phe Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220


Ser Trp Asn Arg Arg Val Arg Glu Arg Arg Ala Gln Phe Glu Lys Lys
225 230 235 240


Thr His Asp Phe Ala Ser Arg Phe Ser Glu Ser Asp Val Gln Trp Met
245 250 255


Asn Lys Leu Arg Glu Tyr Glu Ala Gln Gln Glu Lys Ser Leu Glu Glu
260 265 270


Asn Ala Phe Ala Pro Asn Glu Pro Tyr Ala Leu Thr Lys Lys Ala Leu
275 280 285


Arg Gly Trp Glu Arg Val Tyr His Ser Trp Met Arg Leu Asp Ser Ala
290 295 300


Ala Ser Glu Glu Ala Tyr Trp Gln Glu Val Ala Thr Cys Gln Thr Ala
305 310 315 320


Met Arg Gly Glu Phe Gly Asp Pro Ala Ile Tyr Gln Phe Leu Ala Gln
325 330 335


Lys Glu Asn His Asp Ile Trp Arg Gly Tyr Pro Glu Arg Val Ile Asp
340 345 350


Phe Ala Glu Leu Asn His Leu Gln Arg Glu Leu Arg Arg Ala Lys Glu
355 360 365


Asp Ala Thr Phe Thr Leu Pro Asp Ser Val Asp His Pro Leu Trp Val
370 375 380


Arg Tyr Glu Ala Pro Gly Gly Thr Asn Ile His Gly Tyr Asp Leu Val
385 390 395 400


Gln Asp Thr Lys Arg Asn Leu Thr Leu Ile Leu Asp Lys Phe Ile Leu
405 410 415


Pro Asp Glu Asn Gly Ser Trp His Glu Val Lys Lys Val Pro Phe Ser
420 425 430


Leu Ala Lys Ser Lys Gln Phe His Arg Gln Val Trp Leu Gln Glu Glu
435 440 445


Gln Lys Gln Lys Lys Arg Glu Val Val Phe Tyr Asp Tyr Ser Thr Asn
450 455 460


Leu Pro His Leu Gly Thr Leu Ala Gly Ala Lys Leu Gln Trp Asp Arg
465 470 475 480


Asn Phe Leu Asn Lys Arg Thr Gln Gln Gln Ile Glu Glu Thr Gly Glu
485 490 495


Ile Gly Lys Val Phe Phe Asn Ile Ser Val Asp Val Arg Pro Ala Val
500 505 510


Glu Val Lys Asn Gly Arg Leu Gln Asn Gly Leu Gly Lys Ala Leu Thr
515 520 525


Val Leu Thr His Pro Asp Gly Thr Lys Ile Val Thr Gly Trp Lys Ala
530 535 540


Glu Gln Leu Glu Lys Trp Val Gly Glu Ser Gly Arg Val Ser Ser Leu
545 550 555 560


Gly Leu Asp Ser Leu Ser Glu Gly Leu Arg Val Met Ser Ile Asp Leu
565 570 575


Gly Gln Arg Thr Ser Ala Thr Val Ser Val Phe Glu Ile Thr Lys Glu
580 585 590


Ala Pro Asp Asn Pro Tyr Lys Phe Phe Tyr Gln Leu Glu Gly Thr Glu
595 600 605


Leu Phe Ala Val His Gln Arg Ser Phe Leu Leu Ala Leu Pro Gly Glu
610 615 620


Asn Pro Pro Gln Lys Ile Lys Gln Met Arg Glu Ile Arg Trp Lys Glu
625 630 635 640


Arg Asn Arg Ile Lys Gln Gln Val Asp Gln Leu Ser Ala Ile Leu Arg
645 650 655


Leu His Lys Lys Val Asn Glu Asp Glu Arg Ile Gln Ala Ile Asp Lys
660 665 670


Leu Leu Gln Lys Val Ala Ser Trp Gln Leu Asn Glu Glu Ile Ala Thr
675 680 685


Ala Trp Asn Gln Ala Leu Ser Gln Leu Tyr Ser Lys Ala Lys Glu Asn
690 695 700


Asp Leu Gln Trp Asn Gln Ala Ile Lys Asn Ala His His Gln Leu Glu
705 710 715 720


Pro Val Val Gly Lys Gln Ile Ser Leu Trp Arg Lys Asp Leu Ser Thr
725 730 735


Gly Arg Gln Gly Ile Ala Gly Leu Ser Leu Trp Ser Ile Glu Glu Leu
740 745 750


Glu Ala Thr Lys Lys Leu Leu Thr Arg Trp Ser Lys Arg Ser Arg Glu
755 760 765


Pro Gly Val Val Lys Arg Ile Glu Arg Phe Glu Thr Phe Ala Lys Gln
770 775 780


Ile Gln His His Ile Asn Gln Val Lys Glu Asn Arg Leu Lys Gln Leu
785 790 795 800


Ala Asn Leu Ile Val Met Thr Ala Leu Gly Tyr Lys Tyr Asp Gln Glu
805 810 815


Gln Lys Lys Trp Ile Glu Val Tyr Pro Ala Cys Gln Val Val Leu Phe
820 825 830


Glu Asn Leu Arg Ser Tyr Arg Phe Ser Tyr Glu Arg Ser Arg Arg Glu
835 840 845


Asn Lys Lys Leu Met Glu Trp Ser His Arg Ser Ile Pro Lys Leu Val
850 855 860


Gln Met Gln Gly Glu Leu Phe Gly Leu Gln Val Ala Asp Val Tyr Ala
865 870 875 880


Ala Tyr Ser Ser Arg Tyr His Gly Arg Thr Gly Ala Pro Gly Ile Arg
885 890 895


Cys His Ala Leu Thr Glu Ala Asp Leu Arg Asn Glu Thr Asn Ile Ile
900 905 910


His Glu Leu Ile Glu Ala Gly Phe Ile Lys Glu Glu His Arg Pro Tyr
915 920 925


Leu Gln Gln Gly Asp Leu Val Pro Trp Ser Gly Gly Glu Leu Phe Ala
930 935 940


Thr Leu Gln Lys Pro Tyr Asp Asn Pro Arg Ile Leu Thr Leu His Ala
945 950 955 960


Asp Ile Asn Ala Ala Gln Asn Ile Gln Lys Arg Phe Trp His Pro Ser
965 970 975


Met Trp Phe Arg Val Asn Cys Glu Ser Val Met Glu Gly Glu Ile Val
980 985 990


Thr Tyr Val Pro Lys Asn Lys Thr Val His Lys Lys Gln Gly Lys Thr
995 1000 1005


Phe Arg Phe Val Lys Val Glu Gly Ser Asp Val Tyr Glu Trp Ala
1010 1015 1020


Lys Trp Ser Lys Asn Arg Asn Lys Asn Thr Phe Ser Ser Ile Thr
1025 1030 1035


Glu Arg Lys Pro Pro Ser Ser Met Ile Leu Phe Arg Asp Pro Ser
1040 1045 1050


Gly Thr Phe Phe Lys Glu Gln Glu Trp Val Glu Gln Lys Thr Phe
1055 1060 1065


Trp Gly Lys Val Gln Ser Met Ile Gln Ala Tyr Met Lys Lys Thr
1070 1075 1080


Ile Val Gln Arg Met Glu Glu
1085 1090


<210> 529
<211> 1041
<212> PRT
<213> Methylobacterium nodulans

<400> 529

Met Tyr Glu Ala Ile Val Leu Ala Asp Asp Ala Asn Ala Gln Leu Ala
1 5 10 15


Asn Ala Phe Leu Gly Pro Leu Thr Asp Pro Asn Ser Ala Gly Phe Leu
20 25 30


Glu Ala Phe Asn Lys Val Asp Arg Pro Ala Pro Ser Trp Leu Asp Gln
35 40 45


Val Pro Ala Ser Asp Pro Ile Asp Pro Ala Val Leu Ala Glu Ala Asn
50 55 60


Ala Trp Leu Asp Thr Asp Ala Gly Arg Ala Trp Leu Val Asp Thr Gly
65 70 75 80


Ala Pro Pro Arg Trp Arg Ser Leu Ala Ala Lys Gln Asp Pro Ile Trp
85 90 95


Pro Arg Glu Phe Ala Arg Lys Leu Gly Glu Leu Arg Lys Glu Ala Ala
100 105 110


Ser Gly Thr Ser Ala Ile Ile Lys Ala Leu Lys Arg Asp Phe Gly Val
115 120 125


Leu Pro Leu Phe Gln Pro Ser Leu Ala Pro Arg Ile Leu Gly Ser Arg
130 135 140


Ser Ser Leu Thr Pro Trp Asp Arg Leu Ala Phe Arg Leu Ala Val Gly
145 150 155 160


His Leu Leu Ser Trp Glu Ser Trp Cys Thr Arg Ala Arg Asp Glu His
165 170 175


Thr Ala Arg Val Gln Arg Leu Glu Gln Phe Ser Ser Ala His Leu Lys
180 185 190


Gly Asp Leu Ala Thr Lys Val Ser Thr Leu Arg Glu Tyr Glu Arg Ala
195 200 205


Arg Lys Glu Gln Ile Ala Gln Leu Gly Leu Pro Met Gly Glu Arg Asp
210 215 220


Phe Leu Ile Thr Val Arg Met Thr Arg Gly Trp Asp Asp Leu Arg Glu
225 230 235 240


Lys Trp Arg Arg Ser Gly Asp Lys Gly Gln Glu Ala Leu His Ala Ile
245 250 255


Ile Ala Thr Glu Gln Thr Arg Lys Arg Gly Arg Phe Gly Asp Pro Asp
260 265 270


Leu Phe Arg Trp Leu Ala Arg Pro Glu Asn His His Val Trp Ala Asp
275 280 285


Gly His Ala Asp Ala Val Gly Val Leu Ala Arg Val Asn Ala Met Glu
290 295 300


Arg Leu Val Glu Arg Ser Arg Asp Thr Ala Leu Met Thr Leu Pro Asp
305 310 315 320


Pro Val Ala His Pro Arg Ser Ala Gln Trp Glu Ala Glu Gly Gly Ser
325 330 335


Asn Leu Arg Asn Tyr Gln Leu Glu Ala Val Gly Gly Glu Leu Gln Ile
340 345 350


Thr Leu Pro Leu Leu Lys Ala Ala Asp Asp Gly Arg Cys Ile Asp Thr
355 360 365


Pro Leu Ser Phe Ser Leu Ala Pro Ser Asp Gln Leu Gln Gly Val Val
370 375 380


Leu Thr Lys Gln Asp Lys Gln Gln Lys Ile Thr Tyr Cys Thr Asn Met
385 390 395 400


Asn Glu Val Phe Glu Ala Lys Leu Gly Ser Ala Asp Leu Leu Leu Asn
405 410 415


Trp Asp His Leu Arg Gly Arg Ile Arg Asp Arg Val Asp Ala Gly Asp
420 425 430


Ile Gly Ser Ala Phe Leu Lys Leu Ala Leu Asp Val Ala His Val Leu
435 440 445


Pro Asp Gly Val Asp Asp Gln Leu Ala Arg Ala Ala Phe His Phe Gln
450 455 460


Ser Ala Lys Gly Ala Lys Ser Lys His Ala Asp Ser Val Gln Ala Gly
465 470 475 480


Leu Arg Val Leu Ser Ile Asp Leu Gly Val Arg Ser Phe Ala Thr Cys
485 490 495


Ser Val Phe Glu Leu Lys Asp Thr Ala Pro Thr Thr Gly Val Ala Phe
500 505 510


Pro Leu Ala Glu Phe Arg Leu Trp Ala Val His Glu Arg Ser Phe Thr
515 520 525


Leu Glu Leu Pro Gly Glu Asn Val Gly Ala Ala Gly Gln Gln Trp Arg
530 535 540


Ala Gln Ala Asp Ala Glu Leu Arg Gln Leu Arg Gly Gly Leu Asn Arg
545 550 555 560


His Arg Gln Leu Leu Arg Ala Ala Thr Val Gln Lys Gly Glu Arg Asp
565 570 575


Ala Tyr Leu Thr Asp Leu Arg Glu Ala Trp Ser Ala Lys Glu Leu Trp
580 585 590


Pro Phe Glu Ala Ser Leu Leu Ser Glu Leu Glu Arg Cys Ser Thr Val
595 600 605


Ala Asp Pro Leu Trp Gln Asp Thr Cys Lys Arg Ala Ala Arg Leu Tyr
610 615 620


Arg Thr Glu Phe Gly Ala Val Val Ser Glu Trp Arg Ser Arg Thr Arg
625 630 635 640


Ser Arg Glu Asp Arg Lys Tyr Ala Gly Lys Ser Met Trp Ser Val Gln
645 650 655


His Leu Thr Asp Val Arg Arg Phe Leu Gln Ser Trp Ser Leu Ala Gly
660 665 670


Arg Ala Ser Gly Asp Ile Arg Arg Leu Asp Arg Glu Arg Gly Gly Val
675 680 685


Phe Ala Lys Asp Leu Leu Asp His Ile Asp Ala Leu Lys Asp Asp Arg
690 695 700


Leu Lys Thr Gly Ala Asp Leu Ile Val Gln Ala Ala Arg Gly Phe Gln
705 710 715 720


Arg Asn Glu Phe Gly Tyr Trp Val Gln Lys His Ala Pro Cys His Val
725 730 735


Ile Leu Phe Glu Asp Leu Ser Arg Tyr Arg Met Arg Thr Asp Arg Pro
740 745 750


Arg Arg Glu Asn Ser Gln Leu Met Gln Trp Ala His Arg Gly Val Pro
755 760 765


Asp Met Val Gly Met Gln Gly Glu Ile Tyr Gly Ile Gln Asp Arg Arg
770 775 780


Asp Pro Asp Ser Ala Arg Lys His Ala Arg Gln Pro Leu Ala Ala Phe
785 790 795 800


Cys Leu Asp Thr Pro Ala Ala Phe Ser Ser Arg Tyr His Ala Ser Thr
805 810 815


Met Thr Pro Gly Ile Arg Cys His Pro Leu Arg Lys Arg Glu Phe Glu
820 825 830


Asp Gln Gly Phe Leu Glu Leu Leu Lys Arg Glu Asn Glu Gly Leu Asp
835 840 845


Leu Asn Gly Tyr Lys Pro Gly Asp Leu Val Pro Leu Pro Gly Gly Glu
850 855 860


Val Phe Val Cys Leu Asn Ala Asn Gly Leu Ser Arg Ile His Ala Asp
865 870 875 880


Ile Asn Ala Ala Gln Asn Leu Gln Arg Arg Phe Trp Thr Gln His Gly
885 890 895


Asp Ala Phe Arg Leu Pro Cys Gly Lys Ser Ala Val Gln Gly Gln Ile
900 905 910


Arg Trp Ala Pro Leu Ser Met Gly Lys Arg Gln Ala Gly Ala Leu Gly
915 920 925


Gly Phe Gly Tyr Leu Glu Pro Thr Gly His Asp Ser Gly Ser Cys Gln
930 935 940


Trp Arg Lys Thr Thr Glu Ala Glu Trp Arg Arg Leu Ser Gly Ala Gln
945 950 955 960


Lys Asp Arg Asp Glu Ala Ala Ala Ala Glu Asp Glu Glu Leu Gln Gly
965 970 975


Leu Glu Glu Glu Leu Leu Glu Arg Ser Gly Glu Arg Val Val Phe Phe
980 985 990


Arg Asp Pro Ser Gly Val Val Leu Pro Thr Asp Leu Trp Phe Pro Ser
995 1000 1005


Ala Ala Phe Trp Ser Ile Val Arg Ala Lys Thr Val Gly Arg Leu
1010 1015 1020


Arg Ser His Leu Asp Ala Gln Ala Glu Ala Ser Tyr Ala Val Ala
1025 1030 1035


Ala Gly Leu
1040


<210> 530
<211> 1413
<212> PRT
<213> Unknown

<220>
<223> Member of the candidate phylum Omnitrophica

<400> 530

Met Asn Arg Ile Tyr Gln Gly Arg Val Thr Lys Val Glu Lys Leu Lys
1 5 10 15


Asn Gly Lys Ser Pro Asp Asp Arg Glu Glu Leu Lys Asp Trp Gln Thr
20 25 30


Ala Leu Trp Arg His His Glu Leu Phe Gln Asp Ala Val Ser Tyr Tyr
35 40 45


Thr Leu Ala Leu Ala Ala Met Ala Glu Gly Leu Pro Asp Lys His Pro
50 55 60


Ile Asn Val Leu Arg Lys Arg Met Glu Glu Ala Trp Glu Glu Phe Pro
65 70 75 80


Arg Lys Thr Val Thr Pro Ala Lys Asn Leu Arg Asp Ser Val Arg Pro
85 90 95


Trp Leu Gly Leu Ser Glu Ser Ala Ser Phe Gly Asp Ala Leu Lys Lys
100 105 110


Ile Leu Pro Pro Ala Pro Glu Asn Lys Glu Val Arg Ala Leu Ala Val
115 120 125


Ala Leu Leu Ala Glu Lys Ala Arg Thr Leu Lys Pro Gln Lys Thr Ser
130 135 140


Ala Ser Tyr Trp Gly Arg Phe Cys Asp Asp Leu Lys Lys Lys Pro Asn
145 150 155 160


Trp Asp Tyr Ser Glu Glu Glu Leu Ala Arg Lys Thr Gly Ser Gly Asp
165 170 175


Trp Val Ala Gly Leu Trp Ser Glu Asp Ala Leu Asn Lys Ile Asp Glu
180 185 190


Leu Ala Lys Ser Leu Lys Leu Ser Ser Leu Val Lys Cys Val Pro Asp
195 200 205


Gly Gln Ile Asn Pro Glu Gly Ala Arg Asn Leu Val Lys Glu Ala Leu
210 215 220


Asp His Leu Glu Gly Val Ser Asn Gly Thr Lys Lys Glu Lys Asn Asp
225 230 235 240


Pro Gly Pro Ala Lys Lys Thr Asn Asn Trp Leu Arg Gln His Ala Ser
245 250 255


Asp Val Arg Asn Phe Ile His Lys Asn Lys Asn Gln Phe Ser Ser Leu
260 265 270


Pro Asn Gly Arg Leu Ile Thr Glu Arg Ala Arg Gly Gly Gly Ile Asn
275 280 285


Ile Asn Lys Thr Tyr Ala Gly Val Leu Phe Lys Ala Phe Pro Cys Pro
290 295 300


Phe Thr Phe Asp Tyr Val Arg Ala Ala Val Pro Glu Pro Lys Val Lys
305 310 315 320


Lys Val Asp Gln Glu Lys Lys Ser Glu Gln Ser Ala Thr Trp Thr Glu
325 330 335


Leu Glu Lys Arg Ile Leu Arg Ile Gly Asp Asp Pro Ile Glu Leu Ala
340 345 350


Arg Lys Asn Asn Lys Pro Ile Phe Lys Ala Phe Thr Ala Leu Glu Lys
355 360 365


Trp Ser Asp Gln Asn Ser Lys Ser Cys Trp Ser Asp Phe Asp Lys Cys
370 375 380


Ala Phe Glu Glu Ala Leu Lys Thr Leu Asn Gln Phe Asn Gln Lys Thr
385 390 395 400


Glu Glu Arg Glu Lys Arg Arg Ser Glu Ala Glu Ala Glu Leu Lys Tyr
405 410 415


Met Met Asp Glu Asn Pro Glu Trp Lys Pro Lys Lys Glu Thr Glu Gly
420 425 430


Asp Asp Val Arg Glu Val Pro Ile Leu Lys Gly Asp Pro Arg Tyr Glu
435 440 445


Lys Leu Val Lys Leu Phe Gly Asp Leu Asp Glu Glu Gly Ser Glu His
450 455 460


Ala Thr Gly Lys Ile Tyr Gly Pro Ser Arg Ala Ser Leu Arg Gly Phe
465 470 475 480


Gly Lys Leu Arg Asn Glu Trp Val Asp Leu Phe Thr Lys Ala Asn Asp
485 490 495


Asn Pro Arg Glu Gln Asp Leu Gln Lys Ala Val Thr Gly Phe Gln Arg
500 505 510


Glu His Lys Leu Asp Met Gly Tyr Thr Ala Phe Phe Leu Lys Leu Cys
515 520 525


Glu Arg Asp Tyr Trp Asp Ile Trp Arg Asp Asp Thr Glu Val Glu Val
530 535 540


Lys Lys Ile Arg Glu Lys Arg Trp Val Lys Ser Val Val Tyr Ala Ala
545 550 555 560


Ala Asp Thr Arg Glu Leu Ala Glu Glu Leu Glu Arg Leu Gln Glu Pro
565 570 575


Val Arg Tyr Thr Pro Ala Glu Pro Gln Phe Ser Arg Arg Leu Phe Met
580 585 590


Phe Ser Asp Ile Lys Gly Lys Gln Gly Ala Lys His Ile Arg Glu Gly
595 600 605


Leu Val Glu Val Ser Leu Ala Val Lys Asp Gln Ser Gly Lys Tyr Gly
610 615 620


Thr Cys Arg Val Arg Leu His Tyr Ser Ala Pro Arg Leu Ile Arg Asp
625 630 635 640


His Leu Ser Asp Gly Ser Ser Ser Met Trp Leu Gln Pro Met Met Ala
645 650 655


Ala Leu Gly Leu Ser Ser Asp Ala Arg Gly Cys Phe Thr Arg Asp Ser
660 665 670


Lys Gly Asn Val Lys Glu Pro Ala Val Ala Leu Met Ser Asp Phe Val
675 680 685


Gly Arg Lys Arg Glu Leu Arg Met Leu Leu Asn Phe Pro Val Asp Leu
690 695 700


Asp Ile Ser Lys Leu Glu Glu Asn Ile Gly Lys Lys Ala Arg Trp Glu
705 710 715 720


Lys Gln Met Asn Thr Ala Tyr Glu Lys Asn Lys Leu Lys Gln Arg Phe
725 730 735


His Leu Ile Trp Pro Gly Met Glu Leu Lys Glu Thr Gln Glu Pro Gly
740 745 750


Gln Phe Trp Trp Asp Asn Pro Thr Ile Gln Lys Glu Gly Met Tyr Cys
755 760 765


Leu Ala Ile Asp Leu Ser Gln Arg Arg Ala Ala Asp Tyr Ala Leu Leu
770 775 780


His Ala Gly Val Asn Arg Asp Ser Lys Thr Phe Val Glu Leu Gly Gln
785 790 795 800


Ala Gly Gly Gln Ser Trp Phe Thr Lys Leu Cys Ala Ala Gly Ser Leu
805 810 815


Arg Leu Pro Gly Glu Asp Thr Glu Val Ile Arg Glu Gly Lys Arg Gln
820 825 830


Ile Glu Leu Ser Gly Lys Lys Gly Arg Asn Ala Thr Gln Ser Glu Tyr
835 840 845


Asp Gln Ala Ile Ala Leu Ala Lys Gln Leu Leu His Asn Glu Asn Ser
850 855 860


Ala Glu Leu Glu Ser Ala Ala Arg Asp Trp Leu Gly Asp Asn Ala Lys
865 870 875 880


Arg Phe Ser Phe Pro Glu Gln Asn Asp Lys Leu Ile Asp Leu Tyr Tyr
885 890 895


Gly Ala Leu Ser Arg Tyr Lys Thr Trp Leu Arg Trp Ser Trp Arg Leu
900 905 910


Thr Glu Gln His Lys Glu Leu Trp Asp Lys Thr Leu Asp Glu Ile Arg
915 920 925


Lys Val Pro Tyr Phe Ala Ser Trp Gly Glu Leu Ala Gly Asn Gly Thr
930 935 940


Asn Glu Ala Thr Val Gln Gln Leu Gln Lys Leu Ile Ala Asp Ala Ala
945 950 955 960


Val Asp Leu Arg Asn Phe Leu Glu Lys Ala Leu Leu His Ile Ala Tyr
965 970 975


Arg Ala Leu Pro Leu Arg Glu Asn Thr Trp Arg Trp Ile Glu Asn Gly
980 985 990


Lys Asp Gly Lys Gly Lys Pro Leu His Leu Leu Val Ser Asp Gly Gln
995 1000 1005


Ser Pro Ala Glu Ile Pro Trp Leu Arg Gly Gln Arg Gly Leu Ser
1010 1015 1020


Ile Ala Arg Ile Glu Gln Leu Glu Asn Phe Arg Arg Ala Val Leu
1025 1030 1035


Ser Leu Asn Arg Leu Leu Arg His Glu Ile Gly Thr Lys Pro Glu
1040 1045 1050


Phe Gly Ser Ser Thr Cys Gly Glu Ser Leu Pro Asp Pro Cys Pro
1055 1060 1065


Asp Leu Thr Asp Lys Ile Val Arg Leu Lys Glu Glu Arg Val Asn
1070 1075 1080


Gln Thr Ala His Leu Ile Ile Ala Gln Ser Leu Gly Val Arg Leu
1085 1090 1095


Lys Gly His Ser Leu Phe Thr Glu Glu Arg Glu Lys Ala Asp Met
1100 1105 1110


His Gly Glu His Glu Val Ile Pro Gly Arg Ser Pro Val Asp Phe
1115 1120 1125


Val Val Leu Glu Asp Leu Ser Arg Tyr Thr Thr Asp Lys Ser Arg
1130 1135 1140


Ser Arg Ser Glu Asn Ser Arg Leu Met Lys Trp Cys His Arg Lys
1145 1150 1155


Ile Asn Glu Lys Val Lys Leu Leu Ala Glu Pro Phe Gly Ile Pro
1160 1165 1170


Val Ile Glu Val Phe Ala Ser Tyr Ser Ser Lys Phe Asp Ala Arg
1175 1180 1185


Thr Gly Ala Pro Gly Phe Arg Ala Val Glu Val Thr Ser Glu Asp
1190 1195 1200


Arg Pro Phe Trp Arg Lys Thr Ile Glu Lys Gln Ser Val Ala Arg
1205 1210 1215


Glu Val Phe Asp Cys Leu Asp Asn Leu Val Gly Lys Gly Leu Asn
1220 1225 1230


Gly Ile His Leu Val Leu Pro Gln Asn Gly Gly Pro Leu Phe Ile
1235 1240 1245


Ala Ala Val Lys Glu Asp Gln Pro Leu Pro Ala Ile Arg Gln Ala
1250 1255 1260


Asp Ile Asn Ala Ala Val Asn Ile Gly Leu Arg Ala Ile Ala Gly
1265 1270 1275


Pro Ser Cys Tyr His Ala His Pro Lys Val Arg Leu Ile Lys Gly
1280 1285 1290


Glu Ser Gly Thr Asp Lys Gly Lys Trp Leu Pro Arg Lys Gly Lys
1295 1300 1305


Glu Ala Asn Lys Arg Glu Asn Ala Gln Phe Gly Asn Val Asp Leu
1310 1315 1320


Asp Leu Glu Val Lys Phe Asn Arg Leu Asp Ile Asp Ser Asp Val
1325 1330 1335


Leu Lys Gly Asp Asn Thr Asn Leu Phe His Asp Pro Leu Asn Ile
1340 1345 1350


Ala Cys Tyr Gly Phe Ala Thr Ile Gln Asn Leu Gln His Pro Phe
1355 1360 1365


Leu Ala His Ala Ser Ala Val Phe Ser Arg Gln Lys Gly Ala Val
1370 1375 1380


Ala Arg Leu Gln Trp Glu Val Cys Arg Ala Ile Asn Ser Arg Arg
1385 1390 1395


Leu Glu Ala Trp Gln Lys Lys Ala Glu Lys Ala Ala Val Lys Arg
1400 1405 1410


<210> 531
<211> 1388
<212> PRT
<213> Unknown

<220>
<223> Member of the family Opitutaceae

<400> 531

Met Ser Leu Asn Arg Ile Tyr Gln Gly Arg Val Ala Ala Val Glu Thr
1 5 10 15


Gly Thr Ala Leu Ala Lys Gly Asn Val Glu Trp Met Pro Ala Ala Gly
20 25 30


Gly Asp Glu Val Leu Trp Gln His His Glu Leu Phe Gln Ala Ala Ile
35 40 45


Asn Tyr Tyr Leu Val Ala Leu Leu Ala Leu Ala Asp Lys Asn Asn Pro
50 55 60


Val Leu Gly Pro Leu Ile Ser Gln Met Asp Asn Pro Gln Ser Pro Tyr
65 70 75 80


His Val Trp Gly Ser Phe Arg Arg Gln Gly Arg Gln Arg Thr Gly Leu
85 90 95


Ser Gln Ala Val Ala Pro Tyr Ile Thr Pro Gly Asn Asn Ala Pro Thr
100 105 110


Leu Asp Glu Val Phe Arg Ser Ile Leu Ala Gly Asn Pro Thr Asp Arg
115 120 125


Ala Thr Leu Asp Ala Ala Leu Met Gln Leu Leu Lys Ala Cys Asp Gly
130 135 140


Ala Gly Ala Ile Gln Gln Glu Gly Arg Ser Tyr Trp Pro Lys Phe Cys
145 150 155 160


Asp Pro Asp Ser Thr Ala Asn Phe Ala Gly Asp Pro Ala Met Leu Arg
165 170 175


Arg Glu Gln His Arg Leu Leu Leu Pro Gln Val Leu His Asp Pro Ala
180 185 190


Ile Thr His Asp Ser Pro Ala Leu Gly Ser Phe Asp Thr Tyr Ser Ile
195 200 205


Ala Thr Pro Asp Thr Arg Thr Pro Gln Leu Thr Gly Pro Lys Ala Arg
210 215 220


Ala Arg Leu Glu Gln Ala Ile Thr Leu Trp Arg Val Arg Leu Pro Glu
225 230 235 240


Ser Ala Ala Asp Phe Asp Arg Leu Ala Ser Ser Leu Lys Lys Ile Pro
245 250 255


Asp Asp Asp Ser Arg Leu Asn Leu Gln Gly Tyr Val Gly Ser Ser Ala
260 265 270


Lys Gly Glu Val Gln Ala Arg Leu Phe Ala Leu Leu Leu Phe Arg His
275 280 285


Leu Glu Arg Ser Ser Phe Thr Leu Gly Leu Leu Arg Ser Ala Thr Pro
290 295 300


Pro Pro Lys Asn Ala Glu Thr Pro Pro Pro Ala Gly Val Pro Leu Pro
305 310 315 320


Ala Ala Ser Ala Ala Asp Pro Val Arg Ile Ala Arg Gly Lys Arg Ser
325 330 335


Phe Val Phe Arg Ala Phe Thr Ser Leu Pro Cys Trp His Gly Gly Asp
340 345 350


Asn Ile His Pro Thr Trp Lys Ser Phe Asp Ile Ala Ala Phe Lys Tyr
355 360 365


Ala Leu Thr Val Ile Asn Gln Ile Glu Glu Lys Thr Lys Glu Arg Gln
370 375 380


Lys Glu Cys Ala Glu Leu Glu Thr Asp Phe Asp Tyr Met His Gly Arg
385 390 395 400


Leu Ala Lys Ile Pro Val Lys Tyr Thr Thr Gly Glu Ala Glu Pro Pro
405 410 415


Pro Ile Leu Ala Asn Asp Leu Arg Ile Pro Leu Leu Arg Glu Leu Leu
420 425 430


Gln Asn Ile Lys Val Asp Thr Ala Leu Thr Asp Gly Glu Ala Val Ser
435 440 445


Tyr Gly Leu Gln Arg Arg Thr Ile Arg Gly Phe Arg Glu Leu Arg Arg
450 455 460


Ile Trp Arg Gly His Ala Pro Ala Gly Thr Val Phe Ser Ser Glu Leu
465 470 475 480


Lys Glu Lys Leu Ala Gly Glu Leu Arg Gln Phe Gln Thr Asp Asn Ser
485 490 495


Thr Thr Ile Gly Ser Val Gln Leu Phe Asn Glu Leu Ile Gln Asn Pro
500 505 510


Lys Tyr Trp Pro Ile Trp Gln Ala Pro Asp Val Glu Thr Ala Arg Gln
515 520 525


Trp Ala Asp Ala Gly Phe Ala Asp Asp Pro Leu Ala Ala Leu Val Gln
530 535 540


Glu Ala Glu Leu Gln Glu Asp Ile Asp Ala Leu Lys Ala Pro Val Lys
545 550 555 560


Leu Thr Pro Ala Asp Pro Glu Tyr Ser Arg Arg Gln Tyr Asp Phe Asn
565 570 575


Ala Val Ser Lys Phe Gly Ala Gly Ser Arg Ser Ala Asn Arg His Glu
580 585 590


Pro Gly Gln Thr Glu Arg Gly His Asn Thr Phe Thr Thr Glu Ile Ala
595 600 605


Ala Arg Asn Ala Ala Asp Gly Asn Arg Trp Arg Ala Thr His Val Arg
610 615 620


Ile His Tyr Ser Ala Pro Arg Leu Leu Arg Asp Gly Leu Arg Arg Pro
625 630 635 640


Asp Thr Asp Gly Asn Glu Ala Leu Glu Ala Val Pro Trp Leu Gln Pro
645 650 655


Met Met Glu Ala Leu Ala Pro Leu Pro Thr Leu Pro Gln Asp Leu Thr
660 665 670


Gly Met Pro Val Phe Leu Met Pro Asp Val Thr Leu Ser Gly Glu Arg
675 680 685


Arg Ile Leu Leu Asn Leu Pro Val Thr Leu Glu Pro Ala Ala Leu Val
690 695 700


Glu Gln Leu Gly Asn Ala Gly Arg Trp Gln Asn Gln Phe Phe Gly Ser
705 710 715 720


Arg Glu Asp Pro Phe Ala Leu Arg Trp Pro Ala Asp Gly Ala Val Lys
725 730 735


Thr Ala Lys Gly Lys Thr His Ile Pro Trp His Gln Asp Arg Asp His
740 745 750


Phe Thr Val Leu Gly Val Asp Leu Gly Thr Arg Asp Ala Gly Ala Leu
755 760 765


Ala Leu Leu Asn Val Thr Ala Gln Lys Pro Ala Lys Pro Val His Arg
770 775 780


Ile Ile Gly Glu Ala Asp Gly Arg Thr Trp Tyr Ala Ser Leu Ala Asp
785 790 795 800


Ala Arg Met Ile Arg Leu Pro Gly Glu Asp Ala Arg Leu Phe Val Arg
805 810 815


Gly Lys Leu Val Gln Glu Pro Tyr Gly Glu Arg Gly Arg Asn Ala Ser
820 825 830


Leu Leu Glu Trp Glu Asp Ala Arg Asn Ile Ile Leu Arg Leu Gly Gln
835 840 845


Asn Pro Asp Glu Leu Leu Gly Ala Asp Pro Arg Arg His Ser Tyr Pro
850 855 860


Glu Ile Asn Asp Lys Leu Leu Val Ala Leu Arg Arg Ala Gln Ala Arg
865 870 875 880


Leu Ala Arg Leu Gln Asn Arg Ser Trp Arg Leu Arg Asp Leu Ala Glu
885 890 895


Ser Asp Lys Ala Leu Asp Glu Ile His Ala Glu Arg Ala Gly Glu Lys
900 905 910


Pro Ser Pro Leu Pro Pro Leu Ala Arg Asp Asp Ala Ile Lys Ser Thr
915 920 925


Asp Glu Ala Leu Leu Ser Gln Arg Asp Ile Ile Arg Arg Ser Phe Val
930 935 940


Gln Ile Ala Asn Leu Ile Leu Pro Leu Arg Gly Arg Arg Trp Glu Trp
945 950 955 960


Arg Pro His Val Glu Val Pro Asp Cys His Ile Leu Ala Gln Ser Asp
965 970 975


Pro Gly Thr Asp Asp Thr Lys Arg Leu Val Ala Gly Gln Arg Gly Ile
980 985 990


Ser His Glu Arg Ile Glu Gln Ile Glu Glu Leu Arg Arg Arg Cys Gln
995 1000 1005


Ser Leu Asn Arg Ala Leu Arg His Lys Pro Gly Glu Arg Pro Val
1010 1015 1020


Leu Gly Arg Pro Ala Lys Gly Glu Glu Ile Ala Asp Pro Cys Pro
1025 1030 1035


Ala Leu Leu Glu Lys Ile Asn Arg Leu Arg Asp Gln Arg Val Asp
1040 1045 1050


Gln Thr Ala His Ala Ile Leu Ala Ala Ala Leu Gly Val Arg Leu
1055 1060 1065


Arg Ala Pro Ser Lys Asp Arg Ala Glu Arg Arg His Arg Asp Ile
1070 1075 1080


His Gly Glu Tyr Glu Arg Phe Arg Ala Pro Ala Asp Phe Val Val
1085 1090 1095


Ile Glu Asn Leu Ser Arg Tyr Leu Ser Ser Gln Asp Arg Ala Arg
1100 1105 1110


Ser Glu Asn Thr Arg Leu Met Gln Trp Cys His Arg Gln Ile Val
1115 1120 1125


Gln Lys Leu Arg Gln Leu Cys Glu Thr Tyr Gly Ile Pro Val Leu
1130 1135 1140


Ala Val Pro Ala Ala Tyr Ser Ser Arg Phe Ser Ser Arg Asp Gly
1145 1150 1155


Ser Ala Gly Phe Arg Ala Val His Leu Thr Pro Asp His Arg His
1160 1165 1170


Arg Met Pro Trp Ser Arg Ile Leu Ala Arg Leu Lys Ala His Glu
1175 1180 1185


Glu Asp Gly Lys Arg Leu Glu Lys Thr Val Leu Asp Glu Ala Arg
1190 1195 1200


Ala Val Arg Gly Leu Phe Asp Arg Leu Asp Arg Phe Asn Ala Gly
1205 1210 1215


His Val Pro Gly Lys Pro Trp Arg Thr Leu Leu Ala Pro Leu Pro
1220 1225 1230


Gly Gly Pro Val Phe Val Pro Leu Gly Asp Ala Thr Pro Met Gln
1235 1240 1245


Ala Asp Leu Asn Ala Ala Ile Asn Ile Ala Leu Arg Gly Ile Ala
1250 1255 1260


Ala Pro Asp Arg His Asp Ile His His Arg Leu Arg Ala Glu Asn
1265 1270 1275


Lys Lys Arg Ile Leu Ser Leu Arg Leu Gly Thr Gln Arg Glu Lys
1280 1285 1290


Ala Arg Trp Pro Gly Gly Ala Pro Ala Val Thr Leu Ser Thr Pro
1295 1300 1305


Asn Asn Gly Ala Ser Pro Glu Asp Ser Asp Ala Leu Pro Glu Arg
1310 1315 1320


Val Ser Asn Leu Phe Val Asp Ile Ala Gly Val Ala Asn Phe Glu
1325 1330 1335


Arg Val Thr Ile Glu Gly Val Ser Gln Lys Phe Ala Thr Gly Arg
1340 1345 1350


Gly Leu Trp Ala Ser Val Lys Gln Arg Ala Trp Asn Arg Val Ala
1355 1360 1365


Arg Leu Asn Glu Thr Val Thr Asp Asn Asn Arg Asn Glu Glu Glu
1370 1375 1380


Asp Asp Ile Pro Met
1385


<210> 532
<211> 747
<212> PRT
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 532

Met Ala Thr Lys Ser Tyr Arg Ala Arg Ile Leu Thr Asp Ser Arg Leu
1 5 10 15


Ala Ala Ala Leu Asp Arg Thr His Val Val Phe Val Glu Ser Leu Lys
20 25 30


Gln Met Ile Asn Thr Tyr Leu Arg Met Gln Asn Gly Lys Phe Gly Pro
35 40 45


Asp His Lys Lys Leu Ala Gln Ile Met Leu Ser Arg Ser Asn Thr Phe
50 55 60


Ala His Gly Val Met Asp Gln Ile Thr Arg Asp Gln Pro Thr Ser Thr
65 70 75 80


Leu Asp Glu Glu Trp Thr Asp Leu Ala Arg Arg Ile His Lys Thr Thr
85 90 95


Gly Pro Leu Phe Leu Gln Ala Glu Arg Phe Ala Thr Val Lys Asn Arg
100 105 110


Ala Ile His Thr Lys Ser Arg Gly Lys Val Ile Pro Ser Pro Glu Thr
115 120 125


Leu Ala Val Pro Ala Lys Phe Trp His Gln Val Cys Asp Ser Ala Ser
130 135 140


Ala Tyr Ile Arg Ser Asn Arg Glu Leu Met Gln Gln Trp Arg Lys Asp
145 150 155 160


Arg Ala Ala Trp Leu Lys Asp Lys Asn Glu Trp Gln Gln Lys His Pro
165 170 175


Glu Phe Met Gln Phe Tyr Asn Gly Pro Tyr Gln Asn Phe Leu Lys Leu
180 185 190


Cys Asp Asp Asp Arg Ile Thr Ser Gln Leu Ala Ala Glu Gln Gln Pro
195 200 205


Thr Ala Ser Lys Asn Asn Arg Pro Arg Lys Thr Gly Lys Arg Phe Ala
210 215 220


Arg Trp His Leu Trp Tyr Lys Trp Leu Ser Glu Asn Pro Glu Ile Ile
225 230 235 240


Glu Trp Arg Asn Lys Ala Ser Ala Ser Asp Phe Lys Thr Val Thr Asp
245 250 255


Asp Val Arg Lys Gln Ile Ile Thr Lys Tyr Pro Gln Gln Asn Lys Tyr
260 265 270


Ile Thr Arg Leu Leu Asp Trp Leu Glu Asp Asn Asn Pro Glu Leu Lys
275 280 285


Thr Leu Glu Asn Leu Arg Arg Thr Tyr Val Lys Lys Phe Asp Ser Phe
290 295 300


Lys Arg Pro Pro Thr Leu Thr Leu Pro Ser Pro Tyr Arg His Pro Tyr
305 310 315 320


Trp Phe Thr Met Glu Leu Asp Gln Phe Tyr Lys Lys Ala Asp Phe Glu
325 330 335


Asn Gly Thr Ile Gln Leu Leu Leu Ile Asp Glu Asp Asp Asp Gly Asn
340 345 350


Trp Phe Phe Asn Trp Met Pro Ala Ser Leu Lys Pro Asp Pro Arg Leu
355 360 365


Val Pro Ser Trp Arg Ala Glu Thr Phe Glu Thr Glu Gly Arg Phe Pro
370 375 380


Pro Tyr Leu Gly Gly Lys Ile Gly Lys Lys Leu Ser Arg Pro Ala Pro
385 390 395 400


Thr Asp Ala Glu Arg Lys Ala Gly Ile Ala Gly Ala Lys Leu Met Ile
405 410 415


Lys Asn Asn Arg Ser Glu Leu Leu Phe Thr Val Phe Glu Gln Asp Cys
420 425 430


Pro Pro Arg Val Lys Trp Ala Lys Thr Lys Asn Arg Lys Cys Pro Ala
435 440 445


Asp Asn Ala Phe Ser Ser Asp Gly Lys Thr Arg Lys Pro Leu Arg Ile
450 455 460


Leu Ser Ile Asp Leu Gly Ile Arg His Ile Gly Ala Phe Ala Leu Thr
465 470 475 480


Gln Gly Thr Arg Asn Asp Ser Ala Trp Gln Thr Glu Ser Leu Lys Lys
485 490 495


Gly Ile Ile Asn Ser Pro Ser Ile Pro Pro Leu Arg Gln Val Arg Arg
500 505 510


His Asp Tyr Asp Leu Lys Arg Lys Arg Arg Arg His Gly Lys Pro Val
515 520 525


Lys Gly Gln Arg Ser Asn Ala Asn Leu Gln Ala His Arg Thr Asn Met
530 535 540


Ala Gln Asp Arg Phe Lys Lys Gly Ala Ser Ala Ile Val Ser Leu Ala
545 550 555 560


Arg Glu His Ser Ala Asp Leu Ile Leu Phe Glu Asn Leu His Ser Leu
565 570 575


Lys Phe Ser Ala Phe Asp Glu Arg Trp Met Asn Arg Gln Leu Arg Asp
580 585 590


Met Asn Arg Arg His Ile Val Glu Leu Val Ser Glu Gln Ala Pro Glu
595 600 605


Phe Gly Ile Thr Val Lys Asp Asp Ile Asn Pro Trp Met Thr Ser Arg
610 615 620


Ile Cys Ser Asn Cys Asn Leu Pro Gly Phe Arg Phe Ser Met Lys Lys
625 630 635 640


Lys Asn Pro Tyr Arg Glu Lys Leu Pro Arg Glu Lys Cys Thr Asp Phe
645 650 655


Gly Tyr Pro Val Trp Glu Pro Gly Gly His Leu Phe Arg Cys Pro His
660 665 670


Cys Asp His Arg Val Asn Ala Asp Ile Asn Ala Ala Ala Asn Leu Ala
675 680 685


Asn Lys Phe Phe Gly Leu Gly Tyr Trp Asn Asn Gly Leu Lys Tyr Asp
690 695 700


Ala Glu Thr Lys Thr Phe Thr Val His Thr Asp Lys Lys Thr Pro Pro
705 710 715 720


Leu Ile Phe Lys Pro Arg Pro Gln Phe Asp Leu Trp Ala Asp Ser Val
725 730 735


Lys Thr Arg Lys Gln Leu Gly Pro Asp Pro Phe
740 745


<210> 533
<211> 743
<212> PRT
<213> Unknown

<220>
<223> Member of the phylum Planktomycetes

<400> 533

Met Ser Val Arg Ser Phe Gln Ala Arg Val Glu Cys Asp Lys Gln Thr
1 5 10 15


Met Glu His Leu Trp Arg Thr His Lys Val Phe Asn Glu Arg Leu Pro
20 25 30


Glu Ile Ile Lys Ile Leu Phe Lys Met Lys Arg Gly Glu Cys Gly Gln
35 40 45


Asn Asp Lys Gln Lys Ser Leu Tyr Lys Ser Ile Ser Gln Ser Ile Leu
50 55 60


Glu Ala Asn Ala Gln Asn Ala Asp Tyr Leu Leu Asn Ser Val Ser Ile
65 70 75 80


Lys Gly Trp Lys Pro Gly Thr Ala Lys Lys Tyr Arg Asn Ala Ser Phe
85 90 95


Thr Trp Ala Asp Asp Ala Ala Lys Leu Ser Ser Gln Gly Ile His Val
100 105 110


Tyr Asp Lys Lys Gln Val Leu Gly Asp Leu Pro Gly Met Met Ser Gln
115 120 125


Met Val Cys Arg Gln Ser Val Glu Ala Ile Ser Gly His Ile Glu Leu
130 135 140


Thr Lys Lys Trp Glu Lys Glu His Asn Glu Trp Leu Lys Glu Lys Glu
145 150 155 160


Lys Trp Glu Ser Glu Asp Glu His Lys Lys Tyr Leu Asp Leu Arg Glu
165 170 175


Lys Phe Glu Gln Phe Glu Gln Ser Ile Gly Gly Lys Ile Thr Lys Arg
180 185 190


Arg Gly Arg Trp His Leu Tyr Leu Lys Trp Leu Ser Asp Asn Pro Asp
195 200 205


Phe Ala Ala Trp Arg Gly Asn Lys Ala Val Ile Asn Pro Leu Ser Glu
210 215 220


Lys Ala Gln Ile Arg Ile Asn Lys Ala Lys Pro Asn Lys Lys Asn Ser
225 230 235 240


Val Glu Arg Asp Glu Phe Phe Lys Ala Asn Pro Glu Met Lys Ala Leu
245 250 255


Asp Asn Leu His Gly Tyr Tyr Glu Arg Asn Phe Val Arg Arg Arg Lys
260 265 270


Thr Lys Lys Asn Pro Asp Gly Phe Asp His Lys Pro Thr Phe Thr Leu
275 280 285


Pro His Pro Thr Ile His Pro Arg Trp Phe Val Phe Asn Lys Pro Lys
290 295 300


Thr Asn Pro Glu Gly Tyr Arg Lys Leu Ile Leu Pro Lys Lys Ala Gly
305 310 315 320


Asp Leu Gly Ser Leu Glu Met Arg Leu Leu Thr Gly Glu Lys Asn Lys
325 330 335


Gly Asn Tyr Pro Asp Asp Trp Ile Ser Val Lys Phe Lys Ala Asp Pro
340 345 350


Arg Leu Ser Leu Ile Arg Pro Val Lys Gly Arg Arg Val Val Arg Lys
355 360 365


Gly Lys Glu Gln Gly Gln Thr Lys Glu Thr Asp Ser Tyr Glu Phe Phe
370 375 380


Asp Lys His Leu Lys Lys Trp Arg Pro Ala Lys Leu Ser Gly Val Lys
385 390 395 400


Leu Ile Phe Pro Asp Lys Thr Pro Lys Ala Ala Tyr Leu Tyr Phe Thr
405 410 415


Cys Asp Ile Pro Asp Glu Pro Leu Thr Glu Thr Ala Lys Lys Ile Gln
420 425 430


Trp Leu Glu Thr Gly Asp Val Thr Lys Lys Gly Lys Lys Arg Lys Lys
435 440 445


Lys Val Leu Pro His Gly Leu Val Ser Cys Ala Val Asp Leu Ser Met
450 455 460


Arg Arg Gly Thr Thr Gly Phe Ala Thr Leu Cys Arg Tyr Glu Asn Gly
465 470 475 480


Lys Ile His Ile Leu Arg Ser Arg Asn Leu Trp Val Gly Tyr Lys Glu
485 490 495


Gly Lys Gly Cys His Pro Tyr Arg Trp Thr Glu Gly Pro Asp Leu Gly
500 505 510


His Ile Ala Lys His Lys Arg Glu Ile Arg Ile Leu Arg Ser Lys Arg
515 520 525


Gly Lys Pro Val Lys Gly Glu Glu Ser His Ile Asp Leu Gln Lys His
530 535 540


Ile Asp Tyr Met Gly Glu Asp Arg Phe Lys Lys Ala Ala Arg Thr Ile
545 550 555 560


Val Asn Phe Ala Leu Asn Thr Glu Asn Ala Ala Ser Lys Asn Gly Phe
565 570 575


Tyr Pro Arg Ala Asp Val Leu Leu Leu Glu Asn Leu Glu Gly Leu Ile
580 585 590


Pro Asp Ala Glu Lys Glu Arg Gly Ile Asn Arg Ala Leu Ala Gly Trp
595 600 605


Asn Arg Arg His Leu Val Glu Arg Val Ile Glu Met Ala Lys Asp Ala
610 615 620


Gly Phe Lys Arg Arg Val Phe Glu Ile Pro Pro Tyr Gly Thr Ser Gln
625 630 635 640


Val Cys Ser Lys Cys Gly Ala Leu Gly Arg Arg Tyr Ser Ile Ile Arg
645 650 655


Glu Asn Asn Arg Arg Glu Ile Arg Phe Gly Tyr Val Glu Lys Leu Phe
660 665 670


Ala Cys Pro Asn Cys Gly Tyr Cys Ala Asn Ala Asp His Asn Ala Ser
675 680 685


Val Asn Leu Asn Arg Arg Phe Leu Ile Glu Asp Ser Phe Lys Ser Tyr
690 695 700


Tyr Asp Trp Lys Arg Leu Ser Glu Lys Lys Gln Lys Glu Glu Ile Glu
705 710 715 720


Thr Ile Glu Ser Lys Leu Met Asp Lys Leu Cys Ala Met His Lys Ile
725 730 735


Ser Arg Gly Ser Ile Ser Lys
740


<210> 534
<211> 1119
<212> PRT
<213> Unknown

<220>
<223> Member of the Spirochaetes

<400> 534

Met Ser Phe Thr Ile Ser Tyr Pro Phe Lys Leu Ile Ile Lys Asn Lys
1 5 10 15


Asp Glu Ala Lys Ala Leu Leu Asp Thr His Gln Tyr Met Asn Glu Gly
20 25 30


Val Lys Tyr Tyr Leu Glu Lys Leu Leu Met Phe Arg Gln Glu Lys Ile
35 40 45


Phe Ile Gly Glu Asp Glu Thr Gly Lys Arg Ile Tyr Ile Glu Glu Thr
50 55 60


Glu Tyr Lys Lys Gln Ile Glu Glu Phe Tyr Leu Ile Lys Lys Thr Glu
65 70 75 80


Leu Gly Arg Asn Leu Thr Leu Thr Leu Asp Glu Phe Lys Thr Leu Met
85 90 95


Arg Glu Leu Tyr Ile Cys Leu Val Ser Ser Ser Met Glu Asn Lys Lys
100 105 110


Gly Phe Pro Asn Ala Gln Gln Ala Ser Leu Asn Ile Phe Ser Pro Leu
115 120 125


Phe Asp Ala Glu Ser Lys Gly Tyr Ile Leu Lys Glu Glu Asn Asn Asn
130 135 140


Ile Ser Leu Ile His Lys Asp Tyr Gly Lys Ile Leu Leu Lys Arg Leu
145 150 155 160


Arg Asp Asn Asn Leu Ile Pro Ile Phe Thr Lys Phe Thr Asp Ile Lys
165 170 175


Lys Ile Thr Ala Lys Leu Ser Pro Thr Ala Leu Asp Arg Met Ile Phe
180 185 190


Ala Gln Ala Ile Glu Lys Leu Leu Ser Tyr Glu Ser Trp Cys Lys Leu
195 200 205


Met Ile Lys Glu Arg Phe Asp Lys Glu Val Lys Ile Lys Glu Leu Glu
210 215 220


Asn Lys Cys Glu Asn Lys Gln Glu Arg Asp Lys Ile Phe Glu Ile Leu
225 230 235 240


Glu Lys Tyr Glu Glu Glu Arg Gln Lys Thr Phe Glu Gln Asp Ser Gly
245 250 255


Phe Ala Lys Lys Gly Lys Phe Tyr Ile Thr Gly Arg Met Leu Lys Gly
260 265 270


Phe Asp Glu Ile Lys Glu Lys Trp Leu Lys Glu Lys Asp Arg Ser Glu
275 280 285


Gln Asn Leu Ile Asn Ile Leu Asn Lys Tyr Gln Thr Asp Asn Ser Lys
290 295 300


Leu Val Gly Asp Arg Asn Leu Phe Glu Phe Ile Ile Lys Leu Glu Asn
305 310 315 320


Gln Cys Leu Trp Asn Gly Asp Ile Asp Tyr Leu Lys Ile Lys Arg Asp
325 330 335


Ile Asn Lys Asn Gln Ile Trp Leu Asp Arg Pro Glu Met Pro Arg Phe
340 345 350


Thr Met Pro Asp Phe Lys Lys His Pro Leu Trp Tyr Arg Tyr Glu Asp
355 360 365


Pro Ser Asn Ser Asn Phe Arg Asn Tyr Lys Ile Glu Val Val Lys Asp
370 375 380


Glu Asn Tyr Ile Thr Ile Pro Leu Ile Thr Glu Arg Asn Asn Glu Tyr
385 390 395 400


Phe Glu Glu Asn Tyr Thr Phe Asn Leu Ala Lys Leu Lys Lys Leu Ser
405 410 415


Glu Asn Ile Thr Phe Ile Pro Lys Ser Lys Asn Lys Glu Phe Glu Phe
420 425 430


Ile Asp Ser Asn Asp Glu Glu Glu Asp Lys Lys Asp Gln Lys Lys Ser
435 440 445


Lys Gln Tyr Ile Lys Tyr Cys Asp Thr Ala Lys Asn Thr Ser Tyr Gly
450 455 460


Lys Ser Gly Gly Ile Arg Leu Tyr Phe Asn Arg Asn Glu Leu Glu Asn
465 470 475 480


Tyr Lys Asp Gly Lys Lys Met Asp Ser Tyr Thr Val Phe Thr Leu Ser
485 490 495


Ile Arg Asp Tyr Lys Ser Leu Phe Ala Lys Glu Lys Leu Gln Pro Gln
500 505 510


Ile Phe Asn Thr Val Asp Asn Lys Ile Thr Ser Leu Lys Ile Gln Lys
515 520 525


Lys Phe Gly Asn Glu Glu Gln Thr Asn Phe Leu Ser Tyr Phe Thr Gln
530 535 540


Asn Gln Ile Thr Lys Lys Asp Trp Met Asp Glu Lys Thr Phe Gln Asn
545 550 555 560


Val Lys Glu Leu Asn Glu Gly Ile Arg Val Leu Ser Val Asp Leu Gly
565 570 575


Gln Arg Phe Phe Ala Ala Val Ser Cys Phe Glu Ile Met Ser Glu Ile
580 585 590


Asp Asn Asn Lys Leu Phe Phe Asn Leu Asn Asp Gln Asn His Lys Ile
595 600 605


Ile Arg Ile Asn Asp Lys Asn Tyr Tyr Ala Lys His Ile Tyr Ser Lys
610 615 620


Thr Ile Lys Leu Ser Gly Glu Asp Asp Asp Leu Tyr Lys Glu Arg Lys
625 630 635 640


Ile Asn Lys Asn Tyr Lys Leu Ser Tyr Gln Glu Arg Lys Asn Lys Ile
645 650 655


Gly Ile Phe Thr Arg Gln Ile Asn Lys Leu Asn Gln Leu Leu Lys Ile
660 665 670


Ile Arg Asn Asp Glu Ile Asp Lys Glu Lys Phe Lys Glu Leu Ile Glu
675 680 685


Thr Thr Lys Arg Tyr Val Lys Asn Thr Tyr Asn Asp Gly Ile Ile Asp
690 695 700


Trp Asn Asn Val Asp Asn Lys Ile Leu Ser Tyr Glu Asn Lys Glu Asp
705 710 715 720


Val Ile Asn Leu His Lys Glu Leu Asp Lys Lys Leu Glu Ile Asp Phe
725 730 735


Lys Glu Phe Ile Arg Glu Cys Arg Lys Pro Ile Phe Arg Ser Gly Gly
740 745 750


Leu Ser Met Gln Arg Ile Asp Phe Leu Glu Lys Leu Asn Lys Leu Lys
755 760 765


Arg Lys Trp Val Ala Arg Thr Gln Lys Ser Ala Glu Ser Ile Val Leu
770 775 780


Thr Pro Lys Phe Gly Tyr Lys Leu Lys Glu His Ile Asn Glu Leu Lys
785 790 795 800


Asp Asn Arg Val Lys Gln Gly Val Asn Tyr Ile Leu Met Thr Ala Leu
805 810 815


Gly Tyr Ile Lys Asp Asn Glu Ile Lys Asn Asp Ser Lys Lys Lys Gln
820 825 830


Lys Glu Asp Trp Val Lys Lys Asn Arg Ala Cys Gln Ile Ile Leu Met
835 840 845


Glu Lys Leu Thr Glu Tyr Thr Phe Ala Glu Asp Arg Pro Arg Glu Glu
850 855 860


Asn Ser Lys Leu Arg Met Trp Ser His Arg Gln Ile Phe Asn Phe Leu
865 870 875 880


Gln Gln Lys Ala Ser Leu Trp Gly Ile Leu Val Gly Asp Val Phe Ala
885 890 895


Pro Tyr Thr Ser Lys Cys Leu Ser Asp Asn Asn Ala Pro Gly Ile Arg
900 905 910


Cys His Gln Val Thr Lys Lys Asp Leu Ile Asp Asn Ser Trp Phe Leu
915 920 925


Lys Ile Val Val Lys Asp Asp Ala Phe Cys Asp Leu Ile Glu Ile Asn
930 935 940


Lys Glu Asn Val Lys Asn Lys Ser Ile Lys Ile Asn Asp Ile Leu Pro
945 950 955 960


Leu Arg Gly Gly Glu Leu Phe Ala Ser Ile Lys Asp Gly Lys Leu His
965 970 975


Ile Val Gln Ala Asp Ile Asn Ala Ser Arg Asn Ile Ala Lys Arg Phe
980 985 990


Leu Ser Gln Ile Asn Pro Phe Arg Val Val Leu Lys Lys Asp Lys Asp
995 1000 1005


Glu Thr Phe His Leu Lys Asn Glu Pro Asn Tyr Leu Lys Asn Tyr
1010 1015 1020


Tyr Ser Ile Leu Asn Phe Val Pro Thr Asn Glu Glu Leu Thr Phe
1025 1030 1035


Phe Lys Val Glu Glu Asn Lys Asp Ile Lys Pro Thr Lys Arg Ile
1040 1045 1050


Lys Met Asp Lys His Glu Lys Glu Ser Thr Asp Glu Gly Asp Asp
1055 1060 1065


Tyr Ser Lys Asn Gln Ile Ala Leu Phe Arg Asp Asp Ser Gly Ile
1070 1075 1080


Phe Phe Asp Lys Ser Leu Trp Val Asp Gly Lys Ile Phe Trp Ser
1085 1090 1095


Val Val Lys Asn Lys Met Thr Lys Leu Leu Arg Glu Arg Asn Asn
1100 1105 1110


Lys Lys Asn Gly Ser Lys
1115


<210> 535
<211> 1447
<212> PRT
<213> Unknown

<220>
<223> Member of the phylum Verrucomicrobiaceae

<400> 535

Met Pro Leu Ser Arg Ile Tyr Gln Gly Arg Thr Asn Ser Leu Ile Ile
1 5 10 15


Leu Thr Pro Thr Pro Gln Glu Pro Trp Asp His Lys Ala Leu Ala Arg
20 25 30


Phe Asp Ser Pro Leu Trp Arg His His Ala Leu Phe Gln Asp Ala Val
35 40 45


Asn Tyr Tyr Gln Leu Cys Leu Val Ala Leu Ala Ser Ser Asp Gly Thr
50 55 60


Arg Pro Leu Ser Lys Leu His Glu Gln Met Lys Ala Ser Trp Asp Glu
65 70 75 80


Ala Lys Thr Asp Thr Glu Asp Ser Trp Arg Val Arg Leu Ala Arg Arg
85 90 95


Leu Gly Ile Pro Ala Ala Ser Leu Phe Glu Ala Ala Leu Ala Lys Val
100 105 110


Leu Glu Gly Asn Glu Ala Pro Glu Arg Ala Arg Glu Leu Ala Gly Glu
115 120 125


Leu Leu Leu Asp Lys Ile Glu Gly Asp Ile Gln Gln Ala Gly Arg Gly
130 135 140


Tyr Trp Pro Arg Phe Cys Asp Pro Lys Ala Asn Pro Thr Tyr Asp Tyr
145 150 155 160


Ser Ala Thr Ala Arg Ala Ser Ala Ser Gly Leu Thr Lys Leu Ala Ala
165 170 175


Val Ile His Ala Glu Asn Val Thr Glu Glu Ala Leu Lys Gln Val Ala
180 185 190


Ala Glu Met Asp Leu Ser Trp Thr Val Lys Leu Gln Pro Asp Lys Asn
195 200 205


Phe Val Gly Ala Glu Ala Arg Ala Arg Leu Leu Glu Ala Ala His His
210 215 220


Phe Ile Lys Val Ala Glu Ser Pro Pro Thr Lys Leu Ala Glu Val Leu
225 230 235 240


Ala Arg Phe Pro Asp Gly Leu Ala Leu Trp Gln Ala Leu Pro Glu Lys
245 250 255


Ile Ala Ala Leu Pro Glu Glu Thr Gln Val Pro Arg Asn Arg Lys Ala
260 265 270


Ser Pro Asp Leu Thr Phe Ala Thr Leu Leu Phe Gln His Phe Pro Ser
275 280 285


Leu Phe Thr Ala Ala Val Leu Gly Leu Ser Val Gly Lys Pro Lys Ser
290 295 300


Val Lys Ala Pro Lys Val Val Glu Lys Val Ser Ala Arg Arg Lys Ala
305 310 315 320


Asn Ala Val Thr Gln Ala Val Val Ile Glu Glu Pro Glu Ile Asp Phe
325 330 335


Ala Glu Leu Gly Asp Asp Pro Ile Lys Leu Ala Arg Gly Glu Arg Gly
340 345 350


Phe Val Phe Pro Ala Phe Thr Ser Leu Ser Phe Trp Ala Val Pro Gly
355 360 365


Pro His Val Pro Val Trp Lys Glu Phe Asp Ile Ala Ala Phe Lys Glu
370 375 380


Ala Leu Lys Thr Val Asn Gln Phe Lys Leu Lys Thr Ser Glu Arg Asn
385 390 395 400


Ala Leu Leu Ala Glu Ala Gln Arg Arg Leu Asp Tyr Met Asp Glu Lys
405 410 415


Thr His Asp Trp Lys Thr Gly Asp Ser Asp Glu Pro Gly His Ile Pro
420 425 430


Pro Arg Leu Lys Ser Asp Pro Asn Phe Thr Leu Ile Gln Ala Leu Thr
435 440 445


Gln Asp Glu Gly Val Ser Asn Lys Ala Thr Gly Asp Gln His Ile Pro
450 455 460


Lys Gly Val Tyr Thr Gly Gly Leu Arg Gly Phe Tyr Ala Ile Lys Lys
465 470 475 480


Asp Trp Cys Glu Leu Trp Glu Arg Lys Ala Asp Lys Ser Gln Gly Thr
485 490 495


Pro Thr Glu Glu Glu Leu Ile Ser Ile Val Thr Asp Tyr Gln Arg Asp
500 505 510


His Val Tyr Asp Val Gly Asp Val Gly Leu Phe Arg Ala Leu Cys Glu
515 520 525


Pro Arg Phe Trp Pro Leu Trp Gln Pro Leu Thr Asp Glu Gln Glu Ala
530 535 540


Glu Arg Ile Lys Ala Gly Arg Ala Lys Asp Met Ile Ser Ala Tyr Arg
545 550 555 560


Val Trp Leu Glu Leu Gln Glu Asp Val Val Arg Leu Ala Gln Pro Ile
565 570 575


Arg Phe Thr Pro Ala His Ala Glu Asn Ser Arg Arg Leu Phe Met Phe
580 585 590


Ser Asp Ile Ser Gly Ser His Gly Ala Glu Phe Gly Ser Asp Gly Lys
595 600 605


Ser Leu Glu Val Ser Ile Ala Tyr Asp Val Asp Gly Lys Leu Gln Pro
610 615 620


Val Arg Ala Lys Leu Glu Phe Ser Ala Pro Arg Ala Ala Arg Asp Glu
625 630 635 640


Leu Glu Gly Leu Ser Gly Gly Ser Glu Ser Met Arg Trp Phe Gln Pro
645 650 655


Met Met Lys Ala Leu Asp Cys Pro Glu Val Glu Met Pro Ala Leu Glu
660 665 670


Lys Cys Ala Val Ser Leu Met Pro Asp Val Val Lys Lys Gly Gly Gly
675 680 685


Lys Trp Val Arg Leu Leu Leu Asn Phe Pro Ala Thr Leu Glu Pro Glu
690 695 700


Gly Leu Ile Arg His Ile Gly Lys Gln Ala Met Trp Tyr Lys Gln Phe
705 710 715 720


Asn Gly Thr Tyr Lys Pro Arg Thr Gln Gln Leu Asp Thr Gly Leu His
725 730 735


Leu Tyr Trp Pro Gly Leu Glu Lys Ala Pro Glu Ala Glu Asp Ala Ala
740 745 750


Ala Trp Trp Asn Arg Glu Glu Ile Arg Ala Lys Gly Phe Ser Val Leu
755 760 765


Ser Val Asp Leu Gly Gln Arg Asp Ala Gly Ala Trp Ala Leu Leu Glu
770 775 780


Ser Arg Ser Asp Lys Ala Phe Ser Arg Asn Arg Gln Pro Phe Ile Glu
785 790 795 800


Leu Gly Glu Ala Gly Gly Lys Leu Trp Ser Thr Ala Leu Leu Gly Leu
805 810 815


Gly Met Leu Arg Leu Pro Gly Glu Asp Ala Arg Thr Gly Ala Leu Asp
820 825 830


Asp Gln Gly Lys Arg Ala Val Glu Phe His Gly Lys Ala Gly Arg Asn
835 840 845


Ala Leu Glu Ala Glu Trp Gln Glu Ala Arg Glu Met Ala Leu Leu Phe
850 855 860


Gly Gly Glu Glu Ala Lys Ser Arg Leu Gly Pro Gly Phe Asp His Leu
865 870 875 880


Ser His Ser Lys Gln Asn Glu Glu Leu Leu Arg Ile Leu Ser Arg Ala
885 890 895


Gln Ser Arg Leu Ala Arg Phe His Arg Trp Ser Cys Arg Ile His Glu
900 905 910


Lys Pro Glu Ala Thr Gly Asp Asp Val Ile Asp Tyr Gly Gln Val Asp
915 920 925


Glu Leu Leu Thr Lys Thr Ala Glu Ala Met Leu Glu Asn Leu Lys Ala
930 935 940


Leu Tyr Thr Asn Ala Gly Gly Ile Leu Asp Ser Lys Ser Lys Gln Pro
945 950 955 960


Leu Thr Leu Val Gly Leu Arg Lys Lys Leu Glu Ala Gln Lys Val Glu
965 970 975


Pro Glu Lys Ile Ala Ala Val Leu Lys Pro His Ala Glu Ile Ile Phe
980 985 990


Gln Arg Leu Gly Thr Leu Ile Pro Glu Leu Lys Gln His Leu Arg Val
995 1000 1005


Ser Leu Glu Arg Leu Ala Asn Arg Glu Leu Pro Leu Arg His Arg
1010 1015 1020


Glu Trp Val Trp Asn Glu Ala Phe Glu Lys Leu Glu Gln Gly Asn
1025 1030 1035


Phe Lys Lys Glu Glu Asn Pro Lys Trp Ile Arg Gly Gln Arg Gly
1040 1045 1050


Leu Ser Met Ala Arg Ile Glu Gln Ile Glu Asn Leu Arg Lys Arg
1055 1060 1065


Phe Met Ser Leu Arg Arg Gln Met Ser Leu Ile Pro Gly Glu Gln
1070 1075 1080


Val Lys Gln Gly Val Glu Asp Lys Gly Gln Arg Gln Pro Glu Pro
1085 1090 1095


Cys Glu Asp Ile Leu Asn Lys Leu Asp Arg Met Lys Gln Gln Arg
1100 1105 1110


Val Asn Gln Thr Ala His Leu Ile Leu Ala Gln Ala Leu Gly Leu
1115 1120 1125


Arg Leu Arg Pro His Leu Ala Asn Asp Ala Glu Arg Glu Glu Lys
1130 1135 1140


Asp Ile His Gly Glu Tyr Glu Leu Ile Pro Gly Arg Lys Pro Val
1145 1150 1155


Asp Phe Ile Val Met Glu Asp Leu Ser Arg Tyr Leu Ser Ser Gln
1160 1165 1170


Gly Arg Ala Pro Ser Glu Asn Gly Arg Leu Met Lys Trp Cys His
1175 1180 1185


Arg Ala Val Leu Ala Lys Leu Lys Gln Met Cys Glu Pro Phe Gly
1190 1195 1200


Ile Pro Val Leu Glu Val Pro Ala Ala Tyr Ser Ser Arg Phe Cys
1205 1210 1215


Ala Leu Thr Gly Val Pro Gly Phe Arg Ala Val Glu Val His Asp
1220 1225 1230


Gly Asn Ala Glu Asp Phe Arg Trp Lys Arg Leu Ile Lys Lys Ala
1235 1240 1245


Glu Lys Asp Lys Ser Ser Lys Asp Ala Glu Ala Ala Ala Met Leu
1250 1255 1260


Phe Asp Gln Leu His Asp Leu Asn Ile Glu Ala Arg Glu Ala Arg
1265 1270 1275


Lys Gln Asp Lys Lys Leu Pro Leu Arg Thr Leu Phe Ala Pro Val
1280 1285 1290


Ala Gly Gly Pro Leu Phe Ile Pro Met Val Gly Gly Gly Pro Arg
1295 1300 1305


Gln Ala Asp Met Asn Ala Ala Ile Asn Leu Gly Leu Arg Ala Ile
1310 1315 1320


Ala Ser Pro Thr Cys Leu Arg Ala Arg Pro Lys Ile Arg Ala Glu
1325 1330 1335


Leu Lys Asp Gly Lys His Gln Ala Met Leu Gly Asn Lys Leu Glu
1340 1345 1350


Lys Ala Ala Ala Leu Thr Leu Glu Pro Pro Lys Glu Pro Thr Lys
1355 1360 1365


Glu Leu Ala Ala Gln Lys Arg Thr Asn Phe Phe Leu Asp Glu Lys
1370 1375 1380


Phe Val Gly Lys Phe Asp Thr Ala His Val Thr Thr Ser Gly Lys
1385 1390 1395


Lys Leu Arg Leu Ser Gly Gly Met Ser Leu Trp Lys Ala Ile Lys
1400 1405 1410


Asp Gly Ala Trp Gln Arg Val Lys Lys Ile Asn Asp Ala Arg Ile
1415 1420 1425


Ala Lys Trp Lys Asn Asn Pro Pro Pro Glu Pro Asp Pro Asp Asp
1430 1435 1440


Glu Ile Gln Phe
1445


<210> 536
<211> 25
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 536
uagaugaauu aaaugugauu agcac 25


<210> 537
<211> 80
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 537
uuugccuaaa gggcaaagaa uacugugcgu gugcuaagga uggaaaaaau ccauucaacc 60

acaggauuac auuauuuauc 80


<210> 538
<211> 105
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 538
uuugccuaaa gggcaaagaa uacugugcgu gugcuaagga uggaaaaaau ccauucaacc 60

acaggauuac auuauuuauc aaaagaugaa uaaugugauu agcac 105


<210> 539
<211> 25
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 539
agcgagcggu cugagaagug gcacu 25


<210> 540
<211> 89
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 540
gucgucuaua ggacggcgag gacaacggga agugccaaug ugcucuuucc aagagcaaac 60

accccguugg cuucaagaug accgcucgc 89


<210> 541
<211> 113
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 541
gucgucuaua ggacggcgag gacaacggga agugccaaug ugcucuuucc aagagcaaac 60

accccguugg cuucucagac cgcucgaaaa cgagcggucu gagaaguggc acu 113


<210> 542
<211> 23
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 542
gcagaaauaa ugaugauugg cac 23


<210> 543
<211> 78
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 543
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggauuaucuu auuucugc 78


<210> 544
<211> 104
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 544
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggauuaucuu auuucugcaa aagcagaaau aagaugauug gcac 104


<210> 545
<211> 194
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 545
ucagccaaca ugcucgcuuu gcgaaggcug acggcccgcu cucauuuggc auugccggga 60

gccggaguuu ucggaagaga gugucgacga cugcugaucu ccgcauccgc guccuguucg 120

ccaggccggg ucggguguac ggaucaugcu ggcagcaguc uacgccgaga acauucgcua 180

ccgcgaaugg acac 194


<210> 546
<211> 194
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 546
guggaguaag gucggaguaa cgaccgaacg uuuagcgugc uauaggccgc ugaaugccac 60

acagcgaugu guuuugagug ucaauagcug cugacccaaa ggccaaaagc cgaguagggc 120

uugacugaug cgguuuauau cgcacauagg cggcaguaac acauaucgcg ucaaucaaau 180

uuauugaugg acac 194


<210> 547
<211> 21
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 547
gggcgaucug agaaguggca c 21


<210> 548
<211> 29
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 548
cguugagcgg gcgaucugag aaguggcac 29


<210> 549
<211> 36
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 549
gucggaucgu ugagcgggcg aucugagaag uggcac 36


<210> 550
<211> 41
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 550
cgatctgaga agtggcacga gaagtcattt aataaggcca c 41


<210> 551
<211> 32
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 551
ccgaucuaua ggacggcaga uucaacggga ug 32


<210> 552
<211> 38
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 552
ccgaucuaua ggacggcaga uucaacggga ugugccaa 38


<210> 553
<211> 61
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 553
ccgaucuaua ggacggcaga uucaacggga ugugccaaug cacucuuucc aggagugaac 60

a 61


<210> 554
<211> 97
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 554
ccgaucuaua ggacggcaga uucaacggga ugugccaaug cacucuuucc aggagugaac 60

accccguugg cuucaacaug aucgcccgcu caacggu 97


<210> 555
<211> 59
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 555
ugccaaugca cucuuuccag gagugaacac cccguuggcu ucaacaugau cgcccgcuc 59


<210> 556
<211> 139
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 556
gccgaucuau aggacggcag auucaacggg augugccaau gcacucuuuc caggagugaa 60

caccccguug gcuucaacau gaucgcccgc ucaacggucc cuagucggau cguugagcgg 120

gcgaucugag aaguggcac 139


<210> 557
<211> 128
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 557
gccgaucuau aggacggcag auucaacggg augugccaau gcacucuuuc caggagugaa 60

caccccguug gcuucaacau gaucgcccgc ucaacgcuac guugagcggg cgaucugaga 120

aguggcac 128


<210> 558
<211> 112
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 558
gccgaucuau aggacggcag auucaacggg augugccaau gcacucuuuc caggagugaa 60

caccccguug gcuucaacau gaucgccccu agggcgaucu gagaaguggc ac 112


<210> 559
<211> 20
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 559
augauacgag gcauuagcac 20


<210> 560
<211> 36
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 560
guccaagaaa aaagaaauga uacgaggcau uagcac 36


<210> 561
<211> 89
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 561
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuuuu 89


<210> 562
<211> 99
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 562
gagguucugu cuuuugguca ggacaaccgu cuagcuauaa gugcugcagg gugugagaaa 60

cuccuauugc uggacgaugu cucuacgagg cauuagcac 99


<210> 563
<211> 106
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 563
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuauga uacgaggcau uagcac 106


<210> 564
<211> 102
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 564
acgagguucu gucuuuuggu caggacaacc gucuagcuau aagugcugca gggugugaga 60

aacuccuauu gcuggacgau gucucuuacg aggcauuagc ac 102


<210> 565
<211> 120
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (98)..(120)
<223> n = any nucleotide

<400> 565
gttctgtctt ttggtcagga caaccgtcta gctataagtg ctgcagggtg tgagaaactc 60

ctattgctgg acgacgcctc ttacgaggcg ttagcacnnn nnnnnnnnnn nnnnnnnnnn 120


<210> 566
<211> 1173
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 566

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15


Ala Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr
20 25 30


Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile
35 40 45


Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln
50 55 60


Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile
65 70 75 80


Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His
85 90 95


Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu
100 105 110


Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly
115 120 125


Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys
130 135 140


Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu
145 150 155 160


Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg
165 170 175


Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr
180 185 190


Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile
195 200 205


Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys
210 215 220


Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp
225 230 235 240


Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu
245 250 255


Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys
260 265 270


Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala
275 280 285


Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly
290 295 300


Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser
305 310 315 320


Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser
325 330 335


Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu
340 345 350


Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala
355 360 365


Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala
370 375 380


Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr
385 390 395 400


Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys
405 410 415


Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser
420 425 430


Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro
435 440 445


Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly
450 455 460


Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp
465 470 475 480


Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys
485 490 495


Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe
500 505 510


Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg
515 520 525


Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe
530 535 540


Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn
545 550 555 560


Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly
565 570 575


Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val
580 585 590


Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys
595 600 605


Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg
610 615 620


Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys
625 630 635 640


Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln
645 650 655


Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro
660 665 670


Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser
675 680 685


Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu
690 695 700


Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu
705 710 715 720


Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile
725 730 735


Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala
740 745 750


Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu
755 760 765


Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg
770 775 780


Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln
785 790 795 800


Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met
805 810 815


Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys
820 825 830


Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn
835 840 845


Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser
850 855 860


Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met
865 870 875 880


Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr
885 890 895


Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His
900 905 910


Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg
915 920 925


Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys
930 935 940


Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu
945 950 955 960


Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile
965 970 975


His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln
980 985 990


Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly
995 1000 1005


Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys
1010 1015 1020


Lys Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln
1025 1030 1035


Glu Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr
1040 1045 1050


Asp Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile
1055 1060 1065


Ser Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu
1070 1075 1080


Thr Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr
1085 1090 1095


Trp Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile
1100 1105 1110


Lys Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu
1115 1120 1125


Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1130 1135 1140


Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr
1145 1150 1155


Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1160 1165 1170


<210> 567
<211> 127
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (105)..(127)
<223> n = any nucleotide

<400> 567
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggauuaucuu auuucugcaa aagcagaaau aagaugauug gcacnnnnnn nnnnnnnnnn 120

nnnnnnn 127


<210> 568
<211> 130
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (108)..(130)
<223> n = any nucleotide

<400> 568
ggugaccuau agggucaaug aaucugugcg ugugccauaa guaauuaaaa auuacccacc 60

acaggauuau cuuauuucug caaaagcaga aauaagauga uuggcacnnn nnnnnnnnnn 120

nnnnnnnnnn 130


<210> 569
<211> 124
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (102)..(124)
<223> n = any nucleotide

<400> 569
cuauaggguc aaugaaucug ugcgugugcc auaaguaauu aaaaauuacc caccacagga 60

uuaucuuauu ucugcaaaag cagaaauaag augauuggca cnnnnnnnnn nnnnnnnnnn 120

nnnn 124


<210> 570
<211> 111
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (89)..(111)
<223> n = any nucleotide

<400> 570
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggaucaucuu aaaaaagaug auuggcacnn nnnnnnnnnn nnnnnnnnnn n 111


<210> 571
<211> 121
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (99)..(121)
<223> n = any nucleotide

<400> 571
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggaucaucuu auuucaaaag aaauaagaug auuggcacnn nnnnnnnnnn nnnnnnnnnn 120

n 121


<210> 572
<211> 111
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (89)..(111)
<223> n = any nucleotide

<400> 572
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60

ggagcaccug aaaacaggug cuuggcacnn nnnnnnnnnn nnnnnnnnnn n 111


<210> 573
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 573
cccttcagct aaaataaagg agg 23


<210> 574
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 574
ggctcagcag gcacctgcct cag 23


<210> 575
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 575
acgtactgat gttaacagct gac 23


<210> 576
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 576
gggactggag ttgcttcatg tac 23


<210> 577
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 577
ctgacctccc aaacagctac ata 23


<210> 578
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 578
ttcatggaga aaatattcag aat 23


<210> 579
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 579
tctccatgaa aaatactggg gtc 23


<210> 580
<211> 9041
<212> DNA
<213> Bacillus species

<400> 580
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 60

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 780

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 840

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 900

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 960

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1020

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1080

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1140

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1200

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1260

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1320

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1380

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1440

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1500

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1560

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1620

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1680

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1740

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1800

gaaaagtgcc acctgacgtc gacggatcgg gagatctccc gatcccctat ggtgcactct 1860

cagtacaatc tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt 1920

ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga 1980

caattgcatg aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc 2040

cagatatacg cgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 2100

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 2160

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 2220

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 2280

cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 2340

taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 2400

gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 2460

tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 2520

tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 2580

cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctct 2640

ctggctaact agagaaccca ctgcttactg gcttatcgaa attaatacga ctcactatag 2700

ggagacccaa gctggctagc gtttaaactt aagcttgcca ccatggcccc aaagaagaag 2760

cggaaggtcg gtatccacgg agtcccagca gccggatccg ccgtgaagtc catcaaagtg 2820

aagctgcggc tgagcgagtg ccccgatatt ctggctggaa tgtggcagct gcacagagcc 2880

acaaatgccg gcgtgcggta ctacacagaa tgggtgtccc tgatgcggca agagatcctg 2940

tacagcagag gccctgatgg cggccagcag tgttatatga ccgccgagga ttgccagaga 3000

gagctgctgc ggagactgcg gaatagacag ctgcataacg gccggcagga tcagcctgga 3060

acagatgctg atctgctggc catcagcaga cggctgtacg agattctggt gctgcagagc 3120

atcggcaaaa gaggcgacgc ccagcagatt gccagcagct ttctgagccc tctggtggac 3180

cccaacagca aaggtggaag aggcgaggcc aagagcggaa gaaaacctgc ctggcagaag 3240

atgcgcgacc agggcgatcc tagatgggtt gccgctagag agaagtacga gcagcggaag 3300

gccgtggatc ccagcaaaga gattctgaac agcctggacg ccctgggcct cagacctctg 3360

tttgccgtgt tcaccgagac atacagatcc ggcgtggact ggaagcctct gggcaaatct 3420

cagggcgtca gaacctggga cagagacatg tttcagcagg ccctggaacg gctgatgagc 3480

tgggagagct ggaatcggag agtgggcgaa gagtacgcca gactgttcca gcagaaaatg 3540

aagttcgagc aagagcactt cgccgagcag agccacctgg tcaaactggc tagagccctg 3600

gaagccgata tgagagccgc ctctcagggc ttcgaggcca aaagaggaac agcccaccag 3660

atcaccagaa gggcactgag aggggccgac agagtgttcg agatctggaa gtctatcccc 3720

gaggaagccc tgttcagcca gtacgacgaa gtgatcagac aggtgcaggc cgagaagcgg 3780

agagatttcg gcagccatga cctgttcgcc aagctggccg agcctaagta tcagcccctt 3840

tggagagccg acgagacatt cctgaccaga tacgccctgt acaacggcgt gctgcgcgat 3900

ctggaaaagg ccagacagtt cgccaccttc acactgcctg atgcctgcgt gaaccccatc 3960

tggaccagat tcgagtctag ccagggcagc aacctgcaca aatacgagtt tctgttcgac 4020

cacctcggac ctggcagaca cgccgtcaga tttcagagac tgctggtggt ggaaagcgag 4080

ggcgccaaag aaagggatag cgtggtggtg cctgtggctc cttctggcca actggataag 4140

ctggtgctga gggaagaaga gaagtccagc gtcgccctgc atctgcacga taccgctaga 4200

cccgatggct tcatggctga atgggctggc gccaaactgc agtacgagag aagcaccctg 4260

gccagaaaag ccagacggga caagcagggc atgagaagct ggcggagaca gccctccatg 4320

ctgatgtctg ccgctcagat gctggaagat gccaaacagg ctggcgacgt gtacctgaac 4380

atcagcgtgc gcgtgaagtc tcccagtgaa gtgcgaggac agaggcggcc tccttacgcc 4440

gctctgttta gaatcgacga caagcagcgg agagtgaccg tgaactacaa caagctgagc 4500

gcctacctgg aagaacaccc cgataagcag atccctggcg ctcctggact gctgtctgga 4560

ctgagagtga tgtccgtgga cctgggcctg agaacaagcg ccagcatctc cgtgttcaga 4620

gtggccaaga aagaagaggt ggaagccctc ggagatggcc ggcctcctca ctactatcct 4680

atccacggca ccgatgacct ggtggccgtg cacgaaagat cccacctgat tcagatgccc 4740

ggcgaaaccg agacaaagca gctgcggaag ctgagagaag aacggcaggc cgtgctgagg 4800

ccactgtttg ctcaactggc actgctgaga ctgctcgtca gatgtggcgc cgctgacgag 4860

agaatcagaa ccagatcctg gcagcggctg accaagcagg gaagagagtt caccaagaga 4920

ctgaccccta gctggcgcga ggctctggaa ctggaactga caagactcga ggcctactgc 4980

ggcagagtgc ccgatgatga gtggtccaga atcgtggaca gaaccgtgat tgccctgtgg 5040

cggagaatgg gcaagcaagt gcgcgattgg cggaagcaag tgaagtccgg ggccaaagtg 5100

aaagtgaagg gctaccagct ggatgtcgtc ggcggaaatt ctctggccca gatcgactat 5160

ctggaacagc agtacaagtt cctgcggcgt tggagcttct tcgccagagc ttctggcctg 5220

gtcgtgcggg ccgatagaga aagccatttt gccgtggctc tgagacagca catcgagaac 5280

gccaagcggg acagactgaa gaaactggcc gaccggatcc tgatggaagc actgggctat 5340

gtgtacgagg ccagcggacc tagagaaggc cagtggacag ctcagcaccc tccttgccag 5400

ctgatcattc tcgaggaact gtccgcctac cggttcagcg acgatagacc tcctagcgag 5460

aacagcaaac tgatggcctg gggccacaga ggcatcctcg aagaactggt caaccaggct 5520

caggtgcacg atgtgctcgt gggcacagtg tacgccgcct tcagcagcag attcgacgct 5580

agaacaggtg ctcccggcgt cagatgcaga agagtgcctg ccagatttgt gggcgccacc 5640

gtggatgatt ctctgccact gtggctgacc gagttcctgg acaagcaccg gctggataag 5700

aacctgctgc ggcccgacga tgtgatccca acaggcgaag gcgaattcct ggtgtcccct 5760

tgtggcgaag aggctgccag agttagacag gttcacgccg acatcaacgc tgcccagaac 5820

ctgcagagaa ggctgtggca gaacttcgac atcaccgagc tgaggctgag atgcgacgtg 5880

aagatgggcg gagagggaac agtgctggtg cccagagtga acaacgccag agccaagcag 5940

ctgttcggca agaaggtgct ggtttcccag gacggcgtga ccttcttcga gagatctcag 6000

acaggcggca agccccacag cgagaagcag accgatctga ccgacaaaga actcgagctg 6060

atcgccgagg ccgatgaggc cagagctaaa agcgtggtgc tgttcaggga tcctagcggc 6120

cacattggca aaggccactg gatccggcag cgcgagtttt ggagtctggt caagcagagg 6180

atcgagagcc acaccgccga gcggattaga gttagaggcg tgggaagctc cctggacgga 6240

tccaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa gggatcttac 6300

ccatacgatg ttccagatta cgcttatccc tacgacgtgc ctgattatgc atacccatat 6360

gatgtccccg actatgccta agaattctgc agatatccag cacagtggcg gccgctcgag 6420

tctagagggc ccgtttaaac ccgctgatca gcctcgactg tgccttctag ttgccagcca 6480

tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 6540

ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 6600

gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 6660

ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg 6720

tatccccacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 6780

gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 6840

ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 6900

cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 6960

agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 7020

aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 7080

gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 7140

aaatttaacg cgaattaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 7200

gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 7260

gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 7320

caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 7380

attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctctg 7440

cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 7500

agctcccggg agcttgtata tccattttcg gatctgatca agagacagga tgaggatcgt 7560

ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 7620

tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 7680

tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 7740

aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 7800

ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 7860

ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 7920

caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 7980

atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 8040

acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 8100

ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 8160

aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 8220

aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 8280

gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 8340

ttcttgacga gttcttctga gcgggactct ggggttcgaa atgaccgacc aagcgacgcc 8400

caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 8460

aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 8520

cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 8580

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 8640

catcaatgta tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc 8700

atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 8760

agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 8820

tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 8880

aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 8940

cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 9000

ggtaatacgg ttatccacag aatcagggga taacgcagga a 9041


<210> 581
<211> 8924
<212> DNA
<213> Bacillus hisashii

<400> 581
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 60

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 780

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 840

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 900

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 960

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1020

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1080

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1140

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1200

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1260

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1320

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1380

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1440

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1500

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1560

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1620

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1680

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1740

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1800

gaaaagtgcc acctgacgtc gacggatcgg gagatctccc gatcccctat ggtgcactct 1860

cagtacaatc tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt 1920

ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga 1980

caattgcatg aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc 2040

cagatatacg cgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 2100

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 2160

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 2220

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 2280

cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 2340

taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 2400

gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 2460

tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 2520

tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 2580

cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctct 2640

ctggctaact agagaaccca ctgcttactg gcttatcgaa attaatacga ctcactatag 2700

ggagacccaa gctggctagc gtttaaactt aagcttgcca ccatggcccc aaagaagaag 2760

cggaaggtcg gtatccacgg agtcccagca gccggatccg ccaccagatc cttcatcctg 2820

aagatcgagc ccaacgagga agtgaagaaa ggcctctgga aaacccacga ggtgctgaac 2880

cacggaatcg cctactacat gaatatcctg aagctgatcc ggcaagaggc catctacgag 2940

caccacgagc aggaccccaa gaatcccaag aaggtgtcca aggccgagat ccaggccgag 3000

ctgtgggatt tcgtgctgaa gatgcagaag tgcaacagct tcacacacga ggtggacaag 3060

gacgaggtgt tcaacatcct gagagagctg tacgaggaac tggtgcccag cagcgtggaa 3120

aagaagggcg aagccaacca gctgagcaac aagtttctgt accctctggt ggaccccaac 3180

agccagtctg gaaagggaac agccagcagc ggcagaaagc ccagatggta caacctgaag 3240

attgccggcg atccctcctg ggaagaagag aagaagaagt gggaagaaga taagaaaaag 3300

gacccgctgg ccaagatcct gggcaagctg gctgagtacg gactgatccc tctgttcatc 3360

ccctacaccg acagcaacga gcccatcgtg aaagaaatca agtggatgga aaagtcccgg 3420

aaccagagcg tgcggcggct ggataaggac atgttcattc aggccctgga acggttcctg 3480

agctgggaga gctggaacct gaaagtgaaa gaggaatacg agaaggtcga gaaagagtac 3540

aagaccctgg aagagaggat caaagaggac atccaggctc tgaaggctct ggaacagtat 3600

gagaaagagc ggcaagaaca gctgctgcgg gacaccctga acaccaacga gtaccggctg 3660

agcaagagag gccttagagg ctggcgggaa atcatccaga aatggctgaa aatggacgag 3720

aacgagccct ccgagaagta cctggaagtg ttcaaggact accagcggaa gcaccctaga 3780

gaggccggcg attacagcgt gtacgagttc ctgtccaaga aagagaacca cttcatctgg 3840

cggaatcacc ctgagtaccc ctacctgtac gccaccttct gcgagatcga caagaaaaag 3900

aaggacgcca agcagcaggc caccttcaca ctggccgatc ctatcaatca ccctctgtgg 3960

gtccgattcg aggaaagaag cggcagcaac ctgaacaagt acagaatcct gaccgagcag 4020

ctgcacaccg agaagctgaa gaaaaagctg acagtgcagc tggaccggct gatctaccct 4080

acagaatctg gcggctggga agagaagggc aaagtggaca ttgtgctgct gcccagccgg 4140

cagttctaca accagatctt cctggacatc gaggaaaagg gcaagcacgc cttcacctac 4200

aaggatgaga gcatcaagtt ccctctgaag ggcacactcg gcggagccag agtgcagttc 4260

gacagagatc acctgagaag ataccctcac aaggtggaaa gcggcaacgt gggcagaatc 4320

tacttcaaca tgaccgtgaa catcgagcct acagagtccc cagtgtccaa gtctctgaag 4380

atccaccggg acgacttccc caaggtggtc aacttcaagc ccaaagaact gaccgagtgg 4440

atcaaggaca gcaagggcaa gaaactgaag tccggcatcg agtccctgga aatcggcctg 4500

agagtgatga gcatcgacct gggacagaga caggccgctg ccgcctctat tttcgaggtg 4560

gtggatcaga agcccgacat cgaaggcaag ctgtttttcc caatcaaggg caccgagctg 4620

tatgccgtgc acagagccag cttcaacatc aagctgcccg gcgagacact ggtcaagagc 4680

agagaagtgc tgcggaaggc cagagaggac aatctgaaac tgatgaacca gaagctcaac 4740

ttcctgcgga acgtgctgca cttccagcag ttcgaggaca tcaccgagag agagaagcgg 4800

gtcaccaagt ggatcagcag acaagagaac agcgacgtgc ccctggtgta ccaggatgag 4860

ctgatccaga tccgcgagct gatgtacaag ccttacaagg actgggtcgc cttcctgaag 4920

cagctccaca agagactgga agtcgagatc ggcaaagaag tgaagcactg gcggaagtcc 4980

ctgagcgacg gaagaaaggg cctgtacggc atctccctga agaacatcga cgagatcgat 5040

cggacccgga agttcctgct gagatggtcc ctgaggccta ccgaacctgg cgaagtgcgt 5100

agactggaac ccggccagag attcgccatc gaccagctga atcacctgaa cgccctgaaa 5160

gaagatcggc tgaagaagat ggccaacacc atcatcatgc acgccctggg ctactgctac 5220

gacgtgcgga agaagaaatg gcaggctaag aaccccgcct gccagatcat cctgttcgag 5280

gatctgagca actacaaccc ctacgaggaa aggtcccgct tcgagaacag caagctcatg 5340

aagtggtcca gacgcgagat ccccagacag gttgcactgc agggcgagat ctatggcctg 5400

caagtgggag aagtgggcgc tcagttcagc agcagattcc acgccaagac aggcagccct 5460

ggcatcagat gtagcgtcgt gaccaaagag aagctgcagg acaatcggtt cttcaagaat 5520

ctgcagagag agggcagact gaccctggac aaaatcgccg tgctgaaaga gggcgatctg 5580

tacccagaca aaggcggcga gaagttcatc agcctgagca aggatcggaa gtgcgtgacc 5640

acacacgccg acatcaacgc cgctcagaac ctgcagaagc ggttctggac aagaacccac 5700

ggcttctaca aggtgtactg caaggcctac caggtggacg gccagaccgt gtacatccct 5760

gagagcaagg accagaagca gaagatcatc gaagagttcg gcgagggcta cttcattctg 5820

aaggacgggg tgtacgaatg ggtcaacgcc ggcaagctga aaatcaagaa gggcagctcc 5880

aagcagagca gcagcgagct ggtggatagc gacatcctga aagacagctt cgacctggcc 5940

tccgagctga aaggcgaaaa gctgatgctg tacagggacc ccagcggcaa tgtgttcccc 6000

agcgacaaat ggatggccgc tggcgtgttc ttcggaaagc tggaacgcat cctgatcagc 6060

aagctgacca accagtactc catcagcacc atcgaggacg acagcagcaa gcagtctatg 6120

ggatccaaaa ggccggcggc cacgaaaaag gccggccagg caaaaaagaa aaagggatct 6180

tacccatacg atgttccaga ttacgcttat ccctacgacg tgcctgatta tgcataccca 6240

tatgatgtcc ccgactatgc ctaagaattc tgcagatatc cagcacagtg gcggccgctc 6300

gagtctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc tagttgccag 6360

ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 6420

gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 6480

ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 6540

gctggggatg cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg 6600

gggtatcccc acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 6660

agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 6720

tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 6780

ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 6840

cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 6900

tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 6960

tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 7020

caaaaattta acgcgaatta attctgtgga atgtgtgtca gttagggtgt ggaaagtccc 7080

caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 7140

gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 7200

cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 7260

cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 7320

ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 7380

aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca ggatgaggat 7440

cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 7500

ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 7560

ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 7620

atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 7680

cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 7740

cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 7800

atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 7860

aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 7920

tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 7980

tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 8040

tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 8100

atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 8160

accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 8220

gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg accaagcgac 8280

gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt 8340

cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga 8400

gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag 8460

catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 8520

actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga gcttggcgta 8580

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8640

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8700

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8760

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8820

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8880

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaa 8924


<210> 582
<211> 9692
<212> DNA
<213> Unknown

<220>
<223> Member of the phylum Elusimicrobia

<400> 582
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 60

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 780

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 840

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 900

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 960

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1020

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1080

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1140

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1200

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1260

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1320

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1380

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1440

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1500

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1560

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1620

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1680

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1740

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1800

gaaaagtgcc acctgacgtc gacggatcgg gagatctccc gatcccctat ggtgcactct 1860

cagtacaatc tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt 1920

ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga 1980

caattgcatg aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc 2040

cagatatacg cgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 2100

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 2160

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 2220

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 2280

cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 2340

taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 2400

gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 2460

tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 2520

tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 2580

cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctct 2640

ctggctaact agagaaccca ctgcttactg gcttatcgaa attaatacga ctcactatag 2700

ggagacccaa gctggctagc gtttaaactt aagcttgcca ccatggcccc aaagaagaag 2760

cggaaggtcg gtatccacgg agtcccagca gccggatcca accggatcta ccagggcaga 2820

gtgaccaagg tggaagtgcc cgatggcaag gacgagaagg gcaacatcaa gtggaagaag 2880

ctggaaaatt ggagcgacat cctgtggcag caccacatgc tgttccagga cgccgtgaac 2940

tactacacac tggccctggc cgccatctct ggatctgctg ttggcagcga cgagaagtcc 3000

atcatcctga gagaatgggc cgtgcaggtc cagaacatct gggagaaagc caagaaaaag 3060

gccaccgtgt tcgagggccc acagaagaga ctgaccagca tcctgggcct tgagcagaac 3120

gccagcttcg acattgccgc caagcacatc ctgaggacct ctgaggccaa gcctgagcag 3180

agagctagcg ccctgatcag actgctggaa gagatcgaca agaaaaacca caacgtcgtg 3240

tgcggcgagc ggctgccttt tttctgccct cggaacatcc agagcaagcg gagccctaca 3300

agcaaggccg tgtctagcgt gcaagagcag aaacggcaag aggaagtgcg gcggttccac 3360

aacatgcagc ctgaggaagt ggtcaagaac gccgtgacac tggacatcag cctgttcaag 3420

agcagcccca agatcgtgtt cctggaagat cccaagaagg ccagagccga gctgctgaag 3480

cagttcgaca acgcctgcaa gaaacacaaa gaactcgtgg gcatcaagaa agccttcacc 3540

gagtccatcg acaagcacgg ctctagcctg aaggtgccag ctcctggctc taagcctagc 3600

ggcctgtatc ctagcgccat cgtgttcaag tacttccccg tggatattac caagaccgtg 3660

tttctgaagg ccacagagaa gctggccatg ggcaaagacc gggaagtgac caacgatcct 3720

atcgccgacg ccagagtgaa cgacaagccc cacttcgact acttcaccaa cattgccctg 3780

atccgcgaga aagagaagaa cagagccgct tggtttgagt tcgatctggc cgcctttatc 3840

gaggccatca tgagccctca cagattctac caggacaccc agaagcggaa agaggccgcc 3900

agaaagctgg aagaaaagat caaggccatc gaaggcaaag gcgggcagtt caaagagagc 3960

gacagcgagg acgacgacgt ggactctctg cctggatttg agggcgacac cagaatcgac 4020

ctgctgcgga agctggtcac cgatacactt ggatggctgg gcgagagcga gacacccgat 4080

aacaacgagg gcaaaaagac cgagtacagc atcagcgagc ggaccctgag aatcttcccc 4140

gacatccaga agcagtggag cgagctggcc gagaaaggcg agacaacaga gggaaagctg 4200

ctcgaagtgc tgaaacacga gcagaccgag caccagagcg atttcggaag cgccacactg 4260

tatcagcacc tggccaagcc agagtttcac cccatctggc tgaagtccgg caccgaggaa 4320

tggcacgccg agaatcctct gaaagcctgg ctgaactaca aagagctgca gtacgagctg 4380

accgacaaga agcggcccat ccactttacc cctgctcacc ctgtgtacag ccccagatac 4440

ttcgacttcc ccaagaagtc cgaaaccgaa gagaaagagg tgtccaagaa cacccacagc 4500

ctgaccacaa gcctggccag cgagcacatc aagaactccc tgcagtttac agccgggctg 4560

atcagaaaga ccaacgtggg caagaaggct atcaaggccc ggttcagcta cagcgcccct 4620

agactgagaa gggactgcct gagaagcgag aacaacgaga acctgtacaa ggccccttgg 4680

ctccagccta tgatgagagc cctgggcatc gacgaggaaa aggccgacag acagaacttc 4740

gccaacacca ggatcaccct gatggccaaa ggcctggacg acattcagct gggctttccc 4800

gtggaagcca acagccaaga actgcagaaa gaagtgtcta acggcatcag ctggaagggc 4860

cagttcaact ggggaggaat cgcctctctg tctgccctga gatggcccca cgagaagaag 4920

cccaagaatc ctcctgagca gccttggtgg ggcatcgata gctttagctg cctggccgtg 4980

gatctgggcc agagatatgc tggcgccttc gccagactgg acgtgtccac cattgagaaa 5040

aagggcaaga gccggttcat cggcgaggcc tgcgacaaaa agtggtacgc caaggtgtcc 5100

cggatgggcc tgttgagact tcctggcgag gacgtgaaag tgtggcggga tgccagcaag 5160

attgacaaag agaacggctt cgccttccgg aaagagctgt tcggcgagaa gggaagatcc 5220

gccacacctc tggaagccga ggaaaccgcc gagctgatca agctgtttgg agccaacgag 5280

aaggacgtga tgcccgacaa ctggtctaaa gagctgagct tccccgagca gaatgacaag 5340

ctgctgatcg tggctcggag agcccaggct gctgttagca gactgcatag atgggcatgg 5400

ttcttcgacg aggccaagag atccgacgac gccatcagag agattctgga aagcgacgac 5460

accgacctga agcagaaagt gaacaagaac gagatcgaga aagtcaaaga gacaatcatc 5520

tccctgctga aagtcaagca agagctgctg cccacactgc tgaccagact ggccaataga 5580

gtgctgcccc tgagaggcag atcctgggag tggaaaaagc accaccagaa gaacgacggc 5640

ttcatcctgg accagaccgg caaggccatg cctaacgtgc tgattagagg acagcggggc 5700

ctgagcatgg accggatcga gcagattacc gagctgagaa agcggtttca ggccctgaac 5760

cagagcctgc ggagacagat cggaaagaag gcccctgcca agcgggacga ctctatccct 5820

gattgctgcc ccgatctgct ggaaaaactg gaccacatga aggaacagcg cgtgaaccag 5880

acagcccaca tgattctggc cgaggcactg ggactgaaac tggccgagcc tcctaaggac 5940

aagaaagaac tgaacgagac atgcgacatg cacggcgcct acgccaaagt ggacaacccc 6000

gtgtccttca tcgtgatcga ggacctgagc cggtacagaa gcagccaagg cagaagcccc 6060

agagaaaaca gccgactgat gaagtggtgc cacagggccg tcagagacaa gctgaaagaa 6120

atgtgcgagg tgttcttccc actgtgcgag agaagaaagg ccggctctgc ttgggtttcc 6180

ctgcctcctc tgcttgaaac accagccgcc tacagcagca gattctgcag cagatctggc 6240

gtggccggct tcagagccgt ggaagtgatt cctggcttcg agctgaagta cccctggtct 6300

tggctgaagg ataagaagga caaggccggc aatctggcca aagaagccct gaacatccgg 6360

accgtgtctg agcagctgaa ggcctttaac caggacaagc ccgagaagcc caggacactg 6420

ctggtgccta ttgccggcgg acctatcttc gtgcccatct ctgaagtggg cctgtccagc 6480

ttcggactga agcctcaggt tgtgcaggcc gacatcaacg ccgccatcaa tctgggactc 6540

agagccatca gcgaccctcg gatttgggag attcacccca gactgcggac cgagaagaga 6600

gatggcagac tgttcgccag agagaaacgg aagtacggcg aagagaaggt cgaggtgcag 6660

cccagcaaga atgagaaggc caaaaaagtg aaggacgacc ggaagcctaa ctacttcgcc 6720

gatttcagcg gcaaggtgga ctggggcttt ggcaacatta agaacgagtc cggcctgaca 6780

ctggtgtctg gcaaagcact gtggtggacc atcaaccagc tgcagtggga gagatgcttt 6840

gacatcaaca agcggcacat cgaggactgg tccaacaagc agaagcaagg atccaaaagg 6900

ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa agggatctta cccatacgat 6960

gttccagatt acgcttatcc ctacgacgtg cctgattatg catacccata tgatgtcccc 7020

gactatgcct aagaattctg cagatatcca gcacagtggc ggccgctcga gtctagaggg 7080

cccgtttaaa cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt 7140

tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 7200

taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 7260

gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg 7320

gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg gtatccccac 7380

gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 7440

acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 7500

ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 7560

gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 7620

tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 7680

ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 7740

gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 7800

gcgaattaat tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 7860

caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc 7920

caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag 7980

tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc 8040

cccatggctg actaattttt tttatttatg cagaggccga ggccgcctct gcctctgagc 8100

tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg 8160

gagcttgtat atccattttc ggatctgatc aagagacagg atgaggatcg tttcgcatga 8220

ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 8280

atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 8340

aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg 8400

acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 8460

acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 8520

tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 8580

ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 8640

agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 8700

atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg 8760

aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 8820

gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 8880

cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 8940

tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 9000

agttcttctg agcgggactc tggggttcga aatgaccgac caagcgacgc ccaacctgcc 9060

atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt 9120

ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt tcttcgccca 9180

ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 9240

cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt 9300

atcttatcat gtctgtatac cgtcgacctc tagctagagc ttggcgtaat catggtcata 9360

gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 9420

cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 9480

ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 9540

acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 9600

gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 9660

gttatccaca gaatcagggg ataacgcagg aa 9692


<210> 583
<211> 9041
<212> DNA
<213> Alicyclobacillus kakegawensis

<400> 583
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 60

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 780

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 840

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 900

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 960

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1020

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1080

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1140

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1200

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1260

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1320

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1380

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1440

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1500

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1560

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1620

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1680

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1740

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1800

gaaaagtgcc acctgacgtc gacggatcgg gagatctccc gatcccctat ggtgcactct 1860

cagtacaatc tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt 1920

ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga 1980

caattgcatg aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc 2040

cagatatacg cgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 2100

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 2160

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 2220

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 2280

cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 2340

taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 2400

gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 2460

tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 2520

tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 2580

cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctct 2640

ctggctaact agagaaccca ctgcttactg gcttatcgaa attaatacga ctcactatag 2700

ggagacccaa gctggctagc gtttaaactt aagcttgcca ccatggcccc aaagaagaag 2760

cggaaggtcg gtatccacgg agtcccagca gccggatccg ccgtgaagtc catcaaagtg 2820

aagctgcggc tgagcgagtg ccccgatatt ctggctggaa tgtggcagct gcacagagcc 2880

acaaatgccg gcgtgcggta ctacacagaa tgggtgtccc tgatgcggca agagatcctg 2940

tacagcagag gccctgatgg cggccagcag tgttatatga ccgccgagga ttgccagaga 3000

gagctgctgc ggagactgcg gaatagacag ctgcataacg gccggcagga tcagcctgga 3060

acagatgctg atctgctggc catcagcaga cggctgtacg agattctggt gctgcagagc 3120

atcggcaaaa gaggcgacgc ccagcagatt gccagcagct ttctgagccc tctggtggac 3180

cccaacagca aaggtggaag aggcgaggcc aagagcggaa gaaaacctgc ctggcagaag 3240

atgcgcgacc agggcgatcc tagatgggtt gccgctagag agaagtacga gcagcggaag 3300

gccgtggatc ccagcaaaga gattctgaac agcctggacg ccctgggcct cagacctctg 3360

tttgccgtgt tcaccgagac atacagatcc ggcgtggact ggaagcctct gggcaaatct 3420

cagggcgtca gaacctggga cagagacatg tttcagcagg ccctggaacg gctgatgagc 3480

tgggagagct ggaatcggag agtgggcgaa gagtacgcca gactgttcca gcagaaaatg 3540

aagttcgagc aagagcactt cgccgagcag agccacctgg tcaaactggc tagagccctg 3600

gaagccgata tgagagccgc ctctcagggc ttcgaggcca aaagaggaac agcccaccag 3660

atcaccagaa gggcactgag aggggccgac agagtgttcg agatctggaa gtctatcccc 3720

gaggaagccc tgttcagcca gtacgacgaa gtgatcagac aggtgcaggc cgagaagcgg 3780

agagatttcg gcagccatga cctgttcgcc aagctggccg agcctaagta tcagcccctt 3840

tggagagccg acgagacatt cctgaccaga tacgccctgt acaacggcgt gctgcgcgat 3900

ctggaaaagg ccagacagtt cgccaccttc acactgcctg atgcctgcgt gaaccccatc 3960

tggaccagat tcgagtctag ccagggcagc aacctgcaca aatacgagtt tctgttcgac 4020

cacctcggac ctggcagaca cgccgtcaga tttcagagac tgctggtggt ggaaagcgag 4080

ggcgccaaag aaagggatag cgtggtggtg cctgtggctc cttctggcca actggataag 4140

ctggtgctga gggaagaaga gaagtccagc gtcgccctgc atctgcacga taccgctaga 4200

cccgatggct tcatggctga atgggctggc gccaaactgc agtacgagag aagcaccctg 4260

gccagaaaag ccagacggga caagcagggc atgagaagct ggcggagaca gccctccatg 4320

ctgatgtctg ccgctcagat gctggaagat gccaaacagg ctggcgacgt gtacctgaac 4380

atcagcgtgc gcgtgaagtc tcccagtgaa gtgcgaggac agaggcggcc tccttacgcc 4440

gctctgttta gaatcgacga caagcagcgg agagtgaccg tgaactacaa caagctgagc 4500

gcctacctgg aagaacaccc cgataagcag atccctggcg ctcctggact gctgtctgga 4560

ctgagagtga tgtccgtgga cctgggcctg agaacaagcg ccagcatctc cgtgttcaga 4620

gtggccaaga aagaagaggt ggaagccctc ggagatggcc ggcctcctca ctactatcct 4680

atccacggca ccgatgacct ggtggccgtg cacgaaagat cccacctgat tcagatgccc 4740

ggcgaaaccg agacaaagca gctgcggaag ctgagagaag aacggcaggc cgtgctgagg 4800

ccactgtttg ctcaactggc actgctgaga ctgctcgtca gatgtggcgc cgctgacgag 4860

agaatcagaa ccagatcctg gcagcggctg accaagcagg gaagagagtt caccaagaga 4920

ctgaccccta gctggcgcga ggctctggaa ctggaactga caagactcga ggcctactgc 4980

ggcagagtgc ccgatgatga gtggtccaga atcgtggaca gaaccgtgat tgccctgtgg 5040

cggagaatgg gcaagcaagt gcgcgattgg cggaagcaag tgaagtccgg ggccaaagtg 5100

aaagtgaagg gctaccagct ggatgtcgtc ggcggaaatt ctctggccca gatcgactat 5160

ctggaacagc agtacaagtt cctgcggcgt tggagcttct tcgccagagc ttctggcctg 5220

gtcgtgcggg ccgatagaga aagccatttt gccgtggctc tgagacagca catcgagaac 5280

gccaagcggg acagactgaa gaaactggcc gaccggatcc tgatggaagc actgggctat 5340

gtgtacgagg ccagcggacc tagagaaggc cagtggacag ctcagcaccc tccttgccag 5400

ctgatcattc tcgaggaact gtccgcctac cggttcagcg acgatagacc tcctagcgag 5460

aacagcaaac tgatggcctg gggccacaga ggcatcctcg aagaactggt caaccaggct 5520

caggtgcacg atgtgctcgt gggcacagtg tacgccgcct tcagcagcag attcgacgct 5580

agaacaggtg ctcccggcgt cagatgcaga agagtgcctg ccagatttgt gggcgccacc 5640

gtggatgatt ctctgccact gtggctgacc gagttcctgg acaagcaccg gctggataag 5700

aacctgctgc ggcccgacga tgtgatccca acaggcgaag gcgaattcct ggtgtcccct 5760

tgtggcgaag aggctgccag agttagacag gttcacgccg acatcaacgc tgcccagaac 5820

ctgcagagaa ggctgtggca gaacttcgac atcaccgagc tgaggctgag atgcgacgtg 5880

aagatgggcg gagagggaac agtgctggtg cccagagtga acaacgccag agccaagcag 5940

ctgttcggca agaaggtgct ggtttcccag gacggcgtga ccttcttcga gagatctcag 6000

acaggcggca agccccacag cgagaagcag accgatctga ccgacaaaga actcgagctg 6060

atcgccgagg ccgatgaggc cagagctaaa agcgtggtgc tgttcaggga tcctagcggc 6120

cacattggca aaggccactg gatccggcag cgcgagtttt ggagtctggt caagcagagg 6180

atcgagagcc acaccgccga gcggattaga gttagaggcg tgggaagctc cctggacgga 6240

tccaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa gggatcttac 6300

ccatacgatg ttccagatta cgcttatccc tacgacgtgc ctgattatgc atacccatat 6360

gatgtccccg actatgccta agaattctgc agatatccag cacagtggcg gccgctcgag 6420

tctagagggc ccgtttaaac ccgctgatca gcctcgactg tgccttctag ttgccagcca 6480

tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 6540

ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 6600

gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 6660

ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctctaggggg 6720

tatccccacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 6780

gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 6840

ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 6900

cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 6960

agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 7020

aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 7080

gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 7140

aaatttaacg cgaattaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 7200

gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 7260

gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 7320

caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 7380

attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctctg 7440

cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 7500

agctcccggg agcttgtata tccattttcg gatctgatca agagacagga tgaggatcgt 7560

ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 7620

tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 7680

tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 7740

aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 7800

ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 7860

ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 7920

caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 7980

atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 8040

acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 8100

ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 8160

aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 8220

aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 8280

gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 8340

ttcttgacga gttcttctga gcgggactct ggggttcgaa atgaccgacc aagcgacgcc 8400

caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 8460

aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 8520

cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 8580

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 8640

catcaatgta tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc 8700

atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 8760

agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 8820

tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 8880

aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 8940

cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 9000

ggtaatacgg ttatccacag aatcagggga taacgcagga a 9041


<210> 584
<211> 7826
<212> DNA
<213> Unknown

<220>
<223> Member of the class Phycisphaerae

<400> 584
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900

gtttaaactt aagcttgcca ccatggcccc aaagaagaag cggaaggtcg gtatccacgg 960

agtcccagca gccgccacca agagctacag agccagaatc ctgaccgaca gcagactggc 1020

cgctgctctg gatagaaccc acgtggtgtt tgtggaaagc ctgaagcaga tgatcaacac 1080

ctacctgcgg atgcagaacg gcaagttcgg ccccgaccac aagaaactgg cccagatcat 1140

gctgagccgg tccaacacat ttgcccacgg cgtgatggac cagatcacca gagatcagcc 1200

caccagcaca ctggacgagg aatggaccga cctggccaga agaatccaca agacaaccgg 1260

acctctgttc ctgcaagccg agagattcgc caccgtgaag aacagagcca tccacaccaa 1320

gtccagaggc aaagtgatcc catctcctga gacactggcc gtgcctgcca agttctggca 1380

ccaagtgtgc gatagcgcca gcgcctacat cagatccaac cgcgaactga tgcagcagtg 1440

gcggaaagat agagccgcct ggctgaagga caagaacgag tggcagcaga aacaccccga 1500

gttcatgcag ttctacaacg gcccctacca gaacttcctg aagctgtgcg acgacgacag 1560

aatcacctct cagctggctg ccgagcagca gcctacagcc agcaagaaca acagacccag 1620

aaagaccggc aagcgcttcg ccagatggca cctgtggtac aagtggctga gcgagaaccc 1680

cgagatcatc gaatggcgga acaaggcctc cgccagcgac tttaagaccg tgaccgatga 1740

cgtgcggaag cagatcatta ccaagtatcc ccagcagaac aagtacatca cccggctgct 1800

ggactggctg gaagataaca accccgagct gaaaaccctg gaaaacctgc ggcggaccta 1860

cgtgaagaag ttcgacagct tcaagcggcc tcctacactg accctgccat ctccatacag 1920

acacccctac tggttcacca tggaactgga ccagttttac aagaaggccg acttcgagaa 1980

cggcaccatc cagctgctgc tgatcgacga ggacgacgac ggcaactggt tcttcaactg 2040

gatgcccgcc tctctgaagc ccgatcctag actggtgcct tcttggagag ccgaaacctt 2100

cgagacagag ggcagattcc ctccttacct cggcggcaag atcggcaaga agctgagcag 2160

acctgctcct accgacgccg agagaaaggc tggaattgcc ggcgctaagc tgatgattaa 2220

gaacaatcgg agcgagctgc tgttcaccgt gttcgagcag gactgccctc ctagagtgaa 2280

gtgggccaag accaagaacc ggaagtgccc tgccgacaac gcctttagct ccgacggcaa 2340

gaccagaaag cccctgagaa tcctgtccat cgacctgggc atcagacaca tcggcgcctt 2400

cgctctgaca cagggcacca gaaatgatag cgcctggcag accgagagcc tgaagaaggg 2460

catcatcaac agccctagca tccctccact gcggcaagtg cggagacacg actacgacct 2520

gaagcggaaa agacggcggc acggcaagcc tgtgaagggc cagagaagca acgccaatct 2580

gcaggcccac aggaccaaca tggcccagga cagattcaag aagggcgcct ctgccatcgt 2640

gtcactggcc agagagcata gcgccgacct gatcctgttc gagaacctgc acagcctgaa 2700

gttcagcgcc ttcgacgagc ggtggatgaa cagacagctg cgggacatga accggcggca 2760

catcgtggaa ctggtgtctg aacaggcccc tgagttcggc atcacagtga aggacgacat 2820

caacccctgg atgaccagcc ggatctgcag caactgtaac ctgcctggct tcaggttcag 2880

catgaagaag aagaacccct accgcgagaa gctgcccaga gagaagtgca ccgatttcgg 2940

ctaccctgtg tgggaacctg gcggccacct gtttagatgc cctcactgcg accacagagt 3000

gaacgccgac attaacgccg ctgccaacct ggccaacaag ttctttggcc tcggctactg 3060

gaacaacggc ctgaagtacg atgccgagac aaagaccttc accgtgcaca ccgacaagaa 3120

aaccccacct ctgatcttca agcccagacc tcagttcgat ctgtgggccg acagcgtgaa 3180

aacacggaag cagcttggcc ccgatccttt caaaaggccg gcggccacga aaaaggccgg 3240

ccaggcaaaa aagaaaaagg gatcctaccc atacgatgtt ccagattacg cttatcccta 3300

cgacgtgcct gattatgcat acccatatga tgtccccgac tatgcctaag aattctgcag 3360

atatccagca cagtggcggc cgctcgagtc tagagggccc gtttaaaccc gctgatcagc 3420

ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3480

gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3540

ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3600

ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 3660

ggaaagaacc agctggggct ctagggggta tccccacgcg ccctgtagcg gcgcattaag 3720

cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 3780

cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 3840

tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 3900

aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 3960

ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 4020

actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 4080

ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattaattct gtggaatgtg 4140

tgtcagttag ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg 4200

catctcaatt agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt 4260

atgcaaagca tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc 4320

ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt 4380

atttatgcag aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc 4440

ttttttggag gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga 4500

tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 4560

ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 4620

ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 4680

aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 4740

ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 4800

gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 4860

gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 4920

acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 4980

gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 5040

ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccatggc 5100

gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 5160

ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 5220

gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 5280

gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgagc gggactctgg 5340

ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 5400

ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 5460

tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 5520

ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 5580

tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtataccgt 5640

cgacctctag ctagagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 5700

atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 5760

cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 5820

gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 5880

gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 5940

ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 6000

acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 6060

cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 6120

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 6180

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 6240

tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 6300

aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 6360

ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 6420

cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 6480

tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 6540

tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 6600

ctggtagcgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 6660

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 6720

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 6780

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 6840

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 6900

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 6960

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 7020

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 7080

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 7140

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 7200

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 7260

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 7320

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 7380

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 7440

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 7500

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 7560

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 7620

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 7680

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 7740

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 7800

ttccccgaaa agtgccacct gacgtc 7826


<210> 585
<211> 7814
<212> DNA
<213> Unknown

<220>
<223> Member of the phylum Planctomycetes

<400> 585
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900

gtttaaactt aagcttgcca ccatggcccc aaagaagaag cggaaggtcg gtatccacgg 960

agtcccagca gccagcgtgc ggagctttca ggccagagtg gaatgcgaca agcagaccat 1020

ggaacacctg tggcggaccc acaaggtgtt caacgagaga ctgcccgaga tcatcaagat 1080

cctgttcaag atgaagcggg gcgagtgcgg ccagaacgat aagcagaagt ccctgtacaa 1140

gagcatcagc cagagcatcc tggaagccaa cgctcagaac gccgactacc tgctgaacag 1200

cgtgtccatc aaaggctgga agcctggcac cgccaagaag tacagaaacg ccagcttcac 1260

ctgggccgac gatgccgcta aactgtctag ccagggcatc cacgtgtacg acaagaaaca 1320

ggtgctgggc gacctgcctg gcatgatgtc tcagatggtc tgcaggcaga gcgtggaagc 1380

catctctgga cacatcgagc tgaccaagaa gtgggagaaa gaacacaacg agtggctgaa 1440

agaaaaagag aaatgggagt ccgaggacga gcacaagaag tatctggacc tgcgcgagaa 1500

gttcgagcag tttgagcaga gcatcggcgg caagatcacc aagagaagag gccggtggca 1560

cctgtacctg aagtggctga gcgacaaccc tgattttgcc gcctggcggg gaaacaaggc 1620

cgtgatcaat cctctgagcg agaaggccca gatcaggatc aacaaggcca agccgaacaa 1680

gaagaacagc gtcgagcggg acgagttctt caaggccaat cctgagatga aggccctgga 1740

caacctgcac ggctactacg agcggaattt cgtgcggcgg agaaagacaa agaagaaccc 1800

cgacggcttc gaccacaagc ctaccttcac actgccccat cctaccatcc atcctcgttg 1860

gttcgtgttc aacaagccta agacaaaccc cgagggctac cgcaagctga tcctgcctaa 1920

aaaggccggc gatctgggca gcctggaaat gagactgctg accggcgaga agaacaaggg 1980

caactacccc gacgactgga tcagcgtgaa gtttaaggcc gatcctcggc tgagcctgat 2040

cagacccgtg aaaggcagac gggttgtgcg gaagggcaaa gagcagggcc agaccaaaga 2100

gacagacagc tacgagtttt tcgacaagca cctgaagaag tggcggcctg ccaaactgtc 2160

tggcgtgaag ctgatcttcc ccgacaagac acctaaggcc gcctacctgt acttcacctg 2220

tgacatcccc gacgagcccc tgaccgagac agccaagaaa atccagtggc tggaaaccgg 2280

cgacgtgacc aaaaagggca agaaacgcaa aaagaaggtg ctgccccacg gcctggtgtc 2340

ctgtgctgtt gatctgagca tgcggagagg caccaccggc tttgccacac tgtgcagata 2400

cgagaatggc aagatccaca tcctgcggag ccggaacctg tgggtcggat acaaagaagg 2460

caagggctgt cacccctaca gatggacaga gggacccgac ctgggacaca ttgccaagca 2520

caagagagag atcagaatcc tgcggtccaa gcggggcaag cctgtgaagg gcgaagagag 2580

ccacatcgac ctgcagaaac acatcgacta catgggcgaa gatcggttca agaaggccgc 2640

cagaaccatc gtgaacttcg ccctgaacac cgagaacgcc gccagcaaga atggcttcta 2700

ccccagagct gacgtgctgc tgctggaaaa cctggaagga ctgatccccg atgccgagaa 2760

agagcggggc atcaatagag ccctggccgg ctggaataga cggcacctgg ttgagcgcgt 2820

gatcgagatg gccaaggatg ccggcttcaa gcggcgggtg ttcgagatcc caccttacgg 2880

cacaagccaa gtgtgcagca aatgtggcgc cctgggcaga agatacagca tcatcagaga 2940

gaacaaccgg cgcgagatca gattcggcta cgtggaaaag ctgttcgcct gtcctaactg 3000

cggctactgc gccaacgccg atcacaatgc cagcgtgaac ctgaaccggc ggttcctgat 3060

cgaggacagc ttcaagtcct actacgactg gaagcggctg tccgagaaga agcagaaaga 3120

ggaaatcgag acaatcgagt ccaagctgat ggataagctg tgcgccatgc acaagatcag 3180

ccggggcagc atcagcaaga aaaggccggc ggccacgaaa aaggccggcc aggcaaaaaa 3240

gaaaaaggga tcctacccat acgatgttcc agattacgct tatccctacg acgtgcctga 3300

ttatgcatac ccatatgatg tccccgacta tgcctaagaa ttctgcagat atccagcaca 3360

gtggcggccg ctcgagtcta gagggcccgt ttaaacccgc tgatcagcct cgactgtgcc 3420

ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 3480

tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 3540

gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 3600

caatagcagg catgctgggg atgcggtggg ctctatggct tctgaggcgg aaagaaccag 3660

ctggggctct agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 3720

ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 3780

tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 3840

gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 3900

gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 3960

ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 4020

ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 4080

tgagctgatt taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttaggg 4140

tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 4200

tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg 4260

catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc gcccctaact 4320

ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat ttatgcagag 4380

gccgaggccg cctctgcctc tgagctattc cagaagtagt gaggaggctt ttttggaggc 4440

ctaggctttt gcaaaaagct cccgggagct tgtatatcca ttttcggatc tgatcaagag 4500

acaggatgag gatcgtttcg catgattgaa caagatggat tgcacgcagg ttctccggcc 4560

gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 4620

gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 4680

tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg 4740

ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 4800

ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 4860

tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 4920

gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 4980

gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 5040

ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 5100

ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 5160

gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 5220

ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 5280

atcgccttct atcgccttct tgacgagttc ttctgagcgg gactctgggg ttcgaaatga 5340

ccgaccaagc gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg 5400

aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg 5460

atctcatgct ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca 5520

aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 5580

gtggtttgtc caaactcatc aatgtatctt atcatgtctg tataccgtcg acctctagct 5640

agagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa 5700

ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga 5760

gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt 5820

gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct 5880

cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 5940

cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 6000

acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 6060

ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 6120

ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 6180

gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 6240

gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 6300

ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 6360

actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 6420

gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 6480

ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 6540

ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtt 6600

tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6660

tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 6720

tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 6780

caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 6840

cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 6900

agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 6960

acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7020

gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7080

ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7140

tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7200

ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7260

tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7320

attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7380

agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7440

ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7500

ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7560

cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7620

gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7680

tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 7740

tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 7800

tgccacctga cgtc 7814


<210> 586
<211> 8936
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 586
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 60

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 780

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 840

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 900

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 960

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1020

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1080

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1140

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1200

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1260

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1320

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1380

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1440

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1500

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1560

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1620

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1680

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1740

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1800

gaaaagtgcc acctgacgtc gacggatcgg gagatctccc gatcccctat ggtgcactct 1860

cagtacaatc tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt 1920

ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga 1980

caattgcatg aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc 2040

cagatatacg cgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 2100

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 2160

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 2220

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 2280

cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 2340

taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 2400

gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 2460

tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 2520

tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 2580

cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctct 2640

ctggctaact agagaaccca ctgcttactg gcttatcgaa attaatacga ctcactatag 2700

ggagacccaa gctggctagc gtttaaactt aagcttgcca ccatggcccc aaagaagaag 2760

cggaaggtcg gtatccacgg agtcccagca gccggatccg ccatccggtc catcaagctg 2820

aagatgaaga ccaacagcgg caccgacagc atctacctga gaaaagccct gtggcggacc 2880

caccagctga tcaatgaggg aatcgcctac tacatgaacc tgctgaccct gtaccggcaa 2940

gaggccatcg gcgacaagac caaagaagcc tatcaggccg agctgattaa catcatccgg 3000

aaccagcagc ggaacaacgg cagctctgag gaacacggct ccgaccaaga aattctggcc 3060

ctgctgagac agctgtacga gctgatcatc cccagcagca tcggcgaatc tggcgacgct 3120

aatcagctgg gcaacaagtt tctgtaccct ctggtggacc ccaacagcca gtctggcaag 3180

ggcacatcta acgccggcag aaagcccaga tggaagcggc tgaaagagga aggcaacccc 3240

gactgggaac tcgagaagaa gaaggacgag gaacgcaagg ccaaggatcc caccgtgaag 3300

atctttgaca acctgaacaa atacggcctg ctgcctctgt tcccactgtt caccaacatc 3360

cagaaagaca tcgagtggct gcccctgggc aagagacagt ctgtgcggaa gtgggacaaa 3420

gacatgttca tccaggccat cgagagactg ctgagctggg agagctggaa cagaagagtg 3480

gccgacgagt acaaacagct gaaagaaaag accgagagct actacaaaga gcacctgaca 3540

ggcggcgagg aatggatcga gaagatccgg aagttcgaga aagaacggaa catggaactg 3600

gaaaagaacg ccttcgctcc caacgacggc tacttcatca ccagcagaca gatcagaggc 3660

tgggacagag tgtacgagaa gtggtccaag ctgcccgagt ctgctagccc tgaggaactg 3720

tggaaagtgg tggccgagca gcagaacaag atgtccgaag gcttcggcga ccccaaggtg 3780

ttcagcttcc tggccaacag agagaaccgg gacatttgga gaggccacag cgagcggatc 3840

taccacattg ccgcctacaa cggcctgcag aagaagctga gccggaccaa agagcaggcc 3900

accttcacac tgcctgacgc cattgaacac cctctgtgga tcagatacga gagccctggc 3960

ggcaccaacc tgaatctgtt caagctggaa gagaaacaga aaaagaacta ctacgtgacc 4020

ctgagcaaga tcatctggcc cagcgaggaa aagtggattg agaaagagaa catcgagatc 4080

cctctggctc ccagcatcca gttcaaccgg cagattaagc tgaagcagca cgtgaagggc 4140

aagcaagaga tcagcttcag cgactacagc agccggatca gcctggatgg tgttctcggc 4200

ggcagcagaa tccagtttaa tcggaagtac atcaagaacc acaaagagct gctcggagag 4260

ggcgacatcg gccccgtgtt ctttaacctg gtggtggatg tggcccctct gcaagaaacc 4320

agaaacggca gactgcagag ccccatcggc aaggccctga aagtgatcag cagcgacttc 4380

tccaaagtga tcgactacaa gccgaaagaa ctcatggatt ggatgaatac cggcagcgcc 4440

agcaacagct ttggagtggc ttctctgctg gaaggcatga gagtgatgag catcgacatg 4500

ggccagagaa ccagcgcctc cgtgtccatc ttcgaggtcg tgaaagaact gcccaaggat 4560

caagagcaga agctgttcta cagcatcaac gacaccgagc tgttcgccat ccacaagcgg 4620

agctttctgc tgaacctgcc tggcgaggtg gtcaccaaga acaacaagca gcagcggcaa 4680

gagcggcgga aaaagcggca gtttgtgcgg agccagatca gaatgctggc caacgtgctg 4740

cggctggaaa caaagaaaac ccctgacgag cggaagaagg ccattcacaa gctgatggaa 4800

atcgtgcaga gctacgacag ctggaccgcc agccagaaag aagtgtggga gaaagagctg 4860

aatctcctga ccaacatggc cgccttcaat gacgagatct ggaaagaaag cctggtggaa 4920

ctgcaccacc ggatcgagcc ttacgtggga cagatcgtgt ccaagtggcg gaagggcctg 4980

tctgagggca gaaagaatct ggccggcatc agcatgtgga acatcgacga actggaagat 5040

accaggcggc tgctgatttc ctggtccaag agaagcagaa ccccaggcga ggccaacagg 5100

atcgaaaccg atgagccttt cggcagcagc ctgctccagc acattcagaa cgtgaaggac 5160

gacagactga agcagatggc caacctgatc atcatgacag ccctgggctt taagtacgac 5220

aaagaggaaa aggaccggta caagcggtgg aaagagacat accccgcctg ccagatcatc 5280

ctgttcgaga acctgaaccg ctacctgttc aacctcgacc ggtccagacg cgagaacagc 5340

agactgatga agtgggccca tcggagcatc cccagaaccg tgtctatgca gggcgagatg 5400

ttcggcctgc aagtgggcga cgttcggagc gagtacagct ccagattcca cgccaaaaca 5460

ggcgcccctg gcatcagatg tcacgccctg actgaagagg atctgaaggc cggcagcaac 5520

accctgaaga gactgatcga ggacggcttc atcaatgaga gcgagctggc ctacctgaag 5580

aagggcgata tcatccctag ccaaggcggc gaactgttcg tgacactgtc caagcggtac 5640

aagaaggaca gcgacaacaa cgagctgacc gtgatccacg ccgacatcaa cgccgctcag 5700

aatctgcaga agcggttttg gcagcaaaac agcgaggtgt acagagtgcc ctgtcagctg 5760

gccagaatgg gcgaagataa gctgtacatc cccaagagcc agaccgagac aatcaagaag 5820

tatttcggca agggctcctt cgtgaagaac aataccgaac aagaggtcta caagtgggag 5880

aagtccgaga aaatgaagat caagacggac accaccttcg acctgcaaga cctggatggc 5940

ttcgaggaca tcagcaagac cattgagctg gcacaagagc agcaaaagaa atacctgacc 6000

atgttcaggg accccagcgg ctactttttc aacaatgaga catggcggcc tcaaaaagaa 6060

tactggtcca tcgtgaacaa catcatcaag agctgcctca agaagaagat cctgagcaac 6120

aaggtcgagc tgggatccaa aaggccggcg gccacgaaaa aggccggcca ggcaaaaaag 6180

aaaaagggat cttacccata cgatgttcca gattacgctt atccctacga cgtgcctgat 6240

tatgcatacc catatgatgt ccccgactat gcctaagaat tctgcagata tccagcacag 6300

tggcggccgc tcgagtctag agggcccgtt taaacccgct gatcagcctc gactgtgcct 6360

tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 6420

gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 6480

tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 6540

aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc 6600

tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 6660

gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 6720

ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 6780

ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 6840

ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 6900

gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 6960

tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 7020

gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt 7080

gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 7140

cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 7200

atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 7260

cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 7320

ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 7380

taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct gatcaagaga 7440

caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg 7500

cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 7560

ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 7620

ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg 7680

gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 7740

tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 7800

ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 7860

accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 7920

atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 7980

tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 8040

cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 8100

tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 8160

gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 8220

tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt tcgaaatgac 8280

cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg ccttctatga 8340

aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc agcgcgggga 8400

tctcatgctg gagttcttcg cccaccccaa cttgtttatt gcagcttata atggttacaa 8460

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 8520

tggtttgtcc aaactcatca atgtatctta tcatgtctgt ataccgtcga cctctagcta 8580

gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 8640

tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 8700

ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 8760

ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 8820

ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 8880

agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaa 8936


<210> 587
<211> 6516
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 587
accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg ctgcatacgc 60

ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta 120

ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat caggggctcg 180

cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag gatctcgtcg 240

tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc ttttctggat 300

tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg ttggctaccc 360

gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg ctttacggta 420

tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag ttcttctgag 480

cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt 540

cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 600

ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 660

tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 720

atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 780

ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc tgtttcctgt 840

gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 900

agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 960

tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 1020

aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 1080

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1140

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1200

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1260

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 1320

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 1380

gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 1440

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 1500

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1560

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1620

tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 1680

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1740

acaaaccacc gctggtagcg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1800

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1860

ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 1920

aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 1980

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2040

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2100

cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 2160

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2220

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2280

cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2340

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2400

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2460

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2520

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2580

ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2640

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2700

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2760

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 2820

acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 2880

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2940

tccgcgcaca tttccccgaa aagtgccacc tgacgtcgac ggatcgggag atctcccgat 3000

cccctatggt gcactctcag tacaatctgc tctgatgccg catagttaag ccagtatctg 3060

ctccctgctt gtgtgttgga ggtcgctgag tagtgcgcga gcaaaattta agctacaaca 3120

aggcaaggct tgaccgactt aattaagagg gcctatttcc catgattcct tcatatttgc 3180

atatacgata caaggctgtt agagagataa ttggaattaa tttgactgta aacacaaaga 3240

tattagtaca aaatacgtga cgtagaaagt aataatttct tgggtagttt gcagttttaa 3300

aattatgttt taaaatggac tatcatatgc ttaccgtaac ttgaaagtat ttcgatttct 3360

tggctttata tatcttgtgg aaaggacgaa acaccggacc tatagggtca atgaatctgt 3420

gcgtgtgcca taagtaatta aaaattaccc accacaggag cacctgaaaa caggtgcttg 3480

gcacggagac gatatatcgt ctcttttttt caattgcatg aagaatctgc ttagggttag 3540

gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt gattattgac 3600

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 3660

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 3720

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 3780

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 3840

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 3900

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 3960

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 4020

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 4080

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 4140

acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca ctgcttactg 4200

gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc gtttaaactt 4260

aagcttgccg gtgccaccat ggtgagcaag ggcgaggagg ataacatggc catcatcaag 4320

gagttcatgc gcttcaaggt gcacatggag ggctccgtga acggccacga gttcgagatc 4380

gagggcgagg gcgagggccg cccctacgag ggcacccaga ccgccaagct gaaggtgacc 4440

aagggtggcc ccctgccctt cgcctgggac atcctgtccc ctcagttcat gtacggctcc 4500

aaggcctacg tgaagcaccc cgccgacatc cccgactact tgaagctgtc cttccccgag 4560

ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac cgtgacccag 4620

gactcctccc tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg caccaacttc 4680

ccctccgacg gccccgtaat gcagaagaag accatgggct gggaggcctc ctccgagcgg 4740

atgtaccccg aggacggcgc cctgaagggc gagatcaagc agaggctgaa gctgaaggac 4800

ggcggccact acgacgctga ggtcaagacc acctacaagg ccaagaagcc cgtgcagctg 4860

cccggcgcct acaacgtcaa catcaagttg gacatcacct cccacaacga ggactacacc 4920

atcgtggaac agtacgaacg cgccgagggc cgccactcca ccggcggcat ggacgagctg 4980

tacaagtacc catacgatgt tccagattac gcttaagaat tctgcagata tccagcacag 5040

tggcggccgc tcgagtctag agggcccgtt taaacccgct gatcagcctc gactgtgcct 5100

tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 5160

gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 5220

tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 5280

aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc 5340

tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 5400

gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 5460

ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 5520

ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 5580

ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 5640

gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 5700

tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 5760

gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt 5820

gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 5880

cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 5940

atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 6000

cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 6060

ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 6120

taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct gatcaagaga 6180

caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg 6240

cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 6300

ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 6360

ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg gccacgacgg 6420

gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 6480

tgggcgaagt gccggggcag gatctcctgt catctc 6516


<210> 588
<211> 6525
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 588
accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg ctgcatacgc 60

ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta 120

ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat caggggctcg 180

cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag gatctcgtcg 240

tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc ttttctggat 300

tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg ttggctaccc 360

gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttcctcgtg ctttacggta 420

tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag ttcttctgag 480

cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt 540

cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 600

ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 660

tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 720

atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 780

ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc tgtttcctgt 840

gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 900

agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 960

tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 1020

aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 1080

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1140

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1200

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1260

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 1320

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 1380

gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 1440

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 1500

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1560

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1620

tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 1680

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1740

acaaaccacc gctggtagcg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1800

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1860

ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 1920

aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 1980

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2040

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2100

cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 2160

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2220

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2280

cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2340

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2400

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2460

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2520

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2580

ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2640

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2700

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2760

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 2820

acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 2880

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2940

tccgcgcaca tttccccgaa aagtgccacc tgacgtcgac ggatcgggag atctcccgat 3000

cccctatggt gcactctcag tacaatctgc tctgatgccg catagttaag ccagtatctg 3060

ctccctgctt gtgtgttgga ggtcgctgag tagtgcgcga gcaaaattta agctacaaca 3120

aggcaaggct tgaccgactt aattaagagg gcctatttcc catgattcct tcatatttgc 3180

atatacgata caaggctgtt agagagataa ttggaattaa tttgactgta aacacaaaga 3240

tattagtaca aaatacgtga cgtagaaagt aataatttct tgggtagttt gcagttttaa 3300

aattatgttt taaaatggac tatcatatgc ttaccgtaac ttgaaagtat ttcgatttct 3360

tggctttata tatcttgtgg aaaggacgaa acaccggttc tgtcttttgg tcaggacaac 3420

cgtctagcta taagtgctgc agggtgtgag aaactcctat tgctggacga tgtctcttac 3480

gaggcattag cacggagacg atatatcgtc tctttttttc aattgcatga agaatctgct 3540

tagggttagg cgttttgcgc tgcttcgcga tgtacgggcc agatatacgc gttgacattg 3600

attattgact agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat 3660

ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 3720

ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 3780

ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 3840

tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 3900

tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat 3960

cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat agcggtttga 4020

ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca 4080

aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg 4140

taggcgtgta cggtgggagg tctatataag cagagctctc tggctaacta gagaacccac 4200

tgcttactgg cttatcgaaa ttaatacgac tcactatagg gagacccaag ctggctagcg 4260

tttaaactta agcttgccgg tgccaccatg gtgagcaagg gcgaggagga taacatggcc 4320

atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 4380

ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 4440

aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 4500

tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 4560

ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 4620

gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa gctgcgcggc 4680

accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 4740

tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gaggctgaag 4800

ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 4860

gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 4920

gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 4980

gacgagctgt acaagtaccc atacgatgtt ccagattacg cttaagaatt ctgcagatat 5040

ccagcacagt ggcggccgct cgagtctaga gggcccgttt aaacccgctg atcagcctcg 5100

actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 5160

ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 5220

ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 5280

tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 5340

agaaccagct ggggctctag ggggtatccc cacgcgccct gtagcggcgc attaagcgcg 5400

gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 5460

cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 5520

aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 5580

cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 5640

ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 5700

aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 5760

ttaaaaaatg agctgattta acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc 5820

agttagggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 5880

tcaattagtc agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 5940

aaagcatgca tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc 6000

ccctaactcc gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt 6060

atgcagaggc cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt 6120

ttggaggcct aggcttttgc aaaaagctcc cgggagcttg tatatccatt ttcggatctg 6180

atcaagagac aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt 6240

ctccggccgc ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct 6300

gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga 6360

ccgacctgtc cggtgccctg aatgaactgc aggacgaggc agcgcggcta tcgtggctgg 6420

ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 6480

ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctc 6525


<210> 589
<211> 8924
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 589
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 60

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 780

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 840

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 900

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 960

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1020

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1080

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1140

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1200

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1260

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1320

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1380

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1440

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1500

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1560

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1620

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1680

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1740

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1800

gaaaagtgcc acctgacgtc gacggatcgg gagatctccc gatcccctat ggtgcactct 1860

cagtacaatc tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt 1920

ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga 1980

caattgcatg aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc 2040

cagatatacg cgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 2100

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 2160

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 2220

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 2280

cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 2340

taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 2400

gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 2460

tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 2520

tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 2580

cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctct 2640

ctggctaact agagaaccca ctgcttactg gcttatcgaa attaatacga ctcactatag 2700

ggagacccaa gctggctagc gtttaaactt aagcttgcca ccatggcccc aaagaagaag 2760

cggaaggtcg gtatccacgg agtcccagca gccggatccg ccaccagatc cttcatcctg 2820

aagatcgagc ccaacgagga agtgaagaaa ggcctctgga aaacccacga ggtgctgaac 2880

cacggaatcg cctactacat gaatatcctg aagctgatcc ggcaagaggc catctacgag 2940

caccacgagc aggaccccaa gaatcccaag aaggtgtcca aggccgagat ccaggccgag 3000

ctgtgggatt tcgtgctgaa gatgcagaag tgcaacagct tcacacacga ggtggacaag 3060

gacgaggtgt tcaacatcct gagagagctg tacgaggaac tggtgcccag cagcgtggaa 3120

aagaagggcg aagccaacca gctgagcaac aagtttctgt accctctggt ggaccccaac 3180

agccagtctg gaaagggaac agccagcagc ggcagaaagc ccagatggta caacctgaag 3240

attgccggcg atccctcctg ggaagaagag aagaagaagt gggaagaaga taagaaaaag 3300

gacccgctgg ccaagatcct gggcaagctg gctgagtacg gactgatccc tctgttcatc 3360

ccctacaccg acagcaacga gcccatcgtg aaagaaatca agtggatgga aaagtcccgg 3420

aaccagagcg tgcggcggct ggataaggac atgttcattc aggccctgga acggttcctg 3480

agctgggaga gctggaacct gaaagtgaaa gaggaatacg agaaggtcga gaaagagtac 3540

aagaccctgg aagagaggat caaagaggac atccaggctc tgaaggctct ggaacagtat 3600

gagaaagagc ggcaagaaca gctgctgcgg gacaccctga acaccaacga gtaccggctg 3660

agcaagagag gccttagagg ctggcgggaa atcatccaga aatggctgaa aatggacgag 3720

aacgagccct ccgagaagta cctggaagtg ttcaaggact accagcggaa gcaccctaga 3780

gaggccggcg attacagcgt gtacgagttc ctgtccaaga aagagaacca cttcatctgg 3840

cggaatcacc ctgagtaccc ctacctgtac gccaccttct gcgagatcga caagaaaaag 3900

aaggacgcca agcagcaggc caccttcaca ctggccgatc ctatcaatca ccctctgtgg 3960

gtccgattcg aggaaagaag cggcagcaac ctgaacaagt acagaatcct gaccgagcag 4020

ctgcacaccg agaagctgaa gaaaaagctg acagtgcagc tggaccggct gatctaccct 4080

acagaatctg gcggctggga agagaagggc aaagtggaca ttgtgctgct gcccagccgg 4140

cagttctaca accagatctt cctggacatc gaggaaaagg gcaagcacgc cttcacctac 4200

aaggatgaga gcatcaagtt ccctctgaag ggcacactcg gcggagccag agtgcagttc 4260

gacagagatc acctgagaag ataccctcac aaggtggaaa gcggcaacgt gggcagaatc 4320

tacttcaaca tgaccgtgaa catcgagcct acagagtccc cagtgtccaa gtctctgaag 4380

atccaccggg acgacttccc caaggtggtc aacttcaagc ccaaagaact gaccgagtgg 4440

atcaaggaca gcaagggcaa gaaactgaag tccggcatcg agtccctgga aatcggcctg 4500

agagtgatga gcatcgacct gggacagaga caggccgctg ccgcctctat tttcgaggtg 4560

gtggatcaga agcccgacat cgaaggcaag ctgtttttcc caatcaaggg caccgagctg 4620

tatgccgtgc acagagccag cttcaacatc aagctgcccg gcgagacact ggtcaagagc 4680

agagaagtgc tgcggaaggc cagagaggac aatctgaaac tgatgaacca gaagctcaac 4740

ttcctgcgga acgtgctgca cttccagcag ttcgaggaca tcaccgagag agagaagcgg 4800

gtcaccaagt ggatcagcag acaagagaac agcgacgtgc ccctggtgta ccaggatgag 4860

ctgatccaga tccgcgagct gatgtacaag ccttacaagg actgggtcgc cttcctgaag 4920

cagctccaca agagactgga agtcgagatc ggcaaagaag tgaagcactg gcggaagtcc 4980

ctgagcgacg gaagaaaggg cctgtacggc atctccctga agaacatcga cgagatcgat 5040

cggacccgga agttcctgct gagatggtcc ctgaggccta ccgaacctgg cgaagtgcgt 5100

agactggaac ccggccagag attcgccatc gaccagctga atcacctgaa cgccctgaaa 5160

gaagatcggc tgaagaagat ggccaacacc atcatcatgc acgccctggg ctactgctac 5220

gacgtgcgga agaagaaatg gcaggctaag aaccccgcct gccagatcat cctgttcgag 5280

gatctgagca actacaaccc ctacggagaa aggtcccgct tcgagaacag ccggctcatg 5340

aagtggtcca gacgcgagat ccccagacag gttgcactgc agggcgagat ctatggcctg 5400

caagtgggag aagtgggcgc tcagttcagc agcagattcc acgccaagac aggcagccct 5460

ggcatcagat gtcgggtcgt gaccaaagag aagctgcagg acaatcggtt cttcaagaat 5520

ctgcagagag agggcagact gaccctggac aaaatcgccg tgctgaaaga gggcgatctg 5580

tacccagaca aaggcggcga gaagttcatc agcctgagca aggatcggaa gtgcgtgacc 5640

acacacgccg acatcaacgc cgctcagaac ctgcagaagc ggttctggac aagaacccac 5700

ggcttctaca aggtgtactg caaggcctac caggtggacg gccagaccgt gtacatccct 5760

gagagcaagg accagaagca gaagatcatc gaagagttcg gcgagggcta cttcattctg 5820

aaggacgggg tgtacgaatg ggtcaacgcc ggcaagctga aaatcaagaa gggcagctcc 5880

aagcagagca gcagcgagct ggtggatagc gacatcctga aagacagctt cgacctggcc 5940

tccgagctga aaggcgaaaa gctgatgctg tacagggacc ccagcggcaa tgtgttcccc 6000

agcgacaaat ggatggccgc tggcgtgttc ttcggaaagc tggaacgcat cctgatcagc 6060

aagctgacca accagtactc catcagcacc atcgaggacg acagcagcaa gcagtctatg 6120

ggatccaaaa ggccggcggc cacgaaaaag gccggccagg caaaaaagaa aaagggatct 6180

tacccatacg atgttccaga ttacgcttat ccctacgacg tgcctgatta tgcataccca 6240

tatgatgtcc ccgactatgc ctaagaattc tgcagatatc cagcacagtg gcggccgctc 6300

gagtctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc tagttgccag 6360

ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 6420

gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 6480

ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 6540

gctggggatg cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg 6600

gggtatcccc acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 6660

agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 6720

tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 6780

ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 6840

cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 6900

tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 6960

tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 7020

caaaaattta acgcgaatta attctgtgga atgtgtgtca gttagggtgt ggaaagtccc 7080

caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 7140

gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 7200

cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 7260

cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 7320

ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 7380

aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca ggatgaggat 7440

cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 7500

ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 7560

ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 7620

atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 7680

cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 7740

cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 7800

atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 7860

aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 7920

tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 7980

tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 8040

tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 8100

atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 8160

accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 8220

gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg accaagcgac 8280

gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt 8340

cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga 8400

gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag 8460

catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 8520

actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga gcttggcgta 8580

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8640

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8700

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8760

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8820

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8880

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaa 8924


<210> 590
<211> 8924
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 590
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 60

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 120

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 180

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 240

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 300

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 360

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 420

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 480

ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 540

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 600

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 660

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 720

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 780

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 840

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 900

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 960

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1020

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1080

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1140

caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1200

gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1260

ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1320

tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1380

caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1440

tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1500

cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1560

ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1620

aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1680

tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 1740

gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 1800

gaaaagtgcc acctgacgtc gacggatcgg gagatctccc gatcccctat ggtgcactct 1860

cagtacaatc tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt 1920

ggaggtcgct gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga 1980

caattgcatg aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc 2040

cagatatacg cgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 2100

attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 2160

tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 2220

aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 2280

cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 2340

taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 2400

gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 2460

tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 2520

tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 2580

cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctct 2640

ctggctaact agagaaccca ctgcttactg gcttatcgaa attaatacga ctcactatag 2700

ggagacccaa gctggctagc gtttaaactt aagcttgcca ccatggcccc aaagaagaag 2760

cggaaggtcg gtatccacgg agtcccagca gccggatccg ccaccagatc cttcatcctg 2820

aagatcgagc ccaacgagga agtgaagaaa ggcctctgga aaacccacga ggtgctgaac 2880

cacggaatcg cctactacat gaatatcctg aagctgatcc ggcaagaggc catctacgag 2940

caccacgagc aggaccccaa gaatcccaag aaggtgtcca aggccgagat ccaggccgag 3000

ctgtgggatt tcgtgctgaa gatgcagaag tgcaacagct tcacacacga ggtggacaag 3060

gacgaggtgt tcaacatcct gagagagctg tacgaggaac tggtgcccag cagcgtggaa 3120

aagaagggcg aagccaacca gctgagcaac aagtttctgt accctctggt ggaccccaac 3180

agccagtctg gaaagggaac agccagcagc ggcagaaagc ccagatggta caacctgaag 3240

attgccggcg atccctcctg ggaagaagag aagaagaagt gggaagaaga taagaaaaag 3300

gacccgctgg ccaagatcct gggcaagctg gctgagtacg gactgatccc tctgttcatc 3360

ccctacaccg acagcaacga gcccatcgtg aaagaaatca agtggatgga aaagtcccgg 3420

aaccagagcg tgcggcggct ggataaggac atgttcattc aggccctgga acggttcctg 3480

agctgggaga gctggaacct gaaagtgaaa gaggaatacg agaaggtcga gaaagagtac 3540

aagaccctgg aagagaggat caaagaggac atccaggctc tgaaggctct ggaacagtat 3600

gagaaagagc ggcaagaaca gctgctgcgg gacaccctga acaccaacga gtaccggctg 3660

agcaagagag gccttagagg ctggcgggaa atcatccaga aatggctgaa aatggacgag 3720

aacgagccct ccgagaagta cctggaagtg ttcaaggact accagcggaa gcaccctaga 3780

gaggccggcg attacagcgt gtacgagttc ctgtccaaga aagagaacca cttcatctgg 3840

cggaatcacc ctgagtaccc ctacctgtac gccaccttct gcgagatcga caagaaaaag 3900

aaggacgcca agcagcaggc caccttcaca ctggccgatc ctatcaatca ccctctgtgg 3960

gtccgattcg aggaaagaag cggcagcaac ctgaacaagt acagaatcct gaccgagcag 4020

ctgcacaccg agaagctgaa gaaaaagctg acagtgcagc tggaccggct gatctaccct 4080

acagaatctg gcggctggga agagaagggc aaagtggaca ttgtgctgct gcccagccgg 4140

cagttctaca accagatctt cctggacatc gaggaaaagg gcaagcacgc cttcacctac 4200

aaggatgaga gcatcaagtt ccctctgaag ggcacactcg gcggagccag agtgcagttc 4260

gacagagatc acctgagaag ataccctcac aaggtggaaa gcggcaacgt gggcagaatc 4320

tacttcaaca tgaccgtgaa catcgagcct acagagtccc cagtgtccaa gtctctgaag 4380

atccaccggg acgacttccc caaggtggtc aacttcaagc ccaaagaact gaccgagtgg 4440

atcaaggaca gcaagggcaa gaaactgaag tccggcatcg agtccctgga aatcggcctg 4500

agagtgatga gcatcgacct gggacagaga caggccgctg ccgcctctat tttcgaggtg 4560

gtggatcaga agcccgacat cgaaggcaag ctgtttttcc caatcaaggg caccgagctg 4620

tatgccgtgc acagagccag cttcaacatc aagctgcccg gcgagacact ggtcaagagc 4680

agagaagtgc tgcggaaggc cagagaggac aatctgaaac tgatgaacca gaagctcaac 4740

ttcctgcgga acgtgctgca cttccagcag ttcgaggaca tcaccgagag agagaagcgg 4800

gtcaccaagt ggatcagcag acaagagaac agcgacgtgc ccctggtgta ccaggatgag 4860

ctgatccaga tccgcgagct gatgtacaag ccttacaagg actgggtcgc cttcctgaag 4920

cagctccaca agagactgga agtcgagatc ggcaaagaag tgaagcactg gcggaagtcc 4980

ctgagcgacg gaagaaaggg cctgtacggc atctccctga agaacatcga cgagatcgat 5040

cggacccgga agttcctgct gagatggtcc ctgaggccta ccgaacctgg cgaagtgcgt 5100

agactggaac ccggccagag attcgccatc gaccagctga atcacctgaa cgccctgaaa 5160

gaagatcggc tgaagaagat ggccaacacc atcatcatgc acgccctggg ctactgctac 5220

gacgtgcgga agaagaaatg gcaggctaag aaccccgcct gccagatcat cctgttcgag 5280

gatctgagca actacaaccc ctacaaggaa aggtcccgct tcgagaacag ccggctcatg 5340

aagtggtcca gacgcgagat ccccagacag gttgcactgc agggcgagat ctatggcctg 5400

caagtgggag aagtgggcgc tcagttcagc agcagattcc acgccaagac aggcagccct 5460

ggcatcagat gtcgggtcgt gaccaaagag aagctgcagg acaatcggtt cttcaagaat 5520

ctgcagagag agggcagact gaccctggac aaaatcgccg tgctgaaaga gggcgatctg 5580

tacccagaca aaggcggcga gaagttcatc agcctgagca aggatcggaa gtgcgtgacc 5640

acacacgccg acatcaacgc cgctcagaac ctgcagaagc ggttctggac aagaacccac 5700

ggcttctaca aggtgtactg caaggcctac caggtggacg gccagaccgt gtacatccct 5760

gagagcaagg accagaagca gaagatcatc gaagagttcg gcgagggcta cttcattctg 5820

aaggacgggg tgtacgaatg ggtcaacgcc ggcaagctga aaatcaagaa gggcagctcc 5880

aagcagagca gcagcgagct ggtggatagc gacatcctga aagacagctt cgacctggcc 5940

tccgagctga aaggcgaaaa gctgatgctg tacagggacc ccagcggcaa tgtgttcccc 6000

agcgacaaat ggatggccgc tggcgtgttc ttcggaaagc tggaacgcat cctgatcagc 6060

aagctgacca accagtactc catcagcacc atcgaggacg acagcagcaa gcagtctatg 6120

ggatccaaaa ggccggcggc cacgaaaaag gccggccagg caaaaaagaa aaagggatct 6180

tacccatacg atgttccaga ttacgcttat ccctacgacg tgcctgatta tgcataccca 6240

tatgatgtcc ccgactatgc ctaagaattc tgcagatatc cagcacagtg gcggccgctc 6300

gagtctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc tagttgccag 6360

ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 6420

gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 6480

ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 6540

gctggggatg cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg 6600

gggtatcccc acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 6660

agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 6720

tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 6780

ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 6840

cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 6900

tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 6960

tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 7020

caaaaattta acgcgaatta attctgtgga atgtgtgtca gttagggtgt ggaaagtccc 7080

caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 7140

gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 7200

cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 7260

cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 7320

ctgcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 7380

aaaagctccc gggagcttgt atatccattt tcggatctga tcaagagaca ggatgaggat 7440

cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 7500

ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 7560

ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 7620

atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 7680

cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 7740

cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 7800

atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 7860

aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 7920

tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 7980

tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 8040

tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 8100

atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 8160

accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 8220

gccttcttga cgagttcttc tgagcgggac tctggggttc gaaatgaccg accaagcgac 8280

gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt 8340

cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga 8400

gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag 8460

catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 8520

actcatcaat gtatcttatc atgtctgtat accgtcgacc tctagctaga gcttggcgta 8580

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8640

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8700

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8760

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8820

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8880

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaa 8924


<210> 591
<211> 31
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 591
gagaagtcat ttaataaggc cactgttaaa a 31


<210> 592
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 592
agacccagag gctcaagtga gca 23


<210> 593
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 593
agctgaaggg aaataaaagg aaa 23


<210> 594
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 594
tctcccctgg gaagcatccc tgg 23


<210> 595
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 595
tcatggagaa aatattcaga atc 23


<210> 596
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 596
cctcactcct gctcggtgaa ttt 23


<210> 597
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 597
aggagtgttc agtctccgtg aac 23


<210> 598
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 598
ggaggtcaga aatagggggt cca 23


<210> 599
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 599
caaagcccat tccctcttta gcc 23


<210> 600
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 600
cccttcagct aaaataaagg agg 23


<210> 601
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 601
ttctcccctg ggaagcatcc ctg 23


<210> 602
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 602
tgcagagcaa ataccagaga taa 23


<210> 603
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 603
cgccgggccc tgaccacgct cat 23


<210> 604
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 604
ccgacttcat ctttgccaac gtc 23


<210> 605
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 605
tagagcactg gcatggggat ggg 23


<210> 606
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 606
ttgctccaga ggcccccctt ggg 23


<210> 607
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 607
ctggtgccag aaacaggggt gac 23


<210> 608
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 608
tgggcttcaa gcaacttgta gtg 23


<210> 609
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 609
tgtaattggt tctaccaaag aag 23


<210> 610
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 610
agaggcggag ggcggcgtgc ctg 23


<210> 611
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 611
cttcagccca agaacagtac aag 23


<210> 612
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 612
tctgtgagtc gaggagaaac gac 23


<210> 613
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 613
cttgggtgtg ttaaaagtga cca 23


<210> 614
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 614
tcactcctgc tcggtgaatt 20


<210> 615
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 615
gctacaggca gagacaaagg 20


<210> 616
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 616
aggtcagaaa tagggggtcc 20


<210> 617
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 617
caggctgtga accttggtgg 20


<210> 618
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 618
gaccccctcc accccgcctc 20


<210> 619
<211> 21
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 619
gtatctagcc tcttctaaga c 21


<210> 620
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 620
tctcccctgg gaagcatccc 20


<210> 621
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 621
gagtccgagc agaagaagaa 20


<210> 622
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 622
ttttgggagt aagaaaaggt 20


<210> 623
<211> 20
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 623
agtgtccagg gatgcttccc 20


<210> 624
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 624
cctcactcct gctcggtgaa ttt 23


<210> 625
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 625
ggaggtcaga aatagggggt cca 23


<210> 626
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 626
gatggcgact tcaggcacag gat 23


<210> 627
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 627
ggaagtgtcc agggatgctt ccc 23


<210> 628
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 628
cccttcagct aaaataaagg agg 23


<210> 629
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 629
ggctcagcag gcacctgcct cag 23


<210> 630
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 630
gggactggag ttgcttcatg tac 23


<210> 631
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 631
tctccatgaa aaatactggg gtc 23


<210> 632
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 632
ttcatggaga aaatattcag aat 23


<210> 633
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 633
gcagctacag gcagagacaa agg 23


<210> 634
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 634
cctggaaacc atccaggcct tgt 23


<210> 635
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 635
ggtcagctgt taacatcagt acg 23


<210> 636
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 636
tcttcacgga aacagggttc ctt 23


<210> 637
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 637
tggttgccca ccctagtcat tgg 23


<210> 638
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 638
gatggcgact tcaggcacag gat 23


<210> 639
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 639
cctcactcct gctcggtgaa ttt 23


<210> 640
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 640
ggaagtgtcc agggatgctt ccc 23


<210> 641
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 641
ggctcagcag gcacctgcct cag 23


<210> 642
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 642
ttcatggaga aaatattcag aat 23


<210> 643
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 643
ctgacctccc aaacagctac ata 23


<210> 644
<211> 47
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(1)
<223> 5' posphorylated

<400> 644
gttgtgagca agggcgagga ggataacgcc tctctcccag cgactat 47


<210> 645
<211> 47
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide


<220>
<221> misc_feature
<222> (1)..(1)
<223> 5' phosphorylate

<400> 645
atagtcgctg ggagagaggc gttatcctcc tcgcccttgc tcacaac 47


<210> 646
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 646
tactttagag cgaaaggctt ttc 23


<210> 647
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 647
agataccaaa gagaacggga tca 23


<210> 648
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 648
tgacttcact gtaactggga gag 23


<210> 649
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 649
tctcccagga agggcagcag gct 23


<210> 650
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 650
tagacgtgga gatcattttt aac 23


<210> 651
<211> 49
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 651
aataaaatat ctttattttc attacatctg tgtgttggtt ttttgtgtg 49


<210> 652
<211> 208
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 652
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180

gggaagagaa tagcaggcat gctgggga 208


<210> 653
<211> 1190
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 653

Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15


Ala Ala Val Lys Ser Met Lys Val Lys Leu Arg Leu Asp Asn Met Pro
20 25 30


Glu Ile Arg Ala Gly Leu Trp Lys Leu His Thr Glu Val Asn Ala Gly
35 40 45


Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
50 55 60


Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Tyr Lys Thr
65 70 75 80


Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
85 90 95


Val Glu Asn Gly His Cys Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
100 105 110


Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
115 120 125


Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
130 135 140


Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
145 150 155 160


Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
165 170 175


Glu Glu Lys Ala Lys Ala Glu Ala Arg Lys Ser Thr Asp Arg Thr Ala
180 185 190


Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
195 200 205


Val Tyr Thr Asp Ser Asp Met Ser Ser Val Gln Trp Lys Pro Leu Arg
210 215 220


Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
225 230 235 240


Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Glu
245 250 255


Ala Tyr Ala Lys Leu Val Glu Gln Lys Ser Arg Phe Glu Gln Lys Asn
260 265 270


Phe Val Gly Gln Glu His Leu Val Gln Leu Val Asn Gln Leu Gln Gln
275 280 285


Asp Met Lys Glu Ala Ser His Gly Leu Glu Ser Lys Glu Gln Thr Ala
290 295 300


His Tyr Leu Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
305 310 315 320


Lys Trp Glu Lys Leu Asp Pro Asp Ala Pro Phe Asp Leu Tyr Asp Thr
325 330 335


Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
340 345 350


Asp Leu Phe Ala Lys Leu Ala Glu Pro Lys Tyr Gln Ala Leu Trp Arg
355 360 365


Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Val
370 375 380


Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
385 390 395 400


Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
405 410 415


Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Gly Arg His
420 425 430


Ala Ile Arg Phe Gln Lys Leu Leu Thr Val Glu Asp Gly Val Ala Lys
435 440 445


Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Ala Gln Leu Asp
450 455 460


Asp Leu Leu Pro Arg Asp Pro His Glu Leu Val Ala Leu Tyr Phe Gln
465 470 475 480


Asp Tyr Gly Ala Glu Gln His Leu Ala Gly Glu Phe Gly Gly Ala Lys
485 490 495


Ile Gln Tyr Arg Arg Asp Gln Leu Asn His Leu His Ala Arg Arg Gly
500 505 510


Ala Arg Asp Val Tyr Leu Asn Leu Ser Val Arg Val Gln Ser Gln Ser
515 520 525


Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
530 535 540


Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
545 550 555 560


Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
565 570 575


Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
580 585 590


Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
595 600 605


Asn Ser Glu Gly Arg Val Pro Phe Cys Phe Pro Ile Glu Gly Asn Glu
610 615 620


Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
625 630 635 640


Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
645 650 655


Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
660 665 670


Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
675 680 685


Leu Ile Glu Gln Pro Met Asp Ala Asn Gln Met Thr Pro Asp Trp Arg
690 695 700


Glu Ala Phe Glu Asp Glu Leu Gln Lys Leu Lys Ser Leu Tyr Gly Ile
705 710 715 720


Cys Gly Asp Arg Glu Trp Thr Glu Ala Val Tyr Glu Ser Val Arg Arg
725 730 735


Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp Val
740 745 750


Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Gln Lys Asp Val Val
755 760 765


Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr Lys
770 775 780


Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val Ile
785 790 795 800


Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His Ile
805 810 815


Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile Ile
820 825 830


Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Asp Glu Arg Gly Lys
835 840 845


Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
850 855 860


Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
865 870 875 880


Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Leu
885 890 895


Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
900 905 910


Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
915 920 925


Arg Arg Val Pro Ala Arg Cys Ala Arg Glu Gln Asn Pro Glu Pro Phe
930 935 940


Pro Trp Trp Leu Asn Lys Phe Val Ala Glu His Lys Leu Asp Gly Cys
945 950 955 960


Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Phe Phe
965 970 975


Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
980 985 990


Asp Leu Asn Ala Ala Gln Asn Leu Gln Arg Arg Leu Trp Ser Asp Phe
995 1000 1005


Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp
1010 1015 1020


Gly Glu Pro Val Leu Ile Pro Arg Thr Thr Gly Lys Arg Thr Ala
1025 1030 1035


Asp Ser Tyr Gly Asn Lys Val Phe Tyr Thr Lys Thr Gly Val Thr
1040 1045 1050


Tyr Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala
1055 1060 1065


Gln Glu Glu Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala
1070 1075 1080


Asp Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser
1085 1090 1095


Gly Ile Ile Asn Arg Gly Asp Trp Thr Arg Gln Lys Glu Phe Trp
1100 1105 1110


Ser Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile
1115 1120 1125


Arg Ser Arg Val Arg Leu Gln Glu Ser Ala Cys Glu Asn Thr Gly
1130 1135 1140


Asp Ile Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1145 1150 1155


Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr
1160 1165 1170


Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp
1175 1180 1185


Tyr Ala
1190


<210> 654
<211> 7584
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 654
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggg gctggaagct acctttgaca tcatttcctc 180

tgcgaatgca tgtataattt ctacagaacc tattagaaag gatcacccag cctctgcttt 240

tgtacaactt tcccttaaaa aactgccaat tccactgctg tttggcccaa tagtgagaac 300

tttttcctgc tgcctcttgg tgcttttgcc tatggcccct attctgcctg ctgaagacac 360

tcttgccagc atggacttaa acccctccag ctctgacaat cctctttctc ttttgtttta 420

catgaagggt ctggcagcca aagcaatcac tcaaagttca aaccttatca ttttttgctt 480

tgttcctctt ggccttggtt ttgtacatca gctttgaaaa taccatccca gggttaatgc 540

tggggttaat ttataactaa gagtgctcta gttttgcaat acaggacatg ctataaaaat 600

ggaaagatac cggtgccaca agaggtaagg gtttaaggga tggttggttg gtggggtatt 660

aatgtttaat tacctggagc acctgcctga aatcactttt tttcaggttg gcatggcccc 720

aaagaagaag cggaaggtcg gtatccacgg agtcccagca gccgccacca gatccttcat 780

cctgaagatc gagcccaacg aggaagtgaa gaaaggcctc tggaaaaccc acgaggtgct 840

gaaccacgga atcgcctact acatgaatat cctgaagctg atccggcaag aggccatcta 900

cgagcaccac gagcaggacc ccaagaatcc caagaaggtg tccaaggccg agatccaggc 960

cgagctgtgg gatttcgtgc tgaagatgca gaagtgcaac agcttcacac acgaggtgga 1020

caaggacgag gtgttcaaca tcctgagaga gctgtacgag gaactggtgc ccagcagcgt 1080

ggaaaagaag ggcgaagcca accagctgag caacaagttt ctgtaccctc tggtggaccc 1140

caacagccag tctggaaagg gaacagccag cagcggcaga aagcccagat ggtacaacct 1200

gaagattgcc ggcgatccct cctgggaaga agagaagaag aagtgggaag aagataagaa 1260

aaaggacccg ctggccaaga tcctgggcaa gctggctgag tacggactga tccctctgtt 1320

catcccctac accgacagca acgagcccat cgtgaaagaa atcaagtgga tggaaaagtc 1380

ccggaaccag agcgtgcggc ggctggataa ggacatgttc attcaggccc tggaacggtt 1440

cctgagctgg gagagctgga acctgaaagt gaaagaggaa tacgagaagg tcgagaaaga 1500

gtacaagacc ctggaagaga ggatcaaaga ggacatccag gctctgaagg ctctggaaca 1560

gtatgagaaa gagcggcaag aacagctgct gcgggacacc ctgaacacca acgagtaccg 1620

gctgagcaag agaggcctta gaggctggcg ggaaatcatc cagaaatggc tgaaaatgga 1680

cgagaacgag ccctccgaga agtacctgga agtgttcaag gactaccagc ggaagcaccc 1740

tagagaggcc ggcgattaca gcgtgtacga gttcctgtcc aagaaagaga accacttcat 1800

ctggcggaat caccctgagt acccctacct gtacgccacc ttctgcgaga tcgacaagaa 1860

aaagaaggac gccaagcagc aggccacctt cacactggcc gatcctatca atcaccctct 1920

gtgggtccga ttcgaggaaa gaagcggcag caacctgaac aagtacagaa tcctgaccga 1980

gcagctgcac accgagaagc tgaagaaaaa gctgacagtg cagctggacc ggctgatcta 2040

ccctacagaa tctggcggct gggaagagaa gggcaaagtg gacattgtgc tgctgcccag 2100

ccggcagttc tacaaccaga tcttcctgga catcgaggaa aagggcaagc acgccttcac 2160

ctacaaggat gagagcatca agttccctct gaagggcaca ctcggcggag ccagagtgca 2220

gttcgacaga gatcacctga gaagataccc tcacaaggtg gaaagcggca acgtgggcag 2280

aatctacttc aacatgaccg tgaacatcga gcctacagag tccccagtgt ccaagtctct 2340

gaagatccac cgggacgact tccccaaggt ggtcaacttc aagcccaaag aactgaccga 2400

gtggatcaag gacagcaagg gcaagaaact gaagtccggc atcgagtccc tggaaatcgg 2460

cctgagagtg atgagcatcg acctgggaca gagacaggcc gctgccgcct ctattttcga 2520

ggtggtggat cagaagcccg acatcgaagg caagctgttt ttcccaatca agggcaccga 2580

gctgtatgcc gtgcacagag ccagcttcaa catcaagctg cccggcgaga cactggtcaa 2640

gagcagagaa gtgctgcgga aggccagaga ggacaatctg aaactgatga accagaagct 2700

caacttcctg cggaacgtgc tgcacttcca gcagttcgag gacatcaccg agagagagaa 2760

gcgggtcacc aagtggatca gcagacaaga gaacagcgac gtgcccctgg tgtaccagga 2820

tgagctgatc cagatccgcg agctgatgta caagccttac aaggactggg tcgccttcct 2880

gaagcagctc cacaagagac tggaagtcga gatcggcaaa gaagtgaagc actggcggaa 2940

gtccctgagc gacggaagaa agggcctgta cggcatctcc ctgaagaaca tcgacgagat 3000

cgatcggacc cggaagttcc tgctgagatg gtccctgagg cctaccgaac ctggcgaagt 3060

gcgtagactg gaacccggcc agagattcgc catcgaccag ctgaatcacc tgaacgccct 3120

gaaagaagat cggctgaaga agatggccaa caccatcatc atgcacgccc tgggctactg 3180

ctacgacgtg cggaagaaga aatggcaggc taagaacccc gcctgccaga tcatcctgtt 3240

cgaggatctg agcaactaca acccctacga ggaaaggtcc cgcttcgaga acagcaagct 3300

catgaagtgg tccagacgcg agatccccag acaggttgca ctgcagggcg agatctatgg 3360

cctgcaagtg ggagaagtgg gcgctcagtt cagcagcaga ttccacgcca agacaggcag 3420

ccctggcatc agatgtagcg tcgtgaccaa agagaagctg caggacaatc ggttcttcaa 3480

gaatctgcag agagagggca gactgaccct ggacaaaatc gccgtgctga aagagggcga 3540

tctgtaccca gacaaaggcg gcgagaagtt catcagcctg agcaaggatc ggaagtgcgt 3600

gaccacacac gccgacatca acgccgctca gaacctgcag aagcggttct ggacaagaac 3660

ccacggcttc tacaaggtgt actgcaaggc ctaccaggtg gacggccaga ccgtgtacat 3720

ccctgagagc aaggaccaga agcagaagat catcgaagag ttcggcgagg gctacttcat 3780

tctgaaggac ggggtgtacg aatgggtcaa cgccggcaag ctgaaaatca agaagggcag 3840

ctccaagcag agcagcagcg agctggtgga tagcgacatc ctgaaagaca gcttcgacct 3900

ggcctccgag ctgaaaggcg aaaagctgat gctgtacagg gaccccagcg gcaatgtgtt 3960

ccccagcgac aaatggatgg ccgctggcgt gttcttcgga aagctggaac gcatcctgat 4020

cagcaagctg accaaccagt actccatcag caccatcgag gacgacagca gcaagcagtc 4080

tatgaaaagg ccggcggcca cgaaaaaggc cggccaggca aaaaagaaaa agggatccta 4140

cccatacgat gttccagatt acgcttatcc ctacgacgtg cctgattatg catacccata 4200

tgatgtcccc gactatgcct aagaattcct agagctcgct gatcagcctc gactgtgcct 4260

tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 4320

gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 4380

tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagag 4440

aatagcaggc atgctgggga cggccaaaaa aagagaccat atatggtctc cgtgctaatg 4500

cctcgtaaga gacatcgtcc agcaatagga gtttctcaca ccctgcagca cttatagcta 4560

gacggttgtc ctgaccaaaa gacagaaccg gtgtttcgtc ctttccacaa gatatataaa 4620

gccaagaaat cgaaatactt tcaagttacg gtaagcatat gatagtccat tttaaaacat 4680

aattttaaaa ctgcaaacta cccaagaaat tattactttc tacgtcacgt attttgtact 4740

aatatctttg tgtttacagt caaattaatt ccaattatct ctctaacagc cttgtatcgt 4800

atatgcaaat atgaaggaat catgggaaat aggccctcgc ggccgcagga acccctagtg 4860

atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 4920

gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc 4980

ctgcaggggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 5040

atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 5100

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 5160

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 5220

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgatttgg 5280

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 5340

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 5400

cgggctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 5460

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaattttat 5520

ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc 5580

caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag 5640

ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg 5700

cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg 5760

tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat 5820

ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc 5880

aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct 5940

tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag 6000

atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta 6060

agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc 6120

tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca 6180

tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg 6240

atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg 6300

ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca 6360

tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa 6420

acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa 6480

ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata 6540

aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat 6600

ctggagccgg tgagcgtgga agccgcggta tcattgcagc actggggcca gatggtaagc 6660

cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata 6720

gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt 6780

actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 6840

agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 6900

cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 6960

tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 7020

agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 7080

tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 7140

acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 7200

ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 7260

gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 7320

gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 7380

gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 7440

tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 7500

caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 7560

tttgctggcc ttttgctcac atgt 7584


<210> 655
<211> 7495
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 655
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcctcta gactcgaggg gctggaagct acctttgaca tcatttcctc 180

tgcgaatgca tgtataattt ctacagaacc tattagaaag gatcacccag cctctgcttt 240

tgtacaactt tcccttaaaa aactgccaat tccactgctg tttggcccaa tagtgagaac 300

tttttcctgc tgcctcttgg tgcttttgcc tatggcccct attctgcctg ctgaagacac 360

tcttgccagc atggacttaa acccctccag ctctgacaat cctctttctc ttttgtttta 420

catgaagggt ctggcagcca aagcaatcac tcaaagttca aaccttatca ttttttgctt 480

tgttcctctt ggccttggtt ttgtacatca gctttgaaaa taccatccca gggttaatgc 540

tggggttaat ttataactaa gagtgctcta gttttgcaat acaggacatg ctataaaaat 600

ggaaagatac cggtgccacc atggccccaa agaagaagcg gaaggtcggt atccacggag 660

tcccagcagc cgccatccgg tccatcaagc tgaagatgaa gaccaacagc ggcaccgaca 720

gcatctacct gagaaaagcc ctgtggcgga cccaccagct gatcaatgag ggaatcgcct 780

actacatgaa cctgctgacc ctgtaccggc aagaggccat cggcgacaag accaaagaag 840

cctatcaggc cgagctgatt aacatcatcc ggaaccagca gcggaacaac ggcagctctg 900

aggaacacgg ctccgaccaa gaaattctgg ccctgctgag acagctgtac gagctgatca 960

tccccagcag catcggcgaa tctggcgacg ctaatcagct gggcaacaag tttctgtacc 1020

ctctggtgga ccccaacagc cagtctggca agggcacatc taacgccggc agaaagccca 1080

gatggaagcg gctgaaagag gaaggcaacc ccgactggga actcgagaag aagaaggacg 1140

aggaacgcaa ggccaaggat cccaccgtga agatctttga caacctgaac aaatacggcc 1200

tgctgcctct gttcccactg ttcaccaaca tccagaaaga catcgagtgg ctgcccctgg 1260

gcaagagaca gtctgtgcgg aagtgggaca aagacatgtt catccaggcc atcgagagac 1320

tgctgagctg ggagagctgg aacagaagag tggccgacga gtacaaacag ctgaaagaaa 1380

agaccgagag ctactacaaa gagcacctga caggcggcga ggaatggatc gagaagatcc 1440

ggaagttcga gaaagaacgg aacatggaac tggaaaagaa cgccttcgct cccaacgacg 1500

gctacttcat caccagcaga cagatcagag gctgggacag agtgtacgag aagtggtcca 1560

agctgcccga gtctgctagc cctgaggaac tgtggaaagt ggtggccgag cagcagaaca 1620

agatgtccga aggcttcggc gaccccaagg tgttcagctt cctggccaac agagagaacc 1680

gggacatttg gagaggccac agcgagcgga tctaccacat tgccgcctac aacggcctgc 1740

agaagaagct gagccggacc aaagagcagg ccaccttcac actgcctgac gccattgaac 1800

accctctgtg gatcagatac gagagccctg gcggcaccaa cctgaatctg ttcaagctgg 1860

aagagaaaca gaaaaagaac tactacgtga ccctgagcaa gatcatctgg cccagcgagg 1920

aaaagtggat tgagaaagag aacatcgaga tccctctggc tcccagcatc cagttcaacc 1980

ggcagattaa gctgaagcag cacgtgaagg gcaagcaaga gatcagcttc agcgactaca 2040

gcagccggat cagcctggat ggtgttctcg gcggcagcag aatccagttt aatcggaagt 2100

acatcaagaa ccacaaagag ctgctcggag agggcgacat cggccccgtg ttctttaacc 2160

tggtggtgga tgtggcccct ctgcaagaaa ccagaaacgg cagactgcag agccccatcg 2220

gcaaggccct gaaagtgatc agcagcgact tctccaaagt gatcgactac aagccgaaag 2280

aactcatgga ttggatgaat accggcagcg ccagcaacag ctttggagtg gcttctctgc 2340

tggaaggcat gagagtgatg agcatcgaca tgggccagag aaccagcgcc tccgtgtcca 2400

tcttcgaggt cgtgaaagaa ctgcccaagg atcaagagca gaagctgttc tacagcatca 2460

acgacaccga gctgttcgcc atccacaagc ggagctttct gctgaacctg cctggcgagg 2520

tggtcaccaa gaacaacaag cagcagcggc aagagcggcg gaaaaagcgg cagtttgtgc 2580

ggagccagat cagaatgctg gccaacgtgc tgcggctgga aacaaagaaa acccctgacg 2640

agcggaagaa ggccattcac aagctgatgg aaatcgtgca gagctacgac agctggaccg 2700

ccagccagaa agaagtgtgg gagaaagagc tgaatctcct gaccaacatg gccgccttca 2760

atgacgagat ctggaaagaa agcctggtgg aactgcacca ccggatcgag ccttacgtgg 2820

gacagatcgt gtccaagtgg cggaagggcc tgtctgaggg cagaaagaat ctggccggca 2880

tcagcatgtg gaacatcgac gaactggaag ataccaggcg gctgctgatt tcctggtcca 2940

agagaagcag aaccccaggc gaggccaaca ggatcgaaac cgatgagcct ttcggcagca 3000

gcctgctcca gcacattcag aacgtgaagg acgacagact gaagcagatg gccaacctga 3060

tcatcatgac agccctgggc tttaagtacg acaaagagga aaaggaccgg tacaagcggt 3120

ggaaagagac ataccccgcc tgccagatca tcctgttcga gaacctgaac cgctacctgt 3180

tcaacctcga ccggtccaga cgcgagaaca gcagactgat gaagtgggcc catcggagca 3240

tccccagaac cgtgtctatg cagggcgaga tgttcggcct gcaagtgggc gacgttcgga 3300

gcgagtacag ctccagattc cacgccaaaa caggcgcccc tggcatcaga tgtcacgccc 3360

tgactgaaga ggatctgaag gccggcagca acaccctgaa gagactgatc gaggacggct 3420

tcatcaatga gagcgagctg gcctacctga agaagggcga tatcatccct agccaaggcg 3480

gcgaactgtt cgtgacactg tccaagcggt acaagaagga cagcgacaac aacgagctga 3540

ccgtgatcca cgccgacatc aacgccgctc agaatctgca gaagcggttt tggcagcaaa 3600

acagcgaggt gtacagagtg ccctgtcagc tggccagaat gggcgaagat aagctgtaca 3660

tccccaagag ccagaccgag acaatcaaga agtatttcgg caagggctcc ttcgtgaaga 3720

acaataccga acaagaggtc tacaagtggg agaagtccga gaaaatgaag atcaagacgg 3780

acaccacctt cgacctgcaa gacctggatg gcttcgagga catcagcaag accattgagc 3840

tggcacaaga gcagcaaaag aaatacctga ccatgttcag ggaccccagc ggctactttt 3900

tcaacaatga gacatggcgg cctcaaaaag aatactggtc catcgtgaac aacatcatca 3960

agagctgcct caagaagaag atcctgagca acaaggtcga gctgaaaagg ccggcggcca 4020

cgaaaaaggc cggccaggca aaaaagaaaa agggatccta cccatacgat gttccagatt 4080

acgcttatcc ctacgacgtg cctgattatg catacccata tgatgtcccc gactatgcct 4140

aagaattcct agagctcgct gatcagcctc gactgtgcct tctagttgcc agccatctgt 4200

tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 4260

ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 4320

tggggtgggg caggacagca agggggagga ttgggaagag aatagcaggc atgctgggga 4380

cggccaaaaa aagagaccat atatggtctc cgtgccaagc acctgttttc aggtgctcct 4440

gtggtgggta atttttaatt acttatggca cacgcacaga ttcattgacc ctataggtcc 4500

ggtgtttcgt cctttccaca agatatataa agccaagaaa tcgaaatact ttcaagttac 4560

ggtaagcata tgatagtcca ttttaaaaca taattttaaa actgcaaact acccaagaaa 4620

ttattacttt ctacgtcacg tattttgtac taatatcttt gtgtttacag tcaaattaat 4680

tccaattatc tctctaacag ccttgtatcg tatatgcaaa tatgaaggaa tcatgggaaa 4740

taggccctcg cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4800

tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4860

ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcctgatgc ggtattttct 4920

ccttacgcat ctgtgcggta tttcacaccg catacgtcaa agcaaccata gtacgcgccc 4980

tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt 5040

gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc 5100

ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta 5160

cggcacctcg accccaaaaa acttgatttg ggtgatggtt cacgtagtgg gccatcgccc 5220

tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg 5280

ttccaaactg gaacaacact caaccctatc tcgggctatt cttttgattt ataagggatt 5340

ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 5400

tttaacaaaa tattaacgtt tacaatttta tggtgcactc tcagtacaat ctgctctgat 5460

gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 5520

tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 5580

cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 5640

tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 5700

ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 5760

ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 5820

attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 5880

gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 5940

ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 6000

cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 6060

gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 6120

tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 6180

gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 6240

ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 6300

tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 6360

gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 6420

caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 6480

cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg aagccgcggt 6540

atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 6600

gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 6660

attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 6720

cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 6780

atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 6840

tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 6900

ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 6960

ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 7020

cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 7080

gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 7140

gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 7200

acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 7260

gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 7320

agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 7380

tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 7440

agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 7495


<210> 656
<211> 14
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 656
ccgcgaaugg acac 14


<210> 657
<211> 25
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 657
tagatgaatt aaatgtgatt agcac 25


<210> 658
<211> 25
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 658
agcgagcggt ctgagaagtg gcact 25


<210> 659
<211> 23
<212> DNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 659
gcagaaataa tgatgattgg cac 23


<210> 660
<211> 36
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 660
gucggaucgu ugagcgggcg aucugagaag uggcac 36


<210> 661
<211> 21
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 661
gggcgaucug agaaguggca c 21


<210> 662
<211> 20
<212> RNA
<213> Artificial Sequence

<220>
<223> Synthetic Oligonucleotide

<400> 662
augauacgag gcauuagcac 20


<210> 663
<211> 102
<212> PRT
<213> Artificial Sequence

<220>
<223> Synthetic Peptide

<400> 663

Ser Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala
1 5 10 15


Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg
20 25 30


Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu
35 40 45


Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val
50 55 60


Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr
65 70 75 80


Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys
85 90 95


Glu Leu Tyr Phe Tyr His
100

Claims (85)

  1. i)表1または表2に記載のCas12bエフェクタータンパク質、および
    ii)標的配列にハイブリダイズ可能なガイド配列を含むガイド
    を含む非天然起源または遺伝子操作されたシステム。
  2. アリシクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis)、バチルス属種V3-13(Bacillus sp. V3-13)、バチルス・ヒサシイ(Bacillus hisashii)、レンティスファエラ・バクテリウム(Lentisphaeria bacterium)、およびラセエラ・セデミニス(Laceyella sediminis)からなる群から選択される細菌に由来する、請求項1のシステム。
  3. トランス活性化型クリスパーRNA(tracr RNA)は直接反復配列の5’末端においてクリスパーRNA(crRNA)に融合している、請求項1のシステム。
  4. 2つの異なる標的配列または同じ標的配列の異なる領域をハイブリダイズさせることが可能な2つ以上のガイド配列を含む、請求項1のシステム。
  5. 前記ガイド配列は原核細胞中の1つ以上の標的配列にハイブリダイズする、請求項1のシステム。
  6. 前記ガイド配列は真核細胞中の1つ以上の標的配列にハイブリダイズする、請求項1のシステム。
  7. 前記Cas12bエフェクタータンパク質は1つ以上の核局在化シグナル(NLS)を含む、請求項1のシステム。
  8. 前記Cas12bエフェクタータンパク質は触媒的に不活性である、請求項1のシステム。
  9. 前記Cas12bエフェクタータンパク質は1つ以上の機能ドメインと会合している、請求項1のシステム。
  10. 前記1つ以上の機能ドメインは前記1つ以上の標的DNA配列を切断する、請求項9のシステム。
  11. 前記機能ドメインは前記1つ以上の標的配列の転写または翻訳を改変する、請求項10のシステム。
  12. 前記Cas12bエフェクタータンパク質は1つ以上の機能ドメインと会合しており、かつ、前記Cas12bエフェクタータンパク質はリゾルバーゼ(RuvC)ドメインおよび/またはヌクレアーゼ(Nuc)ドメイン内に1つ以上の変異を含み、これにより、形成されたCRISPR複合体は、標的配列にあるか標的配列に隣接する後生修飾因子または転写もしくは翻訳活性化もしくは抑制シグナルを送達することができる、請求項1のシステム。
  13. 前記Cas12bエフェクタータンパク質はアデノシン脱アミノ酵素またはシチジン脱アミノ酵素と会合している、請求項1のシステム。
  14. 更に組換え鋳型を含む、請求項1のシステム。
  15. 前記組換え鋳型は相同性指向修復(HDR)により挿入されている、
    請求項14のシステム。
  16. 更にtracr RNAを含む、請求項1のシステム。
  17. 表1または表2に記載のCas12bエフェクタータンパク質をコードするヌクレオチド配列に操作可能に結合している第1の調節エレメント、ならびに
    i)a)ガイド配列をコードするヌクレオチド配列に操作可能に結合している第2の調節エレメント、およびb)tracr RNAをコードするヌクレオチド配列に操作可能に結合している第3の調節エレメント、または
    ii)ガイド配列およびtracr RNAをコードするヌクレオチド配列に操作可能に結合している第2の調節エレメント、
    を含む1種以上のベクターを含む、Cas12bベクターシステム。
  18. Cas12bエフェクタータンパク質をコードするヌクレオチド配列は真核細胞内での発現のために最適化されたコドンである、請求項17のベクターシステム。
  19. 単一のベクター内に含まれる、請求項17または18のベクターシステム。
  20. 前記1種以上のベクターはウイルスベクターを含む、請求項17から19のいずれかのベクターシステム。
  21. 前記1種以上のベクターは、1種以上のレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、または単純ヘルペスウイルスベクターを含む、請求項17から20のいずれかのベクターシステム。
  22. i)表1または表2に記載のCas12bエフェクタータンパク質、
    ii)1つ以上の標的配列にハイブリダイズ可能なガイド配列、および
    iii)tracr RNA
    を含む、非天然起源または遺伝子操作された組成物のCas12bエフェクタータンパク質および1種以上の核酸成分を送達するように構成された送達システム。
  23. 1種以上のベクターまたは1種以上のポリヌクレオチド分子を含む、請求項22の送達システムであって、前記1種以上のベクターまたは1種以上のポリヌクレオチド分子は、非天然起源または遺伝子操作された組成物のCas12bエフェクタータンパク質および1種以上の核酸成分をコードする1種以上のポリヌクレオチド分子を含む、請求項22の送達システム。
  24. リポソーム、粒子、エキソソーム、微少胞、遺伝子銃、またはウイルスベクターを含む送達媒介物を含む、請求項22または23の送達システム。
  25. 治療的処置方法に使用するための、請求項1から16の非天然起源または遺伝子操作されたシステム、請求項17から21のベクターシステム、もしくは請求項22から24の送達システム。
  26. 1つ以上の関心のある標的配列を、
    i)表1または表2に記載のCas12bエフェクタータンパク質、
    ii)1つ以上の標的配列にハイブリダイズ可能なガイド配列、および
    iii)tracr RNA
    を含む1種以上の非天然起源または遺伝子操作された組成物と接触させることを含み、
    これにより、前記crRNAおよびtracr RNAと複合化したCas12bエフェクタータンパク質を含むCRISPR複合体が形成され、前記ガイド配列は細胞中の1つ以上の標的配列への配列特異的結合を導き、それにより前記1つ以上の標的配列の発現を改変する、
    1つ以上の標的配列を改変する方法。
  27. 前記1つ以上の標的配列を改変することは前記1つ以上の標的配列を切断することを含む、請求項26の方法。
  28. 前記1つ以上の標的配列を改変することは前記1つ以上の標的配列の発現を増強あるいは減弱させることを含む、請求項26または27の方法。
  29. 前記組成物は組換え鋳型を更に含み、前記1つ以上の標的配列を改変することは組換え鋳型またはその一部の挿入を含む、請求項28の方法。
  30. 前記1つ以上の標的配列は原核細胞内にある、請求項26から29のいずれかの方法。
  31. 前記1つ以上の標的配列は真核細胞内にある、請求項26から30のいずれかの方法。
  32. 1つ以上の標的配列が、請求項23から29のいずれかの方法により改変されており、必要に応じて治療用T細胞または抗体生成B細胞であるか、又は細胞が植物細胞である、1つ以上の標的配列を含む細胞またはその後代。
  33. 前記細胞は原核細胞である、請求項32の細胞。
  34. 前記細胞は真核細胞である、請求項32の細胞。
  35. 前記1つ以上の標的配列の改変は、
    少なくとも1つの遺伝子産物の発現の変化を含む細胞、
    少なくとも1つの遺伝子産物の発現の変化を含み、この少なくとも1つの遺伝子産物の発現が増強した細胞、
    少なくとも1つの遺伝子産物の発現の変化を含み、この少なくとも1つの遺伝子産物の発現が減弱した細胞、または
    内因性または非内因性の生物学的産物または化合物を産生かつ/あるいは分泌する細胞または集団
    をもたらす、請求項32から34のいずれかに記載の細胞。
  36. 前記細胞は哺乳動物の細胞またはヒト細胞である、請求項32または35のいずれか1項に記載の真核細胞。
  37. 請求項32から36のいずれか1項に記載の細胞の細胞株又は前記細胞を含む細胞株もしくはそれらの後代。
  38. 請求項32から36のいずれか1項に記載の1つ以上の細胞を含む多細胞生物。
  39. 請求項32から36のいずれか1項に記載の1つ以上の細胞を含む植物または動物モデル。
  40. 請求項32から36のいずれか1項の細胞、請求項37の細胞株、請求項38の生物、または請求項39の植物もしくは動物モデルからの遺伝子産物。
  41. 前記発現された遺伝子産物の量は発現が変化していない細胞からの遺伝子産物の量より多いか少ない、請求項40の遺伝子産物。
  42. 表1または表2に記載の単離されたCas12bエフェクタータンパク質。
  43. 請求項42のCas12bエフェクタータンパク質をコードする単離された核酸。
  44. 前記単離された核酸はDNAであり、crRNAおよびtracr RNAをコードする配列を更に含む、請求項43に記載の単離された核酸。
  45. 請求項43もしくは44に記載の核酸または請求項42のCas12bを含む、単離された真核細胞。
  46. i)表1または表2に記載のCas12bエフェクタータンパク質をコードするメッセンジャーRNA(mRNA)、
    ii)ガイド配列、および
    iii)tracr RNA
    を含む非天然起源または遺伝子操作されたシステム。
  47. 前記tracr RNAは直接反復配列の5’末端においてcrRNAに融合している、請求項46に記載の非天然起源または遺伝子操作されたシステム。
  48. 標的ドメインおよびアデノシン脱アミノ酵素、シチジン脱アミノ酵素、またはそれらの触媒ドメインを含み、前記標的ドメインはCas12bエフェクタータンパク質またはオリゴヌクレオチド結合活性を維持するその断片、およびガイド分子を含む、部位指向塩基編集のための遺伝子操作された組成物。
  49. 前記Cas12bエフェクタータンパク質は触媒的に不活性である、請求項48の組成物。
  50. 前記Cas12bエフェクタータンパク質は表1または表2から選択される、請求項48の組成物。
  51. 前記Cas12bエフェクタータンパク質は、 アリシクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis)、バチルス属種V3-13(Bacillus sp. V3-13)、バチルス・ヒサシイ(Bacillus hisashii)、レンティスファエラ・バクテリウム(Lentisphaeria bacterium)、およびラセエラ・セデミニス(Laceyella sediminis)からなる群から選択される細菌に由来する、請求項50の組成物。
  52. 1種以上の関心のある標的オリゴヌクレオチドに請求項48から51のいずれか1項に記載の組成物を送達することを含む、前記1種以上の標的オリゴヌクレオチド中のアデノシンまたはシチジンを改変する方法。
  53. 病原性のT→CまたはA→Gの点変異を含む転写物によって発症する疾患の治療または予防に使用するための、請求項52の方法。
  54. 請求項48もしくは49のいずれか1項の方法で得られた、および/または請求項48から51のいずれか1項の組成物を含む、単離された細胞。
  55. 前記真核細胞、好適にはヒトまたは非ヒト動物細胞、必要に応じて治療用植物T細胞または抗体生成植物B細胞であるか、または前記細胞は植物細胞である、請求項54の細胞またはその後代。
  56. 請求項50または51の前記改変された細胞またはその後代を含む、非ヒト動物。
  57. 請求項56の前記改変された細胞を含む植物。
  58. 治療用、好ましくは細胞治療に使用するための請求項56または57に記載の改変された細胞。
  59. 標的オリゴヌクレオチドに
    (a)触媒的に不活性なCas12bタンパク質、
    (b)直接反復配列に結合したガイド配列を含むガイド分子、および
    (c)アデノシンもしくはシチジン脱アミノ酵素タンパク質またはその触媒ドメイン
    を送達することを含み、
    前記アデノシンもしくはシチジン脱アミノ酵素タンパク質またはその触媒ドメインは前記触媒的に不活性なCas12bタンパク質に共有結合もしくは非共有結合されているか、あるいは前記ガイド分子は送達後にそれに適合もしくは結合されており、
    前記ガイド分子は前記触媒的に不活性なCas12bタンパク質と複合体を形成し、この複合体を前記標的オリゴヌクレオチドに結合させるように導き、前記ガイド配列は前記標的オリゴヌクレオチド内で標的配列とハイブリダイズしてオリゴヌクレオチド二重鎖を形成することが可能である、
    標的オリゴヌクレオチド中のアデノシンまたはシトシンを改変する方法。
  60. (A)前記シトシンは前記オリゴヌクレオチド二本鎖を形成する前記標的配列の外側にあり、前記シチジン脱アミノ酵素タンパク質またはその触媒ドメインは前記オリゴヌクレオチド二本鎖の外側にある前記シトシンを脱アミノ化するか、あるいは(B)前記シトシンは前記オリゴヌクレオチド二本鎖を形成する前記標的配列内にあり、前記ガイド配列は前記オリゴヌクレオチド二本鎖内のC-AまたはC-U不適正塩基対をもたらす前記シトシンに相当する位置で非対合アデノシンまたはウラシルを含み、かつ前記シチジン脱アミノ酵素タンパク質またはその触媒ドメインは前記非対合アデノシンまたはウラシルと反対側のオリゴヌクレオチド二本鎖中のシトシンを脱アミノ化する、請求項59の方法。
  61. 前記アデノシン脱アミノ酵素タンパク質またはその触媒ドメインはオリゴヌクレオチド二本鎖内の前記アデノシンまたはシトシンを脱アミノ化する、請求項59の方法。
  62. 前記Cas12bタンパク質は表1または表2から選択される、請求項59の方法。
  63. 前記Cas12bタンパク質は、アリシクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis)、バチルス属種V3-13(Bacillus sp. V3-13)、バチルス・ヒサシイ(Bacillus hisashii)、レンティスファエラ・バクテリウム(Lentisphaeria bacterium)、およびラセエラ・セデミニス(Laceyella sediminis)からなる群から選択される細菌に由来する、請求項62の方法。
  64. Cas12bタンパク質、
    1つ以上の標的配列と所定の程度の相補性を持ち、かつCas12bタンパク質と複合体を形成するように設計されたガイド配列を含む少なくとも1種のガイドポリヌクレオチド、および
    非標的配列を含む、オリゴヌクレオチドに基づくマスキング構築物、
    を含み、前記Cas12bタンパク質は、側副核酸分解酵素活性を示し、かつ前記1つ以上の標的配列により活性化されると前記オリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する、
    1つ以上のin vitro試料中の1つ以上の標的配列の存在を検出するシステム。
  65. Cas12bタンパク質、
    それぞれが1種以上の標的ポリペプチドのうちの1種に結合するように設計され、マスクされたプロモーター結合部位もしくはマスクされたプライマー結合部位およびトリガー配列鋳型を含む1つ以上の検出アプタマー、および
    非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物
    を含む、1つ以上のin vitro試料中の標的ポリペプチドの存在を検出するシステム。
  66. 前記標的配列またはトリガー配列を増幅するための核酸増幅試薬を更に含む、請求項64または65のシステム。
  67. 前記核酸増幅試薬は等温増幅試薬である、請求項66のシステム。
  68. 前記Cas12bタンパク質は表1または表2から選ばれる、請求項65から67のいずれか1項のシステム。
  69. 前記Cas12bタンパク質は、アリシクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis)、バチルス属種V3-13(Bacillus sp. V3-13)、バチルス・ヒサシイ(Bacillus hisashii)、レンティスファエラ・バクテリウム(Lentisphaeria bacterium)、およびラセエラ・セデミニス(Laceyella sediminis)からなる群から選択される細菌に由来する、請求項68のシステム。
  70. 1つ以上のin vitro試料を
    i)Cas12bエフェクタータンパク質、
    ii)1つ以上の標的配列と所定の程度の相補性を持ち、かつCas12bエフェクタータンパク質と複合体を形成するように設計されたガイド配列を含む少なくとも1種のガイドポリヌクレオチド、および
    iii)非標的配列を含むオリゴヌクレオチドに基づくマスキング構築物
    と接触させることを含み、
    前記Cas12エフェクタータンパク質は側副核酸分解酵素活性を示し、かつ前記オリゴヌクレオチドに基づくマスキング構築物の非標的配列を切断する、
    前記1つ以上のin vitro試料中の1つ以上の標的配列を検出する方法。
  71. 前記Cas12bエフェクタータンパク質は表1または表2から選ばれる、請求項70の方法。
  72. 前記Cas12bエフェクタータンパク質は、 アリシクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis)、バチルス属種V3-13(Bacillus sp. V3-13)、バチルス・ヒサシイ(Bacillus hisashii)、レンティスファエラ・バクテリウム(Lentisphaeria bacterium)、およびラセエラ・セデミニス(Laceyella sediminis)からなる群から選択される細菌に由来する、請求項71の方法。
  73. 酵素またはレポーター成分の不活性な第1部分に結合したCas12bタンパク質を含む非天然起源または遺伝子操作された組成物であって、
    前記酵素またはレポーター成分は、前記酵素またはレポーター成分の相補部分に接触させたときに再構成される、組成物。
  74. 前記酵素またはレポーター成分はタンパク質分解酵素を含む、請求項73の組成物
  75. 前記Cas12bタンパク質は酵素またはレポーター成分の相補部分に結合した第1のCas12bタンパク質および第2のCas12bタンパク質を含む、請求項73または74の組成物。
  76. i)前記第1のCas12bタンパク質と複合体を形成し、標的核酸の第1の標的配列にハイブリダイズすることが可能な第1のガイド、および
    ii)前記第2のCas12bタンパク質と複合体を形成し、前記標的核酸の第2の標的配列にハイブリダイズすることが可能な第2のガイドを更に含む、
    請求項73の組成物。
  77. 前記酵素はカスパーゼを含む、請求項73から76のいずれか1項の組成物。
  78. 前記酵素はタバコエッチウイルス(TEV)を含む、請求項73から77のいずれか1項の組成物。
  79. a)細胞または細胞の集団を、
    i)タンパク質分解酵素の不活性部分に結合した第1のCas12bエフェクタータンパク質、
    ii)前記タンパク質分解酵素の相補部分に結合し、前記タンパク質分解酵素の前記第1の部分と前記相補部分が接触したときに前記タンパク質分解酵素のタンパク質分解活性が再構成される、第2のCas12bエフェクタータンパク質、
    iii)前記第1のCas12bエフェクタータンパク質に結合し、かつ前記標的オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、および
    iv)前記第2のCas12bエフェクタータンパク質に結合し、かつ前記標的オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド
    に接触させることを含み、
    これにより前記タンパク質分解酵素の前記第1の部分と前記相補部分を接触させて、前記タンパク質分解酵素のタンパク質分解活性を再構成する、
    標的オリゴヌクレオチドを含む細胞中にタンパク質分解活性を提供する方法。
  80. 前記酵素はカスパーゼである、請求項79の方法。
  81. 前記タンパク質分解酵素はTEVプロテアーゼであり、このTEVプロテアーゼのタンパク質分解活性は再構成され、それによりTEV基質は切断され活性化される、請求項80の方法。
  82. 前記TEV基質は、TEV標的配列を含み、それにより前記TEVプロテアーゼによる切断がプロカスパーゼを活性化するように遺伝子操作されたプロカスパーゼである、請求項81の方法。
  83. 細胞中の関心のあるオリゴヌクレオチドを、
    i)タンパク質分解酵素の不活性な第1の部分に結合した第1のCas12bエフェクタータンパク質、
    ii)前記タンパク質分解酵素の相補部分に結合し、前記タンパク質分解酵素の前記第1の部分と前記相補部分が接触したときに前記タンパク質分解酵素の活性が再構成される、第2のCas12bエフェクタータンパク質、
    iii)前記第1のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、
    iv)前記第2のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド、および
    v)検出可能に切断されたレポーター
    を含む組成物と接触させることを含み、
    前記関心のあるオリゴヌクレオチドが細胞中に存在すると前記タンパク質分解酵素の前記第1の部分と前記相補部分が接触して、前記タンパク質分解酵素の活性を再構成しかつ前記レポーターを検出可能に切断する、
    前記関心のあるオリゴヌクレオチドを含む細胞を同定する方法。
  84. 細胞中の関心のあるオリゴヌクレオチドを、
    i)レポーターの不活性な第1の部分に結合した第1のCas12bエフェクタータンパク質、
    ii)前記レポーターの相補部分に結合し、前記レポーターの前記第1の部分と前記相補部分が接触したときに前記レポーターの活性が再構成される、第2のCas12bエフェクタータンパク質、
    iii)前記第1のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第1の標的配列にハイブリダイズする第1のガイド、
    iv)前記第2のCas12bエフェクタータンパク質に結合し、かつ前記オリゴヌクレオチドの第2の標的配列にハイブリダイズする第2のガイド、および
    V)前記レポーター
    を含む組成物と接触させることを含み、
    前記関心のあるオリゴヌクレオチドが細胞中に存在すると前記レポーターの前記第1の部分と前記相補部分が接触して、前記レポーターの活性を再構成する、
    前記関心のあるオリゴヌクレオチドを含む細胞を同定する方法。
  85. 前記レポーターは蛍光タンパク質または発光タンパク質である、請求項83または84の方法。
JP2024095510A 2018-08-07 2024-06-13 新規Cas12b酵素およびシステム Pending JP2024138266A (ja)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US201862715640P 2018-08-07 2018-08-07
US62/715,640 2018-08-07
US201862744080P 2018-10-10 2018-10-10
US62/744,080 2018-10-10
US201862751196P 2018-10-26 2018-10-26
US62/751,196 2018-10-26
US201962794929P 2019-01-21 2019-01-21
US62/794,929 2019-01-21
US201962831028P 2019-04-08 2019-04-08
US62/831,028 2019-04-08
JP2021506471A JP2021532815A (ja) 2018-08-07 2019-08-07 新規Cas12b酵素およびシステム
PCT/US2019/045582 WO2020033601A1 (en) 2018-08-07 2019-08-07 Novel cas12b enzymes and systems

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021506471A Division JP2021532815A (ja) 2018-08-07 2019-08-07 新規Cas12b酵素およびシステム

Publications (1)

Publication Number Publication Date
JP2024138266A true JP2024138266A (ja) 2024-10-08

Family

ID=67809656

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021506471A Pending JP2021532815A (ja) 2018-08-07 2019-08-07 新規Cas12b酵素およびシステム
JP2024095510A Pending JP2024138266A (ja) 2018-08-07 2024-06-13 新規Cas12b酵素およびシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021506471A Pending JP2021532815A (ja) 2018-08-07 2019-08-07 新規Cas12b酵素およびシステム

Country Status (8)

Country Link
US (1) US20210163944A1 (ja)
EP (1) EP3833761A1 (ja)
JP (2) JP2021532815A (ja)
KR (1) KR20210056329A (ja)
CN (1) CN113286884A (ja)
AU (1) AU2019318079A1 (ja)
CA (1) CA3106035A1 (ja)
WO (1) WO2020033601A1 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2019126709A1 (en) * 2017-12-22 2019-06-27 The Broad Institute, Inc. Cas12b systems, methods, and compositions for targeted dna base editing
CN109337904B (zh) * 2018-11-02 2020-12-25 中国科学院动物研究所 基于C2c1核酸酶的基因组编辑系统和方法
US11981922B2 (en) 2019-10-03 2024-05-14 Dana-Farber Cancer Institute, Inc. Methods and compositions for the modulation of cell interactions and signaling in the tumor microenvironment
US11793787B2 (en) 2019-10-07 2023-10-24 The Broad Institute, Inc. Methods and compositions for enhancing anti-tumor immunity by targeting steroidogenesis
US11844800B2 (en) 2019-10-30 2023-12-19 Massachusetts Institute Of Technology Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia
US20230071360A1 (en) * 2020-02-24 2023-03-09 Chan Zuckerberg Biohub, Inc. Nucleic acid sequence detection by measuring free monoribonucleotides generated by endonuclease collateral cleavage activity
CN111349649B (zh) * 2020-03-16 2020-11-17 三峡大学 一种用于双孢蘑菇的基因编辑的方法及应用
WO2021207651A2 (en) * 2020-04-09 2021-10-14 Verve Therapeutics, Inc. Chemically modified guide rnas for genome editing with cas12b
EP4199957A4 (en) * 2020-08-24 2024-10-02 Wave Life Sciences Ltd NON-HUMAN CELLS AND ANIMALS ENGINEERED TO EXPRESS ADAR1 AND THEIR USES
WO2022040909A1 (en) * 2020-08-25 2022-03-03 Institute Of Zoology, Chinese Academy Of Sciences Split cas12 systems and methods of use thereof
IL303359A (en) * 2020-12-03 2023-08-01 Scribe Therapeutics Inc Compositions and methods for targeting BCL11A
CN112195164B (zh) * 2020-12-07 2021-04-23 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
US20240327933A1 (en) * 2020-12-16 2024-10-03 The Broad Institute, Inc. Coronavirus rapid diagnostics
CN112538500A (zh) * 2020-12-25 2021-03-23 佛山科学技术学院 一种碱基编辑器及其制备方法和应用
US20240148832A1 (en) * 2021-02-05 2024-05-09 The General Hospital Corporation Astrocyte Interleukin-3 Reprograms Microglia and Limits Alzheimer`s Disease
US20240141328A1 (en) * 2021-03-08 2024-05-02 Ladder Therapeutics, Inc. Assay for Massive Parallel RNA Function Perturbation Profiling
IL308806A (en) 2021-06-01 2024-01-01 Arbor Biotechnologies Inc Gene editing systems including nuclease crisper and their uses
CN116751780A (zh) * 2021-06-08 2023-09-15 山东舜丰生物科技有限公司 一种具有碱基突变的同向重复序列及其应用
WO2023287669A2 (en) 2021-07-12 2023-01-19 Labsimply, Inc. Nuclease cascade assay
WO2023004391A2 (en) 2021-07-21 2023-01-26 Montana State University Nucleic acid detection using type iii crispr complex
CN113801933B (zh) * 2021-09-17 2024-03-29 上海五色石医学科技有限公司 一种人serpinb7基因突变快速分型的检测试剂盒
CN114015674B (zh) * 2021-11-02 2024-08-30 辉大(上海)生物科技有限公司 一种CRISPR-Cas12i系统
US11820983B2 (en) 2021-12-13 2023-11-21 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
US20230279375A1 (en) 2021-12-13 2023-09-07 Labsimply, Inc. Signal boost cascade assay
IL316038A (en) 2022-04-04 2024-11-01 The Regents Of The Univ Of California Preparations and methods for genetic complementation
CN117460822B (zh) * 2022-04-25 2024-08-02 辉大基因治疗(新加坡)私人有限公司 新型CRISPR-Cas12i系统及其用途
CN115725743A (zh) * 2022-08-03 2023-03-03 湖南工程学院 一组检测肿瘤外泌体的探针组、试剂盒和检测体系及应用
CN115786544B (zh) * 2022-08-19 2023-11-17 湖南工程学院 一种检测牛结核分枝杆菌的试剂、试剂盒及检测方法
WO2024046307A1 (zh) * 2022-08-29 2024-03-07 北京迅识科技有限公司 一种突变的v型crispr酶及其应用
WO2024073114A1 (en) 2022-09-30 2024-04-04 Vedabio, Inc. Delivery of therapeutics in vivo via a crispr-based cascade system
US11982677B2 (en) 2022-10-02 2024-05-14 Vedabio, Inc. Dimerization screening assays
WO2024081156A1 (en) 2022-10-14 2024-04-18 Vedabio, Inc. Detection of nucleic acid and non-nucleic acid target molecules
CN115819543B (zh) * 2022-11-29 2023-07-21 华南师范大学 转录因子Tbx20启动子区G4调控元件在害虫防治中的应用
US12091690B2 (en) 2023-01-07 2024-09-17 Vedabio, Inc. Engineered nucleic acid-guided nucleases
US12060602B2 (en) 2023-01-10 2024-08-13 Vedabio, Inc. Sample splitting for multiplexed detection of nucleic acids without amplification
US20240301447A1 (en) 2023-02-15 2024-09-12 Arbor Biotechnologies, Inc. Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript
CN117535354B (zh) * 2023-09-28 2024-07-19 广州瑞风生物科技有限公司 一种修复hba2基因突变的方法、组合物及其应用

Family Cites Families (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
ATE141646T1 (de) 1986-04-09 1996-09-15 Genzyme Corp Genetisch transformierte tiere, die ein gewünschtes protein in milch absondern
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
WO1994002620A2 (en) 1992-07-27 1994-02-03 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
US5985309A (en) 1996-05-24 1999-11-16 Massachusetts Institute Of Technology Preparation of particles for inhalation
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
US5944710A (en) 1996-06-24 1999-08-31 Genetronics, Inc. Electroporation-mediated intravascular delivery
US5869326A (en) 1996-09-09 1999-02-09 Genetronics, Inc. Electroporation employing user-configured pulsing scheme
GB9907461D0 (en) 1999-03-31 1999-05-26 King S College London Neurite regeneration
GB9710049D0 (en) 1997-05-19 1997-07-09 Nycomed Imaging As Method
GB9720465D0 (en) 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
WO1999021977A1 (en) 1997-10-24 1999-05-06 Life Technologies, Inc. Recombinational cloning using nucleic acids having recombination sites
US6750059B1 (en) 1998-07-16 2004-06-15 Whatman, Inc. Archiving of vectors
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
EP1975251A3 (en) 2000-07-07 2009-03-25 Visigen Biotechnologies, Inc. Real-time sequence determination
GB0024550D0 (ja) 2000-10-06 2000-11-22 Oxford Biomedica Ltd
AU2002227156A1 (en) 2000-12-01 2002-06-11 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AU2002336760A1 (en) 2001-09-26 2003-06-10 Mayo Foundation For Medical Education And Research Mutable vaccines
GB0125216D0 (en) 2001-10-19 2001-12-12 Univ Strathclyde Dendrimers for use in targeted delivery
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
CN1620508A (zh) 2001-12-21 2005-05-25 牛津生物医学(英国)有限公司 转基因生物
AU2003245160B2 (en) 2002-06-28 2009-09-24 Arbutus Biopharma Corporation Method and apparatus for producing liposomes
AU2003256857A1 (en) 2002-08-08 2004-02-25 Dharmacon, Inc. Short interfering rnas having a hairpin structure containing a non-nucleotide loop
GB0220467D0 (en) 2002-09-03 2002-10-09 Oxford Biomedica Ltd Composition
WO2004040973A2 (en) 2002-11-01 2004-05-21 New England Biolabs, Inc. Organellar targeting of rna and its use in the interruption of environmental gene flow
WO2004098497A2 (en) 2003-04-28 2004-11-18 Genencor International, Inc. Cd4+ human papillomavirus (hpv) epitopes
KR101168440B1 (ko) 2003-07-16 2012-07-27 프로티바 바이오쎄라퓨틱스, 인코포레이티드 지질 캡슐화된 간섭 rna
WO2005026372A1 (en) 2003-09-15 2005-03-24 Protiva Biotherapeutics, Inc. Polyethyleneglycol-modified lipid compounds and uses thereof
GB0325379D0 (en) 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
EP1771206B1 (en) 2004-05-05 2018-04-11 Silence Therapeutics GmbH Lipids, lipid complexes and use thereof
CA2569645C (en) 2004-06-07 2014-10-28 Protiva Biotherapeutics, Inc. Cationic lipids and methods of use
CA2569664C (en) 2004-06-07 2013-07-16 Protiva Biotherapeutics, Inc. Lipid encapsulated interfering rna
JP4772045B2 (ja) 2004-07-16 2011-09-14 アメリカ合衆国 Cmv/r核酸コンストラクトを含むaidsに対するワクチン
JP2008513782A (ja) 2004-09-17 2008-05-01 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 分子解析のための装置及び方法
GB0422877D0 (en) 2004-10-14 2004-11-17 Univ Glasgow Bioactive polymers
CN101287497B (zh) 2004-12-27 2013-03-06 赛伦斯治疗公司 涂层脂质复合体和它们的用途
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US7838658B2 (en) 2005-10-20 2010-11-23 Ian Maclachlan siRNA silencing of filovirus gene expression
WO2007051303A1 (en) 2005-11-02 2007-05-10 Protiva Biotherapeutics, Inc. MODIFIED siRNA MOLECULES AND USES THEREOF
GB0526211D0 (en) 2005-12-22 2006-02-01 Oxford Biomedica Ltd Viral vectors
SG170802A1 (en) 2006-03-31 2011-05-30 Solexa Inc Systems and devices for sequence by synthesis analysis
ES2549728T3 (es) 2006-04-20 2015-11-02 Silence Therapeutics Gmbh Formulaciones de lipoplexo para la administración específica al endotelio vascular
US7915399B2 (en) 2006-06-09 2011-03-29 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
JP2011512326A (ja) 2007-12-31 2011-04-21 ナノコア セラピューティクス,インコーポレイテッド 心不全の治療用のrna干渉
JP5475753B2 (ja) 2008-04-15 2014-04-16 プロチバ バイオセラピューティクス インコーポレイティッド 核酸送達用の脂質製剤
WO2009147368A1 (en) 2008-06-04 2009-12-10 Medical Research Council Peptides
WO2010004594A1 (en) 2008-07-08 2010-01-14 S.I.F.I. Societa' Industria Farmaceutica Italiana S.P.A. Ophthalmic compositions for treating pathologies of the posterior segment of the eye
WO2010053572A2 (en) 2008-11-07 2010-05-14 Massachusetts Institute Of Technology Aminoalcohol lipidoids and uses thereof
GB2465749B (en) 2008-11-25 2013-05-08 Algentech Sas Plant cell transformation method
WO2010129602A2 (en) 2009-05-04 2010-11-11 Fred Hutchinson Cancer Research Center Cocal vesiculovirus envelope pseudotyped retroviral vectors
IL292615B2 (en) 2009-07-01 2023-11-01 Protiva Biotherapeutics Inc Nucleic acid-lipid particles, preparations containing them and their uses
CA2767129C (en) 2009-07-01 2015-01-06 Protiva Biotherapeutics, Inc. Compositions and methods for silencing apolipoprotein b
US8871730B2 (en) 2009-07-13 2014-10-28 Somagenics Inc. Chemical modification of short small hairpin RNAs for inhibition of gene expression
US8927807B2 (en) 2009-09-03 2015-01-06 The Regents Of The University Of California Nitrate-responsive promoter
US20110200582A1 (en) 2009-12-23 2011-08-18 Novartis Ag Lipids, lipid compositions, and methods of using them
US8372951B2 (en) 2010-05-14 2013-02-12 National Tsing Hua University Cell penetrating peptides for intracellular delivery
WO2011148194A1 (en) 2010-05-28 2011-12-01 Oxford Biomedica (Uk) Ltd Delivery of lentiviral vectors to the brain
WO2012027675A2 (en) 2010-08-26 2012-03-01 Massachusetts Institute Of Technology Poly(beta-amino alcohols), their preparation, and uses thereof
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
PL2691443T3 (pl) 2011-03-28 2021-08-30 Massachusetts Institute Of Technology Sprzężone lipomery i ich zastosowania
CA2831613A1 (en) 2011-03-31 2012-10-04 Moderna Therapeutics, Inc. Delivery and formulation of engineered nucleic acids
US20120295960A1 (en) 2011-05-20 2012-11-22 Oxford Biomedica (Uk) Ltd. Treatment regimen for parkinson's disease
AU2012352180A1 (en) 2011-12-16 2014-07-31 Moderna Therapeutics, Inc. Modified nucleoside, nucleotide, and nucleic acid compositions
WO2013158141A1 (en) 2012-04-18 2013-10-24 Arrowhead Research Corporation Poly(acrylate) polymers for in vivo nucleic acid delivery
EP3494997B1 (en) 2012-07-25 2019-09-18 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
CN113528577A (zh) 2012-12-12 2021-10-22 布罗德研究所有限公司 用于序列操纵的系统、方法和优化的指导组合物的工程化
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
WO2014093622A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
EP3434776A1 (en) 2012-12-12 2019-01-30 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
EP3031921A1 (en) 2012-12-12 2016-06-15 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
ES2576128T3 (es) 2012-12-12 2016-07-05 The Broad Institute, Inc. Modificación por tecnología genética y optimización de sistemas, métodos y composiciones para la manipulación de secuencias con dominios funcionales
EP4286403A3 (en) 2012-12-12 2024-02-14 The Broad Institute Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
KR20150105634A (ko) 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2014118272A1 (en) 2013-01-30 2014-08-07 Santaris Pharma A/S Antimir-122 oligonucleotide carbohydrate conjugates
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
KR20160034901A (ko) 2013-06-17 2016-03-30 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
RU2716421C2 (ru) 2013-06-17 2020-03-11 Те Брод Инститьют Инк. Доставка, применение и применения в терапии систем crispr-cas и композиций для целенаправленного воздействия на нарушения и заболевания с использованием вирусных компонентов
EP3011033B1 (en) 2013-06-17 2020-02-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
EP3620524A1 (en) 2013-06-17 2020-03-11 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
EP3674411A1 (en) 2013-06-17 2020-07-01 The Broad Institute, Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
EP3825406A1 (en) 2013-06-17 2021-05-26 The Broad Institute Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
CA2932626A1 (en) 2013-12-05 2015-06-11 Silence Therapeutics Gmbh Means for lung specific delivery
WO2015089486A2 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
CN106103705A (zh) 2013-12-12 2016-11-09 布罗德研究所有限公司 核苷酸重复障碍中crispr‑cas系统的组合物和使用方法
EP3080259B1 (en) 2013-12-12 2023-02-01 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
CN111206032B (zh) 2013-12-12 2024-07-19 布罗德研究所有限公司 用于基因组编辑的crispr-cas系统和组合物的递送、用途和治疗应用
CA2932475A1 (en) 2013-12-12 2015-06-18 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components
JP2017527256A (ja) 2013-12-12 2017-09-21 ザ・ブロード・インスティテュート・インコーポレイテッド HBV及びウイルス性疾患及び障害のためのCRISPR−Cas系及び組成物の送達、使用及び治療適用
WO2015089427A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
EP3080256B1 (en) 2013-12-13 2018-06-13 Cellectis Cas9 nuclease platform for microalgae genome engineering
WO2016161516A1 (en) 2015-04-10 2016-10-13 Feldan Bio Inc. Polypeptide-based shuttle agents for improving the transduction efficiency of polypeptide cargos to the cytosol of target eukaryotic cells, uses thereof, methods and kits relating to same
EP3294880A4 (en) 2015-05-15 2018-12-26 Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
EP3436575A1 (en) * 2015-06-18 2019-02-06 The Broad Institute Inc. Novel crispr enzymes and systems
CA3012631A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US10648020B2 (en) * 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
KR20180069898A (ko) 2015-10-23 2018-06-25 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 편집제 및 그의 용도
WO2018027078A1 (en) * 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
EP3551753B1 (en) * 2016-12-09 2022-06-29 The Broad Institute, Inc. Crispr effector system based diagnostics
CN118416088A (zh) * 2017-03-03 2024-08-02 加利福尼亚大学董事会 经由抑制性tRNAs和脱氨酶对突变进行RNA靶向
KR20200062198A (ko) * 2017-09-09 2020-06-03 더 브로드 인스티튜트, 인코퍼레이티드 다중-이펙터 crispr 기반 진단 시스템
WO2019071051A1 (en) * 2017-10-04 2019-04-11 The Broad Institute, Inc. DIAGNOSTICS BASED ON A CRISPR EFFECTOR SYSTEM
EP3727469A4 (en) * 2017-12-22 2021-12-01 The Broad Institute, Inc. NEW CRISPR ENZYMES AND SYSTEMS
JP7500549B2 (ja) * 2018-09-20 2024-06-17 インスティテュート オブ ズーオロジー、チャイニーズ アカデミー オブ サイエンシーズ 核酸を検出する方法
WO2020131862A1 (en) * 2018-12-17 2020-06-25 The Broad Institute, Inc. Crispr-associated transposase systems and methods of use thereof
US11639523B2 (en) * 2020-03-23 2023-05-02 The Broad Institute, Inc. Type V CRISPR-Cas systems and use thereof

Also Published As

Publication number Publication date
JP2021532815A (ja) 2021-12-02
KR20210056329A (ko) 2021-05-18
CA3106035A1 (en) 2020-02-13
AU2019318079A1 (en) 2021-01-28
US20210163944A1 (en) 2021-06-03
CN113286884A (zh) 2021-08-20
WO2020033601A1 (en) 2020-02-13
EP3833761A1 (en) 2021-06-16

Similar Documents

Publication Publication Date Title
JP2024138266A (ja) 新規Cas12b酵素およびシステム
JP7280312B2 (ja) 新規crispr酵素及び系
JP6793699B2 (ja) オフターゲット効果を低下させるcrispr酵素突然変異
AU2017257274B2 (en) Novel CRISPR enzymes and systems
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
KR20230091894A (ko) 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물
WO2021138469A1 (en) Genome editing using reverse transcriptase enabled and fully active crispr complexes
WO2019126774A1 (en) Novel crispr enzymes and systems
WO2017106657A1 (en) Novel crispr enzymes and systems
KR20210125560A (ko) 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용한 질환-관련 유전자의 스플라이스 수용체 부위 파괴
CN116096880A (zh) Crispr相关转座酶系统和其使用方法
WO2021173734A1 (en) Novel type iv and type i crispr-cas systems and methods of use thereof
EP4225928A1 (en) Helitron mediated genetic modification

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240710

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240710