KR102662879B1

KR102662879B1 - 망막 기능장애 질환 치료를 위한 유전자 조작

Info

Publication number: KR102662879B1
Application number: KR1020180115678A
Authority: KR
Inventors: 이정민; 송동우; 김운기; 김정훈; 조동현
Original assignee: 주식회사 툴젠; 서울대학교병원; 서울대학교산학협력단
Priority date: 2017-09-29
Filing date: 2018-09-28
Publication date: 2024-05-02
Also published as: US20200277630A1; WO2019066549A3; WO2019066549A2; KR20190038407A; US11845951B2; EP3690045A2

Abstract

본 발명은 망막 기능장애 질환의 치료 또는 개선을 위한 유전자 조작용 조성물 또는 이를 이용한 방법에 관한 것이다. 보다 구체적으로, 망막 기능형성 유전자를 표적화할 수 있는 가이드핵산을 포함하는 유전자 조작용 조성물 및 이를 이용한 망막 기능형성 유전자를 인위적으로 조작 및/또는 교정하여 망막 기능장애로 인한 질환을 치료 또는 개선하는 방법에 관한 것이다.

Description

망막 기능장애 질환 치료를 위한 유전자 조작 {Genome editing for treating Retinal dysfunction disease}

신생아에서 실명을 초래하는 LCA는 아직까지 마땅한 치료제가 없는 상황으로, 약 20여개가 넘는 다양한 유전자의 유전적 변이 때문에 생기고, 이를 극복하기 위해서 치료제 개발회사(Spark Therapeutics 등)들에서 AAV를 통해 원인 유전자의 하나인 RPE65를 발현시키는 방법의 치료제 개발을 하고 있지만, AAV가 존재하는 동안만 치료효과를 얻는 단점이 있다. 따라서, 보다 장기적인 치료효과를 위해서는 변이된 돌연변이를 교정시켜주는 방법이 필요한 실정이다.

1. 한국공개공보 제10-2013-0054961호 (출원번호: 제10-2012-7030132호, 공개일자: 2013.05.27) 2. 한국공개공보 제10-2017-0036085호 (출원번호: 제10-2017-7005460호, 공개일자: 2017.03.31)

본 발명은 일 구체예로서 망막 기능형성 유전자를 인위적으로 조작하기 위해 망막 기능형성 유전자를 표적화하는 가이드핵산을 제공하고자 한다.

본 발명은 일 구체예로서 망막 기능형성 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 제공하고자 한다.

본 발명의 일 구체예로서 망막 기능형성 유전자를 인위적으로 조작하는 방법을 제공하고자 한다.

본 발명의 일 구체예로서 유전자 조작용 조성물을 이용한 망막 기능장애 질환의 치료 방법을 제공하고자 한다.

상기 과제를 해결하기 위하여, 본 발명은 망막 기능장애 질환을 치료를 위한 유전자 조작용 조성물에 관한 것이다. 보다 구체적으로, 망막 기능장애 질환을 치료를 위해 망막 기능형성 유전자를 인위적으로 조작할 수 있는 유전자 조작용 조성물 및 이를 이용한 방법에 관한 것이다.

본 발명은 망막 기능형성 유전자를 표적화할 수 있는 가이드핵산을 제공한다.

구현예에서, 망막 기능형성 유전자는 RPE65 유전자일 수 있다.

가이드핵산은 망막 기능형성 유전자의 표적 서열을 표적화할 수 있다.

이때, 가이드핵산은 망막 기능형서 유전자의 표적 서열을 표적화할 수 있는 가이드 도메인을 포함할 수 있다.

상기 가이드 도메인은 망막 기능형성 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 형성할 수 있는 뉴클레로타이드 서열을 포함할 수 있다.

상기 가이드 도메인은 망막 기능형성 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 형성할 수 있다.

이때, 상기 상보적 결합은 0 내지 5개의 미스매칭(mismatching) 결합을 포함할 수 있다.

가이드핵산은 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 포함할 수 있다.

상기 표적 서열은 망막 기능형성 유전자의 돌연변이 서열을 포함하거나 또는 근접하게 위치할 수 있다.

이때, 상기 망막 기능형성 유전자의 돌연변이 서열은 야생형(wildtype) 망막 기능형성 유전자의 핵산서열과 비교하여 하나 이상의 뉴클레오타이드가 삭제(deletion), 삽입(insertion) 또는 치환(substitution)된 망막 기능형성 유전자의 일부 핵산 서열일 수 있다.

이때, 상기 망막 기능형성 유전자의 돌연변이 서열은 야생형(wildtype) 망막 기능형성 유전자의 핵산서열과 비교하여 하나 이상의 다른 코돈(codon) 서열을 가지는 망막 기능형성 유전자의 일부 핵산 서열일 수 있다.

이때, 상기 망막 기능형성 유전자의 돌연변이 서열은 망막 기능형성 유전자의 엑손 영역 및 인트론 영역으로 구성된 군에서 선택된 하나 이상의 영역 내에 위치할 수 있다.

이때, 상기 망막 기능형성 유전자의 돌연변이 서열은 RPE65 유전자의 엑손 영역에 위치할 수 있다.

상기 표적 서열은 망막 기능형성 유전자의 프로모터 영역, 엑손 영역, 인트론 영역 및 인핸서 영역으로 구성된 군에서 선택된 하나 이상의 영영 내에 위치할 수 있다.

상기 표적 서열은 망막 기능형성 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 망막 기능형성 유전자의 돌연변이 된 부위를 포함하는 망막 기능형성 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 서열번호 1 내지 69번 중 선택된 하나 이상일 수 있다.

본 발명은 망막 기능형성 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 제공한다.

구현예에서, 유전자 조작용 조성물은 다음을 포함할 수 있다:

망막 기능형성 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및

스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산 서열.

이때, 상기 망막 기능형성 유전자는 RPE65 유전자일 수 있다.

상기 표적 서열은 망막 기능형성 유전자의 돌연변이 서열을 포함하거나 또는 근접하게 위치할 수있다.

이때, 상기 망막 기능형성 유전자의 돌연변이 서열은 야생형(wildtype) 망막 기능형성 유전자의 핵산서열과 비교하여 하나 이상의 뉴클레오타이드가 삭제(deletion), 삽입(insertion) 또는 치환(substitution)된 것을 포함하는 망막 기능형성 유전자의 일부 핵산 서열일 수 있다.

또는 상기 망막 기능형성 유전자의 돌연변이 서열은 야생형(wildtype) 망막 기능형성 유전자의 핵산서열과 비교하여 하나 이상의 다른 코돈(codon) 서열을 포함하는 망막 기능형성 유전자의 일부 핵산 서열일 수 있다.

이때, 상기 망막 기능형성 유전자의 돌연변이 서열은 망막 기능형성 유전자의 엑손 영역 내에 위치할 수 있다.

상기 가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체를 형성할 수 있다.

이때, 상기 가이드핵산-에디터단백질 복합체는 가이드핵산의 일부 핵산과 에디터단백질의 일부 아미노산이 상호작용하여 형성될 수 있다.

상기 가이드핵산 및 에디터단백질은 각각 핵산 서열의 형태로 1 이상의 벡터로 존재할 수 있다.

이때, 상기 벡터는 플라스미드일 수 있다.

이때, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나 이상의 바이러스 벡터일 수 있다.

다른 구현예에서, 유전자 조작용 조성물은 다음을 포함할 수 있다:

망막 기능형성 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산 서열;

스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산 서열; 및

삽입을 원하는 핵산 서열을 포함하는 도너 또는 이를 암호화하는 핵산 서열.

이때, 상기 망막 기능형성 유전자는 RPE65 유전자일 수 있다.

상기 삽입을 원하는 핵산 서열은 망막 기능형성 유전자의 일부 핵산 서열일 수 있다.

상기 삽입을 원하는 핵산 서열은 망막 기능형성 유전자의 돌연변이 서열을 교정하기 위한 정상 핵산 서열일 수 있다.

상기 도너는 상기 절단된 표적 서열의 왼쪽(upstream) 및/또는 오른쪽(downstream)의 뉴클레오타이드 서열과 각각 상동성을 가지는 뉴클레오타이드 서열을 포함할 수 있다.

이때, 상기 상동성을 가지는 뉴클레오타이드 서열은 최소한 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 가이드핵산, 에디터단백질 및 도너는 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.

이때, 상기 벡터는 플라스미드일 수 있다.

본 발명은 망막 기능장애 질환을 치료하는 방법을 제공한다.

구현예에서, 망막 기능장애 질환을 치료하는 방법은 유전자 조작용 조성물을 치료 대상에 투여하는 단계를 포함할 수 있다.

상기 유전자 조작용 조성물은 다음을 포함할 수 있다:

망막 기능형성 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및

이때, 상기 망막 기능형성 유전자는 RPE65 유전자일 수 있다.

상기 유전자 조작용 조성물은 선택적으로 도너 또는 이를 암호화하는 핵산서열을 추가로 더 포함할 수 있다.

상기 망막 기능장애 질환은 레베르 선천성 흑암시, 망막색소변성증, 스타카르트 질환, 망막형성장애, 색맹, 범맥락막위축, 황반변성, 근시성 맥락막신생혈관, 결절맥락막혈관병증, 중심장액맥락망막병증, 황반원공, 황반이상증, 당뇨망막병증, 망막동정맥폐쇄, 고혈압성 망막병증, 망막대동맥류, 안허혈증후군, 미숙아망막병증, 급성망막괴사, 거대세포 바이러스 망막염, 톡소플라스마 망막맥락막염, 매독성 맥락망막염, 망막박리 또는 망막모세포종일 수 있다.

상기 망막 기능장애 질환은 레베르 선천성 흑암시 또는 망막색소변성증일 수 있다.

상기 치료 대상은 인간, 원숭이, 마우스, 래트를 포함하는 포유동물일 수 있다.

상기 투여는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다.

상기 투여는 망막하(subretinal), 안구내(intraocularly), 유리체내(intravitreally), 근육내(intramuscularly) 또는 정맥내(intravenous)에서 선택된 투여 경로로 수행될 수 있다.

본 발명은 유전자 조작용 조성물을 통해 망막 기능장애 질환을 치료할 수 있다. 보다 구체적으로, 망막 기능형성 유전자를 표적화하는 가이드핵산을 포함하는 유전자 조작용 조성물을 이용해 망막 기능형성 유전자를 인위적으로 조작 및/또는 교정하여 망막 기능형성 유전자가 정상 기능 또는 정상 발현될 수 있도록 하여 망막 기능장애를 개선 또는 치료할 수 있다.

도 1은 야생형 Rpe65 유전자의 개략도로, rd12 마우스의 조기 종결 코돈에 해당하는 서열은 밑줄로 표시하였고, 역방향 화살표(←)는 TS1 sgRNA 표적 서열을 표시하고, 정방향 화살표(→)는 TS4 sgRNA 표적 서열을 표시하였으며, 이때, protospacer adjacent motif (PAM)은 네모 박스로 표시하였다.
도 2는 T7E1 assay에 의해 검출된 C2C12 세포에서의 TS1 sgRNA 및 TS4 sgRNA 유도 돌연변이를 확인한 이미지로, 이때, 대조군(Ctrl)은 Cas9만 처리하였고, T7E1에 의해 절단된 DNA fragment를 화살표로 표시하였다.
도 3은 targeted deep sequencing으로 측정한 인델 빈도를 나타내는 그래프(n=3)로, SpCas9과 Rpe65-donor의 비율을 괄호에 표시하였다. 오차 막대는 SEM을 나타내며, TS4 sgRNA를 위한 post-hoc Bonferroni's test와 함께 one-way ANOVA 및 TS1 sgRNA을 위한 Student's t test에 의해***P < 0.001로 표시하였다.
도 4는 targeted deep sequencing으로 측정한 rd12 돌연변이에 대응되는 부위에서의 HDR 빈도를 나타낸 그래프(n=4)로, SpCas9과 Rpe65-donor의 비율을 괄호에 표시하였다. 오차 막대는 SEM을 나타내며, TS4 sgRNA를 위한 post-hoc Bonferroni's test와 함께 one-way ANOVA 및 TS1 sgRNA을 위한 Student's t test에 의해***P < 0.001로 표시하였다.
도 5는 서로 다른 카테고리에서 deep sequencing 리드 수의 평균값을 나타낸 것으로, (a)는 TS4 sgRNA에 의해 유도된 인델의 패턴을 여러 카테고리로 나누어 보여주는 그래프(n=3)이며, 약 40%가 결실을 보이는 것을 확인하였고, (b)는 TS4 sgRNA에 의해 유도된 in-frame 인델 및 out-of-frame 인델의 다른 형태의 패턴을 여러 카테고리(3N: one codon; 3N+1: one codon+1 nucleotide; 3N+2: one codon+2 nucleotides)로 나누어 보여주는 그래프(n=3)이다. 이때, 결실의 삼분의 일은 in-frame 인델인 것으로 확인되었다.
도 6은 Rpe65 도너 주형을 나타내는 뉴클레오타이드 서열 및 TS4 sgRNA에 의해 유도되는 변화를 보여주는 이미지로, 역삼각형(▼)은 TS4 sgRNA에 의해 유도되는 DSB 위치를 나타내며, rd12 마우스의 조기 종결 코돈에 해당하는 서열은 밑줄(직선)로 표시하였고, PAM은 네모 박스(점선)로 표시하였다. 또한, 도너의 동의돌연변이(synonymous mutation)는 밑줄(물결)로 표시하였으며, HDR 및 1- 코돈 결실 빈도는 1 : 1 비율로 전달된 SpCas9 및 Rpe65-도너 주형에 의해 유도된 값이다(n=3).
도 7은 rd12 마우스에서 Rpe65의 난센스 돌연변이의 CRISPR / Cas9 매개 치료 교정을위한 이중 AAV 전략의 개략도로, Rpe65의 조기 종결코돈(밑줄(직선))은 엑손 3에 C→T 돌연변이에 의해 생성되며, AAV 벡터는 sgRNA와 도너 주형(동의돌연변이(synonymous mutation)는 밑줄(물결)로 표시)을 함께 발현하기 위해 U6 프로모터 및 SpCas9의 발현을 위해 EFS 프로모터를 각각 사용하였다. 치료적 유전자 교정은 HDR- 매개 정밀 교정 (HDR) 또는 in-frame NHEJ (Inf-NHEJ)로부터 유도 될 수 있다.
도 8은 고용량 (총 2×10¹¹ vg/eye) 및 저용량 (총 2×10¹⁰ vg/eye) AAV 주입 후 4 주째에 rd12 마우스의 망막(a) 및 RPE(b)에서 targeted deep sequencing으로 측정한 인델 빈도를 나타내는 그래프로, SpCas9과 TS4^rd12 sgRNA-Rpe65-donor의 비율을 괄호에 표시하였다.
도 9는 이배체 세포 당 AAV 카피 수와 인델 빈도 사이의 상관관계를 보여주는 그래프이다.
도 10은 주입 후 4 주째에 rd12 마우스의 망막 및 RPE에서 C→T 돌연변이 위치에서 치료적 HDR의 빈도를 나타낸 그래프이다.
도 11은 HDR에 대한 인델 빈도의 비율을 나타낸 그래프로, SpCas9과 TS4^rd12 sgRNA-Rpe65-donor의 비율을 1:1로 하여 고용량 또는 저용량으로 망막하에 주입하였다(n=4).
도 12는 AAV를 처리한 RPE에서 삽입, 결실 또는 HDR을 포함하는 deep sequencing 리드 수의 평균값을 나타낸 그래프(a)와 in-frame 결실, 1-코돈 결실 또는 HDR의 평균 백분율값을 나타내는 그래프(b)로, SpCas9과 TS4^rd12 sgRNA-Rpe65-donor의 비율을 1:1로 하여 고용량 또는 저용량으로 망막하에 주입하였다(n=10). Rpe65mut/mut 또는 others는 조작되지 않은 대조군, Ins는 삽입, Del은 결실, Inf-Del은 in-frame 결실을 의미한다.
도 13은 AAV를 처리한 RPE에 TS4^rd12 sgRNA에 의해 유도되는 변화 및 Rpe65 도너 주형을 나타내는 뉴클레오타이드 서열을 보여주는 이미지로, SpCas9과 TS4^rd12 sgRNA-Rpe65-donor의 비율을 1:1로 하여 고용량 또는 저용량으로 망막하에 주입하였다(n=10). 이때, 역삼각형(▼)은 TS4 sgRNA에 의해 유도되는 DSB 위치를 나타내며, rd12 마우스의 조기 종결 코돈에 해당하는 서열은 밑줄(점선)로 표시하였고, PAM은 네모 박스로 표시하였다. 또한, 도너의 동의돌연변이(synonymous mutation)는 밑줄(물결)로 표시하였으며, 조기 종결 코돈을 포함하는 뉴클레오타이드 서열 및 이들에 상응하는 아미노산 서열을 밑줄(직선)로 표시하였다.
도 14는 동물 실험의 개요로, SRT 주입 및 망막 전위도 검사의 시점을 표시하였다(P0: 출생후 날 0; EGR: electroretinography; W: 주).
도 15는 주입 후 6 주째에 암순응 광 응답의 진폭(n=4)에 관한 그래프로, (a)는 암순응(scotopic) a-wave의 진폭에 관한 것이고, (b)는 암순응(scotopic) b-wave의 진폭에 관한 것이다(Normal: C57BL/6; rd12: 처리하지 않은 rd12 마우스; rd12-AAV: SpCas9과 TS4^rd12 sgRNA-Rpe65-donor를 1:1 비율로 하여 망막하에 주입하여 처리한 rd12 마우스). Scale bar, 20 μm. *P < 0.05; **P < 0.01 by Student's t test.
도 16은 주입 후 7 개월째에 암순응 광 응답의 진폭(n=4)에 관한 그래프로, (a)는 암순응(scotopic) a-wave의 진폭에 관한 것이고, (b)는 암순응(scotopic) b-wave의 진폭에 관한 것이다(Normal: C57BL/6; rd12: 처리하지 않은 rd12 마우스; rd12-AAV: SpCas9과 TS4^rd12 sgRNA-Rpe65-donor를 1:1 비율로 하여 망막하에 주입하여 처리한 rd12 마우스). Scale bar, 20 μm. *P < 0.05; **P < 0.01 by Student's t test.
도 17은 주입 후 7 개월째에 SpCas9와 TS4^rd12 sgRNA-Rpe65-donor의 1 : 1 비율로 SRT 주입을 하거나 또는 하지 않은 rd12 마우스의 망막 조직의 H & E 이미지(a) 및 외핵층 핵의 층 수를 보여주는 그래프이다(GCL: 신경절 세포층; INL: 내부 핵 층; ONL: 외핵층; rd12: 처리하지 않은 rd12 마우스; rd12-AAV: SpCas9과 TS4^rd12 sgRNA-Rpe65-donor를 1:1 비율로 하여 망막하에 주입하여 처리한 rd12 마우스). Scale bar, 20 μm. *P < 0.05; **P < 0.01 by Student's t test.
도 18은 rd12 마우스의 RPE 층에서 Rpe65 및 HA의 발현을 보여주는 이미지이다(rd12: 처리하지 않은 rd12 마우스; rd12-AAV: SpCas9과 TS4^rd12 sgRNA-Rpe65-donor를 1:1 비율로 하여 망막하에 주입하여 처리한 rd12 마우스). Scale bar, 20 μm.
도 19는 HEK293 세포주의 인간 RPE65 표적 부위에서의 Indel 빈도를 보여주는 그래프(a), in-frame 및 out-of-frame 인델의 백분율값을 보여주는 그래프(b)로, targeted deep sequencing에 의해 빈도를 측정하였다. TS4 표적 부위에 해당하는 인간 표적 부위(Ex3-2)에서 인델 빈도는 화살표로 표시하였다. 또한, 도 19는 16개의 RPE65 표적 부위에서의 in-frame 및 out-of-frame 인델의 백분율값을 가지는 그래프(c)를 보여준다.
도 20은 인간 RPE65 및 마우스 Rpe65 유전자와 그 아미노산 서열의 비교한 것으로, 인간(Ex3-2) 및 마우스(TS4) sgRNA에 의해 표적화되는 서열은 밑줄로 표시하였고, PAM 서열은 네모 박스로 표시하였다.
도 21은 AAV-처리 망막에서 TS4rd12 표적 부위와 최대 3 개의 뉴클레오타이드가 다른 33 개의 동종 부위에 대한 잠재적인 오프-타겟 위치의 리스트 및 targeted deep sequencing 결과를 보여주는 그래프로, 대상 사이트와 관련하여 일치하지 않는 뉴클레오티드를 소문자 알파벳으로 나타내며 PAM 서열은 네모 박스로 표시하였다.
도 22는 SpCas9 및 도너 주형을 암호화하는 이중 AAV 시스템의 처리하지 않거나 또는 처리한 루 7 개월째에 rd12 마우스의 RPE 층의 대표적인 H & E 이미지를 보여준다. Scale bar, 20 μm.

달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.

본 명세서에 의해 개시되는 내용의 일 태양은 가이드핵산에 관한 것이다.

“가이드핵산”은 표적 핵산, 유전자 또는 염색체를 인지하고, 및 에디터단백질과 상호작용할 수 있는 뉴클레오타이드서열을 의미한다. 이때, 상기 가이드핵산은 표적 핵산, 유전자 또는 염색체 내의 일부 뉴클레오타이드서열과 상보적인 결합할 수 있다. 또한 상기 가이드핵산의 일부 뉴클레오타이드서열은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성할 수 있다.

상기 가이드핵산은 가이드핵산-에디터단백질 복합체가 표적 핵산, 유전자 또는 염색체의 표적 영역에 위치할 수 있도록 유도하는 기능을 수행할 수 있다.

상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.

상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.

예를 들어, 하나의 연속된 핵산 서열은 (N)_m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.

상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.

예를 들어, 두 개 이상의 연속된 핵산서열은 (N)_m과 (N)_o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.

상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.

상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리 도메인 등의 기능적 도메인일 수 있으며, 이에 제한되지 않는다.

이때, 하나의 가이드핵산은 2 이상의 기능적 도메인을 가질 수 있다. 이때, 상기 2 이상의 기능적 도메인은 서로 상이할 수 있다. 예를 들어, 하나의 가이드핵산은 가이드 도메인 및 제 1 상보적 도메인을 가질 수 있고, 다른 예를 들어, 하나의 가이드핵산은 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인을 가질 수 있으며, 또 다른 예를 들어, 하나의 가이드핵산은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인을 가질 수 있다. 또는 하나의 가이드핵산에 포함된 2 이상의 기능적 도메인은 서로 동일할 수도 있다. 예를 들어, 하나의 가이드핵산은 2 이상의 근위 도메인을 가질 수 있고, 다른 예를 들어, 하나의 가이드핵산은 2 이상의 꼬리도메인을 가질 수 있다. 다만, 하나의 가이드핵산에 포함되어 있는 기능적 도메인이 서로 동일한 도메인이라는 말은 두 기능적 도메인의 시퀀스가 동일하다는 의미는 아니며, 시퀀스가 상이하여도 기능적으로 동일한 기능을 수행하고 있으면 동일한 도메인이라고 할 수 있다.

기능적 도메인에 대해서 이하에서 구체적으로 설명한다.

i) 가이드 도메인

"가이드 도메인"은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 결합을 할 수 있는 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위해 역할한다. 예를 들어, 가이드 도메인은 표적 유전자 또는 핵산의 특정 뉴클레오타이드서열을 가지는 위치로 가이드핵산-에디터단백질 복합체를 유도하는 기능을 수행할 수 있다.

상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드서열일 수 있다.

일 예로, 상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.

다른 일 예로, 상기 가이드 도메인은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.

상기 가이드 도메인은 가이드 서열을 포함할 수 있다.

“가이드 서열”은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드서열이며, 이때 상기 가이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드서열일 수 있다.

상기 가이드 서열은 10 내지 25개의 뉴클레오타이드서열일 수 있다.

일 예로, 상기 가이드 서열은 10 내지 25개의 뉴클레오타이드서열, 15 내지 25개의 뉴클레오타이드서열 또는 20 내지 25개의 뉴클레오타이드서열일 수 있다.

다른 일 예로, 상기 가이드 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열 또는 20 내지 25개의 뉴클레오타이드서열일 수 있다.

또한, 상기 가이드 도메인은 추가 뉴클레오타이드서열을 더 포함할 수 있다.

상기 추가 뉴클레오타이드서열은 가이드 도메인의 기능 향상 또는 저하를 위한 것일 수 있다.

상기 추가 뉴클레오타이드서열은 가이드 서열의 기능 향상 또는 저하를 위한 것일 수 있다.

상기 추가 뉴클레오타이드서열은 1 내지 10개의 뉴클레오타이드서열일 수 있다.

일 예로, 상기 추가 뉴클레오타이드서열은 2내지 10개의 뉴클레오타이드서열, 4 내지 10개의 뉴클레오타이드서열, 6 내지 10개의 뉴클레오타이드서열 또는 8 내지 10개의 뉴클레오타이드서열일 수 있다.

다른 일 예로, 상기 추가 뉴클레오타이드서열은 1 내지 3개의 뉴클레오타이드서열, 3 내지 6개의 뉴클레오타이드서열 또는 7 내지 10개의 뉴클레오타이드서열일 수 있다.

일 구체예로서, 상기 추가 뉴클레오타이드서열은 1개의 뉴클레오타이드서열, 2개의 뉴클레오타이드서열, 3개의 뉴클레오타이드서열, 4개의 뉴클레오타이드서열, 5개의 뉴클레오타이드서열, 6개의 뉴클레오타이드서열, 7개의 뉴클레오타이드서열, 8개의 뉴클레오타이드서열, 9개의 뉴클레오타이드서열 또는 10개의 뉴클레오타이드서열일 수 있다.

예를 들어, 상기 추가 뉴클레오타이드서열은 1개의 뉴클레오타이드서열 G(구아닌)일 수 있으며, 또는 2개의 뉴클레오타이드서열 GG일 수 있다.

상기 추가 뉴클레오타이드서열은 상기 가이드 서열의 5' 말단에 위치할 수 있다.

상기 추가 뉴클레오타이드서열은 상기 가이드 서열의 3' 말단에 위치할 수 있다.

ii) 제 1 상보적 도메인

"제 1 상보적 도메인"은 이하에서 설명하는 제 2 상보적 도메인에 대해 상보적 뉴클레오타이드서열을 포함하는 도메인으로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 1 상보적 도메인은 제 2 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드서열일 수 있다.

상기 제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.

상기 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드서열일 수 있다.

일 예로, 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드서열, 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.

다른 일 예로서, 상기 제 1 상보적 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.

iii) 연결 도메인

"연결 도메인"은 두 개 이상의 도메인을 연결하는 뉴클레오타이드서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.

상기 연결 도메인은 1 내지 30개의 뉴클레오타이드서열일 수 있다.

일 예로서, 상기 연결 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열 또는 25 내지 30개의 뉴클레오타이드서열일 수 있다.

다른 일 예로서, 상기 연결 도메인은 1 내지 30개의 뉴클레오타이드서열, 5 내지 30개의 뉴클레오타이드서열, 10 내지 30개의 뉴클레오타이드서열, 15 내지 30개의 뉴클레오타이드서열, 20 내지 30개의 뉴클레오타이드서열 또는 25 내지 30개의 뉴클레오타이드서열일 수 있다.

iv) 제 2 상보적 도메인

"제 2 상보적 도메인"은 전술한 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 뉴클레오타이드서열을 포함하는 도메인으로, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 2 상보적 도메인은 제 1 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드서열일 수 있다.

상기 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.

제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 뉴클레오타이드서열 및 제 1 상보적 도메인과의 상보성이 없는 뉴클레오타이드서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 뉴클레오타이드서열을 포함할 수 있으며, 제 1 상보적 도메인보다 뉴클레오타이드서열의 길이가 길 수 있다.

상기 제 2 상보적 도메인은 5 내지 35개의 뉴클레오타이드서열일 수 있다.

일 예로, 상기 제 2 상보적 도메인은 1 내지 35개의 뉴클레오타이드서열, 5 내지 35개의 뉴클레오타이드서열, 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35 뉴클레오타이드서열일 수 있다.

다른 일 예로, 상기 제 2 상보적 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.

v) 근위 도메인(proximal domain)

"근위 도메인"은 제 2 상보적 도메인에 근접하게 위치하는 뉴클레오타이드서열이다.

근위 도메인은 근위 도메인 내의 상보적인 뉴클레오타이드서열을 포함할 수 있으며, 상보적인 뉴클레오타이드서열에 의해 이중가닥을 형성할 수 있다.

상기 근위 도메인은 1 내지 20개의 뉴클레오타이드서열일 수 있다.

일 예로서, 상기 근위 도메인은 1 내지 20개의 뉴클레오타이드서열, 5 내지 20개의 뉴클레오타이드서열, 10 내지 20개의 뉴클레오타이드서열 또는 15 내지 20개의 뉴클레오타이드서열일 수 있다.

다른 일 예로서, 상기 근위 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열 또는 15 내지 20개의 뉴클레오타이드서열일 수 있다.

vi) 꼬리 도메인

"꼬리 도메인"은 가이드핵산의 양 말단 중 어느 하나 이상의 말단에 위치하는 뉴클레오타이드서열이다.

꼬리 도메인은 꼬리 도메인 내의 상보적인 뉴클레오타이드서열을 포함할 수 있으며, 상보적인 뉴클레오타이드서열에 의해 이중가닥을 형성할 수 있다.

상기 꼬리 도메인은 1 내지 50개의 뉴클레오타이드서열일 수 있다.

일 예로, 상기 꼬리 도메인은 5 내지 50개의 뉴클레오타이드서열, 10 내지 50개의 뉴클레오타이드서열, 15 내지 50개의 뉴클레오타이드서열, 20 내지 50개의 뉴클레오타이드서열, 25 내지 50개의 뉴클레오타이드서열, 30 내지 50개의 뉴클레오타이드서열, 35 내지 50개의 뉴클레오타이드서열, 40 내지 50개의 뉴클레오타이드서열 또는 45 내지 50개의 뉴클레오타이드서열일 수 있다.

다른 일 예로, 상기 꼬리 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열, 30 내지 35개의 뉴클레오타이드서열, 35 내지 40개의 뉴클레오타이드서열, 40 내지 45개의 뉴클레오타이드서열 또는 45 내지 50개의 뉴클레오타이드서열일 수 있다.

한편, 상기 도메인들, 즉, 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인이 포함하는 핵산 서열의 일부 또는 전부는 선택적 또는 추가적으로 화학적 변형을 포함할 수 있다.

상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.

가이드핵산은 하나 이상의 도메인을 포함한다.

상기 가이드핵산은 가이드 도메인을 포함할 수 있다.

상기 가이드핵산은 제 1 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 연결 도메인을 포함할 수 있다.

상기 가이드핵산은 제 2 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 근위 도메인을 포함할 수 있다.

상기 가이드핵산은 꼬리 도메인을 포함할 수 있다.

이때, 상기 도메인의 개수는 1, 2, 3, 4, 5, 6 또는 그 이상일 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 가이드 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 1 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 연결 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 2 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 근위 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 꼬리 도메인을 포함할 수 있다.

이때, 상기 가이드핵산은 하나의 도메인이 중복되어 포함될 수 있다.

상기 가이드핵산은 여러 도메인을 중복 또는 중복시키지 않고 포함할 수 있다.

상기 가이드핵산은 같은 종류의 도메인을 포함할 수 있으며, 이때, 같은 종류의 도메인은 동일한 핵산서열을 가지거나 또는 서로 다른 핵산서열을 가질 수 있다.

상기 가이드핵산은 두 종류의 도메인을 포함할 수 있으며, 이때, 다른 두 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 세 종류의 도메인을 포함할 수 있으며, 이때, 다른 세 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 네 종류의 도메인을 포함할 수 있으며, 이때, 다른 네 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 다섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 다섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 여섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 여섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

예를 들면, 가이드핵산은 [가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[연결 도메인]-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]으로 구성될 수 있으며, 이때, 두 개의 가이드 도메인은 서로 다른 또는 동일한 표적을 위한 가이드 서열을 포함할 수 있으며, 상기 두 개의 제 1 상보적 도메인과 두 개의 제 2 상보적 도메인 동일한 핵산서열을 가지거나 다른 핵산서열을 가질 수 있다. 가이드 도메인이 서로 다른 표적을 위한 가이드 서열을 포함하는 경우, 상기 가이드핵산은 두 개의 표적에 특이적으로 결합할 수 있으며, 이때, 특이적 결합을 동시에 일어나거나 순차적으로 일어날 수 있다. 또한, 상기 연결 도메인은 특정 효소에 의해 절단될 수 있으며, 특정 효소의 존재 하에서 상기 가이드핵산은 두 부분 또는 세 부분으로 나누어질 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예로서, 가이드핵산은 gRNA일 수 있다.

gRNA

“gRNA”는 표적 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 특이적 표적화할 수 있는 RNA를 지칭한다. 또한, 상기 gRNA는 표적 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 표적 유전자 또는 핵산으로 인도할 수 있다.

상기 gRNA는 다수의 도메인을 포함할 수 있다. 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.

gRNA는 단일가닥 gRNA(단일 RNA 분자; single gRNA; sgRNA); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.

일 구체예에서, 단일가닥 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 연결 도메인; 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인; 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함할 수 있다.

다른 일 구체예로서, 이중 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인 및 제 1 상보적 도메인을 포함하는 제 1가닥; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인, 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함하는 제 2 가닥을 포함할 수 있다.

이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다. 상기 crRNA는 가이드 도메인과 제 1 상보적 도메인을 포함할 수 있으며, 상기 tracrRNA는 제 2 상보적 도메인, 근위 도메인 및 선택적으로 꼬리 도메인을 포함할 수 있다.

또 다른 일 구체예로서, 단일가닥 gRNA는 3'으로부터 5' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인을 포함할 수 있다.

이때, 상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophiles), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGAGCUA-3'일 수 있고, 또는 5'-GUUUUAGAGCUA-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)_n을 포함, 즉, 5'-GUUUUAGAGCUA(X)_n-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.

또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3' 또는 5'-GUUUUAGUCCCUU-3'일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3' 또는 5'-GUUUUAGUCCCUU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)_n을 포함, 즉, 5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)_n-3' 또는 5'-GUUUUAGUCCCUU(X)_n-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.

다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-UUUGUAGAU-3' 일 수 있고, 또는 5'-UUUGUAGAU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)_n을 포함, 즉, 5'-(X)_nUUUGUAGAU-3' 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 5의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 역할을 하는 뉴클레오타이드서열일 수 있다.

상기 연결 도메인은 제 1 상보적 도메인 및 제 2 상보적 도메인과 각각 공유결합 또는 비공유결합을 할 수 있다.

상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.

상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다.

상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.

이때, 상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophiles), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-UAGCAAGUUAAAAU-3'일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)_n또는/및 (X)_m을 포함, 즉, 5'-(X)_n UAGCAAGUUAAAAU(X)_m-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드서열의 개수로, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다. 또한 (X)_m은 동일한 뉴클레오타이드서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드서열일 수 있다.

또 다른 예를 들어, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3' 또는 5'-AAGGGACUAAAAU-3'일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3' 또는 5'-AAGGGACUAAAAU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)_n또는/및 (X)_m을 포함, 즉, 5'-(X)_n AAGAAAUUUAAAAAGGGACUAAAAU(X)_m-3' 또는 5'-(X)_n AAGGGACUAAAAU(X)_m-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다. 또한 (X)_m은 동일한 뉴클레오타이드서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드서열일 수 있다.

다른 일 구체예로서, 상기 제 2 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAAUUUCUACU-3' 일 수 있고, 또는 5'-AAAUUUCUACU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드 서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)_n또는/및 (X)_m을 포함, 즉, 5'-(X)_nAAAUUUCUACU (X)_m-3' 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드 서열의 개수로, 상기 n은 1 내지 10의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다. 또한 (X)_m은 동일한 뉴클레오타이드 서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상보적 결합을 할 수 있다.

상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상기 상보적 결합을 통해 이중가닥을 형성할 수 있다.

상기 형성된 이중가닥은 CRISPR 효소와 상호작용할 수 있다.

선택적으로, 상기 제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 하지않는 추가 뉴클레오타이드 서열을 포함할 수 있다.

이때, 상기 추가 뉴클레오타이드 서열은 1 내지 15개의 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 뉴클레오타이드 서열은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 또는 10 내지 15개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 근위 도메인은 제 2 상보적 도메인의 3' 방향에 위치하는 도메인일 수 있다.

상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophiles), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAGGCUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUAGUCCG-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)_n을 포함, 즉, 5'-AAGGCUAGUCCG(X)_n-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

또 다른 예를 들어, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAAGAGUUUGC-3'일 수 있고, 또는 5'-AAAGAGUUUGC-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)_n을 포함, 즉, 5'-AAAGAGUUUGC(X)_n-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 1 내지 40의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 꼬리 도메인은 단일가닥 gRNA 또는 이중 gRNA의 제 1 가닥 또는 제 2 가닥의 3' 말단에 선택적으로 추가될 수 있다.

상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophiles), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)_n을 포함, 즉, 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)_n-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

또 다른 예를 들어, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)_n을 포함, 즉, 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)_n-3', 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예에서, 상기 꼬리 도메인은 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드 서열을 포함할 수 있다.

예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드 서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안 될 수 있는 뉴클레오타이드를 포함할 수 있다.

gRNA는 상기에 기재된 바와 같이 다수의 도메인을 포함할 수 있어, gRNA가 포함하는 도메인의 종류 및 개수에 따라 핵산 서열의 길이를 조절할 수 있으며, 각각의 도메인에 의해 3차원 형태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.

gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.

이중 gRNA

이중 gRNA는 제 1 가닥 및 제 2 가닥으로 구성된다.

이때, 상기 제 1 가닥은

5'-[가이드 도메인]-[제 1 상보적 도메인]-3'으로 구성될 수 있고,

상기 제 2 가닥은

5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는

5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.

이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다.

이때, 상기 제 1가닥 및 제 2가닥은 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.

일 구체예로서, 상기 제 1 가닥은

5'-(N_target)-(Q)_m-3'; 또는

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-3'일 수 있다.

이때, 상기 N_target은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열로서, 상기 N_target은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드 서열 부위이다.

이때, 상기 (Q)_m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Q)_m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드 서열의 개수로, 5 내지 35의 정수일 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGAGCUA-3'일 수 있고, 또는 5'-GUUUUAGAGCUA-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3' 또는 5'-GUUUUAGUCCCUU-3'일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3' 또는 5'-GUUUUAGUCCCUU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (X)_a, (X)_b 및 (X)_c는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.

일 구체예로서, 상기 제 2 가닥은

5'-(Z)_h-(P)_k-3'; 또는

5'-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-3' 일 수 있다.

다른 일 구체예로서, 상기 제 2 가닥은

5'-(Z)_h-(P)_k-(F)_i-3'; 또는

5'-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-(F)_i-3' 일 수 있다.

이때, 상기 (Z)_h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Z)_h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드 서열의 개수로, 5 내지 50의 정수일 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-UAGCAAGUUAAAAU-3'일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3' 또는 5'-AAGGGACUAAAAU-3'일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3' 또는 5'-AAGGGACUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 (P)_k는 근위 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 뉴클레오타이드 서열의 개수로, 1 내지 20의 정수일 수 있다.

예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)_k는 5'-AAGGCUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)_k는 5'-AAAGAGUUUGC-3'일 수 있고, 또는 5'-AAAGAGUUUGC-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)_k는 5'-AAGGCUUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 (F)_i는 꼬리 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 뉴클레오타이드 서열의 개수로, 1 내지 50의 정수일 수 있다.

예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)_i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)_i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)_i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (F)_i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드 서열을 포함할 수 있다.

예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드 서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안될 수 있는 뉴클레오타이드를 포함할 수 있다.

또한, 상기 (X)_d, (X)_e 및 (X)_f는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 d, e 및 f는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.

단일가닥 gRNA

단일가닥 gRNA는 제 1 단일가닥 gRNA 및 제 2 단일가닥 gRNA로 나뉠 수 있다.

제 1 단일가닥 gRNA

제 1 단일가닥 gRNA는 상기 이중 gRNA의 제 1 가닥과 제 2 가닥을 연결 도메인으로 연결한 단일가닥 gRNA이다.

구체적으로, 상기 단일가닥 gRNA는

5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-3',

5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는

5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.

상기 제 1 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.

일 구체예로서, 상기 제 1 단일가닥 gRNA는

5'-(N_target)-(Q)_m-(L)_j-(Z)_h-3';

5'-(N_target)-(Q)_m-(L)_j-(Z)_h-(P)_k-3'; 또는

5'-(N_target)-(Q)_m-(L)_j-(Z)_h-(P)_k-(F)_i-3'일 수 있다.

다른 일 구체예로서, 상기 단일가닥 gRNA는

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-(L)_j-(X)_d-(Z)_h-(X)_e-3';

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-(L)_j-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-3'; 또는

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-(L)_j-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-(F)_i-3'일 수 있다.

상기 (Q)_m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Q)_m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드 서열의 개수로, 5 내지 35의 정수일 수 있다.

다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3' 또는 5'-GUUUUAGUCCCUU-3' 일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3' 또는 5'-GUUUUAGUCCCUU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (L)_j는 연결 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 뉴클레오타이드 서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드 서열의 개수로, 1 내지 30의 정수일 수 있다.

상기 (Z)_h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Z)_h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드 서열의 개수로, 5 내지 50의 정수일 수 있다.

또한, 상기 (X)_a, (X)_b, (X)_c, (X)_d, (X)_e 및 (X)_f는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b, c, d, e 및 f는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.

제 2 단일가닥 gRNA

제 2 단일가닥 gRNA는 가이드 도메인, 제 1 상보적 도메인 및 제 2 상보적 도메인으로 구성되는 단일가닥 gRNA일 수 있다.

이때, 상기 제 2 단일가닥 gRNA는

5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'; 또는

5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.

상기 제 2 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.

일 구체예로서, 상기 제 2 단일가닥 gRNA는

5'-(Z)_h-(Q)_m-(N_target)-3'; 또는

5'-(X)_a-(Z)_h-(X)_b-(Q)_m-(X)_c-(N_target)-3'일 수 있다.

다른 일 구체예로서, 상기 단일가닥 gRNA는

5'-(Z)_h-(L)_j-(Q)_m-(N_target)-3'; 또는

5'-(X)_a-(Z)_h-(L)_j-(Q)_m-(X)_c-(N_target)-3'일 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-UUUGUAGAU-3'일 수 있고, 또는 5'-UUUGUAGAU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-AAAUUUCUACU-3'일 수 있고, 또는 5'-AAAUUUCUACU-3'와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (L)_j는 연결 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 뉴클레오타이드 서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드 서열의 개수로, 1 내지 30의 정수일 수 있다.

본 명세서에 의해 개시되는 내용의 일 태양으로서, 가이드핵산은 망막 기능형성 유전자의 표적 서열에 상보적으로 결합할 수 있는 gRNA일 수 있다.

“망막 기능형성(Retinal function-forming)”은 망막의 기능, 예를 들면, 안구 내로 들어오는 빛이 망막의 내층을 지나 망막의 시세포에 감지되고 시세포는 감지된 빛 에너지 또는 신호를 전기적 에너지 또는 신호로 전환하여 이 에너지 또는 신호를 망막 내층의 세포를 통해 시신경으로 전달하는데 필요한 모든 기능이 정상적으로 작동할 수 있도록 하는 모든 과정을 의미한다.

또한, 망막 기능형성은 망막조직을 이루는 여러 층 또는 막, 예를 들면, 망막색소상피층, 광수용체세포층, 바깥경계막, 바깥핵층, 바깥얼기층, 속핵층, 속얼기층, 신경절세포층, 신경섬유층, 속경계막 등 각각의 층 또는 막들이 정상적으로 기능할 수 있도록 하는 모든 과정도 포함한다.

망막 기능형성은 망막 조직이 정상적이 기능을 수행할 수 있도록 관여하는 다양한 조직 및/또는 세포들의 각각의 기능들이 정상적으로 작동할 수 있도록 하는 모든 과정도 포함한다. 여기서 망막 조직이 정상적인 기능을 수행할 수 있도록 관여하는 다양한 조직 및/또는 세포들은 망막 조직에 근접한 조직, 예를 들어, 맥락막, 각막, 공막, 홍채, 섬모체, 모양체 등 및/또는 이 조직을 이루는 세포들을 포함한다.

또한, 망막 기능형성은 망막 세포의 생존, 증식, 지속 및 사명 등 전체적인 발달 및 생장과정도 포함한다. 이때, 망막 세포는 신경세포, 신경교세포, 원뿔세포, 간상세포, 망막색소상피세포 등을 포함한다.

망막 기능형성은 원뿔세포 및/또는 간상세포의 빛을 감지하는 기능일 수 있다.

망막 기능형성은 시각회로(visual cycle) 관련 기능일 수 있다.

이때, 시각회로는 시각수용체인 로돕신의 광화학 변화와 재생의 순환과정으로, 로돕신 내에 11-cis-레티놀이 광합성화에 의해 전 트랜스형(all-trans)으로 변화되는 과정을 포함한다.

망막 기능형성은 시각회로(visual cycle) 관련 유전자 및/또는 단백질의 발현 조절일 수 있다.

망막 기능형성은 시각 색소 재생(visual pigment regeneration) 관련 기능일 수 있다.

“망막 기능형성 유전자(Retinal function-forming gene)”는 망막의 기능형성에 직접적으로 참여하거나 또는 간접적으로 영향을 미치는 모든 유전자를 의미하며, 이때, 상기 유전자는 망막의 기능형성에 직접적으로 참여하거나 또는 간접적으로 영향을 미치는 모든 펩타이드, 폴리펩타이드 또는 단백질을 암호화는 유전자 또는 핵산 서열을 모두 포함한다.

상기 망막 기능형성 유전자는 야생형(wildtype) 망막 기능형성 유전자일 수 있다.

상기 망막 기능형성 유전자는 하나 이상의 돌연변이를 포함하는 망막 기능형성 유전자일 수 있다.

상기 “돌연변이(mutation)”는 유전자가 가지는 DNA의 염기서열에 변화가 일어난 것으로, 유전자가 가지는 DNA의 염기서열 내에서 하나 이상의 뉴클레오타이드가 삭제(deletion), 삽입(insertion) 또는 치환(substitution)되어 변형된 것을 모두 포함한다. 이때, 유전자 내 돌연변이가 일어난 서열을 “돌연변이 서열(mutation sequence)”로 지칭한다. 또한, 돌연변이는 유전자 내 돌연변이로 인해 유전자가 암호화하는 단백질의 일부 아미노산이 삭제(deletion), 삽입(insertion) 또는 치환(substitution)되어 변형된 것도 모두 포함한다.

예를 들어, 망막 기능형성 유전자가 RPE65 유전자인 경우, 상기 RPE65 유전자는 야생형(wildtype) RPE65 유전자 및 자연적으로 발생될 수 있는 모든 돌연변이 형태의 RPE65 유전자를 포함한다. 현재까지 발견된 자연적으로 발생하는 RPE65 유전자의 돌연변이는 86개로 알려져 있으며, 본 명세서에서 개시하는 RPE65 유전자는 상기 모든 돌연변이를 포함한다. 일 예로, RPE65 유전자는 자연적으로 발생되는 돌연변이인 RPE65 유전자의 IVS-2A>C, IVS-2A>T, IVS2+1G>T, c.57_84delGG, c90_91insT, c.137delG, c106_114del9bp, c.292_311del20bp, c.440_441delCA, c.495_496insG, IVS6-2A>T, IVS6-1G>T, IVS6+1G>C, c.615_616delCA, IVS7+4A>G, IVS8+1G>A, IVS8+4A>G, c.891delA, c.894delG, c.1064delA, c.1120delA, c.961_962insA, IVS11+2T>A, c.1056G>A, c.1059_1060insG, c.1069_1070insT, c.1243+2T>A, c.1338+20A>C, c.1417_1418delinsA, c.1590delC, c.1590C>A 또는 c.1499_1503del15bp 돌연변이를 포함할 수 있다. 다른 일 예로, RPE65 유전자는 자연적으로 발생되는 M1T, E6 deletion, G32V, R44Q, L60P, Q64 deletion, F70V, R91Q, R91P, T101I, G104D, R118S, Y144D, E148D, T162P, H182R, H182N, N205S, D215G, R234 deletion, Y239D, Y249C, V287F, K303 deletion, H313R, Y318N, N321K, C330Y, L343 deletion, A360P, Y368C, A393G, W402 deletion, L403P, V407A, L408P, E417Q, Y431C, A434V, Y435C, G436V, V443A, W458 deletion, W460 deletion, E462 deletion, P470L, G528V, F530L 또는 S533T 돌연변이 RPE65 단백질을 암호화하는 돌연변이 RPE 유전자를 포함할 수 있다.

이때, 상기 하나 이상의 돌연변이는 망막 기능형성 유전자가 암호화하는 단백질의 발현을 증가시키거나 또는 감소시킬 수 있다.

이때, 상기 하나 이상의 돌연변이는 망막 기능형성 유전자가 암호화하는 단백질의 발현에 영향을 미치지 않는 동의 돌연변이(synonymous mutation)일 수 있다.

이때, 상기 하나 이상의 돌연변이는 망막 기능형성 유전자가 암호화하는 단백질의 발현을 막는 넌센스 돌연변이(nonsense mutation)일 수 있다.

상기 망막 기능형성 유전자는 망막 기능형성을 촉진하거나 증가시킬 수 있다.

상기 망막 기능형성 유전자는 망막 기능형성을 저해하거나 억제시킬 수 있다.

상기 망막 기능형성 유전자는 망막 기능형성 환경을 유도하거나 활성화시킬 수 있다.

상기 망막 기능형성 유전자는 망막 기능형성 억제환경을 유도하거나 신생혈관형성 환경을 비활성화시킬 수 있다.

상기 망막 기능형성 유전자는 망막 기능형성을 조절(촉진, 증가, 저해 및/또는 억제 등)할 수 있다.

상기 망막 기능형성 유전자는 원뿔세포 및/또는 간상세포의 빛을 감지하는 기능을 수행하는 단백질을 발현할 수 있다.

상기 망막 기능형성 유전자는 원뿔세포 및/또는 간상세포의 빛을 감지하는 기능을 촉진하거나 증가시킬 수 있다.

상기 망막 기능형성 유전자는 원뿔세포 및/또는 간상세포의 빛을 감지하는 기능을 저해하거나 억제시킬 수 있다.

상기 망막 기능형성 유전자는 시각회로(visual cycle) 관련 기능을 촉진하거나 증가시킬 수 있다.

상기 망막 기능형성 유전자는 시각회로(visual cycle) 관련 기능을 저해하거나 억제시킬 수 있다.

상기 망막 기능형성 유전자는 시각회로(visual cycle) 관련 기능을 수행하는 단백질을 발현할 수 있다.

상기 망막 기능형성 유전자는 시각회로(visual cycle) 관련 기능을 수행하는 유전자 및/또는 단백질의 발현 조절할 수 있다.

상기 망막 기능형성 유전자는 시각 색소 재생(visual pigment regeneration) 관련 기능을 수행하는 단백질을 발현할 수 있다.

상기 망막 기능형성 유전자는 시각 색소 재생(visual pigment regeneration) 관련 기능을 촉진하거나 증가시킬 수 있다.

상기 망막 기능형성 유전자는 시각 색소 재생(visual pigment regeneration) 관련 기능을 저해하거나 억제시킬 수 있다.

상기 망막 기능형성 유전자는 망막 기능장애 질환의 개선 및 치료에 이용될 수 있다.

구현예에서,

본 명세서에 의해 개시되는 망막 기능형성 유전자는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및 CRX 유전자로 구성된 군에서 선택된 하나 이상일 수 있다.

임의의 구체예에서, 망막 기능형성 유전자는 RPE65 유전자일 수 있다.

RPE65(Retinal pigment epithelium-specific 65 kDa protein) 유전자는 BCO3, LCA2, RP20 또는 mrd12로도 칭해지는 단백질 RPE65를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, RPE65 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 RPE65(e.g., NCBI Accession No. NP_000320 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_000329 등으로 표현되는 RPE65 유전자.

RPE65 유전자는 IVS-2A>C, IVS-2A>T, IVS2+1G>T, c.57_84delGG, c90_91insT, c.137delG, c106_114del9bp, c.292_311del20bp, c.440_441delCA, c.495_496insG, IVS6-2A>T, IVS6-1G>T, IVS6+1G>C, c.615_616delCA, IVS7+4A>G, IVS8+1G>A, IVS8+4A>G, c.891delA, c.894delG, c.1064delA, c.1120delA, c.961_962insA, IVS11+2T>A, c.1056G>A, c.1059_1060insG, c.1069_1070insT, c.1243+2T>A, c.1338+20A>C, c.1417_1418delinsA, c.1590delC, c.1590C>A 또는 c.1499_1503del15bp 등의 돌연변이를 포함할 수 있다.

RPE65 유전자는 M1T, E6 deletion, G32V, R44Q, L60P, Q64 deletion, F70V, R91Q, R91P, T101I, G104D, R118S, Y144D, E148D, T162P, H182R, H182N, N205S, D215G, R234 deletion, Y239D, Y249C, V287F, K303 deletion, H313R, Y318N, N321K, C330Y, L343 deletion, A360P, Y368C, A393G, W402 deletion, L403P, V407A, L408P, E417Q, Y431C, A434V, Y435C, G436V, V443A, W458 deletion, W460 deletion, E462 deletion, P470L, G528V, F530L 또는 S533T 등의 RPE65 단백질 돌연변이를 암호화하는 돌연변이 RPE65 유전자를 포함할 수 있다.

임의의 구체예에서, 망막 기능형성 유전자는 GUCY2D 유전자일 수 있다.

GUCY2D(guanylate cyclase 2D) 유전자는 CORD5, CORD6, CYGD, GUC1A4, GUC2D, LCA1, RCD2, RETGC-1, ROS-GC1 또는 ROSGC로도 칭해지는 단백질 GUCY2D를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, GUCY2D 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 GUCY2D(e.g., NCBI Accession No. NP_000171 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_000180 등으로 표현되는 GUCY2D 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 SPATA7 유전자일 수 있다.

SPATA7(Spermatogenesis-associated protein 7) 유전자는 HSD3 또는 LCA3로도 칭해지는 단백질 SPATA7를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, SPATA7 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 SPATA7 (e.g., NCBI Accession No. NP_001035518, NP_060888 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001040428, NM_018418 등으로 표현되는 SPATA7 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 AIPL1 유전자일 수 있다.

AIPL1(Aryl-hydrocarbon-interacting protein-like 1) 유전자는 LCA4로도 칭해지는 단백질 AIPL1를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, AIPL1 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 AIPL1 (e.g., NCBI Accession No. NP_001028226, NP_001028227 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_014336, NM_001033054 등으로 표현되는 AIPL1 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 LCA5 유전자일 수 있다.

LCA5(leber congenital amaurosis 5) 유전자는 lebercilin 또는 C6orf152로도 칭해지는 단백질 LCA5를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, LCA5 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 LCA5 (e.g., NCBI Accession No. NP_001116241, NP_859065 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001122769, NM_181714 등으로 표현되는 LCA5 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 RPGRIP1 유전자일 수 있다.

RPGRIP1(X-linked retinitis pigmentosa GTPase regulator-interacting protein 1) 유전자는 CORD13, LCA6, RGI1, RGRIP, RPGRIP 또는 RPGRIP1d로도 칭해지는 단백질 RPGRIP1를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, RPGRIP1 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 RPGRIP1 (e.g., NCBI Accession No. NP_065099 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_020366 등으로 표현되는 RPGRIP1 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 CRB1 유전자일 수 있다.

CRB1(Crumbs homolog 1) 유전자는 LCA8 또는 RP12로도 칭해지는 단백질 CRB1를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, CRB1 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 CRB1(e.g., NCBI Accession No. NP_001180569, NP_001244894 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001193640, NM_001257965 등으로 표현되는 CRB1 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 CEP290 유전자일 수 있다.

CEP290(Centrosomal protein of 290 kDa) 유전자는 BBS14, CT87, JBTS5 또는 LCA10로도 칭해지는 단백질 CEP290를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, CEP290 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 CEP290(e.g., NCBI Accession No. NP_079390 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_025114 등으로 표현되는 CEP290 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 IMPDH1 유전자일 수 있다.

IMPDH1(Inosine-5'-monophosphate dehydrogenase 1) 유전자는 IMPD1, IMPDH-I, LCA11 또는 RP10로도 칭해지는 단백질 IMPDH1를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, IMPDH1 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 IMPDH1(e.g., NCBI Accession No. NP_000874, NP_001096075 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_000883, NM_001102605 등으로 표현되는 IMPDH1 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 RD3 유전자일 수 있다.

RD3(Retinal Degeneration 3) 유전자는 LCA12 또는 C1orf36로도 칭해지는 단백질 RD3를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, RD3 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 RD3(e.g., NCBI Accession No. NP_001158160.1, NP_898882.1 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001164688.1, NM_183059.2 등으로 표현되는 RD3 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 RDH12 유전자일 수 있다.

RDH12(Retinol dehydrogenase 12) 유전자는 LCA13, RP53 또는 SDR7C2로도 칭해지는 단백질 RDH12를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, RDH12 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 RDH12 (e.g., NCBI Accession No. NP_689656 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_152443 등으로 표현되는 RDH12 유전자.

임의의 구체예에서, 망막 기능형성 유전자는 CRX 유전자일 수 있다.

CRX(Cone-rod homeobox protein) 유전자는 CORD2, CRD, LCA7 또는 OTX3로도 칭해지는 단백질 CRX를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, CRX 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 CRX (e.g., NCBI Accession No. NP_000545 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_000554 등으로 표현되는 CRX 유전자.

상기 망막 기능형성 유전자는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래한 것일 수 있다.

유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.

본 명세서에 의해 개시되는 내용의 일 구현예에서, 가이드핵산은 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 표적 서열에 상보적으로 결합하는 gRNA일 수 있다.

“표적 서열”은 표적 유전자 또는 핵산 내에 존재하는 뉴클레오타이드 서열로, 구체적으로는 표적 유전자 또는 핵산 내에 표적 영역의 일부 뉴클레오타이드 서열이며, 이때 “표적 영역”은 표적 유전자 또는 핵산 내에 가이드핵산-에디터단백질에 의해 변형될 수 있는 부위이다.

이하에서, 표적 서열이라 함은 두 가지의 뉴클레오타이드 서열 정보 모두를 의미하는 용어로 사용될 수 있다. 예를 들어, 표적 유전자의 경우, 표적 서열은 표적 유전자 DNA의 transcribed strand의 서열 정보를 의미하는 것일 수도 있고, 또는 non-transcribed strand의 뉴클레오타이드 서열 정보를 의미하는 것일 수도 있다.

예를 들어, 표적 서열은 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드 서열(transcribed strand)인 5'-ATCATTGGCAGACTAGTTCG-3'을 의미할 수도 있으며, 이에 상보적인 뉴클레오타이드 서열(non-transcribed strand)인 5'-CGAACTAGTCTGCCAATGAT-3' 을 의미할 수도 있다.

표적 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서 상기 표적 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.

표적 서열은 가이드핵산 결합 서열 혹은 가이드핵산 비결합 서열을 포함한다.

“가이드핵산 결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 표적 서열 및 가이드핵산 결합 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 뉴클레오타이드 서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.

“가이드핵산 비결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상동성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 없다. 또한, 가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산 결합 서열과 상보적인 결합을 할 수 있다.

가이드핵산 결합 서열은 표적 서열 중 일부 뉴클레오타이드 서열로, 표적 서열의 두 가지 서로 다른 서열순서를 가지는 뉴클레오타이드 서열, 즉, 서로 상보적인 결합을 할 수 있는 두 가지의 뉴클레오타이드 서열 중 한 가지 뉴클레오타이드 서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.

예를 들면, 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드 서열인 5'-ATCATTGGCAGACTAGTTCG-3'과 이에 상보적인 뉴클레오타이드 서열인 5'-CGAACTAGTCTGCCAATGAT-3'을 표적 서열로 할 때, 가이드핵산 결합 서열은 두 개의 표적 서열 중 하나, 즉, 5'-ATCATTGGCAGACTAGTTCG-3' 또는 5'-CGAACTAGTCTGCCAATGAT-3'일 수 있다. 이때, 가이드핵산 비결합 서열은, 가이드핵산 결합 서열이 5'-ATCATTGGCAGACTAGTTCG-3'인 경우, 5'-CGAACTAGTCTGCCAATGAT-3'일 수 있고, 또는 가이드핵산 결합 서열이 5'-CGAACTAGTCTGCCAATGAT-3'인 경우 가이드핵산 비결합 서열은 5'-ATCATTGGCAGACTAGTTCG-3'일 수 있다.

가이드핵산 결합 서열은 표적 서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드 서열 중 선택된 하나의 뉴클레오타이드 서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드 서열 중 선택된 하나의 뉴클레오타이드 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.

가이드핵산 결합 서열은 표적 서열의 길이와 동일할 수 있다.

가이드핵산 비결합 서열은 표적 서열 또는 가이드핵산 결합 서열의 길이와 동일할 수 있다.

가이드핵산 결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서 상기 가이드핵산 결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.

가이드핵산 비결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서 상기 가이드핵산 비결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.

가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 일부 또는 완전한상보적인 결합을 할 수 있으며, 상기 가이드핵산 결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.

상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 또는 포함할 수 있다.

가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 일부 또는 완전한 상동성을 가질 수 있으며, 상기 가이드핵산 비결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.

상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동성을 가진 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성이거나 또는 완전하게 상동성인 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동적이 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.

가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보적 결합을 할 수 있으며, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열의 길이와 동일할 수 있다.

상기 가이드핵산 비결합 서열은 가이드핵산 결합서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열에 상보적이지 않은 1 내지 2개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.

또한, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 위치한 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

또한, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

“표적화(targeting)”는 표적 유전자 또는 핵산 내에 존재하는 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 하는 것을 의미한다. 이때, 상기 상보적 결합은 100%의 완전한 상보적 결합일 수 있고, 또는 70% 이상 100% 미만의 불완전한 상보적 결합일 수 있다. 따라서, “표적화하는 gRNA”는 표적 유전자 또는 핵산 내에 존재하는 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 하는 gRNA를 의미한다.

본 명세서에 의해 개시되는 표적 유전자는 망막 기능형성 유전자일 수 있다.

본 명세서에 의해 개시되는 표적 유전자는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자일 수 있다.

구현예에서,

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 프로모터 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.

또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 인트론 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 엑손 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 인핸서 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 암호화, 비암호화 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 엑손, 인트론 또는 이의 혼합 부분에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 돌연변이 부분은 망막 기능형성 유전자의 프로모터 영역, 인핸선 영역, 엑손 영역 및/또는 인트론 영역에 위치할 수 있다.

일 예로, 상기 표적 서열은 RPE65 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 망막 기능형성 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

“PAM(proto-spacer-adjacent Motif) 서열”은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열이다. 이때, PAM 서열은 에디터단백질의 종류 및 유래된 종에 따라 뉴클레오타이드 서열에 차이가 있을 수 있다.

이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).

NGG(N은 A, T, C 또는 G임);

NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);

NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);

NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);

NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및

TTN(N은 A, T, C 또는 G임).

일 예로, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPE65 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 GUCY2D 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 SPATA7 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AIPL1 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 LCA5 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RPGRIP1 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRB1 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CEP290 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 IMPDH1 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RD3 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 RDH12 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 PAM 서열의 5'말단 및/또는 3'말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 CRX 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

이하, 본 명세서에 의해 개시되는 일 구체예에서 사용할 수 있는 표적 서열들의 일 예들은 표 1 및 표 2에 정리하였으며, 표 1 및 표 2에 기재된 표적 서열은 가이드핵산 비결합 서열로, 기재한 서열을 통해 상보적인 서열, 즉, 가이드핵산 결합 서열은 예측될 수 있다. 또한, 표 1 및 표 2에 기재된 표적 이름(target name)은 에디터단백질에 따라 SpCas9의 경우 Sp를 기재하였고, CjCas9의 경우 Cj를 기재하여 구분하였다.

[표 1]

SpCas9을 위한 RPE65 유전자의 표적 서열(Target sequences of RPE65 gene for SpCas9)

[표 2]

CjCas9을 위한 RPE65 유전자의 표적 서열(Target sequences of RPE65 gene for CjCas9)

본 명세서에 의해 개시되는 내용의 일 태양은 망막 기능형성 유전자를 인위적으로 조작 또는 교정하기 위한 유전자 조작용 조성물에 관한 것이다.

상기 유전자 조작용 조성물은 인위적으로 조작된 또는 교정된 망막 기능형성 유전자의 생성에 이용될 수 있다. 또한, 상기 유전자 조작용 조성물에 의해 인위적으로 조작된 또는 교정된 망막 기능형성 유전자는 망막 기능형성 시스템을 조절할 수 있다.

“인위적으로 조작된(artificially modified or engineered or artificially engineered)”이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다. 이하에서, 비자연적인 인위적으로 조작된 또는 변형된 망막 기능형성 유전자는 인위적인 망막 기능형성 유전자라는 용어와 혼용되어 사용될 수 있다.

“인위적으로 교정된(artificially corrected)”이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태로 자연상태에서 발생한 유전자의 돌연변이를 인위적으로 교정한 상태를 의미한다. 이때, 교정(correction)은 자연상태에서 발생한 유전자의 돌연변이 서열에 대응되는 야생형의 유전자의 정상 서열로 교정하거나 또는 유전자의 돌연변이에 의해 변형된 단백질의 발현을 정상 단백질이 발현하도록하는 변형일 수 있다. 또는 상기 교정은 자연상태에서 발생한 유전자의 돌연변이에 의한 단백질의 비정상적 발현이 정상적으로 발현되도록하는 변형일 수 있다.

"망막 기능형성 시스템(system)"은 인위적으로 조작된 망막 기능형성 유전자의 기능 변경에 의해 망막 기능형성에 영향을 끼치는 모든 현상을 포함하는 용어로, 이러한 망막 기능형성 시스템에 직접적으로 또는 간접적으로 관여하는 모든 물질, 조성물, 방법 및 용도를 포함한다. 이러한 망막 기능형성 시스템을 구성하는 각 요소들을 통칭하여 "망막 기능형성 조절 요소"로 칭하기도 한다.

본 명세서에 의해 개시되는 유전자 조작용 조성물은 가이드핵산 및 에디터단백질을 포함할 수 있다.

유전자 조작용 조성물은

(a) 망막 기능형성 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및

(b) 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산서열

을 포함할 수 있다.

상기 망막 기능형성 유전자 관련 설명은 상기 기술한 바와 같다.

상기 표적 서열 관련 설명은 상기 기술한 바와 같다.

유전자 조작용 조성물은 가이드핵산-에디터단백질 복합체를 포함할 수 있다.

“가이드핵산-에디터단백질 복합체”는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미한다.

상기 가이드핵산 관련 설명은 상기 기술한 바와 같다.

상기 “에디터단백질”은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다.

이때, 상기 핵산은 표적 핵산, 유전자 또는 염색체에 포함된 핵산일 수 있다.

이때, 상기 핵산은 가이드핵산일 수 있다.

상기 에디터단백질은 효소일 수 있다.

이때, 상기 “효소”는 핵산, 유전자 또는 염색체를 절단할 수 있는 도메인을 포함하는 폴리펩타이드 또는 단백질을 의미한다.

상기 효소는 뉴클레아제 또는 제한효소일 수 있다.

상기 에디터단백질은 완전 활성 효소를 포함할 수 있다.

이때, 상기 “완전 활성 효소”는 야생형(wild type) 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능과 동일한 기능을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소는 DNA 이중 가닥을 모두 절단하는 완전한 활성 효소일 수 있다. 또 다른 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소가 인위적인 조작에 의해 아미노산 서열 중 일부 서열이 삭제(deletion) 또는 치환(substitution)된 경우, 인위적으로 조작된 효소 변이체가 야생형 효소와 동일하게 DNA의 이중 가닥을 절단한다면, 상기 인위적으로 조작된 효소 변이체는 완전 활성 효소일 수 있다.

또한, 상기 완전 활성 효소는 야생형의 효소의 기능보다 향상 된 기능을 가지고 있는 효소를 포함할 수 있다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 야생형 효소보다 증가된 완전한 효소 활성, 즉, 증가된 DNA 이중 가닥을 절단하는 활성을 가질 수 있다.

상기 에디터단백질은 불완전 또는 부분 활성 효소를 포함할 수 있다.

이때, 상기 "불완전 또는 부분 활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능의 일부만을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능을 가지는 형태 또는 제2 기능을 가지는 형태일 수 있다. 이때, 제1 기능은 DNA의 이중 가닥 중 제1 가닥을 절단하는 기능이고, 제2 기능은 DNA의 이중 가닥 중 제2 가닥을 절단하는 기능일 수 있다. 이때, 상기 제1 기능을 가지는 효소 또는 제2 기능을 가지는 효소는 불완전 또는 부분 활성 효소일 수 있다.

상기 에디터단백질은 불활성 효소를 포함할 수 있다.

이때, 상기 "불활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능이 모두 불활성화 된 효소를 의미한다. 예를 들면, 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능 및 제2 기능이 모두 상실된 형태, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 제2 가닥을 절단하는 제2 기능이 모두 상실된 형태일 수 있다. 이때, 상기 제1 기능 및 제2 기능이 모두 상실된 효소는 불활성 효소일 수 있다.

상기 에디터단백질은 융합단백질일 수 있다.

이때, 상기 “융합 단백질”은 효소에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.

상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소에 포함된 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.

상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.

이때, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드, 폴리펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.

상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.

상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.

또한, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.

상기 NLS는 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.

상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 특정 기능을 수행하지 않는 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다. 이때, 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소의 기능에 영향을 주지 않는 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.

상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.

상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질일 수 있다.

상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.

상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질일 수 있다.

상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.

이때, 상기 변형은 에디터단백질에 포함된 아미노산의 치환, 제거, 부가 또는 이의 혼합일 수 있다.

또는 상기 변형은 에디터단백질을 암호화하는 뉴클레오타이드 서열 중 일부 뉴클레오타이드의 치환, 제거, 부가 또는 이의 혼합일 수 있다.

또한, 상기 유전자 조작용 조성물은 삽입을 원하는 특정 뉴클레오타이드서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.

이때, 상기 삽입은 원하는 핵산서열은 망막 기능형성 유전자의 일부 뉴클레오타이드서열일 수 있다.

이때, 상기 삽입은 원하는 핵산서열은 조작하고자 하는 망막 기능형성 유전자의 돌연변이를 교정하거나 돌연변이를 도입하기 위한 핵산 서열일 수 있다.

상기 "도너(donor)"는 손상된 유전자 또는 핵산의 상동성 재조합에 의한 수복을 돕는 뉴클레오타이드서열을 의미한다.

상기 도너는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.

상기 도너는 선형 또는 원형일 수 있다.

상기 도너는 표적 유전자 또는 핵산에 상동성을 가지는 뉴클레오타이드 서열을 포함할 수 있다.

예를 들어, 도너는 특정 뉴클레오타이드서열을 삽입하고자 하는 위치, 예를 들어, 손상된 핵산의 왼쪽(upstream)및 오른쪽(downstream)의 뉴클레오타이드서열과 각각 상동성을 가지는 뉴클레오타이드서열을 포함할 수 있다. 이때, 삽입하고자 하는 특정 뉴클레오타이드서열은 손상된 핵산의 오른쪽 뉴클레오타이드서열에 대해 상동성을 가지는 뉴클레오타이드서열과 손상된 핵산의 왼쪽 뉴클레오타이드서열에 대해 상동성을 가지는 뉴클레오타이드서열 사이에 위치할 수 있다. 이때, 상기 상동성을 가지는 뉴클레오타이드서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.

상기 도너는 특정 핵산 서열을 포함할 수 있다.

이때, 상기 특정 핵산 서열은 표적 유전자의 일부 뉴클레오타이드 서열 또는 일부 유사 뉴클레오타이드일 수 있다. 상기 표적 유전자의 일부 뉴클레오타이드 서열은, 예를 들어, 돌연변이를 포함하는 표적 유전자를 교정하기 위한 돌연변이가 교정된 정상 핵산 서열을 포함할 수 있다. 또는, 상기 표적 유전자의 일부 유사 뉴클레오타이드 서열은 정상 표적 유전자를 돌연변이 시키키 위한 표적 유전자의 일부 정상 핵산 서열 중 일부가 변형된 돌연변이 유발 핵산 서열을 포함할 수 있다.

일 예로, 엑손 내 종결코돈을 포함하는 돌연변이를 가지는 유전자를 표적 유전자로 하는 경우, 상기 특정 핵산은 엑손 내 종결코돈을 정상 뉴클레오타이드 서열로 교정할 수 있는 정상 뉴클레오타이드 서열일 수 있다. 다른 일 예로, 표적 유전자의 단백질로 발현을 억제시키고자 하는 경우, 상기 특정 핵산은 표적 유전자의 엑손 내에 삽입시킬 종결코돈일 수 있으며, 이러한 경우, 도너를 포함하는 유전자 조작용 조성물에 의해 표적 유전자의 엑손 내 삽입된 종결코돈으로 인해 표적 유전자의 발현을 억제시킬 수 있다.

이때, 상기 특정 핵산 서열은 종결 코돈일 수 있다.

이때, 상기 특정 핵산 서열은 외인성 핵산 서열일 수 있다. 예를 들어, 상기 외인성 핵산 서열은 표적 유전자를 포함하는 세포에서 발현하길 원하는 외인성 유전자일 수 있다.

이때, 상기 특정 핵산 서열은 표적 유전자를 포함하는 세포에서 발현시키길 원하는 핵산 서열일 수 있다. 예를 들어, 상기 핵산 서열은 표적 유전자를 포함하는 세포에서 발현하는 특정 유전자일 수 있으며, 이러한 경우, 도너를 포함하는 유전자 조작용 조성물에 의해 상기 특정 유전자는 세포 내 카피수가 증가하여 발현이 증가할 수 있다.

상기 도너는 선택적으로 부수적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 부수적인 핵산서열은 도너의 안정성, 표적 내 삽입 효율 또는 상동성 재조합 효율을 높이는 역할을 하는 것일 수 있다.

예를 들어, 상기 부수적인 뉴클레오타이드서열은 뉴클레오타이드 A, T가 풍부한 핵산서열, 즉, A-T 풍부 도메인(A-T rich domain)일 수 있다. 예를 들면, 상기 부수적인 뉴클레오타이드서열은 SMAR(scaffold/matrix attachment region)일 수 있다.

본 명세서에 의해 개시되는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.

이때, "대상"은 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되는 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 작동하는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.

상기 대상은 가이드핵산-에디터단백질 복합체의 표적 유전자 또는 염색체를 포함하는 유기체일 수 있다.

상기 유기체는 동물, 동물의 조직 또는 동물 세포일 수 있다.

상기 유기체는 인간, 인간의 조직 또는 인간 세포일 수 있다.

상기 조직은 안구, 피부, 간, 신장, 심장, 폐, 뇌, 근육 또는 혈액일 수 있다.

상기 세포는 망막세포, 신경세포, 신경교세포, 원뿔세포, 간상세포, 망막색소상피세포 또는 줄기세포일 수 있다.

상기 검체 또는 시료는 침, 혈액, 망막조직, 뇌조직, 망막세포, 신경세포, 신경교세포, 원뿔세포, 간상세포, 망막색소상피세포 또는 줄기세포 등 표적 유전자 또는 염색체를 포함하는 유기체에서 획득한 것 일 수 있다.

바람직하게는, 상기 대상은 망막 기능형성 유전자를 포함하는 유기체일 수 있다.

상기 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 DNA, RNA 또는 이의 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.

이때, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.

또는, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 벡터, 비벡터 또는 이들의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 벡터는 바이러스 또는 비바이러스 벡터(예를 들어, 플라스미드)일 수 있다.

상기 비벡터는 네이키드 DNA, DNA 복합체 또는 mRNA일 수 있다.

일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.

일 예로, 상기 벡터는 가이드핵산과 에디터단백질을 암호화하는 핵산서열을 동시에 포함할 수 있다.

다른 일 예로, 상기 벡터는 가이드핵산 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 가이드핵산에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.

다른 일 예로, 상기 벡터는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 에디터단백질의 경우, 에디터단백질을 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 에디터단백질을 암호화하는 핵산서열이 분할되어 여러 개의 벡터에 포함될 수 있다.

상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.

이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.

상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.

상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.

상기 프로모터는 유도성 프로모터일 수 있다.

상기 프로모터는 대상 특이적 프로모터일 수 있다.

상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.

상기 프로모터는 제어 영역(즉, 가이드핵산 또는 에디터단백질을 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.

예를 들어, 가이드핵산을 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, 에디터단백질을 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.

벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.

상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.

이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.

이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.

상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.

일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 가이드핵산 및/또는 에디터단백질을 도입시킬 수 있다. 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.

바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 가이드핵산 또는 에디터단백질을 단독으로 포함하는 바이러스 벡터를 설계하거나 가이드핵산 및 에디터단백질을 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 가이드핵산, 에디터단백질 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.

일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.

다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.

또 다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.

다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.

다른 일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 비벡터로 대상 내로 전달 또는 도입될 수 있다.

비벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.

상기 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.

상기 비벡터는 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 덴드리머, 나노입자, 인산칼슘, 실리카, 실리케이트(오르모실) 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 세포와 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.

다른 일 예로, 나노입자를 이용하여 비벡터를 전달할 수 있다. 상기 나노입자는 무기 나노입자(예를 들면, 자기 나노입자, 실리카 등) 또는 유기 나노입자(예를 들면, 폴리에틸렌 글리콜(PEG)로 코팅된 지질 등)일 수 있다. 상기 나노입자의 외면은 부착을 가능하게 하는 양 전하로 하전된 중합체(예를 들면, 폴리에틸렌이민, 폴리리신, 폴리세린 등)와 컨쥬케이팅될 수 있다.

임의의 구체예로, 지질 외피를 이용하여 전달할 수 있다.

임의의 구체예로, 엑소좀을 이용하여 전달할 수 있다. 엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 수송하는 내인성 나노-소낭이다.

임의의 구체예로, 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는데 인지질이 가장 통상적으로 사용된다.

또한, 비벡터의 전달을 위한 조성물은 기타 몇몇 다른 첨가제를 포함할 수 있다.

상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 펩타이드, 폴리펩타이드 또는 단백질의 형태는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 펩타이드, 폴리펩타이드 또는 단백질의 전달은 가이드핵산을 암호화하는 핵산서열과 함께 전달될 수 있다.

일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 가이드핵산와 함께 또는 가이드핵산 없이 에디터단백질을 도입시킬 세포와 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.

상기 가이드핵산 및 에디터단백질은 핵산-단백질 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.

예를 들어, 상기 가이드핵산은 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.

일 예로, 가이드핵산 및 에디터단백질은 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.

본 명세서에 의해 개시되는 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체를 변형시킬 수 있다.

예를 들어, 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체의 서열에 변형(modification)을 유도한다. 그 결과, 상기 표적 핵산, 유전자 또는 염색체에 의해 발현되는 단백질은 그 구조 및/또는 기능이 변형되거나, 그 단백질의 발현이 조절되거나, 그 단백질의 발현이 제거될 수 있다.

상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.

일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자를 조작 또는 변형하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.

상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.

일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 전사를 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.

다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 번역을 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예로서, 유전자 조작용 조성물은 gRNA 및 CRISPR 효소를 포함할 수 있다.

유전자 조작용 조성물은

(a) 망막 기능형성 유전자의 표적 서열을 표적화할 수 있는 gRNA 또는 이를 암호화하는 핵산서열; 및

(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열

을 포함할 수 있다.

상기 표적 서열 관련 설명은 상기 기술한 바와 같다.

유전자 조작용 조성물은 gRNA-CRISPR 효소 복합체를 포함할 수 있다.

“gRNA-CRISPR 효소 복합체”는 gRNA과 CRISPR 효소의 상호작용을 통해 형성된 복합체를 의미한다.

상기 gRNA 관련 설명은 상기 기술한 바와 같다.

상기 “CRISPR 효소”는 CRISPR-Cas 시스템의 주요 단백질 구성 요소로, gRNA와 복합체를 형성하여 CRISPR-Cas 시스템을 형성한다.

상기 CRISPR 효소는 CRISPR 효소를 암호화하는 서열을 가지는 핵산 또는 폴리펩타이드(또는 단백질)일 수 있다.

상기 CRISPR 효소는 Type II CRISPR 효소일 수 있다.

Type II CRISPR 효소의 결정 구조는 2종 이상의 자연유래 미생물 Type II CRISPR 효소 분자에 대한 연구(Jinek et al., Science, 343(6176):1247997, 2014) 및 gRNA와 함께 복합체를 이루는 스트렙토코커스 피오게네스 Cas9(SpCas9)에 대한 연구(Nishimasu et al., Cell, 156:935-949, 2014; 및 Anders et al., Nature, 2014, doi: 10.1038/nature13579)를 통해 결정되었다.

Type II CRISPR 효소는 2개의 로브, 즉, 인식(REC) 및 뉴클레아제(NUC) 로브를 포함하며, 각각의 로브는 여러 개의 도메인을 포함한다.

상기 REC 로브는 아르기닌-풍부 브릿지 나선(BH), REC1 도메인 및 REC2 도메인을 포함한다.

이때, 상기 BH 도메인은 긴 α-나선 및 아르기닌 풍부 영역이며, 상기 REC1 및 REC2 도메인은 gRNA 내의 형성되는 이중가닥의, 예를 들어, 단일가닥 gRNA, 이중 gRNA 또는 tracrRNA의 인식에 중요한 역할을 한다.

상기 NUC 로브는 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. 이때, 상기 RuvC 도메인은 RuvC-유사 도메인을 포괄하는 의미로 사용되고, 또한 상기 HNH 도메인은 HNH-유사 도메인을 포괄하는 의미로 사용된다.

이때, 상기 RuvC 도메인은 Type II CRISPR 효소를 포함하는 자연상태에 존재하는 미생물의 구성원에 대해 구조적으로 유사성을 공유하며, 단일가닥, 예를 들어 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단한다. 상기 RuvC 도메인은 종종 당업계에서 RuvCI 도메인, RuvCII 도메인 및 RuvCIII 도메인으로서, 통상적으로 RuvC I, RuvCII 및 RuvCIII로 지칭된다.

상기 HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어 표적 핵산 분자의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 위치한다.

상기 PI 도메인은 표적 유전자 또는 핵산 내의 특정 뉴클레오타이드서열, 즉, PAM(Protospacer adjacent motif)을 인식하거나 또는 PAM과 상호작용한다. 이때, 상기 PAM은 Type II CRISPR 효소의 유래(origin)에 따라 다를 수 있다. 예를 들어, CRISPR 효소가 SpCas9 인 경우 PAM은 5'-NGG-3'일 수 있고, 스트렙토코커스 써모필러스 Cas9(StCas9)인 경우 PAM은 5'-NNAGAAW-3'(W = A or T)일 수 있고, 네이세리아 메닝기디티스 Cas9(NmCas9)인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, 캄필로박터 제주니 Cas9(CjCas9)의 경우 PAM은 5'-NNNVRYAC-3' (V = G or C or A, R = A or G, Y = C or T)일 수 있으며, 이때 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.

상기 Type II CRISPR 효소는 Cas9일 수 있다.

상기 Cas9은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 스타필로코커스 아우레스(Staphylococcus aureus), 캄필로박터 제주니 (Campylobacter jejuni), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina) 등 다양한 미생물 유래의 Cas9일 수 있다.

상기 Cas9은 gRNA와 결합하여 표적 유전자 또는 핵산 상에서 표적 서열 또는 위치를 절단 또는 변형시키는 효소로서, gRNA가 상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 HNH 도메인, gRNA와 비상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 RuvC 도메인, 표적, 즉, 타겟과 상호작용하는 REC 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.

상기 Cas9은 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.

또한, 상기 CRISPR 효소는 Type V CRISPR 효소일 수 있다.

Type V CRISPR 효소는 Type II CRISPR 효소의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Type II CRISPR 효소의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 표적과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Type V CRISPR 효소의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.

Type V CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 Type V CRISPR 효소의 능력은 PAM 서열에 의존적이다.

상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, Type V CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 Type V CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다. 예를 들어, Cpf1이 인식하는 PAM 서열은 5'-TTN-3' (N은 A, T, C 또는 G)일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.

상기 Type V CRISPR 효소는 Cpf1일 수 있다.

상기 Cpf1은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpf1일 수 있다.

상기 Cpf1은 Cas9의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Cas9의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.

상기 Cpf1는 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.

상기 CRISPR 효소는 표적 유전자 또는 핵산의 이중가닥을 절단하는 기능을 가지는 뉴클레아제 또는 제한효소일 수 있다.

상기 CRISPR 효소는 완전 활성 CRISPR 효소일 수 있다.

"완전 활성"는 야생형(wild type) CRISPR 효소의 기능과 동일한 기능을 가지고 있는 상태를 의미하며, 이러한 상태의 CRISPR 효소를 완전 활성 CRISPR 효소로 명칭한다. 이때, “야생형(wild type) CRISPR 효소의 기능”은 DNA의 이중 가닥을 절단하는 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 모두 가지는 상태를 말한다.

상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소일 수 있다.

상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소를 변형 또는 조작시킨 CRISPR 효소 변이체일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 하나 이상의 아미노산이 다른 아미노산으로 치환되거나 또는 하나 이상의 아미노산이 제거된 효소일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열에 하나 이상의 아미노산이 부가된 효소일 수 있다. 이때, 부가되는 아미노산의 위치는 야생형 효소의 N 말단, C 말단 또는 아미노산 서열 내일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 향상된 완전 활성 효소일 수 있다.

예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 결합하지 않거나 또는 일정한 거리 간격을 유지한 상태에서 DNA 이중 가닥을 절단할 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 향상된 완전 활성 CRISPR 효소일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 감소된 완전 활성 CRISPR 효소일 수 있다.

예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 일정 거리이상으로 근접한 상태 또는 특정 결합이 형성된 상태에서 DNA 이중 가닥을 절단할 수 있다. 이때, 특정 결합은, 예를 들어, 효소의 특정 위치의 아미노산과 절단 위치의 DNA 뉴클레오타이드서열과의 결합일 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 감소된 완전 활성 CRISPR 효소일 수 있다.

상기 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소일 수 있다.

“불완전 또는 부분 활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능 중 선택된 하나의 기능을 가지는 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소로 명칭한다. 또한 상기 불완전 또는 부분 활성 CRISPR 효소는 니카아제(nickase)로 지칭될 수 있다.

“니카아제(nickase)”는 표적 유전자 또는 핵산의 이중가닥 중 한 가닥만 절단되도록 조작 또는 변형된 CRISPR 효소를 의미하며, 상기 니카아제는 단일가닥, 예를 들어, 표적 유전자 또는 핵산의 gRNA와 비상보성 가닥 또는 상보성 가닥을 절단하는 뉴클레아제 활성을 가진다. 따라서, 이중가닥을 절단하기 위해서는 2개의 니카아제의 뉴클레아제 활성이 필요하다.

상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 HNH 도메인은 조작 또는 변경될 수 있다.

일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.

예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.

또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.

또한, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인은 조작 또는 변경될 수 있다.

일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 RuvC 도메인을 포함하는 Type II CRISPR 효소일 수 있다.

예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.

또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.

상기 CRISPR 효소는 불활성 CRISPR 효소일 수 있다.

“불활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능이 모두 상실된 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불활성 CRISPR 효소로 명칭한다.

상기 불활성 CRISPR 효소는 야생형 CRISPR 효소의 뉴클레아제 활성을 가지는 도메인에 변이로 인한 뉴클레아제 불활성을 가질 수 있다.

상기 불활성 CRISPR 효소는 RuvC 도메인 및 HNH 도메인에 변이로 인한 뉴클레아제 불화성을 가질 수 있다. 즉, 상기 불활성 CRISPR 효소는 CRISPR 효소의 RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인 및 HNH 도메인은 조작 또는 변경될 수 있다.

일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 불활성 CRISPR 효소는 변형된 RuvC 도메인 및 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.

예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, SpCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.

또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, CjCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.

상기 CRISPR 효소는 상기 기재된 뉴클레아제 활성 외에도 헬리카제 활성, 즉, 이중가닥 핵산의 나선 구조를 푸는 기능을 가질 수 있다.

또한, 상기 CRISPR 효소는 CRISPR 효소의 헬리카제 활성에 대해 완전 활성, 불완전 또는 부분 활성, 또는 불활성이 되도록 CRISPR 효소를 변형시킬 수 있다.

상기 CRISPR 효소는 야생형 CRISPR 효소를 인위적으로 조작 또는 변형시킨 CRISPR 효소 변이체일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및/또는 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제1 기능이 상실된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제2 기능이 상실된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, 제1 기능 및 제2 기능이 모두 상실된 형태일 수 있다.

상기 CRISPR 효소 변이체는 gRNA와 상호작용을 통한 gRNA-CRISPR 효소 복합체 형성할 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 gRNA와 상호작용하는 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA의 상호작용이 증가된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 증가된 형태일 수 있다.

이때, gRNA와 CRISPR 효소 변이체의 상호작용 세기에 따라 다양한 gRNA-CRISPR 효소 복합체가 형성될 수 있고, CRISPR 효소 변이체에 따라 표적 서열에 접근 또는 절단하는 기능에 차이가 생길 수 있다.

예를 들어, gRNA와의 상호작용이 감소된 CRISPR 효소 변이체에 의해 형성된 gRNA-CRISPR 효소 복합체는 gRNA와 완전히 상보적 결합을 하는 표적 서열에 근접 또는 국소화되는 경우에만 오직 표적 서열의 이중가닥 또는 단일가닥을 절단할 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다.

일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환된 것일 수 있다.

다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다.

또 다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 내에 적어도 하나 이상의 아미노산이 부가된 것일 수 있다.

일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환, 제거 및/또는 부가된 것일 수 있다.

또한, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능, 이외에 선택적으로 기능적(functional) 도메인을 추가로 포함할 수 있다. 이때, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능 이외에 부가적인 기능을 가질 수 있다.

상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.

상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.

상기 기능적 도메인은 디아미네이즈(deaminase)일 수 있다.

예를 들어, 불완전 또는 부분 CRISPR 효소에 시티딘 디아미네이즈(cytidine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 시티딘 디아미네이즈, 예를 들면, APOBEC1(apolipoprotein B editing complex 1)를 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[APOBEC1]은 뉴클레오타이드 C를 T 또는 U로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 G를 A로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.

또 다른 예를 들어, 불완전 또는 부분 CRISPR 효소에 아데닌 디아미네이즈(adenine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 아데닌 디아미네이즈, 예를 들면, TadA variants, ADAR2 variants, ADAT2 variants 등을 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[TadA variant], [SpCas9 니카아제]-[ADAR2 variant] 또는 [SpCas9 니카아제]-[ADAT2 variant]는 뉴클레오타이드 A를 inosine으로 변형시키며, 변형된 inosine은 polymerase에 의해 뉴클레오타이드 G로 인식되어 실질적으로 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집되는 효과를 보이므로, 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 T를 C로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.

상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.

일 예로, CRISPR 효소는 하나 이상의 NLS를 포함할 수 있다. 이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK.

또한, 상기 CRISPR 효소 변이체는 CRISPR 효소를 분할하여 두 개 이상의 부분으로 나눈 스플릿(split) 형태의 CRISPR 효소를 포함할 수 있다. “스플릿(split)”은 단백질을 기능적으로 또는 구조적으로 또는 임의로 두 개 이상으로 분할하는 것을 의미한다.

상기 스플릿(split) 형태의 CRISPR 효소는 완전 활성 효소, 불완전 또는 부분 활성 효소 또는 불활성 효소일 수 있다.

예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 656번 타이로신과 657번 트레오닌 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9을 생성할 수 있다.

상기 스플릿(split) 형태의 CRISPR 효소는 선택적으로 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.

상기 재구성을 위한 추가 도메인, 펩타이드 폴리펩타이드 또는 단백질은 스플릿(split) 형태의 CRISPR 효소가 구조적으로 야생형 CRISPR 효소와 동일하거나 유사하도록 조립될 수 있다.

상기 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 FRB 및 FKBP dimerization domains; 인테인(intein); ERT 및 VPR domains 또는 특정 조건에서 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.

예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 713번 세린과 714번 글라이신 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9에 두 부분 중 하나에 FRB 도메인을 연결하고, 나머지 하나에 FKBP 도메인을 연결할 수 있다. 이렇게 생성된 스플릿 SpCas9은 라파마이신이 존재하는 환경에서 FRB 도메인과 FKBP 도메인이 다이머를 형성하여 재구성된 CRISPR 효소를 생성할 수 있다.

본 명세서에 의해 개시되는 CRISPR 효소 또는 CRISPR 효소 변이체는 폴리펩타이드, 단백질 또는 이를 암호화하는 서열을 가지는 핵산일 수 있으며, 상기 CRISPR 효소 또는 CRISPR 효소 변이체를 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.

“코돈 최적화”는 고유 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노상 서열을 유지함으로써 관심 숙주 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것을 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.

본 명세서에 의해 개시되는 gRNA, CRISPR 효소 또는 gRNA-CRISPR 효소 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 대상 관련 설명은 상기 기술한 바와 같다.

일 구현예로서, gRNA 및/또는 CRISPR 효소는 각각을 암호화하는 핵산서열을 포함하는 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.

벡터는 gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.

일 예로, 상기 벡터는 gRNA 및 CRISPR 효소를 암호화하는 핵산서열을 동시에 포함할 수 있다.

다른 일 예로, 상기 벡터는 gRNA 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 gRNA에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.

다른 일 예로, 상기 벡터는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 CRISPR 효소의 경우, CRISPR 효소를 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 CRISPR 효소를 암호화하는 핵산서열은 분할되어 여러 개의 벡터에 포함될 수 있다.

상기 프로모터는 유도성 프로모터일 수 있다.

상기 프로모터는 대상 특이적 프로모터일 수 있다.

상기 프로모터는 제어 영역(즉, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.

예를 들어, gRNA를 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, CRISPR 효소를 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.

상기 벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.

상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.

일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.

다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.

또 다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.

다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.

일 구현예로서, gRNA-CRISPR 효소 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.

예를 들어, 상기 gRNA는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 CRISPR 효소는 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.

일 예로, gRNA 및 CRISPR 효소는 RNA 형태의 gRNA와 단백질 형태의 CRISPR gRNA-CRISPR 효소 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 CRISPR gRNA-CRISPR 효소 복합체는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

본 명세서에 의해 개시되는 gRNA-CRISPR 효소 복합체는 표적 유전자, 즉, 망막 기능형성 유전자를 인위적으로 조작 또는 변형시키는데 이용될 수 있다.

표적 유전자는 앞서 기재한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 조작 또는 변형할 수 있다. 이때, 표적 유전자의 조작 또는 변형은 i) 표적 유전자의 절단 또는 손상과 ii) 손상된 표적 유전자의 수선 또는 수복하는 단계를 모두 포함한다.

상기 i) 표적 유전자의 절단 또는 손상은 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상일 수 있으며, 구체적으로는 표적 유전자 내의 표적 서열의 절단 손상일 수 있다.

상기 표적 서열은 gRNA-CRISPR 효소 복합체의 타겟이 될 수 있고, 상기 표적 서열은 CRISPR 효소가 인식하는 PAM 서열을 포함하거나 또는 포함하지 않을 수 있다. 이러한 표적 서열은 실시자에게 gRNA 설계 단계에서 중요한 기준을 제공할 수 있다.

상기 표적 서열은 gRNA-CRISPR 효소 복합체의 gRNA에 의해 특이적으로 인식될 수 있으며, 이로 인해 gRNA-CRISPR 효소 복합체는 인식된 표적 서열에 근접하게 위치할 수 있다.

표적 부위의 "절단(cleavage)"은 폴리뉴클레오타이드의 공유결합(covalent backbone)의 파손(breakage)을 의미한다. 절단은 포스포다이에스터(phosphodiester) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일가닥의 절단 및 이중가닥의 절단 모두 가능하며, 이중가닥의 절단은 두 개의 구별되는(distinct) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end(또는 sticky end)를 생성할 수 있다.

일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상은 표적 서열의 이중가닥이 모두 절단 또는 손상되는 것일 수 있다.

일 구체예로서, CRISPR 효소가 야생형의 SpCas9인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 모두 절단시킬 수 있다.

다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)인 경우, 각각의 CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 두 개의 단일가닥을 각각 절단시킬 수 있다. 즉, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.

다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열의 이중가닥 중 단일가닥만 절단 또는 손상되는 것일 수 있다. 이때, 단일가닥은 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥일 수 있고, 또는 gRNA와 상보적 결합을 하지 않는 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥일 수 있다.

일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단시키고, gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 절단시키지 않을 수 있다.

다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(H840A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단시키고, gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 절단시키지 않을 수 있다.

또 다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 일부 핵산 조각(fragment)를 제거하는 것일 수 있다.

일 구체예로서, 상기 CRISPR 복합체가 서로 다른 표적 서열에 상보적 결합을 하는 두 개의 gRNA와 야생형 SpCas9에 의해 구성되는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하여 제 1 gRNA와 제 2 gRNA 및 SpCas9에 의해 핵산 조각을 제거할 수 있다.

상기 ii) 손상된 표적 유전자의 수선 또는 수복은 비-상동성 말단-결합 (NHEJ) 및 상동 재조합 수리(HDR)을 통해 수선 또는 수복될 수 있다.

상기 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)은 절단된 이중가닥 또는 단일가닥의 양 말단이 함께 결합함으로써 DNA 내 이중가닥 파손을 수복 또는 수선하는 방법으로, 일반적으로, 이중가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 2개의 말단이 완전히 결합되는 경우 파손된 이중가닥이 복구된다. NHEJ는 모든 세포주기에서 가능한 수복 방식으로, 주로 G1 시기와 같이 세포 내에 주형으로 쓸 상동유전체가 없을 때 발생한다.

NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에서 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래하며, 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 또는 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이를 초래해 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 비중요 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 좌위 의존적이다.

NHEJ에 의해 생성된 삽입결실 돌연변이는 자연 상태에서 예측 불가능하지만, 주어진 파손 부위에서 특정 삽입 결실 서열이 선호되며, 이는 마이크로상동성의 작은 영역에 기인할 가능성이 있다. 통상적으로 결실 길이는 1 bp 내지 50 bp 범위이며, 삽입은 더 짧게 되는 경향이 있고, 종종 파손 부위를 바로 둘러싸는 짧은 중복 서열을 포함한다.

또한, NHEJ는 돌연변이를 유발하는 과정으로, 특이적 최종 서열의 생성이 필요하지 않은 경우, 작은 서열의 모티프를 결실시키는데 사용될 수 있다.

이러한 NHEJ를 이용하면, CRISPR 복합체에 의해 표적되는 유전자의 특이적 넉아웃(knockout)할 수 있다. CRISPR 효소, 예를 들어, Cas9 또는 Cpf1을 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥의 절단하고, 파손된 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다. 이때, 상기 CRISPR 효소에 의해 절단되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있으며, 더불어 NHEJ에 의해 수복되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있다.

일 예로, CRISPR 복합체를 이용하여 표적 유전자의 이중가닥을 절단하고 NHEJ에 의해 수복되는 과정을 통해 수복 부위에 다양한 인델 (indel; insertion and deletion)이 발생할 수 있다.

"인델(indel)"은 DNA의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 삽입 (insertion)되거나 결실 (deletion) 된 변이를 총칭한다. 인델은 상술한 바와 같이 gRNA-CRISPR 효소 복합체가 망막 기능형성 유전자의 핵산(DNA, RNA)를 절단하는 경우, HDR 또는 NHEJ 기작에 의해 수선되는 과정에서 표적 서열에 도입되는 것일 수 있다.

상기 상동 재조합 수리(homology directed repairing, HDR)는 손상된 유전자 또는 핵산을 수선 또는 수복하기 위해 상동성을 가진 서열을 주형으로 이용하는 방식으로 오류 없이 교정할 수 있는 방법으로, 일반적으로, 파손된 DNA을 수선 또는 수복하기 위해, 즉 세포가 가지고 있는 원래의 정보를 복원하기 위해, 변형이 이루어지지 않은 상보적인 뉴클레오타이드서열의 정보를 이용하거나 자매 염색분체의 정보를 이용하여 파손된 DNA를 수선 또는 수복한다. HDR의 가장 일반적인 형태는 상동성 재조합(homologous recombination, HR)이다. HDR은 통상적으로 활발하게 분열하는 세포의 S나 G2/M 시기에 주로 발생하는 수선 또는 수복 방식이다.

HDR을 이용한 손상된 DNA 수선 또는 수복을 위해, 세포가 본래 가지는 상보적인 뉴클레오타이드서열 또는 자매 염색분체를 이용하는 대신에, 상보적인 뉴클레오타이드서열 또는 상동성 뉴클레오타이드서열 정보를 이용한 인공적으로 합성한 DNA 주형, 즉, 상보적인 뉴클레오타이드서열 또는 상동성 뉴클레오타이드서열을 포함하는 핵산 주형을 세포에 제공하여 파손된 DNA를 수선 또는 수복할 수 있다. 이때, 상기 핵산 주형에 추가로 핵산 서열 또는 핵산 조각을 포함시켜 파손된 DNA를 수선 또는 수복 할 때, 파손된 DNA에 추가로 포함시킨 핵산 서열 또는 핵산 조작을 삽입(Knock-In)할 수 있다. 추가로 포함시킨 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있으나, 이에 제한되지 않는다.

일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드서열과 상보적인 뉴클레오타이드서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드서열을 HDR 방법으로 수선 또는 수복할 수 있다.

이때, 상기 상보적인 뉴클레오타이드서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상보적인 뉴클레오타이드서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상보적인 뉴클레오타이드서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상보적인 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드서열과 상보적인 결합을 하는 뉴클레오타이드서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상보적인 결합을 하는 뉴클레오타이드서열일 수 있다. 상기 상보적인 뉴클레오타이드서열은 15 내지 3000개의 뉴클레오타이드서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상보적인 뉴클레오타이드서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.

다른 일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드서열과 상동성 뉴클레오타이드서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드서열을 HDR 방법으로 수선 또는 수복할 수 있다.

이때, 상기 상동성 뉴클레오타이드서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상동성 뉴클레오타이드서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상동성 뉴클레오타이드서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상동성 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드서열과 상동성을 가지는 뉴클레오타이드서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상동성을 가지는 뉴클레오타이드서열일 수 있다. 상기 상동성 뉴클레오타이드서열은 15 내지 3000개의 뉴클레오타이드서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상동성 뉴클레오타이드서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.

상기 NHEJ와 HDR 외에도 손상된 표적 유전자를 수선 또는 수복하는 다양한 방법이 존재한다. 예를 들어, 손상된 표적 유전자의 수선 또는 수복 방법은 단일가닥 어닐링, 단일가닥 파손 수선, 미스매치 수선, 뉴클레오타이드 절단 수선 또는 뉴클레오타이드 절단 수선을 이용한 방법일 수 있다.

상기 단일가닥 어닐링(Single-strand annealing, SSA)은 표적 핵산 중에 존재하는 2개의 반복부 서열 사이의 이중가닥 파손을 수선하는 방법으로, 일반적으로 30개 초과의 뉴클레오타이드서열의 반복부 서열을 이용할 수 있다. 파손 말단에서 표적 핵산의 이중가닥에 대해 반복부 서열을 각각의 단일가닥이 가지도록 절단(Sticky end가 되도록)되며, 절단 후 반복부 서열을 함유하는 단일가닥 돌출부는 반복체 서열이 자체적으로 부적절하게 어닐링되는 것을 방지하기 위해 RPA 단백질로 코팅된다. RAD52는 돌출부 상의 각각의 반복부 서열에 결합하고, 상보성 반복부 서열의 어닐링을 가능하게 하는 서열을 정렬한다. 어닐링 후에, 돌출부의 단일가닥 플랩(flap)은 절단되고, 새로운 DNA 합성이 임의의 갭을 채우면서 DNA 이중가닥을 복원한다. 이러한 수복 또는 수선의 결과로, 2개의 반복체 사이의 DNA 서열이 결실되며, 결실 길이는 이용되는 2개의 반복체의 위치를 포함하는 다수의 인자 및 절단 경로 또는 진행도에 의존될 수 있다.

SSA는 HDR 방식과 유사하게는 상보성 서열, 즉 상보성 반복부 서열을 이용하고, 대조적으로는 표적 핵산 서열을 변경 또는 수정하기 위한 핵산 주형을 필요로 하지 않는다.

게놈 내 단일가닥 파손은 상기 논의된 수선 메커니즘과는 별도의 메커니즘인 단일가닥 파손 수선(Single-strand break repair, SSBA)을 통해 수선 또는 수복될 수 있다. DNA 파손의 형태가 단일가닥 파손일 때, PARP1 및/또는 PARP2는 파손을 인식하고 수선 기작을 동원한다. DAN 파손에서 PARP1의 결합 및 활성을 일시적이며, 손상부에 SSBR 단백질 복합체의 안정성을 촉진함으로써 SSBR을 촉진시킨다. SSBR 복합체에서 가장 중요한 단백질은 XRCC1으로, 이는 DNA의 3' 및 5' 말단 가공을 촉진하는 단백질과 상호작용하며, 안정화시킨다. 말단 가공은 일반적을 손상된 3' 말단을 하이드록실화 된 상태 및/또는 5' 말단을 인산염 모이어티로 복구하는 것을 수반하며, 말단이 가공되면, DNA 갭 채우기가 일어난다. DNA 갭 채우기에는 2가지 방법, 즉, 짧은 패치 수선 및 긴 패치 수선이 있으며, 이때 짧은 패치 수선은 빠져있는 단일 뉴클레오타이드의 삽입을 수반한다. DNA 갭 채우기 후, DNA 리가아제는 말단의 결합을 촉진한다.

상기 미스매치 수선(Mismatch repair, MMR)은 잘못 짝지어진 DNA 뉴클레오타이드상에서 작용할 수 있다. MSH2/6 또는 MSH2/3 복합체는 둘 다 미스매치 인식 및 수선의 개시에서 중요한 역할을 하는 ATP 분해효소 활성을 가지며, MSH2/6는 뉴클레오타이드-뉴클레오타이드 미스매치를 우선적으로 인식하고, 1개 또는 2개의 뉴클레오타이드의 미스매치를 동정하는 반면, MSH2/3는 더 큰 미스매치를 우선적으로 인식한다.

상기 뉴클레오타이드 절단 수선(Base excision repair, BER)은 세포주기 전체에서 활성이며, 게놈으로부터 작은 비-나선-뒤틀림 뉴클레오타이드 손상부를 제거하는데 이용되는 수선 방식이다. 손상된 DNA는 당 인산화 백본에 뉴클레오타이드를 연결하는 N-글리코사이드 결합을 절단하여 손상된 뉴클레오타이드를 절단하고, 이어서 포스포디에스테르 백본을 절단하여 DNA 단일가닥 파손을 생성한다. 이렇게 형성된 파손된 단일가닥 말단을 제거하고, 제거된 단일가닥에 의해 발생된 갭을 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.

상기 뉴클레오타이드 절단 수선(Nucleotide excision repair, NER)은 DNA로부터 큰 나선-뒤틀림 손상을 제거하는 중요한 절단 메커니즘으로, 손상이 인식되면, 손상부를 함유하는 짧은 단일가닥 DNA 세그먼트를 제거하여, 22개 내지 30개 뉴클레오타이드의 단일가닥 갭을 생성한다. 생성된 갭은 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.

상기 gRNA-CRISPR 효소 복합체에 의한 표적 유전자, 즉, 망막 기능형성 유전자의 인위적인 조작 효과는 크게 넉아웃(knockout), 넉다운(knockdown), 넉인(knockin) 및 발현증가일 수 있다.

"넉아웃(knockout)"은 표적 유전자 또는 핵산을 불활성화시키는 것을 의미하며, “표적 유전자 또는 핵산의 불활성화”는 표적 유전자 또는 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 넉아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다.

예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.

다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너을 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 이때, 도너는 상동성 뉴클레오타이드서열 및 삽입시키길 원하는 뉴클레오타이드서열을 포함한다. 이때, 삽입시키길 원하는 뉴클레오타이드 서열의 개수는 삽입 위치 또는 목적에 따라 다양하게 조절될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드서열 부위에 삽입시키길 원하는 뉴클레오타이드서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.

"넉다운(knockdown)"은 표적 유전자 또는 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 넉다운을 통해 과발현되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다.

예를 들어, gRNA- CRISPR 불활성 효소-전사 저해 활성 도메인 복합체, 즉, 전사 저해 활성 도메인을 포함하는 CRISPR 불활성 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, 상기 CRISPR 불활성 복합체가 표적 유전자 또는 염색체에 특이적으로 결합하고, CRISPR 불활성 복합체에 포함된 전사 저해 활성 도메인에 의해 표적 유전자 또는 염색체의 전사가 저해되어 해당 유전자 또는 염색체의 발현이 저해되는 넉다운을 유도할 수 있다.

다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, 상기 CRISPR 복합체가 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위를 절단할 수 있다. 이때, 상기 gRNA는 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위의 일부 뉴클레오타이드서열을 표적 서열로 인식할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다. 또는 선택적으로 도너를 이용하는 경우, CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드서열 부위에 삽입시키길 원하는 뉴클레오타이드서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다.

"넉인(knockin)"은 표적 유전자 또는 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산 또는 유전자"은 삽입하고자 하는 또는 발현시키기 원하는 핵산 또는 유전자를 의미한다. 넉인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.

더불어, 넉인은 추가적으로 도너(donor)를 필요로 할 수 있다.

예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 이때, 도너는 특정 핵산 또는 유전자를 포함하며, 이를 이용하여 손상된 유전자 또는 염색체에 특정 핵산 또는 유전자를 삽입할 수 있다. 이때, 삽입된 특정 핵산 또는 유전자는 단밸질로의 발현이 유도할 수 있다.

“발현증가”는 인위적으로 조작되기 전과 비교하여 표적 유전자 또는 핵산의 전사 및/또는 번역을 증가시키거나 표적 단백질의 발현이 증가하는 것을 의미한다. 발현증가를 통해 저발현되거나 발현되지 않는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다.

예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 돌연변이를 가지는 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이때 생성된 삽입결실로 인해 돌연변이 서열이 제거 또는 리딩 프레임을 변경되어 정상적인 표적 유전자 또는 염색체의 발현을 유도할 수 있다.

다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너을 이용하여 돌연변이를 가지는 표적 유전자 또는 염색체를 편집 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 이때, 도너는 상동성 뉴클레오타이드서열 및 삽입시키길 원하는 뉴클레오타이드서열을 포함한다. 이때, 삽입시키길 원하는 뉴클레오타이드서열의 개수는 삽입 위치 또는 목적에 따라 다양하게 조절될 수 있다. 돌연변이를 교정할 수 있는 뉴클레오타이드 서열을 포함하는 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드서열 부위에 돌연변이를 교정할 수 있는 뉴클레오타이드서열이 삽입되며, 이를 통해 정상적인 표적 유전자 또는 염색체의 발현을 유도할 수 있다.

본 명세서에 의해 개시되는 일 구체예로서, gRNA-CRISPR 효소 복합체는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자에 인위적인 조작 또는 변형을 가할 수 있다.

상기 gRNA-CRISPR 효소 복합체는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 표적 서열을 특이적으로 인식할 수 있다.

상기 표적 서열은 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자에 인위적인 변형이 일어나는 부위 또는 영역일 수 있다.

상기 표적 서열은 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 프로모터 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인트론 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 엑손 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인핸서 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

NGG(N은 A, T, C 또는 G임);

NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);

TTN(N은 A, T, C 또는 G임).

일 구체예에서, 상기 표적 서열은 표 1 및 표 2에 기재된 뉴클레오타이드서열 중 선택된 하나 이상의 뉴클레오타이드 서열일 수 있다.

상기 gRNA-CRISPR 효소 복합체는 gRNA와 CRISPR 효소로 구성될 수 있다.

상기 gRNA는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 표적 서열 중 가이드핵산 결합 서열과 일부 또는 완전한 상보적 결합을 할 수 있는 가이드 도메인을 포함할 수 있다.

상기 가이드 도메인은 가이드핵산 결합 서열에 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성이거나 또는 완전하게 상보성일 수 있다.

상기 가이드 도메인은 RPE65 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 GUCY2D 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 SPATA7 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 AIPL1 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 LCA5 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 RPGRIP1 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 CRB1 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 CEP290 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 IMPDH1 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 RD3 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 RDH12 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 CRX 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 gRNA는 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 포함할 수 있다.

상기 CRISPR 효소는 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다. 일 예에서, 상기 에디터단백질은 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질 또는 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질일 수 있다.

상기 gRNA-CRISPR 효소 복합체는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자에 다양한 인위적인 조작 또는 변형을 가할 수 있다.

상기 인위적으로 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

예를 들어, 인위적으로 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 연속되는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 또다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 2 이상의 뉴클레오타이드 조각은 뉴클레오타이드 서열이 연속되지 않는, 즉, 하나 이상의 뉴클레오타이드 서열 간격을 가지는 각각의 뉴클레오타이드 조각일 수 있으며, 결실된 2 이상의 뉴클레오타이드 조각에 의해 2 이상의 결실 부위가 발생할 수 있다.

또는, 예를 들어, 인위적으로 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 삽입을 포함할 수 있다. 일 예로, 삽입되는 뉴클레오타이드는 연속된 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 삽입되는 뉴클레오타이드는 연속되는 5bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 또 다른 일 예로, 삽입되는 뉴클레오타이드는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있다. 이때, 특정 유전자는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다.

또는, 예를 들어, 인위적으로 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실 및 삽입을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 이때, 삽입되는 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 이때, 특정 유전자는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 결실되는 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또 다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또한, 상기 삽입은 결실된 2 이상의 부위에 일부 또는 전체 부위에서 발생할 수 있다.

상기 gRNA-CRISPR 효소 복합체는 gRNA 및 CRISPR 효소의 종류에 따라 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자에 다양한 인위적인 조작 또는 변형을 가할 수 있다.

일 예로, 상기 CRISPR 효소가 SpCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NGG-3' (N은 A, T, G, 또는 C임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

다른 일 예로, 상기 CRISPR 효소가 CjCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNNNRYAC-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

또 다른 일 예로, 상기 CRISPR 효소가 StCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNAGAAW-3'(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

일 예로, 상기 CRISPR 효소가 NmCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNNNGATT-3'(N은 각각 독립적으로 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

다른 일 예로, 상기 CRISPR 효소가 SaCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNGRR(T)-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

또 다른 일 예로, 상기 CRISPR 효소가 Cpf1 단백질인 경우, 상기 인위적인 조작 또는 변형된 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자는 각 유전자의 표적 영역 내 존재하는 5'-TTN-3'(N은 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

상기 gRNA-CRISPR 효소 복합체에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 넉아웃(knockout)일 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자에 의해 각각 암호화되는 단백질의 발현이 억제될 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 넉다운(knockdown)일 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자에 의해 각각 암호화되는 단백질의 발현이 감소될 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 넉인(knockin)일 수 있다.

이때, 상기 넉인 효과는 gRNA-CRISPR 효소 복합체 및 추가적으로 외부 유래 뉴클레오타이드서열 또는 유전자를 포함하는 도너에 의해 유도된 것일 수 있다.

상기 gRNA-CRISPR 효소 복합체 및 도너에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 외부 유래 뉴클레오타이드서열 또는 유전자에 의해 암호화되는 펩타이드 또는 단백질이 발현될 수 있다.

이때, 상기 넉인 효과는 gRNA-CRISPR 효소 복합체 및 삽입을 원하는 뉴클레오타이드 서열을 포함하는 도너에 의해 유도된 것일 수 있다.

상기 삽입을 원하는 뉴클레오타이드 서열은 하나 이상의 돌연변이를 포함하는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 돌연변이 뉴클레오타이드 서열을 교정하기 위한 정상 뉴클레오타이드 서열일 수 있다.

상기 gRNA-CRISPR 효소 복합체 및 도너에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 하나 이상의 돌연변이를 포함하는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 돌연변이 뉴클레오타이드 서열이 정상 뉴클레오타이드 서열로 교정됨에 따라 교정된 유전자가 암호화는 단백질이 발현될 수 있다.

이때, 상기 넉인 효과는 gRNA-CRISPR 효소 복합체 및 교정용 도너에 의해 유도된 것일 수 있다.

상기 교정용 도너는 하나 이상의 돌연변이를 포함하는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 돌연변이 뉴클레오타이드 서열을 교정하기 위한 정상 뉴클레오타이드 서열을 포함하는 도너일 수 있다.

상기 gRNA-CRISPR 효소 복합체 및 교정용 도너에 의한 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 인위적인 조작 효과는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자의 돌연변이 뉴클레오타이드 서열이 교정되어 정상 유전자가 암호하는 단백질이 발현될 수 있다.

본 명세서에 의해 개시되는 일 태양은 망막 기능장애 질환을 치료하기 위한 유전자 조작용 조성물을 이용한 망막 기능장애 질환 치료방법에 관한 것이다.

본 명세서에 의해 개시되는 일 구체예는 치료 대상에 망막 기능형성 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물의 투여를 포함하는 방법을 이용하는 망막 기능장애 질환 치료 용도이다.

이때, 상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.

“망막 기능장애(Retinal dysfunction)”는 망막 조직이 정상적인 기능 또는 역할을 하지 못하는 모든 형태, 과정 및/또는 이로 인한 결과물 등을 포함하는 모든 상태를 의미한다. 따라서, “망막 기능장애 질환(Retinal dysfunction disease)”은 상기와 같은 상태로 인해 발생되는 질병을 모두 포함하는 모든 상태를 의미하며, 또한, 병리학적 특징으로 망막 이상을 보이는 질환도 모두 포함한다.

이때, “병리학적 특징”은 질병으로 인한 유기체의 세포 수준 및 조직, 장기, 개체 수준에서의 변화를 의미하며, “망막 이상”은 망막 조직의 비정상화 또는 비정상적인 기능 및/또는 역할을 하는 것으로, 병리학적 특징으로 망막 이상을 보이는 질환은 유기체의 망막 조직의 비정상화 또는 비정상적인 기능을 병리학적 특징으로 나타내는 질환으로, 안구 질환, 시신경 관련 질환, 안구 종양 등을 포함한다.

망막 기능장애 질환은 레베르 선천성 흑암시, 망막색소변성증, 스타카르트 질환, 망막형성장애, 색맹, 범맥락막위축, 황반변성, 근시성 맥락막신생혈관, 결절맥락막혈관병증, 중심장액맥락망막병증, 황반원공, 황반이상증, 당뇨망막병증, 망막동정맥폐쇄, 고혈압성 망막병증, 망막대동맥류, 안허혈증후군, 미숙아망막병증, 급성망막괴사, 거대세포 바이러스 망막염, 톡소플라스마 망막맥락막염, 매독성 맥락망막염, 망막박리 또는 망막모세포종 등일 수 있다.

일 실시예에서, 망막 기능장애 질환은 선천성 흑암시 또는 망막색소변성증일 수 있다.

망막색소변성증(Retinitis Pigmentosa, RP)

망막색소변성증은 광수용체의 기능에 문제가 생겨 나타나는 진행성 질환으로, 주로 광수용체와 망막색소상피에 영향을 주는 망막변성 질환으로 세계적으로 대략 4,000명 중 1명에게 발병하는 것으로 보고되고 있다.

망막색소변성증의 원인은 아직 명확하지 않으나 유전자 이상에 의한 것으로 여겨지고 있으며, 가계도를 조사해보면 가족력이 있는 경우와 없는 경우로 나눌 수 있다. 가족력이 있다면 우성, 열성, 반성 유전을 보이며, 가족력이 없다면 단독형이라고 하며 이상유전자를 가지고 있을 가능성이 있다. 유전형태와 원인 유전자에 따라 병의 임상양상과 진행 정도에 차이가 있다는 보고가 있으나 추가적인 연구들이 필요하다.

망막색소변성증의 증상에는 야맹증, 시야협착, 눈부심 현상, 시력 장애가 있으며, 일반적으로 망막색소변성증이 있을 때는 시세포에 이상이 생겨 밝은 곳에 있다 어두운 곳으로 들어갈 때 적응하지 못한다. 또한, 불빛이 희미하거나 어두울 때 사물을 알아보기 어렵고(야맹증), 병이 진행되면서 주변의 사물을 볼 수 있는 범위인 시야가 점차 좁아지는 시야 협착이 발생한다. 시야협착이 진행되면 좁은 관을 통해 보는 것과 같은 터널시야 상태가 되며, 빛이 강하면 주변 사물을 판단하는데 어려움이 생기는 눈부심 현상이 나타난다. 또한, 병이 진행되어 망막의 중심의 원뿔세포까지 손상되면 중심시력을 상실하여 법적 실명까지 이를 수 있다.

레베르 선천성 흑암시 (Leber Congenital Amaurosis, LCA)

레베르 선천성 흑암시는 매우 드문 유전성 안질환으로, 출생시 혹은 출생 직후에 선천 실명을 일으킬 수 있는 가장 중요한 유전성 망막 이상증 중 하나이며, 외국의 보고에는 10만명 중 2~3명에서 발생하고, 시각장애 특수학교 어린이의 10~18%가 이 질병을 가지고 있다고 알려져 있습니다.

레베르 선천성 흑암시는 유전자 이상에 의한 질환으로, 40~50%의 환자에서 유전자의 돌연변이가 발견됩니다. 알려진 12가지 유전자 이상 중 상염색체 열성으로 유전하는 돌연변이가 11가지(GUCY2D, RPE65, SPATA7, AIPL1, LCA5, RPGRIP1, CRB1, CEP290, IMPDH1, RD3, RDH12)이며, 드물게 상염색체 우성으로 유전하는 경우(CRX)도 나타난다.

레베르 선천성 흑암시 환자는 정상기능을 갖는 망막의 막대세포와 원뿔세포가 존재하지 않아 망막전위도검사에서 원뿔세포반응과 막대세포반응이 모두 소실되어 있으며, 출생 시 혹은 출생 직후부터 시작된 심한 시력 소실 혹은 실명, 눈떨림, 방황주시, 느리고 완만한 동공반사, 망막 색소 변성 등의 증상을 보인다. 시각적 자극에 대한 반응의 감소가 첫 증상으로 나타나며, 손으로 눈을 찌르는 증상을 흔히 보이고, 이로 인해 안구함몰을 유발하기도 한다. 그 외 증상들로 사시, 눈떨림, 눈부심, 백내장, 원추각막 등이 있을 수 있고, 일부 환아에서는 청력소실, 정신지연, 발달지연이 동반되기도 한다. 또한, 36-68%의 중추신경계 기형이 동반되며 뇌량 무형성증(corpus callosal agenesis)이 가장 많이 발생되고 그 외 대이랑(macrogyria), 다왜소이랑(polymicrogyria)과 같은 이랑(gyrus)이상, 후두부 척수뇌막류 및 뇌류, 수도폐쇄(aqueductal stenosis), 요천추부수막류 및 이분척추 등이 발생된다. 전신기형은 47-65%에서 동반되는데, 이중 안면기형으로 안면혈관종, 귀의 형성부전, 구순, 구개열, 소구증(microstomia), 두 개 안면골 형성부전증(craniofacial dysostosis), 눈의 발달 이상으로 백내장, 각막경화(sclerocornea), 망막발육부전(retinal dysgenesis) 등이 발생할 수 있다. 심혈관계 기형으로는 심실중격결손, 동맥관개존증, 대동맥축착, 우심증, 단심실, 비뇨생식기계 기형으로 다낭성신, 수신증, 잠재고환, 외성기의 발생부전 등이 발생할 수 있다. 이외에도 다지증, 합지증, 유문협착증, 선천성 횡경막 탈장, Meckel 게실, 선천성풍진증후군, 코넬리아 드 랑게 증후군(Cornelia de Langes syndrome), 클리펠-페일 증후군(Klippel-Feil syndrome) 등이 동반될 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예는 망막 기능형성 유전자를 인위적으로 조작할 수 있는 유전자 조작용 조성물을 포함하는 약학적 조성물이다.

상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.

일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다:

(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.

이때, 상기 망막 기능형성 유전자는 RPE65 유전자, GUCY2D 유전자, SPATA7 유전자, AIPL1 유전자, LCA5 유전자, RPGRIP1 유전자, CRB1 유전자, CEP290 유전자, IMPDH1 유전자, RD3 유전자, RDH12 유전자 및/또는 CRX 유전자일 수 있다.

이때, 상기 유전자 조작용 조성물은 가이드핵산 및/또는 에디터단백질은 각각을 암호화하는 핵산서열을 포함하는 벡터를 포함할 수 있다.

이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질을 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.

다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.

(a) 망막 기능형성 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열;

(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열; 및

(c) 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열.

이때, 삽입을 원하는 핵산서열은 망막 기능형성 유전자의 일부 서열일 수 있다.

또는 삽입을 원하는 핵산서열은 조작하고자 하는 망막 기능형성 유전자의 돌연변이를 교정하기 위한 핵산서열일 수 있다.

이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 에디터단백질을 암호화하는 핵산서열; 및 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.

상기 약학적 조성물은 부가적 요소를 추가로 더 포함할 수 있다.

상기 부가적 요소는 대상의 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예는 망막 기능장애 질환을 치료하기 위해 망막 기능장애 질환을 가지는 유기체에 유전자 조작용 조성물을 투여하는 단계를 포함하는, 망막 기능장애 질환의 치료방법이다.

상기 치료방법은 생체의 유전자를 조작하여 망막 기능형성 시스템을 조절하는 치료방법일 수 있다. 이러한 치료방법은 생체의 유전자를 조작하기 위한 유전자 조작용 조성물을 체내에 직접 주입하여 이루어질 수 있다.

상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.

상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.

상기 가이드 핵산 및 에디터 단백질, 및/또는 도너는, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.

이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 잇다.

이때, 상기 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.

상기 망막 기능장애 질환 관련 설명은 상기 기재한 바와 같다.

상기 유전자 조작용 조성물은 망막 기능장애 질환을 가지는 치료 대상에 투여될 수 있다.

상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.

상기 유전자 조작용 조성물은 치료 대상에 투여될 수 있다.

상기 투여는 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 또는 복막내(intraperitoneally)에서 선택된 투여 경로로 수행될 수 있다.

유전자 조작용 조성물의 1회 투여량(소정의 소망하는 효과를 얻기 위한 약학적 유효량)은 투여 대상의 체중 kg 당 10⁴-10⁹ 세포, 예컨대, 10⁵ 내지 10⁶ 세포/kg(체중) 정도로 상기 수치 범위들 내의 모든 정수값들 중에서 선택될 수 있으나, 이에 제한되는 것은 아니고, 투여 대상의 연령, 건강 및 체중, 동시에 받는 치료의 종류, 만약 있다면 치료의 빈도, 원하는 효과의 특성 등을 고려하여 적절히 처방될 수 있다.

본 명세서에 의해 개시되는 몇몇 구현예들의 방법 및 조성물에 의해 망막 기능형성 유전자를 인위적으로 조작할 경우, 망막 기능형성 시스템의 정상화가 가능하게 되고, 이를 통해 비정상적인 망막 기능형성을 억제시키거나 개선시키는 등의 효과를 얻을 수 있다.

본 명세서에 의해 개시되는 일 구체예는 진핵세포에서 망막 기능형성 유전자를 변형하는 방법에 관한 것으로, 이것은 생체 내, 생체 외 또는 시험관 내에서 이루어질 수 있다.

일부 실시형태에서, 방법은 인간 또는 비인간 동물로부터 세포 또는 세포 집단을 시료추출하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물 또는 식물에 재도입될 수 있다.

상기 방법은 진핵세포에 유전자 조작용 조성물을 도입시키는 단계를 포함하는, 진핵세포를 인위적으로 조작하는 방법일 수 있다.

상기 도입 단계는 생체 내 또는 생체 외에서 수행될 수 있다.

예를 들어, 도입 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.

예를 들어, 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.

실시예

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.

이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들의 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.

실험재료 및 실험방법

1. sgRNA 설계 및 프라이머

CRISPR RGEN Tools (Institute for Basic Science, Korea)을 사용하여 인간의 RPE65 유전자의 CRISPR/Cas9 표적 부위 선별하였다. 각각의 유전자의 표적 부위는 CRISPR 효소의 종류에 따라 달라질 수 있으며, SpCas9를 위한 각각 유전자의 표적 서열은 앞서 기재한 표 1에 정리하였고, CjCas9을 위한 각각 유전자의 표적 서열은 앞서 표 2에 정리하였다. 또한, 표적 서열에 따른 인델 빈도를 각각 표 3 및 표 4에 정리하였다.

[표 3]

SpCas9을 이용한 인간 RPE65의 표적 서열에 따른 인델 빈도

[표 4]

CjCas9을 이용한 인간 RPE65의 표적 서열에 따른 인델 빈도

또한, 실험에 사용된 프라이머는 표 5에 정리하였다.

[표 5]

실험에 사용된 프라이머(Primers used in this study)

2. 세포 배양 및 형질감염(transfection)

마우스 C2C12 (ATCC, CRL-1722^TM) 세포를 4.5g/l, 4mM 글루타민, 1mM 피루브산나트륨(sodium pyruvate), 10% 소 태아 혈청(fetal bovine serum), 100 units/㎖㎎/㎖ 스트렙토마이신이 보충된 DMEM에서 유지하였다. 플라스미드의 형질감염은 제조사의 프로시져(Life Technology)에 따라 Neon®Transfection을 이용하여 수행하였다. 간단하게 설명하면, 2.5 × 10⁵개 세포를 총 1㎍의 플라스미드(인간에 최적화시킨 SpCas9을 암호화하는 플라스미드와 도너와 함께 sgRNA를 암호화하는 플라스미드)와 혼합하였다. 그 후, Neon 시스템의 10㎕ 팁을 사용하여 1,150V에서 15 초 및 2 회의 펄스로 전기 충격을 가했다. 형질 감염 5 일 후, 세포를 수확하고 DNeasy Blood & Tissue kit (Qiagen)를 사용하여 게놈 DNA를 추출 하였다.

3. 동물

8 주령의 수컷 C57BL/6 마우스 및 교배 쌍인 rd12 마우스 (Stock no. 005379, The Jackson Laboratory)를 Central Laboratory Animal로부터 구입하고 12 시간 동안 dark-light cycle 하에서 유지시켰다. rd12 마우스를 서로 교배시켜 Rpe65 유전자에서 동형 접합 돌연변이(homozygous mutation)를 갖는 자손을 생산 하였다.

4. T7E1 assay

형질감염된 세포로부터 추출한 게놈 DNA에서 중합 효소 연쇄 반응 (PCR)에 의해 표적 부위를 증폭시켰다. 그 후, thermal cycler를 이용하여 PCR 생성물을 변성시키고 어닐링시켜 heteroduplex DNA 형성하였고, 결과물을 T7 endonuclease 1 (Toolgen Inc.)과 함께 37 ℃에서 20 분 동안 배양하고 2 % 아가로스겔에서 전기 영동으로 분석 하였다.

5. Targeted deep sequencing

형질감염된 세포, 망막 또는 RPE로부터 추출한 게놈 DNA에서 온-타겟 및 오프-타겟 영역을 중합 효소 연쇄 반응 (PCR)에 의해 증폭하였다. HDR 빈도를 정량하기 위해, Rpe65-상동성 암의 바깥 쪽 서열을 인식하는 프라이머를 사용하여 첫번째 PCR을 수행하였고, 그 후, PCR 생성물을 deep sequencing을 위한 amplicon 생성을 위해 추가적인 증폭을 수행하였다. 생성된 amplicon은 TrueSeq HT dual index system (Illumina)과 함께 Miseq을 이용하여 시퀀싱하였다. 인델 또는 HDR 빈도는 Cas-Analyzer (www.rgenome.net)를 사용하여 정량화하였다.

6. 오프-타겟 위치의 In silico 확인( In silico identification of off-target sites)

잠재적인 오프-타겟 위치는 in-silico 툴인 Off-finder (www.rgenome.net)를 사용하여 확인하였다. 최대 3 bp의 미스 매치를 포함하는 마우스 게놈 위치를 오프-타겟 위치로 간주하였고, targeted deep sequencing에 의해 확인되었다.

7. AAV 벡터 구성 및 바이러스 생산

핵 위치 신호(NLS), HA-태그 및 소 성장 호르몬 poly-A tail을 가지는 인간 최적화된 SpCas9과 EFS 프로모터의 서열을 합성하고, NotI 제한효소 사이트를 이용하여 AAV2의 역위 말단 반복(Inverted Tandem Repeat, ITR) 기반 플라스미드로 서브클로닝 하였다. 또한 다른 AAV 벡터를 위해, U6 프로모터, TS4 sgRNA 및 Rpe65 도너의 서열을 합성하였고, 같은 제한효소 사이트를 이용하여 AAV2 ITR 기반 플라스미드로 서브클로닝 하였다. Rpe65 도너 서열에서, TS4 sgRNA 매개 절단을 방지하고 내인성 게놈 서열로부터 넉인된 서열을 정확하게 구별하기 위해 5개의 뉴클레오타이드를 코돈 변경없이 치환하였다. 재조합 AAV 입자는 헬퍼 아데노바이러스-프리 패키징 시스템(helper adenovirus-free packaging system)을 이용하여 생산되었다. 간략하게, HEK293 세포를 AAV9-capsid 플라스미드 및 헬퍼 플라스미드와 함께 pAAV-ITR-EFS-SpCas9 또는 pAAV-ITR-TS4rd12-sgRNA-Rpe65 donor를 형질감염시켰다. 형질감염 3일 후, 세포를 용해시키고 바이러스 입자를 iodixanol gradient ultracentrifugation에 의해 정제하고 농축하여 10¹³ vg/ml 이상의 역가를 수득하였다.

8. AAV의 망막하 주입(Subretinal injection of AAV)

깊은 마취 후, AAV9-SpCas9 및 AAV9-TS4^rd12 sgRNA-Rpe65-donor (각각 1 × 10¹⁰ viral genomes/1 ㎕ PBS 및 1 × 10¹¹ viral genomes/1 ㎕ PBS)를 수술용 현미경(Leica Microsystems Ltd.) 하에서 33 gauge 블런트 니들이 있는 Nanofil 주사기(World Precision Instruments Inc.)를 사용하여 유리체강(vitreous cavity)을 통해 마우스 눈의 망막하(subretinal) 공간에 주입하였다.

9. 망막전위도검사(Electroretinography)

마우스를 16시간동안 암순응 시키고, 마취한 후, phenylephrine hydrochloride (5 ㎎/㎖)와 tropicamide (5 ㎎/㎖)가 포함 된 점안액으로 동공을 확장시켰다. Full-field electroretinography는 universal testing 및 electrophysiologic system 2000 (UTAS E-2000, LKC Technologies)을 사용하여 수행되었다. 응답은 60 Hz에서 노치 필터를 사용하여 2k의 gain에서 기록되었고, 0.1에서 1500 Hz 사이에서 대역 통과 필터되었다. a-wave의 진폭은 베이스 라인에서 가장 낮은 음의 전압으로 측정되었지만 피크 b-wave 진폭은 a-wave의 골에서 양의 b-wave의 가장 높은 피크까지 측정되었다.

10. 면역형광법(Immunofluorescence)

SpCas9 및 TS4^rd12 sgRNA-Rpe65-donor의 AAV 매개 전달 후 6 주 및 7 개월째, 적출한 눈으로부터 파라핀 블록을 제조하였다. 항-HA 항체 (1 : 1000, cat. no. 3F10, Roche) 및 항-Rpe65 항체 (1 : 1,000, cat. no. sc-73616, Santa Cruz)를 사용하여 얇은 절편을 면역 염색 한 후 Alexa Fluor 488 또는 594 IgG (1 : 500, Thermo Fisher)을 처리하였다. 핵 염색은 4',6-diamidino-2-phenylindole dihydrochloride (Sigma)를 사용하여 수행하였다. 그 후, 슬라이드를 형광 현미경 (Leica)에서 관찰 하였다.

11. 조직학적 평가(Histologic evaluation)

SpCas9 및 TS4^rd12 sgRNA-Rpe65-donor의 AAV 매개 전달 후 7 개월째, 적출한 눈으로부터 파라핀 블록을 제조하였고, 얇은 절편을 준비해 H & E 염색하였다.

12. 조직에서 AAV 게놈 검출을 위한 정량적 PCR(Quantitative PCR for AAV genome detection in tissues)

AAV 게놈 카피 수를 결정하기 위한 정량적 PCR은 망막 또는 RPE로부터 추출한 게놈 DNA를 사용하여 수행하였다. Quantifluor Dye 시스템 (Promega)과 함께 Quantus 형광 측정기를 사용하여 게놈 DNA 농도를 측정 한 후, 50ng의 게놈 DNA를 AAVpro 적정 키트 (Takara)를 사용하여 정량적 PCR 분석에 적용하였다. 열 순환 조건은 다음과 같다: 95 ℃2 분, 이어서 95 ℃5 초의 35 사이클; 60 ℃, 30 초. AAV 게놈 카피의 수는 표준 곡선에 대해 계산되었다. 이배체 마우스 세포의 수는 100μg 게놈 DNA 당 ~ 1.6 × 10⁴ 이배체 세포의 전환 계수를 사용하여 계산되었다.

13. 통계

모든 그룹의 결과는 달리 명시되지 않은 경우 평균 ± SEM으로 표시된다. 처리되지 않은 대조군과 비교된 통계적 유의성은 도면 및 도면 범례에서 *P <0.05, **P <0.01, ***P <0.001로 표시된다. 통계 분석은 Graph Pad PRISM 5에서 수행되었다.

실시예 1. 체외에서 CRISPR/Cas9에 의한 Rpe65의 HDR 매개 게놈 조작 (HDR-mediated genome editing of Rpe65 by CRISPR/Cas9 in vitro )

마우스 C2C12 세포주 (Rpe65wt / wt)를 이용해 초기 sgRNA 스크리닝을 하였다. 기술적인 편리성 및 마우스 C2C12 세포주에서 스크리닝된 sgRNA는 1 개의 뉴클레오티드를 변화시킨 후 rd12 마우스에서 사용할 수 있는 이유때문에 rd12 마우스 유래 세포 대신에 마우스 C2C12 세포주 (Rpe65wt / wt)를 이용하였다. 테스트된 11개의 유력한 후보 중 TS1 sgRNA 및 TS4 sgRNA는 targeted deep sequencing에 의해 측정된 것처럼 가장 효과적인 인델 비율을 나타냈다(도 1). Editing 비욜은 T7 endonuclease 1 assay로 확인하였다(도 2).

다음으로, TS1 sgRNA 및 TS4 sgRNA에 의해 유도되는 HDR 빈도를 시험하였다. 이를 위해, 1.8kb Rpe65 도너 주형을 SpCas 및 두 개의 sgRNA 중 하나와 함께 C2C12 세포주로 도입하였다. 도너 자체의 절단 및 HDR 후 수복된 Rpe65 유전자위의 재절단을 방지하기 위해 도너 주형 서열에 동의 돌연변이(synonymous mutation)를 도입하였다(도 1 및 도 6). 2개의 sgRNA에 의해 유도된 인델 비율은 비슷하였지만, HDR 빈도는 rd12 마우스의 조기 종결코돈에 상응하는 서열에서 현저한 차이를 보였다(도 3 및 도 4). TS1 sgRNA는 1.73 ± 0.17 %의 빈도로 HDR을 유도하였다. 이 HDR 사건 중 절반 이하의 결과(0.74 ± 0.04 %)는 rd12 돌연변이의 잠재적 교정과 관련되었고, 나머지(0.98 ± 0.12 %)는 TS1-유도 이중 가닥 절단(DSB) 위치 근처에서 발생하였다. 대조적으로, TS4 sgRNA는 rd12 돌연변이의 교정(> 2 %)과 관련된 하나의 지배적인 HDR의 빈도가 상당히 높았다(도 4). 특히, TS4 sgRNA에 의해 유도된 HDR의 높은 빈도는 SpCas9에 대하여 도너의 비율과 무관 하였다(도 4).

흥미롭게도 NHEJ가 deep sequencing에 의해 분석되었을 때, TS4 sgRNA 매개 인델은 결실에 의한 것이 지배적이었고, 돌연변이의 약 1/3이 in-frame 인델에 상응했다(도 5). In-frame 인델 중에서 1-코돈 결실은 전체 리드의 2.8 %를 차지하였다(도 6). In-frame 인델은 rd12 생쥐에서 조기 Rpe65 종결 코돈의 제거를 초래할 수 있기 때문에, NHEJ 매개 편집 또한 CRISPR/Cas9의 치료 효과에 기여할 수 있을 것으로 사료된다. 이러한 결과는 LCA를 치료하기 위한 치료상의CRISPR/Cas9 매개 게놈 조작을 위한 최적화된 sgRNA 서열을 확인한 것을 보여준다.

실시예 2. 생체 내에서 이중 AAV 시스템에 의한 Rpe65의 게놈 조작 ( In vivo genome editing of Rpe65 by the dual AAV system)

질병 모델에서 Rpe65의 난센스 돌연변이의 CRISPR/Cas9 매개 편집의 치료적 효능을 평가하기 위해, TS4^rd12 sgRNA를 설계하기 위해 TS4 sgRNA의 하나의 뉴클레오타이드를 변경하였다. 설계된 TS4^rd12 sgRNA는 rd12 마우스의 Rpe65 엑손 3의 돌연변이 유전자좌와 완벽하게 일치하였다. 필요한 모든 조작 구성 요소를 두 개의 분리된 AAV (AAV-SpCas9 및 AAV-TS4^rd12 sgRNA-Rpe65-donor, 이후 AAV-TS4^rd12 sgRNA-Rpe65-donor는 AAV-TS4^rd12-donor로 기재함)에 포함시켰으며, 생체 내 전달은 이중 AAV 시스템을 사용하여 수행하였다(도 7).

Total 2 × 10¹¹vg의 AAV9을 1:1로(AAV-EFS-SpCas9 : AAV-RPE65-sgRNA-donor) 섞어서 망막하 주사하였을 때, RPE와 retina에서 모두 28%정도의 indel이 확인되었고, 이것은 AAV를 통해 효율적으로 망막색소상피와 망막 구성 세포를 교정할 수 있음을 의미한다. 특히 망막색소상피에서는 RPE65 donor에 의한 HDR이 일어나는 것을 확인하였는데, 총 6마리 생쥐에서 약 1.4%정도의 HDR이 발생하였다. 이를 통해, HDR에 의한 유전자 교정으로 정상적인 기능을 하는 RPE65가 발현될 수 있음을 예상할 수 있다(도 7). 최대 게놈 조작 결과를 얻기 위해 두 개의 AAV 농도를 변화시켜 AAV 성분의 비율을 최적화하였다. 3 주령의 rd12 마우스에 망막하(subretinal; SRT) 주사를 통해 저용량(총 2 × 10¹⁰ 벡터 게놈(vg)/눈) 또는 고용량(총 2 × 10¹¹ vg/눈)의 AAV를 투여했다. AAV 처리 4주 후, 망막 및 망막색소상피(RPE)로부터 얻은 세포를 이용하여 Rpe65의 표적 부위를 deep sequencing으로 분석하였다. SRT 주입은 망막과 RPE에서 ~ 20 %에 달하는 indel 비율을 보였지만, 이것은 다양한 매개 변수에 따라 변하였다(도 8). 저용량 SRT 주입 (SRT-low)은 망막과 RPE에서 각각 낮고 높은 인델 비율을 보였다. 이러한 결과는 AAV의 SRT 투여가 망막보다 RPE에서 더 효율적임을 나타내며, 이는 RPE에서 이배체 세포당 더 높은 AAV 카피 수에 의해 것으로 확인되었다(도 9). 이전 연구에서 간 질환 마우스 모델에서 Cas9에 비해 10 배 높은 sgRNA와 도너의 사용은 교정 증가를 유도했기 때문에 AAV-SpCas9에 비해 과량의 AAV-TS4^rd12-donor (AAV-SpCas9 : AAV-TS4^rd12-donor = 0.1 : 1.9)를 시험하였으나, SRT 투여 후 두 조직에서 낮은 인델을 보였다(도 8). 종합적으로, 상기 결과는 SRT 전달 효율이 Rpe65의 생체 내 편집을 유도하는데 효율적이며, Cas9에 대한 sgRNA 비율은 최적화된 조작을 위해 중요한 요소임을 보여준다.

실시예 3. Rd12 마우스에서 Rpe65 돌연변이의 교정( In vivo correction of Rpe65 mutation in rd12 mice)

Rd12 마우스에서 AAV 치료 후 망막과 RPE에서 Rpe65의 병원성 C-to-T 돌연변이 근처의 HDR 사건을 분석하였다. HDR 사건은 RPE에서 명확하게 관찰되었지만 망막에서는 관찰되지 않았다 (도 10). 비록 인델 빈도가 AAV-SpCas9에 대한 AAV-TS4^rd12-donor의 1 : 1 비율을 사용하는 저용량과 고용량 AAV 처리 된 RPE에서 서로 유사했지만(도 8), 고용량 투여군에서 HDR 이벤트가 더 빈번하게 발생하였다(high dose, 1.17±0.31%; low dose, 0.59±0.22%) (도 10). 이러한 결과는 이전 연구에서 간세포에서의 ornithine transcarbamylase 유전자의 CRISPR 매개 교정에서 관찰된 것과 유사하다. 또한, HDR 대 인델 비율의 분석을 통해 HDR 사건이 고용량 처리 그룹에서 약 3 배정도 더 빈번한 것을 확인하였다(도 11). 성공적인 HDR (1.01 ± 0.38 %)은 AAV-SpCas9 : AAV-TS4^rd12-donor의 비율이 0.5 : 1.5 일 때 유도되었다(도 10). 중요하게도, 대부분의 HDR은 T에서 C 로의 돌연변이의 정확한 교정이었기 때문에 결과적으로 단백질 서열은 야생형 Rpe65와 동일 하였다(도 13). 또한, RPE에서 NHEJ 매개 조작의 특징을 확인한 결과, in-frame 결실이 3.83 %의 빈도에서 발생하였고, rd12 마우스에서 조기 종결 코돈의 제거를 초래하는 1-코돈 결실은 1.61 % 발생하였다(도 12 및 도 13).

실시예 4. Rd12 마우스에서 Rpe65 유전자의 HDR 매개 교정에 의한 망막 기능 향상(Improved retinal function by HDR-mediated correction of the Rpe65 gene in rd12 mice)

Rd12 마우스에서 HDR 매개 Rpe65 유전자 교정의 치료 효과를 조사하기 위해, AAV의 SRT 주사 후 6 주 및 7 개월에 dark-adapted electroretinography을 수행 하였다 (도 14). Electroretinography에서 rd12 마우스는 연령이 일치된 정상 C57BL/6 마우스와 비교하여 암 적응 빛 반응(dark-adapted light responses)이 현저하게 약하게 나타났다. 대조적으로, SRT 주사 후 6 주에 AAV로 처리한 rd12 마우스에서 명확한 반응을 확인하였다(도 15). 전기적 반응은 초기 주입 후 7 개월까지 유지되었다(도 16). 측정된 암순응(scotopic) a-wave와 b-wave의 진폭은 정상 C57BL/6 마우스의 값의 각각 21.2 ± 4.1 %와 39.8 ± 3.2 %였다.

실시예 5. 회복된 Rpe65 발현 및 망막 변성의 완화 (Recovered Rpe65 expression and attenuation of retinal degeneration)

HDR 매개 Rpe65 유전자 교정은 outer nuclear layer에서의 신경 세포의 손실을 막았다(도 17). AAV 처리는 주사 후 6 주에 RPE 세포에서 Rpe65 발현을 회복시켰다(도 18).

실시예 6. 인간 RPE65의 in frame 조작 (In frame editing of human RPE65)

다양한 sgRNA에 의해 인간 RPE65에서 실질적인 in frame 조작이 일어났으며(도 19), 이러한 결과는 HDR 매개 교정 외에도 RPE65의 NHEJ 매개 조작의 임상 잠재력을 보여준다.

실시예 7. 잠재적인 오프-타겟 위치 및 망막 구조 분석 (Analysis of potential off-target sites and retinal structure)

TS4^rd12 sgRNA 서열과 최대 3 개의 뉴클레오타이드가 다른 33 개의 상동성 부위에 대한 오프-타겟 분석 결과, AAV를 처리한 rd12 마우스의 예상 게놈 좌위에서 의미있는 돌연변이는 관찰되지 않았다(도 21). 또한, 7 개월 동안 조직학적 변화(perturbation)나 종양 형성의 확실한 증거는 확인되지 않았다(도 22).

[표 6]

활성 오프-타겟 위치(Active off-target sites, 미스매치 뉴클레오타이드 서열: 소문자 알파벳; PAM 서열: 밑줄)

<110> TOOLGEN INCORPORATED <120> Genome editing for treating Retinal dysfunction disease <130> CP18-180 <150> US 62/565838 <151> 2017-09-29 <160> 178 <170> KoPatentIn 3.0 <210> 1 <211> 20 <212> DNA <213> Homo sapiens <400> 1 agtttcttgt aaccaccagc 20 <210> 2 <211> 20 <212> DNA <213> Homo sapiens <400> 2 tacatgagct gtgagcggcg 20 <210> 3 <211> 20 <212> DNA <213> Homo sapiens <400> 3 ccgctcacag ctcatgtaac 20 <210> 4 <211> 20 <212> DNA <213> Homo sapiens <400> 4 tcacagctca tgtaacaggt 20 <210> 5 <211> 20 <212> DNA <213> Homo sapiens <400> 5 ggagactgcc ggtgagccag 20 <210> 6 <211> 20 <212> DNA <213> Homo sapiens <400> 6 accggcagtc tccttcgatg 20 <210> 7 <211> 20 <212> DNA <213> Homo sapiens <400> 7 agtctccttc gatgtgggcc 20 <210> 8 <211> 20 <212> DNA <213> Homo sapiens <400> 8 agagtcctgg cccacatcga 20 <210> 9 <211> 20 <212> DNA <213> Homo sapiens <400> 9 gggcttgccc atcaaacagg 20 <210> 10 <211> 20 <212> DNA <213> Homo sapiens <400> 10 taaagtcaaa cttgtgcagg 20 <210> 11 <211> 20 <212> DNA <213> Homo sapiens <400> 11 tccgcactga tgcttacgta 20 <210> 12 <211> 20 <212> DNA <213> Homo sapiens <400> 12 ccgcactgat gcttacgtac 20 <210> 13 <211> 20 <212> DNA <213> Homo sapiens <400> 13 cccgtacgta agcatcagtg 20 <210> 14 <211> 20 <212> DNA <213> Homo sapiens <400> 14 tacgggcaat gactgagaaa 20 <210> 15 <211> 20 <212> DNA <213> Homo sapiens <400> 15 aggatcgtca taacagaatt 20 <210> 16 <211> 20 <212> DNA <213> Homo sapiens <400> 16 ccactgggta gacattaaca 20 <210> 17 <211> 20 <212> DNA <213> Homo sapiens <400> 17 cgtagtaatc ttcccccact 20 <210> 18 <211> 20 <212> DNA <213> Homo sapiens <400> 18 gcgtagtaat cttcccccac 20 <210> 19 <211> 20 <212> DNA <213> Homo sapiens <400> 19 gcaactatgt ctctgtcaat 20 <210> 20 <211> 20 <212> DNA <213> Homo sapiens <400> 20 caactatgtc tctgtcaatg 20 <210> 21 <211> 20 <212> DNA <213> Homo sapiens <400> 21 ttcaatgtgg gggtgagcag 20 <210> 22 <211> 20 <212> DNA <213> Homo sapiens <400> 22 cacccccaca ttgaaaatga 20 <210> 23 <211> 20 <212> DNA <213> Homo sapiens <400> 23 cggttccatc attttcaatg 20 <210> 24 <211> 20 <212> DNA <213> Homo sapiens <400> 24 gatggaaccg tttacaatat 20 <210> 25 <211> 20 <212> DNA <213> Homo sapiens <400> 25 gcttgaatcg gtcactgcag 20 <210> 26 <211> 20 <212> DNA <213> Homo sapiens <400> 26 gaacgtaaga tggcttgaat 20 <210> 27 <211> 20 <212> DNA <213> Homo sapiens <400> 27 agttacctat gaacgtaaga 20 <210> 28 <211> 20 <212> DNA <213> Homo sapiens <400> 28 tcccaactat atcgtttttg 20 <210> 29 <211> 20 <212> DNA <213> Homo sapiens <400> 29 tccacaaaaa cgatatagtt 20 <210> 30 <211> 20 <212> DNA <213> Homo sapiens <400> 30 atatctaaga cttaccccca 20 <210> 31 <211> 20 <212> DNA <213> Homo sapiens <400> 31 tagccaattt acgtgagaac 20 <210> 32 <211> 20 <212> DNA <213> Homo sapiens <400> 32 agccaattta cgtgagaact 20 <210> 33 <211> 20 <212> DNA <213> Homo sapiens <400> 33 ttcaggttgg ggagcctttc 20 <210> 34 <211> 20 <212> DNA <213> Homo sapiens <400> 34 aggctcccca acctgaagtt 20 <210> 35 <211> 20 <212> DNA <213> Homo sapiens <400> 35 gttaccttgt caatattcaa 20 <210> 36 <211> 20 <212> DNA <213> Homo sapiens <400> 36 tgtgcagtga cgagactatc 20 <210> 37 <211> 20 <212> DNA <213> Homo sapiens <400> 37 cagtgacgag actatctggc 20 <210> 38 <211> 20 <212> DNA <213> Homo sapiens <400> 38 atcaattacc agaagtattg 20 <210> 39 <211> 20 <212> DNA <213> Homo sapiens <400> 39 aaaccttaca catatgcgta 20 <210> 40 <211> 20 <212> DNA <213> Homo sapiens <400> 40 agtccatacg catatgtgta 20 <210> 41 <211> 20 <212> DNA <213> Homo sapiens <400> 41 tacacatatg cgtatggact 20 <210> 42 <211> 20 <212> DNA <213> Homo sapiens <400> 42 gaaggattaa ttaccctatc 20 <210> 43 <211> 20 <212> DNA <213> Homo sapiens <400> 43 tgaagttgcc cgggctgaag 20 <210> 44 <211> 20 <212> DNA <213> Homo sapiens <400> 44 gttaatctcc acttcagccc 20 <210> 45 <211> 22 <212> DNA <213> Homo sapiens <400> 45 cacctgtttg atgggcaagc cc 22 <210> 46 <211> 22 <212> DNA <213> Homo sapiens <400> 46 tttgacttta aagaaggaca tg 22 <210> 47 <211> 22 <212> DNA <213> Homo sapiens <400> 47 tgtttcaatg tccttcaggt tc 22 <210> 48 <211> 22 <212> DNA <213> Homo sapiens <400> 48 tcaggttcat ccgcactgat gc 22 <210> 49 <211> 22 <212> DNA <213> Homo sapiens <400> 49 gacgatcctt ttctcagtca tt 22 <210> 50 <211> 22 <212> DNA <213> Homo sapiens <400> 50 gaaaaggatc gtcataacag aa 22 <210> 51 <211> 22 <212> DNA <213> Homo sapiens <400> 51 atatattctt gcagggatct gg 22 <210> 52 <211> 22 <212> DNA <213> Homo sapiens <400> 52 cccagtgggg gaagattact ac 22 <210> 53 <211> 22 <212> DNA <213> Homo sapiens <400> 53 atccaataag caagtcagag at 22 <210> 54 <211> 22 <212> DNA <213> Homo sapiens <400> 54 cttgaatcgg tcactgcagg gg 22 <210> 55 <211> 22 <212> DNA <213> Homo sapiens <400> 55 ctcccaacta tatcgttttt gt 22 <210> 56 <211> 22 <212> DNA <213> Homo sapiens <400> 56 catattgctg acaaaaaaag ga 22 <210> 57 <211> 22 <212> DNA <213> Homo sapiens <400> 57 ggagaagttc tgtatttatt at 22 <210> 58 <211> 22 <212> DNA <213> Homo sapiens <400> 58 tcctttcaac ctcttccatc ac 22 <210> 59 <211> 22 <212> DNA <213> Homo sapiens <400> 59 ctccccaacc tgaagttagg ag 22 <210> 60 <211> 22 <212> DNA <213> Homo sapiens <400> 60 ggttaccttg tcaatattca aa 22 <210> 61 <211> 22 <212> DNA <213> Homo sapiens <400> 61 aggcaagaat ttagtcacgc tc 22 <210> 62 <211> 22 <212> DNA <213> Homo sapiens <400> 62 ggctccagcc agatagtctc gt 22 <210> 63 <211> 22 <212> DNA <213> Homo sapiens <400> 63 ttaccagaag tattgtggga aa 22 <210> 64 <211> 22 <212> DNA <213> Homo sapiens <400> 64 tacgcatatg tgtaaggttt cc 22 <210> 65 <211> 22 <212> DNA <213> Homo sapiens <400> 65 ggaacaaagt gattcaagcc aa 22 <210> 66 <211> 22 <212> DNA <213> Homo sapiens <400> 66 acttgggttt ggcaagagcc tg 22 <210> 67 <211> 22 <212> DNA <213> Homo sapiens <400> 67 ctgggctcac caccacactc ag 22 <210> 68 <211> 22 <212> DNA <213> Homo sapiens <400> 68 tttgtcctgc tcctgggctc ac 22 <210> 69 <211> 22 <212> DNA <213> Homo sapiens <400> 69 catggactgt tcaaaaaatc tt 22 <210> 70 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 70 actctgtcca aagacctcat gtga 24 <210> 71 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 71 agctgacaaa taacaaatag gcac 24 <210> 72 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 72 agctgacaaa taacaaatag gcac 24 <210> 73 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 73 tgcctctatc tctgcggact 20 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 74 tgcctctatc tctgcggact 20 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 75 tgcctctatc tctgcggact 20 <210> 76 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 76 tgcctctatc tctgcggact 20 <210> 77 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 77 ctgccttacc aaggacaagc 20 <210> 78 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 78 ctgccttacc aaggacaagc 20 <210> 79 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 79 ctgccttacc aaggacaagc 20 <210> 80 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 80 ctgccttacc aaggacaagc 20 <210> 81 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 81 gctgtacgga ttgctcctgt 20 <210> 82 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 82 gctgtacgga ttgctcctgt 20 <210> 83 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 83 ttccaggtta ctgaacccaa a 21 <210> 84 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 84 ttccaggtta ctgaacccaa a 21 <210> 85 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 85 ttccaggtta ctgaacccaa a 21 <210> 86 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 86 ccttctctca actggaggac a 21 <210> 87 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 87 ccttctctca actggaggac a 21 <210> 88 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 88 ggctctggaa gttactctca ctag 24 <210> 89 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 89 tgccctgtac accccaaata caca 24 <210> 90 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 90 cactttggat cctctggcaa ctca 24 <210> 91 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 91 cccatggaca gagttctata gaca 24 <210> 92 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 92 gccaaatata tccaaagata gtgg 24 <210> 93 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 93 atggaatacg tgcctttgca ggaa 24 <210> 94 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 94 ctctagtcta ccaccctgag aact 24 <210> 95 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 95 tgaagagaat cactgcaggg gatt 24 <210> 96 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 96 gttggttacc cctcagataa aggt 24 <210> 97 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 97 aggaagctga gtggctaatg gtaa 24 <210> 98 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 98 cctgagaaag ctaatactgt ccac 24 <210> 99 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 99 atccccaaaa ccccttatac cctt 24 <210> 100 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 100 gctaaggggt cagttctgca ctca 24 <210> 101 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 101 ctgcatcacc attactacaa caca 24 <210> 102 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 102 gagtgagcca tcacagttgc agat 24 <210> 103 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 103 tgtacctcag ccttgagttt gagt 24 <210> 104 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 104 gccgattggg agatagttta caca 24 <210> 105 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 105 acgggggagg gagtaactta gcta 24 <210> 106 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 106 aagagcagtc agtgctctta acca 24 <210> 107 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 107 gcaggatgac agaaatgctt gttg 24 <210> 108 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 108 gcaggatgac agaaatgctt gttg 24 <210> 109 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 109 gagtggctca cttagcttct gcta 24 <210> 110 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 110 catctgttgt ggtgttgaaa gcca 24 <210> 111 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 111 ccatccaatc tcttcctggg agaa 24 <210> 112 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 112 ccagatgcaa accacagcat ccta 24 <210> 113 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 113 cccagaacct gtgctaaaga ttga 24 <210> 114 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 114 ctttccttgt ttcccctctg aaga 24 <210> 115 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 115 ctttccttgt ttcccctctg aaga 24 <210> 116 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 116 ctttccttgt ttcccctctg aaga 24 <210> 117 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 117 ctttccttgt ttcccctctg aaga 24 <210> 118 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 118 gtaggcaaag catccataca caca 24 <210> 119 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 119 aatgctatcc cgaaagaccc ctat 24 <210> 120 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 120 atggccaagc aatacttatg ctga 24 <210> 121 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 121 tggatgctga gtcattgctc taac 24 <210> 122 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 122 tggtgaggtc agtcatggac tta 23 <210> 123 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 123 tggtgaggtc agtcatggac tta 23 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 124 aaaccacctg atccctctcc 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 125 aaaccacctg atccctctcc 20 <210> 126 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 126 aaaccacctg atccctctcc 20 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 127 aaaccacctg atccctctcc 20 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 128 aggccctact ttgaggagga 20 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 129 aggccctact ttgaggagga 20 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 130 aggccctact ttgaggagga 20 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 131 aggccctact ttgaggagga 20 <210> 132 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 132 tcaagccatg agagaaaaag g 21 <210> 133 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 133 tcaagccatg agagaaaaag g 21 <210> 134 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 134 cctagcactg tgtcccacct 20 <210> 135 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 135 cctagcactg tgtcccacct 20 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 136 cctagcactg tgtcccacct 20 <210> 137 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 137 tgcacaaaat gctattctga cat 23 <210> 138 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 138 tgcacaaaat gctattctga cat 23 <210> 139 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 139 agccattcaa gtttctccct tgat 24 <210> 140 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 140 gacggtacat aaatgagcag cctt 24 <210> 141 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 141 tcccctttct ttgtaagcac tcct 24 <210> 142 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 142 gctgtcctcg aactcagaaa tcca 24 <210> 143 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 143 gtcagttgaa ccgtgtgaag tt 22 <210> 144 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 144 tcacaagtaa gggatgcttc ctgt 24 <210> 145 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 145 atcactaagc tgtgccaagt agca 24 <210> 146 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 146 cagggatgct taatgcactg tgaa 24 <210> 147 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 147 gttctcactt acatgtggaa ggct 24 <210> 148 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 148 tctggtttcc gttctccagt tcca 24 <210> 149 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 149 ttcccctccg aaaatcccct atcc 24 <210> 150 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 150 gtaccccagg tgctaaaagg gtct 24 <210> 151 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 151 cagtgccctc cctgacaatg tca 23 <210> 152 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 152 tgagattggg gtgcatctct ggaa 24 <210> 153 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 153 agtcatccta tagctctgga cagg 24 <210> 154 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 154 gctcatagtc ctctactgga tgga 24 <210> 155 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 155 gggtgcctaa gacacgtact aaag 24 <210> 156 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 156 aattactgtc ccgccaggat gga 23 <210> 157 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 157 tgccctgaga ccaaaggaat aaga 24 <210> 158 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 158 ccagaaagtg aggtctcatc tcca 24 <210> 159 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 159 ccagaaagtg aggtctcatc tcca 24 <210> 160 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 160 cgtcttatca ctagggttaa gggt 24 <210> 161 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 161 atgaccacag acctacaaca tgca 24 <210> 162 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 162 cccaggatcc tcgtgtgtgt taca 24 <210> 163 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 163 ctgctgtggc atcatggtgc cta 23 <210> 164 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 164 caggagccaa ctgggaaata gact 24 <210> 165 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 165 caccagccaa agaaaacaca tggt 24 <210> 166 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 166 caccagccaa agaaaacaca tggt 24 <210> 167 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 167 caccagccaa agaaaacaca tggt 24 <210> 168 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 168 caccagccaa agaaaacaca tggt 24 <210> 169 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 169 caaggcagcc aaggatgtag gaa 23 <210> 170 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 170 cctgggacta aaccaccaat ccat 24 <210> 171 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 171 agcctggcat ttagaagtca agga 24 <210> 172 <211> 23 <212> DNA <213> Mus musculus <400> 172 actggcagtc tcctctgatg tgg 23 <210> 173 <211> 23 <212> DNA <213> Mus musculus <400> 173 aaaggcagtc tcctctgaag tgg 23 <210> 174 <211> 23 <212> DNA <213> Mus musculus <400> 174 tatggcagtc ttctctgatg ggg 23 <210> 175 <211> 23 <212> DNA <213> Mus musculus <400> 175 agaggcagtc tcctctgagg agg 23 <210> 176 <211> 23 <212> DNA <213> Mus musculus <400> 176 actagcattc ccctatgatg ggg 23 <210> 177 <211> 23 <212> DNA <213> Mus musculus <400> 177 taaagcagtc ttctctgatg ggg 23 <210> 178 <211> 23 <212> DNA <213> Mus musculus <400> 178 actggaagcc ttctctgatg agg 23

Claims

RPE65 유전자를 표적하는 가이드 RNA 또는 이를 암호화하는 핵산; 및
에디터단백질 또는 이를 암호화하는 핵산
을 포함하는 유전자 조작용 조성물로서,
상기 가이드 RNA는 RPE65 유전자의 표적 영역을 표적화할 수 있는 가이드 서열을 포함하고,
상기 가이드 서열은 RPE65 유전자의 표적 영역 중 가이드핵산 비결합 서열과 상동성을 가지는 서열로 구성되며, 이때, 상기 가이드 서열은 RNA 서열로서, 상기 가이드핵산 비결합 서열과 비교하여 T가 U로 대체된 서열로 구성되며,
이때, 상기 가이드핵산 비결합 서열은 서열번호 1, 2, 4, 5, 6, 9, 12, 14, 16, 17, 18, 20, 21, 37 및 51에 제시된 서열 중 선택된 적어도 하나의 서열이고,
상기 가이드 서열은 RPE65 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적인 결합을 하며, 이때, 상기 상보적 결합은 0 내지 5개의 미스매칭(mismatching) 결합을 포함하고,
상기 가이드 RNA는 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 더 포함하며,
상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질이고,
상기 가이드 RNA는 에디터단백질과 리보뉴클레오프로테인(ribonucleoprotein)을 형성하며,
상기 리보뉴클레오프로테인(ribonucleoprotein)은 상기 REP65 유전자의 인위적인 조작을 위해 이용되는,
유전자 조작용 조성물.
제1항에 있어서,
상기 인위적인 조작은 상기 RPE65 유전자의 표적영역 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입;
야생형 RPE65 유전자와 상이한 하나 이상의 뉴클레오타이드의 치환; 및
외부 유래의 하나 이상의 뉴클레오타이드의 삽입
중 선택된 하나 이상의 핵산의 변형, 또는
상기 RPE65 유전자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형
을 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
제2항에 있어서,
상기 PAM 서열은
상기 에디터단백질이 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질 일 때, 5'-NGG-3' 이고,
상기 에디터단백질이 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 때, 5'-NNNNRYAC-3'이며,
이때, N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T인 것을 특징으로 하는 유전자 조작용 조성물.
제1항에 있어서,
상기 가이드핵산 및 에디터단백질은 각각 암호화된 핵산의 형태로 1 이상의 벡터에 존재하는 것을 특징으로 하는 유전자 조작용 조성물.
제4항에 있어서,
상기 벡터는 플라스미드이거나, 또는
상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나 이상의 바이러스벡터인 것을 특징으로 하는 유전자 조작용 조성물.
제1항에 있어서,
상기 유전자 조작용 조성물은 상기 표적 영역 내에 삽입시키고자 하는 핵산 서열을 포함하는 도너를 더 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
제6항에 있어서,
상기 삽입시키고자 하는 핵산 서열은 야생형의 정상 RPE65 유전자의 일부 서열과 동일한 서열이고, 상기 표적 영역 내에 존재하는 돌연변이를 교정하기 위한 것임을 특징으로 하는 유전자 조작용 조성물.
제6항에 있어서,
상기 가이드핵산, 에디터단백질 및 도너는 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하는 것을 특징으로 하는 유전자 조작용 조성물.
제8항에 있어서,
상기 벡터는 플라스미드이거나, 또는
상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나 이상의 바이러스벡터인 것을 특징으로 하는 유전자 조작용 조성물.
제 1항에 있어서,
상기 유전자 조작용 조성물은 망막 기능장애 질환의 치료를 위해 이용되는 것을 특징으로 하는 유전자 조작용 조성물.
제10항에 있어서,
상기 망막 기능장애 질환은 레베르 선천성 흑암시 또는 망막색소변성증인 것을 특징으로 하는 유전자 조작용 조성물.
RPE65 유전자를 표적하는 가이드 RNA 또는 이를 암호화하는 핵산으로,
상기 가이드 RNA는 RPE65 유전자의 표적 영역을 표적화할 수 있는 가이드 서열을 포함하고,
상기 가이드 서열은 RPE65 유전자의 표적 영역 중 가이드핵산 비결합 서열과 상동성을 가지는 서열로 구성되며, 이때, 상기 가이드 서열은 RNA 서열로서, 상기 가이드핵산 비결합 서열과 비교하여 T가 U로 대체된 서열로 구성되며,
이때, 상기 가이드핵산 비결합 서열은 서열번호 1, 2, 4, 5, 6, 9, 12, 14, 16, 17, 18, 20, 21, 37 및 51에 제시된 서열 중 선택된 적어도 하나의 서열이고,
상기 가이드 서열은 RPE65 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적인 결합을 하며, 이때, 상기 상보적 결합은 0 내지 5개의 미스매칭(mismatching) 결합을 포함하고,
상기 가이드 RNA는 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 더 포함하는,
가이드 RNA 또는 이를 암호화하는 핵산.
제12항에 있어서,
상기 가이드 RNA를 암호화하는 핵산은 1 이상의 벡터에 존재하는 것을 특징으로 하는 가이드 RNA 또는 이를 암호화하는 핵산.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제