KR20150070307A - 안정한 비-폴리아데닐화된 rna의 생산 - Google Patents
안정한 비-폴리아데닐화된 rna의 생산 Download PDFInfo
- Publication number
- KR20150070307A KR20150070307A KR1020157012583A KR20157012583A KR20150070307A KR 20150070307 A KR20150070307 A KR 20150070307A KR 1020157012583 A KR1020157012583 A KR 1020157012583A KR 20157012583 A KR20157012583 A KR 20157012583A KR 20150070307 A KR20150070307 A KR 20150070307A
- Authority
- KR
- South Korea
- Prior art keywords
- rna
- virus
- nucleic acid
- sequence
- poly
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
- A61P21/02—Muscle relaxants, e.g. for tetanus or cramps
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/15—Nucleic acids forming more than 2 strands, e.g. TFOs
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/50—Methods for regulating/modulating their activity
- C12N2320/52—Methods for regulating/modulating their activity modulating the physical stability, e.g. GC-content
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Biochemistry (AREA)
- Epidemiology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Neurology (AREA)
- Immunology (AREA)
- Neurosurgery (AREA)
- Dermatology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Hospice & Palliative Care (AREA)
- Cardiology (AREA)
- Heart & Thoracic Surgery (AREA)
- Urology & Nephrology (AREA)
- Psychiatry (AREA)
- Pulmonology (AREA)
- Pain & Pain Management (AREA)
Abstract
본 발명은 여러 측면에서, 폴리-A 꼬리가 결여된 하이브리드 RNA, 및 이 RNA를 발현하기 위한 핵산 벡터에 관한 것이다. 하이브리드 RNA는 일부 경우에 3' 말단 안정화 삼중 나선 구조를 갖는다. 생체내에서 및 시험관내에서 상기 RNA를 발현하기 위한 관련 방법이 또한 개시된다.
[대표도]
도 1a
[대표도]
도 1a
Description
관련 출원
본원은 그 전부가 본원에 참고로 포함된, 2012년 10월 16일 출원된 미국 특허 가출원 61/714,697 (명칭: "PRODUCTION OF STABLE NON-POLYADENYLATED RNAS"), 2012년 10월 22일 출원된 미국 특허 가출원 61/716,764 (명칭: "PRODUCTION OF STABLE NON-POLYADENYLATED RNAS"), 및 2012년 12월 19일 출원된 미국 특허 가출원 61/739,153 (명칭: "PRODUCTION OF STABLE NON-POLYADENYLATED RNAS")을 기초로 한, 35 U.S.C. § 119(e) 하의 우선권을 주장한다.
미연방 정부 지원 연구
본 발명은 미국 국립 보건원이 부여한 인가 번호 GM34277 및 CA133404 하의 정부 지원으로 이루어졌다. 미국 정부는 본 발명에 대해 특정 권리를 갖는다.
신생 전사체의 3' 말단부의 프로세싱은 RNA 폴리머라제의 종료 및 성숙 RNA의 적절한 기능을 보장하기 위해 대단히 중요하다. 질환, 예컨대 암의 통상적인 발생 동안 및 진행에서, 3' 말단부 절단 부위 사용은 빈번하게 변하고, 이것은 전사체의 안정성, 세포내 위치, 또는 기능에 영향을 줄 수 있는 추가의 서열 모티프를 성숙 RNA의 3' 말단부에 포함시킨다 (또는 제외시킨다) (문헌 [Lutz and Moreira 2011]에서 검토됨). 실질적으로 모든 긴 RNA 폴리머라제 II (Pol II) 전사체는 뉴클레오티드내 분해에 의한 절단, 이어서 비-주형 방식의 아데노신 (A) 잔기의 부가에 의해 생성된 폴리-A 꼬리로 끝난다 (문헌 [Moore and Sharp 1985]; 문헌 [Colgan and Manley 1997]에서 검토됨; 문헌 [Zhao et al. 1999]; [Proudfoot 2004]). 그러나, 인간 트랜스크립톰에 대한 최근의 대규모 연구는 전사가 게놈 전체에 걸쳐 널리 발생함을 나타내고 (문헌 [Wilusz et al. 2009]에서 검토됨), 세포에 존재하는 유의한 비율 (가능하게는 >25%)의 긴 Pol II 전사체에는 정규 폴리-A 꼬리가 결여될 수 있음을 제시한다 (Cheng et al. 2005; Wu et al. 2008; Yang et al. 2011a). 일부 상기 전사체가 분해 중간체일 가능성이 있지만, 폴리-A 꼬리가 결여된 잘 특성화된 안정한 Pol II 전사체, 예컨대 복제-의존성 히스톤 mRNA가 존재한다. 그의 3' 말단부에서 U7 snRNA 안내된 뉴클레오티드내 분해에 의한 절단 후에, 히스톤 mRNA는, RNA 안정성을 보장하고 번역 효율을 향상시키기 때문에 폴리-A 꼬리에 기능적으로 유사한 고도로 보존된 스템-루프 구조를 그의 3' 비번역 영역 (UTR)에 갖는다 (문헌 [Marzluff et al. 2008]에서 검토됨).
최근의 연구는 비-표준 3' 말단부 프로세싱 메카니즘에 적용된 추가의 Pol II 전사체를 확인하였다 (문헌 [Wilusz and Spector 2010]에서 검토됨). 특히, 다른 RNA 프로세싱 이벤트, 예컨대 프리-mRNA 스플라이싱 (Box et al. 2008) 및 tRNA 생합성에서 잘 알려진 기능을 갖는 효소는 특정 신생 전사체를 절단하여 성숙 3' 말단부를 생성하는 것으로 밝혀졌다. 그의 잘 특성화된 기능에서, RNase P는 tRNA 전구체를 뉴클레오티드내 분해에 의해 절단하여 기능성 tRNA의 성숙 5' 말단을 생성한다 (문헌 [Kirsebom 2007]에서 검토됨). 또한, RNase P는 가까이의 폴리아데닐화 신호의 존재에도 불구하고 NEAT2로도 알려진 긴 비코딩 RNA MALAT1 (전이-연관 폐 선암종 전사체 1)의 성숙 3' 말단부를 생성하는 것으로 밝혀졌다 (Wilusz et al. 2008). RNase P에 의한 절단은 ~6.7-kb MALAT1 비코딩 RNA의 성숙 3' 말단부 및 작은 tRNA-유사 전사체의 5' 말단부를 동시에 생성한다. RNase Z 및 CCA-부가 효소를 비롯하여 tRNA 생합성에 관여하는 추가의 효소는 작은 RNA를 추가로 프로세싱하여 mascRNA (MALAT1-associated small cytoplasmic RNA)로 알려진 성숙 61-뉴클레오티드 (nt) 전사체를 생성한다 (Wilusz et al. 2008).
긴 MALAT1 전사체는 핵 반점 내의 핵에 보유되고 (Hutchinson et al. 2007), 여기서 선택적 스플라이싱 (Tripathi et al. 2010), 전사 활성화 (Yang et al. 2011b), 및 가까이에 있는 유전자의 발현 (Nakagawa et al. 2012; Zhang et al. 2012)을 시스로 조절하는 것으로 제안되었다. MALAT1 유전자좌는 마우스 발생에 없어도 되는 것으로 보이지만 (Eissmann et al. 2012; Nakagawa et al. 2012; Zhang et al. 2012), MALAT1은 많은 인간 암에서 과다발현되고 (Ji et al. 2003; Lin et al. 2007; Lai et al. 2011), 이것은 MALAT1이 암 진행 동안 중요한 기능을 가질 수 있음을 제시한다. 또한, 염색체 전좌 절단점 (Davis et al. 2003; Kuiper et al. 2003; Rajaram et al. 2007) 및 암과 연관된 점 돌연변이 및 짧은 결실 (Ellis et al. 2012)이 MALAT1 내에서 확인되었다.
정규 폴리-A 꼬리의 결여에도 불구하고, MALAT1은 마우스 및 인간 세포에서 가장 풍부한 긴 비코딩 RNA에 속한다. 실제로, MALAT1은 β-액틴 또는 GAPDH를 포함하는 많은 단백질-코딩 유전자에 비해 대등하거나 더 높은 수준으로 발현된다 (Zhang et al. 2012).
일부 측면에서, 본 발명은 하이브리드 RNA, RNA를 발현하기 위한 발현 벡터 및 그의 사용 방법에 관한 것이다. 하이브리드 RNA는 내인성 RNA의 폴리-A 꼬리를 교체하는 안정화 3' 말단부를 포함한다. 따라서, 일부 측면에서, 본 발명은, RNA 분자를 포함하고 폴리-A 꼬리가 결여되고 말단 서열에 연결된 하이브리드 핵산이다.
다른 측면에서, mRNA가 아닌 기능성 RNA를 생성하는 방법이 제공된다. 일부 실시양태에서, mRNA가 아닌 기능성 RNA는 표적 mRNA와 염기쌍을 형성하여 표적 mRNA의 발현을 조절할 수 있는 안티센스 RNA이다. 조절은 상향조절 또는 하향조절일 수 있다.
일부 실시양태에서, 말단 서열은 삼중 나선 입체형태를 갖는 이종 RNA 안정화 말단 서열이다. 다른 실시양태에서, 말단 서열은 MALAT1 말단 서열 또는 MEN β 말단 서열인 이종 RNA 안정화 말단 서열이다. 또 다른 실시양태에서, 말단 서열은 U-풍부 서열, A-풍부 서열, U-풍부 및 A-풍부 서열, 또는 C-풍부 및 G-풍부 서열인 이종 RNA 안정화 말단 서열이다.
다른 실시양태에서, 말단 서열은 리간드 결합 도메인을 갖는다. 예를 들어, 리간드 결합 도메인은 조직 특이적 요소이다. 일부 실시양태에서, 조직은 암성 조직이고, 조직 특이적 요소는 암성 조직에서 번역의 조절에 관여한다.
RNA 분자는 임의의 종류의 RNA 분자일 수 있다. 예를 들어, RNA 분자는 세포질 RNA, 핵 RNA, mRNA, 또는 비코딩 RNA일 수 있다. 일부 실시양태에서, RNA 분자는 진핵 RNA, 포유동물 RNA, 식물 RNA, 또는 보다 구체적으로 인간 RNA이다. 일부 경우에, RNA 분자는 리포터 분자에 대응한다.
RNA 분자에 대응하는 핵산을 갖는 벡터, RNA 분자에 대응하는 핵산의 상류의 프로모터 및 RNA 분자에 대응하는 핵산의 하류의 말단 서열에 대응하는 핵산이 본 발명의 다른 측면에 따라 제공된다. 일부 실시양태에서, 벡터는 플라스미드이다.
일부 실시양태에서, RNA 분자에 대응하는 핵산은 리포터 단백질, 예컨대 녹색 형광 단백질을 코딩하는 핵산이다.
다른 실시양태에서, 벡터는 본원에서 설명되는 임의의 하이브리드 핵산을 생산하는 핵산 서열을 포함한다.
일부 실시양태에서, 프로모터는 이종 프로모터이다. 다른 실시양태에서, 프로모터는 CMV 프로모터이다.
본 발명의 다른 측면에서, RNA의 번역을 향상시키기 위한 방법을 제공한다. 방법은 폴리-A 꼬리가 결여된 단리된 세포질 RNA를 세포 내에서 발현시키는 것을 수반하며, 여기서 세포질 RNA는 세포 내에서 RNA의 번역을 향상시키는데 효과적인 3' 말단 서열을 갖는다.
일부 실시양태에서, 3' 말단 서열을 갖는, 폴리-A 꼬리가 결여된 단리된 세포질 RNA는 본원에서 설명되는 하이브리드 핵산이다. 다른 실시양태에서, 본원에서 설명되는 임의의 벡터는 폴리-A 꼬리가 결여된 단리된 세포질 RNA를 발현하기 위해 세포에게 투여된다.
3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 세포 내에서 발현시킴으로써 폴리-A 꼬리가 결여된 RNA를 발현하기 위한 방법이 본 발명의 다른 측면에 따라 제공된다. 일부 실시양태에서, 단리된 핵산은 본원에서 설명되는 임의의 하이브리드 핵산이다. 다른 실시양태에서, 본원에서 설명되는 임의의 벡터는 단리된 핵산을 발현하기 위해 세포에게 투여된다.
일부 실시양태에서, 핵산은 적어도 하나의 화학적 또는 천연 변형을 포함한다.
다른 측면에서, 본 발명은 RNA의 정제 방법이다. 방법은 폴리-A 꼬리가 결여된 정제된 RNA를 얻기 위해, 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산의 혼합물을 친화도 정제 단계 또는 크기 배제 정제 단계에 적용하는 단계를 포함한다.
일부 실시양태에서, 단리된 핵산은 본원에서 개시되는 하이브리드 핵산이다. 다른 실시양태에서, 정제된 RNA는 시험관내, 생체외 또는 생체내 방법에서 사용된다.
3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 대상체에서 단백질을 발현시키기에 효과적인 양으로 대상체에게 투여하는 것을 포함하는, 대상체에서 질환의 치료 방법이 본 발명의 다른 측면에 따라 제공되고, 여기서 단백질은 대상체에서 질환의 치료에 유용하다. 일부 실시양태에서, 질환은 기능 상실과 연관된 질환, 예컨대 근이영양증 또는 낭성 섬유증이다. 다른 실시양태에서, 질환은 암, 자가면역, 심혈관 질환, 신경변성 질환, 및 피부 질환의 군으로부터 선택된 질환이다.
다른 측면에 따르면, 본 발명은 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 세포 내에서 발현시키는 것, 및 세포를 성장 조건 하에 스캐폴드 상에서 성장시켜 조직을 형성하는 것을 수반하는 조직 생성 방법이다. 일부 실시양태에서, 조직은 체내에 이식된다.
본 발명은 또한 본원에서 설명되는 방법에 따라 생성된 조직을 포함한다.
본 발명의 다른 측면에서, 줄기 세포의 생산 방법이 제공된다. 방법은 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 분화된 세포의 집단 내에서 발현시키는 것, 및 분화된 세포를 재프로그래밍을 촉진하는 조건 하에 성장시켜 만능성 줄기 세포를 형성하는 것을 수반하며, 여기서 RNA는 재프로그래밍 단백질을 코딩한다.
본원에서 설명되는 방법에 따라 생산된 만능성 줄기 세포가 본 발명의 다른 측면에 따라 제공된다.
분화된 세포의 생산 방법이 본 발명의 측면에 따라 제공된다. 방법은 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 줄기 세포의 집단 내에서 발현시키는 것, 및 줄기 세포를 분화를 촉진하는 조건 하에 성장시켜 분화된 세포를 형성하는 것을 수반하며, 여기서 RNA는 분화 단백질을 코딩한다.
본 발명은 다른 측면에서 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 포함하는 단리된 세포의 치료 유효량을 유전자 결함의 교정이 필요한 대상체에게 투여함으로써 대상체에서 유전자 결함을 교정하는 방법이고, 여기서 RNA는 유전자 결함을 교정하기 위한 단백질을 코딩한다. 일부 실시양태에서, 유전자 결함은 면역계 장애를 야기하는 유전자 결함; 신경계 장애를 야기하는 유전자 결함; 심장 장애를 야기하는 유전자 결함; 순환 장애를 야기하는 유전자 결함 및 호흡기 장애를 야기하는 유전자 결함으로 이루어지는 군으로부터 선택된다.
3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 포함하는 단리된 세포의 치료 유효량을 유전 장애의 치료가 필요한 대상체에게 투여함으로써 대상체에서 유전 장애를 치료하는 방법이 본 발명의 다른 측면에서 제공되고, 여기서 RNA는 교체 단백질을 코딩하고, 교체 단백질의 결여는 유전 장애과 연관된다.
본 발명은 다른 측면에서 이종 RNA 안정화 말단 서열에 연결된, 폴리-A 꼬리가 결여된 RNA 분자의 하이브리드 핵산이고, 여기서 RNA 분자는 면역원성 단백질을 코딩한다. 하이브리드 핵산을 면역원성 단백질에 대한 적응 면역 반응을 유도하기에 효과적인 양으로 대상체에게 투여함으로써 대상체를 예방접종하는 방법이 다른 실시양태에서 제공된다.
다른 측면에서, 본 발명은 이종 RNA에 연결된, 폴리-A 꼬리가 결여된 외인성 RNA 분자, 및 안정화 말단 서열을 동물의 하나 이상의 세포에 포함하는 비-인간 동물이다. 일부 실시양태에서, RNA 분자는 치료 단백질 또는 면역원성 단백질을 코딩한다.
본 발명은 하기 설명에서 제시되고 도면에서 예시되는 성분의 구축 및 배열에 대한 상세한 설명으로 그 적용이 제한되지 않는다. 본 발명은 다른 실시양태이거나 또는 다른 방법으로 실행되거나 수행될 수 있다. 각각의 상기 실시양태 및 측면은 임의의 다른 실시양태 또는 측면과 연결될 수 있다. 또한, 본원에서 사용되는 표현 및 용어는 설명을 위한 것으로서, 제한하는 의미로 간주되지 않아야 한다. 본원에서 "포함하는", "포괄하는", 또는 "갖는", "함유하는", "수반하는", 및 이들의 변형 표현의 사용은 그 다음에 나열되는 항목 및 그의 동등물뿐만 아니라 추가의 항목을 포함하는 것을 의미한다.
첨부 도면은 일정 비율로 그려짐을 의도하지 않는다. 도면에서, 다양한 도면에 도시된 각각의 동일한 또는 거의 동일한 성분은 유사한 수치로 제시된다. 명확성을 위해, 모든 성분이 모든 도면에 표시되는 것은 아니다. 도면에서:
도 1은 MALAT1의 3' 말단부가 고도로 보존되고 RNase P에 의해 절단됨을 보여준다. (a) MALAT1 유전자좌의 3' 말단부에 폴리아데닐화 신호가 존재하지만, MALAT1은 tRNA 생합성 기구에 의해 매개되는 상류 절단 메카니즘을 통해 1차적으로 프로세싱된다. RNase P 절단은 MALAT1의 성숙 3' 말단부 및 mascRNA의 5' 말단부를 동시에 생성한다. tRNA-유사 작은 RNA는 이어서 RNase Z에 의해 절단되고, CCA 부가에 적용된다. 제시된 서열은 서열 70이다. (b) MALAT1 RNase P 절단 부위 (화살표로 표시됨)의 바로 상류에 고도로 진화상 보존된 A-풍부 구역이 존재한다. 보다 상류에는 예측된 스템-루프 구조에 의해 분리된 2개의 거의 완전히 보존된 U-풍부 모티프가 존재한다. 제시된 서열은 상부에서 하부로 서열 71 내지 78이다. (c) 유사한 모티프가 MEN β RNase P 절단 부위의 상류에 존재한다. 제시된 서열은 상부에서 하부로 서열 79 내지 84이다. (d) CMV-cGFP-mMALAT1_3' 센스 발현 플라스미드는 cGFP 오픈 리딩 프레임의 하류에 마우스 MALAT1의 nt 6581-6754를 교체함으로써 생성되었다. 폴리아데닐화 신호는 3' 말단부에 존재하지 않는다. 제시된 서열은 서열 70이다. (e) 플라스미드로 HeLa 세포를 형질감염시킨 후, 노던 블롯을 수행하여 mascRNA 및 cGFPMALAT1_3' RNA의 발현을 검출한다. cGFP MALAT1_3' RNA의 3' 말단부가 정확하게 생성되었고 추가의 뉴클레오티드가 전사 후에 부가되지 않았음을 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다.
도 2는 U-풍부 모티프가 MALAT1의 3' 말단부의 우리딜화 및 분해를 억제함을 보여준다. (a) 본 연구에 사용된 cGFP 발현 플라스미드의 모식도. 제시된 서열은 서열 70이다. 정규 폴리-A 꼬리로 끝나는 cGFP 전사체를 생성하기 위해, mMALAT1_3' 영역을 소 성장 호르몬 (bGH) 또는 SV40 폴리아데닐화 신호 (중앙)로 교체하였다. 핵-보유된 cGFP 전사체를 생성하기 위해, mMALAT1의 nt 1676 내지 3598을 cGFP의 상류에 배치하였다 (하부). (b) 형질감염된 HeLa 세포를 분획화하여 핵 및 세포질 총 RNA를 단리한 후, cGFP ORF에 대한 프로브를 사용한 노던 블롯 분석에 적용하였다. 내인성 MALAT1에 대한 프로브를 분획화 효율에 대한 대조군으로 사용하였다. (c) SpeckleF2-MALAT1_3' 전사체는 핵 내에 효율적으로 보유되었다. (d) 돌연변이 또는 결실 (적색으로 표시됨)을 CMV-cGFP-mMALAT1_3' 발현 플라스미드의 mMALAT1_3' 영역 내에 도입하였다. 제시된 서열은 상부에서 하부로 서열 85 내지 89이다. (e) 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다. (f) 라이게이션-매개된 3' RACE 방법을 사용하여 분해를 겪은 cGFP-MALAT1_3' RNA 전사체의 3' 말단부를 조사하였다. 전사 후에 부가된 뉴클레오티드는 적색으로 표시된다. 제시된 서열은 상부에서 하부로 서열 90 내지 100이다. (g) RNase H 처리, 이어서 노던 블롯팅을 사용하여, cGFP-MALAT1_3' (도 2d에 제시된 comp 14) 전사체가 안정함을 밝혀내었다. 51 nt가 결실되어 Comp. 14 전사체를 생성하기 때문에, 오직 139-nt의 밴드만이 예상된다.
도 3은 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 MALAT1 안정성을 위해 필요하지만 충분하지는 않음을 보여준다. (a) 성숙 Comp.14 전사체 (서열 101)의 3' 말단부의 예측된 2차 구조. 패널 C, D, 및 E에서 돌연변이된 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성은 자주색으로 표시된다. (b) 돌연변이 (적색으로 표시됨)를 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내에 도입하였다. 제시된 서열은 상부에서 하부로 서열 102 내지 111이다. 나선의 원자 구조는 제시된 예측 구조와 상세한 부분에서는 상이할 수 있지만, 2차 구조의 형성은 강하게 지지된다. U-풍부 모티프 2와 A-풍부 구역 사이의 영역만이 제시되지만, 전체 174-nt mMALAT1_3' 영역이 이들 플라스미드에 존재한다. (c-e) 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다.
도 4는 삼중 나선이 MALAT1의 3' 말단부에서 형성됨을 보여준다. (a) 염기 트리플(triple) (파선으로 표시됨)은 성숙 Comp.14 전사체의 3' 말단부에서 형성된다. 제시된 서열은 서열 101이다. 이 구조는 보존된 스템-루프의 배향이 90도 회전된 것을 제외하고 도 3a에 제시된 것과 유사하다. 상기 예측된 구조는 이용가능할 때 원자 구조에서 상세한 부분에서는 상이할 수 있지만, 삼중 나선의 형성은 강하게 지지된다. 패널 E에서 돌연변이된 U-A·U 염기 트리플은 자주색으로 표시된다. (b) U-A·U 및 C-G·C 염기 트리플은 왓슨-크릭(Watson-Crick) 염기쌍 형성 나선의 주요 홈에 대한 후그스틴(Hoogsteen) 수소 결합을 통해 형성된다. (c) 만화 표현에서 MALAT1 Comp.14 3' 말단부의 로제타(Rosetta) 모델. 염기 1 내지 5는 모델링 수렴을 달성하기 위해 포함되지 않는다. 패널 A에서처럼, U-풍부 모티프 1은 초록색으로, U-풍부 모티프 2는 적색으로, A-풍부 구역은 청색으로 표시된다. 나머지 염기는 회색으로 표시된다. (d) 비-결합된 염기 C-11 (패널 A에서와 같이 넘버링됨)을 둘러싸는 삼중 나선의 근접도. 염기는 왓슨-크릭 수소 결합 (흑색), 후그스틴 수소 결합 (적색)과 함께 막대 형태로 제시된다. (e) 4개의 U-A·U 염기 트리플은 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내의 C-G·C 염기 트리플로 점진적으로 전환되었다. 각각의 구축물의 명칭에서, *은 후그스틴 수소 결합을 나타낸다. 이어서, 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 웨스턴 블롯을 수행하여 cGFP 단백질 발현을 검출하였다. 빈쿨린(Vinculin)을 로딩 대조군으로 사용하였다. (f) 돌연변이 (적색으로 표시됨)를 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내에 도입하였다. U-풍부 모티프 1 주위의 영역만이 제시되었지만, 전체 174-nt mMALAT1_3' 영역이 이들 플라스미드에 존재하였다. 각각의 전사체의 5' 말단부가 우측에 존재하여 패널 A 내의 구조와 직접적인 비교가 가능함을 유의한다. 제시된 서열은 상부에서 하부로 서열 112 내지 117이다. 이어서, WT 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다.
도 5는 MALAT1 삼중 나선이 번역 인핸서 요소로 기능함을 보여준다. (a) 지정된 3' 말단부 서열로 끝나는 cGFP 전사체를 발현하는 플라스미드로 HeLa 세포를 형질감염시켰다. mMALAT1_3' 영역 및 폴리아데닐화 신호를 나타낸 바와 같은 센스 또는 안티센스 방향으로 삽입하였다. 웨스턴 블롯을 수행하여 cGFP 단백질 발현을 수행하였다. 빈쿨린을 로딩 대조군으로 사용하였다. (b) 2색 형광 리포터 발현 시스템의 모식도. (c) 2색 발현 플라스미드로 HeLa 세포를 형질감염시키고, 유동 세포 분석을 사용하여 단일 세포에서 mCherry 및 eYFP 단백질 발현을 측정하였다. 대표적인 실험 (n=3)으로부터 개개의 형질감염된 세포에서 측정된 mCherry 대 eYFP 단백질 발현의 비에 대한 상자 그림이 제시된다 (수평선, 중간값; 상자, 25 내지 75번째 백분위수; 오차 막대, 1.5x 4분위수간 영역). (d) QPCR을 사용하여 2색 발현 플라스미드로 형질감염된 세포 집단에서 mCherry mRNA 대 eYFP mRNA의 비를 측정하였다. 데이터를 폴리아데닐화된 구축물에 대해 정규화하고, 3개의 독립 실험의 평균 및 표준 편차로서 제시한다. (e) 돌연변이 또는 결실 (적색으로 표시됨)을 CMV-cGFP-mMALAT1_3' 발현 플라스미드의 mMALAT1_3' 영역 내로 도입하였다. 제시된 서열은 상부에서 하부로 서열 85, 및 118 내지 122이다. (f) 이어서, 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다. (g) 웨스턴 블롯팅을 사용하여 형질감염된 HeLa 세포에서 cGFP 발현을 검출하였다. (h) 형질감염된 HeLa 세포를 분획화하여 핵 및 세포질 총 RNA를 단리한 후, 노던 블롯 분석에 적용하였다. (i) 번역을 촉진하는 기능을 하는 뉴클레오티드 (자주색으로 표시됨)는 MALAT1의 3' 말단부에서 삼중 나선 영역의 측면에 존재한다. 제시된 서열은 서열 101이다.
도 6은 리보솜 풋프린트가 마우스 배아 줄기 세포에서 MALAT1의 5' 말단부 근처에서 관찰됨을 보여준다. 문헌 [Ingolia et al. 2011]에 의해 결정된 마우스 배양체 및 마우스 배아 줄기 세포 (백혈병 억제 인자 (LIF)의 존재 또는 부재 하에 성장된)에서 MALAT1의 mRNA-seq 및 리보솜 흔적 프로파일이 제시된다. MALAT1 전사 개시 부위는 도면의 우측에 화살표로 표시된다.
도 7은 MALAT1 삼중 나선으로 끝나는 전사체가 생체내에서 마이크로RNA에 의해 효율적으로 억제됨을 보여준다. (a) let-7에 완전히 상보성인 서열 또는 2개의 튀어나온 let-7 결합 부위가 mCherry의 3' UTR 내로 삽입되었다. let-7 마이크로RNA 서열은 청색으로 제시된다. 제시된 서열은 상부에서 하부로 서열 123 내지 125이고, 서열 124는 2회 반복된다. (b) HeLa 세포를, (0x로 표시함) 마이크로RNA 결합 부위가 존재하거나 존재하지 않는, SV40 폴리아데닐화 신호 또는 mMALAT1_3' 영역으로 끝나는 2색 형광 리포터 플라스미드로 형질감염시켰다. 또한, 40 nM의 대조군 siRNA 또는 외인성 let-7 마이크로RNA를 나타낸 바와 같이 동시-형질감염시켰다. 이어서, 유동 세포 분석을 사용하여 mCherry 및 eYFP 단백질 수준을 측정하였다. 상대적인 억제 배수는 비-표적화된 (0x) 리포터에 대한 동등한 비로 정규화된, 표적화된 구축물의 평균 mCherry 대 평균 eYFP 신호의 비로서 계산하였다. 데이터는 3개의 독립 실험의 평균 및 표준 편차로서 제시한다. (c) QPCR을 사용하여 세포 집단에 걸친 mCherry 및 eYFP 전사체 수준을 측정하고, mCherry RNA 발현의 상대적인 억제 배수를 상기와 유사하게 계산하였다. 데이터는 3개의 독립 실험의 평균 및 표준 편차로서 제시한다.
도 8은 구조적으로 불안정한 mascRNA 돌연변이체가 생체내 분해를 위해 그의 3' 말단부에서 표지됨을 보여준다. (a) 그의 5' 말단부에 GG를 갖고 불안정한 수용자 스템을 함유하는 tRNA (및 tRNA-유사 전사체)가 CCA-부가 효소에 의한 CCACCA의 부가에 의해 신속한 분해를 위해 표적화됨이 밝혀졌다 (Wilusz et al. 2011). 제시된 서열은 둘 다 서열 126이다. 정제된 CCA-부가 효소의 사용은 수용자 스템에 4개의 돌연변이 (적색으로 표시됨)의 도입을 통해 mascRNA를 시험관내에서 CCA로부터 CCACCA 표적으로 전환하는 것을 허용하였다 (Mut 10 전사체 생성). 이와 대조적으로, 불안정한 수용자 스템을 갖지만 그의 5' 말단부에 GA를 갖는 mascRNA 돌연변이체 (Mut 7)는 시험관내에서 CCA 표적을 유지하였다. 생체내에서 CCACCA 부가를 위한 이들 서열 요건을 확인하기 위해, 이들 2개의 돌연변이체 mascRNA 전사체를 발현하는 CMV-cGFP-mMALAT1_3' 플라스미드를 생성하였다. (b) 야생형 (WT) 또는 돌연변이체 발현 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 사용하여 mascRNA 및 cGFP-MALAT1_3' RNA의 발현을 검출하였다. cGFP-MALAT1_3' RNA가 두 돌연변이체 플라스미드로부터 효율적으로 생산되었기 때문에 mascRNA 돌연변이는 RNase P 절단에 영향을 주었다 (하부). 이와 대조적으로, 어떤 돌연변이체 mascRNA 전사체도 노던 블롯 분석에 의해 검출가능하지 않았고 (상부), 이것은 둘 다가 RNase P 절단 후에 효율적으로 분해되었음을 나타낸다. (c) 라이게이션-기반 3' RACE PCR 방법을 수행함으로써, CCACC(A)가 생체내에서 mascRNA Mut 10 전사체에 부가됨이 밝혀졌다. 전사 후에 부가된 뉴클레오티드는 적색으로 표시된다. 제시된 서열은 상부에서 하부로 서열 127 내지 131이다. (d) 대조적으로 및 선행 시험관내 결과 (Wilusz et al. 2011)와 일치하게, CCACCA로 끝나는 어떠한 mascRNA Mut 7 전사체도 검출되지 않았다. 그 대신에, Mut 7 전사체의 3' 말단부에 부가된 짧은 U-풍부 꼬리가 종종 관찰되었고, 이것은 분해 과정에서의 우리딜화를 시사한다. 제시된 서열은 상부에서 하부로 서열 132 내지 138이다. 일부 RACE 클론에 대해, U-풍부 꼬리는 수용자 스템 내에서 시작하였고, 이것은 3'-5' 엑소뉴클레아제가 상기 이중 가닥 영역 내에서 멈출 가능성이 있고 엑소뉴클레아제가 인식하여 붕괴 과정을 재시작하기 위한 새로운 단일 가닥 꼬리를 제공하기 위해 U-풍부 꼬리가 부가됨을 나타낸다. 이것은 짧은 단일 가닥 꼬리가 생체내에서 증식 메카니즘에 의해 구조적으로 불안정한 tRNA 및 tRNA-유사 전사체의 3' 말단부에 부가되어 전사체 분해를 야기함을 보여준다.
도 9는 MALAT1 tRNA-유사 구조가 RNase P 동원 및 생체내 mascRNA 생합성을 위해 충분함을 보여준다. (a) CMV-유도 전사체로부터 mascRNA 생합성을 위해 요구되는 최소 서열 요소를 확인하기 위해, 점진적인 결실을 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내에 도입하였다 (상부). cGFP 오픈 리딩 프레임을 먼저 제거하여 CMV-mMALAT1_3' 발현 플라스미드를 생성하였다 (중앙). 상기 플라스미드는 여전히 완전한 174-nt mMALAT1_3' 단편 (nt 6581-6754)를 함유하고, 따라서 RNase P 절단 부위 상류에 U- 및 A-풍부 모티프를 포함한다. 이어서 mascRNA tRNA-유사 구조 그 자체가 mascRNA 생합성을 위해 충분하지 결정하기 위해서, MALAT1 RNase P 절단 부위 상류의 영역을 비관련 12-nt 서열로 교체하여, CMV-리더-mmascRNA 발현 플라스미드를 생성하였다 (하부). 12-nt 서열은 에스. 세레비지아에 (S. cerevisiae) 프리-tRNA(Tyr)로부터의 5' 리더이다. 각각의 플라스미드에 대한 안티센스 대조군 (미제시)은 MALAT1/mascRNA 영역을 안티센스 배향으로 배치함으로써 생성되었다. 제시된 서열은 상부에서 하부로 서열 139, 139, 및 140이다. (b) 발현 플라스미드로 HeLa 세포를 형질감염시키고, 총 RNA를 24 hr 후에 단리하였다. 이어서, 노던 블롯을 수행하여 mascRNA 발현을 검출하였다. U6 snRNA를 로딩 대조군으로 사용하였다. mascRNA가 3개의 모든 센스 플라스미드로부터 생산되었기 때문에, 이것은 생체내에서 mascRNA 생성을 위해 요구되는 MALAT1의 유일한 영역이 tRNA-유사 구조 자체임을 보여준다.
도 10은 MEN β의 3' 말단부가 RNase P에 의해 절단되고 효율적인 번역을 지지함을 보여준다. (a) 사용된 발현 플라스미드의 모식도. cGFP 오픈 리딩 프레임의 하류에 mMALAT1_3' 영역 (상부), SV40 또는 bGH 폴리아데닐화 신호 (중앙), 또는 MEN β tRNA-유사 구조 및 보존된 상류 U- 및 A-풍부 모티프를 포함하는 마우스 MEN β 유전자좌의 3' 말단부로부터의 174-nt 영역 (하부)이 삽입되었다. 제시된 서열은 둘 다 서열 139이다. (b) 플라스미드로 HeLa 세포를 형질감염시킨 후, 노던 블롯을 수행하여 mascRNA 및 cGFP mRNA의 발현을 검출하였다. 다양한 구축물을 사용한 cGFP mRNA 3' 말단부 프로세싱의 정확성을 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다. 스미어가 SV40 또는 bGH 폴리-A 부위로 끝나는 cGFP 전사체에 대해 관찰되었고, 이것은 부가된 폴리-A 꼬리의 길이의 변화를 나타낸다. 이와 대조적으로, 예상된 크기 (190-nt)의 규정된 밴드가 MALAT1 또는 MEN β의 3' 말단부로 끝나는 cGFP 전사체에 대해 관찰되었고, 이것은 추가의 뉴클레오티드가 RNase P 절단 후에 부가되지 않음을 나타낸다. (c) 웨스턴 블롯을 수행하여 형질감염된 플라스미드로부터 cGFP 단백질 발현을 검출하였다. 빈쿨린을 로딩 대조군으로 사용하였다. 결과는 MALAT1 및 MEN β의 3' 말단부가 유사한 수준의 번역을 지지함을 보여준다.
도 11은 U- 및 A-풍부 모티프가 핵 내에서 MALAT1의 3' 말단부를 안정화시키기 위해 중대함을 보여준다. (a) U-풍부 모티프 1, U-풍부 모티프 2, 또는 A-풍부 구역 내의 돌연변이 (적색으로 표시됨)를 도 2c에 제시된 핵-보유된 긴 전사체를 생성하는 CMV-SpeckleF2-mMALAT1_3' 발현 플라스미드 내에 도입하였다. 제시된 서열은 상부에서 하부로 서열 85, 86, 141, 및 142이다. (b) 야생형 (WT) 또는 돌연변이체 CMV-SpeckleF2-mMALAT1_3' 발현 플라스미드로 HeLa 세포를 형질감염시켰다. 대조군으로서, CMV-cGFP-mMALAT1_3' 발현 플라스미드를 또한 사용하였다 (레인 2). 이어서, 노던 블롯을 수행하여 mascRNA 및 SpeckleF2-MALAT1_3' 전사체 (또는 레인 2의 cGFP-MALAT1_3' 전사체)를 검출하였다. 긴 SpeckleF2-MALAT1_3' 전사체의 3' 말단부가 정확하게 생성되고 추가의 뉴클레오티드가 전사 후에 부가되지 않았음을 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다. SpeckleF2-MALAT1_3' 돌연변이체 전사체가 노던 분석에 의해 비검출가능하였기 때문에, 본 발명자들은 U- 및 A-풍부 모티프 둘 다가 핵에서 MALAT1의 안정화를 위해 필요하다고 결론지었다. (c) 라이게이션-매개 3' RACE 방법을 사용하여 분해를 겪는 SpeckleF2-MALAT1_3' 전사체의 3' 말단부를 조사하였다. 우리딜화된 붕괴 중간체를 나타내는 3개의 클론 (서열결정된 15개 중에서)이 검출되었고, 이것은 우리딜화가 또한 핵에서 발생함을 시사한다. 제시된 서열은 상부에서 하부로 서열 85 및 143 내지 145이다. 흥미롭게도, 이들 3개의 우리딜화된 전사체는 짧은 U-꼬리의 부가 전에 3' 말단부로부터 유의하게 분해되었다.
도 12는 MALAT1의 3' 말단부의 모티프들이 전사체 안정성을 보장하기 위해 협력함을 시사하는 돌연변이 분석을 보여준다. (a) MALAT1의 3' 말단부 영역에 다양한 결실을 함유하는 CMV-cGFP-mMALAT1_3' 발현 플라스미드를 생성하였다. *는 각각의 구축물에서 결실된 뉴클레오티드를 나타낸다. 제시된 서열은 상부에서 하부로 서열 146 내지 160이다. (b) 복합 돌연변이를 함유하는 다양한 CMV-cGFP-mMALAT1_3' 플라스미드로 HeLa 세포를 형질감염시키고, 총 RNA를 24 hr 후에 단리하였다. 이어서, 노던 블롯을 수행하여 mascRNA 또는 cGFP-MALAT1의 발현을 검출하였다. 각각의 구축물에 대해 RNase P 프로세싱의 정확도를 입증하기 위해 cGFP-MALAT1 RNA에 대한 노던 블롯 분석 전에 RNase H 소화를 수행하였다. 흥미롭게도, cGFP-MALAT1_3' 전사체는 안정하였고, 이것은 보존된 스템-루프의 10 nt만이 RNA 안정성을 위해 요구됨을 시사한다. 그러나, Comp.1 전사체로부터 추가의 뉴클레오티드를 결실시키기 위해 시도할 때 (Comp.2, Comp.3, Comp.4, 또는 Comp.5를 생성하기 위해), cGFP-MALAT1_3' 전사체는 불안정하게 되었다. 그럼에도 불구하고, 18개 이상의 뉴클레오티드가 보존된 스템-루프 (Comp.12)에 존재하면, 추가의 뉴클레오티드를 MALAT1의 3' 말단부의 다른 부분으로부터 결실될 수 있다. 보존된 스템-루프 내 및 U-풍부 모티프 2와 A-풍부 구역 사이의 영역 내의 뉴클레오티드는 아마도 구조적 안정성의 역치에 도달함을 보장함으로써 MALAT1 RNA 안정성을 보장하기 위해 크게 협력하는 것으로 밝혀졌다. 그러나, 삼중 나선 형성이 MALAT1 3' 말단부 안정성을 보장하는대 훨씬 더 중대한 역할을 하는 것을 언급하는 것은 중요하다.
도 13은 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 MALAT1의 3' 말단부를 안정화하는데 필요함을 보여준다. (a) U-풍부 모티프 2 내의 돌연변이를 CMV-cGFP-mMALAT1_3' 플라스미드 내로 도입하여 U-풍부 모티프 2와 A-풍부 구역 사이의 선택된 염기쌍 형성을 붕괴시켰다. U-풍부 모티프 2만이 제시되었지만, 전체 174-nt mMALAT1_3' 영역이 존재하였다. mMALAT1_3' Comp.14의 2차 구조 예측에서, 패널 B의 각각의 레인에서 돌연변이된 뉴클레오티드는 자주색으로 표시된다. 제시된 서열은 상부에서 하부로 서열 161 내지 168 및 101이다. (b) 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다. MALAT1 3' 말단부로부터 가장 먼 U-A 염기쌍 형성을 제외하고 (Mut U2.5, 레인 9), U-풍부 모티프 2와 A-풍부 구역 사이의 모든 염기쌍 형성은 생체내에서 MALAT1 3' 말단부를 안정화하는데 유의한 역할을 수행한다.
도 14는 MALAT1 3' 말단부의 구조적 모델링을 보여준다. (a) 전장 (nt 1 내지 59) MALAT1 Comp.14 3' 말단부의 5개의 개별적인 모델의 중첩. 모델은 만화 표현으로 제시되고, 청색, 적색, 초록색, 오렌지색, 및 자홍색으로 채색된다. (b) 청색으로 채색된 모델의 5' 말단부의 근접도 (패널 A로부터). 삼중 나선의 제1 염기 트리플은 그의 왓슨-크릭 및 후그스틴 염기쌍 형성을 통해 표시된다. G-5와 A-45 사이의 가능한 수소 결합은 오렌지색으로 제시되고, U-풍부 모티프 2와 A-풍부 구역 사이의 루프를 통한 상기 영역의 5' 말단부의 안정화 가능성을 강조한다. (c) 로제타 신생 RNA 폴딩에 의해 생성된 2,000 MALAT1 Comp.14 3' 말단부 모델 (nt 1-5가 결여된)의 산포도. 도면은 X-축에 참조 모델까지의 모든 모델의 거리 (Å 단위)를, Y-축에 개별 구조의 점수를 보여준다.
도 15는 MALAT1 삼중 나선이 효율적인 단백질 번역을 지지함을 보여준다. (a) HeLa 세포를 지정된 이중 색상 형광 리포터 벡터 (mCherry 하류의 서열을 각각의 플롯에 대해 표시함)로 형질감염시킨 후, 유동 세포 분석을 사용하여 각각의 세포의 미가공 eYFP 및 mCherry 강도를 결정하였다. 모의 형질감염된 샘플은 관찰된 eYFP 및 mCherry의 배경 (자가형광) 수준을 보여준다. 모든 후속 분석에서, 배경 수준의 형광을 나타내는 세포를 물질 및 방법에서 설명되는 바와 같이 제거하였다. (b-d) mCherry가 지정된 바와 같이 SV40 폴리아데닐화 신호 또는 WT/돌연변이체 mMALAT1_3' 영역으로 끝나는 이중 색상 벡터로 형질감염된 각각의 세포에 대해 eYFP 및 mCherry 강도를 비교하는 산포도. 배경 수준의 형광만을 나타내는 세포는 제거하였다. (e) 다양한 구축물을 사용한 mCherry mRNA 3' 말단부 프로세싱의 정확도를 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다. 스미어가 SV40 폴리-A 부위로 끝나는 mCherry 전사체에 대해 관찰되었고, 이것은 부가된 폴리-A 꼬리의 길이의 변화를 나타낸다. 이와 대조적으로, 예상된 크기 (180-nt)의 규정된 밴드가 mMALAT1_3' 영역으로 끝나는 mCherry에 대해 관찰되었고, 이것은 추가의 뉴클레오티드가 RNase P 프로세싱 후에 부가되지 않음을 나타낸다.
도 16은 MALAT1 삼중 나선으로 끝나는 전사체가 마이크로RNA에 의해 효율적으로 억제됨을 보여준다. HeLa 세포를 지정된 이중 색상 형광 리포터 벡터 (mCherry 하류의 서열을 각각의 플롯에 대해 표시함)로 형질감염시킨 후, 유동 세포 분석을 사용하여 각각의 세포의 미가공 eYFP 및 mCherry 강도를 결정하였다. SV40 폴리아데닐화 신호 (a) 또는 mMALAT1_3' 영역 (b)으로 끝나는 mCherry 전사체. 배경 수준의 형광만을 나타내는 세포를 모든 분석으로부터 제거하고, 제시하였고, 제시하지 않는다.
도 17은 다른 고도로 구조화된 RNA 꼬리가 긴 전사체의 3' 말단부를 안정화할 수 있음을 보여준다. (a) 다른 고도로 구조화된 RNA 꼬리가 긴 cGFP 전사체의 3' 말단부를 안정화하기에 충분할 수 있는지 시험하기 위해, RNase P 절단 부위의 상류의 MALAT1 영역 (삼중 나선을 형성하는 U- 및 A-풍부 모티프 함유)을 잘 특성화된 리보스위치(riboswitch)의 서열로 교체하였다 (Serganov et al. 2004; Klein and Ferre-D'Amare 2006; Montange and Batey 2006; Sudarsan et al. 2008). 제시된 서열은 서열 139이다. mascRNA tRNA-유사 구조는 리보스위치의 3' 말단부의 바로 하류에 존재하므로, RNase P 절단은 생체내에서 리보스위치 서열로 끝나는 성숙 cGFP 전사체를 생성한다. (b) mMALAT1_3' 영역 또는 리보스위치+mascRNA로 끝나는 CMV-cGFP 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP mRNA를 검출하는 노던 블롯 전에 수행하였다. 시험된 5개의 리보스위치 중에서, 단지 티. 텡콘겐시스 (T. tengcongensis) glmS 촉매적 리보스위치 (글루코사민-6 포스페이트를 감지함)만이, MALAT1 삼중 나선보다 훨씬 더 약하지만 cGFP 메시지의 3' 말단부를 안정화시킬 수 있음이 밝혀졌다. (c) 웨스턴 블롯은 티. 텡콘겐시스 glmS 리보스위치가 또한 번역을 약하게 지지함을 나타냈다. 시험된 구조적 모티프는 상기 생체내 발현 시스템이, RNA 전사체의 3' 말단부를 안정화하기에 충분한 RNA 서열을 스크리닝하기 위한 이상적인 방법을 제공함을 보여준다.
도 18은 본 발명의 RNA의 반감기 측정을 보여준다. 상부 패널은 노던 블롯의 사진이고, 하부 패널은 HeLa 세포에서 ~5 hr인, 삼중 나선으로 끝나는 cGFP 전사체의 반감기를 나타내는 데이터의 그래프이다.
도 19는 중간엽 세포에 mRNA를 함유하는 삼중 나선의 번역을 보여주는 모식도 및 그래프이다. (19a) 2색 형광 리포터 발현 시스템의 모식도. (19b) 2색 발현 플라스미드로 마우스 중간엽 줄기 세포를 일시 형질감염시키고, 유동 세포 분석을 사용하여 단일 세포에서 mCherry 및 eYFP 단백질 발현을 측정하였다. 대표적인 실험 (n=3)으로부터 개개의 형질감염된 세포에서 측정된 mCherry 대 eYFP 단백질 발현의 비에 대한 상자 그림이 제시된다 (수평선, 중간값; 상자, 25 내지 75번째 백분위수; 오차 막대, 1.5x 4분위수간 영역). (19c) mCherry가 지정된 바와 같이 SV40 폴리아데닐화 신호 또는 mMALAT1_3' 영역으로 끝나는 이중 색상 벡터로 형질감염된 각각의 세포에 대해 eYFP 및 mCherry 강도를 비교하는 산포도. 배경 수준의 형광만을 나타내는 세포를 제거하였다.
도 20은 삼중 나선이 다수의 상이한 mRNA의 3' 말단부 상에 위치하고 번역을 지지할 수 있음을 보여주는 모식도 및 그래프 세트이다. (20a) L1 mRNA의 모식도 (문헌 [Beck et al. 2011]의 변형). L1 mRNA가 보통 폴리(A)(poly(A)) 꼬리로 끝나지만 (상부, 서열 174로 제시됨), 성숙 L1 전사체가 삼중 나선으로 끝나도록 허용하기 위해 L1 폴리아데닐화 신호가 mMALAT1_3' 영역으로 교체된 추가의 구축물을 생성하였다 (하부). (20b) HeLa 세포를 GFP를 발현하는 대조군 벡터 또는 폴리(A) 꼬리 또는 삼중 나선으로 끝나는 L1 mRNA를 발현하는 에피솜-기반 벡터로 형질감염시켰다. 레인당 15 ㎍의 총 RNA를 사용하는 노던 블롯을 수행하여 L1 mRNA의 발현을 검출하였다. (20c) L1 mRNA의 3' 말단부가 정확하게 생성되었는지 확인하기 위해서, RNase H 소화를 노던 블롯 분석 전에 수행하였다. 단일 밴드가 삼중 나선으로 끝나는 L1 mRNA에 대해 관찰된 반면, 폴리(A) 꼬리로 끝나는 L1 mRNA는 약 300-400 nt에 이르는 스미어를 제시한다. (20d) 웨스턴 블롯을 수행하여 형질감염된 발현 벡터로부터 ORF1 및 ORF2 단백질의 발현을 검출하였다. p110을 로딩 대조군으로서 사용하였다. (20e) 면역형광을 사용하여 형질감염된 HeLa 세포에서 ORF1 및 ORF2 단백질의 발현을 검출하였다.
도 21은 삼중 나선으로 끝나는 시험관내 전사된 GFP mRNA가 시험관내에서 번역될 수 있음을 보여주는 그래프이다. 등몰량의 시험관내 전사된 캡핑된 (5'-m7GpppG) 루시페라제 mRNA를 야생형 효모 추출물 내에서 인큐베이션하였다. 루시페라제 mRNA는 나타낸 바와 같이 그의 3' 말단부에서 폴리(A) 꼬리, 야생형 MALAT1 삼중 나선, 또는 Comp.27 돌연변이체 MALAT1 삼중 나선으로 종결된다. 캡핑된 mRNA의 번역에 의한 평균 루시페라제 활성이 제시된다. 오차 막대는 표준 편차를 나타낸다.
도 1은 MALAT1의 3' 말단부가 고도로 보존되고 RNase P에 의해 절단됨을 보여준다. (a) MALAT1 유전자좌의 3' 말단부에 폴리아데닐화 신호가 존재하지만, MALAT1은 tRNA 생합성 기구에 의해 매개되는 상류 절단 메카니즘을 통해 1차적으로 프로세싱된다. RNase P 절단은 MALAT1의 성숙 3' 말단부 및 mascRNA의 5' 말단부를 동시에 생성한다. tRNA-유사 작은 RNA는 이어서 RNase Z에 의해 절단되고, CCA 부가에 적용된다. 제시된 서열은 서열 70이다. (b) MALAT1 RNase P 절단 부위 (화살표로 표시됨)의 바로 상류에 고도로 진화상 보존된 A-풍부 구역이 존재한다. 보다 상류에는 예측된 스템-루프 구조에 의해 분리된 2개의 거의 완전히 보존된 U-풍부 모티프가 존재한다. 제시된 서열은 상부에서 하부로 서열 71 내지 78이다. (c) 유사한 모티프가 MEN β RNase P 절단 부위의 상류에 존재한다. 제시된 서열은 상부에서 하부로 서열 79 내지 84이다. (d) CMV-cGFP-mMALAT1_3' 센스 발현 플라스미드는 cGFP 오픈 리딩 프레임의 하류에 마우스 MALAT1의 nt 6581-6754를 교체함으로써 생성되었다. 폴리아데닐화 신호는 3' 말단부에 존재하지 않는다. 제시된 서열은 서열 70이다. (e) 플라스미드로 HeLa 세포를 형질감염시킨 후, 노던 블롯을 수행하여 mascRNA 및 cGFPMALAT1_3' RNA의 발현을 검출한다. cGFP MALAT1_3' RNA의 3' 말단부가 정확하게 생성되었고 추가의 뉴클레오티드가 전사 후에 부가되지 않았음을 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다.
도 2는 U-풍부 모티프가 MALAT1의 3' 말단부의 우리딜화 및 분해를 억제함을 보여준다. (a) 본 연구에 사용된 cGFP 발현 플라스미드의 모식도. 제시된 서열은 서열 70이다. 정규 폴리-A 꼬리로 끝나는 cGFP 전사체를 생성하기 위해, mMALAT1_3' 영역을 소 성장 호르몬 (bGH) 또는 SV40 폴리아데닐화 신호 (중앙)로 교체하였다. 핵-보유된 cGFP 전사체를 생성하기 위해, mMALAT1의 nt 1676 내지 3598을 cGFP의 상류에 배치하였다 (하부). (b) 형질감염된 HeLa 세포를 분획화하여 핵 및 세포질 총 RNA를 단리한 후, cGFP ORF에 대한 프로브를 사용한 노던 블롯 분석에 적용하였다. 내인성 MALAT1에 대한 프로브를 분획화 효율에 대한 대조군으로 사용하였다. (c) SpeckleF2-MALAT1_3' 전사체는 핵 내에 효율적으로 보유되었다. (d) 돌연변이 또는 결실 (적색으로 표시됨)을 CMV-cGFP-mMALAT1_3' 발현 플라스미드의 mMALAT1_3' 영역 내에 도입하였다. 제시된 서열은 상부에서 하부로 서열 85 내지 89이다. (e) 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다. (f) 라이게이션-매개된 3' RACE 방법을 사용하여 분해를 겪은 cGFP-MALAT1_3' RNA 전사체의 3' 말단부를 조사하였다. 전사 후에 부가된 뉴클레오티드는 적색으로 표시된다. 제시된 서열은 상부에서 하부로 서열 90 내지 100이다. (g) RNase H 처리, 이어서 노던 블롯팅을 사용하여, cGFP-MALAT1_3' (도 2d에 제시된 comp 14) 전사체가 안정함을 밝혀내었다. 51 nt가 결실되어 Comp. 14 전사체를 생성하기 때문에, 오직 139-nt의 밴드만이 예상된다.
도 3은 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 MALAT1 안정성을 위해 필요하지만 충분하지는 않음을 보여준다. (a) 성숙 Comp.14 전사체 (서열 101)의 3' 말단부의 예측된 2차 구조. 패널 C, D, 및 E에서 돌연변이된 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성은 자주색으로 표시된다. (b) 돌연변이 (적색으로 표시됨)를 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내에 도입하였다. 제시된 서열은 상부에서 하부로 서열 102 내지 111이다. 나선의 원자 구조는 제시된 예측 구조와 상세한 부분에서는 상이할 수 있지만, 2차 구조의 형성은 강하게 지지된다. U-풍부 모티프 2와 A-풍부 구역 사이의 영역만이 제시되지만, 전체 174-nt mMALAT1_3' 영역이 이들 플라스미드에 존재한다. (c-e) 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다.
도 4는 삼중 나선이 MALAT1의 3' 말단부에서 형성됨을 보여준다. (a) 염기 트리플(triple) (파선으로 표시됨)은 성숙 Comp.14 전사체의 3' 말단부에서 형성된다. 제시된 서열은 서열 101이다. 이 구조는 보존된 스템-루프의 배향이 90도 회전된 것을 제외하고 도 3a에 제시된 것과 유사하다. 상기 예측된 구조는 이용가능할 때 원자 구조에서 상세한 부분에서는 상이할 수 있지만, 삼중 나선의 형성은 강하게 지지된다. 패널 E에서 돌연변이된 U-A·U 염기 트리플은 자주색으로 표시된다. (b) U-A·U 및 C-G·C 염기 트리플은 왓슨-크릭(Watson-Crick) 염기쌍 형성 나선의 주요 홈에 대한 후그스틴(Hoogsteen) 수소 결합을 통해 형성된다. (c) 만화 표현에서 MALAT1 Comp.14 3' 말단부의 로제타(Rosetta) 모델. 염기 1 내지 5는 모델링 수렴을 달성하기 위해 포함되지 않는다. 패널 A에서처럼, U-풍부 모티프 1은 초록색으로, U-풍부 모티프 2는 적색으로, A-풍부 구역은 청색으로 표시된다. 나머지 염기는 회색으로 표시된다. (d) 비-결합된 염기 C-11 (패널 A에서와 같이 넘버링됨)을 둘러싸는 삼중 나선의 근접도. 염기는 왓슨-크릭 수소 결합 (흑색), 후그스틴 수소 결합 (적색)과 함께 막대 형태로 제시된다. (e) 4개의 U-A·U 염기 트리플은 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내의 C-G·C 염기 트리플로 점진적으로 전환되었다. 각각의 구축물의 명칭에서, *은 후그스틴 수소 결합을 나타낸다. 이어서, 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 웨스턴 블롯을 수행하여 cGFP 단백질 발현을 검출하였다. 빈쿨린(Vinculin)을 로딩 대조군으로 사용하였다. (f) 돌연변이 (적색으로 표시됨)를 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내에 도입하였다. U-풍부 모티프 1 주위의 영역만이 제시되었지만, 전체 174-nt mMALAT1_3' 영역이 이들 플라스미드에 존재하였다. 각각의 전사체의 5' 말단부가 우측에 존재하여 패널 A 내의 구조와 직접적인 비교가 가능함을 유의한다. 제시된 서열은 상부에서 하부로 서열 112 내지 117이다. 이어서, WT 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다.
도 5는 MALAT1 삼중 나선이 번역 인핸서 요소로 기능함을 보여준다. (a) 지정된 3' 말단부 서열로 끝나는 cGFP 전사체를 발현하는 플라스미드로 HeLa 세포를 형질감염시켰다. mMALAT1_3' 영역 및 폴리아데닐화 신호를 나타낸 바와 같은 센스 또는 안티센스 방향으로 삽입하였다. 웨스턴 블롯을 수행하여 cGFP 단백질 발현을 수행하였다. 빈쿨린을 로딩 대조군으로 사용하였다. (b) 2색 형광 리포터 발현 시스템의 모식도. (c) 2색 발현 플라스미드로 HeLa 세포를 형질감염시키고, 유동 세포 분석을 사용하여 단일 세포에서 mCherry 및 eYFP 단백질 발현을 측정하였다. 대표적인 실험 (n=3)으로부터 개개의 형질감염된 세포에서 측정된 mCherry 대 eYFP 단백질 발현의 비에 대한 상자 그림이 제시된다 (수평선, 중간값; 상자, 25 내지 75번째 백분위수; 오차 막대, 1.5x 4분위수간 영역). (d) QPCR을 사용하여 2색 발현 플라스미드로 형질감염된 세포 집단에서 mCherry mRNA 대 eYFP mRNA의 비를 측정하였다. 데이터를 폴리아데닐화된 구축물에 대해 정규화하고, 3개의 독립 실험의 평균 및 표준 편차로서 제시한다. (e) 돌연변이 또는 결실 (적색으로 표시됨)을 CMV-cGFP-mMALAT1_3' 발현 플라스미드의 mMALAT1_3' 영역 내로 도입하였다. 제시된 서열은 상부에서 하부로 서열 85, 및 118 내지 122이다. (f) 이어서, 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다. (g) 웨스턴 블롯팅을 사용하여 형질감염된 HeLa 세포에서 cGFP 발현을 검출하였다. (h) 형질감염된 HeLa 세포를 분획화하여 핵 및 세포질 총 RNA를 단리한 후, 노던 블롯 분석에 적용하였다. (i) 번역을 촉진하는 기능을 하는 뉴클레오티드 (자주색으로 표시됨)는 MALAT1의 3' 말단부에서 삼중 나선 영역의 측면에 존재한다. 제시된 서열은 서열 101이다.
도 6은 리보솜 풋프린트가 마우스 배아 줄기 세포에서 MALAT1의 5' 말단부 근처에서 관찰됨을 보여준다. 문헌 [Ingolia et al. 2011]에 의해 결정된 마우스 배양체 및 마우스 배아 줄기 세포 (백혈병 억제 인자 (LIF)의 존재 또는 부재 하에 성장된)에서 MALAT1의 mRNA-seq 및 리보솜 흔적 프로파일이 제시된다. MALAT1 전사 개시 부위는 도면의 우측에 화살표로 표시된다.
도 7은 MALAT1 삼중 나선으로 끝나는 전사체가 생체내에서 마이크로RNA에 의해 효율적으로 억제됨을 보여준다. (a) let-7에 완전히 상보성인 서열 또는 2개의 튀어나온 let-7 결합 부위가 mCherry의 3' UTR 내로 삽입되었다. let-7 마이크로RNA 서열은 청색으로 제시된다. 제시된 서열은 상부에서 하부로 서열 123 내지 125이고, 서열 124는 2회 반복된다. (b) HeLa 세포를, (0x로 표시함) 마이크로RNA 결합 부위가 존재하거나 존재하지 않는, SV40 폴리아데닐화 신호 또는 mMALAT1_3' 영역으로 끝나는 2색 형광 리포터 플라스미드로 형질감염시켰다. 또한, 40 nM의 대조군 siRNA 또는 외인성 let-7 마이크로RNA를 나타낸 바와 같이 동시-형질감염시켰다. 이어서, 유동 세포 분석을 사용하여 mCherry 및 eYFP 단백질 수준을 측정하였다. 상대적인 억제 배수는 비-표적화된 (0x) 리포터에 대한 동등한 비로 정규화된, 표적화된 구축물의 평균 mCherry 대 평균 eYFP 신호의 비로서 계산하였다. 데이터는 3개의 독립 실험의 평균 및 표준 편차로서 제시한다. (c) QPCR을 사용하여 세포 집단에 걸친 mCherry 및 eYFP 전사체 수준을 측정하고, mCherry RNA 발현의 상대적인 억제 배수를 상기와 유사하게 계산하였다. 데이터는 3개의 독립 실험의 평균 및 표준 편차로서 제시한다.
도 8은 구조적으로 불안정한 mascRNA 돌연변이체가 생체내 분해를 위해 그의 3' 말단부에서 표지됨을 보여준다. (a) 그의 5' 말단부에 GG를 갖고 불안정한 수용자 스템을 함유하는 tRNA (및 tRNA-유사 전사체)가 CCA-부가 효소에 의한 CCACCA의 부가에 의해 신속한 분해를 위해 표적화됨이 밝혀졌다 (Wilusz et al. 2011). 제시된 서열은 둘 다 서열 126이다. 정제된 CCA-부가 효소의 사용은 수용자 스템에 4개의 돌연변이 (적색으로 표시됨)의 도입을 통해 mascRNA를 시험관내에서 CCA로부터 CCACCA 표적으로 전환하는 것을 허용하였다 (Mut 10 전사체 생성). 이와 대조적으로, 불안정한 수용자 스템을 갖지만 그의 5' 말단부에 GA를 갖는 mascRNA 돌연변이체 (Mut 7)는 시험관내에서 CCA 표적을 유지하였다. 생체내에서 CCACCA 부가를 위한 이들 서열 요건을 확인하기 위해, 이들 2개의 돌연변이체 mascRNA 전사체를 발현하는 CMV-cGFP-mMALAT1_3' 플라스미드를 생성하였다. (b) 야생형 (WT) 또는 돌연변이체 발현 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 사용하여 mascRNA 및 cGFP-MALAT1_3' RNA의 발현을 검출하였다. cGFP-MALAT1_3' RNA가 두 돌연변이체 플라스미드로부터 효율적으로 생산되었기 때문에 mascRNA 돌연변이는 RNase P 절단에 영향을 주었다 (하부). 이와 대조적으로, 어떤 돌연변이체 mascRNA 전사체도 노던 블롯 분석에 의해 검출가능하지 않았고 (상부), 이것은 둘 다가 RNase P 절단 후에 효율적으로 분해되었음을 나타낸다. (c) 라이게이션-기반 3' RACE PCR 방법을 수행함으로써, CCACC(A)가 생체내에서 mascRNA Mut 10 전사체에 부가됨이 밝혀졌다. 전사 후에 부가된 뉴클레오티드는 적색으로 표시된다. 제시된 서열은 상부에서 하부로 서열 127 내지 131이다. (d) 대조적으로 및 선행 시험관내 결과 (Wilusz et al. 2011)와 일치하게, CCACCA로 끝나는 어떠한 mascRNA Mut 7 전사체도 검출되지 않았다. 그 대신에, Mut 7 전사체의 3' 말단부에 부가된 짧은 U-풍부 꼬리가 종종 관찰되었고, 이것은 분해 과정에서의 우리딜화를 시사한다. 제시된 서열은 상부에서 하부로 서열 132 내지 138이다. 일부 RACE 클론에 대해, U-풍부 꼬리는 수용자 스템 내에서 시작하였고, 이것은 3'-5' 엑소뉴클레아제가 상기 이중 가닥 영역 내에서 멈출 가능성이 있고 엑소뉴클레아제가 인식하여 붕괴 과정을 재시작하기 위한 새로운 단일 가닥 꼬리를 제공하기 위해 U-풍부 꼬리가 부가됨을 나타낸다. 이것은 짧은 단일 가닥 꼬리가 생체내에서 증식 메카니즘에 의해 구조적으로 불안정한 tRNA 및 tRNA-유사 전사체의 3' 말단부에 부가되어 전사체 분해를 야기함을 보여준다.
도 9는 MALAT1 tRNA-유사 구조가 RNase P 동원 및 생체내 mascRNA 생합성을 위해 충분함을 보여준다. (a) CMV-유도 전사체로부터 mascRNA 생합성을 위해 요구되는 최소 서열 요소를 확인하기 위해, 점진적인 결실을 CMV-cGFP-mMALAT1_3' 발현 플라스미드 내에 도입하였다 (상부). cGFP 오픈 리딩 프레임을 먼저 제거하여 CMV-mMALAT1_3' 발현 플라스미드를 생성하였다 (중앙). 상기 플라스미드는 여전히 완전한 174-nt mMALAT1_3' 단편 (nt 6581-6754)를 함유하고, 따라서 RNase P 절단 부위 상류에 U- 및 A-풍부 모티프를 포함한다. 이어서 mascRNA tRNA-유사 구조 그 자체가 mascRNA 생합성을 위해 충분하지 결정하기 위해서, MALAT1 RNase P 절단 부위 상류의 영역을 비관련 12-nt 서열로 교체하여, CMV-리더-mmascRNA 발현 플라스미드를 생성하였다 (하부). 12-nt 서열은 에스. 세레비지아에 (S. cerevisiae) 프리-tRNA(Tyr)로부터의 5' 리더이다. 각각의 플라스미드에 대한 안티센스 대조군 (미제시)은 MALAT1/mascRNA 영역을 안티센스 배향으로 배치함으로써 생성되었다. 제시된 서열은 상부에서 하부로 서열 139, 139, 및 140이다. (b) 발현 플라스미드로 HeLa 세포를 형질감염시키고, 총 RNA를 24 hr 후에 단리하였다. 이어서, 노던 블롯을 수행하여 mascRNA 발현을 검출하였다. U6 snRNA를 로딩 대조군으로 사용하였다. mascRNA가 3개의 모든 센스 플라스미드로부터 생산되었기 때문에, 이것은 생체내에서 mascRNA 생성을 위해 요구되는 MALAT1의 유일한 영역이 tRNA-유사 구조 자체임을 보여준다.
도 10은 MEN β의 3' 말단부가 RNase P에 의해 절단되고 효율적인 번역을 지지함을 보여준다. (a) 사용된 발현 플라스미드의 모식도. cGFP 오픈 리딩 프레임의 하류에 mMALAT1_3' 영역 (상부), SV40 또는 bGH 폴리아데닐화 신호 (중앙), 또는 MEN β tRNA-유사 구조 및 보존된 상류 U- 및 A-풍부 모티프를 포함하는 마우스 MEN β 유전자좌의 3' 말단부로부터의 174-nt 영역 (하부)이 삽입되었다. 제시된 서열은 둘 다 서열 139이다. (b) 플라스미드로 HeLa 세포를 형질감염시킨 후, 노던 블롯을 수행하여 mascRNA 및 cGFP mRNA의 발현을 검출하였다. 다양한 구축물을 사용한 cGFP mRNA 3' 말단부 프로세싱의 정확성을 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다. 스미어가 SV40 또는 bGH 폴리-A 부위로 끝나는 cGFP 전사체에 대해 관찰되었고, 이것은 부가된 폴리-A 꼬리의 길이의 변화를 나타낸다. 이와 대조적으로, 예상된 크기 (190-nt)의 규정된 밴드가 MALAT1 또는 MEN β의 3' 말단부로 끝나는 cGFP 전사체에 대해 관찰되었고, 이것은 추가의 뉴클레오티드가 RNase P 절단 후에 부가되지 않음을 나타낸다. (c) 웨스턴 블롯을 수행하여 형질감염된 플라스미드로부터 cGFP 단백질 발현을 검출하였다. 빈쿨린을 로딩 대조군으로 사용하였다. 결과는 MALAT1 및 MEN β의 3' 말단부가 유사한 수준의 번역을 지지함을 보여준다.
도 11은 U- 및 A-풍부 모티프가 핵 내에서 MALAT1의 3' 말단부를 안정화시키기 위해 중대함을 보여준다. (a) U-풍부 모티프 1, U-풍부 모티프 2, 또는 A-풍부 구역 내의 돌연변이 (적색으로 표시됨)를 도 2c에 제시된 핵-보유된 긴 전사체를 생성하는 CMV-SpeckleF2-mMALAT1_3' 발현 플라스미드 내에 도입하였다. 제시된 서열은 상부에서 하부로 서열 85, 86, 141, 및 142이다. (b) 야생형 (WT) 또는 돌연변이체 CMV-SpeckleF2-mMALAT1_3' 발현 플라스미드로 HeLa 세포를 형질감염시켰다. 대조군으로서, CMV-cGFP-mMALAT1_3' 발현 플라스미드를 또한 사용하였다 (레인 2). 이어서, 노던 블롯을 수행하여 mascRNA 및 SpeckleF2-MALAT1_3' 전사체 (또는 레인 2의 cGFP-MALAT1_3' 전사체)를 검출하였다. 긴 SpeckleF2-MALAT1_3' 전사체의 3' 말단부가 정확하게 생성되고 추가의 뉴클레오티드가 전사 후에 부가되지 않았음을 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다. SpeckleF2-MALAT1_3' 돌연변이체 전사체가 노던 분석에 의해 비검출가능하였기 때문에, 본 발명자들은 U- 및 A-풍부 모티프 둘 다가 핵에서 MALAT1의 안정화를 위해 필요하다고 결론지었다. (c) 라이게이션-매개 3' RACE 방법을 사용하여 분해를 겪는 SpeckleF2-MALAT1_3' 전사체의 3' 말단부를 조사하였다. 우리딜화된 붕괴 중간체를 나타내는 3개의 클론 (서열결정된 15개 중에서)이 검출되었고, 이것은 우리딜화가 또한 핵에서 발생함을 시사한다. 제시된 서열은 상부에서 하부로 서열 85 및 143 내지 145이다. 흥미롭게도, 이들 3개의 우리딜화된 전사체는 짧은 U-꼬리의 부가 전에 3' 말단부로부터 유의하게 분해되었다.
도 12는 MALAT1의 3' 말단부의 모티프들이 전사체 안정성을 보장하기 위해 협력함을 시사하는 돌연변이 분석을 보여준다. (a) MALAT1의 3' 말단부 영역에 다양한 결실을 함유하는 CMV-cGFP-mMALAT1_3' 발현 플라스미드를 생성하였다. *는 각각의 구축물에서 결실된 뉴클레오티드를 나타낸다. 제시된 서열은 상부에서 하부로 서열 146 내지 160이다. (b) 복합 돌연변이를 함유하는 다양한 CMV-cGFP-mMALAT1_3' 플라스미드로 HeLa 세포를 형질감염시키고, 총 RNA를 24 hr 후에 단리하였다. 이어서, 노던 블롯을 수행하여 mascRNA 또는 cGFP-MALAT1의 발현을 검출하였다. 각각의 구축물에 대해 RNase P 프로세싱의 정확도를 입증하기 위해 cGFP-MALAT1 RNA에 대한 노던 블롯 분석 전에 RNase H 소화를 수행하였다. 흥미롭게도, cGFP-MALAT1_3' 전사체는 안정하였고, 이것은 보존된 스템-루프의 10 nt만이 RNA 안정성을 위해 요구됨을 시사한다. 그러나, Comp.1 전사체로부터 추가의 뉴클레오티드를 결실시키기 위해 시도할 때 (Comp.2, Comp.3, Comp.4, 또는 Comp.5를 생성하기 위해), cGFP-MALAT1_3' 전사체는 불안정하게 되었다. 그럼에도 불구하고, 18개 이상의 뉴클레오티드가 보존된 스템-루프 (Comp.12)에 존재하면, 추가의 뉴클레오티드를 MALAT1의 3' 말단부의 다른 부분으로부터 결실될 수 있다. 보존된 스템-루프 내 및 U-풍부 모티프 2와 A-풍부 구역 사이의 영역 내의 뉴클레오티드는 아마도 구조적 안정성의 역치에 도달함을 보장함으로써 MALAT1 RNA 안정성을 보장하기 위해 크게 협력하는 것으로 밝혀졌다. 그러나, 삼중 나선 형성이 MALAT1 3' 말단부 안정성을 보장하는대 훨씬 더 중대한 역할을 하는 것을 언급하는 것은 중요하다.
도 13은 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 MALAT1의 3' 말단부를 안정화하는데 필요함을 보여준다. (a) U-풍부 모티프 2 내의 돌연변이를 CMV-cGFP-mMALAT1_3' 플라스미드 내로 도입하여 U-풍부 모티프 2와 A-풍부 구역 사이의 선택된 염기쌍 형성을 붕괴시켰다. U-풍부 모티프 2만이 제시되었지만, 전체 174-nt mMALAT1_3' 영역이 존재하였다. mMALAT1_3' Comp.14의 2차 구조 예측에서, 패널 B의 각각의 레인에서 돌연변이된 뉴클레오티드는 자주색으로 표시된다. 제시된 서열은 상부에서 하부로 서열 161 내지 168 및 101이다. (b) 야생형 (WT) 또는 돌연변이체 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP-MALAT1_3' RNA를 검출하는 노던 블롯 전에 수행하였다. MALAT1 3' 말단부로부터 가장 먼 U-A 염기쌍 형성을 제외하고 (Mut U2.5, 레인 9), U-풍부 모티프 2와 A-풍부 구역 사이의 모든 염기쌍 형성은 생체내에서 MALAT1 3' 말단부를 안정화하는데 유의한 역할을 수행한다.
도 14는 MALAT1 3' 말단부의 구조적 모델링을 보여준다. (a) 전장 (nt 1 내지 59) MALAT1 Comp.14 3' 말단부의 5개의 개별적인 모델의 중첩. 모델은 만화 표현으로 제시되고, 청색, 적색, 초록색, 오렌지색, 및 자홍색으로 채색된다. (b) 청색으로 채색된 모델의 5' 말단부의 근접도 (패널 A로부터). 삼중 나선의 제1 염기 트리플은 그의 왓슨-크릭 및 후그스틴 염기쌍 형성을 통해 표시된다. G-5와 A-45 사이의 가능한 수소 결합은 오렌지색으로 제시되고, U-풍부 모티프 2와 A-풍부 구역 사이의 루프를 통한 상기 영역의 5' 말단부의 안정화 가능성을 강조한다. (c) 로제타 신생 RNA 폴딩에 의해 생성된 2,000 MALAT1 Comp.14 3' 말단부 모델 (nt 1-5가 결여된)의 산포도. 도면은 X-축에 참조 모델까지의 모든 모델의 거리 (Å 단위)를, Y-축에 개별 구조의 점수를 보여준다.
도 15는 MALAT1 삼중 나선이 효율적인 단백질 번역을 지지함을 보여준다. (a) HeLa 세포를 지정된 이중 색상 형광 리포터 벡터 (mCherry 하류의 서열을 각각의 플롯에 대해 표시함)로 형질감염시킨 후, 유동 세포 분석을 사용하여 각각의 세포의 미가공 eYFP 및 mCherry 강도를 결정하였다. 모의 형질감염된 샘플은 관찰된 eYFP 및 mCherry의 배경 (자가형광) 수준을 보여준다. 모든 후속 분석에서, 배경 수준의 형광을 나타내는 세포를 물질 및 방법에서 설명되는 바와 같이 제거하였다. (b-d) mCherry가 지정된 바와 같이 SV40 폴리아데닐화 신호 또는 WT/돌연변이체 mMALAT1_3' 영역으로 끝나는 이중 색상 벡터로 형질감염된 각각의 세포에 대해 eYFP 및 mCherry 강도를 비교하는 산포도. 배경 수준의 형광만을 나타내는 세포는 제거하였다. (e) 다양한 구축물을 사용한 mCherry mRNA 3' 말단부 프로세싱의 정확도를 확인하기 위해, RNase H 소화를 노던 블롯 분석 전에 수행하였다. 스미어가 SV40 폴리-A 부위로 끝나는 mCherry 전사체에 대해 관찰되었고, 이것은 부가된 폴리-A 꼬리의 길이의 변화를 나타낸다. 이와 대조적으로, 예상된 크기 (180-nt)의 규정된 밴드가 mMALAT1_3' 영역으로 끝나는 mCherry에 대해 관찰되었고, 이것은 추가의 뉴클레오티드가 RNase P 프로세싱 후에 부가되지 않음을 나타낸다.
도 16은 MALAT1 삼중 나선으로 끝나는 전사체가 마이크로RNA에 의해 효율적으로 억제됨을 보여준다. HeLa 세포를 지정된 이중 색상 형광 리포터 벡터 (mCherry 하류의 서열을 각각의 플롯에 대해 표시함)로 형질감염시킨 후, 유동 세포 분석을 사용하여 각각의 세포의 미가공 eYFP 및 mCherry 강도를 결정하였다. SV40 폴리아데닐화 신호 (a) 또는 mMALAT1_3' 영역 (b)으로 끝나는 mCherry 전사체. 배경 수준의 형광만을 나타내는 세포를 모든 분석으로부터 제거하고, 제시하였고, 제시하지 않는다.
도 17은 다른 고도로 구조화된 RNA 꼬리가 긴 전사체의 3' 말단부를 안정화할 수 있음을 보여준다. (a) 다른 고도로 구조화된 RNA 꼬리가 긴 cGFP 전사체의 3' 말단부를 안정화하기에 충분할 수 있는지 시험하기 위해, RNase P 절단 부위의 상류의 MALAT1 영역 (삼중 나선을 형성하는 U- 및 A-풍부 모티프 함유)을 잘 특성화된 리보스위치(riboswitch)의 서열로 교체하였다 (Serganov et al. 2004; Klein and Ferre-D'Amare 2006; Montange and Batey 2006; Sudarsan et al. 2008). 제시된 서열은 서열 139이다. mascRNA tRNA-유사 구조는 리보스위치의 3' 말단부의 바로 하류에 존재하므로, RNase P 절단은 생체내에서 리보스위치 서열로 끝나는 성숙 cGFP 전사체를 생성한다. (b) mMALAT1_3' 영역 또는 리보스위치+mascRNA로 끝나는 CMV-cGFP 플라스미드로 HeLa 세포를 형질감염시키고, 노던 블롯을 수행하였다. RNase H 처리는 cGFP mRNA를 검출하는 노던 블롯 전에 수행하였다. 시험된 5개의 리보스위치 중에서, 단지 티. 텡콘겐시스 (T. tengcongensis) glmS 촉매적 리보스위치 (글루코사민-6 포스페이트를 감지함)만이, MALAT1 삼중 나선보다 훨씬 더 약하지만 cGFP 메시지의 3' 말단부를 안정화시킬 수 있음이 밝혀졌다. (c) 웨스턴 블롯은 티. 텡콘겐시스 glmS 리보스위치가 또한 번역을 약하게 지지함을 나타냈다. 시험된 구조적 모티프는 상기 생체내 발현 시스템이, RNA 전사체의 3' 말단부를 안정화하기에 충분한 RNA 서열을 스크리닝하기 위한 이상적인 방법을 제공함을 보여준다.
도 18은 본 발명의 RNA의 반감기 측정을 보여준다. 상부 패널은 노던 블롯의 사진이고, 하부 패널은 HeLa 세포에서 ~5 hr인, 삼중 나선으로 끝나는 cGFP 전사체의 반감기를 나타내는 데이터의 그래프이다.
도 19는 중간엽 세포에 mRNA를 함유하는 삼중 나선의 번역을 보여주는 모식도 및 그래프이다. (19a) 2색 형광 리포터 발현 시스템의 모식도. (19b) 2색 발현 플라스미드로 마우스 중간엽 줄기 세포를 일시 형질감염시키고, 유동 세포 분석을 사용하여 단일 세포에서 mCherry 및 eYFP 단백질 발현을 측정하였다. 대표적인 실험 (n=3)으로부터 개개의 형질감염된 세포에서 측정된 mCherry 대 eYFP 단백질 발현의 비에 대한 상자 그림이 제시된다 (수평선, 중간값; 상자, 25 내지 75번째 백분위수; 오차 막대, 1.5x 4분위수간 영역). (19c) mCherry가 지정된 바와 같이 SV40 폴리아데닐화 신호 또는 mMALAT1_3' 영역으로 끝나는 이중 색상 벡터로 형질감염된 각각의 세포에 대해 eYFP 및 mCherry 강도를 비교하는 산포도. 배경 수준의 형광만을 나타내는 세포를 제거하였다.
도 20은 삼중 나선이 다수의 상이한 mRNA의 3' 말단부 상에 위치하고 번역을 지지할 수 있음을 보여주는 모식도 및 그래프 세트이다. (20a) L1 mRNA의 모식도 (문헌 [Beck et al. 2011]의 변형). L1 mRNA가 보통 폴리(A)(poly(A)) 꼬리로 끝나지만 (상부, 서열 174로 제시됨), 성숙 L1 전사체가 삼중 나선으로 끝나도록 허용하기 위해 L1 폴리아데닐화 신호가 mMALAT1_3' 영역으로 교체된 추가의 구축물을 생성하였다 (하부). (20b) HeLa 세포를 GFP를 발현하는 대조군 벡터 또는 폴리(A) 꼬리 또는 삼중 나선으로 끝나는 L1 mRNA를 발현하는 에피솜-기반 벡터로 형질감염시켰다. 레인당 15 ㎍의 총 RNA를 사용하는 노던 블롯을 수행하여 L1 mRNA의 발현을 검출하였다. (20c) L1 mRNA의 3' 말단부가 정확하게 생성되었는지 확인하기 위해서, RNase H 소화를 노던 블롯 분석 전에 수행하였다. 단일 밴드가 삼중 나선으로 끝나는 L1 mRNA에 대해 관찰된 반면, 폴리(A) 꼬리로 끝나는 L1 mRNA는 약 300-400 nt에 이르는 스미어를 제시한다. (20d) 웨스턴 블롯을 수행하여 형질감염된 발현 벡터로부터 ORF1 및 ORF2 단백질의 발현을 검출하였다. p110을 로딩 대조군으로서 사용하였다. (20e) 면역형광을 사용하여 형질감염된 HeLa 세포에서 ORF1 및 ORF2 단백질의 발현을 검출하였다.
도 21은 삼중 나선으로 끝나는 시험관내 전사된 GFP mRNA가 시험관내에서 번역될 수 있음을 보여주는 그래프이다. 등몰량의 시험관내 전사된 캡핑된 (5'-m7GpppG) 루시페라제 mRNA를 야생형 효모 추출물 내에서 인큐베이션하였다. 루시페라제 mRNA는 나타낸 바와 같이 그의 3' 말단부에서 폴리(A) 꼬리, 야생형 MALAT1 삼중 나선, 또는 Comp.27 돌연변이체 MALAT1 삼중 나선으로 종결된다. 캡핑된 mRNA의 번역에 의한 평균 루시페라제 활성이 제시된다. 오차 막대는 표준 편차를 나타낸다.
통상적으로, 긴 RNA 폴리머라제 II 전사체는 RNA 안정성 및 효율적인 단백질 번역을 위해 요구되는, 전사 후에 부가된 폴리아데닐화 (폴리-A) 꼬리로 끝난다. 폴리-A 꼬리가 존재하지 않을 때, 전사체는 일반적으로 신속하게 세포에서 분해된다. 폴리-A 꼬리가 결여되지만 안정하고 효율적으로 번역되는 전사체를 생성하는 방법이 본원에서 설명된다. 본 발명은 적어도 부분적으로는, RNA의 폴리-A 꼬리가 폴리-A 꼬리의 부재 하에 RNA의 안정성을 향상시키고 일부 경우에 심지어 RNA에서 코딩되는 단백질의 번역을 향상시키는 기능성 말단 도메인 또는 서열로 교체될 수 있다는 발견을 기초로 한다.
예를 들어, RNA로 전사될 때 삼중 나선 구조, 이어서 tRNA-유사 구조로 폴딩되는 MALAT1 긴 비코딩 RNA 및 MEN β 긴 비코딩 RNA로부터 유래된 서열, 및 그의 돌연변이 및 변형체의 사용은 본원에서 제공되는 실시예에서 제시된다. MALAT1 유전자좌는 많은 인간 암에서 오조절되고, 풍부한 긴 핵-보유된 비코딩 RNA를 생산한다. RNA 폴리머라제 II에 의해 전사됨에도 불구하고, MALAT1의 3' 말단부는 표준 절단/폴리아데닐화에 의해 생산되지 않고, 대신에 RNase P에 의한 tRNA-유사 구조의 인식 및 절단에 의해 생산된다. 따라서, 성숙 MALAT1은 폴리-A 꼬리가 결여되지만, 생체내에서 많은 단백질-코딩 유전자보다 더 높은 수준으로 발현된다. tRNA-유사 구조는 엔도뉴클레아제 RNase P에 의해 인식되고 그의 5' 말단부에서 효율적으로 절단되어, 생체내에서 그의 3' 말단부에 폴리-A가 아니라 삼중 나선을 갖는 성숙 전사체를 생성한다.
RNase P에 의한 절단은 ~6.7-kb MALAT1 비코딩 RNA의 성숙 3' 말단부 및 작은 tRNA-유사 전사체의 5' 말단부를 동시에 생성한다 (도 1a). 성숙 MALAT1 전사체는 그의 3' 말단부에 짧은 A-풍부 구역을 갖는다 (Wilusz et al. 2008; Wilusz and Spector 2010). 전사 후에 부가되기보다는, 폴리아데닐화 동안 발생하기 때문에, MALAT1 폴리-A 꼬리-유사 모이어티는 게놈, 따라서 신생 전사체의 일부에서 코딩된다 (도 1a). 인간에서 어류에 이르기까지, 상기 A-풍부 모티프는 2개의 상류 U-풍부 모티프 및 스템-루프 구조와 함께 진화상 고도로 보존된다 (도 1b). 유사한 고도로 보존된 A- 및 U-풍부 모티프는 RNase P에 의해 그의 3' 말단부에서 또한 프로세싱되는 NEAT1_2로도 알려진 MEN β 긴 핵-보유된 비코딩 RNA의 3' 말단부에 존재한다 (Sunwoo et al. 2009) (도 1c). 그러나, MALAT1 및 MEN β의 3' 말단부가 보호되어 전사체가 높은 수준으로 축적하도록 하는 이들 모티프의 기능 및 분자 메카니즘은 본 발명 이전에 알려지지 않았다.
일부 측면에서, 본 발명은 하이브리드 RNA, RNA를 발현하기 위한 발현 벡터 및 그의 사용 방법에 관한 것이다. 하이브리드 RNA는 예를 들어 그의 3' 말단부에 삼중 나선 구조를 형성하는 고도로 보존된 A- 및 U-풍부 모티프를 사용하여 생체내에서 MALAT1 3' 말단부 프로세싱을 효과적으로 재현한다. 삼중 나선의 형성은 RNase P 프로세싱 또는 mascRNA 생합성에 영향을 주지 않지만, 3'-5' 엑소뉴클레아제로부터 MALAT1의 3' 말단부를 보호하기 위해 중요하다. 놀랍게도, MALAT1 또는 MEN β의 3' 말단부가 실시예에서 제시되는 바와 같이 오픈 리딩 프레임의 하류에 위치할 때, 전사체는 폴리-A 꼬리의 부재에도 불구하고 생체내에서 효율적으로 번역되었다. 따라서, 삼중 나선 구조는 RNA 안정성 및 번역을 모두 강하게 촉진하고, 이것은 이들 긴 비코딩 RNA가 단백질 합성 기구와 상호작용하거나 또는 심지어 특정 조건 하에 번역될 수 있음을 시사한다. 또한, RNA 안정성 및 번역 제어 기능이 분리될 수 있음을 밝히기 위해 돌연변이 분석을 사용하였다. 상기 발현 시스템은 생체내에서 폴리-A 꼬리가 결여된 안정한 전사체를 생성하기 위한 특유한 방법을 제공하기 때문에, 본 발명자들은 마이크로RNA-매개된 억제에서 폴리-A 꼬리의 역할을 조사하였다. 이들 및 다른 조사 방법은 본 발명에 포함된다. 이들 결과는 폴리-A 꼬리가 결여된 MALAT1, MEN β, 및 유사한 다른 전사체가 어떻게 안정화되고, 조절되고, 따라서 중요한 세포 기능을 수행할 수 있는지에 대한 중요한 새로운 통찰력을 제공한다.
삼중 나선 구조는 생체내에서 성숙 비-폴리-A RNA의 3' 말단부를 효율적으로 안정화하기에 충분하다. 또한, 삼중 나선으로 끝나는 전사체는 효율적으로 번역되어 생체내에서 단백질을 생산한다. 말단 서열 또는 도메인은 폴리-A 꼬리가 결여된 다양한 안정한 RNA 분자를 구축하기 위해 사용될 수 있다. 이들 안정한 RNA 분자는 발현 벡터로부터 생체내에서 생산될 수 있다. 하기 실시예에서 예시되는 바와 같이, 전사된 RNA는 이어서 세포질로 전달되고, 단백질을 효율적으로 생산한다. 일부 경우에, 핵 RNA가 본 발명에 따라 사용된다. 이 경우에, RNA는 그 내에서 기능성인 핵에 계속 남아있다.
tRNA-유사 구조/RNase P 절단 부위의 상류의 서열은 임의의 다른 서열로 교체될 수 있기 때문에, 본 발명의 방법은 그의 3' 말단부에 임의의 요구되는 서열을 갖는 성숙 RNA를 생성하기 위해 사용될 수 있다. 이들 서열은 예를 들어 특정 자극에 반응하여 RNA 안정성 및/또는 번역을 조절하여 조절된 유전자 발현을 유도할 수 있다. 본원에서 설명되는 방법 및 구축물을 통해, 폴리-A 꼬리의 효과, 및 대체 발현 메카니즘 및 일부 경우에 생체내 조절된 발현 메카니즘의 설계를 연구할 수 있다.
따라서, 본 발명은 일부 실시양태에서 이종 RNA 안정화 말단 서열에 연결된 RNA 분자로 이루어진 하이브리드 핵산이다. RNA 분자는 천연 발생 또는 합성 RNA의 임의의 형태일 수 있지만, 폴리-A 꼬리가 결여된다. 본원에서 사용될 때 폴리-A 꼬리는 8, 9, 10, 11, 12개 또는 그 초과의 연속적인 A의 핵산을 의미한다. 일반적으로, 핵으로부터 세포질로 수송되는 RNA, 즉 세포질 RNA는 폴리-A 꼬리를 포함한다. 폴리-A 꼬리가 없는 RNA는 고도로 불안정하다. 폴리-A 꼬리를 본 발명의 말단 서열로 교체함으로써, RNA는 안정화되고 번역이 향상되어, RNA로부터 특이적 단백질의 생산을 유도한다. RNA 분자는 예를 들어 mRNA 또는 비코딩 RNA 및 세포질 및 핵 RNA를 포함한다. mRNA는 일반적으로 단백질에 상응한다. 본 발명의 방법의 목적에 따라, RNA에 상응하는 단백질은 치료적 또는 진단적 단백질 또는 리포터 또는 다른 연구용 단백질, 예컨대 녹색 형광 단백질일 수 있다.
RNA 분자는 임의의 종류의 종 또는 유기체로부터의 RNA 분자에 상응하고 그의 임의의 화학적 또는 천연 변형을 포함하는 RNA 분자일 수 있다. 예를 들어, RNA는 진핵 RNA, 포유동물 RNA, 식물 RNA 또는 보다 구체적으로 인간 RNA일 수 있다. RNA의 특정 종류는 RNA의 용도에 따라 상이할 것이다. 예를 들어, RNA가 포유동물 세포에서 특정 단백질의 발현 효과를 연구하기 위해 사용될 경우, RNA는 포유동물의 종류에 상응할 수 있다. 다른 상황에서, RNA는 치료 목적을 위해 생체내에서 인간에서 발현될 수 있다. 이 경우에, 인간 RNA를 발현하는 것이 바람직하다.
화학적 및 천연 변형은 관련 기술분야에 널리 공지되어 있다. 상기 변형은 예를 들어 표적 가닥에 대한 결합을 증가시키기 위해 (즉, 그의 융점을 증가시키기 위해), 올리고뉴클레오티드 또는 올리고뉴클레오티드-표적 복합체의 확인을 돕기 위해, 세포 투과를 증가시키기 위해, 뉴클레아제 및 올리고뉴클레오티드의 구조 또는 활성을 분해하거나 저해하는 다른 효소에 대해 안정화하기 위해, 표적에 서열 특이적으로 결합한 후 붕괴 방식 (종료 이벤트)을 제공하기 위해, 및 올리고뉴클레오티드의 약동학적 특성을 개선하기 위해 설계된 변형을 포함한다.
변형은 예를 들어, (a) 말단부 변형, 예를 들어, 5' 말단부 변형 (인산화 탈인산화, 접합, 역위 연결 등), 3' 말단부 변형 (접합, DNA 뉴클레오티드, 역위 연결 등), (b) 염기 변형, 예를 들어, 변형된 염기, 안정화 염기, 탈안정화 염기, 또는 확장된 파트너 레퍼토리와 염기쌍 형성하는 염기, 또는 접합된 염기로의 교체, (c) 당 변형 (예를 들어, 2' 위치 또는 4' 위치에서의) 또는 당의 교체, 및 (d) 포스포디에스테르 연결의 변형 또는 교체를 포함하는 뉴클레오티드간 연결 변형을 포함하고 이로 제한되지 않는다. 상기 변형이 번역을 저해하는 (즉, 예를 들어 토끼 망상적혈구 시험관내 번역 검정에서, 변형 결여에 비해 번역의 50%, 60%, 70%, 80%, 또는 90% 또는 그 초과의 감소를 야기하는) 정도로, 변형은 본원에서 설명되는 방법 및 조성물에 적합하지 않을 수 있다.
변형된 뉴클레오티드간 연결의 비제한적인 예는 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 메틸 및 3'-알킬렌 포스포네이트 및 키랄 포스포네이트를 포함하는 다른 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 포함하는 포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 및 이들의 정상 3'-5' 연결, 2'-5' 연결된 유사체를 갖는 보라노포스페이트, 및 인접하는 뉴클레오티드 쌍이 3'-5' 대 5'-3' 또는 2'-5' 대 5'-2'로 연결된 반대 극성을 갖는 것을 포함한다. 다양한 염, 혼합된 염 및 유리산 형태도 포함된다.
그 내에 인 원자를 포함하지 않는 변형된 뉴클레오티드간 연결은 단쇄 알킬 또는 시클로알킬 뉴클레오시드간 연결, 혼합된 헤테로원자 및 알킬 또는 시클로알킬 뉴클레오시드간 연결, 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로시클릭 뉴클레오시드간 연결에 의해 형성된 뉴클레오시드간 연결을 갖는다. 이들은 모르폴리노 연결 (부분적으로 뉴클레오시드의 당 부분으로부터 형성됨); 실록산 백본; 술피드, 술폭시드 및 술폰 백본; 포름아세틸 및 티오포름아세틸 백본; 메틸렌 포름아세틸 및 티오포름아세틸 백본; 알켄 함유 백본; 술파메이트 백본; 메틸렌이미노 및 메틸렌히드라지노 백본; 술포네이트 및 술폰아미드 백본; 아미드 백본을 갖는 것; 및 혼합된 N, O, S 및 CH2 성분 부분을 갖는 것을 포함한다.
치환된 당 모이어티는 2' 위치에 다음 중의 하나 (이로 제한되지 않음)를 포함한다: H (데옥시리보스); OH (리보스); F; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬 (여기서, 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있다).
화학적으로 또는 천연적으로 변형된 RNA는 예를 들어 당의 2' 위치에서 변형된 적어도 하나의 뉴클레오티드, 가장 바람직하게는 2'-O-알킬, 2'-O-알킬-O-알킬 또는 2'-플루오로-변형된 뉴클레오티드 또는 말단부 캡을 포함할 수 있다. 다른 실시양태에서, RNA 변형은 RNA의 3' 말단부에 피리미딘, 비-염기성 (abasic) 잔기 또는 역위 염기의 리보스 상에 2'-플루오로, 2'-아미노 및 2' O-메틸 변형을 포함한다.
본 발명에 따라 유용한 RNA는 단일 변형 뉴클레오시드를 포함할 수 있다. 다른 실시양태에서, RNA는 적어도 2개의 변형된 뉴클레오시드, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 15, 적어도 20개 또는 그 초과의 뉴클레오시드 내지 올리고뉴클레오티드의 전체 길이를 포함할 수 있다.
뉴클레오티드 또는 핵염기는 천연 푸린 염기 아데닌 (A) 및 구아닌 (G), 및 피리미딘 염기 티민 (T), 시토신 (C) 및 우라실 (U)을 포함한다. 변형된 뉴클레오티드는 다른 합성 및 천연 핵염기, 예컨대 이노신, 크산틴, 히포크산틴, 누불라린, 이소구아니신, 투베르시딘, 2-(할로)아데닌, 2-(알킬)아데닌, 2-(프로필)아데닌, 2 (아미노)아데닌, 2-(아미노알킬)아데닌, 2 (아미노프로필)아데닌, 2 (메틸티오) N6 (이소펜테닐)아데닌, 6 (알킬)아데닌, 6 (메틸)아데닌, 7 (데아자)아데닌, 8 (알케닐)아데닌, 8-(알킬)아데닌, 8 (알키닐)아데닌, 8 (아미노)아데닌, 8-(할로)아데닌, 8-(히드록실)아데닌, 8 (티오알킬) 아데닌, 8-(티올)아데닌, N6-(이소펜틸)아데닌, N6 (메틸)아데닌, N6, N6 (디메틸)아데닌, 2-(알킬)구아닌, 2 (프로필)구아닌, 6-(알킬)구아닌, 6 (메틸)구아닌, 7 (알킬)구아닌, 7 (메틸)구아닌, 7 (데아자)구아닌, 8 (알킬)구아닌, 8-(알케닐)구아닌, 8 (알키닐)구아닌, 8-(아미노)구아닌, 8 (할로)구아닌, 8-(히드록실)구아닌, 8 (티오알킬)구아닌, 8-(티올)구아닌, N-(메틸)구아닌, 2-(티오)시토신, 3 (데아자) 5 (아자)시토신, 3-(알킬)시토신, 3 (메틸)시토신, 5-(알킬)시토신, 5-(알키닐)시토신, 5 (할로)시토신, 5 (메틸)시토신, 5 (프로피닐)시토신, 5 (프로피닐)시토신, 5 (트리플루오로메틸)시토신, 6-(아조)시토신, N4 (아세틸)시토신, 3 (3 아미노-3-카르복시프로필)우라실, 2-(티오)우라실, 5 (메틸) 2 (티오)우라실, 5 (메틸아미노메틸)-2 (티오)우라실, 4-(티오)우라실, 5 (메틸) 4 (티오)우라실, 5 (메틸아미노메틸)-4-(티오)우라실, 5 (메틸) 2,4 (디티오)우라실, 5 (메틸아미노메틸)-2,4 (디티오)우라실, 5 (2-아미노프로필)우라실, 5-(알킬)우라실, 5-(알키닐)우라실, 5-(알릴아미노)우라실, 5 (아미노알릴)우라실, 5 (아미노알킬)우라실, 5 (구아니디늄알킬)우라실, 5 (1,3-디아졸-1-알킬-우라실, 5-(시아노알킬)우라실, 5-(디알킬아미노알킬)우라실, 5 (디메틸아미노알킬)우라실, 5-(할로)우라실, 5-(메톡시)우라실, 우라실-5 옥시아세트산, 5 (메톡시카르보닐메틸)-2-(티오)우라실, 5 (메톡시카르보닐-메틸)우라실, 5 (프로피닐)우라실, 5 (프로피닐)우라실, 5 (트리플루오로메틸)우라실, 6 (아조)우라실, 디히드로우라실, N3 (메틸)우라실, 5-우라실 (즉, 슈도우라실), 2 (티오)슈도우라실, 4 (티오)슈도우라실, 2,4-(디티오)슈도우라실, 5-(알킬)슈도우라실, 5-(메틸)슈도우라실, 5-(알킬)-2-(티오)슈도우라실, 5-(메틸)-2-(티오)슈도우라실, 5-(알킬)-4 (티오)슈도우라실, 5-(메틸)-4 (티오)슈도우라실, 5-(알킬)-2,4-(디티오)슈도우라실, 5-(메틸)-2,4 (디티오)슈도우라실, 1 치환된 슈도우라실, 1 치환된 2(티오)-슈도우라실, 1 치환된 4 (티오)슈도우라실, 1 치환된 2,4-(디티오)슈도우라실, 1 (아미노카르보닐에틸레닐)-슈도우라실, 1 (아미노카르보닐에틸레닐)-2(티오)-슈도우라실, 1 (아미노카르보닐에틸레닐)-4 (티오)슈도우라실, 1 아미노카르보닐에틸레닐)-2,4-(디티오)슈도우라실, 1 (아미노알킬노아미카르보닐에틸레닐)-슈도우라실, 1 (아미노알킬아미노-카르보닐에틸레닐)-2(티오)-슈도우라실, 1 (아미노알킬아미노카르보닐에틸레닐)-4 (티오)슈도우라실, 1 (아미노알킬아미노카르보닐에틸레닐)-2,4-(디티오)슈도우라실, 1,3-(디아자)-2-(옥소)-페녹사진-1-일, 1-(아자)-2-(티오)-3-(아자)-페녹사진-1-일, 1,3-(디아자)-2-(옥소)-펜티아진-1-일, 1-(아자)-2-(티오)-3-(아자)-펜티아진-1-일, 7-치환된 1,3-(디아자)-2-(옥소)-페녹사진-1-일, 7-치환된 1-(아자)-2-(티오)-3-(아자)-페녹사진-1-일, 7-치환된 1,3-(디아자)-2-(옥소)-펜티아진-1-일, 7-치환된 1-(아자)-2-(티오)-3-(아자)-펜티아진-1-일, 7-(아미노알킬히드록시)-1,3-(디아자)-2-(옥소)-페녹사진-1-일, 7-(아미노알킬히드록시)-1-(아자)-2-(티오)-3-(아자)-페녹사진-1-일, 7-(아미노알킬히드록시)-1,3-(디아자)-2-(옥소)-펜티아진-1-일, 7-(아미노알킬히드록시)-1-(아자)-2-(티오)-3-(아자)-펜티아진-1-일, 7-(구아니디늄알킬히드록시)-1,3-(디아자)-2-(옥소)-페녹사진-1-일, 7-(구아니디늄알킬히드록시)-1-(아자)-2-(티오)-3-(아자)-페녹사진-1-일, 7-(구아니디늄알킬-히드록시)-1,3-(디아자)-2-(옥소)-펜티아진-1-일, 7-(구아니디늄알킬히드록시)-1-(아자)-2-(티오)-3-(아자)-펜티아진-1-일, 1,3,5-(트리아자)-2,6-(디옥사)-나프탈렌, 이노신, 크산틴, 히포크산틴, 누불라린, 투베르시딘, 이소구아니신, 이노시닐, 2-아자-이노시닐, 7-데아자-이노시닐, 니트로이미다졸릴, 니트로피라졸릴, 니트로벤즈이미다졸릴, 니트로인다졸릴, 아미노인돌릴, 피롤로피리미디닐, 3-(메틸)이소카르보스티릴릴, 5-(메틸)이소카르보스티릴릴, 3-(메틸)-7-(프로피닐)이소카르보스티릴릴, 7-(아자)인돌릴, 6-(메틸)-7-(아자)인돌릴, 이미디조피리디닐, 9-(메틸)-이미디조피리디닐, 피롤로피리지닐, 이소카르보스티릴릴, 7-(프로피닐)이소카르보스티릴릴, 프로피닐-7-(아자)인돌릴, 2,4,5-(트리메틸)페닐, 4-(메틸)인돌릴, 4,6-(디메틸)인돌릴, 페닐, 나프탈레닐, 안트라세닐, 페난트라세닐, 피레닐, 스틸베닐, 테트라세닐, 펜타세닐, 디일루오로톨릴, 4-(일루오로)-6-(메틸)벤즈이미다졸, 4-(메틸)벤즈이미다졸, 6-(아조)티민, 2-피리디논, 5 니트로인돌, 3 니트로피롤, 6-(아자)피리미딘, 2 (아미노)푸린, 2,6-(디아미노) 푸린, 5 치환된 피리미딘, N2-치환된 푸린, N6-치환된 푸린, O6-치환된 푸린, 치환된 1,2,4-트리아졸, 피롤로-피리미딘-2-온-3-일, 6-페닐-피롤로-피리미딘-2-온-3-일, 파라-치환된-6-페닐-피롤로-피리미딘-2-온-3-일, 오르토-치환된-6-페닐-피롤로-피리미딘-2-온-3-일, 비스-오르토-치환된-6-페닐-피롤로-피리미딘-2-온-3-일, 파라-(아미노알킬히드록시)-6-페닐-피롤로-피리미딘-2-온-3-일, 오르토-(아미노알킬히드록시)-6-페닐-피롤로-피리미딘-2-온-3-일, 비스-오르토-(아미노알킬히드록시)-6-페닐-피롤로-피리미딘-2-온-3-일, 피리도피리미딘-3-일, 2-옥소-7-아미노-피리도피리미딘-3-일, 2-옥소-피리도피리미딘-3-일, 또는 그의 임의의 O-알킬화된 또는 N-알킬화된 유도체를 포함한다.
하이브리드 RNA 또는 RNA를 발현하기 위한 벡터의 말단 서열은 일반적으로 삼중 나선 구조를 갖는 이종 RNA 안정화 말단 서열이다. 본원에서 사용되는 바와 같이, 용어 "이종"은 RNA의 3' 말단부 또는 "RNA 안정화 말단 서열"의 측면에서 사용될 때 천연적으로 발생하는 RNA의 3' 말단부에서 발견되는 천연적으로 발생하는 서열이 아닌 임의의 뉴클레오티드 서열을 의미한다. 긴 RNA 폴리머라제 II 전사체의 3' 말단부에 존재하는 폴리-A 꼬리는 성숙 RNA가 안정하고, 세포질로 수송되고, 효율적으로 번역되도록 보장하는 기능을 수행한다 (문헌 [Zhao et al. 1999]에서 검토됨). 본 발명에 따라, MALAT1 및 MEN β 긴 비코딩 RNA의 3' 말단부의 삼중 나선 구조가 폴리-A 꼬리를 기능적으로 교체할 수 있음이 입증되었다. 또한, 유사한 삼중 나선 구조가 폴리-A 꼬리를 교체할 수 있음이 입증되었다. 전사체 안정성을 지지하는 이외에, 이들 삼중 나선은 리포터 전사체의 효율적인 수송 (도 2b) 및 번역 (도 5)을 지지한다. 그러나, 예시되는 내인성 비코딩 RNA는 전사체 내의 다른 부분에 존재하는 핵 체류 신호 (도 2c)가 3' 말단부에 존재하는 임의의 수송 신호보다 어떻게든 우선하기 때문에 수송되지 않는다. 삼중 나선 영역에 속하는 다양한 기능은 효과적으로 번역되지 않는 안정하고 수송되는 전사체를 생성하는 돌연변이의 확인을 기초로 하여 서로 분리되었다.
PAN (폴리아데닐화된 핵) RNA (카포시 (Kaposi) 육종-연관 헤르페스 바이러스에 의해 생성된 풍부한 긴 비코딩 RNA)는 이전에 그의 3' 말단부에서 삼중 나선을 또한 갖는 것으로 나타났다 (Mitton-Fry et al. 2010). MALAT1 및 MEN β와는 달리, PAN RNA는 표준 절단/폴리아데닐화되고, PABP에 결합한다 (Borah et al. 2011). 그럼에도 불구하고, 5개 연속 U-A·U 염기 트리플은 PAN RNA 폴리-A 꼬리의 일부 및 폴리-A 꼬리의 약 120 nt 상류의 U-풍부 영역 사이를 형성한다 (Mitton-Fry et al. 2010). 상기 삼중 나선의 형성은 RNA 붕괴를 억제하고, PAN RNA의 핵 체류를 위해 요구되는 것으로 제안되었다. 이와 대조적으로, 본 발명자들은 MALAT1/MEN β 삼중 나선이 핵 체류를 위해 중대하지 않음을 발견하였다 (도 2b). PAN RNA 삼중 나선 구조를 가이드로서 이용하여, 최근의 컴퓨터 작업에서 아마도 삼중 나선을 형성하는 6개의 추가의 전사체를 확인하였지만, 이들 중 2개는 단순히 관련 감마헤르페스바이러스 내의 PAN RNA 상동체이다 (Tycowski et al. 2012). MALAT1 및 MEN β 삼중 나선은 아마도 PAN RNA 삼중 나선에 비해 이들 구조에서 미묘한 차이 때문에, 본 연구에서 확인되지 않았다. 염기 트리플이 전사체의 일차 서열 내에서 서로 멀리 있는 뉴클레오티드에 의해 형성될 수 있는 (또는 심지어 별개의 독립적 전사체 상에 코딩될 수 있는) 것을 고려하면, 추가의 기능적 RNA 삼중 나선이 본 발명에 따라 고려되고 본 발명에 포함된다.
따라서, 히스톤 스템-루프 구조 및 MALAT1/MEN β 삼중 나선에 추가로, 다른 RNA 구조적 모티프가 폴리-A 꼬리를 기능적으로 교체할 수 있다. 예를 들어, tRNA-유사 구조는 순무 황화 모자이크 (Turnip Yellow Mosaic) 바이러스 및 박테리오파지 Qβ와 같은 일부 단일 가닥 RNA 바이러스의 3' 말단부를 안정화시키는 것으로 알려져 있다 (문헌 [Fechter et al. 2001]에서 검토됨). 실시예에 제시된 작업은 RNA 구조를 안정화시키는 다른 것에 대한 스크린을 포함한다. 이들 스크린을 이용하여, 변형된 CMV-cGFP-mMALAT1_3' 발현 플라스미드는 RNase P 절단 부위의 상류의 MALAT1의 영역을 다양한 리보스위치 (세포성 대사체에 결합하고 종종 정교한 구조로 접히는 RNA 요소 (문헌 [Serganov and Patel 2012]에서 검토됨)의 서열로 교체함으로써 생성되었다 (데이터를 실시예에 제시한다). mascRNA tRNA-유사 구조는 리보스위치의 3' 말단부의 바로 하류에 존재하기 때문에, RNase P 절단은 생체내에서 리보스위치 서열로 끝나는 성숙 cGFP 전사체를 생성한다. 흥미롭게도, 티. 텡콘겐시스 glmS 촉매적 리보스위치 (글루코사민-6 포스페이트를 감지함 (Klein and Ferre-D'Amare 2006))는 cGFP 메시지의 3' 말단부를 안정화시키고 번역을 지지할 수 있었지만, 그 효과는 MALAT1 삼중 나선에서 얻어진 것보다 더 약하였다. 그럼에도 불구하고, 이들 결과는 비-폴리아데닐화된 전사체의 3' 말단부를 안정화하기 위해 충분한 다양한 RNA 서열이 실제로 존재함을 입증한다. 본 발명은 또한 추가의 서열을 확인하기 위한 생체내 스크리닝을 위한 방법을 포함한다.
따라서, 이종 RNA 안정화 말단 서열은 MALAT1 말단 서열 또는 MEN β 말단 서열 또는 그의 기능성 변이체일 수 있다. 변이체는 본원에 제공되는 유전자의 선택적 스플라이싱 또는 대립유전자 변이에 의해 발생할 수 있다. 일반적으로, 상동체 및 대립유전자는 일반적으로 알려진 삼중 나선 형성 핵산 및 폴리펩티드의 서열에 대해 각각 적어도 90% 뉴클레오티드 동일성 및/또는 적어도 95% 아미노산 동일성을 공유할 것이고, 일부 경우에 적어도 95% 뉴클레오티드 동일성 및/또는 적어도 97% 아미노산 동일성을 공유할 것이고, 다른 경우에 적어도 97% 뉴클레오티드 동일성 및/또는 적어도 98% 아미노산 동일성을 공유할 것이고, 다른 경우에, 적어도 99% 뉴클레오티드 동일성 및/또는 적어도 99% 아미노산 동일성을 공유할 것이고, 다른 경우에 적어도 99.5% 뉴클레오티드 동일성 및/또는 적어도 99.5% 아미노산 동일성을 공유할 것이다. 상동성은 관련 기술분야에 공지된 다양한 공개적으로 이용가능한 소프트웨어 툴, 예컨대 인터넷을 통해 이용가능한 NCBI (미국 메릴랜드주 베데스다)에 의해 개발된 것을 사용하여 계산될 수 있다. 예시적인 툴은 미국 국립 보건원의 국립 생명공학 정보 센터 (NCBI)의 웹사이트로부터 이용가능한 BLAST 시스템 (예를 들어, 디폴트 핵산 (Blastn) 또는 단백질 (Blastp) 검색 파라미터를 이용)을 포함한다.
대안적으로, 이종 RNA 안정화 말단 서열은 U-풍부 또는 A-풍부 서열 또는 이들의 조합일 수 있다. 본원에서 사용될 때 U-풍부 서열은 매우 근접한 적어도 5개의 U 및 일부 실시양태에서 5개의 연속적인 U를 포함하는 뉴클레오티드 서열의 세트를 의미한다. 본원에서 사용될 때 A-풍부 서열은 매우 근접한 적어도 5개의 A 및 일부 실시양태에서 5개의 연속적인 A를 포함하는 뉴클레오티드 서열의 세트를 의미한다. 말단 서열은 다수의 U-풍부 및/또는 A-풍부 서열 또는 모티프를 포함할 수 있다. 예를 들어, 말단 서열은 2, 3, 또는 4개의 U-풍부 서열 및/또는 2, 3, 또는 4개의 A-풍부 서열 또는 이들의 임의의 조합을 포함할 수 있다. 바람직하게는, U-풍부 및/또는 A-풍부 서열은 삼중 나선 구조를 생산하는 방식으로 배열된다.
말단 서열은 유사하게 C-풍부 및/또는 G-풍부 서열로 이루어질 수 있다. 본원에서 사용될 때 C-풍부 서열은 매우 근접한 적어도 5개의 C 및 일부 실시양태에서 5개의 연속적인 C를 포함하는 뉴클레오티드 서열의 세트를 의미한다. 본원에서 사용될 때 G-풍부 서열은 매우 근접한 적어도 5개의 G 및 일부 실시양태에서 5개의 연속적인 G를 포함하는 뉴클레오티드 서열의 세트를 의미한다. 말단 서열은 다수의 C-풍부 및/또는 G-풍부 서열 또는 모티프를 포함할 수 있다. 예를 들어, 말단 서열은 2, 3, 또는 4개의 C-풍부 서열 및/또는 2, 3, 또는 4개의 G-풍부 서열 또는 이들의 임의의 조합을 포함할 수 있다. 바람직하게는, C-풍부 및/또는 G-풍부 서열은 삼중 나선 구조를 생산하는 방식으로 배열된다.
말단 서열은 또한 리간드 결합 도메인을 가질 수 있다. 리간드 결합 도메인은 리간드의 존재 또는 부재에 민감한 도메인이다. 리간드가 존재할 때, RNA는 활성화되거나 억제될 수 있다. 대안적으로, 리간드가 부재할 때, RNA는 특정 리간드 및 RNA 내의 요소에 따라 활성화되거나 억제될 수 있다. 일부 경우에, 리간드 결합 도메인은 조직 특이적 요소를 갖는다. 예를 들어, 리간드는 특정 종류의 암에 대해 특이적일 수 있고, 그 특정 종류의 암의 존재 하에 활성화 또는 억제될 수 있다.
본 발명의 RNA는 벡터를 이용하여 발현될 수 있다. 유전자의 발현을 실행하기 위해서, 핵산은 벡터 내에서 전달되고/되거나 이종 프로모터 및 전사 종결인자에 작동가능하게 연결될 수 있다. 발현 벡터는 목적하는 서열이 조절 서열에 작동가능하게 연결되고 RNA 전사체로서 발현될 수 있도록, 예를 들어 제한 및 라이게이션에 의해 목적하는 서열이 삽입될 수 있는 것이다. 벡터는 벡터로 형질전환 또는 형질감염되거나 되지 않은 세포의 확인에 사용하기 위해 및 말단 서열 및 하이브리드 RNA의 발현 및 효과를 연구하기 위해 적합한 하나 이상의 마커 서열을 추가로 포함할 수 있다. 마커는 예를 들어, 항생제 또는 다른 화합물에 대한 내성 또는 감수성을 증가 또는 감소시키는 단백질을 코딩하는 유전자, 그의 활성이 관련 기술분야에 공지된 표준 검정에 의해 검출가능한 효소 (예를 들어, β-갈락토시다제 또는 알칼리성 포스파타제)를 코딩하는 유전자, 및 형질전환된 또는 형질감염된 세포, 숙주, 콜로니 또는 플라크의 표현형에 가시적인 영향을 주는 유전자 (예를 들어, 녹색 형광 단백질)를 포함한다.
본원에 개시된 방법에서 사용하기 위한 핵산 서열을 확인하고 얻는 방법은 관련 기술분야에서 통상적으로 수행되는 것이다. 예를 들어, 통상의 기술자는 본원에서 설명되는 하이브리드 RNA 또는 벡터의 생성을 위한 RNA 서열을 확인하기 위해 표적의 GeneID 또는 GeneAlias를 사용하여 엔트레즈 진(Entrez Gene) 데이터염기를 검색할 수 있다. 대부분의 경우에, 전사체를 함유하는 cDNA의 상업적인 공급처 (예를 들어, 오픈 바이오시스템즈(Open Biosystems))에 대한 연결은 카피 cDNA 클론을 얻기 위해 이용될 수 있는 엔트레즈 진 웹 인터페이스에서 제공된다. 다른 경우에, 상업적인 공급원 (예를 들어, 시그마 알드리치(Sigma Aldrich))에 직접 접촉할 수 있다.
클로닝 벡터는 숙주 세포 내에서 복제할 수 있고, 벡터가 그 부위에서 결정할 수 있는 방식으로 절단될 수 있고 목적하는 DNA 서열이 그 내로 라이게이션되어 새로운 재조합 벡터가 숙주 세포 내에서 복제할 수 있는 그의 능력을 보유할 수 있는 하나 이상의 엔도뉴클레아제 제한 부위에 의해 추가로 특성화되는 것이다. 발현 벡터는 조절 서열에 작동가능하게 연결되어 RNA 전사체로서 발현될 수 있도록 목적하는 DNA 서열이 제한 및 라이게이션에 의해 그 내로 삽입되는 것이다.
본원에서 사용될 때, 코딩 서열 및 조절 서열은 이들이 코딩 서열의 발현 또는 전사를 조절 서열의 영향 또는 제어 하에 두는 방식으로 공유 연결될 때 "작동가능하게 연결된" 것으로 언급된다. 본원에서 사용될 때, "작동가능하게 연결된" 및 "작동가능하게 연관된"은 교환가능하게 사용되고, 동일한 의미를 갖는 것으로 고려되어야 한다. 코딩 서열이 기능성 단백질로 번역될 것이 요구되는 경우, 2개의 DNA 서열은 5' 조절 서열 내의 프로모터의 유도가 코딩 서열의 전사를 유발하고 2개의 DNA 서열 사이의 연결의 특성이 (1) 프레임-이동 돌연변이의 도입을 야기하지 않거나, (2) 코딩 서열의 전사를 유도하는 프로모터 영역의 능력을 저해하지 않거나 또는 (3) 단백질로 번역될 상응하는 RNA 전사체의 능력을 저해하지 않을 경우에 작동가능하게 연결된 것으로 언급된다. 따라서, 프로모터 영역은 생성되는 전사체가 목적하는 단백질 또는 폴리펩티드로 번역될 수 있도록 프로모터 영역이 DNA 서열의 전사를 수행할 수 있다면 코딩 서열에 작동가능하게 연결된 것이다.
유전자 발현을 위해 필요한 조절 서열의 정확한 특성은 종 또는 세포 종류에 따라 상이할 수 있지만, 일반적으로 각각 전사 및 번역의 개시에 관여하는 5' 비-전사 및 5' 비-번역 서열, 예컨대 TATA 박스, 캡 형성 서열, CAAT 서열 등을 필요에 따라 포함할 것이다. 종종, 그러한 5' 비-전사 조절 서열은 작동가능하게 연결된 유전자의 전사 제어를 위해 프로모터 서열을 포함하는 프로모터 영역을 포함할 것이다. 조절 서열은 또한 필요에 따라 인핸서 서열 또는 상류 활성제 서열을 포함할 수 있다. 본 발명의 벡터는 임의로 5' 리더 또는 신호 서열을 포함할 수 있다. 적절한 벡터의 선택 및 설계는 관련 기술분야의 통상의 기술자의 능력과 판단에 따라 실시될 수 있다.
일부 실시양태에서, 핵산 분자를 전달하기 위한 바이러스 벡터는 아데노바이러스, 아데노-연관 바이러스, 폭스바이러스, 예를 들어 우두 (vaccinia) 바이러스 및 약독화 폭스바이러스, 셈리키 삼림열 (Semliki Forest) 바이러스, 베네주엘라 말 뇌염 바이러스, 레트로바이러스, 신드비스 (Sindbis) 바이러스, 및 Ty 바이러스-유사 입자로 이루어지는 군 중에서 선택된다. 외인성 핵산을 전달하기 위해 사용된 바이러스 및 바이러스-유사 입자의 예는 다음을 포함한다: 복제-결함 아데노바이러스 (예를 들어, 문헌 [Xiang et al., Virology 219:220-227, 1996]; [Eloit et al., J. Virol. 7:5375-5381, 1997]; [Chengalvala et al., Vaccine 15:335-339, 1997]), 변형된 레트로바이러스 (Townsend et al., J. Virol. 71:3365-3374, 1997), 비복제 레트로바이러스 (Irwin et al., J. Virol. 68:5036-5044, 1994), 복제 결함 셈리키 삼림열 바이러스 (Zhao et al., Proc. Natl. Acad. Sci. USA 92:3009-3013, 1995), 카나리폭스(canarypox) 바이러스 및 고도 약독화 우두 바이러스 유도체 (Paoletti, Proc. Natl. Acad. Sci. USA 93: 11349-11353, 1996), 비-복제성 우두 바이러스 (Moss, Proc. Natl. Acad. Sci. USA 93: 11341-11348, 1996), 복제성 우두 바이러스 (Moss, Dev. Biol. Stand. 82:55-63, 1994), 베네주엘라 말 뇌염 바이러스 (Davis et al., J. Virol. 70:3781-3787, 1996), 신드비스 바이러스 (Pugachev et al., Virology 212:587-594, 1995), 렌티바이러스 벡터 (Naldini L, et al., Proc Natl Acad Sci U S A. 1996 Oct 15;93(21): 11382-8) 및 Ty 바이러스-유사 입자 (Allsopp et al., Eur. J. Immunol 26: 1951-1959, 1996).
특정 용도에 유용한 또 다른 바이러스는 아데노-연관 바이러스 (이중 가닥 DNA 바이러스)이다. 아데노-연관 바이러스는 매우 다양한 세포 종류 및 종을 감염시킬 수 있고, 복제-결핍성이도록 처리될 수 있다. 이것은 추가로 열 및 지질 용매 안정성, 조혈 세포를 비롯한 다양한 계열의 세포 내에서 높은 형질도입 빈도, 및 중복감염 억제의 결여, 따라서 다중 연속의 형질도입을 허용하는 것과 같은 이점을 갖는다. 아데노-연관 바이러스는 부위-특이적 방식으로 인간 세포성 DNA 내로 통합되어, 삽입 돌연변이유발 및 삽입된 유전자 발현의 변동성의 가능성을 최소화할 수 있다. 추가로, 야생형 아데노-연관 바이러스 감염은 선택 압력의 부재 하에 100 초과의 통과율로 조직 배양을 일으키고, 이것은 아데노-연관 바이러스 게놈 통합이 비교적 안정한 이벤트임을 시사한다. 아데노-연관 바이러스는 또한 염색체외 방식으로 기능을 할 수 있다.
다른 유용한 바이러스 벡터는 비-필수 유전자가 관심있는 유전자로 교체된 비-세포병변 진핵 바이러스에 기반한다. 비-세포병변 바이러스는 특정 레트로바이러스를 포함하고, 그의 생활 주기는 게놈 바이러스 RNA의 DNA로의 역전사, 이어서 숙주 세포성 DNA 내로 후속적인 프로바이러스 통합을 포함한다. 일반적으로, 레트로바이러스는 복제-결핍성이다 (즉, 목적하는 전사체의 합성을 지시할 수 있지만, 감염성 입자를 생산할 수 없다). 그러한 유전적으로 변경된 레트로바이러스 발현 벡터는 생체내에서 유전자의 고-효율 형질도입을 위한 일반적 효용을 갖는다. 복제-결핍 레트로바이러스를 생산하기 위한 표준 프로토콜 (외인성 유전 물질의 플라스미드 내로 혼입, 플라스미드를 사용한 패키징 세포 계열의 형질감염, 패키징 세포 계열에 의한 재조합 레트로바이러스의 생산, 조직 배양 배지로부터 바이러스 입자의 수집, 및 바이러스 입자를 사용한 표적 세포의 감염의 단계 포함)은 문헌 [Kriegler, M., "Gene Transfer and Expression, A Laboratory Manual", W.H. Freeman Co., New York (1990)] 및 [Murry, E.J. Ed. "Methods in Molecular Biology", vol. 7, Humana Press, Inc., Clifton, New Jersey (1991)]에 제시되어 있다.
또 다른 실시양태에서, 본 발명의 핵산은 포유동물 발현 벡터를 이용하여 포유동물 세포 내에서 발현된다. 재조합 포유동물 발현 벡터는 특정 세포 종류 내에서 우선적으로 핵산의 발현을 지시할 수 있다 (예를 들어, 핵산을 발현하기 위해 조직-특이적 조절 요소가 사용된다). 조직 특이적 조절 요소는 관련 기술분야에 공지되어 있다. 적합한 조직-특이적 프로모터의 비제한적인 예는 미오신 중쇄 프로모터, 알부민 프로모터, 림프-특이적 프로모터, 뉴런 특이적 프로모터, 췌장 특이적 프로모터, 및 유선 특이적 프로모터를 포함한다. 발달-조절된 프로모터, 예를 들어 뮤린 혹스 (hox) 프로모터 및 a-페토단백질 프로모터가 또한 포함된다.
본 발명은 또한 RNA의 번역을 향상시키기 위한 또는 RNA를 발현하기 위한 방법을 포함한다. 상기 방법은 세포 또는 유기체에서 생체내에서 본원에서 설명되는 바와 같은 하이브리드 RNA를 발현함으로써 달성된다.
방법은 대상체 (또한 유기체로서 칭함)에서 질환을 치료하기 위해 유용할 수 있다. 본원에서 사용될 때, 대상체는 포유동물, 예컨대 인간, 비-인간 영장류, 소, 말, 돼지, 양, 염소, 개, 고양이, 또는 설치류이다. 모든 실시양태에서, 인간 대상체가 바람직하다. 본 발명의 방법에 따라 치료가능한 질환은 안정한 버전의 RNA 및 임의로 RNA에 상응하는 단백질을 발현하는 것이 요망되는 임의의 질환이다.
본 발명의 핵산은 전형적으로 단리된 핵산이다. 핵산에 관련하여 본원에서 사용할 때, 용어 "단리된"은 (i) 예를 들어, 폴리머라제 연쇄 반응 (PCR)에 의해 시험관내에서 증폭되거나; (ii) 클로닝에 의해 재조합 방식으로 생산되거나; (iii) 절단 및 겔 분리에 의해 정제되거나; 또는 (iv) 예를 들어, 화학적 합성에 의해 합성된 것을 의미한다. 단리된 핵산은 관련 기술분야에 잘 알려진 재조합 DNA 기술에 의해 쉽게 조작가능한 것이다. 따라서, 그 내부의 5' 및 3' 제한 부위가 공지되어 있거나 그에 대한 폴리머라제 연쇄 반응 (PCR) 프라이머 서열이 개시된 벡터 내에 함유된 뉴클레오티드 서열은 단리된 것으로 간주되지만, 그의 천연 숙주 내에 천연 상태로 존재하는 핵산 서열은 그렇지 않다. 단리된 핵산은 실질적으로 정제될 수 있지만, 그러할 필요는 없다. 예를 들어, 클로닝 또는 발현 벡터 내에서 단리된 핵산은 그가 거주하는 세포 내의 물질을 단지 소량 포함할 수 있는 점에서 순수하지 않다. 그러나, 그러한 핵산은 단리된 상태이고, 이것은 관련 기술분야의 통상의 기술자에게 공지된 표준 기술에 의해 쉽게 조작가능하기 때문에 상기 용어가 사용된다.
본 발명의 측면은 세포(들)의 표현형 특성을 변경시키는 방법에 관한 것이다. 상기 방법은 세포에 본 발명의 RNA를 투여하는 것을 포함하고, 이것은 세포 또는 조직 내에서 목적하는 단백질의 발현을 일으키고, 이것은 다른 단백질, 핵산, 또는 인자의 상향조절, 하향조절, 활성화, 또는 탈활성화를 일으키거나 심지어 세포의 분화된 표현형을 또 다른, 목적하는 세포 종류의 표현형으로 변화시킬 수 있다. 본 발명의 방법은 DNA 또는 단백질보다는 RNA의 투여를 포함하므로, 상기 방법은 게놈의 영구 변형을 일으키지 않거나 의도되지 않은 돌연변이유발 효과에 대한 가능성을 갖는다.
따라서, 본 발명의 측면은 세포를 변형시키기 위해 시험관내에서, 생체내에서, 또는 생체외에서 세포 내에서 단백질 발현의 유도를 포함한다. 작용제를 도입하기 위한 또는 유전자 발현을 유도하기 위한 전통적인 방법은 외인성 DNA, 또는 재조합 바이러스 벡터를 이용하였다. 그러나, 유전자 치료 방법에는 잠재적인 위험이 있다. 본 발명의 방법은 유전자 치료 연관 위험을 피하고, 효과적인 및 특이적인 단백질 발현을 제공한다.
일부 실시양태에서, 본 발명은 본 발명의 핵산을 사용하여 질환을 치료하는 방법을 제공한다. 치료할 질환의 종류는 발현되는 RNA에 따르고 그 반대의 경우도 마찬가지일 것이다. 본 발명에 따라 치료가능한 질환은 증식성 질환, 자가면역, 신경변성 질환, 심혈관 질환, 근육병증, 리소솜 저장 질환, 피부 질환, 유전자 결함 또는 기능 상실과 연관된 질환, 및 감염성 질환을 포함하고 이로 제한되지 않는다.
본 발명의 RNA는 세포의 하나 이상의 표현형 특성을 변경시키기 위해 세포 내에서 단백질을 발현하기 위해 또한 유용하다. 예를 들어, 단백질은 조직 생성 또는 재생에 관여할 수 있거나, 질환의 치료를 위한 치료 단백질 또는 억제성 단백질일 수 있다. 예를 들어, 단백질은 암 또는 다른 증식성 장애, 신경변성 질환, 자가면역, 심혈관 질환, 근육 질환 및 장애의 치료에 유용할 수 있다.
따라서, 본 방법은 대상체에서 질환 및 장애의 치료를 위해 관심있는 단백질을 코딩하는 RNA를 세포에 전달하기 위해 유용하다. 예를 들어, 방법은 생체내에서 단백질 교체 요법을 위한 방법에서 사용될 수 있다. 일부 실시양태에서, 관심있는 단백질을 코딩하는 본 발명의 RNA는 단백질 발현이 요망되는 다양한 상이한 질환의 치료를 위한 방법에서 생체내 단백질 발현을 위해 조직 및/또는 장기에 전달될 수 있다. 예를 들어, 기능 상실, 예컨대 근이영양증, 낭성 섬유증을 수반한 질환 또는 특정 단백질의 단백질 발현의 낮은 수준을 수반하는 다른 질환이 본 발명에 따라 치료가능하다.
따라서, 일부 실시양태에서, 방법 및 조성물은 근이영양증의 치료를 위한 방법에서 유용하다. 근이영양증은 근육의 유전적 질환의 패밀리를 나타낸다. 일부 형태는 아동을 침범하고 (예를 들어, 뒤시엔느(Duchenne) 이영양증), 2~30년 내에 치명적이다. 성인 형태는 보다 서서히 진행하는 경향이 있다. 뒤시엔느 이영양증 (디스트로핀 (dystrophin) 유전자에서 돌연변이에 의해 유발됨) 및 십대 및 성인 발병 미요시 (Miyoshi) 이영양증 또는 그의 변이형, 지대근 이영양증 2B 또는 LGMD-2B (디스페르린 (dysferlin) 유전자에서 돌연변이에 의해 유발됨)을 비롯한 일부 이영양증에 대한 유전자가 확인되어 있다. 이들은 근육 내에서 관련 단백질의 발현을 방지하고 그에 의해 근육 기능장애를 일으키는 "기능 상실" 돌연변이이다. 본 발명의 핵산은 질환과 연관된 결함성 단백질을 교체하기 위해 하나 이상의 근육 조직 표적에 전달된다. 예를 들어, 뒤시엔느/벡커(Becker) 근이영양증의 치료를 위해 디스트로핀 단백질을 코딩하는 RNA를 전달할 수 있다. 대안적으로, 에머린(Emerin) 및/또는 라민(Lamin) 단백질을 코딩하는 RNA를 에머리-드라이푸스(Emery-Dreyfuss) 근이영양증이 있는 대상체에 투여할 수 있다.
RNA는 치료 이익을 달성하기 위해 전신 또는 국소 전달될 수 있다. 국소 투여는 예를 들어, 병태와 특히 연관된 근육 조직에 디스트로핀 및/또는 에머린 및/또는 라민 단백질을 코딩하는 RNA을 전달하는 것을 포함한다. 예를 들어, 질환은 약화된 횡경막으로 인한 불충분한 호흡, 및 약한 체위 근육으로 인한 보행 불능과 연관된다. 횡경막 주사를 위해, 횡경막 근육 내로 RNA를 전달하기 위해 흉강경 방법을 이용할 수 있다. 대안적으로, 골격근 내로 직접 주사, 예를 들어, 각각 체위 유지 및 총체적 팔 운동과 연관된 다리이음뼈 및 팔이음뼈 근육 내로 직접 주사를 수행할 수 있다.
낭성 섬유증의 치료를 위해, CFTR 단백질을 코딩하는 RNA를 대상체의 조직, 예컨대 횡경막에 투여할 수 있다. 일부 실시양태에서, CFTR을 코딩하는 RNA는 직접적 실질 주사 및/또는 기관지내 주사에 의해 전달될 수 있다.
본 방법은 심혈관 질환을 치료하기 위해 또한 유용하다. 심혈관 질환은 울혈성 심부전, 심근병증, 심근경색, 조직 허혈, 심장 허혈, 혈관 질환, 후천성 심장 질환, 선천성 심장 질환, 아테롬성동맥경화증, 심근병증, 흥분전도계 기능장애, 관상 동맥 기능장애, 폐성 심장 고혈압, 관상 동맥 질환, 심근경색, 심근 허혈, 아테롬성동맥경화증, 심근병증, 특발성 심근병증, 심장 부정맥, 근이영양증, 근육 질량 이상, 근육 변성, 감염성 심근염, 약물- 또는 독소-유발 근육 이상, 과민 심근염, 및 자가면역 심내막염을 포함하고 이로 제한되지 않는다.
많은 단백질이 심장 질환의 치료에 유용한 것으로 알려져 있다. 본 발명의 RNA는 질환을 치료하기 위해 생체내에서 이들 단백질을 생산하도록 투여될 수 있다. 심혈관 질환을 치료하기 위해 유용한 단백질의 예는 VEGF 폴리펩티드, 예를 들어, 인간 VEGF (hVEGF), 알파 1 항-트립신 폴리펩티드, 심장 세포의 생존 및/또는 성장을 촉진하는 임의의 심장지향 인자 또는 성장 인자, TGF-베타 리간드, 예컨대 액티빈 A, 액티빈 B, 인슐린-유사 성장 인자, 골 형태발생 단백질, 섬유모세포 성장 인자, 혈소판 유래 성장 인자 나트륨이뇨 인자, 인슐린, 백혈병 억제 인자 (LIF), 상피 성장 인자 (EGF), TGF알파, BMP 또는 크립토 (cripto) 경로의 생성물, 및 세포 분화 작용제, 예컨대 시토카인 및 성장 인자를 포함하고 이로 제한되지 않는다. 심장지향 인자는 관련 기술분야에 널리 공지되어 있고, 심장지향 작용제, 크레아틴, 카르니틴, 및 타우린을 포함하고 이로 제한되지 않는다. RNA는 본원에 설명되는 임의의 질환의 치료에서와 같이 국소 또는 전신 전달될 수 있다. 일부 국소 전달 방법의 예는 심내막심근, 심근외, 심실내, 관상동맥내, 후동, 동맥내, 심낭내, 또는 정맥내 투여 경로를 통한 대상체에의 투여를 포함한다.
일부 경우에, 본 발명에 따라 치료가능한 질환은 기능 상실 질환이다. 기능 상실 질환은 감소된 또는 폐지된 단백질 기능을 유발하는 유전자 내의 돌연변이와 연관된 질환이다. "기능 상실"은 본원에서 사용될 때 유전자 또는 유전자 생성물의 정상 활성의 감소 또는 제거를 나타낸다. 활성 상실은 RNA의 전사 및/또는 프로세싱의 감소, 유전자 생성물의 번역, 안정성, 수송, 또는 활성의 감소, 또는 그의 임의의 조합 때문일 수 있다. 기능 상실 유전자는 종양 서프레서 유전자, 또는 DNA 복구, 세포 분열 주기 확인점, 세포 운동성, 전사 조절, 및 세포자멸을 담당하는 유전자에서의 돌연변이를 포함하고 이로 제한되지 않는다. 종양-서프레서 유전자 및 종양-서프레서 유전자인 것으로 의심되는 유전자는 BRCA1, BRCA2, MLH1, MSH2, MSH6, EPHA3, EPHA4, APHB2, INI1, AXIN1, AXIN2, MLL3, EP300, NF1, TP53, APC, VHL, SMAD2, SMAD4, KEAP1, CDKN2A, RBI, MEN, NF2/SCH, PTCH, TGFBR1, TGFBR2, ACVR1B, AVCR2, MRE11, MAP2K4, 및 LKB1/STK11을 포함하고 이로 제한되지 않는다. 기능 상실 질환은 a-지중해빈혈, 베타-지중해빈혈, 터너(Turner) 증후군, 망막모세포종을 포함한다.
본 발명의 방법은 또한 신경변성 장애를 치료하기 위한 RNA의 용도를 포함한다. 본원에서 사용될 때 용어 "신경변성 질환" 또는 "신경변성 장애"는 새로운 뉴런의 생성을 자극하는 작용제를 사용하여 역전시키거나 저지하거나 관리하거나 치료하거나 개선하거나 제거할 수 있는 임의의 장애를 뜻한다. 신경변성 장애의 예는 (i) 만성 신경변성 질환, 예컨대 가족성 및 산발성 근위축성 측삭 경화증 (각각 FALS 및 ALS), 가족성 및 산발성 파킨슨 (Parkinson) 질환, 헌팅톤 (Huntington) 질환, 가족성 및 산발성 알츠하이머 (Alzheimer) 질환, 다발성 경화증, 올리브교소뇌 위축, 다계통 위축, 진행성 핵상 마비, 미만성 루이(Lewy) 소체 질환, 코티코덴타토니그랄(corticodentatonigral) 변성, 진행성 가족성 근간대성 간질, 선상체흑질 변성, 염전(torsion) 이상긴장증, 가족성 진전, 다운 (Down) 증후군, 질 드 라 투렛(Gilles de la Tourette) 증후군, 할러보르덴 스파츠(Hallervorden Spatz) 질환, 당뇨병성 말초 신경병증, 권투선수 치매, AIDS 치매, 연령 관련 치매, 노화 연관 기억 장애, 및 아밀로이드증 관련 신경변성 질환, 예컨대 전염성 해면상 뇌병증와 연관된 프리온 단백질 (PrP)에 의해 유발된 질환 (크로이츠펠트 야콥(Creutzfeldt Jakob) 질환, 게르스트만 스트라우슬러 샤잉커 (Gerstmann Straussler Scheinker) 증후군, 면양떨림병, 및 쿠루병(kuru)), 및 과잉의 시스타틴 C 축적에 의해 유발된 질환 (유전성 시스타틴 C 혈관병증); 및 (ii) 급성 신경변성 장애, 예컨대 외상성 뇌 손상 (예를 들어, 수술 관련 뇌 손상), 뇌 부종, 말초 신경 손상, 척수 손상, 라이(Leigh) 질환, 길랑-바레 (Guillain-Barre) 증후군, 리소솜 축적 장애, 예컨대 리포푸신증, 알퍼(Alper) 질환, CNS 변성의 결과로서 현기증; 예를 들어, 청반 (locus coeruleus) 및 소뇌에서 뉴런의 변성을 포함한, 만성 알콜 또는 약물 남용으로 일어나는 병리학; 인지 및 운동 장애를 일으키는 소뇌 뉴런 및 피질 뉴런의 변성을 포함하는, 노화로 일어나는 병리학; 및 운동 장애를 일으키는 기저 신경절의 변성을 포함하는, 만성 암페타민 남용으로 일어나는 병리학; 국소 외상, 예컨대 졸중중, 국소 허혈, 혈관 부전, 저산소성-허혈성 뇌병증, 고혈당증, 저혈당증 또는 직접 외상으로부터 발생하는 병리학적 변화; 치료 약물 및 치료의 부정적인 부작용으로서 발생하는 병리학 (예를 들어, 항경련 용량의 NMDA 클래스의 글루타메이트 수용체의 길항제에 반응한 대상 및 내비 피질 뉴런의 변성), 및 베르니케 코르사코프(Wernicke Korsakoff) 관련 치매를 포함한다. 감각 뉴런에 영향을 미치는 신경변성 질환은 프리드라이히(Friedreich) 운동실조, 당뇨병, 말초 신경병증, 및 망막 뉴런 변성을 포함한다. 다른 신경변성 질환은 척수 손상과 연관된 신경 손상 또는 외상을 포함한다. 변연계 및 피질계의 신경변성 질환은 뇌 아밀로이드증, 픽(Pick) 위축, 및 레트(Retts) 증후군을 포함한다. 상기 예는 종합적인 것을 의미하지 않고, 단지 용어 "신경변성 장애"의 예시로서 제공된다.
파킨슨 질환은 근육이 경직되고 느리게 움직이는 수의 운동의 장애이다. 질환의 증상은 흔들림 또는 떨림을 일으키는 근육 집단의 율동적인 연축의 어려움 및 제어불가능함을 포함한다. 현재, 상기 질환은 뇌 및 구체적으로 뇌간에서 전-시냅스 도파민 뉴런의 변성에 의해 유발된다. 변성의 결과로서, 뉴런 활성 동안 화학 전달물질 도파민의 부적당한 방출이 일어난다.
근위축성 측삭 경화증 (ALS) (또한 루게릭 (Lou Gehrig) 병으로 불림)은 진행성의 치명적 신경학적 질환이다. ALS는 수의 운동을 제어하는 뇌 및 척수 내의 특이적 신경 세포가 점차 변성되어 그의 제어 하에 근육을 약화시키고 쇠약하게 하여 마비를 일으킬 때 일어난다. ANG (14 kDa 혈관신생 리보뉴클레아제를 코딩함)는 ALS에서 확인된 기능 상실 유전자이다. 본 발명의 방법은 본 발명의 RNA를 사용하여, ALS의 치료에서 14 kDa 혈관신생 리보뉴클레아제의 전달을 고려한다.
현재, 파킨슨 질환은 일부 상이한 화합물 및 배합물을 사용하여 치료되고 있다. 뇌에서 도파민으로 전환되는 레보도파 (L-도파)가 근육 제어를 회복시키기 위해 종종 제공된다. 혈액-뇌 장벽을 가로지르는 ACE 억제제인 페린도프릴은 L-도파에 대한 환자의 운동 반응을 개선하기 위해 사용된다. 카르비도파는 뇌에 도달할 때까지 L-도파의 도파민으로의 전환을 지연시키기 위해 L-도파와 함께 투여되고, 또한 L-도파의 부작용을 감소시킨다. 파킨슨 질환 치료에 사용되는 다른 약물은 도파민 모방체 미라펙스(Mirapex) (프라미펙솔 이염산염) 및 리큅(Requip) (로피니롤 염산염), 및 타스마(Tasmar) (톨카폰: 뇌에 도달하기 전에 레보도파를 파괴하는 역할을 하는 핵심 효소를 차단하는 COMT 억제제)를 포함한다.
알츠하이머 질환은 인지 및 비인지 신경정신 증상을 특징으로 하는 변성 뇌 장애이다. 정신 증상은 알츠하이머 질환에서 일반적이고, 여기서 정신병 (환각 및 망상)은 약 50%의 이환된 환자에서 존재한다. 정신분열증과 유사하게, 양성 정신병 증상은 알츠하이머 질환에서 일반적이다. 망상이 대개 환각보다 더 빈번하게 일어난다. 알츠하이머 환자는 또한 음성 증상, 예컨대 이탈, 무관심, 감소된 정서적 반응성, 의욕 상실, 및 감소된 주도성을 보일 수 있다. 실제로, 정신분열증의 정신병을 경감시키기 위해 사용되는 항정신병약은 알츠하이머 환자에서 정신병을 개선하기 위해 또한 유용하다. 본원에서 사용될 때, 용어 "치매"는 지각 또는 의식의 장애 없이 인지 및 지적 기능의 상실을 나타낸다. 치매는 대개 지남력장애, 손상된 기억, 판단, 및 지적 능력, 및 얕은 불안정 정동을 특징으로 한다.
자폐 (또한 자폐 스펙트럼 (Autism Spectrum) 장애, 또는 ASD로서도 칭함)는 개인의 기능성을 심각하게 손상시키는 장애이다. 이것은 자기 몰두(self-absorption), 외부 세계와 소통하거나 반응하는 능력 감소, 강박행위 및 강박 현상, 및 정신 지체를 특징으로 한다. 자폐 개체는 또한 발작 장애, 예컨대 간질을 발병할 위험이 증가한다. 자폐의 실제 원인은 알려지지 않았지만, 일치율이 이란성 쌍둥이보다 일란성 쌍둥이에서 더 높다는 사실이 나타내는 바와 같이 하나 이상의 유전적 인자를 포함하는 것으로 보이고, 또한 면역 및 환경 인자, 예컨대 식이, 독성 화학물질 및 감염을 포함할 수 있다.
신경변성 장애를 치료하기 위해 유용한 단백질은 프레세닐린 단백질 및 ANG를 포함하고 이로 제한되지 않는다. 프레세닐린 단백질은 알츠하이머 질환의 치료에 유용하다.
관심있는 단백질을 코딩하는 RNA는 또한 예를 들어, 백반증, 습진 (종종 필라그린 (filaggrin) 유전자의 기능 상실과 연관됨), 백색증, 예를 들어, 헤르만스키-푸들락(Hermansky-Pudlak) 증후군 (다른 것 중에서도 HPS1 및 HPS3 유전자에서 돌연변이와 연관됨), 색소 실조증 (1 KB KG 유전자에서 돌연변이와 연관됨), 안구피부 백색증 (MC1R, OCA2, SLC45A2, TYR, SLC45A2 및 TYRP1 유전자 중 하나 이상에서 돌연변이와 연관됨), 바르덴부르크(Waardenburg) 증후군 (EDN3, EDNRB, MITF, PAX3, SNAI2, 및 SOX10 유전자에서 돌연변이와 연관됨), 또는 색소성 건피증 (ERCC2, ERCC3, POLH, XPA, 및 XPC 유전자에서 돌연변이와 연관됨)와 같은 피부 장애의 치료에 또한 사용될 수 있다. 따라서, 본 발명은 피부 장애와 연관된 단백질의 생체내 발현에 의한 그러한 장애의 치료에 관한 것이다. 임의로, 투여는 피부에 대한 국소 투여일 수 있다.
본원에서 설명되는 방법 및 조성물은 증식성 질환의 치료에 유용하다. 일부 실시양태에서, 증식성 질환은 고형 종양이다. 일부 실시양태에서, 증식성 질환은 혈액암이다. 특정 실시양태에서, 증식성 질환은 양성 신생물이다. 다른 실시양태에서, 신생물은 악성 신생물이다. 특정 실시양태에서, 증식성 질환은 암이다. 일부 실시양태에서, 적어도 일부 종양 세포는 예를 들어, 종양이 발생한 것으로 생각되는 종류의 세포 및/또는 정상 세포에서 관찰된 대표적인 값에 비해 단백질을 과발현한다. 이 경우에, 본 발명의 방법은 예를 들어, 과발현된 단백질의 발현 또는 활성을 저해하거나 중단시키는 단백질을 전달하기 위해 이용될 수 있다. 대안적으로 또는 추가로, 방법은 리간드 결합 도메인을 갖는 RNA 분자의 전달을 포함할 수 있고, 여기서 리간드는 과발현된 단백질이고, 과발현된 단백질과 접촉에 반응하여 생산된 단백질은 세포를 치사시키거나 달리 암을 치료하는데 유용할 수 있다. 다른 경우에, 암 세포는 단백질을 과소발현할 수 있다. 이 경우에, 본 발명의 방법은 단백질의 증가된 전달 및 발현을 일으킬 수 있다.
일부 실시양태에서, 종양은 다양한 장기계 중 하나, 예컨대 폐, 유방, 림프, 위장관 (예를 들어, 결장) 및 비뇨생식관 (예를 들어, 신장, 요로상피, 또는 고환 종양), 췌장, 인두, 전립선, 및 난소의 악성 종양 (예를 들어, 육종, 선암종, 또는 암종)이다. 일부 실시양태에서, 종양은 기질층을 갖는 종양일 수 있다. 일부 실시양태에서, 암은 비-소세포 폐암이다. 일부 실시양태에서, 암은 선암종이다. 일부 실시양태에서, 암은 췌장관 선암종 (PDAC)이다. 선암종의 예는 결장직장암, 신-세포 암종, 간암, 폐의 비-소세포 암종 및 소장의 암을 포함하고 이로 제한되지 않는다. 추가의 예시적인 고형 종양은 섬유육종, 점액육종, 지방육종, 연골육종, 골원성 육종, 척삭종, 혈관육종, 내피육종, 림프관육종, 림프관내피육종, 활막종, 중피종, 유잉 (Ewing) 종양, 평활근육종, 횡문근육종, 위장계 암종, 결장 암종, 췌장암, 유방암, 비뇨생식계 암종, 난소암, 전립선암, 편평 세포 암종, 기저 세포 암종, 선암종, 한선 암종, 피지선 암종, 유두상 암종, 유두상 선암종, 낭선암종, 수질 암종, 기관지원성 암종, 신세포 암종, 간세포암, 담관 암종, 융모막암종, 정상피종, 배아성 암종, 윌름스(Wilms) 종양, 자궁경부암, 내분비계 암종, 고환 종양, 폐 암종, 소세포 폐 암종, 비-소세포 폐 암종, 폐암, 방광 암종, 상피 암종, 신경교종, 성상세포종, 속질모세포종, 두개인두종, 상의세포종, 송과체종, 혈관모세포종, 청신경종, 핍지교종, 수막종, 흑색종, 신경모세포종, 및 망막모세포종을 포함한다.
RNA는 단독으로 또는 표준 화학요법제와 함께 사용될 수 있다. 일부 경우에, RNA에 의해 발현된 단백질은 암 세포의 화학요법제 감수성 표현형에 기여하는 것이다. 예를 들어, 단백질은 내성 암 세포를 화학요법제에 감수성이 되도록 할 수 있다. 대안적으로 단백질은 암 세포가 화학요법제 내성 표현형을 나타내는 것을 방지하기 위해 유용할 수 있다. 본원에서 사용될 때, "화학요법제"는 이상 세포 성장을 특징으로 하는 질환의 치료에 치료 효용을 갖는 임의의 화학적 또는 생물학적 작용제이다. 그러한 질환은 종양, 신생물 및 암, 및 과형성 성장을 특징으로 하는 질환을 포함한다. 화학요법제는 알킬화/알칼로이드 작용제, 항대사물질, 호르몬 또는 호르몬 유사체, 및 다른 항신생물질 약물을 포함하고 이로 제한되지 않는다. 화학요법제는 관련 기술분야에 널리 공지되어 있다 (예를 들어, 문헌 [Slapak and Kufe, Principles of Cancer Therapy, Chapter 86 in Harrison's Principles of Internal Medicine, 14th edition]; [Perry et al., Chemotherapy, Ch. 17 in Abeloff, Clinical Oncology 2nd ed., 2000 Churchill Livingstone, Inc]; [Baltzer L, Berkery R (eds): Oncology Pocket Guide to Chemotherapy, 2nd ed. St. Louis, Mosby-Year Book, 1995]; [Fischer D S, Knobf M F, Durivage H J (eds): The Cancer Chemotherapy Handbook, 4th ed. St. Louis, Mosby-Year Book, 1993] 참조).
따라서, 본 발명의 RNA는 세포에 유용한 임의의 단백질을 코딩할 수 있다. 세포의 조작 또는 질환의 치료에 사용되는 RNA/단백질의 특정한 종류는 질환의 종류에 따라 결정될 것이다. 본 발명의 방법에서 발현시키기 위해 유용한 예시적인 단백질 및 단백질을 코딩하는 유전자는 VEGF 단백질, 알파 1 항-트립신 폴리펩티드, 심장지향 인자, 예컨대 크레아틴, 카르니틴 및 타우린, 심장 세포의 생존 및/또는 성장을 촉진하는 성장 인자, TGF-베타 리간드, 예컨대 액티빈 A, 액티빈 B, 인슐린-유사 성장 인자, 골 형태발생 단백질, 섬유모세포 성장 인자, 혈소판-유래 성장 인자 나트륨이뇨 인자, 인슐린, 백혈병 억제 인자 (LIF), 상피 성장 인자 (EGF), TGF알파, BMP 또는 크립토 경로의 생성물, 및 세포 분화 작용제, 예컨대 시토카인 성장 인자, TDGF1, vWF, GATA-4, GATA-6, Nkx2.5, Mef2-c, LGMD-2B, 디스페르린, 디스트로핀, 에머린, 라민 A/C, 알파-1 항-트립신, CFTR, ANG, p프레세닐린, IS11, SERCA 1a 또는 2a, 포스포람반, 베타-ARK, 베타-아드레날린작용성 수용체, Akt, 아데닐 시클라제 V1, 뉴레굴린 1, ErbB4, 페리오스틴, HAND1, E2F4, Skp2, BRCA1, BRCA2, MLH1, MSH2, MSH6, EPHA3, EPHA4, APHB2, INI1, AXIN1, AXIN2, MLL3, EP300, NF1, TP53, APC, VHL, SMAD2, SMAD4, KEAP1, CDKN2A, RBI, MEN, NF2/SCH, PTCH, TGFBR1, TGFBR2, ACVR1B, AVCR2, MRE11, MAP2K4, LKB1/STK11, HERG, KCNQ1, SCN5A, ANK2, KCNE1, KCNE2, KCNJ2, CACNA1c, SCN4B SERCA, KCNQ2, SCN1B, 및 KCNE3을 포함하고 이로 제한되지 않는다.
본원에서 설명되는 방법은 생체내, 시험관내 및 생체외 용도를 포함한다. 상기 논의한 바와 같이, 관심있는 단백질은 RNA 조성물의 대상체에 대한 생체내 투여에 의해 표적 조직 또는 장기 내에서 치료를 위해 발현될 수 있다. 본 발명은 또한 하나 이상의 세포를 생체외에서 RNA 조성물과 접촉시키고, 이어서 상기 세포를 치료, 진단 또는 연구 목적을 위해 대상체에게 투여하는 것을 수반하는 치료 방법을 포함한다. 세포는 먼저 전통적인 생체외 방법으로 대상체로부터 제거되고, RNA를 세포 내로 수송할 수 있는 임의의 방법, 예를 들어, 전기천공 또는 리포펙션에 의해 형질감염되고, 대상체에게 재도입될 수 있다. 대안적으로, 세포는 상이한 공급원으로부터 얻은 후, RNA가 세포 내로 도입된 후에 처음으로 대상체에게 도입될 수 있다.
본 발명은 연구를 위한 동물 모델의 개발에서 또한 유용하다. 예를 들어, 본 발명의 RNA는 전체 장기 및 전신 병리생리학 연구, 및 약물 스크리닝 및 시험을 위한 동물 모델의 개발을 위해 동물에게 투여될 수 있다. 방법은 치료제의 시험 및/또는 개발을 위한 작은- 및 큰-동물 모델, 예컨대 뮤린, 영장류 및 돼지 모델 모두의 개발을 포함한다.
따라서, 본 발명은 비-인간 척추동물, 예를 들어, 비-인간 포유동물의 생산 방법을 제공한다. 본 발명의 비-인간 척추동물은 매우 다양한 목적을 위해 이용될 수 있다. 일부 실시양태에서, 비-인간 척추동물은 병태 연구를 용이하게 하기 위한 병태에 대한 모델로서 사용된다. 일부 실시양태에서, 비-인간 척추동물은 그에 대한 예방 또는 치료 약물이 탐색되는 병태에 대한 모델로서 사용된다. 후보 약물이, 병태가 동물 모델에 존재하는 정도를 감소시키거나 또는 병태가 역전되도록 진행시키거나 유도하면 (부분적으로 또는 완전히), 후보 약물은 병태를 치료하기 위해 투여될 약물이다.
본 발명은 또한 재생 의학 방법론을 포함한다. 예를 들어, 조직을 형성할 수 있는 세포의 집단을 일부 실시양태에서, 세포의 집단에 의한 조직 형성에 기여하는 단백질을 코딩하는 RNA로 처리할 수 있다. 세포의 집단은 생체내에서 RNA로 처리할 수 있거나, 시험관내에서 이식 직전에 처리할 수 있거나 또는 시험관내에서 처리되고, 스캐폴드에 씨딩되고, 이식 전에 배양액에서 성장할 수 있다. 일부 실시양태에서, 세포 집단은 줄기 세포 집단이다.
따라서, 본 발명은 조직 생성, 조직 재생 및 조직 조작의 방법을 포함한다. "조직 재생"은 질환 또는 외상 후에 세포 집단, 장기 또는 조직의 재성장을 의미한다. 용어 "조직 생성"은 초기 세포 집단으로부터 조직의 성장을 의미한다.
조직 조작은 세포 및 스캐폴드 또는 지지체 물질을 사용하여 조직 또는 조직 구조를 생성하는 것을 수반한다. 상기 조작된 조직 또는 조직 구조는 생물학적 기능의 개선 또는 교체를 위한 치료 목적에, 예를 들어 전체 조직 (예를 들어, 피부, 심장, 심장 조직, 뼈, 연골, 췌장, 간, 신장, 혈관, 방광 등) 또는 그의 일부의 복구 또는 교체에, 또는 대상체로부터 그 장기를 얻을 필요 없이 전체 장기 또는 그의 일부의 기능을 변형하는 작용제를 확인하기 위한 검정에 유용하다.
"스캐폴드" 또는 "지지체"는 본원에서 설명되는 방법 및 조성물을 사용하여 생성된 세포가 스스로 부착하거나 들러붙을 수 있는 임의의 적합한 담체 물질을 의미한다. 스캐폴드 또는 지지체는 편평할 수 있거나 또는 3차원 형태를 가질 수 있다. 스캐폴드는 세포가 부착하여 그 위에서 성장하도록 허용하는 지지 프레임워크를 제공하도록, 복구 또는 교체를 필요로 하는 목적하는 구조로 성형될 수 있는 표면을 갖는 중합체일 수 있다. 스캐폴드는 임의의 요구되는 기하 입체형태, 예를 들어, 편평 시트, 나선, 원뿔, 또는 v-유사 구조로 존재할 수 있다. 이어서, 배양된 세포 집단은 세포-세포 상호작용에 요구되는 적절한 세포간 거리 및 추후 이식을 위한 적절한 크기 및 형상을 제공하는 스캐폴드 상에서 성장할 수 있다. 일반적으로, 스캐폴드가 대상체에 이식되어야 할 경우, 스캐폴드는 생체적합성 스캐폴드일 수 있다. "생체적합성 스캐폴드"는 대상체에 이식된 후에 독성 효과를 야기하지 않도록 비-독성이다.
스캐폴드는 분화 또는 전환분화를 겪는 세포의 제어를 돕도록 설계될 수 있다. 예를 들어, 스캐폴드는 세포의 특정 조직으로의 분화를 제어하고 유도하기 위한 환경 신호를 포함할 수 있다. 환경 신호를 제공하도록 조작된 스캐폴드는 예를 들어 나노미터 내지 마이크로미터 내지 밀리미터 내지 육안으로 보이는 길이를 포함하고/하거나, 물질 기계적 특성, 물질 용해도, 생활성 화합물의 공간 패턴화, 위상 기하학적 특징 요소의 공간 패턴화, 가용성 생활성 화합물, 기계적 교란 (주기적 또는 정적 변형, 스트레스, 전단 등), 전기적 자극, 및 열 교란과 같은 인자 (이로 제한되지 않음)를 기초로 할 수 있다.
스캐폴드는 일반적으로 중합체이다. 스캐폴드의 생성에 유용한 중합체의 예는 폴리락트산 (PLA), 폴리-L-락트산 (PLLA), 폴리-D-락트산 (PDLA), 폴리글리콜리드, 폴리글리콜산 (PGA), 폴리락티드-co-글리콜리드 (PLGA), 폴리디옥사논, 폴리글루코네이트, 폴리락트산-폴리에틸렌 옥시드 공중합체, 변형된 셀룰로스, 콜라겐, 폴리히드록시부티레이트, 폴리히드록시프로피온산, 폴리포스포에스테르, 폴리(알파-히드록시산), 폴리카프로락톤, 폴리카르보네이트, 폴리아미드, 폴리안히드라이드 (polyanhydride), 폴리아미노산, 폴리오르토에스테르, 폴리아세탈, 폴리시아노아크릴레이트, 분해가능 우레탄, 지방족 폴리에스테르 폴리아크릴레이트, 폴리메타크릴레이트, 아실 치환된 셀룰로스 아세테이트, 비-분해가능 폴리우레탄, 폴리스티렌, 폴리비닐 클로라이드, 폴리비닐 플루오라이드, 폴리비닐 이미다졸, 클로로술폰화 폴리올레핀, 폴리에틸렌 옥시드, 폴리비닐 알콜, 테플론(Teflon)™, 나일론 실리콘, 및 형상 기억 물질, 예컨대 폴리(스티렌-블록-부타디엔), 폴리노르보르넨, 히드로겔, 금속 합금, 및 전환 절편으로서 올리고(e-카프로락톤)디올/물리적 가교결합제로서 올리고(p-디옥시아논)디올을 포함하고 이로 제한되지 않는다. 다른 적합한 중합체는 그 내용 전체가 본원에 참조로 포함되는 문헌 [The Polymer Handbook, 3rd edition (Wiley, N.Y., 1989)]을 참고로 하여 얻을 수 있다.
중합체는 또한 생체 중합체, 예컨대 세포외 기질 (ECM) 단백질 (예를 들어, 세포 부착 및 기능을 유도하는 콜라겐, 피브로넥틴, 라미닌 등), 성장 인자 (예를 들어, 신경 성장 인자, 골 형태발생 단백질, 혈관 내피 성장 인자 등), 지질, 지방산, 스테로이드 (예를 들어, 글리세리드, 비-글리세리드, 포화 및 불포화 지방산, 콜레스테롤, 코티코스테로이드, 성 스테로이드 등), 당 및 다른 생물학적 활성 탄수화물 (예를 들어, 단당류, 올리고당, 수크로스, 글루코스, 글리코겐 등), 프로테오글리칸 (콘드로이틴 술페이트, 더마탄 술페이트, 헤파린, 헤파란 술페이트, 및/또는 케라탄 술페이트의 부착된 측쇄를 갖는 단백질 코어); 당단백질 [예를 들어, 셀렉틴, 이뮤노글로불린, 호르몬 (예를 들어, 단백 동화 스테로이드, 성 호르몬, 인간 융모막 고나도트로핀, 인슐린, 안지오텐신 등), 알파-페토단백질 및 에리트로포이에틴 (EPO) 등]; 단백지질 (예를 들어, N-미리스토일화된, 팔미토일화된 및 프레닐화된 단백질); 및 당지질 (예를 들어, 글리코글리세로지질, 글리코스핑고지질, 글리코포스파티딜이노시톨 등), 핵산 (예를 들어, DNA, RNA 등), 호르몬, 세포 표면 리간드 및 수용체 (예를 들어, 인테그린, 셀렉틴, 카드헤린 등), 세포골격 미세섬유, 운동 단백질 (예를 들어, 중간체 미세섬유, 미세관, 액틴 미세섬유, 디네인, 키네신, 미오신 등), 실크, 효소 (종류: 옥시도리덕타제, 트랜스퍼라제, 히드롤라제, 리아제, 이소머라제, 리가제; 예: 트립신, 콜라게나제, 기질 메탈로프로테이나제 등), 다중단백질 (예를 들어, 폴리(리신), 폴리락트산 및 폴리글리콜산 및 폴리-L-리신) 또는 이들의 임의의 조합으로 코팅되거나 혼합될 수 있다.
세포를 스캐폴드에 씨딩하기 전에 본 발명의 RNA로 처리할 수 있다. 대안적으로, 세포는 RNA로 전처리한 후에 추가로 또는 전처리를 하지 않은 상태로, 스캐폴드 상에 씨딩한 후에 RNA로 처리될 수 있다. 일부 실시양태에서, 본 발명의 RNA는 스캐폴드에 부착되거나 그 내부에 포함된다. 추가로, 치료제는 스캐폴드 내에 또는 상부에 포함될 수 있다. 대안적으로, 스캐폴드에 씨딩된 세포는 본 발명의 RNA 이외의 추가의 치료제로 처리될 수 있다.
치료제는 다음을 포함하고 이로 제한되지 않는다: 항바이러스제; 항미생물제 및/또는 항생제, 예컨대 에리트로마이신, 바시트라신, 네오마이신, 페니실린, 폴리마이신 B, 테트라시클린, 바이오마이신, 클로로미세틴, 및 스트렙토마이신, 세파졸린, 암피실린, 아작탐, 토브라마이신, 클린다마이신 및 겐타마이신 등; 살생물성/정생물성 당, 예컨대 덱스트란, 글루코스 등; 아미노산; 펩티드; 비타민; 무기 요소; 단백질 합성을 위한 보조-인자; 호르몬; 내분비 조직 또는 조직 단편; 합성제; 효소, 예컨대 알칼리성 포스파타제, 콜라게나제, 펩티다제, 옥시다제 등; 혈관신생제; 콜라겐 격자; 항원성 작용제; 세포골격제; 연골 단편; 살아있는 세포, 예컨대 연골세포, 골수 세포, 중간엽 줄기 세포; 천연 추출물; 유전 조작된 살아있는 세포 또는 달리 변형된 살아있는 세포; 팽창 또는 배양된 세포; 탈무기질 골 분말; 자생 조직, 예컨대 혈액, 혈청, 연부 조직, 골수 등; 생체접착제; 골 형태발생 단백질 (BMP); 골유도성 인자 (IFO); 피브로넥틴 (FN); 내피 세포 성장 인자 (ECGF); 혈관 내피 성장 인자 (VEGF); 백악질 부착 추출물 (CAE); 케탄세린; 인간 성장 호르몬 (HGH); 동물 성장 호르몬; 상피 성장 인자 (EGF); 인터류킨, 예를 들어, 인터류킨-1 (IL-1), 인터류킨-2 (IL-2); 인간 알파 트롬빈; 형질전환 성장 인자 (TGF-베타); 인슐린-유사 성장 인자 (IGF-1, IGF-2); 혈소판 유래 성장 인자 (PDGF); 섬유모세포 성장 인자 (FGF, BFGF 등); 치주 인대 화학주성 인자 (PDLGF); 법랑 기질 단백질; 성장 및 분화 인자 (GDF); 단백질의 헤지호그 패밀리; 단백질 수용체 분자; 상기 성장 인자로부터 유래된 작은 펩티드; 골 촉진제; 시토카인; 소마토트로핀; 골 소화제; 항종양제; 세포 유인제 및 부착제; 면역억제제; 투과 증강제, 예를 들어, 지방산 에스테르, 예컨대 폴리에틸렌 글리콜의 라우레이트, 미리스테이트 및 스테아레이트 모노에스테르, 에나민 유도체, 알파-케토 알데히드 등; 및 핵산.
세포의 발달 잠재력은 본 발명의 RNA 조성물을 사용하여 변경될 수 있다. 예를 들어, 본 발명의 외인성 RNA로부터 단백질을 발현하는 능력은 세포의 발달 잠재력의 변경 또는 역전, 즉, 세포의 재프로그래밍, 및 세포의 보다 분화된 표현형으로의 유도된 분화를 허용한다. 세포의 발달 잠재력을 변경하는 과정의 중요한 성분은 세포에서 하나 이상의 발달 잠재력 재프로그래밍 인자의 지속적이고 장기적인 발현의 필요이다. 일반적으로, 상기 지속적인 발현은 외인성 DNA 또는 바이러스 벡터를 사용하여 달성할 수 있다. 그러나, 본 발명의 RNA는 세포에 직접 전달될 수 있고, 따라서 DNA 또는 바이러스 벡터를 사용할 필요성을 배제할 수 있음이 밝혀졌다.
따라서, 본 발명의 RNA는 분화된 표현형을 갖는 세포로부터 만능성 줄기 세포를 생산하기 위해 사용될 수 있다. 상기 실시양태를 수행하기 위해서, RNA는 분화된 표현형을 갖는 세포로 전달된다. 일단 RNA가 세포 내에 존재하면, 이것은 세포가 덜 분화된 표현형을 생성하도록 하는 재프로그래밍 인자로 번역된다. 비처리 세포보다 더 큰 발달 잠재력을 갖는 생성되는 세포는 이어서 추가의 조작을 위한 줄기 세포의 공급원이 될 수 있다.
상기 설명된 바와 같이 생산된 줄기 세포, 또는 줄기 세포의 임의의 다른 공급원은 또한 보다 분화된 세포를 생산하기 위해 본 발명에 따라 처리될 수 있다. 예를 들어, 줄기 세포는 줄기 세포가 목적하는 세포 종류로 분화하도록 만들기 위한 단백질 발현의 유도에 의해 조작될 수 있다. 상기 종류의 유도된 분화는 목적하는 표현형을 갖는 세포를 생성하기 위해 사용된다. 줄기 세포는 세포가 분화된 표현형을 생산하도록 유도하는 분화 인자로 번역되는 본 발명의 RNA로 처리된다.
따라서, 본원에서 설명되는 기술을 이용하여, 줄기 세포는 분화된 세포로부터 생성될 수 있고, 줄기 세포는 하나 이상의 요구되는 세포 종류로 분화될 수 있다. 본원에서 사용될 때 "줄기 세포"는 자가 재생하는 능력을 갖고 다수의 세포 종류로 분화하는 발달 잠재력을 갖는 비분화된 또는 부분적으로 분화된 세포이다. 만능성 세포는 상이한 조건 하에 3개의 모든 생식 세포층, 즉, 내배엽 (예를 들어, 소화관 조직), 중배엽 (혈액, 근육, 및 혈관 포함), 및 외배엽 (예컨대 피부 및 신경)에 특유한 세포 종류로 분화하는 발달 잠재력을 갖는 세포이다.
다능성 세포는 3개 전부는 아니지만, 하나 이상의 배엽의 세포로 분화하는 발달 잠재력을 갖는 세포이다. 이들 세포는 예를 들어, 성체 줄기 세포, 예컨대 예를 들어, 조혈 줄기 세포 및 신경 줄기 세포를 포함한다. 줄기 세포는 분화된 표현형에 대한 경향을 가질 수 있다. 그러나, 이들 세포는 역전되어 줄기 세포 표현형을 재발현하도록 유도될 수 있다. 상기 과정은 "탈분화" 또는 "재프로그래밍"으로 언급된다.
줄기 세포는 자가 재생 전구세포, 비-재생 전구세포, 및 말단 분화 세포를 포함하는, 단일 세포 수준에서 자손체 세포를 생산하기 위해 자가 재생하고 분화하는 그의 능력에 의해 규정되는 비분화된 세포이다. 그의 분화 수준에 따라 줄기 세포는 또한 시험관내에서 다수의 배엽 (내배엽, 중배엽 및 외배엽)으로부터 다양한 세포 계통의 기능성 세포로 분화하고 이식 후에 다수의 배엽의 조직을 생성하는 그의 능력에 의해 특징지워진다. 줄기 세포는 배아 줄기 세포 또는 체세포 줄기 세포일 수 있다. 용어 "배아 줄기 세포"는 일반적으로 발생 동안 3개의 일차 배엽, 즉 외배엽, 내배엽 및 중배엽의 모든 유도체를 생성할 수 있는 배아 배반포의 내부 세포괴의 만능성 줄기 세포를 지칭하기 위해 사용된다. 이와 대조적으로, 본원에서 사용될 때 "체세포 줄기 세포"는 태아, 소아, 및 성체 조직을 포함하는 비-배아 조직으로부터 유래된 임의의 만능성 또는 다능성 줄기 세포를 지칭하기 위해 사용된다. 천연 체세포 줄기 세포는 혈액, 골수, 뇌, 후각 상피, 피부, 췌장, 골격근, 및 심장 근육을 포함하는 매우 다양한 성체 조직으로부터 단리되었다. 이와 대조적으로, "분화된 세포"는 만능성이 아닌 체세포이다.
본원에서 사용될 때 용어 "재프로그래밍"은 세포 또는 세포의 집단 (예를 들어, 체세포)의 발달 잠재력을 역전시키는 과정을 의미한다. 따라서, 재프로그래밍은 세포를 보다 높은 발달 잠재력을 갖는 상태로, 즉, 덜 분화된 상태로 퇴보하는 방향으로 유도하는 과정을 의미한다. 재프로그래밍되는 세포는 재프로그래밍 전에 부분적으로 또는 말단에서 분화될 수 있다. 일부 실시양태에서, 재프로그래밍은 분화 상태의 완전한 또는 부분적인 역전, 즉, 만능성 상태를 갖는 세포의 수준까지 세포의 발달 잠재력의 증가를 포함한다. 일부 실시양태에서, 재프로그래밍은 세포가 배아 줄기 세포의 발달 잠재력, 즉, 배아 줄기 세포 표현형을 갖도록 체세포를 만능성 상태로 유도하는 것을 포함한다. 일부 실시양태에서, 재프로그래밍은 또한 세포, 예컨대 체세포 또는 단분화능 세포의 발달 잠재력의 다능성 상태까지의 부분적인 증가 또는 분화 상태의 부분적인 역전을 포함한다. 재프로그래밍은 또한 추가의 조작에 적용할 때 세포를 만능성 상태로의 완전한 재프로그래밍에 보다 감수성이 되도록 만드는 상태까지의 세포의 분화 상태의 부분적인 역전을 포함한다.
본원에서 사용될 때 "재프로그래밍 인자"는 그의 발현이 세포, 예를 들어 체세포의 덜 분화된 또는 비분화된 상태로, 예를 들어 만능성 상태 또는 부분적 만능성 상태의 세포로의 재프로그래밍에 기여하는 발달 잠재력 변경 인자를 의미한다. 재프로그래밍 인자는 OCT4, SOX1, SOX2, SOX3, SOX15, SOX18, NANOG, KLF1, KLF2, KLF4, KLF5, NR5A2, c-MYC, 1-MYC, n-MYC, REM2, TERT, 및 LIN28을 포함하고 이로 제한되지 않는다.
본원에서 사용될 때, 용어 "분화 인자"는 세포가 목적하는 세포-종류로 분화하는 것을 유도하는, 본원에서 규정된 바와 같은 발달 잠재력 변경 인자, 예컨대 단백질, RNA, 또는 작은 분자를 의미하고, 즉, 분화 인자는 세포의 발달 잠재력을 감소시킨다. 특이적 세포 종류로의 분화는 하나 초과의 분화 인자의 동시의 및/또는 연속적인 발현을 수반할 수 있다. 이것은 하나 이상의 분화 인자를 코딩하는 하나 이상의 RNA를 세포에 전달하고, 임의로 하나 이상의 분화 인자를 세포에 단백질의 형태로 전달함으로써 달성될 수 있다.
일부 측면에서, 본 발명은 본 발명의 방법에 따라 조작된 세포에 관한 것이다. 그러한 세포는 단리된 세포이다. 용어 "단리된 세포"는 세포가 본래 발견되는 유기체로부터 제거된 세포, 또는 상기 세포의 후손을 의미한다. 이들 세포는 나중에 제2 유기체 내에 도입되거나 또는 그 세포 (또는 그 세포가 유래되는 세포 또는 세포의 집단)가 단리된 유기체 내로 재도입될 수 있다. 그러나, 상기 세포는 본 발명의 방법에 따라 조작된 후에도 계속 단리된 세포로 간주된다. 줄기 세포는 관심있는 특이적 마커의 존재 또는 부재를 기초로 하여 단리될 수 있다. 예를 들어, 줄기 세포 마커를 인식하기 위해 작용제가 사용될 수 있고, 예를 들어 목적하는 줄기 세포 상의 세포-표면 마커 또는 항원을 인식하고 결합하는 표지된 항체가 형광 활성화된 세포 분류 (FACS), 패닝 방법, 자기 입자 선택, 입자 분류기 선택, 및 밀도 분리를 비롯하여 관련 기술 분야의 통상의 기술자에게 알려진 다른 방법을 사용하여 목적하는 줄기 세포를 분리하고 단리하기 위해 사용될 수 있다.
일부 실시양태에서, 본 발명에 따라 처리된 줄기 세포는 암 줄기 세포이다. 암 줄기 세포는 일부 인간 종양에 존재한다. 이들 세포는 종양의 총 세포 질량의 극소수를 나타내지만, 종양 성장을 책임지는 종양 세포의 하위집단인 것으로 생각된다. 암 줄기 세포는 광범하게 증식하고, 추가의 종양 줄기 세포 및 종양원성 잠재력이 결여된 다른 종양 세포를 생성한다. 암 줄기 세포의 추가의 특질은 치료제, 예컨대 화학요법제에 대한 그의 내성이다. 증식하고 궁극적으로 치명상이 되는 것은 종양 줄기 세포 및 그의 직계 딸 세포 집단의 작은 부분이다. 본 발명의 암 줄기 세포는 세포의 화학치료 내성을 역전시키거나 달리 저해하는 인자를 연구하기 위해 사용될 수 있다.
줄기 세포는 임의의 포유동물 종, 예를 들어 인간, 영장류, 말, 소, 돼지, 개, 고양이, 설치류, 예를 들어 마우스, 래트, 햄스터 등으로부터 얻을 수 있다.
본 발명의 방법에 따라 처리된 분화된 또는 만능성 세포 집단은 이들 세포 종류에 대한 표준 조건 하에 조작될 수 있다. 세포의 처리는 시험관내에서, 생체외에서, 또는 생체내에서 수행할 수 있다. 예를 들어, 세포는 신체 내에 또는 배양 배지 내에 존재할 수 있다. 조작은 고산소 또는 저산소 조건 하에 수행할 수 있다.
"배양 배지"는 세포 생활력을 유지하고 증식을 지지하는 영양분을 함유한다. 전형적인 배양 배지는 염, 완충제, 아미노산, 글루코스 또는 다른 당(들), 항생제, 혈청 또는 혈청 교체, 및/또는 다른 성분, 예컨대 펩티드 성장 인자 등을 포함한다. 만능성 세포를 유도하고 유지할 때 사용하기 위한 세포 배양 배지는 관련 기술분야에 공지되어 있다. 배양 배지는 또한 세포 특이적 성장 인자, 예컨대 안지오게닌, 골 형태발생 단백질-1, 골 형태발생 단백질-2, 골 형태발생 단백질-3, 골 형태발생 단백질-4, 골 형태발생 단백질-5, 골 형태발생 단백질-6, 골 형태발생 단백질-7, 골 형태발생 단백질-8, 골 형태발생 단백질-9, 골 형태발생 단백질-10, 골 형태발생 단백질-11, 골 형태발생 단백질-12, 골 형태발생 단백질-13, 골 형태발생 단백질-14, 골 형태발생 단백질-15, 골 형태발생 단백질 수용체 IA, 골 형태발생 단백질 수용체 IB, 뇌 유래 신경영양 인자, 섬모 호중구 인자, 섬모 호중구 인자 수용체-알파, 시토카인-유도 호중구 화학주성 인자 1, 시토카인-유도 호중구, 화학주성 인자 2-알파, 시토카인-유도 호중구 화학주성 인자 2-베타, 베타-내피 세포 성장 인자, 내피 1, 상피 성장 인자, 상피 유래 호중구 유인제, 섬유모세포 성장 인자 4, 섬유모세포 성장 인자 5, 섬유모세포 성장 인자 6 섬유모세포 성장 인자 7, 섬유모세포 성장 인자 8, 섬유모세포 성장 인자 b, 섬유모세포 성장 인자 c, 섬유모세포 성장 인자 9, 섬유모세포 성장 인자 10, 산성 섬유모세포 성장 인자, 염기성 섬유모세포 성장 인자, 아교 세포주-유래 호중구 인자 수용체-알파-1, 아교 세포주-유래 호중구 인자 수용체-알파-2, 성장 관련 단백질, 성장 관련 단백질-알파, 성장 관련 단백질-베타, 성장 관련 단백질-감마, 헤파린 결합 상피 성장 인자, 간세포 성장 인자, 간세포 성장 인자 수용체, 인슐린-유사 성장 인자 I, 인슐린-유사 성장 인자 수용체, 인슐린-유사 성장 인자 II, 인슐린-유사 성장 인자 결합 단백질, 각질세포 성장 인자, 백혈병 억제 인자, 백혈병 억제 인자 수용체-알파, 신경 성장 인자, 신경 성장 인자 수용체, 뉴로트로핀-3, 뉴로트로핀-4, 태반 성장 인자, 태반 성장 인자 2, 혈소판 유래 내피 세포 성장 인자, 혈소판 유래 성장 인자, 혈소판 유래 성장 인자 A 쇄, 혈소판 유래 성장 인자 AA, 혈소판 유래 성장 인자 AB, 혈소판 유래 성장 인자 B 쇄, 혈소판 유래 성장 인자 BB, 혈소판 유래 성장 인자 수용체-알파, 혈소판 유래 성장 인자 수용체-베타, 프리-B 세포 성장 자극 인자, 줄기 세포 인자, 줄기 세포 인자 수용체, 형질전환 성장 인자-알파, 형질전환 성장 인자-베타, 형질전환 성장 인자-베타-1, 형질전환 성장 인자-베타-1-2, 형질전환 성장 인자-베타-2, 형질전환 성장 인자-베타-3, 형질전환 성장 인자-베타-5, 잠복 형질전환 성장 인자-베타-1, 형질전환 성장 인자-베타-결합 단백질 I, 형질전환 성장 인자-베타-결합 단백질 II, 형질전환 성장 인자-베타-결합 단백질 III, 종양 괴사 인자 수용체 I형, 종양 괴사 인자 수용체 II형, 유로키나제-유형 플라스미노겐 활성제 수용체, 혈관 내피 성장 인자, 및 이들의 키메라 단백질 및 생물학적 또는 면역학적 활성 단편을 포함할 수 있다.
세포의 분화 상태는 평가를 위해 관련 기술분야에 공지된 임의의 방법을 이용하여 평가할 수 있다. 예를 들어, 본원에서 설명되는 방법에 따라 처리된 세포의 분화 상태는 동일한 재프로그래밍 또는 분화 인자의 발현을 야기하는 DNA를 전달하기 위해 바이러스 벡터를 사용하여 DNA로 처리된 세포 또는 비처리 세포와 비교할 수 있다.
본 발명의 방법은 또한 예방접종에도 유용하다. 본 발명의 RNA는 세포 또는 대상체에게 항원을 발현하기 위해 사용될 수 있다. 예를 들어, 세포에 전달되는 RNA는 항원, 예를 들어, 그에 대한 면역 반응이 요망되는 항원을 코딩할 수 있다. 예시적인 항원은 병원성 유기체, 예를 들어, 박테리아 또는 바이러스 또는 다른 미생물로부터의 단백질 또는 그의 단편, 및 세포, 예를 들어, 암 세포로부터의 단백질 또는 그의 단편을 포함할 수 있다. 항원은 단순히 면역원성 단백질 또는 그의 단편일 수 있거나 또는 담체 펩티드와 융합된 항원성 단백질 또는 그의 단편을 포함하는 융합 단백질일 수 있다. 담체 펩티드는 제2 항원성 펩티드일 수 있거나 또는 비-면역원성일 수 있다.
항원은 완전 단백질 또는 에피토프, 예컨대 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, 또는 B 또는 T 세포 에피토프일 수 있다. MHC 클래스 I 분자에 의해 제시되는 T 세포 에피토프는 약 8 내지 11개 아미노산의 펩티드일 수 있다. MHC 클래스 II 분자에 의해 제시되는 T 세포 에피토프는 MHC 클래스 I 분자보다 더 길 수 있다. 에피토프는 다양한 웹-기반 예측 툴, 예컨대, http://tools.immuneepitope.org/main/html/tcell tools.html을 이용하여 예측될 수 있다.
바이러스 항원은 바이러스로부터 유래된 면역원성 단백질 또는 그의 단편이다. 만성 인간 바이러스 감염에서 일부 중요한 바이러스는 HPV, HBV, C형 간염 바이러스 (HCV), 레트로바이러스, 예컨대 인간 면역결핍 바이러스 (HIV-1 및 HIV-2), 헤르페스 바이러스, 예컨대 엡스타인 바아 (Epstein Barr) 바이러스 (EBV), 거대세포바이러스 (CMV), HSV-1 및 HSV-2, 및 인플루엔자 바이러스를 포함하고 이로 제한되지 않는다. 유용한 항원은 HBV 표면 항원 또는 HBV 중심 항원; CMV의 ppUL83 또는 pp 89; HIV-1의 gp120, gp41 또는 p24 단백질의 항원; HSV의 ICP27, gD2, gB; 또는 인플루엔자 혈구응집소 또는 핵단백질을 포함한다 (Anthony, L S et al., Vaccine 1999; 17:373-83). 다른 바이러스는 다음을 포함한다: 아벨슨 (Abelson) 백혈병 바이러스, 아벨슨 뮤린 백혈병 바이러스, 아벨슨 바이러스, 급성 후두기관기관지염 바이러스, 아델레이드 강 (Adelaide River) 바이러스, 아데노 연관 바이러스 군, 아데노바이러스, 아프리카 말 질병 바이러스, 아프리카 돼지 열 바이러스, AIDS 바이러스, 알류산 (Aleutian) 밍크병 파르보바이러스, 알파레트로바이러스, 알파바이러스, ALV 관련 바이러스, 아마파리(Amapari) 바이러스, 아프토바이러스(Aphthovirus), 아쿠아레오바이러스, 아르보바이러스(Arbovirus), 아르보바이러스 C, 아르보바이러스 군 A, 아르보바이러스 군 B, 아레나바이러스(Arenavirus) 군, 아르헨티나 출혈열 바이러스, 아르헨티나 출혈열 바이러스, 아르테리바이러스(Arterivirus), 아스트로바이러스(Astrovirus), 아테린(Ateline) 헤르페스바이러스 군, 아우제키(Aujezky) 병 바이러스, 아우라(Aura) 바이러스, 아우스덕(Ausduk) 병 바이러스, 오스트리아 박쥐 리사바이러스(lyssavirus), 아비아데노바이러스, 조류 적아구증 바이러스, 조류 감염성 기관지염 바이러스, 조류 백혈병 바이러스, 조류 백혈증 바이러스, 조류 림프종증 바이러스, 조류 골수아구증 바이러스, 조류 파라믹소바이러스 (paramyxovirus), 조류 폐뇌염 바이러스, 조류 망상내피증 바이러스, 조류 육종 바이러스, 조류 C형 레트로바이러스 군, 조류헤파드나바이러스(Avihepadnavirus), 조류폭스바이러스(Avipoxvirus), B 바이러스, B19 바이러스, 바반키(Babanki) 바이러스, 비비(baboon) 헤르페스바이러스, 바큘로바이러스, 바마(Barmah) 삼림 바이러스, 베바루(Bebaru) 바이러스, 베리마(Berrimah) 바이러스, 베타레트로바이러스, 비르나바이러스(Birnavirus), 비트너(Bittner) 바이러스, BK 바이러스, 블랙 크릭 카날(Black Creek Canal) 바이러스, 청설 바이러스, 볼리비아 출혈열 바이러스, 보마 (Boma) 병 바이러스, 양 보더 (border) 병 바이러스, 보르나 (borna) 바이러스, 소 알파헤르페스바이러스 1, 소 알파헤르페스바이러스 2, 소 코로나바이러스, 소 일시 열 바이러스, 소 면역결핍 바이러스, 소 백혈병 바이러스, 소 백혈증 바이러스, 소 유두염 바이러스, 소 유두종바이러스, 소 구진 구내염 바이러스, 소 파르보바이러스, 소 세포융합 바이러스, 소 C형 옹코바이러스, 소 바이러스 설사 바이러스, 버기 크릭(Buggy Creek) 바이러스, 탄환(bullet) 형상 바이러스 군, 분얌웨라(Bunyamwera) 바이러스 초군(supergroup), 분야바이러스(Bunyavirus), 버킷(Burkitt) 림프종 바이러스, 브왐바(Bwamba) 열, CA 바이러스, 칼리시바이러스(Calicivirus), 캘리포니아 뇌염 바이러스, 낙타폭스(camelpox) 바이러스, 카나리폭스 바이러스, 개 헤르페스바이러스, 개 코로나바이러스, 개 디스템퍼(distemper) 바이러스, 개 헤르페스바이러스, 개 미니트(minute) 바이러스, 개 파르보바이러스, 카노 델가디토(Cano Delgadito) 바이러스, 염소 관절염 바이러스, 염소 뇌염 바이러스, 염소 헤르페스 바이러스, 카프리폭스(Capripox) 바이러스, 카르디오바이러스(Cardiovirus), 호저아목(caviid) 헤르페스바이러스 1, 긴꼬리원숭이과(Cercopithecid) 헤르페스바이러스 1, 긴꼬리원숭이과 헤르페스바이러스 1, 긴꼬리원숭이과 헤르페스바이러스 2, 챈디푸라 (Chandipura) 바이러스, 챈귀놀라(Changuinola) 바이러스, 얼룩메기(channel catfish) 바이러스, 샤를빌(Charleville) 바이러스, 수두 바이러스, 치쿤군야(Chikungunya) 바이러스, 침팬지 헤르페스바이러스, 처브(chub) 레오바이러스, 백연어(chum salmon) 바이러스, 코칼(Cocal) 바이러스, 은연어(Coho salmon) 레오바이러스, 성교 발진 바이러스, 콜로라도 진드기 열 바이러스, 콜티바이러스(Coltivirus), 콜롬비아 SK 바이러스, 감기 바이러스, 접촉 농창 바이러스, 접촉 농포 피부염 바이러스, 코로나바이러스(Coronavirus), 코리파르타(Corriparta) 바이러스, 코리자(coryza) 바이러스, 우두 바이러스, 콕사키(coxsackie) 바이러스, CPV (세포질 다면체형성(polyhedrosis) 바이러스), 귀뚜라미 마비 바이러스, 크림-콩고 출혈열 바이러스, 크루프(croup) 연관 바이러스, 크립토바이러스 (Cryptovirus), 사이포바이러스(Cypovirus), 거대세포바이러스, 거대세포바이러스 군, 세포질 다면체형성 바이러스, 사슴 유두종바이러스, 델타레트로바이러스, 뎅기(dengue) 바이러스, 덴소바이러스(Densovirus), 데펜도바이러스(Dependovirus), 도리(Dhori) 바이러스, 디플로마(diploma) 바이러스, 초파리(Drosophila) C 바이러스, 오리 B형 간염 바이러스, 오리 간염 바이러스 1, 오리 간염 바이러스 2, 두오바이러스(duovirus), 두벤하게(Duvenhage) 바이러스, 변형 날개 바이러스 DWV, 동부 말 뇌염 바이러스, 동부 말 뇌척수염 바이러스, EB 바이러스, 에볼라(Ebola) 바이러스, 에볼라-유사 바이러스, 에코(echo) 바이러스, 에코바이러스, 에코바이러스 10, 에코바이러스 28, 에코바이러스 9, 엑트로멜리아(ectromelia) 바이러스, EEE 바이러스, EIA 바이러스, EIA 바이러스, 뇌염 바이러스, 뇌심근염 군 바이러스, 뇌심근염 바이러스, 엔테로바이러스(Enterovirus), 효소 상승 바이러스, 효소 상승 바이러스 (LDH), 유행성 출혈열 바이러스, 동물유행성 출혈병 바이러스, 엡스타인 바아 바이러스, 말과 알파헤르페스바이러스 1, 말과 알파헤르페스바이러스 4, 말과 헤르페스바이러스 2, 말 유산 바이러스, 말 동맥염 바이러스, 말 뇌증 바이러스, 말 감염성 빈혈 바이러스, 말 모르빌리바이러스 (morbillivirus), 말 비폐렴 바이러스, 말 리노바이러스(rhinovirus), 유베난구(Eubenangu) 바이러스, 유럽 엘크(elk) 유두종바이러스, 유럽 돼지 열 바이러스, 에버글레이드(Everglades) 바이러스, 에야크(Eyach) 바이러스, 고양이과 헤르페스바이러스 1, 고양이 칼리시바이러스, 고양이 섬유육종 바이러스, 고양이 헤르페스바이러스, 고양이 면역결핍 바이러스, 고양이 감염성 복막염 바이러스, 고양이 백혈병/육종 바이러스, 고양이 백혈병 바이러스, 고양이 범백혈구감소증 바이러스, 고양이 파르보바이러스, 고양이 육종 바이러스, 고양이 세포융합 바이러스, 필로바이러스(Filovirus), 플랑드르(Flanders) 바이러스, 플라비바이러스(Flavivirus), 구제역 바이러스, 포트 모건(Fort Morgan) 바이러스, 포 코너스(Four Corners) 한타바이러스(hantavirus), 가금 아데노바이러스 1, 조류폭스 바이러스, 프렌드(Friend) 바이러스, 감마레트로바이러스, GB 간염 바이러스, GB 바이러스, 풍진(German measles) 바이러스, 게타(Getah) 바이러스, 긴팔원숭이 백혈병 바이러스, 선열 바이러스, 염소폭스 바이러스, 골든 샤이너(golden shinner) 바이러스, 고노메타(Gonometa) 바이러스, 거위 파르보바이러스, 과립증 바이러스, 그로쓰(Gross) 바이러스, 얼룩 다람쥐 B형 간염 바이러스, 군 A 아르보바이러스, 구아나리토(Guanarito) 바이러스, 기니 피그 거대세포바이러스, 기니 피그 C형 바이러스, 한탄(Hantaan) 바이러스, 한타바이러스, 대합 레오바이러스, 토끼 섬유종 바이러스, HCMV (인간 거대세포바이러스), 혈구흡착 바이러스 2, 일본 혈구응집성 바이러스, 출혈열 바이러스, 헨드라(hendra) 바이러스, 헤니파바이러스(Henipavirus), 헤파드나바이러스(Hepadnavirus), A형 간염 바이러스, B형 간염 바이러스 군, C형 간염 바이러스, D형 간염 바이러스, 델타 간염 바이러스, E형 간염 바이러스, F형 간염 바이러스, G형 간염 바이러스, 비A 비B형 간염 바이러스, 간염 바이러스, 간염 바이러스 (비인간), 간뇌척수염 레오바이러스 3, 헤파토바이러스(Hepatovirus), 왜가리 B형 간염 바이러스, 헤르페스 B 바이러스, 단순 헤르페스 바이러스, 단순 헤르페스 바이러스 1, 단순 헤르페스 바이러스 2, 헤르페스바이러스, 헤르페스바이러스 7, 헤르페스바이러스 거미원숭이(ateles), 헤르페스바이러스 호미니스(hominis), 헤르페스바이러스 감염, 헤르페스바이러스 다람쥐원숭이(saimiri), 헤르페스바이러스 돼지(suis), 헤르페스바이러스 수두(varicellae), 하이랜즈(Highlands) J 바이러스, 히라메(Hirame) 랍도바이러스(rhabdovirus), 돼지 콜레라 바이러스, 인간 아데노바이러스 2, 인간 알파헤르페스바이러스 1, 인간 알파헤르페스바이러스 2, 인간 알파헤르페스바이러스 3, 인간 B 림프친화 바이러스, 인간 베타헤르페스바이러스 5, 인간 코로나바이러스, 인간 거대세포바이러스 군, 인간 거품형성 바이러스, 인간 감마헤르페스바이러스 4, 인간 감마헤르페스바이러스 6, 인간 A형 간염 바이러스, 인간 헤르페스바이러스 1 군, 인간 헤르페스바이러스 2 군, 인간 헤르페스바이러스 3 군, 인간 헤르페스바이러스 4 군, 인간 헤르페스바이러스 6, 인간 헤르페스바이러스 8, 인간 면역결핍 바이러스, 인간 면역결핍 바이러스 1, 인간 면역결핍 바이러스 2, 인간 유두종바이러스, 인간 T 세포 백혈병 바이러스, 인간 T 세포 백혈병 바이러스 I, 인간 T 세포 백혈병 바이러스 II, 인간 T 세포 백혈병 바이러스 III, 인간 T 세포 림프종 바이러스 I, 인간 T 세포 림프종 바이러스 II, 인간 T 세포 림프친화 바이러스 1형, 인간 T 세포 림프친화 바이러스 2형, 인간 T 림프친화 바이러스 I, 인간 T 림프친화 바이러스 II, 인간 T 림프친화 바이러스 III, 이치노바이러스(Ichnovirus), 영아 위장염 바이러스, 감염성 소 비기관염 바이러스, 감염성 조혈 괴사 바이러스, 감염성 췌장 괴사 바이러스, 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 인플루엔자 바이러스 C, 인플루엔자 바이러스 D, 인플루엔자 바이러스 pr8, 곤충 무지개(iridescent) 바이러스, 곤충 바이러스, 이리도바이러스(iridovirus), 일본 B 바이러스, 일본 뇌염 바이러스, JC 바이러스, 주닌(Junin) 바이러스, 카포시 육종-연관 헤르페스바이러스, 케메로보(Kemerovo) 바이러스, 킬함(Kilham) 래트 바이러스, 클래머쓰(Klamath) 바이러스, 코롱고(Kolongo) 바이러스, 한국 출혈열 바이러스, 쿰바(kumba) 바이러스, 키야사나(Kysanur) 삼림병 바이러스, 키지라가흐(Kyzylagach) 바이러스, 라크로스(La Crosse) 바이러스, 락트산 탈수소효소 상승 바이러스, 락트산 탈수소효소 바이러스, 라고스(Lagos) 박쥐 바이러스, 랑구르(Langur) 바이러스, 라파인(lapine) 파르보바이러스, 라사(Lassa) 열 바이러스, 라사 바이러스, 잠복 래트 바이러스, LCM 바이러스, 리키(Leaky) 바이러스, 렌티바이러스, 레포리폭스바이러스(Leporipoxvirus), 백혈병 바이러스, 류코바이러스(leukovirus), 괴(lumpy) 피부병 바이러스, 림프절병 연관 바이러스, 림포크립토바이러스(Lymphocryptovirus), 림프구성 맥락수막염 바이러스, 림프증식성 바이러스 군, 마추포(Machupo) 바이러스, 유사광견병(mad itch) 바이러스, 포유동물 B형 옹코바이러스 군, 포유동물 B형 레트로바이러스, 포유동물 C형 레트로바이러스 군, 포유동물 D형 레트로바이러스, 유방 종양 바이러스, 마푸에라(Mapuera) 바이러스, 마르부르크(Marburg) 바이러스, 마르부르크-유사 바이러스, 메이슨 파이저 (Mason Pfizer) 원숭이 바이러스, 마스트아데노바이러스 (Mastadenovirus), 마야로(Mayaro) 바이러스, ME 바이러스, 홍역 바이러스, 메낭글 (Menangle) 바이러스, 멩고(Mengo) 바이러스, 멩고바이러스, 미델부르크 (Middelburg) 바이러스, 착유자(milkers) 결절 바이러스, 밍크 장염 바이러스, 마우스의 미니트 바이러스, MLV 관련 바이러스, MM 바이러스, 모코라(Mokola) 바이러스, 몰루시폭스바이러스(Molluscipoxvirus), 전염성 연종(Molluscum contagiosum) 바이러스, 원숭이 B 바이러스, 원숭이폭스 바이러스, 모노네가바이러스 (Mononegavirales), 모르빌리바이러스, 엘곤산(Mount Elgon) 박쥐 바이러스, 마우스 거대세포바이러스, 마우스 뇌척수염 바이러스, 마우스 간염 바이러스, 마우스 K 바이러스, 마우스 백혈병 바이러스, 마우스 유방 종양 바이러스, 마우스 미니트 바이러스, 마우스 페렴 바이러스, 마우스 회색척수염 바이러스, 마우스 폴리오마바이러스(polyomavirus), 마우스 육종 바이러스, 마우스폭스 바이러스, 모잠비크 (Mozambique) 바이러스, 무캄보(Mucambo) 바이러스, 점막병 바이러스, 이하선염 바이러스, 쥐과 베타헤르페스바이러스 1, 쥐과 거대세포바이러스 2, 뮤린 거대세포바이러스 군, 뮤린 뇌척수염 바이러스, 뮤린 간염 바이러스, 뮤린 백혈병 바이러스, 뮤린 결절 유발 바이러스, 뮤린 폴리오마바이러스, 뮤린 육종 바이러스, 뮤로메갈로바이러스(Muromegalovirus), 머레이 계곡(Murray Valley) 뇌염 바이러스, 점액종 바이러스, 믹소바이러스, 믹소바이러스 멀티포름 (Myxovirus multiforme), 믹소바이러스 파로티티디스 (Myxovirus parotitidis), 나이로비(Nairobi) 양 병 바이러스, 나이로바이러스(Nairovirus), 나니르나바이러스(Nanirnavirus), 나리바 (Nariva) 바이러스, 두모(Ndumo) 바이러스, 니슬링(Neethling) 바이러스, 넬슨 베이 (Nelson Bay) 바이러스, 신경친화 바이러스, 뉴월드(New World) 아레나바이러스, 신생아 페렴 바이러스, 뉴캐슬 (Newcastle) 병 바이러스, 니파(Nipah) 바이러스, 비세포병원성 바이러스, 노르워크 (Norwalk) 바이러스, 핵 다면체형성 바이러스 (NPV), 니플 넥(nipple neck) 바이러스, 오뇽뇽(O'nyong'nyong) 바이러스, 옥켈보(Ockelbo) 바이러스, 발암 바이러스, 발암 바이러스 유사 입자, 온코르나바이러스 (oncornavirus), 오르비바이러스(Orbivirus), 오르프(Orf) 바이러스, 오로푸치(Oropouche) 바이러스, 오르토헤파드나바이러스, 오르토믹소바이러스, 오르토폭스바이러스, 오르토레오바이러스, 오룽고 (Orungo), 양 유두종바이러스, 양 카타르열 바이러스, 올빼미 원숭이 헤르페스바이러스, 파리얌(Palyam) 바이러스, 유두종바이러스, 파필로마바이러스 실빌라지 (Papillomavirus sylvilagi), 파포바바이러스 (Papovavirus), 파라인플루엔자 바이러스, 파라인플루엔자 바이러스 1형, 파라인플루엔자 바이러스 2형, 파라인플루엔자 바이러스 3형, 파라인플루엔자 바이러스 4형, 파라믹소바이러스, 파라폭스바이러스(Parapoxvirus), 유사종두 (paravaccinia) 바이러스, 파르보바이러스, 파르보바이러스 B19, 파르보바이러스 군, 페스티바이러스 (Pestivirus), 펠보바이러스 (Phlebovirus), 바다표범 디스템퍼 바이러스, 피코드나바이러스(Picodnavirus), 피코르나바이러스(Picornavirus), 돼지 거대세포바이러스, 구두(pigeonpox) 바이러스, 피리(Piry) 바이러스, 픽수나 (Pixuna) 바이러스, 마우스의 페렴 바이러스, 뉴모바이러스(Pneumovirus), 회색척수염 바이러스, 폴리오바이러스, 폴리드나바이러스(Polydnavirus), 다면체 바이러스, 폴리오마 바이러스, 폴리오마바이러스, 폴리오마바이러스 보비스(Polyomavirus bovis), 폴리오마바이러스 세르코피테시(Polyomavirus cercopitheci), 폴리오마바이러스 호미니스(Polyomavirus hominis) 2, 폴리오마바이러스 마카카에 (Polyomavirus maccacae) 1, 폴리오마바이러스 뮤리스(Polyomavirus muris) 1, 폴리오마바이러스 뮤리스 2, 폴리오마바이러스 파피오니스(Polyomavirus papionis) 1, 폴리오마바이러스 파피오니스 2, 폴리오마바이러스 실빌라지 (Polyomavirus sylvilagi), 폰진(Pongine) 헤르페스바이러스 1, 돼지 유행성 설사 바이러스, 돼지 혈구응집성 뇌척수염 바이러스, 돼지 파르보바이러스, 돼지 전염성 위장염 바이러스, 돼지 C형 바이러스, 폭스 바이러스, 폭스바이러스, 폭스바이러스 바리올라스(variolas), 프로스펙트 힐(Prospect Hill) 바이러스, 프로바이러스(Provirus), 가성우두 바이러스, 가성광견병 바이러스, 앵무새폭스 바이러스, 메추라기폭스 바이러스, 토끼 섬유종 바이러스, 토끼 신장 액포 바이러스, 토끼 유두종바이러스, 광견병 바이러스, 너구리 파르보바이러스, 너구리폭스 바이러스, 라니켓(Ranikhet) 바이러스, 래트 거대세포바이러스, 래트 파르보바이러스, 래트 바이러스, 라우쳐(Rauscher) 바이러스, 재조합 우두 바이러스, 재조합 바이러스, 레오바이러스, 레오바이러스 1, 레오바이러스 2, 레오바이러스 3, 파충류 C형 바이러스, 호흡기 감염 바이러스, 호흡기 세포융합 바이러스, 호흡기 바이러스, 망상내피증 바이러스, 랍도바이러스, 랍도바이러스 카르피아(Rhabdovirus carpia), 라디노바이러스 (Rhadinovirus), 리노바이러스, 리지디오바이러스(Rhizidiovirus), 리프트 계곡 (Rift Valley) 열 바이러스, 라일리(Riley) 바이러스, 우역(rinderpest) 바이러스, RNA 종양 바이러스, 로스강(Ross River) 바이러스, 로타바이러스(Rotavirus), 루즈올(rougeole) 바이러스, 라우스 (Rous) 육종 바이러스, 풍진 바이러스, 홍역 바이러스, 루비바이러스(Rubivirus), 러시아 가을 뇌염 바이러스, SA 11 원숭이(simian) 바이러스, SA2 바이러스, 사비아(Sabia) 바이러스, 사기야마(Sagiyama) 바이러스, 다람쥐원숭이 헤르페스바이러스 1, 타액선 바이러스, 모래파리 열 바이러스 군, 샌드짐바(Sandjimba) 바이러스, SARS 바이러스, SDAV (타액선누선염 바이러스), 물개폭스 바이러스, 셈리키 삼림열 바이러스, 서울(Seoul) 바이러스, 양폭스 바이러스, 쇼프(Shope) 섬유종 바이러스, 쇼프 유두종 바이러스, 원숭이 거품형성 바이러스, 원숭이 A형 간염 바이러스, 원숭이 인간 면역결핍 바이러스, 원숭이 면역결핍 바이러스, 원숭이 파라인플루엔자 바이러스, 원숭이 T 세포 림프친화 바이러스, 원숭이 바이러스, 원숭이 바이러스 40, 심플렉스바이러스(Simplexvirus), 신놈브레(Sin Nombre) 바이러스, 신드비스 바이러스, 천연두 바이러스, 사우스아메리카 출혈열 바이러스, 참새폭스 바이러스, 스푸마바이러스(Spumavirus), 다람쥐 섬유종 바이러스, 다람쥐 원숭이 레트로바이러스, SSV 1 바이러스 군, STLV (원숭이 T 림프친화 바이러스) I형, STLV (원숭이 T 림프친화 바이러스) II형, STLV (원숭이 T 림프친화 바이러스) III형, 구진 구내염 바이러스, 악하(submaxillary) 바이러스, 멧돼지과 알파헤르페스바이러스 1, 멧돼지과 헤르페스바이러스 2, 수이폭스바이러스(Suipoxvirus), 습지 열 바이러스, 돼지폭스 바이러스, 스위스 마우스 백혈병 바이러스, TAC 바이러스, 타카리브 콤플렉스(Tacaribe complex) 바이러스, 타카리브 바이러스, 타나폭스(Tanapox) 바이러스, 타테라폭스 (Taterapox) 바이러스, 잉어(Tench) 레오바이러스, 타일러(Theiler) 뇌척수염 바이러스, 타일러 바이러스, 토고토(Thogoto) 바이러스, 토타팔라얌(Thottapalayam) 바이러스, 진드기 매개 뇌염 바이러스, 티오만(Tioman) 바이러스, 토가바이러스(Togavirus), 토로바이러스(Torovirus), 종양 바이러스, 투파이아(Tupaia) 바이러스, 칠면조 비기관염 바이러스, 칠면조폭스 바이러스, C형 레트로바이러스, D형 옹코바이러스, D형 레트로바이러스 군, 궤양병 랍도바이러스, 우나(Una) 바이러스, 우우쿠니미(Uukuniemi) 바이러스 군, 우두 바이러스, 액포 바이러스, 수두 대상포진 바이러스, 바리셀로바이러스(Varicellovirus), 바리콜라(Varicola) 바이러스, 대두창 바이러스, 두창 바이러스, 바신 기수(Vasin Gishu) 병 바이러스, VEE 바이러스, 베네주엘라 말 뇌염 바이러스, 베네주엘라 말 뇌척수염 바이러스, 베네주엘라 출혈열 바이러스, 소포 구내염 바이러스, 베지쿨로바이러스 (Vesiculovirus), 빌류이스크(Vilyuisk) 바이러스, 독사 레트로바이러스, 바이러스 출혈성 패혈증 바이러스, 비스나 매디(Visna Maedi) 바이러스, 비스나 바이러스, 들쥐폭스 바이러스, VSV (소포 구내염 바이러스), 왈랄(Wallal) 바이러스, 와레고 (Warrego) 바이러스, 사마귀 바이러스, WEE 바이러스, 서부 나일(West Nile) 바이러스, 서부 말 뇌염 바이러스, 서부 말 뇌척수염 바이러스, 와타로아(Whataroa) 바이러스, 동계 구토증 바이러스, 우드척(woodchuck) B형 간염 바이러스, 울리 (woolly) 원숭이 육종 바이러스, 운드(wound) 종양 바이러스, WRSV 바이러스, 야바 (Yaba) 원숭이 종양 바이러스, 야바 바이러스, 야타폭스바이러스(Yatapoxvirus), 황열 바이러스, 또는 유기 보그다노비치 (Yug Bogdanovac) 바이러스.
박테리아 항원은 다음과 같은 박테리아로부터 유래한다: 아세토박터 오란티우스(Acetobacter aurantius), 아시네토박터 바우만니이 (Acinetobacter baumannii), 악티노마이세스 이스라엘리이(Actinomyces israelii), 아그로박테리움 라디오박터(Agrobacterium radiobacter), 아그로박테리움 투메파시엔스 (Agrobacterium tumefaciens), 아조리조비움 콜리노단스(Azorhizobium caulinodans), 아조박터 비네란디이(Azotobacter vinelandii), 아나플라스마 파고사이토필룸 (Anaplasma phagocytophilum), 바실루스 안트락시스(Bacillus anthracis), 바실루스 브레비스(Bacillus brevis), 바실루스 세레우스(Bacillus cereus), 바실루스푸시포르미스(Bacillus fusiformis), 바실루스 리케니포르미스(Bacillus licheniformis), 바실루스 메가테리움(Bacillus megaterium), 바실루스 미코이데스(Bacillus mycoides), 바실루스 스테아로테르모필루스(Bacillus stearothermophilus), 바실루스 서브틸리스(Bacillus subtilis), 박테리오데스 프라질리스 (Bacteroides fragilis), 박테리오데스 징기발리스 (Bacteroides gingivalis), 박테리오데스 멜라미노게니쿠스 (Bacteroides melaminogenicus) (프레보텔라 멜라미노게니카(Prevotella melaminogenica)), 바르토넬라 헨셀라에(Bartonella henselae), 바르토넬라 퀸타나(Bartonella quintana), 보르데텔라 브론키셉티카(Bordetella bronchiseptica), 보르데텔라 페르투시스(Bordetella pertussis), 보렐리아 부르그도르페리(Borrelia burgdorferi), 브루셀라 아보르투스(Brucella abortus), 브루셀라 멜리텐시스(Brucella melitensis), 브루셀라 수이스(Brucella suis), 부르크홀데리아(Burkholderia), 부르크홀데리아 말레이 (Burkholderia mallei), 부르크홀데리아 슈도말레이(Burkholderia pseudomallei), 부르크홀데리아 카페시아(Burkholderia cepacia), 칼림마토박테리움 그라눌로마티스 (Calymmatobacterium granulomatis), 캄필로박터 콜리(Campylobacter coli), 캄필로박터 페투스(Campylobacter fetus), 캄필로박터 제주니(Campylobacter jejuni), 캄필로박터 필로리(Campylobacter pylori), 클라미디아 트라코마티스(Chlamydia trachomatis), 클라미도필라 뉴모니아에 (Chlamydophila pneumoniae) (클라미디아뉴모니아에(Chlamydia pneumoniae)), 클라미도필라 시타시(Chlamydophila psittaci) (클라미디아 시타시(Chlamydia psittaci)), 클로스트리디움 보툴리눔 (Clostridium botulinum), 클로스트리디움 디피실레(Clostridium difficile), 클로스트리디움 페르프리겐스(Clostridium perfringens) (이전에 클로스트리디움 웰치이 (Clostridium welchii)로 불림), 클로스트리디움 테타니(Clostridium tetani), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 코리네박테리움 푸시포르메(Corynebacterium fusiforme), 콕시엘라 부르네티이(Coxiella burnetii), 에를리치아 샤페엔시스(Ehrlichia chaffeensis), 엔테로박터 클로아카에(Enterobacter cloacae), 엔테로코쿠스 아비움(Enterococcus avium), 엔테로코쿠스 두란스 (Enterococcus durans), 엔테로코쿠스 패칼리스(Enterococcus faecalis), 엔테로코쿠스 파에시움(Enterococcus faecium), 엔테로코쿠스 갈리나룸(Enterococcus galllinarum), 엔테로코쿠스 말로라투스(Enterococcus maloratus), 에스케리키아 콜리(Escherichia coli), 프란시셀라 툴라렌시스(Francisella tularensis), 푸소박테리움 누클레아툼(Fusobacterium nucleatum), 가드네렐라 바지날리스(Gardnerella vaginalis), 헤모필루스 두크레이이(Haemophilus ducreyi), 헤모필루스 인플루엔자 (Haemophilus influenza), 헤모필루스 파라인플루엔자에(Haemophilus parainfluenzae), 헤모필루스 페르투시스(Haemophilus pertussis), 헤모필루스 바지날리스(Haemophilus vaginalis), 헬리코박터 필로리(Helicobacter pylori), 클레브시엘라 뉴모니아(Klebsiella pneumonia), 락토바실루스 아시도필루스 (Lactobacillus acidophilus), 락토바실루스 카세이(Lactobacillus casei), 락토코쿠스 락티스(Lactococcus lactis), 레지오넬라 뉴모필라(Legionella pneumophila), 리스테리아 모노사이토제네스(Listeria monocytogenes), 메타노박테리움 엑스트로켄스(Methanobacterium extroquens), 미크로박테리움 멀티포르메(Microbacterium multiforme), 미크로코쿠스 루테우스(Micrococcus luteus), 모락셀라 카타랄리스 (Moraxella catarrhalis), 미코박테리움 아비움(Mycobacterium avium), 미코박테리움 보비스(Mycobacterium bovis), 미코박테리움 디프테리아(Mycobacterium diphtheria), 미코박테리움 인트라셀룰라레(Mycobacterium intracellulare), 미코박테리움 레프라에(Mycobacterium leprae), 미코박테리움 레프라에무리움 (Mycobacterium lepraemurium), 미코박테리움 플레이(Mycobacterium phlei), 미코박테리움 스메그마티스(Mycobacterium smegmatis), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 마이코플라스마 페르멘탄스(Mycoplasma fermentans), 마이코플라스마 제니탈리움(Mycoplasma genitalium), 마이코플라스마 호미니스(Mycoplasma hominis), 마이코플라스마 페네트란스(Mycoplasma penetrans), 마이코플라스마 뉴모니아(Mycoplasma pneumonia), 락토바실루스 불가리쿠스(Lactobacillus Bulgaricus), 나이세리아 고노로레아에(Neisseria gonorrhoeae), 나이세리아 메닝기티데스(Neisseria meningitides), 파스퇴렐라 물토시다(Pasteurella multocida), 파스퇴렐라 툴라렌시스(Pasteurella tularensis), 펩토스트렙토코쿠스(Peptostreptococcus), 포르피로모나스 징기발리스 (Porphyromonas gingivalis), 슈도모나스 애루기노사(Pseudomonas aeruginosa), 리조비움 라디오박터(Rhizobium radiobacter), 리케치아 프로와제키이(Rickettsia prowazekii), 리케치아 시타시(Rickettsia psittaci), 리케치아 퀸타나(Rickettsia Quintana), 리케치아 리케치이(Rickettsia rickettsii), 리케치아 트라코마스(Rickettsia trachomas), 로칼리마에아 헨셀라에(Rochalimaea henselae), 로칼리마에아 퀸타나(Rochalimaea quintana), 로치아 덴토카리오사(Rothia dentocariosa), 살모넬라 엔테리티디스(Salmonella enteritidis), 살모넬라 티피(Salmonella typhi), 살모넬라 티피무리움(Salmonella typhimurium), 세라티아 마르세센스(Serratia marcescens), 쉬겔라 디센테리아에(Shigella dysenteriae), 스타필로코쿠스 아우레우스(Staphylococcus aureus), 스타필로코쿠스 에피더미디스 (Staphylococcus epidermidis), 스테노트로포모나스 말토필리아(Stenotrophomonas maltophilia), 스트렙토코쿠스 아갈락티아에(Streptococcus agalactiae), 스트렙토코쿠스 아비움(Streptococcus avium), 스트렙토코쿠스 보비스(Streptococcus bovis), 스트렙토코쿠스 크리세투스(Streptococcus cricetus), 스트렙토코쿠스 파세이움(Streptococcus faceium), 스트렙토코쿠스 패칼리스(Streptococcus faecalis), 스트렙토코쿠스 페러스(Streptococcus ferus), 스트렙토코쿠스 갈리나룸(Streptococcus gallinarum), 스트렙토코쿠스 락티스(Streptococcus lactis), 스트렙토코쿠스 미티오르(Streptococcus mitior), 스트렙토코쿠스 미티스 (Streptococcus mitis), 스트렙토코쿠스 뮤탄스(Streptococcus mutans), 스트렙토코쿠스 오랄리스(Streptococcus oralis), 스트렙토코쿠스 뉴모니아(Streptococcus pneumonia), 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 스트렙토코쿠스 라투스(Streptococcus rattus), 스트렙토코쿠스 살리바리우스(Streptococcus salivarius), 스트렙토코쿠스 상구이스(Streptococcus sanguis), 스트렙토코쿠스 소브리누스(Streptococcus sobrinus), 트레포네마 팔리둠(Treponema pallidum), 트레포네마 덴티콜라(Treponema denticola), 비브리오 콜레라(Vibrio cholera), 비브리오 콤마(Vibrio comma), 비브리오 파라해몰리티쿠스(Vibrio parahaemolyticus), 비브리오 불니피쿠스(Vibrio vulnificus), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 예르시니아 페스티스(Yersinia pestis), 또는 예르시니아 슈도투베르쿨로시스(Yersinia pseudotuberculosis).
진균 항원은 다음과 같은 진균으로부터 유래된다: 압시디아 코림비페라 (Absidia corymbifera), 아젤로마이세스 캅술라투스(Ajellomyces capsulatus), 아젤로마이세스 더마티티디스(Ajellomyces dermatitidis), 아르트로더마 벤하미아에(Arthroderma benhamiae), 아르트로더마 풀붐(Arthroderma fulvum), 아르트로더마 깁세움(Arthroderma gypseum), 아르트로더마 인쿠르바툼(Arthroderma incurvatum), 아르트로더마 오타에(Arthroderma otae), 아르트로더마 반브에우세게미이(Arthroderma vanbreuseghemii), 아스페르길러스 플라부스(Aspergillus flavus), 아스페르길러스 푸미가테스(Aspergillus fumigates), 아스페르길러스 니거(Aspergillus niger), 블라스토마이세스 더마티티디스(Blastomyces dermatitidis), 칸디다 알비칸스(Candida albicans), 칸디다 글라브라타(Candida glabrata), 칸디다 길리어몬디이(Candida guilliermondii), 칸디다 크루세이 (Candida krusei), 칸디다 파라실로시스((Candida parapsilosis), 칸디다 트로피칼리스(Candida tropicalis), 칸디다 펠리쿨로사(Candida pelliculosa), 클라도피아로포라 카리오니이(Cladophialophora carrionii), 코시디오이데스 이미티스(Coccidioides immitis), 크립토코쿠스 네오포르만스(Cryptococcus neoformans), 쿤닝가멜라(Cunninghamella) 종, 에피더모파이톤 플로코숨(Epidermophyton floccosum), 엑소피알라 더마티티디스(Exophiala dermatitidis), 필로바시디엘라 네오포르만스(Filobasidiella neoformans), 폰세카에아 페드로소이(Fonsecaea pedrosoi), 푸사리움 솔라니(Fusarium solani), 게오트리쿰 칸디둠(Geotrichum candidum), 히스토플라스마 캅술라툼(Histoplasma capsulatum), 호르타에아 베르넥키이(Hortaea werneckii), 이사트센키아 오리엔탈리스(Issatschenkia orientalis), 만두렐라 그리사에(Madurella grisae), 말라세지아 푸르푸르(Malassezia furfur), 말라세지아 글로보사(Malassezia globosa), 말라세지아 옵투세(Malassezia obtuse), 말라세지아 파키더마티스(Malassezia pachydermatis), 말라세지아 레스트릭타(Malassezia restricta), 말라세지아 슬루피아에(Malassezia slooffiae), 말라세지아 심포디알리스(Malassezia sympodialis), 미크로스포룸 카니스 (Microsporum canis), 미크로스포룸 풀붐(Microsporum fulvum), 미크로스포룸 깁세움(Microsporum gypseum), 무코르 시르시넬로이데스(Mucor circinelloides), 넥트리아 해마토코카(Nectria haematococca), 파에실로마이세스 바리오티이(Paecilomyces variotii), 파라코시디오이데스 브라실리엔시스(Paracoccidioides brasiliensis), 페니실리움 마르네페이(Penicillium marneffei), 피키아 아노말라(Pichia anomala), 피키아 길리어몬디이(Pichia guilliermondii), 뉴모시스티스 카리니이 (Pneumocystis carinii), 슈달레쉐리아 보이디이(Pseudallescheria boydii), 리조푸스 오리자에(Rhizopus oryzae), 로도토루라 루브라(Rhodotorula rubra), 스케도스포리움 아피오스페르뭄(Scedosporium apiospermum), 쉬조필룸 코뮨 (Schizophyllum commune), 스포로트릭스 센키이(Sporothrix schenckii), 트리코파이톤 멘타그로피테스(Trichophyton mentagrophytes), 트리코파이톤 루브룸 (Trichophyton rubrum), 트리코파이톤 베루코숨(Trichophyton verrucosum), 트리코파이톤 비올라세움(Trichophyton violaceum), 트리코스포론 아사히이(Trichosporon asahii), 트리코스포론 쿠타네움(Trichosporon cutaneum), 트리코스포론 인킨 (Trichosporon inkin), 및 트리코스포론 무코이데스(Trichosporon mucoides).
기생충 항원은 다음 기생충으로부터의 면역원성 단백질 또는 그의 단편을 포함하고 이로 제한되지 않는다: 아칸타메바(Acanthamoeba: 가시아메바), 아프리카 트리파노소마증(trypanosomiasis: 파동편모충증), 에키노코쿠스 그라눌로수스 (Echinocococcus granulosus: 단방조충), 에키노코쿠스 멀티로쿠라리스 (Echinococcus multilocularis: 다방조충), 엔타메바 히스톨리티카(Entamoeba histolytica: 이질아메바), 트리파노소마 크루지(Trypanosoma cruzi: 크루스 파동편모충), 아스카리스 룸브리코이데스(Ascaris lumbricoides: 회충), 안지오스트롱기러스 칸토넨시스(Angiostrongylus cantonensis: 광동주혈선충), 고래회충과 (anisakid) 선충, 바베시아 미크로티(Babesia microti: 쥐바베스열원충), 발란티듐 콜리(Balantidium coli: 대장 발란티움), 시멕스 렉툴라리우스(Cimex lectularius: 빈대), 발라무티아 만드릴라리스(Balamuthia mandrillaris), 베이리사스카리스 (Baylisascaris), 쉬스토소마 만소니(Schistosoma mansoni: 만손주혈흡충), 에스. 해마토비움(S. haematobium: 방광주혈흡충), 에스. 자포니쿰(S. japonicum: 일본 주혈흡충), 쉬스토소마 마소니(Schistosoma masoni), 쉬스토소마 인테르칼라툼 (Schistosoma intercalatum: 장간막주혈흡충), 비. 호미니스(B. hominis), 몸니 (body lice), 카필라리아 헤파티카(Capillaria hepatica: 간 모세선충), 카필라리아 필리피넨시스(Capillaria philippinensis: 창자 모세선충), 오스트로비라르지아 바리글란디스(Austrobilharzia variglandis), 킬로마스틱스 메스니리(Chilomastix mesnili: 메닐편모충), 엔도리막스 나나(Endolimax nana: 왜소아메바), 엔타메바 콜리(Entamoeba coli: 대장아메바), 엔타메바 디스파르(Entamoeba dispar: 동형아메바), 엔타메바 하트만니(Entamoeba hartmanni: 작은아메바), 엔타메바 폴레키 (Entamoeba polecki: 폴레키 아메바), 이오다메바 부데치리이(Iodamoeba buetschlii: 요드아메바), 씨. 시넨시스(C. sinensis: 간흡충), 안실로스토마 브라질렌스(Ancylostoma brazilense: 브라질구충), 에이. 카니눔(A. caninum), 에이. 세이라니쿰(A. ceylanicum: 실론구충), 운시나리아 스테노세팔라(Uncinaria stenocephala), 이 (lice), 크립토스포리디움(Cryptosporidium: 와포자충), 시클로스포라 카에타넨시스(Cyclospora cayetanensis: 북미원포자충), 타에니아(Taenia; 조충), 시스토이소스포라 벨리(Cystoisospora belli), 디엔타메바 프라질리스 (Dientamoeba fragilis: 이핵아메바), 디필로보트륨 란툼(Diphyllobothrium latum: 광절열두조충), 디피리디움 카니눔(Dipylidium caninum: 개조충), 드라쿤쿨러스 메디넨시스(Dracunculus medinensis: 메디나충), 지아르디아 인테스티날리스 (Giardia intestinalis: 장 편모충), 브루기아 말라이(Brugia malayi: 말레이사상충), 엔타메바 히스톨리티카, 엔테로비우스 베르미쿨라리스(Enterobius vermicularis: 요충), 파시올라 헤파티카(Fasciola hepatica: 간질), 파시올라 기간티카(Fasciola gigantica: 거대간질), 파시올롭시스 부스키(Fasciolopsis buski: 거대흡충), 톡소플라스마 곤디이(Toxoplasma gondii: 톡소포자충), 트리키넬라 스피랄리스 (Trichinella spiralis: 선모충), 지아르디아 람블리아(Giardia lamblia: 람블 편모충), 지아르디아 듀오데날리스(Giardia duodenalis), 그나소스토마 스피니게룸 (Gnathostoma spinigerum: 유극 턱구충), 헤테로피에스 헤테로피에스(Heterophyes heterophyes: 이형흡충), 하이메노렙시스 나나(Hymenolepis nana: 왜소조충), 리슈마니아 프로마스티고테스(Leishmania promastigotes), 페디쿨러스 휴마누스 카피티스(Pediculus humanus capitis: 머릿니), 페디쿨러스 휴마누스 코포리스(Pediculus humanus corporis: 몸니), 프티러스 푸비스(Pthirus pubis), 로아 로아(Loa loa: 로아 사상충), 플라스모듐 비박스(Plasmodium vivax: 삼일열원충), 플라스모듐 오발레(Plasmodium ovale: 난형열원충), 플라스모듐 팔시파룸(Plasmodium falciparum: 열대열원충), 플라스모듐 말라리아에(Plasmodium malariae: 사일열원충), 플라스모듐 요엘리이(Plasmodium yoelii), 플라스모듐 부바리스(Plasmodium bubalis), 플라스모듐 죽스타누클레아레(Plasmodium juxtanucleare), 플라스모듐 시르쿰플렉숨(Plasmodium circumflexum), 플라스모듐 레릭툼(Plasmodium relictum), 플라스모듐 레릭툼, 플라스모듐 보가니(Plasmodium vaughani), 플라스모듐 미나센스(Plasmodium minasense), 플라스모듐 아가매(Plasmodium agamae), 플라스모듐 도미니쿰(Plasmodium dominicum), 브라키올라 알게라에(Brachiola algerae), 비. 콘노리(B. connori), 비. 베지쿨라룸(B. vesicularum), 엔세팔리토준 쿠니쿨리(Encephalitozoon cuniculi), 이. 헬렘(E. hellem), 이. 인테스티날리스(E. intestinalis), 엔테로사이토준 비에네우시(Enterocytozoon bieneusi: 돼지 미포자충), 미크로스포리디움 세일로넨시스(Microsporidium ceylonensis), 엠. 아프리카눔 (M. africanum), 노세마 오쿨라룸(Nosema ocularum), 플라이스토포라 (Pleistophora) 종, 트라키플라이스토포라 호미니스(Trachipleistophora hominis), 티. 안트로프테라(T. anthropophthera), 비타포르마 코르네아에(Vittaforma corneae), 사르콥테스 스카비에이 변종 호미니스(Sarcoptes scabiei var. hominis: 옴진드기), 더마토비아 호미니스(Dermatobia hominis), 네글레리아 파우레리 (Naegleria fowleri: 파울러 자유아메바), 톡소카라 카니스(Toxocara canis: 개회충), 톡소카라 카티(Toxocara cati: 고양이회충), 온코세르카 볼부루스(Onchocerca volvulus: 회선사상충), 오피스토라키스 페리네우스(Opisthorchis felineus: 고양이 간흡충), 파라고니무스 웨스테르마니(Paragonimus westermani: 폐흡충), 뉴모시스티스 지로베시이(Pneumocystis jirovecii), 사피니아 디플로이데아(Sappinia diploidea), 사피니아 페다타(Sappinia pedata), 트리파노소마 브루세이 (Trypanosoma brucei: 브루스 파동편모충), 트리쿠리스 트리키우라(Trichuris trichiura: 편충), 아스카리스 룸브리코이데스, 안실로스토마 듀오데날레 (Anclostoma duodenale: 십이지장충), 네카토르 아메리카누스(Necator americanus: 아메리카구충), 스트롱길로이데스(Strongyloides stercoralis: 분선충), 스트롱길로이데스 피일레보르니(Strongyloides fiilleborni), 카필라리아 필리피넨시스, 태니아 사기나타(Taenia saginata: 무구조충), 태니아 솔리움(Taenia solium; 유구조충), 태니아 아시아티카(Taenia asiatica: 아시아조충), 톡소플라스마 곤디이, 트리키넬라, 또는 트리코모나스 바지날리스(Trichomonas vaginalis: 질트리코모나스).
암 항원은 개별 종양에 특이적인 단백질 또는 그의 단편이다. 예를 들어, 동일한 개체로부터 대조군 샘플 또는 정상 조직 또는 공지의 표준 대조군 값에 비해 종양 샘플 내에서 과발현되는 단백질이 종양-특이적 항원인 것으로 간주된다. 종양 특이적 항원을 코딩하는 RNA가 종양 특이적 항원을 생산하기 위해 세포에 투여될 수 있다. 종양 특이적 항원 또는 암 항원 또는 그의 단편은 예를 들어, HER2, BRCA1, 전립선-특이적 막 항원 (PSMA), MART-1/MelanA, 전립선 혈청 항원 (PSA), 편평 세포 암종 항원 (SCCA), 난소암 항원 (OCA), 췌장암 연관 항원 (PaA), MUC-1, MUC-2, MUC-3, MUC-18, 암-배아 항원 (CEA), 다형성 상피 뮤신 (PEM), 톰슨-프리덴라이히(Thomsen-Friedenreich) (T) 항원, gp100, 티로시나제, TRP-1, TRP-2, NY-ESO-1, CDK-4, b-카테닌, MUM-1, 카스파제-8, KIAA0205, HPVE7, SART-1, SART-2, PRAME, BAGE-1, DAGE-1, RAGE-1, NAG, TAG-72, CA125, 돌연변이된 p21ras, 돌연변이된 p53, HPV16 E7, RCC-3.1.3, MAGE-1, MAGE-2, MAGE-3, MAGE-4, MAGE-11, GAGE-I, GAGE-6, GD2, GD3, GM2, TF, sTn, gp75, EBV-LMP 1, EBV-LMP 2, HPV-F4, HPV-F6, HPV-F7, 알파-페토단백질 (AFP), CO17-1A, GA733, gp72, p-HCG, gp43, HSP-70, p17 mel, HSP-70, gp43, HMW, HOJ-1, HOM-MEL-55, NY-COL-2, HOM-HD-397, HOM-RCC-1.14, HOM-HD-21, HOM-NSCLC-11, HOM-MEL-2.4, HOM-TES-11, 흑색종 갱글리오사이드, TAG-72, 전립선 산 포스파타제, 단백질 MZ2-E, 폴레이트-결합-단백질 LK26, 말단절단 상피 성장 인자 수용체 (EGFR), GM-2 및 GD-2 갱글리오사이드, 다형성 상피 뮤신, 폴레이트-결합 단백질 LK26, 췌장 종양태아 항원, 암 항원 15-3, 암 항원 19-9, 암 항원 549, 암 항원 195 또는 그의 단편으로부터 선택된 항원을 포함할 수 있다.
본 발명의 RNA은 또한 알츠하이머 질환 항원 또는 그의 단편을 코딩할 수 있다. 알츠하이머 질환 항원은 알츠하이머 질환이 있는 대상체에서 선택적으로 발현된 항원이다. 알츠하이머 질환이 있는 대상체 선택적으로 발현된 항원은 알츠하이머 질환이 있는 대상체에서 발현되지만, 알츠하이머 질환이 없는 대상체에서 발현되지 않거나 보다 낮은 수준으로 발현되는 항원이다. 대안적으로, 이것은 알츠하이머 질환이 없는 대상체에 비해 알츠하이머 질환이 있는 대상체에서 과발현된 항원이다. 알츠하이머 질환 항원은 예를 들어, A68, Aβ40, Aβ42 또는 그의 단편일 수 있다.
전달 비히클 또는 형질감염 시약, 예컨대 리포솜, 나노캡슐, 미세입자, 미세구, 지질 입자, 소낭 등이 본 발명의 핵산의 세포 및 유기체 내로의 도입을 위해 사용될 수 있다. 특히, 핵산은 지질 입자, 리포솜, 소낭, 나노구체, 또는 나노입자 등 내에 캡슐화되어 전달을 위해 제제화될 수 있다.
형질감염 시약은 양이온성 지질, 예컨대 리포펙틴, 양이온성 글리세롤 유도체, 및 다가양이온성 분자, 예컨대 폴리리신을 포함하고 이로 제한되지 않는다. 상업적으로 이용가능한 형질감염 시약의 예는 예를 들어 리포펙타민(Lipofectamine)™ (인비트로젠 (Invitrogen; 미국 캘리포니아주 칼스바드)), 리포펙타민 2000™ (인비트로젠; 미국 캘리포니아주 칼스바드), 293fectin™ (인비트로젠; 미국 캘리포니아주 칼스바드), 셀펙틴(Cellfectin)™ (인비트로젠; 미국 캘리포니아주 칼스바드), DMRIE-C™ (인비트로젠; 미국 캘리포니아주 칼스바드), 프리스타일(FreeStyle)™ 맥스(MAX) (인비트로젠; 미국 캘리포니아주 칼스바드), 리포펙타민™ 2000 CD (인비트로젠; 미국 캘리포니아주 칼스바드), 리포펙타민™ (인비트로젠; 미국 캘리포니아주 칼스바드), RNAiMAX (인비트로젠; 미국 캘리포니아주 칼스바드), 올리고펙타민(Oligofectamine)™ (인비트로젠; 미국 캘리포니아주 칼스바드), 옵티펙트(Optifect)™ (인비트로젠; 미국 캘리포니아주 칼스바드), X-tremeGENE Q2 형질감염 시약 (로슈 (Roche); 스위스 그렌짜체스트라쎄), DOTAP 리포솜 형질감염 시약 (스위스 그렌짜체스트라쎄), DOSPER 리포솜 형질감염 시약 (스위스 그렌짜체스트라쎄), 또는 푸젠(Fugene) (스위스 그렌짜체스트라쎄), 트랜스펙탐(Transfectam)(R) 시약 (프로메가 (Promega), 미국 위스콘신주 메디슨), 트랜스패스트(TransFast)™ 형질감염 시약 (프로메가, 미국 위스콘신주 메디슨), Tfx™-20 시약 (프로메가, 미국 위스콘신주 메디슨), Tfx™-50 시약 (프로메가, 미국 위스콘신주 메디슨), 드림펙트(DreamFect)™ (오지 바이오사이언시스 (OZ Biosciences); 프랑스 마르세유), 에코트랜스펙트(EcoTransfect) (오지 바이오사이언시스; 프랑스 마르세유), TransPass3 D1 형질감염 시약 (뉴 잉글랜드 바이오랩스 (New England Biolabs; 미국 매수추세츠주 입스위츠)), LyoVec™/LipoGen™ (인비트로젠; 미국 캘리포니아주 샌디에고), 퍼펙틴(PerFectin) 형질감염 시약 (젠란티스(Genlantis); 미국 캘리포니아주 샌디에고), 뉴로포터(NeuroPORTER) 형질감염 시약 (젠란티스; 미국 캘리포니아주 샌디에고), 진포터(GenePORTER) 형질감염 시약 (젠란티스; 미국 캘리포니아주 샌디에고), 진포터 2 형질감염 시약 (젠란티스; 미국 캘리포니아주 샌디에고), 사이토펙틴(Cytofectin) 형질감염 시약 (젠란티스; 미국 캘리포니아주 샌디에고), 바큘로포터(BaculoPORTER) 형질감염 시약 (젠란티스; 미국 캘리포니아주 샌디에고), 트로간포터(TroganPORTER)™ 형질감염 시약 (젠란티스; 미국 캘리포니아주 샌디에고), 리보펙트(RiboFect) (바이올라인 (Bioline); 미국 매수추세츠주 톤튼), 플라스펙트(PlasFect) (바이올라인; 미국 매수추세츠주 톤튼), 유니펙터(UniFECTOR) (비-브릿지 인터내셔널 (B-Bridge International; 미국 캘리포니아주 마운튼뷰)), 슈어펙터(SureFECTOR) (비-브릿지 인터내셔널; 미국 캘리포니아주 마운튼뷰), 또는 HiFecf™ (비-브릿지 인터내셔널, 미국 캘리포니아주 마운튼뷰) 또는 비-양이온성 지질-기반 담체 (예를 들어, Transit-TKOTM™, 미니스 바이오 엘엘시 (Minis Bio LLC, 미국 위스콘신주 메디슨))를 포함한다.
상기 제제는 본원에 개시된 핵산의 제약상 허용되는 제제의 도입을 위해 바람직할 수 있다. 리포솜의 형성 및 사용은 일반적으로 관련 기술분야의 통상의 기술자에게 알려져 있다. 최근에, 개선된 혈청 안정성 및 순환 반감기를 갖는 리포솜이 개발되었다 (미국 특허 번호 5,741,516). 또한, 잠재적인 약물 담체로서 리포솜 및 리포솜 유사 제제의 다양한 방법이 문헌에 기재되어 있다 (미국 특허 번호 5,567,434; 5,552,157; 5,565,213; 5,738,868 및 5,795,587).
리포솜은 다른 절차에 의해 형질감염에 대해 통상 저항성인 많은 세포 종류와 함께 성공적으로 사용되었다. 또한, 리포솜에는 바이러스-기반 전달 시스템에 전형적인 DNA 길이 제한이 존재하지 않는다. 리포솜은 유전자, 약물, 방사선치료제, 바이러스, 전사 인자 및 알로스테릭 이펙터를 다양한 배양된 세포주 및 동물에 도입하기 위해 효과적으로 사용되었다. 또한, 리포솜-매개 약물 전달의 유효성을 조사하는 일부 성공적인 임상 시험이 완료되었다.
리포솜은 수성 매질에 분산되고 다층 동심원 이중층 소낭 (다층 소낭 (MLV)으로도 불림)을 자연 형성하는 포스포지질로 형성된다. MLV의 직경은 일반적으로 25 nm 내지 4 ㎛이다. MLV의 초음파 처리는 중심에 수용액을 함유하는, 직경이 200 내지 500 옹스트롬인 작은 단층 소낭 (SUV)을 형성시킨다.
일부 실시양태에서, 핵산은 나노입자 또는 마이크로입자를 사용하여 유기체 또는 대상체에게 전달될 수 있다. 본원에서 사용될 때, 용어 나노입자 또는 마이크로입자는 평균 입자 크기 (즉, 직경)가 각각 나노미터 또는 마이크로미터 이하인 입자를 의미한다. 이들 용어는 고체 및 다공성 입자 및 중공 구체 및 캡슐 및 하이브리드 및 다중-상 입자를 포함하는 모든 형태의 입자를 포함한다. 예를 들어, 입자는 가교-결합되거나 또는 지질층 또는 지질 이중층에 의해 둘러싸일 수 있는 중합체 외피 (나노캡슐), 중합체 매트릭스 (나노구체) 또는 블록 공중합체를 포함할 수 있다.
본 발명의 핵산은 발명은 입자 내에 혼입되거나, 분산되거나, 접합되거나 또는 달리 부착될 수 있다.
수많은 중합체가 폴리아미노산, 다당류, 예컨대 덱스트린 또는 덱스트란, 및 합성 중합체, 예컨대 N-(2-히드록시프로필)메타크릴아미드 (HPMA) 공중합체를 포함하는 중합체-작용제 접합체의 합성을 위해 제시되었다. 적합한 제조 방법은 관련 기술분야에, 예를 들어, 문헌 [Veronese et al. (1999) IL Farmaco 54:497-516]에 기재되어 있다. 다른 적합한 중합체는 제약 기술분야에 임의로 공지되어 있고, 천연 생성 중합체, 예컨대 히드록시에틸 전분, 단백질, 당펩티드 및 지질을 포함하고, 이로 제한되지 않는다. 합성 중합체는 또한 선형 또는 분지쇄, 치환 또는 비치환, 단독중합체, 2종 이상의 상이한 합성 단량체의 공중합체, 또는 블록 공중합체일 수 있다.
나노캡슐은 일반적으로 물질을 안정하고 재현가능한 방식으로 포획할 수 있다. 세포내 중합체 과다투입에 의한 부작용을 방지하기 위해, 생체내에서 분해될 수 있는 중합체를 사용하여 상기 초미세 입자 (약 0.1 ㎛ 크기)를 설계할 수 있다. 이들 요건을 충족하는 생분해가능 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
다음 실시예는 본 발명의 실시의 구체적인 예를 예시하기 위해 제공되는 것으로서, 본 발명의 범위를 제한하고자 의도되지 않는다. 관련 기술분야의 통상의 기술자에게 명백한 바와 같이, 본 발명은 다양한 조성물 및 방법에서 유용할 것이다.
실시예
물질 및 방법:
발현 플라스미드 구축
CMV-cGFP-mMALAT1_3' 발현 구축물을 생성하기 위해, 이전에 설명된 플라스미드를 변형하였고 (Gutschner et al. 2011), 이에 의해 CMV 프로모터 및 cGFP 오픈 리딩 프레임이 pCRII-TOPO 벡터 (라이프 테크놀로지스 (Life Technologies))의 다중클로닝 부위 내로 클로닝되었다. mMALAT1_3' 영역 (GenBank 기탁 번호 EF177380의 nt 6581 내지 6754)을 센스 방향 (CMV-cGFP-mMALAT1_3' 센스를 생성하기 위해) 또는 안티센스 방향 (CMV-cGFP-mMALAT1_3' 안티센스를 생성하기 위해)으로 NotI 클로닝 부위 내로 cGFP의 하류에 삽입하였다. NotI 클로닝 부위를 유사하게 사용하여, SV40 폴리아데닐화 신호, bGH 폴리아데닐화 신호, mMEN β_3' 영역, 및 모든 돌연변이체 mMALAT1_3' 영역으로 끝나는 CMV-cGFP 발현 플라스미드를 생성하였다. CMV-SpeckleF2-mMALAT1_3' 발현 플라스미드를 생성하기 위해서, 마우스 MALAT1의 nt 1676 내지 3598을 CMV-cGFP-mMALAT1_3' 센스 플라스미드의 EcoRV 및 BstEII 클로닝 부위 내로 삽입하였다. 모든 플라스미드의 삽입물의 서열을 표 1에 제시한다 (상부에서 하부로 서열 1-61).
형질감염 및 RNA 분석
HeLa 세포를 37℃, 5% CO2에서 페니실린-스트렙토마이신 및 10% 태아 소 혈청으로 보충된 고 글루코스를 함유하는 둘베코 (Dulbecco) 변형 이글 (Eagle) 배지 (DMEM) (라이프 테크놀로지스)에서 성장시켰다. CMV-cGFP 발현 플라스미드를 리포펙타민 2000 (라이프 테크놀로지스)을 사용하여 형질감염시키고, 총 RNA를 제조자의 지시에 따라 트리졸 (Trizol) (라이프 테크놀로지스)을 사용하여 단리하였다. 노던 블롯을 이전에 설명된 바와 같이 수행하였다 (Wilusz et al. 2008). RNase H 처리를 위해, 9 ㎍의 총 RNA를 먼저 20 pmol의 안티센스 올리고와 혼합하고, 65℃로 10 min 동안 가열하였다. 서서히 냉각시켜 안티센스 올리고를 어닐링하고, RNA를 37℃에서 30 min 동안 RNase H (뉴 잉글랜드 바이오랩스)로 처리한 후, 노던 블롯 분석에 적용하였다. 핵 및 세포질 분획화는 이전에 설명된 바와 같이 수행하였다 (Wilusz et al. 2008). 모든 올리고뉴클레오티드 프로브 서열을 표 2에 제시한다 (상부에서 하부로 서열 62-69). 마이크로RNA 클로닝 링커 3 (인테그레이티드 디엔에이 테크놀로지스 (Integrated DNA Technologies))를 사용하여 3' RACE PCR을 이전에 설명된 바와 같이 수행하였다 (Wilusz et al. 2008).
단백질 분석
웨스턴 블롯을 제조자의 지시에 따라 Nu-PAGE 비스-트리스 전기영동 시스템 (라이프 테크놀로지스)을 사용하여 수행하였다. cGFP 항체는 젠스크립트 (GenScript)로부터, 빈쿨린 항체는 시그마-알드리치로부터 얻었다.
2색 형광 리포터 시스템
2색 형광 리포터 벡터는 이전에 설명되었고 (Mukherji et al. 2011), mCherry의 3' UTR에 SV40 폴리아데닐화 신호를 보유한다. 상기 폴리아데닐화 신호를 mMALAT1_3' 영역으로 교체하기 위해, SV40 폴리아데닐화 신호에 인접한 EcoRV 및 AatII 클로닝 부위를 사용하였다. let-7에 대한 표적 부위를 HindIII 및 SalI 클로닝 부위를 사용하여 mCherry의 3' UTR 내에 삽입하였고, 서열은 표 1에 제시된다. HeLa 세포를 리포펙타민 2000을 사용한 동등량 (250 ng)의 리포터 플라스미드 및 rtTA의 형질감염 전에 20시간 동안 12-웰 플레이트의 웰당 175,000개 세포를 씨딩하였다. 형질감염시에, 배지를 2 ㎍/mL 독시시클린 (시그마)으로 보충된 완전 DMEM으로 변경하였다. 표시된 경우, 대조군 siRNA (siGENOME Non-Targeting siRNA #2, 다마콘 (Dharmacon)) 또는 뮤린 let-7g의 siRNA 동등물 (다마콘)을 40 nM의 최종 농도로 동시-형질감염시켰다. 유동 세포 분석 또는 RNA 단리를 형질감염 18-20시간 후에 수행하였다. 유동 세포 분석, QPCR, 및 원 데이터 프로세싱을 이전에 설명되고 (Mukherji et al. 2011) 본원에서 추가로 설명된 바와 같이 수행하였다.
구조적 모델 예측
신생 RNA 폴딩을 로제타 버전 3.4 (rosettacommons.org)을 이용하여 수행하였다 (Das and Baker 2007; Das et al. 2010). MALAT1 Comp.14 전사체의 3' 말단부의 수렴 모델을 위해, 처음 5개의 뉴클레오티드 (AAGGG)를 제거하였다. 예상된 나선 상호작용을 규정하고 (9개의 모든 U-A·U 염기 트리플을 규정하고), 2,000개의 모델을 계산하였다. 모델은 3-4 Å으로 수렴되었다 (도 14c 참조). 전장 (59-nt) Comp.14 3' 말단부를 동일한 절차에 적용하였지만, 수렴은 5' 말단부의 높은 신축성 (flexibility) 때문에 달성될 수 없었다.
유동
세포 분석
,
QPCR, 및 데이터
프로세싱
유동 세포 분석 및 원 데이터 프로세싱을 이전에 설명된 바와 같이 수행하였다 (Mukherji et al. 2011). 간단히 설명하면, ~100,000개의 세포를 FACSDiva 소프트웨어를 사용하는 LSRII 분석기 (벡톤 디킨슨 (Becton Dickinson))에서 시험하였다. FlowJo를 사용하여, 생존한 단일 세포 집단을 전면 및 측면 산란 프로파일에 따라 게이팅하였다. 배경 형광에 대해 조정하기 위해, 평균 자가형광 플러스 비형질감염된 세포의 표준 편차의 2배를 형질감염된 샘플의 각각의 세포에 대한 eYFP 및 mCherry 값으로부터 차감하였다. 배경으로부터 구별가능한 세포 (배경 차감 후 0 미만의 형광값)는 추가의 분석으로부터 제외하였다. 배경 차감 및 하류 분석은 통상적인 MATLAB 스크립트 (script) (매쓰웍스 (MathWorks))를 사용하여 수행하였다.
총 RNA를 트리졸을 사용하여 단리하고, TURBO DNA-무함유 키트 (라이프 테크놀로지스)로 처리하고, 수퍼스크립트 (Superscript) III (라이프 테크놀로지스)를 사용하여 무작위 육량체로 역전사시켰다. 생성 cDNA에 대한 QPCR 반응을 어플라이드 바이오시스템즈 (Applied Biosystems) 7500 실시간 PCR 기기에서 시행된 파워 (Power) SYBR 그린 (Green) (라이프 테크놀로지스)을 사용하여 삼중으로 수행하였다. QPCR 프라이머 서열 (서열 169 내지 서열 171): eYFP 정방향 (5'-CCACCTACGGCAAGCTGACC), eYFP 역방향 (5'-GGTAGCGGGCGAAGCACT), mCherry 정방향 (5'-GAACGGCCACGAGTTCGAGA) 및 mCherry 역방향 (5'-CTTGGAGCCGTACATGAACTGAGG).
실시예
1:
MALAT1
3' 말단부 프로세싱을 정확하게 재현하는 발현 플라스미드의 생성
MALAT1이 절단되어 mascRNA를 생성하는 것이 분명하지만 (Wilusz et al. 2008), 상기 프로세싱 이벤트를 생체내에서 재현하는 플라스미드 발현 시스템은 보고된 바 없다. CMV 프로모터의 하류에 산호 녹색 형광 단백질 (cGFP) 오픈 리딩 프레임 (ORF), 이어서 마우스 MALAT1 유전자좌의 3' 말단부의 174-nt 단편 (mMALAT1의 nt 6581 내지 6754)을 삽입함으로써 상기 플라스미드를 생성하는 것이 가능하였다 (도 1d). mMALAT1_3'으로 표시된 상기 영역은 인간에서 제브라피쉬 (zebrafish)까지 고도로 진화상 보존되고 (도 1b), 잘 보존된 U- 및 A-풍부 모티프, RNase P 절단 부위 (nt 6690 다음의), 및 mascRNA (nt 6691-6748)를 포함한다. 대조군으로서, mascRNA 발현이 CMV-유도 전사체로부터의 프로세싱에 의존성인지 확인하기 위해 mMALAT1_3' 영역이 안티센스 방향으로 cGFP의 하류에 클로닝된 플라스미드를 생성하였다.
CMV-cGFP-mMALAT1_3' 센스 및 안티센스 플라스미드로 인간 HeLa 세포를 일시 형질감염시키고, 총 RNA를 24시간 후에 단리하였다. 상기 시스템이 MALAT1 3' 말단부 프로세싱을 정확하게 재현하기 위해서는 다음 2개의 전사체를 생성하여야 한다: ~850-nt cGFP-MALAT1_3' RNA 및 RNases P 및 Z에 의해 및 CCA-부가 효소에 의해 프로세싱된 성숙 (61-nt) 마우스 mascRNA (도 1d). 마우스와 인간 mascRNA 사이에 4개의 서열 변화가 존재하여 (Wilusz et al. 2008), 상동체를 구별하거나 (도 1e에 "마우스 mascRNA 단독"으로 표시된 프로브) 또는 노던 블롯 분석에 의해 마우스 및 인간 mascRNA를 둘 다 검출하는 올리고 프로브 (도 1e에 "모든 mascRNA"로 표시된 프로브)의 설계를 허용한다. 안티센스가 아니라 센스 발현 플라스미드로 형질감염된 세포에서, 성숙 mascRNA가 생성되고, 모의 처리된 세포에서 관찰된 수준의 ~16배로 발현되었다 (도 1e). 3' RACE PCR을 사용하여, 플라스미드로부터 생성된 mascRNA가 적절하게 프로세싱되고 전사 후에 CCA가 그의 3' 말단부에 부가되었는지 확인하였다 (데이터 미제시). 이와 동시에, 상기 플라스미드를 사용하여 발현된 돌연변이체 mascRNA 전사체에 CCACCA를 부가하고, 생체내에서 신속하게 분해시켜 (도 8), CCA-부가 효소가 tRNA 품질 제어에 중요한 역할을 수행한다는 이전의 발견을 확인하였다 (Wilusz et al. 2011). 이들 결과는 상기 플라스미드가 진정한 mascRNA를 생성함을 보여준다.
센스 플라스미드가 생체내에서 안정하고 그의 3' 말단부에서 RNase P에 의해 적절하게 프로세싱된 cGFP-MALAT1_3' RNA를 발현하는지 결정하기 위해, 형질감염으로부터의 총 RNA를 cGFP ORF의 3' 말단부 근처에 상보성인 올리고에 먼저 혼성화시키고, RNase H 소화에 적용하였다. 보다 작은 크기로 전사체를 절단함으로써, RNase P 절단의 정확성을 확인하기 위해 고 분해능의 노던 블롯을 실시할 수 있었다. 예상된 크기 (190-nt)의 단일 밴드는 센스 플라스미드에서 관찰되었지만, 안티센스 플라스미드에서는 그렇지 않았다 (도 1e). 이들 결과는 cGFP-MALAT1_3' 센스 1차 전사체가 RNase P에 의해 효율적으로 절단되어 두 개의 예상된 성숙 전사체를 모두 생성하고 (도 1d), 따라서 생체내에서 MALAT1의 3' 말단부 프로세싱을 정확하게 재현함을 나타낸다. 안티센스 플라스미드는 전사체가 어떠한 기능성 폴리아데닐화 신호도 함유하지 않아 전사체가 핵 감시 경로에 의해 빠르게 분해되도록 야기하기 때문에, 안정한 cGFP mRNA를 생산하지 못할 가능성이 있었다.
mascRNA는 CMV 프로모터-유도 전사체로부터 효율적으로 생산되기 때문에 (도 1e), MALAT1 프로모터는 RNase P 또는 임의의 다른 tRNA 프로세싱 인자를 신생 RNA로 동원하는 것을 필요로 하지 않음이 밝혀졌다. 또한, 생체내에서 mascRNA 생성에 필요한 MALAT1 1차 전사체의 유일한 영역은 tRNA-유사 구조 자체임이 밝혀졌다 (도 9). RNase P에 의한 기질 인식에 대한 현재 모델과 일치하게 (Kirsebom 2007), 효소는 아마도 전사체를 생성하기 위해 사용되는 프로모터와 무관하게 임의의 tRNA-유사 구조를 인식하고 절단할 것이다. 실제로, 본 발명의 발현 시스템에서 cGFP의 하류에 MEN β tRNA-유사 구조를 유사하게 배치하면 효율적인 RNase P 절단을 야기하였다 (도 10).
실시예
2: 보존된 U-풍부 모티프는
MALAT1의
3' 말단부를 분해로부터 보호한다.
MALAT1 RNase P 절단 부위의 바로 상류에 존재하는 고도로 보존된 U- 및 A-풍부 모티프는 mascRNA 생합성에 필요하지 않기 때문에 (도 1b 및 도 9), 이것들은 MALAT1의 핵 수송 방지 및/또는 RNase P 절단 후 긴 비코딩 RNA의 안정화를 위해 기능할 수 있다고 가정되었다. 형질감염된 HeLa 세포로부터 핵 및 세포질 총 RNA를 분리하기 위해 생화학적 분획화를 사용하여, cGFP-MALAT1_3' 리포터 RNA가 세포질로 효율적으로 수송됨이 밝혀졌다 (도 2b). 사실상, 전사체는 정규 폴리-A 꼬리로 끝나는 cGFP 전사체로서 효율적으로 수송되었다 (도 2a, b). 따라서, MALAT1의 3' 말단부는 핵 체류에서 기능하지 않는다. 대신에, 발현 구축물에 삽입될 때 (CMV-SpeckleF2-mMALAT1_3' 플라스미드를 생성하기 위해, 도 2a) 핵 체류를 일으키기에 충분한 영역이 마우스 MALAT1 (nt 1676-3598) 내에서 확인되었다 (도 2c). 이것은 상기 영역이 내인성 MALAT1의 핵 반점으로의 표적화를 위해 중요하다는 것을 나타낸 이전의 보고와 일치한다 (Tripathi et al. 2010; Miyagawa et al. 2012).
대신에, MALAT1 RNA 안정성에서 고도로 보존된 U-풍부 모티프의 가능한 역할을 조사하기 위해, U-풍부 모티프 1, U-풍부 모티프 2, 또는 두 모티프 모두에 5-nt 돌연변이를 포함하는 cGFP-mMALAT1_3' 발현 플라스미드를 생성하고, 형질감염시켰다 (도 2d). 이들 돌연변이는 RNase P 절단 또는 mascRNA 생합성에 어떠한 영향도 보이지 않았지만 (도 2e, 하부), 성숙 cGFP-MALAT1_3' RNA의 효율적인 분해를 야기하이브리드 핵산 (도 2e, 상부). 핵-보유된 리포터 전사체 내로 유사한 돌연변이의 도입은 또한 RNA가 노던 블롯 분석에 의해 비검출가능하도록 만들고 (도 11b), 이것은 U-풍부 모티프 1 및 2 둘 다가 핵 및 세포질에서 MALAT1의 3' 말단부의 안정화에 필요함을 보여준다.
돌연변이체 전사체가 분해되는 메카니즘을 통찰하기 위해 라이게이션-기반 3' RACE PCR 방법을 사용하였다. 그의 3' 말단부로부터 다양한 정도로 단순히 분해된 전사체를 검출하는 이외에, 짧은 전사 후에 부가된 U-풍부 꼬리로 끝나는 많은 cGFP-MALAT1_3' 전사체 (56개의 서열결정된 RACE 클론 중 10개)가 놀랍게도 검출되었고, 이것은 야생형 및 돌연변이체 MALAT1 3' 말단부 둘 다의 분해시의 우리딜화를 시사한다 (도 2f). 일부 분해 패턴이 관찰되었다: (1) 우리딜화 전에 MALAT1 3' 말단부의 비주형 아데닐화 (예를 들어 Mut U1 RACE #1), (2) U-풍부 꼬리의 전장 전사체에 대한 부가 (예를 들어 Mut U2 RACE #1), 및 (3) 우리딜화 전에 3' 말단부의 부분적인 분해 (예를 들어 WT RACE #1) (도 2f). 상기 마지막 패턴은 3'-5' 엑소뉴클레아제가 MALAT1 3' 말단부를 분해하기 때문에 그 엑소뉴클레아제가 중지함을 시사하기 때문에 특히 흥미롭다. 이어서 붕괴 과정을 인식하고 재출발하기 위해 엑소뉴클레아제에 대한 새로운 단일 가닥 꼬리를 제공하기 위해 U-꼬리가 부가되는 것으로 보였다 (Houseley et al. 2006). 또한, 핵-보유된 리포터 전사체를 사용하여 우리딜화된 붕괴 중간체가 검출되었고 (도 11c), 이것은 우리딜화가 핵 및 세포질 둘 다에서 발생할 가능성이 있음을 나타낸다. 이들 결과는 U-풍부 모티프 1 및 2가 3'-5' 엑소뉴클레아제에 의한 우리딜화 및 분해를 억제함으로써 MALAT1의 3' 말단부를 안정화시키기 위해 매우 중요할 가능성이 있음을 나타낸다.
실시예
3: 삼중 나선은
MALAT1
및 MEN β의 3' 말단부에서 형성된다.
U-풍부 모티프 1 및 2을 MALAT1 3' 말단부 안정성을 위해 매우 중요한 것으로 확인하였기 때문에, cGFP-MALAT1_3' 전사체의 3' 말단부 안정화에 필요한 최소 서열 요소를 조사하였다. 광범한 돌연변이유발을 사용하여, MALAT1의 3' 말단부의 110 nt 중 51개 (Comp.14, 도 2d)가 cGFP-MALAT1_3' RNA 안정성에 대해 거의 또는 전혀 효과를 보이지 않으면서 제거될 수 있음이 밝혀졌다 (도 2g 및 도 12). MALAT1 (도 1b) 및 MEN β (도 1c)의 진화상 보존 패턴과 일치하게, 잘 보존된 A- 및 U-풍부 모티프 및 보존된 스템-루프의 하부 절반이 cGFP-MALAT1_3' 안정성에 필요하다 (도 2d 및 도 3a). 이와 대조적으로, 보다 많은 분기 영역, 예컨대 U-풍부 모티프 2와 A-풍부 구역 사이의 서열은 불필요하거나 또는 MALAT1의 3' 말단부 안정화에서 단지 작은 지지 역할만을 수행한다 (도 12).
Mfold를 사용하여 최소 기능성 MALAT1 3' 말단부의 2차 구조 예측은 A-풍부 구역이 U-풍부 모티프 2와 염기쌍을 형성하여야 함을 나타내었다 (도 3a). 이들 잠재적인 염기쌍 형성은 진화를 통해 완전히 보존되기 때문에 (도 1b,c), 특이적 염기쌍 형성이 붕괴된 cGFP-MALAT1_3' 발현 플라스미드를 생성하였다 (도 3b 및 도 18). 도 3c 및 3d에 제시된 바와 같이, cGFP-MALAT1_3' RNA는 2개의 미스매치가 U-풍부 모티프 2 또는 A-풍부 구역에 도입될 때 축적되지 않았다. 두 모티프 내에 돌연변이를 도입함으로써 염기쌍 형성이 재확립될 때, cGFP-MALAT1_3' RNA의 수준의 유의한 구제가 검출되었다 (도 3c, d). 이것은 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 MALAT1의 3' 말단부 안정화에 매우 중요함을 나타낸다. 흥미롭게도, A-풍부 구역 내의 GC가 AA로 돌연변이됨으로써 짧은 단독중합체 폴리-A 꼬리로 끝나는 cGFP-MALAT1_3'이 또한 생체내에서 분해되었고 (데이터 미제시), 이것은 짧은 폴리-A 꼬리가 MALAT1의 3' 말단부에서 염기쌍 형성을 기능적으로 교체할 수 없음을 보여준다. 예상된 바와 같이, 6개 염기쌍 형성이 붕괴될 때, 돌연변이된 cGFP-MALAT1_3' 전사체는 생체내에서 축적되지 않았다 (도 3e). 그러나, 예기치 않게, 이들 6개의 염기쌍 형성을 재확립하는 보상 돌연변이의 도입은 cGFP-MALAT1_3' 전사체 수준을 구제하지 못하였고 (도 3e), 이것은 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 MALAT1 안정성에 필요하지만, 충분하지는 않음을 나타낸다.
U-풍부 모티프 1이 또한 MALAT1 3' 말단부 안정성을 위해 필요하고 (도 2e), 고도로 보존되고 (도 1b,c), U-풍부 모티프 2 및 A-풍부 구역에 매우 근접할 것으로 예측되기 때문에 (도 3a), 본 발명자들은 U-풍부 모티프 1이 또한 예를 들어 삼중 나선에서 이중체와 상호작용할 수 있다고 생각하였다 (도 4a). 1957년도에 펠센펠드 (Felsenfeld), 데이비스 (Davies), 및 리치 (Rich)에 의한 선구적인 연구는 처음으로 U-A·U 삼중 나선 구조를 설명한 바 있고, 여기서 폴리(U) 제3 가닥은 폴리-A/폴리(U)의 왓슨-크릭 염기쌍 형성된 나선의 주요 홈에 대한 후그스틴 수소 결합을 형성한다 (Felsenfeld et al. 1957) (도 4b). 천연 발생 U-A·U RNA 삼중 나선 구조가 최근에 텔로머라제 RNA에서 (Qiao and Cech 2008) 및 카포시 육종-연관 헤르페스바이러스 및 관련 감마헤르페스바이러스에 의해 생산된 비코딩 RNA의 3' 말단부에서 확인되었다 (Mitton-Fry et al. 2010; Tycowski et al. 2012). 후자의 경우에, 상기 구조는 RNA의 안정화에 필수적이다. C-G·C 삼중 나선은 U-A·U에 구조적으로 유사하지만, 제3 가닥 내의 시토신의 양성자 부가가 구조를 완전히 안정화하기 위해 필요하고, 이것은 C-G·C 삼중체를 산성 조건 하에 적합하게 만든다 (도 4b). 중요하게는, MALAT1 및 MEN β의 3' 말단부에, U- 및 A-풍부 모티프는 U-풍부 모티프 2 및 A-풍부 구역에 의해 형성된 왓슨-크릭 염기쌍 형성된 나선의 주요 홈에 대한 U-풍부 모티프 1의 후그스틴 수소-결합에 의해 분자내 삼중 나선 구조가 형성되도록 적절하게 배향된다 (도 4a).
삼중 나선을 형성하는 MALAT1의 3' 말단부의 능력을 평가하기 위해, FARFAR로 알려진, 전체 원자 정제를 사용한 RNA의 단편 조립을 사용하였다 (Das et al. 2010). 상기 로제타-기반 알고리즘은 저에너지 3차 RNA 구조를 원자 근접 해상도로 신생로 예측한다 (Das and Baker 2007). 도 4c에 제시된 바와 같이, 59-nt Comp.14 mMALAT1_3' 영역은 연속적인 왓슨-크릭 염기쌍 형성된 나선의 각각의 말단부에서 루프와 바벨(barbell)-유사 구조로 폴딩될 수 있고, 그 일부는 주요 홈에서 U-풍부 모티프 1 결합과 함께 삼중 나선 구조를 추가로 형성할 것으로 예측된다. 9개의 U-A·U 염기 트리플은 A-풍부 구역 내의 A 뉴클레오티드의 후그스틴 면과 U-풍부 모티프 1의 U 뉴클레오티드의 왓슨-크릭 면 사이의 염기쌍 형성에 의해 형성될 수 있다 (도 4c, d 및 도 14). C-G·C 트리플이 형성되는지 여부는 모델링으로부터 불분명하다. FARFAR는 후그스틴 염기에서 양성자 부가된 시티딘 잔기의 모델링을 허용하지 않지만 (도 4d), 다른 입체 제한이 상기 C-G·C 트리플의 형성을 못하게 할 수 있다. 예측된 구조는 쇄 파단이 결여되고, 합리적인 입체화학을 갖고, 이것은 삼중 나선의 형성을 차단하는 구조적 제한이 존재하지 않음을 나타낸다. 훌륭하게, MALAT1 3' 말단부 안정성에 중요하지 않고 따라서 Comp.14 전사체로부터 결실된 뉴클레오티드 (도 2d)는 중심 삼중 나선으로부터 물리적으로 분리된 바벨-유사 구조의 말단부의 루프 영역 내에 존재하는 것으로 모두 예측된다 (도 4a, c). 또한, 구조적 모델은 MALAT1의 3' 말단 뉴클레오티드가 중심 삼중 나선의 일부이고 따라서 비-주형 뉴클레오티드의 부가 또는 엑소뉴클레아제로부터 잘 보호됨을 나타낸다. 유의한 자유 에너지가 상기 삼중 나선을 풀기 위해 필요할 가능성이 있다. 상기 모델과 일치하게, 3' RACE는 3'-5' 엑소뉴클레아제가 종종 상기 구조 내에서 멈춤을 보여주었다 (도 2f).
구조적 모델은 삼중 나선 구조가 형성될 수 있음을 예측하지만, 이것은 삼중 나선이 생체내에서 형성됨을 증명하지 않는다. 그럼에도 불구하고, 일부 독립적인 증거는 생체내에서 삼중 나선의 존재 및 기능적 유의성을 지지한다. 먼저, 모든 염기 트리플은 MALAT1 (도 1b) 및 MEN β (도 1c)의 3' 말단부에서 모두에서 거의 완전히 보존된다. 두 번째로, 도 3에서 돌연변이 분석은 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 MALAT1의 3' 말단부 안정화에 필요하지만 충분하지는 않음을 보여준다. 특히, U-풍부 모티프 2와 A-풍부 구역 사이에 6개의 염기쌍을 형성하는 뉴클레오티드가 나선에 걸쳐 교환된 Mut U2/A-CGAAAA 전사체 (도 3b,e)가 흥미롭다. 이들 뉴클레오티드 교환은 이중 나선의 구조적 일체성을 변경하지 않아야 하지만, 염기 트리플을 형성할 가능성을 제거하여 MALAT1의 안정화에서 상기 구조에 대한 간접적인 지지를 제공하여야 한다. 세 번째로, 생체내에서 삼중 나선의 존재를 직접 시험하기 위해서, 본 발명자들은 MALAT1의 3' 말단부의 4개의 U-A·U 염기 트리플 (도 4a에 자주색으로 표시됨)을 C-G·C 염기 트리플로 전환하는 효과를 조사하였다 (도 4e). 4개의 연속하는 A 뉴클레오티드를 G로 돌연변이시키면 (레인 4, 도 4e), cGFP-MALAT1_3' 전사체는 생체내에서 불안정하고 번역되지 않았다 (번역에 대한 추가의 정보는 아래 참조). C-G 염기쌍을 갖는 이중 나선만을 형성할 수 있는 전사체에 비해 (레인 5), C-G·C 염기 트리플이 형성될 수 있을 때 유의하게 더 큰 단백질 발현이 관찰되었다 (레인 6, 도 4e). 이것은 기능성 삼중 나선이 생체내에서 형성된다는 강한 증거이다.
이어서, 전체 삼중 나선 구조가 생체내에서 MALAT1의 3' 말단부 안정화에 필요한지 조사하기 위해서, U-풍부 모티프 1을 돌연변이된시킴으로써 선택된 염기 트리플이 붕괴된 cGFP-MALAT1_3' 발현 플라스미드를 생성하였다 (도 4f). 흥미롭게도, U-풍부 모티프 1의 중앙의 돌연변이 (Mut U1.1 및 Mut U1.2)는 cGFP-MALAT1_3' 전사체 수준에 대해 어떠한 효과도 갖지 않는 것으로 밝혀졌다 (도 4f). 이 결과는 상기 중앙 영역에서 U-풍부 모티프 2와 A-풍부 구역 사이의 염기쌍 형성이 RNA 안정성을 위해 필요하지만, 이중 나선의 어느 한 측면 상의 뉴클레오티드의 종류 (및, 따라서 염기 트리플을 형성하는 또는 그렇지 않은 능력)는 그리 중요하지 않다는 도 3c 및 3d로부터의 데이터와 일치한다. 이와 대조적으로, 삼중 나선의 양 말단부의 염기 트리플은 cGFP-MALAT1_3'의 안정성에 매우 중요하다 (Mut U1.3 내지 Mut U1.5, 도 4f). 이들 결과는 MALAT1 삼중 나선의 각각의 말단부의 U-A·U 염기 트리플이 전체 구조의 구조적 안정성을 보장하고 3'-5' 엑소뉴클레아제에 의한 전사체 분해를 억제하는 모델을 지지한다.
실시예
4: 삼중 나선 구조는 또한 번역
인핸서
요소로
기능한다
.
cGFP-MALAT1_3' 리포터 mRNA는 안정하고, 세포질로 효율적으로 수송되기 때문에 (도 2b), cGFP 오픈 리딩 프레임이 번역되는지 조사하였다. 놀랍게도, 폴리-A 꼬리로 끝나는 것에 비해 유사한 수준의 단백질 발현이 mMALAT1_3' 영역으로 끝나는 cGFP 전사체에 대해 관찰되었다 (도 5a). 이것은 MALAT1의 3' 말단부가 또한 번역을 촉진하는 기능을 수행할 수 있음을 보여준다. MEN β의 3' 말단부는 유사하게 유의한 cGFP 단백질 발현을 지지한다 (도 10c). 이들 결과는 내인성 MALAT1 및 MEN β가 핵-보유된 전사체이고 따라서 번역 기구와 상호작용하는 것으로 생각되지 않음을 고려할 때 특히 놀랍다.
MALAT1 3' 말단부로 끝나는 전사체로부터 얻은 번역량 대 폴리-A 꼬리로 끝나는 전사체로부터 얻은 것을 보다 양호하게 정량하기 위해서, 단일 포유동물 세포에서 유전자 발현의 측정을 허용하는 2-색상 형광 리포터 시스템을 사용하였다 (Mukherji et al. 2011). 상기 구축물은 핵 국한 서열로 태깅된 형광 단백질 mCherry 및 향상된 황색 형광 단백질 (eYFP)의 발현을 유도하는 2방향성 Tet-유도가능 프로모터로 이루어진다 (도 5b). mCherry의 3' UTR에, SV40 폴리아데닐화 신호 또는 mMALAT1_3' 영역이 삽입되었다. 이와 대조적으로, eYFP의 3' UTR은 항상 SV40 폴리아데닐화 신호로 끝나고, 이것은 eYFP 발현이 2방향성 프로모터로부터의 전사 및 번역 활성에 대한 감수성 리포터인 것처럼 내부 표준 대조군으로 기능하도록 허용한다. 단일 세포에서 단백질 발현을 모니터링하기 위해 유동 세포 분석을 사용하여, 얻은 mCherry 및 eYFP 단백질의 수준을 두 전사체가 모두 정규 폴리-A 꼬리로 끝날 때와 비교하였다. 각각의 분석된 세포에서 검출된 mCherry 대 eYFP 단백질의 비를 계산함으로써, 형광 단백질의 발현이 예상된 바와 같이 고도로 상관성이 있음이 밝혀졌다 (0.91 +/- 0.05의 비) (도 5c 및 도 15a). 상기 상관성은 정량적 PCR (QPCR)에 의해 세포 집단에 걸쳐 측정될 때 전사체 수준에서 반영되었다 (도 5d). 이어서, mCherry 및 eYFP 단백질 및 mMALAT1_3' 영역이 mCherry의 하류에 삽입될 때 얻은 mRNA를 비교하였다. 도 5a에서 cGFP 리포터를 사용하여 얻은 결과와 일치하게, mMALAT1_3' 영역은 강한 번역을 지지하였다 (1.00 +/- 0.05의 mCherry/eYFP 단백질 비) (도 5c, d 및 도 15b). 노던 블롯을 통해, mCherry 전사체가 RNase P에 의해 생성된 mMALAT1_3' 영역으로 끝나는 것이 확인되었고, 따라서 잠재 폴리아데닐화 신호가 관찰된 효율적인 번역을 담당하였을 가능성을 제거하였다 (도 15e). 이어서, 추가의 비관련 세포 종류에서 번역을 지지하는 삼중 나선의 능력을 결정하기 위해 2색 형광 리포터 (도 5b)로 마우스 중간엽 줄기 세포를 형질감염시켰다. 단일 세포에서 단백질 발현을 모니터링하는 유동 세포 분석을 사용하여, 얻은 mChery 및 eYFP 단백질의 수준을 전사체가 정규 폴리(A) 꼬리로 끝날 때 또는 mMALAT1_3' 영역이 mCherry의 하류에 삽입될 때와 비교하였다. 두 경우 모두에서, 형광 단백질의 발현은 고도로 상관성이 있는 것으로 밝혀졌고 (도 19), 이것은 MALAT1 삼중 나선이 HeLa 세포 및 마우스 중간엽 줄기 세포 둘 다에서 효율적인 번역을 촉진함을 나타낸다.
효율적인 번역을 위해 필요한 mMALAT1_3' 영역 내의 서열 요소를 결정하기 위해서, 안정하지만 불량하게 번역된 전사체가 확인될 수 있는지 시험하기 위해 RNA 안정성 (도 2g 및 도 5f) 및 효율적인 번역 (도 5g)에 필요한 최소 요소를 포함하는 cGFP-MALAT1_3' Comp. 14 전사체를 돌연변이시켰다 (도 2d). 중심 삼중 나선 영역에 존재하지 않는 MALAT1의 3' 말단부의 모든 뉴클레오티드를 돌연변이시킴으로써 (보존된 스템-루프에 염기쌍을 유지하면서) (도 5e에 제시된 Comp. 15), 안정하지만 (도 5f) 불량하게 번역된 (도 5g) cGFP 전사체를 확인하였다. Comp. 15로서 제시된 전사체는 Comp. 14만큼 효율적으로 세포질로 수송되었고, 이것은 상기 번역 효율의 감소가 전사체의 증가된 핵 체류에 의한 것이 아님을 나타낸다 (도 5h). 상기 결과를 확인한 후, mMALAT1_3' Comp. 15 영역이 2색 형광 리포터 시스템에서 mCherry의 하류에 위치할 때 (도 5b), WT mMALAT1_3' 영역에 비해 번역 효율의 ~5배 감소가 관찰된 반면, mRNA의 수준은 단지 ~2배 감소하였다 (도 5c,d 및 도 15c,d).
이어서, Comp. 15 영역에 존재하는 27개의 돌연변이 중 어느 돌연변이가 상기 번역 효율의 감소를 위해 필요한지 결정하기 위해 추가의 돌연변이유발을 수행하였다 (도 5e). 흥미롭게도, 상기 분석은 27개의 돌연변이의 특정 하위세트 (Comp. 27, 도 5e)가 전사체가 더 이상 안정하지 않도록 야기함을 보여주었다 (도 5f). 그럼에도 불구하고, 불량하게 번역된 (도 5g) 안정한 cGFP 전사체 (도 5f)를 생성한 돌연변이의 다른 하위세트 (Comp. 25 및 Comp. 26, 도 5e)를 확인하는 것이 가능하였다. 이것은 중심 삼중 나선 영역의 각각의 측면에 바로 인접하는 뉴클레오티드가 번역 촉진시에 핵심 역할을 수행함을 보여준다 (도 5i).
이들 결과는 강한 번역 인핸서 요소가 MALAT1 및 MEN β의 3' 말단부에 존재함을 나타내기 때문에, 이들 내인성 비코딩 RNA의 번역에 대한 임의의 증거가 존재하는지 조사하였다. MEN β 전사체가 마우스 배아 줄기 (ES) 세포에서 낮게 발현되지만 (데이터 미제시), MALAT1은 고도로 발현되고, 리보솜 프로파일링 (Ingolia et al. 2011)은 MALAT1의 5' 말단부 근처의 재현가능한 비-무작위 영역이 리보솜에 의해 보호됨을 시사한다 (도 6). 본 발명자들은 이들 영역에서 분명한 잘 보존된 오픈 리딩 프레임을 확인할 수 없었지만, 리보솜이 집중되는 여러 영역 근처에 마우스에 잠재적인 출발 코돈이 존재하기 때문에 종-특이적 짧은 펩티드가 MALAT1의 5' 말단부로부터 생산되는 것이 가능할 수 있다.
삼중 나선 구조는 인간 LINE-1
mRNA의
RNA 안정성 및 번역을 촉진한다.
MALAT1 삼중 나선이 다양한 메신저 RNA 서열의 3' 말단부에서 폴리(A) 꼬리를 기능적으로 교체할 수 있는지 결정하기 위해, 일부 리포터 mRNA를 시험하였다. 이미 제시된 바와 같이, 삼중 나선이 형광 리포터 단백질 GFP (도 5a) 또는 mCherry (도 5c)를 코딩하는 2개의 상이한 mRNA의 3' 말단부에 위치할 때, 리포터 mRNA의 폴리아데닐화된 형태로 얻은 것과 구별가능한 번역 수준이 관찰되었다.
이어서, MALAT1 삼중 나선을 인간 긴 산재성 요소-1 (LINE-1 또는 L1) mRNA의 하류에서 시험하였다. L1 서열은 인간 게놈 내의 자발적 레트로트랜스포존 (autonomous retrotransposon)의 우세한 클래스이다. 99.9% 초과의 L1 요소는 더 이상 역전위에 의해 이동할 수 없지만, 평균 인간 게놈은 약 80-100개의 역전위-가능 L1 요소를 보유한다 (문헌 [Beck et al. 2011]에서 검토됨). 복제-가능 L1은 약 6 kb의 길이이고, 2개의 비-중첩 오픈 리딩 프레임 (ORF1 및 ORF2)을 포함하고, 3' UTR로 끝나고, 이어서 폴리(A) 꼬리가 존재한다 (도 20a). L1 폴리(A) 꼬리를 MALAT1 삼중 나선으로 교체시의 효과를 결정하기 위해, 이전에 설명된 L1 에피솜-기반 발현 벡터 (pAD2TE1) (Doucet et al. 2010)를 사용하였다. 상기 벡터는 ORF1의 C-말단에 T7 에피토프 태그 및 ORF2의 C-말단에 TAP 태그를 포함하고, 이것들은 ORF1 및 ORF2 단백질 발현의 검출을 용이하게 한다.
pAD2TE1 L1 발현 벡터 또는 L1 폴리아데닐화 신호가 mMALAT1_3' 서열로 교체된 변형된 형태 (삼중 나선으로 끝나는 L1 mRNA를 생성하기 위해)로 HeLa 세포를 형질감염시키고, 총 RNA를 트리졸을 사용하여 단리하였다. 노던 블롯 분석에 의해 결정한 바와 같이, MALAT1 삼중 나선으로 끝나는 L1 mRNA는 폴리아데닐화된 L1 mRNA와 유사한 수준으로 축적되었다 (도 20b, 프로브 서열 (서열 172): 5'-GCGCCTGAGCACCATTTAGC). L1-MALAT1_3' RNA가 생체내에서 그의 3' 말단부에서 RNase P에 의해 적절하게 프로세싱되는지 확인하기 위해, 형질감염으로부터의 총 RNA를 ORF2의 3' 말단부 근처의 올리고 (5'-GCGCTTTGGCTTGGGTCATC) (서열 173)에 먼저 혼성화시키고, RNase H 소화에 적용하였다. 보다 작은 크기로 전사체를 절단함으로써, RNase P 절단의 정확성을 확인하기 위해 고 분해능의 노던 블롯을 실시할 수 있었다. 예상된 크기 (234 nt)의 단일 밴드가 L1-MALAT1_3' RNA에 대해 관찰되었다 (도 20c). 이와 대조적으로, 스미어가 폴리아데닐화된 L1 mRNA에 대해 관찰되었고, 이것은 부가된 폴리(A) 꼬리의 길이의 변화를 나타낸다. 이들 결과는 MALAT1 삼중 나선이 L1 mRNA를 효율적으로 안정화할 수 있음을 나타낸다.
이어서, MALAT1 삼중 나선이 L1 mRNA 번역을 지지할 수 있는지 결정하기 위해서, ORF1 및 ORF2 단백질의 번역을 정량하였다. L1 발현 벡터로부터 (게놈 내의 임의의 내인성 L1 요소로부터가 아니라) 번역된 유일한 단백질이 정량됨을 보장하기 위해, 이뮤노블롯팅 및 면역형광을 T7 또는 TAP 에피토프 태그를 인식하는 항체 (각각 ORF1 단백질 또는 ORF2 단백질의 발현을 측정하기 위한)를 사용하여 수행하였다. 도 20d에서 면역블롯에 의해 제시되는 바와 같이, L1 전사체가 폴리(A) 꼬리 또는 MALAT1 삼중 나선으로 끝날 때 유사한 수준의 ORF1 및 ORF2 단백질이 관찰되었다. 이들 결과는 ORF1 및 ORF2 단백질이 L1 mRNA 상의 3' 말단 서열과 무관하게 세포의 세포질에 높은 수준으로 축적됨을 입증한 면역형광에 의해 확인되었다 (도 20e). 종합적으로, 이들 결과는 삼중 나선이 L1 mRNA의 3' 말단부를 안정화하고 두 코딩되는 L1 단백질의 효율적인 생산을 보장할 수 있음을 나타낸다.
실시예
5:
MALAT1
삼중 나선으로 끝나는
전사체는
마이크로RNA에
의해 효율적으로 억제된다.
폴리-A 꼬리가 결여된 대부분의 긴 전사체는 세포에서 신속하게 분해되기 때문에, 일반적으로 생체내에서 폴리-A 꼬리 또는 폴리-A 결합 단백질 (PABP)에 대해 조절 역할을 규정하는 것은 어려웠다. 이제, MALAT1의 3' 말단부 주위에 구축된 발현 시스템은 생체내에서 폴리-A 꼬리가 결여된 안정한 전사체를 생성하기 때문에 이들 문제를 처리하기 위한 특유하고 가치있는 도구를 제시한다. 그의 3' 말단부에 mMALAT1_3' 서열을 갖는 전사체는 PABP와 상호작용할 것으로 보이지 않고, 그 이유는 상기 단백질이 결합을 위해 적어도 12개의 연속적인 A 잔기를 필요로 하기 때문이다 (Sachs et al. 1987). 비-폴리아데닐화된 전사체가 생체내에서 어떻게 조절되는지 조사하기 위한 상기 시스템의 유용성을 입증하기 위해, 마이크로RNA가 폴리아데닐화된 전사체에 대해서만큼 효율적으로 MALAT1 삼중 나선으로 끝나는 전사체를 억제하는지 조사하였다. 마이크로RNA는 RISC (RNA-유발 침묵 복합체)의 일부로서 기능하고, 표적 mRNA 내의 부분적으로 상보성인 부위에 결합하여, 번역 억제 및/또는 전사체 분해를 야기한다 (Bartel 2009). 중심 RISC 단백질 성분 GW182는 PABP 및 데아데닐라제와 직접 상호작용할 수 있기 때문에 (Braun et al. 2011), RISC와 PABP 사이의 상호작용이 마이크로RNA에 의한 최대 억제를 위해 필요한 모델이 개발되었다 (Fabian et al. 2009; Huntzinger et al. 2010; Moretti et al. 2012). 그러나, 이들 상호작용의 기능적 중요성은 논의되고 있다 (Fukaya and Tomari 2011; Mishima et al. 2012).
생체내에서 마이크로RNA-매개된 억제에서 폴리-A 꼬리의 역할을 조사하기 위해서, 2색 형광 리포터 시스템을 이용하고, 마이크로RNA 결합 부위를 mCherry의 3' UTR 내에, SV40 폴리아데닐화 신호 또는 mMALAT1_3' 영역의 상류에 삽입하였다 (도 7a). 특히, 2개의 튀어나온 let-7 결합 부위 (let-7 bg로 표시) 또는 let-7에 완전히 상보성인 서열 (let-7 pf로 표시)을 삽입하였고, 따라서 표적과 마이크로RNA 사이의 상호작용을 촉매적, RNA 간섭형 억제로 전환하였다. 천연적으로 let-7 마이크로RNA를 발현하는 HeLa 세포를 사용하여, mCherry가 정규 폴리-A 꼬리로 끝날 때, 2개의 튀어나온 let-7 결합 부위의 부가는 단백질 발현에 의해 측정시에 3.2 +/- 0.2배 억제를 야기하는 것으로 밝혀졌다 (도 7b 및 도 16a). 놀랍게도, 2.9 +/- 0.4배 억제가 2개의 튀어나온 let-7 부위가 MALAT1 삼중 나선으로 끝나는 mCherry에 부가될 때 관찰되었고 (도 7b 및 도 16b), 이것은 폴리-A 꼬리가 존재할 때 얻은 것과 통계적으로 상이하지 않은 억제 수준이다. mCherry가 폴리-A 꼬리 또는 MALAT1 삼중 나선으로 끝나는 것과 상관없이, 이들 효과는 전사체 수준에서 반영되었고 (도 7c), 이것은 단백질 생산에 대한 효과가 적어도 부분적으로 감소된 RNA 수준에 의한 것일 수 있다. HeLa 세포에서 마이크로RNA의 수준을 증가시키기 위해 합성 let-7의 형질감염시에, 관찰된 마이크로RNA-매개된 억제의 수준은 존재하는 3' 말단 서열과 무관하게 지속적으로 증가하였다 (도 7b, c). 이들 결과는 폴리-A 꼬리가 생체내에서 마이크로RNA에 의한 최대 억제를 위해 필요하지 않고, 따라서 마이크로RNA가 또한 세포에서 비-폴리아데닐화된 전사체를 효율적으로 표적화할 수 있음을 제시한다. 비-폴리아데닐화된 전사체가 마이크로RNA에 반응하여 분해되는 메카니즘은 불명확하지만, 이들 결과는 탈아데닐화가 효율적인 마이크로RNA-매개된 침묵을 위해 항상 요구되는 것은 아님을 시사한다.
실시예
6: 반감기 측정:
HeLa 세포를 CMV-cGFP-mMALAT1_3' 리포터 플라스미드로 24 hr 동안 일시 형질감염시켰다. 이어서, MALAT1 삼중 나선으로 끝나는 cGFP 리포터 mRNA의 반김기를 추정하기 위해, 전사 억제제인 1 μΜ 악티노마이신 D (ActD)를 배지에 첨가하고, 세포를 전사 억제 0, 1, 2, 4, 6, 8, 및 10 hr 후에 수거하였다. 노던 블롯은 HeLa 세포에서 삼중 나선으로 끝나는 cGFP 전사체의 반감기가 ~5 hr임을 보여주었다. 그 결과를 도 18에 제시한다. 이전의 연구는 폴리(A) 꼬리로 끝나는 GFP 전사체의 반감기를 ~4.8 hr으로 추정하였고 (Kudla, G., et al. (2006). High guanine and cytosine content increases mRNA levels in mammalian cells. PLoS Biol. 4: e180.), 이것은 시험된 RNA 분자 상의 삼중 나선 및 폴리(A) 꼬리가 전사체의 3' 말단부를 유사한 정도로 안정화할 수 있음을 나타낸다.
실시예
7: 삼중 나선으로 끝나는 시험관내 전사된
mRNA는
세포 추출물에서 번역될 수 있다.
다량의 mRNA는 파지 (예를 들어, SP6, T3, 또는 T7)로부터 단리된 RNA 폴리머라제를 사용하여 시험관내에서 DNA 주형으로부터 합성될 수 있다. 세포를 형질감염시거나 세포 추출물에서 인큐베이션될 때, 폴리(A) 꼬리로 끝나는 시험관내에서 합성된 mRNA는 내인성 세포성 번역 기구를 사용하여 효율적으로 번역될 수 있다. 삼중 나선으로 끝나는 시험관내 전사된 mRNA가 세포 번역 기구와 함께 인큐베이션될 때 유사하게 번역될 수 있는지 결정하기 위해서, 잘 특성화된 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 시험관내 번역 검정을 사용하였다 (Gilbert et al. 2007; Rojas-Duran and Gilbert 2012). 이전에 설명된 바와 같이 (Rojas-Duran and Gilbert 2012), T7 프로모터의 제어 하에 반딧불이 루시페라제 오픈 리딩 프레임 (ORF)을 포함하는 리포터 구축물을 생성하였다. DNA 주형 내의 루시페라제 ORF의 하류에 (i) 62개 뉴클레오티드의 폴리(A) 꼬리, (ii) 야생형 MALAT1 삼중 나선, 또는 (iii) 삼중 나선 구조를 유의하게 불안정하게 만들고, 따라서 신속한 분해를 위한 mRNA를 표적화하는 돌연변이를 포함하는 MALAT1 삼중 나선의 Comp.27 형태를 삽입하였다 (도 5e).
T7 폴리머라제를 사용한 런-오프 (run-off) 전사, 이어서 우두 캡 형성 효소를 사용한 캡 형성에 의해 캡핑된 루시페라제 mRNA를 시험관내에서 합성하였다. 정제된 m7G-캡핑된 mRNA를 아가로스 겔의 밀도계에 의해 정량하였다. 이어서, 등몰량의 각각의 mRNA를 야생형 효모 추출물에 첨가하고, 번역 검정을 수행하였다 (Rojas-Duran and Gilbert 2012). mRNA당 번역 활성을 결정하기 위해 루시페라제 활성을 사용하여, 폴리(A) 꼬리 및 야생형 MALAT1 삼중 나선 둘 다는 배경 수준보다 유의한 번역을 촉진하는 것으로 밝혀졌다 (Comp.27 돌연변이체에 의해 결정될 때) (도 21). 따라서, 이들 결과는 삼중 나선으로 끝나는 시험관내 전사된 mRNA가 유의한 수준의 단백질 생산을 얻기 위해 세포 추출물에 첨가될 수 있음을 나타낸다.
논의
폴리-A 꼬리의 결여에도 불구하고, 긴 비코딩 RNA MALAT1은 생체내에서 많은 단백질-코딩 유전자에 대응하거나 더 높은 수준으로 발현되는 안정한 전사체이다 (Wilusz et al. 2008; Zhang et al. 2012). 본 연구에서, 본 발명자들은 MALAT1의 3' 말단부가 진화상 보존된 삼중 나선에 의한 분해로부터 보호됨을 입증하였다. 본 발명자들은 MEN β 긴 비코딩 RNA의 3' 말단부를 안정화하는 고도로 유사한 삼중 나선 구조를 추가로 확인하였다. 놀랍게도, 이들 삼중 나선 영역은 또한 강력한 번역 인핸서 요소로 기능하여, 비-폴리아데닐화된 mRNA가 정규 폴리-A 꼬리가 존재하는 mRNA만큼 효율적으로 번역될 수 있도록 허용한다. 이들 결과는 다수의 세포주에서 관찰되었다. 삼중 나선으로 끝나는 전사체는 마이크로RNA에 의해 효율적으로 억제되고, 이것은 폴리-A 꼬리가 생체내에서 효율적인 마이크로RNA-매개된 침묵을 위해 필요하지 않음을 나타낸다. 본 발명자들의 데이터는 폴리-A 꼬리가 결여된 MALAT1, MEN β, 및 유사한 다른 전사체가 생체내에서 안정화되고 조절되는 방식에 대한 새로운 통찰력을 제공한다.
RNA 분해에서
우리딜화의
증가하는 역할
MALAT1 삼중 나선의 일체성의 붕괴는 전사체가 효율적으로 분해되도록 유도한다. 본 발명자들은 놀랍게도 전사체가 분해를 겪을 때 전사 후에 부가된 짧은 U-풍부 꼬리로 끝나는 수많은 cGFP-MALAT1_3' 전사체를 발견하였고 (도 2f 및 도 11c), 이것은 우리딜화가 붕괴 과정에 관련됨을 나타낸다. 올리고우리딜화는 tRNA (도 8), 마이크로RNA 전구체 (Heo et al. 2009), 성숙 마이크로RNA (Li et al. 2005), 및 전사 개시 부위-회합 RNA (Choi et al. 2012)를 포함하는 작은 RNA의 수많은 클래스의 분해에 연결된다. 현재 생체내에서 긴 전사체 상의 U-꼬리에 대한 증거는 적지만, 우리딜화는 mRNA 탈캡핑을 촉진할 수 있고 (Song and Kiledjian 2007; Rissland and Norbury 2009), U-꼬리는 마이크로RNA-유도 절단의 생성물 상에서 관찰되었다 (Shen and Goodman 2004). 흥미롭게도, 히스톤 mRNA는 DNA 합성 완료 후에 우리딜화 및 분해에 적용된다 (Mullen and Marzluff 2008). 본 발명자들이 MALAT1의 고도로 구조화된 3' 말단부에서 관찰한 바와 유사하게 (도 2f 및 도 11c), 물렌 (Mullen) 및 마즐루프 (Marzluff)는 3'-5' 엑소뉴클레아제에 의해 이전에 단축된 것으로 보이는 히스톤 mRNA 상에서 짧은 U-꼬리를 관찰하였다. 본 발명자들은 분해를 위해 표적화되는 돌연변이체 mascRNA 전사체의 3' 말단부에서 유사한 현상을 추가로 관찰하였다 (도 8). 이들 결과는 올리고우리딜화가 본 발명자들이 현재 평가하는 것보다 광범한 RNA 2차 구조의 영역의 분해에서 훨씬 더 큰 유의한 역할을 수행할 수 있음을 제시한다. 특히, 본 발명자들은 3'-5' 엑소뉴클레아제가 광범한 2차 구조의 영역에서 멈출 때, 올리고(U) 꼬리가 부가되어 단일 가닥 꼬리를 제공할 수 있고, 이것은 후속적으로 붕괴 인자에 의해 인식되고 분해 과정을 재출발시키기 위해 사용됨을 제시한다.
MALAT1
및 MEN β의 기능에 대한 삼중 나선의 영향
신속하게 분해되고 따라서 거의 비검출가능한 수준에서 발현되는 많은 긴 비코딩 RNA와 달리 (Wyers et al. 2005; Preker et al. 2008), MALAT1 및 MEN β는 반감기가 12시간 초과인 안정한 전사체이다 (Wilusz et al. 2008; Sunwoo et al. 2009). 이들 비코딩 RNA의 3' 말단부로부터 분해를 억제함으로써, 삼중 나선은 RNA 안정성을 보장하는 것뿐만 아니라 이들 전사체가 중요한 세포 기능을 수행하도록 허용하기 위해 매우 중요한 역할을 수행한다. 예를 들어, MEN β 비코딩 RNA는 핵에서 파라스페클 (paraspeckle)의 필수적인 구조적 성분이다 (Sunwoo et al. 2009). MEN β가 세포로부터 고갈될 때, 상기 핵내 도메인이 더 이상 관찰되지 않고, 대신에 파라스페클-회합 단백질 및 RNA가 분산된다. MALAT1의 정확한 세포 기능은 모순되는 결과가 발표되기 때문에 현재 논쟁이 되고 있는 대상이다 (Tripathi et al. 2010; Yang et al. 2011b; Eissmann et al. 2012; Zhang et al. 2012). 그럼에도 불구하고, MALAT1은 많은 암에서 공통적으로 과다발현되고, 이것은 악성 표현형에서 가능한 역할을 제시한다.
MALAT1 및 MEN β 삼중 나선이 강한 번역 인핸서 요소로서 기능한다는 본 발명자들의 발견은 이들 핵-보유된 전사체가 기능할 수 있는 방법에 추가의 예상치 않은 전환을 추가로 제시한다. Xist 긴 비코딩 RNA가 단백질-코딩 유전자로부터 진화됨을 고려할 때 (Duret et al. 2006), 이것은 MALAT1 및 MEN β에 대해서도 동일하게 적용될 수 있고, 따라서 그의 연관 번역 제어 요소는 단순히 그의 진화상 과거의 유물일 수 있다. 대안적으로, 이들 비코딩 RNA는 이전에 비코딩으로 간주된 다른 전사체에 대해 밝혀진 바와 같이 리보솜과 상호작용하여, 가능하게는 짧은 펩티드를 생산할 수 있다 (Galindo et al. 2007; Ingolia et al. 2011). 재현가능한 비-무작위 리보솜 흔적은 마우스 배아 줄기 세포에서 MALAT1 상에서 발견되었지만 (도 6), 분명한 잘 보존된 오픈 리딩 프레임은 확인되지 않았다. 또한, MALAT1 및 MEN β는 단순히 번역 기구의 성분과 상호작용하여, mRNA에 대한 이들 인자의 결합을 방지하는 "스폰지"로서 기능할 수 있는 것도 가능하다.
마지막으로, 폴리-A 꼬리가 없는 안정한 세포질 mRNA를 생산하는 발현 벡터의 이용가능성은 상기 비-주형 코딩되는 구조를 수반하는 번역 제어 메카니즘에 대한 생체내 시험을 허용할 것이다. 예를 들어, 본 발명자들은 마이크로RNA가 폴리-A 꼬리가 존재하는 표적 mRNA의 발현을 MALAT1 삼중 나선으로 끝나는 mRNA만큼 효율적으로 조절함을 밝혀내었다.
요약하면, 본 발명자들은 RNA 붕괴를 억제하는 기능을 수행하는, 비-폴리아데닐화된 MALAT1 및 MEN β 긴 비코딩 RNA의 3' 말단부에서 고도로 보존된 삼중 나선 구조를 확인하였다. 오픈 리딩 프레임의 하류에 위치할 때, 삼중 나선은 효율적인 번역을 촉진하는 기능을 추가로 수행한다. 본 발명자들은 삼중 나선으로 끝나는 시험관내 전사된 mRNA가 또한 시험관내에서 번역될 수 있음을 입증하였다. 본 발명자들의 발견은 따라서 정규 폴리-A 꼬리가 결여된 전사체가 어떻게 안정화되고 조절되고 및 번역될 수 있는지에 대한 새로운 패러다임을 제공한다. 인간 트랜스크립톰의 복잡성 및 폴리-A 꼬리가 결여된 많은 다른 긴 전사체의 존재를 고려할 때, 삼중 나선 및 다른 RNA 구조적 요소가 전사체 안정성을 보장하고 유전자 발현을 조절할 때 추가의 예상치 않은 역할을 수행할 수 있을 것으로 보인다.
참고문헌
SEQUENCE LISTING
<110> Massachusetts Institute of Technology
Jeremy E. Wilusz
Phillip A. Sharp
<120> PRODUCTION OF STABLE NON-POLYADENYLATED RNAS
<130> M0656.70290WO00
<140> TBD
<141> 2013-10-11
<150> 61/739,153
<151> 2012-12-19
<150> 61/716,764
<151> 2012-10-22
<150> 61/714,697
<151> 2012-10-16
<160> 174
<170> PatentIn version 3.5
<210> 1
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 1
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 2
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 2
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtatcttt gctt 174
<210> 3
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 3
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa ggcgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtaccgtt gctt 174
<210> 4
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 4
gattcgtcag tagggttgta aaggtttaaa aattcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 5
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 5
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggtttaaa aatttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 6
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 6
gattcgtcag tagggttgta aaggtttaaa aattcctgag aaaacaacct tttgttttct 60
caggtttaaa aatttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 7
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 7
gattcgtcag tagggttgta aaggttttta ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 8
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 8
gattcgtcag tagggttgta aaggtttaac ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 9
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 9
gattcgtcag tagggttgta aaggtttttc aattcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 10
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 10
gattcgtcag tagggttgta aaggtttttc ttaacctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 11
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 11
gattcgtcag tagggttgta aaggtaattc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 12
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 12
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttaa tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 13
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 13
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttaagc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 14
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 14
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggaattgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 15
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 15
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc ttaatggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 16
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 16
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttaaggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 17
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 17
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttcg tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 18
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 18
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaacgaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 19
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 19
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttcg tttttggcct ttccctagct ttaaaaaaaa aaaacgaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 20
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 20
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc aatttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 21
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 21
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aattgcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 22
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 22
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc aatttggcct ttccctagct ttaaaaaaaa aattgcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 23
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 23
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttcg aaaatggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 24
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 24
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa ttttcgaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 25
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 25
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttcg aaaatggcct ttccctagct ttaaaaaaaa ttttcgaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 26
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 26
aaaggttttt cttttcctga tcaggttttg ctttttggcc tttccctagc tttaaaaaaa 60
aaaaagcaaa agacgctggt ggctggcact cctggtttcc aggacggggt tcaagtccct 120
gcggtgtctt tgctt 135
<210> 27
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 27
aaaggttttt cttttcctga tcaggttttg ctttttaaaa aaaaaaaagc aaaagacgct 60
ggtggctggc actcctggtt tccaggacgg ggttcaagtc cctgcggtgt ctttgctt 118
<210> 28
<211> 128
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 28
aaaggttttt cttttcctga tcaggttttg ctttttggcc tttccctagc tttaaaaagc 60
aaaagacgct ggtggctggc actcctggtt tccaggacgg ggttcaagtc cctgcggtgt 120
ctttgctt 128
<210> 29
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 29
aaaggttttt cttttcctga tcaggttttg cttttttagc tttaaaaagc aaaagacgct 60
ggtggctggc actcctggtt tccaggacgg ggttcaagtc cctgcggtgt ctttgctt 118
<210> 30
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 30
gattcgtcag tagggttgta aaggtttttc ttttcctgat caggttttgc tttttaaaaa 60
aaaaaaagca aaagacgctg gtggctggca ctcctggttt ccaggacggg gttcaagtcc 120
ctgcggtgtc tttgctt 137
<210> 31
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 31
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ctttttaaaa 60
aaaaaaaagc aaaagacgct ggtggctggc actcctggtt tccaggacgg ggttcaagtc 120
cctgcggtgt ctttgctt 138
<210> 32
<211> 148
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 32
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ctttttggcc 60
tttccctagc tttaaaaagc aaaagacgct ggtggctggc actcctggtt tccaggacgg 120
ggttcaagtc cctgcggtgt ctttgctt 148
<210> 33
<211> 131
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 33
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ctttttaaaa 60
agcaaaagac gctggtggct ggcactcctg gtttccagga cggggttcaa gtccctgcgg 120
tgtctttgct t 131
<210> 34
<211> 134
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 34
aaaggttttt cttttcctga gaaaacaatt gttttctcag gttttgcttt ttaaaaaaaa 60
aaaagcaaaa gacgctggtg gctggcactc ctggtttcca ggacggggtt caagtccctg 120
cggtgtcttt gctt 134
<210> 35
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 35
aaaggttttt cttttcctga gaaaacgttt tctcaggttt tgctttttaa aaaaaaaaaa 60
gcaaaagacg ctggtggctg gcactcctgg tttccaggac ggggttcaag tccctgcggt 120
gtctttgctt 130
<210> 36
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 36
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg cttttttagc 60
tttaaaaagc aaaagacgct ggtggctggc actcctggtt tccaggacgg ggttcaagtc 120
cctgcggtgt ctttgctt 138
<210> 37
<211> 126
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 37
aaaggttttt cttttcctga gaaatttctc aggttttgct ttttaaaaaa aaaaaagcaa 60
aagacgctgg tggctggcac tcctggtttc caggacgggg ttcaagtccc tgcggtgtct 120
ttgctt 126
<210> 38
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 38
aaaggttttt cttttcctga gatctcaggt tttgcttttt aaaaaaaaaa aagcaaaaga 60
cgctggtggc tggcactcct ggtttccagg acggggttca agtccctgcg gtgtctttgc 120
tt 122
<210> 39
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 39
aaaggttttt cttttcctga gaaatttctc aggttttgct ttttaaaaaa aaagcaaaag 60
acgctggtgg ctggcactcc tggtttccag gacggggttc aagtccctgc ggtgtctttg 120
ctt 123
<210> 40
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 40
cccaattttt cttttgaatt ctctagagaa ttcttttgct ttttcttcaa aaagcaaaag 60
acgctggtgg ctggcactcc tggtttccag gacggggttc aagtccctgc ggtgtctttg 120
ctt 123
<210> 41
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 41
cccaattttt cttttgaaga gaaatttctc ttcttttgct ttttcttcaa aaagcaaaag 60
acgctggtgg ctggcactcc tggtttccag gacggggttc aagtccctgc ggtgtctttg 120
ctt 123
<210> 42
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 42
cccaattttt cttttgaaga gaaatttctc ttcttttgct ttttaaaaaa aaagcaaaag 60
acgctggtgg ctggcactcc tggtttccag gacggggttc aagtccctgc ggtgtctttg 120
ctt 123
<210> 43
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 43
aaaggttttt cttttgaaga gaaatttctc ttcttttgct ttttcttcaa aaagcaaaag 60
acgctggtgg ctggcactcc tggtttccag gacggggttc aagtccctgc ggtgtctttg 120
ctt 123
<210> 44
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 44
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ccccctaaaa 60
aaaaaaaagc aaaagacgct ggtggctggc actcctggtt tccaggacgg ggttcaagtc 120
cctgcggtgt ctttgctt 138
<210> 45
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 45
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ctttttaaaa 60
aaaagggggc aaaagacgct ggtggctggc actcctggtt tccaggacgg ggttcaagtc 120
cctgcggtgt ctttgctt 138
<210> 46
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 46
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ccccctaaaa 60
aaaagggggc aaaagacgct ggtggctggc actcctggtt tccaggacgg ggttcaagtc 120
cctgcggtgt ctttgctt 138
<210> 47
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 47
aaaggtcccc cttttcctga gaaaacaacc ttttgttttc tcaggttttg ccccctaaaa 60
aaaagggggc aaaagacgct ggtggctggc actcctggtt tccaggacgg ggttcaagtc 120
cctgcggtgt ctttgctt 138
<210> 48
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 48
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 49
<211> 228
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 49
cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 60
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 120
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 180
attgggaaga caatagcagg catgctgggg atgcggtggg ctctatgg 228
<210> 50
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 50
ggcacggagc cgccgcaggt gtttcttttc ctgaccgcgg ctcatggccg cgctcaggtt 60
ttgcttttca cctttgtctg agagaacgaa cgtgagcagg aaaaagcaaa aggcactggt 120
ggcggcacgc ccgcacctcg ggccagggtt cgagtccctg cagtaccgtg cttc 174
<210> 51
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 51
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 52
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 52
ggacaaaaac gagacgctgg tggctggcac tcctggtttc caggacgggg ttcaagtccc 60
tgcggtgtct ttgctt 76
<210> 53
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 53
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 54
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 54
gattcgtcag tagggttgta aaggtttaaa aattcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 55
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 55
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttcg aaaatggcct ttccctagct ttaaaaaaaa aaaagcaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 56
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 56
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa ttttcgaaaa gacgctggtg 120
gctggcactc ctggtttcca ggacggggtt caagtccctg cggtgtcttt gctt 174
<210> 57
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 57
ggcttcatat aatcctaatg atatggtttg ggagtttcta ccaagagcct taaactcttg 60
attatgaagt cgacgctggt ggctggcact cctggtttcc aggacggggt tcaagtccct 120
gcggtgtctt tgctt 135
<210> 58
<211> 132
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 58
ggatcatata atcgcgtgga tatggcacgc aagtttctac cgggcaccgt aaatgtccga 60
ctatggtcga cgctggtggc tggcactcct ggtttccagg acggggttca agtccctgcg 120
gtgtctttgc tt 132
<210> 59
<211> 162
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 59
ggaaaaatgt cacgcacagg gcaaaccatt cgaaagagtg ggacgcaaag cctccggcct 60
aaaccagaag acatggtagg tagcggggtt accgatggga cgctggtggc tggcactcct 120
ggtttccagg acggggttca agtccctgcg gtgtctttgc tt 162
<210> 60
<211> 196
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 60
ttaaaatctc ttatcaagag aggtggaggg actggcccga tgaaacccgg caaccagcct 60
tagggcatgg tgccaattcc tgcagcggtt tcgctgaaag atgagagatt cttgtagtct 120
cttcttttag cggacgctgg tggctggcac tcctggtttc caggacgggg ttcaagtccc 180
tgcggtgtct ttgctt 196
<210> 61
<211> 189
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 61
ccggctttaa gttgacgagg gcagggttta tcgagacatc ggcgggtgcc ctgcggtctt 60
cctgcgaccg ttagaggact ggtaaaacca caggcgactg tggcatagag cagtccgggc 120
aggaagacgc tggtggctgg cactcctggt ttccaggacg gggttcaagt ccctgcggtg 180
tctttgctt 189
<210> 62
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 62
gcaaagacac cgcagggact tgaac 25
<210> 63
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 63
gcaaagacac cgcagggatt tgaaccccgt cctggaaacc aggagtgcca 50
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 64
tccatgccgt gggtgatgcc 20
<210> 65
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 65
ctaagatgct agcttggcca agtctgttat g 31
<210> 66
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 66
gctaatcttc tctgtatcgt tccaatttta gtatatgtgc tgccg 45
<210> 67
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 67
gccggtggag tggcggccct c 21
<210> 68
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 68
cgcgcttctc gttggggtcc 20
<210> 69
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 69
ttcgtactgt tccacgatgg 20
<210> 70
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 70
aaaaagcaaa a 11
<210> 71
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 71
cagtagggtc atgaaggttt ttcttttcct gagaaaacaa cacgtattgt tttctcaggt 60
tttgcttttt ggcctttttc tagcttaaaa aaaaaaaaag caaaa 105
<210> 72
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 72
cagtagggtc atgaaggttt ttcttttcct gagaaaacaa cacgttttgt tttctcaggt 60
tttgcttttt ggcctttttc tagctttaaa aaaaaaaaag caaaa 105
<210> 73
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 73
cagtagggtt gtaaaggttt ttcttttcct gagaaaacaa ccttttgttt tctcaggttt 60
tgctttttgg cctttcccta gctttaaaaa aaaaaaagca aaa 103
<210> 74
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 74
cagtagggtt gtaaaggttt ttcttttcct gagaaaacaa atttttgttt tctcaggttt 60
tgctttttag ccttttccta gcttaaaaaa aaagcaaaa 99
<210> 75
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 75
cagtagggct gtaaaggttt ttcttttcct gagaaaacaa cttttgtttt ctcaggtttt 60
gctttttggc cttttcctag ctttaaaaaa aaaaaagcaa aa 102
<210> 76
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 76
caccttgtcc gagggttttt cttttcctga ggaaacaccg cttgtttcct caggttttgc 60
tttttcacct ttaatactca aaaaaagcaa aa 92
<210> 77
<211> 98
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 77
gtagtctcaa aaggttttct tttactggga gaacattttt tgttcttgca ggttttgctt 60
tttacctctc gaattaccaa aaaaaaaaaa aagcaaaa 98
<210> 78
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 78
gtttgaggtt tttctttttt cctgggggaa caactattgt tctttcaggt tttgcttttt 60
aacctcctaa gaaaaaaagc aaaa 84
<210> 79
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 79
cggagccgcc gcaggtgttt cttttactga gtgcagccca tggccgcact caggttttgc 60
ttttcacctt cccatctgtg aaagagtgag caggaaaaag caaaa 105
<210> 80
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 80
cggagccgcc gcaggtgttt cttttactga gtgtggccca tggccgcact caggttttgc 60
ttttcacctt ctgatctgtg aaagagtgag caggaaaaag caaaa 105
<210> 81
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 81
cggagccgcc gcaggtgttt cttttcctga ccgcggctca tggccgcgct caggttttgc 60
ttttcacctt tgtctgagag aacgtgagca ggaaaaagca aaa 103
<210> 82
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 82
tggagccgcc gcaggtgttt cttttactgg atgaggctca tggccacatt caggttttgc 60
ttttcacctt tgagtctgtg cgaaaacaag gaggaaaaag caaaa 105
<210> 83
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 83
cggagccgcc gcaggtgttt cttttactga acgcagctca tggcagcgtt caggttttgc 60
ttttcacctt tgagtctgtg agaaaatgag caggaaaaag caaaa 105
<210> 84
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 84
ggcagccccc gcgggtgttt cttttactga ggctgccctg cagcctcagg ttttgctttt 60
cacccttaac tttgtgaaag aaagagcgcc aaaaagcaaa a 101
<210> 85
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 85
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa 110
<210> 86
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 86
gattcgtcag tagggttgta aaggtttaaa aattcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa 110
<210> 87
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 87
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggtttaaa aatttggcct ttccctagct ttaaaaaaaa aaaagcaaaa 110
<210> 88
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 88
gattcgtcag tagggttgta aaggtttaaa aattcctgag aaaacaacct tttgttttct 60
caggtttaaa aatttggcct ttccctagct ttaaaaaaaa aaaagcaaaa 110
<210> 89
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 89
aaaggttttt cttttcctga gaaatttctc aggttttgct ttttaaaaaa aaagcaaaa 59
<210> 90
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 90
aaaaagcaaa agacgcg 17
<210> 91
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 91
aaaaagcaaa attttttt 18
<210> 92
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 92
aaaaagcaat ttttt 15
<210> 93
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 93
aaaaagcaaa atctt 15
<210> 94
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 94
aaaaagcaaa aatattt 17
<210> 95
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 95
aaaaagcaaa aaaaaaaat 19
<210> 96
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 96
aaaaagcaaa aaaaaaatt 19
<210> 97
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 97
aaaaagcaaa atttt 15
<210> 98
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 98
aaaaagcaaa aaaaaaa 17
<210> 99
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 99
aaaaagcttt tttttttttt ttttt 25
<210> 100
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 100
aaaaagcttt ttt 13
<210> 101
<211> 59
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 101
aaagguuuuu cuuuuccuga gaaauuucuc agguuuugcu uuuuaaaaaa aaagcaaaa 59
<210> 102
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 102
ttttgctttt tggcctttcc ctagctttaa aaaaaaaaaa gcaaaa 46
<210> 103
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 103
ttttcgtttt tggcctttcc ctagctttaa aaaaaaaaaa gcaaaa 46
<210> 104
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 104
ttttgctttt tggcctttcc ctagctttaa aaaaaaaaaa cgaaaa 46
<210> 105
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 105
ttttcgtttt tggcctttcc ctagctttaa aaaaaaaaaa cgaaaa 46
<210> 106
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 106
ttttgcaatt tggcctttcc ctagctttaa aaaaaaaaaa gcaaaa 46
<210> 107
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 107
ttttgctttt tggcctttcc ctagctttaa aaaaaaaatt gcaaaa 46
<210> 108
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 108
ttttgcaatt tggcctttcc ctagctttaa aaaaaaaatt gcaaaa 46
<210> 109
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 109
ttttcgaaaa tggcctttcc ctagctttaa aaaaaaaatt gcaaaa 46
<210> 110
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 110
ttttgctttt tggcctttcc ctagctttaa aaaaaatttt cgaaaa 46
<210> 111
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 111
ttttcgaaaa tggcctttcc ctagctttaa aaaaaatttt cgaaaa 46
<210> 112
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 112
ccttttcttt ttggaaa 17
<210> 113
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 113
ccttttattt ttggaaa 17
<210> 114
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 114
ccttttcaat ttggaaa 17
<210> 115
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 115
ccttaacttt ttggaaa 17
<210> 116
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 116
ccaattcttt ttggaaa 17
<210> 117
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 117
ccttttctta atggaaa 17
<210> 118
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 118
aaaggttttt cttttcctga gaaatttctc agttttgctt ttttaaaaaa aaagcaaaa 59
<210> 119
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 119
cccaattttt cttttgaatt ctctagagaa ttcttttgct ttttcttcaa aaagcaaaa 59
<210> 120
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 120
cccaattttt cttttgaaga gaaatttctc ttcttttgct ttttcttcaa aaagcaaaa 59
<210> 121
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 121
cccaattttt cttttgaaga gaaatttctc ttcttttgct ttttaaaaaa aaagcaaaa 59
<210> 122
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 122
aaaggttttt cttttgaaga gaaatttctc ttcttttgct ttttcttcaa aaagcaaaa 59
<210> 123
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 123
acuccaucau ccaacauacc aa 22
<210> 124
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 124
ugagguagua gguuguaugg uu 22
<210> 125
<211> 50
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 125
acuccaucua gcaacauacc aacuuaagac uccaucuagc aacauaccaa 50
<210> 126
<211> 58
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<220>
<221> misc_feature
<222> (2)..(2)
<223> n represents a or g
<220>
<221> misc_feature
<222> (55)..(55)
<223> n represents a or g
<220>
<221> misc_feature
<222> (56)..(56)
<223> n represents c or u
<220>
<221> misc_feature
<222> (58)..(58)
<223> n represents g or u
<400> 126
gncgcuggug gcuggcacuc cugguuucca ggacgggguu caagucccug cggunncn 58
<210> 127
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 127
ttcaagtccc tgcggtaccg ttgctt 26
<210> 128
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 128
ttcaagtccc tgcggtaccg ccacca 26
<210> 129
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 129
ttcaagtccc tgcggtaccg ccacc 25
<210> 130
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 130
ttcaggtccc tgcggtaccg ccacca 26
<210> 131
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 131
ttcaagtccc tgcggtaccg ccaccag 27
<210> 132
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 132
ttcaagtccc tgcggtatct ttgctt 26
<210> 133
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 133
tcaagtccct gcggtaaaac tcttttttt 29
<210> 134
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 134
ttcaagtccc tgcggtttaa atttttttt 29
<210> 135
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 135
ttcaagtccc tgcggtatct ttttttttct t 31
<210> 136
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 136
ttcmgtccct gcggtatttt tatttttttt atttctt 37
<210> 137
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 137
ttcaagtccc tgcggtatct c 21
<210> 138
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 138
ttcaagtccc tgcggtatct cca 23
<210> 139
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 139
aaaaaaagca aaa 13
<210> 140
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 140
ggacaaaaac ga 12
<210> 141
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 141
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttcg aaaatggcct ttccctagct ttaaaaaaaa aaaagcaaaa 110
<210> 142
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 142
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa ttttcgaaaa 110
<210> 143
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 143
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggtttttt tttttttttt t 81
<210> 144
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 144
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgtttttt 60
ttttttttt 69
<210> 145
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 145
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct ttttt 55
<210> 146
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 146
gattcgtcag tagggttgta aaggtttttc ttttcctgag aaaacaacct tttgttttct 60
caggttttgc tttttggcct ttccctagct ttaaaaaaaa aaaagcaaaa 110
<210> 147
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 147
aaaggttttt cttttcctga tcaggttttg ctttttggcc tttccctagc tttaaaaaaa 60
aaaaagcaaa a 71
<210> 148
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 148
aaaggttttt cttttcctga tcaggttttg ctttttaaaa aaaaaaaagc aaaa 54
<210> 149
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 149
aaaggttttt cttttcctga tcaggttttg ctttttggcc tttccctagc tttaaaaagc 60
aaaa 64
<210> 150
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 150
aaaggttttt cttttcctga tcaggttttg cttttttagc tttaaaaagc aaaa 54
<210> 151
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 151
gattcgtcag tagggttgta aaggtttttc ttttcctgat caggttttgc tttttaaaaa 60
aaaaaaagca aaa 73
<210> 152
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 152
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ctttttaaaa 60
aaaaaaaagc aaaa 74
<210> 153
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 153
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ctttttggcc 60
tttccctagc tttaaaaagc aaaa 84
<210> 154
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 154
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg ctttttaaaa 60
agcaaaa 67
<210> 155
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 155
aaaggttttt cttttcctga gaaaacaatt gttttctcag gttttgcttt ttaaaaaaaa 60
aaaagcaaaa 70
<210> 156
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 156
aaaggttttt cttttcctga gaaaacgttt tctcaggttt tgctttttaa aaaaaaaaaa 60
gcaaaa 66
<210> 157
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 157
aaaggttttt cttttcctga gaaaacaacc ttttgttttc tcaggttttg cttttttagc 60
tttaaaaagc aaaa 74
<210> 158
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 158
aaaggttttt cttttcctga gaaatttctc aggttttgct ttttaaaaaa aaaaaagcaa 60
aa 62
<210> 159
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 159
aaaggttttt cttttcctga gatctcaggt tttgcttttt aaaaaaaaaa aagcaaaa 58
<210> 160
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 160
aaaggttttt cttttcctga gaaatttctc aggttttgct ttttaaaaaa aaagcaaaa 59
<210> 161
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 161
ttttgctttt t 11
<210> 162
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 162
tttaaaaatt t 11
<210> 163
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 163
aattgctttt t 11
<210> 164
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 164
ttaagctttt t 11
<210> 165
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 165
ttttaatttt t 11
<210> 166
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 166
ttttgcaatt t 11
<210> 167
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 167
ttttgcttaa t 11
<210> 168
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 168
ttttgcttta a 11
<210> 169
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 169
ccacctacgg caagctgacc 20
<210> 170
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 170
ggtagcgggc gaagcact 18
<210> 171
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 171
cttggagccg tacatgaact gagg 24
<210> 172
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 172
gcgcctgagc accatttagc 20
<210> 173
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 173
gcgctttggc ttgggtcatc 20
<210> 174
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic oligonucleotide
<400> 174
aaaaaaaaaa aaaaa 15
Claims (71)
- 이종 RNA 안정화 말단 서열에 연결된, 폴리-A 꼬리가 결여된 RNA 분자를 포함하는 하이브리드 핵산.
- 제1항에 있어서, 이종 RNA 안정화 말단 서열이 삼중 나선 입체형태를 갖는 것인 하이브리드 핵산.
- 제1항 또는 제2항에 있어서, RNA 분자가 세포질 RNA 또는 핵 RNA인 하이브리드 핵산.
- 제1항 내지 제3항 중 어느 한 항에 있어서, RNA 분자가 mRNA인 하이브리드 핵산.
- 제1항 내지 제3항 중 어느 한 항에 있어서, RNA 분자가 비코딩 RNA인 하이브리드 핵산.
- 제1항 내지 제3항 중 어느 한 항에 있어서, RNA 분자가 진핵 RNA인 하이브리드 핵산.
- 제1항 내지 제3항 중 어느 한 항에 있어서, RNA 분자가 포유동물 RNA인 하이브리드 핵산.
- 제1항 내지 제3항 중 어느 한 항에 있어서, RNA 분자가 식물 RNA인 하이브리드 핵산.
- 제1항 내지 제3항 중 어느 한 항에 있어서, RNA 분자가 인간 RNA인 하이브리드 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 RNA 안정화 말단 서열이 MALAT1 말단 서열인 하이브리드 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 RNA 안정화 말단 서열이 MEN β 말단 서열인 하이브리드 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 RNA 안정화 말단 서열이 U-풍부 서열인 하이브리드 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 RNA 안정화 말단 서열이 A-풍부 서열인 하이브리드 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 RNA 안정화 말단 서열이 U-풍부 및 A-풍부 서열인 하이브리드 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 RNA 안정화 말단 서열이 C-풍부 및 G-풍부 서열인 하이브리드 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 이종 RNA 안정화 말단 서열이 삼중 나선 구조를 갖는 RNA인 하이브리드 핵산.
- 제1항 내지 제16항 중 어느 한 항에 있어서, RNA 분자가 리포터 분자에 대응하는 것인 하이브리드 핵산.
- RNA 분자에 대응하는 핵산, RNA 분자에 대응하는 핵산의 상류의 프로모터, 및 RNA 분자에 대응하는 핵산의 하류의 말단 서열에 대응하는 핵산을 포함하는 벡터.
- 제18항에 있어서, 플라스미드인 벡터.
- 제18항 또는 제19항에 있어서, RNA 분자에 대응하는 핵산이 리포터 단백질을 코딩하는 핵산인 벡터.
- 제20항에 있어서, 리포터 단백질이 녹색 형광 단백질인 벡터.
- 제18항 내지 제21항 중 어느 한 항에 있어서, RNA 분자가 mRNA인 벡터.
- 제18항 내지 제22항 중 어느 한 항에 있어서, 제1항 내지 제17항 중 어느 한 항의 하이브리드 핵산을 생산하는 핵산 서열을 포함하는 벡터.
- 제18항 내지 제23항 중 어느 한 항에 있어서, 프로모터가 이종 프로모터인 벡터.
- 제18항 내지 제24항 중 어느 한 항에 있어서, 프로모터가 CMV 프로모터인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, RNA 분자가 진핵 RNA, 포유동물 RNA, 식물 RNA, 또는 인간 RNA인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 말단 서열이 MALAT1 말단 서열인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 말단 서열이 MEN β 말단 서열인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 말단 서열이 U-풍부 서열인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 말단 서열이 A-풍부 서열인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 말단 서열이 U-풍부 및 A-풍부 서열인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 말단 서열이 C-풍부 및 G-풍부 서열인 벡터.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 말단 서열이 삼중 나선 구조를 갖는 RNA인 벡터.
- 제18항 내지 제33항 중 어느 한 항에 있어서, 말단 서열이 리간드 결합 도메인을 갖는 것인 벡터.
- 제34항에 있어서, 리간드 결합 도메인이 조직 특이적 요소를 갖는 것인 벡터.
- 제35항에 있어서, 조직이 암성 조직이고, 조직 특이적 요소가 암성 조직에서 번역의 조절에 관여하는 것인 벡터.
- 제1항 내지 제36항 중 어느 한 항에 있어서, 핵산이 적어도 하나의 화학적 또는 천연 변형을 포함하는 것인 하이브리드 핵산 또는 벡터.
- 세포에서 폴리-A 꼬리가 결여된 단리된 세포질 RNA를 발현시키는 것을 포함하며, 여기서 세포질 RNA는 세포에서 RNA의 번역을 향상시키는데 효과적인 3' 말단 서열을 갖는 것인, RNA의 번역을 향상시키는 방법.
- 제38항에 있어서, 3' 말단 서열을 갖는, 폴리-A 꼬리가 결여된 단리된 세포질 RNA가 제1항 내지 제17항 중 어느 한 항의 하이브리드 핵산인 방법.
- 제38항에 있어서, 제18항 내지 제36항 중 어느 한 항의 벡터가 폴리-A 꼬리가 결여된 단리된 세포질 RNA를 발현하기 위해 세포에 투여되는 것인 방법.
- 세포에서 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 발현시키는 것을 포함하는, 폴리-A 꼬리가 결여된 RNA를 발현시키는 방법.
- 제41항에 있어서, 단리된 핵산이 제1항 내지 제17항 중 어느 한 항의 하이브리드 핵산인 방법.
- 제41항에 있어서, 제18항 내지 제36항 중 어느 한 항의 벡터가 단리된 핵산을 발현하기 위해 세포에 투여되는 것인 방법.
- 나노입자 내에 제제화된, 이종 RNA 안정화 말단 서열에 연결되고 폴리-A 꼬리가 결여된 RNA 분자를 포함하는 조성물.
- 제44항에 있어서, RNA가 적어도 하나의 화학적 또는 천연 변형을 포함하는 것인 조성물.
- 제18항 내지 제36항 중 어느 한 항의 핵산 벡터를 포함하는 나노입자 또는 마이크로입자를 포함하는 조성물.
- 제46항에 있어서, 핵산이 적어도 하나의 화학적 또는 천연 변형을 포함하는 것인 조성물.
- 대상체에게 제46항의 조성물을 투여하는 것을 포함하는, 생체내에서 RNA를 세포에 전달하는 방법.
- 폴리-A 꼬리가 결여된 정제된 RNA를 얻기 위해 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산의 혼합물을 친화도 정제 단계 또는 크기 배제 정제 단계에 적용하는 것을 포함하는, RNA를 정제하는 방법.
- 제49항에 있어서, 단리된 핵산이 제1항 내지 제17항 중 어느 한 항의 하이브리드 핵산인 방법.
- 제49항에 있어서, 정제된 RNA가 시험관내, 생체외 또는 생체내 방법에서 사용되는 것인 방법.
- 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 대상체에서 단백질을 발현시키기에 효과적인 양으로 대상체에게 투여하는 것을 포함하며, 여기서 단백질은 대상체에서 질환의 치료에서 유용한 것인, 대상체에서 질환을 치료하는 방법.
- 제52항에 있어서, 질환이 기능 상실과 연관된 질환인 방법.
- 제53항에 있어서, 질환이 근이영양증 또는 낭성 섬유증인 방법.
- 제52항에 있어서, 질환이 암, 심혈관 질환, 자가면역, 신경변성 질환, 및 피부 질환으로 이루어지는 군으로부터 선택되는 질환인 방법.
- 제52항에 있어서, 단리된 핵산이 제1항 내지 제17항 중 어느 한 항의 하이브리드 핵산인 방법.
- 제52항에 있어서, 제18항 내지 제36항 중 어느 한 항의 벡터가 단리된 핵산을 발현시키기 위해 세포에 투여되는 것인 방법.
- 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 세포 내에서 발현시키는 것, 및 세포를 성장 조건 하에 스캐폴드 상에서 성장시켜 조직을 형성하는 것을 포함하는, 조직을 생성하는 방법.
- 제58항에 있어서, 조직이 체내에 이식되는 것인 방법.
- 제58항의 방법에 따라 생성된 조직.
- 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 분화된 세포의 집단 내에서 발현시키는 것, 및 분화된 세포를 재프로그래밍을 촉진하는 조건 하에 성장시켜 만능성 줄기 세포를 형성하는 것을 포함하며, 여기서 RNA는 재프로그래밍 단백질을 코딩하는 것인, 줄기 세포를 생산하는 방법.
- 제61항의 방법에 따라 생산된 만능성 줄기 세포.
- 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 줄기 세포의 집단 내에서 발현시키는 것, 및 줄기 세포를 분화를 촉진하는 조건 하에 성장시켜 분화된 세포를 형성하는 것을 포함하며, 여기서 RNA는 분화 단백질을 코딩하는 것인, 분화된 세포를 생산하는 방법.
- 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 포함하는 단리된 세포의 치료 유효량을 유전자 결함의 교정이 필요한 대상체에게 투여하는 것을 포함하며, 여기서 RNA는 유전자 결함을 교정하기 위한 단백질을 코딩하는 것인, 대상체에서 유전자 결함을 교정하는 방법.
- 제64항에 있어서, 유전자 결함이 면역계 장애를 야기하는 유전자 결함; 신경계 장애를 야기하는 유전자 결함; 심장 장애를 야기하는 유전자 결함; 순환 장애를 야기하는 유전자 결함 및 호흡기 장애를 야기하는 유전자 결함으로 이루어지는 군으로부터 선택되는 것인 방법.
- 3' 이종 말단 서열을 갖고 폴리-A 꼬리가 결여된 RNA를 포함하는 단리된 핵산을 포함하는 단리된 세포의 치료 유효량을 유전 장애의 치료가 필요한 대상체에게 투여하는 것을 포함하며, 여기서 RNA는 교체 단백질을 코딩하고, 교체 단백질의 결여는 유전 장애과 연관되는 것인, 대상체에서 유전 장애를 치료하는 방법.
- 이종 RNA 안정화 말단 서열에 연결된, 폴리-A 꼬리가 결여된 RNA 분자를 포함하며, 여기서 RNA 분자는 면역원성 단백질을 코딩하는 것인 하이브리드 핵산.
- 제67항의 하이브리드 핵산을 면역원성 단백질에 대한 적응 면역 반응의 도출에 효과적인 양으로 대상체에게 투여하는 것을 포함하는, 대상체를 예방접종하는 방법.
- 이종 RNA에 연결된, 폴리-A 꼬리가 결여된 외인성 RNA 분자, 및 안정화 말단 서열을 동물의 하나 이상의 세포에 포함하는 비-인간 동물.
- 제69항에 있어서, RNA 분자가 치료 단백질을 코딩하는 것인 동물.
- 제69항에 있어서, RNA 분자가 면역원성 단백질을 코딩하는 것인 동물.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261714697P | 2012-10-16 | 2012-10-16 | |
US61/714,697 | 2012-10-16 | ||
US201261716764P | 2012-10-22 | 2012-10-22 | |
US61/716,764 | 2012-10-22 | ||
US201261739153P | 2012-12-19 | 2012-12-19 | |
US61/739,153 | 2012-12-19 | ||
PCT/US2013/065239 WO2014062801A1 (en) | 2012-10-16 | 2013-10-16 | Production of stable non-polyadenylated rnas |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20150070307A true KR20150070307A (ko) | 2015-06-24 |
Family
ID=50488728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157012583A KR20150070307A (ko) | 2012-10-16 | 2013-10-16 | 안정한 비-폴리아데닐화된 rna의 생산 |
Country Status (11)
Country | Link |
---|---|
US (2) | US9717749B2 (ko) |
EP (1) | EP2909321A4 (ko) |
JP (1) | JP2015536647A (ko) |
KR (1) | KR20150070307A (ko) |
CN (1) | CN104955951A (ko) |
AU (1) | AU2013331351A1 (ko) |
CA (1) | CA2888215A1 (ko) |
HK (1) | HK1213294A1 (ko) |
IL (1) | IL238256A0 (ko) |
MX (1) | MX2015004853A (ko) |
WO (1) | WO2014062801A1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013331351A1 (en) | 2012-10-16 | 2015-04-30 | Massachusetts Institute Of Technology | Production of stable non-polyadenylated RNAs |
EP3207139A1 (en) | 2014-10-17 | 2017-08-23 | The Penn State Research Foundation | Methods and compositions for multiplex rna guided genome editing and other rna technologies |
US12019066B2 (en) * | 2016-05-16 | 2024-06-25 | Biomadison, Inc. | Assay with synaptobrevin based moiety |
US11739333B2 (en) * | 2017-03-02 | 2023-08-29 | Meiragtx Uk Ii Limited | Regulation of gene expression by aptamer-modulated RNase p cleavage |
US10378070B2 (en) * | 2017-09-07 | 2019-08-13 | Kyoto University | Vector and gene introduction agent for monitoring and visualizing cell differentiation using expression of micro RNA as indicator and monitoring and visualizing method using thereof |
WO2019195714A1 (en) * | 2018-04-05 | 2019-10-10 | Azitra Inc | Methods and compositions for treating skin disease with recombinant microorganisms |
MX2021012702A (es) * | 2019-04-17 | 2022-01-24 | Univ Pennsylvania | Terminador de triple hélice para un empalme trans de arn eficiente. |
CN112790125B (zh) * | 2021-01-22 | 2022-09-06 | 中国科学院水生生物研究所 | 一种玉兔百褶裙泰狮金鱼的创制方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5824497A (en) * | 1995-02-10 | 1998-10-20 | Mcmaster University | High efficiency translation of mRNA molecules |
US6242187B1 (en) | 1996-01-29 | 2001-06-05 | Virologic, Inc. | Compositions and methods for determining anti-viral drug susceptibility and resistance and anti-viral drug screening |
EP3112467B1 (en) | 2009-12-07 | 2018-02-14 | The Trustees of the University of Pennsylvania | Rna preparations comprising purified modified rna for reprogramming cells |
WO2012075040A2 (en) | 2010-11-30 | 2012-06-07 | Shire Human Genetic Therapies, Inc. | mRNA FOR USE IN TREATMENT OF HUMAN GENETIC DISEASES |
US10086043B2 (en) * | 2011-04-03 | 2018-10-02 | The General Hospital Corporation | Efficient protein expression in vivo using modified RNA (MOD-RNA) |
AU2013331351A1 (en) | 2012-10-16 | 2015-04-30 | Massachusetts Institute Of Technology | Production of stable non-polyadenylated RNAs |
-
2013
- 2013-10-16 AU AU2013331351A patent/AU2013331351A1/en not_active Abandoned
- 2013-10-16 CA CA2888215A patent/CA2888215A1/en not_active Abandoned
- 2013-10-16 JP JP2015537026A patent/JP2015536647A/ja active Pending
- 2013-10-16 MX MX2015004853A patent/MX2015004853A/es unknown
- 2013-10-16 US US14/436,228 patent/US9717749B2/en active Active
- 2013-10-16 WO PCT/US2013/065239 patent/WO2014062801A1/en active Application Filing
- 2013-10-16 CN CN201380060191.4A patent/CN104955951A/zh active Pending
- 2013-10-16 KR KR1020157012583A patent/KR20150070307A/ko not_active Application Discontinuation
- 2013-10-16 EP EP13847465.5A patent/EP2909321A4/en not_active Withdrawn
-
2015
- 2015-04-13 IL IL238256A patent/IL238256A0/en unknown
-
2016
- 2016-02-04 HK HK16101305.0A patent/HK1213294A1/zh unknown
-
2017
- 2017-07-31 US US15/664,017 patent/US10946035B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
IL238256A0 (en) | 2015-06-30 |
US20150315574A1 (en) | 2015-11-05 |
EP2909321A4 (en) | 2016-06-22 |
MX2015004853A (es) | 2015-12-09 |
EP2909321A1 (en) | 2015-08-26 |
CN104955951A (zh) | 2015-09-30 |
WO2014062801A1 (en) | 2014-04-24 |
HK1213294A1 (zh) | 2016-06-30 |
CA2888215A1 (en) | 2014-04-24 |
JP2015536647A (ja) | 2015-12-24 |
US10946035B2 (en) | 2021-03-16 |
US9717749B2 (en) | 2017-08-01 |
AU2013331351A1 (en) | 2015-04-30 |
US20180140625A1 (en) | 2018-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20150070307A (ko) | 안정한 비-폴리아데닐화된 rna의 생산 | |
US20220220501A1 (en) | CELL-SPECIFIC EXPRESSION OF modRNA | |
WO2018237372A1 (en) | RNA MOLECULES, METHODS FOR PRODUCING CIRCULAR RNA, AND METHODS OF TREATMENT | |
JP5099570B2 (ja) | siRNA導入による新規hiPSC作製法 | |
WO2017074788A1 (en) | Compositions and methods for targeting cancer-specific sequence variations | |
KR20210119416A (ko) | 폐쇄-말단 dna (cedna), 및 유전자 또는 핵산 치료 관련 면역 반응을 감소시키는 방법에서의 이의 용도 | |
US20180223279A1 (en) | Therapeutic oligonucleotides | |
CN115397987A (zh) | 调节人l1反转录转座子rna的方法和用于其中的组合物 | |
JP6666002B2 (ja) | Tdp−43プロテノパシーの予防又は治療用組成物 | |
JP2024150579A (ja) | ゲノム配列変異を有する細胞死滅誘導用組成物及び該組成物を用いた細胞死滅誘導方法 | |
EP3329004B1 (en) | Therapeutic oligonucleotides | |
JP2022515211A (ja) | 合成マイクロrnaミミック | |
CA2949345A1 (en) | Small interfering rna (sirna) for the therapy of type 2 (ado2) autosomal dominant osteopetrosis caused by clcn7 (ado2 clcn7-dependent) gene mutation | |
RU2829367C2 (ru) | ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК) И ПРИМЕНЕНИЕ В СПОСОБАХ УМЕНЬШЕНИЯ ИММУННОГО ОТВЕТА, СВЯЗАННОГО С ГЕННОЙ ТЕРАПИЕЙ ИЛИ ТЕРАПИЕЙ НУКЛЕИНОВОЙ КИСЛОТОЙ | |
JP2022523806A (ja) | 閉端dna(cedna)および免疫調節化合物 | |
Chen et al. | Chemical and topological design of multicapped mRNA and capped circular RNA to augment translation | |
CN114306367B (zh) | 一种含有C/EBPα-saRNA的组合物 | |
US20240197640A1 (en) | Systems and methods for exosome delivery of micrornas for cellular reprogramming | |
AU2022280145A1 (en) | Compositions and methods for increasing efficiency of precise editing repair | |
JP2023542132A (ja) | Fviii治療薬を発現させるための非ウイルス性dnaベクター及びその使用 | |
US20100197765A1 (en) | Method for promoting the expression of p53, and p53 expression promoter for use in the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |