KR20150113170A - 탄수화물 분해 폴리펩티드 및 이의 용도 - Google Patents
탄수화물 분해 폴리펩티드 및 이의 용도 Download PDFInfo
- Publication number
- KR20150113170A KR20150113170A KR1020157023753A KR20157023753A KR20150113170A KR 20150113170 A KR20150113170 A KR 20150113170A KR 1020157023753 A KR1020157023753 A KR 1020157023753A KR 20157023753 A KR20157023753 A KR 20157023753A KR 20150113170 A KR20150113170 A KR 20150113170A
- Authority
- KR
- South Korea
- Prior art keywords
- polypeptide
- seq
- sequence
- present
- enzyme
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/12—Disaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열; 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 또는 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74의 뉴클레오티드 서열에 의해 코딩된 아미노산 서열; 또는 이의 변이체 폴리펩티드 또는 변이체 폴리뉴클레오티드를 포함하는, 헤미셀룰라제(hemicellulase) 활성을 갖는 폴리펩티드에 관한 것으로서, 이때 상기 변이체 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖거나, 상기 변이체 폴리뉴클레오티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖는 폴리펩티드를 코딩한다. 본 발명은 신규 유전자의 전체 길이 코딩 서열뿐만 아니라 유전자 또는 아미노산 서열의 전체 길이 기능성 단백질 및 기능성 균등물의 아미노산 서열도 특징으로 한다. 또한, 본 발명은 산업 공정에서 상기 폴리펩티드를 사용하는 방법에 관한 것이다. 이들 단백질들을 제조하는 데에 적합한, 본 발명에 따른 폴리뉴클레오티드로 형질전환된 세포도 본 발명에 포함된다.
Description
본 발명은 리그노셀룰로스성(lignocellulosic) 물질 분해 활성을 갖는 폴리펩티드를 코딩하는 유전자를 포함하는 서열에 관한 것이다. 본 발명은 신규 유전자의 전체 길이 코딩 서열뿐만 아니라 전체 길이 기능성 단백질의 아미노산 서열, 및 상기 유전자 또는 아미노산 서열의 변이체 및 단편을 특징으로 한다. 또한, 본 발명은 산업 공정에서 이들 단백질들을 사용하는 방법에 관한 것이다. 이들 단백질들을 제조하는 데에 적합한, 본 발명에 따른 폴리뉴클레오티드로 형질전환된 세포도 본 발명에 포함된다. 또한, 본 발명은 숙주 유기체, 예컨대, 아스퍼길러스 니게르(Aspergillus niger) 및/또는 라삼소니아 에머소니이(Rasamsonia emersonii)에서 리그노셀룰로스성 물질 분해 활성을 갖는 폴리펩티드를 코딩하는 유전자의 성공적인 발현에 관한 것이다.
탄수화물은 지구상에서 가장 풍부한 유기 화합물을 구성한다. 그러나, 이 탄수화물의 대다수가 전분(종자 및 곡물에서 주요 저장 탄수화물)을 비롯한 복합 중합체, 및 리그노셀룰로스로서 공지되어 있는 탄수화물과 리그닌의 집합체에 격리되어 있다. 리그노셀룰로스의 주요 탄수화물 성분은 셀룰로스, 헤미셀룰로스 및 펙틴이다. 이들 복합 중합체들은 종종 리그노셀룰로스로서 총칭된다.
재생가능한 리그노셀룰로스성 바이오매스(biomass)를 발효가능한 당으로 생물전환시킨 후, 상기 발효가능한 당을 발효시켜 액체 연료에 대한 대체물로서 알코올(예를 들면, 에탄올)을 생성하는 것은 OPEC에 의한 석유 생산량의 감소 때문에 오일 위기가 발생한 때인 1970년대 이후 연구자들의 집중적인 관심을 끌고 있다. 에탄올은 지난 이십년 동안 미국에서 가솔린에 대한 10% 블렌드로서 광범위하게 사용되고 있고 브라질에서 차량용 순수 연료로서 사용되고 있다. 보다 최근에는, 85% 에탄올 블렌드인 E85의 사용이 특히 청정 도시 적용분야를 위해 시행되고 있다. 연료 바이오에탄올의 중요성은 오일 가격의 증가 및 그의 공급원의 점진적인 고갈과 동시에 증가할 것이다. 추가로, 발효가능한 당은 플라스틱, 중합체 및 다른 바이오-기제 생성물을 생성하는 데에 사용되고 있고, 이 산업은 실질적으로 성장하여 석유-기제 공급원료 대신에 공급원료로서 사용될 수 있는 풍부한 저렴한 발효가능한 당에 대한 수요를 증가시킬 것으로 예상된다.
식물 바이오매스에서 이러한 많은 양의 탄수화물의 격리는 당(다수의 산업 공정 및 농업 공정에 사용될 수 있는 오탄당 및 육탄당 둘다)의 형태로 잠재적인 에너지의 풍부한 공급원을 제공한다. 그러나, 당이 복합 중합체에 갇혀 있어 발효를 위해 용이하게 접근될 수 없기 때문에 이들 탄수화물들의 막대한 에너지 잠재력은 현재 충분히 이용되지 않고 있다. 식물 바이오매스로부터 당을 생성하는 방법은 화학물질, 플라스틱, 예를 들면, 석신산 및 (바이오)연료(에탄올, 메탄올, 부탄올, 합성 액체 연료 및 바이오가스를 포함함)로의 발효를 위한 풍부한 경제적 경쟁력이 있는 공급원료를 제공할 것이다.
셀룰로스성 공급원료의 종류와 관계없이 효소의 비용 및 가수분해 효율은 바이오매스 생물전환 공정의 상업화를 제한하는 주요 요인이다. 미생물에 의해 생성된 효소의 생산 비용은 효소 생성 균주의 생산성 및 발효 브로쓰에서의 최종 활성 수율과 밀접하게 관련되어 있다.
효소에 의한 리그노셀룰로스성 바이오매스 분해 및 셀룰라제(cellulase) 생성을 이해하기 위한 지난 수십년의 계속된 연구에도 불구하고, 신규 고도 활성 셀룰라제 및 헤미셀룰라제(hemicellulase)를 발견하거나 조작하는 것은 여전히 요구된다. 리그노셀룰로스성 물질의 신속하고 효율적인 생물분해를 수행할 수 있는 고효율적인 효소 조성물, 특히 증가된 열안정성을 갖는 이러한 셀룰라제 및 헤미셀룰라제를 구축하는 것도 매우 요구될 것이다.
이러한 효소는 화학물질, 플라스틱, 예를 들면, 석신산 및 (바이오)연료(에탄올, 메탄올, 부탄올, 합성 액체 연료 및 바이오가스를 포함함)로의 발효용 및 엔사일링(ensiling)용 당을 생성하는 데에 사용될 수 있고, 다른 산업 공정, 예를 들면, 식품 또는 사료, 직물, 펄프 또는 종이, 또는 세제 산업 및 다른 산업에서 효소로서도 사용될 수 있다.
본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열; 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 또는 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74의 뉴클레오티드 서열에 의해 코딩된 아미노산 서열; , 또는 이의 변이체 폴리펩티드 또는 변이체 폴리뉴클레오티드를 포함하는, 헤미셀룰라제 활성 또는 표 1에 따른 활성을 갖는 폴리펩티드를 제공하는데, 이때 상기 변이체 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖거나, 상기 변이체 폴리뉴클레오티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖는 폴리펩티드를 코딩한다.
[표 1]
본 발명의 폴리펩티드는 바람직하게는 β-자일로시다제, α-갈락토시다제, 자일로글루카나제, α-아라비노푸라노시다제, 엔도-자일라나제, 만노시다제/자일로시다제, 페룰로일 에스터라제, 자일로시다제, 엔도-엑소-자일라나제 또는 α-글루쿠로니다제 활성을 갖는다.
나아가, 본 발명은 헤미셀룰라제를 코딩하는 핵산 서열을 제공하는데, 이때 상기 핵산 서열은
(a) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열과 70% 이상의 동일성을 갖는 핵산 서열;
(b) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열의 상보체와 혼성화하는 핵산 서열;
(c) (i) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열, (ii) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 70% 이상의 동일성을 갖는 아미노산 서열, 또는 (iii) 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개 또는 12개의 아미노산이 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 상이한 아미노산 서열을 코딩하는 핵산 서열; 및
(d) (a), (b) 또는 (c)에 정의된 뉴클레오티드 서열의 역 상보체인 뉴클레오티드 서열
로 구성된 군으로부터 선택된다.
본 발명은 본 발명의 폴리뉴클레오티드를 포함하는 핵산 구축물 또는 벡터, 및 본 발명의 폴리펩티드, 또는 본 발명의 핵산 구축물 또는 벡터를 포함하는 세포도 제공한다.
본 발명의 한 양태에 따르면, 세포는 진균 세포, 바람직하게는 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼길러스(Aspergillus), 아우레오바시듐(Aureobasidium), 크리소스포리움(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 마이셀리오프쏘라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 패실로마이세스(Paecilomyces), 페니실리움(Penicillium), 피로마이세스(Piromyces), 파네로캐테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로마이세스(Talaromyces), 라삼소니아(Rasamsonia), 써모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium) 및 트라이코데르마(Trichoderma) 속으로 구성된 군으로부터 선택된 진균 세포이다. 본 발명의 또 다른 양태에 따르면, 본 발명의 세포의 하나 이상의 유전자가 전체적으로 또는 부분적으로 결실되어 있거나, 넉아웃되어 있거나 파괴되어 있고, 이때 임의적으로 상기 유전자는 프로테아제(protease)를 코딩한다.
본 발명은 헤미셀룰라제 또는 표 1에 따른 활성을 갖는 본 발명에 따른 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드의 발현을 허용하는 조건 하에서 본 발명의 세포를 배양하는 단계 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법도 제공한다. 나아가, 본 발명은 (i) 본 발명의 폴리펩티드; 및 (ii) 셀룰라제, 추가 헤미셀룰라제 및/또는 펙티나제(pectinase)를 포함하는 조성물을 제공하고, 바람직하게는 상기 셀룰라제는 GH61, 셀로바이오하이드롤라제(cellobiohydrolase), 셀로바이오하이드롤라제 I, 셀로바이오하이드롤라제 II, 엔도-β-1,4-글루카나제(glucanase), β-글루코시다제(glucosidase) 또는 β-(1,3)(1,4)-글루카나제이고/이거나, 상기 헤미셀룰라제는 엔도-자일라나제, β-자일로시다제, α-L-아라비노푸라노시다제, α-D-글루쿠로니다제. 페룰로일 에스터라제, 쿠마로일 에스터라제(coumaroyl esterase), α-갈락토시다제, β-갈락토시다제, β-만나나제(mannanase) 또는 β-만노시다제이다.
추가로, 본 발명은 헤미셀룰로스를 포함하는 기질, 임의적으로 식물 물질을 처리하는 방법으로서, 상기 기질을 본 발명의 폴리펩티드 및/또는 본 발명의 조성물과 접촉시키는 단계를 포함하는 방법을 제공한다.
본 발명의 또 다른 양태는 리그노셀룰로스성 물질로부터 당을 제조하기 위한 본 발명의 폴리펩티드 및/또는 본 발명의 조성물의 용도에 관한 것이다.
본 발명은 탄수화물 물질 분해 또는 탄수화물 가수분해 활성을 갖는 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드의 발현을 허용하는 조건 하에서 본 발명의 세포를 배양하는 단계 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법; 이러한 방법에 의해 수득될 수 있는 폴리펩티드; 및 (i) 본 발명의 폴리펩티드 및 (ii) 셀룰라제, 헤미셀룰라제 및/또는 펙티나제를 포함하는 조성물도 제공한다.
탄수화물 물질 분해 또는 탄수화물 가수분해 활성을 갖는 본 발명의 폴리펩티드는 산업 공정에서 사용될 수 있다. 따라서, 본 발명은 탄수화물 물질을 포함하는 기질을 처리하는 방법으로서, 상기 기질을 본 발명의 폴리펩티드 또는 조성물과 접촉시키는 단계를 포함하는 방법을 제공한다.
구체적으로, 본 발명은 리그노셀룰로스성 물질로부터 당 또는 당들을 제조하는 방법으로서, 리그노셀룰로스성 물질을 본 발명의 폴리펩티드 또는 조성물과 접촉시키는 단계를 포함하는 방법을 제공한다.
이 방식으로 제조된 당은 발효 공정에서 사용될 수 있다. 따라서, 본 발명은 발효 생성물을 제조하는 방법으로서, 전술된 방법을 이용하여 발효가능한 당을 제조하는 단계; 및 생성된 발효가능한 당을 발효시켜 발효 생성물을 제조하는 단계를 포함하는 방법을 제공한다.
본 발명의 폴리펩티드 또는 조성물은 예를 들면, 식품의 제조, 세제의 제조, 동물 사료의 제조, 펄프의 처리, 종이의 제조, 옷감 또는 직물의 제조 또는 이들의 세정에 사용될 수도 있다.
본 발명은 식물 물질 또는 리그노셀룰로스성 물질을 본 발명의 폴리펩티드 또는 조성물과 접촉시킴으로써 수득될 수 있는 가공된 물질; 본 발명의 폴리펩티드 또는 조성물을 포함하는 식품 또는 사료; 및 본 발명에 따른 폴리뉴클레오티드, 폴리펩티드, 벡터 또는 세포를 포함하는 식물 또는 이의 일부도 제공한다.
도 1은 아스퍼길러스 니게르에서의 유전자의 발현을 위한 pGBTOP의 맵을 보여준다. 글루코아밀라제(glucoamylase) 프로모터(PglaA)로부터 발현된 관심있는 유전자(GOI)가 도시되어 있다. 추가로, 발현 카세트의 글루코아밀라제 플랭크(3' glaA)가 도시되어 있다. 본원에서 관심있는 유전자는 이하에 정의된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 코딩 서열이다.
도 2는 RePepA 좌위로 표적화되는, 라삼소니아 에머소니이 내의 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 구축물에 대한 기초인 플라스미드 Te pep.bbn의 도시적 도표를 보여준다. 벡터는 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 업스트림에 있는 1500 bp 5' 플랭킹 영역 1.5 kb를 포함하고, lox66 부위, 아스퍼길러스 니둘란스(A. nidulans) gpdA 프로모터에 의해 유도되는 ble 코딩 영역의 비-기능성 5' 부분(5' ble) 및 ccdB 유전자도 포함한다.
도 3은 라삼소니아 에머소니이에서 RePepA ORF, 및 시작 ATG 코돈의 업스트림에 있는 약 1500개 뉴클레오티드를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 발현 카세트로 교체할 목적으로 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 함유하는 pEBA 발현 벡터와 함께 이분(bipartite) 유전자 표적화 방법에서 사용된 플라스미드 pEBA1006의 도시적 도표를 보여준다. 벡터는 ble 코딩 영역의 3' 부분, 아스퍼길러스 니둘란스 trpC 종결요소(terminator), lox71 부위, RePepA ORF의 2500 bp 3' 플랭킹 영역 및 pUC19의 골격(인비트로겐(Invitrogen), 네덜란드 브레다 소재)을 포함한다. 라삼소니아 에머소니이 균주의 형질전환 전, 에스케리키아 콜라이(E. coli) DNA를 제한효소 NotI로 분해하여 제거하였다.
도 4는 라삼소니아 에머소니이에서 RePepA ORF, 및 시작 ATG 코돈의 업스트림에 있는 약 1500개 뉴클레오티드를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 발현 카세트로 교체할 목적으로 pEBA1006 벡터와 함께 이분 유전자 표적화 방법에서 사용된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 함유하는 pEBA 발현 플라스미드의 도시적 도표를 보여준다. 벡터는 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 업스트림에 있는 1500 bp 5' 플랭킹 영역 1.5 kb를 포함하고, 라삼소니아 에머소니이 프로모터 2, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 코딩 영역 및 아스퍼길러스 니둘란스 amdS 종결요소(TamdS)로 구성된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 발현 카세트, lox66 부위, 및 아스퍼길러스 니둘란스 gpdA 프로모터에 의해 유도되는 ble 코딩 영역의 비-기능성 5' 부분(5' ble)도 포함한다. 라삼소니아 에머소니이 균주의 형질전환 전, 에스케리키아 콜라이 DNA를 제한효소 NotI로 분해하여 제거하였다.
도 5는 pH 4.5 및 60℃에서 24시간 동안 자일로글루칸 상에서 항온처리한 후 라삼소니아 에머소니이 Temer04790에 의한 올리고머 형성을 시판되는 셀룰라제와 비교하여 보여주는 고성능 음이온 교환 크로마토그래피에 의해 수득된 크로마토그램을 보여준다.
서열목록의 간단한 설명
표 2는 본 발명의 코돈-쌍 최적화된 코딩 서열 서열번호, 아미노산 서열 서열번호, 신호 서열 서열번호, 게놈 DNA 서열 서열번호 및 야생형 코딩 서열 서열번호를 보여준다.
[표 2]
서열번호 76: 라삼소니아 에머소니이 RePepA(플랭크를 포함하는 게놈 서열)
서열번호 77: 라삼소니아 에머소니이 RePepA(cDNA)
서열번호 78: 라삼소니아 에머소니이 RePepA(단백질)
서열번호 79: 아스퍼길러스 니둘란스 gpdA 프로모터 및 ble 코딩 서열의 5' 부분
서열번호 80: ble 코딩 서열의 3' 부분 및 아스퍼길러스 니둘란스 TrpC 종결요소
서열번호 81: 라삼소니아 에머소니이 프로모터 2
서열번호 82: 아스퍼길러스 니둘란스 AmdS 종결요소
도 2는 RePepA 좌위로 표적화되는, 라삼소니아 에머소니이 내의 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 구축물에 대한 기초인 플라스미드 Te pep.bbn의 도시적 도표를 보여준다. 벡터는 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 업스트림에 있는 1500 bp 5' 플랭킹 영역 1.5 kb를 포함하고, lox66 부위, 아스퍼길러스 니둘란스(A. nidulans) gpdA 프로모터에 의해 유도되는 ble 코딩 영역의 비-기능성 5' 부분(5' ble) 및 ccdB 유전자도 포함한다.
도 3은 라삼소니아 에머소니이에서 RePepA ORF, 및 시작 ATG 코돈의 업스트림에 있는 약 1500개 뉴클레오티드를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 발현 카세트로 교체할 목적으로 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 함유하는 pEBA 발현 벡터와 함께 이분(bipartite) 유전자 표적화 방법에서 사용된 플라스미드 pEBA1006의 도시적 도표를 보여준다. 벡터는 ble 코딩 영역의 3' 부분, 아스퍼길러스 니둘란스 trpC 종결요소(terminator), lox71 부위, RePepA ORF의 2500 bp 3' 플랭킹 영역 및 pUC19의 골격(인비트로겐(Invitrogen), 네덜란드 브레다 소재)을 포함한다. 라삼소니아 에머소니이 균주의 형질전환 전, 에스케리키아 콜라이(E. coli) DNA를 제한효소 NotI로 분해하여 제거하였다.
도 4는 라삼소니아 에머소니이에서 RePepA ORF, 및 시작 ATG 코돈의 업스트림에 있는 약 1500개 뉴클레오티드를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 발현 카세트로 교체할 목적으로 pEBA1006 벡터와 함께 이분 유전자 표적화 방법에서 사용된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 함유하는 pEBA 발현 플라스미드의 도시적 도표를 보여준다. 벡터는 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 업스트림에 있는 1500 bp 5' 플랭킹 영역 1.5 kb를 포함하고, 라삼소니아 에머소니이 프로모터 2, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 코딩 영역 및 아스퍼길러스 니둘란스 amdS 종결요소(TamdS)로 구성된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 발현 카세트, lox66 부위, 및 아스퍼길러스 니둘란스 gpdA 프로모터에 의해 유도되는 ble 코딩 영역의 비-기능성 5' 부분(5' ble)도 포함한다. 라삼소니아 에머소니이 균주의 형질전환 전, 에스케리키아 콜라이 DNA를 제한효소 NotI로 분해하여 제거하였다.
도 5는 pH 4.5 및 60℃에서 24시간 동안 자일로글루칸 상에서 항온처리한 후 라삼소니아 에머소니이 Temer04790에 의한 올리고머 형성을 시판되는 셀룰라제와 비교하여 보여주는 고성능 음이온 교환 크로마토그래피에 의해 수득된 크로마토그램을 보여준다.
서열목록의 간단한 설명
표 2는 본 발명의 코돈-쌍 최적화된 코딩 서열 서열번호, 아미노산 서열 서열번호, 신호 서열 서열번호, 게놈 DNA 서열 서열번호 및 야생형 코딩 서열 서열번호를 보여준다.
[표 2]
서열번호 76: 라삼소니아 에머소니이 RePepA(플랭크를 포함하는 게놈 서열)
서열번호 77: 라삼소니아 에머소니이 RePepA(cDNA)
서열번호 78: 라삼소니아 에머소니이 RePepA(단백질)
서열번호 79: 아스퍼길러스 니둘란스 gpdA 프로모터 및 ble 코딩 서열의 5' 부분
서열번호 80: ble 코딩 서열의 3' 부분 및 아스퍼길러스 니둘란스 TrpC 종결요소
서열번호 81: 라삼소니아 에머소니이 프로모터 2
서열번호 82: 아스퍼길러스 니둘란스 AmdS 종결요소
본 명세서 및 첨부된 특허청구범위 전체에 걸쳐 용어 "포함한다" 및 "포괄한다", 및 파생어, 예컨대, "포함하고", "포함하는", "포괄하고" 및 "포괄하는"은 포괄적으로 해석되어야 한다. 즉, 이들 용어들은 문맥이 허용하는 경우 구체적으로 언급되지 않은 다른 요소 또는 정수의 가능한 포함을 전달하기 위한 것이다.
본원에서 단수형은 하나 또는 하나 초과의(즉, 하나 또는 하나 이상의) 문법적 객체를 지칭하기 위해 사용된다. 예를 들면, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미할 수 있다.
본 발명은 폴리펩티드, 예를 들면, 탄수화물 물질을 변경시키는, 예를 들면, 분해하는 능력을 갖는 효소를 코딩하는 폴리뉴클레오티드를 제공한다. 탄수화물 물질은 하나 이상의 탄수화물을 포함하거나, 하나 이상의 탄수화물로 구성되거나 실질적으로 하나 이상의 탄수화물로 구성된 물질이다. 본원에서 효소는 폴리펩티드의 서브클래스이다.
본원에서 기질(공급원료로서도 지칭됨)은 그 내부의 탄수화물 물질이 변경되도록 본 발명에 따른 효소로 처리될 수 있는 탄수화물 물질을 포함하는 물질을 지칭하기 위해 사용된다. 기질은 탄수화물 물질 이외에 비-탄수화물 물질 및 전분을 포함하나 이들로 한정되지 않는 임의의 다른 성분을 함유할 수 있다.
본 발명은 폴리펩티드, 예를 들면, 탄수화물 물질을 변경시키는, 예를 들면, 분해하는 능력을 갖는 효소를 코딩하는 폴리뉴클레오티드를 제공한다. 탄수화물 물질은 하나 이상의 탄수화물을 포함하거나, 하나 이상의 탄수화물로 구성되거나 실질적으로 하나 이상의 탄수화물로 구성된 물질이다. 본원에서 효소는 폴리펩티드의 서브클래스이다.
Temer09484
전형적으로, 본 발명의 폴리펩티드는 서열번호 2에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 2의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 β-자일로시다제 활성을 갖는 폴리펩티드(Temer09484로서 가칭됨)를 코딩한다.
β-자일로시다제(EC 3.2.1.37)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스(xylobiose)도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 β-자일로시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer00088
전형적으로, 본 발명의 폴리펩티드는 서열번호 7에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 7의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 β-자일로시다제 활성을 갖는 폴리펩티드(Temer00088로서 가칭됨)를 코딩한다.
β-자일로시다제(EC 3.2.1.37)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 β-자일로시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer08028
전형적으로, 본 발명의 폴리펩티드는 서열번호 12에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 12의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-갈락토시다제 활성을 갖는 폴리펩티드(Temer08028로서 가칭됨)를 코딩한다.
본원에서 α-갈락토시다제(EC 3.2.1.22; GH27)는 갈락토스 올리고사카라이드, 갈락토만난, 갈락탄 및 아라비노갈락탄을 비롯한 α-D-갈락토사이드에서 말단 비-환원 α-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-D-푸코사이드도 가수분해할 수 있다. 이 효소는 멜리비아제(melibiase)로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 α-갈락토시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer02362
전형적으로, 본 발명의 폴리펩티드는 서열번호 17에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 17의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-갈락토시다제 활성을 갖는 폴리펩티드(Temer02362로서 가칭됨)를 코딩한다.
본원에서 α-갈락토시다제(EC 3.2.1.22; GH27)는 갈락토스 올리고사카라이드, 갈락토만난, 갈락탄 및 아라비노갈락탄을 비롯한 α-D-갈락토사이드에서 말단 비-환원 α-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-D-푸코사이드도 가수분해할 수 있다. 이 효소는 멜리비아제(melibiase)로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 α-갈락토시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer08862
전형적으로, 본 발명의 폴리펩티드는 서열번호 22에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 22의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-갈락토시다제 활성을 갖는 폴리펩티드(Temer08862로서 가칭됨)를 코딩한다.
본원에서 α-갈락토시다제(EC 3.2.1.22; GH27)는 갈락토스 올리고사카라이드, 갈락토만난, 갈락탄 및 아라비노갈락탄을 비롯한 α-D-갈락토사이드에서 말단 비-환원 α-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-D-푸코사이드도 가수분해할 수 있다. 이 효소는 멜리비아제(melibiase)로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 α-갈락토시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer04790
전형적으로, 본 발명의 폴리펩티드는 서열번호 27에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 27의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 자일로글루카나제 활성을 갖는 폴리펩티드(Temer04790으로서 가칭됨)를 코딩한다.
본원에서 자일로글루카나제는 β1→4-연결된 글루코스 잔기들(이들 중 대다수가 1-6-연결된 자일로스 측쇄로 치환됨)의 골격인 자일로글루칸의 절단을 촉진하는 자일로글루칸 특이적 엔도-β-1,4-글루카나제이다.
본 발명의 폴리펩티드는 자일로글루카나제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer05249
전형적으로, 본 발명의 폴리펩티드는 서열번호 32에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 32의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-아라비노푸라노시다제 활성을 갖는 폴리펩티드(Temer05249로서 가칭됨)를 코딩한다.
본원에서 α-L-아라비노푸라노시다제(EC 3.2.1.55)는 α-L-아라비노푸라노사이드, (1,2)-연결, (1,3)-연결 및/또는 (1,5)-연결을 함유하는 α-L-아라비난, 아라비노자일란 및 아라비노갈락탄에 작용할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-N-아라비노푸라노시다제, 아라비노푸라노시다제 또는 아라비노시다제로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 α-아라비노푸라노시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer06848
전형적으로, 본 발명의 폴리펩티드는 서열번호 37에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 37의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-아라비노푸라노시다제 활성을 갖는 폴리펩티드(Temer06848로서 가칭됨)를 코딩한다.
본원에서 α-L-아라비노푸라노시다제(EC 3.2.1.55)는 α-L-아라비노푸라노사이드, (1,2)-연결, (1,3)-연결 및/또는 (1,5)-연결을 함유하는 α-L-아라비난, 아라비노자일란 및 아라비노갈락탄에 작용할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-N-아라비노푸라노시다제, 아라비노푸라노시다제 또는 아라비노시다제로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 α-아라비노푸라노시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer02056
전형적으로, 본 발명의 폴리펩티드는 서열번호 42에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 42의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-아라비노푸라노시다제 활성을 갖는 폴리펩티드(Temer02056으로서 가칭됨)를 코딩한다.
본원에서 α-L-아라비노푸라노시다제(EC 3.2.1.55)는 α-L-아라비노푸라노사이드, (1,2)-연결, (1,3)-연결 및/또는 (1,5)-연결을 함유하는 α-L-아라비난, 아라비노자일란 및 아라비노갈락탄에 작용할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-N-아라비노푸라노시다제, 아라비노푸라노시다제 또는 아라비노시다제로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 α-아라비노푸라노시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer03124
전형적으로, 본 발명의 폴리펩티드는 서열번호 47에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 47의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 엔도-자일라나제 활성을 갖는 폴리펩티드(Temer03124로서 가칭됨)를 코딩한다.
본원에서 엔도-자일라나제(EC 3.2.1.8)는 자일란에서 1,4-β-D-자일로사이드 연결의 엔도-가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 엔도-1,4-β-자일라나제 또는 1,4-β-D-자일란 자일라노하이드롤라제로서도 지칭될 수 있다. 대안적 효소는 글루쿠로노아라비노자일란에서 1,4-자일로사이드 연결을 가수분해할 수 있는 효소인 글루쿠로노아라비노자일란 엔도-자일라나제(EC 3.2.1.136)이다.
본 발명의 폴리펩티드는 엔도-자일라나제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer09491
전형적으로, 본 발명의 폴리펩티드는 서열번호 52에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 52의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 만노시다제 및/또는 자일로시다제 활성을 갖는 폴리펩티드(Temer09491로서 가칭됨)를 코딩한다.
본원에서 β-자일로시다제(EC 3.2.1.37)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.
본원에서 β-만노시다제(EC 3.2.1.25)는 β-D-만노사이드에서 말단 비-환원 β-D-만노스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 만나나제 또는 만나제로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 만노시다제 및/또는 자일로시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer06400
전형적으로, 본 발명의 폴리펩티드는 서열번호 57에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 57의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 페룰로일 에스터라제 활성을 갖는 폴리펩티드(Temer06400으로서 가칭됨)를 코딩한다.
본원에서 페룰로일 에스터라제(EC 3.1.1.73; CE1)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: 페룰로일-사카라이드 + H(2)O = 페룰레이트 + 사카라이드. 사카라이드는 예를 들면, 올리고사카라이드 또는 폴리사카라이드일 수 있다. 이 효소는 전형적으로 통상적으로 '천연' 기질에서 아라비노스인 에스터화된 당으로부터의 4-하이드록시-3-메톡시신나모일(페룰로일) 기의 가수분해를 촉진할 수 있다. p-니트로페놀 아세테이트 및 메틸 페룰레이트는 전형적으로 보다 더 약한 기질이다. 이 효소는 신나모일 에스터 하이드롤라제, 페룰산 에스터라제 또는 하이드록시신나모일 에스터라제로서도 지칭될 수 있다. 상기 효소는 자일라나제 및 펙티나제가 식물 세포벽 헤미셀룰로스 및 펙틴을 분해하는 것을 도울 수 있기 때문에 헤미셀룰라제 보조 효소로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 페룰로일 에스터라제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer08570
전형적으로, 본 발명의 폴리펩티드는 서열번호 62에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 62의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 엔도-자일라나제 활성을 갖는 폴리펩티드(Temer08570으로서 가칭됨)를 코딩한다.
본원에서 β-자일로시다제(EC 3.2.1.37; GH39)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.
본 발명의 폴리펩티드는 자일로시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer08163
전형적으로, 본 발명의 폴리펩티드는 서열번호 67에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 67의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 엔도-자일라나제 및/또는 엑소-자일라나제 활성을 갖는 폴리펩티드(Temer08163으로서 가칭됨)를 코딩한다. Temer08163은 유리하게는 자일로바이오스를 주 생성물로서 생성한다.
본원에서 엔도-자일라나제(EC 3.2.1.8)는 자일란에서 1,4-β-D-자일로사이드 연결의 엔도-가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 엔도-1,4-β-자일라나제 또는 1,4-β-D-자일란 자일라노하이드롤라제로서도 지칭될 수 있다. 대안적 효소는 글루쿠로노아라비노자일란에서 1,4-자일로사이드 연결을 가수분해할 수 있는 효소인 글루쿠로노아라비노자일란 엔도-자일라나제(EC 3.2.1.136)이다.
본 발명의 폴리펩티드는 엔도-자일라나제 및/또는 엑소-자일라나제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
Temer07305
전형적으로, 본 발명의 폴리펩티드는 서열번호 72에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 72의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-글루쿠로니다제 활성을 갖는 폴리펩티드(Temer07305로서 가칭됨)를 코딩한다.
본원에서 α-D-글루쿠로니다제(EC 3.2.1.139; GH115)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: α-D-글루쿠로노사이드 + H(2)O = 알코올 + D-글루쿠로네이트. 이 효소는 α-글루쿠로니다제 또는 α-글루코시듀로나제로서도 지칭될 수 있다. 이 효소는 자일란에 치환기로서 존재할 수도 있는 4-O-메틸화된 글루코론산을 가수분해할 수도 있다. 대안적 효소는 α-1,2-(4-O-메틸)글루쿠로노실 연결의 가수분해를 촉진하는 자일란 α-1,2-글루쿠로노시다제(EC 3.2.1.131)이다.
본 발명의 폴리펩티드는 α-글루쿠로니다제활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.
이와 관련하여 탄수화물은 모든 사카라이드, 예를 들면, 폴리사카라이드, 올리고사카라이드, 다이사카라이드 또는 모노사카라이드를 포함한다.
본 발명에 따른 폴리펩티드는 탄수화물 물질을 화학적으로 분해하거나 물리적으로 분해하거나 탄수화물을 가수분해함으로써 이러한 탄수화물 물질을 변경시킬 수 있다. 탄수화물 물질의 화학적 변경은 예를 들면, 가수분해, 산화 또는 다른 화학적 변경, 예컨대, 라이아제(lyase)의 작용에 의한 이러한 물질의 분해를 초래할 수 있다. 물리적 변경은 화학적 변경을 동반할 수 있거나 동반하지 않을 수 있다.
적합한 탄수화물 물질
리그노셀룰로스용해 또는 리그노셀룰로스성 물질 또는 바이오매스는 자연에 풍부하고 대체 에너지 공급원으로서 큰 가치를 갖는다. 진보된 바이오연료로서도 공지되어 있는 제2 세대 바이오연료는 다양한 종류의 바이오매스로부터 제조될 수 있는 연료이다. 바이오매스는 탄소 주기의 일부로서 신속하게 재생되는 유기 탄소의 임의의 공급원을 의미하는 광범위한 용어이다. 바이오매스는 식물 물질로부터 유래되지만 동물 물질도 포함할 수 있다. 리그노셀룰로스성 바이오매스의 조성은 상이하고, 주성분은 셀룰로스(35% 내지 50%)이고 그 다음 많은 성분은 자일란(20% 내지 35%, 헤미셀룰로스의 일종) 및 리그닌(10% 내지 25%)이고, 이와 더불어 리그노셀룰로스성 바이오매스의 남은 분율을 구성하는 부성분, 예컨대, 단백질, 오일 및 재(ash)가 있다. 리그노셀룰로스성 바이오매스는 다양한 탄수화물들을 함유한다. 용어 "탄수화물"은 생화학에서 가장 일반적인 용어이고, 이때 상기 용어는 사카라이드의 동의어이다. 탄수화물(사카라이드)은 하기 4개의 화학 집단으로 나누어진다: 모노사카라이드, 다이사카라이드, 올리고사카라이드 및 폴리사카라이드. 일반적으로, 보다 작은(저분자량) 탄수화물인 모노사카라이드 및 다이사카라이드는 통상적으로 당으로서 지칭된다.
본 발명의 폴리펩티드에 의한 변경에 적합한 비-전분 탄수화물은 리그노셀룰로스이다. 잠재적인 재생가능한 공급원료로서 간주될 수 있는, 상이한 리그노셀룰로스성 잔기를 포함하는 주요 폴리사카라이드는 셀룰로스(글루칸) 및 헤미셀룰로스(자일란, 헤테로자일란 및 자일로글루칸)이다. 추가로, 일부 헤미셀룰로스는 예를 들면, 목재 유래의 공급원료에서 글루코만난으로서 존재할 수 있다. 가용성 당, 예를 들면, 글루코스, 자일로스, 아라비노스, 갈락토스, 프럭토스, 만노스, 람노스, 리보스, D-갈락투론산 및 다른 헥소스 및 펜토스로의 이들 폴리사카라이드들의 효소 가수분해는 협력하여 작용하는 상이한 효소들의 작용 하에서 일어난다.
리그닌은 특히 목질부 헛물관, 도관 요소 및 후막 세포에서 셀룰로스, 헤미셀룰로스 및 펙틴 성분들 사이의 세포벽내 공간을 채운다. 리그닌은 헤미셀룰로스에 공유연결됨으로써 상이한 식물 폴리사카라이드들을 가교연결하여 기계적 강도를 세포벽 및 더 나아가 식물 전체에 부여한다. 리그닌은 다양한 정도로 메톡실화될 수 있는 상이한 모노리그놀 단량체들에 의해 형성되는 고도 소수성 가교연결된 방향족 중합체성 물질이다. 다양한 정도로 메톡실화되는 하기 3종의 모노리그놀 단량체들이 존재한다: p-쿠마릴 알코올, 코니페릴 알코올 및 시나필 알코올. 이들 리그놀들은 페닐프로파노이드(각각 p-하이드록시페닐(H), 구아이아실(guaiacyl)(G) 및 시링길(syringyl)(S))의 형태로 리그닌 내로 도입된다. 리그닌의 생분해는 식물 원료 물질로부터 바이오연료를 가공하기 위한 전제조건이다. 리그닌은 상이한 전처리 방법을 적용함으로써, 또는 리그니나제(ligninase) 또는 리그닌 변경 효소(LME)를 사용함으로써 분해될 수 있다. 리그닌 분해의 개선은 예를 들면, (헤미)셀룰로스성 성분에의 접근성을 개선함으로써, 또는 (헤미)셀룰라제의 작용에 의해 방출된 올리고사카라이드에서 리그닌-(헤미)셀룰로스 연결을 제거함으로써 바이오연료 가공으로부터의 생산량을 보다 더 우수한 수득 또는 보다 더 우수한 효율 계수까지 끌어올릴 것이다.
추가로, 펙틴 및 다른 펙틴성 물질, 예컨대, 아라비난은 전형적으로 비-목재성 식물 조직으로부터의 세포벽의 건조 질량의 상당한 비율을 차지할 수 있다(건조 질량의 약 4분의 1 내지 2분의 1이 펙틴일 수 있다).
셀룰로스는 β-1,4 결합에 의해 연결된 글루코스 잔기들로 구성된 선형 폴리사카라이드이다. 셀룰로스 섬유의 선형 성질 및 (α에 비해) β-연결된 글루코스의 화학양론은 전분의 고도로 분지된 α-연결된 구조보다 더 가닥간 수소결합하기 쉬운 구조를 발생시킨다. 따라서, 셀룰로스 중합체는 일반적으로 보다 더 낮은 가용성을 갖고 전분에서 발견된 섬유보다 더 단단히 결합된 섬유를 형성한다.
헤미셀룰로스는 복합 중합체이고, 그의 조성은 종종 유기체마다 및 조직 종류마다 광범위하게 달라진다. 일반적으로, 헤미셀룰로스의 주성분은 오탄당인 β-1,4-연결된 자일로스이다. 그러나, 이 자일로스는 종종 O-3 및/또는 O-2에서 분지되고, 아라비노스, 갈락토스, 만노스, 글루쿠론산 또는 갈락투론산과의 연결, 또는 아세트산으로의 에스터화(및 아라비노스로의 페룰산의 에스터화)에 의해 치환될 수 있다. 헤미셀룰로스는 β-연결된 육탄당(예컨대, 앞서 언급된 β-(1,3)(1,4)-글루칸 및 헤테로글루칸)에 대한 일반 용어인 글루칸, 및 추가로 글루코만난(이때, 글루코스 및 만노스 둘다가 β-연결에 의해 서로 연결된 상태로 선형 골격에 존재함)도 함유할 수 있다.
헤미셀룰로스의 조성, 치환 성질 및 분지화 정도는 단자엽 식물(외떡잎 식물, 즉 단일 자엽 또는 종자 잎을 갖는 식물, 예컨대, 옥수수, 밀, 벼, 잔디, 보리)에 비해 쌍자엽 식물(쌍떡잎 식물, 즉 2개의 자엽 또는 종자 잎을 갖는 종자를 갖는 식물, 예컨대, 리마콩, 땅콩, 아몬드, 완두콩, 강낭콩)에서 매우 상이하다. 쌍떡잎 식물에서 헤미셀룰로스는 1,6-β-연결된 자일로실 측쇄를 갖는 1,4-β-연결된 글루코스 쇄인 자일로글루칸으로 주로 구성된다. 대다수의 곡물 작물을 포함하는 외떡잎 식물에서, 헤미셀룰로스의 주성분은 헤테로자일란이다. 이것은 아라비노스, 갈락토스, 만노스 및 글루쿠론산 또는 4-O-메틸-글루쿠론산과의 1,3-α 연결을 갖는 1,4-β-연결된 자일로스 골격 중합체, 및 에스터-연결된 아세트산에 의해 변경된 자일로스로 주로 구성된다. 1,3-β-연결된 글루코실 쇄 및 1,4-β-연결된 글루코실 쇄로 구성된 β-글루칸도 존재한다. 외떡잎 식물에서, 셀룰로스, 헤테로자일란 및 β-글루칸은 세포벽의 건조 물질의 약 15% 내지 25%를 각각 차지하면서 거의 동등한 양으로 존재할 수 있다. 또한, 상이한 식물은 상이한 양 및 상이한 조성의 펙틴성 물질을 포함할 수 있다. 예를 들면, 사탕무는 건조 중량 기준으로 약 19%의 펙틴 및 약 21%의 아라비난을 함유한다.
따라서, 본 발명의 조성물은 사용될 구체적인 공급원료(기질로서도 지칭됨) 면에서 조정될 수 있다. 다시 말해, 본 발명의 조성물에서 활성의 스펙트럼은 해당 공급원료에 따라 달라질 수 있다.
효소 조합물 또는 물리적 처리가 동시적으로 또는 순차적으로 투여될 수 있다. 효소는 미생물, 효모, 진균, 세균 또는 식물에서 외생적으로 생성된 후 단리될 수 있고 리그노셀룰로스성 공급원료에 첨가될 수 있다. 대안적으로, 효소는 생성되되 단리되지 않고, 미정제 세포 덩어리 발효 브로쓰 또는 식물 물질(예컨대, 옥수수대) 등이 공급원료에 첨가된다. 대안적으로, 미정제 세포 덩어리, 효소 생성 배지 또는 식물 물질이 추가 미생물 생장을 방지하도록 (예를 들면, 가열 또는 항미생물제의 첨가에 의해) 처리된 후 공급원료에 첨가될 수 있다. 이들 미정제 효소 혼합물들은 효소를 생성하는 유기체를 포함할 수 있다. 대안적으로, 효소는 공급원료(예컨대, 옥수수대)를 사용하여 효소를 생성하는 유기체에게 영양을 제공하는 발효에서 생성될 수 있다. 이 방식으로, 효소를 생성하는 식물은 리그노셀룰로스성 공급원료로서 사용될 수 있고 리그노셀룰로스성 공급원료 내로 첨가될 수 있다.
효소 활성
엔도-1,4-β-글루카나제(EG) 및 엑소-셀로바이오하이드롤라제(CBH)는 셀로올리고사카라이드(주 생성물로서 셀로바이오스)로의 불용성 셀룰로스의 가수분해를 촉진하는 반면, β-글루코시다제(BGL)는 올리고사카라이드, 주로 셀로바이오스 및 셀로트라이오스를 글루코스로 전환시킨다.
자일라나제는 다른 보조 효소, 예를 들면, α-L-아라비노푸라노시다제, 페룰로일 및 아세틸자일란 에스터라제, 글루쿠로니다제 및 β-자일로시다제와 함께 헤미셀룰로스의 일부의 가수분해를 촉진한다.
펙틴성 물질은 펙틴, 아라비난, 갈락탄 및 아라비노갈락탄을 포함한다. 펙틴은 식물 세포벽에서 가장 복잡한 폴리사카라이드이다. 펙틴은 어느 정도까지 L-람노스 사이에 배치된 α(1,4)-연결된 D-갈락투론산 유닛들로 구성된 코어 쇄 주변에서 구축된다. 임의의 한 세포벽에는 이 설명과 들어맞는 다수의 구조 유닛들이 존재하고, 일반적으로 단일 펙틴성 분자에서 상이한 구조 유닛들로 구성된 코어 쇄들은 서로 연속적으로 존재한다고 간주된다.
펙티나제는 예를 들면, 엔도-폴리갈락투로나제, 펙틴 메틸 에스터라제, 엔도-갈락타나제, β-갈락토시다제, 펙틴 아세틸 에스터라제, 엔도-펙틴 라이아제, 펙테이트 라이아제, α-람노시다제, 엑소-갈락투로나제, 엑소-폴리갈락투로네이트 라이아제, 람노갈락투로난 하이드롤라제, 람노갈락투로난 라이아제, 람노갈락투로난 아세틸 에스터라제, 람노갈락투로난 갈락투로노하이드롤라제, 자일로갈락투로나제, 및 α-아라비노푸라노시다제를 포함한다.
구조 유닛의 주요 종류는 다음과 같다: 카복실 기 상에서 메탄올로 치환될 수 있고 O-2 및 O-3 상에서 아세테이트로 치환될 수 있는 갈락투로난(호모갈락투로난); 갈락투론산 유닛이 (1,4)-연결된 갈락탄 및 (1,5)-연결된 아라비난 측쇄를 보유하는 람노스 유닛과 교대로 존재하는 람노갈락투로난 I(RGI)(아라비난 측쇄는 람노스에 직접적으로 또는 갈락탄 쇄를 통해 간접적으로 부착될 수 있음); 갈락투론산의 O-3 상에서 단일 자일로실 유닛을 갖는 자일로갈락투로난(RGI와 밀접하게 관련되어 있음); 및 희귀 당, 예를 들면, 아피오스를 함유하는 특히 복잡한 소수 유닛인 람노갈락투로난 II(RGII). RGII 유닛은 적합한 이온성 조건 하에서 보레이트와 함께 에스터를 가역적으로 형성할 수 있는 2개의 아피오실 잔기를 함유할 수 있다.
전술된 바와 같이, 본 발명의 폴리펩티드는 전형적으로 표 1에 따른 활성을 가질 것이다. 그러나, 본 발명의 폴리펩티드는 그 활성 이외에 또는 대신에 전술된 활성들 중 하나 이상을 가질 수 있다. 또한, 본원에 기재된 본 발명의 조성물은 표 1에 따른 활성을 갖는 본 발명의 폴리펩티드에 의해 제공된 활성 이외에 전술된 활성들 중 하나 이상을 가질 수 있다.
폴리뉴클레오티드 서열
본 발명은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 코딩하는 유전자를 포함하는 게놈 폴리뉴클레오티드 서열뿐만 아니라 그의 코딩 서열도 제공한다. 따라서, 본 발명은 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 따른 코딩 뉴클레오티드 서열에 따른 게놈 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드, 및 이의 변이체, 예컨대, 기능성 균등물에 관한 것이다.
구체적으로, 본 발명은 예를 들면, 엄격한 조건 하에서, 바람직하게는 고도로 엄격한 조건 하에서 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 기재된 서열을 포함하는 폴리뉴클레오티드의 역 상보체와 선택적으로 혼성화할 수 있는 단리된 폴리뉴클레오티드에 관한 것이다.
보다 구체적으로, 본 발명은 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 따른 뉴클레오티드 서열을 포함하거나 본질적으로 이러한 뉴클레오티드 서열로 구성된 폴리뉴클레오티드에 관한 것이다.
본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 폴리펩티드 또는 이의 변이체, 예컨대, 기능성 균등물, 또는 이들 중 어느 하나의 단편의 하나 이상의 기능성 도메인을 코딩하는 서열을 포함하거나 본질적으로 이러한 서열로 구성된 단리된 폴리뉴클레오티드에 관한 것이다.
본원에서 사용된 바와 같이, 용어 "유전자" 및 "재조합 유전자"는 염색체 DNA로부터 단리될 수 있고 예를 들면, 본 발명에 따른 활성을 갖는 단백질을 코딩하는 개방 판독 프레임(open reading frame)을 포함하는 핵산 분자를 지칭한다.
유전자는 코딩 서열, 비-코딩 서열, 인트론 및/또는 조절 서열을 포함할 수 있다. 나아가, 용어 "유전자"는 본원에서 정의된 단리된 핵산 분자를 지칭할 수 있다.
본 발명의 핵산 분자, 예컨대, 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 뉴클레오티드 서열을 갖는 핵산 분자, 또는 이의 변이체, 예컨대, 기능성 균등물은 표준 분자생물학 기법 및 본원에서 제공된 서열 정보를 사용함으로써 단리될 수 있다. 예를 들면, 본 발명에 따른 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71의 핵산 서열의 전부 또는 일부를 혼성화 프로브로서 사용하여 표준 기법 및 클로닝 기법(예를 들면, 문헌(Sambrook, J., Fritsh, E. F., and Maniatis, T. Molecular Cloning: A Laboratory Manual.2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에 기재됨)을 이용함으로써 단리될 수 있다.
더욱이, 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 전부 또는 일부를 포괄하는 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 함유된 서열 정보에 근거하여 디자인된 합성 올리고뉴클레오티드 프라이머를 사용하는 중합효소 연쇄 반응에 의해 단리될 수 있다.
본 발명의 핵산은 표준 PCR 증폭 기법에 따라 주형으로서 cDNA, mRNA 또는 대안적으로 게놈 DNA, 및 적절한 올리고뉴클레오티드 프라이머를 사용함으로써 증폭될 수 있다. 이렇게 증폭된 핵산은 적절한 벡터 내로 클로닝될 수 있고 DNA 서열 분석에 의해 특징규명될 수 있다.
나아가, 본 발명에 따른 뉴클레오티드 서열에 상응하거나 혼성화될 수 있는 올리고뉴클레오티드는 표준 합성 기법에 의해, 예를 들면, 자동 DNA 합성기를 이용함으로써 제조될 수 있다.
바람직한 실시양태에서, 본 발명의 단리된 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 뉴클레오티드 서열을 포함한다.
또 다른 바람직한 실시양태에서, 본 발명의 단리된 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 뉴클레오티드 서열 또는 이러한 뉴클레오티드 서열의 변이체, 예컨대, 기능성 균등물의 역 상보체인 핵산 분자를 포함한다.
또 다른 뉴클레오티드 서열에 상보적인 핵산 분자는 다른 뉴클레오티드 서열에 혼성화하여 안정한 이중체를 형성할 수 있을 정도로 다른 뉴클레오티드 서열에 충분히 상보적인 핵산 분자이다.
본 발명의 한 양태는 본 발명의 폴리펩티드 또는 이의 변이체, 예컨대, 기능성 균등물, 예를 들면, 생물학적 활성 단편 또는 도메인을 코딩하는 단리된 핵산 분자; 및 본 발명의 폴리펩티드를 코딩하는 핵산 분자를 확인하기 위한 혼성화 프로브로서 사용되기에 충분한 핵산 분자, 및 핵산 분자의 증폭 또는 돌연변이를 위한 PCR 프라이머로서 사용되기에 적합한 이러한 핵산 분자의 단편에 관한 것이다.
본 발명에 따른 폴리뉴클레오티드는 "단리"될 수 있다. 본 발명과 관련하여, "단리된 폴리뉴클레오티드" 또는 "단리된 핵산"은 그 자신의 기원인 유기체의 천연 게놈에서 그 자신과 바로 인접하여 존재하는 코딩 서열들(5' 말단 상의 한 코딩 서열 및 3' 말단 상의 한 코딩 서열) 중 하나 또는 둘다와 바로 인접하여 존재하지 않는 DNA 또는 RNA이다. 따라서, 한 실시양태에서, 단리된 핵산은 코딩 서열에 바로 인접하여 존재하는 5' 비-코딩(예를 들면, 프로모터) 서열들 중 일부 또는 전부를 포함한다. 따라서, 상기 용어는 예를 들면, 벡터, 자율 복제 플라스미드 또는 바이러스, 또는 원핵생물 또는 진핵생물의 게놈 DNA 내로 도입되거나, 다른 서열과 무관하게 별개의 분자(예를 들면, PCR 또는 제한 엔도뉴클레아제(endonuclease) 처리에 의해 생성된 cDNA 또는 게놈 DNA 단편)로서 존재하는 재조합 DNA를 포함한다. 상기 용어는 세포 물질, 바이러스 물질 또는 배양 배지(재조합 DNA 기법에 의해 생성될 때), 또는 화학 전구체 또는 다른 화학물질(화학적으로 합성될 때)을 실질적으로 갖지 않는 추가 폴리펩티드를 코딩하는 하이브리드 유전자의 일부인 재조합 DNA도 포함한다. 나아가, "단리된 핵산 단편"은 단편으로서 천연적으로 존재하지 않고 천연 상태에서 발견되지 않을 핵산 단편이다.
본원에서 사용된 바와 같이, 용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 DNA 분자(예를 들면, cDNA 또는 게놈 DNA) 및 RNA 분자(예를 들면, mRNA), 및 뉴클레오티드 유사체의 사용에 의해 생성된 DNA 또는 RNA의 유사체를 포함하기 위한 것이다. 핵산 분자는 단일 가닥 또는 이중 가닥일 수 있으나, 바람직하게는 이중 가닥 DNA이다. 핵산은 올리고뉴클레오티드 유사체 또는 유도체(예를 들면, 이노신 또는 포스포로티오에이트 뉴클레오티드)를 사용함으로써 합성될 수 있다. 이러한 올리고뉴클레오티드는 예를 들면, 변경된 염기쌍 형성 능력 또는 뉴클레아제(nuclease)에 대한 증가된 내성을 갖는 핵산을 제조하는 데에 사용될 수 있다.
본 발명의 또 다른 실시양태는 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 핵산 분자, 예를 들면, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 핵산 분자의 코딩 가닥에 대한 안티센스 가닥인 단리된 핵산 분자를 제공한다. 본원에 기재된 핵산 분자의 상보적 가닥도 본 발명의 범위 내에 포함된다.
달리 표시되어 있지 않은 한, 본원에서 DNA 분자를 서열결정(sequencing)함으로써 결정된 모든 뉴클레오티드 서열들은 자동 DNA 서열결정기를 이용함으로써 결정되었고, 본원에서 결정된 DNA 분자에 의해 코딩된 폴리펩티드의 모든 아미노산 서열들은 상기 결정된 DNA 서열의 번역에 의해 예측되었다. 따라서, 이 자동 방법에 의해 결정된 임의의 DNA 서열에 대해 당분야에서 공지되어 있는 바와 같이, 본원에서 결정된 임의의 뉴클레오티드 서열은 일부 오류를 함유할 수 있다. 자동화에 의해 결정된 뉴클레오티드 서열은 서열결정된 DNA 분자의 실제 뉴클레오티드 서열과 전형적으로 약 90% 이상, 보다 전형적으로 약 95% 이상 내지 약 99.9% 이상 동일하다.
실제 서열은 당분야에서 잘 공지되어 있는 수동 DNA 서열결정 방법을 비롯한 다른 방법에 의해 보다 더 정확히 결정될 수 있다. 당분야에서도 공지되어 있는 바와 같이, 실제 서열에 비해 결정된 뉴클레오티드 서열에서의 단일 삽입 또는 결실은 결정된 뉴클레오티드 서열에 의해 코딩된 예측된 아미노산 서열이 서열결정된 DNA 분자에 의해 실제로 코딩된 아미노산 서열과 완전히 상이할 정도로 뉴클레오티드 서열의 번역에서 이러한 삽입 또는 결실 지점부터 시작되는 프레임 변동을 야기할 것이다.
당업자는 이러한 오류로 확인된 염기를 확인할 수 있고 이러한 오류를 정정하는 방법을 알고 있다.
본 발명에 따른 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 핵산 서열(또는 이의 변이체)의 일부 또는 단편, 예를 들면, 프로브 또는 프라이머로서 사용될 수 있는 단편, 또는 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 일부를 코딩하는 단편만을 포함할 수 있다.
Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자 및 cDNA의 클로닝으로부터 결정된 뉴클레오티드 서열은 다른 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 패밀리 구성원뿐만 아니라, 다른 종으로부터의 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 상동체의 확인 및/또는 클로닝에 사용되도록 디자인된 프로브 및 프라이머의 생성을 가능하게 한다.
상기 프로브/프라이머는 전형적으로 바람직하게는 고도로 엄격한 조건 하에서 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 뉴클레오티드 서열 또는 이의 변이체, 예컨대, 기능성 균등물의 적어도 약 12개 내지 약 15개, 바람직하게는 약 18개 내지 약 20개, 바람직하게는 약 22개 내지 약 25개, 보다 바람직하게는 약 30개, 약 35개, 약 40개, 약 45개, 약 50개, 약 55개, 약 60개, 약 65개 또는 약 75개 이상의 연속 뉴클레오티드에 혼성화하는 뉴클레오티드 서열의 영역을 전형적으로 포함하는 실질적으로 정제된 올리고뉴클레오티드를 포함한다.
Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 뉴클레오타이드 서열에 근거한 프로브를 사용하여 예를 들면, 다른 유기체에서 동일한 또는 유사한 단백질을 코딩하는 전사체 또는 게놈 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 서열을 검출할 수 있다. 바람직한 실시양태에서, 프로브는 그에 부착된 표지 기를 더 포함하고, 예를 들면, 표지 기는 방사성 동위원소, 형광 화합물, 효소 또는 효소 보조인자일 수 있다. 이러한 프로브는 Temer09484 단백질을 발현하는 세포를 확인하기 위한 진단 시험 키트의 일부로서 사용될 수도 있다.
본원의 폴리뉴클레오티드는 합성 폴리뉴클레오티드일 수 있다. 합성 폴리뉴클레오티드는 바람직하게는 본원에 참고로 도입되는 국제 특허출원 공개 제WO2006/077258호 및/또는 국제 특허출원 제PCT/EP2007/055943호에 기재된 방법에 따라 코돈 사용에서 최적화될 수 있다. 국제 특허출원 제PCT/EP2007/055943호는 코돈-쌍 최적화를 다룬다. 코돈 쌍 최적화는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 그의 코돈 사용, 특히 사용되는 코돈 쌍에 대하여 변경시켜 폴리펩티드를 코딩하는 뉴클레오티드 서열의 개선된 발현 및/또는 코딩된 폴리펩티드의 개선된 생성을 수득하는 방법이다. 코돈 쌍은 코딩 서열에서 2개의 연속 삼중체들(코돈들)의 세트로서 정의된다.
또한, 본 발명은 전술된 폴리뉴클레오티드를 포함하는 핵산 구축물에 관한 것이다. 본원에서 "핵산 구축물"은 천연 유전자로부터 단리되거나, 자연에 존재하지 않을 방식으로 조합되고 병치되는 핵산 분절들을 함유하도록 변경되어 있는 단일 또는 이중 가닥 핵산 분자로서 정의된다. 용어 "핵산 구축물"은 핵산 구축물이 코딩 서열의 발현에 필요한 모든 조절 서열들을 함유할 때 용어 "발현 카세트"와 동의어이다. 본원에서 정의된 용어 "코딩 서열"은 mRNA로 전사되고 본 발명의 프로테아제 프로모터의 전사 활성화제로 번역되는 서열이다. 코딩 서열의 경계는 일반적으로 mRNA의 5' 말단에 있는 ATG 시작 코돈, 및 mRNA의 3' 말단에서 개방 판독 프레임을 종결하는 번역 정지 코돈 서열에 의해 결정된다. 코딩 서열은 DNA, cDNA 및 재조합 핵산 서열을 포함할 수 있으나 이들로 한정되지 않는다. 바람직하게는, 핵산은 높은 GC 함량을 갖는다. 본원에서 GC 함량은 구축물 내의 G 및 C 뉴클레오티드의 수를 뉴클레오티드의 총 수로 나눈 값(%로 표현됨)을 표시한다. GC 함량은 바람직하게는 56% 이상, 57% 이상, 58% 이상, 59% 이상, 60% 이상, 56% 내지 70%, 또는 58% 내지 65%이다. 바람직하게는, DNA 구축물은 프로모터 DNA 서열, 상기 프로모터 DNA 서열과 작동가능하게 연결된 코딩 서열, 및 조절 서열, 예컨대, 하기 조절 서열을 포함한다:
- 서열 TAAG, TAGA 및 TAAA로부터 선택된, 5'부터 3' 방향으로 배향된 1개의 번역 종결 서열, 바람직하게는 TAAA;
- 서열 GCTACCCCC, GCTACCTCC, GCTACCCTC, GCTACCTTC, GCTCCCCCC, GCTCCCTCC, GCTCCCCTC, GCTCCCTTC, GCTGCCCCC, GCTGCCTCC, GCTGCCCTC, GCTGCCTTC, GCTTCCCCC, GCTTCCTCC, GCTTCCCTC 및 GCTTCCTTC로부터 선택된, 5'부터 3' 방향으로 배향된 1개의 번역 개시요소 코딩 서열, 바람직하게는 GCTTCCTTC; 및/또는
- 뉴클레오티드에 대한 하기 모호한 코드를 사용하는 서열 5'-mwChkyCAAA-3', 5'-mwChkyCACA-3' 및 5'-mwChkyCAAG-3'으로부터 선택된 1개의 번역 개시요소 서열, 바람직하게는 5'-CACCGTCAAA-3' 또는 5'-CGCAGTCAAG-3': m(A/C); w(A/T); y(C/T); k(G/T); h(A/C/T).
본 발명과 관련하여, 용어 "번역 개시요소 코딩 서열"은 DNA 코딩 서열의 개방 판독 프레임의 개시요소 또는 시작 코돈의 바로 다운스트림에 있는 9개의 뉴클레오티드로서 정의된다. 상기 개시요소 또는 시작 코돈은 AA 메티오닌을 코딩한다. 개시요소 코돈은 전형적으로 ATG이지만 임의의 기능성 시작 코돈, 예컨대, GTG일 수도 있다.
본 발명과 관련하여, 용어 "번역 종결 서열"은 개방 판독 프레임 또는 뉴클레오티드 코딩 서열의 3' 말단에 있는 번역 정지 코돈으로부터 시작되고 5'부터 3' 방향으로 배향된 4개의 뉴클레오티드로서 정의된다.
본 발명과 관련하여, 용어 "번역 개시요소 서열"은 폴리펩티드를 코딩하는 DNA 서열의 개방 판독 프레임의 개시요소 또는 시작 코돈의 바로 업스트림에 있는 10개의 뉴클레오티드로서 정의된다. 상기 개시요소 또는 시작 코돈은 AA 메티오닌을 코딩한다. 개시요소 코돈은 전형적으로 ATG이지만 임의의 기능성 시작 코돈, 예컨대, GTG일 수도 있다. RNA에서 우라실인 U가 데옥시뉴클레오티드 타이민인 T를 대체한다는 것은 당분야에서 잘 공지되어 있다.
상동성
및 동일성
아미노산 또는 뉴클레오티드 서열은 일정한 수준의 유사성을 나타낼 때 상동성을 갖는다고 주장된다. 2개의 서열들이 상동성을 갖는다는 것은 공통된 진화 기원을 시사한다. 2개의 상동성 서열들이 밀접하게 관련되어 있는지 아니면 보다 더 멀리 관련되어 있는지는 각각 높은 또는 낮은 "퍼센트 동일성" 또는 "퍼센트 유사성"에 의해 표시된다. 논쟁의 여지가 있지만, "퍼센트 동일성" 또는 "퍼센트 유사성"을 표시하기 위해, "상동성의 수준" 또는 "퍼센트 상동성"은 종종 상호교환적으로 사용된다.
용어 "상동성", "퍼센트 상동성", "퍼센트 동일성" 또는 "퍼센트 유사성"은 본원에서 상호교환적으로 사용된다. 본 발명의 목적상, 2개의 아미노산 서열들 또는 2개의 핵산 서열들의 퍼센트 동일성을 측정하기 위해 완전한 서열들이 최적 비교 목적으로 정렬된다고 본원에서 정의된다. 2개의 서열들 사이의 정렬을 최적화하기 위해 갭이 비교되는 2개의 서열들 중 임의의 서열 내에 도입될 수 있다. 이러한 정렬은 비교되는 서열들의 전체 길이에 걸쳐 수행된다. 대안적으로, 상기 정렬은 보다 더 짧은 길이, 예를 들면, 약 20개, 약 50개 또는 약 100개 이상의 핵산/염기 또는 아미노산에 걸쳐 수행될 수 있다. 동일성은 보고된 정렬된 영역에 걸쳐 2개의 서열들 사이의 동일한 일치의 백분율이다.
서열들의 비교 및 2개의 서열들 사이의 퍼센트 동일성의 측정은 수학 알고리즘을 사용함으로써 달성될 수 있다. 당업자는 여러 상이한 컴퓨터 프로그램들이 2개의 서열들을 정렬하고 2개의 서열들 사이의 상동성을 측정하는 데에 이용될 수 있다는 사실을 알고 있을 것이다(Kruskal, J. B. (1983) An overview of sequence comparison In D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley). 2개의 아미노산 서열들 사이의 퍼센트 동일성은 2개의 서열들의 정렬을 위한 니들만(Needleman) 및 분슈(Wunsch) 알고리즘을 사용함으로써 측정될 수 있다(Needleman, S. B. and Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). 상기 알고리즘은 아미노산 서열뿐만 아니라 뉴클레오티드 서열도 정렬한다. 니들만-분슈 알고리즘은 컴퓨터 프로그램 NEEDLE에서 실행되어 왔다. 본 발명의 목적상, EMBOSS 팩키지로부터의 NEEDLE 프로그램이 사용되었다(버전 2.8.0 이상, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice, P. Longden, I. and Bleasby, A. Trends in Genetics 16, (6) pp276-277, http://emboss.bioinformatics.nl/). 단백질 서열의 경우, EBLOSUM62가 치환 매트릭스용으로 사용된다. 뉴클레오티드 서열의 경우, EDNAFULL이 사용된다. 다른 매트릭스가 특정될 수 있다. 아미노산 서열들의 정렬을 위해 사용되는 임의적 파라미터는 10의 갭-개방 벌점 및 0.5의 갭 연장 벌점이다. 당업자는 모든 이들 상이한 파라미터들이 약간 상이한 결과를 제공할 것이지만 2개의 서열들의 전체 백분율 동일성은 상이한 알고리즘을 사용할 때 유의하게 변경되지 않는다는 것을 인식할 것이다.
전체 상동성 정의
상동성 또는 동일성은 임의의 갭 또는 연장을 포함하는 총 정렬된 영역에 걸쳐 2개의 전체 서열들 사이에 동일한 일치의 백분율이다. 2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 2개의 서열들에서 동일한 아미노산을 보이는 정렬 내의 상응하는 위치의 수를, 갭을 포함하는 정렬의 총 길이로 나눈다. 본원에서 정의된 동일성은 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "동일성"으로서 표지된다.
가장 긴 동일성 정의
2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 2개의 서열들에서 동일한 아미노산을 보이는 정렬 내의 상응하는 위치의 수를, 정렬 내의 총 갭 수의 차감 후 정렬의 총 길이로 나눈다. 본원에서 정의된 동일성은 NOBRIEF 방법을 이용함으로써 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "가장 긴 동일성"으로서 표지된다. 본 발명의 목적상, 2개의 서열들(아미노산 또는 뉴클레오티드) 사이의 동일성(상동성) 수준은 프로그램 NEEDLE를 사용함으로써 수행될 수 있는 바와 같이 "가장 긴 동일성"의 정의에 따라 계산된다.
본 발명의 단백질 서열은 서열 데이터베이스에 대한 검색을 수행하기 위한, 예를 들면, 다른 패밀리 구성원 또는 관련된 서열을 확인하기 위한 "질의(query) 서열"로서 사용될 수도 있다. 이러한 검색은 BLAST 프로그램을 사용함으로써 수행될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생물공학 정보 센터(http://www.ncbi.nlm.nih.gov)를 통해 공개적으로 입수가능하다. 아미노산 서열의 경우 BLASTP가 사용되고 뉴클레오티드 서열의 경우 BLASTN이 사용된다. BLAST 프로그램은 디폴트로서 하기 파라미터들을 사용한다:
- 갭을 개방하기 위한 값: 디폴트 = 뉴클레오티드의 경우 5/단백질의 경우 11
- 갭을 연장하기 위한 값: 디폴트 = 뉴클레오티드의 경우 2/단백질의 경우 1
- 뉴클레오티드 불일치에 대한 벌점: 디폴트 = -3
- 뉴클레오티드 일치에 대한 보상: 디폴트 = 1
- 기대 값: 디폴트 = 10
- 단어크기: 디폴트 = 뉴클레오티드의 경우 11/메가블라스트(megablast)의 경우 28/단백질의 경우 3.
나아가, 질의 아미노산 서열 또는 질의 핵산 서열과 검색된 상동성 서열 사이의 국소 동일성(상동성) 정도는 BLAST 프로그램에 의해 측정된다. 그러나, 일정한 역치를 초과하는 일치를 제공하는 서열 분절들만이 비교된다. 따라서, 상기 프로그램은 이들 일치하는 분절들에 대해서만 동일성을 계산한다. 따라서, 이 방식으로 계산된 동일성은 국소 동일성으로서 지칭된다.
벡터
본 발명의 또 다른 양태는 Temer09484 단백질 또는 이의 기능성 균등물을 코딩하는 본 발명의 폴리뉴클레오티드를 포함하는 벡터(클로닝 벡터 및 발현 벡터를 포함함), 및 예를 들면, 본 발명의 폴리펩티드의 발현이 일어나는 조건 하에서 적합한 숙주 세포에서 이러한 벡터를 증폭하거나, 형질전환시키거나 형질감염시키는 방법에 관한 것이다. 본원에서 사용된 바와 같이, 용어 "벡터"는 그 자신에 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다.
본 발명의 폴리뉴클레오티드는 재조합 복제가능한 벡터, 예를 들면, 클로닝 또는 발현 벡터 내로 도입될 수 있다. 상기 벡터는 상용가능한 숙주 세포에서 핵산을 복제하는 데에 사용될 수 있다. 따라서, 추가 실시양태에서, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고 상기 벡터를 상용가능한 숙주 세포 내로 도입하고 벡터의 복제를 일으키는 조건 하에서 상기 숙주 세포를 생장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 숙주 세포로부터 회수될 수 있다. 적합한 숙주 세포는 이하에 기재되어 있다.
본 발명의 발현 카세트 또는 폴리뉴클레오티드가 삽입되는 벡터는 편리하게는 재조합 DNA 절차로 처리될 수 있는 임의의 벡터일 수 있고, 벡터의 선택은 그 자신이 도입되는 숙주 세포에 의해 종종 좌우될 것이다.
본 발명에 따른 벡터는 자율 복제 벡터, 즉 염색체 외부 물질로서 존재하는 벡터일 수 있고, 이의 복제는 염색체 복제와 무관하다(예를 들면, 플라스미드). 대안적으로, 벡터는 숙주 세포 내로 도입될 때 숙주 세포 게놈 내로 삽입되고 그 자신이 삽입된 염색체와 함께 복제되는 벡터일 수 있다.
벡터의 한 종류는 추가 DNA 분절이 결찰될 수 있는 원형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 벡터의 또 다른 종류는 바이러스 벡터이고, 이때 추가 DNA 분절은 바이러스 게놈 내로 결찰될 수 있다. 일부 벡터들은 이들이 도입된 숙주 세포에서 자율적으로 복제할 수 있다(예를 들면, 세균 복제기점을 갖는 세균 벡터 및 에피좀 포유동물 벡터). 다른 벡터(예를 들면, 비-에피좀 포유동물 벡터)는 숙주 세포 내로의 도입 시 숙주 세포의 게놈 내로 삽입되어 숙주 게놈과 함께 복제된다. 더욱이, 일부 벡터들은 그들과 작동가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터들은 본원에서 "발현 벡터"로서 지칭된다. 일반적으로, 재조합 DNA 기법에서 유용한 발현 벡터는 종종 플라스미드의 형태로 존재한다. 플라스미드가 가장 흔히 사용되는 형태의 벡터이기 때문에 용어 "플라스미드" 및 "벡터"는 본원에서 상호교환적으로 사용될 수 있다. 그러나, 본 발명은 동등한 기능을 제공하는 다른 형태의 발현 벡터, 예컨대, 코스미드, 바이러스 벡터(예를 들면, 복제 결여 레트로바이러스, 아데노바이러스 및 아데노 관련 바이러스) 및 파지 벡터를 포함하기 위한 것이다.
본 발명에 따른 벡터는 예를 들면, RNA의 제조를 위해 시험관내에서 사용될 수 있거나, 숙주 세포를 형질감염시키거나 형질전환시키기 위해 사용될 수 있다.
본 발명의 벡터는 예를 들면, 과다발현을 위해 2개 이상, 예를 들면, 3개, 4개 또는 5개의 본 발명의 폴리뉴클레오티드를 포함할 수 있다.
본 발명의 재조합 발현 벡터는 숙주 세포에서의 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함하는데, 이것은 상기 재조합 발현 벡터가 발현될 핵산 서열에 작동가능하게 연결된 하나 이상의 조절 서열(발현을 위해 사용되는 숙주 세포에 근거하여 선택됨)을 포함한다는 것을 의미한다.
벡터, 예컨대, 발현 벡터 내에서 "작동가능하게 연결된"은 관심있는 뉴클레오티드 서열이 (예를 들면, 시험관내 전사/번역 시스템에서, 또는 벡터가 숙주 세포 내로 도입될 때 숙주 세포에서) 이 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 서열에 연결된다는 것을 의미하기 위한 것이다. 즉, 용어 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 작용할 수 있게 하는 관계로 존재하는 병치를 지칭한다. 코딩 서열에 "작동가능하게 연결된" 조절 서열, 예컨대, 프로모터, 인핸서 또는 다른 발현 조절 신호는 코딩 서열의 발현이 조절 서열과 상용가능한 조건 하에서 달성되거나, 서열들이 그들의 의도된 목적을 위해 협력하여 작용하도록, 예를 들면, 전사가 프로모터에서 시작되고 폴리펩티드를 코딩하는 DNA 서열을 통과하여 진행하도록 정렬되는 방식으로 위치한다.
따라서, 주어진 숙주 세포에 대한 벡터 또는 발현 구축물은 제1 발명의 폴리펩티드를 코딩하는 서열의 코딩 가닥을 기준으로 5' 말단부터 3' 말단까지 연속적인 순서로 서로 작동가능하게 연결된 하기 요소들을 포함할 수 있다: (1) 주어진 숙주 세포에서 폴리펩티드를 코딩하는 뉴클레오티드 서열의 전사를 유도할 수 있는 프로모터 서열; (2) 임의적으로, 주어진 숙주 세포로부터 배양 배지 내로 폴리펩티드의 분비를 유도할 수 있는 신호 서열; (3) 셀로바이오하이드롤라제 활성을 갖는 성숙, 바람직하게는 활성 형태의 폴리펩티드를 코딩하는 본 발명의 DNA 서열; 및 바람직하게는 (4) 폴리펩티드를 코딩하는 뉴클레오티드 서열의 다운스트림에서 전사를 종결할 수 있는 전사 종결 영역(종결요소).
본 발명에 따른 뉴클레오티드 서열의 다운스트림에는 하나 이상의 전사 종결 부위(예를 들면, 종결요소)를 함유하는 3' 비-번역 영역이 존재할 수 있다. 종결요소의 기원은 덜 중요하다. 종결요소는 예를 들면, 폴리펩티드를 코딩하는 DNA 서열에 대한 천연 종결요소일 수 있다. 그러나, 바람직하게는 효모 종결요소는 효모 숙주 세포에서 사용되고, 사상 진균 종결요소는 사상 진균 숙주 세포에서 사용된다. 보다 바람직하게는, 종결요소는 (폴리펩티드를 코딩하는 뉴클레오티드 서열이 발현될) 숙주 세포에 내재한다. 전사된 영역에는 번역을 위한 리보좀 결합 부위가 존재할 수 있다. 구축물에 의해 발현된 성숙 전사체의 코딩 부분은 번역될 폴리펩티드의 시작 부분에 위치하는 번역 시작 AUG 코돈, 및 번역될 폴리펩티드의 말단 부분에 적절하게 위치하는 종결 코돈을 포함할 것이다.
본 발명의 폴리뉴클레오티드의 향상된 발현은 발현 숙주로부터의 관심있는 단백질의 발현 및 원하는 경우 분비 수준을 증가시키는 데에 기여할 수 있고/있거나 본 발명의 폴리펩티드의 발현의 유도성 조절을 제공하는 데에 기여할 수 있는 이종 조절 영역, 예를 들면, 프로모터, 분비 리더 및/또는 종결요소 영역의 선택에 의해 달성될 수도 있다.
당업자는 발현 벡터의 디자인이 형질전환될 숙주 세포의 선택, 원하는 단백질의 발현 수준 등과 같은 요인에 의해 좌우될 수 있다는 것을 인식할 것이다. 본 발명의 벡터, 예컨대, 발현 벡터는 숙주 세포 내로 도입되어 본원에 기재된 핵산에 의해 코딩된 단백질 또는 펩티드(예를 들면, Temer09484 단백질, Temer09484 단백질의 돌연변이체 형태, 이의 단편, 변이체 또는 기능성 균등물)를 생성할 수 있다. 본 발명의 벡터, 예컨대, 재조합 발현 벡터는 원핵 세포 또는 진핵 세포에서 Temer09484 단백질을 발현하도록 디자인될 수 있다.
예를 들면, Temer09484 단백질은 세균 세포, 예컨대, 에스케리키아 콜라이, 곤충 세포(바큘로바이러스 발현 벡터를 사용함), 사상 진균, 효모 세포 또는 포유동물 세포에서 발현될 수 있다. 적합한 숙주 세포는 문헌(Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990))에 더 논의되어 있다. 적절한 숙주의 대표적인 예는 이하에 기재되어 있다.
전술된 숙주 세포에 적합한 배양 배지 및 조건은 당분야에서 공지되어 있다.
재조합 발현 벡터는 예를 들면, T7 프로모터 조절 서열 및 T7 중합효소를 사용함으로써 시험관내에서 전사되고 번역될 수 있다.
대다수의 사상 진균들 및 효모들의 경우, 안정한 형질전환체를 수득하기 위해 벡터 또는 발현 구축물은 바람직하게는 숙주 세포의 게놈 내에 삽입된다. 그러나, 일부 효모들의 경우, 안정한 고수준 발현을 위해 발현 구축물이 도입될 수 있는 적합한 에피좀 벡터도 이용가능하고, 이의 예에는 각각 사카로마이세스(Saccharomyces) 및 클루이베로마이세스(Kluyveromyces)의 2μ 및 pKD1 플라스미드로부터 유도된 벡터, 또는 AMA 서열(예를 들면, 아스퍼길러스로부터의 AMA1)을 함유하는 벡터가 포함된다. 발현 구축물이 숙주 세포 게놈 내로 삽입되는 경우, 구축물은 게놈 내의 무작위 좌위에서 삽입되거나, 상동성 재조합의 이용을 통해 예정된 표적 좌위에서 삽입되고, 이 경우 표적 좌위는 바람직하게는 고도로 발현되는 유전자를 포함한다.
따라서, 본 발명에서 유용한 발현 벡터는 염색체로부터 유도된 벡터, 에피좀으로부터 유도된 벡터 및 바이러스로부터 유도된 벡터, 예를 들면, 세균 플라스미드, 박테리오파지, 효모 에피좀, 효모 염색체 요소, 바이러스, 예컨대, 바큘로바이러스, 파포바 바이러스, 백시니아 바이러스, 아데노바이러스, 계두 바이러스, 가성광견병 바이러스 및 레트로바이러스로부터 유도된 벡터, 및 이들의 조합물로부터 유도된 벡터, 예컨대, 플라스미드 및 박테리오파지 유전 요소로부터 유도된 벡터, 예컨대, 코스미드 및 파지미드를 포함한다.
본원에서 용어 "제어 서열" 또는 "조절 서열"은 적어도 폴리펩티드의 발현에 필요할 수 있고/있거나 유리할 수 있는 임의의 성분을 포함하는 것으로 정의된다. 임의의 조절 서열은 폴리펩티드를 코딩하는 본 발명의 핵산 서열에 대한 천연 또는 외래 조절 서열일 수 있다. 이러한 조절 서열은 프로모터, 리더, 최적 번역 개시 서열(문헌(Kozak, 1991, J. Biol. Chem. 266:19867-19870)에 기재됨), 분비 신호 서열, 전구펩티드 서열, 폴리아데닐화 서열 및 전사 종결요소를 포함할 수 있으나 이들로 한정되지 않는다. 최소한, 조절 서열은 전형적으로 프로모터, 및 전사 및 번역 정지 신호를 포함한다. 전술된 바와 같이, 본원에서 용어 "작동가능하게 연결된"은 조절 서열이 폴리펩티드의 생성을 유도하도록 DNA 서열의 코딩 서열을 기준으로 특정 위치에 적절하게 배치되어 있는 배열로서 정의된다.
조절 서열은 폴리펩티드를 코딩하는 핵산 서열의 코딩 영역과 조절 서열의 결찰을 용이하게 하는 특정 제한 부위를 도입할 목적으로 링커를 구비할 수 있다. 본원에서 용어 "작동가능하게 연결된"은 조절 서열이 폴리펩티드의 생성을 유도하도록 DNA 서열의 코딩 서열을 기준으로 특정 위치에 적절하게 배치되어 있는 배열로서 정의된다.
조절 서열은 핵산 서열의 발현을 위해 숙주 세포에 의해 인식되는 핵산 서열인 적절한 프로모터 서열일 수 있다. 프로모터 서열은 폴리펩티드의 발현을 매개하는 전사 조절 서열을 함유한다. 돌연변이체 프로모터, 절두된 프로모터 및 하이브리드 프로모터를 비롯한 프로모터는 세포에서 전사 활성을 보이는 임의의 핵산 서열일 수 있고, 세포에 대한 동종성 또는 이종성을 갖는 세포외 또는 세포내 폴리펩티드를 코딩하는 유전자로부터 수득될 수 있다.
본원에서 용어 "프로모터"는 RNA 중합효소에 결합하고 상기 중합효소가 생물학적 화합물을 코딩하는 핵산 서열의 정확한 다운스트림 전사 시작 부위로 향하여 전사를 시작하게 하는 DNA 서열로서 정의된다. RNA 중합효소는 코딩 영역의 적절한 DNA 가닥에 상보적인 메신저 RNA의 조립을 효율적으로 촉진한다. 용어 "프로모터"는 mRNA로의 전사 후 번역을 위한 (프로모터와 번역 시작 부위 사이의) 5' 비-코딩 영역, 시스-작용 전사 조절 요소, 예컨대, 인핸서, 및 전사 인자와 상호작용할 수 있는 다른 뉴클레오티드 서열을 포함하는 것으로도 이해될 것이다. 프로모터는 전사 활성을 보이는, 진핵 또는 원핵 숙주 세포에 적합한 임의의 적절한 프로모터 서열(돌연변이체 프로모터, 절두된 프로모터 및 하이브리드 프로모터를 포함함)일 수 있고, 세포에 대한 동종(천연) 또는 이종(외래) 세포외 또는 세포내 폴리펩티드를 코딩하는 폴리뉴클레오티드로부터 수득될 수 있다. 프로모터는 항시성 또는 유도성 프로모터일 수 있다.
바람직하게는, 프로모터는 유도성 프로모터이다. 보다 바람직하게는, 프로모터는 탄수화물 유도성 프로모터이다. 바람직하게 사용되는 탄수화물 유도성 프로모터는 전분 유도성 프로모터(즉, 전분, 또는 이의 단량체, 이량체 또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 말토스 유도성 프로모터, 이소말토스 유도성 프로모터), 셀룰로스 유도성 프로모터(즉, 셀룰로스, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 셀로바이오스 유도성 프로모터, 소포로스 유도성 프로모터), 헤미셀룰로스 유도성 프로모터(즉, 헤미셀룰로스, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 자일란 유도성 프로모터, 아라바이오노스 유도성 프로모터, 자일로스 유도성 프로모터), 펙틴 유도성 프로모터(즉, 펙틴, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 갈락투론산 유도성 프로모터, 람노스 유도성 프로모터), 아라비난 유도성 프로모터(즉, 아라비난, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 아라비노스 유도성 프로모터), 글루코스 유도성 프로모터, 락토스 유도성 프로모터, 및 갈락토스 유도성 프로모터로부터 선택된다. 다른 유도성 프로모터는 구리 유도성 프로모터 및 올레산 유도성 프로모터이다.
사상 진균에 적합한 프로모터는 아스퍼길러스 오리자(A. oryzae) TAKA 아밀라제, 리조뮤코르 미에헤이(Rhizomucor miehei) 아스파르트산 프로테이나제, 아스퍼길러스 gpdA 프로모터, 아스퍼길러스 니게르 중성 α-아밀라제, 아스퍼길러스 니게르 산 안정성 α-아밀라제, 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리(A. awamori) 글루코아밀라제(glaA), 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리 엔도-자일라나제(xlnA) 또는 β-자일로시다제(xlnD), 트라이코데르마 리세이(T. reesei) 셀로바이오하이드롤라제 I(CBHI), 리조뮤코르 미에헤이 리파제, 아스퍼길러스 오리자 알칼리성 프로테아제, 아스퍼길러스 오리자 트라이오스 포스페이트 이소머라제, 아스퍼길러스 니둘란스 아세트아미다제, 푸사리움 베네나툼(Fusarium venenatum) 아밀로글루코시다제(국제 특허출원 공개 제WO2000/56900호), 푸사리움 베네나툼 다니아(Dania)(국제 특허출원 공개 제WO2000/56900호), 푸사리움 베네나툼 퀴인(Quinn)(국제 특허출원 공개 제WO2000/56900호), 푸사리움 옥시스포룸(Fusarium oxysporum) 트립신 유사 프로테아제(국제 특허출원 공개 제WO1996/00787호), 트라이코데르마 리세이 β-글루코시다제, 트라이코데르마 리세이 셀로바이오하이드롤라제 I, 트라이코데르마 리세이 셀로바이오하이드롤라제 II, 트라이코데르마 리세이 엔도-글루카나제 I, 트라이코데르마 리세이 엔도-글루카나제 II, 트라이코데르마 리세이 엔도-글루카나제 III, 트라이코데르마 리세이 엔도-글루카나제 IV, 트라이코데르마 리세이 엔도-글루카나제 V, 트라이코데르마 리세이 자일라나제 I, 트라이코데르마 리세이 자일라나제 II 또는 트라이코데르마 리세이 β-자일로시다제를 코딩하는 폴리뉴클레오티드로부터 수득된 프로모터뿐만 아니라, NA2-tpi 프로모터(아스퍼길러스 니게르 중성 α-아밀라제 및 아스퍼길러스 오리자 트라이오스 포스페이트 이소머라제를 코딩하는 폴리뉴클레오티드로부터 수득된 프로모터들의 하이브리드), 및 이들의 돌연변이체 프로모터, 절두된 프로모터 및 하이브리드 프로모터도 포함하나 이들로 한정되지 않는 군으로부터 선택될 수 있는 프로모터이다. 프로모터의 다른 예는 본원에 참고로 도입되는 국제 특허출원 공개 제WO2006/092396호 및 제WO2005/100573호에 기재된 프로모터이다. 프로모터의 사용의 다른 예는 국제 특허출원 공개 제WO2008/098933호에 기재되어 있다. 사상 진균에서 사용될 수 있는 바람직한 탄수화물 유도성 프로모터는 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니게르 중성 α-아밀라제, 아스퍼길러스 니게르 산 안정성 α-아밀라제, 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리 글루코아밀라제(glaA), 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리 엔도-자일라나제(xlnA) 또는 β-자일로시다제(xlnD), 트라이코데르마 리세이 β-글루코시다제, 트라이코데르마 리세이 셀로바이오하이드롤라제 I, 트라이코데르마 리세이 셀로바이오하이드롤라제 II, 트라이코데르마 리세이 엔도-글루카나제 I, 트라이코데르마 리세이 엔도-글루카나제 II, 트라이코데르마 리세이 엔도-글루카나제 III, 트라이코데르마 리세이 엔도-글루카나제 IV, 트라이코데르마 리세이 엔도-글루카나제 V, 트라이코데르마 리세이 자일라나제 I, 트라이코데르마 리세이 자일라나제 II, 트라이코데르마 리세이 β-자일로시다제, 및 상기 정의된 NA2-tpi 프로모터(아스퍼길러스 니게르 중성 α-아밀라제 및 아스퍼길러스 오리자 트라이오스 포스페이트 이소머라제를 코딩하는 폴리뉴클레오티드로부터 수득된 프로모터들의 하이브리드)이다.
그람 양성 미생물로부터 유래된 이러한 프로모터의 예에는 gnt(글루코네이트 오페론 프로모터); 바실러스 리체니포르미스(Bacillus licheniformis)로부터의 penP; glnA(글루타민 신쎄타제(synthetase)); xylAB(자일로스 오페론); araABD(L-아라비노스 오페론 및 Pspac 프로모터; 및 유도제, 예컨대, 이소프로필-β-D-티오갈락토피라노사이드[IPTG]에 의해 조절될 수 있는 하이브리드 SPO1/lac 프로모터가 포함되나 이들로 한정되지 않는다(Yansura D.G., Henner D.J. Proc Natl Acad Sci U S A. 1984 81(2):439-443). (i) 활성화제는 프로모터 활성을 유도하는 서열 특이적 DNA 결합 단백질이다. 그람 양성 미생물로부터 유래된 이러한 프로모터의 예에는 2-성분 시스템((PhoP-PhoR, DegU-DegS, Spo0A-Phosphorelay), LevR, Mry 및 GltC가 포함되나 이들로 한정되지 않는다. (ii) 이차 시그마 인자의 생성은 주로 특정 프로모터로부터의 전사를 책임질 수 있다. 그람 양성 미생물로부터의 예에는 하기 포자형성 특이적 시그마 인자들에 의해 활성화되는 프로모터들이 포함되나 이들로 한정되지 않는다: σF, σE, σG 및 σK, 및 일반적인 스트레스 시그마 인자인 σB. σB 매개 반응은 에너지 제한 및 환경 스트레스에 의해 유도된다(Hecker M, Volker U. Mol Microbiol. 1998; 29(5):1129-1136). (iii) 약화(Attenuation) 및 항종결(antitermination)도 전사를 조절한다. 그람 양성 미생물로부터의 예에는 trp 오페론 및 sacB 유전자가 포함되나 이들로 한정되지 않는다. (iv) 발현 벡터 내의 다른 조절 프로모터는 수크로스 유도성을 부여하는 sacR 조절 시스템에 근거한다(Klier AF, Rapoport G. Annu Rev Microbiol. 1988;42:65-95).
세균, 예컨대, 바실러스에서 유용한 적합한 유도성 프로모터는 그람 양성 미생물로부터 유래된 프로모터, 예컨대, SP01-26, SP01-15, veg, pyc(피루베이트 카복실라제 프로모터) 및 amyE(그러나 이들로 한정되지 않음)를 포함한다. 그람 음성 미생물로부터 유래된 프로모터의 예에는 tac, tet, trp-tet, lpp, lac, lpp-lac, lacIq, T7, T5, T3, gal, trc, ara, SP6, λ-PR 및 λ-PL이 포함되나 이들로 한정되지 않는다.
세균 세포, 예컨대, 바실러스에서 유용한 프로모터의 추가 예에는 α-아밀라제 및 SPo2 프로모터뿐만 아니라 세포외 프로테아제 유전자로부터의 프로모터도 포함된다.
적합한 프로모터의 또 다른 예는 에스케리키아 콜라이 lac 오페론으로부터 수득된 프로모터이다. 또 다른 예는 스트렙토마이세스 코엘리칼라(Streptomyces coelicolor) 아가라제(agarase) 유전자(dagA)의 프로모터이다. 또 다른 예는 바실러스 렌터스(Bacillus lentus) 알칼리성 프로테아제 유전자(aprH)의 프로모터이다. 또 다른 예는 바실러스 리체니포르미스(Bacillus licheniformis) 알칼리성 프로테아제 유전자(서브틸리신 칼스버그(subtilisin Carlsberg) 유전자)의 프로모터이다. 또 다른 예는 바실러스 서브틸리스(Bacillus subtilis) 레반수크라제(levansucrase) 유전자(sacB)의 프로모터이다. 또 다른 예는 바실러스 서브틸리스 α-아밀라제 유전자(amyF)의 프로모터이다. 또 다른 예는 바실러스 리체니포르미스 α-아밀라제 유전자(amyL)의 프로모터이다. 또 다른 예는 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 말토스생성 아밀라제 유전자(amyM)의 프로모터이다. 또 다른 예는 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) α-아밀라제 유전자(amyQ)의 프로모터이다. 또 다른 예는 "-35" 영역에 대해 서열 TTGACA 및 "-10" 영역에 대해 TATAAT를 갖는 "컨센서스" 프로모터이다. 또 다른 예는 바실러스 리체니포르미스 페니실리나제(penicillinase) 유전자(penP)의 프로모터이다. 또 다른 예는 바실러스 서브틸리스 xylA 및 xylB 유전자의 프로모터이다.
바람직하게는, 프로모터 서열은 고도로 발현되는 유전자의 프로모터 서열이다. 프로모터가 선택될 수 있고/있거나 발현 구축물의 삽입을 위해 바람직한 예정된 표적 좌위에 포함되는 바람직한 고도로 발현되는 유전자의 예에는 해당 효소, 예컨대, 트라이오스 포스페이트 이소머라제(TPI), 글리세르알데하이드 포스페이트 데하이드로게나제(GAPDH), 포스포글리세레이트 키나제(PGK), 피루베이트 키나제(PYK 또는 PKI) 및 알코올 데하이드로게나제(ADH)를 코딩하는 유전자뿐만 아니라, 아밀라제, 글루코아밀라제, 프로테아제, 자일라나제, 셀로바이오하이드롤라제, β-갈락토시다제 및 알코올(메탄올) 옥시다제, 연장 인자 및 리보좀 단백질을 코딩하는 유전자도 포함되나 이들로 한정되지 않는다. 적합한 고도로 발현되는 유전자의 구체적인 예에는 예를 들면, 클루이베로마이세스 종으로부터의 LAC4 유전자, 한세눌라(Hansenula) 및 피키아(Pichia)로부터의 메탄올 옥시다제 유전자(각각 AOX 및 MOX), 아스퍼길러스 니게르 및 아스퍼길러스 아와모리로부터의 글루코아밀라제(glaA) 유전자, 아스퍼길러스 오리자 TAKA-아밀라제 유전자, 아스퍼길러스 니둘란스 gpdA 유전자 및 트라이코데르마 리세이 셀로바이오하이드롤라제 유전자가 포함된다.
효모에서 사용될 수 있는 프로모터는 예를 들면, 해당효소 유전자로부터의 프로모터, 예컨대, 효모 또는 사상 진균으로부터의 포스포프럭토키나제(PFK), 트라이오스 포스페이트 이소머라제(TPI), 글리세르알데하이드-3-포스페이트 데하이드로게나제(GPD, TDH3 또는 GAPDH), 피루베이트 키나제(PYK) 및 포스포글리세레이트 키나제(PGK) 프로모터를 포함하고; 효모로부터의 이러한 프로모터에 대한 보다 더 상세한 설명은 국제 특허출원 공개 제WO1993/03159호에서 발견될 수 있다. 다른 유용한 프로모터는 리보좀 단백질 코딩 유전자 프로모터, 락타제 유전자 프로모터(LAC4), 알코올 데하이드로게나제 프로모터(ADH1, ADH4 등), 및 에놀라제(enolase) 프로모터(ENO)이다. 다른 항시성 프로모터 및 유도성 프로모터, 및 인핸서 또는 업스트림 활성화 서열은 당업자에게 공지되어 있을 것이다. 본 발명의 숙주 세포에서 사용되는 프로모터는 원하는 경우 그의 조절 특성에 영향을 미치도록 변경될 수 있다. 이와 관련하여 적합한 프로모터는 당업자에게 잘 공지되어 있는 항시성 천연 프로모터 및 유도성 천연 프로모터 둘다뿐만 아니라 조작된 프로모터도 포함한다. 진핵 숙주 세포에서 적합한 프로모터는 GAL7, GAL10, GAL1, CYC1, HIS3, ADH1, PGL, PH05, GAPDH, ADC1, TRP1, URA3, LEU2, ENO1, TPI1 및 AOX1일 수 있다. 다른 적합한 프로모터는 PDC1, GPD1, PGK1, TEF1 및 TDH3을 포함한다. 사용될 수 있는 탄수화물 유도성 프로모터의 예는 GAL 프로모터, 예컨대, GAL1 또는 GAL10 프로모터이다.
전술된 프로모터들 전부가 당분야에서 용이하게 입수될 수 있다.
고등 진핵생물에 의한 본 발명의 폴리펩티드를 코딩하는 DNA의 전사는 인핸서 서열을 벡터 내로 삽입함으로써 증가될 수 있다. 인핸서는 주어진 종류의 숙주 세포에서 프로모터의 전사 활성을 증가시키는 작용을 하는, 통상적으로 약 10 bp 내지 300 bp의 시스-작용 DNA 요소이다. 인핸서의 예에는 100 bp 내지 270 bp에서 복제기점의 뒤쪽에 위치하는 SV40 인핸서, 사이토메갈로바이러스 초기 프로모터 인핸서, 복제기점의 뒤쪽에 위치하는 폴리오마 인핸서 및 아데노바이러스 인핸서가 포함된다.
조절 서열은 사상 진균 세포에 의해 인식되어 전사를 종결하는 서열인 적합한 전사 종결요소 서열일 수도 있다. 종결요소 서열은 폴리펩티드를 코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 세포에서 작용하는 임의의 종결요소가 본 발명에서 사용될 수 있다.
조절 서열은 종결요소일 수도 있다. 사상 진균 세포에 바람직한 종결요소는 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니게르 글루코아밀라제(glaA), 아스퍼길러스 니둘란스 안쓰라닐레이트 신타제, 아스퍼길러스 니게르 α-글루코시다제, trpC 유전자 및 푸사리움 옥시스포룸 트립신 유사 프로테아제를 코딩하는 유전자로부터 수득된다.
조절 서열은 사상 진균 세포에 의해 번역에 중요한 mRNA의 비-번역된 영역인 적합한 리더 서열도 포함할 수 있다. 리더 서열은 폴리펩티드를 코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 세포에서 작용하는 임의의 리더 서열은 본 발명에서 사용될 수 있다. 사상 진균 세포에 바람직한 리더는 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니둘란스 트라이오스 포스페이트 이소머라제 및 아스퍼길러스 니게르 glaA를 코딩하는 유전자로부터 수득된다. 다른 바람직한 서열은 국제 특허출원 공개 제WO2006/077258호에서 단리되어 있고/있거나 개시되어 있다.
다른 조절 서열은 페니실리움 IPNS 유전자, pcbC 유전자 또는 β 튜불린 유전자로부터 단리될 수 있다. 국제 특허출원 공개 제WO2001/21779호에서 언급된 모든 조절 서열들이 본원에 참고로 도입된다.
조절 서열은 핵산 서열의 3' 말단에 작동가능하게 연결되고 전사될 때 폴리아데노신 잔기를 전사된 mRNA에 추가하는 신호로서 사상 진균 세포에 의해 인식되는 서열인 폴리아데닐화 서열일 수도 있다. 세포에서 작용하는 임의의 폴리아데닐화 서열이 본 발명에서 사용될 수 있다. 사상 진균 세포에 바람직한 폴리아데닐화 서열은 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니게르 글루코아밀라제, 아스퍼길러스 니둘란스 안쓰라닐레이트 신타제, 푸사리움 옥시스포룸 트립신 유사 프로테아제 및 아스퍼길러스 니게르 α-글루코시다제를 코딩하는 유전자로부터 수득된다.
본 발명에 따른 폴리펩티드가 숙주 세포로부터 배양 배지 내로 분비되어야 할 때, 새로 합성된 폴리펩티드가 숙주 세포의 분비 경로로 향하게 하기 위해 적절한 신호 서열이 폴리펩티드에 추가될 수 있다. 당업자는 특정 숙주에 적합한 신호 서열을 선택해야 하는 것을 인식하고 있다. 신호 서열은 숙주 세포에 대한 천연 신호 서열일 수 있거나, 숙주 세포에 대한 외래 신호 서열일 수 있다. 한 예로서, 숙주 세포에 대한 천연 단백질로부터의 신호 서열이 사용될 수 있다. 바람직하게는, 상기 천연 단백질은 고도로 분비되는 단백질, 즉 분비되는 단백질의 총량의 10%보다 더 높은 양으로 분비되는 단백질이다. 본 발명에 따라 바람직하게 사용되는 신호 서열은 예를 들면, pmeA이다.
신호 서열에 대한 대체물로서, 본 발명의 폴리펩티드는 분비되는 담체 단백질 또는 이의 일부에 융합될 수 있다. 이러한 키메라 구축물은 상기 담체 단백질의 신호 서열 또는 이의 일부에 의해 분비 경로로 향한다. 또한, 담체 단백질은 본 발명에 따른 폴리펩티드에게 안정화 효과를 제공할 것이고/것이거나 가용성을 향상시킬 수 있다. 이러한 담체 단백질은 임의의 단백질일 수 있다. 바람직하게는, 고도로 분비되는 단백질은 담체 단백질로서 사용된다. 담체 단백질은 본 발명에 따른 폴리펩티드에 대한 천연 또는 외래 담체 단백질일 수 있다. 담체 단백질은 숙주 세포에 대한 천연 또는 외래 담체 단백질일 수 있다. 이러한 담체 단백질의 예는 글루코아밀라제, α-교배 인자의 예비전구 서열, 클로스트리듐 셀룰로보란스(Clostridium cellulovorans) 셀룰로스 결합 단백질 A의 셀룰로스 결합 도메인, 글루타티온 S-트랜스퍼라제, 바실러스 서큘란스(Bacillus circulans) 키티나제(chitinase) A1의 키틴 결합 도메인, 에스케리키아 콜라이 K12의 malE 유전자에 의해 코딩된 말토스 결합 도메인, β-갈락토시다제 및 알칼리성 포스파타제이다. 아스퍼길러스 세포에서의 이러한 키메라 구축물의 발현에 바람직한 담체 단백질은 글루코아밀라제이다. 담체 단백질 및 본 발명에 따른 폴리펩티드는 폴리펩티드의 단리를 용이하게 하기 위한 특정 아미노산 모티프를 함유할 수 있고; 본 발명에 따른 폴리펩티드는 특별한 방출제에 의해 방출될 수 있다. 방출제는 단백질용해 효소 또는 화학 물질일 수 있다. 이러한 아미노산 모티프의 한 예는 당업자에게 잘 공지되어 있는 KEX 프로테아제 절단 부위이다.
신호 서열은 본 발명의 단백질 또는 폴리펩티드의 분비 및 단리를 용이하게 하기 위해 사용될 수 있다. 신호 서열은 전형적으로 하나 이상의 절단 사건에서 분비 동안 성숙 단백질로부터 일반적으로 절단되는 소수성 아미노산의 코어를 특징으로 한다. 이러한 신호 펩티드는 이것이 분비 경로를 통과할 때 성숙 단백질로부터의 신호 서열의 절단을 허용하는 프로세싱 부위를 함유한다. 신호 서열은 예컨대, 발현 벡터로 형질전환된 진핵 숙주로부터의 단백질의 분비를 유도하고, 신호 서열은 후속적으로 또는 동시에 절단된다. 그 다음, 단백질은 공지되어 있는 방법에 의해 세포외 매질로부터 용이하게 정제될 수 있다. 대안적으로, 신호 서열은 정제를 용이하게 하는 서열, 예컨대, GST 도메인의 사용을 통해 관심있는 단백질에 연결될 수 있다. 따라서, 예를 들면, 폴리펩티드를 코딩하는 서열은 마커 서열, 예컨대, 융합된 폴리펩티드의 정제를 용이하게 하는 펩티드를 코딩하는 서열에 융합될 수 있다. 본 발명의 이 양태의 일부 바람직한 실시양태에서, 마커 서열은 헥사-히스티딘 펩티드, 예컨대, pQE 벡터(퀴아젠 인코포레이티드(Qiagen, Inc.)) 내에 제공된 태그이고, 특히 이들 중 대다수는 상업저으로 입수가능하다. 문헌(Gentz et al., Proc. Natl. Acad. Sci. USA 86: 821-824(1989))에 기재된 바와 같이, 예를 들면, 헥사-히스티딘은 융합 단백질의 편리한 정제를 제공한다. HA 태그는 예를 들면, 문헌(Wilson et al., Cell 37:767 (1984))에 기재되어 있는 인플루엔자 헤마글루티닌(hemaglutinin) 단백질로부터 유래된 에피토프에 상응하는, 정제에 유용한 또 다른 펩티드이다.
바람직하게는, 본 발명의 Temer09484 융합 단백질은 표준 재조합 DNA 기법에 의해 제조된다. 예를 들면, 상이한 폴리펩티드 서열들을 코딩하는 DNA 단편들은 보편적인 기법에 따라, 예를 들면, 결찰을 위한 블런트(blunt)-종결 또는 스태거(stagger)-종결 말단, 적절한 말단을 제공하기 위한 제한효소 분해, 적절한 경우 점착(cohesive) 말단들의 충전, 바람직하지 않은 연결을 피하기 위한 알칼리성 포스파타제(phosphatase) 처리 및 효소에 의한 결찰을 이용함으로써 인-프레임(in-frame)으로 함께 결찰된다. 또 다른 실시양태에서, 융합 유전자는 자동 DNA 합성기를 비롯한 보편적인 기법에 의해 합성될 수 있다. 대안적으로, 유전자 단편의 PCR 증폭은 후속적으로 어닐링되고 재증폭되어 키메라 유전자 서열을 생성할 수 있는 2개의 연속 유전자 단편들 사이에 상보적 돌출부(overhangs)를 발생시키는 앵커(anchor) 프라이머를 사용함으로써 수행될 수 있다(예를 들면, 문헌(Current Protocols in Molecular Biology, eds. Ausubel et al. John Wiley & Sons: 1992) 참조). 나아가, 융합 모이어티(예를 들면, GST 폴리펩티드)를 이미 코딩하는 많은 발현 벡터들이 상업적으로 입수가능하다. Temer09484 코딩 핵산은 융합 모이어티가 Temer09484 단백질에 인-프레임으로 연결되도록 이러한 발현 벡터 내로 클로닝될 수 있다.
(과다)발현
바람직한 실시양태에서, 본원에 기재된 본 발명의 폴리뉴클레오티드는 이 유전자가 과다발현되지 않는 모 미생물 균주에 비해 본 발명의 미생물 균주에서 과다발현될 수 있다. 본원에서 폴리뉴클레오티드 서열의 과다발현은 미생물 균주에서 상기 서열에 의해 코딩된 효소의 활성이 모 미생물에서의 상기 효소의 활성의 약 1.5배 이상이 되게 하는 상기 서열 유전자의 발현으로서 정의되고; 바람직하게는 상기 효소의 활성은 모 미생물에서의 상기 효소의 활성의 약 2배 이상, 보다 바람직하게는 약 3배 이상, 보다 바람직하게는 약 4배 이상, 보다 바람직하게는 약 5배 이상, 훨씬 더 바람직하게는 약 10배 이상, 가장 바람직하게는 약 20배 이상이다.
벡터는 진핵생물 게놈 서열 또는 바이러스 게놈 서열에 대한 상동성을 갖는 서열을 포함하는 RNA를 생성하는 폴리뉴클레오티드를 플랭킹하는 서열을 추가로 포함할 수 있다. 이것은 본 발명의 폴리뉴클레오티드가 숙주 세포의 게놈 내로 도입될 수 있게 할 것이다.
삽입 클로닝 벡터는 그 자신이 삽입되는 숙주 세포의 염색체 내의 무작위 좌위 또는 예정된 표적 좌위에서 삽입될 수 있다. 본 발명의 바람직한 실시양태에서, 삽입 클로닝 벡터는 예정된 좌위에서의 클로닝 벡터의 삽입을 표적화하기 위해 숙주 세포의 게놈 내의 예정된 표적 좌위에 있는 DNA 서열에 대한 상동성을 갖는 DNA 단편을 포함할 수 있다. 표적화된 삽입을 촉진하기 위해, 클로닝 벡터는 바람직하게는 숙주 세포의 형질전환 전에 선형화될 수 있다. 선형화는 바람직하게는 클로닝 벡터의 하나 이상의 말단, 바람직하게는 어느 한 말단이 표적 좌위에 대한 상동성을 갖는 서열에 의해 플랭킹되도록 수행될 수 있다. 표적 좌위를 플랭킹하는 상동성 서열의 길이는 바람직하게는 약 0.1 kb 이상, 예컨대, 약 0.2 kb 이상, 보다 바람직하게는 약 0.5 kb 이상, 훨씬 더 바람직하게는 약 1 kb 이상, 가장 바람직하게는 약 2 kb 이상이다. 바람직하게는, 모 숙주 균주는 국제 특허출원 공개 제WO2005/095624호 및/또는 국제 특허출원 공개 제WO2007/115886호에 기재된 바와 같이 표적화된 DNA 삽입의 개선된 빈도를 위해 변경될 수 있다.
본 발명에서 제공된 결실 예는 프로모터와 유전자 사이에 선택 마커를 삽입하여 유전자 전사를 방해하기(즉, 기능적으로 불활성화시키기) 위해 유전자의 프로모터를 5'-플랭크로서 사용하고 유전자를 3'-플랭크로서 사용한다. 상기 제공된 유전자 서열은 유사한 기능적으로 불활성화된 유전자를 제조하는 데에 사용될 수 있다. 유전자는 2개로 분할되어 5'-플랭크 및 3'-플랭크를 생성할 수 있으나, 유전자는 5'-플랭크 및 3'-플랭크로서 작용할 수 있는, 유전자의 프로모터 및 종결요소 영역을 함유하는 보다 더 큰 게놈 DNA 조각을 클로닝하는 데에 사용될 수도 있다.
벡터 시스템은 단일 벡터, 예컨대, 단일 플라스미드일 수 있거나, 숙주 세포의 게놈 내로 도입될 전체 DNA를 함께 함유하는 2개 이상의 벡터, 예컨대, 2개 이상의 플라스미드일 수 있다.
벡터는 안티센스 RNA의 생성을 제공하도록 안티센스 방향으로 배향된 본 발명의 폴리뉴클레오티드를 함유할 수 있다.
벡터 DNA는 보편적인 형질전환 또는 형질감염 기법을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 본원에서 사용된 바와 같이, 용어 "형질전환" 및 "형질감염"은 칼슘 포스페이트 또는 칼슘 클로라이드 공-침전, DEAE-덱스트란 매개 형질감염, 형질도입, 감염, 지질감염, 양이온성 지질 매개 형질감염 또는 전기천공을 비롯한, 외래 핵산(예를 들면, DNA)을 숙주 세포 내로 도입하는 당분야에서 인정된 다양한 기법들을 지칭하기 위한 것이다. 숙주 세포를 형질전환시키거나 형질감염시키는 적합한 방법은 문헌(Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd,ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), 문헌(Davis et al., Basic Methods in Molecular Biology (1986)) 및 다른 실험실 매뉴얼에서 발견될 수 있다.
당업자는 세포를 하나 이상의 발현 카세트 및 선택 마커로 형질전환시키는 방법을 알고 있다. 예를 들면, 당업자는 하나 이상의 발현 벡터를 사용할 수 있고, 이때 하나 이상의 클로닝 벡터는 발현 카세트 및 선택 마커를 포함한다.
돌연변이체 미생물 숙주 세포의 형질전환은 예를 들면, 전기천공 방법, 입자 충격 또는 미립자가속장치(microprojectile) 충격, 프로토플라스트(protoplast) 방법 및 아그로박테리움(Agrobacterium) 매개 형질전환(AMT)을 비롯한 임의의 적합한 공지되어 있는 방법에 의해 수행될 수 있다. 바람직하게는, 프로토플라스트 방법이 이용된다. 형질전환을 위한 절차는 문헌(J.R.S. Fincham, Transformation in fungi. 1989, Microbiological reviews. 53, 148-170)에 기재되어 있다.
형질전환은 프로토플라스트 형성, 프로토플라스트의 형질전환 및 그 자체로 공지되어 있는 방식에 의한 세포벽의 재생으로 구성된 과정을 포함할 수 있다. 아스퍼길러스 세포의 형질전환에 적합한 절차는 유럽 특허 제238 023호 및 문헌(Yelton et al., 1984, Proceedings of the National Academy of Sciences USA 81:1470-1474)에 기재되어 있다. 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)를 사용하는 아스퍼길러스 및 다른 사상 진균 숙주 세포의 형질전환에 적합한 절차는 예를 들면, 문헌(De Groot et al., Agrobacterium tumefaciens-mediated transformation of filamentous fungi. Nat Biotechnol. 1998, 16:839-842. Erratum in: Nat Biotechnol 1998 16:1074)에 기재되어 있다. 푸사리움 종을 형질전환시키는 적합한 방법은 문헌(Malardier et al., 1989, Gene 78:147-156) 또는 국제 특허출원 공개 제WO1996/00787호에 기재되어 있다. 다른 방법, 예컨대, 문헌(Christiansen et al., Biolistic transformation of the obligate plant pathogenic fungus, Erysiphe graminis f.sp. hordei. 1995, Curr Genet. 29:100-102)에 기재된 바이올리스틱(biolistic) 형질전환을 이용하는 방법이 적용될 수 있다. 효모는 문헌(Becker and Guarente, In Abelson, J. N. and Simon, M. I., editors, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, pp 182-187, Academic Press, Inc., New York); 문헌(Ito et al., 1983, Journal of Bacteriology 153: 163); 및 문헌(Hinnen et al., 1978, Proceedings of the National Academy of Sciences USA 75: 1920)에 기재된 절차를 이용함으로써 형질전환될 수 있다.
돌연변이된 미생물 숙주 세포에서 관심있는 화합물을 코딩하거나 세포에 의한 관심있는 화합물의 생성에 관여하는 화합물을 코딩하는 폴리뉴클레오티드(유전자)의 카피의 양을 향상시키기 위해, 숙주 세포의 다회 형질전환이 요구될 수 있다. 이 방식으로, 숙주 세포에 의해 생성되는 상이한 효소들의 비가 영향을 받을 수 있다. 또한, 발현 벡터는 형질전환될 폴리뉴클레오티드의 카피의 양을 증가시키기 위해 다수의 발현 카세트를 포함할 수 있다.
또 다른 방법은 선택에 따라 원하는 폴리펩티드의 보다 더 높은 또는 보다 더 낮은 생성을 야기할 수 있는, 상이한 폴리뉴클레오티드들에 대한 상이한 조절 서열들을 선택하는 것일 수 있다.
선택 마커로 형질전환된 세포는 선택 마커의 존재에 근거하여 선택될 수 있다. (아스퍼길러스) 세포의 형질전환의 경우, 통상적으로 세포가 동시에 모든 핵산 물질로 형질전환되는 경우, 선택 마커가 존재할 때 원하는 폴리펩티드를 코딩하는 폴리뉴클레오티드도 존재한다.
포유동물 세포의 안정한 형질감염의 경우, 이용되는 발현 벡터 및 형질감염 기법에 따라 단지 극소량의 세포가 외래 DNA를 그의 게놈 내로 삽입할 수 있다는 것은 공지되어 있다. 이 삽입체를 확인하고 선택하기 위해, 선택 마커(예를 들면, 항생제에 대한 내성)를 코딩하는 유전자를 일반적으로 관심있는 유전자와 함께 숙주 세포 내로 도입한다. 바람직한 선택 마커는 약물에 대한 내성을 부여하거나 숙주 세포에서 결함을 보완하는 선택 마커들을 포함하나 이들로 한정되지 않는다. 이러한 선택 마커는 예를 들면, 대다수의 사상 진균 및 효모의 형질전환에 사용될 수 있는 다재다능한 마커 유전자, 예컨대, 아세트아미다제 유전자 또는 cDNA(아스퍼길러스 니둘란스, 아스퍼길러스 오리자 또는 아스퍼길러스 니게르로부터의 amdS, niaD, facA 유전자 또는 cDNA); 또는 항생제에 대한 내성, 예컨대, G418, 하이그로마이신, 블레오마이신, 카나마이신, 메토트렉세이트 또는 플레오마이신 오르베노밀(phleomycin orbenomyl)(benA) 내성을 제공하는 유전자를 포함한다. 대안적으로, 특정 선택 마커, 예컨대, 상응하는 돌연변이체 숙주 균주를 요구하는 영양요구성 마커, 예를 들면, (사카로마이세스 세레비지애(S. cerevisiae)로부터의) URA3(또는 다른 효모의 유사한 유전자), (아스퍼길러스 니둘란스 또는 아스퍼길러스 니게르부터의) pyrG 또는 pyrA, (아스퍼길러스 니둘란스 또는 아스퍼길러스 니게르부터의) argB, 또는 trpC가 사용될 수 있다. 바람직한 실시양태에서, 선택 마커는 선택 마커 유전자를 갖지 않는 폴리펩티드를 생성할 수 있는 형질전환된 숙주 세포를 수득하기 위해 발현 구축물의 도입 후 형질전환된 숙주 세포로부터 결실된다.
다른 마커는 ATP 신쎄타제, 서브유닛 9(oliC), 오로티딘(orotidine)-5'-포스페이트 데카복실라제(decarboxylase)(pvrA), 세균 G418 내성 유전자(이것은 효모에서도 사용될 수 있으나 진균에서는 사용될 수 없음), 앰피실린 내성 유전자(에스케리키아 콜라이), 네오마이신 내성 유전자(바실러스) 및 β-글루쿠로니다제(GUS)를 코딩하는 에스케리키아 콜라이 uidA 유전자를 포함한다. 벡터는 예를 들면, RNA의 생성을 위해 시험관내에서 사용될 수 있거나, 숙주 세포를 형질감염시키거나 형질전환시키기 위해 사용될 수 있다.
원핵생물에서의 단백질의 발현은 종종 융합 또는 비-융합 단백질의 발현을 유도하는 항시성 또는 유도성 프로모터를 함유하는 벡터를 사용함으로써 에스케리키아 콜라이에서 수행된다. 융합 벡터는 다수의 아미노산들을 그 내에 코딩된 단백질, 예를 들면, 재조합 단백질의 아미노 말단에 추가한다. 이러한 융합 벡터는 전형적으로 3가지 목적에 기여한다: 1) 재조합 단백질의 발현을 증가시키는 것; 2) 재조합 단백질의 가용성을 증가시키는 것; 및 3) 친화성 정제에서 리간드로서 작용함으로써 재조합 단백질의 정제에 도움을 주는 것. 종종, 융합 발현 벡터에서 단백질용해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부(junction)에 도입되어 융합 단백질의 정제 후 융합 모이어티로부터의 재조합 단백질의 분리를 가능하게 한다.
표시된 바와 같이, 발현 벡터는 바람직하게는 선택 마커를 함유할 것이다. 이러한 마커는 진핵 세포 배양을 위한 다이하이드로폴레이트 리덕타제 또는 네오마이신 내성, 및 에스케리키아 콜라이 및 다른 세균에서의 배양을 위한 테트라사이클린 또는 앰피실린 내성을 포함한다.
세균에서 사용되기에 바람직한 벡터는 예를 들면, 본원에 참고로 도입되는 국제 특허출원 공개 제WO2004/074468(A1)호에 개시되어 있다. 다른 적합한 벡터는 당업자에게 용이하게 자명할 것이다.
번역된 단백질이 소포체(endoplasmic reticulum)의 내강, 세포질주변 공간 또는 세포외 환경으로 분비되기 위해, 적절한 분비 신호가 발현된 폴리펩티드 내로 도입될 수 있다. 신호는 폴리펩티드에 내재할 수 있거나 폴리펩티드에 대한 이종 신호일 수 있다.
Temer09484 폴리펩티드는 변경된 형태, 예컨대, 융합 단백질로서 발현될 수 있고, 분비 신호뿐만 아니라 추가 이종 기능성 영역도 포함할 수 있다. 따라서, 예를 들면, 추가 아미노산, 특히 하전된 아미노산의 영역이 폴리펩티드의 N-말단에 추가되어 정제 동안 또는 후속 취급 및 저장 동안 숙주 세포에서 안정성 및 지속성을 개선할 수 있다. 또한, 펩티드 모이어티는 정제를 용이하게 하기 위해 폴리펩티드에 추가될 수 있다.
본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 아미노산 서열; 또는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 폴리뉴클레오티드를 적절한 숙주에서 발현시킴으로써 수득될 수 있는 아미노산 서열을 갖는 단리된 폴리펩티드를 제공한다. 또한, 상기 폴리펩티드의 변이체, 예컨대, 기능성 균등물을 포함하는 펩티드 또는 폴리펩티드도 본 발명 내에 포함된다. 상기 폴리펩티드들은 용어 "본 발명에 따른 폴리펩티드" 내에 집합적으로 포함된다.
본원에서 용어 "변이체 펩티드" 또는 "변이체 폴리펩티드"는 각각 펩티드 또는 폴리펩티드 내의 하나 이상의 특정 위치에서 하나 이상의 특정 아미노산 잔기의 하나 이상의 변경, 예컨대, 치환, 삽입, 결실 및/또는 절두를 포함하는 각각 펩티드 또는 폴리펩티드로서 정의된다. 따라서, 변이체 신호 펩티드는 신호 펩티드 내의 하나 이상의 특정 위치에서 하나 이상의 특정 아미노산 잔기의 하나 이상의 변경, 예컨대, 치환, 삽입, 결실 및/또는 절두를 포함하는 신호 펩티드이다.
용어 "폴리뉴클레오티드"는 용어 "핵산 분자"와 동일하고 본원에서 상호교환적으로 읽힐 수 있다. 상기 용어는 단일 가닥 또는 이중 가닥 리보핵산(RNA) 또는 데옥시리보핵산(DNA) 분자인 폴리뉴클레오티드 분자를 지칭한다. 폴리뉴클레오티드는 단리된 형태로 존재할 수 있거나, 재조합 핵산 분자 또는 벡터 내에 포함될 수 있거나, 숙주 세포 내에 포함될 수 있다.
본원에서 용어 "변이체 폴리뉴클레오티드"는 폴리뉴클레오티드 내의 하나 이상의 특정 위치에서 하나 이상의 뉴클레오티드의 하나 이상의 변경, 예컨대, 치환, 삽입, 결실 및/또는 절두를 포함하는 폴리뉴클레오티드로서 정의된다.
용어 "펩티드" 및 "올리고펩티드"는 (통상적으로 인식되는 바와 같이) 동의어로 간주되고, 문맥이 요구할 때 각각의 용어는 펩티딜 연결에 의해 커플링된 2개 이상의 아미노산들로 구성된 쇄를 표시하기 위해 상호교환적으로 사용될 수 있다. 본원에서 용어 "폴리펩티드"는 7개 초과의 아미노산 잔기를 함유하는 쇄에 대해 사용된다. 본원에서 모든 올리고펩티드 및 폴리펩티드 식 및 서열은 아미노 말단부터 카복시 말단 방향으로 좌측부터 우측으로 기재되어 있다. 본원에서 사용된 아미노산의 1-문자 코드는 당분야에서 통상적으로 공지되어 있고 문헌(Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd,ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에서 발견될 수 있다.
"단리된" 폴리펩티드 또는 단백질은 그의 천연 환경으로부터 제거된 폴리펩티드 또는 단백질을 의미한다. 예를 들면, 숙주 세포에서 발현된 재조합적으로 제조된 폴리펩티드 및 단백질은 임의의 적합한 기법, 예를 들면, 문헌(Smith and Johnson, Gene 67:31-40 (1988))에 개시된 단일 단계 정제 방법에 의해 실질적으로 정제된 천연 또는 재조합 폴리펩티드이기 때문에 본 발명의 목적상 단리된 것으로 간주된다.
본 발명에 따른 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질은 당분야에서 공지되어 있는 방법에 의해 재조합 세포 배양물로부터 회수될 수 있고 정제될 수 있다. 가장 바람직하게는, 고성능 액체 크로마토그래피("HPLC")가 정제를 위해 이용된다.
본 발명의 폴리펩티드는 천연적으로 정제된 생성물, 화학적 합성 절차의 생성물, 및 예를 들면, 세균, 효모, 고등 식물, 곤충 및 포유동물 세포를 비롯한 원핵 또는 진핵 숙주로부터 재조합 기법에 의해 제조된 생성물을 포함한다. 재조합 제조 절차에서 사용된 숙주에 따라, 본 발명의 폴리펩티드는 글리코실화될 수 있거나 글리코실화되지 않을 수 있다. 추가로, 본 발명의 폴리펩티드는 일부 경우 숙주 매개 과정의 결과로서 변경된 첫번째 메티오닌 잔기도 포함할 수 있다.
본 발명은 본 발명에 따른 폴리펩티드의 생물학적 활성 단편도 특징으로 한다.
본 발명의 폴리펩티드의 생물학적 활성 단편은 전체 길이 단백질보다 더 적은 수의 아미노산을 포함하되 상응하는 전체 길이 단백질의 하나 이상의 생물학적 활성을 나타내는, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 아미노산 서열(예를 들면, 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열)과 충분히 동일한 또는 이러한 아미노산 서열로부터 유도된 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 전형적으로. 생물학적 활성 단편은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 하나 이상의 활성을 갖는 도메인 또는 모티프를 포함한다.
본 발명의 단백질의 생물학적 활성 단편은 예를 들면, 약 10개, 약 25개, 약 50개 또는 약 100개 이상의 아미노산 길이, 약 100개 이상의 아미노산, 150개, 200개, 250개, 300개, 350개 또는 400개 이상의 아미노산 길이, 또는 본 발명의 폴리펩티드의 아미노산의 총 수에 해당하는 길이를 갖는 폴리펩티드일 수 있다.
나아가, 단백질의 다른 영역이 결실되어 있는 다른 생물학적 활성 부분은 재조합 기법에 의해 제조될 수 있고 본 발명의 폴리펩티드의 천연 형태의 생물학적 활성들 중 하나 이상의 생물학적 활성에 대해 평가될 수 있다. 본 발명은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 상기 생물학적 활성 단편을 코딩하는 핵산 단편도 특징으로 한다.
단백질
본 발명의 또 다른 양태에서, 개선된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질이 제공된다. 개선된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질은 하나 이상의 생물학적 활성이 개선된 단백질이다. 이러한 단백질은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 코딩 서열의 전부 또는 일부를 따라 돌연변이를 무작위로 도입함으로써, 예컨대, 포화 돌연변이유발에 의해 수득될 수 있고, 생성된 돌연변이체는 재조합적으로 발현될 수 있고 생물학적 활성에 대해 스크리닝될 수 있다. 예를 들면, 당분야는 본 발명의 단백질의 효소 활성을 측정하는 표준 분석을 제공하므로, 개선된 단백질은 용이하게 선택될 수 있다.
개선된 셀로바이오하이드롤라제 기능을 이끌어내는, 본 발명의 아미노산 서열의 개선된 변이체는 본 발명의 상응하는 유전자에 의해 수득될 수 있다. 이러한 변경에는 하기 변경들이 포함된다:
1. 무작위 돌연변이를 도입하기 위한 오류 유발 PCR에 이어서, 수득된 변이체의 스크리닝 및 개선된 동력학적 성질을 갖는 변이체의 단리; 및
2. 셀로바이오하이드롤라제를 코딩하는 유전자의 관련 변이체의 패밀리 셔플링(shuffling)에 이어서, 수득된 변이체의 스크리닝 및 개선된 동력학적 성질을 갖는 변이체의 단리.
보다 더 높은 표 1에 따른 활성을 야기하는 증가된 mRNA 및/또는 단백질 수준을 이끌어내는 본 발명의 유전자의 변이체는 상기 유전자의 폴리뉴클레오티드 서열에 의해 수득될 수 있다. 이러한 변경에는 하기 변경들이 포함된다:
1. 코돈이 모 미생물 숙주에 (최적으로) 적응되게 하는 방식으로 코돈 사용의 개선;
2. 코돈이 모 미생물 숙주에 (최적으로) 적응되게 하는 방식으로 코돈 쌍 사용의 개선; 및
3. 증가된 반감기를 갖는 mRNA 분자를 생성하는, 셀로바이오하이드롤라제를 코딩하는 유전 정보에의 안정화 서열의 추가.
개선된 촉매 성질 또는 증가된 mRNA 또는 단백질 수준을 갖는 변이체를 단리하는 바람직한 방법은 국제 특허출원 공개 제WO2003/010183호 및 제WO2003/01311호에 기재되어 있다. 모 미생물 균주에서 코돈 사용을 최적화하는 바람직한 방법은 국제 특허출원 제PCT/EP2007/05594호에 기재되어 있다. 본 발명의 셀로바이오하이드롤라제를 코딩하는 유전자에 안정화 요소를 추가하는 바람직한 방법은 국제 특허출원 공개 제WO2005/059149호에 기재되어 있다.
바람직한 실시양태에서, 본 발명의 단백질은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 아미노산 서열을 갖는다. 또 다른 실시양태에서, 본 발명의 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 아미노산 서열에 대한 실질적 상동성을 갖고 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 폴리펩티드의 하나 이상의 생물학적 활성을 보유하되, 기재된 바와 같이 천연 변이 또는 돌연변이유발로 인해 아미노산 서열에서 상이하다.
추가 바람직한 실시양태에서, 본 발명의 단백질은 바람직하게는 고도로 엄격한 혼성화 조건 하에서 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 따른 핵산과 혼성화할 수 있는 단리된 핵산 단편에 의해 코딩된 아미노산 서열을 갖는다.
따라서, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질 또는 본 발명의 단백질은 바람직하게는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 제시된 아미노산 서열에 대한 50% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.8% 또는 99.9% 이상의 상동성을 갖는 아미노산 서열을 포함하고 전형적으로 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 폴리펩티드의 하나 이상의 기능적 활성을 보유하는 단백질이다.
본 발명의 한 양태에 따르면, 본 발명의 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개 또는 12개의 아미노산이 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열과 상이한 아미노산 서열을 포함할 수 있고, 이때 상기 폴리펩티드는 본 발명의 폴리펩티드의 활성 또는 기능을 여전히 갖는다. 당업자는 본 발명의 폴리펩티드에서의 이들 소수 아미노산 변화가 존재할 수 있거나(예를 들면, 천연 돌연변이), 단백질 기능 또는 활성을 손실시키지 않으면서 (예를 들면, r-DNA 기술의 이용을 통해) 만들어질 수 있다. 이 돌연변이들이 폴리펩티드의 결합 도메인, 활성 부위 또는 다른 기능성 도메인에 존재하는 경우, 폴리펩티드의 성질(예를 들면, 그의 열안정성)이 변할 수 있으나, 폴리펩티드는 그의 헤미셀룰라제 활성을 유지할 수 있다. 활성 부위, 결합 도메인 또는 다른 기능성 도메인에 가깝지 않은 돌연변이가 존재하는 경우, 보다 적은 영향이 예상될 수 있다.
본 발명에 따른 단백질의 기능성 균등물도 예를 들면, 표 1에 따른 활성에 대해 본 발명의 단백질의 돌연변이체, 예를 들면, 절두 돌연변이체의 조합 라이브러리를 스크리닝함으로써 확인될 수 있다. 한 실시양태에서, 변이체의 다채로운 라이브러리는 핵산 수준에서 조합 돌연변이유발에 의해 생성된다. 변이체의 다채로운 라이브러리는 예를 들면, 잠재적 단백질 서열의 축퇴 세트가 개별 폴리펩티드로서 또는 대안적으로 보다 더 큰 융합 단백질의 세트(예를 들면, 파지 디스플레이의 경우)로서 발현될 수 있도록 효소를 사용하여 합성 올리고뉴클레오티드의 혼합물을 유전자 서열로 결찰함으로써 생성될 수 있다. 축퇴 올리고뉴클레오티드 서열로부터 본 발명의 폴리펩티드의 잠재적 변이체의 라이브러리를 생성하는 데에 이용될 수 있는 다양한 방법들이 존재한다. 축퇴 올리고뉴클레오티드를 합성하는 방법은 당분야에서 공지되어 있다(예를 들면, 문헌(Narang (1983) Tetrahedron 39:3); 문헌(Itakura et al. (1984) Annu. Rev. Biochem. 53:323); 문헌(Itakura et al. (1984) Science 198:1056); 및 문헌(Ike et al. (1983) Nucleic Acid Res. 11:477) 참조).
추가로, 본 발명의 폴리펩티드의 코딩 서열의 단편의 라이브러리는 변이체의 후속 선택을 스크리닝하기 위해 다채로운 폴리펩티드 집단을 생성하는 데에 사용될 수 있다. 예를 들면, 코딩 서열 단편의 라이브러리는 닉킹(nicking)이 분자 당 약 1회만 일어나는 조건 하에서 관심있는 코딩 서열의 이중 가닥 PCR 단편을 뉴클레아제로 처리하고 이중 가닥 DNA를 변성시키고 DNA를 재생시켜 상이한 닉킹된 생성물로부터 센스/안티센스 쌍을 포함할 수 있는 이중 가닥 DNA를 형성하고 S1 뉴클레아제로 처리하여 재형성된 이중체로부터 단일 가닥 부분을 제거하고 생성된 단편 라이브러리를 발현 벡터 내로 결찰함으로써 생성될 수 있다. 이 방법에 의해 다양한 크기의 관심있는 단백질의 N-말단 단편 및 내부 단편을 코딩하는 발현 라이브러리가 유도될 수 있다.
점 돌연변이 또는 절두에 의해 만들어진 조합 라이브러리의 유전자 생성물을 스크리닝하고 선택된 성질을 갖는 유전자 생성물에 대해 cDNA 라이브러리를 스크리닝하는 여러 기법들이 당분야에서 공지되어 있다. 큰 유전자 라이브러리를 스크리닝하는, 고처리율 분석에 적합한 가장 널리 이용되는 기법은 전형적으로 유전자 라이브러리를 복제가능한 발현 벡터 내로 클로닝하는 단계, 적절한 세포를 생성된 벡터 라이브러리로 형질전환시키는 단계, 및 원하는 활성의 검출이 검출되는 생성물의 유전자를 코딩하는 벡터의 단리를 용이하게 하는 조건 하에서 조합 유전자를 발현시키는 단계를 포함한다. 라이브러리에서 기능성 돌연변이체의 빈도를 향상시키는 기법인 반복 앙상블(ensemble) 돌연변이유발(REM)이 본 발명의 단백질의 변이체를 확인하기 위해 스크리닝 분석과 함께 이용될 수 있다(Arkin and Yourvan (1992) Proc. Natl. Acad. Sci. USA 89:7811-7815; Delgrave et al. (1993) Protein Engineering 6(3): 327-331).
서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자 서열 이외에, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 아미노산 서열의 변화를 유발할 수 있는 DNA 서열 다형성이 주어진 집단 내에 존재할 수 있다는 것은 당업자에게 자명할 것이다. 이러한 유전적 다형성은 천연 대립형질 변이로 인해 상이한 집단들로부터의 세포들 또는 한 집단 내에 존재할 수 있다. 대립형질 변이체는 기능성 균등물도 포함할 수 있다.
본 발명에 따른 폴리뉴클레오티드의 단편은 기능성 폴리펩티드를 코딩하지 않는 폴리뉴클레오티드도 포함할 수 있다. 이러한 폴리뉴클레오티드는 프로브 또는 PCR 반응용 프라이머로서 작용할 수 있다.
본 발명에 따른 핵산은 기능성 폴리펩티드를 코딩하는지 아니면 비-기능성 폴리펩티드를 코딩하는지 관계없이 혼성화 프로브 또는 중합효소 연쇄 반응(PCR) 프라이머로서 사용될 수 있다. Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 활성을 갖는 폴리펩티드를 코딩하지 않는 본 발명의 핵산 분자의 용도는 특히, (1) 예를 들면, 적합한 미생물로부터의 cDNA 라이브러리로부터 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질을 코딩하는 유전자, 또는 이의 대립형질 변이체의 단리; (2) 문헌(Verma et al., Human Chromosomes: a Manual of Basic Techniques, Pergamon Press, New York (1988))에 기재된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자의 정확한 염색체 위치를 제공하기 위한 중기 염색체 스프레드(spreads)에의 제자리 혼성화(예를 들면, FISH); (3) 특정 조직 및/또는 세포에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 mRNA의 발현을 검출하기 위한 노던 블롯 분석; 및 4) 주어진 생물학적 (예를 들면, 조직) 샘플에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 프로브에 혼성화될 수 있는 핵산의 존재를 분석하기 위한 진단 수단으로서 사용될 수 있는 프로브 및 프라이머를 포함한다.
Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자의 기능성 균등물을 수득하는 방법도 본 발명에 포함된다. 이러한 방법은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 단백질 서열 또는 이의 변이체의 전부 또는 일부를 코딩하는 단리된 핵산을 포함하는 표지된 프로브를 수득하는 단계; 프로브와 라이브러리 내의 핵산 단편의 혼성화를 허용하여 핵산 이중체를 형성하는 조건 하에서 핵산 단편 라이브러리를 상기 표지된 프로브로 스크리닝하는 단계; 및 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자와 관련된 유전자를 수득하기 위해 임의의 표지된 이중체에서 핵산 단편으로부터 전체 길이 유전자 서열을 결정하는 단계를 수반한다.
한 실시양태에서, 본 발명의 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 핵산은 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 핵산 서열 또는 이의 상보체에 대한 50% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 상동성을 갖는다.
본 발명의 폴리뉴클레오티드 또는 벡터를 포함하는 숙주 세포도 제공된다. 상기 폴리뉴클레오티드는 숙주 세포의 게놈에 대한 이종성을 가질 수 있다. 통상적으로 숙주 세포와 관련하여 용어 "이종성"은 폴리뉴클레오티드가 숙주 세포의 게놈에 천연적으로 존재하지 않거나 폴리펩티드가 그 세포에 의해 천연적으로 생성되지 않는다는 것을 의미한다.
또 다른 실시양태에서, 본 발명은 본 발명에 의해 포괄되는 핵산을 함유하는 세포, 예를 들면, 형질전환된 숙주 세포 또는 재조합 숙주 세포를 특징으로 한다. "형질전환된 세포" 또는 "재조합 세포"는 본 발명에 따른 핵산이 재조합 DNA 기법에 의해 도입되어 있는 세포(또는 이의 조상세포)이다. 원핵 세포 및 진핵 세포 둘다, 예를 들면, 세균, 진균, 효모 등이 포함되고, 사상 진균, 예컨대, 아스퍼길러스 니게르로부터의 세포가 특히 바람직하다.
삽입된 서열의 발현을 조절하거나 유전자 생성물을 특정 원하는 방식으로 변경시키고 프로세싱하는 숙주 세포가 선택될 수 있다. 단백질 생성물의 이러한 변경(예를 들면, 글리코실화) 및 프로세싱(예를 들면, 절단)은 단백질의 최적 작용을 용이하게 할 수 있다.
다양한 숙주 세포들이 단백질 및 유전자 생성물의 번역 후 프로세싱 및 변경을 위한 특징적인 특정 기작을 갖는다. 분자생물학 및/또는 미생물 분야의 숙련된 자에게 익숙한 적절한 세포주 또는 숙주 시스템은 발현되는 외래 단백질의 원하는 정확한 변경 및 프로세싱을 보장하도록 선택될 수 있다. 이를 위해, 유전자 생성물의 적절한 일차 전사체 프로세싱, 글리코실화 및 인산화를 위한 세포 기구를 보유하는 진핵 숙주 세포가 사용될 수 있다. 이러한 숙주 세포는 당분야에서 잘 공지되어 있다.
원하는 경우, 전술된 세포는 본 발명에 따른 폴리펩티드의 제조에 사용될 수 있다. 이러한 방법은 전형적으로 폴리펩티드를 코딩하는 코딩 서열의 (벡터에 의한) 발현을 제공하는 조건 하에서 (예를 들면, 전술된 바와 같이 발현 벡터로 형질전환되거나 형질감염된) 숙주 세포를 배양하는 단계, 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함한다. 본 발명의 폴리뉴클레오티드는 재조합 복제가능한 벡터, 예를 들면, 발현 벡터 내로 도입될 수 있다. 벡터는 상용가능한 숙주 세포에서 핵산을 복제하는 데에 사용될 수 있다. 따라서, 추가 실시양태에서, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고 상기 벡터를 상용가능한 숙주 세포 내로 도입하고 상기 벡터의 복제를 일으키는 조건 하에서 상기 숙주 세포를 생장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 상기 숙주 세포로부터 회수될 수 있다.
바람직하게는, 폴리펩티드는 분비 단백질로서 생성되고, 이 경우 발현 구축물에서 성숙 형태의 폴리펩티드를 코딩하는 뉴클레오티드 서열은 신호 서열을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된다. 바람직하게는, 신호 서열은 폴리펩티드를 코딩하는 뉴클레오티드 서열에 대한 천연(상동성) 신호 서열이다. 대안적으로, 신호 서열은 폴리펩티드를 코딩하는 뉴클레오티드 서열에 대한 외래(이종) 신호 서열이고, 이 경우 신호 서열은 바람직하게는 본 발명에 따른 뉴클레오티드 서열이 발현되는 숙주 세포에 내재한다. 효모 숙주 세포에 적합한 신호 서열의 예는 효모 α-인자 유전자로부터 유래된 신호 서열이다. 유사하게, 사상 진균 숙주 세포에 적합한 신호 서열은 예를 들면, 사상 진균 아밀로글루코시다제(AG) 유전자, 예를 들면, 아스퍼길러스 니게르 glaA 유전자로부터 유래된 신호 서열이다. 이것은 아밀로글루코시다제((글루코)아밀라제로서도 지칭됨) 프로모터 자체와 함께 사용될 수 있을 뿐만 아니라, 다른 프로모터와도 함께 사용될 수 있다. 하이브리드 신호 서열도 본 발명에서 사용될 수 있다.
바람직한 이종 분비 리더 서열은 진균 아밀로글루코시다제(AG) 유전자(예를 들면, 아스퍼길러스로부터의 glaA - 18개 아미노산 버전 및 24개 아미노산 버전 둘다), α-인자 유전자(효모, 예를 들면, 사카로마이세스 및 클루이베로마이세스) 또는 α-아밀라제 유전자(바실러스)로부터 유래된 분비 리더 서열이다.
벡터는 전술된 바와 같이 적합한 숙주 세포 내로 형질전환되거나 형질감염되어 본 발명의 폴리펩티드의 발현을 제공할 수 있다. 이 과정은 폴리펩티드를 코딩하는 코딩 서열의 벡터에 의한 발현을 제공하는 조건 하에서 전술된 바와 같이 발현 벡터로 형질전환된 숙주 세포를 배양하는 단계를 포함할 수 있다.
숙주 세포
따라서, 본 발명은 본 발명의 폴리뉴클레오티드 또는 벡터로 형질전환되거나 형질감염된, 또는 본 발명의 폴리뉴클레오티드 또는 벡터를 포함하는 숙주 세포를 제공한다. 바람직하게는, 폴리뉴클레오티드는 이 폴리뉴클레오티드의 복제 및 발현을 위해 벡터 내에 보유된다. 세포는 상기 벡터와 상용가능하도록 선택될 것이고, 예를 들면, 원핵(예를 들면, 세균), 진균, 효모 또는 식물 세포일 수 있다.
이종 숙주도 선택될 수 있고, 이때 본 발명의 폴리펩티드는 다른 셀룰로스 분해 또는 헤미셀룰로스 분해 효소를 실질적으로 갖지 않는 형태로 생성된다. 이것은 이러한 효소를 정상적으로 생성하지 않는 숙주를 선택함으로써 달성될 수 있다.
본 발명은 폴리펩티드를 코딩하는 DNA 서열을 재조합 발현시킴으로써 본 발명의 폴리펩티드를 제조하는 방법을 포괄한다. 이를 목적으로, 본 발명의 DNA 서열은 적합한 동종 또는 이종 숙주 세포에서 폴리펩티드의 경제적 생성을 가능하게 하기 위해 발현 신호, 예컨대, 프로모터 또는 분비 신호 서열의 유전자 증폭 및/또는 교환에 사용될 수 있다. 동종 숙주 세포는 동일한 종의 숙주 세포이거나, DNA 서열의 기원인 종과 동일한 종 내의 변이체인 숙주 세포이다.
적합한 숙주 세포는 바람직하게는 원핵 미생물, 예컨대, 세균, 보다 바람직하게는 진핵 유기체, 예를 들면, 진균, 예컨대, 효모 또는 사상 진균, 또는 식물 세포이다. 일반적으로, 효모 세포는 조작하기 더 용이하기 때문에 진균 세포에 비해 바람직하다. 그러나, 일부 단백질들은 효모로부터 잘 분비되지 않거나, 일부 경우 적절하게 프로세싱되지 않는다(예를 들면, 효모에서의 과다글리코실화). 이 경우, 진균 숙주 유기체가 선택되어야 한다.
숙주 세포는 폴리펩티드를 과다발현할 수 있고, 과다발현을 조작하는 기법은 잘 공지되어 있다. 따라서, 숙주는 코딩 폴리뉴클레오티드의 2개 이상의 카피를 가질 수 있다(이에 따라 벡터는 2개 이상의 카피를 가질 수 있다).
본 발명과 관련하여, "모 미생물 숙주 세포" 및 "돌연변이체 미생물 숙주 세포"는 임의의 종류의 숙주 세포일 수 있다. 돌연변이체 미생물 숙주 세포의 특정 실시양태는 이하에 기재되어 있다. 달리 표시되어 있지 않은 한, 돌연변이체 미생물 숙주 세포에 적용가능한 실시양태는 모 미생물 숙주 세포에도 적용될 수 있다는 것은 당업자에게 명확할 것이다.
본 발명에 따른 돌연변이체 미생물 숙주 세포는 원핵 세포일 수 있다. 바람직하게는, 원핵 숙주 세포는 세균 세포이다. 용어 "세균 세포"는 그람 음성 미생물 및 그람 양성 미생물 둘다를 포함한다. 적합한 세균은 예를 들면, 에스케리키아(Escherichia), 아나배나(Anabaena), 카울로박테르트(Caulobactert), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조비움(Rhizobium)(시노리조비움(Sinorhizobium)), 플라보박테리움(Flavobacterium), 크렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 스타필로코커스(Staphylococcus) 또는 스트렙토마세스(Streptomyces)로부터 선택될 수 있다. 바람직하게는, 세균 세포는 바실러스 서브틸리스(B. subtilis), 바실러스 아밀로리쿠에파시엔스(B. amyloliquefaciens), 바실러스 리체니포르미스(B. licheniformis), 바실러스 푼티스(B. puntis), 바실러스 메가테리움(B. megaterium), 바실러스 할로두란스(B. halodurans), 바실러스 푸밀러스(B. pumilus), 글루코노박터 옥시단스(G. oxydans), 카울로박테르트 크레센터스(Caulobactert crescentus) CB 15, 메틸로박테리움 엑토르쿠엔스(Methylobacterium extorquens), 로도박터 스패로이데스(Rhodobacter sphaeroides), 슈도모나스 제아잔티니파시엔스(Pseudomonas zeaxanthinifaciens), 파라코커스 데니트라이피칸스(Paracoccus denitrificans), 에스케리키아 콜라이(E. coli), 코리네박테리움 글루타미쿰(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토마이세스 리비단스(Streptomyces lividans), 시노리조비움 멜리오티(Sinorhizobium melioti) 및 리조비움 라디오박터(Rhizobium radiobacter)로 구성된 군으로부터 선택된다.
한 실시양태에 따르면, 본 발명에 따른 돌연변이체 미생물 숙주 세포는 진핵 숙주 세포이다. 바람직하게는, 진핵 세포는 포유동물, 곤충, 식물, 진균 또는 해조류 세포이다. 바람직한 포유동물 세포는 예를 들면, 중국 햄스터 난소(CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마를 포함한다. 바람직한 곤충 세포는 예를 들면, Sf9 및 Sf21 세포, 및 이들의 유도체를 포함한다. 보다 바람직하게는, 진핵 세포는 진균 세포, 즉 효모 세포, 예컨대, 칸디다(Candida), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 사카로마이세스(Saccharomyces), 시조사카로마이세스(Schizosaccharomyces) 또는 야로위아(Yarrowia) 균주이다. 보다 바람직하게는, 진핵 숙주 세포는 클루이베로마이세스 락티스(Kluyveromyces lactis), 사카로마이세스 세레비지애(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴라이티카(Yarrowia lipolytica) 또는 피키아 파스토리스(Pichia pastoris), 또는 사상 진균 세포이다. 가장 바람직하게는, 진핵 세포는 사상 진균 세포이다.
사상 진균은 (문헌(Hawksworth et al., In, Ainsworth and Bisby's Dictionary of The Fungi, 8th edition, 1995, CAB International, University Press, Cambridge, UK)에 의해 정의된) 유마이코타(Eumycota) 및 오마이코타(Oomycota) 아목의 모든 사상 형태들을 포함한다. 사상 진균은 키틴, 셀룰로스, 글루칸, 키토산, 만난 및 다른 복합 폴리사카라이드로 구성된 균사벽을 특징으로 한다. 양양 성장은 균사 연장에 의한 성장이고, 탄소 이화작용은 불가피하게 호기성 탄소 이화작용이다. 사상 진균 균주는 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼길러스(Aspergillus), 아우레오바시듐(Aureobasidium), 크리소스포리움(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 마이셀리오프쏘라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 패실로마이세스(Paecilomyces), 페니실리움(Penicillium), 피로마이세스(Piromyces), 파네로캐테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로마이세스(Talaromyces), 라삼소니아(Rasamsonia), 써모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium) 및 트라이코데르마(Trichoderma)의 균주들을 포함하나 이들로 한정되지 않는다.
바람직한 사상 진균 세포는 아크레모늄, 아스퍼길러스, 크리소스포리움, 마이셀리오프쏘라, 페니실리움, 탈라로마이세스, 라삼소니아, 티엘라비아, 푸사리움 또는 트라이코데르마 속의 종, 가장 바람직하게는 아스퍼길러스 니게르, 아크레모늄 알라바멘스, 아스퍼길러스 아와모리, 아스퍼길러스 포에티더스, 아스퍼길러스 소자, 아스퍼길러스 푸미가터스, 탈라로마이세스 에머소니이, 라삼소니아 에머소니이, 아스퍼길러스 오리자, 크리소스포리움 럭노웬스, 푸사리움 옥시스포룸, 마이셀리오프쏘라 써모필라, 트라이코데르마 리세이, 티엘라비아 테레스트리스 또는 페니실리움 크리소게눔의 종에 속한다. 보다 바람직한 숙주 세포는 아스퍼길러스 또는 라삼소니아 속에 속하고, 보다 바람직하게는 숙주 세포는 아스퍼길러스 니게르 또는 라삼소니아 에머소니이 종에 속한다. 본 발명에 따른 숙주 세포가 아스퍼길러스 니게르 숙주 세포인 경우, 숙주 세포는 바람직하게는 CBS 513.88, CBS124.903 또는 이의 유도체이다.
사상 진균의 여러 균주들이 다수의 배양물 보관기관, 예컨대, ATCC(American Type Culture Collection), DSM(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH), CBS(Centraal bureau Voor Schimmelcultures), NRRL(Agricultural Research Service Patent Culture Collection, Northern Regional Research Center) 및 러시아 과학학회의 러시아 미생물 보관기관(러시아어 약어 - VKM, 영어 약어 - RCM)(러시아 모스코바 소재)에서 대중에게 용이하게 입수될 수 있다. 본 발명과 관련하여 유용한 균주는 아스퍼길러스 니게르 CBS 513.88, CBS124.903, 아스퍼길러스 오리자 ATCC 20423, IFO 4177, ATCC 1011, CBS205.89, ATCC 9576, ATCC 14488-14491, ATCC 11601, ATCC 12892, 페니실리움 크리소게눔 CBS 455.95, 페니실리움 크리소게눔 위스콘신54-1255(ATCC 28089), 페니실리움 시트리눔(Penicillium citrinum) ATCC 38065, 페니실리움 크리소게눔 P2, 티엘라비아 테레스트리스 NRRL8126, 탈라로마이세스 에머소니이 CBS 124.902, 아크레모늄 크리소게눔 ATCC 36225 또는 ATCC 48272, 트라이코데르마 리세이 ATCC 2692, ATCC 56765 또는 ATCC 26921, 아스퍼길러스 소자 ATCC 11906, 마이셀리오프쏘라 써모필라 C1, Garg 27K, VKM-F 3500 D, 크리소스포리움 럭노웬스 C1, Garg 27K, VKM-F 3500 D, ATCC 44006 및 이들의 유도체일 수 있다.
본 발명의 한 실시양태에 따라, 본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 상기 돌연변이체 미생물 숙주 세포는 이 돌연변이체 미생물 숙주 세포가 모 숙주 세포와 비교되고 동일한 조건 하에서 측정될 때 글루코아밀라제(glaA), 산 안정성 α-아밀라제(amyA), 중성 α-아밀라제(amyBI 및 amyBII), 옥살산 하이드롤라제(oahA), 독소, 바람직하게는 오크라톡신(ochratoxin) 및/또는 푸모니신(fumonisin), 프로테아제 전사 조절제 prtT, PepA, 유전자 hdfA 및/또는 hdfB에 의해 코딩된 생성물 및 비-리보좀 펩티드 신타제 npsE로부터 선택된 하나 이상의 생성물의 생성에서 결핍되도록 그의 게놈 내에 하나 이상의 변경을 포함할 수 있다.
따라서, 본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 숙주 세포는 주요 세포외 아스파르트산 프로테아제 PepA의 생성에서의 결핍을 초래하도록 그의 게놈 내에 하나 이상의 변경을 포함할 수 있다. 예를 들면, 본 발명에 따른 숙주 세포는 주요 세포외 아스파르트산 프로테아제 PepA를 코딩하는 pepA 유전자의 파괴를 추가로 포함할 수 있다.
본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 본 발명에 따른 숙주 세포는 hdfA 및/또는 hdfB 유전자에 의해 코딩된 생성물의 생성에서의 결핍을 초래하도록 그의 게놈 내에 하나 이상의 변경을 추가로 포함할 수 있다. 예를 들면, 본 발명에 따른 숙주 세포는 hdfA 및/또는 hdfB 유전자의 파괴를 추가로 포함할 수 있다. hdfA 및/또는 hdfB 유전자에 의해 코딩된 생성물에서 결핍된 사상 진균 숙주 세포는 국제 특허출원 공개 제WO2005/095624호에 기재되어 있다.
본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 본 발명에 따른 숙주 세포는 비-리보좀 펩티드 신타제 npsE의 생성에서의 결핍을 초래하도록 그의 게놈 내에 변경을 추가로 포함할 수 있다. 비-리보좀 펩티드 신타제 npsE의 생성에서 결핍된 이러한 숙주 세포는 국제 특허출원 공개 제WO2012/001169호에 기재되어 있다(npsE는 국제 특허출원 공개 제WO2012/001169호의 서열번호 35에 제시된 게놈 서열, 서열번호 36에 제시된 코딩 서열, 서열번호 37에 제시된 mRNA 및 서열번호 38에 제시된 nrps 단백질을 갖는다).
본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 숙주 세포는 관심있는 화합물을 코딩하는 폴리뉴클레오티드의 하나 이상의 카피의 삽입에 적합한 2개 이상의 실질적 상동성 DNA 도메인들을 추가로 포함할 수 있고, 이때 상기 2개 이상의 실질적 상동성 DNA 도메인들 중 하나 이상은 그 자신의 기원인 실질적 상동성 DNA 도메인에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조되고, 개조된 실질적 상동성 DNA 도메인의 기원인 상기 실질적 상동성 DNA 도메인은 상기 2개 이상의 실질적 상동성 DNA 도메인들의 나머지들 중 하나보다 10% 이상 더 높은 유전자 전환 빈도를 갖는다. 이들 세포들은 국제 특허출원 공개 제WO2011/009700호에 기재되어 있다. 이들 실질적 상동성 DNA 도메인들의 2개 이상의 카피를 함유하는 균주는 이하에서 2개 이상의 앰플리콘을 함유하는 균주로서도 지칭된다. 이러한 앰플리콘을 포함하는 숙주 세포의 예는 예를 들면, 문헌(van Dijck et al, 2003, Regulatory Toxicology and Pharmacology 28; 27-35: On the safety of a new generation of DSM Aspergillus niger enzyme production strains)에 기재되어 있다. 상기 문헌(van Dijck et al.)에는 7개의 증폭된 글루코아밀라제 유전자 좌위, 즉 7개의 앰플리콘들을 포함하는 아스퍼길러스 니게르 균주가 기재되어 있다. 이와 관련하여 바람직한 숙주 세포는 2개 이상의 앰플리콘, 바람직하게는 2개 이상의 ΔglaA 앰플리콘들을 포함하는(바람직하게는 3개, 4개, 5개, 6개 또는 7개의 ΔglaA 앰플리콘들을 포함하는) 사상 진균 숙주 세포, 바람직하게는 아스퍼길러스 니게르 숙주 세포이고, 이때 가장 높은 빈도의 유전자 전환을 갖는 앰플리콘은 그 자신이 유래된 앰플리콘에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조된다. 앰플리콘의 개조는 국제 특허출원 공개 제WO2011/009700호(전체적으로 본원에 참고로 도입됨)에 기재된 방법들 중 어느 한 방법에 따라 수행될 수 있다. 국제 특허출원 공개 제WO2011/009700호에 기재된 이들 숙주 세포들의 한 예는 BamHI 절두된 앰플리콘, SalI 절두된 앰플리콘 및 BglII 절두된 앰플리콘인 3개의 ΔglaA 앰플리콘들을 포함하는 숙주 세포이고, 이때 BamHI 앰플리콘은 그 자신의 기원인 BamHI 앰플리콘에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조된다. 2개 이상의 앰플리콘들을 포함하는 숙주 세포로서, 이때 1개의 앰플리콘이 그 자신의 기원인 앰플리콘에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조된, 숙주 세포는 이하에서 개조된 앰플리콘을 포함하는 숙주 세포로서 지칭된다.
본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 본 발명에 따른 숙주 세포는 Sec61의 변경을 추가로 포함할 수 있다. 바람직한 SEC61 변경은 SEC61의 한 방향 돌연변이체, 즉 새로 합성된 단백질이 SEC61을 통해 ER로 들어갈 수 있되 상기 단백질이 SEC61을 통해 ER을 떠날 수 없는 돌연변이체를 초래하는 변경이다. 이러한 변경은 국제 특허출원 공개 제WO2005/123763호에 광범위하게 기재되어 있다. 가장 바람직하게는, SEC61 변경은 세린 376이 트립토판으로 교체되어 있는 S376W 돌연변이이다.
본 발명에 따른 숙주 세포는 식물 세포를 포함하므로, 본 발명은 하나 이상의 본 발명의 세포를 함유하는 형질전환 유기체, 예컨대, 식물 및 이의 일부까지 확장된다. 상기 세포는 본 발명의 폴리펩티드를 이종적으로 발현할 수 있거나, 본 발명의 폴리뉴클레오티드들 중 하나 이상의 폴리뉴클레오티드를 이종적으로 함유할 수 있다. 따라서, 형질전환(또는 유전적으로 변경된) 식물은 그의 게놈 내로 (예를 들면, 안정하게) 삽입된 본 발명의 폴리펩티드들 중 하나 이상의 폴리펩티드를 코딩하는 서열을 가질 수 있다. 식물 세포의 형질전환은 공지되어 있는 기법을 이용함으로써, 예를 들면, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)로부터의 Ti 또는 Ri 플라스미드를 사용함으로써 수행될 수 있다. 따라서, 플라스미드(또는 벡터)는 식물을 감염시키기 위해 필요한 서열을 함유할 수 있고, Ti 및/또는 Ri 플라스미드의 유도체가 사용될 수 있다.
대안적으로, 식물의 일부, 예컨대, 잎, 뿌리 또는 줄기의 직접적인 감염이 수행될 수 있다. 이 기법에서 감염될 식물은 예를 들면, 면도칼을 사용한 식물의 절단, 바늘을 사용한 식물의 천공, 또는 연마제를 사용한 식물의 문지르기에 의해 상처를 입을 수 있다. 그 다음, 상처는 아그로박테리움으로 접종된다. 그 다음, 식물 또는 식물의 일부는 적합한 배양 배지 상에서 성장될 수 있고 성숙 식물로 발달될 수 있다. 유전적으로 변경된 식물로의 형질전환된 세포의 재생은 공지되어 있는 기법을 이용함으로써, 예를 들면, 항생제를 사용하여 형질전환된 싹을 선택하고 적절한 영양분, 식물 호르몬 등을 함유하는 배지 상에서 상기 싹을 하위배양함으로써 달성될 수 있다.
본 발명은 본 발명의 셀로바이오하이드롤라제 또는 이의 변이체를 발현하도록 변경된 세포도 포함한다. 이러한 세포는 일시적인 또는 바람직하게는 안정한 고등 진핵 세포주, 예컨대, 포유동물 세포 또는 곤충 세포, 하등 진핵 세포, 예컨대, 효모 및 (예를 들면, 사상) 진균 세포 또는 원핵 세포, 예컨대, 세균 세포를 포함한다.
본 발명의 단백질을 세포주 내에서 또는 막 상에서, 예컨대, 바큘로바이러스 발현 시스템 내에서 일시적으로 발현시키는 것도 가능하다. 본 발명에 따른 단백질을 발현하도록 개조되는 이러한 시스템도 본 발명의 범위 내에 포함된다.
본 발명에 따르면, 본 발명의 폴리펩티드의 제조는 하나 이상의 본 발명의 폴리뉴클레오티드로 형질전환된 미생물 발현 숙주를 보편적인 영양 발효 배지에서 배양함으로써 수행될 수 있다.
폴리펩티드/효소 제조
본 발명에 따른 재조합 숙주 세포는 당분야에서 공지되어 있는 절차를 이용함으로써 배양될 수 있다. 프로모터와 숙주 세포의 각각의 조합의 경우, 폴리펩티드를 코딩하는 DNA 서열의 발현에 기여하는 배양 조건이 이용가능하다. 원하는 세포 밀도 또는 폴리펩티드 역가에 도달한 후, 배양을 중단하고 공지되어 있는 절차를 이용하여 폴리펩티드를 회수한다.
발효 배지는 탄소원(예를 들면, 글루코스, 말토스, 당밀, 전분, 셀룰로스, 자일란, 펙틴, 리그노셀룰로스용해 바이오매스 가수분해물 등), 질소원(예를 들면, 암모늄 설페이트, 암모늄 니트레이트, 암모늄 클로라이드 등), 유기 질소원(예를 들면, 효모 추출물, 맥아 추출물, 펙톤 등) 및 무기 영양분 공급원(예를 들면, 포스페이트, 마그네슘, 칼륨, 아연, 철 등)을 함유하는 공지되어 있는 배양 배지를 포함할 수 있다. 임의적으로, 유도제(예를 들면, 셀룰로스, 펙틴, 자일란, 말토스, 말토덱스트린 또는 자일로갈락투로난)가 포함될 수 있다.
적절한 배지의 선택은 발현 숙주의 선택에 근거할 수 있고/있거나 발현 구축물의 조절 요구에 근거할 수 있다. 이러한 배지는 당업자에게 공지되어 있다. 원하는 경우, 배지는 다른 잠재적 오염 미생물에 비해 형질전환된 발현 숙주에 유리한 추가 성분을 함유할 수 있다.
발효는 약 0.5일 내지 약 30일의 기간에 걸쳐 수행될 수 있다. 발효는 적절하게는 0℃ 내지 100℃ 또는 0℃ 내지 80℃, 예를 들면, 약 0℃ 내지 약 50℃의 온도 및/또는 예를 들면, 약 2 내지 약 10의 pH에서의 회분식, 연속식 또는 유가식 공정일 수 있다. 바람직한 발효 조건은 약 20℃ 내지 약 45℃의 온도 및/또는 약 3 내지 약 9의 pH이다. 적절한 조건은 통상적으로 발현 숙주 및 발현될 단백질의 선택에 근거하여 선택된다.
필요한 경우, 발효 후 세포는 원심분리 또는 여과에 의해 발효 브로쓰로부터 제거될 수 있다. 발효가 중단된 후 또는 세포의 제거 후, 본 발명의 폴리펩티드는 회수될 수 있고, 원하는 경우 보편적인 수단에 의해 정제되고 단리될 수 있다.
폴리펩티드/효소 조성물
본 발명은 본 발명의 폴리펩티드, 및 셀룰라제, 헤미셀룰라제, 펙티나제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함하는 조성물을 제공한다.
본 발명의 폴리펩티드가 셀룰라제인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 헤미셀룰라제, 펙티나제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함할 것이다.
본 발명의 폴리펩티드가 헤미셀룰라제인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 셀룰라제, 펙티나제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함할 것이다.
본 발명의 폴리펩티드가 펙티나제인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 셀룰라제, 헤미셀룰라제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함할 것이다.
본 발명의 폴리펩티드가 리그니나제 또는 리그닌 변경 효소인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 셀룰라제, 헤미셀룰라제 및/또는 펙티나제를 포함할 것이다.
본 발명의 조성물은 셀룰라제의 1개, 2개 또는 3개 이상의 클래스, 예를 들면, GH61, 엔도-1,4-β-글루카나제(EG), 엑소-셀로바이오하이드롤라제(CBH) 및 β-글루코시다제(BGL) 중 하나, 둘 또는 전부를 포함할 수 있다.
본 발명의 조성물은 본 발명의 폴리펩티드에 의해 제공된 효소 활성과 동일한 효소 활성, 예를 들면, 동일한 종류의 셀룰라제, 헤미셀룰라제 및/또는 펙티나제 활성을 갖는 폴리펩티드를 포함할 수 있다.
본 발명의 조성물은 본 발명의 폴리펩티드에 의해 제공된 효소 활성과 상이한 종류의 셀룰라제 활성, 헤미셀룰라제 활성 및/또는 펙티나제 활성을 갖는 폴리펩티드를 포함할 수 있다. 예를 들면, 본 발명의 조성물은 본 발명의 폴리펩티드에 의해 제공된 제1종의 셀룰라제 활성, 헤미셀룰라제 활성 및/또는 펙티나제 활성 및 추가 헤미셀룰라제/펙티나제에 의해 제공된 제2종의 셀룰라제 활성, 헤미셀룰라제 활성 및/또는 펙티나제 활성을 포함할 수 있다.
본원에서 셀룰라제는 셀룰로스를 분해할 수 있는 임의의 폴리펩티드이다. 셀룰로스를 분해할 수 있는 폴리펩티드는 셀룰로스를 보다 더 작은 유닛으로 부분적으로(예를 들면, 셀로덱스트린으로) 또는 전체적으로(글루코스 단량체로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 셀룰라제는 셀룰라제와 접촉될 때 셀로덱스트린과 글루코스 단량체의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 가수분해 반응에 의해 일어날 것이다.
본원에서 헤미셀룰라제는 헤미셀룰로스를 분해할 수 있는 임의의 폴리펩티드이다. 다시 말해, 헤미셀룰라제는 자일란, 글루쿠로노자일란, 아라비노자일란, 글루코만난 및 자일로글루칸 중 하나 이상을 분해할 수 있다. 헤미셀룰로스를 분해할 수 있는 폴리펩티드는 헤미셀룰로스를 보다 더 작은 폴리사카라이드로 부분적으로(예를 들면, 올리고사카라이드로) 또는 전체적으로(당 단량체, 예를 들면, 헥소스 또는 펜토스 당 단량체로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 헤미셀룰라제는 헤미셀룰라제와 접촉될 때 올리고사카라이드와 당 단량체의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 가수분해 반응에 의해 일어날 것이다.
본원에서 펙티나제는 펙틴을 분해할 수 있는 임의의 폴리펩티드이다. 펙틴을 분해할 수 있는 폴리펩티드는 펙틴을 보다 더 작은 유닛으로 부분적으로(예를 들면, 올리고사카라이드로) 또는 전체적으로(당 단량체로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 펙티나제는 펙티나제와 접촉될 때 올리고사카라이드와 당 단량체의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 가수분해 반응에 의해 일어날 것이다.
본원에서 리그니나제 또는 리그닌 변경 효소는 리그닌 또는 이의 분해 성분을 분해할 수 있거나 변경시킬 수 있는 임의의 폴리펩티드이다. 리그닌을 분해할 수 있거나 변경시킬 수 있는 폴리펩티드는 리그닌을 보다 더 작은 유닛으로 부분적으로(예를 들면, 모노페놀성 화합물로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 리그니나제 또는 리그닌 변경 효소는 리그닌과 접촉될 때 페놀성 화합물들의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 산화 반응에 의해 일어날 것이다. 본원에서 리그니나제 또는 리그닌 변경 효소는 리그닌의 페놀성 분해 생성물을 분해할 수 있는 임의의 폴리펩티드일 수도 있다. 리그닌의 페놀성 분해 생성물을 분해할 수 있는 폴리펩티드는 예를 들면, 페놀성 고리의 개환 반응을 촉진함으로써 리그닌의 페놀성 분해 생성물을 훨씬 더 작은 유닛으로 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 리그니나제 또는 리그닌 변경 효소는 리그닌의 페놀성 분해 생성물과 접촉될 때 페놀성 화합물의 개환된 분해 생성물들의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 산화 반응에 의해 일어날 것이다. 리그니나제 또는 리그닌 변경 효소는 셀룰로스 또는 헤미셀룰로스와 리그닌 또는 이의 분해 생성물 사이의 연결을 더 분해할 수 있다. 리그닌을 분해할 수 있는 효소는 리그닌 퍼록시다제(peroxidase), 망간 퍼록시다제, 락카제(laccase) 및 페룰로일 에스터라제, 및 리그닌 중합체를 탈중합시키거나 다른 방식으로 분해하는 것으로 당분야에서 공지되어 있는 다른 효소를 포함한다. 헤미셀룰로스성 당(특히 아라비노스)와 리그닌 사이에 형성된 결합을 가수분해할 수 있는 효소도 포함된다. 리그니나제는 하기 효소 군을 포함하나 이들로 한정되지 않는다: 리그닌 퍼록시다제(EC 1.11.14), 망간 퍼록시다제(EC 1.11.1.13), 락카제(EC 1.10.3.2) 및 페룰로일 에스터라제(EC 3.1.1.73).
따라서, 본 발명의 조성물은 임의의 셀룰라제, 예를 들면, GH61, 셀로바이오하이드롤라제, 엔도-β-1,4-글루카나제, β-글루코시다제 또는 β-(1,3)(1,4)-글루카나제를 포함할 수 있다.
GH61(글리코사이드 하이드롤라제 패밀리 61, 또는 종종 EGIV로서 지칭됨) 단백질은 최근 문헌에 따르면 산소 의존성 폴리사카라이드 모노옥시게나제(PMO)이다. 종종, 문헌에서 이 단백질은 리그노셀룰로스 기질에 대한 셀룰라제의 작용을 향상시키는 것으로 언급되어 있다. GH61은 처음에 한 패밀리 구성원에서의 매우 약한 엔도-1,4-β-D-글루카나제 활성의 측정에 근거하여 엔도-글루코나제로서 분류되었다. 본원에서 사용된 용어 "GH61"은 공통의 보존된 서열 부분 및 폴딩을 공유하여 잘 확립된 CAZY GH 분류 시스템(http://www.cazy.org/GH61.html)의 패밀리 61로 분류되는 한 효소 패밀리로서 이해되어야 한다. 글리코사이드 하이드롤라제 패밀리 61은 글리코사이드 하이드롤라제 EC 3.2.1의 패밀리의 구성원이다. GH61은 본원에서 셀룰라제의 일부로서 사용된다.
본원에서 셀로바이오하이드롤라제(EC 3.2.1.91)는 셀룰로스 또는 셀로테트라오스에서 1,4-β-D-글루코사이드 연결의 가수분해를 촉진하여 쇄의 비-환원 말단으로부터 셀로바이오스를 방출시킬 수 있는 임의의 폴리펩티드이다. 이 효소는 셀룰라제 1,4-β-셀로바이오시다제, 1,4-β-셀로바이오하이드롤라제, 1,4-β-D-글루칸 셀로바이오하이드롤라제, 아비셀라제, 엑소-1,4-β-D-글루카나제, 엑소-셀로바이오하이드롤라제 또는 엑소-글루카나제로서도 지칭될 수 있다. 상기 효소는 EC 코드 EC 3.2.1.91을 가질 수 있다.
본원에서 엔도-β-1,4-글루카나제(EC 3.2.1.4)는 셀룰로스, 리케닌 또는 곡물 β-D-글루칸에서 1,4-β-D-글루코사이드 연결의 내부가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 1,3-연결도 함유하는 β-D-글루칸에서 1,4-연결을 가수분해할 수도 있다. 이 효소는 셀룰라제, 아비셀라제, β-1,4-엔도글루칸 하이드롤라제, β-1,4-글루카나제, 카복시메틸 셀룰라제, 셀루덱스트리나제, 엔도-1,4-β-D-글루카나제, 엔도-1,4-β-D-글루카노하이드롤라제, 엔도-1,4-β-글루카나제 또는 엔도-글루카나제로서도 지칭될 수 있다. 엔도-글루카나제는 β1→4-연결된 글루코스 잔기들(이들 중 대다수는 1-6-연결된 자일로스 측쇄로 치환됨)의 골격인 자일로글루칸의 절단도 촉진할 수 있고, 그 후 상기 효소는 자일로글루칸 특이적 엔도-β-1,4-글루카나제 또는 자일로글루카나제로서도 지칭된다.
본원에서 β-글루코시다제(EC 3.2.1.21)는 β-D-글루코스를 방출시키면서 말단 비-환원 β-D-글루코스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 β-D-글루코사이드에 대한 넓은 특이성을 가질 수 있고 β-D-갈락토사이드, α-L-아라비노사이드, β-D-자일로사이드 및 β-D-푸코사이드 중 하나 이상을 가분해할 수도 있다. 이 효소는 아미그달라제(amygdalase), β-D-글루코사이드 글루코하이드롤라제, 셀로비아제 또는 젠토비아제(gentobiase)로서도 지칭될 수 있다.
본원에서 β-(1,3)(1,4)-글루카나제(EC 3.2.1.73)는 1.3-결합 및 1,4-결합을 함유하는 β-D-글루칸에서 1,4-β-D-글루코사이드 연결의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 리케닌 및 곡물 β-D-글루칸에 작용할 수 있으나, 1,3-결합 또는 1,4-결합만을 함유하는 β-D-글루칸에는 작용할 수 없다. 이 효소는 리케니나제(licheninase), 1,3-1,4-β-D-글루칸 4-글루카노하이드롤라제, β-글루카나제, 엔도-β-1,3-1,4-글루카나제, 리케나제(lichenase) 또는 혼합된 연결 β-글루카나제로서도 지칭될 수 있다. 이러한 종류의 효소에 대한 대체물은 엔도-1,3(4)-β-글루카나제로서 기재되는 EC 3.2.1.6이다. 이러한 종류의 효소는 가수분해될 연결에 관여하는 환원 기를 갖는 글루코스 잔기 그 자체가 C-3에서 치환될 때 β-D-글루칸에서 1,3-연결 또는 1,4-연결을 가수분해한다. 대안적 명칭은 엔도-1,3-β-글루카나제, 라미나리나제(laminarinase), 및 1,3-(1,3;1,4)-β-D-글루칸 3(4) 글루카노하이드롤라제를 포함하고; 기질은 라미나린, 리케닌 및 곡물 β-D-글루칸을 포함한다.
본 발명의 조성물은 임의의 헤미셀룰라제, 예를 들면, 엔도-자일라나제, β-자일로시다제, α-L-아라바이오노푸라노시다제, α-D-글루쿠로니다제, 셀로바이오하이드롤라제, 페룰로일 에스터라제, 쿠마로일 에스터라제, α-갈락토시다제, β-갈락토시다제, β-만나나제 또는 β-만노시다제를 포함할 수 있다.
본원에서 엔도-자일라나제(EC 3.2.1.8)는 자일란에서 1,4-β-D-자일로사이드 연결의 엔도-가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 엔도-1,4-β-자일라나제 또는 1,4-β-D-자일란 자일라노하이드롤라제로서도 지칭될 수 있다. 대체물은 글루쿠로노아라비노자일란에서 1,4-자일로사이드 연결을 가수분해할 수 있는 효소인 글루쿠로노아라비노자일란 엔도-자일라나제(EC 3.2.1.136)이다.
본원에서 β-자일로시다제(EC 3.2.1.37; GH3)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.
본원에서 α-L-아라비노푸라노시다제(EC 3.2.1.55)는 α-L-아라비노푸라노사이드, (1,2)-연결, (1,3)-연결 및/또는 (1,5)-연결을 함유하는 α-L-아라비난, 아라비노자일란 및 아라비노갈락탄에 작용할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-N-아라비노푸라노시다제, 아라비노푸라노시다제 또는 아라비노시다제로서도 지칭될 수 있다.
본원에서 α-D-글루쿠로니다제(EC 3.2.1.139)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: α-D-글루쿠로노사이드 + H(2)O = 알코올 + D-글루쿠로네이트. 이 효소는 α-글루쿠로니다제 또는 α-글루코시듀로나제로서 지칭될 수도 있다. 이 효소는 자일란에 치환기로서 존재할 수도 있는 4-O-메틸화된 글루코론산을 가수분해할 수도 있다. 대체물은 α-1,2-(4-O-메틸)글루쿠로노실 연결의 가수분해를 촉진하는 자일란 α-1,2-글루쿠로노시다제(EC 3.2.1.131)이다.
본원에서 아세틸 자일란 에스터라제(EC 3.1.1.72)는 자일란 및 자일로-올리고사카라이드의 탈아세틸화를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 중합체성 자일란, 아세틸화된 자일로스, 아세틸화된 글루코스, α-나프틸 아세테이트 또는 p-니트로페닐 아세테이트로부터의 아세틸 기의 가수분해를 촉진할 수 있으나, 전형적으로 트라이아세틸글리세롤로부터의 아세틸 기의 가수분해를 촉진할 수는 없다. 이러한 폴리펩티드는 전형적으로 아세틸화된 만난 또는 펙틴에 작용하지 않는다.
본원에서 페룰로일 에스터라제(EC 3.1.1.73)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: 페룰로일-사카라이드 + H(2)O = 페룰레이트 + 사카라이드. 사카라이드는 예를 들면, 올리고사카라이드 또는 폴리사카라이드일 수 있다. 상기 효소는 전형적으로 에스터화된 당(통상적으로 '천연' 기질에서 아라비노스)으로부터의 4-하이드록시-3-메톡시신나모일(페룰로일) 기의 가수분해를 촉진할 수 있다. p-니트로페놀 아세테이트 및 메틸 페룰레이트는 전형적으로 보다 더 약한 기질이다. 이 효소는 신나모일 에스터 하이드롤라제, 페룰산 에스터라제 또는 하이드록시신나모일 에스터라제로서도 지칭될 수 있다. 상기 효소는 자일라나제 및 펙티나제가 식물 세포벽 헤미셀룰로스 및 펙틴을 분해하는 것을 도울 수 있기 때문에 헤미셀룰라제 보조 효소로서도 지칭될 수 있다.
본원에서 쿠마로일 에스터라제(EC 3.1.1.73)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: 쿠마로일-사카라이드 + H(2)O = 쿠마레이트 + 사카라이드. 사카라이드는 예를 들면, 올리고사카라이드 또는 폴리사카라이드일 수 있다. 이 효소는 트랜스-4-쿠마로일 에스터라제, 트랜스-p-쿠마로일 에스터라제, p-쿠마로일 에스터라제 또는 p-쿠마르산 에스터라제로서도 지칭될 수 있다. 이 효소는 EC 3.1.1.73 내에도 속하므로, 페룰로일 에스터라제로서도 지칭될 수 있다.
본원에서 α-갈락토시다제(EC 3.2.1.22)는 갈락토스 올리고사카라이드, 갈락토만난, 갈락탄 및 아라비노갈락탄을 비롯한 α-D-갈락토사이드에서 말단 비-환원 α-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-D-푸코사이드를 가수분해할 수도 있다. 이 효소는 멜리비아제로서도 지칭될 수 있다.
본원에서 β-갈락토시다제(EC 3.2.1.23)는 β-D-갈락토사이드에서 말단 비-환원 β-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-L-아라비노사이드를 가수분해할 수도 있다. 이 효소는 엑소-(1→4)-β-D-갈락타나제 또는 락타제로서도 지칭될 수 있다.
본원에서 β-만나나제(EC 3.2.1.78)는 만난, 갈락토만난 및 글루코만난에서 1,4-β-D-만노사이드 연결의 무작위 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 만난 엔도-1,4-β-만노시다제 또는 엔도-1,4-만나나제로서도 지칭될 수 있다.
본원에서 β-만노시다제(EC 3.2.1.25)는 β-D-만노사이드에서 말단 비-환원 β-D-만노스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 만나나제 또는 만나제로서도 지칭될 수 있다.
본 발명의 조성물은 임의의 펙티나제, 예를 들면, 엔도-폴리갈락투로나제, 펙틴 메틸 에스터라제, 엔도-갈락타나제, β-갈락토시다제, 펙틴 아세틸 에스터라제, 엔도-펙틴 라이아제, 펙테이트 라이아제, α-람노시다제, 엑소-갈락투로나제, 엑소-폴리갈락투로네이트 라이아제, 람노갈락투로난 하이드롤라제, 람노갈락투로난 라이아제, 람노갈락투로난 아세틸 에스터라제, 람노갈락투로난 갈락투로노하이드롤라제 또는 자일로갈락투로나제를 포함할 수 있다.
본원에서 엔도-폴리갈락투로나제(EC 3.2.1.15)는 펙테이트 및 다른 갈락투로난에서 1,4-α-D-갈락토시듀론 연결의 무작위 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 폴리갈락투로나제 펙틴 탈중합효소, 펙티나제, 엔도-폴리갈락투로나제, 펙트롤라제, 펙틴 하이드롤라제, 펙틴 폴리갈락투로나제, 폴리-α-1,4-갈락투로나이드 글리카노하이드롤라제, 엔도-갈락투로나제, 엔도-D-갈락투로나제 또는 폴리(1,4-α-D-갈락투로나이드) 글리카노하이드롤라제로서도 지칭될 수 있다.
본원에서 펙틴 메틸 에스터라제(EC 3.1.1.11)는 하기 반응을 촉진할 수 있는 임의의 효소이다: 펙틴 + n H2O = n 메탄올 + 펙테이트. 상기 효소는 펙틴 에스터라제, 펙틴 데메톡실라제, 펙틴 메톡실라제, 펙틴 메틸에스터라제, 펙타제, 펙티노에스터라제 또는 펙틴 펙틸하이드롤라제로서도 공지되어 있을 수 있다.
본원에서 엔도-갈락타나제(EC 3.2.1.89)는 아라비노갈락탄에서 1,4-β-D-갈락토사이드 연결의 내부가수분해를 촉진할 수 있는 임의의 효소이다. 상기 효소는 아라비노갈락탄 엔도-1,4-β-갈락토시다제, 엔도-1,4-β-갈락타나제, 갈락타나제, 아라비노갈락타나제 또는 아라비노갈락탄 4-β-D-갈락타노하이드롤라제로서도 공지되어 있을 수 있다.
본원에서 펙틴 아세틸 에스터라제는 펙틴의 GalUA 잔기의 하이드록실 기에서 아세틸 기의 탈아세틸화를 촉진하는 아세틸 에스터라제 활성을 갖는 임의의 효소로서 정의된다.
본원에서 엔도-펙틴 라이아제(EC 4.2.2.10)는 (1→4)-α-D-갈락투로난 메틸 에스터의 제거적 절단을 촉진하여 그의 비-환원 말단에서 4-데옥시-6-O-메틸-α-D-갈락트-4-에누로노실 기를 갖는 올리고사카라이드를 제공할 수 있는 임의의 효소이다. 상기 효소는 펙틴 라이아제, 펙틴 트랜스엘리미나제(transeliminase), 엔도-펙틴 라이아제, 폴리메틸갈락투론산 트랜스엘리미나제, 펙틴 메틸트랜스엘리미나제, 펙토라이아제, PL, PNL 또는 PMGL 또는 (1→4)-6-O-메틸-α-D-갈락투로난 라이아제로서도 공지되어 있을 수 있다.
본원에서 펙테이트 라이아제(EC 4.2.2.2)는 (1→4)-α-D-갈락투로난의 제거적 절단을 촉진하여 그의 비-환원 말단에서 4-데옥시-α-D-갈락트-4-에누로노실 기를 갖는 올리고사카라이드를 제공할 수 있는 임의의 효소이다. 상기 효소는 폴리갈락투론산 트랜스엘리미나제, 펙트산 트랜스엘리미나제, 폴리갈락투로네이트 라이아제, 엔도-펙틴 메틸트랜스엘리미나제, 펙테이트 트랜스엘리미나제, 엔도-갈락투로네이트 트랜스엘리미나제, 펙트산 라이아제, 펙틱 라이아제, α-1,4-D-엔도-폴리갈락투론산 라이아제, PGA 라이아제, PPase-N, 엔도-α-1,4-폴리갈락투론산 라이아제, 폴리갈락투론산 라이아제, 펙틴 트랜스엘리미나제, 폴리갈락투론산 트랜스엘리미나제 또는 (1→4)-α-D-갈락투로난 라이아제로서도 공지되어 있을 수 있다.
본원에서 α-람노시다제(EC 3.2.1.40)는 α-L-람노사이드 또는 대안적으로 람노갈락투로난에서 말단 비-환원 α-L-람노스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-L-람노시다제 T, α-L-람노시다제 N 또는 α-L-람노사이드 람노하이드롤라제로서도 공지되어 있을 수 있다.
본원에서 엑소-갈락투로나제(EC 3.2.1.82)는 비-환원 말단으로부터 펙트산을 가수분해하여 다이갈락투로네이트를 방출시킬 수 있는 임의의 폴리펩티드이다. 상기 효소는 엑소-폴리-α-갈락투로노시다제, 엑소-폴리갈락투로노시다제 또는 엑소-폴리갈락투라노시다제로서도 공지되어 있을 수 있다.
본원에서 엑소-갈락투로나제(EC 3.2.1.67)는 하기 반응을 촉진할 수 있는 임의의 폴리펩티드이다: (1,4-α-D-갈락투로나이드)n + H2O = (1,4-α-D-갈락투로나이드)n-1 + D-갈락투로네이트. 상기 효소는 갈락투란 1,4-α-갈락투로니다제, 엑소-폴리갈락투로나제, 폴리(갈락투로네이트) 하이드롤라제, 엑소-D-갈락투로나제, 엑소-D-갈락투로나제, 엑소-폴리-D-갈락투로나제 또는 폴리(1,4-α-D-갈락투로나이드) 갈락투로노하이드롤라제로서도 공지되어 있을 수 있다.
본원에서 엑소-폴리갈락투로네이트 라이아제(EC 4.2.2.9)는 펙테이트, 즉 탈에스터화된 펙틴의 환원 말단으로부터 4-(4-데옥시-α-D-갈락트-4-에누로노실)-D-갈락투로네이트의 제거적 절단을 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 펙테이트 다이사카라이드-라이아제, 펙테이트 엑소-라이아제, 엑소-펙트산 트랜스엘리미나제, 엑소-펙테이트 라이아제, 엑소-폴리갈락투론산-트랜스엘리미나제, PATE, 엑소-PATE, 엑소-PGL 또는 (1→4)-α-D-갈락투로난 환원 말단-다이사카라이드-라이아제로서 공지되어 있을 수 있다.
본원에서 람노갈락투로난 하이드롤라제는 다이사카라이드[(1,2-α-L-람노일-(1,4)-α-갈락토실유론산]로 구성된, 엄격히 교대로 존재하는 람노갈락투로난 구조물에서 갈락토실유론산과 람노피라노실 사이의 연결을 엔도 방식으로 가수분해할 수 있는 임의의 폴리펩티드이다.
본원에서 람노갈락투로난 라이아제는 β-제거를 통해 람노갈락투로난에서 α-L-Rhap-(1→4)-α-D-GalpA 연결을 엔도 방식으로 절단할 수 있는 임의의 폴리펩티드이다.
본원에서 람노갈락투로난 아세틸 에스터라제는 람노갈락투로난에서 교대로 존재하는 람노스와 갈락투론산 잔기로 구성된 골격의 탈아세틸화를 촉진하는 임의의 폴리펩티드이다.
본원에서 람노갈락투로난 갈락투로노하이드롤라제는 엄격히 교대로 존재하는 람노갈락투로난 구조물의 비-환원 말단으로부터 갈락투론산을 엑소 방식으로 가수분해할 수 있는 임의의 폴리펩티드이다.
본원에서 자일로갈락투로나제는 β-자일로스 치환된 갈락투론산 골격을 엔도 방식으로 절단함으로써 자일로갈락투로난에 작용하는 임의의 폴리펩티드이다. 이 효소는 자일로갈락투로난 하이드롤라제로서도 공지되어 있을 수 있다.
본원에서 α-L-아라비노푸라노시다제(EC 3.2.1.55)는 α-L-아라비노푸라노사이드, (1,2)-연결, (1,3)-연결 및/또는 (1,5)-연결을 함유하는 α-L-아라비난, 아라비노자일란 및 아라비노갈락탄에 작용할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-N-아라비노푸라노시다제, 아라비노푸라노시다제 또는 아라비노시다제로서도 지칭될 수 있다.
본원에서 엔도-아라비나제(EC 3.2.1.99)는 1,5-아라비난에서 1,5-α-아라비노푸라노사이드 연결의 내부가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 엔도-아라비나제, 아라비난 엔도-1,5-α-L-아라비노시다제, 엔도-1,5-α-L-아라비나나제, 엔도-α-1,5-아라바나제, 엔도-아라바나제 또는 1,5-α-L-아라비난 1,5-α-L-아라비나노하이드롤라제로서도 공지되어 있을 수 있다.
본 발명의 조성물은 전형적으로 하나 이상의 셀룰라제, 하나 이상의 헤미셀룰라제 및/또는 하나 이상의 펙티나제(이들 중 하나는 본 발명에 따른 폴리펩티드임)를 포함할 것이다. 본 발명의 조성물은 셀로바이오하이드롤라제, 엔도-글루카나제 및/또는 β-글루코시다제를 포함할 수 있다. 이러한 조성물은 하나 이상의 헤미셀룰라제 및/또는 하나 이상의 펙티나제도 포함할 수 있다.
하나 이상의(예를 들면, 2개의, 3개의, 4개의 또는 모든) 아밀라제, 프로테아제, 리파제, 리그니나제, 헥소실트랜스퍼라제 또는 글루쿠로니다제가 본 발명의 조성물에 존재할 수 있다.
"프로테아제"는 펩티드 결합을 가수분해하는 효소(펩티다제)뿐만 아니라 펩티드와 다른 모이어티, 예컨대, 당 사이의 결합을 가수분해하는 효소(글리코펩티다제)도 포함한다. 많은 프로테아제들이 EC 3.4 하에서 특징규명되어 있고 본원에 참고로 도입되는 발명에서 사용되기에 적합하다. 일부 특정 종류의 프로테아제들은 펩신 및 파파인을 비롯한 시스테인 프로테아제, 및 카이모트립신, 카복시펩티다제 및 메탈로엔도-펩티다제를 비롯한 세린 프로테아제를 포함한다.
"리파제"는 지질, 지방산, 및 아실글리세라이드(포스포글리세라이드, 지단백질, 다이아실글리세롤 등을 포함함)를 가수분해하는 효소를 포함한다. 식물에서, 지질은 수분 손실 및 병원체 감염을 제한하는 구조 성분으로서 사용된다. 이들 지질들은 지방산으로부터 유도된 왁스뿐만 아니라 쿠틴 및 수베린도 포함한다.
"헥소실트랜스퍼라제"(2.4.1-)는 글리코실 기, 보다 구체적으로 헥소실 기를 전달할 수 있는 효소를 포함한다. 글리코실 기를 글리코실 함유 공여자로부터 또 다른 글리코실 함유 화합물로 전달하는 것 이외에, 상기 효소는 글리코실 기를 수용자인 물에게 전달할 수도 있다. 이 반응은 전달 반응 대신에 가수분해 반응으로서도 공지되어 있다. 본 발명에서 사용될 수 있는 헥소실트랜스퍼라제의 한 예는 β-글루카노실트랜스퍼라제이다. 이러한 효소는 (1,3)(1,4)글루칸, 셀룰로스 및/또는 셀룰로스 분해 생성물의 분해를 촉진할 수 있다.
"글루쿠로니다제"는 글루쿠로노사이드, 예를 들면, β-글루쿠로노사이드의 가수분해를 촉진하여 알코올을 생성하는 효소를 포함한다. 많은 글루쿠로니다제들, 예를 들면, β-글루쿠로니다제(EC 3.2.1.31), 하이알루로노-글루쿠로니다제(EC 3.2.1.36), 글루쿠로노실-다이설포글루코스아민 글루쿠로니다제(3.2.1.56), 글리시리지네이트 β-글루쿠로니다제(3.2.1.128) 또는 α-D-글루쿠로니다제(EC 3.2.1.139)가 특징규명되어 있고 본 발명에서 사용되기에 적합할 수 있다.
본 발명의 조성물은 익스팬신(expansin) 또는 익스팬신 유사 단백질, 예컨대, 스왈레닌(swollenin)(문헌(Salheimo et al., Eur. J. Biochem. 269, 4202-4211, 2002) 참조) 또는 스왈레닌 유사 단백질을 포함할 수 있다.
익스팬신은 식물 세포 생장 동안 세포벽 구조가 느슨해지는 것에 관여한다. 익스팬신은 가수분해 활성을 갖지 않으면서 셀룰로스와 다른 세포벽 폴리사카라이드 사이의 수소 결합을 파괴하는 것으로 제안되었다. 이 방식으로, 익스팬신은 셀룰로스 섬유의 활주 및 세포벽의 확장을 가능하게 하는 것으로 생각된다. 익스팬신 유사 단백질인 스왈레닌은 N-말단 탄수화물 결합 모듈 패밀리 1 도메인(CBD) 및 C-말단 익스팬신 유사 도메인을 함유한다. 본 발명의 목적상, 익스팬신 유사 단백질 또는 스왈레닌 유사 단백질은 이러한 도메인들 중 하나 또는 둘다를 포함할 수 있고/있거나, 임의적으로 검출가능한 양의 환원 당을 생성하지 않으면서 세포벽의 구조를 파괴(예컨대, 셀룰로스 구조를 파괴)할 수 있다.
본 발명의 조성물은 셀룰로스 삽입 단백질, 스카폴딘(scaffoldin) 또는 스카폴딘 유사 단백질, 예를 들면, 클로스트리듐 써모셀룸(Clostridium thermocellum) 또는 클로스트리듐 셀룰로라이티쿰(Clostridium cellulolyticum)으로부터의 각각 CipA 또는 CipC의 폴리펩티드 생성물을 포함할 수 있다.
스카폴딘 및 셀룰로스 삽입 단백질은 셀룰로스용해 서브유닛을 다중-효소 복합체로 조직화할 수 있는 다중-기능 삽입 서브유닛이다. 이것은 2개의 상보적인 클래스의 도메인, 즉 스카폴딘 상의 점착 도메인과 각각의 효소 유닛 상의 독케린(dockerin) 도메인의 상호작용에 의해 달성된다. 스카폴딘 서브유닛은 셀룰로좀이 그의 기질에 부착하는 것을 매개하는 셀룰로스 결합 모듈(CBM)도 보유한다. 본 발명의 목적상 스카폴딘 또는 셀룰로스 삽입 단백질은 이러한 도메인들 중 하나 또는 둘다를 포함할 수 있다.
본 발명의 조성물은 예를 들면, 트라이코데르마 리세이(Trichoderma reesei)/하이포크레아 자코리나(Hypocrea jacorina)로부터의 cip1 또는 cip2 유전자 또는 유사한 유전자에 의해 코딩된 셀룰로스-유도된 단백질 또는 조절 단백질을 포함할 수 있다(문헌(Foreman et al., J. Biol. Chem. 278(34), 31988-31997, 2003) 참조). 이들 유전자들의 폴리펩티드 생성물은 셀룰로스 결합 모듈, 및 공지되어 있는 글리코실 하이드롤라제 패밀리와 관련되어 있지 않을 수 있는 기능 또는 활성을 갖는 도메인을 함유하는 바이모듈 단백질이다. 셀룰로스 결합 모듈의 존재 및 셀룰라제 성분에 의한 이들 유전자들의 발현의 공-조절은 바이오매스 분해에 있어서 잠재적 역할을 갖는 이전에 인식되지 않은 활성을 시사한다.
본 발명의 조성물은 전술된 각각의 폴리펩티드 클래스의 구성원, 한 폴리펩티드 클래스의 여러 구성원, 또는 이들 폴리펩티드 클래스들의 임의의 조합물로 구성될 수 있다.
본 발명의 조성물은 (1) 상업적 공급처; (2) 폴리펩티드, 예를 들면, 효소를 발현하는 클로닝된 유전자; (3) 복합 브로쓰(예컨대, 단백질 및 효소를 배지 내로 분비하는 미생물 균주가 배지에서 생장함으로써 생성된 복합 브로쓰); (4) (3)에서와 같이 생장된 균주의 세포 용해물; 및/또는 (5) 폴리펩티드, 예를 들면, 효소를 발현하는 식물 물질로부터의 폴리펩티드, 예를 들면, 효소로 구성될 수 있다. 본 발명의 조성물 중의 상이한 폴리펩티드, 예를 들면, 효소는 상이한 공급원으로부터 입수될 수 있다.
폴리펩티드의 용도
본 발명에 따른 폴리펩티드 및 폴리펩티드 조성물은 많은 상이한 적용분야에서 사용될 수 있다. 예를 들면, 이들은 발효가능한 당의 제조에 사용될 수 있다. 발효가능한 당은 바이오연료 공정의 일부로서 바이오가스 또는 에탄올, 부탄올, 이소부탄올, 2-부탄올 또는 다른 적합한 물질로 전환될 수 있다. 대안적으로, 폴리펩티드 및 이의 조성물은 예를 들면, 식품의 제조, 세제 조성물, 종이 및 펄프 산업, 항균 제제, 약품, 예컨대, 인후 로젠지, 치약 및 구강세척제에서 효소로서 사용될 수 있다. 용도 중 일부는 이하에 보다 더 상세히 예시될 것이다.
이하에 기재된 용도 및 방법에서, 전술된 조성물의 성분들은 동시에(즉, 단일 조성물 그 자체로서), 별도로 또는 순차적으로 제공될 수 있다.
또한, 본 발명은 산업 공정에서 본 발명에 따른 셀로바이오하이드롤라제 및 이러한 효소를 포함하는 조성물의 용도에 관한 것이다.
이 공정에 대해 수득된 장기간 경험에도 불구하고, 본 발명에 따른 셀로바이오하이드롤라제는 현재 사용되는 효소들에 비해 다수의 유의한 장점들을 특징으로 할 수 있다. 구체적인 적용분야에 따라, 이들 장점들은 양태, 예컨대, 보다 더 낮은 생산 비용, 기질에 대한 보다 더 높은 특이성, 감소된 항원성, 보다 더 적은 바람직하지 않은 부작용, 적합한 미생물에서 생성될 때 보다 더 높은 수율, 보다 더 큰 적합한 pH 및 온도 범위, 소수성 리그닌-유도된 생성물에 의한 비-억제 또는 보다 더 낮은 생성물 억제, 또는 식품 산업의 경우 최종 생성물의 보다 더 우수한 맛 또는 식감뿐만 아니라 식품 등급 및 코셔(kosher) 양태를 포함할 수 있다.
원칙적으로, 본 발명의 셀로바이오하이드롤라제 또는 조성물은 폴리사카라이드를 포함하는 물질의 처리를 필요로 하는 임의의 공정에서 사용될 수 있다. 따라서, 본 발명의 폴리펩티드 또는 조성물은 폴리사카라이드 물질의 처리에 사용될 수 있다. 본원에서 폴리사카라이드 물질은 하나 이상, 전형적으로 하나 초과의 폴리사카라이드를 포함하거나 본질적으로 이러한 폴리사카라이드로 구성된 물질이다.
전형적으로, 식물 및 이로부터 유래된 물질은 상당한 양의 비-전분 폴리사카라이드 물질을 포함한다. 따라서, 본 발명의 폴리펩티드는 식물 또는 진균 물질, 또는 이로부터 유도된 물질의 처리에 사용될 수 있다.
리그노셀룰로스
식물 비-전분 폴리사카라이드 물질의 중요한 성분은 리그노셀룰로스(본원에서 리그노셀룰로스용해 바이오매스로서도 지칭됨)이다. 리그노셀룰로스는 셀룰로스, 헤미셀룰로스 및 리그닌을 포함하는 식물 물질이다. 탄수화물 중합체(셀룰로스 및 헤미셀룰로스)는 수소결합 및 공유결합에 의해 리그닌에 단단히 결합된다. 따라서, 본 발명의 폴리펩티드는 리그노셀룰로스용해 물질의 처리에 사용될 수 있다. 본원에서 리그노셀룰로스용해 물질은 리그노셀룰로스를 포함하거나 본질적으로 리그노셀룰로스로 구성된 물질이다. 따라서, 비-전분 폴리사카라이드를 처리하는 본 발명의 방법에서 비-전분 폴리사카라이드는 리그노셀룰로스성 물질/바이오매스일 수 있다.
따라서, 본 발명은 비-전분 폴리사카라이드를 포함하는 기질을 처리하는 방법을 제공하고, 이때 상기 처리는 셀룰로스, 헤미셀룰로스 및/또는 펙틴성 물질의 분해, 가수분해 및/또는 변경을 포함한다.
이와 관련하여 분해는 상기 처리가 셀룰로스, 헤미셀룰로스 및/또는 펙틴성 물질의 가수분해 생성물을 생성한다는 것, 즉 유사한 비처리된 비-전분 폴리사카라이드에 존재하는 것보다 더 짧은 길이의 사카라이드가 처리의 결과로서 존재한다는 것을 시사한다. 따라서, 이와 관련하여 분해는 올리고사카라이드 및/또는 당 단량체를 유리시킬 수 있다.
모든 식물들은 사실상 모든 식물 유래의 폴리사카라이드 물질들처럼 비-전분 폴리사카라이드를 함유한다. 따라서, 비-전분 폴리사카라이드를 포함하는 기질을 처리하는 본 발명의 방법에서 상기 기질은 식물 또는 식물 유래의 물질의 형태, 또는 식물 또는 식물 유래의 물질을 포함하는 물질, 예를 들면, 식물 펄프, 식물 추출물, 식품 또는 이의 성분, 옷감, 직물 또는 의복의 형태로 제공될 수 있다.
본 발명에서 사용되기에 적합한 리그노셀룰로스용해 바이오매스는 바이오매스를 포함하고 순수 바이오매스 및/또는 비-순수 바이오매스, 예컨대, 농업 바이오매스, 상업 유기물, 건축 및 파괴 잔해, 자치도시 고체 폐기물, 폐지 및 구내 폐기물을 포함할 수 있다. 흔한 형태의 바이오매스는 나무, 관목 및 잔디, 밀, 밀짚, 사탕수수 찌꺼기, 옥수수, 옥수수 껍질, 옥수수 속대, 옥수수 알(알로부터의 섬유를 포함함), 곡물, 예컨대, 옥수수, 밀 및 보리의 제분(습식 제분 및 건식 제분을 포함함)으로부터의 생성물 및 부산물(종종 "겨 또는 섬유"로서 지칭됨)뿐만 아니라, 자치도시 고체 폐기물, 폐지 및 구내 폐기물도 포함한다. 바이오매스는 초본 물질, 농업 잔류물, 임업 잔류물, 자치도시 고체 폐기물, 폐지, 및 펄프 및 종이 제분 잔류물일 수도 있으나 이들로 한정되지 않는다. "농업 바이오매스"는 가지, 덤불, 줄기, 옥수수 및 옥수수 껍질, 에너지 작물, 숲, 과일, 꽃, 곡물, 잔디, 초본 작물, 잎, 나무껍질, 솔잎, 통나무, 뿌리, 묘목, 짧은 회전 목재 작물, 관목, 수수, 나무, 채소, 과일 껍질, 포도나무, 사탕무 펄프, 밀 분쇄물, 귀리 껍질, 및 경질 및 연질 목재(유해한 물질을 갖는 목재를 포함하지 않음)를 포함한다. 추가로, 농업 바이오매스는 농사 및 임업 활동을 포함하는 농업 공정으로부터 발생된 유기 폐기 물질(구체적으로, 산림 목재 폐기물을 포함함)을 포함한다. 농업 바이오매스는 단독으로 존재하거나 임의의 조합물 또는 혼합물로 존재하는 상기 언급된 물질들 중 임의의 물질일 수 있다. 적합한 바이오매스의 추가 예는 과수원 밑자리 잎, 수풀, 제분 폐기물, 도시 목재 폐기물, 자치도시 폐기물, 벌목 폐기물, 산림 간벌, 짧은 회전 목재 작물, 산업 폐기물, 밀짚, 귀리짚, 벼짚, 보리짚, 호밀짚, 아마짚, 대두 껍질, 벼 껍질, 벼짚, 옥수수 글루텐 사료, 귀리 껍질, 사탕수수, 옥수수대, 옥수수 줄기, 옥수수 속대, 옥수수 껍질, 대초원 목초, 가마그래스(gamagrass), 뚝새풀, 사탕무 펄프, 시트러스 과일 펄프, 종자 껍질, 셀룰로스성 동물 폐기물, 잔디 절단조각, 목화, 해초, 나무, 관목, 잔디, 밀, 사탕수수 찌꺼기, 옥수수, 옥수수 속대, 옥수수 알, 알로부터의 섬유, 곡물의 습식 또는 건식 제분으로부터의 생성물 및 부산물, 자치도시 고체 폐기물, 폐지, 구내 폐기물, 초본 물질, 농업 잔류물, 임업 잔류물, 펄프, 종이 제분 잔류물, 가지, 덤불, 줄기, 에너지 작물, 숲, 과일, 꽃, 곡물, 초본 작물, 잎, 나무껍질, 솔잎, 통나무, 뿌리, 묘목, 수수, 채소, 과일 껍질, 포도나무, 사탕무 펄프, 밀 분쇄물, 및 경질 및 연질 목재, 농업 과정으로부터 발생된 유기 폐기 물질, 산림 목재 폐기물, 또는 이들 중 임의의 둘 이상의 물질들의 조합물이다.
식품 및 사료 또는 종이 및 펄핑 산업에서 이미 가공된 순수한 바이오매스 또는 공급원료와 별도로, 효소 분해를 향상시키기 위해 바이오매스/공급원료는 열, 기계적 및/또는 화학적 변경, 또는 이러한 방법들의 임의의 조합에 의해 추가로 전처리될 수 있다.
전처리
효소 처리 전에, 효소 가수분해에의 기질의 접근성을 향상시키고/시키거나, 헤미셀룰로스를 가수분해하고/하거나, 헤미셀룰로스, 셀룰로스 및/또는 리그닌을 가용화시키기 위해 공급원료는 임의적으로 당분야에서 공지되어 있는 임의의 방식으로 열, 기계적 및/또는 화학적 변경, 또는 이러한 방법들의 임의의 조합에 의해 전처리될 수 있다. 전처리는 리그노셀룰로스성 물질을 (고온) 물, 증기(증기 폭발), 산, 염기, 용매, 열, 퍼록사이드, 오존, 기계적 채썰기(shredding), 연마, 제분 또는 신속한 압력제거, 또는 이들 중 임의의 둘 이상의 조합에 노출시키는 단계를 포함할 수 있다. 이 화학적 전처리는 종종 열 전처리, 예를 들면, 1분 내지 30분 동안 150℃ 내지 220℃에서의 전처리와 조합된다.
전당화(presaccharification)
전처리 단계 후, 효소 또는 효소 혼합물과의 항온처리를 수반하는 액화/가수분해 또는 전당화 단계가 이용될 수 있다. 전당화 단계는 많은 상이한 온도에서 수행될 수 있으나, 전당화 단계는 시험되는 효소 혼합물에 가장 잘 맞는 온도, 또는 시험되는 효소의 예상된 효소 최적 온도에서 일어나는 것이 바람직하다. 전당화 단계의 온도는 약 10℃ 내지 약 95℃, 약 20℃ 내지 약 85℃, 약 30℃ 내지 약 70℃, 약 40℃ 내지 약 60℃, 약 37℃ 내지 약 50℃, 바람직하게는 약 37℃ 내지 약 80℃, 보다 바람직하게는 약 60℃ 내지 70℃, 훨씬 더 바람직하게는 약 65℃일 수 있다. 전당화 혼합물의 pH는 약 2.0 내지 약 10.0일 수 있으나, 바람직하게는 약 3.0 내지 약 7.0, 보다 바람직하게는 약 4.0 내지 약 6.0, 훨씬 더 바람직하게는 약 4.0 내지 약 5.0이다. 또한, pH는 효소 활성을 최대화하도록 조절될 수 있고 효소의 첨가에 의해 조절될 수 있다. 이 시험으로부터의 분석 결과의 비교는 방법을 시험되는 효소에 가장 잘 맞도록 변경시킬 수 있게 할 것이다.
액화/가수분해 또는 전당화 단계 반응은 수분 내지 수시간, 예컨대, 약 1시간 내지 약 120시간, 바람직하게는 약 2시간 내지 약 48시간, 보다 바람직하게는 약 2시간 내지 약 24시간, 가장 바람직하게는 약 2시간 내지 약 6시간 동안 일어날 수 있다. 셀룰라제 처리는 수분 내지 수시간, 예컨대, 약 6시간 내지 약 120시간, 바람직하게는 약 12시간 내지 약 72시간, 보다 바람직하게는 약 24시간 내지 48시간 동안 일어날 수 있다.
당화
본 발명은 리그노셀룰로스성 물질로부터 당을 제조하는 방법으로서, 본 발명의 폴리펩티드 또는 본 발명의 조성물을 리그노셀룰로스성 물질과 접촉시키는 단계를 포함하는 방법을 제공한다.
이러한 방법은 자유 당(단량체) 및/또는 올리고사카라이드가 리그노셀룰로스성 바이오매스로부터 생성될 수 있게 한다. 이 방법은 본 발명의 폴리펩티드 또는 조성물을 사용하여 리그노셀룰로스성 바이오매스를 자유 당 및 작은 올리고사카라이드로 전환시키는 단계를 포함한다.
복합 탄수화물, 예컨대, 리그노셀룰로스를 당으로 전환시키는 공정은 바람직하게는 발효가능한 당으로의 전환을 가능하게 한다. 이러한 공정은 "당화"로서 지칭될 수 있다. 따라서, 본 발명의 방법은 하나 이상의 헥소스 및/또는 펜토스 당, 예컨대, 글루코스, 자일로스, 아라비노스, 갈락토스, 갈락투론산, 글루쿠론산, 만노스, 람노스, 리보스 및 프럭토스 중 하나 이상을 유리시킬 수 있다.
따라서, 본 발명의 또 다른 양태는 추가 효소 또는 물리적 처리, 예컨대, 온도 및 pH와 함께 전술된 본 발명의 폴리펩티드 또는 조성물을 사용하여 리그노셀룰로스성 식물 바이오매스를 당 및 올리고사카라이드로 전환시키는 방법을 포함한다.
조성물이 단일 혼합물로서 논의되어 있지만, 온도, pH 및 다른 조건이 각각의 개별 효소의 활성을 증가시키도록 변경될 수 있는 경우 효소가 순차적으로 첨가될 수 있다는 것은 인식되어 있다. 대안적으로, 효소 혼합물에 대한 최적 pH 및 온도가 결정될 수 있다.
효소는 임의의 적절한 조건 하에서 기질과 반응한다. 예를 들면, 효소는 약 25℃, 약 30℃, 약 35℃, 약 37℃, 약 40℃, 약 45℃, 약 50℃, 약 55℃, 약 60℃, 약 65℃, 약 70℃, 약 75℃, 약 80℃, 약 85℃ 또는 약 90℃ 이상에서 항온처리될 수 있다. 즉, 효소는 예를 들면, 낮은 내지 중간 이온 강도 및/또는 낮은 내지 중성 pH의 완충제에서 약 20℃ 내지 약 95℃의 온도에서 항온처리될 수 있다. "중간 이온 강도"는 완충제가 임의의 단일 이온 성분에 대해 약 200 밀리몰(mM) 이하의 이온 농도를 갖는다는 것을 의미한다. pH는 약 pH 2.5, 약 pH 3.0, 약 pH 3.5, 약 pH 4.0, 약 pH 4.5, 약 pH 5, 약 pH 5.5, 약 pH 6, 약 pH 6.5, 약 pH 7, 약 pH 7.5, 약 pH 8.0 내지 약 pH 8.5일 수 있다. 일반적으로, pH 범위는 약 pH 3.0 내지 약 pH 7일 것이다. 에탄올 생성의 경우, 산성 배지, 예를 들면, pH=4의 배지가 바람직한 반면, 바이오가스 생성의 경우 중성 pH, 예를 들면, pH=7이 바람직하다. 이 조건 하에서의 효소 조합물의 항온처리는 리그노셀룰로스로부터 상당한 양의 당을 방출시키거나 유리시킨다. 상당한 양은 이용가능한 당의 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 95% 이상을 의미한다.
폴리펩티드, 예컨대, 효소는 미생물, 효모, 진균, 세균 또는 식물에서 외생적으로 생성된 후 단리되고, 예를 들면, 리그노셀룰로스성 공급원료에 첨가될 수 있다. 대안적으로, 효소는 생성되지만 단리되지 않고, 미정제 세포 덩어리 발효 브로쓰 또는 식물 물질(예컨대, 옥수수대) 등이 예를 들면, 공급원료에 첨가될 수 있다. 대안적으로, 미정제 세포 덩어리, 효소 생성 배지 또는 식물 물질은 (예를 들면, 가열 또는 항미생물제의 첨가에 의해) 추가 미생물 생장을 방지하도록 처리된 후, 예를 들면, 공급원료에 첨가될 수 있다. 이들 미정제 효소 혼합물들은 효소를 생성하는 유기체를 포함할 수 있다. 대안적으로, 효소는 공급원료(예컨대, 옥수수대)를 사용하여 영양분을 효소 생성 유기체에게 제공하는 발효에서 생성될 수 있다. 이 방식으로, 효소를 생성하는 식물은 그 자체가 리그노셀룰로스성 공급원료로서 사용될 수 있고 리그노셀룰로스성 공급원료 내로 첨가될 수 있다.
당의 발효
발효가능한 당은 유용한 부가 가치 발효 생성물로 전환될 수 있고, 이 발효 생성물의 비-한정적 예에는 아미노산, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학 공급원료, 플라스틱, 용매, 연료 또는 다른 유기 중합체, 젖산 및 에탄올(연료 에탄올을 포함함)이 포함된다. 구체적으로, 당은 화학물질, 플라스틱, 예를 들면, 석신산 및 (바이오)연료(에탄올, 메탄올, 부탄올, 합성 액체 연료 및 바이오가스를 포함함)로의 발효를 위한 공급원료로서 사용될 수 있다.
예를 들면, 본 발명의 방법에서, 효소 또는 효소의 조합물은 공급원료로서 사용되는 리그노셀룰로스성 기질 또는 식물 바이오매스에 작용함으로써, 에탄올 또는 다른 유용한 발효 생성물을 생성하도록 이 복합 기질을 단순한 당 및 올리고사카라이드로 전환시킨다.
바이오매스로부터 방출된 당은 유용한 발효 생성물, 예컨대, 아미노산, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학 공급원료, 플라스틱 및 에탄올(연료 에탄올을 포함함)을 포함하나 이들로 한정되지 않는 발효 생성물들 중 하나로 전환될 수 있다.
따라서, 본 발명은 발효 생성물의 제조 방법으로서,
a. 본원에 기재된 방법을 이용하여 리그노셀룰로스를 분해하는 단계; 및
b. 생성된 물질을 발효시켜 발효 생성물을 제조하는 단계
를 포함하는 방법을 제공한다.
발효는 호기성 또는 혐기성 조건 하에서 수행될 수 있다. 바람직하게는, 이 공정은 미호기성(micro-aerophilic) 또는 산소-한정된 조건 하에서 수행된다.
본원에서 혐기성 발효 공정은 산소의 부재 하에서 수행되는 발효 공정, 또는 실질적으로 산소가 소모되지 않는, 바람직하게는 약 5 mmol/ℓ/h 이하, 약 2.5 mmol/ℓ/h 이하 또는 약 1 mmol/ℓ/h 이하의 산소가 소모되는 발효 공정으로서 정의되고, 이때 유기 분자는 전자 공여자 및 전자 수용자 둘다로서 사용된다.
산소-한정된 발효 공정은 산소 소모가 기체로부터 액체에로의 산소 전달에 의해 한정되는 공정이다. 산소 한정의 정도는 들어오는 기류의 양 및 조성뿐만 아니라 이용된 발효 장치의 실제 혼합/물질 전달 성질에 의해서도 결정된다. 바람직하게는, 산소-한정된 조건 하에서의 공정에서 산소 소모의 속도는 약 5.5 mmol/ℓ/h 이상, 보다 바람직하게는 약 6 mmol/ℓ/h 이상, 훨씬 더 바람직하게는 약 7 mmol/ℓ/h 이상이다.
발효 생성물의 제조 방법은 임의적으로 발효 생성물을 회수하는 단계를 포함할 수 있다.
SSF
발효 및 당화는 동시적인 당화 및 발효(SSF) 방식으로 수행될 수도 있다. 이 방식의 장점들 중 하나는 효소 가수분해에 대한 당 억제의 감소이다(셀룰라제에 대한 당 억제는 문헌(Caminal B&B Vol XXVII Pp 1282-1290)에 기재되어 있다).
발효 생성물
본 발명에 따라 제조될 수 있는 발효 생성물은 아미노산, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학 공급원료, 플라스틱, 용매, 연료 또는 다른 유기 중합체, 젖산 및 에탄올(연료 에탄올을 포함함)(용어 "에탄올"은 에틸 알코올, 또는 에틸 알코올과 물의 혼합물을 포함하는 것으로 이해됨)을 포함한다.
본 발명의 방법에 따라 제조될 수 있는 특정 부가 가치 생성물은 바이오연료(에탄올 및 부탄올, 및 바이오가스를 포함함); 젖산; 플라스틱; 특수 화학물질; 시트르산, 석신산, 푸마르산, 이타콘산 및 말레산을 비롯한 유기산; 3-하이드록시-프로피온산; 아크릴산; 아세트산; 1,3-프로판-다이올; 에틸렌; 글리세롤; 용매; 동물 사료 보충제; 약제, 예컨대, β-락탐 항생제 또는 세팔로스포린; 비타민; 아미노산, 예컨대, 라이신, 메티오닌, 트립토판, 쓰레오닌 및 아스파르트산; 산업 효소, 예컨대, 프로테아제, 셀룰라제, 아밀라제, 글루카나제, 락타제, 리파제, 라이아제, 옥시도리덕타제, 트랜스퍼라제 또는 자일라나제; 및 화학 공급원료를 포함하나 이들로 한정되지 않는다.
바이오가스
본 발명은 바이오가스 제조 방법에 있어서 본원에 기재된 폴리펩티드 또는 조성물의 용도도 제공한다. 바이오가스는 전형적으로 산소의 부재 하에서 유기 물질, 예를 들면, 비-전분 탄수화물 함유 물질의 생물학적 분해에 의해 생성된 가스를 지칭한다. 바이오가스는 생물생성(biogenic) 물질로부터 유래되고 바이오연료의 한 종류이다. 바이오가스의 한 종류는 생분해가능한 물질, 예컨대, 바이오매스, 거름 또는 하수, 자치도시 폐기물 및 에너지 작물의 혐기성 분해 또는 발효에 의해 생성된다. 이 종류의 바이오가스는 주로 메탄 및 이산화탄소로 구성된다. 메탄 가스는 연소될 수 있거나 산소에 의해 산화될 수 있다. 공기는 21%의 산소를 함유한다. 이 에너지 방출은 바이오가스가 연료로서 사용될 수 있게 한다. 바이오가스는 임의의 가열 목적, 예컨대, 요리를 위해 임의의 국가에서 저렴한 연료로서 사용될 수 있다. 바이오가스는 현대식 폐기물 관리 시설에서도 사용될 수 있고, 이 시설에서 바이오가스는 임의의 종류의 열 엔진을 작동시켜 기계적 또는 전기적 동력을 발생시키는 데에 사용될 수 있다.
미생물 바이오가스 제조에서 제1 단계는 중합체 및 복합 기질(예를 들면, 비-전분 탄수화물)의 효소 분해로 구성된다. 따라서, 본 발명은 비-전분 탄수화물을 포함하는 기질을 본 발명의 폴리펩티드 또는 조성물과 접촉시켜 유기체, 예컨대, 미생물에 의해 바이오가스로 전환될 수 있는 발효가능한 물질을 생성하는 바이오가스 제조 방법을 제공한다. 이러한 방법에서, 본 발명의 폴리펩티드는 유기체, 예를 들면, 이러한 폴리펩티드를 발현하는 미생물에 의해 제공될 수 있다.
식품에서의 효소의 용도
본 발명의 폴리펩티드 및 조성물은 식물 물질을 가공하는 방법에서 사용되어 식물 또는 진균 물질의 세포벽의 셀룰로스, 헤미셀룰로스 또는 펙틴성 물질 성분을 분해할 수 있거나 변경시킬 수 있다. 이러한 방법은 식품의 제조에 유용할 수 있다. 따라서, 본 발명은 식품의 제조 동안 본 발명의 폴리펩티드 또는 조성물을 도입하는 식품 제조 방법을 제공한다.
본 발명은 식물 물질을 가공하는 방법으로서, 식물 물질을 본 발명의 폴리펩티드 또는 조성물과 접촉시켜 상기 (식물) 물질에서 셀룰로스를 분해하거나 변경시키는 단계를 포함하는 방법도 제공한다. 바람직하게는, 식물 물질은 식물 펄프 또는 식물 추출물, 예컨대, 쥬스이다.
본 발명은 식물 추출물의 점성, 투명성 및/또는 여과성을 감소시키는 방법으로서, 식물 추출물을 이 식물 추출물에 함유된 셀룰로스, 헤미셀룰로스 또는 펙틴성 물질의 분해에 효과적인 양의 본 발명의 폴리펩티드 또는 조성물과 접촉시키는 단계를 포함하는 방법도 제공한다.
식물 및 셀룰로스/헤미셀룰로스/펙틴성 물질 함유 물질은 식물 펄프, 식물의 일부 및 식물 추출물을 포함한다. 본 발명과 관련하여 식물 물질로부터의 추출물은 (기계적 및/또는 화학적) 추출, 가공 또는 다른 분리 기법에 의해 식물 물질로부터 유도될 수 있는 임의의 물질이다. 추출물은 쥬스, 넥타, 염기, 또는 이들의 농축물일 수 있다. 식물 물질은 채소, 예를 들면, 당근, 셀러리, 양파, 콩류 또는 콩과 식물(콩, 대두, 땅콩) 또는 과일, 예를 들면, 이과 또는 종자 과일(사과, 배, 모과 등), 포도, 토마토, 시트러스(오렌지, 레몬, 라임, 만다린), 멜론, 프룬, 체리, 까막까치밥나무, 레드커런트(redcurrant), 라즈베리, 딸기, 크랜베리, 파인애플 및 다른 열대 과일, 나무 및 이의 일부(예를 들면, 소나무 화분), 또는 곡물(귀리, 보리, 밀, 옥수수, 벼)을 포함할 수 있거나 이들로부터 유래될 수 있다. (가수분해될) 상기 물질은 농업 잔류물, 예컨대, 사탕무 펄프, 옥수수 속대, 밀짚, (땅속) 견과껍질, 또는 재활용가능한 물질, 예를 들면, (폐기된) 종이일 수도 있다.
따라서, 본 발명의 폴리펩티드는 식물 펄프 및 식물 추출물을 비롯한 식물 물질의 처리에 사용될 수 있다. 본 발명의 폴리펩티드는 액체 또는 고체 식품 또는 식용가능한 식품 성분의 처리에 사용될 수도 있거나, 커피, 식물유 또는 전분의 추출에 사용될 수도 있거나, 식품에서 증점제로서 사용될 수도 있다.
전형적으로, 본 발명의 폴리펩티드는 전술된 조성물/효소 제제로서 사용된다. 조성물은 일반적으로 예를 들면, 식물 물질의 기계적 가공, 예컨대, 분쇄 또는 제분에 의해 수득될 수 있는 식물 펄프에 첨가될 것이다. 조성물과 식물의 항온처리는 전형적으로 10분 내지 5시간, 예컨대, 30분 내지 2시간, 바람직하게는 약 1시간 동안 수행될 것이다. 가공 온도는 바람직하게는 약 10℃ 내지 약 55℃, 예를 들면, 약 15℃ 내지 약 25℃, 최적으로 약 20℃이고, 처리될 물질 톤(ton) 당 약 10 g 내지 약 300 g, 바람직하게는 약 30 g 내지 약 70 g, 최적으로 약 50 g의 효소를 사용할 수 있다.
사용되는 모든 효소 또는 이들의 조성물은 식물 펄프에 순차적으로 또는 동시에 첨가될 수 있다. 효소 제제의 조성에 따라 식물 물질은 먼저 (예를 들면, 순수할 때까지) 침연될(macerated) 수 있거나 액화될 수 있다. 본 발명의 폴리펩티드를 사용하여 가공 파라미터, 예컨대, 추출의 수율, 추출물의 점성 및/또는 추출물의 품질을 개선할 수 있다.
대안적으로 또는 추가로, 본 발명의 폴리펩티드는 식물 펄프를 압착시키거나 액화시킴으로써 수득된 생쥬스에 첨가될 수 있다. 생쥬스의 처리는 용량, 온도 및 유지 시간 면에서 식물 펄프와 유사한 방식으로 수행될 것이다. 또한, 다른 효소, 예컨대, 앞서 논의된 효소가 포함될 수 있다. 전형적인 항온처리 조건은 이전 단락에 기재된 바와 같다.
일단 생쥬스가 본 발명의 폴리펩티드와 함께 항온처리되면, 상기 쥬스를 원심분리하거나 (한외)여과하여 최종 생성물을 생성한다.
본 발명의 폴리펩티드를 사용한 처리 후, 본 발명의 폴리펩티드를 부분적으로 또는 전체적으로 불활성화시키는 조건 하에서 예를 들면, 약 1분 내지 약 1시간 동안 약 100℃에서 (최종) 생성물을 열 처리할 수 있다.
본 발명의 폴리펩티드를 함유하는 조성물은 과일 또는 채소 퓌레(purees)의 제조 동안 사용될 수도 있다.
본 발명의 폴리펩티드는 양조, 와인 제조, 증류 또는 베이킹에 사용될 수도 있다. 따라서, 상기 폴리펩티드는 알코올성 음료, 예컨대, 와인 및 맥주의 제조에 사용될 수 있다. 예를 들면, 상기 폴리펩티드는 예를 들면, 맥주, (예를 들면, 보리 및/또는 수수 맥아를 함유하는) 맥아즙 또는 와인의 여과성 또는 투명성을 개선할 수 있다.
나아가, 본 발명의 폴리펩티드 또는 조성물은 양조업자가 소모한 곡물, 즉 보리 또는 맥아 보리, 또는 다른 곡물을 함유하는 보리 맥아즙 생성의 잔류물을 처리하여, 예를 들면, 동물 사료를 위한 상기 잔류물의 활용을 개선하는 데에 사용될 수 있다.
단백질은 예를 들면, 유기물로부터 유래된 증류 폐기물이 미생물 바이오매스로 생물전환되는 브로쓰 또는 배양 배지로부터 용해된 유기 물질을 제거하는 것을 보조할 수 있다. 본 발명의 폴리펩티드는 예컨대, (예를 들면, α-아밀라제를 사용한) 액화에 의해 생성된 곡물로부터의 글루코스 시럽에서 여과성을 개선할 수 있고/있거나 점성을 감소시킬 수 있다.
베이킹에서, 폴리펩티드는 도우(dough) 구조를 개선할 수 있거나, 그의 점착성 또는 유연성을 변경시킬 수 있거나, 덩어리(loaf) 부피 및/또는 부스러기 구조를 개선할 수 있거나, 보다 더 우수한 질감 특성, 예컨대, 깨지거나, 찢어지거나 부서지는 질감을 부여할 수 있다.
따라서, 본 발명은 본 발명의 폴리펩티드 또는 조성물을 도우 내로 도입하는 단계를 포함하는, 도우 또는 곡물-기제 식품의 제조 방법에 관한 것이다. 이것은 상기 도우 또는 이 도우로부터 수득된 곡물-기제 식품의 하나 이상의 성질을, 상기 폴리펩티드가 도입되지 않은 도우 또는 곡물-기제 식품에 비해 개선할 수 있다.
본 발명에 따른 곡물-기제 식품의 제조는 당분야에서 공지되어 있는 단계, 예컨대, 수득된 도우를 끓이거나, 건조하거나, 튀기거나 증기처리하거나 굽는 단계를 추가로 포함할 수 있다.
끓여진 도우로부터 제조된 제품은 예를 들면, 끓여진 면 및 덤플링(dumpling)이고, 튀겨진 도우로부터 제조된 제품은 예를 들면, 도우넛, 튀김 및 튀긴 면이고, 증기처리된 도우로부터 제조된 제품은 예를 들면, 증기처리된 번(bun) 및 증기처리된 면이고, 건조된 도우로부터 제조된 제품의 예는 파스타 및 건조된 면이고, 구워진 도우로부터 제조된 제품의 예는 빵, 쿠키 및 케이크이다.
본원에서 용어 "개선된 성질"은 본 발명에 따른 폴리펩티드가 도입되지 않은 도우 또는 제품에 비해 본 발명에 따른 폴리펩티드의 작용에 의해 개선되는, 도우 및/또는 도우로부터 수득된 제품, 특히 곡물-기제 식품의 임의의 성질로서 정의된다. 개선된 성질은 도우의 증가된 강도, 도우의 증가된 탄성, 도우의 증가된 안정성, 도우의 개선된 기계가공성, 도우의 개선된 가공 내성, 도우의 감소된 점착성, 도우의 개선된 연신성, 곡물-기제 식품의 증가된 부피, 곡물-기제 식품의 감소된 블리스터링, 구워진 제품의 개선된 부스러기 구조, 곡물-기제 식품의 개선된 연성, 곡물-기제 식품의 개선된 풍미, 및 곡물-기제 식품의 개선된 노화방지를 포함할 수 있으나 이들로 한정되지 않는다. 파스타 및 면 종류의 곡물-기제 제품과 관련된 개선된 성질은 예를 들면, 개선된 견고성, 감소된 점착성, 개선된 응집성 및 감소된 조리 손실이다.
개선된 성질은 본 발명의 폴리펩티드를 첨가하여 제조한 도우 및/또는 곡물-기제 식품을 본 발명의 폴리펩티드를 첨가하지 않고 제조한 도우 및/또는 곡물-기제 식품과 비교함으로써 확인될 수 있다. 감각수용성 품질은 베이킹 산업에서 잘 확립된 절차를 이용함으로써 평가될 수 있고, 예를 들면, 훈련받은 맛 시험관(taste-tester)의 패널의 이용을 포함할 수 있다.
본원에서 용어 "도우"는 혼련하거나 롤링하기에 충분한 강도의 곡물 가루와 다른 성분의 혼합물로서 정의된다. 곡물의 예는 밀, 호밀, 옥수수, 메이즈(maize), 보리, 벼, 그로트(groats), 메밀 및 귀리이다. 여기서 및 이하에서 밀은 트라이티쿰(Triticum) 속의 모든 공지되어 있는 종들, 예를 들면, 소맥(aestivum), 듀럼밀(durum) 및/또는 스펠트밀(spelt)을 포괄하기 위한 것이다. 적합한 다른 성분의 예는 본 발명에 따른 셀로바이오하이드롤라제, 추가 효소, 화학적 첨가제 및/또는 가공 보조제이다. 도우는 새로 만든 것일 수 있거나, 냉동될 수 있거나, 제조될 수 있거나 미리 구워질 수 있다. 전술된 성분들로부터의 도우의 제조는 당분야에서 잘 공지되어 있고, 상기 성분들과 가공 보조제의 혼합, 및 하나 이상의 성형 및 임의적으로 발효 단계를 포함한다. 냉동된 도우의 제조는 문헌(Kulp and Lorenz, Frozen and Refrigerated Doughs and Batters)에 기재되어 있다.
본원에서 용어 "곡물-기제 식품"은 도우로부터 제조된, 연한 또는 부스러지는 특성을 갖는 임의의 제품으로서 정의된다. 백색 유형이든, 밝은 색 유형이든 아니면 어두운 색 유형이든 관계없이 본 발명에 의해 유리하게 제조될 수 있는 곡물-기제 식품의 예는 전형적으로 덩어리 또는 롤 형태의 빵(특히, 백색, 통밀 또는 호밀 빵), 프랑스 바게트 유형 빵, 파스타, 면, 도우넛, 베이글, 케이크, 피타 빵, 토틸라(tortillas), 타코, 팬케이크, 비스킷, 쿠키, 파이 크러스트, 찐빵 및 귀리빵 등이다.
본원에서 용어 "구워진 제품"은 도우의 베이킹에 의해 제조된 임의의 곡물-기제 식품으로서 정의된다.
비-전분 폴리사카라이드(NSP)는 소화물의 점성을 증가시켜 영양분 이용가능성 및 동물 성능을 감소시킬 수 있다. 본 발명의 셀로바이오하이드롤라제의 사용은 인 사용뿐만 아니라 동물 소화 동안 양이온 광물 및 단백질을 개선할 수 있다.
사료에의 특정 영양분의 첨가는 동물 소화를 개선하여 사료 가격을 감소시킨다. 많은 사료 첨가제들이 현재 사용되고 있고, 새로운 개념이 계속 개발되고 있다. 섬유가 분해될 때 단백질의 접근성이 더 우수해지기 때문에, 특정 효소, 예컨대, 비-전분 탄수화물 분해 효소의 사용은 섬유를 분해하여 에너지를 방출시킬 수 있을 뿐만 아니라 단백질 소화능도 증가시킬 수 있다. 이 방식으로 사료 가격이 떨어질 수 있을 뿐만 아니라 사료 중의 단백질 수준도 감소될 수 있다.
비-전분 폴리사카라이드(NSP)도 사실상 식물 유래의 모든 사료 성분들에 존재한다. NSP는 잘 사용되지 않고, 가용화될 때 소화에 대한 불리한 영향을 발휘할 수 있다. 외생성 효소는 이 NSP의 보다 더 우수한 사용에 기여할 수 있고, 그 결과 임의의 항-영양 효과를 감소시킬 수 있다. 본 발명의 비-전분 탄수화물 분해 효소는 가금류, 및 보다 덜한 정도로 돼지 및 다른 종을 위한 곡물-기제 정규식에서 이 목적으로 사용될 수 있다.
본 발명의 비-전분 탄수화물 분해 폴리펩티드/효소(또는 본 발명의 폴리펩티드/효소를 포함하는 조성물)는 세제 산업, 예를 들면, 세탁물로부터의 탄수화물-기제 얼룩의 제거에 사용될 수 있다. 세제 조성물은 본 발명의 폴리펩티드/효소, 및 추가로 셀룰라제, 헤미셀룰라제, 펙티나제, 프로테아제, 리파제, 쿠티나제(cutinase), 아밀라제 및 카보하이드라제(carbohydrase) 중 하나 이상을 포함할 수 있다.
세제 조성물에서의 효소의 용도
본 발명의 폴리펩티드 또는 조성물을 포함하는 세제 조성물은 임의의 편리한 형태, 예를 들면, 페이스트, 겔, 분말 또는 액체로 존재할 수 있다. 액체 세제는 전형적으로 약 70% 이하의 물 및 약 0% 내지 약 30%의 유기 용매 또는 비-수성 물질을 함유하는 수성 액체 세제일 수 있다.
이러한 세제 조성물은 예를 들면, 오염된 직물의 전처리에 적합한 세탁물 첨가제 조성물 및 린스-첨가된 직물 연화제 조성물을 비롯한 손 또는 기계 세탁물 세제 조성물로서 제제화될 수 있거나, 일반적으로 가정 경질 표면 세척 작업에서 사용되는 세제 조성물로서 제제화될 수 있거나, 손 또는 기계 접시 세척 작업용으로 제제화될 수 있다.
일반적으로, 효소의 성질은 선택된 세제에 적합해야 하고(예를 들면, pH-최적치, 다른 효소 및/또는 비-효소 성분과의 상용성 등), 효소는 유효량으로 존재해야 한다.
세제 조성물은 계면활성제, 예를 들면, 음이온성 또는 비-이온성 계면활성제, 세제 구축제 또는 착물화제, 하나 이상의 중합체, 표백 시스템(예를 들면, H2O2 공급원), 또는 효소 안정화제를 포함할 수 있다. 세제 조성물은 임의의 다른 보편적인 세제 성분, 예를 들면, 점토를 포함하는 컨디셔너, 거품 증강제(foam booster), 거품 억제제, 항부식제, 오물 현탁제, 오물 재침착 방지제, 염료, 살세균제, 광증백제, 하이드로트롭(hydrotropes), 변색 억제제 또는 방향제도 포함할 수 있다.
종이 및 펄프 가공에서의 효소의 용도
본 발명의 폴리펩티드 또는 조성물은 종이 및 펄프 산업, 특히 표백 공정에서 표백된 펄프의 명도를 향상시키고(이에 따라 표백 단계에서 사용되는 염소의 양이 감소될 수 있음) 재활용된 종이 공정에서 펄프의 여수도(freeness)를 증가시키는 데에 사용될 수 있다(Eriksson, K. E. L., Wood Science and Technology 24 (1990):79-101; Paice, et al., Biotechnol. and Bioeng. 32 (1988):235-239 and Pommier et al., Tappi Journal (1989):187-191). 나아가, 본 발명의 폴리펩티드 또는 조성물은 리그노셀룰로스성 펄프의 표백능을 개선하도록 리그노셀룰로스성 펄프를 처리하는 데에 사용될 수 있다. 이에 따라, 펄프의 만족스러운 표백을 수득하기 위해 필요한 염소의 양이 감소될 수 있다.
본 발명의 폴리펩티드 또는 조성물은 셀룰로스 함유 직물이 거칠어지는 속도를 감소시키거나 셀룰로스 함유 직물의 거친 정도를 감소시키는 방법으로서, 셀룰로스 함유 직물을 전술된 폴리펩티드 또는 조성물로 처리하는 단계를 포함하는 방법에서 사용될 수 있다. 추가로, 본 발명은 착색된 셀룰로스 함유 직물의 색채 정화를 제공하는 방법으로서, 착색된 셀룰로스 함유 직물을 전술된 폴리펩티드 또는 조성물로 처리하는 단계를 포함하는 방법; 및 착색된 셀룰로스 함유 직물의 색채에서의 국한된 변경을 제공하는 방법으로서, 착색된 셀룰로스 함유 직물을 전술된 폴리펩티드 또는 조성물로 처리하는 단계를 포함하는 방법에 관한 것이다. 본 발명의 방법은 세척 동안 셀룰로스 함유 직물을 처리함으로써 수행될 수 있다. 그러나, 원하는 경우, 직물의 처리는 담구거나 린싱하는 동안 수행될 수도 있거나, 전술된 폴리펩티드 또는 조성물을 직물이 함침되거나 함침될 물에 단순히 첨가함으로써 수행될 수도 있다.
다른 효소 용도
추가로, 본 발명의 폴리펩티드 또는 조성물은 항균 제제뿐만 아니라 약품, 예컨대, 인후 로젠지, 치약 및 구강세척제에서도 사용될 수 있다.
하기 실시예는 본 발명을 예시한다.
실시예
실험 정보
균주 및 효소 조성물
아스퍼길러스 니게르 균주는 수탁번호 CBS 513.88로서 CBS(CENTRAAL BUREAU VOOR SCHIMMELCULTURES)에 기탁되어 있다.
라삼소니아(탈라로마이세스) 에머소니이 균주 TEC-142는 2009년 7월 1일에 수탁번호 CBS 124902로서 CBS(CENTRAAL BUREAU VOOR SCHIMMELCULTURES)(네덜란드 엔엘-3508 아데 우트레흐트 피.오. 박스 85167 업살라라안 8 소재)에 기탁되어 있다. TEC-142S는 TEC-142의 단일 단리물이다.
라삼소니아(탈라로마이세스) 에머소니이 균주는 1964년 12월에 수탁번호 CBS 393.64로서 CBS(CENTRAAL BUREAU VOOR SCHIMMELCULTURES)(네덜란드 엔엘-3508 아데 우트레흐트 피.오. 박스 85167 업살라라안 8 소재)에 기탁되었다. 본 발명의 효과 및 장점을 보여주기 위해 다른 적합한 균주들이 본 실시예에서 동등하게 사용될 수 있다. 예를 들면, TEC-101, TEC-147, TEC-192, TEC-201 또는 TEC-210은 국제 특허출원 공개 제WO2011/000949호에 기재된 적합한 라삼소니아 균주이다.
TEC-210 셀룰라제 함유 조성물은 국제 특허출원 공개 제WO2011/000949호에 기재된 절차, 예컨대, 접종 및 발효에 따라 제조되었다.
β-글루코시다제(BG)는 국제 특허출원 공개 제WO2011/098577호에 기재된 바와 같이 아스퍼길러스 니게르에서의 EBA4의 과다발현 후 아스퍼길러스 니게르 형질전환체의 발효에 의해 제조된다. EBA4는 라삼소니아 에머소니이(탈라로마이세스 에머소니이) BG이고 국제 특허출원 공개 제WO2011/098577호에서 탈라로마이세스 에머소니이 β-글루코시다제(BG)로서 확인되어 있고 국제 특허출원 공개 제WO2011/098577호에서 서열번호 5로 표시되어 있다.
셀루클라스트(Celluclast)(트라이코데르마 셀룰라제)는 시그마(Sigma)로부터 입수되었다.
분자생물학 기법
이들 균주들에서 당업자에게 공지되어 있는 분자생물학 기법(문헌(Sambrook & Russell, Molecular Cloning: A Laboratory Manual, 3rd Ed., CSHL Press, Cold Spring Harbor, NY, 2001) 참조)을 이용하여 여러 유전자들을 과다발현시켰고 다른 유전자들을 후술된 바와 같이 하향조절하였다. 유전자 과다발현을 위한 발현 벡터 및 하향조절을 위한 파괴 벡터의 일반적인 디자인, 형질전환, 마커의 사용 및 선택 배지의 예는 국제 특허출원 공개 제WO1998/46772호, 국제 특허출원 공개 제WO1999/32617호, 국제 특허출원 공개 제WO2001/121779호, 국제 특허출원 공개 제WO2005/095624호, 국제 특허출원 공개 제WO2006/040312호, 유럽 특허 제635574B호, 국제 특허출원 공개 제WO2005/100573호, 국제 특허출원 공개 제WO2011/009700호, 국제 특허출원 공개 제WO2012/001169호 및 국제 특허출원 공개 제WO2011/054899호에서 발견될 수 있다. 모든 유전자 교체 벡터들은 예정된 게놈 좌위에서의 상동성 재조합을 위해 표적화하도록 각각의 ORF 서열의 약 1 kb 내지 2 kb 플랭킹 영역을 포함한다. 또한, 아스퍼길러스 니게르 벡터는 직접적인 반복부들 사이에 형질전환을 위한 아스퍼길러스 니둘란스 쌍방향 amdS 선택 마커를 함유한다. 본원의 모든 실시예들에서 유전자 결실을 위해 적용된 방법은 이중 교차에 의해 플랭킹 서열의 상동성 좌위에서 게놈 내로 삽입되어 결실될 유전자를 amdS 유전자로 치환시키는 선형 DNA를 사용한다. 형질전환 후, 직접적인 반복부는 (제2) 상동성 재조합 사건에 의한 선택 마커의 제거를 허용한다. amdS 마커의 제거는 플루오로-아세트아미드 배지 상에 플레이팅하여 마커 유전자 무함유 균주를 선택함으로써 수행될 수 있다. 유럽 특허 제0 635 574호에 "마커 유전자 무함유" 방법으로서도 기재되어 있는 이 형질전환 및 후속 반대-선택 방법을 이용하여 amdS 마커를 균주 변경 프로그램에서 무기한으로 사용할 수 있다.
배지 및 용액:
감자 덱스트로스 한천(PDA)(플루카(Fluka), 카탈로그 번호 70139): ℓ 당: 감자 추출물 4 g; 덱스트로스 20 g; 박토 한천 15 g; pH 5.4; 120℃에서 20분 동안 멸균한다.
라삼소니아 한천 배지: ℓ 당: 염 분획 제3번 15 g; 셀룰로스 30 g; 박토 펩톤 7.5 g; 곡물 가루 15 g; KH2PO4 5 g; CaCl2.2aq 1 g; 박토 한천 20 g; pH 6.0; 120℃에서 20분 동안 멸균한다.
염 분획 조성물: "염 분획 제3번"은 국제 특허출원 공개 제WO98/37179호의 표 1의 개시내용에 맞추어졌다. 이 표의 조성으로부터의 편차는 다음과 같았다: CaCl2.2aq 1.0 g/ℓ, KCl 1.8 g/ℓ, 시트르산 1aq 0.45 g/ℓ(킬레이팅제).
라삼소니아를 위한 진탕 플라스크 배지
라삼소니아 배지 1: ℓ 당: 글루코스 20 g; 효모 추출물(딥코(Difco)) 20 g; 클레롤(Clerol) FBA3107(AF) 4 방울; pH 6.0; 120℃에서 20분 동안 멸균한다.
라삼소니아 배지 2: ℓ 당: 염 분획 제3번 15 g; 셀룰로스 20 g; 박토 펩톤 4 g; 곡물 가루 7.5 g; KH2PO4 10 g; CaCl2.2H20 0.5 g; 클레롤 FBA3107(AF) 0.4 ㎖; pH 5; 120℃에서 20분 동안 멸균한다.
라삼소니아 배지 3: ℓ 당: 염 분획 제3번 15 g; 글루코스 50 g; 박토 펩톤 7.5 g; KH2PO4 10 g; CaCl2.2H20 0.5 g; 클레롤 FBA3107(AF) 0.4 ㎖; pH 5; 120℃에서 20분 동안 멸균한다.
라삼소니아를 위한 포자 회분 제조
40℃에서 5일 내지 7일 동안 10 cm 직경 페트리 접시 내의 라삼소니아 한천 배지 상에서 스톡(stock)으로부터의 균주를 생장시켰다. MTP 발효를 위해, 라삼소니아 한천 배지를 함유하는 96웰 플레이트에서 균주를 생장시켰다. 10% 글리세롤 중의 균주 스톡을 -80℃에서 저장하였다.
염색체 DNA 단리
균주를 42℃ 및 250 rpm에서 16시간 동안 YGG 배지(ℓ 당: 8 g KCl, 16 g 글루코스.H2O, 20 ㎖의 10% 효모 추출물, 10 ㎖의 100x 페니실린/스트렙토마이신, 6.66 g YNB+아미노산, 1.5 g 시트르산 및 6 g K2HPO4)에서 생장시키고 DNeasy 식물 미니 키트(퀴아젠(Qiagen), 독일 힐덴 소재)를 사용하여 염색체 DNA를 단리하였다.
라삼소니아의 MTP 발효
포자형성된 라삼소니아 에머소니이 균주를 갖는 96웰 마이크로타이터 플레이트(MTP)를 이용하여 MTP 발효를 위해 포자를 수거하였다. 이를 위해, 200 ㎕의 10배 희석된 라삼소니아 배지 1을 각각의 웰에 첨가하고, 혼합물을 재현탁한 후 100 ㎕의 포자 현탁액을 44℃, 550 rpm 및 80% 습도에서 16시간 동안 습한 진탕기(인포르스(Infors)) 내에서 항온처리하였다. 그 후, 50 ㎕의 예비배양물을 사용하여 MTP 플레이트에서 250 ㎕의 라삼소니아 배지 2를 접종하였다. 96웰 플레이트를 44℃, 550 rpm 및 80% 습도에서 6일 동안 습한 진탕기(인포르스) 내에서 항온처리하였다. 플레이트를 원심분리하고 상청액을 수거하였다.
라삼소니아의 진탕 플라스크 생장 프로토콜
100 ㎖의 라삼소니아 배지 2 또는 3을 함유하는 500 ㎖ 진탕 플라스크 내로 포자를 직접 접종하고 45℃ 및 250 rpm에서 3일 내지 4일 동안 항온처리 진탕기 내에서 항온처리하였다. 대안적으로, 라삼소니아 배지 1을 함유하는 100 ㎖ 진탕 플라스크 내에 포자를 접종하고 45℃ 및 250 rpm에서 1일(예비배양) 동안 항온처리 진탕기 내에서 항온처리한 후, 5 ㎖ 또는 10 ㎖의 바이오매스를 예비배양물로부터 100 ㎖의 라삼소니아 배지 2 또는 3을 함유하는 500 ㎖ 진탕 플라스크로 옮기고 전술된 바와 같은 조건 하에서 생장시켰다.
단백질 분석
NuPAGE 4% 내지 12% 비스-트라이스(Bis-Tris) 겔(인비트로겐, 네덜란드 브레다 소재) 상에서 환원 조건 하에서 단백질 샘플을 분리하고 염색하였다. 겔을 제조자의 설명서에 따라 인스탄트블루(InstantBlue)(익스페데온(Expedeon), 영국 캠브리지 소재), 심플리블루 세이프스테인(SimplyBlue safestain)(인비트로겐, 네덜란드 브레다 소재) 또는 사이프로 루비(Sypro Ruby)(인비트로겐, 네덜란드 브레다 소재)로 염색하였다.
총 단백질 함량
회수된 상청액의 단백질 함량을 브래드포드(Bradford) 방법에 따라 측정하였다. 쿠마시(Coomassie) 단백질 시약을 사용하여 효소 샘플 중의 단백질의 양을 브래드포드 단백질 분석으로 측정하였다. 25 ㎕의 적절하게 희석된 효소 샘플을 1.2 ㎖의 쿠마시 시약과 혼합하였다. 실온에서 10분 후, 분광광도계(유비콘 엘스엘(Uvikon XL))를 이용하여 595 nm에서 혼합물의 흡광도를 측정하였다. 단백질 함량을 BSA 표준물과 비교하여 계산하였다.
산
전처리된
옥수수대
공급원료로부터의 당-방출 활성 분석
각각의 (헤미)셀룰라제 분석 조건에 대해, 효소 배양 상청액을 하기 절차에 따라 이중으로 분석하였다: 효소 배양 상청액(건조 물질 공급원료 g 당 5 mg 단백질)을, pH 3.5, pH 4.5 또는 pH 5.0에서 완충된 50 mM 시트레이트 완충제 중의 약산 전처리된 옥수수대 기질 800 ㎕(2.5%(중량/중량) 건조 물질)를 함유하는 적합한 바이알로 옮겼다. 추가로, 블랭크 샘플로서 동일한 양의 효소 배양 상청액을 또 다른 바이알에 첨가하였는데, 이때 50 mM 시트레이트 완충제 중의 약산 전처리된 옥수수대 기질 800 ㎕(2.5%(중량/중량) 건조 물질)는 pH 4.5에서 완충된 50 mM 시트레이트 완충제 800 ㎕로 교체되었다. pH 3.5에서 완충된 분석 샘플을 65℃에서 72시간 동안 항온처리하였다. pH 5.0에서 완충된 분석 샘플을 50℃에서 72시간 동안 항온처리하였다. pH 4.5에서 완충된 분석 샘플, 및 효소 상청액 중의 단량체 당 함량의 보정을 위한 블랭크 샘플을 65℃에서 72시간 동안 항온처리하였다. 또한, pH 4.5에서 완충된 분석 샘플을 75℃에서 72시간 동안 항온처리하였다.
전술된 개별 항온처리 이외에, 효소 배양 상청액을 하기 2개의 상이한 헤미셀룰라제 혼합물과 함께 시험하였다: 추가 β-글루코시다제(BG)(라삼소니아 에머소니이로부터의 BG를 발현하는 아스퍼길러스 니게르 균주)가 첨가된(0.08 mg/g 건조 물질) TEC-210(라삼소니아 에머소니이), 및 추가 BG(노보자임(Novozym)-188)가 첨가된(0.08 mg/g 건조 물질) 셀루클라스트(트라이코데르마 리세이). 상기 혼합물을 공급원료의 건조 물질 g 당 1 mg 단백질의 농도로 첨가하였다. 이들 항온처리를 전술된 조건과 동일한 조건에서 수행하였다.
각각의 절차에 대해, 항온처리 후 공급원료에 존재하는 가능한 단량체 당을 보정하기 위해 효소 상청액이 탈염수로 교체되는 분석을 수행하였다.
분석 샘플의 항온처리 후, 고정된 부피의 내부 표준물, 말레산(20 g/ℓ), EDTA(40 g/ℓ) 및 DSS(2,2-다이메틸-2-실라펜탄-5-설포네이트)(0.5 g/ℓ)를 각각의 바이알에 첨가하였다. 원심분리 후, 650 ㎕의 상청액을 새로운 바이알로 옮겼다.
샘플의 상청액을 밤새 동결건조한 후, 50 ㎕의 D2O를 건조된 잔류물에 첨가하고 다시 한번 동결건조하였다. 건조된 잔류물을 600 ㎕의 D2O에 용해시켰다. 17℃의 온도에서 물 억제를 갖지 않되 90도 여기 펄스, 2.0초의 획득 시간 및 10초의 이완 지연을 갖는 펄스 프로그램을 이용하여 N2 냉각 크라이오-프로브(cryo-probe)를 갖춘 브루커 아반스(Bruker Avance) III HD 400 MHz 상에서 1D 1H NMR 스펙트럼을 기록하였다. 하기 신호에 근거하여 분석물 농도를 계산하였다(DSS(4,4-다이메틸-4-실라펜탄-1-설폰산)에 대한 상대적인 δ): 4.63 ppm에서 1/2의 β-글루코스 피크(d, 0.31 H, J = 8 Hz), 4.56 ppm에서 1/2의 β-자일로스 피크(d, 0.315 H, J = 8 Hz), 4.45 ppm에서 자일로-올리고 피크(d, 1H, J=8Hz), 4.66 ppm에서 1/2의 셀로바이오스의 환원 말단의 β-아노머 피크(d, 0.31H, J=8Hz). 6.26 ppm에서 표준물:말레산 피크에 대한 신호 사용자(s, 2H).
(헤미)셀룰라제 효소 용액은 잔류 당을 함유할 수 있다. 따라서, 분석의 결과를 효소 용액의 항온처리 후 측정된 당 함량에 대해 보정하였다.
β-자일로시다제 활성 측정
이 분석은 p-니트로페닐-β-D-자일로피라노사이드(PNPX)에 대한 β-자일로시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 β-자일로시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPX(시그마)를 분석 기질로서 사용한다.
100 mg의 PNPX를 84 ㎖의 0.1 M 아세테이트 완충제에 용해시켜 4.4 mM 스톡 용액을 수득한다. 중단 시약(1 M 나트륨 카보네이트 용액)을 다음과 같이 제조한다: 10.6 g의 무수 나트륨 카보네이트를 50 ㎖의 증류수에 용해시키고, 용액 부피를 100 ㎖로 조절한다. 이 시약을 사용하여 효소 반응을 종결시킨다.
효소와의 항온처리를 위해, 0.1 ㎖의 4.4 mM PNPX 스톡 용액을 0.1 ㎖의 적절하게 희석된 효소 샘플과 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AS로서 측정한다.
기질 블랭크를 위해, 0.1 ㎖의 4.4 mM PNPX 스톡 용액을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 샘플과 동일하게 처리한다: 60분 동안 60℃에서 항온처리한 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 ASB로서 측정한다.
(기질이 첨가되지 않은) 효소 블랭크를 측정하여 효소로부터 유래된 배경 색채를 보정한다. 0.1 ㎖의 적절하게 희석된 효소 샘플을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AEB로서 측정한다.
1 M 나트륨 카보네이트 용액과 1:1의 비로 혼합된 p-니트로페놀(0.1 M 아세테이트 완충제로 적절하게 희석됨, pH 4.5)의 보정 곡선을 이용하여 효소의 작용에 의한 PNPX로부터의 그의 방출을 정량한다.
효소와 기질의 항온처리 후, 보정된 흡광도(= AS-AEB-ASB)를 이용하여 효소에 의해 방출된 p-니트로페놀의 양을 계산한다.
활성은 분석 조건 하에서 분 당 1 μM p-니트로페놀을 방출시키기 위해 요구된 효소의 양으로서 표현된다.
이 분석을 이용하여 효소, 예컨대, GH3, GH30, GH39, GH43, GH52 및 GH54 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
β-자일로시다제 활성 분석 2
이 분석은 자일로바이오스에 대한 β-자일로시다제의 작용에 의한 자일로스의 방출을 측정한다.
나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트 또는 6.8 g의 나트륨 아세테이트 * 3H2O를 1000 ㎖의 최종 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다. 자일로바이오스를 시그마로부터 구입하고 100 ㎍/㎖의 농도까지 나트륨 아세테이트 완충제(pH 4.5)에 용해시켰다.
분석을 이하에 상세히 기재된 바와 같이 수행하였다.
효소 배양 상청액을 기질 g 당 1 mg 내지 5 mg 단백질의 용량으로 기질에 첨가한 후 62℃에서 24시간 동안 항온처리하였다. 100℃에서 10분 동안 샘플을 가열하여 반응을 중단시켰다. 자일로스의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.
기질 블랭크
효소 배양 상청액 대신에 동일한 양의 완충제를 기질 용액에 첨가한 후 62℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중지시켰다. 샘플을 고성능 음이온 교환 크로마토그래피로 분석하였다. 카보팩(CarboPac) PA 가드(guard) 컬럼(2 mm ID x 50 mm) 및 다이오넥스(Dionex) PAD-검출기(다이오넥스 컴파니(Dionex Co.), 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 20분, 0 mM 내지 180 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다.
자일로스 확인을 복잡하게 하는 간섭 화합물이 존재하는 경우, 30분 동안 H2O 상에서 등용매 용출(검출을 위해 0.5 M NaOH를 0.1 ㎖/분으로 포스트-컬럼에 첨가함)을 실시한 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 H2O를 사용한 15분의 평형화 단계를 실시하여 분석을 수행하였다.
기질 및 효소에 의해 형성된 생성물의 확인을 위해 자일로스 및 자일로바이오스(시그마)의 표준물을 사용하였다.
이 분석을 이용하여 효소, 예컨대, GH3, GH30, GH39, GH43, GH52 및 GH54 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
β-자일로시다제 활성 분석 3
중합체성 기질에 대한 자일로시다제 활성을 측정하기 위해 자일로바이오스 대신에 자일란 기질, 예컨대, 귀리 아라비노자일란, 너도밤나무 자일란 및 자작나무 자일란(시그마)을 사용하여 전술된 분석과 동일한 분석을 수행하였다.
모든 기질들이 2 mg/㎖의 농도까지 용해되었다는 점을 제외하고 분석 조건은 동일하였다. 항온처리를 10 mg/g의 용량에서 24시간 동안 60℃에서 수행하였다. 자일로스 및 자일로바이오스 다음에 자일로트라이오스 및 자일로테트라오스를 정량하였다.
α-갈락토시다제 활성 측정
이 분석은 p-니트로페닐-α-D-갈락토피라노사이드(PNPG)에 대한 α-갈락토시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 α-갈락토시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPG(시그마)를 분석 기질로서 사용한다.
4.4 mM PNPG 스톡 용액을 0.1 M 아세테이트 완충제로 제조한다. 중단 시약(1 M 나트륨 카보네이트 용액)을 다음과 같이 제조한다: 10.6 g의 무수 나트륨 카보네이트를 50 ㎖의 증류수에 용해시키고, 용액 부피를 100 ㎖로 조절한다. 이 시약을 사용하여 효소 반응을 종결한다.
효소와의 항온처리를 위해, 0.1 ㎖의 4.4 mM PNPG 스톡 용액을 0.1 ㎖의 적절하게 희석된 효소 샘플과 혼합하고 60℃에서 60분 동안 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AS로서 측정한다.
기질 블랭크를 위해, 0.1 ㎖의 4.4 mM PNPG 스톡 용액을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 샘플과 동일하게 처리한다: 60℃에서 60분 동안 항온처리한 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 ASB로서 측정한다.
(기질이 첨가되지 않은) 효소 블랭크를 측정하여 효소로부터 유래된 배경 색채를 보정한다. 0.1 ㎖의 적절하게 희석된 효소 샘플을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AEB로서 측정한다.
1 M 나트륨 카보네이트 용액과 1:1의 비로 혼합된 p-니트로페놀(0.1 M 아세테이트 완충제로 적절하게 희석됨, pH 4.5)의 보정 곡선을 이용하여 효소의 작용에 의한 PNPG로부터의 그의 방출을 정량한다.
효소와 기질의 항온처리 후, 보정된 흡광도(= AS-AEB-ASB)를 이용하여 효소에 의해 방출된 p-니트로페놀의 양을 계산한다.
활성은 분석 조건 하에서 분 당 1 μM p-니트로페놀을 방출시키기 위해 요구된 효소의 양으로서 표현된다.
이 분석을 이용하여 효소, 예컨대, GH4, GH27 및 GH36 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
자일로글루카나제 활성 분석 1
나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트를 1000 ㎖의 최종 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다.
타마린드(Tamarind) 자일로글루칸을 나트륨 아세테이트 완충제에 용해시켜 2.0 mg/㎖를 수득하였다. 효소 배양 상청액을 기질 g 당 10 mg 단백질의 용량으로 기질에 첨가한 후 60℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 올리고사카라이드의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.
블랭크 샘플로서, 기질을 동일한 방식으로 처리하고 항온처리하되 효소를 첨가하지 않았다.
50배 희석된 후 20 ㎕가 항온처리에 첨가된 시판되는 트라이코데르마 리세이 셀룰라제 제제(셀루클라스트; 시그마)와 함께 동일한 조건 하에서 기준물로서 기질도 항온처리하였다.
카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 150 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다.
이 분석을 이용하여 효소, 예컨대, GH5, GH12, GH16, GH44 및 GH74 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
자일로글루카나제 활성 분석 2
하기 실시예는 자일로글루카나제 활성을 측정하기 위한 분석을 예시한다.
자일로글루칸을 기질로서 사용하고 환원 당 분석(PAHBAH)을 검출 방법으로서 이용하여 이러한 활성을 입증하였다. 값을, 시판되는 트라이코데르마 리세이 셀룰라제 제제(셀루클라스트; 시그마)를 사용하여 제조한 표준물과 비교하였다.
시약 A: 5 g의 p-하이드록시벤조산 하이드라자이드(PAHBAH)를 60 ㎖의 물에 현탁시키고, 4.1 ㎖의 농축된 염산을 첨가하고 부피를 100 ㎖로 조절하였다. 시약 B: 24.9 g의 삼나트륨 시트레이트를 500 ㎖의 물에 용해시켰다. 2.2 g의 칼슘 클로라이드 및 40 g의 나트륨 하이드록사이드를 이 용액에 첨가하였다. 물을 사용하여 부피를 2 ℓ로 조절하였다. 상기 두 시약들을 실온에서 저장하였다. 작업 시약: 10 ㎖의 시약 A를 40 ㎖의 시약 B에 첨가하였다. 이 용액을 매일 새로 제조하고 사용 사이에 얼음 상에서 저장하였다. 상기 시약들을 사용하여 분석을 이하에 상세히 기재된 바와 같이 수행하였다.
자일로글루칸 다음에 카복시메틸셀룰로스도 기질로서 사용하여 효소의 특이성을 측정하였다.
항온처리 후, 10 ㎕의 각각의 웰을 200 ㎕의 작업 시약과 혼합하였다. 이들 용액들을 30분 동안 70℃에서 가열하였다. 냉각시킨 후, 405 nm에서 흡광도를 측정함으로써 샘플을 분석하였다. 글루코스를 표준물로서 사용하여 형성된 환원 말단을 글루코스 당량으로서 정량하였다.
대조군으로서, 기질도 효소 배양 상청액의 첨가 없이 항온처리하고 효소 배양 상청액을 기질 없이 항온처리하였다.
이 분석을 이용하여 효소, 예컨대, GH5, GH12, GH16, GH44 및 GH74 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
자일로글루카나제 활성 분석 3
나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조한다: 4.1 g의 무수 나트륨 아세테이트를 1000 ㎖의 최종 부피까지 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조한다.
타마린드 자일로글루카난을 나트륨 아세테이트 완충제에 용해시켜 2.0 mg/㎖를 수득한다. 효소를 기질 g 당 10 mg 단백질의 용량으로 기질에 첨가한 후 60℃에서 24시간 동안 항온처리한다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시킨다. 저분자량 올리고사카라이드의 형성을 고성능 크기 배제 크로마토그래피로 분석한다.
블랭크 샘플로서, 기질을 동일한 방식으로 처리하고 항온처리하되 효소를 첨가하지 않는다.
기준물로서, 예를 들면, 시판되는 아스퍼길러스 니게르 또는 트라이코데르마 리세이 셀룰라제 제제(60℃에서 불활성을 나타내는 경우 그 자신의 최적 온도에서 셀룰라제 표준물)과 함께 동일한 조건 하에서 기질을 항온처리한다.
PWX 가드 컬럼(토소 바이오사이언스(Tosoh Bioscience))과 함께 3개의 TSK-겔 컬럼들(컬럼 당 6.0 mm x 15.0 cm; 일련의 SuperAW4000, SuperAW3000 및 SuperAW2500; 토소 바이오사이언스) 상에서 수행된 고성능 크기 배제 크로마토그래피(HPSEC)를 이용하여 분석을 수행한다. 0.2 M 나트륨 니트레이트를 사용하여 0.6 ㎖/분의 속도로 55℃에서 용출을 수행한다. 쇼덱스(Shodex) RI-101(카와사키(Kawasaki)) 굴절 지수(RI) 검출기를 이용하여 용출물을 모니터링한다. 0.18 kDa 내지 788 kDa의 범위 내에서 분자량을 갖는 풀루란(pullulan)(어소시에이티드 폴리머 랩스 인코포레이티드(Associated Polymer Labs Inc.), 미국 뉴욕 소재)을 사용하여 보정을 수행한다.
이 분석을 이용하여 효소, 예컨대, GH5, GH12, GH16, GH44 및 GH74 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
α-아라비노푸라노시다제 활성 분석
하기 실시예는 치환된 자일로스 잔기로부터 α-L-아라비노푸라노실 잔기를 제거하는 α-아라비노푸라노시다제의 능력을 측정하는 분석을 예시한다.
아라비노자일란을 아라비노스 및 자일로스로 완전히 분해하기 위해, 엔도-자일라나제 및 아라비노푸라노시다제를 비롯한 여러 효소 활성이 필요하다. 밀 아라비노자일란 분자는 아라비노실 잔기로 고도로 치환된다. 이들은 자일로실 잔기의 C2 또는 C3 위치에서 치환될 수 있거나(단일 치환), 자일로스의 C2 위치 및 C3 위치 둘다에서 치환될 수 있다(이중 치환).
40℃에서 48시간 동안 50 mM 아세테이트 완충제(pH 4.5) 중의 밀 아라비노자일란(WAX; 10 mg/㎖; 메가자임(Megazyme), 아일랜드 브레이 소재)을 적절한 양의 엔도-자일라나제(아스퍼길러스 아와모리로부터 유래됨, Kormelink F. et al; Journal of Biotechnology (1993) 27: 249-265)와 함께 항온처리하여 충분한 양의 아라비노자일로-올리고사카라이드를 생성함으로써 단일 치환된 올리고사카라이드 및 이중 치환된 올리고사카라이드를 제조하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 샘플을 10,000 x g에서 5분 동안 원심분리하였다. 상청액을 추가 실험에 사용하였다. 아라비노자일란의 분해 후, 형성된 환원 당의 분석 및 고성능 음이온 교환 크로마토그래피(HPAEC)를 수행하였다.
효소 배양 상청액을 50 mg 나트륨 아세테이트 완충제 중의 기질 g 당 10 mg 단백질의 용량으로 단일 치환된 아라비노자일로-올리고사카라이드 및 이중 치환된 아라비노자일로-올리고사카라이드(엔도-자일라나제로 처리된 WAX; 2 mg/㎖)에 첨가한 후, 65℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 샘플을 10,000 x g에서 5분 동안 원심분리하였다. 아라비노스의 방출 후 HPAEC 분석을 수행하였다.
카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 400 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다. 아라비노스 방출을 확인하고 표준물(시그마)로 정량하였다.
이 분석을 이용하여 효소, 예컨대, GH3, GH43, GH51, GH54 및 GH62 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
엔도-자일라나제 활성 분석
엔도-자일라나제는 자일란 골격에서 β-1,4 결합을 가수분해하여 짧은 자일로-올리고사카라이드를 생성할 수 있는 효소이다. 이 분석은 밀 아라비노자일란(WAX)(메가자임, 중간 점성 29 cSt), 귀리 아라비노자일란, 너도밤나무 자일란 및 자작나무 자일란(시그마)에 대한 자일라나제의 작용에 의한 자일로스 및 자일로-올리고사카라이드의 방출을 측정한다.
나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트를 1000 ㎖의 최종 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다. 각각의 기질을 나트륨 아세테이트 완충제에 용해시켜 2.0 mg/㎖를 수득하였다. 효소 배양 상청액을 기질 g 당 10 mg 단백질의 용량으로 기질에 첨가한 후, 60℃에서 20시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 자일로스 및 자일로-올리고사카라이드의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.
블랭크 샘플로서, 기질을 동일한 방식으로 처리하고 항온처리하되 효소를 첨가하지 않았다.
카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 400 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다. 자일로스, 자일로바이오스 및 자일로트라이오스의 표준물(시그마)을 사용하여 상기 효소의 작용에 의해 방출된 이들 올리고머들을 확인하였다.
이 분석을 이용하여 효소, 예컨대, GH5, GH8, GH10 및 GH11 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
α/β-자일로시다제 활성 측정
이 분석은 p-니트로페닐-α/β-D-자일로피라노사이드(PNPX)에 대한 α/β-자일로시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 β-자일로시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPX(시그마)를 분석 기질로서 사용한다.
100 mg의 PNPX를 84 ㎖의 0.1 M 아세테이트 완충제에 용해시켜 4.4 mM 스톡 용액을 수득한다. 중단 시약(1 M 나트륨 카보네이트 용액)을 다음과 같이 제조한다: 10.6 g의 무수 나트륨 카보네이트를 50 ㎖의 증류수에 용해시키고, 용액 부피를 100 ㎖로 조절한다. 이 시약을 사용하여 효소 반응을 종결시킨다.
효소와의 항온처리를 위해, 0.1 ㎖의 4.4 mM PNPX 스톡 용액을 0.1 ㎖의 적절하게 희석된 효소 샘플과 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AS로서 측정한다.
기질 블랭크를 위해, 0.1 ㎖의 4.4 mM PNPX 스톡 용액을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 샘플과 동일하게 처리한다: 60분 동안 60℃에서 항온처리한 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 ASB로서 측정한다.
(기질이 첨가되지 않은) 효소 블랭크를 측정하여 효소로부터 유래된 배경 색채를 보정한다. 0.1 ㎖의 적절하게 희석된 효소 샘플을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AEB로서 측정한다.
1 M 나트륨 카보네이트 용액과 1:1의 비로 혼합된 p-니트로페놀(0.1 M 아세테이트 완충제로 적절하게 희석됨, pH 4.5)의 보정 곡선을 이용하여 효소의 작용에 의한 PNPX로부터의 그의 방출을 정량한다.
효소와 기질의 항온처리 후, 보정된 흡광도(= AS-AEB-ASB)를 이용하여 효소에 의해 방출된 p-니트로페놀의 양을 계산한다.
활성은 분석 조건 하에서 분 당 1 μM p-니트로페놀을 방출시키기 위해 요구된 효소의 양으로서 표현된다.
이 분석을 이용하여 효소, 예컨대, GH3, GH30, GH31, GH39, GH43, GH52 및 GH54 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
α/β-만노시다제 활성 측정
이 분석은 p-니트로페닐-α/β-D-만노피라노사이드(PNPM)에 대한 α/β-만노시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 α/β-만노시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPM(시그마)을 분석 기질로서 사용한다.
4.4 mM PNPM 스톡 용액을 0.1 M 아세테이트 완충제로 제조한다. 중단 시약(1 M 나트륨 카보네이트 용액)을 다음과 같이 제조한다: 10.6 g의 무수 나트륨 카보네이트를 50 ㎖의 증류수에 용해시키고, 용액 부피를 100 ㎖로 조절한다. 이 시약을 사용하여 효소 반응을 종결시킨다.
효소와의 항온처리를 위해, 0.1 ㎖의 4.4 mM PNPM 스톡 용액을 0.1 ㎖의 적절하게 희석된 효소 샘플과 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AS로서 측정한다.
기질 블랭크를 위해, 0.1 ㎖의 4.4 mM PNPM 스톡 용액을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 샘플과 동일하게 처리한다: 60분 동안 60℃에서 항온처리한 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 ASB로서 측정한다.
(기질이 첨가되지 않은) 효소 블랭크를 측정하여 효소로부터 유래된 배경 색채를 보정한다. 0.1 ㎖의 적절하게 희석된 효소 샘플을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 AEB로서 측정한다.
1 M 나트륨 카보네이트 용액과 1:1의 비로 혼합된 p-니트로페놀(0.1 M 아세테이트 완충제로 적절하게 희석됨, pH 4.5)의 보정 곡선을 이용하여 효소의 작용에 의한 PNPM으로부터의 그의 방출을 정량한다.
효소와 기질의 항온처리 후, 보정된 흡광도(= AS-AEB-ASB)를 이용하여 효소에 의해 방출된 p-니트로페놀의 양을 계산한다.
활성은 분석 조건 하에서 분 당 1 μM p-니트로페놀을 방출시키기 위해 요구된 효소의 양으로서 표현된다.
이 분석을 이용하여 효소, 예컨대, GH1, GH2, GH5, GH38, GH47, GH92 및 GH125 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
페룰로일 에스터라제 활성 측정
합성 기질: 메틸 카페에이트(caffeate), 메틸 쿠마레이트(coumarate), 메틸 시나피네이트(sinapinate) 및 메틸 페룰레이트(ferulate)를 아핀 케미칼스(Apin Chemicals)로부터 입수한다. 효소를 5.0의 pH(50 mM 나트륨 아세테이트 완충제)에서 약 5 mg/g DM의 용량으로 기질과 함께 항온처리하여 이들 합성 기질들에 대한 활성을 측정한다. 반응은 최대 24시간 동안 60℃에서 수행될 것이다.
항온처리의 말기에 샘플을 5분 동안 끓여 효소를 불활성화시키고 실온에서 원심분리한다(10분, 10,000 x g). 하이퍼실(Hypersyl) GOLD 컬럼(2.1 mm X 150 mm, 1.9 ㎛ 입자 크기; 써모 사이언티픽(Thermo Scientific))을 갖춘 악셀라(Accela) UHPLC 시스템(써모 사이언티픽) 상에서 종래 기재된 바와 같이(Appeldoorn et al., 2010) 음이온 모드로 RP-UHPLC-MS 분석을 수행하여 기질로부터의 하이드록시신남산 방출을 측정한다. 이동상은 (A) H2O + 1%(부피/부피) 아세토니트릴 + 0.2%(부피/부피) 아세트산, 및 (B) 아세토니트릴 + 0.2%(부피/부피) 아세트산으로 구성된다. 유속은 0.4 ㎖/분이고, 컬럼 온도는 30℃이다. 용출 프로파일은 다음과 같다: 먼저 5분, 등용매 0% B; 5분 내지 23분, 0% B부터 50% B까지 선형; 23분 내지 24분, 50% B부터 100% B까지 선형; 24분 내지 27분, 100% B에서 등용매; 27분 내지 28분, 100% B부터 0% B까지 선형, 이어서 7분 동안 컬럼의 재컨디셔닝. 스펙트럼 데이터를 200 nm부터 600 nm까지 수집하고, 320 nm에서 정량을 수행한다. 페룰산(ferulic acid), 카페산(caffeic acid), 시납산(sinapic acid) 및 쿠마르산(coumaric acid) 함량을 확인하고 표준물에 근거하여 정량한다.
3.5 kV의 이온 분무 전압, -20 V의 모세관 전압 및 35℃의 모세관 온도를 이용하여 MS 데이터를 음성 모드로 수집한다. m/z 150-1500 범위 내에서 전체 MS 스캔을 수행하고 가장 강한 이온의 MS2 데이터를 수득한다.
이 분석을 이용하여 효소, 예컨대, CE1 효소(그러나, 이것으로 한정되지 않음)의 활성을 시험할 수 있다.
페룰로일
에스터라제
활성 측정
천연 기질: 전처리된 옥수수 섬유(CF)로부터 정제된 아라비노자일란 올리고머(각각 1 mg/㎖)(Appeldoorn et al., 2010)를 5.0의 pH(50 mM 나트륨 아세테이트 완충제)에서 약 5 mg/g DM의 용량으로 페룰산 에스터라제와 함께 항온처리한다. 반응은 최대 24시간 동안 60℃에서 수행될 것이다.
항온처리의 말기에 샘플을 5분 동안 끓여 효소를 불활성화시키고 실온에서 원심분리한다(10분, 10,000 x g). 하이퍼실 GOLD 컬럼(2.1 mm X 150 mm, 1.9 ㎛ 입자 크기; 써모 사이언티픽)을 갖춘 악셀라 UHPLC 시스템(써모 사이언티픽) 상에서 종래 기재된 바와 같이(Appeldoorn et al., 2010) 음이온 모드로 RP-UHPLC-MS 분석을 수행하여 기질로부터의 하이드록시신남산 방출을 측정한다. 이동상은 (A) H2O + 1%(부피/부피) 아세토니트릴 + 0.2%(부피/부피) 아세트산, 및 (B) 아세토니트릴 + 0.2%(부피/부피) 아세트산으로 구성된다. 유속은 0.4 ㎖/분이고, 컬럼 온도는 30℃이다. 용출 프로파일은 다음과 같다: 먼저 5분, 등용매 0% B; 5분 내지 23분, 0% B부터 50% B까지 선형; 23분 내지 24분, 50% B부터 100% B까지 선형; 24분 내지 27분, 100% B에서 등용매; 27분 내지 28분, 100% B부터 0% B까지 선형, 이어서 7분 동안 컬럼의 재컨디셔닝. 스펙트럼 데이터를 200 nm부터 600 nm까지 수집하고, 320 nm에서 정량을 수행한다. 페룰산 및 쿠마르산(coumaric acid) 함량을 확인하고 표준물에 근거하여 정량한다.
3.5 kV의 이온 분무 전압, -20 V의 모세관 전압 및 35℃의 모세관 온도를 이용하여 MS 데이터를 음성 모드로 수집한다. m/z 150-1500 범위 내에서 전체 MS 스캔을 수행하고 가장 강한 이온의 MS2 데이터를 수득한다.
알칼리성 가수분해 및 에틸에테르 추출 후 전술된 UHPLC 방법을 이용하여 옥수수 올리고머 중의 에스터-연결된 페룰산의 총량을 측정한다.
참고문헌: MAAIKE M. APPELDOORN et al, J. Agric. Food Chem. 2010, 58, 11294-11301.
이 분석을 이용하여 효소, 예컨대, CE1 효소(그러나, 이것으로 한정되지 않음)의 활성을 시험할 수 있다.
α-
글루쿠로니다제
활성 분석
하기 실시예는 알도우론산(aldouronic acid)(메가자임)에 대한 α-글루쿠로니다제 활성을 측정하는 분석을 예시한다. 이 분석은 글루쿠로노자일란 올리고사카라이드에 대한 α-글루쿠로니다제의 작용에 의한 자일로스 및 자일로올리고머의 방출을 측정한다.
나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트를 최종 1000 ㎖의 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다.
작은 올리고머에 대한 활성을 측정하기 위해 알도우론산을 나트륨 아세테이트 완충제에 용해시켜 1.0 mg/㎖를 수득하였다. 효소 배양 상청액을 기질 g 당 1 mg 및 10 mg 단백질의 용량으로 기질에 첨가한 후, 60℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 4-O-메틸 글루쿠론산 제거의 결과로서 자일로올리고머의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.
블랭크 샘플로서, 기질을 동일한 방식으로 처리하고 항온처리하되 효소를 첨가하지 않았다.
카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 400 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다.
자일로스, 자일로바이오스 및 자일로트라이오스의 표준물(시그마)을 사용하여 이들 올리고머들로부터 4-O-메틸-글루쿠론산을 제거하는 효소의 작용에 의해 방출된 자일로올리고머를 확인하였다.
이 분석을 이용하여 효소, 예컨대, GH67 및 GH115 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.
실시예 1: 아스퍼길러스 니게르 발현 벡터의 구축
본 실시예는 아스퍼길러스 니게르에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 과다발현시키기 위한 발현 구축물의 구축을 기술한다. 라삼소니아 에머소니이 규주 CBS 393.64의 게놈 DNA를 서열결정하고 분석하였다. 표 1에 따른 활성을 갖는 단백질로서 해독된 번역된 단백질을 갖는 유전자를 확인하였다. 코돈-쌍 최적화된 ORF 서열, 단백질 서열, 신호 서열, 게놈 서열 및 야생형 cDNA 서열을 포함하는 라삼소니아 에머소니이 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 및 Temer07305 유전자의 서열들이 서열목록에서 서열번호 1 내지 75로 제시되어 있다.
발현 플라스미드의 구축
EcoRI 및 PacI 부위를 사용하여 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71을 갖는 서열을, 글루코아밀라제 프로모터 및 종결요소 서열을 포함하는 pGBTOP 벡터(도 1) 내로 클로닝한다. 아스퍼길러스 니게르 CBS 513.88의 형질전환 전, NotI 분해를 통해 에스케리키아 콜라이 부분을 제거한다.
아스퍼길러스 니게르의 형질전환 및 진탕 플라스크 발효
실험 정보 단락에 기재된 방법에 따라 아스퍼길러스 니게르 균주 CBS 513.88을 발현 구축물 및 적절한 선택 마커(amdS 또는 플레오마이신) 함유 플라스미드로 공-형질전환시킨다. 재조합 및 대조군 아스퍼길러스 니게르 균주들의 포자 또는 균사체를 제조자의 설명서에 따라 제조된 PDA 플레이트(감자 덱스트로스 한천, 옥소이드(Oxoid)) 상에 플레이팅하여 큰 포자 회분을 생성한다. 30℃에서 3일 내지 7일 동안 생장시킨 후, 0.01% 트라이톤 X-100을 플레이트에 첨가한 후 포자를 수집한다. 멸균수로 세척한 후, 선택된 형질전환체 및 대조군 균주의 약 107개의 포자를, ℓ 당 하기 용량의 성분들로 구성된 20 ㎖의 액체 예비배양 배지(pH 5.5)를 함유하는 100 ㎖ 배플(baffles) 보유 진탕 플라스크 내로 접종한다: 30 g 말토스.H2O; 5 g 효모 추출물; 10 g 가수분해된 카세인; 1 g KH2PO4; 0.5 g MgSO4.7H2O; 0.03 g ZnCl2; 0.02 g CaCl2; 0.01 g MnSO4.4H2O; 0.3 g FeSO4.7H2O; 3 g 트윈 80; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 이 배양물을 34℃에서 16시간 내지 24시간 동안 생장시킨다. 10 ㎖의 이 배양물을, ℓ 당 하기 용량의 성분들로 구성되고 pH 5.6으로 조절된 100 ㎖ 발효 배지를 함유하는 500 ㎖ 배플 보유 진탕 플라스크 내로 접종한다: 70 g 글루코스.H2O; 25 g 가수분해된 카세인; 12.5 g 효모 추출물; 1 g KH2PO4; 2 g K2SO4; 0.5 g MgSO4.7H2O; 0.03 g ZnCl2; 0.02 g CaCl2; 0.01 g MnSO4.4H2O; 0.3 g FeSO4.7H2O; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 모든 글루코스가 고갈될 때까지(통상적으로 4일 내지 7일 후) 이 배양물을 34℃에서 생장시킨다. 발효 브로쓰로부터 채취된 샘플을 진동 버킷(swinging bucket) 원심분리기에서 (5000 x g에서 10분 동안) 원심분리하고 상청액을 수집하고 0.2 ㎛ 필터(날진(Nalgene)) 상에서 여과한다.
SDS-PAGE 및 총 단백질 측정으로 상청액을 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 및 Temer07305의 발현에 대해 분석한다.
실시예 2: 라삼소니아 에머소니이 발현 벡터의 구축
본 실시예는 라삼소니아 에머소니이에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 과다발현시키기 위한 발현 구축물의 구축을 기술한다. 발현 카세트를 RePepA 좌위 내로 표적화 삽입하였다.
프로모터-레포터 구축물을 pepA 좌위 내로 표적화하기 위해, 표적화용 발현 벡터를 클로닝하였다. 프로테아제 pepA로서 해독된 번역된 단백질을 갖는 유전자를 게놈에서 확인하였다. ORF 및 약 3000 bp의 5' 영역 및 2500 bp의 3' 플랭킹 영역의 게놈 서열, cDNA 및 단백질 서열을 포함하는, 라삼소니아 에머소니이 pepA (RePepA)의 서열은 서열목록에서 각각 서열번호 76, 77 및 78로 제시되어 있다.
RePepA 좌위 내로의 표적화를 위해 상용적인 클로닝 절차에 따라 2개의 벡터들을 구축하였다. 두 벡터들의 삽입체 단편들은 소위 "이분 유전자 표적화" 방법(Nielsen et al., 2006, 43: 54-64)에 의해 함께 적용될 수 있다. 이 방법은 유전자 표적화 서열과 함께 중첩되는 선택 마커의 2개 비-기능성 DNA 단편들을 사용하는 방법이다(이분 방법의 추가 상세한 내용에 대해서는 국제 특허출원 공개 제WO2008/113847호 또한 참조). 정확한 상동성 재조합 시, 선택 마커는 상동성 표적 좌위에서의 삽입에 의해 기능성을 갖게 된다. 국제 특허출원 공개 제WO2008/113847호에도 상세히 기재된 바와 같이, 이분 유전자 표적화를 위한 2개의 중첩 DNA 분자들을 제공할 수 있도록 2개의 상이한 결실 벡터들인 Te pep.bbn 및 pEBA1006을 디자인하고 구축하였다. 제1 벡터 Te pep.bbn(도 2에서와 같은 일반적인 배치)은 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 약 1.5 kb 업스트림에 위치하는 1500 bp 5' 플랭킹 영역(ORF 및 약 1500 bp의 RePepA 프로모터)을 포함하고 lox66 부위, 및 아스퍼길러스 니둘란스 gpdA 프로모터에 의해 유발되는 ble 코딩 영역의 비-기능성 5' 부분(ble의 3' 말단에서 코딩 서열의 마지막 104개 염기를 결여하는 PgpdA-ble 서열, 서열번호 79)을 포함한다. 에스케리키아 콜라이에서의 프로모터-레포터 카세트의 효율적인 클로닝을 가능하게 하기 위해, 5' RePepA 플랭킹 영역과 lox66 부위 사이에 ccdB 유전자를 삽입하였다. 제2 pEBA1006 벡터(도 3에서와 같은 일반적인 배치)는 ble 코딩 영역의 비-기능성 3' 부분 및 아스퍼길러스 니둘란스 trpC 종결요소(ble의 5' 말단에서 코딩 서열의 처음 12개 염기를 결여하는 ble-TtrpC 서열, 서열번호 80), lox71 부위, 및 RePepA 좌위에서의 표적화를 위한 RePepA ORF의 2500 bp 3' 플랭킹 영역을 포함한다. 상동성 재조합 시, 제1 비-기능성 단편 및 제2 비-기능성 단편은 기능성을 갖게 되어 기능성 ble 카세트를 생성한다. RePepA 업스트림 유전자 플랭킹 영역 및 다운스트림 유전자 플랭킹 영역 둘다가 예정된 RePepA 게놈 좌위에서의 이분 단편들의 상동성 재조합을 위해 표적화된다.
벡터 Te pep.bbn 내의 ccdB 유전자를 상용적인 클로닝 절차에 따라 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 발현 카세트로 교체하였다. 서열번호 81로 표시되는 라삼소니아 에머소니이 프로모터 2를, 아스퍼길러스 니둘란스 amdS 종결요소를 갖는 라삼소니아 에머소니이 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 코딩 영역의 업스트림에서 클로닝하여 구축물 pEBA를 생성하였다. 아스퍼길러스 니둘란스 amdS 종결요소 서열은 서열번호 82로 표시된다. 관심있는 유전자(GOI)인 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 과다발현을 위한 pEBA의 도식적 묘사는 도 4에 제시되어 있다.
실시예
3:
라삼소니아
에머소니이에서의
Temer00088
,
Temer09484
, Temer08028,
Temer02362
,
Temer08862
,
Temer04790
,
Temer05249
,
Temer06848
, Temer02056,
Temer03124
,
Temer09491
,
Temer06400
,
Temer08570
,
Temer08163
또는 Temer07305 유전자의 과다발현
국제 특허출원 공개 제WO2011/054899호에 이미 기재된 방법을 이용하여 pEBA 및 pEBA1006의 선형 DNA를 단리하고 사용하여 라삼소니아 에머소니이를 형질전환시킨다. 선형 DNA들은 RePepA 좌위에서 게놈 내로 함께 삽입되어 RePepA 유전자를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 및 ble 유전자로 치환시킬 수 있다. 형질전환체를 플레오마이신 배지 상에서 선택하고 콜로니를 정제하고 국제 특허출원 공개 제WO2011/054899호에 기재된 절차에 따라 시험한다. 결실 카세트의 gpdA 프로모터 내의 프라이머 및 5' 표적화 영역의 바로 업스트림에 위치하는 게놈 서열에 대해 유도된 프라이머를 사용하여 성장하는 콜로니를 RePepA 좌위에서의 삽입에 대해 PCR로 진단한다. RePepA가 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305/ble 카세트로 교체되어 있는 후보 형질전환체를 수득한다.
실시예 4: Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 라삼소니아 에머소니이 균주에서의 효소 활성
Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 균주를 진탕 플라스크 내에서 라삼소니아 배지 3에서 발효시키고 상청액을 적합한 분석에서 표 1에 따른 활성에 대해 분석한다. 야생형 균주에 비해 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 균주에서 활성의 증가가 관찰되는데, 이것은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 과다발현이 라삼소니아 에머소니이에서 활성을 개선한다는 것을 시사한다.
실시예 5: 아스퍼길러스 니게르 진탕 플라스크 발효
선택된 형질전환체 및 대조군 균주의 약 107개의 포자를, ℓ 당 하기 용량의 성분들로 구성된 20 ㎖의 액체 예비배양 배지(pH 5.5)를 함유하는 100 ㎖ 배플 보유 진탕 플라스크 내로 접종하였다: 30 g 말토스.H2O; 5 g 효모 추출물; 10 g 가수분해된 카세인; 1 g KH2PO4; 0.5 g MgSO4.7H2O; 0.03 g ZnCl2; 0.02 g CaCl2; 0.01 g MnSO4.4H2O; 0.3 g FeSO4.7H2O; 3 g 트윈 80; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 이 배양물을 34℃에서 16시간 내지 24시간 동안 생장시켰다. 10 ㎖의 이 배양물을, ℓ 당 하기 용량의 성분들로 구성되고 pH 5.6으로 조절된 100 ㎖ 발효 배지를 함유하는 500 ㎖ 배플 보유 진탕 플라스크 내로 접종하였다: 70 g 글루코스.H2O; 25 g 가수분해된 카세인; 12.5 g 효모 추출물; 1 g KH2PO4; 2 g K2SO4; 0.5 g MgSO4.7H2O; 0.03 g ZnCl2; 0.02 g CaCl2; 0.01 g MnSO4.4H2O; 0.3 g FeSO4.7H2O; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 모든 글루코스가 고갈될 때까지(통상 4일 내지 7일 후) 이 배양물을 34℃에서 생장시켰다. 발효 브로쓰로부터 채취된 샘플을 진동 버킷 원심분리기에서 (5000 x g에서 10분 동안) 원심분리하고 상청액을 수집하고 0.2 ㎛ 필터(날진) 상에서 여과하였다.
TCA-뷰렛(biuret) 방법을 이용한 진탕 플라스크 농도 및 단백질 농도 측정
추가 시험을 위한 보다 많은 양의 물질을 수득하기 위해, 10 kDa 스핀 필터를 이용하여 전술된 바와 같이 수득된 발효 상청액(75 ㎖ 내지 100 ㎖의 부피)을 약 5 ㎖의 부피까지 농축하였다. 그 후, 농축된 상청액 중의 단백질 농도를 TCA-뷰렛 방법을 통해 측정하였다.
농축된 단백질 샘플(상청액)을 물로 2 mg/㎖ 내지 8 mg/㎖의 농도까지 희석하였다. 소 혈청 알부민(BSA) 희석물(0 mg/㎖, 1 mg/㎖, 2 mg/㎖, 5 mg/㎖, 8 mg/㎖ 및 10 mg/㎖)을 제조하고 샘플로서 포함시켜 보정 곡선을 생성하였다. 각각의 희석된 단백질 샘플 중 270 ㎕를, 830 ㎕의 아세톤 중의 12%(중량/부피) 트라이클로로아세트산 용액을 함유하는 10 ㎖ 튜브 내로 옮기고 철저히 혼합하였다. 그 후, 상기 튜브를 빙수 상에서 1시간 동안 항온처리하고 4℃ 및 6000 rpm에서 30분 동안 원심분리하였다. 상청액을 따라내고, 튜브를 티슈 상에 뒤집어 놓고 실온에서 30분 동안 세워두어 펠렛을 건조하였다. 다음으로, 3 ㎖의 바이오퀀트(BioQuant) 뷰렛 시약 혼합물을 튜브 내의 펠렛에 첨가하고 혼합 후 1 ㎖의 물을 첨가하여 펠렛을 가용화하였다. 튜브를 철저히 혼합하고 실온에서 30분 동안 항온처리하였다. 블랭크 측정으로서 사용된 물 샘플을 사용하여 혼합물의 흡수를 546 nm에서 측정하고 단백질 농도를 BSA 보정 선을 통해 계산하였다.
실시예
6:
자일로바이오스에
대한 호열성
라삼소니아
에머소니이
Temer09484
β-자일로시다제 활성의 확인
라삼소니아 에머소니이 Temer09484의 β-자일로시다제 활성을 전술된 바와 같이 분석하였다. Temer09484 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고, pH 4.5 및 62℃에서 24시간 동안 항온처리한 후 자일로바이오스로부터의 자일로스 방출에 대해 2개 용량에서 분석하였다. 상기 효소는 표 3에 제시된 바와 같이 자일로바이오스로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer09484가 β-자일로시다제 활성을 갖는다는 것을 보여준다.
[표 3]
실시예 7: 중합체성 자일란 기질에 대한 호열성 라삼소니아 에머소니이 Temer09484 β-자일로시다제 활성의 확인
제2 실험으로서, 중합체성 자일란 기질에 대한 라삼소니아 에머소니이 Temer09484의 β-자일로시다제 활성도 분석하였다. Temer09484 아스퍼길러스 니게르 진탕 플라스크의 상청액을 10 mg/g의 용량으로 3개의 상이한 중합체성 자일란 기질들에 첨가하였다. 모든 3개의 기질들로부터 자일로스가 방출된 반면(표 4), 자일로올리고머는 형성되지 않았다. 이것은 Temer09484가 실시예 6에 제시된 작은 올리고머 다음으로 중합체성 기질에 대한 β-자일로시다제 활성도 갖는다는 것을 보여준다.
[표 4]
실시예 8: 리그노셀룰로스성 공급원료의 가수분해를 위한 Temer09484의 첨가에 의한 2개의 상이한 셀룰로스 혼합물들의 개선
Temer09484 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 전술된 바와 같이 약산 전처리된 옥수수대 공급원료에 첨가하였다. 상기 효소는 표 5에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 이 공급원료로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer09484가 리그노셀룰로스성 공급원료의 가수분해에 중요하다는 것을 보여준다.
[표 5]
Temer09484 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 2개의 상이한 셀룰로스 혼합물들과 함께 시험하였다: 추가 BG가 첨가된 TEC-210 및 셀루클라스트. 상기 두 셀룰로스 혼합물들의 경우 약산 전처리된 옥수수대로부터의 자일로스 방출이 표 6에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 Temer09484의 첨가에 의해 개선되었다. 이것은 Temer09484가 리그노셀룰로스성 공급원료의 가수분해에 이용된 넓은 온도 및 pH 값 범위 내에서 셀룰로스 혼합물을 개선하는 데에 이용될 수 있다는 것을 보여준다.
[표 6]
실시예 9: 자일로바이오스에 대한 호열성 라삼소니아 에머소니이 Temer00088 β-자일로시다제 활성의 확인
라삼소니아 에머소니이 Temer00088의 β-자일로시다제 활성을 전술된 바와 같이 분석하였다. Temer00088 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고, pH 4.5 및 62℃에서 24시간 동안 항온처리한 후 자일로바이오스로부터의 자일로스 방출에 대해 2개의 용량에서 분석하였다. 상기 효소는 표 7에 제시된 바와 같이 자일로바이오스로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer00088이 β-자일로시다제 활성을 갖는다는 것을 보여준다.
[표 7]
실시예 10: 중합체성 자일란 기질에 대한 호열성 라삼소니아 에머소니이 Temer00088 β-자일로시다제 활성의 확인
제2 실험으로서, 중합체성 자일란 기질에 대한 라삼소니아 에머소니이 Temer00088의 β-자일로시다제 활성도 분석하였다. Temer00088 아스퍼길러스 니게르 진탕 플라스크의 상청액을 10 mg/g의 용량으로 3개의 상이한 중합체성 자일란 기질들에 첨가하였다. 모든 3개의 기질들로부터 자일로스가 방출된 반면(표 8), 자일로올리고머는 형성되지 않았다. 이것은 Temer00088이 실시예 9에 제시된 작은 올리고머 다음으로 중합체성 기질에 대한 β-자일로시다제 활성도 갖는다는 것을 보여준다.
[표 8]
실시예 11: 리그노셀룰로스성 공급원료의 가수분해를 위한 Temer00088의 첨가에 의한 2개의 상이한 셀룰로스 혼합물들의 개선
Temer00088 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 전술된 바와 같이 약산 전처리된 옥수수대 공급원료에 첨가하였다. 상기 효소는 표 3에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 이 공급원료로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer00088이 리그노셀룰로스성 공급원료의 가수분해에 중요하다는 것을 보여준다.
[표 9]
Temer00088 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 2개의 상이한 셀룰로스 혼합물들과 함께 시험하였다: 추가 BG가 첨가된 TEC-210 및 셀루클라스트. 상기 두 셀룰로스 혼합물들의 경우 약산 전처리된 옥수수대로부터의 자일로스 방출이 표 10에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 Temer00088의 첨가에 의해 개선되었다. 이것은 Temer00088이 리그노셀룰로스성 공급원료의 가수분해에 이용된 넓은 온도 및 pH 값 범위 내에서 셀룰로스 혼합물을 개선하는 데에 이용될 수 있다는 것을 보여준다.
[표 10]
실시예 12: 호열성 라삼소니아 에머소니이 자일로글루칸 특이적 엔도-글루카나제의 확인
라삼소니아 에머소니이 Temer04790의 자일로글루카나제 활성을 전술된 바와 같이 분석하였다. Temer04790 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 기질 자일로글루칸에 첨가하고 pH 4.5 및 60℃에서 24시간 동안 항온처리하였다. 상기 효소는 표 6에 제시된 바와 같이 여러 올리고머들을 방출시킬 수 있었다. 이것은 Temer04790이 자일로글루칸에 대한 활성을 갖고 시판되는 트라이코데르마 리세이 셀룰라제 혼합물인 셀루클라스트와 유사한 올리고머를 방출시킨다는 것을 보여준다.
형성된 올리고머의 양을 정량하기 위해, Temer04790 및 셀룰라제 혼합물 둘다의 항온처리 후 환원 말단을 측정하였다. 카복시메틸셀룰로스를 기질로서 사용하여 효소 특이성도 측정하였고, 60℃ 다음으로 보다 더 높은 온도인 75℃를 이용하였다. 셀룰라제 혼합물과 대조적으로 CMC에 대한 어떠한 활성도 거의 관찰되지 않았기 때문에 Temer04790은 자일로글루칸에 대한 특이성을 갖는다(표 11). 나아가, Temer04790은 75℃에서 여전히 활성을 가진 반면, 셀룰라제 혼합물은 75℃에서 자일로글루칸에 대한 활성을 거의 갖지 않았다.
[표 11]
실시예 13: 호열성 라삼소니아 에머소니이 아라비노푸라노시다제 활성의 확인
라삼소니아 에머소니이 Temer05249의 아라비노푸라노시다제 활성을 전술된 바와 같이 분석하였다. Temer05249 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 아라비노자일로올리고머에 첨가한 후, pH 4.5 및 65℃에서 24시간 동안 항온처리하였다. 상기 효소는 표 12에 제시된 바와 같이 아라비노자일로올리고머로부터의 유의한 아라비노스 방출을 보였다. 이것은 Temer05249가 아라비노푸라노시다제 활성을 갖는다는 것을 보여준다.
[표 12]
실시예 14: 호열성 라삼소니아 에머소니이 엔도-자일라나제 활성의 확인
라삼소니아 에머소니이 Temer03124의 엔도-자일라나제 활성을 전술된 바와 같이 분석하였다. Temer03124 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 여러 자일란 기질들에 첨가한 후, pH 4.5 및 60℃에서 20시간 동안 항온처리하였다. 상기 효소는 표 13에 제시된 바와 같이 자일로스 및 다양한 자일로올리고머의 유의한 방출을 보였다. 이것은 Temer03124가 엔도-자일라나제 활성을 갖는다는 것을 보여준다.
[표 13]
실시예 15: 호열성 라삼소니아 에머소니이 엔도-자일라나제 활성의 확인
라삼소니아 에머소니이 Temer08570의 엔도-자일라나제 활성을 전술된 바와 같이 분석하였다. Temer08570 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 여러 자일란 기질들에 첨가한 후, pH 4.5 및 60℃에서 20시간 동안 항온처리하였다. 상기 효소는 표 14에 제시된 바와 같이 자일로스 및 다양한 자일로올리고머의 유의한 방출을 보였다. 이것은 Temer08570이 주요 생성물로서 자일로바이오스, 자일로트라이오스 및 자일로테트라오스를 갖는 엔도-자일라나제 활성을 갖는다는 것을 보여준다.
[표 14]
실시예 16: 호열성 라삼소니아 에머소니이 엔도-자일라나제 활성의 확인
라삼소니아 에머소니이 Temer08163의 엔도-자일라나제 활성을 전술된 바와 같이 분석하였다. Temer08163 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 여러 자일란 기질들에 첨가한 후, pH 4.5 및 60℃에서 20시간 동안 항온처리하였다. 상기 효소는 표 15에 제시된 바와 같이 자일로바이오스 및 자일로스의 유의한 방출을 보였다. 이것은 Temer08163이 방출된 자일로스의 양보다 12배 내지 25배 더 높은 주요 생성물로서 자일로바이오스를 갖는 엔도-자일라나제 활성을 갖는다는 것을 보여준다.
[표 15]
실시예
17: 호열성
라삼소니아
에머소니이
α-
글루쿠로니다제
활성의 확인
라삼소니아 에머소니이 Temer07305의 α-글루쿠로니다제 활성을 전술된 바와 같이 분석하였다. Temer07305 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 1 mg/g 및 10 mg/g의 용량으로 알도우론산에 첨가한 후, pH 4.5 및 60℃에서 24시간 동안 항온처리하였다. 상기 효소는 표 16에 제시된 바와 같이 자일로올리고머로부터 4-O-메틸글루쿠론산을 제거하여 자일로스, 자일로바이오스, 자일로트라이오스 및 자일로테트라오스를 동시에 방출시킬 수 있었다. 이것은 Temer07305가 α-글루쿠로니다제 활성을 갖는다는 것을 보여준다.
[표 16]
SEQUENCE LISTING
<110> DSM IP Assets B.V.
<120> CARBOHYDRATE DEGRADING POLYPEPTIDE AND USES THEREOF
<130> 29207-WO-PCT
<140> PCT/EP2014/051998
<141> 2014-02-03
<150> EP 13153824.1
<151> 2013-02-04
<160> 82
<170> PatentIn version 3.5
<210> 1
<211> 2286
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2286)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 1
atggtccttg gtgtctccct ggtccttctg gccactgctg tctccgccac cttccccgac 60
tgctctcagc ctcctctcaa ggacaacgcc gtctgcgaca ccagccttga ccctgtctcc 120
cgcgctgctg ccctcgttgc tgctttcacc ctggaggaga agatcaacaa cactcagaac 180
ggctcccccg gtgttccccg tctgggtctg cctccctacc agtggtggtc tgagggtctg 240
cacggtgttg ccatctcccc cggcgtcaac ttctctgctc acggtgactt ctcctacgcc 300
accagcttcc ctcagcccat cctgatgtcc gctgccttcg atgatgacct catccgccag 360
gtcggctccg tcgtcagcac tgaggctcgt gctttctcca acgccaaccg cgctggtctg 420
gactactgga ctcccaacat caaccccttc aaggaccctc gctggggtcg tggccaggag 480
actcccggtg aagatgcctt ccacatccag cgctacgtgt actctttgat tgatggcctc 540
cagaacggca ttggacctgc caaccccaag atcatggcca cctgcaagca cttcgctgcc 600
tacgacctcg aggactggca cggcaacgag cgctacggtt tcaacgccgt tgtgagcact 660
caggacctgg cggaatacta ccttcctccc ttcaagtcct gcgctcgtga tgccaaggtc 720
gatgccctca tgtgctcgta caacgctgtc aacggtgtgc cctcttgcgc ggactcctac 780
ctcttggaag atatcctccg tgaccactgg ggctggaaca ccaccggtca ctgggtgacc 840
tccgactgcg atgccgtcca gaacatctac gccaaccacc actacacttc caccgctccc 900
caggctgctg ccgatgcctt gggtgctggt actgatcttg actgcggtac cacctacccc 960
gacaaccttg gtgccgccta cacccagggt ctgttccaga accagacctt ggacaccgct 1020
ctgatccgtc tgtactcttc tctggtcaag cttggatact tcgaccctcc cgagaaccag 1080
ccctaccgca gcattggctg gtcagatgtc agcactcctg ctgctcagca gcttgcccgc 1140
actgctgctg ctgagggcat tgtcctcctc aagaacgatg agaagaaggt cctccccctc 1200
agccgtgagg gtcagaccct cgccgtcatc ggtcccttcg ccaacgccac cacccagctg 1260
cagggtaact accagggtgt tgctccttac atctggactg ttgttgctgc tgcggagcag 1320
ctgggctaca aggtcaacta cgccgacggt actgccatca acgctaccaa caccactggc 1380
ttcgccgagg ccgttgctgc cgccaagtcc tccgatgttg tcatctacgc tggtggtatc 1440
gacaacagca ttgaggctga aggccacgac cgtgacacca ttgtgtggcc cggcaaccag 1500
ctccagctca tctccgagct ggcgcagacc ggcaagcctc tggttgtcat ccagttcggt 1560
ggtggtcagg ttgatgactc ctccctcctt gccaacgact ccggtgtcaa cgccctcctc 1620
tgggctggct acccctccca ggctggtggt gctgccatct tcgagatcct gaccggtgcc 1680
actgcccccg ccggtcgtct gcctaccacc cagtaccctg ctcagtacgt ggatgaggtt 1740
cccatgaccg acatgaccct ccgcccctct gccaccaacc ccggtcgcac ctacagatgg 1800
tacgacaagg ccgtcatccc cttcggtttc ggcttgcact acaccacctt cgatgtcacc 1860
tggagcaagg cccagcttgg accttacgaa attggctctc ttgtcaagaa cgcgtcgtcg 1920
tcggatgctc ctgccgacac cgcccccttc gacaccttca ccatccacgt ccgcaacact 1980
ggcaagacca cctcggacta cgtggctctc ctcttcctct ccacccgcaa cgccggtcct 2040
gctccctacc ccctcaagac cctagttgga tacactcgtg cccgtgccat ccagcccggt 2100
gagactcgtg ccgtcgacat tgccgtcacc gttggcagcg ttgcccgtac cgacgagcgt 2160
ggtgacctcg tcctctaccc cggcacctac accctcgagg ttgacgtcaa cggccagtac 2220
cccactgctg gcttcgaagt caccggtgag gctgctgtcc tggatgagtt cccccagccc 2280
ccggcg 2286
<210> 2
<211> 746
<212> PRT
<213> Rasamsonia emersonii
<400> 2
Thr Phe Pro Asp Cys Ser Gln Pro Pro Leu Lys Asp Asn Ala Val Cys
1 5 10 15
Asp Thr Ser Leu Asp Pro Val Ser Arg Ala Ala Ala Leu Val Ala Ala
20 25 30
Phe Thr Leu Glu Glu Lys Ile Asn Asn Thr Gln Asn Gly Ser Pro Gly
35 40 45
Val Pro Arg Leu Gly Leu Pro Pro Tyr Gln Trp Trp Ser Glu Gly Leu
50 55 60
His Gly Val Ala Ile Ser Pro Gly Val Asn Phe Ser Ala His Gly Asp
65 70 75 80
Phe Ser Tyr Ala Thr Ser Phe Pro Gln Pro Ile Leu Met Ser Ala Ala
85 90 95
Phe Asp Asp Asp Leu Ile Arg Gln Val Gly Ser Val Val Ser Thr Glu
100 105 110
Ala Arg Ala Phe Ser Asn Ala Asn Arg Ala Gly Leu Asp Tyr Trp Thr
115 120 125
Pro Asn Ile Asn Pro Phe Lys Asp Pro Arg Trp Gly Arg Gly Gln Glu
130 135 140
Thr Pro Gly Glu Asp Ala Phe His Ile Gln Arg Tyr Val Tyr Ser Leu
145 150 155 160
Ile Asp Gly Leu Gln Asn Gly Ile Gly Pro Ala Asn Pro Lys Ile Met
165 170 175
Ala Thr Cys Lys His Phe Ala Ala Tyr Asp Leu Glu Asp Trp His Gly
180 185 190
Asn Glu Arg Tyr Gly Phe Asn Ala Val Val Ser Thr Gln Asp Leu Ala
195 200 205
Glu Tyr Tyr Leu Pro Pro Phe Lys Ser Cys Ala Arg Asp Ala Lys Val
210 215 220
Asp Ala Leu Met Cys Ser Tyr Asn Ala Val Asn Gly Val Pro Ser Cys
225 230 235 240
Ala Asp Ser Tyr Leu Leu Glu Asp Ile Leu Arg Asp His Trp Gly Trp
245 250 255
Asn Thr Thr Gly His Trp Val Thr Ser Asp Cys Asp Ala Val Gln Asn
260 265 270
Ile Tyr Ala Asn His His Tyr Thr Ser Thr Ala Pro Gln Ala Ala Ala
275 280 285
Asp Ala Leu Gly Ala Gly Thr Asp Leu Asp Cys Gly Thr Thr Tyr Pro
290 295 300
Asp Asn Leu Gly Ala Ala Tyr Thr Gln Gly Leu Phe Gln Asn Gln Thr
305 310 315 320
Leu Asp Thr Ala Leu Ile Arg Leu Tyr Ser Ser Leu Val Lys Leu Gly
325 330 335
Tyr Phe Asp Pro Pro Glu Asn Gln Pro Tyr Arg Ser Ile Gly Trp Ser
340 345 350
Asp Val Ser Thr Pro Ala Ala Gln Gln Leu Ala Arg Thr Ala Ala Ala
355 360 365
Glu Gly Ile Val Leu Leu Lys Asn Asp Glu Lys Lys Val Leu Pro Leu
370 375 380
Ser Arg Glu Gly Gln Thr Leu Ala Val Ile Gly Pro Phe Ala Asn Ala
385 390 395 400
Thr Thr Gln Leu Gln Gly Asn Tyr Gln Gly Val Ala Pro Tyr Ile Trp
405 410 415
Thr Val Val Ala Ala Ala Glu Gln Leu Gly Tyr Lys Val Asn Tyr Ala
420 425 430
Asp Gly Thr Ala Ile Asn Ala Thr Asn Thr Thr Gly Phe Ala Glu Ala
435 440 445
Val Ala Ala Ala Lys Ser Ser Asp Val Val Ile Tyr Ala Gly Gly Ile
450 455 460
Asp Asn Ser Ile Glu Ala Glu Gly His Asp Arg Asp Thr Ile Val Trp
465 470 475 480
Pro Gly Asn Gln Leu Gln Leu Ile Ser Glu Leu Ala Gln Thr Gly Lys
485 490 495
Pro Leu Val Val Ile Gln Phe Gly Gly Gly Gln Val Asp Asp Ser Ser
500 505 510
Leu Leu Ala Asn Asp Ser Gly Val Asn Ala Leu Leu Trp Ala Gly Tyr
515 520 525
Pro Ser Gln Ala Gly Gly Ala Ala Ile Phe Glu Ile Leu Thr Gly Ala
530 535 540
Thr Ala Pro Ala Gly Arg Leu Pro Thr Thr Gln Tyr Pro Ala Gln Tyr
545 550 555 560
Val Asp Glu Val Pro Met Thr Asp Met Thr Leu Arg Pro Ser Ala Thr
565 570 575
Asn Pro Gly Arg Thr Tyr Arg Trp Tyr Asp Lys Ala Val Ile Pro Phe
580 585 590
Gly Phe Gly Leu His Tyr Thr Thr Phe Asp Val Thr Trp Ser Lys Ala
595 600 605
Gln Leu Gly Pro Tyr Glu Ile Gly Ser Leu Val Lys Asn Ala Ser Ser
610 615 620
Ser Asp Ala Pro Ala Asp Thr Ala Pro Phe Asp Thr Phe Thr Ile His
625 630 635 640
Val Arg Asn Thr Gly Lys Thr Thr Ser Asp Tyr Val Ala Leu Leu Phe
645 650 655
Leu Ser Thr Arg Asn Ala Gly Pro Ala Pro Tyr Pro Leu Lys Thr Leu
660 665 670
Val Gly Tyr Thr Arg Ala Arg Ala Ile Gln Pro Gly Glu Thr Arg Ala
675 680 685
Val Asp Ile Ala Val Thr Val Gly Ser Val Ala Arg Thr Asp Glu Arg
690 695 700
Gly Asp Leu Val Leu Tyr Pro Gly Thr Tyr Thr Leu Glu Val Asp Val
705 710 715 720
Asn Gly Gln Tyr Pro Thr Ala Gly Phe Glu Val Thr Gly Glu Ala Ala
725 730 735
Val Leu Asp Glu Phe Pro Gln Pro Pro Ala
740 745
<210> 3
<211> 16
<212> PRT
<213> Rasamsonia emersonii
<400> 3
Met Val Leu Gly Val Ser Leu Val Leu Leu Ala Thr Ala Val Ser Ala
1 5 10 15
<210> 4
<211> 2289
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2289)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 4
atggttctgg gtgtcagtct cgtcctcctg gcgacggccg tctctgccac gttccccgac 60
tgcagccagc ctccgctgaa ggacaacgcc gtgtgcgata cctcgctgga ccccgtatcg 120
cgtgctgctg cgctcgtcgc ggccttcacg ctcgaggaga agatcaacaa cacgcagaat 180
ggatcgcctg gcgtgccccg gctgggcctg ccgccgtatc aatggtggag cgaaggcctg 240
cacggcgtgg ccatctcgcc gggcgtcaac ttctccgcgc acggcgactt cagctacgca 300
acctccttcc cccagcccat cctcatgagc gccgcctttg acgacgacct catcaggcag 360
gtcggcagtg tggtcagcac cgaggcgcgc gccttcagca acgccaaccg cgctggcctc 420
gactactgga cgcccaacat caaccccttc aaggacccgc gctggggtcg cgggcaggag 480
acgcccggcg aagacgcatt ccacatccag cgctacgtct acagcctcat cgacggcctg 540
caaaacggca ttgggccggc caaccccaag atcatggcca cctgcaagca cttcgccgcc 600
tacgacctcg aggactggca cggcaacgag cgctatggct tcaacgccgt cgtgtccacg 660
caggacctgg ccgagtacta cctgccgccc ttcaagagct gcgcccgcga cgccaaagtc 720
gacgcgctca tgtgcagcta caacgccgtc aacggggtgc cctcgtgcgc cgactcgtat 780
ctgctggagg acatcctgcg cgaccactgg ggctggaaca cgaccggcca ctgggtgacg 840
tccgactgcg atgccgtgca gaacatctac gccaaccatc actacacgtc gactgcgccc 900
caggcggccg cggacgccct gggcgccggc accgatctcg actgcggcac cacttatccc 960
gacaatctgg gcgctgccta cacgcagggg ctcttccaga accagaccct cgacacggcg 1020
ctcatccgcc tgtactcgtc gctcgtcaag ctgggctact ttgatccgcc ggagaaccag 1080
ccctaccggt cgataggctg gagtgatgtg tccacgccgg ccgcgcagca gctggcccgc 1140
acggcggcgg cggaggggat cgttcttctc aagaacgacg agaagaaagt cctgccgctg 1200
tcgcgcgagg gacagacgct cgccgtgatc gggcccttcg ccaacgcgac gacccagctg 1260
cagggcaatt accaaggcgt ggcgccgtac atctggacgg tggtcgcggc agcagagcag 1320
ctgggataca aggtcaacta cgcggatggc acggctatca acgcgaccaa cacgactggc 1380
tttgcagagg cagtggccgc agccaagtcg tccgacgtcg tcatctatgc gggcggcatc 1440
gacaactcga tcgaagcgga gggccacgac cgcgacacga tcgtctggcc gggcaaccag 1500
ctgcagctga tcagcgagct agcgcagact ggcaaaccgc tggtcgtcat ccaattcggc 1560
ggcgggcaag tggacgactc gtccctgctg gcaaacgaca gcggcgtcaa cgccctgctg 1620
tgggcgggct atcccagcca ggctgggggc gccgccatct tcgaaatcct gacgggagcg 1680
acagcgccgg caggccgtct cccgacgacg cagtacccgg cgcagtacgt cgacgaggtg 1740
ccgatgacgg acatgacgct gcggccgagc gcgacgaacc cgggacggac gtaccggtgg 1800
tacgacaagg cggtgatccc gttcggattc gggctgcact acacgacgtt tgacgtgacg 1860
tggagcaagg cgcagctggg accgtacgag atcggctctc tcgtgaaaaa cgcctcttct 1920
tccgatgcgc ctgccgacac ggctccgttc gacaccttca ccatccacgt ccgaaacacg 1980
ggcaagacga cctcagacta cgtcgcgctg ctcttcctct cgacgcgcaa cgcgggacca 2040
gcaccgtatc cgctcaagac gctggtgggc tacacgcggg cgcgggcgat ccagccgggc 2100
gagacgcgcg cggtcgacat cgcggtgacg gtgggatcgg tggcgcggac agacgagcgc 2160
ggggatctgg tactgtatcc ggggacgtac acgctggagg tggatgtgaa cgggcagtat 2220
ccaactgcag ggtttgaggt gaccggggag gcggcggttc tggatgagtt tccgcagccg 2280
ccggcataa 2289
<210> 5
<211> 2289
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2289)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 5
atggttctgg gtgtcagtct cgtcctcctg gcgacggccg tctctgccac gttccccgac 60
tgcagccagc ctccgctgaa ggacaacgcc gtgtgcgata cctcgctgga ccccgtatcg 120
cgtgctgctg cgctcgtcgc ggccttcacg ctcgaggaga agatcaacaa cacgcagaat 180
ggatcgcctg gcgtgccccg gctgggcctg ccgccgtatc aatggtggag cgaaggcctg 240
cacggcgtgg ccatctcgcc gggcgtcaac ttctccgcgc acggcgactt cagctacgca 300
acctccttcc cccagcccat cctcatgagc gccgcctttg acgacgacct catcaggcag 360
gtcggcagtg tggtcagcac cgaggcgcgc gccttcagca acgccaaccg cgctggcctc 420
gactactgga cgcccaacat caaccccttc aaggacccgc gctggggtcg cgggcaggag 480
acgcccggcg aagacgcatt ccacatccag cgctacgtct acagcctcat cgacggcctg 540
caaaacggca ttgggccggc caaccccaag atcatggcca cctgcaagca cttcgccgcc 600
tacgacctcg aggactggca cggcaacgag cgctatggct tcaacgccgt cgtgtccacg 660
caggacctgg ccgagtacta cctgccgccc ttcaagagct gcgcccgcga cgccaaagtc 720
gacgcgctca tgtgcagcta caacgccgtc aacggggtgc cctcgtgcgc cgactcgtat 780
ctgctggagg acatcctgcg cgaccactgg ggctggaaca cgaccggcca ctgggtgacg 840
tccgactgcg atgccgtgca gaacatctac gccaaccatc actacacgtc gactgcgccc 900
caggcggccg cggacgccct gggcgccggc accgatctcg actgcggcac cacttatccc 960
gacaatctgg gcgctgccta cacgcagggg ctcttccaga accagaccct cgacacggcg 1020
ctcatccgcc tgtactcgtc gctcgtcaag ctgggctact ttgatccgcc ggagaaccag 1080
ccctaccggt cgataggctg gagtgatgtg tccacgccgg ccgcgcagca gctggcccgc 1140
acggcggcgg cggaggggat cgttcttctc aagaacgacg agaagaaagt cctgccgctg 1200
tcgcgcgagg gacagacgct cgccgtgatc gggcccttcg ccaacgcgac gacccagctg 1260
cagggcaatt accaaggcgt ggcgccgtac atctggacgg tggtcgcggc agcagagcag 1320
ctgggataca aggtcaacta cgcggatggc acggctatca acgcgaccaa cacgactggc 1380
tttgcagagg cagtggccgc agccaagtcg tccgacgtcg tcatctatgc gggcggcatc 1440
gacaactcga tcgaagcgga gggccacgac cgcgacacga tcgtctggcc gggcaaccag 1500
ctgcagctga tcagcgagct agcgcagact ggcaaaccgc tggtcgtcat ccaattcggc 1560
ggcgggcaag tggacgactc gtccctgctg gcaaacgaca gcggcgtcaa cgccctgctg 1620
tgggcgggct atcccagcca ggctgggggc gccgccatct tcgaaatcct gacgggagcg 1680
acagcgccgg caggccgtct cccgacgacg cagtacccgg cgcagtacgt cgacgaggtg 1740
ccgatgacgg acatgacgct gcggccgagc gcgacgaacc cgggacggac gtaccggtgg 1800
tacgacaagg cggtgatccc gttcggattc gggctgcact acacgacgtt tgacgtgacg 1860
tggagcaagg cgcagctggg accgtacgag atcggctctc tcgtgaaaaa cgcctcttct 1920
tccgatgcgc ctgccgacac ggctccgttc gacaccttca ccatccacgt ccgaaacacg 1980
ggcaagacga cctcagacta cgtcgcgctg ctcttcctct cgacgcgcaa cgcgggacca 2040
gcaccgtatc cgctcaagac gctggtgggc tacacgcggg cgcgggcgat ccagccgggc 2100
gagacgcgcg cggtcgacat cgcggtgacg gtgggatcgg tggcgcggac agacgagcgc 2160
ggggatctgg tactgtatcc ggggacgtac acgctggagg tggatgtgaa cgggcagtat 2220
ccaactgcag ggtttgaggt gaccggggag gcggcggttc tggatgagtt tccgcagccg 2280
ccggcataa 2289
<210> 6
<211> 2388
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2388)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 6
atggtgaccc gtgctgccat tttgactgct gttgctgctc tcctccccac tgccacctgg 60
gcgcaggaca accagaccta cgccaactac tcttcccaga gccagcccga cctcttcccc 120
cgcaccgttg ccaccatcga tctttctttc cctgactgcg agaacggacc tctgagcacc 180
aacctcgtct gcaacaagtc ggcggacccc tgggctcgtg ctgaggctct gatctccctc 240
ttcactttgg aggagctcat caacaacacc cagaacactg ctcccggtgt tcctcgtctg 300
ggcctccccc agtaccaggt ctggaacgag gccttgcacg gtcttgaccg tgccaacttc 360
tctcactccg gtgaatactc ttgggccacc agcttcccca tgcccatcct gagcatggcc 420
tccttcaacc gcaccctcat caaccagatt gcctccatca ttgccactca ggcccgtgct 480
ttcaacaacg ctggccgcta cggcttggat tcctacgctc ccaacatcaa cggtttccgc 540
tctcctctct ggggtcgtgg tcaggaaacc cccggtgagg atgccttctt cctgagctca 600
acatacgcct acgaatacat caccggcttg cagggtggtg ttgaccctga gcacgtcaag 660
atcgtcgcca ctgccaagca cttcgctgga tacgaccttg agaactgggg taacgtgtct 720
cgcttgggtt tcaacgccat catcacccag caggatcttt ctgaatacta cactccccag 780
ttcctggcct ccgctcgcta cgccaagacc cgcagcatca tgtgctccta caacgccgtc 840
aacggtgttc cctcctgcgc gaactcgttc ttcctgcaga ctctcctccg cgagaacttc 900
gacttcgtcg acgatggata cgtgagctcc gactgcgatg ccgtctacaa cgtgttcaac 960
ccccacggat acgctctcaa ccagtctggt gctgctgccg actctcttct ggctggtacc 1020
gacatcgact gcggtcagac cctcccctgg cacctgaacg agagcttcgt ggaaggatat 1080
gtctcccgtg gtgacattga gaagtccctc acccgtctgt actccaacct ggtccgccta 1140
ggatacttcg atggaaacaa cagcgaatac cgcaacctca actggaacga cgttgtcacc 1200
accgatgcct ggaacatctc ctacgaagcc gccgttgagg gtatcaccct gctcaagaac 1260
gatggcaccc ttcctctttc caagaaggtc cgctccatcg ccttgattgg accttgggcc 1320
aacgccactg tccagatgca gggcaactac tacggcactc ctccctacct catctcccct 1380
ctggaggctg ccaaggcctc cggcttcacc gtcaactacg ctttcggcac caacatctcc 1440
accgacagca cccagtggtt cgctgaggcc atcgctgctg ccaagaagtc ggatgtcatc 1500
atctacgctg gtggcattga caacaccatt gaggctgagg gccaggaccg taccgacttg 1560
aaatggcccg gcaaccagct cgacctcatt gagcagctgt cccaggtcgg caagcctctg 1620
gtcgtcctcc agatgggtgg tggccaggtc gactcttcct ccctcaaggc caacaagaac 1680
gtcaacgccc ttgtctgggg tggataccct ggccagtccg gcggtgctgc tcttttcgac 1740
atcctgaccg gcaagcgtgc tcctgctggt cgtcttgtct ccacccagta ccccgctgaa 1800
tacgccaccc agttccccgc caacgacatg aacctgcgcc ccaacggctc caaccccggc 1860
cagacttaca tctggtacac cggtactccc gtctacgagt tcggccacgg tctgttctac 1920
actgagttcc aggagtccgc tgctgctggt accaacaaga ccagcacttt tgacatcctg 1980
gatctgttct ccactcctca ccctggttac gagtacatcg agcaggttcc cttcatcaac 2040
gtcaccgttg atgtcaagaa cgttggccac accccttctc cctacaccgg cctcctcttc 2100
gccaacacca ctgctggtcc caagccctac cccaacaagt ggctggtcgg tttcgaccgt 2160
ctgcccacca ttcaaccagg cgaaaccgcc aagctcacca tccccgttcc tcttggtgcc 2220
attgcccgtg ccgatgagaa cggcaacaag gttgtgttcc ccggtaacta cgagcttgct 2280
ctcaacaacg agcgctccgt tgttgtctct ttcaccctca ccggtgatgc tgccaccctc 2340
gagaagtggc ccctctggga gcaggctgtt cccggtgtca ctcagcag 2388
<210> 7
<211> 775
<212> PRT
<213> Rasamsonia emersonii
<400> 7
Gln Asp Asn Gln Thr Tyr Ala Asn Tyr Ser Ser Gln Ser Gln Pro Asp
1 5 10 15
Leu Phe Pro Arg Thr Val Ala Thr Ile Asp Leu Ser Phe Pro Asp Cys
20 25 30
Glu Asn Gly Pro Leu Ser Thr Asn Leu Val Cys Asn Lys Ser Ala Asp
35 40 45
Pro Trp Ala Arg Ala Glu Ala Leu Ile Ser Leu Phe Thr Leu Glu Glu
50 55 60
Leu Ile Asn Asn Thr Gln Asn Thr Ala Pro Gly Val Pro Arg Leu Gly
65 70 75 80
Leu Pro Gln Tyr Gln Val Trp Asn Glu Ala Leu His Gly Leu Asp Arg
85 90 95
Ala Asn Phe Ser His Ser Gly Glu Tyr Ser Trp Ala Thr Ser Phe Pro
100 105 110
Met Pro Ile Leu Ser Met Ala Ser Phe Asn Arg Thr Leu Ile Asn Gln
115 120 125
Ile Ala Ser Ile Ile Ala Thr Gln Ala Arg Ala Phe Asn Asn Ala Gly
130 135 140
Arg Tyr Gly Leu Asp Ser Tyr Ala Pro Asn Ile Asn Gly Phe Arg Ser
145 150 155 160
Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly Glu Asp Ala Phe Phe
165 170 175
Leu Ser Ser Thr Tyr Ala Tyr Glu Tyr Ile Thr Gly Leu Gln Gly Gly
180 185 190
Val Asp Pro Glu His Val Lys Ile Val Ala Thr Ala Lys His Phe Ala
195 200 205
Gly Tyr Asp Leu Glu Asn Trp Gly Asn Val Ser Arg Leu Gly Phe Asn
210 215 220
Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr Tyr Thr Pro Gln Phe
225 230 235 240
Leu Ala Ser Ala Arg Tyr Ala Lys Thr Arg Ser Ile Met Cys Ser Tyr
245 250 255
Asn Ala Val Asn Gly Val Pro Ser Cys Ala Asn Ser Phe Phe Leu Gln
260 265 270
Thr Leu Leu Arg Glu Asn Phe Asp Phe Val Asp Asp Gly Tyr Val Ser
275 280 285
Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn Pro His Gly Tyr Ala
290 295 300
Leu Asn Gln Ser Gly Ala Ala Ala Asp Ser Leu Leu Ala Gly Thr Asp
305 310 315 320
Ile Asp Cys Gly Gln Thr Leu Pro Trp His Leu Asn Glu Ser Phe Val
325 330 335
Glu Gly Tyr Val Ser Arg Gly Asp Ile Glu Lys Ser Leu Thr Arg Leu
340 345 350
Tyr Ser Asn Leu Val Arg Leu Gly Tyr Phe Asp Gly Asn Asn Ser Glu
355 360 365
Tyr Arg Asn Leu Asn Trp Asn Asp Val Val Thr Thr Asp Ala Trp Asn
370 375 380
Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Thr Leu Leu Lys Asn Asp
385 390 395 400
Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile Ala Leu Ile Gly
405 410 415
Pro Trp Ala Asn Ala Thr Val Gln Met Gln Gly Asn Tyr Tyr Gly Thr
420 425 430
Pro Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys Ala Ser Gly Phe
435 440 445
Thr Val Asn Tyr Ala Phe Gly Thr Asn Ile Ser Thr Asp Ser Thr Gln
450 455 460
Trp Phe Ala Glu Ala Ile Ala Ala Ala Lys Lys Ser Asp Val Ile Ile
465 470 475 480
Tyr Ala Gly Gly Ile Asp Asn Thr Ile Glu Ala Glu Gly Gln Asp Arg
485 490 495
Thr Asp Leu Lys Trp Pro Gly Asn Gln Leu Asp Leu Ile Glu Gln Leu
500 505 510
Ser Gln Val Gly Lys Pro Leu Val Val Leu Gln Met Gly Gly Gly Gln
515 520 525
Val Asp Ser Ser Ser Leu Lys Ala Asn Lys Asn Val Asn Ala Leu Val
530 535 540
Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Ala Ala Leu Phe Asp Ile
545 550 555 560
Leu Thr Gly Lys Arg Ala Pro Ala Gly Arg Leu Val Ser Thr Gln Tyr
565 570 575
Pro Ala Glu Tyr Ala Thr Gln Phe Pro Ala Asn Asp Met Asn Leu Arg
580 585 590
Pro Asn Gly Ser Asn Pro Gly Gln Thr Tyr Ile Trp Tyr Thr Gly Thr
595 600 605
Pro Val Tyr Glu Phe Gly His Gly Leu Phe Tyr Thr Glu Phe Gln Glu
610 615 620
Ser Ala Ala Ala Gly Thr Asn Lys Thr Ser Thr Phe Asp Ile Leu Asp
625 630 635 640
Leu Phe Ser Thr Pro His Pro Gly Tyr Glu Tyr Ile Glu Gln Val Pro
645 650 655
Phe Ile Asn Val Thr Val Asp Val Lys Asn Val Gly His Thr Pro Ser
660 665 670
Pro Tyr Thr Gly Leu Leu Phe Ala Asn Thr Thr Ala Gly Pro Lys Pro
675 680 685
Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg Leu Pro Thr Ile Gln
690 695 700
Pro Gly Glu Thr Ala Lys Leu Thr Ile Pro Val Pro Leu Gly Ala Ile
705 710 715 720
Ala Arg Ala Asp Glu Asn Gly Asn Lys Val Val Phe Pro Gly Asn Tyr
725 730 735
Glu Leu Ala Leu Asn Asn Glu Arg Ser Val Val Val Ser Phe Thr Leu
740 745 750
Thr Gly Asp Ala Ala Thr Leu Glu Lys Trp Pro Leu Trp Glu Gln Ala
755 760 765
Val Pro Gly Val Thr Gln Gln
770 775
<210> 8
<211> 21
<212> PRT
<213> Rasamsonia emersonii
<400> 8
Met Val Thr Arg Ala Ala Ile Leu Thr Ala Val Ala Ala Leu Leu Pro
1 5 10 15
Thr Ala Thr Trp Ala
20
<210> 9
<211> 2391
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2391)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 9
atggtgactc gcgcggcgat tctcaccgca gtggcggcgc tcctgcccac cgcgacatgg 60
gcacaggata accaaaccta tgccaattac tcgtcgcagt ctcagccgga cctgtttccc 120
cggaccgtcg cgaccatcga cctgtccttc cccgactgtg agaatggccc gctcagcacg 180
aacctggtgt gcaacaaatc ggccgatccc tgggcccgag ctgaggccct catctcgctc 240
tttaccctcg aagagctgat taacaacacc cagaacaccg ctcctggcgt gccccgtttg 300
ggtctgcccc agtatcaggt gtggaatgaa gctctgcacg gactggaccg cgccaatttc 360
tcccattcgg gcgaatacag ctgggccacg tccttcccca tgcccatcct gtcgatggcg 420
tccttcaacc ggaccctcat caaccagatt gcctccatca ttgcaacgca agcccgtgcc 480
ttcaacaacg ccggccgtta cggccttgac agctatgcgc ccaacatcaa tggcttccgc 540
agtcccctct ggggccgtgg acaggagacg cctggtgagg atgcgttctt cttgagttcc 600
acctatgcgt acgagtacat cacaggcctg cagggcggtg tcgacccaga gcatgtcaag 660
atcgtcgcga cggcgaagca cttcgccggc tatgatctgg agaactgggg caacgtctct 720
cggctggggt tcaatgctat catcacgcag caggatctct ccgagtacta cacccctcag 780
ttcctggcgt ctgctcgata cgccaagacg cgcagcatca tgtgctccta caatgcagtg 840
aatggagtcc caagctgtgc caactccttc ttcctccaga cgcttctccg agaaaacttt 900
gacttcgttg acgacgggta cgtctcgtcg gattgcgacg ccgtctacaa cgtcttcaac 960
ccacacggtt acgcccttaa ccagtcggga gccgctgcgg actcgctcct agcaggtacc 1020
gatatcgact gtggtcagac cttgccgtgg cacctgaatg agtccttcgt agaaggatac 1080
gtctcccgcg gtgatatcga gaaatccctc acccgtctct actcaaacct ggtgcgtctc 1140
ggctactttg acggcaacaa cagcgagtac cgcaacctca actggaacga cgtcgtgact 1200
acggacgcct ggaacatctc gtacgaggcc gcggtggaag gtatcaccct gctcaagaac 1260
gacggaacgc tgccgctgtc caagaaggtc cgcagcattg cgctcatcgg tccttgggcc 1320
aatgccacgg tgcagatgca gggtaactac tatggaacgc caccgtatct gatcagtccg 1380
ctggaagccg ccaaggccag tgggttcacg gtcaactatg cattcggtac caacatctcg 1440
accgattcta cccagtggtt cgcggaagcc atcgcggcgg cgaagaagtc ggacgtgatc 1500
atctacgccg gtggtattga caacacgatc gaggcagagg gacaggaccg cacggatctc 1560
aagtggccgg ggaaccagct ggatctgatc gagcagctca gccaggtggg caagcccttg 1620
gtcgtcctgc agatgggcgg tggccaggtg gattcgtcgt cactcaaggc caacaagaat 1680
gtcaacgctc tggtgtgggg tggctatccc ggacagtcgg gtggtgcggc cctgtttgac 1740
atccttacgg gcaagcgtgc gccggccggt cgtctggtga gcacgcagta cccggccgag 1800
tatgcgacgc agttcccggc caacgacatg aacctgcgtc cgaacggcag caacccggga 1860
cagacataca tctggtacac gggcacgccc gtgtatgagt tcggccacgg tctgttctac 1920
acggagttcc aggagtcggc tgcggcgggc acgaacaaga cgtcgacttt cgacattctg 1980
gaccttttct ccacccctca tccgggatac gagtacatcg agcaggttcc gttcatcaac 2040
gtgactgtgg acgtgaagaa cgtcggccac acgccatcgc cgtacacggg tctgttgttc 2100
gcgaacacga cagccgggcc caagccgtac ccgaacaaat ggctcgtcgg gttcgaccgg 2160
ctgccgacga tccagccggg cgagactgcc aagttgacga tcccggtgcc gttgggcgcg 2220
attgcgcggg cggacgagaa cggcaacaag gtggtcttcc cgggcaacta cgaattggca 2280
ctgaacaatg agcgatcggt agtggtgtcg ttcacgctga cgggcgatgc ggcgactcta 2340
gagaaatggc ctttgtggga gcaggcggtg ccgggggtga cccagcagta g 2391
<210> 10
<211> 2391
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2391)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 10
atggtgactc gcgcggcgat tctcaccgca gtggcggcgc tcctgcccac cgcgacatgg 60
gcacaggata accaaaccta tgccaattac tcgtcgcagt ctcagccgga cctgtttccc 120
cggaccgtcg cgaccatcga cctgtccttc cccgactgtg agaatggccc gctcagcacg 180
aacctggtgt gcaacaaatc ggccgatccc tgggcccgag ctgaggccct catctcgctc 240
tttaccctcg aagagctgat taacaacacc cagaacaccg ctcctggcgt gccccgtttg 300
ggtctgcccc agtatcaggt gtggaatgaa gctctgcacg gactggaccg cgccaatttc 360
tcccattcgg gcgaatacag ctgggccacg tccttcccca tgcccatcct gtcgatggcg 420
tccttcaacc ggaccctcat caaccagatt gcctccatca ttgcaacgca agcccgtgcc 480
ttcaacaacg ccggccgtta cggccttgac agctatgcgc ccaacatcaa tggcttccgc 540
agtcccctct ggggccgtgg acaggagacg cctggtgagg atgcgttctt cttgagttcc 600
acctatgcgt acgagtacat cacaggcctg cagggcggtg tcgacccaga gcatgtcaag 660
atcgtcgcga cggcgaagca cttcgccggc tatgatctgg agaactgggg caacgtctct 720
cggctggggt tcaatgctat catcacgcag caggatctct ccgagtacta cacccctcag 780
ttcctggcgt ctgctcgata cgccaagacg cgcagcatca tgtgctccta caatgcagtg 840
aatggagtcc caagctgtgc caactccttc ttcctccaga cgcttctccg agaaaacttt 900
gacttcgttg acgacgggta cgtctcgtcg gattgcgacg ccgtctacaa cgtcttcaac 960
ccacacggtt acgcccttaa ccagtcggga gccgctgcgg actcgctcct agcaggtacc 1020
gatatcgact gtggtcagac cttgccgtgg cacctgaatg agtccttcgt agaaggatac 1080
gtctcccgcg gtgatatcga gaaatccctc acccgtctct actcaaacct ggtgcgtctc 1140
ggctactttg acggcaacaa cagcgagtac cgcaacctca actggaacga cgtcgtgact 1200
acggacgcct ggaacatctc gtacgaggcc gcggtggaag gtatcaccct gctcaagaac 1260
gacggaacgc tgccgctgtc caagaaggtc cgcagcattg cgctcatcgg tccttgggcc 1320
aatgccacgg tgcagatgca gggtaactac tatggaacgc caccgtatct gatcagtccg 1380
ctggaagccg ccaaggccag tgggttcacg gtcaactatg cattcggtac caacatctcg 1440
accgattcta cccagtggtt cgcggaagcc atcgcggcgg cgaagaagtc ggacgtgatc 1500
atctacgccg gtggtattga caacacgatc gaggcagagg gacaggaccg cacggatctc 1560
aagtggccgg ggaaccagct ggatctgatc gagcagctca gccaggtggg caagcccttg 1620
gtcgtcctgc agatgggcgg tggccaggtg gattcgtcgt cactcaaggc caacaagaat 1680
gtcaacgctc tggtgtgggg tggctatccc ggacagtcgg gtggtgcggc cctgtttgac 1740
atccttacgg gcaagcgtgc gccggccggt cgtctggtga gcacgcagta cccggccgag 1800
tatgcgacgc agttcccggc caacgacatg aacctgcgtc cgaacggcag caacccggga 1860
cagacataca tctggtacac gggcacgccc gtgtatgagt tcggccacgg tctgttctac 1920
acggagttcc aggagtcggc tgcggcgggc acgaacaaga cgtcgacttt cgacattctg 1980
gaccttttct ccacccctca tccgggatac gagtacatcg agcaggttcc gttcatcaac 2040
gtgactgtgg acgtgaagaa cgtcggccac acgccatcgc cgtacacggg tctgttgttc 2100
gcgaacacga cagccgggcc caagccgtac ccgaacaaat ggctcgtcgg gttcgaccgg 2160
ctgccgacga tccagccggg cgagactgcc aagttgacga tcccggtgcc gttgggcgcg 2220
attgcgcggg cggacgagaa cggcaacaag gtggtcttcc cgggcaacta cgaattggca 2280
ctgaacaatg agcgatcggt agtggtgtcg ttcacgctga cgggcgatgc ggcgactcta 2340
gagaaatggc ctttgtggga gcaggcggtg ccgggggtga cccagcagta g 2391
<210> 11
<211> 1473
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1473)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 11
atgggtcgcc gcattgccac tgctgctctg ctcctgttcg gtctgaacgc cctcaagggt 60
gttgttgctc tcgacaacgg tcttgccatc actccccaga tgggctggaa cacctggaac 120
tcgttcggct gctcgctgaa cgaaaccgtc atcctggatg ctgctgagaa gcttgtgtcg 180
ctaggattca aggacctagg atacgagtac gtggtgctgg atgactgctg gtccgctggc 240
cgtaacgcct ctggctacct ggttcctgac cctgccaagt tccccaacgg cattgatggt 300
cttgccgaga agatccacgc tcttggcctc aagatcggta tctactcttc tgctggtacc 360
atgacctgcg ctcgttacgc tggctctctt ggatacgagg agaaggatgc cgccctctgg 420
gcctcctggg gtatcgacta cctcaagtac gacaactgct acaaccaggg tcaagagggt 480
actcccaagc tcagctacga ccgctacaac gccatgggcc aggctctgaa caagaccggc 540
cgtcccattc tctactccct ctgcaactgg ggtgttgacg gcccctggaa cttcgcctcc 600
accattgcca acagctggcg cacctccggt gacctgctca acacctggga ccgtgatgat 660
gccaactgcc cctgctctga gctcgaaggc ttggactgca agacccccgg ctacaagtgc 720
tcgatcctga acgtcatcaa caaggccgtc tactacccct ccaaggcctt ccctggtgcc 780
tggaacgacc ttgacatgct ccaggtcggc aacggtggat tgaccgacga tgaggccgtt 840
gctcacatga gcctctgggc tgctttcaag tctcctctcc tcatgaccaa cgtcctcagc 900
aacattgacc ctcccaccct gtccatcctg cagaaccccg ccgttctagc ggtgtctcag 960
gaccccgtcg gctcctccgt caaccgtatc tggcgctact acgtggatga tgtcgacgcc 1020
aacggatacg gcgagatcca gctgttctcc ggtggtcttg ctggtggtga ccagctcgtc 1080
ctccttctga acgctggcag caaggaccgt accatgaacg ccaccctgga ggacatcttc 1140
tgggaagatg gacctggtgg tactgcctcc caggtccagc agtcctggga tgtctacgat 1200
ctctgggcca accgcatgag caacgagact gctgctgcca tcatcaacgc cgccaacagc 1260
actggaagcg ctgctcctgc tgctcccatc aacatgactg ctcttggtgg tgccaagcac 1320
gtctactctc aggttcctcc ctccgactcc aaggctctga tgggtaccaa ggtcggctcc 1380
gtccagccct ccggcaccgt caaggctttc gtcaaggccc acggtgttgc catgctccgc 1440
ctccgtcagc agtcccagaa gaaggacgaa cta 1473
<210> 12
<211> 468
<212> PRT
<213> Rasamsonia emersonii
<400> 12
Leu Asp Asn Gly Leu Ala Ile Thr Pro Gln Met Gly Trp Asn Thr Trp
1 5 10 15
Asn Ser Phe Gly Cys Ser Leu Asn Glu Thr Val Ile Leu Asp Ala Ala
20 25 30
Glu Lys Leu Val Ser Leu Gly Phe Lys Asp Leu Gly Tyr Glu Tyr Val
35 40 45
Val Leu Asp Asp Cys Trp Ser Ala Gly Arg Asn Ala Ser Gly Tyr Leu
50 55 60
Val Pro Asp Pro Ala Lys Phe Pro Asn Gly Ile Asp Gly Leu Ala Glu
65 70 75 80
Lys Ile His Ala Leu Gly Leu Lys Ile Gly Ile Tyr Ser Ser Ala Gly
85 90 95
Thr Met Thr Cys Ala Arg Tyr Ala Gly Ser Leu Gly Tyr Glu Glu Lys
100 105 110
Asp Ala Ala Leu Trp Ala Ser Trp Gly Ile Asp Tyr Leu Lys Tyr Asp
115 120 125
Asn Cys Tyr Asn Gln Gly Gln Glu Gly Thr Pro Lys Leu Ser Tyr Asp
130 135 140
Arg Tyr Asn Ala Met Gly Gln Ala Leu Asn Lys Thr Gly Arg Pro Ile
145 150 155 160
Leu Tyr Ser Leu Cys Asn Trp Gly Val Asp Gly Pro Trp Asn Phe Ala
165 170 175
Ser Thr Ile Ala Asn Ser Trp Arg Thr Ser Gly Asp Leu Leu Asn Thr
180 185 190
Trp Asp Arg Asp Asp Ala Asn Cys Pro Cys Ser Glu Leu Glu Gly Leu
195 200 205
Asp Cys Lys Thr Pro Gly Tyr Lys Cys Ser Ile Leu Asn Val Ile Asn
210 215 220
Lys Ala Val Tyr Tyr Pro Ser Lys Ala Phe Pro Gly Ala Trp Asn Asp
225 230 235 240
Leu Asp Met Leu Gln Val Gly Asn Gly Gly Leu Thr Asp Asp Glu Ala
245 250 255
Val Ala His Met Ser Leu Trp Ala Ala Phe Lys Ser Pro Leu Leu Met
260 265 270
Thr Asn Val Leu Ser Asn Ile Asp Pro Pro Thr Leu Ser Ile Leu Gln
275 280 285
Asn Pro Ala Val Leu Ala Val Ser Gln Asp Pro Val Gly Ser Ser Val
290 295 300
Asn Arg Ile Trp Arg Tyr Tyr Val Asp Asp Val Asp Ala Asn Gly Tyr
305 310 315 320
Gly Glu Ile Gln Leu Phe Ser Gly Gly Leu Ala Gly Gly Asp Gln Leu
325 330 335
Val Leu Leu Leu Asn Ala Gly Ser Lys Asp Arg Thr Met Asn Ala Thr
340 345 350
Leu Glu Asp Ile Phe Trp Glu Asp Gly Pro Gly Gly Thr Ala Ser Gln
355 360 365
Val Gln Gln Ser Trp Asp Val Tyr Asp Leu Trp Ala Asn Arg Met Ser
370 375 380
Asn Glu Thr Ala Ala Ala Ile Ile Asn Ala Ala Asn Ser Thr Gly Ser
385 390 395 400
Ala Ala Pro Ala Ala Pro Ile Asn Met Thr Ala Leu Gly Gly Ala Lys
405 410 415
His Val Tyr Ser Gln Val Pro Pro Ser Asp Ser Lys Ala Leu Met Gly
420 425 430
Thr Lys Val Gly Ser Val Gln Pro Ser Gly Thr Val Lys Ala Phe Val
435 440 445
Lys Ala His Gly Val Ala Met Leu Arg Leu Arg Gln Gln Ser Gln Lys
450 455 460
Lys Asp Glu Leu
465
<210> 13
<211> 23
<212> PRT
<213> Rasamsonia emersonii
<400> 13
Met Gly Arg Arg Ile Ala Thr Ala Ala Leu Leu Leu Phe Gly Leu Asn
1 5 10 15
Ala Leu Lys Gly Val Val Ala
20
<210> 14
<211> 1670
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1670)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 14
atggggagaa gaattgctac tgctgcactt ctcttgttcg ggctcaatgc cttgaaagga 60
gtggtggcgc tggacaatgg cctggccatc actccgcaga tgggatgggt aagaatatat 120
ccaattgaat ggccaaactt gaaagttgca attggaattt gaataatcct gctcatgcat 180
aagtcaacag aacacatgga actccttcgg atgctcgcta aacgagaccg tcatcctaga 240
cgcggccgaa aagctcgtct cgctcggatt caaggatctc ggctatgagt acgtcgtcct 300
ggacgactgc tggtctgccg gccggaacgc gtctggctat ctggtgccgg atccagccaa 360
gtttcccaat ggcatcgatg gcctggcgga gaagatccat gcgctgggct tgaagattgg 420
catttattcc agtgcgggaa ccatgacttg cgcccgctat gctgggtcgt tgggatatga 480
agagaaggat gcagcgcttt gggctagttg gggggtaagt acgcctaaag ggcataaaac 540
ctgcaaagaa aatacttaaa aaaaaacgta aatagatcga ctacctcaaa tacgacaact 600
gctacaacca aggccaagaa ggcacgccca agctctcgta cgaccgctac aacgccatgg 660
gccaagccct caacaagaca ggccgcccga ttctctactc gctctgcaac tggggcgtcg 720
acggcccgtg gaactttgcc tcgaccatcg ccaactcgtg gcgcacgtcg ggcgatctgc 780
tcaacacgtg ggaccgcgac gacgcaaact gtccgtgcag tgagctcgag ggcctcgact 840
gcaagactcc cgggtacaag tgttcgatcc tgaacgtcat caacaaggcg gtgtattatc 900
cgtctaaggc gttccctggg gcgtggaatg acctggacat gctacgtatg tctccatcta 960
tctatcattc tattacatga tctaacacgc ctgcagaggt tggcaacgga ggcctcaccg 1020
acgacgaagc cgtcgcccac atgagtctct gggcagcctt caagtccccg ctgctgatga 1080
ccaacgtcct gagcaacatc gaccctccta cgctgtccat cctgcagaac ccggccgtgc 1140
tggccgtctc gcaggacccg gtcggctcca gcgtcaaccg catctggcgg tactacgtcg 1200
acgacgtgga cgccaacggg tacggcgaga tccagctgtt cagcggcggc ctggcaggag 1260
gcgaccagct ggtgctgctg ctgaacgcgg ggtcgaagga ccgcaccatg aacgcgacgc 1320
tggaggacat cttctgggaa gacgggcccg gtggcacggc cagccaggta cagcagagct 1380
gggacgtgta cgacctgtgg gcgaaccgga tgagcaacga gacggcggcg gcgatcatca 1440
acgccgccaa ctcgaccggt tctgctgcgc ctgctgcgcc gatcaacatg accgccctcg 1500
ggggtgccaa gcacgtgtac tcgcaggtgc cgccgtccga ctcgaaggcg ttgatgggca 1560
ccaaggttgg gagcgtccag ccgagtggga cggtcaaggc gtttgtcaag gcgcacggcg 1620
tggcgatgtt gcggctgcgc cagcagtcgc agaagaagga tgagttgtaa 1670
<210> 15
<211> 1476
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1476)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 15
atggggagaa gaattgctac tgctgcactt ctcttgttcg ggctcaatgc cttgaaagga 60
gtggtggcgc tggacaatgg cctggccatc actccgcaga tgggatggaa cacatggaac 120
tccttcggat gctcgctaaa cgagaccgtc atcctagacg cggccgaaaa gctcgtctcg 180
ctcggattca aggatctcgg ctatgagtac gtcgtcctgg acgactgctg gtctgccggc 240
cggaacgcgt ctggctatct ggtgccggat ccagccaagt ttcccaatgg catcgatggc 300
ctggcggaga agatccatgc gctgggcttg aagattggca tttattccag tgcgggaacc 360
atgacttgcg cccgctatgc tgggtcgttg ggatatgaag agaaggatgc agcgctttgg 420
gctagttggg ggatcgacta cctcaaatac gacaactgct acaaccaagg ccaagaaggc 480
acgcccaagc tctcgtacga ccgctacaac gccatgggcc aagccctcaa caagacaggc 540
cgcccgattc tctactcgct ctgcaactgg ggcgtcgacg gcccgtggaa ctttgcctcg 600
accatcgcca actcgtggcg cacgtcgggc gatctgctca acacgtggga ccgcgacgac 660
gcaaactgtc cgtgcagtga gctcgagggc ctcgactgca agactcccgg gtacaagtgt 720
tcgatcctga acgtcatcaa caaggcggtg tattatccgt ctaaggcgtt ccctggggcg 780
tggaatgacc tggacatgct acaggttggc aacggaggcc tcaccgacga cgaagccgtc 840
gcccacatga gtctctgggc agccttcaag tccccgctgc tgatgaccaa cgtcctgagc 900
aacatcgacc ctcctacgct gtccatcctg cagaacccgg ccgtgctggc cgtctcgcag 960
gacccggtcg gctccagcgt caaccgcatc tggcggtact acgtcgacga cgtggacgcc 1020
aacgggtacg gcgagatcca gctgttcagc ggcggcctgg caggaggcga ccagctggtg 1080
ctgctgctga acgcggggtc gaaggaccgc accatgaacg cgacgctgga ggacatcttc 1140
tgggaagacg ggcccggtgg cacggccagc caggtacagc agagctggga cgtgtacgac 1200
ctgtgggcga accggatgag caacgagacg gcggcggcga tcatcaacgc cgccaactcg 1260
accggttctg ctgcgcctgc tgcgccgatc aacatgaccg ccctcggggg tgccaagcac 1320
gtgtactcgc aggtgccgcc gtccgactcg aaggcgttga tgggcaccaa ggttgggagc 1380
gtccagccga gtgggacggt caaggcgttt gtcaaggcgc acggcgtggc gatgttgcgg 1440
ctgcgccagc agtcgcagaa gaaggatgag ttgtaa 1476
<210> 16
<211> 2046
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2046)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 16
atgactcgct acccctccct ctcctactac gctctcagca gctaccttct cttcacctcc 60
tgcggtgctc ttgccagcac tcgtctggag ccccgtctgg acaacggatt ggccatcact 120
cctcccatgg gctggaactc ctacaaccac tactcttgct cccccaacga gtccatcatc 180
cagtccaacg ccaaggcctt ggttgacttc ggtctggaca ccctaggata ccgctacgtc 240
accaccgact gcggctggac tgtcccctac cgtctgccca acggctccct cacctggaac 300
gagactctct tcccctccgg tttccctgct cttggccagt acatccacga ccttggactc 360
ctcttcggtg tctaccagga tgctggtatc aagacctgcg gtggtccccc tgaccaggtc 420
ggttccctgt tccacgagca gcaggatgcc gagactttcg ctgcctggaa ggccgatgcc 480
ctcaagtacg acaactgcta ctcggatgct gctgctggct accccgatgc cgactacact 540
cctagcacct cccccagctt ccgttacgcc aacatgacca aggcccttgc ctccgttgac 600
cgcaagatcc tcttccagat ctgcgactgg ggtgttgact tccccgccct ctgggctcct 660
tctctgggaa acacctggcg catctccaac gacattattc ctgcctggcg caccatcttc 720
cgtatcctga accaggcggt gcctcagact tctttcgctg gtcccggtca ctggcccgac 780
ctcgacatgc ttgaggttgg caacaacgtg ttcaccatcc ccgaggagca gacccacttc 840
tctctgtggg ccattctcaa gtcgcctctg accattggtg ctgccctcaa cgacaccctg 900
accaccatcc gcgatgcctc cctccagatc ctcaagcaga aggatgtcat cagctacaac 960
caggacccct tgggtgtctc tgcctccctg aagcgtcgtt ggaccgaaga aggattcgag 1020
gtctggagcg gtcccatctc cggtggcaag accgttgctg ctctcatcaa ctgggcggac 1080
gagtcccgca acctgaccct ggatcttcct gttgttggcc tccagcacgc tcagaccctc 1140
cgcaacatct gggatgagtc tgctgccacc aacgtccgca cctcctacac tgccaacgtc 1200
gctgctcacg gcaccatgtt ggttgagctt gctggtacca ctgaggctgg aaagtacccc 1260
gccgacatct tcgccacctc ggatggccac tccaccactt tcgagaacat ctacgctgag 1320
actacttctt cccagtacca gctcaccatt gctttcgctc ccggttcttc tcactcttcc 1380
gagatcacca tccgtacctc gctaggcggc ttcaagacct cggccaaggt ccagcccact 1440
gagagccaga tctccgtcaa catctccctg tctgctggca gctccaacac catcaccatc 1500
tctcccagcc ccatcatctc ctacatcaac gtcacctcgc ctagcggtac ctactacccc 1560
tgcacctcgt tcactcctgt cggttccgcc aagcccgaga cttgcgatgc tggtttctgc 1620
ctgcccgtcg gctccaagat tggttacatc tcccccaccg gcaacgccag catcaccatt 1680
cccgccaccg tcgtcagcgg ctccggtgac aacaccactg ccgccaccac caccgctggc 1740
aagtacctcg aaattgatta catcaacaac gacatcgctt tctccacctc ctggaccact 1800
ggcagcaact ctcgcaacct caccatttcc gtcaacggtg gtcctcctac ccgtattgag 1860
gttcctcttt ctggcaagca cagcgaactc ttcggtcctg gtcgtggctg gtgggattct 1920
gccaccttcg gtgtgcttgt tgacggctgg cgcaacggtg agaacactgt tgtcattggc 1980
aaccagggtg gtgacgaggg tgtgcagccc tacggtgccg acttcgtcgg tctgcgtctg 2040
tacgac 2046
<210> 17
<211> 657
<212> PRT
<213> Rasamsonia emersonii
<400> 17
Ser Thr Arg Leu Glu Pro Arg Leu Asp Asn Gly Leu Ala Ile Thr Pro
1 5 10 15
Pro Met Gly Trp Asn Ser Tyr Asn His Tyr Ser Cys Ser Pro Asn Glu
20 25 30
Ser Ile Ile Gln Ser Asn Ala Lys Ala Leu Val Asp Phe Gly Leu Asp
35 40 45
Thr Leu Gly Tyr Arg Tyr Val Thr Thr Asp Cys Gly Trp Thr Val Pro
50 55 60
Tyr Arg Leu Pro Asn Gly Ser Leu Thr Trp Asn Glu Thr Leu Phe Pro
65 70 75 80
Ser Gly Phe Pro Ala Leu Gly Gln Tyr Ile His Asp Leu Gly Leu Leu
85 90 95
Phe Gly Val Tyr Gln Asp Ala Gly Ile Lys Thr Cys Gly Gly Pro Pro
100 105 110
Asp Gln Val Gly Ser Leu Phe His Glu Gln Gln Asp Ala Glu Thr Phe
115 120 125
Ala Ala Trp Lys Ala Asp Ala Leu Lys Tyr Asp Asn Cys Tyr Ser Asp
130 135 140
Ala Ala Ala Gly Tyr Pro Asp Ala Asp Tyr Thr Pro Ser Thr Ser Pro
145 150 155 160
Ser Phe Arg Tyr Ala Asn Met Thr Lys Ala Leu Ala Ser Val Asp Arg
165 170 175
Lys Ile Leu Phe Gln Ile Cys Asp Trp Gly Val Asp Phe Pro Ala Leu
180 185 190
Trp Ala Pro Ser Leu Gly Asn Thr Trp Arg Ile Ser Asn Asp Ile Ile
195 200 205
Pro Ala Trp Arg Thr Ile Phe Arg Ile Leu Asn Gln Ala Val Pro Gln
210 215 220
Thr Ser Phe Ala Gly Pro Gly His Trp Pro Asp Leu Asp Met Leu Glu
225 230 235 240
Val Gly Asn Asn Val Phe Thr Ile Pro Glu Glu Gln Thr His Phe Ser
245 250 255
Leu Trp Ala Ile Leu Lys Ser Pro Leu Thr Ile Gly Ala Ala Leu Asn
260 265 270
Asp Thr Leu Thr Thr Ile Arg Asp Ala Ser Leu Gln Ile Leu Lys Gln
275 280 285
Lys Asp Val Ile Ser Tyr Asn Gln Asp Pro Leu Gly Val Ser Ala Ser
290 295 300
Leu Lys Arg Arg Trp Thr Glu Glu Gly Phe Glu Val Trp Ser Gly Pro
305 310 315 320
Ile Ser Gly Gly Lys Thr Val Ala Ala Leu Ile Asn Trp Ala Asp Glu
325 330 335
Ser Arg Asn Leu Thr Leu Asp Leu Pro Val Val Gly Leu Gln His Ala
340 345 350
Gln Thr Leu Arg Asn Ile Trp Asp Glu Ser Ala Ala Thr Asn Val Arg
355 360 365
Thr Ser Tyr Thr Ala Asn Val Ala Ala His Gly Thr Met Leu Val Glu
370 375 380
Leu Ala Gly Thr Thr Glu Ala Gly Lys Tyr Pro Ala Asp Ile Phe Ala
385 390 395 400
Thr Ser Asp Gly His Ser Thr Thr Phe Glu Asn Ile Tyr Ala Glu Thr
405 410 415
Thr Ser Ser Gln Tyr Gln Leu Thr Ile Ala Phe Ala Pro Gly Ser Ser
420 425 430
His Ser Ser Glu Ile Thr Ile Arg Thr Ser Leu Gly Gly Phe Lys Thr
435 440 445
Ser Ala Lys Val Gln Pro Thr Glu Ser Gln Ile Ser Val Asn Ile Ser
450 455 460
Leu Ser Ala Gly Ser Ser Asn Thr Ile Thr Ile Ser Pro Ser Pro Ile
465 470 475 480
Ile Ser Tyr Ile Asn Val Thr Ser Pro Ser Gly Thr Tyr Tyr Pro Cys
485 490 495
Thr Ser Phe Thr Pro Val Gly Ser Ala Lys Pro Glu Thr Cys Asp Ala
500 505 510
Gly Phe Cys Leu Pro Val Gly Ser Lys Ile Gly Tyr Ile Ser Pro Thr
515 520 525
Gly Asn Ala Ser Ile Thr Ile Pro Ala Thr Val Val Ser Gly Ser Gly
530 535 540
Asp Asn Thr Thr Ala Ala Thr Thr Thr Ala Gly Lys Tyr Leu Glu Ile
545 550 555 560
Asp Tyr Ile Asn Asn Asp Ile Ala Phe Ser Thr Ser Trp Thr Thr Gly
565 570 575
Ser Asn Ser Arg Asn Leu Thr Ile Ser Val Asn Gly Gly Pro Pro Thr
580 585 590
Arg Ile Glu Val Pro Leu Ser Gly Lys His Ser Glu Leu Phe Gly Pro
595 600 605
Gly Arg Gly Trp Trp Asp Ser Ala Thr Phe Gly Val Leu Val Asp Gly
610 615 620
Trp Arg Asn Gly Glu Asn Thr Val Val Ile Gly Asn Gln Gly Gly Asp
625 630 635 640
Glu Gly Val Gln Pro Tyr Gly Ala Asp Phe Val Gly Leu Arg Leu Tyr
645 650 655
Asp
<210> 18
<211> 25
<212> PRT
<213> Rasamsonia emersonii
<400> 18
Met Thr Arg Tyr Pro Ser Leu Ser Tyr Tyr Ala Leu Ser Ser Tyr Leu
1 5 10 15
Leu Phe Thr Ser Cys Gly Ala Leu Ala
20 25
<210> 19
<211> 2315
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2315)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 19
atgacaagat atcctagtct tagctactat gcactctctt catatttact atttaccagc 60
tgtggtgcac tggcatccac aaggttggaa cctaggttag acaatggact ggcaatcaca 120
cctccaatgg ggtaagtctc gtcttgtgaa gagttattat tattattatt ctagctagat 180
acagcttggc tcattcatat atgaaccgtg aagatggaac tcctacaacc actactcatg 240
ctccccgaac gaatcgatca tccagtcaaa cgcgaaggct ctcgtggact ttggccttga 300
tacccttggc tatcgatatg tcacaactga ttgcggctgg acggtcccct accgactccc 360
caatgggtcc ttgacctgga atgaaacgct gtttccgagt ggattcccgg cactagggca 420
gtacattcac gatctggggc ttctctttgg cgtctatcaa gatgcgggga ttaagacttg 480
tggaggaccc cctgatcaag taggaagttt atgtaagggc tttgactccc ccgggatgtg 540
cattggccgg cgtggttaat tcgaatcaag tccatgaaca acaggacgca gagacgttcg 600
ctgcctggaa agcggatgcg ttgaaatgta cgtgctgttg tgtctcttct tgcgcccgtc 660
gcattgattg atactgatct tccttccaga cgacaactgc tattctgatg cagccgctgg 720
gtatccagat gcggattata caccgagcac ctcgccatcg ttccgctacg cgaacatgac 780
aaaggcgctg gccagtgtgg atcggaaaat ccttttccaa atctgtgact ggggcgtcga 840
tttccccgcg ctctgggctc cctctctggg caacacctgg cgaatttcca acgacataat 900
ccccgcgtgg cggacgatct tcaggatcct caaccaggcc gtgccgcaga cttcttttgc 960
cggacctggc cactggccag acctcgatat gctcgaggtg gggaacaatg tgtttacgat 1020
cccggaagag cagacgcact tttccctttg ggcgatcctg aaaagccccc tgaccatcgg 1080
tgccgcgttg aatgatacct tgacgacgat cagagatgcc tcgctccaga tcttgaaaca 1140
gaaggatgtc atcagctaca accaagaccc gcttggtgtg agtgccagtc tgaagaggag 1200
atggaccgaa gagggctttg aagtgtggag cgggcccata tcgggtggga agacagtggc 1260
tgcattgatc aactgggcgg atgaatcgag gaacttgacg ctggatctcc ctgtcgtagg 1320
cctacaacac gcgcagacgc tgcggaacat ctgggacgaa agcgcagcca cgaacgtccg 1380
tacgtcgtac actgcgaacg tggcagctca tggaacgatg ttggtagaac tggccgggac 1440
aacagaagca gggaagtatc ctgctgatat ttttgcaact tcagatgggt cagtcctaac 1500
ccctcttccc ttgacaggaa aaaaaaaata agggacgctg accgcttagc aggcactcga 1560
caacttttga aaacatctat gccgagacca ctagcagcca gtaccagttg acaatcgcgt 1620
ttgctcccgg atcatctcac tcgagcgaaa taacgatccg aacgagcctc gggggattca 1680
agacgtctgc caaggtgcaa ccgactgaga gccaaatctc ggtcaacatc tcgctgtcag 1740
caggttcatc gaacacgatc acgatttcgc cgtctccaat tatcagttac ataaacgtca 1800
cctccccatc ggggacatac tatccctgta catcgtttac acctgtggga tccgccaaac 1860
ccgagacttg cgatgcggga ttctgcctgc ctgtcgggtc caaaatcggc tatatcagcc 1920
cgacaggtaa tgcaagcatc actatccctg ccacggtggt gtctggcagt ggcgataata 1980
ctactgctgc tactacgact gcagggaaat acctcgagat cgactacatc aacaacgaca 2040
ttgccttttc aacctcgtgg accacgggct ccaattctcg gaatctgaca atctcggtca 2100
acggcggacc accgacgagg atcgaggtgc ctctttctgg gaagcacagc gagctcttcg 2160
gaccaggccg tggctggtgg gatagcgcga cctttggcgt tttggttgat gggtggagga 2220
atggagaaaa cacggtggtg atagggaacc agggaggtga cgagggagta cagccgtatg 2280
gtgcggactt tgtgggcttg cgactgtatg attga 2315
<210> 20
<211> 2049
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2049)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 20
atgacaagat atcctagtct tagctactat gcactctctt catatttact atttaccagc 60
tgtggtgcac tggcatccac aaggttggaa cctaggttag acaatggact ggcaatcaca 120
cctccaatgg gatggaactc ctacaaccac tactcatgct ccccgaacga atcgatcatc 180
cagtcaaacg cgaaggctct cgtggacttt ggccttgata cccttggcta tcgatatgtc 240
acaactgatt gcggctggac ggtcccctac cgactcccca atgggtcctt gacctggaat 300
gaaacgctgt ttccgagtgg attcccggca ctagggcagt acattcacga tctggggctt 360
ctctttggcg tctatcaaga tgcggggatt aagacttgtg gaggaccccc tgatcaagta 420
ggaagtttat tccatgaaca acaggacgca gagacgttcg ctgcctggaa agcggatgcg 480
ttgaaatacg acaactgcta ttctgatgca gccgctgggt atccagatgc ggattataca 540
ccgagcacct cgccatcgtt ccgctacgcg aacatgacaa aggcgctggc cagtgtggat 600
cggaaaatcc ttttccaaat ctgtgactgg ggcgtcgatt tccccgcgct ctgggctccc 660
tctctgggca acacctggcg aatttccaac gacataatcc ccgcgtggcg gacgatcttc 720
aggatcctca accaggccgt gccgcagact tcttttgccg gacctggcca ctggccagac 780
ctcgatatgc tcgaggtggg gaacaatgtg tttacgatcc cggaagagca gacgcacttt 840
tccctttggg cgatcctgaa aagccccctg accatcggtg ccgcgttgaa tgataccttg 900
acgacgatca gagatgcctc gctccagatc ttgaaacaga aggatgtcat cagctacaac 960
caagacccgc ttggtgtgag tgccagtctg aagaggagat ggaccgaaga gggctttgaa 1020
gtgtggagcg ggcccatatc gggtgggaag acagtggctg cattgatcaa ctgggcggat 1080
gaatcgagga acttgacgct ggatctccct gtcgtaggcc tacaacacgc gcagacgctg 1140
cggaacatct gggacgaaag cgcagccacg aacgtccgta cgtcgtacac tgcgaacgtg 1200
gcagctcatg gaacgatgtt ggtagaactg gccgggacaa cagaagcagg gaagtatcct 1260
gctgatattt ttgcaacttc agatgggcac tcgacaactt ttgaaaacat ctatgccgag 1320
accactagca gccagtacca gttgacaatc gcgtttgctc ccggatcatc tcactcgagc 1380
gaaataacga tccgaacgag cctcggggga ttcaagacgt ctgccaaggt gcaaccgact 1440
gagagccaaa tctcggtcaa catctcgctg tcagcaggtt catcgaacac gatcacgatt 1500
tcgccgtctc caattatcag ttacataaac gtcacctccc catcggggac atactatccc 1560
tgtacatcgt ttacacctgt gggatccgcc aaacccgaga cttgcgatgc gggattctgc 1620
ctgcctgtcg ggtccaaaat cggctatatc agcccgacag gtaatgcaag catcactatc 1680
cctgccacgg tggtgtctgg cagtggcgat aatactactg ctgctactac gactgcaggg 1740
aaatacctcg agatcgacta catcaacaac gacattgcct tttcaacctc gtggaccacg 1800
ggctccaatt ctcggaatct gacaatctcg gtcaacggcg gaccaccgac gaggatcgag 1860
gtgcctcttt ctgggaagca cagcgagctc ttcggaccag gccgtggctg gtgggatagc 1920
gcgacctttg gcgttttggt tgatgggtgg aggaatggag aaaacacggt ggtgataggg 1980
aaccagggag gtgacgaggg agtacagccg tatggtgcgg actttgtggg cttgcgactg 2040
tatgattga 2049
<210> 21
<211> 1821
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1821)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 21
atgatctccg ctgctgttct ggtgtctttg ctactcacca ccatccagcc cggtgcctac 60
gcccagtggc agtgcggtgg ttccacctac actcccggct ccgtcaactt caccgaggag 120
tgctaccagg ctgctcagga ctgcgttgct cagttcggtg cgaacgcctc tctggtcaac 180
tgccaggatg ctgctggtaa cctcttcatg cagcagcagt ccaaccaggg caagaacaac 240
gactacttga ttgcctacca ggatatcctg gacttctgct tgctcgatgg attcaccact 300
ggtacctggt acgatgactc tcagtggtac tggatggctg ctgagcctgg ctgctactct 360
cccaacggct ccatcggtac caccggtccc ggtttctgcg tgcagaaccg cgatgacacc 420
gtcctcaacg gctgctaccc ccagccccag tccggtgctg gtcctctcca ggtcctccgc 480
actgctcgca ctgccaacgg cttcacctcg tctgcccgtg gctggaacag ctggggaatc 540
caggctctgg agaaccccag caccatcccc ggctggactg tgttcaacca gactgctgtc 600
aagcagcagt gctccgtcct tgctcgctcc gacttcaagg ctgctggcta cgacctttgc 660
tctcttgatg ctggctggtc gacctcttcc gaggttgatg agtacggccg tatcctgtac 720
aacagcaccc tcttcgacct tcctgagctg gccgactacc tccacggtca gggtctgaag 780
ctcggtgtct acgtcatccc cggtgttcct tgcgttgccg ccaacaagac cattgagggt 840
accaacatcc gcattggtga tgtcctgaac ggcaacaacg acgagctctc ctactgcgac 900
tgggacttct ccaaggatgg tgtccagcag tggcacgact cgctgatcaa cctctgggcc 960
agctggggtg ttgacatgat caagctcgac ttcgtcactc ctggaagccc tcagaacggt 1020
gccaacttgg tgtgcaacaa ctctgctgcc gttgaggcct accacaaggc cattgccaac 1080
tctggccgtc agatccgtct ggacctcagc tggaagctct gccgtaacga aacctacctg 1140
cccgtctggt ccagccttgc cgactccatc cgcactgacc aggacattga taactacggc 1200
tacaacacct tcgtcgcctg gcaggtcgtc cagcgtgcca tcgagaacta ccgtcagtac 1260
atcctgctgc agaagcagcg caacgttccc atcaccctgt accccgacat ggacaacctg 1320
ttcgtcggca acgccgccaa cctcaccggt gtctccgatg cccagcgtat caccatcatg 1380
aaccactggc ttggtgctgc tgccaacctg atcattggct ccgacctcaa ccagctcgat 1440
gaccttggta ccaagctcct cacctccaac gagtccatcc aggctgccga cttcttcgct 1500
cagtacccca tgcagccccg caaccctggt actggtgaca acgtccccca gcagctccag 1560
gcctggattg ctggcccctc cgacaacaac gaagcctacg tgcttgttgt caactacggc 1620
cctgaccagg gccacggtgg tttcggtacc agcttgactg gtgtgcagaa cgtcaccgtt 1680
tctcttgccg atcttggtat cgctggcaag agctgggaat tctccgatgt ctggaacgga 1740
aactcctcca ccgtcagcac ctcgttcact gcctacctgg atgagggtga gtcccagctc 1800
ctgcacctca ccgttgcgca g 1821
<210> 22
<211> 586
<212> PRT
<213> Rasamsonia emersonii
<400> 22
Gln Trp Gln Cys Gly Gly Ser Thr Tyr Thr Pro Gly Ser Val Asn Phe
1 5 10 15
Thr Glu Glu Cys Tyr Gln Ala Ala Gln Asp Cys Val Ala Gln Phe Gly
20 25 30
Ala Asn Ala Ser Leu Val Asn Cys Gln Asp Ala Ala Gly Asn Leu Phe
35 40 45
Met Gln Gln Gln Ser Asn Gln Gly Lys Asn Asn Asp Tyr Leu Ile Ala
50 55 60
Tyr Gln Asp Ile Leu Asp Phe Cys Leu Leu Asp Gly Phe Thr Thr Gly
65 70 75 80
Thr Trp Tyr Asp Asp Ser Gln Trp Tyr Trp Met Ala Ala Glu Pro Gly
85 90 95
Cys Tyr Ser Pro Asn Gly Ser Ile Gly Thr Thr Gly Pro Gly Phe Cys
100 105 110
Val Gln Asn Arg Asp Asp Thr Val Leu Asn Gly Cys Tyr Pro Gln Pro
115 120 125
Gln Ser Gly Ala Gly Pro Leu Gln Val Leu Arg Thr Ala Arg Thr Ala
130 135 140
Asn Gly Phe Thr Ser Ser Ala Arg Gly Trp Asn Ser Trp Gly Ile Gln
145 150 155 160
Ala Leu Glu Asn Pro Ser Thr Ile Pro Gly Trp Thr Val Phe Asn Gln
165 170 175
Thr Ala Val Lys Gln Gln Cys Ser Val Leu Ala Arg Ser Asp Phe Lys
180 185 190
Ala Ala Gly Tyr Asp Leu Cys Ser Leu Asp Ala Gly Trp Ser Thr Ser
195 200 205
Ser Glu Val Asp Glu Tyr Gly Arg Ile Leu Tyr Asn Ser Thr Leu Phe
210 215 220
Asp Leu Pro Glu Leu Ala Asp Tyr Leu His Gly Gln Gly Leu Lys Leu
225 230 235 240
Gly Val Tyr Val Ile Pro Gly Val Pro Cys Val Ala Ala Asn Lys Thr
245 250 255
Ile Glu Gly Thr Asn Ile Arg Ile Gly Asp Val Leu Asn Gly Asn Asn
260 265 270
Asp Glu Leu Ser Tyr Cys Asp Trp Asp Phe Ser Lys Asp Gly Val Gln
275 280 285
Gln Trp His Asp Ser Leu Ile Asn Leu Trp Ala Ser Trp Gly Val Asp
290 295 300
Met Ile Lys Leu Asp Phe Val Thr Pro Gly Ser Pro Gln Asn Gly Ala
305 310 315 320
Asn Leu Val Cys Asn Asn Ser Ala Ala Val Glu Ala Tyr His Lys Ala
325 330 335
Ile Ala Asn Ser Gly Arg Gln Ile Arg Leu Asp Leu Ser Trp Lys Leu
340 345 350
Cys Arg Asn Glu Thr Tyr Leu Pro Val Trp Ser Ser Leu Ala Asp Ser
355 360 365
Ile Arg Thr Asp Gln Asp Ile Asp Asn Tyr Gly Tyr Asn Thr Phe Val
370 375 380
Ala Trp Gln Val Val Gln Arg Ala Ile Glu Asn Tyr Arg Gln Tyr Ile
385 390 395 400
Leu Leu Gln Lys Gln Arg Asn Val Pro Ile Thr Leu Tyr Pro Asp Met
405 410 415
Asp Asn Leu Phe Val Gly Asn Ala Ala Asn Leu Thr Gly Val Ser Asp
420 425 430
Ala Gln Arg Ile Thr Ile Met Asn His Trp Leu Gly Ala Ala Ala Asn
435 440 445
Leu Ile Ile Gly Ser Asp Leu Asn Gln Leu Asp Asp Leu Gly Thr Lys
450 455 460
Leu Leu Thr Ser Asn Glu Ser Ile Gln Ala Ala Asp Phe Phe Ala Gln
465 470 475 480
Tyr Pro Met Gln Pro Arg Asn Pro Gly Thr Gly Asp Asn Val Pro Gln
485 490 495
Gln Leu Gln Ala Trp Ile Ala Gly Pro Ser Asp Asn Asn Glu Ala Tyr
500 505 510
Val Leu Val Val Asn Tyr Gly Pro Asp Gln Gly His Gly Gly Phe Gly
515 520 525
Thr Ser Leu Thr Gly Val Gln Asn Val Thr Val Ser Leu Ala Asp Leu
530 535 540
Gly Ile Ala Gly Lys Ser Trp Glu Phe Ser Asp Val Trp Asn Gly Asn
545 550 555 560
Ser Ser Thr Val Ser Thr Ser Phe Thr Ala Tyr Leu Asp Glu Gly Glu
565 570 575
Ser Gln Leu Leu His Leu Thr Val Ala Gln
580 585
<210> 23
<211> 21
<212> PRT
<213> Rasamsonia emersonii
<400> 23
Met Ile Ser Ala Ala Val Leu Val Ser Leu Leu Leu Thr Thr Ile Gln
1 5 10 15
Pro Gly Ala Tyr Ala
20
<210> 24
<211> 1824
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1824)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 24
atgatctccg ccgcagtcct ggtctccctg cttctgacca ccatccagcc cggggcttac 60
gcccagtggc aatgtggcgg atcaacgtac acgccaggct cggtgaactt caccgaagag 120
tgctaccagg ctgctcagga ttgcgtcgcg caattcggcg ctaatgccag cctggtcaac 180
tgtcaagacg ccgcaggcaa tctgttcatg cagcagcaat ccaaccaggg gaagaacaac 240
gactacctga ttgcctacca ggacatcctt gacttctgcc tgctcgatgg cttcacgaca 300
gggacgtggt acgacgacag ccagtggtac tggatggccg ctgaaccggg ctgctactct 360
ccaaacggca gcattggcac cactgggccc ggtttctgcg tccagaaccg cgacgacacc 420
gtcctcaatg gttgctatcc ccagccccag tctggtgcag gccccctgca ggtattgcga 480
accgcccgca cagccaacgg gtttacttcg tctgcgcgag gatggaattc ctggggaatt 540
caggcgcttg agaatccgag cacgattccc ggctggacgg tattcaacca gacagccgtg 600
aaacagcaat gctcagtgct ggctcgctcg gatttcaagg cagcaggcta cgatctctgc 660
agcctggacg ccggttggtc cacgagcagc gaagtcgacg aatacgggcg aatcctctac 720
aacagcacct tgttcgacct ccccgagctg gcagattacc tgcacggaca aggcctcaag 780
ctgggtgtgt atgtgatccc gggcgtgccc tgcgttgcgg caaataagac gatcgaaggg 840
accaacattc gcatcgggga cgtcctcaat ggcaacaacg atgaactgtc gtactgcgac 900
tgggacttct ccaaggacgg cgtgcagcaa tggcacgatt cacttatcaa cctgtgggcc 960
tcctggggcg tggacatgat caagctggac tttgtcacgc caggcagtcc gcaaaacggc 1020
gcgaatctcg tctgcaacaa cagcgccgca gtggaggcgt accacaaggc aatcgccaat 1080
tcggggcgcc agatccgact ggatctgtcg tggaaactgt gccgcaatga aacctacctg 1140
ccggtctgga gcagtctggc ggattcgatc cgaacggacc aggacatcga caattatgga 1200
tacaacacgt tcgtcgcatg gcaggtcgtg cagcgggcga tcgagaatta ccgccagtat 1260
atcctgttgc agaagcagcg caacgtgccc atcacgctgt acccggacat ggacaatctc 1320
tttgtgggca atgcagcgaa cctgacgggg gtcagcgacg cgcaacgcat caccatcatg 1380
aaccactggc tcggggcggc agcgaatctg atcataggct cggatttgaa ccagctcgac 1440
gatctgggca cgaagctgct gacgagcaat gagtccatcc aggctgccga tttctttgcg 1500
cagtatccga tgcaaccgcg caacccgggc acgggcgata acgtcccgca acagctgcaa 1560
gcgtggatcg ccggaccgtc cgacaacaac gaagcgtatg tcctcgtcgt caactacgga 1620
ccggatcagg ggcacggcgg gtttgggacg tcgttgactg gcgtccagaa tgtgaccgtg 1680
tcgctggcgg atctgggcat cgcaggcaag agctgggagt tctctgatgt ctggaatggg 1740
aactcgagca cggtgtcgac ttcttttaca gcctatctag atgaagggga gtcgcagctc 1800
ctgcatttga ccgtggcaca ataa 1824
<210> 25
<211> 1824
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1824)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 25
atgatctccg ccgcagtcct ggtctccctg cttctgacca ccatccagcc cggggcttac 60
gcccagtggc aatgtggcgg atcaacgtac acgccaggct cggtgaactt caccgaagag 120
tgctaccagg ctgctcagga ttgcgtcgcg caattcggcg ctaatgccag cctggtcaac 180
tgtcaagacg ccgcaggcaa tctgttcatg cagcagcaat ccaaccaggg gaagaacaac 240
gactacctga ttgcctacca ggacatcctt gacttctgcc tgctcgatgg cttcacgaca 300
gggacgtggt acgacgacag ccagtggtac tggatggccg ctgaaccggg ctgctactct 360
ccaaacggca gcattggcac cactgggccc ggtttctgcg tccagaaccg cgacgacacc 420
gtcctcaatg gttgctatcc ccagccccag tctggtgcag gccccctgca ggtattgcga 480
accgcccgca cagccaacgg gtttacttcg tctgcgcgag gatggaattc ctggggaatt 540
caggcgcttg agaatccgag cacgattccc ggctggacgg tattcaacca gacagccgtg 600
aaacagcaat gctcagtgct ggctcgctcg gatttcaagg cagcaggcta cgatctctgc 660
agcctggacg ccggttggtc cacgagcagc gaagtcgacg aatacgggcg aatcctctac 720
aacagcacct tgttcgacct ccccgagctg gcagattacc tgcacggaca aggcctcaag 780
ctgggtgtgt atgtgatccc gggcgtgccc tgcgttgcgg caaataagac gatcgaaggg 840
accaacattc gcatcgggga cgtcctcaat ggcaacaacg atgaactgtc gtactgcgac 900
tgggacttct ccaaggacgg cgtgcagcaa tggcacgatt cacttatcaa cctgtgggcc 960
tcctggggcg tggacatgat caagctggac tttgtcacgc caggcagtcc gcaaaacggc 1020
gcgaatctcg tctgcaacaa cagcgccgca gtggaggcgt accacaaggc aatcgccaat 1080
tcggggcgcc agatccgact ggatctgtcg tggaaactgt gccgcaatga aacctacctg 1140
ccggtctgga gcagtctggc ggattcgatc cgaacggacc aggacatcga caattatgga 1200
tacaacacgt tcgtcgcatg gcaggtcgtg cagcgggcga tcgagaatta ccgccagtat 1260
atcctgttgc agaagcagcg caacgtgccc atcacgctgt acccggacat ggacaatctc 1320
tttgtgggca atgcagcgaa cctgacgggg gtcagcgacg cgcaacgcat caccatcatg 1380
aaccactggc tcggggcggc agcgaatctg atcataggct cggatttgaa ccagctcgac 1440
gatctgggca cgaagctgct gacgagcaat gagtccatcc aggctgccga tttctttgcg 1500
cagtatccga tgcaaccgcg caacccgggc acgggcgata acgtcccgca acagctgcaa 1560
gcgtggatcg ccggaccgtc cgacaacaac gaagcgtatg tcctcgtcgt caactacgga 1620
ccggatcagg ggcacggcgg gtttgggacg tcgttgactg gcgtccagaa tgtgaccgtg 1680
tcgctggcgg atctgggcat cgcaggcaag agctgggagt tctctgatgt ctggaatggg 1740
aactcgagca cggtgtcgac ttcttttaca gcctatctag atgaagggga gtcgcagctc 1800
ctgcatttga ccgtggcaca ataa 1824
<210> 26
<211> 756
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(756)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 26
atgaagtcgt tcctggctgt gaccctcagc ctttctcttg cctccctgac cactgctgct 60
cctactccca ccaagaccct ggagaagcgt gccgacttct gcggccagtg ggattcgacc 120
gtcactggca gctacaccgt ttacaacaac ctctggggtg agagctctgc ctcctccggc 180
agccagtgca ccggtgttga ctcgctgaac ggcaacaccc tggcctggca caccagctgg 240
acctgggagg gtggtgcctc ttccgtcaag tcgttcgcca acgctgccta cgctttcact 300
gccactcagc tctcccagat ctcctccatc cccaccacct ggcagtggag ctacactggt 360
acctccatcg atgccgatgt tgcctacgac ctcttcacct cctcctcccc cagcggcagc 420
aacgaatacg aagtcatgat ctggctagct gctcttggtg gtgctttccc tatatcttcc 480
accggtacca cccccattgc cactcctacc attggtggta tctcctggaa cctgtactct 540
ggccccaacg gtgccaccac cgtctactct ttcgtcgcct cccgcgagca gaccgacttc 600
tccggtgaca tcaacgactt cctgacctac ctccagcaga acgagggtct ttcttcttcc 660
cagtacctcc tctccatcca ggctggcacc gagcccttca ctggtgagaa cgctgagctc 720
aagaccactg cctactctgt ctccgtcagc acttca 756
<210> 27
<211> 233
<212> PRT
<213> Rasamsonia emersonii
<400> 27
Ala Pro Thr Pro Thr Lys Thr Leu Glu Lys Arg Ala Asp Phe Cys Gly
1 5 10 15
Gln Trp Asp Ser Thr Val Thr Gly Ser Tyr Thr Val Tyr Asn Asn Leu
20 25 30
Trp Gly Glu Ser Ser Ala Ser Ser Gly Ser Gln Cys Thr Gly Val Asp
35 40 45
Ser Leu Asn Gly Asn Thr Leu Ala Trp His Thr Ser Trp Thr Trp Glu
50 55 60
Gly Gly Ala Ser Ser Val Lys Ser Phe Ala Asn Ala Ala Tyr Ala Phe
65 70 75 80
Thr Ala Thr Gln Leu Ser Gln Ile Ser Ser Ile Pro Thr Thr Trp Gln
85 90 95
Trp Ser Tyr Thr Gly Thr Ser Ile Asp Ala Asp Val Ala Tyr Asp Leu
100 105 110
Phe Thr Ser Ser Ser Pro Ser Gly Ser Asn Glu Tyr Glu Val Met Ile
115 120 125
Trp Leu Ala Ala Leu Gly Gly Ala Phe Pro Ile Ser Ser Thr Gly Thr
130 135 140
Thr Pro Ile Ala Thr Pro Thr Ile Gly Gly Ile Ser Trp Asn Leu Tyr
145 150 155 160
Ser Gly Pro Asn Gly Ala Thr Thr Val Tyr Ser Phe Val Ala Ser Arg
165 170 175
Glu Gln Thr Asp Phe Ser Gly Asp Ile Asn Asp Phe Leu Thr Tyr Leu
180 185 190
Gln Gln Asn Glu Gly Leu Ser Ser Ser Gln Tyr Leu Leu Ser Ile Gln
195 200 205
Ala Gly Thr Glu Pro Phe Thr Gly Glu Asn Ala Glu Leu Lys Thr Thr
210 215 220
Ala Tyr Ser Val Ser Val Ser Thr Ser
225 230
<210> 28
<211> 19
<212> PRT
<213> Rasamsonia emersonii
<400> 28
Met Lys Ser Phe Leu Ala Val Thr Leu Ser Leu Ser Leu Ala Ser Leu
1 5 10 15
Thr Thr Ala
<210> 29
<211> 819
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(819)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 29
atgaagtcct tcctcgccgt aactctgtcc ctatccctcg caagcctcac caccgccgcc 60
ccaaccccaa ccaaaaccct cgaaaagcgg gccgacttct gcggacaatg ggactcgacc 120
gtcacaggca gctacaccgt ctacaacaac ctctgggggg aatccagcgc gtcgtccgga 180
tcgcagtgca cgggcgtcga ctcgctcaac gggaacacgc tcgcctggca cacctcgtgg 240
acctgggagg gcggggcgtc cagtgtcaag agcttcgcca atgccgcgta tgcgttcacg 300
gcgacgcagc tgagccagat tagcagtatt ccgacgacgt ggcagtggag gtatgaatga 360
cacttccttt tctgcctctc tgtctatgta cttgctgctg acacgtacag ctacaccggc 420
acctccatcg acgccgacgt cgcgtacgac ctattcacga gttccagccc cagcggcagc 480
aacgagtacg aggttatgat ctggctggcc gcgctcgggg gcgcattccc catctcgtcg 540
acgggcacga cgcccatcgc gacgcccacc atcggcggca tctcatggaa tctgtacagc 600
gggcccaacg gcgcgacgac ggtgtacagc ttcgtagcgt cgagagagca gacggacttt 660
tcgggcgaca tcaacgattt tctgacctat ctccagcaga acgagggcct cagctcgagc 720
cagtacctgc tgtccatcca ggcgggcacg gagccgttta cgggggagaa tgcggagctg 780
aagacgacgg cgtatagtgt cagtgtatca acctcgtga 819
<210> 30
<211> 759
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(759)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 30
atgaagtcct tcctcgccgt aactctgtcc ctatccctcg caagcctcac caccgccgcc 60
ccaaccccaa ccaaaaccct cgaaaagcgg gccgacttct gcggacaatg ggactcgacc 120
gtcacaggca gctacaccgt ctacaacaac ctctgggggg aatccagcgc gtcgtccgga 180
tcgcagtgca cgggcgtcga ctcgctcaac gggaacacgc tcgcctggca cacctcgtgg 240
acctgggagg gcggggcgtc cagtgtcaag agcttcgcca atgccgcgta tgcgttcacg 300
gcgacgcagc tgagccagat tagcagtatt ccgacgacgt ggcagtggag ctacaccggc 360
acctccatcg acgccgacgt cgcgtacgac ctattcacga gttccagccc cagcggcagc 420
aacgagtacg aggttatgat ctggctggcc gcgctcgggg gcgcattccc catctcgtcg 480
acgggcacga cgcccatcgc gacgcccacc atcggcggca tctcatggaa tctgtacagc 540
gggcccaacg gcgcgacgac ggtgtacagc ttcgtagcgt cgagagagca gacggacttt 600
tcgggcgaca tcaacgattt tctgacctat ctccagcaga acgagggcct cagctcgagc 660
cagtacctgc tgtccatcca ggcgggcacg gagccgttta cgggggagaa tgcggagctg 720
aagacgacgg cgtatagtgt cagtgtatca acctcgtga 759
<210> 31
<211> 1923
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1923)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 31
atgtccctcg ccagcaagaa cctgcttgct tgcggcctct tcctggctgt tgctcagctt 60
gctcagcccg ttactggctt ggaattgact gtcagcacct ccggtggcaa caagtcctcc 120
cccatcctct acggcttcat gttcgaagat atcaaccact ccggtgatgg tggtatccac 180
tcccagctcc tccagaacaa cggattccag ggtgccaacc ccggtctgac tgcctacgcc 240
cccatcggta acgtttccct cgccgttgac actgagaacc ctctctcctc tgccatcacc 300
cgctcgctga aggtcaccgt tcctcccaac gcctctggca aggtcggttt ctccaactcc 360
ggctactggg ggatacccgt caacgaggcc aactacacca actcgttcta catcaagggt 420
gactacaacg gtgatgtcac cctccgcctc gccggtgcct cctccggctc tctgtacgcc 480
tcccagacca tctccgtcaa gtccaacagc agcagctaca cctacgtcga gactcagtac 540
cccgtcaagc aggctcctga cggcaacaac atctgggagc tcaccttcga tgcctccaag 600
gttgctggca agtccctcaa cttcgacctc atccagctgt accctcctac cttccacgac 660
cgtcccaacg gtctgaagcc cgagattgcc aacgtccttg ttgacatgaa gggctctttc 720
ctccgtttcc ccggtggtaa caacctcgag ggtctgaccc ccgccacccg ttggaagtgg 780
aacgagacta ttggacctct gacctcccgt cctggtcgcc agggtaactg gggctacccc 840
aacaccgatg ctcttggtct gaacgaatac ttcctctgga tccaggacat gggcttgact 900
gctgtcctgg gtgtctggga tggcttgacc attggtggtc cttctcccca ggtcatcacc 960
ggtgatgctc tcaagcccta cattgatgat gttctcaacg agctggaata catcctgggt 1020
gacaaggaca ccacctacgg caagctccgt gcctctcacg gattccccga cccttggccc 1080
ctccagtacg tggagattgg caacgaggac aacctgaacg gtggtggacc tagctacgct 1140
gagcgcttca ctgctttcca cgacgccatc aaggccaagt acccccacct gaccatcatc 1200
tccagcactg accagtacct tcccaacccc aagcccaagg gtatctggat ggactggcac 1260
acctactctc ctgctggtga attggtgagc atgtttaaca agttcgacaa cgtcgaccgc 1320
gctttcccct acttcgtcgg tgaatacgcc tgcatttctc ttgacaacgg cactgagctt 1380
gcccagccca tcatgcaggg ctctgttgct gaggctgtgt tcatgatcgg tatggagcgc 1440
aactcggatg ttgtcaagat ggccgcctac gctcccttgc tccagcagta cggcggctac 1500
acctggaacg accacgtccc caacctgatc atgttcaaca acaaccccaa cggcattgtc 1560
cgctccacct cgtactacgt gcagcagatg ttctccgtga accgtggaag caccatcctt 1620
cctgttgagt ccgacggctc tttcggtcct gtctactacg tggcctccaa gacctccgac 1680
aacaagacct actacgtcaa gttcgccaac tacggtccta ctccccagcc cgtcaccgtc 1740
aacatcccca agaccgagac tggtcgtctg accaccctct ctggtgctgc cactgctgcc 1800
aacacctggt ccagccccaa cgccgtcact cctaagacct cgaacgtcag ctccgccgat 1860
ggtgctcctg gcaagttcac catcaccctc cccgcctggt ccgttgctgt ccttgctgtc 1920
gag 1923
<210> 32
<211> 615
<212> PRT
<213> Rasamsonia emersonii
<400> 32
Leu Glu Leu Thr Val Ser Thr Ser Gly Gly Asn Lys Ser Ser Pro Ile
1 5 10 15
Leu Tyr Gly Phe Met Phe Glu Asp Ile Asn His Ser Gly Asp Gly Gly
20 25 30
Ile His Ser Gln Leu Leu Gln Asn Asn Gly Phe Gln Gly Ala Asn Pro
35 40 45
Gly Leu Thr Ala Tyr Ala Pro Ile Gly Asn Val Ser Leu Ala Val Asp
50 55 60
Thr Glu Asn Pro Leu Ser Ser Ala Ile Thr Arg Ser Leu Lys Val Thr
65 70 75 80
Val Pro Pro Asn Ala Ser Gly Lys Val Gly Phe Ser Asn Ser Gly Tyr
85 90 95
Trp Gly Ile Pro Val Asn Glu Ala Asn Tyr Thr Asn Ser Phe Tyr Ile
100 105 110
Lys Gly Asp Tyr Asn Gly Asp Val Thr Leu Arg Leu Ala Gly Ala Ser
115 120 125
Ser Gly Ser Leu Tyr Ala Ser Gln Thr Ile Ser Val Lys Ser Asn Ser
130 135 140
Ser Ser Tyr Thr Tyr Val Glu Thr Gln Tyr Pro Val Lys Gln Ala Pro
145 150 155 160
Asp Gly Asn Asn Ile Trp Glu Leu Thr Phe Asp Ala Ser Lys Val Ala
165 170 175
Gly Lys Ser Leu Asn Phe Asp Leu Ile Gln Leu Tyr Pro Pro Thr Phe
180 185 190
His Asp Arg Pro Asn Gly Leu Lys Pro Glu Ile Ala Asn Val Leu Val
195 200 205
Asp Met Lys Gly Ser Phe Leu Arg Phe Pro Gly Gly Asn Asn Leu Glu
210 215 220
Gly Leu Thr Pro Ala Thr Arg Trp Lys Trp Asn Glu Thr Ile Gly Pro
225 230 235 240
Leu Thr Ser Arg Pro Gly Arg Gln Gly Asn Trp Gly Tyr Pro Asn Thr
245 250 255
Asp Ala Leu Gly Leu Asn Glu Tyr Phe Leu Trp Ile Gln Asp Met Gly
260 265 270
Leu Thr Ala Val Leu Gly Val Trp Asp Gly Leu Thr Ile Gly Gly Pro
275 280 285
Ser Pro Gln Val Ile Thr Gly Asp Ala Leu Lys Pro Tyr Ile Asp Asp
290 295 300
Val Leu Asn Glu Leu Glu Tyr Ile Leu Gly Asp Lys Asp Thr Thr Tyr
305 310 315 320
Gly Lys Leu Arg Ala Ser His Gly Phe Pro Asp Pro Trp Pro Leu Gln
325 330 335
Tyr Val Glu Ile Gly Asn Glu Asp Asn Leu Asn Gly Gly Gly Pro Ser
340 345 350
Tyr Ala Glu Arg Phe Thr Ala Phe His Asp Ala Ile Lys Ala Lys Tyr
355 360 365
Pro His Leu Thr Ile Ile Ser Ser Thr Asp Gln Tyr Leu Pro Asn Pro
370 375 380
Lys Pro Lys Gly Ile Trp Met Asp Trp His Thr Tyr Ser Pro Ala Gly
385 390 395 400
Glu Leu Val Ser Met Phe Asn Lys Phe Asp Asn Val Asp Arg Ala Phe
405 410 415
Pro Tyr Phe Val Gly Glu Tyr Ala Cys Ile Ser Leu Asp Asn Gly Thr
420 425 430
Glu Leu Ala Gln Pro Ile Met Gln Gly Ser Val Ala Glu Ala Val Phe
435 440 445
Met Ile Gly Met Glu Arg Asn Ser Asp Val Val Lys Met Ala Ala Tyr
450 455 460
Ala Pro Leu Leu Gln Gln Tyr Gly Gly Tyr Thr Trp Asn Asp His Val
465 470 475 480
Pro Asn Leu Ile Met Phe Asn Asn Asn Pro Asn Gly Ile Val Arg Ser
485 490 495
Thr Ser Tyr Tyr Val Gln Gln Met Phe Ser Val Asn Arg Gly Ser Thr
500 505 510
Ile Leu Pro Val Glu Ser Asp Gly Ser Phe Gly Pro Val Tyr Tyr Val
515 520 525
Ala Ser Lys Thr Ser Asp Asn Lys Thr Tyr Tyr Val Lys Phe Ala Asn
530 535 540
Tyr Gly Pro Thr Pro Gln Pro Val Thr Val Asn Ile Pro Lys Thr Glu
545 550 555 560
Thr Gly Arg Leu Thr Thr Leu Ser Gly Ala Ala Thr Ala Ala Asn Thr
565 570 575
Trp Ser Ser Pro Asn Ala Val Thr Pro Lys Thr Ser Asn Val Ser Ser
580 585 590
Ala Asp Gly Ala Pro Gly Lys Phe Thr Ile Thr Leu Pro Ala Trp Ser
595 600 605
Val Ala Val Leu Ala Val Glu
610 615
<210> 33
<211> 26
<212> PRT
<213> Rasamsonia emersonii
<400> 33
Met Ser Leu Ala Ser Lys Asn Leu Leu Ala Cys Gly Leu Phe Leu Ala
1 5 10 15
Val Ala Gln Leu Ala Gln Pro Val Thr Gly
20 25
<210> 34
<211> 2381
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2381)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 34
atgtcgttgg cttcgaagaa tctcctggcc tgcgggcttt tcttagcagt cgcccagctt 60
gcacagccag tgactggttt agaacttacg gtgtcgacgt ctggcggcaa taaatccagc 120
cctatcttgt atgggttcat gttcgaggtg agtttttgcc aagctggctg tgaaaccgcc 180
tgctggtgga gagttacgat aaccatgtcc acgctcacta tagcgtgatt gattatgtgc 240
tgacacctgc aggatatcaa ccactctggt gatggaggga tccacagtca gcttctgcag 300
aacaacggct tccagggtgc aaaccccggc ttgactgcat acgctccaat cgggaatgtg 360
tcgttggccg tggatacgga aaaccctctc tcgagcgcga taacgcggtc tctgaaggtc 420
actgtcccgc ccaacgcctc cggaaaggtt ggcttctcga attcgggtta ctggggtatt 480
cccgtgaacg aggccaacta caccaacagc ttctacatca agggagacta taatggcgac 540
gtcacgcttc gccttgcggg ggccagcagc ggcagtctgt atgcatcgca aacgatcagc 600
gtcaagagca actcgtccag ctacacctat gtcgagacgc aatatccagt gaagcaggct 660
cctgacggca acaacatctg ggaactgacc tttgacgcgt ccaaggtggc gggaaagtca 720
ttgaattttg acctgatcca gctctaccca ccaacattcc acgacaggtg cgattgcttg 780
tattcctcca ggattgtgtc gctgatgctg acctatttta tagacctaat ggcctcaaac 840
cggaaattgc aaatgttttg gttgacatga agggttcttt cctgcgcttt cccggaggaa 900
acaatctgtg agttgcttcg gtctgtatct ggcgatcctt gctgactttt ggccagcgaa 960
ggattaactc cggcaacgcg ctggaagtgg aatgagacca ttgggcctct gacgagccgt 1020
cctgggcggc aaggtaactg ggggtatccc aacacagatg cacttggtag gctttattta 1080
aaagtgatct gtgtatgaag cattgctaaa tgcgatgaca ggtctgaatg aatatttctt 1140
gtggatccag gacatgggtt tgacggcagt tctcggtgtc tgggatggac tgactatcgg 1200
agggccgagc cctcaagtta tcactgggga cgctttgaag ccctacatcg acgacgtttt 1260
gaacgagctt gaggtaagtg cctctggatg atctttttgt tcggtttcgc taacaattgc 1320
agtatatcct tggagacaag gataccacgt acggcaagct tcgtgcttct catggcttcc 1380
ctgacccctg gccactccaa tacgtggaaa tcggcaacga ggacaacctc aatggaggcg 1440
ggccctcata tgcagagcgc ttcacggcct tccacgacgc aatcaaggcc aagtacccgc 1500
atctgaccat cattagcagc acggaccagt acctcccaaa tcccaagcca aaaggaatct 1560
ggatggactg gcacacgtac tcgccggcgg gggagcttgt gagcatgttc aacaagttcg 1620
acaacgtgga ccgggctttc ccgtactttg tcggcgaata tgcctgcatc tccctcgata 1680
acgggaccga gctcgcgcag ccgatcatgc aggggtctgt ggcggaagct gtctttatga 1740
ttggcatgga aaggaacagc gatgttgtca agatggctgc ctatgcaccg ctgctgcagc 1800
aatacggcgg gtacacatgg aatgtgagat gcgcaaacga aaaatcaaga agactgatat 1860
atgcagactg actgactgac atcaggacca cgtgccaaac ctgattatgt tcaacaacaa 1920
cccaaacggc attgtccgga gcaccagcta ctacgtacag cagatgttct cagtgaaccg 1980
gggcagcacc attctgccag tggaatcaga cgggtcattt ggaccaggta cgtacagacc 2040
aacaaacacc agccacagcc agggcagcag gtccgcctcg acttactaat ttcaatgaca 2100
atgcagtcta ctacgtcgcc tccaaaacct cagacaacaa gacatactac gtcaagttcg 2160
ccaactacgg ccctaccccg cagcccgtca ccgtcaacat ccccaagaca gaaaccgggc 2220
gactgacgac gctgtccggc gccgctactg cagccaacac ctggagcagc cctaatgctg 2280
tcacacccaa gaccagcaat gtcagctctg ctgatggtgc gccaggaaag tttactatta 2340
ctctgcctgc gtggagtgtt gctgtgttgg ctgtggagtg a 2381
<210> 35
<211> 1926
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1926)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 35
atgtcgttgg cttcgaagaa tctcctggcc tgcgggcttt tcttagcagt cgcccagctt 60
gcacagccag tgactggttt agaacttacg gtgtcgacgt ctggcggcaa taaatccagc 120
cctatcttgt atgggttcat gttcgaggat atcaaccact ctggtgatgg agggatccac 180
agtcagcttc tgcagaacaa cggcttccag ggtgcaaacc ccggcttgac tgcatacgct 240
ccaatcggga atgtgtcgtt ggccgtggat acggaaaacc ctctctcgag cgcgataacg 300
cggtctctga aggtcactgt cccgcccaac gcctccggaa aggttggctt ctcgaattcg 360
ggttactggg gtattcccgt gaacgaggcc aactacacca acagcttcta catcaaggga 420
gactataatg gcgacgtcac gcttcgcctt gcgggggcca gcagcggcag tctgtatgca 480
tcgcaaacga tcagcgtcaa gagcaactcg tccagctaca cctatgtcga gacgcaatat 540
ccagtgaagc aggctcctga cggcaacaac atctgggaac tgacctttga cgcgtccaag 600
gtggcgggaa agtcattgaa ttttgacctg atccagctct acccaccaac attccacgac 660
agacctaatg gcctcaaacc ggaaattgca aatgttttgg ttgacatgaa gggttctttc 720
ctgcgctttc ccggaggaaa caatctcgaa ggattaactc cggcaacgcg ctggaagtgg 780
aatgagacca ttgggcctct gacgagccgt cctgggcggc aaggtaactg ggggtatccc 840
aacacagatg cacttggtct gaatgaatat ttcttgtgga tccaggacat gggtttgacg 900
gcagttctcg gtgtctggga tggactgact atcggagggc cgagccctca agttatcact 960
ggggacgctt tgaagcccta catcgacgac gttttgaacg agcttgagta tatccttgga 1020
gacaaggata ccacgtacgg caagcttcgt gcttctcatg gcttccctga cccctggcca 1080
ctccaatacg tggaaatcgg caacgaggac aacctcaatg gaggcgggcc ctcatatgca 1140
gagcgcttca cggccttcca cgacgcaatc aaggccaagt acccgcatct gaccatcatt 1200
agcagcacgg accagtacct cccaaatccc aagccaaaag gaatctggat ggactggcac 1260
acgtactcgc cggcggggga gcttgtgagc atgttcaaca agttcgacaa cgtggaccgg 1320
gctttcccgt actttgtcgg cgaatatgcc tgcatctccc tcgataacgg gaccgagctc 1380
gcgcagccga tcatgcaggg gtctgtggcg gaagctgtct ttatgattgg catggaaagg 1440
aacagcgatg ttgtcaagat ggctgcctat gcaccgctgc tgcagcaata cggcgggtac 1500
acatggaatg accacgtgcc aaacctgatt atgttcaaca acaacccaaa cggcattgtc 1560
cggagcacca gctactacgt acagcagatg ttctcagtga accggggcag caccattctg 1620
ccagtggaat cagacgggtc atttggacca gtctactacg tcgcctccaa aacctcagac 1680
aacaagacat actacgtcaa gttcgccaac tacggcccta ccccgcagcc cgtcaccgtc 1740
aacatcccca agacagaaac cgggcgactg acgacgctgt ccggcgccgc tactgcagcc 1800
aacacctgga gcagccctaa tgctgtcaca cccaagacca gcaatgtcag ctctgctgat 1860
ggtgcgccag gaaagtttac tattactctg cctgcgtgga gtgttgctgt gttggctgtg 1920
gagtga 1926
<210> 36
<211> 2235
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2235)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 36
atgatcctcc gctcgctacc catccacgcc gccgccattg ctgctgcttt gacttctctt 60
gttgacgcca agcccctccg ccacgacatc cgtcaggttg ctgagactca ccgtatcaac 120
agcactcact acaacgacac ttctgctgtt gtcctggatg tgtctctgaa ggacgccgcc 180
ggtcgtaaca acacttctcc tctcctgtac ggctggatgt tcgaggacat ctcccactct 240
ggcgatggcg gtatctacgc tgagctgatc aagaaccgtg ctttccaggg cagcacttct 300
actgtcaagc aggctcctgg tatctccggt gactccgttg ttgctgctca gaaccccatt 360
gtgcccttcg gtcctgtcct cgatggctgg cgccctatag gagatgccaa gctgtctctt 420
gatgtcctgc accctctgtc ggatgccctc cccgtcgtcc tccagatcga tatcccctgg 480
aacgccactg gcgaggttgg tttcctcaac gaaggctggt ggggtattga tgtccgccct 540
cagacctaca acgcctcctt ctacatgctt gccaacgctc ctcgctacaa caagaccttg 600
acctccatca acctgtcgct acgcagcaac ctcaccgacg atgtctgggc caccaccacc 660
atccacgttg accccgacaa ggttcctacc ttcgactacg agcagtacca ggcctccatt 720
gtgaacaccg tcaaggcccc caactccaac aacaccttcg ccatcacctt caacgccgac 780
gaggttgctg gaagcacctt ctacttcggc ttggtgtctc tgttccctga aaccttcaac 840
aaccgcccca acggcctacg caaggacctt gctcagggta tcaaggacat gggtgccaag 900
ttcctgcgtt tccctggtgg aaacaacctc gagggttact ccatcttcca gcgttggaag 960
tggaacgaaa ccattggtcc cctccgttac cgcaagggtc gtgtcggtaa ctgggaatac 1020
tacaacacca acggtcttgg tcttttggaa ttcctggaat ggactgagga ccttggcatg 1080
gagcccgtcc ttgctgtcta cgctggcttc tctctggaca tctggggcca ggaaggcacc 1140
tcctaccccg aggaccgcat ggatgagatc gtccaggaca tcctgaacga gcttgagtac 1200
tgcatgggtg atgtcaacac ccactacggt gctctccgtg cccagcacgg ccaccccgag 1260
cccttcgaca tcaagtacat tgagatcggt aacgaggact ggttctccag cacctacccc 1320
taccgtttcc ccatcatcta caaggccatc aagtccgcct accccaacat taccctcatc 1380
tccactgcct acaacgagaa cgccaactac accatcgaca tccctgctgg tggtatgtgg 1440
gatacccacc actacgaaac cccctccttc ttcctggaga acttcaacta cttcgacaac 1500
tggcaggctg ccactaacaa caccgatgtc aagatcttcg tcggtgaata ctccgtctac 1560
cagatcgaca cccccgatgg ctacgtcaac ttctccaacc ccgagggtat ccacatgttc 1620
ttccccgagc ttgtatctgc tattgctgag gctgtctacc tccttggtgc tgagcgtaac 1680
cccaacactg tcaccatgac ctcctacgct cccagcttcc agaacctgaa ctggtacaac 1740
tggtccccca acctggttgc tttcactgcc aaccctgacg agactgtgtt cagcaccagc 1800
tactacatgc agaagatgtt cgccaaccac cgtggcaccc agaccctccc tgtcaagaac 1860
agcaagggtg acttcaaccc tctctggtgg gttgccacca ttgacgaggg tgctggtgtt 1920
gtctacttca agatcgtcaa ctccggcaac tcctccatcc ccctcaccat taacctggac 1980
caggcgtaca agggtgtcaa cggcaccatc ctcgtccgcc gccgtatctg cctccagctc 2040
cacatctaca ccgtccccga tgagctcacc attgctttcc tccagaccca ccccaacctc 2100
tacggattca actacctgaa caaccagact gccattgtcc ccgtgcctgc caacatcacc 2160
tcccccagca agtcccagaa ccgcttcgac tgggatgttc ccaagtactc cgtcaccgtt 2220
ctccagttcg acatc 2235
<210> 37
<211> 722
<212> PRT
<213> Rasamsonia emersonii
<400> 37
Lys Pro Leu Arg His Asp Ile Arg Gln Val Ala Glu Thr His Arg Ile
1 5 10 15
Asn Ser Thr His Tyr Asn Asp Thr Ser Ala Val Val Leu Asp Val Ser
20 25 30
Leu Lys Asp Ala Ala Gly Arg Asn Asn Thr Ser Pro Leu Leu Tyr Gly
35 40 45
Trp Met Phe Glu Asp Ile Ser His Ser Gly Asp Gly Gly Ile Tyr Ala
50 55 60
Glu Leu Ile Lys Asn Arg Ala Phe Gln Gly Ser Thr Ser Thr Val Lys
65 70 75 80
Gln Ala Pro Gly Ile Ser Gly Asp Ser Val Val Ala Ala Gln Asn Pro
85 90 95
Ile Val Pro Phe Gly Pro Val Leu Asp Gly Trp Arg Pro Ile Gly Asp
100 105 110
Ala Lys Leu Ser Leu Asp Val Leu His Pro Leu Ser Asp Ala Leu Pro
115 120 125
Val Val Leu Gln Ile Asp Ile Pro Trp Asn Ala Thr Gly Glu Val Gly
130 135 140
Phe Leu Asn Glu Gly Trp Trp Gly Ile Asp Val Arg Pro Gln Thr Tyr
145 150 155 160
Asn Ala Ser Phe Tyr Met Leu Ala Asn Ala Pro Arg Tyr Asn Lys Thr
165 170 175
Leu Thr Ser Ile Asn Leu Ser Leu Arg Ser Asn Leu Thr Asp Asp Val
180 185 190
Trp Ala Thr Thr Thr Ile His Val Asp Pro Asp Lys Val Pro Thr Phe
195 200 205
Asp Tyr Glu Gln Tyr Gln Ala Ser Ile Val Asn Thr Val Lys Ala Pro
210 215 220
Asn Ser Asn Asn Thr Phe Ala Ile Thr Phe Asn Ala Asp Glu Val Ala
225 230 235 240
Gly Ser Thr Phe Tyr Phe Gly Leu Val Ser Leu Phe Pro Glu Thr Phe
245 250 255
Asn Asn Arg Pro Asn Gly Leu Arg Lys Asp Leu Ala Gln Gly Ile Lys
260 265 270
Asp Met Gly Ala Lys Phe Leu Arg Phe Pro Gly Gly Asn Asn Leu Glu
275 280 285
Gly Tyr Ser Ile Phe Gln Arg Trp Lys Trp Asn Glu Thr Ile Gly Pro
290 295 300
Leu Arg Tyr Arg Lys Gly Arg Val Gly Asn Trp Glu Tyr Tyr Asn Thr
305 310 315 320
Asn Gly Leu Gly Leu Leu Glu Phe Leu Glu Trp Thr Glu Asp Leu Gly
325 330 335
Met Glu Pro Val Leu Ala Val Tyr Ala Gly Phe Ser Leu Asp Ile Trp
340 345 350
Gly Gln Glu Gly Thr Ser Tyr Pro Glu Asp Arg Met Asp Glu Ile Val
355 360 365
Gln Asp Ile Leu Asn Glu Leu Glu Tyr Cys Met Gly Asp Val Asn Thr
370 375 380
His Tyr Gly Ala Leu Arg Ala Gln His Gly His Pro Glu Pro Phe Asp
385 390 395 400
Ile Lys Tyr Ile Glu Ile Gly Asn Glu Asp Trp Phe Ser Ser Thr Tyr
405 410 415
Pro Tyr Arg Phe Pro Ile Ile Tyr Lys Ala Ile Lys Ser Ala Tyr Pro
420 425 430
Asn Ile Thr Leu Ile Ser Thr Ala Tyr Asn Glu Asn Ala Asn Tyr Thr
435 440 445
Ile Asp Ile Pro Ala Gly Gly Met Trp Asp Thr His His Tyr Glu Thr
450 455 460
Pro Ser Phe Phe Leu Glu Asn Phe Asn Tyr Phe Asp Asn Trp Gln Ala
465 470 475 480
Ala Thr Asn Asn Thr Asp Val Lys Ile Phe Val Gly Glu Tyr Ser Val
485 490 495
Tyr Gln Ile Asp Thr Pro Asp Gly Tyr Val Asn Phe Ser Asn Pro Glu
500 505 510
Gly Ile His Met Phe Phe Pro Glu Leu Val Ser Ala Ile Ala Glu Ala
515 520 525
Val Tyr Leu Leu Gly Ala Glu Arg Asn Pro Asn Thr Val Thr Met Thr
530 535 540
Ser Tyr Ala Pro Ser Phe Gln Asn Leu Asn Trp Tyr Asn Trp Ser Pro
545 550 555 560
Asn Leu Val Ala Phe Thr Ala Asn Pro Asp Glu Thr Val Phe Ser Thr
565 570 575
Ser Tyr Tyr Met Gln Lys Met Phe Ala Asn His Arg Gly Thr Gln Thr
580 585 590
Leu Pro Val Lys Asn Ser Lys Gly Asp Phe Asn Pro Leu Trp Trp Val
595 600 605
Ala Thr Ile Asp Glu Gly Ala Gly Val Val Tyr Phe Lys Ile Val Asn
610 615 620
Ser Gly Asn Ser Ser Ile Pro Leu Thr Ile Asn Leu Asp Gln Ala Tyr
625 630 635 640
Lys Gly Val Asn Gly Thr Ile Leu Val Arg Arg Arg Ile Cys Leu Gln
645 650 655
Leu His Ile Tyr Thr Val Pro Asp Glu Leu Thr Ile Ala Phe Leu Gln
660 665 670
Thr His Pro Asn Leu Tyr Gly Phe Asn Tyr Leu Asn Asn Gln Thr Ala
675 680 685
Ile Val Pro Val Pro Ala Asn Ile Thr Ser Pro Ser Lys Ser Gln Asn
690 695 700
Arg Phe Asp Trp Asp Val Pro Lys Tyr Ser Val Thr Val Leu Gln Phe
705 710 715 720
Asp Ile
<210> 38
<211> 23
<212> PRT
<213> Rasamsonia emersonii
<400> 38
Met Ile Leu Arg Ser Leu Pro Ile His Ala Ala Ala Ile Ala Ala Ala
1 5 10 15
Leu Thr Ser Leu Val Asp Ala
20
<210> 39
<211> 2483
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2483)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 39
atgatcctcc gatccctccc tatccatgct gcggccattg cagcagcctt aacttccctc 60
gtcgacgcaa aacccctgcg acatgacatc aggcaggtgg cagaaacgca tcggatcaat 120
agcacgcact acaacgacac ctctgccgtc gtgctggatg tgtcgttgaa ggacgcggcc 180
gggaggaaca atacgtcgcc gctgctgtat gggtggatgt ttgaggatat tagtgtaatt 240
acctccattt gttgaccctt gactattacc gttctcaaga tgcgttgttt gttttgtact 300
ggtgtcattt tatattactg tgcttcagac gaagatggtt tttttttcct atttcctcaa 360
gctaagcctt cttgcagcac tccggcgacg gcggtatata cgcggaattg atcaagaacc 420
gggctttcca gggtgagaac taccttgact ttctttctct tcgtcgttct gacgacctgc 480
caggctcgac atccaccgtc aaacaagcac ccggcatttc aggcgacagc gtggttgctg 540
cacagaaccc catcgtcccg tttggccccg tcctcgacgg atggcgaccc attggcgatg 600
caaaactctc tctcgacgtg cttcaccccc tgtccgatgc ccttccggtc gtcctgcaga 660
tcgacatccc ctggaacgcc accggcgaag ttggcttcct gaatgaaggc tggtggggca 720
tcgacgtccg gccgcagaca tacaacgcct cgttctacat gctggccaac gccccgcgat 780
acaacaagac gctgaccagc atcaacctgt cgctgcggtc gaacctgacg gacgacgtct 840
gggccacgac gacgatccac gtcgacccgg acaaggtccc cacgttcgac tacgagcagt 900
accaggccag catcgtcaac acggtcaagg cgcccaactc gaacaacacc tttgccatca 960
ccttcaatgc ggacgaggtg gctggctcga cattctactt tggcctcgtc agtctgttcc 1020
ctgagacgtt caacaaccgt cccaacggtc tgcgcaagga cctcgcccag ggcatcaagg 1080
acatgggcgc gaaattcctc cgcttcccag gcggcaacaa cctcgaggga tactccatct 1140
tccagcggtg gaagtggaac gagaccatcg gcccgttgcg ataccgcaag ggacgcgtcg 1200
gcaactggga atactacaac accaacgggc tgggtctgct ggagttcctg gagtggacgg 1260
aggacctcgg catggagccc gttctggccg tgtacgccgg attctcgctc gacatatggg 1320
gccaggaggg cacgtcctac cccgaagacc gcatggacga gattgtgcag gacatcctga 1380
acgagctgga gtactgcatg ggcgacgtca acacgcacta cggcgctctg cgcgcgcagc 1440
acggccaccc ggagccgttc gatatcaagt acatcgagat cggcaacgag gactggttct 1500
ccagcacgta tccctaccgg ttccccatca tctacaaggc catcaagtcc gcgtacccca 1560
acatcaccct catctcgacc gcctacaacg agaacgccaa ctacaccatc gacatccccg 1620
cgggcggcat gtgggacacg catcactacg agacgccgtc cttcttcctc gagaacttca 1680
actacttcga caactggcag gcggcgacga acaacaccga cgtcaagatc ttcgtcggcg 1740
agtactccgt ctaccagatc gacacaccgg acggctacgt caacttcagc aacccggagg 1800
gcatccacat gttcttcccg gagctcgtgt cggcgatcgc agaggcagtc tatctgctcg 1860
gcgcagagcg caatccgaac acggtcacca tgacctcgta cgcgcccagc ttccagaacc 1920
tgaactggta caactggtcg cccaacctgg tggcctttac tgccaatccc gacgagacgg 1980
tcttcagcac cagctactac atgcagaaga tgtttgccaa tcaccggggc acgcagacgc 2040
tgccagtgaa gaattccaag ggagacttta acccgctgtg gtgggttgca acgattgacg 2100
agggggctgg tgttgtttac ttcaaggtat tatccattat aacattgctc gttcctgttg 2160
tcactaacaa caagcagatc gtcaactcgg gaaactcctc catcccgttg acaatcaacc 2220
tcgaccaggc atacaaggga gtcaatggga cgatactggt gcgtcgcaga atctgccttc 2280
agctacatat atataccgtt cctgacgaac tgacaattgc ctttctacag acacacccca 2340
acctctacgg attcaactac ctgaacaacc agactgccat cgtgcctgtt ccggcgaaca 2400
tcacttctcc ctcgaagagt cagaaccgct tcgattggga tgtcccgaag tattcggtca 2460
cggtgttgca gtttgatatt taa 2483
<210> 40
<211> 2238
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2238)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 40
atgatcctcc gatccctccc tatccatgct gcggccattg cagcagcctt aacttccctc 60
gtcgacgcaa aacccctgcg acatgacatc aggcaggtgg cagaaacgca tcggatcaat 120
agcacgcact acaacgacac ctctgccgtc gtgctggatg tgtcgttgaa ggacgcggcc 180
gggaggaaca atacgtcgcc gctgctgtat gggtggatgt ttgaggatat tagtcactcc 240
ggcgacggcg gtatatacgc ggaattgatc aagaaccggg ctttccaggg ctcgacatcc 300
accgtcaaac aagcacccgg catttcaggc gacagcgtgg ttgctgcaca gaaccccatc 360
gtcccgtttg gccccgtcct cgacggatgg cgacccattg gcgatgcaaa actctctctc 420
gacgtgcttc accccctgtc cgatgccctt ccggtcgtcc tgcagatcga catcccctgg 480
aacgccaccg gcgaagttgg cttcctgaat gaaggctggt ggggcatcga cgtccggccg 540
cagacataca acgcctcgtt ctacatgctg gccaacgccc cgcgatacaa caagacgctg 600
accagcatca acctgtcgct gcggtcgaac ctgacggacg acgtctgggc cacgacgacg 660
atccacgtcg acccggacaa ggtccccacg ttcgactacg agcagtacca ggccagcatc 720
gtcaacacgg tcaaggcgcc caactcgaac aacacctttg ccatcacctt caatgcggac 780
gaggtggctg gctcgacatt ctactttggc ctcgtcagtc tgttccctga gacgttcaac 840
aaccgtccca acggtctgcg caaggacctc gcccagggca tcaaggacat gggcgcgaaa 900
ttcctccgct tcccaggcgg caacaacctc gagggatact ccatcttcca gcggtggaag 960
tggaacgaga ccatcggccc gttgcgatac cgcaagggac gcgtcggcaa ctgggaatac 1020
tacaacacca acgggctggg tctgctggag ttcctggagt ggacggagga cctcggcatg 1080
gagcccgttc tggccgtgta cgccggattc tcgctcgaca tatggggcca ggagggcacg 1140
tcctaccccg aagaccgcat ggacgagatt gtgcaggaca tcctgaacga gctggagtac 1200
tgcatgggcg acgtcaacac gcactacggc gctctgcgcg cgcagcacgg ccacccggag 1260
ccgttcgata tcaagtacat cgagatcggc aacgaggact ggttctccag cacgtatccc 1320
taccggttcc ccatcatcta caaggccatc aagtccgcgt accccaacat caccctcatc 1380
tcgaccgcct acaacgagaa cgccaactac accatcgaca tccccgcggg cggcatgtgg 1440
gacacgcatc actacgagac gccgtccttc ttcctcgaga acttcaacta cttcgacaac 1500
tggcaggcgg cgacgaacaa caccgacgtc aagatcttcg tcggcgagta ctccgtctac 1560
cagatcgaca caccggacgg ctacgtcaac ttcagcaacc cggagggcat ccacatgttc 1620
ttcccggagc tcgtgtcggc gatcgcagag gcagtctatc tgctcggcgc agagcgcaat 1680
ccgaacacgg tcaccatgac ctcgtacgcg cccagcttcc agaacctgaa ctggtacaac 1740
tggtcgccca acctggtggc ctttactgcc aatcccgacg agacggtctt cagcaccagc 1800
tactacatgc agaagatgtt tgccaatcac cggggcacgc agacgctgcc agtgaagaat 1860
tccaagggag actttaaccc gctgtggtgg gttgcaacga ttgacgaggg ggctggtgtt 1920
gtttacttca agatcgtcaa ctcgggaaac tcctccatcc cgttgacaat caacctcgac 1980
caggcataca agggagtcaa tgggacgata ctggtgcgtc gcagaatctg ccttcagcta 2040
catatatata ccgttcctga cgaactgaca attgcctttc tacagacaca ccccaacctc 2100
tacggattca actacctgaa caaccagact gccatcgtgc ctgttccggc gaacatcact 2160
tctccctcga agagtcagaa ccgcttcgat tgggatgtcc cgaagtattc ggtcacggtg 2220
ttgcagtttg atatttaa 2238
<210> 41
<211> 1518
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1518)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 41
atgaccacct tcaccaagct cagcgacgag gagactccta ccatctccgt ccacgcttct 60
cgccgcctct ccaagatcaa ccccaacatc tactctggct tcactgagca catgggccgc 120
tgcatctacg gtggtatcta cgaccccggc aaccctctct ccgacgagaa cggattccgc 180
aaggatgttc tcgaagcgtt gaaggagctc aacatccccg tcgtccgtta ccccggtggc 240
aacttcactg ccacctacca ctggttggat ggtgttggtc ccaaggacca gcgccccgcc 300
cgtcccgagc tggcctggct aggaaccgaa accaaccagt tcggtaccga cgagttcctc 360
aagtggtgcg agatgcttgg tgctgagccc tacctctgcc tgaacttcgg tactggtacc 420
ctcgacgagg ccatggcctg ggttgaatac tgcaacggca ccggcaacac ctactacgcc 480
aacctccgtc gcaagaacgg ccgtgagaag ccctacaacg tcaagtactg ggctcttggc 540
aacgaaacct ggggtccctg gcagatcgag cagatgacca aggaagccta cgctcacaag 600
gcctaccagt gggccaaggc tctcaagctc ctggatccca acatcatcct gatcctctgc 660
ggtcaggatg gaactgccag ctgggactac tacaccctca agcactgctt gcagcccacc 720
aaggccaccc tcaactccaa ccccgttcct ctgattgaca tgcactccat ccacatgtac 780
actgcttctt ccaagcacct gcccaacgcc actgcgcctc ttgctgctga gcgtgccatt 840
gagatcacca gcagcttgat tgaccttgct cgcattgaga acggcatctc ccccgatgag 900
cctcgtccca ccatctgctt cgacgaatgg aacgtctggg accctgtccg tgctgagggc 960
tccaagggtg ctgaggagag ctacactctg tcggatgccc ttgctgttgg tgtgttcctc 1020
aacgtgttcg tccgcaagtc caaggacctt ggaatggcct gcattgccca gtccgtcaac 1080
gtcatctccc ctctgatgac cactcgtgac ggtatcgtca agcagaccac ctggtggcct 1140
ctctggctgt tctcccgctt catgcgtggc tggaccattg gtgctcacgt ttcctgcggt 1200
gcctacgagg gtgagacttc tcctgcctgg ctgcgtggtg tcaaggacac tccttggctg 1260
gatgtctctg ccgctcttgg tgatgacggc ttcgtcaacg ttgttgttgt caacatccac 1320
gaaaccaagg acttcaagac caacgtgaag ggtgtctccg gtggtcccgt gaccgtctac 1380
accgtcactg gtgctgatgt gtctgccacc aacatgaagg gcaagcagga agtcggtgtc 1440
caggagtcca cctgggatgg caagggcagc tacgtgttcc ccaagcactc gctgaccctg 1500
ctccgctgga aggccgag 1518
<210> 42
<211> 506
<212> PRT
<213> Rasamsonia emersonii
<400> 42
Met Thr Thr Phe Thr Lys Leu Ser Asp Glu Glu Thr Pro Thr Ile Ser
1 5 10 15
Val His Ala Ser Arg Arg Leu Ser Lys Ile Asn Pro Asn Ile Tyr Ser
20 25 30
Gly Phe Thr Glu His Met Gly Arg Cys Ile Tyr Gly Gly Ile Tyr Asp
35 40 45
Pro Gly Asn Pro Leu Ser Asp Glu Asn Gly Phe Arg Lys Asp Val Leu
50 55 60
Glu Ala Leu Lys Glu Leu Asn Ile Pro Val Val Arg Tyr Pro Gly Gly
65 70 75 80
Asn Phe Thr Ala Thr Tyr His Trp Leu Asp Gly Val Gly Pro Lys Asp
85 90 95
Gln Arg Pro Ala Arg Pro Glu Leu Ala Trp Leu Gly Thr Glu Thr Asn
100 105 110
Gln Phe Gly Thr Asp Glu Phe Leu Lys Trp Cys Glu Met Leu Gly Ala
115 120 125
Glu Pro Tyr Leu Cys Leu Asn Phe Gly Thr Gly Thr Leu Asp Glu Ala
130 135 140
Met Ala Trp Val Glu Tyr Cys Asn Gly Thr Gly Asn Thr Tyr Tyr Ala
145 150 155 160
Asn Leu Arg Arg Lys Asn Gly Arg Glu Lys Pro Tyr Asn Val Lys Tyr
165 170 175
Trp Ala Leu Gly Asn Glu Thr Trp Gly Pro Trp Gln Ile Glu Gln Met
180 185 190
Thr Lys Glu Ala Tyr Ala His Lys Ala Tyr Gln Trp Ala Lys Ala Leu
195 200 205
Lys Leu Leu Asp Pro Asn Ile Ile Leu Ile Leu Cys Gly Gln Asp Gly
210 215 220
Thr Ala Ser Trp Asp Tyr Tyr Thr Leu Lys His Cys Leu Gln Pro Thr
225 230 235 240
Lys Ala Thr Leu Asn Ser Asn Pro Val Pro Leu Ile Asp Met His Ser
245 250 255
Ile His Met Tyr Thr Ala Ser Ser Lys His Leu Pro Asn Ala Thr Ala
260 265 270
Pro Leu Ala Ala Glu Arg Ala Ile Glu Ile Thr Ser Ser Leu Ile Asp
275 280 285
Leu Ala Arg Ile Glu Asn Gly Ile Ser Pro Asp Glu Pro Arg Pro Thr
290 295 300
Ile Cys Phe Asp Glu Trp Asn Val Trp Asp Pro Val Arg Ala Glu Gly
305 310 315 320
Ser Lys Gly Ala Glu Glu Ser Tyr Thr Leu Ser Asp Ala Leu Ala Val
325 330 335
Gly Val Phe Leu Asn Val Phe Val Arg Lys Ser Lys Asp Leu Gly Met
340 345 350
Ala Cys Ile Ala Gln Ser Val Asn Val Ile Ser Pro Leu Met Thr Thr
355 360 365
Arg Asp Gly Ile Val Lys Gln Thr Thr Trp Trp Pro Leu Trp Leu Phe
370 375 380
Ser Arg Phe Met Arg Gly Trp Thr Ile Gly Ala His Val Ser Cys Gly
385 390 395 400
Ala Tyr Glu Gly Glu Thr Ser Pro Ala Trp Leu Arg Gly Val Lys Asp
405 410 415
Thr Pro Trp Leu Asp Val Ser Ala Ala Leu Gly Asp Asp Gly Phe Val
420 425 430
Asn Val Val Val Val Asn Ile His Glu Thr Lys Asp Phe Lys Thr Asn
435 440 445
Val Lys Gly Val Ser Gly Gly Pro Val Thr Val Tyr Thr Val Thr Gly
450 455 460
Ala Asp Val Ser Ala Thr Asn Met Lys Gly Lys Gln Glu Val Gly Val
465 470 475 480
Gln Glu Ser Thr Trp Asp Gly Lys Gly Ser Tyr Val Phe Pro Lys His
485 490 495
Ser Leu Thr Leu Leu Arg Trp Lys Ala Glu
500 505
<210> 43
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> no signal peptide predicted
<400> 43
Met Met Met Met
1
<210> 44
<211> 2005
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2005)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 44
atgacgacat tcaccaagct cagcgacgag gagacgccca ccatctctgt ccatgcgtcc 60
aggcgtctgt ccaaaatcaa ccccaacatc tactcggggt tcacagagta gggagccgac 120
agacgtgtct accggtttta gttcgctagt gagaccctgc tgactgatag ctttcgttac 180
caggcatatg ggacgatgca tctacggagg catatatgat cccggaaatc ctctgtcgga 240
cgagaatggc tttcgaaagg atgttctgga ggctctgaag gagctcaata tccctgtggt 300
tcgctatccc ggcggaaact ttaccgccac gtatcactgg ttagacggtg ttggcccgaa 360
ggatcaacga cccgcgaggt attcaatgac ttcttctctt ggatttcatt tctttcgttt 420
gactgtctgt gttttaccat ggttctgttt taataccatg aactatttga gagactttag 480
ctggtttcca tataattttt ttaccatacg cggcacctgt catgctaaca aagggaaaca 540
atttgaacag accggagctc gcctggctgg ggactgagac caatcagttc ggcactgatg 600
agttcttaaa atggtgtgag atgctcggcg cggagccgta cctctgcttg aactttggaa 660
caggtgcggc gtgccgatat cctgaccctt gtacctgaga acaaacaaac taattggatt 720
gatttaggca ctcttgatga aggtgagcat ccttcaattc ctgtcctata atgccagcac 780
aagatgatgt tgacacttct cagcaatggc atgggtcgag tactgcaatg ggacgggaaa 840
tacctactat gccaacctgc ggaggaagaa tggtcgggag aagccctaca atgtacgatc 900
cagtcactga ttggacattc tgttttttaa atactaatac cagagtttca ggttaaatac 960
tgggctctgg gtaacgagac atggggtccg tggcaaattg aacaaatgac caaggaagcc 1020
tatgctcaca aggcgtatca atgggccaaa ggtacgttga caatttatat atctatttat 1080
ctatacctct aacatacgta cagctctcaa gctgctcgat ccgaatataa ttctcattct 1140
ttgcggtcag gacggcactg catcgtggga ctactacacc ctcaaacact gtctgcagcc 1200
aacaaaggct actctaaaca gcaacccggt tccccttatt gacatgcaca gcattcacat 1260
gtacacggcg tcgtccaagc atttgccaaa cgccaccgca cccttggctg cggagcgtgc 1320
gattgagatt acatcctccc tgatcgacct ggctcggatc gaaaacggga tatccccgga 1380
tgagccgcgc ccgacgatct gctttgacga gtggaacgtc tgggatcccg tgcgtgccga 1440
gggcagcaag ggagccgagg agagctacac cctgtccgac gcgttggcgg tgggagtttt 1500
cctcaacgtg ttcgtccgga agagcaagga cctgggaatg gcgtgcatcg cgcaaagcgt 1560
caatgtcatt tcgccgctca tgacgaccag agacggcatt gtgaagcaaa cgacgtggtg 1620
gccgctgtgg cttttctccc gattcatgcg gggctggacc atcggtgcgc atgtttcctg 1680
tggcgcctac gagggcgaaa cctcacccgc gtggctgcgc ggcgtcaagg acactccctg 1740
gctggacgtc agcgcggcct tgggtgacga tggctttgtc aacgtagttg tcgtcaacat 1800
ccatgaaact aaggacttta agaccaacgt caagggcgtc agtggaggtc ctgtcactgt 1860
ctacacggtc accggagccg atgtgtctgc tactaacatg aaggggaagc aagaggtggg 1920
agttcaggag agtacatggg acggcaaagg cagttatgtg ttcccgaagc attctctgac 1980
gctgctgaga tggaaggcag agtga 2005
<210> 45
<211> 1521
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1521)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 45
atgacgacat tcaccaagct cagcgacgag gagacgccca ccatctctgt ccatgcgtcc 60
aggcgtctgt ccaaaatcaa ccccaacatc tactcggggt tcacagagca tatgggacga 120
tgcatctacg gaggcatata tgatcccgga aatcctctgt cggacgagaa tggctttcga 180
aaggatgttc tggaggctct gaaggagctc aatatccctg tggttcgcta tcccggcgga 240
aactttaccg ccacgtatca ctggttagac ggtgttggcc cgaaggatca acgacccgcg 300
agaccggagc tcgcctggct ggggactgag accaatcagt tcggcactga tgagttctta 360
aaatggtgtg agatgctcgg cgcggagccg tacctctgct tgaactttgg aacaggcact 420
cttgatgaag caatggcatg ggtcgagtac tgcaatggga cgggaaatac ctactatgcc 480
aacctgcgga ggaagaatgg tcgggagaag ccctacaatg ttaaatactg ggctctgggt 540
aacgagacat ggggtccgtg gcaaattgaa caaatgacca aggaagccta tgctcacaag 600
gcgtatcaat gggccaaagc tctcaagctg ctcgatccga atataattct cattctttgc 660
ggtcaggacg gcactgcatc gtgggactac tacaccctca aacactgtct gcagccaaca 720
aaggctactc taaacagcaa cccggttccc cttattgaca tgcacagcat tcacatgtac 780
acggcgtcgt ccaagcattt gccaaacgcc accgcaccct tggctgcgga gcgtgcgatt 840
gagattacat cctccctgat cgacctggct cggatcgaaa acgggatatc cccggatgag 900
ccgcgcccga cgatctgctt tgacgagtgg aacgtctggg atcccgtgcg tgccgagggc 960
agcaagggag ccgaggagag ctacaccctg tccgacgcgt tggcggtggg agttttcctc 1020
aacgtgttcg tccggaagag caaggacctg ggaatggcgt gcatcgcgca aagcgtcaat 1080
gtcatttcgc cgctcatgac gaccagagac ggcattgtga agcaaacgac gtggtggccg 1140
ctgtggcttt tctcccgatt catgcggggc tggaccatcg gtgcgcatgt ttcctgtggc 1200
gcctacgagg gcgaaacctc acccgcgtgg ctgcgcggcg tcaaggacac tccctggctg 1260
gacgtcagcg cggccttggg tgacgatggc tttgtcaacg tagttgtcgt caacatccat 1320
gaaactaagg actttaagac caacgtcaag ggcgtcagtg gaggtcctgt cactgtctac 1380
acggtcaccg gagccgatgt gtctgctact aacatgaagg ggaagcaaga ggtgggagtt 1440
caggagagta catgggacgg caaaggcagt tatgtgttcc cgaagcattc tctgacgctg 1500
ctgagatgga aggcagagtg a 1521
<210> 46
<211> 966
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(966)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 46
atgcgcccca gcttcctccg ctacgtgtct cttgctcctc tgctctggtc tgctgctgcc 60
tccgctgagc ctgtccgtgt tctcgacacc gacttccctg acccttgctt gatctccacc 120
aacggcaagt actacgcttt cgccaccact ggcaacggtg tcaacgtcca gattgcccag 180
tcggatgact tcgtcacctg ggagcgtctt gctggtactg atgcccttcc tggtcccttc 240
cccagctggg ttgcctcctc ccccactgtc tgggctcccg atgtcatcca gcgtctggac 300
ggtacctacg tcatgtacta ctctgctctt tcttccaccg accccagcaa gcactgcttc 360
ggtgctgcca cctcgacctc catcaccggt ccctacaagc ccgaggacaa ctacattgcc 420
tgccccctcg accagggtgg tgccatcgac cccgatggat tcatcgatga tgacggcacc 480
atgtacgtgg tctacaaggt tgacggcagc aacctggatg gagatggcac catccacccc 540
actcccatca tgctccaggc tctggagcct gacggcatca cccccactgg tgaccccatc 600
aagctcctcg accgtgatgc ctccgacggc atcttgattg aggctccctc cctcgtccgc 660
tccgttgttt ccggcaccta cttcctgagc tactcttctc actactacgc ctccctgcac 720
tacgacgttg gatacgccac tggccctgcc gtcaagggtc ccttcaccaa ggcccaggct 780
cctcttctcg tcaccggtga caacaccacc aacgccggtc ctctgggtgg tcccggtggt 840
gccgacttct ccgtcgacgg cactcgtatc gtgttccacg ctttcgagaa cggccgcaac 900
ctgaccaacg gccgtgctct ctacaccagc ggtatcgtcc tcgagggtga tgtcattcgc 960
ctagtt 966
<210> 47
<211> 300
<212> PRT
<213> Rasamsonia emersonii
<400> 47
Glu Pro Val Arg Val Leu Asp Thr Asp Phe Pro Asp Pro Cys Leu Ile
1 5 10 15
Ser Thr Asn Gly Lys Tyr Tyr Ala Phe Ala Thr Thr Gly Asn Gly Val
20 25 30
Asn Val Gln Ile Ala Gln Ser Asp Asp Phe Val Thr Trp Glu Arg Leu
35 40 45
Ala Gly Thr Asp Ala Leu Pro Gly Pro Phe Pro Ser Trp Val Ala Ser
50 55 60
Ser Pro Thr Val Trp Ala Pro Asp Val Ile Gln Arg Leu Asp Gly Thr
65 70 75 80
Tyr Val Met Tyr Tyr Ser Ala Leu Ser Ser Thr Asp Pro Ser Lys His
85 90 95
Cys Phe Gly Ala Ala Thr Ser Thr Ser Ile Thr Gly Pro Tyr Lys Pro
100 105 110
Glu Asp Asn Tyr Ile Ala Cys Pro Leu Asp Gln Gly Gly Ala Ile Asp
115 120 125
Pro Asp Gly Phe Ile Asp Asp Asp Gly Thr Met Tyr Val Val Tyr Lys
130 135 140
Val Asp Gly Ser Asn Leu Asp Gly Asp Gly Thr Ile His Pro Thr Pro
145 150 155 160
Ile Met Leu Gln Ala Leu Glu Pro Asp Gly Ile Thr Pro Thr Gly Asp
165 170 175
Pro Ile Lys Leu Leu Asp Arg Asp Ala Ser Asp Gly Ile Leu Ile Glu
180 185 190
Ala Pro Ser Leu Val Arg Ser Val Val Ser Gly Thr Tyr Phe Leu Ser
195 200 205
Tyr Ser Ser His Tyr Tyr Ala Ser Leu His Tyr Asp Val Gly Tyr Ala
210 215 220
Thr Gly Pro Ala Val Lys Gly Pro Phe Thr Lys Ala Gln Ala Pro Leu
225 230 235 240
Leu Val Thr Gly Asp Asn Thr Thr Asn Ala Gly Pro Leu Gly Gly Pro
245 250 255
Gly Gly Ala Asp Phe Ser Val Asp Gly Thr Arg Ile Val Phe His Ala
260 265 270
Phe Glu Asn Gly Arg Asn Leu Thr Asn Gly Arg Ala Leu Tyr Thr Ser
275 280 285
Gly Ile Val Leu Glu Gly Asp Val Ile Arg Leu Val
290 295 300
<210> 48
<211> 22
<212> PRT
<213> Rasamsonia emersonii
<400> 48
Met Arg Pro Ser Phe Leu Arg Tyr Val Ser Leu Ala Pro Leu Leu Trp
1 5 10 15
Ser Ala Ala Ala Ser Ala
20
<210> 49
<211> 1026
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1026)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 49
atgcgaccat ctttccttcg atacgtctct ctagcacccc tcctgtggag cgcagcagca 60
tctgctgagc ccgtccgagt gctggacacc gacttcccag acccctgcct gatctccacc 120
aacggcaagt actatgcctt tgcgacgacg ggcaatggcg tcaacgtgca aatcgcccag 180
tcggacgact tcgtcacctg ggagcgtctg gctggcactg atgccctgcc gggaccgttt 240
ccctcgtggg tggcgtcttc gccgactgta tgggcgccgg acgtgattca acgggtgcgt 300
ttaaactata cataggattt ttcatcgtca tatctaacga ggtgcatcta gctcgatggc 360
acgtacgtga tgtactactc cgccctctcg agcacggacc cgtccaagca ctgctttggc 420
gccgccacct cgacctccat cacaggccct tacaagcccg aagacaacta catcgcctgt 480
ccgctggacc agggcggcgc catcgaccca gacggcttca tcgacgacga cggcaccatg 540
tacgtcgtct acaaggtcga cgggagcaac ctggacggcg acggcacgat ccatccgacg 600
cccatcatgc tgcaggcgct ggagccggac ggcatcactc cgacagggga cccgatcaag 660
ctgctagacc gggacgcgtc ggacgggatc ctgattgagg cgcccagtct ggtcagaagc 720
gtcgtcagcg ggacgtactt cctctcgtac tcgtcgcact actacgccag tttgcactac 780
gacgtcggct acgcgacagg gccggctgtg aaggggccct tcaccaaggc gcaggccccg 840
ttgctggtga cgggcgacaa tactaccaat gctggtcctc tgggtggacc tggaggagca 900
gacttttccg tcgacgggac gaggattgtc tttcatgcgt ttgagaatgg aaggaatctt 960
actaatggca gggcgctgta tacgtcgggg attgtccttg agggggacgt catacggttg 1020
gtgtag 1026
<210> 50
<211> 969
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(969)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 50
atgcgaccat ctttccttcg atacgtctct ctagcacccc tcctgtggag cgcagcagca 60
tctgctgagc ccgtccgagt gctggacacc gacttcccag acccctgcct gatctccacc 120
aacggcaagt actatgcctt tgcgacgacg ggcaatggcg tcaacgtgca aatcgcccag 180
tcggacgact tcgtcacctg ggagcgtctg gctggcactg atgccctgcc gggaccgttt 240
ccctcgtggg tggcgtcttc gccgactgta tgggcgccgg acgtgattca acggctcgat 300
ggcacgtacg tgatgtacta ctccgccctc tcgagcacgg acccgtccaa gcactgcttt 360
ggcgccgcca cctcgacctc catcacaggc ccttacaagc ccgaagacaa ctacatcgcc 420
tgtccgctgg accagggcgg cgccatcgac ccagacggct tcatcgacga cgacggcacc 480
atgtacgtcg tctacaaggt cgacgggagc aacctggacg gcgacggcac gatccatccg 540
acgcccatca tgctgcaggc gctggagccg gacggcatca ctccgacagg ggacccgatc 600
aagctgctag accgggacgc gtcggacggg atcctgattg aggcgcccag tctggtcaga 660
agcgtcgtca gcgggacgta cttcctctcg tactcgtcgc actactacgc cagtttgcac 720
tacgacgtcg gctacgcgac agggccggct gtgaaggggc ccttcaccaa ggcgcaggcc 780
ccgttgctgg tgacgggcga caatactacc aatgctggtc ctctgggtgg acctggagga 840
gcagactttt ccgtcgacgg gacgaggatt gtctttcatg cgtttgagaa tggaaggaat 900
cttactaatg gcagggcgct gtatacgtcg gggattgtcc ttgaggggga cgtcatacgg 960
ttggtgtag 969
<210> 51
<211> 1998
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1998)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 51
atgctttctg ctttcctctt ctcctccccc actctcagct ctcctcagtc tgcttccaag 60
accgagaaca gcactgccaa cactcctggt atccgcttga tcaacggcca cgaacacgtc 120
ctgatccagc cctggggtgc cgatggcttc cgcgttcgtg ccactctcaa ccgcttcccc 180
gacaactccg tccagcgtca ccaccgctct ccttccggcc gtcccgccga tcttcccatt 240
ggtaccagct actccaccat caacgccact cagactgcca ccgtcaccaa cggacacgcc 300
tccgtcgtcg tcgacaaggg tcagctgtcg ttctaccgtg tcaacggcaa caactccaag 360
accctcgtcc tccaggagct ctggctccag acccccggtt tccctgctcg ctggtaccag 420
aagcgtgatg ctcgccgtgg attccgtgct cagttctcct tcgtcgctcc tgactccccc 480
accgagcgtc tgttcggtac cggccaggat ttgactggct ctctgatcaa gaagaaccag 540
accatcgatc ttgtcaagtt caacaccctc aaccccatcc ccaccattgt ctccgaccgt 600
ggatacctct tcttctggaa cgttccctcc ctcggtcaga tggagctttc tcctacccgc 660
acctcgttcc tgtccgacca cacctccgtt gtggactact acattgccat ccgtcccgag 720
gccgactacg acggtctgct ccagcgttac acttccgtca ccggccgcag ccccatgatc 780
cctgacttcg gtactggata ctggcagtgc aagctccgtt acgccaccca ggaagaattg 840
ctcaacgtca ccatgggttt cgctgagcgc aagatccccg tcagcatgtt catcatcaac 900
tacctgagct ggtcccacga gggtgactgg gctctcaacg cctccgcctg gcctgacccc 960
gccaagatgg ctgctgaggc tgagctgatg gcctccgtct ggccctccat tgaggatgcc 1020
agccccaact gggctgagat gcagtctctt ggattcgctg cccagacttt cgaccctctt 1080
gacattgctg gctactggca gaacaagtac cagaacggta tccgcaactt ctggctagat 1140
gaggatgagg gtggccaggt tgctctcgat gtctacccct ggactgacta ctaccttgga 1200
cctggtgacc agtacgccat gcttttcccc tacttccacc agatgggtgt tttcgagggc 1260
cagatgaaaa ctgttggcag caacaacgtt tctgctgtct ctctgtcccg ctcgtctgcc 1320
aactgggaca gcatgaagat gatgatctcc gctggccagt ccatggccat gtccggccag 1380
ggatggtgga ccctcgacat tggtggtttc aagactgatg gccagtcgaa ctcggccaac 1440
atctcggacc ccgagtacca ggagctgttc gtccgctggc tgcagtgggg taccttcctc 1500
cccatcatgc gcaaccacgg tatgcgtacc tgcctgccct ccgctcagga aggcttcctg 1560
acctgcccct ccgagccctg gagctacggt cctgacaacc tgcccatcat tgtcagctac 1620
atcaacctcc gttacaagct gcagccctac atcaaggccc tcttccgcat gctgagcgaa 1680
tctggccgtg ccatgatgcg ccctctgttc atggacttct ccctctccga cccctacacc 1740
ctggaggcca ctgaggacct caagctccag tacatgttcg gtcctcgctt gcttgtctct 1800
cctgtcacca cctaccgtgc caccaacgcc accgtctacc ttcccaagct tccttcggat 1860
gctcccgata ccaagtggac ctactggtgg accaacgagt ctttcgatgg tggtcagtgg 1920
gtgaccgttc ctgccaacaa gtccatcatc cccttgttcc gtctgggcag cgaagcggac 1980
atcctcaccc gcaacatt 1998
<210> 52
<211> 647
<212> PRT
<213> Rasamsonia emersonii
<400> 52
Lys Thr Glu Asn Ser Thr Ala Asn Thr Pro Gly Ile Arg Leu Ile Asn
1 5 10 15
Gly His Glu His Val Leu Ile Gln Pro Trp Gly Ala Asp Gly Phe Arg
20 25 30
Val Arg Ala Thr Leu Asn Arg Phe Pro Asp Asn Ser Val Gln Arg His
35 40 45
His Arg Ser Pro Ser Gly Arg Pro Ala Asp Leu Pro Ile Gly Thr Ser
50 55 60
Tyr Ser Thr Ile Asn Ala Thr Gln Thr Ala Thr Val Thr Asn Gly His
65 70 75 80
Ala Ser Val Val Val Asp Lys Gly Gln Leu Ser Phe Tyr Arg Val Asn
85 90 95
Gly Asn Asn Ser Lys Thr Leu Val Leu Gln Glu Leu Trp Leu Gln Thr
100 105 110
Pro Gly Phe Pro Ala Arg Trp Tyr Gln Lys Arg Asp Ala Arg Arg Gly
115 120 125
Phe Arg Ala Gln Phe Ser Phe Val Ala Pro Asp Ser Pro Thr Glu Arg
130 135 140
Leu Phe Gly Thr Gly Gln Asp Leu Thr Gly Ser Leu Ile Lys Lys Asn
145 150 155 160
Gln Thr Ile Asp Leu Val Lys Phe Asn Thr Leu Asn Pro Ile Pro Thr
165 170 175
Ile Val Ser Asp Arg Gly Tyr Leu Phe Phe Trp Asn Val Pro Ser Leu
180 185 190
Gly Gln Met Glu Leu Ser Pro Thr Arg Thr Ser Phe Leu Ser Asp His
195 200 205
Thr Ser Val Val Asp Tyr Tyr Ile Ala Ile Arg Pro Glu Ala Asp Tyr
210 215 220
Asp Gly Leu Leu Gln Arg Tyr Thr Ser Val Thr Gly Arg Ser Pro Met
225 230 235 240
Ile Pro Asp Phe Gly Thr Gly Tyr Trp Gln Cys Lys Leu Arg Tyr Ala
245 250 255
Thr Gln Glu Glu Leu Leu Asn Val Thr Met Gly Phe Ala Glu Arg Lys
260 265 270
Ile Pro Val Ser Met Phe Ile Ile Asn Tyr Leu Ser Trp Ser His Glu
275 280 285
Gly Asp Trp Ala Leu Asn Ala Ser Ala Trp Pro Asp Pro Ala Lys Met
290 295 300
Ala Ala Glu Ala Glu Leu Met Ala Ser Val Trp Pro Ser Ile Glu Asp
305 310 315 320
Ala Ser Pro Asn Trp Ala Glu Met Gln Ser Leu Gly Phe Ala Ala Gln
325 330 335
Thr Phe Asp Pro Leu Asp Ile Ala Gly Tyr Trp Gln Asn Lys Tyr Gln
340 345 350
Asn Gly Ile Arg Asn Phe Trp Leu Asp Glu Asp Glu Gly Gly Gln Val
355 360 365
Ala Leu Asp Val Tyr Pro Trp Thr Asp Tyr Tyr Leu Gly Pro Gly Asp
370 375 380
Gln Tyr Ala Met Leu Phe Pro Tyr Phe His Gln Met Gly Val Phe Glu
385 390 395 400
Gly Gln Met Lys Thr Val Gly Ser Asn Asn Val Ser Ala Val Ser Leu
405 410 415
Ser Arg Ser Ser Ala Asn Trp Asp Ser Met Lys Met Met Ile Ser Ala
420 425 430
Gly Gln Ser Met Ala Met Ser Gly Gln Gly Trp Trp Thr Leu Asp Ile
435 440 445
Gly Gly Phe Lys Thr Asp Gly Gln Ser Asn Ser Ala Asn Ile Ser Asp
450 455 460
Pro Glu Tyr Gln Glu Leu Phe Val Arg Trp Leu Gln Trp Gly Thr Phe
465 470 475 480
Leu Pro Ile Met Arg Asn His Gly Met Arg Thr Cys Leu Pro Ser Ala
485 490 495
Gln Glu Gly Phe Leu Thr Cys Pro Ser Glu Pro Trp Ser Tyr Gly Pro
500 505 510
Asp Asn Leu Pro Ile Ile Val Ser Tyr Ile Asn Leu Arg Tyr Lys Leu
515 520 525
Gln Pro Tyr Ile Lys Ala Leu Phe Arg Met Leu Ser Glu Ser Gly Arg
530 535 540
Ala Met Met Arg Pro Leu Phe Met Asp Phe Ser Leu Ser Asp Pro Tyr
545 550 555 560
Thr Leu Glu Ala Thr Glu Asp Leu Lys Leu Gln Tyr Met Phe Gly Pro
565 570 575
Arg Leu Leu Val Ser Pro Val Thr Thr Tyr Arg Ala Thr Asn Ala Thr
580 585 590
Val Tyr Leu Pro Lys Leu Pro Ser Asp Ala Pro Asp Thr Lys Trp Thr
595 600 605
Tyr Trp Trp Thr Asn Glu Ser Phe Asp Gly Gly Gln Trp Val Thr Val
610 615 620
Pro Ala Asn Lys Ser Ile Ile Pro Leu Phe Arg Leu Gly Ser Glu Ala
625 630 635 640
Asp Ile Leu Thr Arg Asn Ile
645
<210> 53
<211> 19
<212> PRT
<213> Rasamsonia emersonii
<400> 53
Met Leu Ser Ala Phe Leu Phe Ser Ser Pro Thr Leu Ser Ser Pro Gln
1 5 10 15
Ser Ala Ser
<210> 54
<211> 2684
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2684)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 54
atgctttccg cttttctttt ctcttcacca acgctgtcct caccacaaag cgcgtccaaa 60
acagagaaca gcacagcaaa tacaccaggg attcgtctga tcaacggcca tgaacacgtt 120
ctgattcagc cttggggagc agatgggttc cgtgtccggg ccactctgaa cagatttcct 180
gacagtgcgt agccacggaa aacgcatctt gttcatctga ctaatttctt acctgctgat 240
tgacactctg tagatgaagc gtacagcgtc atcatagatc cccctctgga cggcccgcag 300
acctccccat cggcaccagc tacagcacca tcaatgcgac acaaaccgcc accgtgacca 360
acggccatgc ctcggtggtc gtcgacaagg gccagctgag tttctatcgc gtaaatggca 420
acaacagtaa aacactcgtc ttgcaggagc tgtggctaca gacaccggga ttcccagcgc 480
gatggtatca aaagagagat gcaagacggg gctttcgagc gcagttcagc ttcgtcgcgc 540
ccgacagtcc cacggagcgg ctgtttggga cgggccagga tctgacgggc tctctcatca 600
agaagaatca gaccatcgac ttggtcaagt tcaacacgct gaatccgatt ccgacaatcg 660
tgtccgatcg agggtatctg tttttctgga acgtgccttc gcttgggcag atggagttgt 720
ctccaacgag gtatgcatca gcaaaatttg aggaacagga tcatttctaa tgtcaatatt 780
agaaccagtt tcctgagcga tcacacttca gtggtggact attacattgc cattcgcccc 840
gaagccgact atgacggcct gctgcagcgg tacaccagtg tcactgggag atcgcccatg 900
attcctgatt ttggcaccgg atactggcag tgcaagctcc gttatgcgac tcaggaggag 960
ctcctcaatg tgactatggg atttgcagag gtcagaccct ttggaaatga taagactgtt 1020
tctgctgact tgtttgcagc gaaaaatacc tgtttcgatg ttcatcatca actatctcag 1080
ctggtctcac gagggtgact gggctctgaa cgcatcggcg tggccagatc cggcgaagat 1140
ggccgcagag ggtgagaaga gtcatttcta ccaaggtgtt gtagtctgac tggagccgaa 1200
ctgatggcat ccgtctggcc cagtatcgag gacgccagtc ccaactgggc tgaaatgcag 1260
agcttgggtt ttgccgcgca gacattcgat cctctcgata ttgctggcta ctggcagaac 1320
aaatacgtgc atatgatcga tcctaccaat gcagcagcca gggacttcct ctggagtaac 1380
ctttaccggc attactagca gaacgggatc cgaaacttct ggctcgacga agacgaggga 1440
ggccaggtcg cgctcgacgt ctacccgtgg acggactatt acctgggtcc gggggatcag 1500
tatgccatgc tgttccccta ctttcatcag atgggggttt ttgaaggaca gatgaagaca 1560
gtggggtcga ataatgtttc cgctgtgtcc ctgtcgcggt cctcgtgggt gggctcccag 1620
cgtttttgcc ggcgcagtgt ggagtggaga tattttgtat gtgttgcaca cttttcaata 1680
atgtaacctg ctgattctgg tcaacagcgc caactgggat tccatgaaga tgatgatatc 1740
cgcaggacag agcatggcca tgtcagggca gggttggtgg actttggaca ttggaggctt 1800
caagacagac gggcagtcca actcggcgaa tattagcgac ccggagtacc aggaattgtt 1860
tgtacggtgg ctgcagtggt aagcatttga atactccatt tcctgtattg ataagtaata 1920
cgtacagggg aaccttctta ccggtgcgta aatgaatgcc ctgttggcaa ttcaccaact 1980
gaacttgacg tagattatgc gcaaccacgg aatgagaacc tgtctccctt cagcacagga 2040
aggcttcctg acctgtccta gcggtacaga cccgtgccat atttttataa cccaaataag 2100
tatctactga cactgtcaaa cttctagaac cctggagcta cggccccgac aacctcccca 2160
tcatcgtgtc ctacatcaac ctccgataca aactgcagcc ctacatcaag gcgctcttcc 2220
ggatgctctc cgagagtgga cgggcaatga tgcggcccct gtttatggat ttctctctca 2280
gcgatcctta cactttggag gcgacggaag atctgaaatt gcagtacatg tttgggccgc 2340
gcttgctcgt cagtcccgtc acaacgtatc gcgcgacgaa tgcgaccgtc tacctgccaa 2400
aattgccgtc ggatgctccc gatacgaaat ggacgtactg gtggacgaac gagagttttg 2460
acggtggtca atgggtgagt tgtctctctc ttttttgata gccagttgac tgacattaat 2520
ttctcaggtc accgttcctg cgaacaaaag catgtaagta ttcaaatcac gtacacatgc 2580
agcttcgaat tgaaatattc ctgtctgacc tgagctgatc tgcatgcaga attccgctct 2640
tccgactcgg cagcgaagca gacatcttga cgaggaacat ctaa 2684
<210> 55
<211> 2001
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(2001)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 55
atgctttccg cttttctttt ctcttcacca acgctgtcct caccacaaag cgcgtccaaa 60
acagagaaca gcacagcaaa tacaccaggg attcgtctga tcaacggcca tgaacacgtt 120
ctgattcagc cttggggagc agatgggttc cgtgtccggg ccactctgaa cagatttcct 180
gacaatagcg tacagcgtca tcatagatcc ccctctggac ggcccgcaga cctccccatc 240
ggcaccagct acagcaccat caatgcgaca caaaccgcca ccgtgaccaa cggccatgcc 300
tcggtggtcg tcgacaaggg ccagctgagt ttctatcgcg taaatggcaa caacagtaaa 360
acactcgtct tgcaggagct gtggctacag acaccgggat tcccagcgcg atggtatcaa 420
aagagagatg caagacgggg ctttcgagcg cagttcagct tcgtcgcgcc cgacagtccc 480
acggagcggc tgtttgggac gggccaggat ctgacgggct ctctcatcaa gaagaatcag 540
accatcgact tggtcaagtt caacacgctg aatccgattc cgacaatcgt gtccgatcga 600
gggtatctgt ttttctggaa cgtgccttcg cttgggcaga tggagttgtc tccaacgaga 660
accagtttcc tgagcgatca cacttcagtg gtggactatt acattgccat tcgccccgaa 720
gccgactatg acggcctgct gcagcggtac accagtgtca ctgggagatc gcccatgatt 780
cctgattttg gcaccggata ctggcagtgc aagctccgtt atgcgactca ggaggagctc 840
ctcaatgtga ctatgggatt tgcagagcga aaaatacctg tttcgatgtt catcatcaac 900
tatctcagct ggtctcacga gggtgactgg gctctgaacg catcggcgtg gccagatccg 960
gcgaagatgg ccgcagaggc cgaactgatg gcatccgtct ggcccagtat cgaggacgcc 1020
agtcccaact gggctgaaat gcagagcttg ggttttgccg cgcagacatt cgatcctctc 1080
gatattgctg gctactggca gaacaaatac cagaacggga tccgaaactt ctggctcgac 1140
gaagacgagg gaggccaggt cgcgctcgac gtctacccgt ggacggacta ttacctgggt 1200
ccgggggatc agtatgccat gctgttcccc tactttcatc agatgggggt ttttgaagga 1260
cagatgaaga cagtggggtc gaataatgtt tccgctgtgt ccctgtcgcg gtcctccgcc 1320
aactgggatt ccatgaagat gatgatatcc gcaggacaga gcatggccat gtcagggcag 1380
ggttggtgga ctttggacat tggaggcttc aagacagacg ggcagtccaa ctcggcgaat 1440
attagcgacc cggagtacca ggaattgttt gtacggtggc tgcagtgggg aaccttctta 1500
ccgattatgc gcaaccacgg aatgagaacc tgtctccctt cagcacagga aggcttcctg 1560
acctgtccta gcgaaccctg gagctacggc cccgacaacc tccccatcat cgtgtcctac 1620
atcaacctcc gatacaaact gcagccctac atcaaggcgc tcttccggat gctctccgag 1680
agtggacggg caatgatgcg gcccctgttt atggatttct ctctcagcga tccttacact 1740
ttggaggcga cggaagatct gaaattgcag tacatgtttg ggccgcgctt gctcgtcagt 1800
cccgtcacaa cgtatcgcgc gacgaatgcg accgtctacc tgccaaaatt gccgtcggat 1860
gctcccgata cgaaatggac gtactggtgg acgaacgaga gttttgacgg tggtcaatgg 1920
gtcaccgttc ctgcgaacaa aagcataatt ccgctcttcc gactcggcag cgaagcagac 1980
atcttgacga ggaacatcta a 2001
<210> 56
<211> 840
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(840)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 56
atgcagatgc tcctcttgtt gctcctcctc cttcctccca gcctttgcgc tatcatcaag 60
ggtatctccg ctcctctcct tgcccgtctg acccagatgg ccaccctctg catgagcacc 120
tacctgaacg acctttgcat tgttcccggt ggtatgacca agatctccga catcaccaac 180
tccaccactg atgtccacgg ctggatcctg cgtgatgatg gtgcccgtga gatcctggcg 240
gtgttccgtg gtaccgagtc cctccagaac tacgccaccg acaccaacta caccctggct 300
cccttcgaca tcttccccca gtgcgaaggc tgcgaggtcc acggtggata ctaccttgcc 360
tgggtgtcga ttgtcgagca ggtccaggct cgcctgcagg agcagaaggc cctcttcccc 420
gactacggtg ttgtcttgac tggccactcc ctcggtggct ccctggctgc tcttgctgct 480
gcccagttct ctcctctctt cgacaacatc accgtctaca ccatgggtga gcctcgcact 540
ggcaacgccg ccttcgcctc cttcattgac cagcgttaca gcacttcttc tcccgagact 600
acccgcttct accgctgcac ccacgccgat gacggtatcc ccaacgctcc tcccacctcc 660
gacggctacg tccaccacgg tctggaatac tggaacctcg accccacttc tgctgagaac 720
acctacgtgt gcactgagga tggtgccgtc cagtgctgcg aagcgcagaa cggcagcggt 780
atcaacgctg cccacctggt ctacttcggc cgccccgttg ttgttggtgg ccagtgtctg 840
<210> 57
<211> 233
<212> PRT
<213> Rasamsonia emersonii
<400> 57
Ala Ile Ile Lys Gly Ile Ser Ala Pro Leu Leu Ala Arg Leu Thr Gln
1 5 10 15
Met Ala Thr Leu Cys Met Ser Thr Tyr Leu Asn Asp Leu Cys Ile Val
20 25 30
Pro Gly Gly Met Thr Lys Ile Ser Asp Ile Thr Asn Ser Thr Thr Asp
35 40 45
Val His Gly Trp Ile Leu Arg Asp Asp Gly Ala Arg Glu Ile Leu Ala
50 55 60
Val Phe Arg Gly Thr Glu Ser Leu Gln Asn Tyr Ala Thr Asp Thr Asn
65 70 75 80
Tyr Thr Leu Ala Pro Phe Asp Ile Phe Pro Gln Cys Glu Gly Cys Glu
85 90 95
Val His Gly Gly Tyr Tyr Leu Ala Trp Val Ser Ile Val Glu Gln Val
100 105 110
Gln Ala Arg Leu Gln Glu Gln Lys Ala Leu Phe Pro Asp Tyr Gly Val
115 120 125
Val Leu Thr Gly His Ser Leu Gly Gly Ser Leu Ala Ala Leu Ala Ala
130 135 140
Ala Gln Phe Ser Pro Leu Phe Asp Asn Ile Thr Val Tyr Thr Met Gly
145 150 155 160
Glu Pro Arg Thr Gly Asn Ala Ala Phe Ala Ser Phe Ile Asp Gln Arg
165 170 175
Tyr Ser Thr Ser Ser Pro Glu Thr Thr Arg Phe Tyr Arg Cys Thr His
180 185 190
Ala Asp Asp Gly Ile Pro Asn Ala Pro Pro Thr Ser Asp Gly Tyr Val
195 200 205
His His Gly Leu Glu Tyr Trp Asn Leu Asp Pro Thr Ser Ala Glu Asn
210 215 220
Thr Phe Pro Met Asn Gly Gln Leu Ser
225 230
<210> 58
<211> 20
<212> PRT
<213> Rasamsonia emersonii
<400> 58
Met Gln Met Leu Leu Leu Leu Leu Leu Leu Leu Pro Pro Ser Leu Cys
1 5 10 15
Ala Ile Ile Lys
20
<210> 59
<211> 1100
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1100)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 59
atgcaaacgc aaatgcaaat gctcctacta ctcctgctgc tactaccacc ctccctctgc 60
gccatcatca aaggcatctc cgcccccctc ctagcccgcc taacccagat ggccacgctc 120
tgcatgtcca cctacctcaa cgacctgtgc atcgtgcccg gggggatgac caagatcagc 180
gacatcacca acagcacaac cgacgtgcac ggctggatcc tgcgcgacga cggcgcgcgc 240
gagatcctcg ccgtgttccg cggcaccgag tcgctgcaga actacgcgac ggatacgaac 300
tacacgcttg cgccgttcga cattttcccg cagtgtgagg gctgtgaggt ccatggcggg 360
tactatctcg cctgggtatc gattgtcgag caggtgcagg ctcgtctgca ggagcagaag 420
gcgctgtttc cggattatgg ggttgttttg acggggcata ggtatgcata tacccaccta 480
acctaggtat aaatatactg tctgtgtata gatactgact tgatatatag tcttggaggc 540
tccctcgccg cgctggccgc agcacagttc tctcccctct tcgacaacat caccgtgtac 600
acaatgggcg agcctcgcac cggcaacgcc gccttcgcgt ccttcatcga ccagcgctac 660
agcacgtcct cgcccgagac gacgcggttc taccggtgca cgcacgcgga cgacggcatc 720
cccaatgcgc cgccgacgtc ggacgggtat gtgcaccacg ggctggagta ctggaacttg 780
gacccgacga gtgcggagaa tacgtatgtc tgtacggagg acggggcggt gcagtgctgc 840
gaggcgcaga atgggtcggg tatcaatgct gctcatctgg tgtattttgg tcggccggtt 900
gtggtggggg ggcagtgtct ttaaatagta ttgagaaggg gaatcaacag gctggatggg 960
atcagatttg gatattcacg aggactaaca ttagctgatg ggtgtacata caggacattt 1020
atataaatga ccgcagatcg aaatcaatca actaataact acagacgtgt aggtttccta 1080
tgaacggtca actatcttag 1100
<210> 60
<211> 843
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(843)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 60
atgcaaatgc tcctactact cctgctgcta ctaccaccct ccctctgcgc catcatcaaa 60
ggcatctccg cccccctcct agcccgccta acccagatgg ccacgctctg catgtccacc 120
tacctcaacg acctgtgcat cgtgcccggg gggatgacca agatcagcga catcaccaac 180
agcacaaccg acgtgcacgg ctggatcctg cgcgacgacg gcgcgcgcga gatcctcgcc 240
gtgttccgcg gcaccgagtc gctgcagaac tacgcgacgg atacgaacta cacgcttgcg 300
ccgttcgaca ttttcccgca gtgtgagggc tgtgaggtcc atggcgggta ctatctcgcc 360
tgggtatcga ttgtcgagca ggtgcaggct cgtctgcagg agcagaaggc gctgtttccg 420
gattatgggg ttgttttgac ggggcatagt cttggaggct ccctcgccgc gctggccgca 480
gcacagttct ctcccctctt cgacaacatc accgtgtaca caatgggcga gcctcgcacc 540
ggcaacgccg ccttcgcgtc cttcatcgac cagcgctaca gcacgtcctc gcccgagacg 600
acgcggttct accggtgcac gcacgcggac gacggcatcc ccaatgcgcc gccgacgtcg 660
gacgggtatg tgcaccacgg gctggagtac tggaacttgg acccgacgag tgcggagaat 720
acgtatgtct gtacggagga cggggcggtg cagtgctgcg aggcgcagaa tgggtcgggt 780
atcaatgctg ctcatctggt gtattttggt cggccggttg tggtgggggg gcagtgtctt 840
taa 843
<210> 61
<211> 1374
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1374)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 61
atgaagtcgc tggtctacgc tctttgcttc gcctccgccg ttgctgcctc caacagcact 60
ggtactgcca ctgttgacct caacgtcaag cgtggacctc cctcccacct tgcctccgga 120
ttcatctacg gcattcctga cacccccaac caggttcctg ctcactggta caccgacatg 180
ggtttccgct acggccgtgc tggtggtgct cagcttggtg ctcctgctcg tggctggatt 240
tggggtattg atgaatacca gggccgtctg aactcgaccc tcagcaacta ccgcacctgc 300
cgtcagtacg gtgccgactt catcatcctc ccccacgaca tctggggtac cgaccacgcc 360
aacgacagca ccatctggcc tggtgacaac ggtgactgga ctgactacga caacttcatc 420
cgccgtctga tggccgatct caaggccaac aacgccttgg atggcctggt ctgggatgtc 480
tggaacgagc ctgacatctc catcttctgg actcgctctc agcagcagtg gattgatctc 540
tacatccgca cccacaagct cctccgccag gatcctgact tcgaccgcgt gcagatctct 600
ggccccaccc tagcgttccg tcccttcccc aacaacacct ggtggaccaa ctggttggat 660
cagattgctg gcaaccagac cattcccgat cagtacgcct accacctcga gggtgacccc 720
agcagccccg atgatgacct gcagaacacc aacgcctccc tggctgccat gctgcagacc 780
taccgcctcc cctctcgcca gatcaacatc aacgagtacg ccaccttcgc tgagcagatc 840
cccgccggtg ctgcctggtg gatctcccgt cttgagcgct acgaggccta cggcctgcgt 900
ggcaactggc agtccggcac catgctccac gacctcttcg ccaacctcct caccaagaag 960
tccgacccct ccaactacac tgccaccgac tacgtgtctg ctcctgaata ccccgtctac 1020
cgctactact accgcaacat gactggccag cgtgtgcaga ccactggatc cgaggaccgt 1080
ctgttggatg tctacgctac tgttgacaag gacaaggtcc gtatcctggc tggtgtccgt 1140
ctggccactg gtacctggca ggtcaccgtc aacagccttt ctgctgttgg attgccctcc 1200
gctggtaccc tcaacatcca gacctggggt ttcgatggtg actccgtctg ggaagaggtt 1260
gaccgccccg aggatcttgg tgtcactgct cacacctact ctggcgactc cgtcaccttc 1320
cccatctacc agaccgacaa ccacaccgcc tgggcgttcg agttcgatgt agct 1374
<210> 62
<211> 442
<212> PRT
<213> Rasamsonia emersonii
<400> 62
Ser Asn Ser Thr Gly Thr Ala Thr Val Asp Leu Asn Val Lys Arg Gly
1 5 10 15
Pro Pro Ser His Leu Ala Ser Gly Phe Ile Tyr Gly Ile Pro Asp Thr
20 25 30
Pro Asn Gln Val Pro Ala His Trp Tyr Thr Asp Met Gly Phe Arg Tyr
35 40 45
Gly Arg Ala Gly Gly Ala Gln Leu Gly Ala Pro Ala Arg Gly Trp Ile
50 55 60
Trp Gly Ile Asp Glu Tyr Gln Gly Arg Leu Asn Ser Thr Leu Ser Asn
65 70 75 80
Tyr Arg Thr Cys Arg Gln Tyr Gly Ala Asp Phe Ile Ile Leu Pro His
85 90 95
Asp Ile Trp Gly Thr Asp His Ala Asn Asp Ser Thr Ile Trp Pro Gly
100 105 110
Asp Asn Gly Asp Trp Thr Asp Tyr Asp Asn Phe Ile Arg Arg Leu Met
115 120 125
Ala Asp Leu Lys Ala Asn Asn Ala Leu Asp Gly Leu Val Trp Asp Val
130 135 140
Trp Asn Glu Pro Asp Ile Ser Ile Phe Trp Thr Arg Ser Gln Gln Gln
145 150 155 160
Trp Ile Asp Leu Tyr Ile Arg Thr His Lys Leu Leu Arg Gln Asp Pro
165 170 175
Asp Phe Asp Arg Val Gln Ile Ser Gly Pro Thr Leu Ala Phe Arg Pro
180 185 190
Phe Pro Asn Asn Thr Trp Trp Thr Asn Trp Leu Asp Gln Ile Ala Gly
195 200 205
Asn Gln Thr Ile Pro Asp Gln Tyr Ala Tyr His Leu Glu Gly Asp Pro
210 215 220
Ser Ser Pro Asp Asp Asp Leu Gln Asn Thr Asn Ala Ser Leu Ala Ala
225 230 235 240
Met Leu Gln Thr Tyr Arg Leu Pro Ser Arg Gln Ile Asn Ile Asn Glu
245 250 255
Tyr Ala Thr Phe Ala Glu Gln Ile Pro Ala Gly Ala Ala Trp Trp Ile
260 265 270
Ser Arg Leu Glu Arg Tyr Glu Ala Tyr Gly Leu Arg Gly Asn Trp Gln
275 280 285
Ser Gly Thr Met Leu His Asp Leu Phe Ala Asn Leu Leu Thr Lys Lys
290 295 300
Ser Asp Pro Ser Asn Tyr Thr Ala Thr Asp Tyr Val Ser Ala Pro Glu
305 310 315 320
Tyr Pro Val Tyr Arg Tyr Tyr Tyr Arg Asn Met Thr Gly Gln Arg Val
325 330 335
Gln Thr Thr Gly Ser Glu Asp Arg Leu Leu Asp Val Tyr Ala Thr Val
340 345 350
Asp Lys Asp Lys Val Arg Ile Leu Ala Gly Val Arg Leu Ala Thr Gly
355 360 365
Thr Trp Gln Val Thr Val Asn Ser Leu Ser Ala Val Gly Leu Pro Ser
370 375 380
Ala Gly Thr Leu Asn Ile Gln Thr Trp Gly Phe Asp Gly Asp Ser Val
385 390 395 400
Trp Glu Glu Val Asp Arg Pro Glu Asp Leu Gly Val Thr Ala His Thr
405 410 415
Tyr Ser Gly Asp Ser Val Thr Phe Pro Ile Tyr Gln Thr Asp Asn His
420 425 430
Thr Ala Trp Ala Phe Glu Phe Asp Val Ala
435 440
<210> 63
<211> 16
<212> PRT
<213> Rasamsonia emersonii
<400> 63
Met Lys Ser Leu Val Tyr Ala Leu Cys Phe Ala Ser Ala Val Ala Ala
1 5 10 15
<210> 64
<211> 1377
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1377)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 64
atgaaaagtc tggtctatgc cctgtgcttc gccagcgctg ttgctgctag caacagcaca 60
ggcacggcga cagtcgacct caatgtcaag cgtggcccgc cctctcacct cgcttcaggc 120
ttcatctacg gcatccccga tacccccaac caggtccccg cccactggta caccgacatg 180
ggcttccgat acggccgcgc aggcggtgcg cagctagggg cccccgcgcg aggctggatc 240
tggggcatcg acgagtacca gggccgtctc aactcgaccc tgtcgaatta ccgcacctgt 300
cgtcagtacg gcgccgactt tatcatcttg ccgcacgaca tctggggcac cgaccacgcc 360
aacgactcaa caatctggcc cggcgacaac ggcgactgga ccgactacga caacttcatc 420
cgccgactga tggccgacct gaaggcgaac aacgccctgg acggcctcgt ctgggatgtt 480
tggaacgagc ccgacatctc catcttctgg acgcgcagcc agcagcagtg gatcgatctg 540
tacatccgca cgcacaagct tctccggcag gaccccgact ttgaccgtgt tcagatctca 600
ggtcccaccc tggccttccg tcccttcccc aacaatacct ggtggacgaa ctggctggac 660
cagattgcag gtaaccagac tatcccggac cagtacgcct atcatctgga gggcgatcca 720
tcctcgccgg atgatgacct ccagaacacc aacgcgtccc tggcggcgat gctgcagacg 780
taccggcttc cgtcgcggca gatcaacatc aacgagtacg cgacattcgc agagcagatt 840
cccgcaggcg cggcatggtg gatctcccgg ctcgagcgct atgaggcgta cgggctgcgc 900
gggaactggc agagcggaac catgctgcat gatctttttg ctaatctcct gaccaagaag 960
tcggaccctt ccaactacac ggcgacagac tacgtatcgg cgccggagta cccggtgtac 1020
aggtactact accggaacat gacaggccag cgggtgcaga cgacgggctc cgaggatcgc 1080
ctgctggacg tgtatgccac tgtcgacaag gacaaggtgc gtatcttggc gggtgtgcgc 1140
ctggccactg gcacctggca agtcacggtc aattcactca gcgccgtggg cctacccagt 1200
gcggggacgt tgaacatcca gacctggggt tttgatggag actcggtgtg ggaggaggtc 1260
gaccgtccag aggatcttgg tgttaccgcg catacctaca gcggggattc ggtgacgttt 1320
ccaatctacc agacggacaa tcatacggcg tgggcatttg aattcgacgt tgcttga 1377
<210> 65
<211> 1377
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1377)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 65
atgaaaagtc tggtctatgc cctgtgcttc gccagcgctg ttgctgctag caacagcaca 60
ggcacggcga cagtcgacct caatgtcaag cgtggcccgc cctctcacct cgcttcaggc 120
ttcatctacg gcatccccga tacccccaac caggtccccg cccactggta caccgacatg 180
ggcttccgat acggccgcgc aggcggtgcg cagctagggg cccccgcgcg aggctggatc 240
tggggcatcg acgagtacca gggccgtctc aactcgaccc tgtcgaatta ccgcacctgt 300
cgtcagtacg gcgccgactt tatcatcttg ccgcacgaca tctggggcac cgaccacgcc 360
aacgactcaa caatctggcc cggcgacaac ggcgactgga ccgactacga caacttcatc 420
cgccgactga tggccgacct gaaggcgaac aacgccctgg acggcctcgt ctgggatgtt 480
tggaacgagc ccgacatctc catcttctgg acgcgcagcc agcagcagtg gatcgatctg 540
tacatccgca cgcacaagct tctccggcag gaccccgact ttgaccgtgt tcagatctca 600
ggtcccaccc tggccttccg tcccttcccc aacaatacct ggtggacgaa ctggctggac 660
cagattgcag gtaaccagac tatcccggac cagtacgcct atcatctgga gggcgatcca 720
tcctcgccgg atgatgacct ccagaacacc aacgcgtccc tggcggcgat gctgcagacg 780
taccggcttc cgtcgcggca gatcaacatc aacgagtacg cgacattcgc agagcagatt 840
cccgcaggcg cggcatggtg gatctcccgg ctcgagcgct atgaggcgta cgggctgcgc 900
gggaactggc agagcggaac catgctgcat gatctttttg ctaatctcct gaccaagaag 960
tcggaccctt ccaactacac ggcgacagac tacgtatcgg cgccggagta cccggtgtac 1020
aggtactact accggaacat gacaggccag cgggtgcaga cgacgggctc cgaggatcgc 1080
ctgctggacg tgtatgccac tgtcgacaag gacaaggtgc gtatcttggc gggtgtgcgc 1140
ctggccactg gcacctggca agtcacggtc aattcactca gcgccgtggg cctacccagt 1200
gcggggacgt tgaacatcca gacctggggt tttgatggag actcggtgtg ggaggaggtc 1260
gaccgtccag aggatcttgg tgttaccgcg catacctaca gcggggattc ggtgacgttt 1320
ccaatctacc agacggacaa tcatacggcg tgggcatttg aattcgacgt tgcttga 1377
<210> 66
<211> 1425
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1425)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 66
atgatctccc tgctggccct tgctgctgtt cccatccccg tcctctctgc tccctcccgc 60
ccccacgctc acatctccgt caacacccag actcgcttcc agcaggttga cggcttcggt 120
ttcagcgaag cgttccagcg tgctgaggat atctacggca aggacggtct ttctcctgag 180
aaccgtaccc gtgtcctcga cctcctcttc tccgacaccc acggtgctgg tctgaccatt 240
gtccgcaacg gcattggcag cagcaacagc agcatcaagg acttcatgaa ctccattgag 300
cccttctccc ccggctcccc ctctgctcct cctcactacg tgtgggaccg caacgactct 360
ggccaggtct ggctatccca cgaagccgcc tcctacggtg tcaacacctt ctacgccgat 420
gcctggtccg ctcctggata catgaaaacc aacgatgatg actccaacgg tggatacctc 480
tgcggtgtca ccaacacttc ttgcgcttcc ggtgactgga agcaggccta cgccaactac 540
cttgttcagt acgtgcgctt ctaccagcag gtcggtatca aggtcaccca cctcggattc 600
ctgaacgagc cccaggaaga tgtcacctac gcctccatgc tctccgacgg cacccaggct 660
gccgacttca tcaaggtcct tgcccccacc gtcaaggccg ccggtctgga tgtcaagctc 720
acctgctgcg atggtgttgg ctgggaggag cagcgtgcca tgcttcctgg tctgcaggct 780
ggtggtcccg agcactccgc tgagagctac ctgtccgtca tcactgctca cggatacaac 840
agccctccca ccactcctct cgagacttct ctgcccgtgt ggatgactga atgggcggat 900
ctcaacggca actacactgc tgcctggtac gagaacggcg ctgctggtga aggcttgacc 960
tgggccaacc gtatccagga tgccttcacc cgctccaacg tgtctgcttt cctgcactgg 1020
attggtgctg agaacggcac cagcaactcg cctctgatca acctcaacgg tgacagctac 1080
gtggccacca agcgtctgtg ggcgttcggc cagttctccc gcttcgtccg tcccggtgcc 1140
gtccgtatcg atgccgtttc ctccgactct ttagtgaccg tttccgcttt ccagaacaag 1200
gacaacggtg ttgttgccac tcaggccatc aacaacgccg acaccgacta cgaggttgag 1260
gttgagttga ctggctacgg tcctgtctcc gtcatccagc cctacctcac caacaacgag 1320
aacgacctcg aggcctccaa gcccatcatt gctctcgccg tcggtgctgc caccaagttc 1380
acctccatcg tccccgcccg ctctcttgtc tccttcgtat ctaag 1425
<210> 67
<211> 459
<212> PRT
<213> Rasamsonia emersonii
<400> 67
Ala Pro Ser Arg Pro His Ala His Ile Ser Val Asn Thr Gln Thr Arg
1 5 10 15
Phe Gln Gln Val Asp Gly Phe Gly Phe Ser Glu Ala Phe Gln Arg Ala
20 25 30
Glu Asp Ile Tyr Gly Lys Asp Gly Leu Ser Pro Glu Asn Arg Thr Arg
35 40 45
Val Leu Asp Leu Leu Phe Ser Asp Thr His Gly Ala Gly Leu Thr Ile
50 55 60
Val Arg Asn Gly Ile Gly Ser Ser Asn Ser Ser Ile Lys Asp Phe Met
65 70 75 80
Asn Ser Ile Glu Pro Phe Ser Pro Gly Ser Pro Ser Ala Pro Pro His
85 90 95
Tyr Val Trp Asp Arg Asn Asp Ser Gly Gln Val Trp Leu Ser His Glu
100 105 110
Ala Ala Ser Tyr Gly Val Asn Thr Phe Tyr Ala Asp Ala Trp Ser Ala
115 120 125
Pro Gly Tyr Met Lys Thr Asn Asp Asp Asp Ser Asn Gly Gly Tyr Leu
130 135 140
Cys Gly Val Thr Asn Thr Ser Cys Ala Ser Gly Asp Trp Lys Gln Ala
145 150 155 160
Tyr Ala Asn Tyr Leu Val Gln Tyr Val Arg Phe Tyr Gln Gln Val Gly
165 170 175
Ile Lys Val Thr His Leu Gly Phe Leu Asn Glu Pro Gln Glu Asp Val
180 185 190
Thr Tyr Ala Ser Met Leu Ser Asp Gly Thr Gln Ala Ala Asp Phe Ile
195 200 205
Lys Val Leu Ala Pro Thr Val Lys Ala Ala Gly Leu Asp Val Lys Leu
210 215 220
Thr Cys Cys Asp Gly Val Gly Trp Glu Glu Gln Arg Ala Met Leu Pro
225 230 235 240
Gly Leu Gln Ala Gly Gly Pro Glu His Ser Ala Glu Ser Tyr Leu Ser
245 250 255
Val Ile Thr Ala His Gly Tyr Asn Ser Pro Pro Thr Thr Pro Leu Glu
260 265 270
Thr Ser Leu Pro Val Trp Met Thr Glu Trp Ala Asp Leu Asn Gly Asn
275 280 285
Tyr Thr Ala Ala Trp Tyr Glu Asn Gly Ala Ala Gly Glu Gly Leu Thr
290 295 300
Trp Ala Asn Arg Ile Gln Asp Ala Phe Thr Arg Ser Asn Val Ser Ala
305 310 315 320
Phe Leu His Trp Ile Gly Ala Glu Asn Gly Thr Ser Asn Ser Pro Leu
325 330 335
Ile Asn Leu Asn Gly Asp Ser Tyr Val Ala Thr Lys Arg Leu Trp Ala
340 345 350
Phe Gly Gln Phe Ser Arg Phe Val Arg Pro Gly Ala Val Arg Ile Asp
355 360 365
Ala Val Ser Ser Asp Ser Leu Val Thr Val Ser Ala Phe Gln Asn Lys
370 375 380
Asp Asn Gly Val Val Ala Thr Gln Ala Ile Asn Asn Ala Asp Thr Asp
385 390 395 400
Tyr Glu Val Glu Val Glu Leu Thr Gly Tyr Gly Pro Val Ser Val Ile
405 410 415
Gln Pro Tyr Leu Thr Asn Asn Glu Asn Asp Leu Glu Ala Ser Lys Pro
420 425 430
Ile Ile Ala Leu Ala Val Gly Ala Ala Thr Lys Phe Thr Ser Ile Val
435 440 445
Pro Ala Arg Ser Leu Val Ser Phe Val Ser Lys
450 455
<210> 68
<211> 16
<212> PRT
<213> Rasamsonia emersonii
<400> 68
Met Ile Ser Leu Leu Ala Leu Ala Ala Val Pro Ile Pro Val Leu Ser
1 5 10 15
<210> 69
<211> 1428
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1428)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 69
atgatctctc tcctcgcgtt ggccgctgtg ccaattcctg tcctgtccgc cccgtctaga 60
cctcacgccc acatctccgt caatacacaa acccgcttcc agcaggtcga cggattcggc 120
ttctccgagg ccttccagcg cgcagaggac atctacggca aggatggctt gtcgcccgag 180
aaccgcacca gagtgctcga tctcctgttc agcgacaccc atggcgccgg cctgaccatc 240
gtccgcaatg gcatcggctc cagcaatagc tccatcaagg acttcatgaa ctccatcgag 300
cccttcagtc ccggctcgcc gtctgcgccg ccgcactacg tctgggaccg caacgacagc 360
ggccaggtgt ggctgtccca cgaagcggcc tcgtatggcg tcaacacgtt ctatgccgac 420
gcctggtctg ctcccggtta catgaagacc aacgacgacg actccaacgg cgggtacctg 480
tgcggcgtga ccaacacgtc ctgcgcctcc ggggactgga agcaggccta cgccaactac 540
ctcgtccagt acgtccggtt ctaccaacag gtcggcatca aggtcaccca cctgggtttc 600
ctgaacgagc cccaggaaga cgtcacctat gccagcatgc tgtcggacgg cacccaggcg 660
gccgacttca tcaaagttct agcacccacc gtcaaggcgg caggactcga cgtcaagctc 720
acctgctgcg acggcgtcgg gtgggaggag cagcgagcga tgctgccggg cctccaggct 780
ggaggtcccg agcacagcgc ggaaagctat ctgtctgtga tcaccgccca tggctacaac 840
tccccgccca caacgcctct tgagacctcg ttgccagtgt ggatgaccga gtgggccgat 900
ctgaatggga actatacggc cgcctggtac gagaacggcg ccgccggcga gggtctgacc 960
tgggcgaacc gcatccaaga cgccttcacg cggagcaacg tcagcgcctt tctgcactgg 1020
atcggagcgg agaatggcac gagcaacagc cctctcatca acctgaacgg cgattcgtat 1080
gtcgcgacca agcggctgtg ggcgttcggc cagttcagtc gattcgtccg gccgggtgcc 1140
gtccgcatcg acgcggtcag ttcggactcc ttggtcacgg tgagcgcgtt ccagaacaag 1200
gataacggcg tggtggccac gcaggccatc aacaatgccg acacagacta tgaggtcgag 1260
gtggagttga cgggttatgg acccgtgtcc gttatccagc cgtatctgac gaacaatgaa 1320
aacgacctgg aagcctccaa gccgatcatc gcgcttgctg ttggggcagc aaccaagttc 1380
acgagtatcg ttccggcgag gtccttggtt agtttcgtaa gtaaatag 1428
<210> 70
<211> 1428
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1428)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 70
atgatctctc tcctcgcgtt ggccgctgtg ccaattcctg tcctgtccgc cccgtctaga 60
cctcacgccc acatctccgt caatacacaa acccgcttcc agcaggtcga cggattcggc 120
ttctccgagg ccttccagcg cgcagaggac atctacggca aggatggctt gtcgcccgag 180
aaccgcacca gagtgctcga tctcctgttc agcgacaccc atggcgccgg cctgaccatc 240
gtccgcaatg gcatcggctc cagcaatagc tccatcaagg acttcatgaa ctccatcgag 300
cccttcagtc ccggctcgcc gtctgcgccg ccgcactacg tctgggaccg caacgacagc 360
ggccaggtgt ggctgtccca cgaagcggcc tcgtatggcg tcaacacgtt ctatgccgac 420
gcctggtctg ctcccggtta catgaagacc aacgacgacg actccaacgg cgggtacctg 480
tgcggcgtga ccaacacgtc ctgcgcctcc ggggactgga agcaggccta cgccaactac 540
ctcgtccagt acgtccggtt ctaccaacag gtcggcatca aggtcaccca cctgggtttc 600
ctgaacgagc cccaggaaga cgtcacctat gccagcatgc tgtcggacgg cacccaggcg 660
gccgacttca tcaaagttct agcacccacc gtcaaggcgg caggactcga cgtcaagctc 720
acctgctgcg acggcgtcgg gtgggaggag cagcgagcga tgctgccggg cctccaggct 780
ggaggtcccg agcacagcgc ggaaagctat ctgtctgtga tcaccgccca tggctacaac 840
tccccgccca caacgcctct tgagacctcg ttgccagtgt ggatgaccga gtgggccgat 900
ctgaatggga actatacggc cgcctggtac gagaacggcg ccgccggcga gggtctgacc 960
tgggcgaacc gcatccaaga cgccttcacg cggagcaacg tcagcgcctt tctgcactgg 1020
atcggagcgg agaatggcac gagcaacagc cctctcatca acctgaacgg cgattcgtat 1080
gtcgcgacca agcggctgtg ggcgttcggc cagttcagtc gattcgtccg gccgggtgcc 1140
gtccgcatcg acgcggtcag ttcggactcc ttggtcacgg tgagcgcgtt ccagaacaag 1200
gataacggcg tggtggccac gcaggccatc aacaatgccg acacagacta tgaggtcgag 1260
gtggagttga cgggttatgg acccgtgtcc gttatccagc cgtatctgac gaacaatgaa 1320
aacgacctgg aagcctccaa gccgatcatc gcgcttgctg ttggggcagc aaccaagttc 1380
acgagtatcg ttccggcgag gtccttggtt agtttcgtaa gtaaatag 1428
<210> 71
<211> 3036
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(3036)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 71
atgatcctga gctctctcct cgtcggctgc gtatctctct ggggtgctgc ccacgccctt 60
ggccagcagc ccgttgttgc cttcacctcc tcccccggat acctcaagct ggctggcccc 120
ggtactcctc ccggtaccgt tgtcctcgac tctgccgact ggcccgctgt cctgcgtgct 180
gccggtgatc ttgctgtcga cttcggtcgt gtcaccggca ccaacctgac caagactgtc 240
atcaacggta ccaccaccag ctccggtctt gctgctgttt ccaacaaggg ccccgtcatc 300
attgctggta ccattggtaa cagcagcttg atcaacgccc ttgcccagtc cggcaagatc 360
gatgtctccg ccactgaggg ccgctgggag gctttccaga ccgagattgt ggacaacccc 420
ttcccaggga tatctcgtgc tctggtcgtt tccggctccg accgtcgtgg aactgtctac 480
ggcttgtacg acatctccga gcagatcggt gtctccccct ggtactggtt cgccgatgtt 540
cctcctgctc agcacgagga gatctacgcc ctggacacca agaagatcca gggttccccc 600
tccgtcaagt accgtggtct gttcatcaac gacgaggctc ccgccctcac caactggatc 660
aacgtcaact accctccttg caagtacggt cctggcttca acgccgactt ctacgcccac 720
gttttcgagc tcttgctgcg cctccgtgcc aactacctct ggcctgctga atggagcaac 780
atcttcgccc ttgacgaccc ccgcaacttc cctactgccg atctctacgg cattgtcatt 840
ggcacctccc acaccgagcc cttgatgcgc tggaccctgg aacaatcgct actactccag 900
ggcccttgga actggctgac caacgagaag aacatctacc agttcctcaa ggaaggtgtt 960
gagcgctcca agaactacga agtcatctac accatgggta tgcgtggtct tggtgacact 1020
gcctccccca ccatcaacgc caccactctg gctcagatcg tcgctgctga ggagcagatc 1080
ctctccgagg tgttcaacac caccaacatc tcctggatcc cccagatgtg gtgcctctac 1140
aaggaagtcg gtggttacta cgaggatggt ctgcgtgttg ccgatgacat cactctcctc 1200
tgggctgatg acaactgggg taacattgag agacttccca tcggtaacga gactgctcgc 1260
tccggtggtg ctggtgtcta ctaccacttc gactacgtcg gtgaccccca ggactacaag 1320
tggatcaaca ccatctccct ccagaaaacc tgggagcaga tgcacctggc ctacgagcgt 1380
caggctcgca acatctggat tgtcaacgtt ggtgacctga aggcccttga gatccccacc 1440
aaccacttct tcgaccttgc ctacgacacc cccagctggt cagatcccga cagcacctcc 1500
cgctggctca agctctgggc tactcgtgag ttcggtgctg ctggtgccga caaggtcgcc 1560
gatatcgtca accgctacgg ccagtacgct gcccgtcgca agttcgagat gatcaccccc 1620
tccaccttct ccatcatcaa ctacaacgag gccaacaacg tcgtgtctca gtgggaatct 1680
ctggtcaacg acgcccgtga tgtctaccgt ggcctgtccg aggctgctcg tcccgccttc 1740
ttcgagctgg tcctccagcc ctgcatggct ggtcacatca tcacccagat ccacgtcact 1800
gctgccaaga acaacctgta cgcctcccag cgccgcactt ccgccaaggc catggccgat 1860
aaggccctga agcttttcaa ggaagatcac gacctcaccg tgagctacca caagattctt 1920
gacggcaagt ggaaccacat catggaccag acccacctgg gctacctcta ctggcagcag 1980
cccatgcgca acaccctccc tcccctccag tacacccagc tgttggaaga ttcgctagcg 2040
ggacctatgg gtgtttccgt tgagggcagc aacgcctccg ttcccggtga tgaccagtac 2100
cacgctctct ccagcaccac cttgactctt cctcccattg acccctacgg cccttctact 2160
cgttggattg agatctactc tcgctcgacc gagtccttcg agttccagat atctcccaat 2220
gtcagctggg tgaccgccac tcccagctct ggcactgtcc acgtttctgg caacggcacc 2280
accaccgatg ttcgcgttca gctctccgtt gactgggaca aggctcccat tggaagctct 2340
ctcgtcagca tcaacgtttc catccccact ggccacttcc ccaccggtga ttacggtaac 2400
tccgccatgc ccgtcgtcca gctccccgtc aacaagactg ttgttcctgc ttctttccac 2460
ggtttcgtgg aatcggatgg tgtcgtttct atcgaagctc ctcacgccac ccgcaacacc 2520
agcactgcca acgtcagcta cgccgtcatc cccggctacg gccgcaccct gtccggtgtc 2580
accctcctgc ctgtcaacgc cccctcccag aaggctcctt cttcccctcg tctggagtac 2640
gacatgtacc tcttctctcc cgccgccaac ggatcgaccg tcaacatcac cctctacctc 2700
ggtccctccc tgaacgtcaa ccccgaccgc cctctccgtt acgctcttgc tttcgatgac 2760
gatgacaacc cccaggttgt ccagtacgtg cccagcaccg tcctcggcac ctacccacct 2820
gactggccct ctgctgtctc caacaatgtg tgggcctcca ccacctccta caccatcaag 2880
ggtttcaacg gcaactccac ttctgccact ggcaccggtt ccgctcacac tctcaagctg 2940
tgggctctgg agcccggtgt tgttttcgag aagatcgtca ttgaccttgg tggtcagcgt 3000
gacagctacc ttggtcctcc tgagtccagg atagta 3036
<210> 72
<211> 991
<212> PRT
<213> Rasamsonia emersonii
<400> 72
Gln Gln Pro Val Val Ala Phe Thr Ser Ser Pro Gly Tyr Leu Lys Leu
1 5 10 15
Ala Gly Pro Gly Thr Pro Pro Gly Thr Val Val Leu Asp Ser Ala Asp
20 25 30
Trp Pro Ala Val Leu Arg Ala Ala Gly Asp Leu Ala Val Asp Phe Gly
35 40 45
Arg Val Thr Gly Thr Asn Leu Thr Lys Thr Val Ile Asn Gly Thr Thr
50 55 60
Thr Ser Ser Gly Leu Ala Ala Val Ser Asn Lys Gly Pro Val Ile Ile
65 70 75 80
Ala Gly Thr Ile Gly Asn Ser Ser Leu Ile Asn Ala Leu Ala Gln Ser
85 90 95
Gly Lys Ile Asp Val Ser Ala Thr Glu Gly Arg Trp Glu Ala Phe Gln
100 105 110
Thr Glu Ile Val Asp Asn Pro Phe Pro Gly Ile Ser Arg Ala Leu Val
115 120 125
Val Ser Gly Ser Asp Arg Arg Gly Thr Val Tyr Gly Leu Tyr Asp Ile
130 135 140
Ser Glu Gln Ile Gly Val Ser Pro Trp Tyr Trp Phe Ala Asp Val Pro
145 150 155 160
Pro Ala Gln His Glu Glu Ile Tyr Ala Leu Asp Thr Lys Lys Ile Gln
165 170 175
Gly Ser Pro Ser Val Lys Tyr Arg Gly Leu Phe Ile Asn Asp Glu Ala
180 185 190
Pro Ala Leu Thr Asn Trp Ile Asn Val Asn Tyr Pro Pro Cys Lys Tyr
195 200 205
Gly Pro Gly Phe Asn Ala Asp Phe Tyr Ala His Val Phe Glu Leu Leu
210 215 220
Leu Arg Leu Arg Ala Asn Tyr Leu Trp Pro Ala Glu Trp Ser Asn Ile
225 230 235 240
Phe Ala Leu Asp Asp Pro Arg Asn Phe Pro Thr Ala Asp Leu Tyr Gly
245 250 255
Ile Val Ile Gly Thr Ser His Thr Glu Pro Leu Met Arg Trp Thr Leu
260 265 270
Glu Gln Ser Leu Leu Leu Gln Gly Pro Trp Asn Trp Leu Thr Asn Glu
275 280 285
Lys Asn Ile Tyr Gln Phe Leu Lys Glu Gly Val Glu Arg Ser Lys Asn
290 295 300
Tyr Glu Val Ile Tyr Thr Met Gly Met Arg Gly Leu Gly Asp Thr Ala
305 310 315 320
Ser Pro Thr Ile Asn Ala Thr Thr Leu Ala Gln Ile Val Ala Ala Glu
325 330 335
Glu Gln Ile Leu Ser Glu Val Phe Asn Thr Thr Asn Ile Ser Trp Ile
340 345 350
Pro Gln Met Trp Cys Leu Tyr Lys Glu Val Gly Gly Tyr Tyr Glu Asp
355 360 365
Gly Leu Arg Val Ala Asp Asp Ile Thr Leu Leu Trp Ala Asp Asp Asn
370 375 380
Trp Gly Asn Ile Glu Arg Leu Pro Ile Gly Asn Glu Thr Ala Arg Ser
385 390 395 400
Gly Gly Ala Gly Val Tyr Tyr His Phe Asp Tyr Val Gly Asp Pro Gln
405 410 415
Asp Tyr Lys Trp Ile Asn Thr Ile Ser Leu Gln Lys Thr Trp Glu Gln
420 425 430
Met His Leu Ala Tyr Glu Arg Gln Ala Arg Asn Ile Trp Ile Val Asn
435 440 445
Val Gly Asp Leu Lys Ala Leu Glu Ile Pro Thr Asn His Phe Phe Asp
450 455 460
Leu Ala Tyr Asp Thr Pro Ser Trp Ser Asp Pro Asp Ser Thr Ser Arg
465 470 475 480
Trp Leu Lys Leu Trp Ala Thr Arg Glu Phe Gly Ala Ala Gly Ala Asp
485 490 495
Lys Val Ala Asp Ile Val Asn Arg Tyr Gly Gln Tyr Ala Ala Arg Arg
500 505 510
Lys Phe Glu Met Ile Thr Pro Ser Thr Phe Ser Ile Ile Asn Tyr Asn
515 520 525
Glu Ala Asn Asn Val Val Ser Gln Trp Glu Ser Leu Val Asn Asp Ala
530 535 540
Arg Asp Val Tyr Arg Gly Leu Ser Glu Ala Ala Arg Pro Ala Phe Phe
545 550 555 560
Glu Leu Val Leu Gln Pro Cys Met Ala Gly His Ile Ile Thr Gln Ile
565 570 575
His Val Thr Ala Ala Lys Asn Asn Leu Tyr Ala Ser Gln Arg Arg Thr
580 585 590
Ser Ala Lys Ala Met Ala Asp Lys Ala Leu Lys Leu Phe Lys Glu Asp
595 600 605
His Asp Leu Thr Val Ser Tyr His Lys Ile Leu Asp Gly Lys Trp Asn
610 615 620
His Ile Met Asp Gln Thr His Leu Gly Tyr Leu Tyr Trp Gln Gln Pro
625 630 635 640
Met Arg Asn Thr Leu Pro Pro Leu Gln Tyr Thr Gln Leu Leu Glu Asp
645 650 655
Ser Leu Ala Gly Pro Met Gly Val Ser Val Glu Gly Ser Asn Ala Ser
660 665 670
Val Pro Gly Asp Asp Gln Tyr His Ala Leu Ser Ser Thr Thr Leu Thr
675 680 685
Leu Pro Pro Ile Asp Pro Tyr Gly Pro Ser Thr Arg Trp Ile Glu Ile
690 695 700
Tyr Ser Arg Ser Thr Glu Ser Phe Glu Phe Gln Ile Ser Pro Asn Val
705 710 715 720
Ser Trp Val Thr Ala Thr Pro Ser Ser Gly Thr Val His Val Ser Gly
725 730 735
Asn Gly Thr Thr Thr Asp Val Arg Val Gln Leu Ser Val Asp Trp Asp
740 745 750
Lys Ala Pro Ile Gly Ser Ser Leu Val Ser Ile Asn Val Ser Ile Pro
755 760 765
Thr Gly His Phe Pro Thr Gly Asp Tyr Gly Asn Ser Ala Met Pro Val
770 775 780
Val Gln Leu Pro Val Asn Lys Thr Val Val Pro Ala Ser Phe His Gly
785 790 795 800
Phe Val Glu Ser Asp Gly Val Val Ser Ile Glu Ala Pro His Ala Thr
805 810 815
Arg Asn Thr Ser Thr Ala Asn Val Ser Tyr Ala Val Ile Pro Gly Tyr
820 825 830
Gly Arg Thr Leu Ser Gly Val Thr Leu Leu Pro Val Asn Ala Pro Ser
835 840 845
Gln Lys Ala Pro Ser Ser Pro Arg Leu Glu Tyr Asp Met Tyr Leu Phe
850 855 860
Ser Pro Ala Ala Asn Gly Ser Thr Val Asn Ile Thr Leu Tyr Leu Gly
865 870 875 880
Pro Ser Leu Asn Val Asn Pro Asp Arg Pro Leu Arg Tyr Ala Leu Ala
885 890 895
Phe Asp Asp Asp Asp Asn Pro Gln Val Val Gln Tyr Val Pro Ser Thr
900 905 910
Val Leu Gly Thr Tyr Pro Pro Asp Trp Pro Ser Ala Val Ser Asn Asn
915 920 925
Val Trp Ala Ser Thr Thr Ser Tyr Thr Ile Lys Gly Phe Asn Gly Asn
930 935 940
Ser Thr Ser Ala Thr Gly Thr Gly Ser Ala His Thr Leu Lys Leu Trp
945 950 955 960
Ala Leu Glu Pro Gly Val Val Phe Glu Lys Ile Val Ile Asp Leu Gly
965 970 975
Gly Gln Arg Asp Ser Tyr Leu Gly Pro Pro Glu Ser Arg Ile Val
980 985 990
<210> 73
<211> 21
<212> PRT
<213> Rasamsonia emersonii
<400> 73
Met Ile Leu Ser Ser Leu Leu Val Gly Cys Val Ser Leu Trp Gly Ala
1 5 10 15
Ala His Ala Leu Gly
20
<210> 74
<211> 3152
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(3152)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 74
atgatcctct ccagtctcct tgtggggtgc gtctccctat ggggagcagc acatgccctt 60
ggacaacagc ctgtcgtcgc cttcacctcc agtccaggat atctgaagct tgcaggccca 120
ggaactcccc ctggaacggt tgttctcgat tcagccgact ggccggcagt cttgagagca 180
gccggtgacc ttgccgtgga ctttgggcgt gttactggaa cgaacctgac caaaacggtg 240
atcaatggca ccacaacgtc gtctgggcta gcagcagtat caaacaaggg ccccgtgatt 300
atcgccggca ccattggcaa ctccagtctc atcaatgctt tggcgcagtc cggcaagatc 360
gacgtctccg cgacagaggg cagatgggag gccttccaga ccgaaatcgt ggacaatcct 420
ttcccgggga tatcgcgggc gttggtcgtc agtggcagcg acaggcgtgg cactgtctac 480
gggctgtacg acatctcaga gcagatcggg gtctcgccgt ggtactggtt cgccgacgtg 540
ccgcccgctc agcacgagga gatatacgct ttggacacga agaaaatcca gggctcgccg 600
tcggtcaaat accgcggatt gttcatcaac gacgaggcac ctgccttgac aaactggatc 660
aatgtgaact acccaccctg caagtatggg cctgggttca acgccgactt ctacgcacac 720
gtgttcgaac tcctcctgag gctgagagcc aactacctgt ggccggcaga atggagcaac 780
atcttcgctc tggacgatcc gcgcaatttc cccacagcag acctgtacgg gattgtgatt 840
ggaaccagcc acacagagcc cctgatgcga tggactctgg agcagagctt gcttctccag 900
ggcccgtgga attggcttac gaacgagaaa aacatctacc agttcctgaa agaaggcgtc 960
gagaggtcca agaattacga ggtcatatat actatgggca tgagaggtct cggcgacacg 1020
gcatcgccca cgatcaacgc cacaactctg gcgcaaatcg tcgccgcgga ggagcagatc 1080
ctctccgagg ttttcaacac gacgaacatc tcttggatcc cgcagatgtg gtgtctctac 1140
aaggaagtgg gcggctacta cgaagacggg ctccgtgtgg cggacgatat cacgctcctc 1200
tgggcagacg acaactgggg gaacatcgag agactgccga ttggcaatga gactgcacgg 1260
tctggcggtg ctggcgtcta ttatcacttt gactacgtcg gggaccccca agactacaag 1320
tggatcaaca ctatttcatt gcagaaaacc tgggagcaga tgcatctcgc atacgagcgg 1380
caggcaagga atatttggat cgtgaatgtt ggcgacttga aagcattggt tagcaagcct 1440
cttccgtggg aatatccgtc atatattgac aagatgacta ggaaatcccg actaaccact 1500
tcttcgactt ggcctacgat acacccagct ggtccgatcc ggacagcacc agccggtggc 1560
tcaagctctg ggccactcgt gaattcgggg cagcgggggc cgacaaagtc gcagacatcg 1620
taaaccgcta cggccagtac gcagctagac gcaaattcga gatgatcacc ccgagcacgt 1680
tcagcatcat caactacaac gaggctaaca acgtggtgag tcaatgggag agtctggtca 1740
acgatgcccg tgatgtgtac cgcggactca gcgaagctgc ccggccggcg ttcttcgagc 1800
tggtattgca accttgcatg gctggccaca tcatcactca gatccatgtt acggccgcca 1860
agaataatct ctatgcgtcc cagagacgga caagcgcgaa ggcaatggca gacaaggcgt 1920
tgaaactgtt caaagaggac cacgacttga cggtttccta tcacaagatt cttgatggaa 1980
aatggaacca tatcatggac cagacgcatc tgggttacct ttactggtga gtattttttt 2040
ttactaataa ccttgaccga ggttttgctg aaacggattc gtataggcag cagccgatga 2100
gaaacacact cccccctctc caatacactc agctgttaga ggacagtttg gcgggtccaa 2160
tgggtgtttc tgtcgagggc agcaatgcct ctgtccctgg cgacgatcaa taccacgctt 2220
tgtcgagtac caccctgacc ctgccaccca tagatcccta cggaccgtcg acgcgctgga 2280
tcgagatcta ctctcgctca actgaaagct tcgagttcca aatctccccc aacgtctcct 2340
gggtcaccgc gacaccgtcc tccggcaccg tccatgttag tggaaacgga acgaccaccg 2400
acgtccgcgt gcagctgtcc gtcgactggg acaaggctcc tatcggctcg agcctcgtct 2460
cgatcaacgt cagcatccca accggccact tcccgacggg ggactacggg aactcggcca 2520
tgccggttgt ccagctcccc gtgaacaaga cggtcgtgcc agcgtccttc cacggcttcg 2580
tcgagtcgga cggcgtcgtc agcatcgagg cgccgcacgc aacgcgcaac acctcgacgg 2640
cgaacgtctc ctacgccgtg atcccggggt acggacgcac actgtcgggc gtcaccttgc 2700
tgccggtgaa cgcgccgtca cagaaagcgc cttcctcccc gcgtctcgag tacgacatgt 2760
acctcttcag ccctgcggcc aacggcagca ccgtcaacat aacgctgtac ctgggaccgt 2820
cactcaacgt caaccctgac cgaccgctgc gatacgcgct ggccttcgac gacgacgaca 2880
atccccaggt agtgcagtac gtcccgagca cggtgctggg cacctaccca ccggactggc 2940
cctcggccgt gtccaacaac gtgtgggcgt cgacgacgtc gtatacaatc aagggcttta 3000
acggaaacag cactagtgca acaggaacgg gatccgcgca cacgctcaag ctgtgggctc 3060
ttgagcctgg cgtggtgttt gagaagattg tcattgatct gggcgggcag agggatagtt 3120
atctcggtcc gccggagagt cggattgtgt ag 3152
<210> 75
<211> 3039
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(3039)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 75
atgatcctct ccagtctcct tgtggggtgc gtctccctat ggggagcagc acatgccctt 60
ggacaacagc ctgtcgtcgc cttcacctcc agtccaggat atctgaagct tgcaggccca 120
ggaactcccc ctggaacggt tgttctcgat tcagccgact ggccggcagt cttgagagca 180
gccggtgacc ttgccgtgga ctttgggcgt gttactggaa cgaacctgac caaaacggtg 240
atcaatggca ccacaacgtc gtctgggcta gcagcagtat caaacaaggg ccccgtgatt 300
atcgccggca ccattggcaa ctccagtctc atcaatgctt tggcgcagtc cggcaagatc 360
gacgtctccg cgacagaggg cagatgggag gccttccaga ccgaaatcgt ggacaatcct 420
ttcccgggga tatcgcgggc gttggtcgtc agtggcagcg acaggcgtgg cactgtctac 480
gggctgtacg acatctcaga gcagatcggg gtctcgccgt ggtactggtt cgccgacgtg 540
ccgcccgctc agcacgagga gatatacgct ttggacacga agaaaatcca gggctcgccg 600
tcggtcaaat accgcggatt gttcatcaac gacgaggcac ctgccttgac aaactggatc 660
aatgtgaact acccaccctg caagtatggg cctgggttca acgccgactt ctacgcacac 720
gtgttcgaac tcctcctgag gctgagagcc aactacctgt ggccggcaga atggagcaac 780
atcttcgctc tggacgatcc gcgcaatttc cccacagcag acctgtacgg gattgtgatt 840
ggaaccagcc acacagagcc cctgatgcga tggactctgg agcagagctt gcttctccag 900
ggcccgtgga attggcttac gaacgagaaa aacatctacc agttcctgaa agaaggcgtc 960
gagaggtcca agaattacga ggtcatatat actatgggca tgagaggtct cggcgacacg 1020
gcatcgccca cgatcaacgc cacaactctg gcgcaaatcg tcgccgcgga ggagcagatc 1080
ctctccgagg ttttcaacac gacgaacatc tcttggatcc cgcagatgtg gtgtctctac 1140
aaggaagtgg gcggctacta cgaagacggg ctccgtgtgg cggacgatat cacgctcctc 1200
tgggcagacg acaactgggg gaacatcgag agactgccga ttggcaatga gactgcacgg 1260
tctggcggtg ctggcgtcta ttatcacttt gactacgtcg gggaccccca agactacaag 1320
tggatcaaca ctatttcatt gcagaaaacc tgggagcaga tgcatctcgc atacgagcgg 1380
caggcaagga atatttggat cgtgaatgtt ggcgacttga aagcattgga aatcccgact 1440
aaccacttct tcgacttggc ctacgataca cccagctggt ccgatccgga cagcaccagc 1500
cggtggctca agctctgggc cactcgtgaa ttcggggcag cgggggccga caaagtcgca 1560
gacatcgtaa accgctacgg ccagtacgca gctagacgca aattcgagat gatcaccccg 1620
agcacgttca gcatcatcaa ctacaacgag gctaacaacg tggtgagtca atgggagagt 1680
ctggtcaacg atgcccgtga tgtgtaccgc ggactcagcg aagctgcccg gccggcgttc 1740
ttcgagctgg tattgcaacc ttgcatggct ggccacatca tcactcagat ccatgttacg 1800
gccgccaaga ataatctcta tgcgtcccag agacggacaa gcgcgaaggc aatggcagac 1860
aaggcgttga aactgttcaa agaggaccac gacttgacgg tttcctatca caagattctt 1920
gatggaaaat ggaaccatat catggaccag acgcatctgg gttaccttta ctggcagcag 1980
ccgatgagaa acacactccc ccctctccaa tacactcagc tgttagagga cagtttggcg 2040
ggtccaatgg gtgtttctgt cgagggcagc aatgcctctg tccctggcga cgatcaatac 2100
cacgctttgt cgagtaccac cctgaccctg ccacccatag atccctacgg accgtcgacg 2160
cgctggatcg agatctactc tcgctcaact gaaagcttcg agttccaaat ctcccccaac 2220
gtctcctggg tcaccgcgac accgtcctcc ggcaccgtcc atgttagtgg aaacggaacg 2280
accaccgacg tccgcgtgca gctgtccgtc gactgggaca aggctcctat cggctcgagc 2340
ctcgtctcga tcaacgtcag catcccaacc ggccacttcc cgacggggga ctacgggaac 2400
tcggccatgc cggttgtcca gctccccgtg aacaagacgg tcgtgccagc gtccttccac 2460
ggcttcgtcg agtcggacgg cgtcgtcagc atcgaggcgc cgcacgcaac gcgcaacacc 2520
tcgacggcga acgtctccta cgccgtgatc ccggggtacg gacgcacact gtcgggcgtc 2580
accttgctgc cggtgaacgc gccgtcacag aaagcgcctt cctccccgcg tctcgagtac 2640
gacatgtacc tcttcagccc tgcggccaac ggcagcaccg tcaacataac gctgtacctg 2700
ggaccgtcac tcaacgtcaa ccctgaccga ccgctgcgat acgcgctggc cttcgacgac 2760
gacgacaatc cccaggtagt gcagtacgtc ccgagcacgg tgctgggcac ctacccaccg 2820
gactggccct cggccgtgtc caacaacgtg tgggcgtcga cgacgtcgta tacaatcaag 2880
ggctttaacg gaaacagcac tagtgcaaca ggaacgggat ccgcgcacac gctcaagctg 2940
tgggctcttg agcctggcgt ggtgtttgag aagattgtca ttgatctggg cgggcagagg 3000
gatagttatc tcggtccgcc ggagagtcgg attgtgtag 3039
<210> 76
<211> 6493
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(6493)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 76
ggagttgctt gcccgggcag gatatcggtt ggcggcgtgg ttggacttga ttgcgaagca 60
gtagagacag gtattctgct gatagcatgg atttatatta tcaataagca gaggcctaaa 120
gacattcaac cagaagaaac gtccttcatg caacagcaag ctagaacata tacatatgag 180
aacaagcata gtgccaatca agcagaccta tactgtactc tattacaaca aactactatc 240
acggtagtcg tacactggtc aatgaaataa tgtgagtaaa aatgatcatg attctatgac 300
agaacagcta gtacgcttga tttattgggg tataaatttt actttattta ggtggttaag 360
agccagcaga ctagatatat agctcagata taatataatt aatagtcaca gaaaaaaata 420
aataaaaata aaaatagcaa gatccatgat atggtataca caaaaaaata ataatcataa 480
atcacacaat tccatcctct ccaaaaccac ctagccagct cctaccaaac gatacatact 540
cagtccaagc aaatcccccg ttccgtcctc ccgtccgtcc gatcagtccc gaataccgac 600
caaaaaaaaa aagagacaaa atccaaatca cgggttcatt cacatcccca caggataccc 660
atggatcagt cgtcctactt actgtggtac agattagaac agaaaattag gtttttacac 720
aactcagggt ggttgcattg cattgcattg tgctgtggag ttagttaact tagttgtact 780
ccatccagtt catacgcagt acattattgg gcatttgacc ccatcagaca agatatctaa 840
ggataagagt agaaattagg taataatagt caaaagagaa gaagagatac caagggaact 900
agatactaac aaccaatcag gatatgccac agtgtggaac agaatggaag cagacaggat 960
caacataact ggaaataacc ttttctttct ttcttcgtac agcatcttgg caggaagtaa 1020
cttgatattg ttaattaatg tccatgtcca tgtccatgtc tttgttatgt cttgtcttgt 1080
ctttcttgtg tgctacaagt acagtgtaac agattcatat ccgctgaaac agacataaca 1140
ttcgacacat ggaatacgga gataaagaaa taaattatac tatatacgga atgatatcaa 1200
taaatatccg tgttgtactc cttattaaga aagagtggcg cttggcgcgt ctacgtgcat 1260
ggactggtac tacatatttg attacttcga tttttaataa caacaaccta gtagacgtat 1320
gtatgtcatg tgaaactttc gattgcgtgc tttcttgtct acttgtcgac ttgttacaat 1380
cttgtcgaat attaataata ataatccatc gcactgacat cttggcaagt actccgtaca 1440
tcaggttaca tacatactga ttctctaaag ctagataacg aataggattc tcgcacagac 1500
agtatgtgtc tcttgtctgt cagatgataa gcagatgaac aaagaaagta taactgctta 1560
ctacctacat gccgacattt agtcgattcc tttcggagaa tttattatgg attattaata 1620
gcataccccg ggattggcag aaggggtaaa aggtccgact agacaaggat atccatacag 1680
tacataccgt tgatacagat cgaatcacat gcatactgct gatggtgtga tgaatccttg 1740
aattagacaa tcatccagac ctgtctggac agagatcctg gcactgaaca atccactcat 1800
tgctatctat cggtactctg tacctgtttc agctgaagct tgccaatcgc agactgccat 1860
ctgcaactga tcagcgccag gatgcaggtc atgatacccc agcgttgttc ccgaggtgtc 1920
attgcttaaa cgcgttaacc agtgtgctaa acgtgctaaa cgtgctaaat gctaaactgc 1980
tgatgctatg cagctgcatc gccgaatctg gagaatgcag atcacctgcc gacggcgggc 2040
tccgggcacg tgcacggggg accccgtagg acagaaacgt ccatcgagag tacggagtac 2100
ggagtattac aagaccctgt ccatcagacc ctgtccatcg tcattgccaa gatctctcat 2160
tgtttgctgt ttcatgctcg gatcaccagt ggacagcaat gccccgtgaa cagcaagccg 2220
catgctggtc cgtgtcttgt ccgtgtgccg atgtagtatt gctaacgaga cccagaatgg 2280
catcaatgac gttgcggatg acagaatgag ggggatcatc agtacgtctg ctatcaggat 2340
gattatccta cggagtattt actcagctga agacaggaac aagatcgtct gatggatgag 2400
gcccacggcc agccagcaca gactccgtac tcttcagtct tctggatttg accgttcgac 2460
ggcgcctccg acgtagcatc tcgctagcct gatccttggc tgcgcctatc gtcggctcat 2520
gcccctgttg atgacgggga agtggagcgg cgccgcgata aggttgcctt gctaatttag 2580
cgcctgcacg ctccagccaa aaagaccaat attgaggtcg atcgtctccc ctggctccgt 2640
gctgctggcc tgcgatcgcc ggcgcgatca taccctgcaa tcacgccgcc agcctatcac 2700
agaccatgcg gtccttgcac catctgggag ctcgagctct cctgactgcc gtcggggcgt 2760
caatgcgtcc ggagcctccg acgagggcct ctgctcctcg tctgtcctac tggagcttgt 2820
ccgtcagacg tcgcatcctg agccgtgtgc tgatatcgcc atggctctga cgtgatcgac 2880
tgcgagcggc cggcgaggct ataagaagcc gcaacttgct gctcgaagta ccgtctccca 2940
tccatcgatc agacagtcag cagtcctcac tcagtcagtc ctcagtcgtc cttcaccacc 3000
atgggtctgt ccaaagcctt cgtgtctgca ctctcgctgt gctccgccgt cgccgtggcc 3060
gccccgaccg ggccagctcc caacgtgcag ttctccctga agcaggtcgc ggtgccccgg 3120
accaagcctc gtgcgccccc agctgccgac tacgcgcgcg ctctggccaa gtatggcgct 3180
ccaattccgt cgtctgtgcg gacggccgcg tccggcacgc agagcggctc tgcggccaac 3240
acgcccgtcg ccggcgacag cttgtatctc acgcccgtta ccatcggcca gagcacgctg 3300
aacctggact ttgacacggg ctctgcggat ctgtaagtgt cccaactctc gcaagaacaa 3360
gaacggagca gctgactcgt ccagctgggt cttctccaac gagacgccct ccagcgagcg 3420
cggcaaccac gccatctaca agcccagctc gacggccaag aagctgaacg gctacacctg 3480
gagcatctcg tacggcgacg gcagctcggc cggcggcgac gtctaccagg acagcgtctc 3540
ggtgggcggc gtcaacgcct ccaaccaggc ggtcgaggcc gccaccaagg tcagctccga 3600
gttcacgcag gagccgggcg acggcttgct gggcctggcc ttcagcagca tcaacaccgt 3660
caagcccaag ccgcagacga ccttcttcga cacggtcaag tcctcgctcg ccaagccgct 3720
gttcgccgtc accctcaagc acaacgagcc cggcagctac gactttggct acatcgacag 3780
ctccaagtac aagggcagca tccagtacac ccaggtcgac aactcgcagg gcttctggca 3840
gttcacggcc gacggctact cgattggcgg cagcagcggc agcggtggct ccatttctgg 3900
cattgctggt aagaactccc cctacatcag agttatctag atgctgattt cgcagacacc 3960
ggcaccaccc tcctcctgct cgacgaccag atcgtcaacg agtactacca gcaggtccag 4020
ggcgcgcaga acgaccagaa cgccggcggc tacaccttcc cgtgcgacgc gcagctgccc 4080
gagctgagct tcaccatcgg ccagtacacc gccaccgtgc cggccgagta cctcaacttc 4140
cagcccgtgt cgcagggcag ccagacctgc ttcggcggtc tgcagtccaa ccagggcatt 4200
ggcttctcca tcttcggcga cgtcttcctc aagagccagt acgtcgtctt tgactcggac 4260
ggtcctcagc tgggctttgc tgctcaggcg tagaccagtc gtcctccagc ccaggttggt 4320
tggtaggaga tgatttttcg atcgatcgat tatcatggtg attgatagga tatgtgcatg 4380
agcagttgcc tgtacataca tacataatga tttattgaat caattagtta tgatcaatct 4440
cgaatatatt ttcagtgaaa tacgtacatg gtcatagcat aacgatatac tccgttttct 4500
tcaggtagct agtaaatata cacaaattca tcgttctccc ggtccgtcag gtccaggaag 4560
gctttgtctc cgatcgtccc gtcgggatca ctctcgctgg tatcgtgata gcgctccctc 4620
atcgagtaat caaccacctt ggccggcttt ccattccgca cgcgccgccg ctcctgcatc 4680
cggttcagca cgaccaaatt cgcccactgc gccagcacga cggccaccag cgccacgaag 4740
atggccagac aagcccgcac gcccggccga tacgccggcg cgtccttctt gctgaagagc 4800
agcgggccga cgatgttgcc cgccgagctg gccgcgttgt acaggctcat cagcgccgat 4860
ttcttcgttg tgccgcccgt gttgcccacg atccacgtca cgatcagtgg gttgccgccg 4920
aagagaaacg cgagcaggta gtagcctacc aggagggagg gttcgactga gttttgcttc 4980
gtgctgttat tactgcgtgg cacggcgtac agaattgcca ggcccgcgac taccggcagc 5040
atgaagccgg ccagcacgac gcccttcatc cgcgcccgct gcgccagata gctccccgcc 5100
aggatgacca gcagctgcag cgcgccaaac ggcatgttga gcagactcgt cgtgtacgcg 5160
tcgtacccca ggccgttgag gatcagcggg ccgaacgtgt tgctcacgct ggcgccgacg 5220
ttcagcagca tcgccatgcc gatccagagg taggttttgg gctcgagcgc tgcctcgacg 5280
acgtgccgga tcttgaactc gcggctccct gtgcccgtct ggttcgcgcg cagccgctcg 5340
atggcctgcg ctttttccgt ctccgtcagg aaccgcgctg aggggatgtc gttgtctagt 5400
ttccagtaga tgaacggcac tgagatgatg gtcaggaggc cgacggtgag gaagatactg 5460
cgccagtcgt cagcagtcag tcagtcagcg ttcggggtag aaggggagta catctgccat 5520
ggcctcagaa caggcgactc gatatggccc aacccgtacg acagggccgc cgcgatgaca 5580
gtcgccgcgc cgttggtact gtaccaggcc gcaatgcgca gcggctgctc ggcgcggcgg 5640
taccactggc tggtgatgac gctgaacagc ggcagacagg cggcctcgaa caggccgagg 5700
aagaagcgcg cggccatcag ggaggcgaaa ctgcgacagg cggccatggc ggcctgggcg 5760
acgccccagc ccagacacag cgcgggcatc aggcggcgat gcggcacgcg cacgatcagc 5820
cacgacgaga acggctgcca gacgagctgg gcgatgggcg cgatcgaccc cagcagcgag 5880
tactggttgc ccgtcaggtg cgtgtcggcc tgcaagccga aggtggcccc gtacccgagc 5940
accgacttgt ccaggatctg caggaagtac acccacacga ggatggccag gatgacgcgg 6000
tctgtcttgc gccggatgcg cttgctgtcg gcgtccgtga gtgggattct ctgctggccg 6060
atcaggcgga gcgccgtgtc gccgtggacg gcgggttgct cttcttcatg ggtgacggtc 6120
ggtttggatg ccatggtagc gattactaga tgtaatcaag ttgtaatggg agacaaacga 6180
ccaagttctc tctcgacgtt ttataccggc ttatatgtct gttcagcagc attgcaagtc 6240
aagtaatgac atcggaattc ctccggttcc ccgcattgcg cggcgatcat cggctggcac 6300
tagcagtata gctagctcag agtccgtatt actggattct attgcattgc gctgattgca 6360
gacgttgact gacagcagga gctttgactc tattaccccc acgcttcggc aattccccgc 6420
gtgctcgggc ctctatgcac ccccacgtgg gggaacattc cagagtatgc aggcagtagt 6480
atgcagcatg gat 6493
<210> 77
<211> 1194
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1194)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 77
atgggtctgt ccaaagcctt cgtgtctgca ctctcgctgt gctccgccgt cgccgtggcc 60
gccccgaccg ggccagctcc caacgtgcag ttctccctga agcaggtcgc ggtgccccgg 120
accaagcctc gtgcgccccc agctgccgac tacgcgcgcg ctctggccaa gtatggcgct 180
ccaattccgt cgtctgtgcg gacggccgcg tccggcacgc agagcggctc tgcggccaac 240
acgcccgtcg ccggcgacag cttgtatctc acgcccgtta ccatcggcca gagcacgctg 300
aacctggact ttgacacggg ctctgcggat ctctgggtct tctccaacga gacgccctcc 360
agcgagcgcg gcaaccacgc catctacaag cccagctcga cggccaagaa gctgaacggc 420
tacacctgga gcatctcgta cggcgacggc agctcggccg gcggcgacgt ctaccaggac 480
agcgtctcgg tgggcggcgt caacgcctcc aaccaggcgg tcgaggccgc caccaaggtc 540
agctccgagt tcacgcagga gccgggcgac ggcttgctgg gcctggcctt cagcagcatc 600
aacaccgtca agcccaagcc gcagacgacc ttcttcgaca cggtcaagtc ctcgctcgcc 660
aagccgctgt tcgccgtcac cctcaagcac aacgagcccg gcagctacga ctttggctac 720
atcgacagct ccaagtacaa gggcagcatc cagtacaccc aggtcgacaa ctcgcagggc 780
ttctggcagt tcacggccga cggctactcg attggcggca gcagcggcag cggtggctcc 840
atttctggca ttgctgacac cggcaccacc ctcctcctgc tcgacgacca gatcgtcaac 900
gagtactacc agcaggtcca gggcgcgcag aacgaccaga acgccggcgg ctacaccttc 960
ccgtgcgacg cgcagctgcc cgagctgagc ttcaccatcg gccagtacac cgccaccgtg 1020
ccggccgagt acctcaactt ccagcccgtg tcgcagggca gccagacctg cttcggcggt 1080
ctgcagtcca accagggcat tggcttctcc atcttcggcg acgtcttcct caagagccag 1140
tacgtcgtct ttgactcgga cggtcctcag ctgggctttg ctgctcaggc gtag 1194
<210> 78
<211> 397
<212> PRT
<213> Rasamsonia emersonii
<400> 78
Met Gly Leu Ser Lys Ala Phe Val Ser Ala Leu Ser Leu Cys Ser Ala
1 5 10 15
Val Ala Val Ala Ala Pro Thr Gly Pro Ala Pro Asn Val Gln Phe Ser
20 25 30
Leu Lys Gln Val Ala Val Pro Arg Thr Lys Pro Arg Ala Pro Pro Ala
35 40 45
Ala Asp Tyr Ala Arg Ala Leu Ala Lys Tyr Gly Ala Pro Ile Pro Ser
50 55 60
Ser Val Arg Thr Ala Ala Ser Gly Thr Gln Ser Gly Ser Ala Ala Asn
65 70 75 80
Thr Pro Val Ala Gly Asp Ser Leu Tyr Leu Thr Pro Val Thr Ile Gly
85 90 95
Gln Ser Thr Leu Asn Leu Asp Phe Asp Thr Gly Ser Ala Asp Leu Trp
100 105 110
Val Phe Ser Asn Glu Thr Pro Ser Ser Glu Arg Gly Asn His Ala Ile
115 120 125
Tyr Lys Pro Ser Ser Thr Ala Lys Lys Leu Asn Gly Tyr Thr Trp Ser
130 135 140
Ile Ser Tyr Gly Asp Gly Ser Ser Ala Gly Gly Asp Val Tyr Gln Asp
145 150 155 160
Ser Val Ser Val Gly Gly Val Asn Ala Ser Asn Gln Ala Val Glu Ala
165 170 175
Ala Thr Lys Val Ser Ser Glu Phe Thr Gln Glu Pro Gly Asp Gly Leu
180 185 190
Leu Gly Leu Ala Phe Ser Ser Ile Asn Thr Val Lys Pro Lys Pro Gln
195 200 205
Thr Thr Phe Phe Asp Thr Val Lys Ser Ser Leu Ala Lys Pro Leu Phe
210 215 220
Ala Val Thr Leu Lys His Asn Glu Pro Gly Ser Tyr Asp Phe Gly Tyr
225 230 235 240
Ile Asp Ser Ser Lys Tyr Lys Gly Ser Ile Gln Tyr Thr Gln Val Asp
245 250 255
Asn Ser Gln Gly Phe Trp Gln Phe Thr Ala Asp Gly Tyr Ser Ile Gly
260 265 270
Gly Ser Ser Gly Ser Gly Gly Ser Ile Ser Gly Ile Ala Asp Thr Gly
275 280 285
Thr Thr Leu Leu Leu Leu Asp Asp Gln Ile Val Asn Glu Tyr Tyr Gln
290 295 300
Gln Val Gln Gly Ala Gln Asn Asp Gln Asn Ala Gly Gly Tyr Thr Phe
305 310 315 320
Pro Cys Asp Ala Gln Leu Pro Glu Leu Ser Phe Thr Ile Gly Gln Tyr
325 330 335
Thr Ala Thr Val Pro Ala Glu Tyr Leu Asn Phe Gln Pro Val Ser Gln
340 345 350
Gly Ser Gln Thr Cys Phe Gly Gly Leu Gln Ser Asn Gln Gly Ile Gly
355 360 365
Phe Ser Ile Phe Gly Asp Val Phe Leu Lys Ser Gln Tyr Val Val Phe
370 375 380
Asp Ser Asp Gly Pro Gln Leu Gly Phe Ala Ala Gln Ala
385 390 395
<210> 79
<211> 1066
<212> DNA
<213> Aspergillus nidulans
<220>
<221> source
<222> (1)..(1066)
<223> /organism="Aspergillus nidulans" /mol_type="unassigned DNA"
<400> 79
agacagctct ggcggctctg aggtgcagtg gatgattatt aatccgggac cggccgcccc 60
tccgccccga agtggaaagg ctggtgtgcc cctcgttgac caagaatcta ttgcatcatc 120
ggagaatatg gagcttcatc gaatcaccgg cagtaagcga aggagaatgt gaagccaggg 180
gtgtatagcc gtcggcgaaa tagcatgcca ttaacctagg tacagaagtc caattgcttc 240
cgatctggta aaagattcac gagatagtac cttctccgaa gtaggtagag cgagtacccg 300
gcgcgtaagc tccctaattg gcccatccgg catctgtagg gcgtccaaat atcgtgcctc 360
tcctgctttg cccggtgtat gaaaccggaa aggccgctca ggagctggcc agcggcgcag 420
accgggaaca caagctggca gtcgacccat ccggtgctct gcactcgacc tgctgaggtc 480
cctcagtccc tggtaggcag ctttgccccg tctgtccgcc cggtgtgtcg gcggggttga 540
caaggtcgtt gcgtcagtcc aacatttgtt gccatatttt cctgctctcc ccaccagctg 600
ctcttttctt ttctctttct tttcccatct tcagtatatt catcttccca tccaagaacc 660
tttatttccc ctaagtaagt actttgctac atccatactc catccttccc atcccttatt 720
cctttgaacc tttcagttcg agctttccca cttcatcgca gcttgactaa cagctacccc 780
gcttgagcag acatcaccat ggccaagttg accagtgccg ttccggtgct caccgcgcgc 840
gacgtcgccg gagcggtcga gttctggacc gaccggctcg ggttctcccg ggacttcgtg 900
gaggacgact tcgccggtgt ggtccgggac gacgtgaccc tgttcatcag cgcggtccag 960
gaccaggtgg tgccggacaa caccctggcc tgggtgtggg tgcgcggcct ggacgagctg 1020
tacgccgagt ggtcggaggt cgtgtccacg aacttccggg acgcct 1066
<210> 80
<211> 1062
<212> DNA
<213> Aspergillus nidulans
<220>
<221> source
<222> (1)..(1062)
<223> /organism="Aspergillus nidulans" /mol_type="unassigned DNA"
<400> 80
accagtgccg ttccggtgct caccgcgcgc gacgtcgccg gagcggtcga gttctggacc 60
gaccggctcg ggttctcccg ggacttcgtg gaggacgact tcgccggtgt ggtccgggac 120
gacgtgaccc tgttcatcag cgcggtccag gaccaggtgg tgccggacaa caccctggcc 180
tgggtgtggg tgcgcggcct ggacgagctg tacgccgagt ggtcggaggt cgtgtccacg 240
aacttccggg acgcctccgg gccggccatg accgagatcg gcgagcagcc gtgggggcgg 300
gagttcgccc tgcgcgaccc ggccggcaac tgcgtgcact tcgtggccga ggagcaggac 360
tgaccgacgc cgaccaacac cgccggtccg acggcggccc acgggtccca ggagcttgag 420
atccacttaa cgttactgaa atcatcaaac agcttgacga atctggatat aagatcgttg 480
gtgtcgatgt cagctccgga gttgagacaa atggtgttca ggatctcgat aagatacgtt 540
catttgtcca agcagcaaag agtgccttct agtgatttaa tagctccatg tcaacaagaa 600
taaaacgcgt tttcgggttt acctcttcca gatacagctc atctgcaatg cattaatgca 660
ttgactgcaa cctagtaacg ccttcaggct ccggcgaaga gaagaatagc ttagcagagc 720
tattttcatt ttcgggagac gagatcaagc agatcaacgg tcgtcaagag acctacgaga 780
ctgaggaatc cgctcttggc tccacgcgac tatatatttg tctctaattg tactttgaca 840
tgctcctctt ctttactctg atagcttgac tatgaaaatt ccgtcaccag ccctgggttc 900
gcaaagataa ttgcatgttt cttccttgaa ctctcaagcc tacaggacac acattcatcg 960
taggtataaa cctcgaaatc attcctacta agatggtata caatagtaac catgcatggt 1020
tgcctagtga atgctccgta acacccaata cgccggccgg cc 1062
<210> 81
<211> 1501
<212> DNA
<213> Rasamsonia emersonii
<220>
<221> source
<222> (1)..(1501)
<223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA"
<400> 81
ccaattattc aaatcttcaa cctgggtcct ttgcgactag actcggcact atacccacct 60
gagtcgaatc tccgctggac gatttttttt cttagaagaa aaaaagcttc agaggctaag 120
gattaggctt ccgtacggac tccatgccct atcagacaga gactccgcaa ctcatctgat 180
ctcttcgatg gagggaaaat ctgctgtttt tcgcaaattt ccaacccacc agaaacaccc 240
agaactgtca cgactcacac gtcctacggt ctttgtgtga gtataactga ttatattcac 300
agatgggtta ctcaatgcag gtacaaactt tgatcgcgct ctttttggga ccgtctatca 360
accggcttcg aaaaatggct cgactagcca atctgacagg aaattgcgat gttgcaaccg 420
tgtatacgga gtcctctgta caacctctgc caacctctgc cacctcggta catgtacgga 480
gtagctcccc gcagccgcga ttggatgcat taaagtgggt caaccgcagt ggcttgcagt 540
ccgctgcacg agtccgtatg caataattct tgacacacac gagtgcacat aataatagga 600
aagcagacaa actttgagct gaaggctgtc gagcttggca aattgcagga tctggctagt 660
ttcgaagtcg acttcgcgcg cgcagcagta ttgcattatt gagtgtgacc tgctgcgtgg 720
gattagcgtc gcaccggccg aaagctagtc tcatccaagg ctgagcctga gcgctaatta 780
ccccggatca gccaagccct aatggatcta atgaggtgcc tcctccagca ttcggcctgc 840
atggtgcggc gacccctctc tccacgtcca ataattgctg ttgcgcctgt cgaaccctgc 900
caccgcatct ttgccgtttt actccgagat ctgaaaagcc tgctgtggat ggcagttcgc 960
aatatgcact ctcaatcagg tctgtagcat cttttaacta ttattctatt actaattgct 1020
tctggaaggc ttgtggggtg tggtttgtca tcaagttggc tccctgagcg ccgcgttgca 1080
atctccacgc gcggttgtac ggagtatatt catgcggatc cccggggcag agccgtagtg 1140
catgtgacac taatcgatca tccgctcaat tggatcctgg atttcgaccc tggcttgaac 1200
atatccaatg atcttccagg gacgaaccga cccggtcatg ctttgttacc tacgtacgga 1260
gtagcggcct gggtgatggt tccggaaggt ctgctaaaag gagatcgagt ataccccccg 1320
gggtccgtct gagacttata aagggctctc tgcaactctc cggccgactt ttttcttcat 1380
tcgacagcca tcactcgttt atctggtcga ttctgcagac ttgcccaagg agcaaagagc 1440
atcttcatac gcgcatcatc catctccagc tttctctctc caaacataca ccgtcaaaat 1500
g 1501
<210> 82
<211> 301
<212> DNA
<213> Aspergillus nidulans
<220>
<221> source
<222> (1)..(301)
<223> /organism="Aspergillus nidulans" /mol_type="unassigned DNA"
<400> 82
ctaataagtg tcagatagca atttgcacaa gaaatcaata ccagcaactg taaataagcg 60
ctgaagtgac catgccatgc tacgaaagag cagaaaaaaa cctgccgtag aaccgaagag 120
atatgacacg cttccatctc tcaaaggaag aatcccttca gggttgcgtt tccagtctag 180
acacgtataa cggcacaagt gtctctcacc aaatgggtta tatctcaaat gtgatctaag 240
gatggaaagc ccagaatatt ggctgggttg atggctgctt cgagtgcagt ctcatgctgc 300
c 301
Claims (12)
- 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열; 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 또는 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74의 뉴클레오티드 서열에 의해 코딩된 아미노산 서열; 또는 이의 변이체 폴리펩티드 또는 변이체 폴리뉴클레오티드를 포함하는, 헤미셀룰라제(hemicellulase) 활성을 갖는 폴리펩티드로서, 상기 변이체 폴리펩티드가 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖거나, 상기 변이체 폴리뉴클레오티드가 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖는 폴리펩티드를 코딩하는, 폴리펩티드.
- 제1항에 있어서,
β-자일로시다제(xylosidase), α-갈락토시다제(galactosidase), 자일로글루카나제(xyloglucanase), α-아라비노푸라노시다제(arabinofuranosidase), 엔도-자일라나제(endo-xylanase), 만노시다제(mannosidase)/자일로시다제, 페룰로일 에스터라제(feruloyl esterase), 자일로시다제, 엔도-엑소-자일라나제(endo-exo-xylanase) 또는 α-글루쿠로니다제(glucuronidase) 활성을 갖는 폴리펩티드. - 헤미셀룰라제를 코딩하는 핵산 서열로서,
(a) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열과 70% 이상의 동일성을 갖는 핵산 서열;
(b) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열의 상보체와 혼성화하는 핵산 서열;
(c) (i) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열, (ii) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 70% 이상의 동일성을 갖는 아미노산 서열, 또는 (iii) 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개 또는 12개의 아미노산이 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 상이한 아미노산 서열을 코딩하는 핵산 서열; 및
(d) (a), (b) 또는 (c)에 정의된 뉴클레오티드 서열의 역 상보체인 뉴클레오티드 서열
로 구성된 군으로부터 선택된 핵산 서열. - 제1항 또는 제2항에 따른 폴리뉴클레오티드를 포함하는 핵산 구축물 또는 벡터.
- 제1항 또는 제2항에 따른 폴리펩티드, 또는 제3항에 따른 핵산 구축물 또는 벡터를 포함하는 세포로서, 바람직하게는 진균 세포, 바람직하게는 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼길러스(Aspergillus), 아우레오바시듐(Aureobasidium), 크리소스포리움(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 마이셀리오프쏘라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 패실로마이세스(Paecilomyces), 페니실리움(Penicillium), 피로마이세스(Piromyces), 파네로캐테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로마이세스(Talaromyces), 라삼소니아(Rasamsonia), 써모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium) 및 트라이코데르마(Trichoderma) 속으로 구성된 군으로부터 선택된 진균 세포인 세포.
- 제5항에 있어서,
하나 이상의 유전자가 전체적으로 또는 부분적으로 결실되어 있거나, 넉아웃되어 있거나 파괴되어 있고, 이때 임의적으로 상기 유전자가 프로테아제(protease)를 코딩하는, 세포. - 헤미셀룰라제 활성을 갖는 제1항 또는 제2항에 따른 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드의 발현을 허용하는 조건 하에서 제4항 내지 제6항 중 어느 한 항에 따른 세포를 배양하는 단계, 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법.
- (i) 제1항 또는 제2항에 따른 폴리펩티드; 및 (ii) 셀룰라제(cellulase), 추가 헤미셀룰라제 및/또는 펙티나제(pectinase)를 포함하는 조성물.
- 제8항에 있어서,
셀룰라제가 GH61, 셀로바이오하이드롤라제(cellobiohydrolase), 셀로바이오하이드롤라제 I, 셀로바이오하이드롤라제 II, 엔도-β-1,4-글루카나제(glucanase), β-글루코시다제(glucosidase) 또는 β-(1,3)(1,4)-글루카나제인 조성물. - 제8항 또는 제9항에 있어서,
추가 헤미셀룰라제가 엔도-자일라나제, β-자일로시다제, α-L-아라비노푸라노시다제, α-D-글루쿠로니다제, 셀로바이오하이드롤라제, 페룰로일 에스터라제, 쿠마로일 에스터라제, α-갈락토시다제, β-갈락토시다제, β-만나나제(mannanase) 또는 β-만노시다제인 조성물. - 헤미셀룰로스를 포함하는 기질, 임의적으로 식물 물질을 처리하는 방법으로서, 상기 기질을 제1항 또는 제2항에 따른 폴리펩티드 및/또는 제8항 내지 제10항 중 어느 한 항에 따른 조성물과 접촉시키는 단계를 포함하는 방법.
- 리그노셀룰로스성(lignocellulosic) 물질로부터 당을 제조하기 위한 제1항 또는 제2항에 따른 폴리펩티드 및/또는 제8항 내지 제10항 중 어느 한 항에 따른 조성물의 용도.
Applications Claiming Priority (61)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13153824 | 2013-02-04 | ||
EP13153828 | 2013-02-04 | ||
EP13153831.6 | 2013-02-04 | ||
EP13153825.8 | 2013-02-04 | ||
EP13153823 | 2013-02-04 | ||
EP13153836 | 2013-02-04 | ||
EP13153831 | 2013-02-04 | ||
EP13153835 | 2013-02-04 | ||
EP13153825 | 2013-02-04 | ||
EP13153837.3 | 2013-02-04 | ||
EP13153821.7 | 2013-02-04 | ||
EP13153841.5 | 2013-02-04 | ||
EP13153829 | 2013-02-04 | ||
EP13153835.7 | 2013-02-04 | ||
EP13153829.0 | 2013-02-04 | ||
EP13153823.3 | 2013-02-04 | ||
EP13153834 | 2013-02-04 | ||
EP13153840 | 2013-02-04 | ||
EP13153834.0 | 2013-02-04 | ||
EP13153839 | 2013-02-04 | ||
EP13153836.5 | 2013-02-04 | ||
EP13153840.7 | 2013-02-04 | ||
EP13153837 | 2013-02-04 | ||
EP13153841 | 2013-02-04 | ||
EP13153821 | 2013-02-04 | ||
EP13153833 | 2013-02-04 | ||
EP13153828.2 | 2013-02-04 | ||
EP13153824.1 | 2013-02-04 | ||
EP13153839.9 | 2013-02-04 | ||
EP13153833.2 | 2013-02-04 | ||
EP13156682 | 2013-02-26 | ||
EP13156679.6 | 2013-02-26 | ||
EP13156684 | 2013-02-26 | ||
EP13156698.6 | 2013-02-26 | ||
EP13156694 | 2013-02-26 | ||
EP13156696 | 2013-02-26 | ||
EP13156685.3 | 2013-02-26 | ||
EP13156693 | 2013-02-26 | ||
EP13156678 | 2013-02-26 | ||
EP13156702.6 | 2013-02-26 | ||
EP13156694.5 | 2013-02-26 | ||
EP13156703.4 | 2013-02-26 | ||
EP13156701.8 | 2013-02-26 | ||
EP13156703 | 2013-02-26 | ||
EP13156702 | 2013-02-26 | ||
EP13156688.7 | 2013-02-26 | ||
EP13156701 | 2013-02-26 | ||
EP13156692 | 2013-02-26 | ||
EP13156679 | 2013-02-26 | ||
EP13156690.3 | 2013-02-26 | ||
EP13156690 | 2013-02-26 | ||
EP13156685 | 2013-02-26 | ||
EP13156693.7 | 2013-02-26 | ||
EP13156698 | 2013-02-26 | ||
EP13156692.9 | 2013-02-26 | ||
EP13156684.6 | 2013-02-26 | ||
EP13156688 | 2013-02-26 | ||
EP13156678.8 | 2013-02-26 | ||
EP13156696.0 | 2013-02-26 | ||
EP13156682.0 | 2013-02-26 | ||
PCT/EP2014/051998 WO2014118360A2 (en) | 2013-02-04 | 2014-02-03 | Carbohydrate degrading polypeptide and uses thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150113170A true KR20150113170A (ko) | 2015-10-07 |
KR102134498B1 KR102134498B1 (ko) | 2020-07-16 |
Family
ID=51263073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157023753A KR102134498B1 (ko) | 2013-02-04 | 2014-02-03 | 탄수화물 분해 폴리펩티드 및 이의 용도 |
Country Status (11)
Country | Link |
---|---|
US (4) | US9988615B2 (ko) |
EP (5) | EP2951296A2 (ko) |
KR (1) | KR102134498B1 (ko) |
CN (1) | CN105073986A (ko) |
CA (1) | CA2900140C (ko) |
DK (3) | DK3202900T3 (ko) |
ES (2) | ES2802807T3 (ko) |
HR (2) | HRP20220917T1 (ko) |
MY (2) | MY176331A (ko) |
PL (2) | PL3447136T3 (ko) |
WO (1) | WO2014118360A2 (ko) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014118360A2 (en) | 2013-02-04 | 2014-08-07 | Dsm Ip Assets B.V. | Carbohydrate degrading polypeptide and uses thereof |
KR102453186B1 (ko) * | 2016-07-12 | 2022-10-12 | 까르비오 | 신규한 에스테라아제 및 그의 용도 |
EP3545100A1 (en) | 2016-11-24 | 2019-10-02 | DSM IP Assets B.V. | Enzyme composition |
US20190276809A1 (en) | 2016-11-24 | 2019-09-12 | Dsm Ip Assets B.V. | Enzyme composition |
WO2018185071A1 (en) | 2017-04-03 | 2018-10-11 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
WO2018185150A1 (en) * | 2017-04-04 | 2018-10-11 | Novozymes A/S | Polypeptides |
CA3075592A1 (en) | 2017-10-09 | 2019-04-18 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
CN111278986A (zh) | 2017-10-30 | 2020-06-12 | 帝斯曼知识产权资产管理有限公司 | 用于酶促水解木质纤维素材料和发酵糖的方法 |
WO2019086370A1 (en) | 2017-10-30 | 2019-05-09 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
CN107988127B (zh) * | 2017-11-02 | 2021-09-03 | 南京农业大学 | 里氏木霉木质纤维素酶基因工程乳酸菌组合在调制优质苜蓿青贮饲料中的应用 |
EP3775189A1 (en) | 2018-03-28 | 2021-02-17 | DSM IP Assets B.V. | Enzyme composition |
WO2019185681A1 (en) | 2018-03-28 | 2019-10-03 | Dsm Ip Assets B.V. | Enzyme composition |
WO2019219804A1 (en) | 2018-05-17 | 2019-11-21 | Dsm Ip Assets B.V. | Process for producing a polypeptide |
LT3802843T (lt) | 2018-05-30 | 2023-04-25 | Versalis S.P.A. | Cukrų gamybos iš angliavandenių medžiagos būdas |
WO2020058248A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
WO2020058253A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
WO2020058249A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
EP3870715A1 (en) | 2018-10-24 | 2021-09-01 | DSM IP Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
CN111607646A (zh) * | 2019-02-26 | 2020-09-01 | 成都华青精准医疗科技有限公司 | 一种用于检测braf基因突变的核苷酸序列组及其应用 |
WO2020182843A1 (en) | 2019-03-12 | 2020-09-17 | Dsm Ip Assets B.V. | Process for producing a fermentation broth |
CA3152393A1 (en) * | 2019-08-30 | 2021-03-04 | Ab Enzymes Gmbh | Use of gh12 cellulases in preparing bakery products comprising rye-flour |
CN114391041A (zh) | 2019-09-10 | 2022-04-22 | 帝斯曼知识产权资产管理有限公司 | 酶组合物 |
CN110577960B (zh) * | 2019-09-12 | 2022-09-13 | 南京农业大学 | 梨木质素合成基因PbMC1a/1b及其在果实品质遗传改良中的应用 |
CN110791439B (zh) * | 2019-10-10 | 2022-04-19 | 天津科技大学 | 一株基因工程构建发酵生产苹果酸的重组黑曲霉菌株及应用 |
US20230313257A1 (en) * | 2020-06-05 | 2023-10-05 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and Systems to Secrete Lignin-Modifying Enzymes and Uses Thereof |
WO2022013148A1 (en) | 2020-07-13 | 2022-01-20 | Dsm Ip Assets B.V. | Process for the production of biogas |
BR112023020370A2 (pt) | 2021-04-06 | 2023-11-21 | Dsm Ip Assets Bv | Composição de enzimas |
EP4320252A1 (en) | 2021-04-06 | 2024-02-14 | DSM IP Assets B.V. | Enzyme composition |
EP4320258A1 (en) | 2021-04-06 | 2024-02-14 | DSM IP Assets B.V. | Enzyme composition |
JP2024512872A (ja) | 2021-04-08 | 2024-03-21 | ベルサリス エッセ.ピー.アー. | 糖生成物及び発酵生成物を製造するプロセス |
CN113307885B (zh) * | 2021-05-26 | 2022-09-27 | 江南大学 | 一种产物特异性提高的融合蛋白及其制备直链麦芽五糖的应用 |
CN113736717B (zh) * | 2021-11-03 | 2022-02-11 | 广东省科学院生态环境与土壤研究所 | 一株具有脱氮功能和缺氧抗逆性的甲烷氧化菌及其应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010122141A1 (en) * | 2009-04-24 | 2010-10-28 | Dsm Ip Assets B.V. | Carbohydrate degrading polypeptide and uses thereof |
KR20100124787A (ko) * | 2008-03-21 | 2010-11-29 | 다니스코 유에스 인크. | 바이오매스의 가수분해를 향상시키기 위한 헤미셀룰라아제 강화 조성물 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
FR2679920A1 (fr) | 1991-08-02 | 1993-02-05 | Rhone Poulenc Rorer Sa | Levures recombinantes hautement stables pour la production de proteines recombinantes, leur preparation et leur utilisation. |
ES2198410T3 (es) | 1993-07-23 | 2004-02-01 | Dsm Ip Assets B.V. | Cepas recombinantes de hongos filamentosos libres de gen marcador de seleccion: un metodo para obtener dichas cepas y su utilizacion. |
WO1996000787A1 (en) | 1994-06-30 | 1996-01-11 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
EP1690945A3 (en) | 1997-02-20 | 2009-06-03 | DSM IP Assets B.V. | Fermentative production of valuable compounds on an industrial scale using chemically defined media |
WO1998046772A2 (en) | 1997-04-11 | 1998-10-22 | Dsm N.V. | Gene conversion as a tool for the construction of recombinant industrial filamentous fungi |
EP1042461B1 (en) | 1997-12-22 | 2007-07-18 | DSM IP Assets B.V. | Expression cloning in filamentous fungi |
WO2000056900A2 (en) | 1999-03-22 | 2000-09-28 | Novo Nordisk Biotech, Inc. | Promoter sequences derived from fusarium venenatum and uses thereof |
WO2001021779A2 (en) | 1999-09-17 | 2001-03-29 | Dsm N.V. | Penicillium chrysogenum transcriptional activator blar, a pathway specific regulator of beta-lactam biosynthesis, and uses therof |
FR2826470B1 (fr) | 2001-06-26 | 2003-09-19 | Astrium Sas | Procede et dispositif de pilotage de l'attitude et de guidage d'un satellite par grappe de gyrodynes |
DE60202478T3 (de) | 2001-07-23 | 2010-01-07 | Dsm Ip Assets B.V. | Verfahren zur herstellung von polynukleotidvarianten |
EP1507857A1 (en) | 2002-05-30 | 2005-02-23 | DSM IP Assets B.V. | Novel pectinases and uses thereof |
WO2005059149A2 (en) | 2003-12-12 | 2005-06-30 | Chromagenics B.V. | Improved protein production |
WO2005095624A2 (en) | 2004-04-02 | 2005-10-13 | Dsm Ip Assets B.V. | Filamentous fungal mutants with improved homologous recombination efficiency |
AU2005233326B2 (en) | 2004-04-16 | 2010-09-23 | Dsm Ip Assets B.V. | Fungal promoters for expressing a gene in a fungal cell |
JP4896013B2 (ja) | 2004-06-16 | 2012-03-14 | ディーエスエム アイピー アセッツ ビー.ブイ. | 改良された分泌によるポリペプチドの製造 |
US7794974B2 (en) | 2004-10-12 | 2010-09-14 | Dsm Ip Assets B.V. | Fungal transcriptional activators useful in methods for producing a polypeptide |
WO2006077258A1 (en) | 2005-01-24 | 2006-07-27 | Dsm Ip Assets B.V. | Method for producing a compound of interest in a filamentous fungal cell |
WO2006092396A1 (en) | 2005-03-01 | 2006-09-08 | Dsm Ip Assets B.V. | Aspergillus promotors for expressing a gene in a fungal cell |
IES20060090A2 (en) * | 2006-02-10 | 2007-06-13 | Nat Univ Ireland | Talaromyces emersonii enzyme systems |
ATE500333T1 (de) | 2006-04-08 | 2011-03-15 | Dsm Ip Assets Bv | Verbessertes verfahren zur homologen rekombination in eukaryontischen zellen |
JP2010517587A (ja) | 2007-02-15 | 2010-05-27 | ディーエスエム アイピー アセッツ ビー.ブイ. | 関心のある化合物を生産するための組み換え宿主細胞 |
WO2008113847A2 (en) | 2007-03-21 | 2008-09-25 | Dsm Ip Assets B.V. | Improved method for homologous recombination |
CN106978455A (zh) * | 2008-08-11 | 2017-07-25 | 帝斯曼知识产权资产管理有限公司 | 木质纤维素材料的降解 |
BRPI1006779A2 (pt) | 2009-03-31 | 2019-09-24 | Stellenbosh Univ | polipeptídeo isolado, polinucleotídeo isolado,método de isolamento de polipeptídeo e preparação. |
BRPI1010696A2 (pt) * | 2009-06-16 | 2016-10-11 | Codexis Inc | método de produção de um polipeptídeo de b-glicosidade com termoatividade aperfeiçoada, polipeptídeo, proteína e seus usos |
EP2449087A1 (en) | 2009-07-03 | 2012-05-09 | DSM IP Assets B.V. | Talaromyces strains and enzyme compositions |
US8734782B2 (en) | 2009-07-22 | 2014-05-27 | Dsm Ip Assets B.V. | Host cell for the production of a compound of interest |
WO2011054899A1 (en) | 2009-11-04 | 2011-05-12 | Dsm Ip Assets B.V. | Talaromyces transformants |
MX2012005152A (es) * | 2009-11-06 | 2012-06-12 | Novozymes Inc | Composiciones para sacrificacion de material celulosico. |
US9109214B2 (en) | 2010-02-11 | 2015-08-18 | Dsm Ip Assets B.V. | Host cell capable of producing enzymes useful for degradation of lignocellulosic material |
AU2011273690C1 (en) | 2010-06-29 | 2015-07-30 | Versalis S.P.A. | Polypeptide having or assisting in carbohydrate material degrading activity and uses thereof |
WO2012001169A1 (en) | 2010-07-01 | 2012-01-05 | Dsm Ip Assets B.V. | A method for the production of a compound of interest |
WO2012018691A2 (en) * | 2010-07-31 | 2012-02-09 | Dyadic International, Inc. | Novel fungal enzymes |
BR112013023757A2 (pt) * | 2011-03-17 | 2017-06-06 | Danisco Us Inc | método para redução de viscosidade no processo de sacarificação |
WO2014118360A2 (en) | 2013-02-04 | 2014-08-07 | Dsm Ip Assets B.V. | Carbohydrate degrading polypeptide and uses thereof |
-
2014
- 2014-02-03 WO PCT/EP2014/051998 patent/WO2014118360A2/en active Application Filing
- 2014-02-03 PL PL18193710T patent/PL3447136T3/pl unknown
- 2014-02-03 EP EP14702266.9A patent/EP2951296A2/en not_active Withdrawn
- 2014-02-03 CA CA2900140A patent/CA2900140C/en active Active
- 2014-02-03 DK DK17156056.8T patent/DK3202900T3/en active
- 2014-02-03 EP EP17156056.8A patent/EP3202900B1/en active Active
- 2014-02-03 CN CN201480019746.5A patent/CN105073986A/zh active Pending
- 2014-02-03 EP EP18193710.3A patent/EP3447136B1/en active Active
- 2014-02-03 MY MYPI2015702356A patent/MY176331A/en unknown
- 2014-02-03 ES ES18193710T patent/ES2802807T3/es active Active
- 2014-02-03 EP EP16158154.1A patent/EP3070165A1/en not_active Withdrawn
- 2014-02-03 MY MYPI2019001267A patent/MY187542A/en unknown
- 2014-02-03 DK DK20154581.1T patent/DK3686280T3/da active
- 2014-02-03 ES ES20154581T patent/ES2923460T3/es active Active
- 2014-02-03 US US14/763,263 patent/US9988615B2/en active Active
- 2014-02-03 HR HRP20220917TT patent/HRP20220917T1/hr unknown
- 2014-02-03 DK DK18193710.3T patent/DK3447136T3/da active
- 2014-02-03 KR KR1020157023753A patent/KR102134498B1/ko active IP Right Grant
- 2014-02-03 EP EP20154581.1A patent/EP3686280B1/en active Active
- 2014-02-03 PL PL20154581.1T patent/PL3686280T3/pl unknown
-
2018
- 2018-04-25 US US15/962,058 patent/US10316305B2/en active Active
-
2019
- 2019-01-17 US US16/250,860 patent/US10655115B2/en active Active
-
2020
- 2020-02-12 US US16/788,868 patent/US11447759B2/en active Active
- 2020-06-19 HR HRP20200976TT patent/HRP20200976T1/hr unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100124787A (ko) * | 2008-03-21 | 2010-11-29 | 다니스코 유에스 인크. | 바이오매스의 가수분해를 향상시키기 위한 헤미셀룰라아제 강화 조성물 |
WO2010122141A1 (en) * | 2009-04-24 | 2010-10-28 | Dsm Ip Assets B.V. | Carbohydrate degrading polypeptide and uses thereof |
Also Published As
Publication number | Publication date |
---|---|
PL3686280T3 (pl) | 2022-09-19 |
WO2014118360A2 (en) | 2014-08-07 |
US20200190495A1 (en) | 2020-06-18 |
DK3686280T3 (da) | 2022-09-12 |
US20180245059A1 (en) | 2018-08-30 |
US10655115B2 (en) | 2020-05-19 |
US11447759B2 (en) | 2022-09-20 |
EP3686280A1 (en) | 2020-07-29 |
EP3202900A1 (en) | 2017-08-09 |
KR102134498B1 (ko) | 2020-07-16 |
HRP20220917T1 (hr) | 2022-10-28 |
US20190136213A1 (en) | 2019-05-09 |
WO2014118360A3 (en) | 2014-09-25 |
ES2802807T3 (es) | 2021-01-21 |
DK3447136T3 (da) | 2020-08-03 |
DK3202900T3 (en) | 2019-04-08 |
CA2900140A1 (en) | 2014-08-07 |
US10316305B2 (en) | 2019-06-11 |
ES2923460T3 (es) | 2022-09-27 |
EP3686280B1 (en) | 2022-06-22 |
MY187542A (en) | 2021-09-28 |
CA2900140C (en) | 2022-05-24 |
CN105073986A (zh) | 2015-11-18 |
EP2951296A2 (en) | 2015-12-09 |
EP3447136A1 (en) | 2019-02-27 |
EP3447136B1 (en) | 2020-05-13 |
US20150361408A1 (en) | 2015-12-17 |
EP3070165A1 (en) | 2016-09-21 |
HRP20200976T1 (hr) | 2020-11-13 |
US9988615B2 (en) | 2018-06-05 |
MY176331A (en) | 2020-07-29 |
PL3447136T3 (pl) | 2020-10-19 |
EP3202900B1 (en) | 2018-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102134498B1 (ko) | 탄수화물 분해 폴리펩티드 및 이의 용도 | |
EP2588492B1 (en) | Polypeptide having beta-glucosidase activity and uses thereof | |
EP2588494B1 (en) | Polypeptide having beta-glucosidase activity and uses thereof | |
EP2421965B1 (en) | Carbohydrate degrading polypeptide and uses thereof | |
EP2534243A1 (en) | Polypeptide having cellobiohydrolase activity and uses thereof | |
WO2014202622A2 (en) | Rasamsonia gene and use thereof | |
US9163223B2 (en) | Polypeptide having acetyl xylan esterase activity and uses thereof | |
US9109213B2 (en) | Polypeptide having carbohydrate degrading activity and uses thereof | |
US9175050B2 (en) | Polypeptide having swollenin activity and uses thereof | |
WO2014202621A1 (en) | Carbohydrate degrading polypeptide and uses thereof | |
BR112015018405B1 (pt) | Polipeptídeo de degradação de carboidrato, sequência de ácidos nucleicos, construção de ácido nucleico ou vetor, célula recombinante, métodos para preparação de um peptídeo, de produção de um produto de fermentação e para o tratamento de um substrato, composição e uso do referido polipeptídeo |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |