[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN108350442A - 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途 - Google Patents

具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途 Download PDF

Info

Publication number
CN108350442A
CN108350442A CN201680029688.3A CN201680029688A CN108350442A CN 108350442 A CN108350442 A CN 108350442A CN 201680029688 A CN201680029688 A CN 201680029688A CN 108350442 A CN108350442 A CN 108350442A
Authority
CN
China
Prior art keywords
seq
polypeptide
trehalase
amylase
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680029688.3A
Other languages
English (en)
Inventor
康正芳
K.M.施诺尔
L.K.斯科夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN108350442A publication Critical patent/CN108350442A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01028Alpha,alpha-trehalase (3.2.1.28)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及具有海藻糖酶活性的多肽。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用本发明的海藻糖酶的方法,特别是产生发酵产物如乙醇的工艺。

Description

具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的 用途
序列表的引用
本申请包括一个处于计算机可读形式的序列表,将其通过引用并入本文。
发明背景
技术领域
本发明涉及具有海藻糖酶活性的多肽和编码这些多肽的多核苷酸。本发明还涉及包含这些多核苷酸的核酸构建体、载体和宿主细胞以及产生这些多肽的方法。本发明还涉及使用本发明的海藻糖酶生产发酵产物的工艺。
背景技术
海藻糖是由两个糖单体(葡萄糖)组成的稳定的二糖。海藻糖以多至10%-15%的细胞干重作为对应激的响应积累于酵母中(GrBa等,(1975)Eur.J.Appl.Microbiol.2:29-37)。海藻糖不能被酵母代谢。海藻糖酶将海藻糖切割成两个葡萄糖单元。
海藻糖酶分类于EC 3.2.1.28(α,α-海藻糖酶)和EC.3.2.1.93(α,α-磷酸海藻糖酶)。EC类别基于国际生物化学与分子生物学联合会(IUBMB)的命名委员会(NomenclatureCommittee)的推荐。EC类别的描述可见于互联网,例如,在“http://www.expasy.org/ enzyme/”上。两个酶类别均被称作“海藻糖酶”。中性海藻糖的实例包括来自如下的海藻糖酶:酿酒酵母(Londesborouh等,(1984)Characterization of two trehalases frombaker’s yeast”Biochem J 219,511-518;洛氏毛霉(Dewerchin等,(1984),“Trehalaseactivity and cyclic AMP content during early development of Mucor rouxiispores”,J.Bacteriol.,158,575-579);布拉克须霉(Phycomyces blakesleeanus)(Thevelein等,(1983),“Glucose-induced trehalase activation and trehalosemobilization during early germination of Phycomyces blakesleeanus spores”J.Gen Microbiol.129,719-726);尖镰孢(Fusarium oxysporium)(Amaral等,(1996),“Comparative study of two trehalase activities from Fusarium oxysporium varLinii”Can.J Microbiol.41,1057-1062)。中性海藻糖酶的实例包括,但不限于,来自如下的海藻糖酶:酿酒酵母(Saccharomyces cerevisiae)(Parvaeh等,(1996)Purificationand biochemical characterization of the ATH1gene product,vacuolar acidtrehalase from Saccharomyces cerevisae”FEBS Lett.391,273-278);粗糙脉孢菌(Neurospora crassa)(Hecker等,(1973),“Location of trehalase in the ascosporesof Neurospora:Relation to ascospore dormancy and germination”.J.Bacteriol.115,592-599);金黄毛壳菌(Chaetomium aureum)(Sumida等,(1989),“Purification and some properties of trehalase from Chaetomium aureum MS-27.J.Ferment.Bioeng.67,83-86);构巢曲霉(Aspergillus nidulans)(d’Enfert等,(1997),“Molecular characterization of the Aspergillus nidulans treA geneencoding an acid trehalase required for growth on trehalose.Mol.Microbiol.24,203-216);灰腐质霉(Humicola grisea)(Zimmermann等,(1990).”Purification andproperties of an extracellular conidial trehalase from Humicola griseavar.thermoidea”,Biochim.Acta 1036,41-46);灰腐质霉(Cardello等(1994),“Acytosolic trehalase from the thermophilhilic fungus Humicola griseavar.thermoidea’,Microbiology UK 140,1671-1677;嗜热柱顶孢霉(Scytalidiumthermophilum)(Kadowaki等,(1996),“Characterization of the trehalose systemfrom the thermophilic fungus Scytalidium thermophilum”Biochim.Biophys.Acta1291,199-205);和尖镰孢(Amaral等,(1996),“Comparative study of two trehalaseactivities from Fusarium oxysporium var Linii”Can.J Microbiol.41,1057-1062)。
还已知海藻糖酶来自大豆(Aeschbachet等,(1999),“Purification of thetrehalase GmTRE1from soybean nodules and cloning of its cDNA”,Plant Physiol119,489-496)。
海藻糖酶也存在于哺乳动物的小肠和肾中。
WO 2009/121058(诺维信公司(Novozymes))涉及一种使用发酵生物通过将一种或多种海藻糖酶添加入发酵培养基而将源自植物材料的糖发酵成发酵产物(如乙醇)的方法。
WO 2012/027374(并矢公司(Dyadic))披露了一种来自嗜热毁丝霉的海藻糖酶,其可在一种酶混合物中使用,该酶混合物用来将木质纤维素生物质降解成可发酵糖。
WO 2013/148993(诺维信公司)披露了一种通过液化、糖化和发酵含淀粉材料从所述含淀粉材料产生发酵产物如乙醇的方法,其中糖源生成酶、纤维素水解组合物和海藻糖酶存在于发酵中。披露了来自里氏木霉(Trichoderma reesei)的海藻糖酶。
WO 2015/065978(丹尼斯科美国公司)披露了一种在发酵反应中增加从液化物(liquefact)产生乙醇的方法,其包括用葡糖淀粉酶、发酵生物和海藻糖酶发酵所述液化物和在发酵结束时回收所述乙醇和其他发酵产物。
对于提供适于以增加的产率产生发酵产物如乙醇的过程中使用的酶或酶组合物,仍然存在需要。
发明内容
本发明涉及具有海藻糖酶活性的多肽和编码这些多肽的多核苷酸。本发明还涉及使用本发明的海藻糖酶生产发酵产物的工艺。所述海藻糖酶涉及E.C.3.2.1.28并进一步属于家族37糖苷水解酶(“GH37”),如由CAZY(参见www.cazy.org)所定义的。
本发明人已发现、纯化并表征了两种海藻糖酶(本申请中SEQ ID NO:30和本申请中4中分别显示的),其具有高热稳定性和宽pH范围。还发现在本发明的工艺中将本发明的海藻糖酶在发酵中添加时可获得增加的乙醇产率。
本发明的海藻糖酶可用于任何酵母发酵产物产生工艺中,特别是乙醇产生过程中。所述海藻糖酶可用作外源酶或可在产生发酵产物的生物,特别是产生乙醇的酵母菌株,尤其是酵母属(Sacchariomyces)的菌株,特别是酿酒酵母(Saccharomyces cerevisiae)菌株中表达。
因此,在第一个方面,本发明涉及选自下组的具有海藻糖酶活性的多肽,该组由以下各项组成:
(a)多肽,其与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少90%序列同一性,或与SEQ ID NO:4的成熟多肽具有至少80%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在非常高严格条件下与以下杂交:(i)SEQ ID NO:29、SEQ ID NO:1或SEQ ID NO:3的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体;
(c)多肽,其由多核苷酸或其cDNA序列编码,所述多核苷酸与SEQ ID NO:29或SEQID NO:1的成熟多肽编码序列具有至少90%序列同一性,或与SEQ ID NO:3的成熟多肽编码序列具有至少80%序列同一性;
(d)SEQ ID NO:30或SEQ ID NO:2或SEQ ID NO:4的成熟多肽的变体,其在一个或多个(例如,几个)位置处包含取代、缺失和/或插入;和
(e)(a)、(b)、(c)或(d)的多肽的具有海藻糖酶活性的片段。
SEQ ID NO:30的成熟多肽如氨基酸21-694所示。SEQ ID NO:2的成熟多肽如氨基酸21-697所示。SEQ ID NO:4的成熟多肽如氨基酸21-690所示。SEQ ID NO:30的信号如氨基酸1-20所示。SEQ ID NO:2的信号如氨基酸1-20所示。SEQ ID NO:4的信号如氨基酸21-690所示。
本发明还涉及编码多肽的多核苷酸,所述多肽具有本发明的海藻糖酶活性;包括这些多核苷酸的核酸构建体;重组表达载体;重组宿主细胞;以及产生所述多肽的方法。
在一方面,本发明还涉及一种产生发酵产物特别是乙醇的工艺,其包括(a)用α-淀粉酶使含淀粉材料液化;
任选在步骤(b)之前使液化的材料预糖化;
(b)使所液化的材料糖化;
(c)使用发酵生物进行发酵;
其中
i)葡糖淀粉酶;
ii)本发明的海藻糖酶;
iii)任选的纤维素分解酶组合物和/或蛋白酶;
在以下步骤的过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的所述预糖化步骤。
步骤(a)中的液化可在起始糊化温度以上的温度,特别是80℃-90℃进行。
在一个中,本发明涉及从含淀粉材料产生发酵产物的方法,其实施例包括:
(i)在起始糊化温度以下的温度使含淀粉材料糖化;和
(ii)使用发酵生物进行发酵;
其中在以下酶的存在下进行糖化和/或发酵:葡糖淀粉酶、α-淀粉酶、本发明的海藻糖酶,和任选的纤维素分解酶组合物和/或蛋白酶。
在一个实施例中,本发明涉及从预处理的纤维素材料产生发酵产物的方法,其包括:
(a)用纤维素分解酶组合物使所述预处理的纤维素材料水解;
(b)使用发酵生物进行发酵;和
(c)任选地回收所述发酵产物;
其中本发明的海藻糖酶被添加至和/或存在于水解步骤(a)和/或发酵步骤(b)中。
在一个实施例中,可将所述海藻糖酶添加至稀釜馏物中,即,在基于淀粉或基于纤维素材料的方法的后端(backend)。
本发明的海藻糖酶可以任何合适的量存在和/或添加于本发明的发酵产物产生方法中的糖化/水解和/或发酵中。在一个优选的实施例中,海藻糖酶以0.01-20ug EP海藻糖酶/g DS,如0.05-15ug EP海藻糖酶/g DS,如0.5-10ug EP海藻糖酶/g DS的量存在和/或添加。
附图说明
图1显示通过在发酵滴(ferm drop)的上清液中添加海藻糖酶所得的葡萄糖产量。
图2显示通过在发酵滴的上清液中添加Ms海藻糖酶(SEQ ID NO:30)和GH65Tr海藻糖酶(SEQ ID NO:31)所得的葡萄糖产量。
定义
海藻糖酶:术语“海藻糖酶”意指将海藻糖降解成其单元单糖(即,葡萄糖)的酶。将海藻糖酶分类于EC 3.2.1.28(α,α-海藻糖酶)和EC.3.2.1.93(α,α-磷酸海藻糖酶)。EC类别基于国际生物化学与分子生物学联合会(IUBMB)的命名委员会(Nomenclature Committee)的推荐。EC类别的描述可见于互联网,例如,在“http://www.expasy.org/enzyme/”上。海藻糖酶是催化如下反应的酶:
EC 3.2.1.28:
EC 3.2.1.93:
出于本发明的目的,海藻糖酶活性可根据在“材料与方法”部分中所描述的“海藻糖酶测定”方法测定的。在一个方面中,本发明的多肽分别具有至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的SEQ ID NO:30、SEQ ID NO:2或SEQ ID NO:4的成熟多肽的海藻糖酶活性。在一个优选的实施例中,本发明的海藻糖酶是家族37糖苷水解酶(“GH37海藻糖酶”)。
等位基因变体:术语“等位基因变体”意指占据相同染色体基因座的基因的两种或更多种可替代形式中的任一种。等位基因变异通过突变天然产生,并且可导致群体内的多态性。基因突变可为沉默的(在所编码的多肽中没有变化)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
催化结构域:术语“催化结构域”意思指酶的包含该酶的催化机构的区域。
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可存在于对应基因组DNA中的内含子序列。起初的原始RNA转录本是mRNA的前体,其通过一系列的步骤(包括剪接)加工,然后作为成熟的剪接的mRNA出现。
编码序列:术语“编码序列”意指直接详明多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架确定,该开放阅读框架以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可为天然的(即,来自相同基因)或外来的(即,来自不同基因),或对于彼此是天然的或外来的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。最少,控制序列包括启动子,和转录和翻译终止信号。这些控制序列可以提供有多个接头,用于引入促进将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制位点的目的。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、和分泌。
表达载体:术语“表达载体”意指线状或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸可操作地连接于供用于其表达的控制序列。
片段:术语“片段”意指从成熟多肽或结构域的氨基和/或羧基末端缺失一个或多个(例如,几个)氨基酸的多肽;其中所述片段具有海藻糖酶活性。在一个方面中,片段含有SEQ ID NO:2的至少592个氨基酸残基,至少627个氨基酸残基,或至少662个氨基酸残基。在另一个方面,片段含有SEQ ID NO:4的至少587个氨基酸残基,至少621个氨基酸残基,或至少655个氨基酸残基。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖亲本细胞的任何后代,其由于复制期间发生的突变而与亲本细胞不同。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中。例如,宿主细胞可经遗传修饰以表达本发明的多肽。来自该宿主细胞的发酵液会包括分离的多肽。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化、磷酸化等之后处于其最终形式的多肽。在一个方面中,成熟多肽是SEQ IDNO:30的氨基酸21至694。SEQ ID NO:30的氨基酸1至20是信号肽。在一方面,成熟多肽是SEQID NO:2的氨基酸21至697。SEQ ID NO:2的氨基酸1至20是信号肽。在另一方面,成熟多肽是SEQ ID NO:4的氨基酸21至690。SEQ ID NO:4的氨基酸1至20是信号肽。使用SignalP程序(Nielsen等,1997,Protein Engineering 10:1-6)确定信号肽。本领域已知,宿主细胞可产生由相同多核苷酸表达的两个或更多个不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有海藻糖酶活性的成熟多肽的多核苷酸。
在一个方面,成熟多肽编码序列是SEQ ID NO:29的核苷酸(101)...(2326),或其cDNA序列,如核苷酸501-679、366-1025、1084-2326所示。
在一个方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸(501)...(2814),或其cDNA序列,如核苷酸501-679、766-1425、1484-2676和2756-2814所示。SEQ ID NO:1的核苷酸501至560编码信号肽。在另一个方面,成熟多肽编码序列是SEQ ID NO:3的核苷酸501-2701,或其cDNA序列,如核苷酸501-679、752-1411和1471-2701所示。SEQ ID NO:3的核苷酸501至560编码信号肽。
核酸构建体:术语“核酸构建体”意指单-链或双链的核酸分子,其分离自天然存在的基因,或以本来不存在于自然界中的方式被修饰以包含核酸的区段,或其是合成的,该核酸分子包括一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指将控制序列相对于多核苷酸的编码序列置于适当位置使得该控制序列指导该编码序列的表达的构型。
序列同一性:两个氨基酸序列之间或者两个核苷酸序列之间的相关性通过参数“序列同一性”来描述。
出于本发明的目的,两个氨基酸序列之间的序列同一性使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)确定,如EMBOSS包(EMBOSS:TheEuropean Molecular Biology Open Software Suite,Rice等,2000,Trends Genet.16:276-277)的Needle程序(优选5.0.0或以后版本)中所执行的。使用的参数是缺口开放罚分10、缺口扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用nobrief选项获得)用作百分比同一性并且计算如下:
(相同的残基x 100)/(比对长度-比对中的缺口总数)
高严格条件:术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准Southern印迹程序,在42℃在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。在65℃使用2X SSC、0.2%SDS将载体材料最终洗涤三次,每次15分钟。
术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准Southern印迹程序,在42℃在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。在70℃使用2X SSC、0.2%SDS将载体材料最终洗涤三次,每次15分钟。
子序列:术语“子序列”意指从成熟多肽编码序列的5'端和/或3'端缺失一个或多个(例如,几个)核苷酸的多核苷酸;其中该子序列编码具有海藻糖酶活性的片段。在一个方面,子序列含有SEQ ID NO:29或SEQ ID NO:1的至少1776个核苷酸、至少1881个核苷酸或至少1962个核苷酸。在一个方面中,子序列含有SEQ ID NO:3的至少1761个核苷酸,至少1863个核苷酸,或至少1965个核苷酸。
变体:术语“变体”意指在一个或多个(例如,几个)位置处包括改变(即,取代、插入和/或缺失)的具有海藻糖酶活性的多肽。取代意指用不同氨基酸替换占据位置的氨基酸;缺失意指去除占据位置的氨基酸;并且插入意指在邻接并且紧随占据位置的氨基酸之后添加氨基酸。
发明详述
具有海藻糖酶活性的多肽
在一个实施例中,本发明涉及与SEQ ID NO:30的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,其具有海藻糖酶活性。在一个方面中,这些多肽与SEQ ID NO:30的成熟多肽相差多至10个氨基酸(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在一个实施例中,本发明涉及与SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,其具有海藻糖酶活性。在一个方面中,这些多肽与SEQ ID NO:2的成熟多肽相差多至10个氨基酸(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在一个具体的实施例中,本发明涉及与SEQ ID NO:30的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:30的成熟多肽的至少70%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:2的成熟多肽的至少70%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:30或SEQ ID NO:2的成熟多肽的至少75%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:30或SEQ ID NO:2的成熟多肽的至少80%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:30或SEQ ID NO:2的成熟多肽的至少85%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:30或SEQ ID NO:2的成熟多肽的至少90%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:30或SEQ ID NO:2的成熟多肽的至少95%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:30或SEQ ID NO:2的成熟多肽的至少100%的海藻糖酶活性。
在一个实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,这些多肽具有海藻糖酶活性。在一个方面中,这些多肽与SEQ ID NO:4的成熟多肽相差多至10个氨基酸(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在一个具体实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:4的成熟多肽的至少70%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:4的成熟多肽的至少75%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:4的成熟多肽的至少80%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:4的成熟多肽的至少85%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:4的成熟多肽的至少90%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:4的成熟多肽的至少95%的海藻糖酶活性。
在一个具体的实施例中,本发明涉及与SEQ ID NO:4的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性的多肽,并且其中该多肽具有SEQ ID NO:4的成熟多肽的至少100%的海藻糖酶活性。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:30或SEQ ID NO:2的氨基酸序列或其等位基因变体或者由SEQ ID NO:30或SEQ ID NO:2的氨基酸序列或其等位基因变体组成;或者是其具有海藻糖酶活性的片段。在另一个方面中,该多肽包含SEQ ID NO:30或SEQ ID NO:2的成熟多肽或者由SEQ ID NO:30或SEQ ID NO:2的成熟多肽组成。在另一个方面中,该多肽包含SEQ ID NO:30的氨基酸21至694或SEQ ID NO:2的氨基酸21至697或者由SEQ ID NO:30的氨基酸21至694或SEQ ID NO:2的氨基酸21至697组成。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:4的氨基酸序列或其等位基因变体或者由SEQ ID NO:4的氨基酸序列或其等位基因变体组成;或者是其具有海藻糖酶活性的片段。在另一个方面中,该多肽包含SEQ ID NO:4的成熟多肽或者由SEQ ID NO:4的成熟多肽组成。在另一个方面中,该多肽包含SEQ ID NO:4的氨基酸21至690或者由SEQ ID NO:4的氨基酸21至690组成。
在另一个实施例中,本发明涉及一种具有海藻糖酶活性的多肽,其由多核苷酸编码,所述多核苷酸在高严格条件或非常高严格条件下与以下杂交:(i)SEQ ID NO:29或SEQID NO:1的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体(Sambrook等,1989,Molecular Cloning,A Laboratory Manual,第2版,冷泉港(ColdSpring Harbor),纽约)。在一个实施例中,该多肽已经被分离。
在另一实施例中,本发明涉及具有海藻糖酶活性的多肽,其由多核苷酸编码,所述多核苷酸在高严格条件或非常高严格条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)其cDNA序列,或(iii)(i)或(ii)的全长互补体(Sambrook等,1989,MolecularCloning,A Laboratory Manual,第2版,冷泉港(Cold Spring Harbor),纽约)。在一个实施例中,该多肽已经被分离。
可使用SEQ ID NO:29或SEQ ID NO:1的多核苷酸或其子序列、以及SEQ ID NO:30或SEQ ID NO:2的多肽或其片段来设计核酸探针,以根据本领域已知的方法来从不同属或种的菌株鉴定并克隆编码具有海藻糖酶活性的多肽的DNA。具体而言,此类探针可用于按照标准Southern印迹程序与感兴趣的细胞的基因组DNA或cDNA杂交,以鉴定和分离其中相应的基因。此类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,核酸探针长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),用于检测相应的基因。本发明涵盖此类探针。
可使用SEQ ID NO:3的多核苷酸或其子序列、以及SEQ ID NO:4的多肽或其片段来设计核酸探针,以根据本领域已知的方法从不同属或种的菌株鉴定和克隆编码具有海藻糖酶活性的多肽的DNA。具体而言,此类探针可用于按照标准Southern印迹程序与感兴趣的细胞的基因组DNA或cDNA杂交,以鉴定和分离其中相应的基因。此类探针可明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),用于检测相应的基因。本发明涵盖此类探针。
可以筛选由此类其他菌株制备的基因组DNA或cDNA文库的与上述探针杂交并编码具有海藻糖酶活性的多肽的DNA。来自此类其他菌株的基因组DNA或其他DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的DNA或分离的DNA转移到并固定在硝化纤维素或其他适合的载体材料上。为了鉴定与SEQ ID NO:1或其子序列或SEQID NO:3或其子序列杂交的克隆或DNA,将载体材料用于Southern印迹中。
出于本发明的目的,杂交指示多核苷酸在高至非常高严格条件下与对应于以下的标记的核酸探针杂交:(i)SEQ ID NO:29或SEQ ID NO:1;(ii)SEQ ID NO:29或SEQ ID NO:1的成熟多肽编码序列;(iii)其cDNA序列,(iv)其全长互补体;或(v)其子序列。
出于本发明的目的,杂交指示多核苷酸在高至非常高严格条件下与对应于以下的标记的核酸探针杂交:(i)SEQ ID NO:3;(ii)SEQ ID NO:3的成熟多肽编码序列;(iii)其cDNA序列,(iv)其全长互补体;或(v)其子序列。
可使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下与核酸探针杂交的分子。
在另一个实施例中,本发明涉及具有海藻糖酶活性的多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:29的成熟多肽编码序列或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。在一个另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及具有海藻糖酶活性的多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。在一个另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及具有海藻糖酶活性的多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。在一个另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及在一个或多个(例如,几个)位置处包括取代、缺失、和/或插入的SEQ ID NO:30的成熟多肽的变体。在一个实施例中,引入SEQ ID NO:30的成熟多肽中的氨基酸取代、缺失和/或插入的数目为多至10个,例如1、2、3、4、5、6、7、8、9或10个。
在另一个实施例中,本发明涉及在一个或多个(例如,几个)位置处包括取代、缺失、和/或插入的SEQ ID NO:2的成熟多肽的变体。在一个实施例中,引入SEQ ID NO:2的成熟多肽中的氨基酸取代、缺失和/或插入的数目为多至10个,例如1、2、3、4、5、6、7、8、9或10个。
在另一个实施例中,本发明涉及在一个或多个(例如,几个)位置处包括取代、缺失、和/或插入的SEQ ID NO:4的成熟多肽的变体。在一个实施例中,引入SEQ ID NO:4的成熟多肽中的氨基酸取代、缺失和/或插入的数目为多至10个,例如1、2、3、4、5、6、7、8、9或10个。
这些氨基酸变化可为性质上较不重要的,即,不会显著地影响蛋白的折叠和/或活性的保守氨基酸取代或插入;典型为1-30个氨基酸的小缺失;小的氨基-或羧基-末端延伸,如氨基末端甲硫氨酸残基;多至20-25个残基的小接头肽;或通过改变净电荷或另外的功能促进纯化的小的延伸,如聚组氨酸段、抗原表位或结合结构域。
保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
可替代地,这些氨基酸变化具有这样的性质:改变多肽的物理化学特性。例如,氨基酸变化可改进多肽的热稳定性、改变底物特异性、改变最适pH,等。
可根据本领域中已知的方法,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且测试所得分子的海藻糖酶活性以鉴定对于该分子的活性关键的氨基酸残基。还参见,Hilton等,1996,J.Biol.Chem.271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如通过这样的技术确定:如核磁共振、晶体学、电子衍射或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见,例如,de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。
单个或多个氨基酸取代、缺失和/或插入可使用已知的诱变、重组和/或改组方法、随后进行相关的筛选程序来进行和测试,如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或者WO 95/22625所披露的那些。其他可使用的方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。
诱变/改组方法可与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。可从宿主细胞回收编码活性多肽的诱变的DNA分子,并使用本领域的标准方法快速测序。这些方法允许迅速确定多肽中个体氨基酸残基的重要性。
该多肽可为杂合多肽,其中一个多肽的区域在另一个多肽的区域的N-末端或C-末端处融合。
该多肽可为融合多肽或可切割的融合多肽,其中另一个多肽在本发明多肽的N-末端或C-末端处融合。通过将编码另一个多肽的多核苷酸与本发明多核苷酸融合而产生融合多肽。用于产生融合多肽的技术是本领域已知的,且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于相同的启动子和终止子的控制之下。还可使用内含肽技术构建融合多肽,其中在翻译后产生融合多肽(Cooper等,1993,EMBO J.12:2575-2583;Dawson等,1994,Science 266:776-779)。
融合多肽可进一步包含两个多肽之间的切割位点。在融合蛋白分泌之时,该位点被切割而释放所述两个多肽。切割位点的实例包括但不限于在以下文献中公开的位点:Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-576;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology 9:378-381;Eaton等,1986,Biochemistry 25:505-512;Collins-Racie等,1995,Biotechnology 13:982-987;Carter等,1989,Proteins:Structure,Function,andGenetics 6:240-248;以及Stevens,2003,Drug Discovery World 4:35-48。
具有海藻糖酶活性的多肽的来源
本发明的具有海藻糖酶活性的多肽可从任何属的微生物获得。出于本发明的目的,如本申请中与给出的来源相连使用的术语“从…获得”应当意指由多核苷酸编码的多肽是由该来源或由其中已经插入来自该来源的多核苷酸的菌株产生的。在一方面,将从给定来源获得的多肽分泌至细胞外。
在另一方面,多肽是具有海藻糖酶活性的瘤孢毁丝霉(Myceliophthorasepedonium)多肽或具有海藻糖酶活性的变绿毛壳菌(Chaetomium virescens)多肽。
应理解的是对于前述的种,本发明涵盖完全和不完全阶段(perfect andimperfect states),和其他分类学的等同物(equivalent),例如无性型(anamorph),而与它们已知的种名无关。本领域的技术人员将容易地识别适当等同物的身份。
这些物种的菌株可容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(CentraalbureauVoor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent Culture Collection,NorthernRegional Research Center,NRRL)。
可使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得该多肽。用于从天然生境中直接分离微生物和DNA的技术是本领域已知的。然后可通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用探针检测到编码多肽的多核苷酸,则可通过利用本领域普通技术人员所知的技术(参见,例如Sambrook等,1989,见上文)分离或克隆多核苷酸。
多核苷酸
本发明还涉及编码本发明的多肽的多核苷酸,如本申请中所述。在一个实施例中,编码本发明的多肽的多核苷酸已经被分离。
用于分离或克隆多核苷酸的技术是本领域中已知的且包括从基因组DNA或cDNA或其组合进行分离。可例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选以检测具有共有结构特征的克隆的DNA片段,来实现从基因组DNA克隆多核苷酸。参见例如,Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,纽约。可使用其他核酸扩增程序如连接酶链式反应(LCR)、连接活化的转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可克隆自毁丝霉属的菌株或相关生物体或者毛壳菌属或相关生物体,并且因此,例如可为该多核苷酸的多肽编码区的等位基因变体或种变体。
核酸构建体
本发明还涉及核酸构建体,其包含与一个或多个控制序列可操作地连接的本发明的多核苷酸,所述控制序列指导编码序列在与所述控制序列相容的条件下在合适的宿主细胞中的表达。
可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可为合意的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域已知的。
该控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。该启动子含有转录控制序列,其介导该多肽的表达。该启动子可为在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短的及杂合的启动子,并可从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明的核酸构建体的转录的合适启动子的实例为从以下基因中获得的启动子:解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌(Bacillus thuringiensis)cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology 13:97-107)、大肠杆菌(E.coli)lac操纵子、大肠杆菌trc启动子(Egon等,1988,Gene 69:301-315)、天蓝色链霉菌(Streptomycescoelicolor)琼脂糖酶基因(dagA)、以及原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proc.Natl.Acad.Sci.USA75:3727-3731)以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA 80:21-25)。其他启动子描述于Gilbert等,1980,ScientificAmerican 242:74-94的“来自重组细菌的有用蛋白质(Useful proteins fromrecombinant bacteria)”中;和Sambrook等,1989,见上文中。串联启动子的实例披露于WO99/43835中。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的合适启动子的实例是获得自以下酶的基因的启动子:构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae)TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢(Fusarium oxysporum)胰蛋白酶-样蛋白酶(WO96/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢菌Quinn(WO 00/56900)、米黑)(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延长因子,以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中未翻译的前导序列已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替换;非限制性实例包括来自黑曲霉中性α-淀粉酶的基因的经修饰的启动子,其中未翻译的前导序列已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换);及其变体、截短的及杂合的启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,从以下酶的基因获得有用的启动子:酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。在Romanos等,1992,Yeast 8:423-488中描述了酵母宿主细胞的其他有用启动子。
控制序列也可为由宿主细胞识别以终止转录的转录终止子。终止子与编码该多肽的多核苷酸的3'-末端可操作地连接。在宿主细胞中有功能的任何终止子可用于本发明中。
细菌宿主细胞的优选终止子从以下酶的基因获得:克劳氏芽孢杆菌(Bacillusclausii)碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。
用于丝状真菌宿主细胞的优选终止子从以下酶的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶-样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
用于酵母宿主细胞的优选终止子从以下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用终止子在Romanos等,1992,见上文中描述。
控制序列还可为启动子下游和基因的编码序列上游的mRNA稳定子区,其增加该基因的表达。
合适的mRNA稳定子区的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等,1995,Journal of Bacteriology 177:3465-3471)。
该控制序列还可为前导序列,对宿主细胞翻译重要的mRNA的非翻译区。该前导序列可操作地连接到编码该多肽的多核苷酸的5'末端。可使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。
对于酵母宿主细胞合适的前导序列从以下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列也可为多聚腺苷化序列,与多核苷酸3'-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号的序列。可使用在宿主细胞中有功能的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下酶的基因获得的:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶-样蛋白酶。
对于酵母宿主细胞有用的多聚腺苷酸化序列由Guo和Sherman,1995,Mol.Cellular Biol.15:5983-5990描述。
控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5'-端可固有地包含在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地,编码序列的5'-末端可包含对于编码序列为外来的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可需要外来的信号肽编码序列。可替代地,外来的信号肽编码序列可单纯地替代天然信号肽编码序列以增强多肽的分泌。然而,可使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于细菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:芽孢杆菌NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews 57:109-137描述。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉(Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉(Humicolalanuginosa)脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其他的有用的信号肽编码序列由Romanos等,1992,见上文描述。
控制序列也可为编码处于多肽的N-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可从以下酶的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻该前肽序列的N-末端。
也可为合意的是添加调节序列,所述调节序列调节相对于宿主细胞的生长的多肽的表达。调节序列的实例是引起基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵基因系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些。在真核系统中,这些调控序列包括在甲氨喋呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调控序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体,其可包括一个或多个便利的限制位点以允许编码该多肽的多核苷酸在这些位点处的插入或取代。可替代地,多核苷酸可通过将该多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中使得该编码序列与该用于表达的适当控制序列可操作地连接。
重组表达载体可为可便利地经受重组DNA程序并可带来多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将通常取决于该载体与其中待引入该载体的宿主细胞的相容性。载体可为线性的或闭合的环形质粒。
载体可为自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体或人工染色体。该载体可包含用于确保自我复制的任何装置。可替代地,该载体可为这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的染色体一起复制。此外,可使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒一起包含待引入到宿主细胞的基因组中的总DNA)或转座子。
载体优选包含一个或多个允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养性等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等同物。优选用于曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选用于木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。
选择性标记可为双选择性标记系统,如WO 2010/039889中描述的。在一方面中,双选择性标记是hph-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的元件。
对于整合入该宿主细胞基因组中,载体可依靠编码多肽的多核苷酸序列或者用于通过同源或非同源重组整合入基因组中的该载体的任何其他元件。可替代地,该载体可包含用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置整合的可能性,整合的元件应包含足够数量的核酸,如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,其与相应的靶序列具有高度的序列同一性以增强同源重组的可能性。这些整合元件可为与宿主细胞基因组中的靶序列同源的任何序列。此外,这些整合元件可为非编码多核苷酸或编码多核苷酸。另一方面,载体可通过非同源重组整合入宿主细胞的基因组中。
对于自主复制,载体可进一步包括使该载体能够在所述的宿主细胞中自主复制的复制起点。复制起点可为在细胞中有功能的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体能够在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。
用于丝状真菌细胞中的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Res.15:9163-9175;WO 00/24883)。可根据WO 00/24883中公开的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下获得:将序列的至少一个额外拷贝整合入宿主细胞基因组,或包括与多核苷酸一起的可扩增的选择性标记基因,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接以上所描述的元件以构建本发明的重组表达载体的方法是本领域的技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,其包含本发明的多核苷酸,该多核苷酸可操作地连接于一个或多个控制序列,该一个或多个控制序列指导本发明的多肽的产生。将包含多核苷酸的构建体或载体引入宿主细胞中,使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择会在很大程度上取决于编码该多肽的基因及其来源。
宿主细胞可为在本发明的多肽的重组产生中有用的任何细胞,例如原核细胞或真核细胞。
原核宿主细胞可为任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、和链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单孢菌属、沙门氏菌属、和脲原体属。
细菌宿主细胞可为任何芽孢杆菌属细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。
细菌宿主细胞还可为任何链球菌属细胞,包括但不限于:似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。
细菌宿主细胞还可为任何链霉菌属细胞,包括但不限于:不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌以及浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:原生质体转化(参见,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115)、感受态细胞转化(参见,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见,例如,Koehler和Thorne,1987,J.Bacteriol.169:5271-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见例如,Dower等,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞:原生质体转化,电穿孔(参见,例如,Gong等,2004,Folia Microbiol.(Praha)49:399-405)、接合(参见例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞:电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods 64:391-397)或接合(参见例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞:例如天然感受态(natural competence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,Catt和Jollick,1991,Microbios 68:189-207),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)、或者接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可使用本领域已知的将DNA引入宿主细胞的任何方法。
宿主细胞还可为真核生物,如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可为真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等,于:Ainsworth and Bisby'sDictionary of The Fungi,第8版,1995,CAB International,University Press,剑桥(Cambridge),英国)所定义的。
真菌宿主细胞可为酵母细胞。如本申请中使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类可在将来变化,出于本发明的目的,酵母应当如Biology and Activities of Yeast(Skinner,Passmore和Davenport编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所描述的那样定义。
酵母宿主细胞可为假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁弗酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。
丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可为泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporium merdarium)、Chrysosporium pannicola、Chrysosporium queenslandicum、热带金孢子菌、褐薄金孢子菌(Chrysosporiumzonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
真菌细胞能通过涉及原生质体形成、原生质体的转化和细胞壁的再生的过程以本身已知的方式进行转化。用于转化曲霉属和木霉属宿主细胞的合适方法描述于EP 238023、Yelton等,1984,Proc.Natl.Acad.Sci.USA 81:1470-1474以及Christensen等,1988,Bio/Technology 6:1419-1422中。用于转化镰孢属菌种的合适方法在Malardier等,1989,Gene78:147-156和WO96/00787中描述。可使用由如以下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and MolecularBiology,Methods in Enzymology,第194卷,第182-187页,Academic Press,Inc.,纽约;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA 75:1920。
产生方法
本发明还涉及产生本发明的多肽的方法,包含(a)在有益于产生该多肽的条件下培养细胞,该细胞以其野生型形式产生该多肽;和任选地(b)回收该多肽。在一个方面中,该细胞是毁丝霉属(Myceliophthora)细胞。在另一个方面中,该细胞是瘤孢毁丝霉(Myceliophthora sepedonium)细胞。在一方面,该细胞是毛壳菌属(Chaetomium)细胞。在另一方面,该细胞是变绿毛壳菌(Chaetomium virescens)细胞。
本发明还涉及产生本发明的多肽的方法,包括(a)在有益于产生该多肽的条件下培养本发明的重组宿主细胞;和任选地,(b)回收该多肽。
这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的营养培养基中培养的。例如,可通过摇瓶培养、或在实验室或工业发酵器中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,所述培养在适合的培养基中并且在允许表达和/或分离多肽的条件下进行。该培养是使用本领域中已知的方法在合适的营养培养基中发生,所述营养培养基包括碳源和氮源及无机盐。合适的培养基可从商业供应商获得或可根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽被分泌到该营养培养基中,那么可直接从培养基中回收多肽。如果多肽不分泌,那么其可从细胞裂解物中回收。
可使用对于该多肽为特异的本领域已知的方法检测该多肽。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可使用酶测定法来确定多肽的活性。
可使用本领域已知的方法来回收多肽。例如,可通过常规方法,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养培养基回收多肽。在一方面,回收包含多肽的发酵液。
可通过本领域已知的多种方法纯化多肽以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification,Janson和Ryden编,VCH Publishers,纽约,1989)。
在一个替代的方面,不回收多肽,而是将表达该多肽的本发明的宿主细胞用作多肽的来源。
植物中的产生
本发明还涉及分离的植物,例如转基因植物、植物部分或植物细胞,其包括本发明的多肽,从而以可回收的量表达和产生多肽或结构域。可从植物或植物部分回收多肽或结构域。作为替代方案,包括该多肽或结构域的植物或植物部分可以按原样用于改进食品或饲料的质量,例如改进营养值、适口性及流变学特性,或破坏抗营养因子。
转基因植物可为双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草地早熟禾(蓝草,早熟禾属);饲用草,如羊茅属(Festuca)、黑麦草属(Lolium);温带草,如翦股颖属(Agrostis);和谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。
双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugarbeet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(familyBrassicaceae))(如花椰菜、油菜籽、以及紧密相关的模式生物拟南芥)。
植物部分的实例是茎、愈伤组织、叶、根、果实、种子和块茎、以及包括这些部分的独立组织,例如,表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。
植物细胞和具体的植物细胞区室(如叶绿体、质外体、线粒体、液泡、过氧化物酶体和细胞质)也被认为是植物部分。
同样包括于本发明范围内的是这些植物、植物部分以及植物细胞的后代。
可根据本领域已知的方法构建表达该多肽或结构域的转基因植物或植物细胞。
本发明还涉及产生本发明的多肽或结构域的方法,其包括(a)在有益于产生该多肽或结构域的条件下培养转基因植物或植物细胞,该转基因植物或植物细胞包含编码该多肽或结构域的多核苷酸;和(b)回收该多肽或结构域。
发酵液配制物或细胞组合物
本发明还涉及包括本发明的多肽的发酵液配制物或细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分,例如,细胞(包括含有编码本发明的多肽的基因的宿主细胞,其被用于产生感兴趣的多肽)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是含有有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。
如在本申请中使用的术语“发酵液”指由细胞发酵产生的、不经历或经历最少的回收和/或纯化的制备物。例如,当微生物培养物在允许蛋白质合成(例如,由宿主细胞表达酶)并且将蛋白质分泌到细胞培养基中的碳限制条件下温育生长到饱和时,产生发酵液。发酵液可包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的且包括耗尽的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。
在一个实施例中,该发酵液配制物和细胞组合物包含第一有机酸组分(包含至少一种1-5碳的有机酸和/或其盐)和第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在一个具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述中的两种或更多种的混合物;且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐,或前述中的两种或更多种的混合物。
在一方面中,该组合物包含有机酸,并且任选地进一步包含杀灭的细胞和/或细胞碎片。在一个实施例中,从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片,以提供不含这些组分的组合物。
这些发酵液配制物或细胞组合物可进一步包括防腐剂和/或抗微生物(例如,抑菌)剂,其包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。
该细胞杀灭的全培养液或组合物可包含在发酵结束时得到的发酵材料的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下温育以允许蛋白合成之后存在的细胞碎片。在一些实施例中,该细胞杀灭的全培养液或组合物包含用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中,可使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。
如本申请中描述的,全培养液或细胞组合物典型地是液体,但是可以包含不溶性组分,例如杀灭的细胞、细胞碎片、培养基组分和/或不溶性酶。在一些实施例中,可除去不溶性组分以提供澄清的液体组合物。
本发明的全培养液配制物和细胞组合物可通过WO 90/15861或WO2010/096673中所描述的方法来产生。
酶组合物
本发明还涉及包含本发明的具有海藻糖酶活性的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”指示,该组合物的海藻糖酶活性已经增加,例如,以至少1.1的富集因数(enrichment factor)增加。
这些组合物可包括本发明的多肽作为主要酶组分,例如单组分组合物。可替代地,这些组合物可包含多种酶活性,如一种或多种(例如,若干种)选自下组的酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂合酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
在另一个具体实施例中,该组合物包含本发明的海藻糖酶以及葡糖淀粉酶。在一个实施例中,该组合物包含本发明的海藻糖酶和源自埃默森踝节菌的葡糖淀粉酶(例如,SEQ ID NO:13)。在一个实施例中,该组合物包含本发明的海藻糖酶和源自粘褶菌属(Gloeophyllum),如篱边粘褶菌(G.sepiarium)(例如,SEQ ID NO:19)或密粘褶菌(Gloeophyllum trabeum)(例如,SEQ ID NO:20)的葡糖淀粉酶。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶以及α-淀粉酶。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶以及源自根毛霉属(Rhizomucor),优选微小根毛霉(Rhizomucorpusillus)的菌株,如具有接头(例如,来自黑曲霉)和淀粉结合域(例如,来自黑曲霉)的微小根毛霉α-淀粉酶杂合体的α-淀粉酶。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶、α-淀粉酶以及纤维素分解酶组合物。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶、α-淀粉酶以及纤维素分解酶组合物,其中所述纤维素分解酶组合物源自里氏木霉。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶、α-淀粉酶以及蛋白酶。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶、α-淀粉酶以及蛋白酶。所述蛋白酶可源自桔橙嗜热子囊菌(Thermoascus aurantiacus)。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶、α-淀粉酶、纤维素分解酶组合物以及蛋白酶。在一个实施例中,该组合物包含本发明的海藻糖酶、葡糖淀粉酶(例如源自埃默森踝节菌、篱边粘褶菌或密粘褶菌的葡糖淀粉酶)、α-淀粉酶(例如源自微小根毛霉的,特别是具有接头和淀粉结合域(特别是源自黑曲霉)的,特别是具有如下取代的:G128D+D143N(使用SEQ ID NO:15用于编号));源自里氏木霉的纤维素分解酶组合物,和蛋白酶(例如源自桔橙嗜热子囊菌)。
具体涵盖的次要的酶的实例,例如,本申请SEQ ID NO:13中所示的源自埃默森踝节菌的葡糖淀粉酶或与本申请SEQ ID NO:13具有例如至少60%,至少70%,至少80%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%同一性的葡糖淀粉酶,可见于下文的“酶”一节中。
这些组合物可根据本领域已知的方法制备,并可为液体或干燥组合物的形式。这些组合物可根据本领域中已知的方法进行稳定化。
下文中给出本发明的组合物的优选用途的实例。组合物的剂量以及组合物使用的其他条件可基于本领域已知的方法来确定。
本发明的方法
使用本发明的海藻糖酶从糊化的淀粉材料产生发酵产物
在此方面,本发明涉及从糊化的和/或未糊化的含淀粉材料或纤维素材料产生发酵产物,特别是乙醇。在糖化/水解过程中生成的可发酵糖在通过发酵生物(特别是酵母)的发酵过程中转化为所述的合意的发酵(产物),特别是乙醇。
在一个实施例中,本发明涉及生产一种发酵产物特别是乙醇的工艺,该工艺包括
(a)用α-淀粉酶使含淀粉材料液化;
任选在步骤(b)之前使所液化的材料预糖化;
(b)使所液化的材料糖化;
(c)使用发酵生物进行发酵;
其中
i)葡糖淀粉酶;
ii)本发明的海藻糖酶;
iii)任选的纤维素分解酶组合物和/或蛋白酶;
在以下步骤的过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
液化步骤(a)
根据本发明的方法,步骤(a)中的液化通过如下进行:将含淀粉材料在起始糊化温度以上的温度(特别是在80℃-90℃的温度)用α-淀粉酶和任选的蛋白酶和其他酶(如葡糖淀粉酶、普鲁兰酶和/或肌醇六磷酸酶)处理。
术语“起始糊化温度”意指含淀粉材料糊化开始的最低温度。通常,在水中加热的淀粉在约50℃-75℃开始糊化;糊化的准确温度取决于具体的淀粉,并能够由本领域的技术人员容易地确定。因此,起始糊化温度可根据植物物种、植物物种的具体品种、以及生长条件而变化。在本发明的上下文中,给定的含淀粉材料的起始糊化温度可确定为使用由Gorinstein和Lii,1992,Starch/44(12):461-466所描述的方法,在5%的淀粉颗粒中丧失双折射的温度。
根据本发明,步骤(a)中的液化典型地在从70℃-100℃范围的温度进行。在一个实施例中,液化中的温度为75℃-95℃,如在75℃-90℃,优选80℃-90℃,如82℃-88℃,如约85℃。
液化中的pH可在3-7,优选4-6,或更优选4.5-5.5范围。
根据本发明,在步骤(a)中的液化之前,可进行喷射蒸煮(jet-cooking)步骤。该喷射蒸煮可在110℃-145℃,优选120℃-140℃,如125℃-135℃,优选约130℃的温度进行约1-15分钟,优选进行约3-10分钟,尤其是大约5分钟。
在一个实施例中,本发明的方法在液化步骤(a)之前进一步包括以下步骤:
x)减小含淀粉材料的粒度,优选通过干磨进行;
z)形成包含该含淀粉材料和水的浆料。
根据本发明,液化中的干固体含量(DS)在20-55wt.-%,优选25-45wt.-%,更优选30-40wt.-%或30-45wt-%的范围。
该含淀粉起始材料(如全谷物)可(例如通过磨制)减少粒度以打开结构、增大表面积并且允许进一步加工。通常,存在以下两种类型的方法:湿磨和干磨。在干磨中,将整粒磨碎并且使用。湿磨给出胚和粗粉(淀粉颗粒和蛋白质)的良好分离。湿磨常常应用于使用淀粉水解物产生例如糖浆的场合(location)。干磨和湿磨在淀粉加工领域中都是众所周知的。根据本发明,优选干磨。
在一个实施例中,将粒度减小至0.05至3.0mm、优选0.1-0.5mm,或使得至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%的含淀粉材料适合通过具有0.05至3.0mm筛网、优选0.1-0.5mm筛网的筛子。在另一个实施例中,至少50%,优选至少70%,更优选至少80%,尤其是至少90%的含淀粉材料适合通过具有#6筛网的筛子。
步骤(a)中的液化可进行0.5-5小时,如1-3小时,如典型地约2小时。
起初可将α-淀粉酶和其他任选的酶如蛋白酶添加到水性浆料中来开始液化(稀化)。在一个实施例中,这些酶中仅有一部分(例如,约1/3)被添加到该水性浆料中,而这些酶中的剩余部分(例如,约2/3)在液化步骤(a)中添加。
α-淀粉酶的实例的非穷尽列表可见于下文“液化中存在和/或添加的α-淀粉酶”一节中。在一个优选的实施例中,该a-淀粉酶是细菌α-淀粉酶。细菌α-淀粉酶典型地是热稳定性的。在一个优选的实施例中,该α-淀粉酶源自芽孢杆菌属,如嗜热脂肪芽孢杆菌的菌株,特别是嗜热脂肪芽孢杆菌α-淀粉酶的变体,如WO 99/019467中的SEQ ID NO:3或本申请中的SEQ ID NO:18中所示的。
在一个实施例中,液化步骤(a)中使用的α-淀粉酶是本申请中的SEQ ID NO:18中所示的嗜热脂肪芽孢杆菌α-淀粉酶的变体,特别是具有I181*+G182*中的双缺失,和任选地具有N193F取代,并被截短以成为长度约491个氨基酸,例如长度为480-495个氨基酸。
合适的嗜热脂肪芽孢杆菌α-淀粉酶变体的实例可见于下文“热稳定性α-淀粉酶”一节,并包括来自具有双缺失I181*+G182*,和任选的N193F取代,和另外的以下取代的嗜热脂肪芽孢杆菌α-淀粉酶变体的下组中的一种:
-E129V+K177L+R179E;
-V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S;
-V59A+Q89R+E129V+K177L+R179E+Q254S+M284V;
-V59A+E129V+K177L+R179E+Q254S+M284V;和
-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S(使用SEQ ID NO:18用于编号)。
根据本发明的方法,步骤(a)中的液化可使用α-淀粉酶(例如,SEQ ID NO:18中所示的嗜热脂肪芽孢杆菌α-淀粉酶)和蛋白酶(例如,SEQ ID NO:22中所示的激烈火球菌(Pyrococcus furiosus)(pfu蛋白酶))的组合进行。也可以存在葡糖淀粉酶,如本申请SEQID NO:23中所示源自草酸青霉(Penicillium oxalicum)的(参见下文“液化步骤(a)中存在和/或添加的葡糖淀粉酶”一节。
糖化与发酵
本发明的海藻糖酶、葡糖淀粉酶和任选的蛋白酶和/或纤维素分解酶组合物可在以下步骤中存在和/或添加:糖化步骤(b);发酵步骤(c);同时的糖化和发酵(SSF);任选的在步骤(b)之前的预糖化步骤。
在一个优选的实施例中,葡糖淀粉酶是与真菌α-淀粉酶,特别是酸性真菌α-淀粉酶一起添加的。葡糖淀粉酶的实例可见于下文“糖化和/或发酵中存在和/或添加的葡糖淀粉酶”一节。
当进行顺序的糖化和发酵时,糖化步骤(b)可在本领域中已知的条件下(即,适于酶糖化)进行。例如,糖化步骤(b)可持续多至约24至约72小时。
在一个实施例中,在步骤(b)中的糖化之前进行预糖化。预糖化在30℃-65℃,典型地约60℃的温度典型地进行40-90分钟。在一个实施例中,在同时糖化和发酵(SSF)中,预糖化之后是发酵过程中的糖化。糖化典型地在20℃-75℃,优选40℃-70℃,典型地约60℃的温度和在4-5的pH、一般在约pH 4.5进行。
同时糖化和发酵(“SSF”)广泛地用于工业规模的发酵产物生产方法中,尤其是乙醇生产方法中。当进行SSF时,同时进行糖化步骤(b)和发酵步骤(c)。不存在针对糖化的保持阶段,意指发酵生物(特别是酵母)和酶可一起添加。然而,还涵盖分开添加发酵生物和酶。根据本发明,SSF可典型地在25℃至40℃,如28℃至35℃,如30℃至34℃、优选大约32℃的温度进行。在一个实施例中,发酵进行6至120小时,尤其是24至96小时。在一个实施例中,pH为4-5。
在本发明的一个实施例中,在糖化步骤(b)、发酵步骤(c)或同时糖化发酵(SSF)或步骤(b)之前的预糖化中存在和/或添加纤维素分解组合物。此类纤维素分解组合物的实例可见于下文“糖化和/或发酵期间存在和/或添加的纤维素分解组合物”一节。任选的纤维素分解组合物可与葡糖淀粉酶和本发明的海藻糖酶一起存在和/或添加。蛋白酶的实例可见于下文“糖化和/或发酵中存在和/或添加的蛋白酶”一节。
在一个优选的实施例中,海藻糖酶以0.01-20ug EP海藻糖酶/g DS,如0.05-15ugEP海藻糖酶/g DS,如0.5-10ug EP海藻糖酶/g DS的量存在和/或添加。
含淀粉材料
根据本发明,可使用任何合适的含淀粉材料。通常基于期望的发酵产物(特别是乙醇)来选择起始材料。适用于本发明的方法的含淀粉起始材料的实例包括谷类、块茎或谷物。具体地,含淀粉材料可为玉米、小麦、大麦、黑麦、买罗高粱、西米、木薯(cassava)、树薯(tapioca)、高粱、燕麦、水稻、豌豆、豆类、或甘薯、或它们的混合物。还涵盖糯型与非糯型(waxy and non-waxy types)的玉米与大麦。
在一个优选实施例中,含淀粉起始材料是玉米。
在一个优选实施例中,含淀粉起始材料是小麦。
在一个优选实施例中,含淀粉起始材料是大麦。
在一个优选实施例中,含淀粉起始材料是黑麦。
在一个优选实施例中,含淀粉起始材料是买罗高粱。
在一个优选实施例中,含淀粉起始材料是西米。
在一个优选实施例中,含淀粉起始材料是木薯。
在一个优选实施例中,含淀粉起始材料是树薯。
在一个优选实施例中,含淀粉起始材料是高粱。
在一个优选实施例中,含淀粉起始材料是水稻,
在一个优选实施例中,含淀粉起始材料是豌豆。
在一个优选实施例中,含淀粉起始材料是豆类。
在一个优选实施例中,含淀粉起始材料是甘薯。
在一个优选实施例中,含淀粉起始材料是燕麦。
使用本发明的海藻糖酶从未糊化的淀粉材料产生发酵产物
本发明的海藻糖酶可合适地用于生淀粉水解(RSH)工艺用于产生合意的发酵产物,特别是乙醇。在RSH工艺中,因为该工艺是在低于所述淀粉的起始糊化温度(上文定义的)的温度进行,淀粉不糊化。
在一个实施例中,合意的发酵产物可为从未糊化的(即未蒸煮的)、优选研磨的谷物(如玉米)或小粒谷物(例如小麦、燕麦、大麦、黑麦、水稻)或谷类(例如高粱)生产的乙醇。合适的含淀粉起始材料的实例在上文“含淀粉材料”一节中列出。
因此,在此方面,本发明涉及从含淀粉材料产生发酵产物的工艺,其包括:
(a)在起始糊化温度以下的温度使含淀粉材料糖化;和
(b)使用发酵生物进行发酵;和
(c)任选地回收所述发酵产物;
其中糖化和/或发酵在以下酶的存在下进行:葡糖淀粉酶,α-淀粉酶,本发明的海藻糖酶,和任选的纤维素分解酶组合物和/或蛋白酶。
在步骤(a)之前,可制备具有含淀粉材料的10-55wt.%干固体(DS)、优选25-45wt.%干固体、更优选30%-40%干固体的含淀粉材料(如颗粒状淀粉)的水性浆料。该浆料可包括水和/或工艺用水,如釜馏物(逆流)、洗涤器水、蒸发器冷凝物或馏出物、由蒸馏得到的侧线汽提器水,或来自其他发酵产物设备(plant)的工艺用水。因为本发明的生淀粉水解工艺是在低于该起始糊化温度进行的,而因此不发生显著的粘度增加,如果希望的话,可使用高水平的釜馏物。在一个实施例中,水性浆料含有约1vol.%至约70vol.%、优选15vol.%-60vol.%、尤其是约30vol.%至50vol.%的水和/或工艺用水,如釜馏物(逆流)、洗涤器水、蒸发器冷凝物或馏出物、由蒸馏得到的侧线汽提器水,或来自其他发酵产物设备的工艺用水,或其组合等。
在一个实施例中,在步骤(a)之前,将逆流或另一再循环流添加至浆料,或添加至糖化(步骤(a)),或添加至同时糖化和发酵步骤(组合的步骤(a)和步骤(b))。
本发明的RSH工艺是在起始糊化温度以下的温度进行的,这意指进行单独的步骤(a)的温度典型地在25℃-75℃、例如30℃-70℃、或45℃-60℃的范围。
在一个优选实施例中,在步骤(b)中的发酵或步骤(a)和(b)中的同时糖化和发酵期间的温度为25℃-40℃、优选28℃-36℃、如在28℃-35℃、如28℃-34℃、如约32℃。
在本发明的一个实施例中,发酵进行30至150小时,优选48至96小时。66.
在一个实施例中,进行发酵使得糖水平如葡萄糖水平保持在低水平,如6wt.-%以下、如约3wt.-%以下、如约2wt.-%以下、如约1wt.-%以下、如约0.5%以下、或0.25%wt.-%以下、如约0.1wt.-%以下。通过简单地采用调整量的酶和发酵生物可实现这样的低水平的糖。本领域的技术人员可容易地确定待使用的酶和发酵生物的剂量/数量。还可选择酶和发酵生物的所采用的量以在发酵液中维持低麦芽糖浓度。例如,麦芽糖水平可保持在约0.5wt.-%以下,如约0.2wt.-%以下。
本发明的工艺可在3-7、优选3至6、或更优选3.5至5.0的pH进行。
术语“颗粒状淀粉”意思指未蒸煮的生淀粉,即,例如在谷类、块茎或谷物中发现的呈其天然形式的淀粉。淀粉是在植物细胞内作为不溶于水的微小颗粒形成。当放入冷水中时,这些淀粉颗粒可吸收少量的液体并膨胀。在高至约50℃至75℃的温度,膨胀可为可逆的。然而,在更高温度下,开始称为“糊化”的不可逆膨胀。颗粒状淀粉可为高度精制的淀粉,优选至少90%、至少95%、至少97%或至少99.5%纯,或它可为含更粗制的淀粉的材料,其包括(例如,磨制的)全谷物,所述全谷物包含非淀粉级分,例如胚残余物和纤维。
该原材料(如全谷物)可例如通过磨制减小粒度,以打开结构并且允许进一步加工。合适的粒度的实例在US 4514496和WO 2004/081193(两篇文件通过提述并入)中公开。根据本发明,两种工艺是优选的:湿磨和干磨。在干磨中,将整个谷粒磨制并使用。湿磨给出胚与粗粉(淀粉颗粒和蛋白)的良好分离,并且常常应用于使用淀粉水解产物生产例如糖浆的场合(location)。干磨和湿磨两者都是淀粉加工领域中熟知的。
在一个实施例中,将粒度减小至0.05至3.0mm、优选0.1-0.5mm,或使得至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%的含淀粉材料适合通过具有0.05至3.0mm筛网、优选0.1-0.5mm筛网的筛子。在一个优选实施例中,通过减小含淀粉材料的粒度(优选通过磨制)使得至少50%的含淀粉材料具有0.1-0.5mm的粒度,来制备含淀粉材料。
在一个优选实施例中,海藻糖酶以0.01-20ug EP海藻糖酶/g DS,如0.05-15ug EP海藻糖酶/g DS,如0.5-10ug EP海藻糖酶/g DS的量存在和/或添加。
根据本发明,添加酶使得葡糖淀粉酶以0.001至10AGU/g DS、优选0.01至5AGU/gDS、尤其是0.1至0.5AGU/g DS的量存在。
根据本发明,添加酶使得α-淀粉酶以0.001至10AFAU/g DS,优选0.01至5AFAU/gDS,尤其是0.3至2AFAU/g DS或0.001至1FAU-F/g DS,优选0.01至1FAU-F/g DS的量存在或添加。
根据本发明,添加酶使得纤维素分解酶组合物以1-10,000微克EP/g DS,如2-5,000,如3-1,000,如4-500微克EP/g DS的量存在或添加。
根据本发明,添加酶使得纤维素分解酶组合物以0.1-100FPU/克总固体(TS)、优选0.5-50FPU/克TS、尤其是1-20FPU/克TS的量存在或添加。
在本发明的一个实施例中,添加酶使得蛋白酶以0.0001-1mg酶蛋白/g DS,优选0.001至0.1mg酶蛋白/g DS的量存在。可替代地,蛋白酶以0.0001至1LAPU/g DS,优选0.001至0.1LAPU/g DS和/或0.0001至1mAU-RH/g DS,优选0.001至0.1mAU-RH/g DS的量存在。
在本发明的一个实施例中,添加酶使得蛋白酶以1-1,000μg EP/g DS,如2-500μgEP/g DS,如3-250μg EP/g DS范围的量存在或添加。
在一个优选实施例中,葡糖淀粉酶和α-淀粉酶之间的比率为99:1-1:2,如98:2-1:1,如在97:3-2:1,如在96:4-3:1之间,如97:3、96:4、95:5、94:6、93:7、90:10、85:15、83:17或65:35(mg EP葡糖淀粉酶:mg EPα-淀粉酶)。
在一个优选实施例中,根据本发明,葡糖淀粉酶和α-淀粉酶的总剂量为10-1,000μg/g DS,如50-500μg/g DS,如75-250μg/g DS。
在一个优选实施例中,添加的纤维素分解酶组合物的总剂量为10-500μg/g DS,如从20-400μg/g DS,如20-300μg/g DS。
在一个实施例中,发酵或SSF中使用的葡糖淀粉酶(如源自瓣环栓菌(Trametescingulata)的葡糖淀粉酶)与SEQ ID NO:14的成熟部分显示至少60%,如至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或甚至100%同一性。
在一个实施例中,发酵或SSF中使用的葡糖淀粉酶(如源自血红密孔菌(Pycnoporus sanguineus)的葡糖淀粉酶)与SEQ ID NO:28的成熟部分显示至少60%,如至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或甚至100%同一性。
在一个实施例中,发酵或SSF中使用的α-淀粉酶与SEQ ID NO:15的成熟部分显示至少60%,如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%同一性。
在一个优选实施例中,本发明涉及从含淀粉材料产生发酵产物的方法,其包括:
(a)在起始糊化温度以下的温度使含淀粉材料糖化;和
(b)使用发酵生物进行发酵;
其中在以下酶的存在下进行糖化和/或发酵:
i)葡糖淀粉酶;
ii)α-淀粉酶;
iii)本发明的海藻糖酶;
iii)任选的纤维素分解酶组合物和/或蛋白酶。
在一个优选实施例中,可以作为本发明的酶组合物来添加酶。在一个优选实施例中,同时进行步骤(a)和步骤(b)(即,一步发酵)。然而,也可以顺序地进行步骤(a)和(b)。
发酵
在发酵培养基中进行发酵。发酵培养基包括发酵底物,即,通过发酵生物代谢的碳水化合物源。根据本发明,发酵培养基可包括用于发酵生物的营养物和生长刺激物。营养物和生长刺激物在发酵领域中广泛使用,且包括氮源如氨;尿素,维生素和矿物质,或其组合。
用于基于淀粉的发酵的发酵生物
术语“发酵生物”指适合用于发酵过程中并且能够产生所希望的发酵产物的任何生物,包括细菌和真菌生物,尤其是酵母。尤其合适的发酵生物能够使糖(如葡萄糖或麦芽糖)直接或间接发酵(即,转化)成所合意的发酵产物(如特别是乙醇)。发酵生物的实例包括真菌生物,如特别是酵母。优选的酵母包括酵母属菌种,特别是酿酒酵母的菌株。
在发酵(如SSF)过程中,活发酵生物的合适的浓度是本领域中熟知的,或可由本领域的技术人员容易地确定。在一个实施例中,将该发酵生物(如乙醇发酵酵母(例如,酿酒酵母))添加至发酵培养基中,使得每mL的发酵培养基的活发酵生物(如酵母)计数在105至1012,优选107至1010,尤其是约5x 107个的范围。
可商购的酵母的实例包括,例如RED STARTM和ETHANOL REDTM酵母(可获得自Fermentis/Lesaffre,美国),FALI(可获得自Fleischmann’s Yeast,美国),SUPERSTART和THERMOSACCTM新鲜酵母(可获得自Ethanol Technology,威斯康星州(WI),美国),BIOFERMAFT和XR(可获得自NABC-North American Bioproducts Corporation,佐治亚州(GA),美国),GERT STRAND(可获得自Gert Strand AB,瑞典)以及FERMIOL(可获得自DSMSpecialties)。
回收
在发酵(例如,SSF)后,可将发酵产物(特别是乙醇)从发酵培养基中分离。可蒸馏该浆料以回收/提取合意的发酵产物(即,乙醇)。可替代地,可通过微滤或膜过滤技术从发酵培养基中提取合意的发酵产物(即,乙醇)。还可通过汽提或本领域中熟知的其他方法来回收发酵产物(即,乙醇)。
液化中存在和/或添加的α-淀粉酶
根据本发明,α-淀粉酶,任选地与其他酶如蛋白酶、葡糖淀粉酶、肌醇六磷酸酶和/或普鲁兰酶一起,在液化中存在和/或添加。
在液化步骤(a)中添加的α-淀粉酶可为任何α-淀粉酶。优选的是细菌α-淀粉酶,其在液化过程中使用的温度通常是稳定的。
细菌α-淀粉酶
术语“细菌α-淀粉酶”意指在EC 3.2.1.1项下分类的任何细菌α-淀粉酶。根据本发明使用的细菌α-淀粉酶可例如源自芽孢杆菌属(有时也称作地芽孢杆菌属)的菌株。在一个实施例中,该芽孢杆菌属α-淀粉酶源自解淀粉芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌的菌株,但是也可源自其他芽孢杆菌属菌种。
细菌α-淀粉酶的具体实例包括WO 99/19467中的SEQ ID NO:3或本申请中的SEQID NO:18的嗜热脂肪芽孢杆菌α-淀粉酶,WO 99/1946中的SEQ ID NO:5的解淀粉芽孢杆菌α-淀粉酶,以及WO 99/19467中的SEQ ID NO:4的地衣芽孢杆菌α-淀粉酶(所有序列都通过提述由此并入)。在一个实施例中,该α-淀粉酶可为分别与WO 99/19467中的SEQ ID NO:3、4或5所示的任何序列具有至少60%,例如至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性程度的酶。
在一个实施例中,该α-淀粉酶可为与WO 99/19467中的SEQ ID NO:3或本申请中的SEQ ID NO:18所示的任何序列具有至少60%,例如至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性程度的酶。
在优选的实施例中,该α-淀粉酶源自嗜热脂肪芽孢杆菌。该嗜热脂肪芽孢杆菌α-淀粉酶可为成熟野生型或其成熟变体。该成熟嗜热脂肪芽孢杆菌α-淀粉酶可为在重组产生过程中天然地截短的。例如,该嗜热脂肪芽孢杆菌α-淀粉酶可为截短的,因此它具有约491个氨基酸,例如,使得它为480-495个氨基酸长,因而它缺乏功能性淀粉结合结构域(相较于WO 99/19467中的SEQ ID NO:3)或本申请中的SEQ ID NO:18。
该芽孢杆菌α-淀粉酶还可为变体和/或杂合体。这样的变体的实例可见于以下任一者中:WO 96/23873、WO 96/23874、WO 97/41213、WO 99/19467、WO 00/60059、以及WO 02/10355(所有文件都通过提述由此并入)。具体的α-淀粉酶变体在美国专利号6,093,562、6,187,576、6,297,038和7,713,723中披露(通过提述由此并入)并包括具有以下改变的嗜热脂肪芽孢杆菌α-淀粉酶(常常称作BSGα-淀粉酶)变体:在位置R179、G180、I181和/或G182处的一个或两个氨基酸的缺失,优选WO 96/23873中披露的双缺失-参见例如第20页,第1-10行(通过提述由此并入),优选与WO 99/19467中披露的SEQ ID NO:3或本申请中的SEQ IDNO:1所述的嗜热脂肪芽孢杆菌α-淀粉酶的氨基酸序列相比对应于位置I181和G182的缺失,或使用WO99/19467(该参考文件通过提述由此并入)中的SEQ ID NO:3或本申请中的SEQ IDNO:1用于编号的氨基酸R179和G180的缺失。甚至更优选的是芽孢杆菌属α-淀粉酶,尤其是嗜热脂肪芽孢杆菌α-淀粉酶,它与WO 99/19467中披露的SEQ ID NO:3或本申请中的SEQ IDNO:18所述的野生型BSGα-淀粉酶氨基酸序列相比具有对应于位置181和182的缺失的双缺失并进一步包括N193F取代(也表示为I181*+G182*+N193F)。细菌α-淀粉酶还可在对应于WO99/19467中的SEQ ID NO:4所示的地衣芽孢杆菌α-淀粉酶中的S239、或WO 99/19467中的SEQ ID NO:3或本申请中的SEQ ID NO:18的嗜热脂肪芽孢杆菌α-淀粉酶的S242和/或E188P变体的位置处具有取代。
在一个实施例中,该变体是嗜热脂肪芽孢杆菌α-淀粉酶的S242A、E或Q变体,优选S242Q变体(使用本申请中的SEQ ID NO:18用于编号)。
在一个实施例中,该变体是嗜热脂肪芽孢杆菌α-淀粉酶的位置E188变体,优选E188P变体(使用本申请中的SEQ ID NO:18用于编号)。
在一个实施例中,细菌α-淀粉酶可为截短的芽孢杆菌属α-淀粉酶。尤其地,截短是这样的,例如,使得WO 99/19467中的SEQ ID NO:3或本申请中的SEQ ID NO:18中所示的嗜热脂肪芽孢杆菌α-淀粉酶是约491个氨基酸长,如480至495个氨基酸长,或者因此其缺乏功能性淀粉结合结构域。
细菌杂合α-淀粉酶
该细菌α-淀粉酶也可为杂合细菌α-淀粉酶,例如包含地衣芽孢杆菌α-淀粉酶(WO99/19467的SEQ ID NO:4中所示)的445个C-末端氨基酸残基和源自解淀粉芽孢杆菌的α-淀粉酶(WO 99/19467的SEQ ID NO:5中所示)的37个N-末端氨基酸残基的α-淀粉酶。在一个优选的实施例中,该杂合体具有下列取代中的一个或多个,尤其是全部:
G48A+T49I+G107A+H156Y+A181T+N190F+I201F+A209V+Q264S(使用WO 99/19467的SEQ ID NO:4中的地衣芽孢杆菌编号)。还优选的是具有以下突变(或在其他芽孢杆菌属α-淀粉酶中的相应突变)中的一个或多个的变体:H154Y、A181T、N190F、A209V以及Q264S和/或在位置176-179中的两个残基的缺失,优选E178和G179的缺失(使用WO 99/19467的SEQ IDNO:5用于位置编号)。
在一个实施例中,该细菌α-淀粉酶是嵌合α-淀粉酶的成熟部分,其披露于Richardson等(2002),The Journal of Biological Chemistry,277卷,29期,7月19日发表,267501-26507页中,称作BD5088或其变体。此α-淀粉酶与WO 2007134207中的SEQ IDNO:2所示的相同。成熟酶序列在位置1处的起始“Met”氨基酸之后开始。
热稳定的α-淀粉酶
α-淀粉酶可为热稳定的α-淀粉酶,如热稳定的细菌α-淀粉酶,优选来自嗜热脂肪芽孢杆菌。
在本发明的一个实施例中,α-淀粉酶是细菌α-淀粉酶,优选源自芽孢杆菌属,尤其是嗜热脂肪芽孢杆菌的菌株,特别是如WO 99/019467中作为SEQ ID NO:3(本申请中的SEQID NO:18)披露的嗜热脂肪芽孢杆菌,其在位置R179、G180、I181和/或G182处缺失一个或两个氨基酸,特别是R179和G180缺失、或I181和G182缺失,具有以下突变列表中的突变。
在优选的实施例中,嗜热脂肪芽孢杆菌α-淀粉酶具有双缺失I181+G182,以及任选的取代N193F,进一步包括选自以下列表的突变:
关于上面的α-淀粉酶变体的热稳定性的具体信息可见于WO 12/088303(诺维信公司),其通过提述由此并入。
在一个优选的实施例中,α-淀粉酶选自下组:嗜热脂肪芽孢杆菌α-淀粉酶变体,其具有I181+G182中的双缺失,和任选的N193F中的取代,以及选自以下列表的取代
-E129V+K177L+R179E;
-V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S;
-V59A+Q89R+E129V+K177L+R179E+Q254S+M284V;
-V59A+E129V+K177L+R179E+Q254S+M284V;和
-E129V+K177L+R179E+K220P+N224L+S242Q+Q254S(使用本申请中的SEQ ID NO:18用于编号)。
应理解的是,当提及嗜热脂肪芽孢杆菌α-淀粉酶及其变体时,它们通常以截短的形式产生。特别地,截短可为这样使得WO 99/19467中的SEQ ID NO:3或本申请中的SEQ IDNO:18中所示的嗜热脂肪芽孢杆菌α-淀粉酶或其变体在C-末端截短并且典型地为约491个氨基酸长,如480至495个氨基酸长,或使得其缺乏功能性淀粉结合结构域。
在一个优选的实施例中,该α-淀粉酶变体可为与WO 99/19467中的SEQ ID NO:3、或本申请中的SEQ ID NO:18所示的序列具有至少60%,例如,至少70%、至少80%、至少90%、至少95%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%,但小于100%同一性程度的酶。
在一个实施例中,将该细菌α-淀粉酶,例如,芽孢杆菌属α-淀粉酶,如尤其是嗜热脂肪芽孢杆菌α-淀粉酶,或其变体,以在0.01-10KNU-A/g Ds,例如,0.02-5KNU-A/g Ds,如0.03-3KNU-A,优选0.04-2KNU-A/g Ds,如尤其是0.01-2KNU-A/g DS的浓度剂量添加至液化。在一个实施例中,将该细菌α-淀粉酶,例如,芽孢杆菌属α-淀粉酶,如尤其是嗜热脂肪芽孢杆菌α-淀粉酶,或其变体,以在0.0001-1mg EP(酶蛋白)/g DS,例如,0.0005-0.5mg EP/gDS,如0.001-0.1mg EP/g DS的浓度剂量添加至液化。
液化中存在和/或添加的蛋白酶
根据本发明,蛋白酶可任选地与α-淀粉酶、和任选的葡糖淀粉酶、肌醇六磷酸酶和/或普鲁兰酶一起存在和/或添加至液化。
蛋白酶根据其催化机制分为以下几类:丝氨酸蛋白酶(S)、半胱氨酸蛋白酶(C)、天冬氨酸蛋白酶(A)、金属蛋白酶(M)以及未知或还未分类的蛋白酶(U),参见Handbook ofProteolytic Enzymes,A.J.Barrett,N.D.Rawlings,J.F.Woessner(编),Academic Press(1998),尤其是概述部分。
在一个优选的实施例中,根据本发明使用的热稳定的蛋白酶是“金属蛋白酶”,其定义为属于EC 3.4.24(金属内肽酶);优选EC 3.4.24.39(酸性金属蛋白酶)的蛋白酶。
为了确定给定的蛋白酶是否是金属蛋白酶,参照上述“Handbook of ProteolyticEnzymes”以及其中指示的原则。可对所有类型的蛋白酶进行这样的确定,而不论其是天然存在的还是野生型蛋白酶;或者是基因工程化的还是合成的蛋白酶。
可使用任何合适的测定法来测量蛋白酶活性,其中采用一种底物,该底物包括与所讨论的蛋白酶的特异性相关的肽键。pH测定和温度测定同样适用于所讨论的蛋白酶。测定pH值的实例是pH 6、7、8、9、10或11。测定温度的实例是30℃、35℃、37℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、或80℃。
蛋白酶底物的实例为酪蛋白,如Azurine-Crosslinked Casein(天青精-交联的酪蛋白,AZCL-酪蛋白)。在下文“材料与方法”一节中描述了两种蛋白酶测定法,其中所谓的“AZCL-酪蛋白测定法”是优选的测定法。
对于在本发明的方法中使用的蛋白酶的来源没有限制,只要其满足下文定义的热稳定性特性。
在一个实施例中,该蛋白酶是真菌来源的。
该蛋白酶可为,例如,野生型蛋白酶的变体,只要该蛋白酶是热稳定的。在一个优选的实施例中,该热稳定的蛋白酶是如上定义的金属蛋白酶的变体。在一个实施例中,在本发明的方法中使用的热稳定的蛋白酶是真菌来源的,如真菌金属蛋白酶,如源自嗜热子囊菌属的菌株,优选桔橙嗜热子囊菌的菌株,尤其是桔橙嗜热子囊菌CGMCC No.0670(分类为EC 3.4.24.39)。
在一个实施例中,该热稳定的蛋白酶是披露于以下的变体:WO2003/048353中披露的SEQ ID NO:2中所示的金属蛋白酶的成熟部分或WO2010/008841中的SEQ ID NO:1的成熟部分以及本申请中作为SEQ ID NO:17所示的,进一步具有选自以下列表的突变:
-S5*+D79L+S87P+A112P+D142L;
-D79L+S87P+A112P+T124V+D142L;
-S5*+N26R+D79L+S87P+A112P+D142L;
-N26R+T46R+D79L+S87P+A112P+D142L;
-T46R+D79L+S87P+T116V+D142L;
-D79L+P81R+S87P+A112P+D142L;
-A27K+D79L+S87P+A112P+T124V+D142L;
-D79L+Y82F+S87P+A112P+T124V+D142L;
-D79L+Y82F+S87P+A112P+T124V+D142L;
-D79L+S87P+A112P+T124V+A126V+D142L;
-D79L+S87P+A112P+D142L;
-D79L+Y82F+S87P+A112P+D142L;
-S38T+D79L+S87P+A112P+A126V+D142L;
-D79L+Y82F+S87P+A112P+A126V+D142L;
-A27K+D79L+S87P+A112P+A126V+D142L;
-D79L+S87P+N98C+A112P+G135C+D142L;
-D79L+S87P+A112P+D142L+T141C+M161C;
-S36P+D79L+S87P+A112P+D142L;
-A37P+D79L+S87P+A112P+D142L;
-S49P+D79L+S87P+A112P+D142L;
-S50P+D79L+S87P+A112P+D142L;
-D79L+S87P+D104P+A112P+D142L;
-D79L+Y82F+S87G+A112P+D142L;
-S70V+D79L+Y82F+S87G+Y97W+A112P+D142L;
-D79L+Y82F+S87G+Y97W+D104P+A112P+D142L;
-S70V+D79L+Y82F+S87G+A112P+D142L;
-D79L+Y82F+S87G+D104P+A112P+D142L;
-D79L+Y82F+S87G+A112P+A126V+D142L;
-Y82F+S87G+S70V+D79L+D104P+A112P+D142L;
-Y82F+S87G+D79L+D104P+A112P+A126V+D142L;
-A27K+D79L+Y82F+S87G+D104P+A112P+A126V+D142L;
-A27K+Y82F+S87G+D104P+A112P+A126V+D142L;
-A27K+D79L+Y82F+D104P+A112P+A126V+D142L;
-A27K+Y82F+D104P+A112P+A126V+D142L;
-A27K+D79L+S87P+A112P+D142L;
-D79L+S87P+D142L。
关于上述的蛋白酶变体的热稳定性的具体信息可见于WO 12/088303(诺维信公司),其通过提述由此并入。
在一个优选的实施例中,热稳定的蛋白酶是作为以下披露的金属蛋白酶的变体:WO 2003/048353中披露的SEQ ID NO:2的成熟部分或WO2010/008841中SEQ ID NO:1的成熟部分或本申请中的SEQ ID NO:17,具有以下突变:
D79L+S87P+A112P+D142L;
D79L+S87P+D142L;或
A27K+D79L+Y82F+S87G+D104P+A112P+A126V+D142L。
在一个实施例中,该蛋白酶变体与WO 2003/048353中披露的SEQ ID NO:2的多肽的成熟部分或WO 2010/008841中SEQ ID NO:1的成熟部分或本申请中的SEQ ID NO:17具有至少75%同一性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,例如甚至至少96%、至少97%、至少98%、至少99%,但小于100%同一性。
该热稳定性蛋白酶还可源自任何细菌,只要该蛋白酶具有根据本发明定义的热稳定性特性。
在一个实施例中,该热稳定的蛋白酶源自细菌火球菌属的菌株,如激烈火球菌的菌株(pfu蛋白酶)。
在一个实施例中,该蛋白酶是如美国专利号6,358,726-B1(宝酒造公司(TakaraShuzo Company))中的SEQ ID NO:1、或本申请中的SEQ ID NO:22所示的一种。
在另一个实施例中,该热稳定的蛋白酶是本申请中的SEQ ID NO:22中公开的,或是与美国专利号6,358,726-B1中的SEQ ID NO:1或本申请中的SEQ ID NO:22具有至少80%同一性,如至少85%,如至少90%,如至少95%,如至少96%,如至少97%,如至少98%,如至少99%同一性的蛋白酶。激烈火球菌蛋白酶可购买自日本宝酒造生物公司(Takara Bio,Japan)。
液化中存在和/或添加的葡糖淀粉酶
根据本发明,葡糖淀粉酶可任选地存在和/或添加到液化步骤(a)中。在一个优选的实施例中,该葡糖淀粉酶与α-淀粉酶和任选的蛋白酶、肌醇六磷酸酶和/或普鲁兰酶一起添加或与其分开添加。
在一个具体且优选的实施例中,该葡糖淀粉酶,优选真菌来源的,优选丝状真菌,来自青霉属的菌株,尤其是草酸青霉的菌株,特别是WO2011/127802(其通过提述由此并入)中作为SEQ ID NO:2披露的以及本申请中的SEQ ID NO:23中所示的草酸青霉葡糖淀粉酶。
在一个实施例中,该葡糖淀粉酶与WO 2011/127802中的SEQ ID NO:2中所示的成熟多肽或本申请中的SEQ ID NO:23具有至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,例如甚至至少96%、至少97%、至少98%、至少99%或100%同一性。
在一个优选的实施例中,该葡糖淀粉酶是WO 2011/127802中作为SEQ ID NO:2披露的以及本申请中的SEQ ID NO:23中所示的草酸青霉葡糖淀粉酶的变体,具有K79V取代(使用本申请中的SEQ ID NO:23中所示的成熟序列用于编号)。如WO 2013/036526(其通过提述由此并入)中披露的,该K79V葡糖淀粉酶变体相对于亲本对蛋白酶降解具有降低的敏感度。
在一个实施例中,该葡糖淀粉酶源自草酸青霉。
在一个实施例中,该葡糖淀粉酶是WO 2011/127802中作为SEQ ID NO:2披露的以及本申请中的SEQ ID NO:23中所示的草酸青霉葡糖淀粉酶的变体。在一个优选的实施例中,该草酸青霉葡糖淀粉酶是WO 2011/127802中作为SEQ ID NO:2披露的以及本申请中的SEQ ID NO:23中所示的,在位置79处具有Val(V)(使用本申请中的SEQ ID NO:23用于编号)。
涵盖的草酸青霉葡糖淀粉酶变体披露于WO 2013/053801(其通过提述由此并入)中。
在一个实施例中,这些变体对蛋白酶降解具有降低的敏感度。
在一个实施例中,这些变体与亲本相比具有改进的热稳定性。
更具体地,在一个实施例中,该葡糖淀粉酶具有K79V取代(使用本申请中的SEQ IDNO:23用于编号),(PE001变体),并进一步包括以下取代或取代的组合中的至少一个:
T65A;或
Q327F;或
E501V;或
Y504T;或
Y504*;或
T65A+Q327F;或
T65A+E501V;或
T65A+Y504T;或
T65A+Y504*;或
Q327F+E501V;或
Q327F+Y504T;或
Q327F+Y504*;或
E501V+Y504T;或
E501V+Y504*;或
T65A+Q327F+E501V;或
T65A+Q327F+Y504T;或
T65A+E501V+Y504T;或
Q327F+E501V+Y504T;或
T65A+Q327F+Y504*;或
T65A+E501V+Y504*;或
Q327F+E501V+Y504*;或
T65A+Q327F+E501V+Y504T;或
T65A+Q327F+E501V+Y504*;
E501V+Y504T;或
T65A+K161S;或
T65A+Q405T;或
T65A+Q327W;或
T65A+Q327F;或
T65A+Q327Y;或
P11F+T65A+Q327F;或
R1K+D3W+K5Q+G7V+N8S+T10K+P11S+T65A+Q327F;或
P2N+P4S+P11F+T65A+Q327F;或
P11F+D26C+K33C+T65A+Q327F;或
P2N+P4S+P11F+T65A+Q327W+E501V+Y504T;或
R1E+D3N+P4G+G6R+G7A+N8A+T10D+P11D+T65A+Q327F;或
P11F+T65A+Q327W;或
P2N+P4S+P11F+T65A+Q327F+E501V+Y504T;或
P11F+T65A+Q327W+E501V+Y504T;或
T65A+Q327F+E501V+Y504T;或
T65A+S105P+Q327W;或
T65A+S105P+Q327F;或
T65A+Q327W+S364P;或
T65A+Q327F+S364P;或
T65A+S103N+Q327F;或
P2N+P4S+P11F+K34Y+T65A+Q327F;或
P2N+P4S+P11F+T65A+Q327F+D445N+V447S;或
P2N+P4S+P11F+T65A+I172V+Q327F;或
P2N+P4S+P11F+T65A+Q327F+N502*;或
P2N+P4S+P11F+T65A+Q327F+N502T+P563S+K571E;或
P2N+P4S+P11F+R31S+K33V+T65A+Q327F+N564D+K571S;或
P2N+P4S+P11F+T65A+Q327F+S377T;或
P2N+P4S+P11F+T65A+V325T+Q327W;或
P2N+P4S+P11F+T65A+Q327F+D445N+V447S+E501V+Y504T;或
P2N+P4S+P11F+T65A+I172V+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+S377T+E501V+Y504T;或
P2N+P4S+P11F+D26N+K34Y+T65A+Q327F;或
P2N+P4S+P11F+T65A+Q327F+I375A+E501V+Y504T;或
P2N+P4S+P11F+T65A+K218A+K221D+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+S103N+Q327F+E501V+Y504T;或
P2N+P4S+T10D+T65A+Q327F+E501V+Y504T;或
P2N+P4S+F12Y+T65A+Q327F+E501V+Y504T;或
K5A+P11F+T65A+Q327F+E501V+Y504T;或
P2N+P4S+T10E+E18N+T65A+Q327F+E501V+Y504T;或
P2N+T10E+E18N+T65A+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+E501V+Y504T+T568N;或
P2N+P4S+P11F+T65A+Q327F+E501V+Y504T+K524T+G526A;或
P2N+P4S+P11F+K34Y+T65A+Q327F+D445N+V447S+E501V+Y504T;或
P2N+P4S+P11F+R31S+K33V+T65A+Q327F+D445N+V447S+E501V+Y504T;或
P2N+P4S+P11F+D26N+K34Y+T65A+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+F80*+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+K112S+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+E501V+Y504T+T516P+K524T+G526A;或
P2N+P4S+P11F+T65A+Q327F+E501V+N502T+Y504*;或
P2N+P4S+P11F+T65A+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+S103N+Q327F+E501V+Y504T;或
K5A+P11F+T65A+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+E501V+Y504T+T516P+K524T+G526A;或
P2N+P4S+P11F+T65A+V79A+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+V79G+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+V79I+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+V79L+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+V79S+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+L72V+Q327F+E501V+Y504T;或
S255N+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+E74N+V79K+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+G220N+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+Y245N+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q253N+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+D279N+Q327F+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+S359N+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+D370N+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+V460S+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+V460T+P468T+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+T463N+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+S465N+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+T477N+E501V+Y504T。
在一个优选的实施例中,该草酸青霉葡糖淀粉酶变体具有对应于PE001变体的K79V取代(使用本申请中的SEQ ID NO:23用于编号),并进一步包括以下突变中的一种:
P11F+T65A+Q327F;或
P2N+P4S+P11F+T65A+Q327F;或
P11F+D26C+K33C+T65A+Q327F;或
P2N+P4S+P11F+T65A+Q327W+E501V+Y504T;或
P2N+P4S+P11F+T65A+Q327F+E501V+Y504T;或
P11F+T65A+Q327W+E501V+Y504T。
该葡糖淀粉酶可以0.1-100微克EP/g,如0.5-50微克EP/g,如1-25微克EP/g,如2-12微克EP/g DS的量添加。
糖化和/或发酵中存在和/或添加的海藻糖酶
根据本发明的方法,本发明的海藻糖酶在如下步骤过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
在一个优选的实施例中,成熟海藻糖酶披露于SEQ ID NO:30或SEQ ID NO:2中。在一个优选的实施例中,成熟海藻糖酶披露于SEQ ID NO:4中。在一个优选的实施例中,海藻糖酶以0.01-20ug EP(酶蛋白)海藻糖酶/g DS,如0.05-15ug EP海藻糖酶/g DS,如0.5-10ug EP海藻糖酶/g DS的量存在和/或添加。
糖化和/或发酵中存在和/或添加的葡糖淀粉酶
在如下步骤过程中存在和/或添加的葡糖淀粉酶:糖化步骤(b);发酵步骤(c);同时的糖化和发酵;或步骤(b)之前的预糖化步骤,可源自任何合适的来源,例如源自微生物或植物。优选的葡糖淀粉酶是真菌或细菌来源的,选自下组:曲霉属葡糖淀粉酶,特别是黑曲霉G1或G2葡糖淀粉酶(Boel等,1984,EMBO J.3(5),p.1097-1102),或其变体,如WO 92/00381、WO00/04136和WO 01/04273中公开的那些(来自丹麦诺维信公司,(Novozymes,Denmark));WO 84/02921中公开的泡盛曲霉(A.awamori)葡糖淀粉酶;米曲霉葡糖淀粉酶(Agric.Biol.Chem.(1991),55(4),p.941-949),或它们的变体或片段。其他曲霉属葡糖淀粉酶变体包括具有增强的热稳定性的变体:G137A和G139A(Chen等,1996,Prot.Eng.9,499-505);D257E和D293E/Q(Chen等(1995),Prot.Eng.8,575-582);N182(Chen等(1994),Biochem.J.301,275-281);二硫键、A246C(Fierobe等,1996,Biochemistry,35:8698-8704);和在A435和S436位置引入Pro残基(Li等,1997,Protein Engng.10,1199-1204)。
其他葡糖淀粉酶包括罗耳阿太菌(Athelia rolfsii)(以前命名为罗尔伏革菌(Corticium rolfsii))葡糖淀粉酶(参见美国专利号4,727,026和Nagasaka等,(1998),“Purification and properties of the raw-starch-degrading glucoamylases fromCorticium rolfsii”Appl.Microbiol.Biotechnol.50:323-330),踝节菌属葡糖淀粉酶,特别是源自埃默森踝节菌(WO 99/28448)、Talaromyces leycettanus(美国专利号Re.32,153)、Talaromyces duponti、以及嗜热踝节菌(美国专利号4,587,215)。在一个优选的实施例中,糖化和/或发酵过程中使用的葡糖淀粉酶是WO 99/28448中披露的埃默森踝节菌葡糖淀粉酶。
涵盖的细菌葡糖淀粉酶包括来自梭菌属(Clostridium),特别是热解淀粉梭菌(C.thermoamylolyticum)(EP 135,138)和热硫化氢梭菌(C.thermohydrosulfuricum)(WO86/01831)的葡糖淀粉酶。
涵盖的真菌葡糖淀粉酶包括均WO 2006/069289中披露的瓣环栓菌(SEQ ID NO:20),纸质大纹饰孢(Pachykytospora papyracea);和大白桩蘑(Leucopaxillusgiganteus);或WO 2007/124285中披露的红边隔孢伏革菌(Peniophora rufomarginata);或它们的混合物。根据本发明还涵盖杂合葡糖淀粉酶。实例包括WO 2005/045018中披露的杂合葡糖淀粉酶。具体实例包括实例1的表1和4中披露的杂合葡糖淀粉酶(这些杂合体通过提述由此并入)。
在一个实施例中,该葡糖淀粉酶源自密孔菌属(Pycnoporus)的菌株,特别是如WO2011/066576中所述的血红密孔菌的菌株(SEQ ID NO 2、4或6),特别是作为本申请中的SEQID NO:28所示的(对应于WO 2011/066576中的SEQ ID NO:4),或来自粘褶菌属(Gloeophyllum)的菌株,如篱边粘褶菌(Gloeophyllum sepiarium)或密粘褶菌(Gloeophyllum trabeum)的菌株,特别是如WO 2011/068803中所述的粘褶菌属的菌株(SEQID NO:2、4、6、8、10、12、14或16)。在一个优选实施例中,该葡糖淀粉酶是WO 2011/068803中的SEQ ID NO:2或本申请中的SEQ ID NO:19(即,篱边粘褶菌葡糖淀粉酶)。在一个优选实施例中,该葡糖淀粉酶是本申请中的SEQ ID NO:20(即,WO 2014/177546中作为SEQ ID NO:3披露的密粘褶菌葡糖淀粉酶)(所有参考文件通过提述由此并入)。
还涵盖如下葡糖淀粉酶,其与上述葡糖淀粉酶中的任一种显示高同一性,即,分别与上述酶序列的成熟部分中的任一个,如本申请中的SEQ ID NO:13、14、19、20或28中的任一个显示至少60%,如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%同一性。
在一个实施例中,发酵或SSF中使用的葡糖淀粉酶与本申请中的SEQ ID NO:20的成熟部分显示至少60%,如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%同一性。
在一个实施例中,发酵或SSF中使用的葡糖淀粉酶与此处SEQ ID NO:28中所示的成熟序列具有至少60%,至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%同一性。
在一个实施例中,可将葡糖淀粉酶以0.0001-20AGU/g DS,优选0.001-10AGU/gDS,尤其是0.01-5AGU/g DS,如0.1-2AGU/g DS的量添加至糖化和/或发酵中。
在一个实施例中,可将葡糖淀粉酶以1-1,000μg EP/g DS,优选地10-500μg/gDS,尤其是25-250μg/g DS的量添加至糖化和/或发酵中。
在一个实施例中,该葡糖淀粉酶作为进一步包含α-淀粉酶的共混物添加。在一个优选的实施例中,该α-淀粉酶是真菌α-淀粉酶,尤其是酸性真菌α-淀粉酶。该α-淀粉酶典型地是副活性。
在一个实施例中,该葡糖淀粉酶是共混物,其包括WO 99/28448中作为SEQ ID NO:34或本申请中的SEQ ID NO:13披露的埃默森踝节菌葡糖淀粉酶和在WO 06/069289中作为SEQ ID NO:2和/或本申请中的SEQ ID NO:14披露的瓣环栓菌葡糖淀粉酶。
在一个实施例中,该葡糖淀粉酶是共混物,其包括本申请中的SEQ ID NO:13中披露的埃默森踝节菌葡糖淀粉酶、本申请中作为SEQ ID NO:14披露的瓣环栓菌葡糖淀粉酶、以及WO 2006/069290的表5中作为V039或本申请中的SEQ ID NO:15披露的具有黑曲霉葡糖淀粉酶接头和SBD的微小根毛霉α-淀粉酶。
在一个实施例中,该葡糖淀粉酶是共混物,其包括本申请中作为SEQ ID NO:19所示的篱边粘褶菌葡糖淀粉酶以及本申请中作为SEQ ID NO:15披露的、具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉(α-淀粉酶),具有以下取代:G128D+D143N。
在一个实施例中,该α-淀粉酶可为源自根毛霉属的菌株,优选微小根毛霉的菌株,如WO 2013/006756中的SEQ ID NO:3中所示的,或亚灰树花菌属(Meripilus),优选大型亚灰树花菌(Meripilus giganteus)的菌株。在一个优选实施例中,该α-淀粉酶源自具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉,WO 2006/069290的表5中作为V039或本申请中的SEQ ID NO:15披露的。
在一个实施例中,微小根毛霉α-淀粉酶或具有接头和淀粉结合结构域(SBD),优选黑曲霉葡糖淀粉酶接头和SBD的微小根毛霉α-淀粉酶具有以下取代或取代组合中的至少一种:D165M;Y141W;Y141R;K136F;K192R;P224A;P224R;S123H+Y141W;G20S+Y141W;A76G+Y141W;G128D+Y141W;G128D+D143N;P219C+Y141W;N142D+D143N;Y141W+K192R;Y141W+D143N;Y141W+N383R;Y141W+P219C+A265C;Y141W+N142D+D143N;Y141W+K192R+V410A;G128D+Y141W+D143N;Y141W+D143N+P219C;Y141W+D143N+K192R;G128D+D143N+K192R;Y141W+D143N+K192R+P219C;G128D+Y141W+D143N+K192R;或G128D+Y141W+D143N+K192R+P219C(使用WO2013/006756中的SEQ ID NO:3或本申请中的SEQ ID NO:15用于编号)。
在一个优选的实施例中,该葡糖淀粉酶共混物包括篱边粘褶菌葡糖淀粉酶(例如,WO 2011/068803中的SEQ ID NO:2或本申请中的SEQ ID NO:19)和微小根毛霉α-淀粉酶。
在一个优选的实施例中,该葡糖淀粉酶共混物包括WO 2011/068803中作为SEQ IDNO:2或本申请中的SEQ ID NO:19所示的篱边粘褶菌葡糖淀粉酶,以及WO 2013/006756中的SEQ ID NO:3和本申请中的SEQ ID NO:15披露的、具有接头和淀粉结合结构域(SBD),优选黑曲霉葡糖淀粉酶接头和SBD的微小根毛霉(α-淀粉酶),具有以下取代:G128D+D143N。
商业上可得到的包含葡糖淀粉酶的组合物包含AMG 200L;AMG 300L;SANTMSUPER、SANTMEXTRA L、SPIRIZYMETMPLUS、SPIRIZYMETMFUEL、SPIRIZYMETMB4U、SPIRIZYMETMULTRA、SPIRIZYMETMEXCEL、SPIRIZYME ACHIEVETM、和AMGTME(来自诺维信公司(Novozymes A/S));OPTIDEXTM300、GC480、GC417(来自杜邦-丹尼斯科公司(DuPont-Danisco));AMIGASETM和AMIGASETMPLUS(来自DSM);G-ZYMETMG900、G-ZYMETM和G990ZR(来自杜邦-丹尼斯科公司)。
糖化和/或发酵中存在和/或添加的纤维素分解酶组合物
根据本发明,纤维素分解酶组合物可存在于糖化、发酵或同时糖化发酵(SSF)中。
该纤维素分解酶组合物包含β-葡糖苷酶、纤维二糖水解酶和内切葡聚糖酶。
合适的纤维素分解组合物的实例可见于WO 2008/151079和WO2013/028928中,其通过提述并入。
在优选的实施例中,纤维素分解酶组合物源自木霉属、腐质霉属、或金孢子菌属的菌株。
在一个实施例中,该纤维素分解酶组合物源自里氏木霉、特异腐质霉、和/或卢克诺文思金孢子菌(Chrysosporium lucknowense)。
在一个实施例中,该纤维素分解酶组合物包含β-葡糖苷酶,优选源自曲霉属的菌株,如米曲霉,如WO 2002/095014中披露的或WO 2008/057637中披露的具有β-葡糖苷酶活性的融合蛋白(特别是WO 2008/057637中的SEQ ID NO:73和74中分别所示的米曲霉β-葡糖苷酶变体融合蛋白,或WO2008/057637中的SEQ ID NO:75和76中分别所示的米曲霉β-葡糖苷酶融合蛋白-两者均通过提述由此并入),或者烟曲霉,如WO 2005/047499中或本申请中的SEQ ID NO:10中披露的或WO 2012/044915(诺维信公司)中公开的烟曲霉β-葡糖苷酶变体,如具有如下取代中的一个或多个(如所有)的:F100D、S283G、N456E、F512Y;或源自青霉属(Penicillium)的菌株,如WO 2007/019442中披露的巴西青霉(Penicilliumbrasilianum)的菌株,或木霉属的菌株,如里氏木霉的菌株。
在一个实施例中,该纤维素分解酶组合物包含具有纤维素分解增强活性的GH61多肽,如源自嗜热子囊菌属,如桔橙嗜热子囊菌的菌株,如WO2005/074656中作为SEQ ID NO:2或本申请中的SEQ ID NO:21所述的;或源自梭孢壳属,如土生梭孢霉的菌株的多肽,如WO2005/074647中作为SEQ ID NO:7和SEQ ID NO:8描述的多肽;或源自曲霉属的菌株,如烟曲霉的菌株的,如WO 2010/138754中作为SEQ ID NO:1和SEQ ID NO:2所述的;或源自青霉属的菌株,如埃默森青霉菌的菌株的,如WO 2011/041397中作为SEQ ID NO:2或本申请中的SEQ ID NO:12披露的。
在一个实施例中,该纤维素分解组合物包含纤维二糖水解酶I(CBH I),如源自曲霉属的菌株,如烟曲霉的菌株的,如WO 2011/057140中的SEQ ID NO:2或本申请中的SEQ IDNO:6中披露的Cel7a CBHI,或源自木霉属的菌株,例如里氏木霉的菌株。
在一个实施例中,该纤维素分解组合物包含纤维二糖水解酶II(CBH II),如源自曲霉属的菌株,如烟曲霉的菌株作为本申请中的SEQ ID NO:8披露的;或源自木霉属的菌株,如里氏木霉,或梭孢壳属的菌株,如土生梭孢壳霉的菌株,如来自土生梭孢壳霉的纤维二糖水解酶II CEL6A。
在一个实施例中,该纤维素分解酶组合物包含具有纤维素分解增强活性的GH61多肽以及β-葡糖苷酶。
在一个实施例中,该纤维素分解组合物包含具有纤维素分解增强活性的GH61多肽、β-葡糖苷酶、以及CBH I。
在一个实施例中,该纤维素分解组合物包含具有纤维素分解增强活性的GH61多肽、β-葡糖苷酶、CBH I、以及CBH II。
在一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,其进一步包括具有纤维素分解增强活性的桔橙嗜热子囊菌GH61A多肽(WO 2005/074656中的SEQID NO:2或本申请中的SEQ ID NO:21)、以及米曲霉β-葡糖苷酶融合蛋白(WO 2008/057637)。
在一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,其进一步包括具有纤维素分解增强活性的桔橙嗜热子囊菌GH61A多肽(WO 2005/074656中的SEQID NO:2或本申请中的SEQ ID NO:21)、以及烟曲霉β-葡糖苷酶(WO 2005/047499的SEQ IDNO:2或本申请中的SEQ ID NO:10)。
在另一个实施例中,纤维素分解组合物是里氏木霉纤维素分解酶组合物,其进一步包括WO 2011/041397中作为SEQ ID NO:2或本申请中的SEQ ID NO:12披露的、具有纤维素分解增强活性的埃默森青霉GH61A多肽、以及烟曲霉β-葡糖苷酶(WO 2005/047499的SEQID NO:2或本申请中的SEQ ID NO:10)或其具有以下取代的变体:F100D、S283G、N456E、F512Y(使用本申请中的SEQ ID NO:10用于编号)。
在一个优选的实施例中,该纤维素分解酶组合物包含一种或多种以下组分:
(i)烟曲霉纤维二糖水解酶I;
(ii)烟曲霉纤维二糖水解酶II;
(iii)烟曲霉β-葡糖苷酶或其变体;和
(iv)具有纤维素分解增强活性的青霉属菌种GH61多肽;或其同系物。
在一个优选的实施例中,该纤维素分解酶组合物源自里氏木霉,其包含源自埃默森青霉的菌株的具有纤维素分解增强活性的GH61A多肽(WO2011/041397中的SEQ ID NO:2或本申请中的SEQ ID NO:12)、烟曲霉β-葡糖苷酶(WO 2005/047499中的SEQ ID NO:2或本申请中的SEQ ID NO:10)具有以下取代的变体:F100D、S283G、N456E、F512Y(WO 2012/044915中披露的);WO2011/057140中作为SEQ ID NO:6或本申请中的SEQ ID NO:6披露的烟曲霉Cel7ACBH I以及WO2011/057140中作为SEQ ID NO:18或本申请中的SEQ ID NO:8披露的烟曲霉Cel7ACBH II。
在一个实施例中,该纤维素分解组合物以0.0001-3mg EP/g DS,优选0.0005-2mgEP/g DS,优选0.001-1mg/g DS,更优选0.005-0.5mg EP/g DS,并且甚至更优选0.01-0.1mgEP/g DS剂量添加。
糖化和/或发酵中存在和/或添加的蛋白酶
可将任何合适的蛋白酶添加至糖化和/或发酵,如SSF中。
在一个优选实施例中,蛋白酶是金属蛋白酶或丝氨酸蛋白酶。
在一个实施例中,酶组合物包含金属蛋白酶,优选源自嗜热子嚢菌属的菌株,优选桔橙嗜热子囊菌的菌株(尤其是桔橙嗜热子囊菌CGMCC编号0670),如作为WO 2003/048353中披露的SEQ ID NO:2的成熟部分或本申请中的SEQ ID NO:17的成熟多肽披露的金属蛋白酶。
在一个实施例中,蛋白酶与本申请中的SEQ ID NO:17的多肽的成熟部分具有至少60%、如至少70%、如至少75%同一性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如甚至至少96%、至少97%、至少98%、至少99%,或100%同一性。
在一个实施例中,蛋白酶源自火球菌属的菌株,例如激烈火球菌的菌株,如US 6,358,726中的SEQ ID NO:1或本申请中的SEQ ID NO:22中所示的蛋白酶。
在一个实施例中,蛋白酶是WO 2014/037438(通过提述由此并入)的实例2中涉及的、来自大型亚灰树花菌蛋白酶3(肽酶家族S53蛋白酶)的成熟序列。在一个实施例中,蛋白酶是来自亚灰树花菌属,特别是大型亚灰树花菌的菌株的、WO 2014/037438(通过提述由此并入)中作为SEQ ID NO:5和本申请中的SEQ ID NO:32所示的成熟蛋白酶3序列。
在一个实施例中,该蛋白酶与本申请中的SEQ ID NO:32作为氨基酸1-547所示的多肽的成熟部分具有至少60%、如至少70%、如至少75%同一性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,例如甚至至少96%、至少97%、至少98%、至少99%,例如100%同一性。
糖化和/或发酵中存在和/或添加的α-淀粉酶
任何合适的α-淀粉酶,如真菌酸性α-淀粉酶,可存在和/或添加至糖化和/或发酵中。
在一个实施例中,该α-淀粉酶是真菌α-淀粉酶,特别是与SEQ ID NO:15的多肽的成熟部分具有至少60%、如至少70%、如至少75%同一性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如甚至至少96%、至少97%、至少98%、至少99%,但100%同一性的。在一个优选实施例中,α-淀粉酶具有以下取代的一个或多个:G128D、D143N、特别是G128D+D143N。
使用本发明的海藻糖酶从纤维素材料产生发酵产物的方法
在一个实施例中,本发明涉及从预处理的纤维素材料产生发酵产物的方法,其包括:
(a)用纤维素分解酶组合物使所述预处理的纤维素材料水解;
(b)使用发酵生物进行发酵;和
(c)任选地回收所述发酵产物,
其中本发明的海藻糖酶被添加至和/或存在于水解步骤(a)和/或发酵步骤(b)中。
根据本发明的方法,水解和发酵可分别或同时进行。在一个实施例中,本发明的方法作为以下进行:分开的水解和发酵(SHF);同时的糖化和发酵(SSF);同时的糖化和共发酵(SSCF);混合的水解和发酵(HHF);分开的水解和共发酵(SHCF);混合的水解和共发酵(HHCF);或直接的微生物转化(DMC),有时也称为合并的生物加工(CBP)。SHF使用分开的处理步骤,以首先将纤维素材料酶促水解为可发酵糖(例如,葡萄糖、纤维二糖、以及戊糖单体),并且然后将可发酵糖发酵为乙醇。在SSF中,纤维素材料的酶促水解和糖变为乙醇的发酵被组合在一个步骤中。SSCF涉及多种糖的共发酵(Sheehan,J.和Himmel,M.,1999,Enzymes,energy and the environment:Astrategic perspective on theU.S.Department of Energy’s research and development activities forbioethanol,Biotechnol.Prog.15:817-827)。HHF涉及分开的水解步骤并且另外涉及同时的糖化和水解步骤,其可在同一反应器中进行。HHF过程中的步骤可在不同的温度进行,即高温酶水解,然后是在发酵菌株能够耐受的较低温度进行SSF。DMC在一个或多个(例如几个)步骤中组合了所有三个过程(酶产生、水解和发酵),其中使用相同的生物以产生用于将纤维素材料转化成可发酵糖并将可发酵糖转化成终产物的酶。
根据本发明,所述纤维素材料是植物材料碎片(chip),植物茎段(stem segment)和/或整个植物茎。在一个实施例中,所述纤维素材料选自下组:芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属(miscanthus)、橙皮、稻秆、柳枝稷(switchgrass)、麦秆。在一个优选实施例中,纤维素材料的来源是玉米秸秆、玉米穗轴和/或麦秆。
根据本发明,可使用任何预处理。在一个优选实施例中,使用化学预处理、物理预处理或者化学和物理预处理。在一个优选实施例中,用酸预处理该纤维素材料,如稀酸预处理。在一个实施例中,所述纤维素材料通过在高温、高压下用酸预处理纤维素材料来制备。
在一个实施例中,水解在20℃-70℃,如30℃-60℃,优选45℃-55℃的温度,在范围4-6,如4.5-5.5的pH进行。
在一个实施例中,所述纤维素材料在水解过程中以1-20(w/w)%的TS,如2-10(w/w)%TS(总固形物),如约5(w/w)%TS存在。
在一个实施例中,水解进行1-20日,优选5-15日。
在一个实施例中,该纤维素分解酶组合物源自里氏木霉、特异腐质霉、或卢克诺文思金孢子菌。
纤维素分解酶组合物:术语“纤维素分解酶组合物”意指一种或多种(例如,几种)水解纤维素材料的酶。这类酶包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、或其组合。用于测量纤维素分解活性的两种基本方法包括:(1)测量总纤维素分解活性,和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶以及β-葡糖苷酶),如Zhang等,Outlook for cellulase improvement:Screening and selection strategies,2006,Biotechnology Advances24:452-481中所综述的。通常使用不溶性底物,包括Whatman№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等,测量总纤维素分解活性。最常见的总纤维素分解活性测定法是将Whatman№1滤纸用作底物的滤纸测定法。该测定法由国际纯粹与应用化学联合会(IUPAC)(Ghose,1987,Measurement ofcellulase activities,Pure Appl.Chem.59:257-68)建立。
出于本发明的目的,可以通过测量在以下条件下与未添加纤维素分解酶蛋白的对照水解相比,由纤维素分解酶对纤维素材料的水解的增加来确定纤维素分解酶活性:1-50mg的纤维素分解酶蛋白/g于PCS中的纤维素(或其他预处理的纤维素材料),在适合的温度(例如50℃、55℃或60℃)下进行3-7天。典型条件为:1ml反应,洗涤或未洗涤的PCS,5%不溶性固体,50mM乙酸钠(pH 5),1mM MnSO4,50℃、55℃、或60℃,72小时,通过HPX-87H柱(Bio-Rad Laboratories,Inc.,美国加州赫拉克勒斯)进行糖分析。
此类组合物的实例可见于上文“糖化和/或发酵中存在和/或添加的纤维素分解酶组合物”一节中。
纤维素材料:术语“纤维素材料”意指包含纤维素的任何材料。纤维素材料的初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过共价交联至半纤维素的聚合木质素而加强。纤维素是脱水纤维二糖的均聚物,因此是线性β-(l-4)-D-葡聚糖,而半纤维素包括多种化合物,如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多形态的,但发现其在植物组织中主要作为平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键结合至纤维素以及其他半纤维素,这有助于稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮和穗轴或树的叶、枝和木材(wood)中。纤维素材料可为,但不限于,农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于Handbookon Bioethanol(Charles E.Wyman编),pp.105-118,Taylor&Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversion ofLignocellulosics,于Advances in Biochemical Engineering/Biotechnology,T.Scheper主编,第65卷,第23-40页,Springer-Verlag,New York)。在本申请中应理解的是,纤维素可为任何形式的木质纤维素,在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在一个优选方面中,该纤维素材料是任何生物质材料。在另一个优选方面中,该纤维素材料是木质纤维素,其包括纤维素、半纤维素、以及木质素。
在一方面中,该纤维素材料是农业残余物。在另一方面中,该纤维素材料是草本材料(包括能源作物)。在另一方面中,该纤维素材料是城市固体废物。在另一方面中,该纤维素材料是纸浆和造纸厂残余物。在另一方面中,该纤维素材料是废纸。在另一方面中,该纤维素材料是木材(包括林业废弃物)。
在另一方面中,该纤维素材料是芦竹。在另一方面中,该纤维素材料是甘蔗渣。在另一方面中,该纤维素材料是竹子。在另一方面中,该纤维素材料是玉米穗轴。在另一方面中,该纤维素材料是玉米纤维。在另一方面中,该纤维素材料是玉米秸秆。在另一方面中,该纤维素材料是芒草属。在另一方面中,该纤维素材料是橘皮。在另一方面中,该纤维素材料是稻杆。在另一方面中,该纤维素材料是柳枝稷。在另一方面中,该纤维素材料是小麦秆。
在另一方面中,该纤维素材料是白杨(aspen)。在另一方面中,该纤维素材料是桉树(eucalyptus)。在另一方面中,该纤维素材料是冷杉(fir)。在另一方面中,该纤维素材料是松树(pine)。在另一个方面中,纤维素材料是杨树(poplar)。在另一个方面中,纤维素材料是云杉(spruce)。在另一个方面中,纤维素材料是柳树。
在另一个方面中,纤维素材料是藻类纤维素。在另一个方面中,纤维素材料是细菌纤维素。在另一个方面中,纤维素材料是棉短绒(cotton linter)。在另一个方面中,纤维素材料是滤纸。在另一个方面中,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
在另一方面中,该纤维素材料是一种水生生物质。如在此使用,术语“水生生物质”意指在水生环境中通过光合作用过程产生的生物质。水生生物质可为藻类、挺水植物、浮叶植物、或沉水植物。
纤维素材料可按原样使用或可使用本领域已知的常规方法进行预处理,如在本申请中所描述的。在一个优选方面,对该纤维素材料进行预处理。
β-葡糖苷酶:术语“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.3.2.1.21),其催化末端非还原β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。就本发明而言,β-葡糖苷酶活性是根据Venturi等,2002,Extracellular beta-D-glucosidase from Chaetomium thermophilum var.coprophilum:production,purification and some biochemical properties,J.Basic Microbiol.42:55-66的方法使用对硝基苯基-β-D-葡糖吡喃糖苷作为底物确定的。一个单位的β-葡糖苷酶定义为在25℃,pH 4.8,在含有0.01%20(聚氧乙烯山梨糖醇酐单月桂酸酯)的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-葡糖吡喃糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。
β-木糖苷酶:术语“β-木糖苷酶”意指β-D-木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3.2.1.37),其催化短β(1→4)-低聚木糖的外切水解,以将连续的D-木糖残基从非还原端移除。出于本发明的目的,一个单位的β-木糖苷酶定义为在40℃、pH5、在含有0.01%20的100mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。
纤维二糖水解酶:术语“纤维二糖水解酶”意指1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从该链的还原端或非还原端释放纤维二糖(Teeri,1997,Crystalline cellulose degradation:New insight into the function ofcellobiohydrolases,Trends in Biotechnology 15:160-167;Teeri等,1998,Trichoderma reesei cellobiohydrolases:why so efficient on crystallinecellulose?,Biochem.Soc.Trans.26:173-178)。纤维二糖水解酶活性根据由Lever等,1972,Anal.Biochem.47:273-279;van Tilbeurgh等,1982,FEBS Letters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288;和Tomme等,1988,Eur.J.Biochem.170:575-581所述的方法确定。在本发明中,Tomme等的方法可用于确定纤维二糖水解酶活性。
内切葡聚糖酶:术语“内切葡聚糖酶”意指内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合β-1,3葡聚糖如谷类β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可通过测量底物粘度的减小,或通过还原糖测定法确定的还原端增加来确定内切葡聚糖酶活性(Zhang等,2006,Biotechnology Advances 24:452-481)。出于本发明的目的,内切葡聚糖酶活性根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法使用羧甲基纤维素(CMC)作为底物,在pH 5,40℃确定。
家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”或“GH61”意指根据Henrissat B.,1991,Aclassification of glycosyl hydrolases based on amino-acidsequence similarities,Biochem.J.280:309-316,及Henrissat和Bairoch,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696属于糖苷水解酶家族61的多肽。该家族中的酶原先基于在一个家族成员中测量到的非常弱的内切-1,4-β-D葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非经典的,并且它们不能被视为真正的(bona fide)糖苷酶。然而,基于当与纤维素酶或纤维素酶的混合物一同使用时,其增强纤维素分解的能力,它们被保留在CAZy分类中。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(例如,几种)水解半纤维素材料的酶。参见例如,Shallom和Shoham,2003,Microbialhemicellulases,Current Opinion In Microbiology6(3):219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括但不限于,乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶以及木糖苷酶。这些酶的底物即半纤维素是支链和线性多糖的异质组,这些多糖经由氢键与植物细胞壁中的纤维素微纤维键合,从而将它们交联成稳固的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH),抑或是水解乙酸或阿魏酸侧基的酯键的碳水化合物酯酶(CE)。这些催化模块,基于其一级结构的同源性,可指派于GH和CE家族。一些家族,具有总体上类似的折叠,可进一步归类为宗族(clan),按字母顺序标记(例如,GH-A)。在碳水化合物活性酶(CAZy)数据库中可得到这些酶以及碳水化合物活性酶的最具信息性和更新的分类。半纤维素分解酶活性可根据Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752在合适的温度(例如50℃、55℃或60℃)和pH(例如5.0或5.5)测量。
具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”意指催化由具有纤维素分解活性的酶对纤维素材料的水解的增强的GH61多肽。出于本发明的目的,纤维素分解增强活性通过测量在以下条件下来自由纤维素分解酶水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定:1-50mg总蛋白质/g于PCS中的纤维素,其中总蛋白质由50%-99.5%w/w纤维素分解酶蛋白以及0.5%-50%w/w具有纤维素分解增强活性的GH61多肽的蛋白质构成,在合适的温度(例如,50℃、55℃或60℃)以及pH(例如,5.0或5.5)进行1-7天,与具有相等的总蛋白质负载量而无纤维素分解增强活性的对照水解(1-50mg纤维素分解蛋白/g于PCS中的纤维素)相比较。在一个方面,使用在总蛋白重量的2%-3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或者总蛋白质量的2%-3%的烟曲霉β-葡糖苷酶(如WO 2002/095014所述在米曲霉中重组产生)的纤维素酶蛋白加载量存在下的1.5L(诺维信公司,巴格斯瓦尔德,丹麦(NovozymesA/S,Denmark))的混合物作为纤维素分解活性的来源。
具有纤维素分解增强活性的GH61多肽通过降低达到相同水解水平所需的纤维素分解酶的量而增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,例如至少1.05倍,至少1.10倍,至少1.25倍,至少1.5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,或至少20倍。
木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(1,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8),其催化木聚糖中1,4-β-D-木糖苷键的内水解。就本发明而言,木聚糖酶活性是在37℃在0.01%X-100和200mM磷酸钠缓冲液pH 6中用0.2%AZCL-阿拉伯木聚糖作为底物确定的。一个单位的木聚糖酶活性定义为在37℃、pH 6在200mM磷酸钠pH 6缓冲液中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0μ摩尔天青精。
用于基于纤维素的发酵的发酵生物
“发酵生物”或“发酵微生物”指适合用于合意的发酵过程以产生发酵产物的任何生物,包括细菌和真菌生物。发酵生物可为己糖和/或戊糖发酵生物,或它们的组合。己糖和戊糖发酵生物均为本领域中公知的。适合的发酵微生物能够将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或寡糖)直接或间接地发酵(即,转化)成合意的发酵产物。可产生乙醇的细菌和真菌发酵生物的实例由Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642描述。
能够发酵己糖类的发酵生物的实例包括细菌生物和真菌生物,如酵母。优选的酵母包括假丝酵母属、克鲁维酵母属和酵母属,例如萨纳瑞西斯假丝酵母(Candidasonorensis)、马克斯克鲁维酵母和酿酒酵母的菌株。
可发酵处于其天然状态的戊糖类的发酵生物的实例包括细菌和真菌生物,如一些酵母。优选的木糖发酵酵母包括假丝酵母属的菌株,优选休哈塔假丝酵母(C.sheatae)或萨纳瑞西斯假丝酵母(C.sonorensis);以及毕赤酵母属的菌株,优选是树干毕赤酵母,例如树干毕赤酵母CBS 5773。优选的戊糖发酵酵母包括管囊酵母属(Pachysolen),优选嗜鞣管囊酵母(Pachysolen tannophilus)的菌株。不能发酵戊糖类(如木糖和阿拉伯糖)的生物可通过本领域已知方法来进行遗传修饰而发酵戊糖。
可将己糖和戊糖有效地发酵为乙醇的细菌的实例包括例如凝结芽孢杆菌、丙酮丁醇梭杆菌、热纤维梭菌、植物发酵梭菌(Clostridium phytofermentans)、地芽孢杆菌属菌种、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)、以及运动发酵单胞菌(Philippidis,1996,上文)。
其他发酵生物包括以下的菌株:芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如萨纳瑞西斯假丝酵母、C.methanosorbosa、迪丹斯假丝酵母(Candida diddensii)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、布朗克假丝酵母(C.blankii)、嗜虫假丝酵母(C.entomophilia)、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(Candidapseudotropicalis)、博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candidautilis)和休哈塔假丝酵母(C.scehatae);梭菌属,如丙酮丁醇梭菌、热纤维梭菌和植物发酵梭菌;大肠杆菌,特别是经遗传修饰促进乙醇产率的大肠杆菌菌株;地芽孢杆菌属菌种;汉逊酵母属,例如异常汉森酵母;克雷伯氏菌属(Klebsiella),如产酸克雷伯氏菌(Klebsiella oxytoca);克鲁维酵母属,如马克斯克鲁维酵母、乳酸克鲁维酵母(K.lactis)、耐热克鲁维酵母(K.thermotolerans)和脆壁克鲁维酵母;裂殖酵母属,例如粟酒裂殖酵母(S.pombe);热厌氧杆菌属,例如解糖热厌氧杆菌(Thermoanaerobactersaccharolyticum);以及发酵单胞菌属,例如运动发酵单胞菌。
在一个优选的方面,酵母是酒香酵母属(Bretannomyces)。在一个更优选方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)。在另一个优选方面,酵母是假丝酵母。在另一个更优选方面,酵母是萨纳瑞西斯假丝酵母。在另一个更优选方面,酵母是博伊丁假丝酵母。在另一个更优选方面,酵母是布朗克假丝酵母。在另一个更优选方面,酵母是芸薹假丝酵母。在另一个更优选方面,酵母是迪丹斯假丝酵母。在另一个更优选方面,酵母是嗜虫假丝酵母。在另一个更优选方面,酵母是假热带假丝酵母。在另一个更优选方面,酵母是休哈塔假丝酵母。在另一个更优选方面,酵母是产朊假丝酵母。在另一个优选方面,酵母是棒孢酵母属(Clavispora)。在另一个更优选方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一个更优选方面,酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选方面,酵母是克鲁维酵母属。在另一个更优选方面,酵母是脆壁克鲁维酵母。在另一个更优选方面,酵母是马克斯克鲁维酵母。在另一个更优选方面,酵母是耐热克鲁维酵母。在另一个优选方面,酵母是管囊酵母属。在另一个更优选方面,酵母是嗜鞣管囊酵母。在另一个优选方面,酵母是毕赤酵母属。在另一个优选方面,酵母是树干毕赤酵母。在另一个优选方面,酵母是酵母属菌种。在一个更优选方面,酵母是酿酒酵母。在另一个更优选方面,酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。
在一个优选方面,细菌是芽孢杆菌属。在一个更优选方面,细菌是凝结芽孢杆菌。在另一个优选方面,细菌是梭菌属。在另一个更优选方面,细菌是丙酮丁醇梭菌。在另一个更优选方面,细菌是植物发酵梭菌。在另一个更优选方面,细菌是热纤维梭菌。在另一个更优选方面,细菌是地芽孢杆菌属菌种。在另一个更优选方面,细菌是热厌氧杆菌属。在另一个更优选的方面,细菌是解糖热厌氧杆菌。在另一个优选方面,细菌是发酵单胞菌属。在另一个更优选方面,细菌是运动发酵单胞菌。
可商购的适合乙醇生产的酵母包括例如,BIOFERMTMAFT和XR(North AmericanBioproducts Corporation,佐治亚州,美国)、ETHANOL REDTM酵母(ermentis/Lesaffre,美国)、FALITM(Fleischmann’s Yeast,美国)、FERMIOLTM(DSM Specialties)、GERT STRANDTM(Gert Strand AB,瑞典)以及SUPERSTARTTM和THERMOSACCTM新鲜酵母(EthanolTechnology,威斯康星州,美国)。
在一个优选的方面,发酵微生物已经过遗传修饰以提供发酵戊糖类的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。
通过将异源基因克隆入多种发酵微生物已经构建了能将己糖和戊糖转化成乙醇(共发酵)的生物(Chen和Ho,1993,Cloning and improving the expression of Pichiastipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,Genetically engineeredSaccharomyces yeast capable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,Xylose fermentationby Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizing Saccharomyces cerevisiae strains overexpressingthe TKL1and TAL1genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,Minimal metabolic engineering of Saccharomyces cerevisiae for efficientanaerobic xylose fermentation:a proof of principle,FEMS Yeast Research 4:655-664;Beall等,1991,Parametric studies of ethanol production from xylose andother sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214;Zhang等,1995,Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243;Deanda等,1996,Development of an arabinose-fermenting Zymomonas mobilis strainby metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470;WO 2003/062430,木糖异构酶)。
在一个优选方面,遗传修饰的发酵微生物是萨纳瑞西斯假丝酵母。在另一个优选方面,遗传修饰的发酵微生物是大肠杆菌。在另一个优选方面,遗传修饰的发酵微生物是产酸克雷伯氏菌。在另一个优选方面,遗传修饰的发酵微生物是马克斯克鲁维酵母。在另一个优选方面,遗传修饰的发酵微生物是酿酒酵母。在另一个优选方面,遗传修饰的发酵微生物是运动发酵单胞菌。
本领域中公知的是,上述生物还能用于产生其他物质,如本文所述。
典型地向降解的纤维素材料或水解物中添加发酵微生物,并且发酵进行约8至约96小时,例如约24至约60小时。温度典型地为约26℃至约60℃,例如约32℃或50℃,并且pH为约pH 3至约pH 8,例如pH 4-5、6、或7。
在一方面,将酵母和/或另一种微生物施加至降解的纤维素材料并且发酵进行约12至约96小时,如典型地24-60小时。在另一方面,温度优选为约20℃至约60℃,例如约25℃至约50℃、约32℃至约50℃、或约32℃至约50℃,并且pH通常为约pH 3至约pH 7,例如约pH4至约pH 7。然而,一些发酵生物(例如细菌)具有更高的最适发酵温度。酵母或另一种微生物优选以大约105至1012,优选大约107至1010,尤其是大约2×108个活细胞计数每ml发酵液的量施用。关于使用酵母进行发酵的进一步指导可见于,例如,“The Alcohol Textbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,Nottingham University Press,UnitedKingdom 1999),其通过提述由此并入。
对于乙醇产生,在发酵之后,蒸馏经发酵的浆料以提取乙醇。根据本发明的方法获得的乙醇可用作例如燃料乙醇、饮用乙醇,即可饮用的中性酒精饮料,或工业乙醇。
发酵刺激剂可与本申请中所述的任何方法组合使用,以进一步改进发酵工艺,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇产率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。用于生长的优选发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素、以及维生素A、B、C、D和E。参见,例如,Alfenore等,Improving ethanolproduction and viability of Saccharomyces cerevisia by a vitamin feedingstrategy during fed-batch process,Springer-Verlag(2002),其通过提述由此并入。矿物质的实例包括矿物质和矿物盐,其可供应包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu的营养物。
发酵产物
根据本发明,术语“发酵产物”可为由发酵得到的任何物质。发酵产物可为,不限于,醇(例如,阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);烷烃(例如,戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、以及十二烷)、环烷烃(例如,环戊烷、环己烷、环庚烷、以及环辛烷)、烯烃(例如,戊烯、己烯、庚烯、以及辛烯);一种氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、以及苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)、以及一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。发酵产物还可为作为高价值产品的蛋白质。
在一个优选的方面,发酵产物是醇。可理解的是,术语“醇”涵盖包含一个或多个(例如几个)羟基基团的物质。在更优选的方面,该醇是正丁醇。在另一个更优选的方面,该醇是异丁醇。在另一个更优选方面,该醇是乙醇。在另一个更优选方面,该醇是甲醇。在另一个更优选方面,该醇是阿拉伯糖醇。在另一个更优选方面,该醇是丁二醇。在另一个更优选方面,该醇是乙二醇。在另一个更优选方面,该醇是丙三醇。在另一个更优选方面,该醇是甘油。在另一个更优选方面,该醇是1,3-丙二醇。在另一个更优选方面,该醇是山梨醇。在另一个更优选方面,该醇是木糖醇。参见,例如,Gong,C.S.、Cao,N.J.、Du,J.以及Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in BiochemicalEngineering/Biotechnology,Scheper,T.编,Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam和Singh,1995,Processes forfermentative production of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji等,2003,Production of acetone,butanol and ethanol byClostridium beijerinckii BA101and in situ recovery by gas stripping,WorldJournal of Microbiology and Biotechnology 19(6):595-603。
在另一个优选的方面,该发酵产物是烷烃。该烷烃可以是非支链或支链烷烃。在另一个更优选方面,该烷烃是戊烷。在另一个更优选方面,该烷烃是己烷。在另一个更优选方面,该烷烃是庚烷。在另一个更优选方面,该烷烃是辛烷。在另一个更优选方面,该烷烃是壬烷。在另一个更优选方面,该烷烃是癸烷。在另一个更优选方面,该烷烃是十一烷。在另一个更优选方面,该烷烃是十二烷。
在另一个优选方面,发酵产物是环烷烃。在另一个更优选方面,该环烷烃是环戊烷。在另一个更优选方面,该环烷烃是环己烷。在另一个更优选方面,该环烷烃是环庚烷。在另一个更优选方面,该环烷烃是环辛烷。
在另一个优选方面,发酵产物是烯烃。该烯烃可以是非支链或支链烯烃。在另一个更优选方面,该烯烃是戊烯。在另一个更优选方面,该烯烃是己烯。在另一个更优选方面,该烯烃是庚烯。在另一个更优选方面,该烯烃是辛烯。
在另一个优选方面,发酵产物是氨基酸。在另一个更优选方面,该有机酸是天冬氨酸。在另一个更优选方面,该氨基酸是谷氨酸。在另一个更优选方面,该氨基酸是甘氨酸。在另一个更优选方面,该氨基酸是赖氨酸。在另一个更优选方面,该氨基酸是丝氨酸。在另一个更优选方面,该氨基酸是苏氨酸。参见,例如,Richard和Margaritis,2004,Empiricalmodeling of batch fermentation kinetics for poly(glutamic acid)production andother microbial biopolymers,Biotechnology and Bioengineering 87(4):501-515。
在另一个优选的方面,该物质是气体。在另一个更优选方面,该气体是甲烷。在另一个更优选方面,该气体是H2。在另一个更优选方面,该气体是CO2。在另一个更优选方面,该气体是CO。参见,例如,Kataoka,Miya以及Kiriyama,1997,Studies on hydrogenproduction by continuous culture system of hydrogen-producing anaerobicbacteria,Water Science and Technology 36(6-7):41-47;和Gunaseelan,1997,Anaerobic digestion of biomass for methane production:A review,Biomass andBioenergy,13(1-2):83-114。
在另一个优选方面,该发酵产物是异戊二烯。
在另一个优选方面,发酵产物是酮。应理解的是,术语“酮”涵盖含有一个或多个(例如几个)酮模块的物质。在另一个更优选的方面,所述酮是丙酮。参见,例如,Qureshi和Blaschek,2003,见上文。
在另一个优选方面,发酵产物是有机酸。在另一个更优选方面,该有机酸是乙酸。在另一个更优选方面,该有机酸是醋酮酸。在另一个更优选方面,该有机酸是己二酸。在另一个更优选方面,该有机酸是抗坏血酸。在另一个更优选方面,该有机酸是柠檬酸。在另一个更优选方面,该有机酸是2,5-二酮-D-葡糖酸。在另一个更优选方面,该有机酸是甲酸。在另一个更优选方面,该有机酸是反丁烯二酸。在另一个更优选方面,该有机酸是葡糖二酸。在另一个更优选方面,该有机酸是葡糖酸。在另一个更优选方面,该有机酸是葡糖醛酸。在另一个更优选方面,该有机酸是戊二酸。在另一个更优选方面,该有机酸是3-羟基丙酸。在另一个更优选方面,该有机酸是衣康酸。在另一个更优选方面,该有机酸是乳酸。在另一个更优选方面,该有机酸是苹果酸。在另一个更优选方面,该有机酸是丙二酸。在另一个更优选方面,该有机酸是草酸。在另一个更优选方面,该有机酸是丙酸。在另一个更优选方面,该有机酸是琥珀酸。在另一个更优选方面,该有机酸是木糖酸。参见,例如,Chen和Lee,1997,Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
回收
在发酵之后,任选地使用本领域已知的任何方法回收发酵产物,所述方法包括,但不限于,层析、电泳方法、差示溶解度、蒸馏或提取。例如,通过常规蒸馏方法从发酵的材料分离并纯化醇,如乙醇。可获得纯度高至约96vol.%的乙醇,其能用作,例如,燃料乙醇、饮用乙醇(即,可饮用的中性含酒精饮料),或工业乙醇。
通过以下实例进一步描述本发明,所述实例不应理解为对本发明范围的限制。
实例
本申请中描述并且要求保护的本发明不限于在此公开的特定方面的范围,因为这些方面旨在作为本发明若干方面的说明。任何等同方面意欲在本发明的范围之内。实际上,除本申请中所示和描述的那些之外,对于本领域的技术人员而言本发明的多种修改将从前述的描述变得显然。这样的修改也旨在落入所附权利要求的范围内。在冲突的情况下,以包括定义的本披露为准。
材料与方法
酶:
来自瘤孢毁丝霉的海藻糖酶(Ms37tr或Ms海藻糖酶)(P33WJF)作为本申请中的SEQID NO:30中氨基酸21-697显示。
来自绿毛壳菌的海藻糖酶(Cv37tr或Cv海藻糖酶)(P33W9X)作为本申请中的SEQID NO:4中氨基酸21-690显示。
来自里氏木霉的海藻糖酶(Tr37tr或Tr37海藻糖酶)(P337ZG)作为WO 2013/148993中的SEQ ID NO:12和本申请中的SEQ ID NO:16显示。
来自里氏木霉的海藻糖酶(Tr65tr或Tr65海藻糖酶)(P24TTB)作为本申请中的SEQID NO:31显示。
纤维素酶VD:源自里氏木霉的纤维素分解组合物,其包含源自埃默森青霉的菌株、具有纤维素分解增强活性的GH61A多肽(WO 2011/041397中的SEQ ID NO:2或本申请中的SEQ ID NO:8)、烟曲霉β-葡糖苷酶(WO2005/047499中的SEQ ID NO:2或本申请中的SEQ IDNO:6)具有以下取代的变体:F100D、S283G、N456E、F512Y(WO 2012/044915中披露的);WO2011/057140中作为SEQ ID NO:6或本申请中的SEQ ID NO:6披露的烟曲霉Cel7A CBH I以及WO 2011/057140中作为SEQ ID NO:18或本申请中的SEQ ID NO:8披露的烟曲霉Cel7ACBH II。
α-淀粉酶A(AAA):嗜热脂肪芽孢杆菌α-淀粉酶,其具有突变I181*+G182*+N193F,截短至491个氨基酸(SEQ ID NO:18)。
α-淀粉酶369(AA369):嗜热脂肪芽孢杆菌α-淀粉酶,其具有突变I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+Q254S+M284V,截短至491个氨基酸(SEQ ID NO:18)。
α-淀粉酶共混物B(AABB):α-淀粉酶369、葡糖淀粉酶PoAMG498和Pfu淀粉酶以基于μg酶蛋白大约55:120:1的比例的共混物。
草酸青霉菌葡糖淀粉酶变体PE498(“PoAMG498”):草酸青霉菌葡糖淀粉酶变体,其具有以下突变:K79V+P2N+P4S+P11F+T65A+Q327F(使用本申请中的SEQ ID NO:23用于编号):
蛋白酶Pfu(“PFU”):本申请中的SEQ ID NO:22中所示的源自激烈火球菌的蛋白酶。
葡糖淀粉酶E:包含共混物,该共混物包括WO 99/28448中披露的埃默森踝节菌葡糖淀粉酶(本申请中的SEQ ID NO:13)、WO 06/69289中作为SEQ ID NO:2和本申请中的SEQID NO:14披露的瓣环栓菌葡糖淀粉酶、和作为本申请中的SEQ ID NO:15披露的具有黑曲霉葡糖淀粉酶接头和SBD的微小根毛霉α-淀粉酶,其具有以下突变:G128D+D143N(活性比AGU:AGU:FAU(F):约30:7:1)。
葡糖淀粉酶U:包括以下的共混物:WO 99/28448中作为SEQ ID NO:34披露的埃默森踝节菌葡糖淀粉酶、WO 06/69289中作为SEQ ID NO:2披露的瓣环栓菌葡糖淀粉酶、以及本申请中的SEQ ID NO:15中披露的具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉α-淀粉酶,其具有以下取代:G128D+D143N(以AGU:AGU:FAU-F表示的活性比为约65:15:1)。
葡糖淀粉酶A:葡糖淀粉酶E和纤维素酶VD以基于μg酶蛋白大约10:3的比例的共混物。
酵母:
来自Fermentis,美国的ETHANOL REDTM
序列同一性
出于本发明的目的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)确定两个氨基酸序列之间的序列同一性,如EMBOSS程序包的Needle程序中所执行的(EMBOSS:The European Molecular Biology Open SoftwareSuite,Rice等,2000,Trends Genet.16:276-277)(优选5.0.0版或更新版本)。使用的参数是缺口开放罚分10、缺口扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle的输出(使用–nobrief选项获得)用作百分比同一性并且计算如下:
(相同的残基x 100)/(比对的长度-比对中缺口的总数)
海藻糖酶活性:
原理:
海藻糖+H2O海藻糖酶>2葡萄糖
T=37℃,pH=5.7,A340nm,光路=1cm
光度法停止率测定(Spectrophotometric Stop Rate Determination)
单位定义
在pH 5.7,在37℃,一个单位每分钟将1.0毫摩尔的海藻糖转化为2.0毫摩尔的葡萄糖(在pH 7.5,测定的释放的葡萄糖)。
(参见Dahlqvist,A.(1968)Analytical Biochemistry 22,99-107)
蛋白质测定法
AZCL-酪蛋白测定法
将蓝色底物AZCL-酪蛋白的0.2%溶液悬浮于Borax/NaH2PO4缓冲液pH9中同时搅拌。在搅拌的同时将该溶液分散在微量滴定板(每孔100微升)上,添加30微升酶样品并将板在Eppendorf热混合器中在45℃和600rpm温育30分钟。将变性的酶样品(100℃煮沸20分钟)用作空白。温育之后通过将微量滴定板转移到冰上来终止该反应并通过在4℃以3000rpm离心5分钟将着色的溶液与固体分离。将60微升的上清液转移到微量滴定板并使用BioRad酶标仪(Microplate Reader)测量在595nm处的吸光度。
pNA-测定法
将50微升含蛋白酶的样品添加到微量滴定板并通过添加100微升1mM pNA底物(5mg溶解于100微升DMSO中并进一步用Borax/NaH2PO4缓冲液pH 9.0稀释至10mL)开始该测定。监测OD405在室温的增加作为蛋白酶活性的量度。
葡糖淀粉酶活性(AGU)
可以葡糖淀粉酶单位(AGU)来测量葡糖淀粉酶活性。
Novo葡糖淀粉酶单位(AGU)定义为在以下标准条件下每分钟水解1微摩尔麦芽糖的酶量:37℃,pH 4.3,底物:麦芽糖23.2mM,缓冲液:乙酸盐0.1M,反应时间5分钟。
可使用自动分析仪系统。将变旋酶添加到葡萄糖脱氢酶试剂中,使得存在的任何α-D-葡萄糖变为β-D-葡萄糖。葡萄糖脱氢酶在以上提到的反应中与β-D-葡萄糖特异性反应,形成NADH,使用光度计在340nm测定该NADH作为起始葡萄糖浓度的量度。
AMG温育:
底物: 麦芽糖23.2mM
缓冲液: 乙酸盐0.1M
pH: 4.30±0.05
温育温度: 37℃±1
反应时间: 5分钟
酶工作范围: 0.5-4.0AGU/mL
颜色反应:
GlucDH: 430U/L
变旋酶: 9U/L
NAD: 0.21mM
缓冲液: 磷酸盐0.12M;0.15M NaCl
pH: 7.60±0.05
温育温度: 37℃±1
反应时间: 5分钟
波长: 340nm
更详细描述这种分析方法的文件夹(EB-SM-0131.02/01)可从丹麦诺维信公司应要求得到,所述文件夹通过提述由此并入。
酸性α-淀粉酶活性
当根据本发明使用时,可以AFAU(酸性真菌α-淀粉酶单位)或FAU-F来测量酸性α-淀粉酶的活性。
酸性α-淀粉酶活性(AFAU)
可以AFAU(酸性真菌α-淀粉酶单位)测量酸性α-淀粉酶活性,其相对于酶标准品确定。1AFAU定义为在下述标准条件下每小时降解5.260mg淀粉干物质的酶量。
酸性α-淀粉酶,其为内切α-淀粉酶(1,4-α-D-葡聚糖-葡聚糖水解酶,E.C.3.2.1.1),水解淀粉分子内部区域中的α-1,4-葡糖苷键以形成具有不同链长的寡糖和糊精。与碘形成的颜色的强度和淀粉浓度成正比。使用反向比色法在指定的分析条件下测定淀粉浓度的降低作为酶活性。
蓝色/紫色t=23秒脱色
标准条件/反应条件:
更详细地描述此分析方法的文件夹EB-SM-0259.02/01可以从丹麦诺维信公司应要求得到,所述文件夹通过提述由此并入。
FAU-F的测定
相对于具有声明强度的酶标准品测量FAU-F真菌α-淀粉酶单位(Fungal Alpha-Amylase Units(Fungamyl))。
更详细地描述这种标准方法的文件夹(EB-SM-0216.02)可从丹麦诺维信公司应要求得到,该文件夹通过提述由此并入。
α-淀粉酶活性(KNU)
可使用马铃薯淀粉作为底物测定α-淀粉酶活性。此方法是基于由酶分解改性的马铃薯淀粉,并且该反应通过将淀粉/酶溶液的样品与碘溶液混合来追踪。最初形成黑蓝色,但淀粉分解过程中蓝色变弱并且逐渐变为红褐色,将其与有色玻璃标准品比较。
将一千Novoα-淀粉酶单位(KNU)定义为在标准条件下(即,在37℃+/-0.05;0.0003M Ca2+;和pH 5.6)使5260mg淀粉干物质Merck Amylum solubile糊精化的酶量。
更详细地描述了这种分析方法的文件夹EB-SM-009.02/01可从丹麦诺维信公司应要求获得,所述文件夹通过提述由此包括。
α-淀粉酶活性(KNU-A)
相对于所声明强度的酶标准品,以KNU(A)千Novozymes单位(A)测量α淀粉酶活性。
样品中的α淀粉酶和试剂盒中的α-葡糖苷酶将底物(4,6-亚乙基(G7)-对硝基苯基(G1)-α、D-麦芽七糖苷(亚乙基-G7PNP)水解成葡萄糖和黄色的对硝基苯酚。
通过Konelab 30观察对硝基苯酚的形成速率。这是反应速率及由此为酶活性的表达。
该酶是具有酶分类号EC 3.2.1.1的α-淀粉酶。
关于确定KNU-A活性的文件夹EB-SM-5091.02-D可从丹麦诺维信公司应要求得到,该文件夹通过提述由此包括。
PNP-G7测定法
可通过采用G7-pNP底物的方法确定α-淀粉酶活性。G7-pNP,其为4,6-亚乙基(G7)-对硝基苯基(G1)-α,D-麦芽七糖苷的缩写,是一种可被内切淀粉酶例如α-淀粉酶切割的嵌段寡糖。切割之后,试剂盒中所包括的α-葡糖苷酶进一步消化水解的底物以释放自由PNP分子,该分子具有黄颜色并因而可通过可见光分光光度法在λ=405nm(400-420nm)处测量。包含G7-pNP底物和α-葡糖苷酶的试剂盒由Roche/Hitachi制造(目录号11876473)。
试剂:
来自这个试剂盒的G7-pNP底物包含22mM 4,6-亚乙基-G7-pNP和52.4mM HEPES(2-[4-(2-羟基乙基)-1-哌嗪基]-乙磺酸),pH 7.0。
α-葡糖苷酶试剂包含52.4mM HEPES、87mM NaCl、12.6mM MgCl2、0.075mM CaCl2、>4kU/L的α-葡糖苷酶。
通过将1mL的α-葡糖苷酶试剂与0.2mL的G7-pNP底物混合,制成底物工作溶液。此底物工作溶液在使用之前立即制成。
稀释缓冲液:50mM MOPS,0.05%(w/v)Triton X100(聚乙二醇对-(1,1,3,3-四甲基丁基)-苯基醚(C14H22O(C2H4O)n(n=9-10))),1mM CaCl2,pH8.0。
方法:
将待分析的淀粉酶样品稀释于稀释缓冲液中以确保稀释样品中的pH是7。通过将20μl稀释的酶样品转移至96孔微量滴定板并添加80μl底物工作溶液来进行测定。将溶液混合并在室温预温育1分钟并且在OD 405nm经5分钟每20秒测量吸收。
在给定的一组条件下,时间依赖性吸收曲线的斜率(每分钟的吸光度)与所讨论的α-淀粉酶的比活性(活性/mg酶)成正比。淀粉酶样品应稀释至其中斜率为0.4吸光度单位/分钟以下的水平。
Phadebas活性测定法
α-淀粉酶活性还可通过使用Phadebas底物(例如来自Magle Life Sciences,隆德(Lund),瑞典(Sweden))的方法来确定。Phadebas片剂包括互联的淀粉聚合物,这些聚合物呈不溶于水的球状微球形式。将蓝色染料共价结合至这些微球。微球中的互联的淀粉聚合物以与α-淀粉酶活性成比例的速度降解。当α-淀粉酶降解淀粉聚合物时,释放的蓝色染料是可溶于水的并且染料的浓度可通过在620nm测量吸光度来确定。蓝色的浓度与样品中的α-淀粉酶活性成比例。
将待分析的淀粉酶样品稀释于具有合意的pH的活性缓冲液中。将一个底物片剂悬浮于5mL活性缓冲液中并在磁力搅拌器上混合。在混合底物期间,将150μl转移至微量滴定板(MTP)或PCR-MTP。将30μl稀释的淀粉酶样品添加至150μl底物并混合。在37℃温育15分钟。通过添加30μl 1M NaOH并且混合来停止反应。在4000xg离心MTP 5分钟。将100μl转移至新的MTP并且测量620nm的吸光度。
淀粉酶样品应稀释使得在620nm的吸光度为0-2.2,并且在活性测定的线性范围内。
还原糖活性测定法:
α-淀粉酶活性还可以通过用例如玉米淀粉底物的还原糖测定法来确定。通过与对-羟基苯甲酸酰肼(PHBAH)反应来确定用α-淀粉酶水解淀粉中的α-1,4-糖苷键所形成的还原端的数目。在与PHBAH反应之后,可通过在405nm的吸光度来测量还原端的数目并且还原端的浓度与样品中的α-淀粉酶活性成比例。
通过在milliQ水中蒸煮5分钟来溶解玉米淀粉底物(3mg/mL)并且在测定之前冷却。关于终止溶液,制备Ka-Na-酒石酸盐/NaOH溶液(K-Na-酒石酸盐(Merck 8087)50g/l,NaOH 20g/l)并通过将对-羟基苯甲酸酰肼(PHBAH,Sigma H9882)添加至Ka-Na-酒石酸盐/NaOH溶液至15mg/mL来新鲜制备终止溶液。
在PCR-MTP中,将50μl活性缓冲液与50μl底物混合。添加50μl稀释的酶并且混合。在PCR仪中在合意的温度温育5分钟。通过添加75μl终止溶液(Ka-Na-酒石酸盐/NaOH/PHBAH)来停止反应。在PCR仪中在95℃温育10分钟。将150μl转移至新MTP并测量405nm的吸光度。
淀粉酶样品应稀释使得在405nm的吸光度为0-2.2,并且在活性测定的线性范围内。
测定法:
为了确定残余淀粉酶活性,可使用Ultra淀粉酶测定试剂盒(E33651,Invitrogen,拉霍亚(La Jolla),加州(CA),美国(USA))。
底物是玉米淀粉衍生物,DQTM淀粉,它是用FL染料标记至这样的程度以使得荧光被淬灭的玉米淀粉。将含有大约1mg冻干底物的一个小瓶溶解于100微升的50mM乙酸钠(pH 4.0)中。将小瓶涡旋20秒并且在室温在黑暗中放置,并偶尔混合直到溶解为止。然后添加900微升的100mM乙酸盐、0.01%(w/v)X100、0.125mM CaCl2,pH 5.5,充分涡旋并在室温在黑暗中储存直到准备使用为止。通过以10倍稀释于残余活性缓冲液(100mM乙酸盐、0.01%(w/v)X100、0.125mM CaCl2,pH 5.5)中来制备储备底物工作溶液。温育之后立即将酶在100mM乙酸盐、0.01%(W/v)X100、0.125mM CaCl2,pH 5.5中稀释至10-20ng酶蛋白/ml的浓度。
为了测定,在黑色384孔微量滴定板中,将25微升的底物工作溶液与25微升稀释的酶混合10秒。在每个孔中在25℃于15分钟内每分钟测量荧光强度(激发:485nm,发射:555nm)并计算荧光强度相对于时间的曲线的斜率作为Vmax。曲线应是线性的,并且调整了残余活性测定使得稀释的参照酶溶液在活性测定的线性范围内。
普鲁兰酶活性(NPUN)的确定
相对于诺维信公司普鲁兰酶标准品测量以NPUN计的内切-普鲁兰酶活性。一个普鲁兰酶单位(NPUN)定义为在标准条件下(0.7%红色普鲁兰(red pullulan)(Megazyme),pH5,40℃,20分钟)每分钟释放1微摩尔葡萄糖的酶量。使用红色普鲁兰以NPUN/ml测量该活性。
将1mL稀释的样品或标准品在40℃温育2分钟。添加0.5mL 2%红色普鲁兰、0.5MKCl、50mM柠檬酸,pH 5并混合。将管在40℃温育20分钟并通过添加2.5ml 80%乙醇终止。将管在室温静置10-60分钟,随后以4000rpm离心10分钟。然后在510nm处测量上清液的OD并使用标准曲线计算活性。
培养基和溶液
YP+2%葡萄糖培养基由1%酵母提取物、2%蛋白胨以及2%葡萄糖构成。
YP+2%麦芽糊精培养基由1%酵母提取物、2%蛋白胨以及2%麦芽糊精构成。
PDA琼脂板是由马铃薯浸出液(马铃薯浸出液是通过将300g切片的(经过洗涤但未削皮)的马铃薯在水中煮沸30分钟,然后将该培养液倾析或滤过粗滤布而制成)构成的。然后添加蒸馏水,直到悬浮液的总体积为一升,随后添加20g的右旋糖和20g的琼脂粉。该培养基通过在15psi高压杀菌15分钟来进行灭菌(Bacteriological Analytical Manual,第8版,修订A,1998)。
LB板由10g的细菌用胰蛋白胨(Bacto-Tryptone)、5g的酵母提取物、10g的氯化钠、15g的细菌用琼脂(Bacto-agar)及补足至1升的去离子水构成。
LB培养基由10g的细菌用胰蛋白胨、5g的酵母提取物、10g的氯化钠,以及补足到1升的去离子水组成。
COVE蔗糖板由342g的蔗糖、20g的琼脂粉、20ml的COVE盐溶液及补足至1升的去离子水构成。该培养基通过在15psi高压杀菌15分钟来进行灭菌(BacteriologicalAnalytical Manual,第8版,修订A,1998)。将该培养基冷却至60℃并添加10mM的乙酰胺、15mM的CsCl、X-100(50μl/500ml)。
COVE盐溶液是由26g的MgSO4·7H2O、26g的KCL、26g的KH2PO4、50ml的COVE痕量金属溶液及补足到1升的去离子水构成的。
COVE痕量金属溶液是由0.04g的Na2B4O7·10H2O,0.4g的CuSO4·5H2O,1.2g的FeSO4·7H2O,0.7g的MnSO4·H2O,0.8g的Na2MoO4·2H2O,10g的ZnSO4·7H2O,和补足到1升的去离子水构成。
实例1
来自变绿毛壳菌CBS547.75的变绿毛壳菌海藻糖酶(Cv37tr)多肽(P33W9X)编码序 列的克隆
变绿毛壳菌海藻糖酶(Cv海藻糖酶)多肽编码序列从变绿毛壳菌CBS547.75DNA通过PCR克隆。
变绿毛壳菌CBS547.75购自荷兰菌种保藏中心(Centraalbureau voorSchimmelcultures)(乌得勒支(Utrecht),荷兰)。在20℃,在1000ml锥形摇瓶中的100ml的YP+2%葡萄糖培养基中培养真菌菌株5天。通过由衬有(EMD Millipore,比勒利卡(Billerica),MA,USA)的Buchner真空漏斗对培养基进行过滤从这些瓶中收获菌丝体。将菌丝冷冻于液氮中并在-80℃储存直至进一步使用。根据制造商的说明,使用植物大提试剂盒(Plant Maxi Kit)(QIAGEN GMBH,希尔登(Hilden),德国)分离基因组DNA。
通过Illumina MySeq(Illumina Inc.,圣迭哥(San Diego),加利福尼亚州)产生基因组序列信息。根据制造商的说明,将5μg的分离的变绿毛壳菌基因组DNA用于文库制备和分析。使用GeneMark.hmm ES版本2.3c调用基因,并使用由Pfam提供的“海藻糖酶PF01204”隐马尔可夫模型(Hidden Markov Model)进行该催化结构域的鉴定。使用以下描述的引物(SEQ ID NO:24和SEQ ID NO:25)通过PCR,从变绿毛壳菌CBS547.75基因组DNA,克隆整个编码区的多肽编码序列。
KKSC0334-F
5’-ACACAACTGGGGATCCACCATGACGCTCCGACACCTCGG-3’(SEQ ID NO:24)
KKSC0334-R
5’-CTAGATCTCGAGAAGCTTTCACGACCTCCTCCCTACCC-3’(SEQ ID NO:25)
粗体字母表示变绿毛壳菌酶编码序列。限制位点是加下划线的。限制位点左方的序列与pDau109(WO 2005/042735)的插入位点是同源的。
根据制造商的说明(Phusion HiFi DNA聚合酶目录#M0530S,New EnglandBiolabs Inc.)以如下终浓度进行扩增反应(50μl):
PCR混合物
将PCR反应在编程为如下的双块热循环仪(Dual-Block ThermalCycler)(BioRad,USA)中温育:在98℃进行30秒的1个循环;35个循环,各在98℃进行10秒钟,在72℃进行2秒钟,然后是在72℃进行7分钟的一个循环;在移出并且进一步加工之前将样品冷却至10℃。
使用40mM Tris碱、20mM乙酸钠、1mM EDTA二钠(TAE)缓冲液,通过1%琼脂糖凝胶电泳分析4μl的PCR反应。观察到约2241bp的主条带。根据制造商的说明,直接用ILLUSTRATMGFXTMPCR DNA和凝胶条带纯化试剂盒(GE Healthcare,皮斯卡塔韦(Piscataway),新泽西州,美国)纯化剩余的PCR反应。
将2μg的质粒pDau109用Bam HI和Hind III进行消化,并且在1%琼脂糖凝胶上使用50mM Tris碱-50mM硼酸-1mM EDTA二钠(TBE)缓冲液运行该消化的质粒,以从该限制质粒去除填充物片段。通过添加安全DNA凝胶染液(Safe DNA gel stain)(LifeTechnologies Corporation,格兰德岛(Grand Island),新泽西州,美国)并且使用470nm波长透照仪将条带可视化。将对应于该限制质粒的条带切下,并使用ILLUSTRATMGFXTMPCR DNA和凝胶条带纯化试剂盒(来自GE Healthcare目录号28-9034-70)进行纯化。将该质粒洗脱入10mM Tris pH 8.0中,并将其浓度调节至20ng/μl。使用IN-HD EcoDry-DownPCR克隆试剂盒(BD Biosciences,Palo Alto,加利福尼亚州,美国)以将该2241bp PCR片段克隆入用Bam HI和Hind III消化的pDau109(20ng)中。该IN-总反应体积是10μl。该IN-总反应体积是10μl。根据制造商的方案,将该IN-反应转化入FUSION-BLUETM大肠杆菌细胞(BD Biosciences,Palo Alto,加利福尼亚州,美国)中,并且将其铺板在补充有50μg的氨苄青霉素/ml的LB琼脂板上。在37℃温育过夜之后,观察到转化菌落在补充有50μg氨苄青霉素/ml的LB板上在选择下生长。
选择具有正确的变绿毛壳菌海藻糖酶编码序列(SEQ ID NO:3)的一个质粒。该质粒命名为pKKSC0334-1。将变绿毛壳菌海藻糖酶基因克隆入Bam HI-Xho I消化的pDau109中,导致变绿毛壳菌海藻糖酶基因在NA2-tpi双启动子的控制下进行转录。NA2-tpi为来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中未翻译的前导序列已经用来自构巢曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换。
将表达质粒pKKSC0334-1转化入根据欧洲专利EP 0238023第14-15页的方法的米曲霉MT3568的原生质体中。米曲霉MT3568是米曲霉JaL355的amdS(乙酰胺酶)破坏的衍生物(WO 2002/40694),其中在失活米曲霉amdS基因的过程中恢复pyrG营养缺陷型。
根据制造商的说明(Genomed),使包含pKKSC0334-1的大肠杆菌3701生长过夜,并且根据制造商的说明使用质粒Midi试剂盒(Genomed JETquick试剂盒,目录号400250,Genomed GmbH,德国)分离pKKSC0334-1的质粒DNA。将纯化的质粒DNA转化入米曲霉MT3568中。根据克Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉MT3568原生质体。选择板由以下组成:COVE蔗糖与+10mM乙酰胺+15mM CsCl+X-100(50μl/500ml)。在37℃温育平板。简言之,将代表3μg的DNA的8μl的质粒DNA添加到100μl的MT3568原生质体中。添加250ul的60%PEG溶液,并将管轻轻地混合,并且在37℃温育30分钟。将混合物添加到10ml的预熔化的Cove顶层琼脂糖中(该顶层琼脂糖融化然后在被添加到原生质体混合物之前在温水浴中温度平衡至40℃)。然后将合并的混合物涂布于具有10mM乙酰胺的两个Cove-蔗糖选择Petri板上。在37℃将板温育4天。通过在作为碳源的选择乙酰胺上生长来鉴定单个曲霉属转化菌落。将四种米曲霉转化体中的每个接种入96深孔板中补充有2%葡萄糖的750μl的YP培养基和补充有2%麦芽糊精的750μl的YP培养基和补充有DAP4C的750μl的YP培养基中,并在37℃静止温育4天。同时,将四种转化体再划线于COVE-2蔗糖琼脂培养基上。
然后根据制造商,使用10%Bis-Tris SDS凝胶(Invitrogen,卡尔斯巴德(Carlsbad),加利福尼亚州,美国)通过SDS-PAGE,针对P33W9X海藻糖酶多肽的产生,对来自米曲霉转化体的培养液进行分析。对于这些米曲霉转化体中每个,在大约75kDa观察到条带。将产生P33W9X多肽的一个米曲霉转化体指定为米曲霉EXP09256。
用于较大规模的生产,将米曲霉EXP09256孢子分散到PDA板上并且在37℃温育五天。用5ml的0.01%20将汇合的孢子板洗涤两次,以使收集的孢子的数目最大化。然后使用孢子悬浮液接种包含100ml的Dap-4C培养基的九个500ml烧瓶。将培养物在30℃进行温育,同时以150rpm进行恒定振荡。在接种后第四天,通过经由瓶盖MF75SuporMachV 0.2μm PES过滤器(Thermo Scientific,罗斯基勒(Roskilde),丹麦)的过滤来收集培养液。来自此转化体的新鲜的培养液产生大约75kDa的GH37蛋白的条带。通过肽测序证实该带与变绿毛壳菌海藻糖酶多肽的同一性。
来自变绿毛壳菌CBS547.75的EXP09256海藻糖酶多肽编码序列的表征
变绿毛壳菌CBS547.75的基因组DNA序列和推导的氨基酸序列。
变绿毛壳菌海藻糖酶多肽(P33W9X)基因组编码序列分别示于SEQ ID NO:3和SEQID NO:4中。编码的预测的蛋白为690个氨基酸。使用SignalP程序(Nielsen等,1997,同上)预测出20个残基的信号肽。预测的成熟蛋白包含670个氨基酸,具有75kDa的预测的分子量和5.5的预测的等电点。实例2
来自瘤孢毁丝霉(Ms Tr37)的海藻糖酶(P33WJF)的表达
此菌株购自UAMH并于1988年9月12日作为UAMH5004收到。UAMH是University ofAlberta Microfungus Collection and Herbarium(艾伯塔大学微真菌保藏和标本中心)。
瘤孢毁丝霉菌株UAHM5004从艾伯塔大学微真菌保藏和标本中心(UAMH,Edmonton,Alberta,Canada T6G 2R3)获得。仍然采用较早的属名和种名瘤孢棒囊孢壳(Cornyascussepedonium)。
海藻糖酶多肽(P33WJF)编码序列从瘤孢毁丝霉菌株UAHM5004DNA通过PCR克隆。
培养真菌菌株,分离DNA,基因组测序,并如实例1中鉴定海藻糖酶候选物。
使用以下描述的引物(SEQ ID NO:26和SEQ ID NO:27)通过PCR,从瘤孢毁丝霉菌株UAHM5004基因组DNA,克隆整个编码区的多肽编码序列。
KKSC0335-F
5’-ACACAACTGGGGATCCACCATGGCGCTACGACACATCGC-3’(SEQ ID NO:26)
KKSC0335-R
5’-CTAGATCTCGAGAAGCTTTTACGAGACGGAGACACTAAACA
(SEQ ID NO:27)
粗体字母表示瘤孢毁丝霉酶编码序列。限制位点是加下划线的。限制位点左方的序列与pDau109(WO 2005/042735)的插入位点是同源的。
扩增反应(50μl)根据制造商的说明(Phusion HiFi DNA聚合酶目录#M0530S,NewEngland Biolabs Inc)根据实例1中的方案进行。
使用40mM Tris碱、20mM乙酸钠、1mM EDTA二钠(TAE)缓冲液,通过1%琼脂糖凝胶电泳分析4μl的PCR反应。观察到约2354bp的主条带。根据制造商的说明,直接用ILLUSTRATMGFXTMPCR DNA和凝胶条带纯化试剂盒(GE Healthcare,皮斯卡塔韦(Piscataway),新泽西州,美国)纯化剩余的PCR反应并克隆入pDau109,如实例1中所述。
选择具有正确的瘤孢毁丝霉海藻糖酶编码序列(SEQ ID NO:x)的一个质粒。该质粒命名为pKKSC0335-1。将表达质粒pKKSC0335-1转化入米曲霉MT3568的原生质体,选择转化体,并同样根据实例1增殖。
根据制造商使用10%Bis-Tris SDS凝胶(Invitrogen,Carlsbad,CA,USA)通过SDS-PAGE产生海藻糖酶多肽(P33WJF)。对于这些米曲霉转化体中每个,观察到在大约76kDa的条带。将产生P33W9X多肽的一个米曲霉转化体指定为米曲霉EXP09258。
还根据实例1进行米曲霉EXP09258的较大规模生产。
来自瘤孢毁丝霉菌株UAHM5004的EXP09258海藻糖酶多肽编码序列、瘤孢毁丝霉菌株UAHM5004的基因组DNA序列和推导的氨基酸序列的表征
海藻糖酶多肽(P33WJF)基因组编码序列分别示于SEQ ID NO:1和SEQ ID NO:2中。编码的预测的蛋白为697个氨基酸。使用SignalP程序(Nielsen等,1997,同上)预测出20个残基的信号肽。预测的成熟蛋白包含677个氨基酸,具有76kDa的预测的分子量和5.1的预测的等电点。
实例3
使用发酵滴的上清液的添加海藻糖酶的葡萄糖产生
在发酵结束时将来自工业玉米乙醇设备的发酵滴(ferm drop)样品首次离心,并收集上清液用于测试。通过离子层析测定法将上清液中的海藻糖水平分析为大约2g/L。将上清液的pH测量为4.6,以3ppm的水平补充作为抗细菌剂。接下来,将2ml的上清液分装入15ml聚丙烯管。向每管中按剂量添加表1中所列的海藻糖酶。酶剂量分别为0、0.05、0.5和5ug/ml。每个处理一式三份进行。之后,将所有管在32℃水浴中温育5小时。在5小时的温育取样用于HPLC分析。HPLC制备由以下组成:通过添加20微升的40%H2SO4来终止反应,并且通过0.45微米过滤器过滤。使用与RI检测器偶联的AgilentTM1100HPLC系统以确定葡萄糖浓度。该分离柱是来自BioRadTM的aminex HPX-87H离子排阻柱(300mm×7.8mm)。
结果
来自HPLC分析的葡萄糖结果总结在图1中。与无任何海藻糖酶添加的对照相比,所有用海藻糖酶的处理显示葡萄糖增加。葡萄糖增加的量取决于海藻糖酶的剂量和其来源。结果显示瘤孢毁丝霉海藻糖酶(Ms海藻糖酶)性能最佳。在0.5ug/ml的剂量,所有海藻糖以5小时温育被转化成葡萄糖。变绿毛壳菌海藻糖酶比瘤孢毁丝霉海藻糖酶效率略低,但仍然比里氏木霉海藻糖酶(Tr tr)好得多。
实例4
Ms海藻糖酶在常规SSF方法中用于乙醇生产的应用
通过5g小测定法评价所有处理。每个处理一式五份进行。将来自工业玉米乙醇设备的由α-淀粉酶共混物B(AABB)(醪A和B)和α-淀粉酶A(AAA)(醪C)液化的三种玉米醪用于测试。将3ppm青霉素和1000ppm尿素补充到每种醪液中。用40%H2SO4或50%NaOH将浆料的pH调节至5.0。将大约5g的此浆料添加至15mL聚丙烯管中。通过钻1/32英寸孔制备管,然后称重空管,之后添加玉米浆料。在添加醪液后再次称重管以确定每管中醪液的精确重量。基于每管中玉米浆料的精确重量,向每管加入实际的酶剂量。每种处理的酶剂量列于表2中。将来自瘤孢毁丝霉的海藻糖酶(Ms37海藻糖酶)(SEQ ID NO:30)用于此研究。之后,向试管添加50μl酵母繁殖物至约5g玉米醪,然后在用于SSF的32℃水浴(water batch)中温育。在53小时的发酵取样用于HPLC分析。HPLC制备由以下组成:通过添加50微升的40%H2SO4来终止反应、离心,并且通过0.45微米过滤器过滤。使用与RI检测器偶联的AgilentTM1100HPLC系统确定糖、酸和乙醇浓度。该分离柱是来自BioRadTM的aminex HPX-87H离子排阻柱(300mm×7.8mm)。
表2.SSF中用于每个处理的AMG和海藻糖酶剂量
结果
来自HPLC分析的结果总结在表3中。与对照相比,添加海藻糖酶的处理实现高得多的乙醇效价,即0.5%至1.2%范围的产率增加。
表3.SSF中与对照相比添加海藻糖酶所致的乙醇产率增加
实例5
GH37海藻糖酶的纯化
向来自携带GH37海藻糖酶基因的米曲霉的发酵的经过滤的培养液添加固体硫酸铵至2M的终浓度,并将pH调节至7。将含有海藻糖酶的溶液施加至疏水相互作用柱(丁基Toyopearl,约50ml于XK26柱中,用缓冲液A平衡),使用50mM Hepes+2M硫酸铵pH 7.0作为缓冲液A,并使用50mM Hepes pH 7.0作为缓冲液B。用平衡缓冲液将未结合的材料洗出柱,并以线性梯度(100%至0%A)在5个柱体积中洗脱海藻糖酶,并收集10ml级分。基于层析图,汇集含有海藻糖酶的级分并针对大体积的20mM Hepes pH 7.0透析。
纯化的GH37海藻糖酶列于下表:
纯化的海藻糖酶的分子量
如从SDS-PAGE估计的,对于所有三种海藻糖酶分子量为大约100kDa并且纯度在所有情况中为>95%。
实例6
来自里氏木霉的GH65海藻糖酶(SEQ ID NO:31)的纯化
将来自携带里氏木霉的GH65海藻糖酶基因(P24TTB)的米曲霉的发酵的经过滤的培养液加载于用50mm乙酸钠pH 5.0平衡的凝胶过滤柱(约780ml Sephadex G-25介质)并收集级分。基于层析图,汇集直接运行穿过柱的含有蛋白的级分(A280>A260)。使用具有30kDa截留膜的Viva cell将含有海藻糖酶的汇集物浓缩。
纯化的海藻糖酶的分子量
如从SDS-PAGE估计的,分子量为大约120kDa并且纯度为>95%。
实例7
海藻糖酶活性的确定(GOD)
GOD-perid
将50微升含海藻糖酶的酶溶液(用20mM MES缓冲液pH 5.0适当地稀释)分配在微量滴定板孔中(例如NUNC 269620)并添加50微升底物(20mM MES缓冲液pH 5.0中的10mg/ml海藻糖)。将板密封并在32℃以750rpm振荡温育15分钟。在温育后,将20微升的反应溶液转移至空的微量滴定板,并添加180微升GOD-perid[0.1M K-磷酸盐(K-phosphate)缓冲液pH7.0中的600ppm葡糖氧化酶(Sigma G1625)、20ppm过氧化物酶(Sigma P8125)、0.1%ATBS(Roche 102946)]。将板在20℃-30℃放置30分钟,此后在微量滴定板分光光度计中测量在420nm的吸光度。
实例8
pH概貌
在32℃在2.0至7.5的pH范围(以0.5pH-单位步长)确定pH概貌,如上文“海藻糖酶活性的确定,GOD-perid”一节中所述,只是使用缓冲液混合物(110mM乙酸、110mM柠檬酸和110mM MES)替代20mM MES缓冲液pH 5.0缓冲液。在下表5中概述了结果。对于在2.0-7.5的范围中的每个pH给出的值是以%表示的标准化至最适值的相对活性。
实例9
使用DSC数据的热稳定性
使用配备有自动采样器的VP-毛细管DSC仪器(MicroCal Inc.,皮斯卡塔韦,新泽西州,美国)通过差示扫描量热法(DSC)确定海藻糖酶的热稳定性。使用预装的NAP-5柱,将如实例1中所述纯化的海藻糖酶的等分试样进行缓冲液交换(参见下表中的缓冲液)。将样品用相应的缓冲液稀释至约0.5mg/ml并使用缓冲液作为参考溶液。将样品和参考溶液(大约0.5ml)在20℃用热方法预平衡10分钟并以200K/小时的扫描速率在从20℃至100℃进行DSC扫描。使用MicroCal Origin软件(版本7.0383)进行数据处理。将以恒定程序化加热速率加热缓冲液中的海藻糖酶溶液后获得的温谱图(Cp对T)中变性峰值的顶点(主吸热峰)取作热变性温度Td(℃)。以大约+/-0.5℃的精确度确定变性温度。
将DSC测量值的结果总结于下表中。
实例10
通过Ms37海藻糖酶(SEQ ID NO:30)和Tr65海藻糖酶(SEQ ID NO:31)的葡萄糖产
收集来自两个工业玉米乙醇设备的发酵结束时的发酵滴样品,并分别测量pH为4.68(A)和4.49(B)。将发酵滴样品以3500rpm离心15分钟,然后收集上清液,并将其用于海藻糖酶应用测试。首先,以3ppm的水平补充青霉素作为抗菌剂。接下来,将2ml的上清液分装入15ml聚丙烯管。向每管中按剂量添加下表中所列的海藻糖酶。测试的酶剂量为0、0.05、0.15、0.5和5ug每ml的上清液。每个处理一式三份进行。之后,将所有管在32℃水浴中温育5小时。在5小时的温育取样用于HPLC分析。HPLC制备由以下组成:通过添加20微升的40%H2SO4来终止反应,并且通过0.45微米过滤器过滤。使用与RI检测器偶联的AgilentTM1100HPLC系统确定葡萄糖浓度。该分离柱是来自BioRadTM的aminex HPX-87H离子排阻柱(300mm×7.8mm)。
测试的海藻糖酶
结果
来自HPLC分析的葡萄糖结果通过JMP总结在图2中。与无任何海藻糖酶添加的对照相比,除了发酵滴(Ferm Drop)B中0.05ug/ml的最低剂量之外,用海藻糖酶处理显示葡萄糖增加。葡萄糖增加的量取决于海藻糖酶的剂量和其来源。结果显示瘤孢毁丝霉GH37海藻糖酶(SEQ ID NO:30)性能好于里氏木霉GH65海藻糖酶(SEQ ID NO:31)。在5ug/ml海藻糖酶添加的高剂量,发酵滴样品中的海藻糖通过海藻糖酶完全转化为葡萄糖。
通过下述编号段落描述本发明:
1.一种具有海藻糖酶活性的多肽,其选自下组,该组由以下各项组成:
(a)多肽,其与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少90%序列同一性,或与SEQ ID NO:4的成熟多肽具有至少80%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在高严格条件下与以下杂交:(i)SEQID NO:29、SEQ ID NO:1或SEQ ID NO:3的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体;
(c)多肽,其由以下多核苷酸编码,所述多核苷酸与SEQ ID NO:29或SEQ ID NO:1或SEQ ID NO:3的成熟多肽编码序列或其cDNA序列具有至少60%序列同一性;
(d)SEQ ID NO:30或SEQ ID NO:2或SEQ ID NO:4的成熟多肽的变体,其在一个或多个(例如,几个)位置处包含取代、缺失和/或插入;和
(e)(a)、(b)、(c)或(d)的多肽的具有海藻糖酶活性的片段。
2.如段落1所述的多肽,其与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性。
3.如段落1或2所述的多肽,其由多核苷酸编码,所述多核苷酸在非常高严格条件下与以下杂交:(i)SEQ ID NO:29或SEQ ID NO:1的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体。
4.如段落1-3中任一项所述的多肽,其由多核苷酸编码,所述多核苷酸与SEQ IDNO:29或SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
5.如段落1-4中任一项所述的多肽,其包含以下或由以下组成:SEQ ID NO:30或SEQ ID NO:2或SEQ ID NO:30的显示为氨基酸21-694的成熟多肽或SEQ ID NO:2的显示为氨基酸21-697的成熟多肽。
6.如段落1-6中任一项所述的多肽,其为SEQ ID NO:30或SEQ ID NO:2的成熟多肽的在一个或多个位置处包含取代、缺失和/或插入的变体。
7.如段落1-6中任一项所述的多肽,其为SEQ ID NO:30或SEQ ID NO:2的片段,其中所述片段具有海藻糖酶活性。
8.如段落1-7中任一项所述的多肽,其与SEQ ID NO:4的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
9.如段落1-8中任一项所述的多肽,其由多核苷酸编码,所述多核苷酸在非常高严格条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体。
10.如段落1-9中任一项所述的多肽,其由多核苷酸编码,所述多核苷酸与SEQ IDNO:3的成熟多肽编码序列或其cDNA序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
11.如段落1-10中任一项所述的多肽,其包含以下或由以下组成:SEQ ID NO:4或SEQ ID NO:4的显示为氨基酸21-690的SEQ ID NO:4的成熟多肽。
12.如段落1-11中任一项所述的多肽,其为SEQ ID NO:4的成熟多肽的在一个或多个位置处包括取代、缺失和/或插入的变体。
13.如段落1-12中任一项所述的多肽,其为SEQ ID NO:4的片段,其中该片段具有海藻糖酶活性。
14.一种组合物,其包含如段落1-13中任一项所述的多肽。
15.一种全培养液配制物或细胞培养组合物,其包含如段落1-14中任一项所述的多肽。
16.一种多核苷酸,其编码如段落1-14中任一项所述的多肽。
17.一种核酸构建体或表达载体,其包含如段落16所述的多核苷酸,该多核苷酸可操作地连接于指导多肽在表达宿主中产生的一个或多个控制序列。
18.一种重组宿主细胞,其包含如段落16所述的多核苷酸,该多核苷酸可操作地连接于指导多肽的产生的一个或多个控制序列。
19.一种产生如段落1-14中任一项所述的多肽的方法,其包括:在有益于产生该多肽的条件下培养细胞,该细胞以其野生型形式产生该多肽。
20.如段落19所述的方法,其进一步包括回收该多肽。
21.一种产生具有海藻糖酶活性的多肽的方法,其包括:在有益于产生该多肽的条件下培养如段落18所述的宿主细胞。
22.如段落21所述的方法,其进一步包括回收该多肽。
23.一种转基因植物、植物部分或植物细胞,其用编码如段落1-14中任一项所述的多肽的多核苷酸转化。
24.一种产生具有海藻糖酶活性的多肽的方法,其包括在有益于产生该多肽的条件下培养如段落21所述的转基因植物或植物细胞。
25.如段落24所述的方法,其进一步包括回收该多肽。
26.一种生产发酵产物的方法,其包括
(a)用α-淀粉酶使含淀粉材料液化;
任选在步骤(b)之前使所液化的材料预糖化;
(b)使所液化的材料糖化;
(c)使用发酵生物进行发酵;
其中
i)葡糖淀粉酶;
ii)段落1-13中任一项所述的海藻糖酶;
iii)任选的纤维素分解酶组合物和/或蛋白酶;
在以下步骤的过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
27.如段落26所述的方法,其中该α-淀粉酶是细菌α-淀粉酶,特别是芽孢杆菌属,如嗜热脂肪芽孢杆菌菌株的,特别是嗜热脂肪芽孢杆菌α-淀粉酶的变体,如WO 99/019467中的SEQ ID NO:3或本申请中的SEQ ID NO:18中所示的α-淀粉酶。
28.如段落27所述的方法,其中该嗜热脂肪芽孢杆菌α-淀粉酶或其变体是截短的,优选为485-495个氨基酸长,如约491个氨基酸长。
29.如段落26或28中任一项所述的方法,其中该嗜热脂肪芽孢杆菌α-淀粉酶具有在位置I181+G182处的双缺失,和任选的N193F取代、或R179+G180缺失(使用SEQ ID NO:18用于编号)。
30.如段落26-29中任一项所述的方法,其中该嗜热脂肪芽孢杆菌α-淀粉酶在位置S242具有取代,优选S242A、E或Q取代(使用SEQ ID NO:18用于编号)。
31.如段落26-30中任一项所述的方法,其中该嗜热脂肪芽孢杆菌α-淀粉酶在位置E188具有取代,优选E188P取代(使用SEQ ID NO:18用于编号)。
32.如段落26-31中任一项所述的方法,其中液化步骤(a)中的α-淀粉酶选自下组的嗜热脂肪芽孢杆菌α-淀粉酶变体:
-I181*+G182*+N193F+E129V+K177L+R179E;
-I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S
-I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+Q254S+M284V;
-I181*+G182*+N193F+V59A+E129V+K177L+R179E+Q254S+M284V以及
-I181*+G182*+N193F+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S(使用本申请中的SEQ ID NO:18用于编号)。
33.如段落26-32中任一项所述的方法,其中所述葡糖淀粉酶是真菌来源的,优选来自曲霉属的菌株,优选黑曲霉、泡盛曲霉、或米曲霉;或木霉属的菌株,优选里氏木霉;或踝节菌属的菌株,优选埃默森踝节菌,或粘褶菌属(Gloeophyllum)的菌株,如篱边粘褶菌(Gloeophyllum sepiarium)或密粘褶菌(Gloeophyllum trabeum)。
34.如段落26-33中任一项所述的方法,其中所述葡糖淀粉酶源自埃默森踝节菌,如本申请中的SEQ ID NO:13中所示的那种。
35.如段落26-34中任一项所述的方法,其中所述葡糖淀粉酶选自下组,该组由以下各项组成:
(i)包括本申请中的SEQ ID NO:13的成熟多肽的葡糖淀粉酶;
(ii)包括以下氨基酸序列的葡糖淀粉酶,所述氨基酸序列与本申请中的SEQ IDNO:13的成熟多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%同一性。
36.如段落26-35中任一项所述的方法,其中所述葡糖淀粉酶源自篱边粘褶菌,如本申请中的SEQ ID NO:19中所示的一种。
37.如段落26-36中任一项所述的方法,其中所述葡糖淀粉酶选自下组,该组由以下各项组成:
(i)包括本申请中的SEQ ID NO:19的成熟多肽的葡糖淀粉酶;
(ii)包括氨基酸序列的葡糖淀粉酶,所述氨基酸序列与本申请中的SEQ ID NO:19的成熟多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%同一性。
38.如段落26-37中任一项所述的方法,其中所述葡糖淀粉酶源自密粘褶菌,如本申请中的SEQ ID NO:20中所示的一种。
39.如段落26-38中任一项所述的方法,其中在糖化中存在和/或添加的葡糖淀粉酶选自下组,该组由以下各项组成:
(i)包括本申请中的SEQ ID NO:20的成熟多肽的葡糖淀粉酶;
(ii)包括氨基酸序列的葡糖淀粉酶,所述氨基酸序列与本申请中的SEQ ID NO:20的成熟多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%同一性。
40.如段落26-39中任一项所述的方法,其中在以下步骤的过程中进一步存在和/或添加α-淀粉酶:糖化步骤(b);发酵步骤(c);同时的糖化和发酵;或步骤(b)之前任选的预糖化步骤。
41.如段落40所述的方法,其中α-淀粉酶是真菌或细菌来源的。
42.如段落40或41所述的方法,其中所述α-淀粉酶源自根毛霉属的菌株,优选微小根毛霉的菌株,如WO 2013/006756中的SEQ ID NO:3中所示的那种,如具有黑曲霉接头和淀粉结合域的微小根毛霉α-淀粉酶杂合体,如本申请中的SEQ ID NO:15中所示的那种。
43.如段落40-42中任一项所述的方法,其中在糖化和/或发酵中存在和/或添加的α-淀粉酶选自下组,该组由以下各项组成:
(i)包括本申请中的SEQ ID NO:15的成熟多肽的α-淀粉酶;
(ii)包括氨基酸序列的α-淀粉酶,所述氨基酸序列与本申请中的SEQ ID NO:15的成熟多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%同一性。
44.如段落40-43中任一项所述的方法,其中所述α-淀粉酶是SEQ ID NO:15中所示的α-淀粉酶具有以下取代或取代组合中的至少一个的变体:D165M;Y141W;Y141R;K136F;K192R;P224A;P224R;S123H+Y141W;G20S+Y141W;A76G+Y141W;G128D+Y141W;G128D+D143N;P219C+Y141W;N142D+D143N;Y141W+K192R;Y141W+D143N;Y141W+N383R;Y141W+P219C+A265C;Y141W+N142D+D143N;Y141W+K192R+V410A;G128D+Y141W+D143N;Y141W+D143N+P219C;Y141W+D143N+K192R;G128D+D143N+K192R;Y141W+D143N+K192R+P219C;G128D+Y141W+D143N+K192R;或G128D+Y141W+D143N+K192R+P219C(使用SEQ ID NO:15用于编号)。
45.如段落36-44中任一项所述的方法,其中该α-淀粉酶源自微小根毛霉,特别是具有黑曲霉葡糖淀粉酶接头和淀粉结合域(SBD)的微小根毛霉,优选本申请中作为SEQ IDNO:15披露的,优选具有以下取代中的一个或多个:G128D、D143N,优选G128D+D143N(使用SEQ ID NO:15用于编号)。
46.如段落44-45中任一项所述的方法,其中所述α-淀粉酶变体与本申请中的SEQID NO:15的多肽的成熟部分具有至少60%同一性、如至少70%,优选至少75%同一性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如甚至至少96%、至少97%、至少98%、至少99%,但小于100%同一性。
47.如段落26-46中任一项的方法,其中所述纤维素分解酶制备物源自里氏木霉、特异腐质霉(Humicola insolens)或卢克诺文思金孢子菌(Chrysosporium lucknowense)。
49.如段落26-48中任一项所述的方法,其中该纤维素分解酶组合物包含β-葡糖苷酶、纤维二糖水解酶、内切葡聚糖酶以及任选的GH61多肽。
50.如段落26-49中任一项所述的方法,其中该纤维素分解酶组合物包含β-葡糖苷酶,优选源自曲霉属的菌株如米曲霉的β-葡糖苷酶,如WO2002/095014中披露的β-葡糖苷酶或WO 2008/057637中披露的具有β-葡糖苷酶活性的融合蛋白,或如烟曲霉的β-葡糖苷酶,如在WO 2005/047499中的SEQ ID NO:2或本申请中的SEQ ID NO:10中披露的β-葡糖苷酶,或WO2012/044915中披露的烟曲霉β-葡糖苷酶变体;特别是具有如下取代中的一个或多个,如所有的烟曲霉β-葡糖苷酶变体:F100D、S283G、N456E、F512Y;或源自青霉属(Penicillium)的菌株,如WO 2007/019442中披露的巴西青霉(Penicillium brasilianum)的菌株,或木霉属的菌株,如里氏木霉的菌株。
51.如段落26-50中任一项所述的方法,其中该纤维素分解酶组合物包含纤维二糖水解酶I(CBH I),如源自曲霉属的菌株如烟曲霉的菌株的纤维二糖水解酶I,如WO 2011/057140中的SEQ ID NO:6或本申请中的SEQ ID NO:6中披露的Cel7a CBH I,或源自木霉属的菌株,例如里氏木霉的菌株的纤维二糖水解酶I。
52.如段落26-50中任一项所述的方法,其中该纤维素分解酶组合物包含纤维二糖水解酶II(CBH II),如源自曲霉属的菌株例如烟曲霉的菌株的CBH II;如作为本申请中的SEQ ID NO:8披露的CBH II,或源自木霉属的菌株,如里氏木霉,或源自梭孢壳属的菌株,如土生梭孢霉的菌株,如是来自土生梭孢霉的纤维二糖水解酶II CEL6A。
53.如段落26-52中任一项所述的方法,其中该纤维素分解酶组合物进一步包含具有纤维素分解增强活性的GH61多肽,如源自嗜热子囊菌属如桔橙嗜热子囊菌的菌株的GH61多肽,如在WO 2005/074656中作为SEQ ID NO:2或本申请中的SEQ ID NO:21描述的GH61多肽;或源自梭孢壳属,如土生梭孢霉的菌株的多肽,如WO 2005/074647中作为SEQ ID NO:7和SEQ ID NO:8描述的GH61多肽;或源自曲霉属的菌株如烟曲霉的菌株的GH61多肽,如WO2010/138754中作为SEQ ID NO:1和SEQ ID NO:2描述的GH61多肽;或源自青霉属的菌株如埃默森青霉菌的菌株的GH61多肽,如WO 2011/041397中作为SEQ ID NO:2或本申请中的SEQID NO:12描述的GH61多肽。
54.如段落26-54中任一项所述的方法,其中该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,所述里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的桔橙嗜热子囊菌GH61A多肽(WO2005/074656中的SEQ ID NO:2或本申请中的SEQ IDNO:21)、以及烟曲霉β-葡糖苷酶(WO 2005/047499的SEQ ID NO:2)或本申请中的SEQ IDNO:6。
55.如段落26-54中任一项所述的方法,其中该纤维素分解酶组合物是一种里氏木霉纤维素分解酶组合物,所述里氏木霉纤维素分解酶组合物进一步包含WO 2011/041397中作为SEQ ID NO:2或本申请中的SEQ ID NO:12披露的、具有纤维素分解增强活性的埃默森青霉GH61A多肽;以及烟曲霉β-葡糖苷酶(WO 2005/047499的SEQ ID NO:2或本申请中的SEQID NO:10)或其具有以下取代中的一个或多个如所有的变体:F100D、S283G、N456E、F512Y。
56.如段落26-55中任一项所述的方法,其中该纤维素分解酶组合物以0.0001-3mgEP/g DS,优选0.0005-2mg EP/g DS,优选0.001-1mg/g DS,更优选0.005-0.5mg EP/g DS,甚至更优选0.01-0.1mg EP/g DS剂量添加。
57.如段落26-56中任一项所述的方法,其中所述预糖化在40℃-75℃,如50℃-70℃,优选60℃的温度;在4-6,优选5的pH;进行30-360分钟,如60-420分钟,如约150-180分钟的时间。
58.如段落26-57中任一项所述的方法,其包括以下步骤:
(a)用α-淀粉酶使含淀粉材料液化;
任选在步骤(b)之前使所液化的材料预糖化;
(b)使所液化的材料糖化;
(c)使用发酵生物进行发酵;
其中
i)葡糖淀粉酶;
ii)段落1-13中任一项的海藻糖酶;
在以下步骤的过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
59.如段落26-58中任一项所述的方法,其包括以下步骤:
(a)用α-淀粉酶使含淀粉材料液化;
任选在步骤(b)之前使所液化的材料预糖化;
(b)使所液化的材料糖化;
(c)使用发酵生物进行发酵;
其中
i)来自埃默森踝节菌或篱边粘褶菌的葡糖淀粉酶;
ii)如段落1-13中任一项中所示的海藻糖酶;
在以下步骤的过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
60.如段落26-58中任一项所述的方法,其包括以下步骤:
(a)用α-淀粉酶使含淀粉材料液化;
任选在步骤(b)之前使所液化的材料预糖化;
(b)使所液化的材料糖化;
(c)使用发酵生物进行发酵;
其中
i)来自埃默森踝节菌或篱边粘褶菌的葡糖淀粉酶;
ii)如段落1-13中任一项中所示的海藻糖酶;
iii)源自里氏木霉的纤维素分解酶组合物;
在以下步骤的过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
61.如段落26-60中任一项所述的方法,其中糖化步骤(a)和发酵步骤(b)分开或同时进行。
62.如段落26-61中任一项所述的方法,其中在发酵后回收该发酵产物。
63.如段落26-62中任一项所述的方法,其中该含淀粉材料是选自以下的植物材料:玉米(玉蜀黍)、穗轴、小麦、大麦、黑麦、买罗高粱、西米、木薯、树薯、高粱、水稻、豌豆、豆类、甘薯、或它们的混合物,优选玉米。
64.如段落26-63中任一项所述的方法,其中液化中的温度为起始糊化温度以上,特别是70℃-100℃的范围,如75℃-95℃,如75℃-90℃,优选80℃-90℃,如在82℃-88℃,如约85℃。
65.如段落26-64中任一项所述的方法,其中该液化步骤(a)在3-7、优选4至6、或更优选4.5至5.5的范围的pH进行。
66.如段落26-65中任一项所述的方法,其中液化中的干固体含量(DS)是在20-55wt.-%、优选25-45wt.-%、更优选30-40wt.-%或30-45wt-%的范围。
66.如段落26-65中任一项所述的方法,其在液化步骤(a)之前进一步包括以下步骤:
x)减小含淀粉材料的粒度,优选通过干磨进行;
y)形成包含该含淀粉材料和水的浆料。
67.如段落26-66中任一项所述的方法,其中在步骤(a)中的液化之前进行喷射蒸煮步骤。
68.如段落26-67中任一项所述的方法,其中将该含淀粉材料的粒度减小,如通过干磨或湿磨或者使用粒度乳化技术。
69.如段落26-68中任一项所述的方法,其中发酵进行30至150小时,优选48至96小时。
70.如段落26-69中任一项所述的方法,其中在步骤(b)中的发酵或步骤(a)和(b)中的同时糖化和发酵期间的温度为25℃-40℃、优选28℃-36℃、如28℃-35℃、如28℃-34℃、如约32℃。
71.如段落26-70中任一项所述的方法,其中在糖化和/或发酵期间进一步存在蛋白酶。
72.如段落26-71中任一项所述的方法,其中葡糖淀粉酶以0.001至10AGU/g DS、优选从0.01至5AGU/g DS、尤其是0.1至0.5AGU/g DS的量存在和/或添加。
73.如段落26-72中任一项所述的方法,其中发酵产物是醇,优选乙醇,尤其是燃料乙醇、饮用乙醇和/或工业乙醇。
74.如段落26-73中任一项所述的方法,其中在以下步骤的过程中进一步存在蛋白酶:
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
75.如段落26-74中任一项所述的方法,其中所述蛋白酶源自嗜热子囊菌属,特别是桔橙嗜热子囊菌,尤其是本申请中的SEQ ID NO:17中所示的桔橙嗜热子囊菌CGMCCNo.0670(分类为EC 3.4.24.39)。
76.根据段落75所述的方法,其中该蛋白酶是本申请中的SEQ ID NO:17中所示的蛋白酶或是与本申请中的SEQ ID NO:17具有至少60%,如至少70%,如至少80%,如至少90%,如至少95%,如至少96%,如至少97%,如至少98%,如至少99%同一性的蛋白酶。
77.如段落26-74中任一项所述的方法,其中所述蛋白酶源自亚灰树花菌属,特别是大型亚灰树花菌,特别是本申请中作为SEQ ID NO:32所示的。
78.根据段落77所述的方法,其中该蛋白酶是本申请中的SEQ ID NO:32中所示的蛋白酶或是与本申请中的SEQ ID NO:32具有至少60%同一性,如至少70%,如至少80%,如至少90%,如至少95%,如至少96%,如至少97%,如至少98%,如至少99%同一性的蛋白酶。
79.如段落26-78中任一项所述的方法,其中该发酵生物源自酵母,如酿酒酵母的菌株。
80.一种从含淀粉材料生产发酵产物的方法,其包括:
(i)在起始糊化温度以下的温度使含淀粉材料糖化;和
(ii)使用发酵生物进行发酵;
其中在以下酶的存在下进行糖化和/或发酵:葡糖淀粉酶、α-淀粉酶、如段落1-13中任一项中所述的海藻糖酶;和任选的蛋白酶和/或纤维素分解酶组合物。
81.一种从预处理的纤维素材料产生发酵产物的方法,其包括:
(a)用纤维素分解酶组合物使所述预处理的纤维素材料水解;
(b)使用发酵生物进行发酵;和
(c)任选地回收所述发酵产物,
其中如段落1-13中任一项中所示的海藻糖酶被添加至和/或存在于水解步骤(a)和/或发酵步骤(b)中。
82.如段落26-81中任一项所述的方法,其中所述海藻糖酶以0.01-20ug EP海藻糖酶/g DS,如0.05-15ug EP海藻糖酶/g DS,如0.5-10ug EP海藻糖酶/g DS的量添加。
83.如段落81-82中任一项的方法,其中所述纤维素分解酶制备物源自里氏木霉、特异腐质霉(Humicola insolens)或卢克诺文思金孢子菌(Chrysosporium lucknowense)。
84.如段落81-83中任一项所述的方法,其中该纤维素分解酶组合物包含β-葡糖苷酶、纤维二糖水解酶、内切葡聚糖酶以及任选的GH61多肽。
85.如段落81-84中任一项所述的方法,其中该纤维素分解酶组合物包含β-葡糖苷酶,优选源自曲霉属的菌株如米曲霉的β-葡糖苷酶,如WO2002/095014中披露的β-葡糖苷酶或WO 2008/057637中披露的具有β-葡糖苷酶活性的融合蛋白,或如烟曲霉的β-葡糖苷酶,如在WO 2005/047499中的SEQ ID NO:2或本申请中的SEQ ID NO:10中披露的β-葡糖苷酶,或WO2012/044915中披露的烟曲霉β-葡糖苷酶变体;特别是具有如下取代中的一个或多个,如所有的烟曲霉β-葡糖苷酶变体:F100D、S283G、N456E、F512Y;或源自青霉属(Penicillium)的菌株,如WO 2007/019442中披露的巴西青霉(Penicillium brasilianum)的菌株,或木霉属的菌株,如里氏木霉的菌株。
86.如段落81-85中任一项所述的方法,其中该纤维素分解酶组合物包含纤维二糖水解酶I(CBH I),如源自曲霉属的菌株如烟曲霉的菌株的纤维二糖水解酶I,如WO 2011/057140中的SEQ ID NO:6或本申请中的SEQ ID NO:6中披露的Cel7a CBH I,或源自木霉属的菌株,例如里氏木霉的菌株的纤维二糖水解酶I。
87.如段落81-86中任一项所述的方法,其中该纤维素分解酶组合物包含纤维二糖水解酶II(CBH II),如源自曲霉属的菌株例如烟曲霉的菌株的CBH II;如作为本申请中的SEQ ID NO:8披露的CBH II,或源自木霉属的菌株,如里氏木霉,或源自梭孢壳属的菌株,如土生梭孢霉的菌株,如是来自土生梭孢霉的纤维二糖水解酶II CEL6A。
88.如段落81-87中任一项所述的方法,其中该纤维素分解酶组合物进一步包含具有纤维素分解增强活性的GH61多肽,如源自嗜热子囊菌属如桔橙嗜热子囊菌的菌株的GH61多肽,如在WO 2005/074656中作为SEQ ID NO:2或本申请中的SEQ ID NO:21描述的GH61多肽;或源自梭孢壳属,如土生梭孢霉的菌株的多肽,如WO 2005/074647中作为SEQ ID NO:7和SEQ ID NO:8描述的多肽;或源自曲霉属的菌株如烟曲霉的菌株的GH61多肽,如WO 2010/138754中作为SEQ ID NO:1和SEQ ID NO:2描述的GH61多肽;或源自青霉属的菌株如埃默森青霉的菌株的GH61多肽,如WO2011/041397中作为SEQ ID NO:2或本申请中的SEQ ID NO:12披露的GH61多肽。
89.如段落81-88中任一项所述的方法,其中该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,所述里氏木霉纤维素分解酶组合物进一步包含具有纤维素分解增强活性的桔橙嗜热子囊菌GH61A多肽(WO2005/074656中的SEQ ID NO:2或本申请中的SEQ IDNO:21)、以及烟曲霉β-葡糖苷酶(WO 2005/047499的SEQ ID NO:2)或本申请中的SEQ IDNO:6。
90.如段落81-89中任一项所述的方法,其中该纤维素分解酶组合物是一种里氏木霉纤维素分解酶组合物,所述里氏木霉纤维素分解酶组合物进一步包含WO 2011/041397中作为SEQ ID NO:2或本申请中的SEQ ID NO:12披露的、具有纤维素分解增强活性的埃默森青霉GH61A多肽;以及烟曲霉β-葡糖苷酶(WO 2005/047499的SEQ ID NO:2或本申请中的SEQID NO:10)或其具有以下取代中的一个或多个如所有的变体:F100D、S283G、N456E、F512Y。
91.如段落81-90中任一项所述的方法,其中该纤维素分解酶组合物以0.0001-3mgEP/g DS,优选0.0005-2mg EP/g DS,优选0.001-1mg/g DS,更优选0.005-0.5mg EP/g DS,甚至更优选0.01-0.1mg EP/g DS剂量添加。
序列表
<110> Kang, Zhengfang
Schnorr, Kirk Matthew
Skov, Lars Kobberxe
<120> 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途
<130> 13136-WO-PCT
<160> 32
<170> PatentIn 3.5版
<210> 1
<211> 3317
<212> DNA
<213> 瘤孢毁丝霉(Myceliophthora sepedonium)
<220>
<221> 信号肽
<222> (501)..(560)
<220>
<221> CDS
<222> (501)..(679)
<220>
<221> 内含子
<222> (680)..(765)
<220>
<221> CDS
<222> (766)..(1425)
<220>
<221> 内含子
<222> (1426)..(1483)
<220>
<221> CDS
<222> (1484)..(2676)
<220>
<221> 内含子
<222> (2677)..(2755)
<220>
<221> CDS
<222> (2756)..(2814)
<400> 1
aaagattgga agccactgct taaagatggc aatcaccagg ctcgcttctc gattcccaaa 60
gcggtgaaaa cacaaaaaag ttggagaagc gacgatcatg atcaagtagc ccctgctcga 120
gcgggaaggg cccagccttg gatccaggca tcaccccgtt actaccttac gtatagagct 180
gcagcttcct gcaagcatgg ttacatgtgc agcttgtcaa ggcccctcga gagcttgcca 240
gaagggttcg gtctgttccc caagccgtat cgggagctaa gacggacatc cttcaatccg 300
attttgaagc ccggccgagc cggctcgttt ggctcctcag tctcccaatg catctgggct 360
gcagacagct tctctcgttt taaaaagcct gagcattccc tgccctcctc ggggccttcc 420
tcgttctctc ccatccttcg ggtacaacag accatcatcg taagcgcaag acagcaccac 480
cgcgtgctga aagctacaca atg gcg cta cga cac atc gcg gcg gcg gcg atc 533
Met Ala Leu Arg His Ile Ala Ala Ala Ala Ile
1 5 10
gcc ggt ctt gcc tca agg act gca gcg ctg tac atc aat ggc tca gtc 581
Ala Gly Leu Ala Ser Arg Thr Ala Ala Leu Tyr Ile Asn Gly Ser Val
15 20 25
aca gcg ccg tgc gac tcg ccc att tac tgc caa ggc gag ctt cta aaa 629
Thr Ala Pro Cys Asp Ser Pro Ile Tyr Cys Gln Gly Glu Leu Leu Lys
30 35 40
gcg gtt gaa ctg gcg cgt cct ttc gtt gac agc aag aca ttt gtg gac 677
Ala Val Glu Leu Ala Arg Pro Phe Val Asp Ser Lys Thr Phe Val Asp
45 50 55
at gtaagtcatg atcggccagc caggtgggaa tgcagccggc gggcagattc 729
Met
60
gtggtgacac actgactgac ttggattccc gcccag g ccc acg atc aag cca gtg 784
Pro Thr Ile Lys Pro Val
65
gat gaa gtg ctt gca gca ttc agc aag ctt agc cta cca ctt tcc aat 832
Asp Glu Val Leu Ala Ala Phe Ser Lys Leu Ser Leu Pro Leu Ser Asn
70 75 80
aac tca gag ctc aac gcc ttc ttg tat gag aac ttc gcc cag gct ggc 880
Asn Ser Glu Leu Asn Ala Phe Leu Tyr Glu Asn Phe Ala Gln Ala Gly
85 90 95
cac gag ctc gaa gaa gtg ccc gac agt gag cta gag acg gac gca aag 928
His Glu Leu Glu Glu Val Pro Asp Ser Glu Leu Glu Thr Asp Ala Lys
100 105 110
ttc ctc gac aag ctc gag gat cgc acc atc aag gag ttc gtc ggc aag 976
Phe Leu Asp Lys Leu Glu Asp Arg Thr Ile Lys Glu Phe Val Gly Lys
115 120 125 130
gtg atc gac atc tgg ccc gac ttg acc agg cgc tat gcc ggc ccc agc 1024
Val Ile Asp Ile Trp Pro Asp Leu Thr Arg Arg Tyr Ala Gly Pro Ser
135 140 145
aac tgc acc gag tgc gcc aac agc ttc att ccc gtg aac cgc acg ttc 1072
Asn Cys Thr Glu Cys Ala Asn Ser Phe Ile Pro Val Asn Arg Thr Phe
150 155 160
gtc gtg gct ggc ggt cgc ttc cga gag ccc tac tat tgg gat tcg tac 1120
Val Val Ala Gly Gly Arg Phe Arg Glu Pro Tyr Tyr Trp Asp Ser Tyr
165 170 175
tgg atc gtc gaa ggt ctc ctg cgc act ggc ggt gcc ttc acc cat atc 1168
Trp Ile Val Glu Gly Leu Leu Arg Thr Gly Gly Ala Phe Thr His Ile
180 185 190
tcc aag aac atc att gag aac ttc ctg gac ttt gtc gac acg att ggc 1216
Ser Lys Asn Ile Ile Glu Asn Phe Leu Asp Phe Val Asp Thr Ile Gly
195 200 205 210
ttc att ccc aat ggc gcc agg atc tac tac ctg aac agg tca cag ccc 1264
Phe Ile Pro Asn Gly Ala Arg Ile Tyr Tyr Leu Asn Arg Ser Gln Pro
215 220 225
cct ctc ctg aca ttg atg gtg aag agc tac gtc gac tac acc aac gac 1312
Pro Leu Leu Thr Leu Met Val Lys Ser Tyr Val Asp Tyr Thr Asn Asp
230 235 240
acg agc atc ctg gac agg gcc ttg ccg ctg ctg atc aag gag cac gag 1360
Thr Ser Ile Leu Asp Arg Ala Leu Pro Leu Leu Ile Lys Glu His Glu
245 250 255
ttc ttc atg aat aac cgg acg gtg tcc atc acg gga tcg aac ggc aag 1408
Phe Phe Met Asn Asn Arg Thr Val Ser Ile Thr Gly Ser Asn Gly Lys
260 265 270
gag tac act ctg aac ag gtaagcgagg tggacaggca ggcctcggcg 1455
Glu Tyr Thr Leu Asn Arg
275 280
accatgcgct tattgttgta tctggcag g tat cac gtt gaa aac aac caa cca 1508
Tyr His Val Glu Asn Asn Gln Pro
285
cgc cca gag tcg ttc cgg gag gat tac att acc gct aac aac ggc tcc 1556
Arg Pro Glu Ser Phe Arg Glu Asp Tyr Ile Thr Ala Asn Asn Gly Ser
290 295 300
tac tac gcg tct tcg ggc ata ata tat ccc gtt aag acg ccc ctc aac 1604
Tyr Tyr Ala Ser Ser Gly Ile Ile Tyr Pro Val Lys Thr Pro Leu Asn
305 310 315 320
gag acg gaa aag gcc gcg ctc tac tcg aac cta gca acc ggc gcc gag 1652
Glu Thr Glu Lys Ala Ala Leu Tyr Ser Asn Leu Ala Thr Gly Ala Glu
325 330 335
tcc ggc tgg gac tac acc tcc cga tgg ctt ggg gtc ccc agc gac gct 1700
Ser Gly Trp Asp Tyr Thr Ser Arg Trp Leu Gly Val Pro Ser Asp Ala
340 345 350
gcg agg gac gtc tat ttc ccg ctc cgc tcg ctt aat gtc cgc gac ata 1748
Ala Arg Asp Val Tyr Phe Pro Leu Arg Ser Leu Asn Val Arg Asp Ile
355 360 365
gtc ccc gtc gat ctc aac tcc atc ctc tac cag aac gag gtg atc att 1796
Val Pro Val Asp Leu Asn Ser Ile Leu Tyr Gln Asn Glu Val Ile Ile
370 375 380
gcc gag tac ctc gag aag gcc ggt aac tcc tcc gcg gcc aag cgc ttc 1844
Ala Glu Tyr Leu Glu Lys Ala Gly Asn Ser Ser Ala Ala Lys Arg Phe
385 390 395 400
gcc act gct gcc gaa cag cgc agc gag gcc atg tac tcc ctc atg tgg 1892
Ala Thr Ala Ala Glu Gln Arg Ser Glu Ala Met Tyr Ser Leu Met Trp
405 410 415
aac gcc acg cac tgg tct tac ttt gac tac aat ctg acc gat aac acg 1940
Asn Ala Thr His Trp Ser Tyr Phe Asp Tyr Asn Leu Thr Asp Asn Thr
420 425 430
caa cac atc ttc gtc cca gcc gac gag gac acc gcc ccc cag gac cgg 1988
Gln His Ile Phe Val Pro Ala Asp Glu Asp Thr Ala Pro Gln Asp Arg
435 440 445
atc gag gcc ccc ccc ggt caa caa gtc ttc ttc cac att gcg cag ctc 2036
Ile Glu Ala Pro Pro Gly Gln Gln Val Phe Phe His Ile Ala Gln Leu
450 455 460
tat cca ttc tgg acg ggc gcg gcc ccc gcc agc ctt aag gct aac ccc 2084
Tyr Pro Phe Trp Thr Gly Ala Ala Pro Ala Ser Leu Lys Ala Asn Pro
465 470 475 480
ctc gcg gtg cag caa gcc tac gcc cgt gtg gcg cgc atg ctc gat atc 2132
Leu Ala Val Gln Gln Ala Tyr Ala Arg Val Ala Arg Met Leu Asp Ile
485 490 495
aag aag ggc gcc atc ccc gcc acc aac tac cgc acc ggc caa caa tgg 2180
Lys Lys Gly Ala Ile Pro Ala Thr Asn Tyr Arg Thr Gly Gln Gln Trp
500 505 510
gac cag ccc aac gtc tgg ccg ccg ctg caa cat atc ctg atg aag ggc 2228
Asp Gln Pro Asn Val Trp Pro Pro Leu Gln His Ile Leu Met Lys Gly
515 520 525
ctg ctt aac acc ccg gca acc ttt ggc aag tcc gac cct gcg tac cag 2276
Leu Leu Asn Thr Pro Ala Thr Phe Gly Lys Ser Asp Pro Ala Tyr Gln
530 535 540
agc gtg caa aac ctc gcc ctg cgt ctc gcc cag cgc tac ctc gat tcc 2324
Ser Val Gln Asn Leu Ala Leu Arg Leu Ala Gln Arg Tyr Leu Asp Ser
545 550 555 560
acc ttt tgt acc tgg tac gcc acg ggc ggt tca acc agc gac ttc ccg 2372
Thr Phe Cys Thr Trp Tyr Ala Thr Gly Gly Ser Thr Ser Asp Phe Pro
565 570 575
cag ctg gag ggt gtt acc ccg ggc gct acg ggc gtc atg ttt gag aag 2420
Gln Leu Glu Gly Val Thr Pro Gly Ala Thr Gly Val Met Phe Glu Lys
580 585 590
tac gcc gac aat gct acc aac gtt gcc ggc ggc ggc ggc gaa tac gag 2468
Tyr Ala Asp Asn Ala Thr Asn Val Ala Gly Gly Gly Gly Glu Tyr Glu
595 600 605
gtc gtc gag ggt ttc ggg tgg acc aat ggc gta ctg atc tgg gcg gcc 2516
Val Val Glu Gly Phe Gly Trp Thr Asn Gly Val Leu Ile Trp Ala Ala
610 615 620
gac gtc ttt ggt aac aag ctc aag cgc ccg gac tgc ggc aac atc acg 2564
Asp Val Phe Gly Asn Lys Leu Lys Arg Pro Asp Cys Gly Asn Ile Thr
625 630 635 640
gcc gca cat acc cac tct agt gcc aag aga ggt ctg gaa gag aat aag 2612
Ala Ala His Thr His Ser Ser Ala Lys Arg Gly Leu Glu Glu Asn Lys
645 650 655
ctg ccg agg agg gcg gtg gag ctc gac ccg tgg gat gcc gcg tgg acc 2660
Leu Pro Arg Arg Ala Val Glu Leu Asp Pro Trp Asp Ala Ala Trp Thr
660 665 670
aag atg ttt ggg cgg a gtaagctccg gagaagagag gcagaagatg tgcggaagcg 2716
Lys Met Phe Gly Arg
675
gtggatgagc taaggtccta atccatatgc ttaatgaag gg tgg ttc gtt gtg 2769
Arg Trp Phe Val Val
680
ctt cgc ttt caa gtt ggt aac tta gtg ttt agt gtc tcc gtc tcg 2814
Leu Arg Phe Gln Val Gly Asn Leu Val Phe Ser Val Ser Val Ser
685 690 695
taagcgatgg caaactttgc gagggaagtc ggtcgatgaa gaggtaatcc gcatcctggc 2874
gccctatcta ggtcggtagc tacctgggcg gatatcgagc ttacattaat acctacttag 2934
taatttccag agagatgatc acctggattg cggctgcaaa tggttaacac acacaataag 2994
ataagaatgt tattgctgcc catgtacaga cacggttgta gaatgagctt gataaagctg 3054
acaacggaaa actggacccc ccggtttgcg cataaatgtc ccgccaacgc caaaagttca 3114
accctccaac cgccaccgta gcaacgccga tacaaatgca accgtgtatt ttctccgtca 3174
tgccgccgta gcccctattc acacactcgg ctcaaaccgc tgtcgtcacc ggcgtgcccc 3234
gacacgcctc ccaatccgac ccagaggcct accccggcgc cgtgtgacga tgggcgtccc 3294
ccccagctca ctgccctcac ccc 3317
<210> 2
<211> 697
<212> PRT
<213> 瘤孢毁丝霉(Myceliophthora sepedonium)
<400> 2
Met Ala Leu Arg His Ile Ala Ala Ala Ala Ile Ala Gly Leu Ala Ser
1 5 10 15
Arg Thr Ala Ala Leu Tyr Ile Asn Gly Ser Val Thr Ala Pro Cys Asp
20 25 30
Ser Pro Ile Tyr Cys Gln Gly Glu Leu Leu Lys Ala Val Glu Leu Ala
35 40 45
Arg Pro Phe Val Asp Ser Lys Thr Phe Val Asp Met Pro Thr Ile Lys
50 55 60
Pro Val Asp Glu Val Leu Ala Ala Phe Ser Lys Leu Ser Leu Pro Leu
65 70 75 80
Ser Asn Asn Ser Glu Leu Asn Ala Phe Leu Tyr Glu Asn Phe Ala Gln
85 90 95
Ala Gly His Glu Leu Glu Glu Val Pro Asp Ser Glu Leu Glu Thr Asp
100 105 110
Ala Lys Phe Leu Asp Lys Leu Glu Asp Arg Thr Ile Lys Glu Phe Val
115 120 125
Gly Lys Val Ile Asp Ile Trp Pro Asp Leu Thr Arg Arg Tyr Ala Gly
130 135 140
Pro Ser Asn Cys Thr Glu Cys Ala Asn Ser Phe Ile Pro Val Asn Arg
145 150 155 160
Thr Phe Val Val Ala Gly Gly Arg Phe Arg Glu Pro Tyr Tyr Trp Asp
165 170 175
Ser Tyr Trp Ile Val Glu Gly Leu Leu Arg Thr Gly Gly Ala Phe Thr
180 185 190
His Ile Ser Lys Asn Ile Ile Glu Asn Phe Leu Asp Phe Val Asp Thr
195 200 205
Ile Gly Phe Ile Pro Asn Gly Ala Arg Ile Tyr Tyr Leu Asn Arg Ser
210 215 220
Gln Pro Pro Leu Leu Thr Leu Met Val Lys Ser Tyr Val Asp Tyr Thr
225 230 235 240
Asn Asp Thr Ser Ile Leu Asp Arg Ala Leu Pro Leu Leu Ile Lys Glu
245 250 255
His Glu Phe Phe Met Asn Asn Arg Thr Val Ser Ile Thr Gly Ser Asn
260 265 270
Gly Lys Glu Tyr Thr Leu Asn Arg Tyr His Val Glu Asn Asn Gln Pro
275 280 285
Arg Pro Glu Ser Phe Arg Glu Asp Tyr Ile Thr Ala Asn Asn Gly Ser
290 295 300
Tyr Tyr Ala Ser Ser Gly Ile Ile Tyr Pro Val Lys Thr Pro Leu Asn
305 310 315 320
Glu Thr Glu Lys Ala Ala Leu Tyr Ser Asn Leu Ala Thr Gly Ala Glu
325 330 335
Ser Gly Trp Asp Tyr Thr Ser Arg Trp Leu Gly Val Pro Ser Asp Ala
340 345 350
Ala Arg Asp Val Tyr Phe Pro Leu Arg Ser Leu Asn Val Arg Asp Ile
355 360 365
Val Pro Val Asp Leu Asn Ser Ile Leu Tyr Gln Asn Glu Val Ile Ile
370 375 380
Ala Glu Tyr Leu Glu Lys Ala Gly Asn Ser Ser Ala Ala Lys Arg Phe
385 390 395 400
Ala Thr Ala Ala Glu Gln Arg Ser Glu Ala Met Tyr Ser Leu Met Trp
405 410 415
Asn Ala Thr His Trp Ser Tyr Phe Asp Tyr Asn Leu Thr Asp Asn Thr
420 425 430
Gln His Ile Phe Val Pro Ala Asp Glu Asp Thr Ala Pro Gln Asp Arg
435 440 445
Ile Glu Ala Pro Pro Gly Gln Gln Val Phe Phe His Ile Ala Gln Leu
450 455 460
Tyr Pro Phe Trp Thr Gly Ala Ala Pro Ala Ser Leu Lys Ala Asn Pro
465 470 475 480
Leu Ala Val Gln Gln Ala Tyr Ala Arg Val Ala Arg Met Leu Asp Ile
485 490 495
Lys Lys Gly Ala Ile Pro Ala Thr Asn Tyr Arg Thr Gly Gln Gln Trp
500 505 510
Asp Gln Pro Asn Val Trp Pro Pro Leu Gln His Ile Leu Met Lys Gly
515 520 525
Leu Leu Asn Thr Pro Ala Thr Phe Gly Lys Ser Asp Pro Ala Tyr Gln
530 535 540
Ser Val Gln Asn Leu Ala Leu Arg Leu Ala Gln Arg Tyr Leu Asp Ser
545 550 555 560
Thr Phe Cys Thr Trp Tyr Ala Thr Gly Gly Ser Thr Ser Asp Phe Pro
565 570 575
Gln Leu Glu Gly Val Thr Pro Gly Ala Thr Gly Val Met Phe Glu Lys
580 585 590
Tyr Ala Asp Asn Ala Thr Asn Val Ala Gly Gly Gly Gly Glu Tyr Glu
595 600 605
Val Val Glu Gly Phe Gly Trp Thr Asn Gly Val Leu Ile Trp Ala Ala
610 615 620
Asp Val Phe Gly Asn Lys Leu Lys Arg Pro Asp Cys Gly Asn Ile Thr
625 630 635 640
Ala Ala His Thr His Ser Ser Ala Lys Arg Gly Leu Glu Glu Asn Lys
645 650 655
Leu Pro Arg Arg Ala Val Glu Leu Asp Pro Trp Asp Ala Ala Trp Thr
660 665 670
Lys Met Phe Gly Arg Arg Trp Phe Val Val Leu Arg Phe Gln Val Gly
675 680 685
Asn Leu Val Phe Ser Val Ser Val Ser
690 695
<210> 3
<211> 3204
<212> DNA
<213> 变绿毛壳菌(Chaetomium virescens)
<220>
<221> CDS
<222> (501)..(679)
<220>
<221> 信号肽
<222> (501)..(560)
<220>
<221> 内含子
<222> (680)..(751)
<220>
<221> CDS
<222> (752)..(1411)
<220>
<221> 内含子
<222> (1412)..(1470)
<220>
<221> CDS
<222> (1471)..(2701)
<400> 3
aattggggaa aggcggtggt cctgaccagg tccccagaga gcgtggccca ccactgctcg 60
gacagggaag cccgaccttg gatcgggcct gacccgtctc ccgtttcctg gcacacctct 120
cccatgattc gtggttgcac aaggggccgc agggttgcaa ctgccctgca gagctctcag 180
gttggtcatg tacgtaaggt aaacctgaac cataggatgt tgcggcccgg ctgcgggaag 240
ctcaaaaagc ttccatcgtc gacctgccta aaccgacgac ctaagacggg ctgccttctc 300
tccgatcttg tgtccctccc gtcgattggc ctccctcgtt tcgtcccgcg ggcacaatat 360
ataaggcaag gtactgtcca aactggaggg cagatgttcc ttccctcgtc ctgctcccca 420
tcgcttccct gccatccact ctcgttcttg tccacctcac tagatgccag tggtgatttc 480
gagaaactga gaaactcaca atg acg ctc cga cac ctc ggg gct gca gca ctc 533
Met Thr Leu Arg His Leu Gly Ala Ala Ala Leu
1 5 10
gcc ggt ctc gct tcg gtc gct tct gct ttg tac atc aat ggc tcg gtc 581
Ala Gly Leu Ala Ser Val Ala Ser Ala Leu Tyr Ile Asn Gly Ser Val
15 20 25
acg gcg cca tgc gat tcg ccg ctc tac tgc cag gga gag atc ctg aag 629
Thr Ala Pro Cys Asp Ser Pro Leu Tyr Cys Gln Gly Glu Ile Leu Lys
30 35 40
gca att gag ctg gca cgg ccc ttc tcc gac tcc aag acg ttc gtg gat 677
Ala Ile Glu Leu Ala Arg Pro Phe Ser Asp Ser Lys Thr Phe Val Asp
45 50 55
at gtaagtcagc gagacccgcc ggcgtgggtg ttggtgagac atgggaatgt 729
Met
60
tgacctggac ccccgcgctc ag g ccg acg atc aag cca ctg gag gag gtc 779
Pro Thr Ile Lys Pro Leu Glu Glu Val
65
att gca gct ttc ggc cgc ttg aag cag ccc ttg agc aac aac tcg gag 827
Ile Ala Ala Phe Gly Arg Leu Lys Gln Pro Leu Ser Asn Asn Ser Glu
70 75 80 85
ctc acc gcc ttc ctg gct gag aac ttt gcc ccg gcc ggc ggc gag ctg 875
Leu Thr Ala Phe Leu Ala Glu Asn Phe Ala Pro Ala Gly Gly Glu Leu
90 95 100
gag gag gtg ccc aag agc gag ctg cat acc gac ccc gtc ttc ctc aac 923
Glu Glu Val Pro Lys Ser Glu Leu His Thr Asp Pro Val Phe Leu Asn
105 110 115
aag ctc gac gat gcc gtg gtc aag gag ttc gtc gga aag gtc atc gac 971
Lys Leu Asp Asp Ala Val Val Lys Glu Phe Val Gly Lys Val Ile Asp
120 125 130
atc tgg ccc gac ctg acc aga cgc tat gcc ggc ccc ggc aac tgc tcc 1019
Ile Trp Pro Asp Leu Thr Arg Arg Tyr Ala Gly Pro Gly Asn Cys Ser
135 140 145
aac tgc gag aac agc ttc atc ccc gtg aac cgc acg ttc gtt gtg gcc 1067
Asn Cys Glu Asn Ser Phe Ile Pro Val Asn Arg Thr Phe Val Val Ala
150 155 160 165
ggc ggc cgc ttc cgc gag ccc tac tac tgg gac tcc tac tgg atc gtc 1115
Gly Gly Arg Phe Arg Glu Pro Tyr Tyr Trp Asp Ser Tyr Trp Ile Val
170 175 180
gag ggt ctc ctt cgc acc ggc ggc gct ttc gtc ggc atc acc aag aac 1163
Glu Gly Leu Leu Arg Thr Gly Gly Ala Phe Val Gly Ile Thr Lys Asn
185 190 195
atc ctc gag aac ttc ctg gac ttc atc gag acc att ggc ttc gtg ccc 1211
Ile Leu Glu Asn Phe Leu Asp Phe Ile Glu Thr Ile Gly Phe Val Pro
200 205 210
aat ggc gcc aga atc tac tac ctc aat cgg tcc cag cca ccg ctc ctc 1259
Asn Gly Ala Arg Ile Tyr Tyr Leu Asn Arg Ser Gln Pro Pro Leu Leu
215 220 225
aca aag atg atc aag atc tac gtc gac cac acc aag gac acc agc atc 1307
Thr Lys Met Ile Lys Ile Tyr Val Asp His Thr Lys Asp Thr Ser Ile
230 235 240 245
ctg cag agg gcc ttg cct ctg ctg atc aag gag cac gag tgg tgg acc 1355
Leu Gln Arg Ala Leu Pro Leu Leu Ile Lys Glu His Glu Trp Trp Thr
250 255 260
aac aac agg agc gtg act gtc act ggc ccc aat ggc aaa acg tac act 1403
Asn Asn Arg Ser Val Thr Val Thr Gly Pro Asn Gly Lys Thr Tyr Thr
265 270 275
ttg aac ag gtaagtgact cgcactgacg acggcgtggt attatgcagg 1451
Leu Asn Arg
280
gactgacagt tccccacag g tac cac gtc aac aac aac caa ccc cgg ccc 1501
Tyr His Val Asn Asn Asn Gln Pro Arg Pro
285 290
gag tca ttc agg gag gac tac atc acc gcc aac aac ggc tcc tac tac 1549
Glu Ser Phe Arg Glu Asp Tyr Ile Thr Ala Asn Asn Gly Ser Tyr Tyr
295 300 305
gcg acg tcg ggt ata ata tac ccc gtt aag agc ccg ctg aac gag acc 1597
Ala Thr Ser Gly Ile Ile Tyr Pro Val Lys Ser Pro Leu Asn Glu Thr
310 315 320
gag aaa gat gag acc tac gcc aac ttg gcc acc ggc gct gag tcc ggc 1645
Glu Lys Asp Glu Thr Tyr Ala Asn Leu Ala Thr Gly Ala Glu Ser Gly
325 330 335
tgg gac tat acc gct aga tgg ctg cgg act cca aat gat gcc gct aag 1693
Trp Asp Tyr Thr Ala Arg Trp Leu Arg Thr Pro Asn Asp Ala Ala Lys
340 345 350
gac gtc tac ttc ccg ctc cgc tcg ctc aac gtc cgc aac atg atc ccc 1741
Asp Val Tyr Phe Pro Leu Arg Ser Leu Asn Val Arg Asn Met Ile Pro
355 360 365 370
gtg gac ctc aac tcc atc ctc tac caa aac gag gtc atc att ggc gag 1789
Val Asp Leu Asn Ser Ile Leu Tyr Gln Asn Glu Val Ile Ile Gly Glu
375 380 385
tac ctc gag cag gca ggc aac aaa tcc gag gcc cag cgc tgg ttc caa 1837
Tyr Leu Glu Gln Ala Gly Asn Lys Ser Glu Ala Gln Arg Trp Phe Gln
390 395 400
gcc gcc aac cag cgc agc gag gcc atg tac gcg ctc atg tgg aat gcc 1885
Ala Ala Asn Gln Arg Ser Glu Ala Met Tyr Ala Leu Met Trp Asn Ala
405 410 415
acc cac tgg tcc tac ttc gac tac aac ctg acg agc aat tcc cag tat 1933
Thr His Trp Ser Tyr Phe Asp Tyr Asn Leu Thr Ser Asn Ser Gln Tyr
420 425 430
atc ttc atc gcc aac gac gag gac gcc acc acc gcc gag caa gcc aac 1981
Ile Phe Ile Ala Asn Asp Glu Asp Ala Thr Thr Ala Glu Gln Ala Asn
435 440 445 450
tcc ccg cct ggc caa cag gtc ctc ttc tcc atc tcg cag ctc tac ccc 2029
Ser Pro Pro Gly Gln Gln Val Leu Phe Ser Ile Ser Gln Leu Tyr Pro
455 460 465
ttc tgg acc ggc gcc gcc ccc gac cag ctc aag aag aac ccc ctt gcg 2077
Phe Trp Thr Gly Ala Ala Pro Asp Gln Leu Lys Lys Asn Pro Leu Ala
470 475 480
gtc caa caa gcg tac tac cgc atc gag cgc atg ctg aac gag aaa gcc 2125
Val Gln Gln Ala Tyr Tyr Arg Ile Glu Arg Met Leu Asn Glu Lys Ala
485 490 495
ggc gcc atc ccc tcc aca aat ttc agg acc ggc cag caa tgg gac gag 2173
Gly Ala Ile Pro Ser Thr Asn Phe Arg Thr Gly Gln Gln Trp Asp Glu
500 505 510
ccc aac gtc tgg cct ccc ctg caa cac atc ctg atg cag ggc ctg ctc 2221
Pro Asn Val Trp Pro Pro Leu Gln His Ile Leu Met Gln Gly Leu Leu
515 520 525 530
aac acc ccg gcc acc ttc ggc acc gcg gac ccg gcc tac gcc gcc gtc 2269
Asn Thr Pro Ala Thr Phe Gly Thr Ala Asp Pro Ala Tyr Ala Ala Val
535 540 545
cag aac ctg gcc ctc cgc ctc gct cag cgc tac ctc gac tcg acc ttc 2317
Gln Asn Leu Ala Leu Arg Leu Ala Gln Arg Tyr Leu Asp Ser Thr Phe
550 555 560
tgc aca tgg tat gcc acg ggc ggc tcg acc agc cag acg ccc cag ctg 2365
Cys Thr Trp Tyr Ala Thr Gly Gly Ser Thr Ser Gln Thr Pro Gln Leu
565 570 575
cag ggc gtc tcc cca ggc gca acg ggg atc atg ttt gag aag tat gcg 2413
Gln Gly Val Ser Pro Gly Ala Thr Gly Ile Met Phe Glu Lys Tyr Ala
580 585 590
gac aac gcg acg aat gtg gct ggc agc ggc ggc gag tac gag gtg gtg 2461
Asp Asn Ala Thr Asn Val Ala Gly Ser Gly Gly Glu Tyr Glu Val Val
595 600 605 610
gag ggg ttt ggg tgg acg aat ggc gtg ctg atc tgg gcg gcc gag acg 2509
Glu Gly Phe Gly Trp Thr Asn Gly Val Leu Ile Trp Ala Ala Glu Thr
615 620 625
ttt ggg aat aag ctg aag agg ccg gat tgc ggt gat atc cag gca gcg 2557
Phe Gly Asn Lys Leu Lys Arg Pro Asp Cys Gly Asp Ile Gln Ala Ala
630 635 640
cat act cat act gat aaa aag aag agg tgg tcg gtg gat ggt gag gtg 2605
His Thr His Thr Asp Lys Lys Lys Arg Trp Ser Val Asp Gly Glu Val
645 650 655
agg gcg agg gag agg atg gcg gtg gag ctc gat ccg tgg gat gcg aag 2653
Arg Ala Arg Glu Arg Met Ala Val Glu Leu Asp Pro Trp Asp Ala Lys
660 665 670
tgg acg aag atg ttt ggg cag gca aag ggg agg gta ggg agg agg tcg 2701
Trp Thr Lys Met Phe Gly Gln Ala Lys Gly Arg Val Gly Arg Arg Ser
675 680 685 690
tgaggagttt gatgattgat ttctttgttc tacaatgagc gtttatgcgt cgtgcggagg 2761
gactcgctga taacgatacc attgccattc gttgcatgaa ccctgcagtt agcggcaagc 2821
tggttgtgtg tgtatcagtg gcagtgttat gataatgcct aatgacaacg tacgagacga 2881
atcaggtaaa gatttgcatg tgagctgaac tgtgtgggca agatacttag atgagatagc 2941
tgggagctcc ccttccccgg ctagagtgac gcaagctgaa ccgcacatac gacatgacga 3001
tgaacagaat caagccaccc aacacactgc gcccgaaacc ctctttattg cccatcccat 3061
acatatgccc ttcccaaacg ccaaacgcgc aagcaaccaa ccgcagccga gctccatcaa 3121
agtaaaaatg caactagcca ccgatgcccc aagcctatac cggaactgga ccctcctcct 3181
attctctctc ctctttcttt tcc 3204
<210> 4
<211> 690
<212> PRT
<213> 变绿毛壳菌(Chaetomium virescens)
<400> 4
Met Thr Leu Arg His Leu Gly Ala Ala Ala Leu Ala Gly Leu Ala Ser
1 5 10 15
Val Ala Ser Ala Leu Tyr Ile Asn Gly Ser Val Thr Ala Pro Cys Asp
20 25 30
Ser Pro Leu Tyr Cys Gln Gly Glu Ile Leu Lys Ala Ile Glu Leu Ala
35 40 45
Arg Pro Phe Ser Asp Ser Lys Thr Phe Val Asp Met Pro Thr Ile Lys
50 55 60
Pro Leu Glu Glu Val Ile Ala Ala Phe Gly Arg Leu Lys Gln Pro Leu
65 70 75 80
Ser Asn Asn Ser Glu Leu Thr Ala Phe Leu Ala Glu Asn Phe Ala Pro
85 90 95
Ala Gly Gly Glu Leu Glu Glu Val Pro Lys Ser Glu Leu His Thr Asp
100 105 110
Pro Val Phe Leu Asn Lys Leu Asp Asp Ala Val Val Lys Glu Phe Val
115 120 125
Gly Lys Val Ile Asp Ile Trp Pro Asp Leu Thr Arg Arg Tyr Ala Gly
130 135 140
Pro Gly Asn Cys Ser Asn Cys Glu Asn Ser Phe Ile Pro Val Asn Arg
145 150 155 160
Thr Phe Val Val Ala Gly Gly Arg Phe Arg Glu Pro Tyr Tyr Trp Asp
165 170 175
Ser Tyr Trp Ile Val Glu Gly Leu Leu Arg Thr Gly Gly Ala Phe Val
180 185 190
Gly Ile Thr Lys Asn Ile Leu Glu Asn Phe Leu Asp Phe Ile Glu Thr
195 200 205
Ile Gly Phe Val Pro Asn Gly Ala Arg Ile Tyr Tyr Leu Asn Arg Ser
210 215 220
Gln Pro Pro Leu Leu Thr Lys Met Ile Lys Ile Tyr Val Asp His Thr
225 230 235 240
Lys Asp Thr Ser Ile Leu Gln Arg Ala Leu Pro Leu Leu Ile Lys Glu
245 250 255
His Glu Trp Trp Thr Asn Asn Arg Ser Val Thr Val Thr Gly Pro Asn
260 265 270
Gly Lys Thr Tyr Thr Leu Asn Arg Tyr His Val Asn Asn Asn Gln Pro
275 280 285
Arg Pro Glu Ser Phe Arg Glu Asp Tyr Ile Thr Ala Asn Asn Gly Ser
290 295 300
Tyr Tyr Ala Thr Ser Gly Ile Ile Tyr Pro Val Lys Ser Pro Leu Asn
305 310 315 320
Glu Thr Glu Lys Asp Glu Thr Tyr Ala Asn Leu Ala Thr Gly Ala Glu
325 330 335
Ser Gly Trp Asp Tyr Thr Ala Arg Trp Leu Arg Thr Pro Asn Asp Ala
340 345 350
Ala Lys Asp Val Tyr Phe Pro Leu Arg Ser Leu Asn Val Arg Asn Met
355 360 365
Ile Pro Val Asp Leu Asn Ser Ile Leu Tyr Gln Asn Glu Val Ile Ile
370 375 380
Gly Glu Tyr Leu Glu Gln Ala Gly Asn Lys Ser Glu Ala Gln Arg Trp
385 390 395 400
Phe Gln Ala Ala Asn Gln Arg Ser Glu Ala Met Tyr Ala Leu Met Trp
405 410 415
Asn Ala Thr His Trp Ser Tyr Phe Asp Tyr Asn Leu Thr Ser Asn Ser
420 425 430
Gln Tyr Ile Phe Ile Ala Asn Asp Glu Asp Ala Thr Thr Ala Glu Gln
435 440 445
Ala Asn Ser Pro Pro Gly Gln Gln Val Leu Phe Ser Ile Ser Gln Leu
450 455 460
Tyr Pro Phe Trp Thr Gly Ala Ala Pro Asp Gln Leu Lys Lys Asn Pro
465 470 475 480
Leu Ala Val Gln Gln Ala Tyr Tyr Arg Ile Glu Arg Met Leu Asn Glu
485 490 495
Lys Ala Gly Ala Ile Pro Ser Thr Asn Phe Arg Thr Gly Gln Gln Trp
500 505 510
Asp Glu Pro Asn Val Trp Pro Pro Leu Gln His Ile Leu Met Gln Gly
515 520 525
Leu Leu Asn Thr Pro Ala Thr Phe Gly Thr Ala Asp Pro Ala Tyr Ala
530 535 540
Ala Val Gln Asn Leu Ala Leu Arg Leu Ala Gln Arg Tyr Leu Asp Ser
545 550 555 560
Thr Phe Cys Thr Trp Tyr Ala Thr Gly Gly Ser Thr Ser Gln Thr Pro
565 570 575
Gln Leu Gln Gly Val Ser Pro Gly Ala Thr Gly Ile Met Phe Glu Lys
580 585 590
Tyr Ala Asp Asn Ala Thr Asn Val Ala Gly Ser Gly Gly Glu Tyr Glu
595 600 605
Val Val Glu Gly Phe Gly Trp Thr Asn Gly Val Leu Ile Trp Ala Ala
610 615 620
Glu Thr Phe Gly Asn Lys Leu Lys Arg Pro Asp Cys Gly Asp Ile Gln
625 630 635 640
Ala Ala His Thr His Thr Asp Lys Lys Lys Arg Trp Ser Val Asp Gly
645 650 655
Glu Val Arg Ala Arg Glu Arg Met Ala Val Glu Leu Asp Pro Trp Asp
660 665 670
Ala Lys Trp Thr Lys Met Phe Gly Gln Ala Lys Gly Arg Val Gly Arg
675 680 685
Arg Ser
690
<210> 5
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 5
atgctggcct ccaccttctc ctaccgcatg tacaagaccg cgctcatcct ggccgccctt 60
ctgggctctg gccaggctca gcaggtcggt acttcccagg cggaagtgca tccgtccatg 120
acctggcaga gctgcacggc tggcggcagc tgcaccacca acaacggcaa ggtggtcatc 180
gacgcgaact ggcgttgggt gcacaaagtc ggcgactaca ccaactgcta caccggcaac 240
acctgggaca cgactatctg ccctgacgat gcgacctgcg catccaactg cgcccttgag 300
ggtgccaact acgaatccac ctatggtgtg accgccagcg gcaattccct ccgcctcaac 360
ttcgtcacca ccagccagca gaagaacatt ggctcgcgtc tgtacatgat gaaggacgac 420
tcgacctacg agatgtttaa gctgctgaac caggagttca ccttcgatgt cgatgtctcc 480
aacctcccct gcggtctcaa cggtgctctg tactttgtcg ccatggacgc cgacggtggc 540
atgtccaagt acccaaccaa caaggccggt gccaagtacg gtactggata ctgtgactcg 600
cagtgccctc gcgacctcaa gttcatcaac ggtcaggcca acgtcgaagg gtggcagccc 660
tcctccaacg atgccaatgc gggtaccggc aaccacgggt cctgctgcgc ggagatggat 720
atctgggagg ccaacagcat ctccacggcc ttcacccccc atccgtgcga cacgcccggc 780
caggtgatgt gcaccggtga tgcctgcggt ggcacctaca gctccgaccg ctacggcggc 840
acctgcgacc ccgacggatg tgatttcaac tccttccgcc agggcaacaa gaccttctac 900
ggccctggca tgaccgtcga caccaagagc aagtttaccg tcgtcaccca gttcatcacc 960
gacgacggca cctccagcgg caccctcaag gagatcaagc gcttctacgt gcagaacggc 1020
aaggtgatcc ccaactcgga gtcgacctgg accggcgtca gcggcaactc catcaccacc 1080
gagtactgca ccgcccagaa gagcctgttc caggaccaga acgtcttcga aaagcacggc 1140
ggcctcgagg gcatgggtgc tgccctcgcc cagggtatgg ttctcgtcat gtccctgtgg 1200
gatgatcact cggccaacat gctctggctc gacagcaact acccgaccac tgcctcttcc 1260
accactcccg gcgtcgcccg tggtacctgc gacatctcct ccggcgtccc tgcggatgtc 1320
gaggcgaacc accccgacgc ctacgtcgtc tactccaaca tcaaggtcgg ccccatcggc 1380
tcgaccttca acagcggtgg ctcgaacccc ggtggcggaa ccaccacgac aactaccacc 1440
cagcctacta ccaccacgac cacggctgga aaccctggcg gcaccggagt cgcacagcac 1500
tatggccagt gtggtggaat cggatggacc ggacccacaa cctgtgccag cccttatacc 1560
tgccagaagc tgaatgatta ttactctcag tgcctgtag 1599
<210> 6
<211> 532
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 6
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 7
<211> 1713
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 7
atgaagcacc ttgcatcttc catcgcattg actctactgt tgcctgccgt gcaggcccag 60
cagaccgtat ggggccaatg tatgttctgg ctgtcactgg aataagactg tatcaactgc 120
tgatatgctt ctaggtggcg gccaaggctg gtctggcccg acgagctgtg ttgccggcgc 180
agcctgtagc acactgaatc cctgtatgtt agatatcgtc ctgagtggag acttatactg 240
acttccttag actacgctca gtgtatcccg ggagccaccg cgacgtccac caccctcacg 300
acgacgacgg cggcgacgac gacatcccag accaccacca aacctaccac gactggtcca 360
actacatccg cacccaccgt gaccgcatcc ggtaaccctt tcagcggcta ccagctgtat 420
gccaacccct actactcctc cgaggtccat actctggcca tgccttctct gcccagctcg 480
ctgcagccca aggctagtgc tgttgctgaa gtgccctcat ttgtttggct gtaagtggcc 540
ttatcccaat actgagacca actctctgac agtcgtagcg acgttgccgc caaggtgccc 600
actatgggaa cctacctggc cgacattcag gccaagaaca aggccggcgc caaccctcct 660
atcgctggta tcttcgtggt ctacgacttg ccggaccgtg actgcgccgc tctggccagt 720
aatggcgagt actcaattgc caacaacggt gtggccaact acaaggcgta cattgacgcc 780
atccgtgctc agctggtgaa gtactctgac gttcacacca tcctcgtcat cggtaggccg 840
tacacctccg ttgcgcgccg cctttctctg acatcttgca gaacccgaca gcttggccaa 900
cctggtgacc aacctcaacg tcgccaaatg cgccaatgcg cagagcgcct acctggagtg 960
tgtcgactat gctctgaagc agctcaacct gcccaacgtc gccatgtacc tcgacgcagg 1020
tatgcctcac ttcccgcatt ctgtatccct tccagacact aactcatcag gccatgcggg 1080
ctggctcgga tggcccgcca acttgggccc cgccgcaaca ctcttcgcca aagtctacac 1140
cgacgcgggt tcccccgcgg ctgttcgtgg cctggccacc aacgtcgcca actacaacgc 1200
ctggtcgctc agtacctgcc cctcctacac ccagggagac cccaactgcg acgagaagaa 1260
gtacatcaac gccatggcgc ctcttctcaa ggaagccggc ttcgatgccc acttcatcat 1320
ggatacctgt aagtgcttat tccaatcgcc gatgtgtgcc gactaatcaa tgtttcagcc 1380
cggaatggcg tccagcccac gaagcaaaac gcctggggtg actggtgcaa cgtcatcggc 1440
accggcttcg gtgttcgccc ctcgactaac accggcgatc cgctccagga tgcctttgtg 1500
tggatcaagc ccggtggaga gagtgatggc acgtccaact cgacttcccc ccggtatgac 1560
gcgcactgcg gatatagtga tgctctgcag cctgctcctg aggctggtac ttggttccag 1620
gtatgtcatc cattagccag atgagggata agtgactgac ggacctaggc ctactttgag 1680
cagcttctga ccaacgctaa cccgtccttt taa 1713
<210> 8
<211> 454
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 8
Met Lys His Leu Ala Ser Ser Ile Ala Leu Thr Leu Leu Leu Pro Ala
1 5 10 15
Val Gln Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Gln Gly Trp
20 25 30
Ser Gly Pro Thr Ser Cys Val Ala Gly Ala Ala Cys Ser Thr Leu Asn
35 40 45
Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Ala Thr Ser Thr Thr
50 55 60
Leu Thr Thr Thr Thr Ala Ala Thr Thr Thr Ser Gln Thr Thr Thr Lys
65 70 75 80
Pro Thr Thr Thr Gly Pro Thr Thr Ser Ala Pro Thr Val Thr Ala Ser
85 90 95
Gly Asn Pro Phe Ser Gly Tyr Gln Leu Tyr Ala Asn Pro Tyr Tyr Ser
100 105 110
Ser Glu Val His Thr Leu Ala Met Pro Ser Leu Pro Ser Ser Leu Gln
115 120 125
Pro Lys Ala Ser Ala Val Ala Glu Val Pro Ser Phe Val Trp Leu Asp
130 135 140
Val Ala Ala Lys Val Pro Thr Met Gly Thr Tyr Leu Ala Asp Ile Gln
145 150 155 160
Ala Lys Asn Lys Ala Gly Ala Asn Pro Pro Ile Ala Gly Ile Phe Val
165 170 175
Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly
180 185 190
Glu Tyr Ser Ile Ala Asn Asn Gly Val Ala Asn Tyr Lys Ala Tyr Ile
195 200 205
Asp Ala Ile Arg Ala Gln Leu Val Lys Tyr Ser Asp Val His Thr Ile
210 215 220
Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Asn
225 230 235 240
Val Ala Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Val Asp
245 250 255
Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp
260 265 270
Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Gly Pro Ala
275 280 285
Ala Thr Leu Phe Ala Lys Val Tyr Thr Asp Ala Gly Ser Pro Ala Ala
290 295 300
Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Leu
305 310 315 320
Ser Thr Cys Pro Ser Tyr Thr Gln Gly Asp Pro Asn Cys Asp Glu Lys
325 330 335
Lys Tyr Ile Asn Ala Met Ala Pro Leu Leu Lys Glu Ala Gly Phe Asp
340 345 350
Ala His Phe Ile Met Asp Thr Ser Arg Asn Gly Val Gln Pro Thr Lys
355 360 365
Gln Asn Ala Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
370 375 380
Val Arg Pro Ser Thr Asn Thr Gly Asp Pro Leu Gln Asp Ala Phe Val
385 390 395 400
Trp Ile Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asn Ser Thr Ser
405 410 415
Pro Arg Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu Gln Pro Ala
420 425 430
Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr
435 440 445
Asn Ala Asn Pro Ser Phe
450
<210> 9
<211> 3060
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 9
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210> 10
<211> 863
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 10
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210> 11
<211> 835
<212> DNA
<213> 青霉属菌种(Penicillium sp.)
<400> 11
atgctgtctt cgacgactcg caccctcgcc tttacaggcc ttgcgggcct tctgtccgct 60
cccctggtca aggcccatgg ctttgtccag ggcattgtca tcggtgacca attgtaagtc 120
cctctcttgc agttctgtcg attaactgct ggactgcttg cttgactccc tgctgactcc 180
caacagctac agcgggtaca tcgtcaactc gttcccctac gaatccaacc caccccccgt 240
catcggctgg gccacgaccg ccaccgacct gggcttcgtc gacggcacag gataccaagg 300
cccggacatc atctgccacc ggaatgcgac gcccgcgccg ctgacagccc ccgtggccgc 360
cggcggcacc gtcgagctgc agtggacgcc gtggccggac agccaccacg gacccgtcat 420
cacctacctg gcgccgtgca acggcaactg ctcgaccgtc gacaagacga cgctggagtt 480
cttcaagatc gaccagcagg gcctgatcga cgacacgagc ccgccgggca cctgggcgtc 540
ggacaacctc atcgccaaca acaatagctg gaccgtcacc attcccaaca gcgtcgcccc 600
cggcaactac gtcctgcgcc acgagatcat cgccctgcac tcggccaaca acaaggacgg 660
cgcccagaac tacccccagt gcatcaacat cgaggtcacg ggcggcggct ccgacgcgcc 720
tgagggtact ctgggcgagg atctctacca tgacaccgac ccgggcattc tggtcgacat 780
ttacgagccc attgcgacgt ataccattcc ggggccgcct gagccgacgt tctag 835
<210> 12
<211> 253
<212> PRT
<213> 青霉属菌种(Penicillium sp.)
<220>
<221> 信号
<222> (1)..(25)
<220>
<221> 信号
<222> (26)..(253)
<400> 12
Met Leu Ser Ser Thr Thr Arg Thr Leu Ala Phe Thr Gly Leu Ala Gly
1 5 10 15
Leu Leu Ser Ala Pro Leu Val Lys Ala His Gly Phe Val Gln Gly Ile
20 25 30
Val Ile Gly Asp Gln Phe Tyr Ser Gly Tyr Ile Val Asn Ser Phe Pro
35 40 45
Tyr Glu Ser Asn Pro Pro Pro Val Ile Gly Trp Ala Thr Thr Ala Thr
50 55 60
Asp Leu Gly Phe Val Asp Gly Thr Gly Tyr Gln Gly Pro Asp Ile Ile
65 70 75 80
Cys His Arg Asn Ala Thr Pro Ala Pro Leu Thr Ala Pro Val Ala Ala
85 90 95
Gly Gly Thr Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His
100 105 110
Gly Pro Val Ile Thr Tyr Leu Ala Pro Cys Asn Gly Asn Cys Ser Thr
115 120 125
Val Asp Lys Thr Thr Leu Glu Phe Phe Lys Ile Asp Gln Gln Gly Leu
130 135 140
Ile Asp Asp Thr Ser Pro Pro Gly Thr Trp Ala Ser Asp Asn Leu Ile
145 150 155 160
Ala Asn Asn Asn Ser Trp Thr Val Thr Ile Pro Asn Ser Val Ala Pro
165 170 175
Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Asn
180 185 190
Asn Lys Asp Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Ile Glu Val
195 200 205
Thr Gly Gly Gly Ser Asp Ala Pro Glu Gly Thr Leu Gly Glu Asp Leu
210 215 220
Tyr His Asp Thr Asp Pro Gly Ile Leu Val Asp Ile Tyr Glu Pro Ile
225 230 235 240
Ala Thr Tyr Thr Ile Pro Gly Pro Pro Glu Pro Thr Phe
245 250
<210> 13
<211> 618
<212> PRT
<213> 埃默森踝节菌(Talaromyces emersonii)
<220>
<221> 信号
<222> (1)..(20)
<220>
<221> 成熟肽
<222> (21)..(618)
<400> 13
Met Ala Ser Leu Val Ala Gly Ala Leu Cys Ile Leu Gly Leu Thr Pro
-20 -15 -10 -5
Ala Ala Phe Ala Arg Ala Pro Val Ala Ala Arg Ala Thr Gly Ser Leu
-1 1 5 10
Asp Ser Phe Leu Ala Thr Glu Thr Pro Ile Ala Leu Gln Gly Val Leu
15 20 25
Asn Asn Ile Gly Pro Asn Gly Ala Asp Val Ala Gly Ala Ser Ala Gly
30 35 40
Ile Val Val Ala Ser Pro Ser Arg Ser Asp Pro Asn Tyr Phe Tyr Ser
45 50 55 60
Trp Thr Arg Asp Ala Ala Leu Thr Ala Lys Tyr Leu Val Asp Ala Phe
65 70 75
Ile Ala Gly Asn Lys Asp Leu Glu Gln Thr Ile Gln Gln Tyr Ile Ser
80 85 90
Ala Gln Ala Lys Val Gln Thr Ile Ser Asn Pro Ser Gly Asp Leu Ser
95 100 105
Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asn Glu Thr Ala Phe
110 115 120
Thr Gly Pro Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg Ala
125 130 135 140
Thr Ala Leu Ile Ala Tyr Ala Asn Tyr Leu Ile Asp Asn Gly Glu Ala
145 150 155
Ser Thr Ala Asp Glu Ile Ile Trp Pro Ile Val Gln Asn Asp Leu Ser
160 165 170
Tyr Ile Thr Gln Tyr Trp Asn Ser Ser Thr Phe Asp Leu Trp Glu Glu
175 180 185
Val Glu Gly Ser Ser Phe Phe Thr Thr Ala Val Gln His Arg Ala Leu
190 195 200
Val Glu Gly Asn Ala Leu Ala Thr Arg Leu Asn His Thr Cys Ser Asn
205 210 215 220
Cys Val Ser Gln Ala Pro Gln Val Leu Cys Phe Leu Gln Ser Tyr Trp
225 230 235
Thr Gly Ser Tyr Val Leu Ala Asn Phe Gly Gly Ser Gly Arg Ser Gly
240 245 250
Lys Asp Val Asn Ser Ile Leu Gly Ser Ile His Thr Phe Asp Pro Ala
255 260 265
Gly Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Ala Arg Ala Leu
270 275 280
Ala Asn His Lys Val Val Thr Asp Ser Phe Arg Ser Ile Tyr Ala Ile
285 290 295 300
Asn Ser Gly Ile Ala Glu Gly Ser Ala Val Ala Val Gly Arg Tyr Pro
305 310 315
Glu Asp Val Tyr Gln Gly Gly Asn Pro Trp Tyr Leu Ala Thr Ala Ala
320 325 330
Ala Ala Glu Gln Leu Tyr Asp Ala Ile Tyr Gln Trp Lys Lys Ile Gly
335 340 345
Ser Ile Ser Ile Thr Asp Val Ser Leu Pro Phe Phe Gln Asp Ile Tyr
350 355 360
Pro Ser Ala Ala Val Gly Thr Tyr Asn Ser Gly Ser Thr Thr Phe Asn
365 370 375 380
Asp Ile Ile Ser Ala Val Gln Thr Tyr Gly Asp Gly Tyr Leu Ser Ile
385 390 395
Val Glu Lys Tyr Thr Pro Ser Asp Gly Ser Leu Thr Glu Gln Phe Ser
400 405 410
Arg Thr Asp Gly Thr Pro Leu Ser Ala Ser Ala Leu Thr Trp Ser Tyr
415 420 425
Ala Ser Leu Leu Thr Ala Ser Ala Arg Arg Gln Ser Val Val Pro Ala
430 435 440
Ser Trp Gly Glu Ser Ser Ala Ser Ser Val Pro Ala Val Cys Ser Ala
445 450 455 460
Thr Ser Ala Thr Gly Pro Tyr Ser Thr Ala Thr Asn Thr Val Trp Pro
465 470 475
Ser Ser Gly Ser Gly Ser Ser Thr Thr Thr Ser Ser Ala Pro Cys Thr
480 485 490
Thr Pro Thr Ser Val Ala Val Thr Phe Asp Glu Ile Val Ser Thr Ser
495 500 505
Tyr Gly Glu Thr Ile Tyr Leu Ala Gly Ser Ile Pro Glu Leu Gly Asn
510 515 520
Trp Ser Thr Ala Ser Ala Ile Pro Leu Arg Ala Asp Ala Tyr Thr Asn
525 530 535 540
Ser Asn Pro Leu Trp Tyr Val Thr Val Asn Leu Pro Pro Gly Thr Ser
545 550 555
Phe Glu Tyr Lys Phe Phe Lys Asn Gln Thr Asp Gly Thr Ile Val Trp
560 565 570
Glu Asp Asp Pro Asn Arg Ser Tyr Thr Val Pro Ala Tyr Cys Gly Gln
575 580 585
Thr Thr Ala Ile Leu Asp Asp Ser Trp Gln
590 595
<210> 14
<211> 574
<212> PRT
<213> 瓣环栓菌(Trametes cingulata)
<220>
<221> 信号
<222> (1)..(18)
<220>
<221> 成熟肽
<222> (19)..(574)
<400> 14
Met Arg Phe Thr Leu Leu Thr Ser Leu Leu Gly Leu Ala Leu Gly Ala
-15 -10 -5
Phe Ala Gln Ser Ser Ala Ala Asp Ala Tyr Val Ala Ser Glu Ser Pro
-1 1 5 10
Ile Ala Lys Ala Gly Val Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys
15 20 25 30
Ser Asn Gly Ala Lys Ala Gly Ile Val Ile Ala Ser Pro Ser Thr Ser
35 40 45
Asn Pro Asn Tyr Leu Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe
50 55 60
Lys Ala Leu Ile Asp Gln Phe Thr Thr Gly Glu Asp Thr Ser Leu Arg
65 70 75
Thr Leu Ile Asp Glu Phe Thr Ser Ala Glu Ala Ile Leu Gln Gln Val
80 85 90
Pro Asn Pro Ser Gly Thr Val Ser Thr Gly Gly Leu Gly Glu Pro Lys
95 100 105 110
Phe Asn Ile Asp Glu Thr Ala Phe Thr Asp Ala Trp Gly Arg Pro Gln
115 120 125
Arg Asp Gly Pro Ala Leu Arg Ala Thr Ala Ile Ile Thr Tyr Ala Asn
130 135 140
Trp Leu Leu Asp Asn Lys Asn Thr Thr Tyr Val Thr Asn Thr Leu Trp
145 150 155
Pro Ile Ile Lys Leu Asp Leu Asp Tyr Val Ala Ser Asn Trp Asn Gln
160 165 170
Ser Thr Phe Asp Leu Trp Glu Glu Ile Asn Ser Ser Ser Phe Phe Thr
175 180 185 190
Thr Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Thr Phe Ala Asn
195 200 205
Arg Ile Gly Gln Thr Ser Val Val Ser Gly Tyr Thr Thr Gln Ala Asn
210 215 220
Asn Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Gly Gly Tyr
225 230 235
Ile Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr
240 245 250
Val Leu Thr Ser Ile His Thr Phe Asp Pro Ala Ala Gly Cys Asp Ala
255 260 265 270
Val Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val
275 280 285
Tyr Val Asp Ala Phe Arg Ser Ile Tyr Ser Ile Asn Ser Gly Ile Ala
290 295 300
Ser Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Met
305 310 315
Gly Gly Asn Pro Trp Tyr Leu Thr Thr Ser Ala Val Ala Glu Gln Leu
320 325 330
Tyr Asp Ala Leu Ile Val Trp Asn Lys Leu Gly Ala Leu Asn Val Thr
335 340 345 350
Ser Thr Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Val
355 360 365
Gly Thr Tyr Ala Ser Ser Ser Ser Thr Phe Lys Thr Leu Thr Ser Ala
370 375 380
Ile Lys Thr Phe Ala Asp Gly Phe Leu Ala Val Asn Ala Lys Tyr Thr
385 390 395
Pro Ser Asn Gly Gly Leu Ala Glu Gln Tyr Ser Arg Ser Asn Gly Ser
400 405 410
Pro Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ala Ala Leu Thr
415 420 425 430
Ser Phe Ala Ala Arg Ser Gly Lys Thr Tyr Ala Ser Trp Gly Ala Ala
435 440 445
Gly Leu Thr Val Pro Thr Thr Cys Ser Gly Ser Gly Gly Ala Gly Thr
450 455 460
Val Ala Val Thr Phe Asn Val Gln Ala Thr Thr Val Phe Gly Glu Asn
465 470 475
Ile Tyr Ile Thr Gly Ser Val Pro Ala Leu Gln Asn Trp Ser Pro Asp
480 485 490
Asn Ala Leu Ile Leu Ser Ala Ala Asn Tyr Pro Thr Trp Ser Ile Thr
495 500 505 510
Val Asn Leu Pro Ala Ser Thr Thr Ile Glu Tyr Lys Tyr Ile Arg Lys
515 520 525
Phe Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr
530 535 540
Thr Pro Ala Ser Gly Thr Phe Thr Gln Asn Asp Thr Trp Arg
545 550 555
<210> 15
<211> 583
<212> PRT
<213> 微小根毛霉(Rhizomucor pusillus)
<220>
<221> 尚未归类的特征
<223> 具有黑曲霉(Aspergillus niger)葡糖淀粉酶接头和SBD的微小根毛霉(Rhizomucor pusillus) α-淀粉酶
<400> 15
Ala Thr Ser Asp Asp Trp Lys Gly Lys Ala Ile Tyr Gln Leu Leu Thr
1 5 10 15
Asp Arg Phe Gly Arg Ala Asp Asp Ser Thr Ser Asn Cys Ser Asn Leu
20 25 30
Ser Asn Tyr Cys Gly Gly Thr Tyr Glu Gly Ile Thr Lys His Leu Asp
35 40 45
Tyr Ile Ser Gly Met Gly Phe Asp Ala Ile Trp Ile Ser Pro Ile Pro
50 55 60
Lys Asn Ser Asp Gly Gly Tyr His Gly Tyr Trp Ala Thr Asp Phe Tyr
65 70 75 80
Gln Leu Asn Ser Asn Phe Gly Asp Glu Ser Gln Leu Lys Ala Leu Ile
85 90 95
Gln Ala Ala His Glu Arg Asp Met Tyr Val Met Leu Asp Val Val Ala
100 105 110
Asn His Ala Gly Pro Thr Ser Asn Gly Tyr Ser Gly Tyr Thr Phe Gly
115 120 125
Asp Ala Ser Leu Tyr His Pro Lys Cys Thr Ile Asp Tyr Asn Asp Gln
130 135 140
Thr Ser Ile Glu Gln Cys Trp Val Ala Asp Glu Leu Pro Asp Ile Asp
145 150 155 160
Thr Glu Asn Ser Asp Asn Val Ala Ile Leu Asn Asp Ile Val Ser Gly
165 170 175
Trp Val Gly Asn Tyr Ser Phe Asp Gly Ile Arg Ile Asp Thr Val Lys
180 185 190
His Ile Arg Lys Asp Phe Trp Thr Gly Tyr Ala Glu Ala Ala Gly Val
195 200 205
Phe Ala Thr Gly Glu Val Phe Asn Gly Asp Pro Ala Tyr Val Gly Pro
210 215 220
Tyr Gln Lys Tyr Leu Pro Ser Leu Ile Asn Tyr Pro Met Tyr Tyr Ala
225 230 235 240
Leu Asn Asp Val Phe Val Ser Lys Ser Lys Gly Phe Ser Arg Ile Ser
245 250 255
Glu Met Leu Gly Ser Asn Arg Asn Ala Phe Glu Asp Thr Ser Val Leu
260 265 270
Thr Thr Phe Val Asp Asn His Asp Asn Pro Arg Phe Leu Asn Ser Gln
275 280 285
Ser Asp Lys Ala Leu Phe Lys Asn Ala Leu Thr Tyr Val Leu Leu Gly
290 295 300
Glu Gly Ile Pro Ile Val Tyr Tyr Gly Ser Glu Gln Gly Phe Ser Gly
305 310 315 320
Gly Ala Asp Pro Ala Asn Arg Glu Val Leu Trp Thr Thr Asn Tyr Asp
325 330 335
Thr Ser Ser Asp Leu Tyr Gln Phe Ile Lys Thr Val Asn Ser Val Arg
340 345 350
Met Lys Ser Asn Lys Ala Val Tyr Met Asp Ile Tyr Val Gly Asp Asn
355 360 365
Ala Tyr Ala Phe Lys His Gly Asp Ala Leu Val Val Leu Asn Asn Tyr
370 375 380
Gly Ser Gly Ser Thr Asn Gln Val Ser Phe Ser Val Ser Gly Lys Phe
385 390 395 400
Asp Ser Gly Ala Ser Leu Met Asp Ile Val Ser Asn Ile Thr Thr Thr
405 410 415
Val Ser Ser Asp Gly Thr Val Thr Phe Asn Leu Lys Asp Gly Leu Pro
420 425 430
Ala Ile Phe Thr Ser Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Pro
435 440 445
Thr Gly Ser Gly Ser Val Thr Ser Thr Ser Lys Thr Thr Ala Thr Ala
450 455 460
Ser Lys Thr Ser Thr Ser Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr
465 470 475 480
Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu
485 490 495
Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr
500 505 510
Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asp Pro
515 520 525
Leu Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr
530 535 540
Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp
545 550 555 560
Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Thr Ser Thr Ala
565 570 575
Thr Val Thr Asp Thr Trp Arg
580
<210> 16
<211> 661
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<220>
<221> 成熟肽
<222> (1)..(661)
<400> 16
Leu Tyr Ile Asn Gly Ser Val Ile Ala Pro Cys Asp Ser Pro Ile Tyr
1 5 10 15
Cys His Gly Asp Ile Leu Arg Glu Ile Glu Leu Ala His Pro Phe Ser
20 25 30
Asp Ser Lys Thr Phe Val Asp Met Pro Ala Lys Arg Pro Leu Ser Glu
35 40 45
Ile Gln Thr Ala Phe Ala Asn Leu Pro Lys Pro Leu Arg Asn Asp Ser
50 55 60
Ser Leu Gln Thr Phe Leu Ala Ser Tyr Phe Ala Asp Ala Gly Gly Glu
65 70 75 80
Leu Ile Gln Val Pro Arg Ala Asn Leu Thr Thr Asn Pro Thr Phe Leu
85 90 95
Ser Lys Ile Asn Asp Thr Val Ile Glu Gln Phe Val Thr Gln Val Ile
100 105 110
Asp Ile Trp Pro Asp Leu Thr Arg Arg Tyr Ala Gly Asp Ala Ala Val
115 120 125
Lys Asn Cys Ser Ser Cys Pro Asn Ser Phe Ile Pro Val Asn Arg Thr
130 135 140
Phe Val Val Ala Gly Gly Arg Phe Arg Glu Pro Tyr Tyr Trp Asp Ser
145 150 155 160
Tyr Trp Ile Val Glu Gly Leu Leu Arg Thr Gly Gly Ala Phe Val Gly
165 170 175
Ile Ala Arg Asn Thr Ile Asp Asn Phe Leu Asp Phe Ile Glu Arg Phe
180 185 190
Gly Phe Val Pro Asn Gly Ala Arg Leu Tyr Tyr Leu Asn Arg Ser Gln
195 200 205
Pro Pro Leu Leu Ser Arg Met Val Lys Val Tyr Ile Asp His Thr Asn
210 215 220
Asp Thr Ala Ile Leu Arg Arg Ala Leu Pro Leu Leu Val Lys Glu His
225 230 235 240
Glu Phe Trp Thr Arg Asn Arg Thr Val Asp Val Arg Val Asn Asn Lys
245 250 255
Thr Tyr Val Leu Asn Gln Tyr Ala Val Gln Asn Thr Gln Pro Arg Pro
260 265 270
Glu Ser Phe Arg Glu Asp Phe Gln Thr Ala Asn Asn Arg Ser Tyr Tyr
275 280 285
Ala Ala Ser Gly Ile Ile Tyr Pro Ala Thr Lys Pro Leu Asn Glu Ser
290 295 300
Gln Ile Glu Glu Leu Tyr Ala Asn Leu Ala Ser Gly Ala Glu Ser Gly
305 310 315 320
Asn Asp Tyr Thr Ala Arg Trp Leu Ala Asp Pro Ser Asp Ala Met Arg
325 330 335
Asp Val Tyr Phe Pro Leu Arg Ser Leu Asn Asn Lys Asp Ile Val Pro
340 345 350
Val Asp Leu Asn Ser Ile Leu Tyr Gly Asn Glu Leu Ala Ile Ala Gln
355 360 365
Phe Tyr Asn Gln Thr Gly Asn Thr Thr Ala Ala Arg Glu Trp Ser Ser
370 375 380
Leu Ala Ala Asn Arg Ser Ala Ser Ile Gln Ala Val Phe Trp Asn Glu
385 390 395 400
Thr Leu Phe Ser Tyr Phe Asp Tyr Asn Leu Thr Ser Ser Ser Gln Asn
405 410 415
Ile Tyr Val Pro Leu Asp Lys Asp Ala Val Ala Leu Asp Arg Gln Thr
420 425 430
Ala Pro Pro Gly Lys Gln Val Leu Phe His Val Gly Gln Phe Tyr Pro
435 440 445
Phe Trp Thr Gly Ala Ala Pro Glu Tyr Leu Arg Asn Asn Pro Phe Ala
450 455 460
Val Thr Arg Ile Phe Asp Arg Val Lys Ser Tyr Leu Asp Thr Arg Pro
465 470 475 480
Gly Gly Ile Pro Ala Ser Asn Val Asn Thr Gly Gln Gln Trp Asp Gln
485 490 495
Pro Asn Val Trp Pro Pro His Met His Ile Leu Met Glu Ser Leu Asn
500 505 510
Ser Val Pro Ala Thr Phe Ser Glu Ala Asp Pro Ala Tyr Gln Asp Val
515 520 525
Arg Asn Leu Ser Leu Arg Leu Gly Gln Arg Tyr Leu Asp Phe Thr Phe
530 535 540
Cys Thr Trp Arg Ala Thr Gly Gly Ser Thr Ser Glu Thr Pro Lys Leu
545 550 555 560
Gln Gly Leu Thr Asp Gln Asp Val Gly Ile Met Phe Glu Lys Tyr Asn
565 570 575
Asp Asn Ser Thr Asn Ala Ala Gly Gly Gly Gly Glu Tyr Gln Val Val
580 585 590
Glu Gly Phe Gly Trp Thr Asn Gly Val Leu Leu Trp Thr Ala Asp Thr
595 600 605
Phe Gly Ser Gln Leu Lys Arg Pro Gln Cys Gly Asn Ile Met Ala Gly
610 615 620
His Pro Ala Pro Ser Lys Arg Ser Ala Val Gln Leu Asp Met Trp Asp
625 630 635 640
Ala Ser Arg Val Lys Lys Phe Gly Arg Arg Ala Glu Gly Arg Met Gly
645 650 655
Thr Leu His Ala Trp
660
<210> 17
<211> 177
<212> PRT
<213> 桔橙嗜热子囊菌(Thermoascus aurantiacus)
<400> 17
Thr Arg Ile Ser Ser Cys Ser Gly Ser Arg Gln Ser Ala Leu Thr Thr
1 5 10 15
Ala Leu Arg Asn Ala Ala Ser Leu Ala Asn Ala Ala Ala Asp Ala Ala
20 25 30
Gln Ser Gly Ser Ala Ser Lys Phe Ser Glu Tyr Phe Lys Thr Thr Ser
35 40 45
Ser Ser Thr Arg Gln Thr Val Ala Ala Arg Leu Arg Ala Val Ala Arg
50 55 60
Glu Ala Ser Ser Ser Ser Ser Gly Ala Thr Thr Tyr Tyr Cys Asp Asp
65 70 75 80
Pro Tyr Gly Tyr Cys Ser Ser Asn Val Leu Ala Tyr Thr Leu Pro Ser
85 90 95
Tyr Asn Ile Ile Ala Asn Cys Asp Ile Phe Tyr Thr Tyr Leu Pro Ala
100 105 110
Leu Thr Ser Thr Cys His Ala Gln Asp Gln Ala Thr Thr Ala Leu His
115 120 125
Glu Phe Thr His Ala Pro Gly Val Tyr Ser Pro Gly Thr Asp Asp Leu
130 135 140
Ala Tyr Gly Tyr Gln Ala Ala Met Gly Leu Ser Ser Ser Gln Ala Val
145 150 155 160
Met Asn Ala Asp Thr Tyr Ala Leu Tyr Ala Asn Ala Ile Tyr Leu Gly
165 170 175
Cys
<210> 18
<211> 515
<212> PRT
<213> 嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)
<400> 18
Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu
1 5 10 15
Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn
20 25 30
Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys
35 40 45
Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp
50 55 60
Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr
65 70 75 80
Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met
85 90 95
Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly
100 105 110
Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln
115 120 125
Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe
130 135 140
Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His
145 150 155 160
Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr
165 170 175
Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu
180 185 190
Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His
195 200 205
Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Val Asn
210 215 220
Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys
225 230 235 240
Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Val Arg Ser Gln Thr Gly
245 250 255
Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys
260 265 270
Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp
275 280 285
Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala
290 295 300
Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro
305 310 315 320
Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln
325 330 335
Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala
340 345 350
Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp
355 360 365
Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile
370 375 380
Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His
385 390 395 400
Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val
405 410 415
Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val
435 440 445
Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser
450 455 460
Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp
465 470 475 480
Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Arg Pro Ile Thr Thr
485 490 495
Arg Pro Trp Thr Gly Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val
500 505 510
Ala Trp Pro
515
<210> 19
<211> 573
<212> PRT
<213> 篱边粘褶菌(Gloeophyllum sepiarium)
<400> 19
Met Tyr Arg Phe Leu Val Cys Ala Leu Gly Leu Ala Ala Ser Val Leu
1 5 10 15
Ala Gln Ser Val Asp Ser Tyr Val Ser Ser Glu Gly Pro Ile Ala Lys
20 25 30
Ala Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly
35 40 45
Ala Ser Ala Gly Val Val Val Ala Ser Pro Ser Thr Ser Asp Pro Asp
50 55 60
Tyr Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu
65 70 75 80
Ile Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Thr
85 90 95
Leu Ile Asp Asp Phe Val Thr Ala Glu Ala Asn Leu Gln Gln Val Ser
100 105 110
Asn Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe
115 120 125
Asn Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg
130 135 140
Asp Gly Pro Ala Leu Arg Ser Thr Ala Leu Ile Thr Tyr Gly Asn Trp
145 150 155 160
Leu Leu Ser Asn Gly Asn Thr Ser Tyr Val Thr Ser Asn Leu Trp Pro
165 170 175
Ile Ile Gln Asn Asp Leu Gly Tyr Val Val Ser Tyr Trp Asn Gln Ser
180 185 190
Thr Tyr Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr
195 200 205
Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Ala
210 215 220
Ile Gly Gln Thr Ser Gln Val Ser Ser Tyr Thr Thr Gln Ala Asp Asn
225 230 235 240
Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Ile
245 250 255
Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu
260 265 270
Leu Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Ala
275 280 285
Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr
290 295 300
Val Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Val Ala Ser
305 310 315 320
Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly
325 330 335
Gly Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr
340 345 350
Asp Ala Leu Asn Val Trp Glu Ser Gln Gly Ser Leu Glu Val Thr Ser
355 360 365
Thr Ser Leu Ala Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Ala Gly
370 375 380
Thr Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Thr Leu Thr Ser Ala Ile
385 390 395 400
Lys Asn Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Lys Tyr Thr Pro
405 410 415
Ser Asn Gly Gly Leu Ala Glu Gln Tyr Ser Lys Ser Asp Gly Ser Pro
420 425 430
Leu Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala
435 440 445
Phe Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Ala Gly
450 455 460
Leu Thr Val Pro Ser Ser Cys Ser Gly Asn Ser Gly Gly Pro Thr Val
465 470 475 480
Ala Val Thr Phe Asn Val Asn Ala Glu Thr Val Trp Gly Glu Asn Ile
485 490 495
Tyr Leu Thr Gly Ser Val Asp Ala Leu Glu Asn Trp Ser Ala Asp Asn
500 505 510
Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val
515 520 525
Asn Leu Pro Ala Ser Thr Ala Ile Glu Tyr Lys Tyr Ile Arg Lys Asn
530 535 540
Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr
545 550 555 560
Pro Ala Ser Gly Ser Thr Thr Glu Asn Asp Thr Trp Arg
565 570
<210> 20
<211> 559
<212> PRT
<213> 密粘褶菌(Gloephyllum trabeum)
<400> 20
Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys Ala
1 5 10 15
Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly Ala
20 25 30
Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp Tyr
35 40 45
Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu Ile
50 55 60
Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser Leu
65 70 75 80
Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser Asn
85 90 95
Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp Leu
130 135 140
Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro Ile
145 150 155 160
Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr Thr
165 170 175
Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys Ile
195 200 205
Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu
245 250 255
Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser Ile
340 345 350
Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly Thr
355 360 365
Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile Lys
370 375 380
Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro Ser
385 390 395 400
Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro Val
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala Phe
420 425 430
Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly Leu
435 440 445
Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly Ser
450 455 460
Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly Glu
465 470 475 480
Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser Pro
485 490 495
Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile
500 505 510
Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile Arg
515 520 525
Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile
530 535 540
Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg
545 550 555
<210> 21
<211> 250
<212> PRT
<213> 桔橙嗜热子囊菌(Thermoascus aurantiacus)
<400> 21
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser
35 40 45
Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg
65 70 75 80
Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr
85 90 95
Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
100 105 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
115 120 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp
130 135 140
Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly
195 200 205
Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp
210 215 220
Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr
225 230 235 240
Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly
245 250
<210> 22
<211> 413
<212> PRT
<213> 激烈火球菌(Pyrococcus furiosus)
<400> 22
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr
1 5 10 15
Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile
20 25 30
Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val
35 40 45
Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp Asp
50 55 60
His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr Gly Ala
65 70 75 80
Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala Lys Leu Ala
85 90 95
Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Ile Ser Thr Ile
100 105 110
Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys Asp Lys Tyr Gly Ile
115 120 125
Lys Val Ile Asn Leu Ser Leu Gly Ser Ser Gln Ser Ser Asp Gly Thr
130 135 140
Asp Ala Leu Ser Gln Ala Val Asn Ala Ala Trp Asp Ala Gly Leu Val
145 150 155 160
Val Val Val Ala Ala Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly
165 170 175
Ser Pro Ala Ala Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys
180 185 190
Tyr Asp Val Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly
195 200 205
Arg Leu Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala
210 215 220
Arg Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
225 230 235 240
Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala
245 250 255
Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys
260 265 270
Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala
275 280 285
Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile Asn
290 295 300
Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala Asn Lys
305 310 315 320
Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser Phe Val Thr
325 330 335
Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu Asp Leu Tyr Leu
340 345 350
Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser Tyr Thr Ala Tyr Tyr
355 360 365
Asp Phe Glu Lys Val Gly Tyr Tyr Asn Pro Thr Asp Gly Thr Trp Thr
370 375 380
Ile Lys Val Val Ser Tyr Ser Gly Ser Ala Asn Tyr Gln Val Asp Val
385 390 395 400
Val Ser Asp Gly Ser Leu Ser Gln Pro Gly Ser Ser Pro
405 410
<210> 23
<211> 595
<212> PRT
<213> 草酸青霉(Penicillium oxalicum)
<400> 23
Arg Pro Asp Pro Lys Gly Gly Asn Leu Thr Pro Phe Ile His Lys Glu
1 5 10 15
Gly Glu Arg Ser Leu Gln Gly Ile Leu Asp Asn Leu Gly Gly Arg Gly
20 25 30
Lys Lys Thr Pro Gly Thr Ala Ala Gly Leu Phe Ile Ala Ser Pro Asn
35 40 45
Thr Glu Asn Pro Asn Tyr Tyr Tyr Thr Trp Thr Arg Asp Ser Ala Leu
50 55 60
Thr Ala Lys Cys Leu Ile Asp Leu Phe Glu Asp Ser Arg Ala Lys Phe
65 70 75 80
Pro Ile Asp Arg Lys Tyr Leu Glu Thr Gly Ile Arg Asp Tyr Lys Ser
85 90 95
Ser Gln Ala Ile Leu Gln Ser Val Ser Asn Pro Ser Gly Thr Leu Lys
100 105 110
Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Ile Asp Leu Asn Pro
115 120 125
Phe Ser Gly Ala Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg
130 135 140
Ala Thr Ala Met Ile Thr Tyr Ala Asn Tyr Leu Ile Ser His Gly Gln
145 150 155 160
Lys Ser Asp Val Ser Gln Val Met Trp Pro Ile Ile Ala Asn Asp Leu
165 170 175
Ala Tyr Val Gly Gln Tyr Trp Asn Asn Thr Gly Phe Asp Leu Trp Glu
180 185 190
Glu Val Asp Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His Arg Ala
195 200 205
Leu Val Glu Gly Ser Gln Leu Ala Lys Lys Leu Gly Lys Ser Cys Asp
210 215 220
Ala Cys Asp Ser Gln Pro Pro Gln Ile Leu Cys Phe Leu Gln Ser Phe
225 230 235 240
Trp Asn Gly Lys Tyr Ile Thr Ser Asn Ile Asn Thr Gln Ala Ser Arg
245 250 255
Ser Gly Ile Asp Leu Asp Ser Val Leu Gly Ser Ile His Thr Phe Asp
260 265 270
Pro Glu Ala Ala Cys Asp Asp Ala Thr Phe Gln Pro Cys Ser Ala Arg
275 280 285
Ala Leu Ala Asn His Lys Val Tyr Val Asp Ser Phe Arg Ser Ile Tyr
290 295 300
Lys Ile Asn Ala Gly Leu Ala Glu Gly Ser Ala Ala Asn Val Gly Arg
305 310 315 320
Tyr Pro Glu Asp Val Tyr Gln Gly Gly Asn Pro Trp Tyr Leu Ala Thr
325 330 335
Leu Gly Ala Ser Glu Leu Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Arg
340 345 350
Leu Gly Lys Leu Glu Val Ser Glu Thr Ser Leu Ser Phe Phe Lys Asp
355 360 365
Phe Asp Ala Thr Val Lys Ile Gly Ser Tyr Ser Arg Asn Ser Lys Thr
370 375 380
Tyr Lys Lys Leu Thr Gln Ser Ile Lys Ser Tyr Ala Asp Gly Phe Ile
385 390 395 400
Gln Leu Val Gln Gln Tyr Thr Pro Ser Asn Gly Ser Leu Ala Glu Gln
405 410 415
Tyr Asp Arg Asn Thr Ala Ala Pro Leu Ser Ala Asn Asp Leu Thr Trp
420 425 430
Ser Phe Ala Ser Phe Leu Thr Ala Thr Gln Arg Arg Asp Ala Val Val
435 440 445
Pro Pro Ser Trp Gly Ala Lys Ser Ala Asn Lys Val Pro Thr Thr Cys
450 455 460
Ser Ala Ser Pro Val Val Gly Thr Tyr Lys Ala Pro Thr Ala Thr Phe
465 470 475 480
Ser Ser Lys Thr Lys Cys Val Pro Ala Lys Asp Ile Val Pro Ile Thr
485 490 495
Phe Tyr Leu Ile Glu Asn Thr Tyr Tyr Gly Glu Asn Val Phe Met Ser
500 505 510
Gly Asn Ile Thr Ala Leu Gly Asn Trp Asp Ala Lys Lys Gly Phe Pro
515 520 525
Leu Thr Ala Asn Leu Tyr Thr Gln Asp Gln Asn Leu Trp Phe Ala Ser
530 535 540
Val Glu Phe Ile Pro Ala Gly Thr Pro Phe Glu Tyr Lys Tyr Tyr Lys
545 550 555 560
Val Glu Pro Asn Gly Asp Ile Thr Trp Glu Lys Gly Pro Asn Arg Val
565 570 575
Phe Val Ala Pro Thr Gly Cys Pro Val Gln Pro His Ser Asn Asp Val
580 585 590
Trp Gln Phe
595
<210> 24
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物KKSC0334-F
<400> 24
acacaactgg ggatccacca tgacgctccg acacctcgg 39
<210> 25
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物KKSC0334-R
<400> 25
ctagatctcg agaagctttc acgacctcct ccctaccc 38
<210> 26
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物KKSC0335-F
<400> 26
acacaactgg ggatccacca tggcgctacg acacatcgc 39
<210> 27
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物KKSC0335-R
<400> 27
ctagatctcg agaagctttt acgagacgga gacactaaac a 41
<210> 28
<211> 573
<212> PRT
<213> 血红密孔菌(Pycnoporus sanguineus)
<220>
<221> 信号
<222> (1)..(18)
<400> 28
Met Arg Phe Thr Leu Leu Ala Ser Leu Ile Gly Leu Ala Val Gly Ala
1 5 10 15
Phe Ala Gln Ser Ser Ala Val Asp Ala Tyr Val Ala Ser Glu Ser Pro
20 25 30
Ile Ala Lys Gln Gly Val Leu Asn Asn Ile Gly Pro Asn Gly Ser Lys
35 40 45
Ala His Gly Ala Lys Ala Gly Ile Val Val Ala Ser Pro Ser Thr Glu
50 55 60
Asn Pro Asp Tyr Leu Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe
65 70 75 80
Lys Leu Leu Ile Asp Gln Phe Thr Ser Gly Asp Asp Thr Ser Leu Arg
85 90 95
Gly Leu Ile Asp Asp Phe Thr Ser Ala Glu Ala Ile Leu Gln Gln Val
100 105 110
Ser Asn Pro Ser Gly Thr Val Ser Thr Gly Gly Leu Gly Glu Pro Lys
115 120 125
Phe Asn Ile Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln
130 135 140
Arg Asp Gly Pro Ala Leu Arg Ala Thr Ser Ile Ile Arg Tyr Ala Asn
145 150 155 160
Trp Leu Leu Asp Asn Gly Asn Thr Thr Tyr Val Ser Asn Thr Leu Trp
165 170 175
Pro Val Ile Gln Leu Asp Leu Asp Tyr Val Ala Asp Asn Trp Asn Gln
180 185 190
Ser Thr Phe Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr
195 200 205
Thr Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Thr Phe Ala Ser
210 215 220
Arg Ile Gly Gln Ser Ser Val Val Ser Gly Tyr Thr Thr Gln Ala Asp
225 230 235 240
Asn Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr
245 250 255
Val Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ser Asn Thr
260 265 270
Val Leu Thr Ser Ile His Thr Phe Asp Pro Ala Ala Gly Cys Asp Ala
275 280 285
Ala Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val
290 295 300
Tyr Val Asp Ala Phe Arg Ser Ile Tyr Thr Ile Asn Asn Gly Ile Ala
305 310 315 320
Ser Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Met
325 330 335
Gly Gly Asn Pro Trp Tyr Leu Thr Thr Ser Ala Val Ala Glu Gln Leu
340 345 350
Tyr Asp Ala Leu Tyr Val Trp Asp Gln Leu Gly Gly Leu Asn Val Thr
355 360 365
Ser Thr Ser Leu Ala Phe Phe Gln Gln Phe Ala Ser Gly Leu Ser Thr
370 375 380
Gly Thr Tyr Ser Ala Ser Ser Ser Thr Tyr Ala Thr Leu Thr Ser Ala
385 390 395 400
Ile Arg Ser Phe Ala Asp Gly Phe Leu Ala Ile Asn Ala Lys Tyr Thr
405 410 415
Pro Ala Asp Gly Gly Leu Ala Glu Gln Tyr Ser Arg Asn Asp Gly Thr
420 425 430
Pro Leu Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ala Ala Leu Thr
435 440 445
Ala Phe Ala Ala Arg Glu Gly Lys Thr Tyr Gly Ser Trp Gly Ala Ala
450 455 460
Gly Leu Thr Val Pro Ala Ser Cys Ser Gly Gly Gly Gly Ala Thr Val
465 470 475 480
Ala Val Thr Phe Asn Val Gln Ala Thr Thr Val Phe Gly Glu Asn Ile
485 490 495
Tyr Ile Thr Gly Ser Val Ala Ala Leu Gln Asn Trp Ser Pro Asp Asn
500 505 510
Ala Leu Ile Leu Ser Ala Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val
515 520 525
Asn Leu Pro Ala Asn Thr Val Val Gln Tyr Lys Tyr Ile Arg Lys Phe
530 535 540
Asn Gly Gln Val Thr Trp Glu Ser Asp Pro Asn Asn Gln Ile Thr Thr
545 550 555 560
Pro Ser Gly Gly Ser Phe Thr Gln Asn Asp Val Trp Arg
565 570
<210> 29
<211> 2829
<212> DNA
<213> 瘤孢毁丝霉(Myceliophthora sepedonium)
<220>
<221> 尚未归类的信号
<222> (40)..(100)
<220>
<221> CDS
<222> (101)..(279)
<220>
<221> 内含子
<222> (280)..(365)
<220>
<221> CDS
<222> (366)..(1025)
<220>
<221> 内含子
<222> (1026)..(1083)
<220>
<221> CDS
<222> (1084)..(2326)
<400> 29
tgccctcctc ggggccttcc tcgttctctc ccatccttcg ggtacaacag accatcatcg 60
taagcgcaag acagcaccac cgcgtgctga aagctacaca atg gcg cta cga cac 115
Met Ala Leu Arg His
1 5
atc gcg gcg gcg gcg atc gcc ggt ctt gcc tca agg act gca gcg ctg 163
Ile Ala Ala Ala Ala Ile Ala Gly Leu Ala Ser Arg Thr Ala Ala Leu
10 15 20
tac atc aat ggc tca gtc aca gcg ccg tgc gac tcg ccc att tac tgc 211
Tyr Ile Asn Gly Ser Val Thr Ala Pro Cys Asp Ser Pro Ile Tyr Cys
25 30 35
caa ggc gag ctt cta aaa gcg gtt gaa ctg gcg cgt cct ttc gtt gac 259
Gln Gly Glu Leu Leu Lys Ala Val Glu Leu Ala Arg Pro Phe Val Asp
40 45 50
agc aag aca ttt gtg gac at gtaagtcatg atcggccagc caggtgggaa 309
Ser Lys Thr Phe Val Asp Met
55 60
tgcagccggc gggcagattc gtggtgacac actgactgac ttggattccc gcccag g 366
ccc acg atc aag cca gtg gat gaa gtg ctt gca gca ttc agc aag ctt 414
Pro Thr Ile Lys Pro Val Asp Glu Val Leu Ala Ala Phe Ser Lys Leu
65 70 75
agc cta cca ctt tcc aat aac tca gag ctc aac gcc ttc ttg tat gag 462
Ser Leu Pro Leu Ser Asn Asn Ser Glu Leu Asn Ala Phe Leu Tyr Glu
80 85 90
aac ttc gcc cag gct ggc cac gag ctc gaa gaa gtg ccc gac agt gag 510
Asn Phe Ala Gln Ala Gly His Glu Leu Glu Glu Val Pro Asp Ser Glu
95 100 105
cta gag acg gac gca aag ttc ctc gac aag ctc gag gat cgc acc atc 558
Leu Glu Thr Asp Ala Lys Phe Leu Asp Lys Leu Glu Asp Arg Thr Ile
110 115 120
aag gag ttc gtc ggc aag gtg atc gac atc tgg ccc gac ttg acc agg 606
Lys Glu Phe Val Gly Lys Val Ile Asp Ile Trp Pro Asp Leu Thr Arg
125 130 135 140
cgc tat gcc ggc ccc agc aac tgc acc gag tgc gcc aac agc ttc att 654
Arg Tyr Ala Gly Pro Ser Asn Cys Thr Glu Cys Ala Asn Ser Phe Ile
145 150 155
ccc gtg aac cgc acg ttc gtc gtg gct ggc ggt cgc ttc cga gag ccc 702
Pro Val Asn Arg Thr Phe Val Val Ala Gly Gly Arg Phe Arg Glu Pro
160 165 170
tac tat tgg gat tcg tac tgg atc gtc gaa ggt ctc ctg cgc act ggc 750
Tyr Tyr Trp Asp Ser Tyr Trp Ile Val Glu Gly Leu Leu Arg Thr Gly
175 180 185
ggt gcc ttc acc cat atc tcc aag aac atc att gag aac ttc ctg gac 798
Gly Ala Phe Thr His Ile Ser Lys Asn Ile Ile Glu Asn Phe Leu Asp
190 195 200
ttt gtc gac acg att ggc ttc att ccc aat ggc gcc agg atc tac tac 846
Phe Val Asp Thr Ile Gly Phe Ile Pro Asn Gly Ala Arg Ile Tyr Tyr
205 210 215 220
ctg aac agg tca cag ccc cct ctc ctg aca ttg atg gtg aag agc tac 894
Leu Asn Arg Ser Gln Pro Pro Leu Leu Thr Leu Met Val Lys Ser Tyr
225 230 235
gtc gac tac acc aac gac acg agc atc ctg gac agg gcc ttg ccg ctg 942
Val Asp Tyr Thr Asn Asp Thr Ser Ile Leu Asp Arg Ala Leu Pro Leu
240 245 250
ctg atc aag gag cac gag ttc ttc atg aat aac cgg acg gtg tcc atc 990
Leu Ile Lys Glu His Glu Phe Phe Met Asn Asn Arg Thr Val Ser Ile
255 260 265
acg gga tcg aac ggc aag gag tac act ctg aac ag gtaagcgagg 1035
Thr Gly Ser Asn Gly Lys Glu Tyr Thr Leu Asn Arg
270 275 280
tggacaggca ggcctcggcg accatgcgct tattgttgta tctggcag g tat cac 1090
Tyr His
gtt gaa aac aac caa cca cgc cca gag tcg ttc cgg gag gat tac att 1138
Val Glu Asn Asn Gln Pro Arg Pro Glu Ser Phe Arg Glu Asp Tyr Ile
285 290 295
acc gct aac aac ggc tcc tac tac gcg tct tcg ggc ata ata tat ccc 1186
Thr Ala Asn Asn Gly Ser Tyr Tyr Ala Ser Ser Gly Ile Ile Tyr Pro
300 305 310
gtt aag acg ccc ctc aac gag acg gaa aag gcc gcg ctc tac tcg aac 1234
Val Lys Thr Pro Leu Asn Glu Thr Glu Lys Ala Ala Leu Tyr Ser Asn
315 320 325 330
cta gca acc ggc gcc gag tcc ggc tgg gac tac acc tcc cga tgg ctt 1282
Leu Ala Thr Gly Ala Glu Ser Gly Trp Asp Tyr Thr Ser Arg Trp Leu
335 340 345
ggg gtc ccc agc gac gct gcg agg gac gtc tat ttc ccg ctc cgc tcg 1330
Gly Val Pro Ser Asp Ala Ala Arg Asp Val Tyr Phe Pro Leu Arg Ser
350 355 360
ctt aat gtc cgc gac ata gtc ccc gtc gat ctc aac tcc atc ctc tac 1378
Leu Asn Val Arg Asp Ile Val Pro Val Asp Leu Asn Ser Ile Leu Tyr
365 370 375
cag aac gag gtg atc att gcc gag tac ctc gag aag gcc ggt aac tcc 1426
Gln Asn Glu Val Ile Ile Ala Glu Tyr Leu Glu Lys Ala Gly Asn Ser
380 385 390
tcc gcg gcc aag cgc ttc gcc act gct gcc gaa cag cgc agc gag gcc 1474
Ser Ala Ala Lys Arg Phe Ala Thr Ala Ala Glu Gln Arg Ser Glu Ala
395 400 405 410
atg tac tcc ctc atg tgg aac gcc acg cac tgg tct tac ttt gac tac 1522
Met Tyr Ser Leu Met Trp Asn Ala Thr His Trp Ser Tyr Phe Asp Tyr
415 420 425
aat ctg acc gat aac acg caa cac atc ttc gtc cca gcc gac gag gac 1570
Asn Leu Thr Asp Asn Thr Gln His Ile Phe Val Pro Ala Asp Glu Asp
430 435 440
acc gcc ccc cag gac cgg atc gag gcc ccc ccc ggt caa caa gtc ttc 1618
Thr Ala Pro Gln Asp Arg Ile Glu Ala Pro Pro Gly Gln Gln Val Phe
445 450 455
ttc cac att gcg cag ctc tat cca ttc tgg acg ggc gcg gcc ccc gcc 1666
Phe His Ile Ala Gln Leu Tyr Pro Phe Trp Thr Gly Ala Ala Pro Ala
460 465 470
agc ctt aag gct aac ccc ctc gcg gtg cag caa gcc tac gcc cgt gtg 1714
Ser Leu Lys Ala Asn Pro Leu Ala Val Gln Gln Ala Tyr Ala Arg Val
475 480 485 490
gcg cgc atg ctc gat atc aag aag ggc gcc atc ccc gcc acc aac tac 1762
Ala Arg Met Leu Asp Ile Lys Lys Gly Ala Ile Pro Ala Thr Asn Tyr
495 500 505
cgc acc ggc caa caa tgg gac cag ccc aac gtc tgg ccg ccg ctg caa 1810
Arg Thr Gly Gln Gln Trp Asp Gln Pro Asn Val Trp Pro Pro Leu Gln
510 515 520
cat atc ctg atg aag ggc ctg ctt aac acc ccg gca acc ttt ggc aag 1858
His Ile Leu Met Lys Gly Leu Leu Asn Thr Pro Ala Thr Phe Gly Lys
525 530 535
tcc gac cct gcg tac cag agc gtg caa aac ctc gcc ctg cgt ctc gcc 1906
Ser Asp Pro Ala Tyr Gln Ser Val Gln Asn Leu Ala Leu Arg Leu Ala
540 545 550
cag cgc tac ctc gat tcc acc ttt tgt acc tgg tac gcc acg ggc ggt 1954
Gln Arg Tyr Leu Asp Ser Thr Phe Cys Thr Trp Tyr Ala Thr Gly Gly
555 560 565 570
tca acc agc gac ttc ccg cag ctg gag ggt gtt acc ccg ggc gct acg 2002
Ser Thr Ser Asp Phe Pro Gln Leu Glu Gly Val Thr Pro Gly Ala Thr
575 580 585
ggc gtc atg ttt gag aag tac gcc gac aat gct acc aac gtt gcc ggc 2050
Gly Val Met Phe Glu Lys Tyr Ala Asp Asn Ala Thr Asn Val Ala Gly
590 595 600
ggc ggc ggc gaa tac gag gtc gtc gag ggt ttc ggg tgg acc aat ggc 2098
Gly Gly Gly Glu Tyr Glu Val Val Glu Gly Phe Gly Trp Thr Asn Gly
605 610 615
gta ctg atc tgg gcg gcc gac gtc ttt ggt aac aag ctc aag cgc ccg 2146
Val Leu Ile Trp Ala Ala Asp Val Phe Gly Asn Lys Leu Lys Arg Pro
620 625 630
gac tgc ggc aac atc acg gcc gca cat acc cac tct agt gcc aag aga 2194
Asp Cys Gly Asn Ile Thr Ala Ala His Thr His Ser Ser Ala Lys Arg
635 640 645 650
ggt ctg gaa gag aat aag ctg ccg agg agg gcg gtg gag ctc gac ccg 2242
Gly Leu Glu Glu Asn Lys Leu Pro Arg Arg Ala Val Glu Leu Asp Pro
655 660 665
tgg gat gcc gcg tgg acc aag atg ttt ggg cgg agt aag ctc cgg aga 2290
Trp Asp Ala Ala Trp Thr Lys Met Phe Gly Arg Ser Lys Leu Arg Arg
670 675 680
aga gag gca gaa gat gtg cgg aag cgg tgg atg agc taaggtccta 2336
Arg Glu Ala Glu Asp Val Arg Lys Arg Trp Met Ser
685 690
atccatatgc ttaatgaagg gtggttcgtt gtgcttcgct ttcaagttgg taacttagtg 2396
tttagtgtct ccgtctcgta agcgatggca aactttgcga gggaagtcgg tcgatgaaga 2456
ggtaatccgc atcctggcgc cctatctagg tcggtagcta cctgggcgga tatcgagctt 2516
acattaatac ctacttagta atttccagag agatgatcac ctggattgcg gctgcaaatg 2576
gttaacacac acaataagat aagaatgtta ttgctgccca tgtacagaca cggttgtaga 2636
atgagcttga taaagctgac aacggaaaac tggacccccc ggtttgcgca taaatgtccc 2696
gccaacgcca aaagttcaac cctccaaccg ccaccgtagc aacgccgata caaatgcaac 2756
cgtgtatttt ctccgtcatg ccgccgtagc ccctattcac acactcggct caaaccgctg 2816
tcgtcaccgg cgt 2829
<210> 30
<211> 694
<212> PRT
<213> 瘤孢毁丝霉(Myceliophthora sepedonium)
<400> 30
Met Ala Leu Arg His Ile Ala Ala Ala Ala Ile Ala Gly Leu Ala Ser
1 5 10 15
Arg Thr Ala Ala Leu Tyr Ile Asn Gly Ser Val Thr Ala Pro Cys Asp
20 25 30
Ser Pro Ile Tyr Cys Gln Gly Glu Leu Leu Lys Ala Val Glu Leu Ala
35 40 45
Arg Pro Phe Val Asp Ser Lys Thr Phe Val Asp Met Pro Thr Ile Lys
50 55 60
Pro Val Asp Glu Val Leu Ala Ala Phe Ser Lys Leu Ser Leu Pro Leu
65 70 75 80
Ser Asn Asn Ser Glu Leu Asn Ala Phe Leu Tyr Glu Asn Phe Ala Gln
85 90 95
Ala Gly His Glu Leu Glu Glu Val Pro Asp Ser Glu Leu Glu Thr Asp
100 105 110
Ala Lys Phe Leu Asp Lys Leu Glu Asp Arg Thr Ile Lys Glu Phe Val
115 120 125
Gly Lys Val Ile Asp Ile Trp Pro Asp Leu Thr Arg Arg Tyr Ala Gly
130 135 140
Pro Ser Asn Cys Thr Glu Cys Ala Asn Ser Phe Ile Pro Val Asn Arg
145 150 155 160
Thr Phe Val Val Ala Gly Gly Arg Phe Arg Glu Pro Tyr Tyr Trp Asp
165 170 175
Ser Tyr Trp Ile Val Glu Gly Leu Leu Arg Thr Gly Gly Ala Phe Thr
180 185 190
His Ile Ser Lys Asn Ile Ile Glu Asn Phe Leu Asp Phe Val Asp Thr
195 200 205
Ile Gly Phe Ile Pro Asn Gly Ala Arg Ile Tyr Tyr Leu Asn Arg Ser
210 215 220
Gln Pro Pro Leu Leu Thr Leu Met Val Lys Ser Tyr Val Asp Tyr Thr
225 230 235 240
Asn Asp Thr Ser Ile Leu Asp Arg Ala Leu Pro Leu Leu Ile Lys Glu
245 250 255
His Glu Phe Phe Met Asn Asn Arg Thr Val Ser Ile Thr Gly Ser Asn
260 265 270
Gly Lys Glu Tyr Thr Leu Asn Arg Tyr His Val Glu Asn Asn Gln Pro
275 280 285
Arg Pro Glu Ser Phe Arg Glu Asp Tyr Ile Thr Ala Asn Asn Gly Ser
290 295 300
Tyr Tyr Ala Ser Ser Gly Ile Ile Tyr Pro Val Lys Thr Pro Leu Asn
305 310 315 320
Glu Thr Glu Lys Ala Ala Leu Tyr Ser Asn Leu Ala Thr Gly Ala Glu
325 330 335
Ser Gly Trp Asp Tyr Thr Ser Arg Trp Leu Gly Val Pro Ser Asp Ala
340 345 350
Ala Arg Asp Val Tyr Phe Pro Leu Arg Ser Leu Asn Val Arg Asp Ile
355 360 365
Val Pro Val Asp Leu Asn Ser Ile Leu Tyr Gln Asn Glu Val Ile Ile
370 375 380
Ala Glu Tyr Leu Glu Lys Ala Gly Asn Ser Ser Ala Ala Lys Arg Phe
385 390 395 400
Ala Thr Ala Ala Glu Gln Arg Ser Glu Ala Met Tyr Ser Leu Met Trp
405 410 415
Asn Ala Thr His Trp Ser Tyr Phe Asp Tyr Asn Leu Thr Asp Asn Thr
420 425 430
Gln His Ile Phe Val Pro Ala Asp Glu Asp Thr Ala Pro Gln Asp Arg
435 440 445
Ile Glu Ala Pro Pro Gly Gln Gln Val Phe Phe His Ile Ala Gln Leu
450 455 460
Tyr Pro Phe Trp Thr Gly Ala Ala Pro Ala Ser Leu Lys Ala Asn Pro
465 470 475 480
Leu Ala Val Gln Gln Ala Tyr Ala Arg Val Ala Arg Met Leu Asp Ile
485 490 495
Lys Lys Gly Ala Ile Pro Ala Thr Asn Tyr Arg Thr Gly Gln Gln Trp
500 505 510
Asp Gln Pro Asn Val Trp Pro Pro Leu Gln His Ile Leu Met Lys Gly
515 520 525
Leu Leu Asn Thr Pro Ala Thr Phe Gly Lys Ser Asp Pro Ala Tyr Gln
530 535 540
Ser Val Gln Asn Leu Ala Leu Arg Leu Ala Gln Arg Tyr Leu Asp Ser
545 550 555 560
Thr Phe Cys Thr Trp Tyr Ala Thr Gly Gly Ser Thr Ser Asp Phe Pro
565 570 575
Gln Leu Glu Gly Val Thr Pro Gly Ala Thr Gly Val Met Phe Glu Lys
580 585 590
Tyr Ala Asp Asn Ala Thr Asn Val Ala Gly Gly Gly Gly Glu Tyr Glu
595 600 605
Val Val Glu Gly Phe Gly Trp Thr Asn Gly Val Leu Ile Trp Ala Ala
610 615 620
Asp Val Phe Gly Asn Lys Leu Lys Arg Pro Asp Cys Gly Asn Ile Thr
625 630 635 640
Ala Ala His Thr His Ser Ser Ala Lys Arg Gly Leu Glu Glu Asn Lys
645 650 655
Leu Pro Arg Arg Ala Val Glu Leu Asp Pro Trp Asp Ala Ala Trp Thr
660 665 670
Lys Met Phe Gly Arg Ser Lys Leu Arg Arg Arg Glu Ala Glu Asp Val
675 680 685
Arg Lys Arg Trp Met Ser
690
<210> 31
<211> 1079
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<220>
<221> 信号
<222> (1)..(23)
<220>
<221> 成熟肽
<222> (24)..(1079)
<400> 31
Met Arg Ser Thr Val Thr Ser Ala Ala Ala Leu Leu Ser Leu Leu Gln
-20 -15 -10
Leu Val Ser Pro Val His Gly Thr Thr Leu Val Asp Arg Val Thr Lys
-5 -1 1 5
Cys Leu Ser Arg His Asp Gly Ser Asp Ala Glu Ser His Phe Ser Lys
10 15 20 25
Asn Val Tyr Lys Thr Asp Phe Ala Gly Val Thr Trp Asp Glu Asp Asn
30 35 40
Trp Leu Leu Ser Thr Thr Gln Leu Lys Gln Gly Ala Phe Glu Ala Arg
45 50 55
Gly Ser Val Ala Asn Gly Tyr Leu Gly Ile Asn Val Ala Ser Val Gly
60 65 70
Pro Phe Phe Glu Val Asp Thr Glu Glu Asp Gly Asp Val Ile Ser Gly
75 80 85
Trp Pro Leu Phe Ser Arg Arg Gln Ser Phe Ala Thr Val Ala Gly Phe
90 95 100 105
Trp Asp Ala Gln Pro Gln Met Asn Gly Thr Asn Phe Pro Trp Leu Ser
110 115 120
Gln Tyr Gly Ser Asp Thr Ala Ile Ser Gly Ile Pro His Trp Ser Gly
125 130 135
Leu Val Leu Asp Leu Gly Gly Gly Thr Tyr Leu Asp Ala Thr Val Ser
140 145 150
Asn Lys Thr Ile Ser His Phe Arg Ser Thr Tyr Asp Tyr Lys Ala Gly
155 160 165
Val Leu Ser Trp Ser Tyr Lys Trp Thr Pro Lys Gly Asn Lys Gly Ser
170 175 180 185
Phe Asp Ile Ser Tyr Arg Leu Phe Ala Asn Lys Leu His Val Asn Gln
190 195 200
Ala Val Val Asp Met Gln Val Thr Ala Ser Lys Asn Val Gln Ala Ser
205 210 215
Ile Val Asn Val Leu Asp Gly Phe Ala Ala Val Arg Thr Asp Phe Val
220 225 230
Glu Ser Gly Glu Asp Gly Ser Ala Ile Phe Ala Ala Val Arg Pro Asn
235 240 245
Gly Val Ala Asn Val Thr Ala Tyr Val Tyr Ala Asp Ile Thr Gly Ser
250 255 260 265
Gly Gly Val Asn Leu Ser Ser Arg Lys Ile Val His Asn Lys Pro Tyr
270 275 280
Val His Ala Asn Ala Ser Ser Ile Ala Gln Ala Val Pro Val Lys Phe
285 290 295
Ala Ala Gly Arg Thr Val Arg Val Thr Lys Phe Val Gly Ala Ala Ser
300 305 310
Ser Asp Ala Phe Lys Asn Pro Lys Gln Val Ala Lys Lys Ala Ala Ala
315 320 325
Ala Gly Leu Ser Asn Gly Tyr Thr Lys Ser Leu Lys Ala His Val Glu
330 335 340 345
Glu Trp Ala Thr Val Met Pro Glu Ser Ser Val Asp Ser Phe Ala Asp
350 355 360
Pro Lys Thr Gly Lys Leu Pro Ala Asp Ser His Ile Val Asp Ser Ala
365 370 375
Ile Ile Ala Val Thr Asn Thr Tyr Tyr Leu Leu Gln Asn Thr Val Gly
380 385 390
Lys Asn Gly Ile Lys Ala Val Asp Gly Ala Pro Val Asn Val Asp Ser
395 400 405
Ile Ser Val Gly Gly Leu Thr Ser Asp Ser Tyr Ala Gly Gln Ile Phe
410 415 420 425
Trp Asp Ala Asp Leu Trp Met Gln Pro Gly Leu Val Ala Ala His Pro
430 435 440
Glu Ala Ala Glu Arg Ile Thr Asn Tyr Arg Leu Ala Arg Tyr Gly Gln
445 450 455
Ala Lys Glu Asn Val Lys Thr Ala Tyr Ala Gly Ser Gln Asn Glu Thr
460 465 470
Phe Phe Ser Ala Ser Ala Ala Val Phe Pro Trp Thr Ser Gly Arg Tyr
475 480 485
Gly Asn Cys Thr Ala Thr Gly Pro Cys Trp Asp Tyr Glu Tyr His Leu
490 495 500 505
Asn Gly Asp Ile Gly Ile Ser Leu Val Asn Gln Trp Val Val Asn Gly
510 515 520
Asp Thr Lys Asp Phe Glu Lys Asn Leu Phe Pro Val Tyr Asp Ser Val
525 530 535
Ala Gln Leu Tyr Gly Asn Leu Leu Arg Pro Asn Lys Thr Ser Trp Thr
540 545 550
Leu Thr Asn Met Thr Asp Pro Asp Glu Tyr Ala Asn His Val Asp Ala
555 560 565
Gly Gly Tyr Thr Met Pro Leu Ile Ala Glu Thr Leu Gln Lys Ala Asn
570 575 580 585
Ser Phe Arg Gln Gln Phe Gly Ile Glu Gln Asn Lys Thr Trp Asn Asp
590 595 600
Met Ala Ser Asn Val Leu Val Leu Arg Glu Asn Gly Val Thr Leu Glu
605 610 615
Phe Thr Ala Met Asn Gly Thr Ala Val Val Lys Gln Ala Asp Val Ile
620 625 630
Met Leu Thr Tyr Pro Leu Ser Tyr Gly Thr Asn Tyr Ser Ala Gln Asp
635 640 645
Ala Leu Asn Asp Leu Asp Tyr Tyr Ala Asn Lys Gln Ser Pro Asp Gly
650 655 660 665
Pro Ala Met Thr Tyr Ala Phe Phe Ser Ile Val Ala Asn Glu Ile Ser
670 675 680
Pro Ser Gly Cys Ser Ala Tyr Thr Tyr Ala Gln Asn Ala Phe Lys Pro
685 690 695
Tyr Val Arg Ala Pro Phe Tyr Gln Ile Ser Glu Gln Leu Ile Asp Asp
700 705 710
Ala Ser Val Asn Gly Gly Thr His Pro Ala Tyr Pro Phe Leu Thr Gly
715 720 725
His Gly Gly Ala His Gln Val Val Leu Phe Gly Tyr Leu Gly Leu Arg
730 735 740 745
Leu Val Pro Asp Asp Val Ile His Ile Glu Pro Asn Leu Pro Pro Gln
750 755 760
Ile Pro Tyr Leu Arg Tyr Arg Thr Phe Tyr Trp Arg Gly Trp Pro Ile
765 770 775
Ser Ala Trp Ser Asn Tyr Thr His Thr Thr Leu Ser Arg Ala Ala Gly
780 785 790
Val Ala Ala Leu Glu Gly Ala Asp Gln Arg Phe Ala Arg Lys Pro Ile
795 800 805
Thr Ile His Ala Gly Pro Glu Gln Asp Pro Thr Ala Tyr Arg Leu Pro
810 815 820 825
Val Lys Gly Ser Val Val Ile Pro Asn Lys Gln Ile Gly Ser Gln Gln
830 835 840
Thr Tyr Ala Gly Asn Leu Val Gln Cys His Ala Ala Ser Ser Pro Asn
845 850 855
Asp Tyr Val Pro Gly Gln Phe Pro Ile Ala Ala Val Asp Gly Ala Thr
860 865 870
Ser Thr Lys Trp Gln Pro Ala Ser Ala Asp Lys Val Ser Ser Ile Thr
875 880 885
Val Ser Leu Asp Lys Glu Asp Val Gly Ser Leu Val Ser Gly Phe His
890 895 900 905
Phe Asp Trp Ala Gln Ala Pro Pro Val Asn Ala Thr Val Ile Phe His
910 915 920
Asp Glu Ala Leu Ala Asp Pro Ala Thr Ala Leu Ala Ser Ala His Lys
925 930 935
His Asn Ser Lys Tyr Thr Thr Val Thr Ser Leu Thr Asn Ile Glu Leu
940 945 950
Ser Asp Pro Tyr Val Ser Thr Lys Asp Leu Asn Ala Ile Ala Ile Pro
955 960 965
Ile Gly Asn Thr Thr Asn Val Thr Leu Ser His Pro Val Ala Ala Ser
970 975 980 985
Arg Tyr Ala Ser Leu Leu Ile Val Gly Asn Gln Gly Leu Asp Pro Val
990 995 1000
Asp Val Lys Ala Lys Asn Gly Thr Gly Ala Thr Val Ala Glu Trp
1005 1010 1015
Ala Ile Phe Gly His Gly Lys Glu His Ser Gly Lys Pro Ser Ser
1020 1025 1030
His Ser Lys Arg Arg Leu Asn Val Arg Thr Ala Ala Thr Leu Ser
1035 1040 1045
Asn Pro Arg Ser Phe Met Arg Arg Arg Leu
1050 1055
<210> 32
<211> 564
<212> PRT
<213> 大型亚灰树花菌(Meripilus giganteus)
<220>
<221> 信号
<222> (1)..(17)
<220>
<221> 成熟肽
<222> (18)..(564)
<400> 32
Met Val Ala Thr Ser Leu Leu Val Ala Ser Leu Phe Thr Leu Ala Leu
-15 -10 -5
Gly Thr Pro Thr Gly Arg Asn Leu Lys Leu His Glu Ala Arg Glu Asp
-1 1 5 10 15
Leu Pro Ala Gly Phe Ser Leu Arg Gly Ala Ala Ser Pro Asp Thr Thr
20 25 30
Leu Lys Leu Arg Ile Ala Leu Val Gln Asn Asn Phe Ala Glu Leu Glu
35 40 45
Asp Lys Leu Tyr Asp Val Ser Thr Pro Ser Ser Ala Asn Tyr Gly Asn
50 55 60
His Leu Ser Lys Glu Glu Val Glu Gln Tyr Ile Ala Pro Ala Pro Glu
65 70 75
Ser Val Lys Ala Val Asn Ala Trp Leu Thr Glu Asn Gly Leu Asp Ala
80 85 90 95
His Thr Ile Ser Pro Ala Gly Asp Trp Leu Ala Phe Glu Val Pro Val
100 105 110
Ser Lys Ala Asn Glu Leu Phe Asp Ala Asp Phe Ser Val Phe Thr His
115 120 125
Asp Glu Ser Gly Leu Glu Ala Ile Arg Thr Leu Ala Tyr Ser Ile Pro
130 135 140
Ala Glu Leu Gln Gly His Leu Asp Leu Val His Pro Thr Val Thr Phe
145 150 155
Pro Asn Pro Asn Ala His Leu Pro Val Val Arg Ser Thr Gln Pro Ile
160 165 170 175
Arg Asn Leu Thr Gly Arg Ala Ile Pro Ala Ser Cys Ala Ser Thr Ile
180 185 190
Thr Pro Ala Cys Leu Gln Ala Ile Tyr Gly Ile Pro Thr Thr Lys Ala
195 200 205
Thr Gln Ser Ser Asn Lys Leu Ala Val Ser Gly Phe Ile Asp Gln Phe
210 215 220
Ala Asn Lys Ala Asp Leu Lys Ser Phe Leu Ala Gln Phe Arg Lys Asp
225 230 235
Ile Ser Ser Ser Thr Thr Phe Ser Leu Gln Thr Leu Asp Gly Gly Glu
240 245 250 255
Asn Asp Gln Ser Pro Ser Glu Ala Gly Ile Glu Ala Asn Leu Asp Ile
260 265 270
Gln Tyr Thr Val Gly Leu Ala Thr Gly Val Pro Thr Thr Phe Ile Ser
275 280 285
Val Gly Asp Asp Phe Gln Asp Gly Asn Leu Glu Gly Phe Leu Asp Ile
290 295 300
Ile Asn Phe Leu Leu Gly Glu Ser Asn Pro Pro Gln Val Leu Thr Thr
305 310 315
Ser Tyr Gly Gln Asn Glu Asn Thr Ile Ser Ala Lys Leu Ala Asn Gln
320 325 330 335
Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu
340 345 350
Phe Ala Ser Gly Asp Gly Gly Val Ser Gly Ser Gln Ser Ala His Cys
355 360 365
Ser Asn Phe Val Pro Thr Phe Pro Ser Gly Cys Pro Phe Met Thr Ser
370 375 380
Val Gly Ala Thr Gln Gly Val Ser Pro Glu Thr Ala Ala Ala Phe Ser
385 390 395
Ser Gly Gly Phe Ser Asn Val Phe Gly Ile Pro Ser Tyr Gln Ala Ser
400 405 410 415
Ala Val Ser Gly Tyr Leu Ser Ala Leu Gly Ser Thr Asn Ser Gly Lys
420 425 430
Phe Asn Arg Ser Gly Arg Gly Phe Pro Asp Val Ser Thr Gln Gly Val
435 440 445
Asp Phe Gln Ile Val Ser Gly Gly Gln Thr Ile Gly Val Asp Gly Thr
450 455 460
Ser Cys Ala Ser Pro Thr Phe Ala Ser Val Ile Ser Leu Val Asn Asp
465 470 475
Arg Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe
480 485 490 495
Leu Tyr Ser Ser Ala Gly Lys Ala Ala Leu Asn Asp Val Thr Ser Gly
500 505 510
Ser Asn Pro Gly Cys Ser Thr Asn Gly Phe Pro Ala Lys Ala Gly Trp
515 520 525
Asp Pro Val Thr Gly Leu Gly Thr Pro Asn Phe Ala Lys Leu Leu Thr
530 535 540
Ala Val Gly Leu
545

Claims (14)

1.一种具有海藻糖酶活性的多肽,其选自下组,该组由以下各项组成:
(a)多肽,其与SEQ ID NO:30或SEQ ID NO:2的成熟多肽具有至少90%序列同一性,或与SEQ ID NO:4的成熟多肽具有至少80%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在高严格条件下与以下杂交:(i)SEQ IDNO:29、SEQ ID NO:1或SEQ ID NO:3的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体;
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:29、SEQ ID NO:1或SEQ IDNO:3的成熟多肽编码序列或其cDNA序列具有至少60%序列同一性;
(d)SEQ ID NO:30、SEQ ID NO:2或SEQ ID NO:4的成熟多肽的变体,其在一个或多个(例如,几个)位置处包含取代、缺失和/或插入;和
(e)(a)、(b)、(c)或(d)的多肽的具有海藻糖酶活性的片段。
2.一种组合物,其包含如权利要求1所述的多肽。
3.一种全培养液配制物或细胞培养组合物,其包含如权利要求1所述的多肽。
4.一种多核苷酸,其编码如权利要求1所述的多肽。
5.一种核酸构建体或表达载体,其包含如权利要求4所述的多核苷酸,该多核苷酸可操作地连接于指导该多肽在表达宿主内的产生的一个或多个控制序列。
6.一种重组宿主细胞,其包含如权利要求4所述的多核苷酸,该多核苷酸可操作地连接于指导该多肽的产生的一个或多个控制序列。
7.如权利要求6所述的重组宿主细胞,其中所述重组宿主细胞是酵母,如酵母属,特别是酿酒酵母的菌株。
8.一种产生如权利要求1所述的多肽的方法,其包括:在有益于产生该多肽的条件下培养细胞,该细胞以其野生型形式产生该多肽。
9.一种产生具有海藻糖酶活性的多肽的方法,其包括:在有益于产生该多肽的条件下培养如权利要求6或7所述的宿主细胞。
10.一种转基因植物、植物部分或植物细胞,其已经用编码权利要求1所述的多肽的多核苷酸转化。
11.一种产生具有海藻糖酶活性的多肽的方法,其包括:在有益于产生该多肽的条件下培养如权利要求10所述的转基因植物或植物细胞。
12.一种生产发酵产物的方法,其包括
(a)用α-淀粉酶使含淀粉材料液化;
任选地在步骤(b)之前使所液化的材料预糖化;
(b)使所液化的材料糖化;
(c)使用发酵生物进行发酵;
其中
i)葡糖淀粉酶;
ii)权利要求1所述的海藻糖酶;
iii)任选的纤维素分解酶组合物和/或蛋白酶;
在以下步骤的过程中存在和/或添加
-糖化步骤(b);
-发酵步骤(c);
-同时的糖化和发酵;
-任选在步骤(b)之前的预糖化步骤。
13.一种从含淀粉材料生产发酵产物的方法,其包括:
(i)在起始糊化温度以下的温度使含淀粉材料糖化;和
(ii)使用发酵生物进行发酵;
其中在以下酶的存在下进行糖化和/或发酵:葡糖淀粉酶、α-淀粉酶、权利要求1所述的海藻糖酶;和任选的蛋白酶和/或纤维素分解酶组合物。
14.一种从预处理的纤维素材料产生发酵产物的方法,其包括:
(a)用纤维素分解酶组合物使所述预处理的纤维素材料水解;
(b)使用发酵生物进行发酵;和
(c)任选地回收所述发酵产物,
其中权利要求1所述的海藻糖酶被添加至和/或存在于水解步骤(a)和/或发酵步骤(b)中。
CN201680029688.3A 2015-06-18 2016-06-13 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途 Pending CN108350442A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562181538P 2015-06-18 2015-06-18
US62/181,538 2015-06-18
PCT/US2016/037224 WO2016205127A1 (en) 2015-06-18 2016-06-13 Polypeptides having trehalase activity and the use thereof in process of producing fermentation products

Publications (1)

Publication Number Publication Date
CN108350442A true CN108350442A (zh) 2018-07-31

Family

ID=56345202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680029688.3A Pending CN108350442A (zh) 2015-06-18 2016-06-13 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途

Country Status (5)

Country Link
US (2) US10676727B2 (zh)
EP (1) EP3310910A1 (zh)
CN (1) CN108350442A (zh)
CA (1) CA2981342A1 (zh)
WO (1) WO2016205127A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109182301A (zh) * 2018-08-17 2019-01-11 广东溢多利生物科技股份有限公司 一种二糖降解酶基因及其应用
WO2020057476A1 (zh) * 2018-09-17 2020-03-26 南京百斯杰生物工程有限公司 海藻糖酶在发酵生产中的应用

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2972654T3 (es) 2017-05-04 2024-06-13 Cargill Inc Levaduras que expresan trehalasa genéticamente modificadas y procedimientos de fermentación que usan tales levaduras genéticamente modificadas
CA3065246A1 (en) 2017-06-28 2019-01-03 Novozymes A/S Polypeptides having trehalase activity and polynucleotides encoding same
CN111094562A (zh) * 2017-08-08 2020-05-01 诺维信公司 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途
CN112601818A (zh) * 2018-07-25 2021-04-02 诺维信公司 用于生产乙醇的表达酶的酵母
CN113490740A (zh) 2019-03-18 2021-10-08 诺维信公司 适合用于液化中的具有普鲁兰酶活性的多肽
CN111850069B (zh) * 2020-07-27 2021-07-02 溧阳维信生物科技有限公司 一种海藻糖的生产制备工艺
CN115820439A (zh) * 2022-07-01 2023-03-21 济南大学 一株昆虫病原真菌转基因菌株及其筛选方法与应用
WO2024137252A1 (en) 2022-12-19 2024-06-27 Novozymes A/S Process for reducing syrup viscosity in the backend of a process for producing a fermentation product
WO2024137248A1 (en) 2022-12-19 2024-06-27 Novozymes A/S Compositions comprising arabinofuranosidases and a xylanase, and use thereof for increasing hemicellulosic fiber solubilization
WO2024137250A1 (en) 2022-12-19 2024-06-27 Novozymes A/S Carbohydrate esterase family 3 (ce3) polypeptides having acetyl xylan esterase activity and polynucleotides encoding same
WO2024137246A1 (en) 2022-12-19 2024-06-27 Novozymes A/S Carbohydrate esterase family 1 (ce1) polypeptides having ferulic acid esterase and/or acetyl xylan esterase activity and polynucleotides encoding same
WO2024137704A2 (en) 2022-12-19 2024-06-27 Novozymes A/S Processes for producing fermentation products using fiber-degrading enzymes with engineered yeast

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1165859A (zh) * 1996-01-12 1997-11-26 莫根国际公司 植物中海藻糖的增强累积
CN1793348A (zh) * 2005-11-30 2006-06-28 重庆大学 一种酸性海藻糖酶及其制备方法
WO2009121058A1 (en) * 2008-03-28 2009-10-01 Novozymes A/S Producing fermentation products in the presence of trehalase
WO2012027374A2 (en) * 2010-08-23 2012-03-01 Dyadic International (Usa) Inc. Novel fungal carbohydrate hydrolases
CN104334738A (zh) * 2012-03-30 2015-02-04 诺维信北美公司 生产发酵产物的方法

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5534046A (en) 1978-09-01 1980-03-10 Cpc International Inc Novel glucoamyrase having excellent heat resistance and production
GB2089836B (en) 1980-12-16 1984-06-20 Suntory Ltd Process for producing alcohol by fermentation without cooking
NO840200L (no) 1983-01-28 1984-07-30 Cefus Corp Glukoamylase cdna.
US4536477A (en) 1983-08-17 1985-08-20 Cpc International Inc. Thermostable glucoamylase and method for its production
US4587215A (en) 1984-06-25 1986-05-06 Uop Inc. Highly thermostable amyloglucosidase
US4628031A (en) 1984-09-18 1986-12-09 Michigan Biotechnology Institute Thermostable starch converting enzymes
JPS62126989A (ja) 1985-11-26 1987-06-09 Godo Shiyusei Kk コルテイシウム属担子菌の生産する酵素を用いた澱粉質の無蒸煮糖化法
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
DE69028529T2 (de) 1989-06-13 1997-02-27 Genencor International, Inc., South San Francisco, Calif. Verfahren zum abtöten von zellen ohne zellyse
US5162210A (en) 1990-06-29 1992-11-10 Iowa State University Research Foundation Process for enzymatic hydrolysis of starch to glucose
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
PT765394E (pt) 1994-06-03 2002-03-28 Novozymes Biotech Inc Lacases myceliophthora purificadas e acidos nucleicos que as codificam
EP0777737B1 (en) 1994-06-30 2005-05-04 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
CA2211316C (en) 1995-02-03 2013-10-01 Novo Nordisk A/S Method of designing alpha-amylase mutants with predetermined properties
AU2692897A (en) 1996-04-30 1997-11-19 Novo Nordisk A/S Alpha-amylase mutants
US6358726B1 (en) 1997-06-10 2002-03-19 Takara Shuzo Co., Ltd. Thermostable protease
WO1999019467A1 (en) 1997-10-13 1999-04-22 Novo Nordisk A/S α-AMYLASE MUTANTS
JP4718005B2 (ja) 1997-11-26 2011-07-06 ノボザイムス アクティーゼルスカブ 熱安定グルコアミラーゼ
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
JP2002520047A (ja) 1998-07-15 2002-07-09 ノボザイムス アクティーゼルスカブ グルコアミラーゼ変異体
CN1197965C (zh) 1998-10-26 2005-04-20 诺维信公司 在丝状真菌细胞内构建和筛选目的dna文库
EP2278016B1 (en) 1999-03-22 2012-09-26 Novozymes Inc. Promoter sequences derived from Fusarium Venenatum and uses thereof
WO2000060059A2 (en) 1999-03-30 2000-10-12 NovozymesA/S Alpha-amylase variants
CA2374009A1 (en) 1999-07-09 2001-01-18 Novozymes A/S Glucoamylase variant
EP2298903A3 (en) 2000-08-01 2011-10-05 Novozymes A/S Alpha-amylase mutants with altered properties
US20020155574A1 (en) 2000-08-01 2002-10-24 Novozymes A/S Alpha-amylase mutants with altered properties
EP1337657A2 (en) 2000-11-17 2003-08-27 Novozymes A/S Heterologous expression of taxanes
JP2004527261A (ja) 2001-05-18 2004-09-09 ノボザイムス アクティーゼルスカブ セロビアーゼ活性を有するポリペプチド及びそれをコードするポリヌクレオチド
WO2003048353A1 (en) 2001-12-07 2003-06-12 Novozymes A/S Polypeptides having protease activity and nucleic acids encoding same
DK1468093T4 (en) 2002-01-23 2018-04-09 Dsm Ip Assets Bv Fermentation of pentose sugars
MXPA05009553A (es) 2003-03-10 2006-03-17 Broin And Associates Inc Metodo para producir etanol utilizando almidon como materia prima.
WO2005047499A1 (en) 2003-10-28 2005-05-26 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
EP2213732B1 (en) 2003-10-28 2014-05-21 Novozymes North America, Inc. Hybrid glucoamylases
ATE441705T1 (de) 2003-10-30 2009-09-15 Novozymes As Kohlenhydratbindende module
CN113564147A (zh) 2004-01-30 2021-10-29 诺维信股份有限公司 具有分解纤维增强活性的多肽及其编码多核苷酸
MXPA06008745A (es) 2004-02-06 2007-01-23 Novozymes Inc Polipeptidos que tienen actividad celulolitica potenciada y polinucleotidos que codifican a los mismos.
DK1831384T3 (en) 2004-12-22 2015-11-23 Novozymes As Polypeptides with glucoamylase activity and polynucleotides encoding them.
ES2368165T3 (es) 2005-08-04 2011-11-15 Novozymes, Inc. Polipéptidos con actividad de beta-glucosidasa y polinucleótidos que codifican los mismos.
US7871800B2 (en) 2006-04-19 2011-01-18 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
WO2007134207A2 (en) 2006-05-12 2007-11-22 Novozymes North America, Inc. Use of a thermococcales-derived alpha-amylase for starch liquefaction or saccharification
DK2046819T3 (da) 2006-07-21 2015-06-22 Novozymes Inc Fremgangsmåder til forøgelse af secernering af polypeptider med biologisk aktivitet
US9453213B2 (en) 2007-05-31 2016-09-27 Novozymes, Inc. Methods of increasing the cellulolytic enhancing activity of a polypeptide
CN102083991A (zh) 2008-06-23 2011-06-01 诺维信公司 生产发酵产物的方法
EP2356242A2 (en) 2008-09-30 2011-08-17 Novozymes Inc. Methods for using positively and negatively selectable genes in a filamentous fungal cell
DK2398889T3 (en) 2009-02-20 2018-07-30 Danisco Us Inc FERMENTATION BOUILLON FORMULATIONS
US20100304437A1 (en) 2009-05-29 2010-12-02 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
WO2011041397A1 (en) 2009-09-29 2011-04-07 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
BR112012008291A8 (pt) 2009-11-06 2019-05-21 Novozymes Inc composição de enzima, célula hospedeira recombinante, e, métodos de produzir uma composição de enzima, para degradar ou converter um material celulósico, para produzir um produto de fermentação e de fermentar um material celulósico
ES2534098T3 (es) 2009-11-30 2015-04-17 Novozymes A/S Polipéptidos que tienen actividad de glucoamilasa y polinucleótidos que codifican los mismos
CN111593035B (zh) 2009-12-01 2024-06-11 诺维信公司 具有葡糖淀粉酶活性的多肽及其编码多核苷酸
WO2011127802A1 (en) 2010-04-14 2011-10-20 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
EP3023492B1 (en) 2010-10-01 2018-01-24 Novozymes, Inc. Beta-glucosidase variants and polynucleotides encoding same
ES2673940T3 (es) 2010-12-22 2018-06-26 Novozymes North America, Inc. Proceso para producir productos de fermentación a partir de materiales que contienen almidón
CN103781910B (zh) 2011-07-06 2019-04-23 诺维信公司 α淀粉酶变体及其编码多核苷酸
CA2846398A1 (en) 2011-08-24 2013-02-28 Novozymes, Inc. Cellulolytic enzyme compositions and uses thereof
EP2748315B1 (en) 2011-09-06 2017-11-15 Novozymes A/S Glucoamylase variants and polynucleotides encoding same
EA201490649A1 (ru) 2011-10-11 2014-07-30 Новозимс А/С Варианты глюкоамилазы и кодирующие их полинуклеотиды
MX2015001818A (es) * 2012-08-16 2015-05-07 Danisco Inc Proceso para producir glucosa a partir de almidon con el uso de la alfa-amilasa de aspergillus clavatus y una pululanasa.
BR112015003071A2 (pt) * 2012-08-16 2019-09-24 Danisco Us Inc método de uso de alfa-amilase a partir de aspergillus clavatus e de isoamilase para sacarificação.
ES2694765T3 (es) 2012-09-05 2018-12-27 Novozymes A/S Polipéptidos con actividad de proteasa
DK3372680T3 (da) 2013-04-30 2021-01-11 Novozymes As Glucoamylasevarianter og polynukleotider, som koder for dem
CN105722989B (zh) 2013-10-28 2020-12-18 丹尼斯科美国公司 发酵中的海藻糖酶
DK3122876T3 (da) * 2014-03-28 2021-02-08 Danisco Us Inc Ændret værtscellebane for forbedret ethanolproduktion

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1165859A (zh) * 1996-01-12 1997-11-26 莫根国际公司 植物中海藻糖的增强累积
CN1793348A (zh) * 2005-11-30 2006-06-28 重庆大学 一种酸性海藻糖酶及其制备方法
WO2009121058A1 (en) * 2008-03-28 2009-10-01 Novozymes A/S Producing fermentation products in the presence of trehalase
WO2012027374A2 (en) * 2010-08-23 2012-03-01 Dyadic International (Usa) Inc. Novel fungal carbohydrate hydrolases
CN104334738A (zh) * 2012-03-30 2015-02-04 诺维信北美公司 生产发酵产物的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109182301A (zh) * 2018-08-17 2019-01-11 广东溢多利生物科技股份有限公司 一种二糖降解酶基因及其应用
WO2020034256A1 (zh) * 2018-08-17 2020-02-20 广东溢多利生物科技股份有限公司 一种二糖降解酶基因及其应用
CN109182301B (zh) * 2018-08-17 2021-12-07 广东溢多利生物科技股份有限公司 一种二糖降解酶基因及其应用
WO2020057476A1 (zh) * 2018-09-17 2020-03-26 南京百斯杰生物工程有限公司 海藻糖酶在发酵生产中的应用
CN112714794A (zh) * 2018-09-17 2021-04-27 南京百斯杰生物工程有限公司 海藻糖酶在发酵生产中的应用
US11913053B2 (en) 2018-09-17 2024-02-27 Nanjing Bestzyme Bio-Engineering Co., Ltd. Application of trehalase in fermentative production

Also Published As

Publication number Publication date
CA2981342A1 (en) 2016-12-22
US20180179504A1 (en) 2018-06-28
WO2016205127A1 (en) 2016-12-22
EP3310910A1 (en) 2018-04-25
US20200299662A1 (en) 2020-09-24
US10676727B2 (en) 2020-06-09
US11685910B2 (en) 2023-06-27

Similar Documents

Publication Publication Date Title
US11685910B2 (en) Polypeptides having trehalase activity and the use thereof in process of producing fermentation products
US20240124902A1 (en) Enzyme-expressing yeast for ethanol production
CN103534348B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN105886485B (zh) β-葡糖苷酶变体及其编码多核苷酸
CN103608461B (zh) 增加多肽的纤维素分解增强活性的方法
DK2069491T3 (en) COMPOSITIONS AND PROCEDURES FOR IMPROVING THE DECOMPOSITION OR CONVERSION OF CELLULOSE SUBSTANCES
CN105164254B (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
US11584783B2 (en) Processes for producing a fermentation product
CN103270165A (zh) 包含具有纤维素分解增强活性的多肽和醌化合物的组合物及其用途
US11220679B2 (en) Polypeptides having trehalase activity
CN103703139A (zh) 用于预处理纤维素材料和改进其水解的方法
CN103459605B (zh) 用于酶法精制经预处理的纤维素材料以供糖化的工艺
CN102918151A (zh) 纤维二糖水解酶变体及编码其的多核苷酸
CN107002056A (zh) 碳水化合物结合模块变体以及编码它们的多核苷酸
Alghamdi Recombinant production and properties of cellulase from hyperthermophilic archaeon Pyrococcus abyssi
CN109415712A (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
TW201139681A (en) Napier grass and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination