CN104039817A - 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 - Google Patents
具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 Download PDFInfo
- Publication number
- CN104039817A CN104039817A CN201280065538.XA CN201280065538A CN104039817A CN 104039817 A CN104039817 A CN 104039817A CN 201280065538 A CN201280065538 A CN 201280065538A CN 104039817 A CN104039817 A CN 104039817A
- Authority
- CN
- China
- Prior art keywords
- seq
- polypeptide
- amino acid
- sequence
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
- C12N9/248—Xylanases
- C12N9/2482—Endo-1,4-beta-xylanase (3.2.1.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01008—Endo-1,4-beta-xylanase (3.2.1.8)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及具有木聚糖酶活性的分离的多肽,以及编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。
Description
对于在联邦资助的研究和开发下完成的发明的权利的声明
本发明是在由美国能源部授予的合作协议(Cooperative Agreement)DE-FC36-08GO18080下以政府支持完成的。政府在本发明中具有一定权利。
涉及序列表
本申请包含计算机可读形式的序列表,其通过提述并入本文。
发明背景
技术领域
本发明涉及具有木聚糖酶活性的多肽,和编码所述多肽的多核苷酸。本发明亦涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。
背景技术
木素纤维素,世界上最大的可再生生物质资源,主要由木质素、纤维素和半纤维素构成,其中半纤维素的较大部分是木聚糖。木聚糖酶(例如内-1,4-β-木糖苷酶,EC3.2.1.8)水解木聚糖酶中的内部β-1,4-木糖苷键以产生较低分子量的木糖和木寡糖(xylo-oligomer)。木聚糖是从1,4-β-葡糖苷连接的D-木糖吡喃糖(1,4-β-glycoside-linked D-xylopyranose)形成的多糖。
纤维素是葡萄糖通过β-1,4-键连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,使其暴露于纤维二糖水解酶攻击(attack)。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。一旦纤维素转化为葡萄糖,所述葡萄糖可容易地由酵母发酵为乙醇。
将含木素纤维素原料(lignocellulosic feedstock)转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦纤维素转化为葡萄糖,所述葡萄糖可容易地由酵母发酵为乙醇。
在本领域存在通过补充其它酶改善纤维素分解酶组合物以增加效率和提供用于降解木素纤维素的划算的酶溶液的需求。
WO2011/041405公开了来自嗜松青霉(Penicillium pinophilum)GH10木聚糖酶及其基因。
本发明提供了具有木聚糖酶活性的多肽和编码所述多肽的多核苷酸。
发明内容
本发明涉及具有木聚糖酶活性的分离的多肽,其选自下组:
(a)多肽,其与SEQ ID NO:2的成熟多肽具有至少60%序列同一性;与SEQID NO:12的成熟多肽具有至少65%序列同一性;与SEQ ID NO:4或SEQ ID NO:10的成熟多肽具有至少70%序列同一性;与SEQ ID NO:14或SEQ ID NO:16的成熟多肽具有至少75%序列同一性;与SEQ ID NO:6或SEQ ID NO:8的成熟多肽具有至少80%序列同一性;与SEQ ID NO:20的成熟多肽具有至少85%序列同一性;或与SEQ ID NO:18的成熟多肽具有至少90%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少中等-高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:9,或SEQ ID NO:11的成熟多肽编码序列,(ii)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:9,或SEQ ID NO:11的cDNA序列,或(iii)(i)或(ii)的全长互补链;或在至少高严格条件下与以下杂交:(i)SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19的成熟多肽编码序列,(ii)SEQ ID NO:5,SEQ ID NO:13,SEQ ID NO:17,或SEQ ID NO:19的cDNA序列,或(iii)(i)或(ii)的全长互补链。
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%序列同一性;与SEQ ID NO:11的成熟多肽编码序列或其cDNA序列具有至少65%序列同一性;与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列或SEQ ID NO:9或其cDNA序列具有至少70%序列同一性;与SEQ ID NO:13的成熟多肽编码序列或其cDNA序列或SEQ ID NO:15的成熟多肽编码序列具有至少75%序列同一性;与SEQID NO:5的成熟多肽编码序列或其cDNA序列或SEQ ID NO:7的成熟多肽编码序列具有至少80%序列同一性;与SEQ ID NO:19的成熟多肽编码序列或其cDNA序列具有至少85%序列同一性;或与SEQ ID NO:17的成熟多肽编码序列或其cDNA序列具有至少90%序列同一性;
(d)SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ IDNO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽在一个或多个(例如几个)位置包含取代、缺失和/或插入的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有木聚糖酶活性的片段。
本发明亦涉及编码本发明的多肽的分离的多核苷酸,包含所述多核苷酸的核酸构建体、重组表达载体、和重组宿主细胞;和产生所述多肽的方法。
本发明亦涉及降解纤维素材料或含木聚糖材料的工艺,其包括:在本发明的具有木聚糖酶活性的多肽的存在下用酶组合物处理纤维素材料或含木聚糖材料。在一个方面,所述工艺还包括回收经降解或转化的纤维素材料或含木聚糖材料。
本发明亦涉及产生发酵产物的工艺,其包括:(a)在本发明的具有木聚糖酶活性的多肽的存在下用酶组合物糖化纤维素材料或含木聚糖材料;(b)用一种或多种(例如几种)发酵微生物发酵经糖化的纤维素材料或含木聚糖材料以产生发酵产物;和(c)从发酵回收该发酵产物。
本发明亦涉及发酵纤维素材料或含木聚糖材料的工艺,其包括用一种或多种(例如几种)发酵微生物发酵所述纤维素材料或含木聚糖材料,其中所述纤维素材料或含木聚糖材料在本发明具有木聚糖酶活性的多肽的存在下用酶组合物糖化。在一个方面,所述纤维素材料或含木聚糖材料的发酵产生发酵产物。在另一个方面,上述工艺进一步包括从发酵回收发酵产物。
本发明亦涉及编码信号肽的多核苷酸,所述信号肽包含或组成为(consist of)SEQ ID NO:2的氨基酸1至20,SEQ ID NO:4的氨基酸1至17,SEQ ID NO:6的氨基酸1至18,SEQ ID NO:8的氨基酸1至22,SEQ ID NO:10的氨基酸1至18,SEQ ID NO:12的氨基酸1至20,SEQ ID NO:14的氨基酸1至17,SEQ ID NO:16的氨基酸1至19,SEQ ID NO:18的氨基酸1至17,或SEQ IDNO:20的氨基酸1至17,其可操作地连接于编码蛋白的基因;包含所述多核苷酸的核酸构建体、表达载体和重组宿主细胞;和产生蛋白的方法。
附图说明
图1显示质粒pGH10_ZY577198_20的限制性图。
图2显示质粒pGH10_ZY577319_22的限制性图。
图3显示质粒pGH10_ZY577226_23的限制性图。
图4显示质粒pGH10_ZY577198_133的限制性图。
图5显示质粒pxyn13的限制性图。
图6显示质粒pGH10_ZY582331_279的限制性图。
图7显示质粒pGH10_Mf4036的限制性图。
图8显示质粒pGH10_Mf2809的限制性图。
图9显示质粒pGH10_Mf0530的限制性图。
图10显示质粒pGH10_ZY569164_676的限制性图。
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指羧基酯酶(EC3.1.1.72),其催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthyl acetate)和乙酸对硝基苯酯(p-nitrophenyl acetate)的水解。就本发明而言,乙酰木聚糖酯酶活性是使用含有0.01%TWEENTM20(聚氧乙烯山梨聚糖单月桂酸酯)的50mM乙酸钠pH5.0中的0.5mM乙酸对硝基苯酯作为底物确定的。一个单位的乙酰木聚糖酯酶定义为能够在pH5,25℃每分钟释放1微摩尔对硝基苯酚阴离子(p-nitrophenolate anion)的酶量。
等位变体(allelic variant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.1.55),其催化对α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本发明而言,α-L-阿拉伯呋喃糖苷酶活性是使用总体积200μl中的每ml的100mM乙酸钠pH5中5mg的中等粘度小麦阿拉伯木聚糖(Megazyme International Ireland,Ltd.,Bray,Co.Wicklow,Ireland)在40℃进行30分钟,接着通过HPX-87H柱层析(Bio-RadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析来确定的。
α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”意指α-D-葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronate glucuronohydrolase)(EC3.2.1.139),其催化α-D-葡糖醛酸糖苷水解为D-葡糖醛酸和醇。就本发明而言,α-葡糖醛酸糖苷酶活性是根据de Vries,1998,J.Bacteriol.180:243-249确定的。一个单位的α-葡糖醛酸糖苷酶等于能够在pH5,40℃每分钟释放1微摩尔葡糖醛酸或4-O-甲基葡糖醛酸的酶量。
β-葡糖苷酶:术语“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucoside glucohydrolase)(E.C.No.3.2.1.21),其催化末端非还原β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。就本发明而言,β-葡糖苷酶根据Venturi等,2002,Extracellular beta-D-glucosidase from Chaetomiumthermophilum var.coprophilum:production,purification and some biochemicalproperties,J.Basic Microbiol.42:55-66的方法使用对硝基苯基-β-D-葡糖吡喃糖苷作为底物确定。一个单位的β-葡糖苷酶定义为在25℃,pH4.8,在含有0.01%20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-葡糖吡喃糖苷每分钟产生1.0微摩尔对硝基苯酚阴离子。
β-木糖苷酶:术语“β-木糖苷酶”意指β-D-木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3.2.1.37),其催化短β(1→4)木寡糖(xylooligosaccharide)的外水解以从非还原端去除连续的D-木糖残基。就本发明而言,一个单位的β-木糖苷酶定义为在40℃,pH5在含有0.01%20的100mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔对硝基苯酚阴离子。
cDNA:术语“cDNA”意指能够通过反转录从得自真核或原核细胞的成熟的、已剪接的mRNA分子制备得到的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。最初的(initial)初级RNA转录物是mRNA的前体,其通过一系列的步骤加工包括剪接,然后作为成熟的已剪接的mRNA出现。
纤维二糖水解酶:术语“纤维二糖水解酶”意指1,4-β-D-葡聚糖纤维二糖水解酶(1,4-beta-D-glucan cellobiohydrolase)(E.C.3.2.1.91和E.C.3.2.1.176),其催化纤维素、纤维寡糖,或任何包含β-1,4-连接的葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从链的还原端(纤维二糖水解酶I)或非还原端(纤维二糖水解酶II)释放纤维二糖(Teeri,1997,Crystalline cellulose degradation:Newinsight into the function of cellobiohydrolases,Trends in Biotechnology15:160-167;Teeri等,1998,Trichoderma reesei cellobiohydrolases:why so efficienton crystalline cellulose?,Biochem.Soc.Trans.26:173-178)。根据Lever等,1972,Anal.Biochem.47:273-279;van Tilbeurgh等,1982,FEBS Letters149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters187:283-288;以及Tomme等,1988,Eur.J.Biochem.170:575-581描述的方法确定纤维二糖水解酶活性。在本发明中,Tomme等的方法可用于确定纤维二糖水解酶活性。
纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如几种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶,纤维二糖水解酶,β-葡糖苷酶,或其组合。测量纤维素分解活性的两种基本方法包括:(1)测量总纤维素分解活性,和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如Zhang等,Outlook for cellulaseimprovement:Screening and selection strategies,2006,Biotechnology Advances24:452-481所综述的。总纤维素分解活性通常是使用不溶性底物来测定的,所述底物包括Whatman1号滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木素纤维素等。最常见的总纤维素分解活性测定法是使用Whatman1号滤纸作为底物的滤纸测定法。该测定法是由International Union ofPure and Applied Chemistry(IUPAC)(Ghose,1987,Measurement of cellulaseactivities,Pure Appl.Chem.59:257-68)确立的。
就本发明而言,纤维素分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料水解相比于未添加纤维素分解酶蛋白的对照水解的增加来确定:1-50mg的纤维素分解酶蛋白/g的PCS中纤维素(或其它经预处理的纤维素材料)在合适的温度,例如50℃、55℃或60℃进行3-7日。通常条件为:1ml反应液,经洗涤或未洗涤的PCS,5%不溶性固形物,50mM乙酸钠pH5,1mM MnSO4,50℃、55℃或60℃,72小时,通过HPX-87H柱(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)进行糖分析。
纤维素材料:术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过共价交联至半纤维素的聚合木质素而加强。纤维素是脱水纤维二糖的均聚物,因此是直链β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,形成具有多种多样的取代基的复杂分支结构。尽管纤维素通常是多形的,但存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,农业残余物、草本材料(包括能源作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于Handbook on Bioethanol(Charles E.Wyman编),pp.105-118,Taylor&Francis,Washington D.C.;Wyman,1994,Bioresource Technology50:3-16;Lynd,1990,Applied Biochemistry and Biotechnology24/25:695-719;Mosier等,1999,Recent Progress in Bioconversion of Lignocellulosics,于Advances inBiochemical Engineering/Biotechnology,T.Scheper主编,Volume65,pp.23-40,Springer-Verlag,New York)。在本文中应理解的是,纤维素可以是木素纤维素的形式,木素纤维素是一种植物细胞壁材料,包含木质素、纤维素和半纤维素的混合基质。在一个优选的方面,纤维素材料是任何生物质材料。在另一个优选的方面,所述纤维素材料是木素纤维素,其包含纤维素、半纤维素和木质素。
在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能源作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。
在另一个方面,纤维素材料是芦竹(arundo)。在另一个方面,纤维素材料是蔗渣。在另一个方面,纤维素材料是竹子。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸秆。在另一个方面,纤维素材料是芒草属。在另一个方面,纤维素材料是橙皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是柳枝稷(switch grass)。在另一个方面,纤维素材料是麦杆。
在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是枞树(fir)。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是杨树。在另一个方面,纤维素材料是云杉。在另一个方面,纤维素材料是柳树。
在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是棉绒(cotton linter)。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
在另一个方面,纤维素材料是水生生物质。如用于本文中,“水生生物质”意指在水生环境中由光合作用过程产生的生物质。水生生物质可为藻类、挺水植物(emergent plant)、浮叶植物(floating-leaf plant)或沉水植物(submerged plant)。
纤维素材料可以按原样(as is)使用或进行预处理,预处理使用本领域已知的常规方法,如本文所述。在一个优选的方面,预处理纤维素材料。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框决定,所述开放阅读框以起始密码子如ATG、GTG或TTG开始,并且以终止密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
调控序列(control sequence):术语“调控序列”意指对编码本发明的成熟多肽的多核苷酸表达是必需的核酸序列。各个调控序列对于编码所述成熟多肽的多核苷酸可以是天然的(即,来自同一基因)或外源的(即,来自不同基因),或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,调控序列包括启动子和转录和翻译的终止信号。调控序列可以配备用于引入特异性限制位点的接头,所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。
内切葡聚糖酶:术语“内切葡聚糖酶”意指内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan4-glucanohydrolase)(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-D-糖苷键、混合的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和含有纤维素组分的其它植物材料中的β-1,4键的内水解(endohydrolysis)。内切葡聚糖酶活性可通过测量底物粘度的减少或由还原糖测定法(Zhang等,2006,Biotechnology Advances24:452-481)确定的还原端增加来确定。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法,在pH5,40℃使用羧甲基纤维素(CMC)作为底物来确定内切葡聚糖酶活性。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”意指线性的或环状的DNA分子,其包含编码多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的调控序列可操作地连接。
家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”或“GH61”在本文中定义为根据Henrissat B.,1991,A classification of glycosyl hydrolasesbased on amino-acid sequence similarities,Biochem.J.280:309-316,及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696属于糖苷水解酶家族61的多肽。该家族中的酶原先基于在一个家族成员测量到的非常弱的内切-1,4-β-D葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非经典的,且它们无法视为真正的(bona fide)糖苷酶。然而,基于当与纤维素酶或纤维素酶的混合物一同使用时,其增强木素纤维素分解的能力,它们被保留在CAZy分类中。
阿魏酸酯酶:术语“阿魏酸酯酶(feruloyl esterase)”意指4-羟基-3-甲氧基肉桂酰-糖水解酶(EC3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(其在“天然生物质”底物中通常为阿拉伯糖)的水解,以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)。阿魏酸酯酶也称作阿魏酸酯酶(ferulic acidesterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I或FAE-II。就本发明而言,阿魏酸酯酶活性是使用50mM乙酸钠pH5.0中的0.5mM阿魏酸对硝基苯酯作为底物确定的。一个单位的阿魏酸酯酶等于能够在pH5,25℃每分钟释放1微摩尔对硝基苯酚阴离子的酶量。
片段:术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如几个)氨基酸的多肽;其中所述片段具有木聚糖酶活性。在一个方面,片段含有SEQ ID NO:2的至少330个氨基酸残基,例如至少350个氨基酸残基,或至少370个氨基酸残基。在另一个方面,片段含有SEQ ID NO:4的至少300个氨基酸残基,例如至少315个氨基酸残基或至少330个氨基酸残基。在另一个方面,片段含有SEQ ID NO:6的至少300个氨基酸残基,例如至少320个氨基酸残基或至少340个氨基酸残基。在另一个方面,片段含有SEQ IDNO:8的至少300个氨基酸残基,例如至少315个氨基酸残基或至少330个氨基酸残基。在另一个方面,片段含有SEQ ID NO:10的至少260个氨基酸残基,例如至少275个氨基酸残基或至少290个氨基酸残基。在另一个方面,片段含有SEQ ID NO:12的至少290个氨基酸残基,例如至少305个氨基酸残基或至少320个氨基酸残基。在另一个方面,片段含有SEQ ID NO:14的至少290个氨基酸残基,例如至少305个氨基酸残基或至少320个氨基酸残基。在另一个方面,片段含有SEQ ID NO:16的至少300个氨基酸残基,例如至少315个氨基酸残基或至少330个氨基酸残基。在另一个方面,片段含有SEQ ID NO:18的至少320个氨基酸残基,例如至少335个氨基酸残基或至少350个氨基酸残基。在另一个方面,片段含有SEQ ID NO:20的至少300个氨基酸残基,例如至少315个氨基酸残基或至少330个氨基酸残基。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(例如几种)水解半纤维素材料的酶。参见,例如Shallom D.和Shoham Y.Microbial hemicellulases.Current Opinion In Microbiology,2003,6(3):219-228)。半纤维素酶是植物生物质降解中的关键成分。半纤维素酶的实例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素是支化和直链多糖的混杂集团,这些多糖通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为鲁棒(robust)的网络。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的多变的结构和组织形式需要许多酶的协同作用使其完全降解。半纤维素酶的催化模块为水解糖苷键的糖苷水解酶(GH),或水解乙酸或阿魏酸侧基的酯连接的糖酯酶(CE)。这些催化模块,基于其一级结构的同源性,可指派为GH和CE家族。一些家族,具有总体上类似的折叠,可进一步归类为宗族(clan),以字母标记(例如,GH-A)。最具信息性和最新的这些和其他糖活性酶的分类可在Carbohydrate-Active Enzymes(CAZy)数据库获得。半纤维素分解酶活性可根据Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752在合适的温度,例如50℃、55℃或60℃,和pH,例如5.0或5.5进行测量。
高严格条件:术语“高严格条件”意指对于长度至少100个核苷酸的探针,在42℃在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在65℃将载体材料最终洗涤三次,每次15分钟。
宿主细胞:术语“宿主细胞”意指适合于使用包含本发明多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的细胞类型。术语“宿主细胞”涵盖亲本细胞的任何由于在复制中发生的突变而不同于亲本细胞的后代。
分离的:术语“分离的”意指以不在自然界出现的形式或环境存在的物质。分离的物质的非限定性实例包括(1)任何非天然存在的物质,(2)任何至少部分地与一种或多种或全部与其天然伴随的天然存在的成分脱离的物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)任何相对于自然界中所见的该物质而言经过了人工修饰的物质;或(4)任何通过相对于与其天然伴随的其他组分增加该物质的量(例如,在宿主细胞中的重组产生;编码该物质的基因的多拷贝;以及使用比与编码该物质的基因天然伴随的启动子更强的启动子)而修饰的物质。
低严格条件:术语“低严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在50℃将载体材料最终洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面,根据预测SEQ ID NO:2(P244XT)的氨基酸1至20是信号肽的SignalP程序(Nielsen等,1997,Protein Engineering10:1-6),成熟多肽是SEQ IDNO:2的氨基酸21至406。在另一个方面,根据预测SEQ ID NO:4(P244XW)的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:4的氨基酸18至360。在另一个方面,根据预测SEQ ID NO:6(P244Y1)的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:6的氨基酸19至376。在另一个方面,根据预测SEQ ID NO:8(P244Y2)的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:8的氨基酸23至367。在另一个方面,根据预测SEQ ID NO:10(P23DM4)的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:10的氨基酸19至326。在另一个方面,根据预测SEQ ID NO:12(P249XY)的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:12的氨基酸21至354。在另一个方面,根据预测SEQ ID NO:14(P24MCW)的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:14的氨基酸18至355。在另一个方面,根据预测SEQ ID NO:16(P24MCX)的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:16的氨基酸20至366。在另一个方面,根据预测SEQ ID NO:18(P24FVF)的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:18的氨基酸18至381。在另一个方面,根据预测SEQ ID NO:20(P241KU)的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:20的氨基酸18至362。在本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有木聚糖酶活性的成熟多肽的多核苷酸。在一个方面,根据预测SEQ ID NO:1(D822JR)的核苷酸1至60编码信号肽的SignalP程序(Nielsen等,1997,见上),成熟多肽编码序列是SEQ ID NO:1或其cDNA序列的核苷酸61至1311。在另一个方面,根据预测SEQ ID NO:3(D822JT)的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:3或其cDNA序列的核苷酸52至1347。在另一个方面,根据预测SEQ ID NO:5(D822JW)的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:5或其cDNA序列的核苷酸55至1196。在另一个方面,根据预测SEQ ID NO:7(D822JX)的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:7或其cDNA序列的核苷酸67至1101。在另一个方面,根据预测SEQ ID NO:9(D6RM)的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:9或其cDNA序列的核苷酸55至1620。在另一个方面,根据预测SEQ ID NO:11(D82DB2)的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:11或其cDNA序列的核苷酸61至1362。在另一个方面,根据预测SEQ ID NO:13(D1316T)的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:13或其cDNA序列的核苷酸52至1510。在另一个方面,根据预测SEQ ID NO:15(D1315U)的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:15或其cDNA序列的核苷酸58至1098。在另一个方面,根据预测SEQ ID NO:17(D82PQC)的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:17或其cDNA序列的核苷酸52至1362。在另一个方面,根据预测SEQ ID NO:19(D72UED)的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:19或其cDNA序列的核苷酸52至1165。
中等严格条件:术语“中等严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在55℃将载体材料最终洗涤三次,每次15分钟。
中等-高严格条件:术语“中等-高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在60℃将载体材料最终洗涤三次,每次15分钟。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,其分离自天然存在的基因,或其经修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段,或其为合成的,其包含一个或多个调控序列。
可操作地连接:术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。
具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强的多肽”意指催化具有纤维素分解活性的酶对纤维素材料的水解的增强的GH61多肽。就本发明而言,通过测量来自由纤维素分解酶在下述条件下与对照水解相比较水解纤维素材料的还原糖增加或纤维二糖与葡萄糖的总量增加来确定纤维素分解增强活性:1-50mg总蛋白/g PCS中纤维素,其中总蛋白包含50-99.5%w/w的纤维素分解酶蛋白,及0.5-50%w/w的具有纤维素分解增强活性的GH61多肽的蛋白质,在合适的温度,例如50℃、55℃或60℃和pH,例如5.0或5.5历时1-7天,对照水解使用等量的总蛋白加载量而无纤维素分解增强活性(1-50mg纤维素分解蛋白/g PCS中纤维素)进行。在一个优选的方面,使用在总蛋白重量的2-3%的米曲霉β-葡糖苷酶(根据WO02/095014在米曲霉中重组产生)或者总蛋白质量的2-3%的烟曲霉β-葡糖苷酶(如WO2002/095014所述在米曲霉中重组产生)的纤维素酶蛋白加载量存在下的1.5L(Novozymes A/S,Bagsvaerd,Denmark)的混合物作为纤维素分解活性的来源。
具有纤维素分解增强活性的GH61多肽通过降低达到相同水解水平所需的纤维素分解酶的量而增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,例如至少1.05倍,至少1.10倍,至少1.25倍,至少1.5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,或至少20倍。
预处理的玉米秸秆:术语“PCS”或“预处理的玉米秸秆”意指通过用热和稀硫酸处理、碱预处理或中性预处理的源自玉米秸秆的纤维素材料。
序列同一性:参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends Genet.16:276-277),优选3.0.0、5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定。使用的参数为缺口打开罚分(gap open penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(同样的残基×100)/(比对长度-比对中缺口的总数)
就本发明而言,两个核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文),优选5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的参数为缺口打开罚分10,缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(同样的脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)
亚序列:术语“亚序列(subsequence)”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如几个)核苷酸的多核苷酸;其中所述亚序列编码具有木聚糖酶活性的片段。在一个方面,亚序列含有SEQ ID NO:1的至少990个核苷酸,例如至少1050个核苷酸,或至少1110个核苷酸。在另一个方面,亚序列含有SEQ ID NO:3的至少900个核苷酸,例如至少945个核苷酸或至少990个核苷酸。在另一个方面,亚序列含有SEQ ID NO:5的至少900个核苷酸,例如至少960个核苷酸或至少1020个核苷酸。在另一个方面,亚序列含有SEQ ID NO:7的至少900个核苷酸,例如至少945个核苷酸或至少990个核苷酸。在另一个方面,亚序列含有SEQ ID NO:9的至少780个核苷酸,例如至少825个核苷酸或至少870个核苷酸。在另一个方面,亚序列含有SEQ ID NO:11的至少870个核苷酸,例如至少915个核苷酸或至少960个核苷酸。在另一个方面,亚序列含有SEQ ID NO:13的至少870个核苷酸,例如至少915个核苷酸或至少960个核苷酸。在另一个方面,亚序列含有SEQ ID NO:15的至少900个核苷酸,例如至少945个核苷酸或至少990个核苷酸。在另一个方面,亚序列含有SEQ IDNO:17的至少960个核苷酸,例如至少1005个核苷酸或至少1050个核苷酸。在另一个方面,亚序列含有SEQ ID NO:19的至少900个核苷酸,例如至少945个核苷酸或至少990个核苷酸。
变体:术语“变体”意指在一个或多个(例如几个)位置包含改变,即取代、插入和/或缺失的具有木聚糖酶活性的多肽。取代意指将占据某位置的氨基酸用不同的氨基酸替代;缺失意指去除占据某位置的氨基酸;而插入意指在邻接并紧接着占据某位置的氨基酸之后添加氨基酸。
非常高严格条件:术语“非常高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在70℃将载体材料最终洗涤三次,每次15分钟。
非常低严格条件:术语“非常低严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在45℃将载体材料最终洗涤三次,每次15分钟。
含木聚糖材料:术语“含木聚糖材料”意指任何包含含有β-(1-4)连接的木糖残基骨架的植物细胞壁多糖的材料。陆生植物的木聚糖是具有β-(1-4)-吡喃木糖骨架的杂聚物,其具有短的糖链分支。它们包含D-葡糖醛酸或其4-O-甲基醚,L-阿拉伯糖和/或多种包含D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖的寡糖。木聚糖类型的多糖可分为均木聚糖(homoxylan)和杂木聚糖(heteroxylan),后者包括葡糖醛酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和复合杂木聚糖。参见,例如Ebringerova等,2005,Adv.Polym.Sci.186:1-67。
在本发明的工艺中,可使用任何含有木聚糖的材料。在一个优选的方面,所述含木聚糖材料是木素纤维素。
木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物学活性。两种测定木聚糖分解活性的基础方法包括:(1)测量总木聚糖分解活性,和(2)测量单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(α-glucuronyl esterase))。最近在木聚糖分解酶测定法的进展总结于几个公开文献中,包括Biely和Puchard,Recent progress in the assays of xylanolytic enzymes,2006,Journal ofthe Science of Food and Agriculture86(11):1636-1647;Spanikova和Biely,2006,Glucuronoyl esterase-Novel carbohydrate esterase produced by Schizophyllumcommune,FEBS Letters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely,和Kubicek,1997,The beta-D-xylosidase of Trichoderma reesei isa multifunctional beta-D-xylan xylohydrolase,Biochemical Journal321:375-381。
总木聚糖降解活性可通过确定从多种类型的木聚糖形成的还原糖来测量,所述木聚糖包括例如燕麦小麦(oat spelt)、山毛榉木(beechwood)和落叶松木(larchwood)木聚糖,或者可通过光度法确定从多种共价染色的木聚糖释放出的染色的木聚糖片段来测量。最常见的总木聚糖分解活性测定法基于从多聚的4-O-甲基葡糖醛酸木聚糖产生还原糖,如Bailey,Biely,Poutanen,1992,Interlaboratory testing of methods for assay of xylanase activity,Journal ofBiotechnology23(3):257-270中所述。木聚糖酶活性亦可用0.2%AZCL-阿拉伯木聚糖作为底物在37℃在0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH6中来确定。一个单位的木聚糖酶活性定义为在37℃,pH6在200mM磷酸钠pH6缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青蛋白(azurine)。
就本发明而言,木聚糖降解活性是通过测量由木聚糖降解酶在下述通常条件下造成的桦木木聚糖(Sigma Chemical Co.,Inc.,St.Louis,MO,USA)水解的增加来确定的:1ml反应,5mg/ml底物(总固形物),5mg木聚糖分解蛋白质/g底物,50mM乙酸钠,pH5,50℃,24小时,如Lever,1972,A new reactionfor colorimetric determination of carbohydrates,Anal.Biochem47:273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定法进行糖分析。
木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(1,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8),其催化木聚糖中1,4-β-D-木糖苷键的内水解。就本发明而言,木聚糖酶活性可用0.2%AZCL-阿拉伯木聚糖作为底物在37℃,pH6在0.01%X-100和200mM磷酸钠缓冲液中或用0.2%AZCL-木聚糖作为底物在50℃,pH5.0在0.01%X-100和20mM乙酸钠缓冲液中(参见实施例17)确定。一个单位的木聚糖酶活性定义为在37℃,pH6在200mM磷酸钠pH6缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖或在50℃,pH5在20mM乙酸钠缓冲液pH5中从0.2%AZCL-木聚糖每分钟产生1.0毫摩尔(mmole)天青蛋白。或者,木聚糖酶活性可根据实施例16使用桦木木聚糖作为底物确定。
在一个方面,本发明的多肽具有SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽的纤维素分解增强活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,或至少100%。
发明详述
具有木聚糖酶活性的多肽
在一个实施方案中,本发明涉及分离的多肽,其与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:12的成熟多肽具有至少65%,例如至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:4或SEQ ID NO:10的成熟多肽具有至少70%,例如至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQID NO:14或SEQ ID NO:16的成熟多肽具有至少75%,例如至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:6或SEQ ID NO:8的成熟多肽具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:20的成熟多肽具有至少85%,例如至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:18的成熟多肽具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;所述多肽具有木聚糖酶活性。在一个方面,所述多肽与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽相差多至10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个氨基酸。
本发明的多肽优选包含或组成为SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQID NO:16,SEQ ID NO:18,或SEQ ID NO:20的氨基酸序列或其等位变体;或为其具有木聚糖酶活性的片段。在另一个方面,所述多肽包含或组成为SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ IDNO:20的成熟多肽。在另一个方面,所述多肽包含或组成为SEQ ID NO:2的氨基酸21至406,SEQ ID NO:4的氨基酸18至360,SEQ ID NO:6的氨基酸19至376,SEQ ID NO:8的氨基酸23至367,SEQ ID NO:10的氨基酸19至326,SEQ ID NO:12的氨基酸21至354,SEQ ID NO:14的氨基酸18至355,SEQ ID NO:16的氨基酸20至366,SEQ ID NO:18的氨基酸18至381,或SEQID NO:20的氨基酸18至362。
在另一个实施方案中,本发明涉及具有木聚糖酶活性的分离的多肽,其由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ IDNO:19的成熟多肽编码序列,(ii)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:17,或SEQID NO:19的cDNA序列,或(iii)(i)或(ii)的全长互补物(Sambrook等,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,NewYork)。
可利用SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19的多核苷酸或其亚序列,以及SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20的多肽或其成熟多肽,或其片段设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有木聚糖酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的细胞的基因组DNA或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少15,例如至少25,至少35,或至少70个核苷酸。优选地,所述核酸探针是至少100个核苷酸的长度,例如,至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个核苷酸,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。
可从由这样的其它菌株制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码具有木聚糖酶活性的多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ IDNO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19其成熟多肽编码序列,或其亚序列杂交的克隆或DNA,将所述载体材料用在Sounthern印迹中。
就本发明而言,杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19,(ii)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19的成熟多肽编码序列,(iii)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:17,或SEQ ID NO:19的cDNA序列,(iv)它们的全长互补物,或(v)它们的亚序列。可使用例如X射线胶片(X-ray film)或其他任何本领域中已知的检测手段检测在这些条件下与核酸探针杂交的分子。
在一个方面,所述核酸探针是编码SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQID NO:16,SEQ ID NO:18,或SEQ ID NO:20的多肽或其成熟多肽,或它们的片段的多核苷酸。在另一个方面,所述核酸探针是SEQ ID NO:1,SEQ IDNO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19或SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:17,或SEQ ID NO:19的cDNA序列。
在另一个实施方案中,本发明涉及具有木聚糖酶活性的分离的多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:11的成熟多肽编码序列或其cDNA序列具有至少65%,例如至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列或SEQ ID NO:9的成熟多肽编码序列或其cDNA序列具有至少70%,例如至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:13的成熟多肽编码序列或其cDNA序列或SEQ ID NO:15的成熟多肽编码序列具有至少75%,例如至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列或SEQ ID NO:7的成熟多肽编码序列具有至少80%,例如至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:19的成熟多肽编码序列或其cDNA序列具有至少85%,例如至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;或与SEQ IDNO:17的成熟多肽编码序列或其cDNA序列具有至少90%,例如至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;所述多肽具有木聚糖酶活性。。
在另一个实施方案中,本发明涉及SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽在一个或多个(例如几个)位置包含取代、缺失和/或插入的变体。在一个实施方案中,导入SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ IDNO:20的成熟多肽的氨基酸取代、缺失和/或插入的数量是至多10个,例如1、2、3、4、5、6、7、8、9或10个。氨基酸改变可为性质上次要的,即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly histidine tract)、抗原表位(antigenicepitope)或结合域(binding domain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
或者,氨基酸改变具有导致多肽的物理化学特性改变的性质。例如,氨基酸改变可改善多肽的热稳定性,改变底物特异性,改变最适pH等。
可以根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得到的突变分子是否具有木聚糖酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。另参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也可以通过对结构的物理分析,结合针对推定的接触位点氨基酸的突变来确定,结构通过以下这些技术来测定:如核磁共振、晶体学、电子衍射或光亲和标记。参见例如de Vos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。也可以从与相关多肽的同一性分析来推断必需氨基酸的身份。
可使用已知的诱变、重组和/或改组方法,然后进行相关的筛选过程,如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或者WO95/22625所公开的那些,进行一个或多个氨基酸取代、缺失和/或插入并加以测试。其他可使用的方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochemistry30:10832-10837;美国专利号5,223,409;WO92/06204)和区域定向诱变(region-directedmutagenesis)(Derbyshire等,1986,Gene46:145;等,1988,DNA7:127)。
诱变/改组方法可与高通量、自动筛选方法组合以检测由宿主细胞表达的经克隆、诱变的多肽的活性(Ness等,1999,Nature Biotechnology17:893-896)。编码活性多肽的经诱变的DNA分子可自宿主细胞回收并使用本领域标准方法迅速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。
所述多肽可为杂合多肽,其中一个多肽的区域融合于另一个多肽的区域的N端或C端。
所述多肽可为融合多肽或可切开的融合多肽,其中另一个多肽融合于本发明的多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们符合读框(in frame),并且使融合多肽的表达在相同启动子和终止子的控制下。融合蛋白亦可使用内蛋白(intein)技术构建,其中融合物在翻译后产生(Cooper等,1993,EMBO J.12:2575-2583;Dawson等,1994,Science266:776-779)。
融合多肽还可在两个多肽之间包含切割位点。在分泌融合多肽时,所述位点就被切开,释放所述两个多肽。切开位点的实例包括,但不限于,公开于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512);Collins-Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248;以及Stevens,2003,Drug Discovery World4:35-48中的位点。
具有木聚糖酶活性的多肽的来源
本发明的具有木聚糖酶活性的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思应为由多核苷酸编码的多肽由所述来源产生,或由其中插入了来自所述来源的多核苷酸的菌株产生。在一个方面,从给定来源获得的多肽是胞外分泌的。
在一个方面,所述多肽是柱顶孢属(Scytalidium)多肽。在另一个方面,所述多肽是嗜热柱顶孢(Scytalidium thermophilum)多肽。在另一个方面,所述多肽是Malbranchea多肽,在另一个方面,所述多肽是樟绒枝霉(Malbrancheacinnamomea)多肽。在另一个方面,所述多肽是棒囊壳属(Corynascus)多肽。在另一个方面,所述多肽是嗜热棒囊壳(Corynascus thermophilus)多肽。在另一个方面,所述多肽是嗜热棒囊壳CBS174.70多肽。在另一个方面,所述多肽是青霉属(Penicillium)多肽。在另一个方面,所述多肽是草酸青霉(Penicillium oxalicum)多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSMZ)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
可以利用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接获得自自然材料(例如,土壤、堆肥、水等)的DNA样品,鉴定并获得所述多肽。用于直接从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。随后可通过类似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来得到编码所述多肽的多核苷酸。一旦用探针检测到编码多肽的多核苷酸,就可以使用本领域普通技术人员已知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。
多核苷酸
本发明亦涉及编码如本文中所述的本发明的多肽的分离的多核苷酸。
用于分离或克隆多核苷酸的技术在本领域中是已知的,并包括从基因组DNA或cDNA,或其组合分离。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆多核苷酸。参见,例如,Innis等,1990,PCR:A Guide toMethods and Application,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于多核苷酸的扩增(NASBA)。可以从柱顶孢属、Malbranchea、棒囊壳属或青霉属的菌株,或相关生物体克隆所述多核苷酸,因此,例如可为所述多核苷酸的多肽编码区的等位基因变体或种间变体(species variant)。
修饰编码本发明多肽的多核苷酸对于合成与所述多肽基本上相似的多肽而言可能是必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的变体。可在作为SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17或SEQ ID NO:19的成熟多肽编码序列,或SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:17或SEQ ID NO:19的成熟多肽编码序列的cDNA序列呈现的多核苷酸的基础上和/或通过引入如下核苷酸取代来构建变体:所述核苷酸取代不导致多肽氨基酸序列的改变,但其符合意欲产生酶的宿主生物体的密码子选择;或者所述核苷酸取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,Protein Expressionand Purification2:95-107。
核酸构建体
本发明还涉及包含本发明的多核苷酸的核酸构建体,所述多核苷酸与一个或多个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作所述多核苷酸以便于多肽的表达。取决于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
调控序列可为启动子,其由用于表达编码本发明的多肽的多核苷酸的宿主细胞所识别的多核苷酸。启动子含有介导多肽的表达的转录调控序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从下述获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等,1988,Gene69:301-315)、天蓝链霉菌琼脂糖酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy ofSciences USA75:3727-3731),以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另外的启动子在"Useful proteins from recombinant bacteria"于Gilbert等,1980,Scientific American,242:74-94中;和在Sambrook等,1989,见上文中描述。串联启动子的实例公开于WO99/43835。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucor miehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、里氏木霉翻译延伸因子,以及NA2-tpi启动子(一种修饰的启动子,其来自在曲霉属中性α-淀粉酶基因,其中未翻译的前导序列由曲霉属丙糖磷酸异构酶的基因的未翻译的前导序列所替代;非限制性实例包括修饰的启动子,其来自黑曲霉中性α-淀粉酶的基因,其中未翻译的前导序列由构巢曲霉或米曲霉丙糖磷酸异构酶的基因的未翻译的前导序列所替代);和它们的突变的、截短的和杂合的启动子。其它启动子描述于美国专利号6,011,147。
在酵母宿主中,有用的启动子从如下的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423-488描述。
调控序列也可以是转录终止子,其由宿主细胞识别以终止转录。所述终止子与编码所述多肽的多核苷酸的3’末端可操作地连接。在本发明中,可使用在宿主细胞中有功能的任何终止子。
对于细菌宿主细胞优选的终止子从如下的基因获得:克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)和大肠杆菌核糖体RNA(rrnB)。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是启动子下游和基因的编码序列上游的mRNA稳定化区,其增加所述基因的表达。
合适的mRNA稳定化区的实例从如下的基因获得:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等,1995,Journal ofBacteriology177:3465-3471)。
调控序列还可为前导序列,其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在宿主细胞中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与多核苷酸的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在宿主细胞中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.Cellular Biol.15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的N端相连的信号肽,并指导所述多肽进入细胞分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列,其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。当编码序列天然不含有信号肽编码序列时,外源信号肽编码序列可能是必需的。或者,可直接用外源信号肽编码序列取代天然信号肽编码序列以增强多肽的分泌。然而,可使用指导表达的多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:芽孢杆菌属NCIB11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。
调控序列还可以是前肽编码序列,其编码位于多肽N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。
当信号肽和前肽序列二者均存在时,将前肽序列置于紧接着(next to)多肽的N端,并且将信号肽序列置于紧接着前肽序列的N端。
同样理想的是添加调节序列,其相对于宿主细胞的生长来调节多肽的表达。调节序列的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节序列包括lac、tac和trp操纵基因系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子和里氏木霉纤维二糖水解酶II启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。多种核苷酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码多肽的多核苷酸。或者,可以通过在适当的用于表达的载体中插入包含所述多核苷酸的核酸构建体或多核苷酸来表达所述多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的调控序列可操作地连接以供表达。
重组表达载体可以是任何能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达的载体(例如,质粒或病毒)。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自我复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
所述载体优选地含有一个或多个选择性标记,以便于容易地选择经转化、转染、转导等的细胞。选择性标记是这样的基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素或四环素抗性。对于酵母宿主细胞合适的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于adeA(磷酸核糖氨基咪唑琥珀羧酰胺合酶,phosphoribosylaminoimidazole-succinocarboxamide synthase)、adeB(磷酸核糖氨基咪唑合酶,phosphoribosyl-aminoimidazole synthase)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选用于木霉属细胞的是adeA、adeB、amdS、hph和pyrG基因。
选择性标记可为WO2010/039889中所述的双重选择性标记系统。在一个方面,所述双重选择性标记是hph-tk双重选择性标记系统。
所述载体优选含有允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制的元件。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置的额外的多核苷酸。为了增加在精确位置整合的可能性,整合元件应含有足够数量的与相应的目标序列具有高度序列同一性的核酸,如100至10,000碱基对,400至10,000碱基对,和800至10,000碱基对,以提高同源重组的概率。整合元件可为任何与宿主细胞基因组中的目标序列同源的序列。此外,整合元件可为非编码或编码的多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是在细胞中发挥功能的介导自主复制的任何质粒复制子(replicator)。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67;Cullen等,1987,Nucleic Acids Res.15:9163-9175;WO00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据WO00/24883中公开的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,其包含本发明的多核苷酸可操作地连接于一个或多个指导本发明多肽的产生的调控序列。将包含多核苷酸的构建体或载体引入宿主细胞,使所述构建体或载体如前所述作为染色体整合体或者作为自我复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何由于复制过程中发生的突变而不同于亲本细胞的后代。宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于,弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。
细菌宿主细胞可为任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
细菌宿主细胞还可为任何链球菌属细胞,包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。
细菌宿主细胞还可为任何链霉菌属细胞,包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:原生质体转化(参见,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),感受态细胞转化(参见,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见,例如,Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞:原生质体转化,电穿孔(参见,例如,Gong等,2004,Folia Microbiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞:电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞:天然感受态(natural competence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-207),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可使用本领域已知的将DNA引入宿主细胞的任何方法。
宿主细胞还可为真核生物,如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可为真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(mitosporicfungi)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)。
真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,Passmore,和Davenport编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowia lipolytica)细胞。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢霉属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可为泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporium inops、嗜角质金孢子菌、Chrysosporium lucknowense、Chrysosporium merdarium、毡金孢子菌、Chrysosporium queenslandicum、热带金孢子菌、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、嗜热柱顶孢、土生梭孢霉、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474以及Christensen等,1988,Bio/Technology6:1419-1422中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume194,pp182-187,Academic Press,Inc.,New York;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。
产生方法
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有助于产生多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和任选地(b)回收所述多肽。在一个方面,所述细胞是柱顶孢属细胞。在另一个方面,所述细胞是嗜热柱顶孢细胞。在另一个方面,所述细胞是Malbranchea细胞。在另一个方面,所述细胞是樟绒枝霉细胞。在另一个方面,所述细胞是棒囊壳属细胞。在另一个方面,所述细胞是嗜热棒囊壳细胞。在另一个方面,所述细胞是嗜热棒囊壳CBS174.70细胞。在另一个方面,所述细胞是青霉属细胞。在另一个方面,所述细胞是草酸青霉细胞。
本发明还涉及用于产生本发明的多肽的方法,其包括:(a)在有助于产生多肽的条件下培养本发明的重组宿主细胞;和任选地(b)回收所述多肽。
所述宿主细胞使用本领域已知的方法在适合于产生所述多肽的营养培养基中培养。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下的摇瓶培养,或实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽可以从所述培养基中直接回收。如果多肽不分泌,其可以从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽特异性的方法来检测多肽。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶测定法(enzyme assay)可用于确定多肽的活性。
多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。在一个方面,回收了包含本发明的多肽的全发酵液。
多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,Janson和Ryden编,VCH Publishers,New York,1989)。
在另一个方面,不回收多肽,而是使用表达所述多肽的本发明的宿主细胞作为所述多肽的来源。
植物
本发明还涉及分离的植物,例如,转基因植物、植物部分或植物细胞,其包含本发明的多核苷酸,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,可以按原样(as such)将含有该多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheological properties),或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如被分离用来促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的后代。
表达多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码多肽的一个或多个表达构建体导入植物宿主基因组或叶绿体基因组,并且将所得的经修饰的植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体便利地是包含编码多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定植物细胞有用的选择性标记,在所述植物细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分如种子或叶。调节序列由例如Tague等,1988,Plant Physiology86:506所述。
对于组成性表达,可以使用35S-CaMV、玉米泛素1或稻肌动蛋白1启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等,1991,Plant Cell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant Cell Physiol.39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,J.Plant Physiol.152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant Cell Physiol.39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiol.102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,Plant Mol.Biol.26:85-93),来自稻的aldP基因启动子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,Plant Mol.Biol.22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellic acid),和重金属。
启动子增强子元件也可以用于实现多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码多肽的多核苷酸之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术导入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。
根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(gene transfer),是一种产生转基因双子叶植物(其综述,参见Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38),和用于转化单子叶植物的方法,虽然对于这些植物可使用其他的转化方法。一种产生转基因单子叶植物的方法是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developing embryos)(Christou,1992,Plant J.2:275-281;Shimamoto,1994,Curr.Opin.Biotechnol.5:158-162;Vasil等,1992,Bio/Technology10:667-674)。转化单子叶植物的一种替代方法是基于原生质体转化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其它转化方法包括描述于美国专利号6,395,966和7,151,204中的那些(两者均通过提述以其整体并入本文)。
转化之后,根据本领域熟知的方法选择具有导入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
除了直接用本发明的构建体直接转化具体植物基因型之外,还可通过将具有构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言,可将编码多肽的构建体通过杂交而引入特定植物品种,而根本无需直接转化该给定品种的植物。因此,本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物,还包括此类植物的后代(progeny)。如用于本文的,后代可指依照本发明制备的亲本植物任何世代的后裔(offspring)。此种后代可包含依据本发明制备的DNA构建体。杂交导致转基因通过将起始种系供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例描述于美国专利号7,151,204。
植物通过回交转化方法生成。举例而言,该植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。
可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势,在于其可用于避免由表型变异导致的错误。进一步,遗传标记可在特定杂交的个体后代中提供有关良种种质相对程度的数据。举例而言,当本不(otherwise)具有非农艺学所需的遗传背景但具有所需性状的植物与良种亲本杂交时,可使用遗传标记来选择不仅具有目标性状,还具有相对较大比例的所需种质的后代。以此方式,使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。
本发明亦涉及产生本发明的多肽的方法,其包括:(a)在有助于产生所述多肽的条件下培养转基因植物或植物细胞,所述植物或植物细胞包含编码多肽的多核苷酸;和任选地(b)回收所述多肽。
去除或减少木聚糖酶活性
本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。
可以使用本领域熟知的方法(例如,插入、破坏、替代或缺失)通过减少或消除多核苷酸的表达来构建突变体细胞。在一个优选的方面,所述多核苷酸是失活的。待修饰或失活的多核苷酸可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响多核苷酸表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。
可以通过向亲本细胞施以诱变,并且选择其中已将多核苷酸的表达减少或消除的突变细胞来进行多核苷酸的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。
适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethyl methane sulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些试剂时,通常通过如下方法来进行所述诱变:在合适条件下存在选定的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。
多核苷酸的修饰或失活也可以通过插入、取代或缺失基因中的一个或多个核苷酸或其转录或翻译所需的调控元件实现。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰的多核苷酸的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。
消除或减少多核苷酸表达的便利方式的例子有基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷性的核酸序列,然后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性多核苷酸。可能理想的是所述缺陷性多核苷酸还编码标记,其可用于选择其中多核苷酸被修饰或破坏的转化子。在一个方面,用可选择的标记(如本文所述的那些)来破坏所述多核苷酸。
本发明亦涉及在细胞中抑制具有木聚糖酶活性的多肽的表达的方法,其包括向细胞施用或在细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的亚序列。在一个优选的方面,所述dsRNA长度为约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。
所述dsRNA优选为小干扰RNA(siRNA)或微RNA(miRNA)。在一个优选的方面,所述dsRNA是用于抑制转录的小干扰RNA。在另一个优选的方面,所述dsRNA是用于抑制翻译的微RNA。
本发明亦涉及这样的双链RNA(dsRNA)分子,其包含SEQ ID NO:1,SEQID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19的成熟多肽编码序列的一部分,以供在细胞中抑制所述多肽的表达。尽管本发明并不受任何具体作用机制的限制,但所述dsRNA可进入细胞并导致类似或相同序列的单链RNA(ssRNA),包括内源mRNA的降解。当细胞暴露于dsRNA时,来自同源基因的mRNA通过称为RNA干扰(RNAi)的过程受选择性降解。
本发明的dsRNA可用于基因沉默。在一个方面,本发明提供了使用本发明的dsRNAi选择性降解RNA的方法。该方法可在体外、离体或体内实施。在一个方面,所述dsRNA分子可用于在细胞、器官或动物中生成功能丧失的突变。用于制备和使用dsRNA分子选择性降解RNA的方法是本领域中公知的,参见,例如美国专利号6,489,127;6,506,559;6,511,824;和6,515,109。
本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的多核苷酸或其调控序列的破坏或缺失或编码所述多肽的基因的沉默,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。
多肽缺陷型突变细胞作为表达天然和异源多肽的宿主细胞特别有用。所以,本发明进一步涉及生产天然或异源多肽的方法,其包括:(a)在有助于生产多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”意指对宿主细胞不是天然的多肽,例如,天然蛋白的变体。宿主细胞可包含超过一个拷贝的编码所述天然或异源多肽的多核苷酸。
用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。
本发明用于产生基本上无木聚糖酶活性的产物的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。木聚糖酶缺陷细胞也可以用于表达在制药上有意义的异源蛋白质例如激素、生长因子、受体等。术语“真核多肽”不仅包括天然多肽,也包括通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强了活性、热稳定性、pH耐受性等的多肽,例如酶。
在其他方面,本发明涉及基本上无木聚糖酶活性的蛋白质产物,其通过本发明的方法产生。
发酵液配制物或细胞组合物
本发明亦涉及发酵液配制物和细胞组合物,其包含本发明的多肽。所述发酵液产物进一步包含用于发酵工艺的其它成分,例如细胞(包括含有编码本发明的多肽的基因的宿主细胞,其用于产生感兴趣的多肽),细胞碎片,生物质,发酵培养基和/或发酵产物。在一些实施方案中,所述组合物是含有机酸的已杀灭细胞的全培养液,已被杀灭的细胞和/或细胞碎片,以及培养基。
术语“发酵液”用于本文中指由细胞发酵产生、不经历或仅经历最低限的回收和/或纯化的制备物。举例而言,当将微生物培养物生长至饱和,在限制碳的条件下温育以允许蛋白合成(例如由宿主细胞表达酶),并分泌入细胞培养基时,产生发酵液。所述发酵液可含有在发酵终止时得到的发酵材料的未分级或分级的内含物。通常而言,发酵液是未分级的,并包含去除(例如通过离心)微生物细胞(例如丝状真菌细胞)之后存在的用过的培养基以及细胞碎片。在一些实施方案中,所述发酵液含有用过的细胞培养基,胞外酶,和能成活的和/或不能成活的(viable and/or nonviable)微生物细胞。
在一个实施方案中,所述发酵液配制物和细胞组合物包含第一有机酸组分和第二有机酸组分,所述第一有机酸组分包含至少一种1-5碳的有机酸和/或其盐,而所述第二有机酸组分包含至少一种6个或更多个碳的有机酸和/或其盐。在一个具体实施方案中,所述第一有机酸组分是乙酸、甲酸、丙酸、它们的盐,或前述两种或更多种的混合物,而所述第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、它们的盐,或前述两种或更多种的混合物。
在一个方面,所述组合物含有有机酸,并任选地进一步含有已被杀灭的细胞和/或细胞碎片。在一个实施方案中,从已杀灭细胞的全培养液中移除所述已被杀灭的细胞和/或细胞碎片以提供不含这些组分的组合物。
所述发酵液配制物或细胞组合物可进一步包含防腐剂和/或抗微生物(例如抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾和其它本领域中已知的。
所述发酵液配制物或细胞组合物可进一步包含多种酶活性,如一种或多种(例如几种)选自下组的酶:纤维素酶、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。所述发酵液配制物或细胞组合物亦可包含一种或多种(例如几种)选自下组的酶:水解酶、异构酶、连接酶、裂合酶、氧还酶或转移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
所述已杀灭细胞的全培养液或组合物可含有在发酵终止时得到的发酵材料的未分级内含物。通常而言,所述已杀灭细胞的全培养液或组合物含有在将微生物细胞(例如丝状真菌细胞)生长至饱和,并在限制碳的条件下温育以允许蛋白合成(例如,表达纤维素酶和葡糖苷酶)之后存在用过的培养基以及细胞碎片。在一些实施方案中,所述已杀灭细胞的全培养液或组合物含有用过的细胞培养基,胞外酶,和已被杀灭的丝状真菌细胞。在一些实施方案中,在已杀灭细胞的全培养液或组合物中存在的微生物细胞可使用本领域中已知的方法渗透和/或裂解。
如本文中所述的全培养液或细胞组合物通常为液体,但可含有不溶性组分,如已被杀灭的细胞、细胞碎片、培养基组分和/或不溶性酶。在一些实施方案中,可去除不溶性组分以提供澄清的液体组合物。
本发明的全培养液配制物和细胞组合物可通过WO90/15861或WO2010/096673中描述的方法来产生。
下文给出了本发明的组合物的优选用途的实施例。所述组合物的剂量和组合物使用的其它条件可基于本领域已知方法确定。
酶组合物
本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富集了此种多肽。术语“富集了”表明所述组合物的内切葡聚糖酶活性以例如至少1.1的富集因子增加。
所述组合物可包含本发明的多肽作为主要酶组分,例如单组分组合物。或者,所述组合物可包含多种酶活性,如选自下组的一种或多种(例如几种)酶:纤维素酶、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。所述发组合物亦可包含一种或多种(例如几种)选自下组的酶:水解酶,异构酶,连接酶,裂合酶,氧还酶或转移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。所述组合物可依照本领域中已知的方法制备,并可为液体或干组合物的形式。所述组合物可依照本领域中已知的方法稳定化。
下文中给出本发明的组合物的优选用途的实例。组合物的剂量和组合物使用的其它条件可给予本领域已知的方法来确定。
用途
本发明还涉及下述使用具有木聚糖酶活性的多肽或其组合物的工艺。
本发明还涉及降解纤维素材料或含木聚糖材料的方法,其包括:在本发明的具有木聚糖酶活性的多肽的存在下,用酶组合物处理纤维素材料或含木聚糖材料。在一个方面,所述工艺进一步包括回收已降解或转化的纤维素材料或含木聚糖材料。所述纤维素材料或含木聚糖材料的降解或转化的可溶性产物可与不溶性纤维素材料或含木聚糖材料使用本领域已知的方法分离,如例如离心、过滤或重力沉降。
本发明还涉及产生发酵产物的工艺,其包括:(a)在本发明的具有木聚糖酶活性的多肽的存在下,用酶组合物糖化纤维素材料或含木聚糖材料;(b)用一种或多种(例如几种)发酵微生物发酵经糖化的纤维素材料或含木聚糖材料以产生发酵产物;和(c)从发酵回收发酵产物。
本发明还涉及发酵纤维素材料或含木聚糖材料的工艺,其包括:用一种或多种(例如几种)发酵微生物发酵纤维素材料或含木聚糖材料,其中所述纤维素材料或含木聚糖材料是在本发明的具有木聚糖酶活性的多肽的存在下用酶组合物糖化的。在一个方面,纤维素材料或含木聚糖材料的发酵产生发酵产物。在另一个方面,所述工艺还包括从发酵回收发酵产物。
本发明的工艺可以用于将纤维素材料或含木聚糖材料糖化成可发酵糖,并且将可发酵糖转化成很多有用的发酵产物,例如燃料、饮用乙醇和/或平台化学品(platform chemical)(例如酸、醇、酮、气体等)。从纤维素材料或含木聚糖材料产生期望的发酵产物通常涉及预处理、酶水解(糖化)和发酵。
根据本发明的纤维素材料或含木聚糖材料的处理可以使用本领域的常规方法完成。此外,本发明的工艺可使用经配置以依照发明操作的任何常规生物质加工设备进行。
水解(糖化)和发酵,分别的或同时的,包括但不限于,分离的水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、分离的水解和共发酵(SHCF)、混合的水解和共发酵(HHCF),和直接微生物转化(DMC),有时也称为联合生物加工(consolidated bioprocessing,CBP)。SHF使用分离的处理步骤以首先将纤维素材料酶水解为可发酵糖,例如,葡萄糖,纤维二糖和戊糖单体,然后将可发酵糖发酵成为乙醇。在SSF中,纤维素材料的酶水解和糖变为乙醇的发酵组合在一个步骤中(Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.和Himmel,M.,1999,Enzymes,energy and the environment:A strategic perspective on the U.S.Department ofEnergy’s research and development activities for bioethanol,Biotechnol.Prog.15:817-827)。HHF在同时糖化和水解步骤之外,还包括单独的水解步骤,所述各步骤可以在同一个反应器中进行。HHF过程中的步骤可以在不同的温度进行,即,高温酶法糖化,然后在发酵菌株能够耐受的较低温度进行SSF。DMC在一个或多个(例如几个)步骤中组合了所有三个过程(酶产生、水解和发酵),其中使用相同的生物体产生用于将纤维素材料转化成可发酵糖并将可发酵糖转化成终产物的酶(Lynd L.R.,Weimer,P.J.,van Zyl,W.H.,和Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentals and biotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文可以理解的是,任何本领域中已知的方法,包括预处理、酶水解(糖化)、发酵,或它们的组合,都可用于实施本发明的工艺。
常规设备可包括补料分批式搅拌反应器、分批式搅拌反应器、具有超滤的连续流搅拌反应器和/或连续活塞流柱式反应器(Fernanda de CastilhosCorazza,Flávio Faria de Moraes,Gisella Maria Zanin和Ivo Neitzel,2003,Optimal control in fed-batch reactor for the cellobiose hydrolysis,ActaScientiarum.Technology25:33-38;Gusakov,A.V.和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis of cellulose:1.A mathematical model for abatch reactor process,Enz.Microb.Technol.7:346-352)、研磨反应器(Ryu,S.K.和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attritionbioreactor,Biotechnol.Bioeng.25:53-65),或者具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel type ofbioreactor with intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。其它反应器类型包括:流化床、升流层(upflowblanket)、固定化和用于水解和/或发酵的挤出机型的反应器。
预处理。在本发明的工艺的实施中,可以使用本领域已知的任何预处理过程破坏植物细胞壁的纤维素材料或含木聚糖材料组分(Chandra等,2007,Substrate pretreatment:The key to effective enzymatic hydrolysis oflignocellulosics?Adv.Biochem.Engin./Biotechnol.108:67-93;Galbe和Zacchi,2007,Pretreatment of lignocellulosic materials for efficient bioethanol production,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks和Zeeman,2009,Pretreatments to enhance the digestibility of lignocellulosic biomass,BioresourceTechnol.100:10-18;Mosier等,2005,Features of promising technologies forpretreatment of lignocellulosic biomass,Bioresource Technol.96:673-686;Taherzadeh和Karimi,2008,Pretreatment of lignocellulosic wastes to improveethanol and biogas production:A review,Int.J.of Mol.Sci.9:1621-1651;Yang和Wyman,2008,Pretreatment:the key to unlocking low-cost cellulosic ethanol,Biofuels Bioproducts and Biorefining-Biofpr.2:26-40)。
纤维素材料或含木聚糖材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调理(conditioning)。
常规的预处理包括但不限于,蒸汽预处理(伴随或不伴随爆破)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆破、氨纤维爆破、有机溶剂预处理和生物预处理。其它预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、离子性液体和γ辐射预处理。
可以在水解和/或发酵之前预处理纤维素材料或含木聚糖材料。预处理优选在水解前进行。或者,预处理可以与酶水解同时进行以释放可发酵糖,如葡萄糖、木糖和/或纤维二糖。在大多数情况下,预处理步骤本身使一些生物质转化成可发酵糖(甚至在不存在酶的情况下)。
蒸汽预处理。在蒸汽预处理中,加热纤维素材料或含木聚糖材料以破坏植物细胞壁成分,包括木质素、半纤维素和纤维素,使纤维素和其它级分,例如半纤维素,能够被酶触及。将纤维素材料或含木聚糖材料经过或通过反应容器,其中注入蒸汽以增加温度至需要的温度和压力,并且在其中保持期望的反应时间。蒸汽预处理优选在140-250℃,例如160-200℃,或170-190℃进行,其中最优的温度范围依赖于化学催化剂的添加。蒸汽预处理的停留时间优选1-60分钟,例如1-30分钟,1-20分钟,3-12分钟,或4-10分钟,其中最优的停留时间依赖于温度范围和化学催化剂的添加。蒸汽预处理允许相对较高的固形物加载量,以至于纤维素材料或含木聚糖材料在预处理过程中通常仅仅变得潮湿。蒸汽预处理经常与预处理后的物质的爆破放料(explosive discharge)组合,这称为蒸汽爆破,即,快速闪变至大气压和物质的湍流,以通过破碎增加可接触的表面积(Duff和Murray,1996,Bioresource Technology855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请No.20020164730)。在蒸汽预处理过程中,半纤维素乙酰基团被切开,并且得到的酸自催化半纤维素部分水解成为单糖和寡糖。木质素仅以有限的程度被去除。
化学预处理:术语“化学处理”指能促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学处理。此种预处理可将晶体纤维素转化为无定形纤维素。合适的化学预处理工艺的实例包括例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆破(AFEX)、氨渗滤(APR)、离子性液体和有机溶剂预处理。
经常在蒸汽预处理之前加入催化剂如H2SO4或SO2(通常0.3至5%w/w),其可减少时间,降低温度,增加回收率,并改进酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等.,2006,Enzyme Microb.Technol.39:756-762)。在稀酸预处理中,将纤维素材料或含木聚糖材料与稀酸(通常是H2SO4)和水混合以形成浆料,由蒸汽加热至期望的温度,并在一段停留时间后闪变至大气压。可以用很多反应器设计形式进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(Duff和Murray,1996,supra;Schell等,2004,Bioresource Technol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。
还可以使用碱性条件下的几种预处理方法。这些碱预处理包括,但不限于,氢氧化钠、石灰、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆破(AFEX)。
用氧化钙或氢氧化钙在85-150℃的温度进行石灰预处理,停留时间从1小时到几天(Wyman等,2005,Bioresource Technol.96:1959-1966;Mosier等,2005,Bioresource Technol.96:673-686)。WO2006/110891、WO2006/110899、WO2006/110900和WO2006/110901公开了使用氨的预处理方法。
湿氧化是一种热预处理,通常在180-200℃进行5-15分钟,加入氧化剂如过氧化氢或过压氧(Schmidt和Thomsen,1998,Bioresource Technol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。预处理以优选1-40%干物质,例如2-30%干物质,或5-20%干物质进行,并且经常通过加入碱如碳酸钠来增加初始pH。
湿氧化预处理方法的修改方法,称为湿爆破(湿氧化和蒸汽爆破的组合),能够处理高达30%的干物质。在湿爆破中,在预处理过程中,在一定的停留时间后引入氧化剂。然后通过闪变至大气压而结束预处理(WO2006/032282)。
氨纤维爆破(AFEX)涉及在中等温度如90-150℃和高压如17-20bar,用液氨或氨气将纤维素材料或含木聚糖材料处理5-10分钟,其中干物质含量可以高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,Bioresource Technol.96:2014-2018)。在AFEX预处理过程中,纤维素和半纤维素保持相对完整。木质素-糖复合物被切开。
有机溶剂预处理通过用含水乙醇(40-60%乙醇)在160-200℃提取30-60分钟而将纤维素材料或含木聚糖材料去木质素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。经常加入硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素和木质素得以去除。
合适的预处理方法的其他实例如Schell等,2003,Appl.Biochem andBiotechn.Vol.105-108:69-85,和Mosier等,2005,Bioresource Technology96:673-686,和美国公开申请2002/0164730所述。
在一个方面,化学预处理优选作为稀酸处理,并且更优选作为连续稀酸处理进行。酸通常是硫酸,但也可以使用其它酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。弱酸(mild acid)处理在优选1-5,例如1-4,或1-2.5的pH范围进行。在一个方面,酸浓度在优选0.01至10wt%酸,例如0.05至5wt%酸或0.1至2wt%酸的范围。将酸与纤维素材料或含木聚糖材料接触,并在优选140-200℃,例如165-190℃范围的温度保持1至60分钟的时间。
在另一个方面,预处理发生在含水浆料中。在优选的方面,在预处理过程中纤维素材料或含木聚糖材料以优选10-80wt%,例如20-70wt%或30-60wt%,如约40wt%的量存在。预处理的纤维素材料或含木聚糖材料可以不洗涤或者使用本领域任何已知的方法洗涤,例如,用水洗涤。
机械预处理或物理预处理:术语“机械预处理”或“物理预处理”指任何促进颗粒大小减少的预处理。举例而言,此种预处理可涉及各种类型的研磨(grinding)或磨制(milling)(例如,干磨、湿磨或振动球磨)。
纤维素材料或含木聚糖材料可经物理(机械)和化学预处理二者。机械或物理预处理可与下述偶联:汽蒸/蒸汽爆破、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如微波辐射),或其组合。在一个方面,高压指优选约100至约400psi,例如约150至约250psi的范围的压强。在另一个方面,高温指约100至300℃,例如约140至约200℃范围的温度。在一个优选的方面,机械或物理预处理在使用利用如上所定义的高温和高压的蒸汽枪水解器系统(例如来自Sunds Defibrator AB,Sweden的Sunds Hydrolyzer)的分批过程中进行。所述物理和化学预处理可视需要顺序进行或同时进行。
因此,在一个优选的方面,对纤维素材料或含木聚糖材料进行物理(机械)或化学预处理,或者它们的任何组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”指可以促进纤维素、半纤维素和/或木质素从纤维素材料或含木聚糖材料分离和/或释放的任何生物预处理。生物预处理技术可以包括应用溶解木质素的微生物和/或酶(参见,例如,Hsu,T.-A.,1996,Pretreatment of biomass,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemical and biological treatments for enzymatic/microbial conversion oflignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,于Enzymatic Conversion of Biomass forFuels Production,Himmel,M.E.,Baker,J.O.,和Overend,R.P.,编,ACS SymposiumSeries566,American Chemical Society,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.,编,Springer-VerlagBerlin Heidelberg,Germany,65:207-241;Olsson和Hahn-Hagerdal,1996,Fermentation of lignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;和Vallander和Eriksson,1990,Production of ethanol fromlignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
糖化。在水解步骤中,将纤维素材料或含木聚糖材料,例如经预处理的纤维素材料或含木聚糖材料水解以将纤维素和半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解利用酶组合物在本发明具有木聚糖酶活性的多肽的存在下如本文中所述酶促进行。组合物的酶组分还可以同时或顺序加入。
酶水解优选在容易由本领域技术人员确定的条件下,在合适的含水环境中进行。在一个方面,水解在适于酶组分的活性,即对于酶组分最佳的条件下进行。水解可以以补料分批或连续的过程进行,在连续过程中将纤维素材料或含木聚糖材料逐渐补入,例如,补入含酶的水解溶液中。
糖化通常在搅拌釜反应器或发酵罐中在受控的pH、温度和混合条件下进行。合适的处理时间、温度和pH条件可以由本领域技术人员容易地确定。例如,糖化可持续长达200小时,但是通常进行优选约12至约120小时,例如约16至约72小时,或约24至约48小时。温度在优选约25℃至约70℃,例如约30℃至约65℃,约40℃至约60℃,或约50℃至55℃的范围。pH在优选约3至约8,例如约3.5至约7,约4至约6,或约5.0至约5.5的范围。干固形物含量在优选约5至约50wt%,例如约10至约40wt%,或约20至约30wt%的范围。
酶组合物可包含任何可用于降解纤维素材料或含木聚糖材料的蛋白。
在一个方面,所述酶组合物包含或还包含一种或多种(例如几种)选自下组的蛋白:纤维素酶、具有纤维素分解增强活性的GH61多肽,半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。在另一个方面,所述纤维素酶为优选一种或多种(例如几种)选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述半纤维素酶为优选一种或多种(例如几种)选自下组的酶:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。
在另一个方面,所述酶组合物包含一种或多种(例如几种)纤维素分解酶。在另一个方面,所述酶组合物包含或进一步包含一种或多种(例如几种)半纤维素分解酶。在另一个方面,所述酶组合物包含一种或多种(例如几种)纤维素分解酶和一种或多种(例如几种)半纤维素分解酶。在另一个方面,所述酶组合物包含一种或多种(例如几种)选自下组的酶:纤维素分解酶和半纤维素分解酶。在另一个方面,所述酶组合物包含内切葡聚糖酶。在另一个方面,所述酶组合物包含纤维二糖水解酶。在另一个方面,所述酶组合物包含β-葡糖苷酶。在另一个方面,所述酶组合物包含具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含纤维二糖水解酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶和纤维二糖水解酶。在另一个方面,所述酶组合物包含内切葡聚糖酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含纤维二糖水解酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。
在另一个方面,所述酶组合物包含乙酰甘露聚糖酯酶。在另一个方面,所述酶组合物包含乙酰木聚糖酯酶。在另一个方面,所述酶组合物包含阿拉伯聚糖酶(例如α-L-阿拉伯聚糖酶)。在另一个方面,所述酶组合物包含阿拉伯呋喃糖苷酶(例如α-L-阿拉伯呋喃糖苷酶)。在另一个方面,所述酶组合物包含香豆酸酯酶。在另一个方面,所述酶组合物包含阿魏酸酯酶。在另一个方面,所述酶组合物包含半乳糖苷酶(例如α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一个方面,所述酶组合物包含葡糖醛酸糖苷酶(例如α-D-葡糖醛酸糖苷酶)。在另一个方面,所述酶组合物包含葡糖醛酸酯酶。在另一个方面,所述酶组合物包含甘露聚糖酶。在另一个方面,所述酶组合物包含甘露糖苷酶(例如β-甘露糖苷酶)。在另一个方面,所述酶组合物包含木聚糖酶。在一个优选的方面,所述木聚糖酶是家族10木聚糖酶。在另一个方面,所述酶组合物包含木糖苷酶(例如β-木糖苷酶)。
在另一个方面,所述酶组合物包含酯酶。在另一个方面,所述酶组合物包含棒曲霉素。在另一个方面,所述酶组合物包含漆酶。在另一个方面,所述酶组合物包含木质素分解酶。在另一个优选的方面,所述木质素分解酶是锰过氧化物酶。在另一个优选的方面,所述木质素分解酶是木质素过氧化物酶。在另一个优选的方面,所述木质素分解酶是产生H2O2的酶。在另一个方面,所述酶组合物包含果胶酶。在另一个方面,所述酶组合物包含过氧化物酶。在另一个方面,所述酶组合物包含蛋白酶。在另一个方面,所述酶组合物包含膨胀素。
在本发明的工艺中,酶可在糖化,糖化和发酵,或发酵之前或过程中添加。
所述酶组合物的一种或多种(例如几种)组分可为野生型蛋白、重组蛋白或野生型蛋白和重组蛋白的组合。举例而言,一种或多种(例如几种)组分可为细胞的天然蛋白,其用作宿主细胞以重组表达酶组合物的一种或多种(例如几种)其他组分。可将酶组合物的一种或多种(例如几种)组分作为单独组分产生,然后将其组合以形成酶组合物。所述酶组合物可为多组分和单组分蛋白制备物的组合。
用于本发明工艺中的酶可为任何适用的形式,例如发酵液配制物,细胞组合物,含或不含细胞碎片的细胞裂解液,半纯化或纯化的酶制备物,或作为酶的来源的宿主细胞。所述酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。液体酶制备物可根据确立的工艺,例如通过添加稳定剂如糖、糖醇或其他多元醇,和/或乳酸或其他有机酸来稳定化。
具有木聚糖酶活性的酶和多肽的最适量取决于几个因素,其包括但不限于,纤维素分解和/或半纤维素分解酶组分的混合物、纤维素材料或含木聚糖材料、纤维素材料或含木聚糖材料的浓度、纤维素材料或含木聚糖材料的预处理、温度、时间、pH和包括发酵生物体(例如,同时糖化和发酵的酵母)。
在一个方面,纤维素分解酶或半纤维素分解酶对于纤维素材料或含木聚糖材料的有效量是约0.5至约50mg,例如约0.5至约40mg,约0.5至约25mg,约0.75至约20mg,约0.75至约15mg,约0.5至约10mg,或约2.5至约10mg每g纤维素材料或含木聚糖材料。
在另一个方面,具有木聚糖酶活性的多肽对于纤维素材料或含木聚糖材料的有效量是约0.01至约50.0mg,例如约0.01至约40mg,约0.01至约30mg,约0.01至约20mg,约0.01至约10mg,约0.01至约5mg,约0.025至约1.5mg,约0.05至约1.25mg,约0.075至约1.25mg,约0.1至约1.25mg,约0.15至约1.25mg,或约0.25至约1.0mg每g纤维素材料或含木聚糖材料。
在另一个方面,具有木聚糖酶活性的多肽对于纤维素分解酶或半纤维素分解酶的有效量是约0.005至约1.0g,例如约0.01至约1.0g,约0.15至约0.75g,约0.15至约0.5g,约0.1至约0.5g,约0.1至约0.25g,或约0.05至约0.2g每g纤维素分解酶或半纤维素分解酶。
具有纤维素分解酶活性或半纤维素分解酶活性的多肽,以及其它可用于纤维素材料或含木聚糖材料的降解的蛋白/多肽,例如具有纤维素分解增强活性的GH61多肽(在本文中统称为“具有酶活性的多肽”)可源自或获得自任何合适的来源,包括细菌、真菌、酵母、植物或哺乳动物来源。术语“获得”在本文中还意指该酶可在宿主生物中使用本文中所述的方法重组产生,其中经重组产生的酶对于宿主生物是天然的或外源的,或具有修饰的氨基酸序列,例如,具有一个或多个(例如几个)缺失、插入和/或取代的氨基酸,即重组产生的酶,其是天然氨基酸序列的片段和/或突变体或是通过本领域已知的氨基酸改组方法产生的酶。天然酶的含义中涵盖的是天然变体,而外来酶的含义中涵盖的是重组(如通过定位诱变或重排)获得的变体。
具有酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)、热解纤维素菌属(Caldicellulosiruptor)、热酸菌属(Acidothermus)、Thermobifidia或海洋芽孢杆菌属(Oceanobacillus)多肽,所述多肽具有酶活性;或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽,所述多肽具有酶活性。
在一个方面,所述多肽是具有酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽。
在另一个优选的方面,所述多肽是具有酶活性的似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种多肽。
在另一个优选的方面,所述多肽是具有酶活性的不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌或浅青紫链霉菌多肽。
具有酶活性的多肽也可以是真菌多肽,并且更优选酵母多肽如假丝酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽,其具有酶活性;或更优选丝状真菌多肽如枝顶孢霉属、伞菌属、链格孢属、曲霉属、短梗霉属、Botryospaeria、拟蜡菌属、Chaetomidium、金孢子菌属、Claviceps、Cochliobolus、鬼伞属、Coptotermes、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、Filibasidium、镰孢属、赤霉属、全鞭毛虫属、腐质霉属、耙齿菌属、蘑菇属、Leptospaeria、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、Pseudotrichonympha、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢霉属、弯颈霉属、木霉属、长毛盘菌属、轮枝孢属、包脚菇属或炭角菌属多肽,其具有酶活性。
在一个方面,所述多肽是具有酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。
在另一个方面,所述多肽是具有酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌、Chrysosporium queenslandicum、Chrysosporiumzonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、白耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、嗜热柱顶孢、Thielavia achromatica、Thielaviaalbomyces、Thielavia albopilosa、澳洲梭孢霉、Thielavia fimeti、小孢梭孢霉、卵孢梭孢霉、Thielavia peruviana、瘤孢梭孢霉、毛梭孢霉、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或褐孢长毛盘菌(Trichophaea saccata)多肽。
还可以使用具有酶活性的多肽的经化学修饰或蛋白质工程改造的突变体。
所述组合物的一种或多种(例如几种)组分可以是重组组分,亦即,通过克隆编码所述单独组分的DNA序列并随后用该DNA序列转化细胞并在宿主中表达(参见,例如,WO91/17243和WO91/17244)而产生的。所述宿主优选是异源宿主(酶对宿主是外源的),但该宿主在一定条件下也可以是同源宿主(酶对宿主是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中提纯这样的蛋白质来制备。
在一个方面,所述一种或多种(例如几种)纤维素分解酶包含商业性纤维素分解酶制备物。适用于本发明的商业的纤维素分解酶制备物的实例包括,例如,CELLICTMCTec(Novozymes A/S)、CELLICTMCTec2(Novozymes A/S)、CTec3(Novozymes A/S)、CELLUCLASTTM(Novozymes A/S)、NOVOZYMTM188(Novozymes A/S)、CELLUZYMETM(Novozymes A/S)、CEREFLOTM(NovozymesA/S)和ULTRAFLOTM(Novozymes A/S),ACCELERASETM(Genencor Int.)、LAMINEXTM(Genencor Int.)、SPEZYMETMCP(Genencor Int.),NL(DSM)、S/L100(DSM),ROHAMENTTM7069W LDI(Dyadic International,Inc.)、LBR(DyadicInternational,Inc.)或150L(Dyadic International,Inc.)。所述纤维素酶酶以固形物的约0.001至约5.0wt%,例如固形物的约0.025至约4.0wt%,或固体的约0.005至约2.0wt%的有效量添加。
可以用于本发明的工艺的细菌内切葡聚糖酶的实例包括但不仅限于,解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO91/05039;WO93/15186;美国专利5,275,944;WO96/02551;美国专利5,536,655,WO00/70031,WO05/093050);Thermobifida fusca内切葡聚糖酶III(WO05/093050);和Thermobifida fusca内切葡聚糖酶V(WO05/093050)。
可以用于本发明的真菌内切葡聚糖酶的实例包括但不仅限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene45:253-263,里氏木霉Cel7B内切葡聚糖酶I(GENBANKTM登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22),里氏木霉Cel5A内切葡聚糖酶II(GENBANKTM登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANKTM登录号AB003694);里氏木霉内切葡聚糖酶V(Saloheimo等,1994,Molecular Microbiology13:219-228;GENBANKTM登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acids Research18:5884);川地曲霉(Aspergillus kawachii)内切葡聚糖酶(Sakamoto等,1995,Current Genetics27:435-439);胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖镰孢内切葡聚糖酶(GENBANKTM登录号L29381);灰腐质霉thermoidea变种内切葡聚糖酶(GENBANKTM登录号AB003107);Melanocarpus albomyces内切葡聚糖酶(GENBANKTM登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GENBANKTM登录号XM_324477);特异腐质霉内切葡聚糖酶V;嗜热毁丝霉CBS117.65内切葡聚糖酶;担子菌纲(basidiomycete)CBS495.95内切葡聚糖酶;担子菌纲CBS494.95内切葡聚糖酶;土生梭孢霉NRRL8126CEL6B内切葡聚糖酶;土生梭孢霉NRRL8126CEL6C内切葡聚糖酶;土生梭孢霉NRRL8126CEL7C内切葡聚糖酶;土生梭孢霉NRRL8126CEL7E内切葡聚糖酶;土生梭孢霉NRRL8126CEL7F内切葡聚糖酶;Cladorrhinum foecundissimum ATCC62373CEL7A内切葡聚糖酶;以及里氏木霉菌株No.VTT-D-80133内切葡聚糖酶(GENBANKTM登录号M15665)。
可用于本发明的纤维二糖水解酶的实例包括但不仅限于,棘孢曲霉纤维二糖水解酶II(WO2011/059740),嗜热毛壳菌(Chaetomium thermophilum)纤维二糖水解酶I,嗜热毛壳菌纤维二糖水解酶II,特异腐质霉纤维二糖水解酶I,嗜热毁丝霉纤维二糖水解酶II,(WO2009/042871),Thielavia hyrcanie纤维二糖水解酶II(WO2010/141325),土生梭孢霉纤维二糖水解酶II(CEL6A,WO2006/074435),里氏木霉纤维二糖水解酶I,里氏木霉纤维二糖水解酶II,以及褐孢长毛盘菌纤维二糖水解酶II(WO2010/057086)。
可用于本发明的β-葡糖苷酶的实例包括但不仅限于来自棘孢曲霉(Kawaguchi等,1996,Gene173:287-288)、烟曲霉(WO2005/047499)、黑曲霉(Dan等,2000,J.Biol.Chem.275:4973-4980)、米曲霉(WO2002/095014)、巴西青霉IBT20888(WO2007/019442和WO2010/088387)、土生梭孢霉(WO2011/035029)和褐孢长毛盘菌(WO2007/019442)的β-葡糖苷酶。
所述β-葡糖苷酶可以是融合蛋白。在一个方面,所述β-葡糖苷酶是WO米曲霉β-葡糖苷酶变体BG融合蛋白(WO2008/057637)或米曲霉β-葡糖苷酶融合蛋白(2008/057637)。
其它可用的内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶公开于使用根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acidsequence similarities,Biochem.J.280:309-316和Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696的分类的许多糖基水解酶家族中。
其它可用于本发明的纤维素分解酶描述于WO98/13465、WO98/015619、WO98/015633、WO99/06574、WO99/10481、WO99/025847、WO99/031255、WO2002/101078、WO2003/027306、WO2003/052054、WO2003/052055、WO2003/052056、WO2003/052057、WO2003/052118、WO2004/016760、WO2004/043980、WO2004/048592、WO2005/001065、WO2005/028636、WO2005/093050、WO2005/093073、WO2006/074005、WO2006/117432、WO2007/071818、WO2007/071820、WO2008/008070、WO2008/008793、美国专利No.5,457,046、美国专利No.5,648,263和美国专利No.5,686,593。
在一个方面,所述具有纤维素分解增强活性的GH61多肽在WO2008/151043中所述的可溶性活化二价金属阳离子,例如硫酸锰或硫酸铜的存在下使用。
在另一个方面,所述具有纤维素分解增强活性的GH61多肽在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从经预处理的纤维素材料如经预处理的玉米秸秆(PCS)获得的液剂的存在下使用。
在一个方面,所述具有纤维素分解增强活性的GH61多肽在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从经预处理的纤维素材料如经预处理的玉米秸秆(PCS)获得的液剂的存在下使用。
所述二氧化合物可包括任何含有两个或更多氧原子的合适化合物。在一些方面,所述二氧化合物含有如本文中所述的取代的芳基模块(moiety)。所述二氧化合物可包括一个或多个(例如几个)羟基和/或羟基衍生物,但亦包括缺乏羟基和羟基衍生物的取代的芳基模块。二氧化合物的非限定性实例包括邻苯二酚或儿茶酚;咖啡酸;3,4-二羟基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二酚;连苯三酚;没食子酸;甲基-3,4,5-三羟基苯甲酸;2,3,4-三羟基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羟基苯甲酸;4-氯-1,2-苯二酚;4-硝基-1,2-苯二酚;鞣酸;没食子酸乙酯;羟乙酸甲酯;二羟基延胡索酸;2-丁炔-1,4-二醇;克酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4’-三羟基二苯甲酮;顺-2-丁烯-1,4-二醇;3,4-二羟基-3-环丁烯-1,2-二酮;二羟基丙酮;乙酰丙烯醛(acrolein acetal);甲基-4-羟基苯甲酸;4-羟基苯甲酸;和甲基-3,5-二甲氧基-4-羟基苯甲酸;或它们的盐或溶剂合物(solvate)。
所述二环化合物可包括任何如本文中所述的合适的取代稠环系统。所述化合物可包含一个或多个(例如几个)另外的环,且除非另行说明,不限于具体的环数。在一个方面,所述二环化合物是类黄酮。在另一个方面,所述二环化合物是任选取代的异类黄酮(isoflavonoid)。在另一个方面,所述二环化合物是任选取代的花色离子(flavylium ion),如任选取代的花色素或任选取代的花色苷,或其衍生物。二环化合物的非限定性实例包括表儿茶素(epicatechin);槲皮素(quercetin);杨梅黄酮(myricetin);黄杉素(taxifolin);山奈酚(kaempferol);桑素(morin);金合欢素(acacetin);柚皮素(naringenin);异鼠李黄素(isorhamnetin);芹菜苷配基(apigenin);花青素(cyanidin);花色素苷(cyanin);kuromanin;花青素鼠李葡糖苷(keracyanin);或它们的盐或溶剂合物。
所述杂环化合物可为任何合适的化合物,如本文中所述的任选取代的包含杂原子的芳环或非芳环。在一个方面,所述杂环是包含任选取代的杂环烷基模块或任选取代的杂芳基模块的化合物。在另一个方面,所述任选取代的杂环烷基模块或任选取代的杂芳基模块是任选取代的五元杂环烷基或任选取代的五元杂芳基模块。在另一个方面,任选取代的杂环烷基或任选取代的杂芳基模块是选自如下的任选取代的模块:吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基(thienyl)、二氢噻吩-吡唑基(dihydrothieno-pyrazolyl)、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基(benzothienyl)、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基(benzooxazolyl)、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异噁唑基(benzoisazolyl)、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮杂环庚三烯基(diazepinyl)、氮杂环庚三烯基(azepinyl)、硫杂环庚三烯基(thiepinyl)、哌啶基和氧杂环庚三烯基(oxepinyl)。在另一个方面所述任选取代的杂环烷基模块或任选取代的杂芳基模块是任选取代的呋喃基。杂环化合物的非限定性实例包括(1,2-二羟乙基)-3,4-二氢呋喃-2(5H)-酮;4-羟基-5-甲基-3-呋喃酮;5-羟基-2(5H)-呋喃酮;[1,2-二羟乙基]呋喃-2,3,4(5H)-三酮;α-羟基-γ-丁内酯;核糖酸γ-内酯;己醛糖酸γ-内酯(aldohexuronicaldohexuronic acidγ-lactone);葡糖酸δ-内酯;4-羟基香豆素;二氢苯并呋喃;5-(羟甲基)糠醛;糠偶姻(furoin);2(5H)-呋喃酮;5,6-二氢-2H-吡喃-2-酮;和5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮;或它们的盐或溶剂合物。
所述含氮化合物可为任何具有一个或多个氮原子的合适化合物。在一个方面,所述含氮化合物包含胺、亚胺、羟胺或氧化亚氮(nitroxide)模块。含氮化合物的非限定性实例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2-氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧(piperidinyloxy);5,6,7,8-四氢生物蝶呤;6,7-二甲基-5,6,7,8-四氢蝶呤;和马来酰胺酸;或它们的盐或溶剂合物。
所述醌化合物可为任何本文中所述的包含醌模块的合适的化合物。醌化合物的非限定性实例包括1,4-苯醌;1,4-萘醌;2-羟基-1,4-萘醌;2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q0;2,3,5,6-四甲基-1,4-苯醌或四甲基对苯醌;1,4-二羟基蒽醌;3-羟基-1-甲基-5,6-二氢吲哚二酮或肾上腺色素;4-叔丁基-5-甲氧基-1,2-苯醌;吡咯并喹啉醌(pyrroloquinoline quinone);或它们的盐或溶剂合物。
所述含硫化合物可为任何包含一个或多个硫原子的合适的化合物。在一个方面,所述含硫化合物包含选自如下的模块:亚硫酰,硫醚,亚磺酰,磺酰,硫酰胺(sulfamide),磺酰胺(sulfonamide),磺酸和磺酸酯。含硫化合物的非限定性实例包括乙硫醇;2-丙硫醇;2-丙烯-1-硫醇;2-巯基乙磺酸;苯硫醇;苯-1,2-二硫醇;半胱氨酸;甲硫氨酸;谷胱甘肽;胱氨酸;或它们的盐或溶剂合物。
在一个方面,此种如上所述的化合物对纤维素材料的有效量,以对纤维素糖单元的摩尔比例计,为约10-6至约10,例如约10-6至约7.5,约10-6至约5,约10-6至约2.5,约10-6至约1,约10-5至约1,约10-5至约10-1,约10-4至约10-1,约10-3至约10-1,或约10-3至约10-2。在另一个方面,如上所述的化合物的有效量为约0.1μM至约1M,例如约0.5μM至约0.75M,约0.75μM至约0.5M,约1μM至约0.25M,约1μM至约0.1M,约5μM至约50mM,约10μM至约25mM,约50μM至约25mM,约10μM至约10mM,约5μM至约5mM,或约0.1mM至约1mM。
术语“液剂(liquor)”意指在本文中所述的条件下,通过处理浆料中的木素纤维素和/或半纤维素材料,或其单糖例如木糖、阿拉伯糖、甘露糖等,所产生的溶液相,即水相、有机相或其组合,及其可溶性内含物。用于GH61多肽的纤维素分解增强的液剂可通过,任选在催化剂例如酸的存在下,任选在有机溶剂的存在下,且任选与对所述材料的物理破坏相组合来藉由施加热和/或压力来处理纤维素材料或半纤维素材料(或原料),然后将溶液与残余固体分离来产生。此类条件决定了在借助纤维素酶制备物水解纤维素材料的过程中通过液剂和GH61多肽的组合可获得的纤维素分解增强的程度。所述液剂可使用本领域中的标准方法如过滤、沉积或离心从经处理的材料分离。
在一个方面,所述液剂对纤维素的有效量为约10-6至约10g每g纤维素,例如约10-6至约7.5g,约10-6至约5,约10-6至约2.5g,约10-6至约1g,约10-5至约1g,约10-5至约10-1g,约10-4至约10-1g,约10-3至约10-1g,或约10-3至约10-2g每g纤维素。
在一个方面,所述一种或多种(例如几种)半纤维素分解酶包含商业性半纤维素分解酶制备物。适用于本发明的商业性半纤维素分解酶制备物的实例包括,例如SHEARZYMETM(Novozymes A/S)、HTec(Novozymes A/S)、Htec2(Novozymes A/S)、HTec3(Novozymes A/S)、(Novozymes A/S)、(Novozymes A/S)、HC(NovozymesA/S)、Xylanase(Genencor)、XY(Genencor)、XC(Genencor)、TX-200A(AB Enzymes)、HSP6000Xylanase(DSM)、DEPOLTM333P(Biocatalysts Limit,Wales,UK)、DEPOLTM740L(Biocatalysts Limit,Wales,UK)和DEPOLTM762P(Biocatalysts Limit,Wales,UK)。
可用于本发明工艺的木聚糖酶的实例包括但不限于来自棘孢曲霉(Aspergillus aculeatus)(GeneSeqP:AAR63790;WO94/21785)、烟曲霉(Aspergillus fumigatus)(WO2006/078256)、嗜松青霉(WO2011/041405)、青霉属菌种(WO2010/126772)、土生梭孢霉(Thielavia terrestris)NRRL8126(WO2009/079210)和褐孢长毛盘菌GH10(WO2011/057083)的木聚糖酶。
可用于本发明工艺的β-木糖苷酶的实例包括但不限于来自粗糙脉孢菌(Neurospora crassa)(SwissProt登录号Q7SOW4)、里氏木霉(Trichoderma reesei)(UniProtKB/TrEMBL登录号Q92458)和埃默森踝节菌(Talaromyces emersonii)(SwissProt登录号Q8X212)的β-木糖苷酶。
可用于本发明工艺的乙酰木聚糖酯酶的实例包括但不限于来自棘孢曲霉(WO2010/108918)、球毛壳菌(Chaetomium globosum)(Uniprot登录号Q2GWX4)、细丽毛壳菌(Chaetomium gracile)(GeneSeqP登录号AAB82124)、特异腐质霉(Humicola insolens)DSM1800(WO2009/073709)、红褐肉座菌(Hypocrea jecorina)(WO2005/001036)、嗜热毁丝霉(Wo2010/014880)、粗糙脉孢菌(UniProt登录号q7s259)、颖枯壳针孢(Phaeosphaeria nodorum)(Uniprot登录号Q0UHJ1)和土生梭孢霉NRRL8126(WO2009/042846)的乙酰木聚糖酯酶。
可用于本发明工艺的阿魏酸酯酶的实例包括但不限于来自特异腐质霉DSM1800(WO2009/076122)、费希新萨托菌(Neosartorya fischer)(UniProt登录号A1D9T4)、粗糙脉孢菌(UniProt登录号Q9HGR3)、橘灰青霉(WO2009/127729)和土生梭孢霉(WO2010/053838和WO2010/065448)的阿魏酸酯酶。
可用于本发明工艺的阿拉伯呋喃糖苷酶的实例包括但不限于来自黑曲霉(Aspergillus niger)(GeneSeqP登录号AAR94170)、特异腐质霉(Humicolainsolens)DSM1800(WO2006/114094和WO2009/073383)和巨多孔菌(M.giganteus)(WO2006/114094)的阿拉伯呋喃糖苷酶。
可用于本发明方法的α-葡糖醛酸糖苷酶的实例包括但不限于来自棒曲霉(Aspergillus clavatus)(UniProt登录号alcc12)、烟曲霉(SwissProt登录号Q4WW45)、黑曲霉(Uniprot登录号Q96WX9)、土曲霉(Aspergillus terreus)(SwissProt登录号Q0CJP9)、特异腐质霉(WO2010/014706)、橘灰青霉(WO2009/068565)、埃默森踝节菌(UniProt登录号Q8X211)和里氏木霉(Uniprot登录号Q99024)的α-葡糖醛酸糖苷酶。
用于本发明工艺的具有酶活性的多肽可通过在含有合适碳源和氮源和无机盐的营养培养基上,使用本领域已知方法(参见,例如Bennett,J.W.和LaSure,L.(编),More Gene Manipulations in Fungi,Academic Press,CA,1991)发酵上述指出的微生物菌株来产生。合适的培养基可从供应商获得,或可根据已公开的组成制备(例如美国典型培养物保藏中心的目录)。适于生长和酶产生的温度范围和其他条件在本领域是已知的(参见,例如Bailey,J.E.和Ollis,D.F.,BiochemicalEngineering Fundamentals,McGraw-Hill Book Company,NY,1986)。
所述发酵可以是任何导致酶或蛋白表达或分离的培养细胞的方法。因此,发酵可以理解为包括在合适的培养基中并在允许所述酶得以表达或分离的条件下进行的摇瓶培养,或在实验室或工业发酵罐中的小-或大规模发酵(包括连续、分批、补料分批或固态发酵)。通过上述方法产生的所得的酶可从发酵培养基回收并通过常规方法纯化。
发酵。可通过一种或多种(例如几种)能将糖直接或间接发酵成所需发酵产物的发酵微生物发酵自经水解的纤维素材料或含木聚糖材料获得的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或任何包含发酵步骤的方法。发酵方法还包括用于消费品醇工业(例如,啤酒和葡萄酒)、乳品业(例如,发酵乳产品)、皮革业和烟草业的发酵方法。发酵条件依赖于期望的发酵产物和发酵生物体,并且能由本领域的技术人员容易地确定。
在发酵步骤中,作为预处理和酶水解步骤的结果从纤维素材料或含木聚糖材料释放的糖,通过发酵生物体(如酵母)发酵成为产物,例如,乙醇。如本文中所述,水解(糖化)和发酵可以是单独或同时的。
在实施本发明的发酵步骤中可以使用任何合适的经水解的纤维素材料或含木聚糖材料。通常根据所需发酵产品(即,要从发酵获得的物质)和使用的方法来选择所述材料,如本领域中所公知的。
术语“发酵培养基”在本文中可理解为指加入发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同时糖化和发酵方法(SSF)中使用的培养基。
“发酵微生物”指适用于理想的发酵方法产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是己糖和/或戊糖发酵生物体,或它们的组合。己糖和戊糖发酵生物体在本领域均是公知的。合适的发酵微生物能将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或寡糖)直接或间接地发酵(即,转化)成所需的发酵产品。可产生乙醇的细菌和真菌发酵生物体的实例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。
能发酵己糖的发酵微生物的实例包括细菌和真菌生物体,如酵母。优选的酵母包括假丝酵母属、克鲁维酵母属和酵母属,例如Candida sonorensis、马克斯克鲁维酵母和酿酒酵母的菌株。
以其天然状态能发酵戊糖的发酵生物体的实例包括细菌和真菌生物体,如一些酵母。优选的木糖发酵酵母包括假丝酵母属,优选休哈塔假丝酵母(Candida sheatae)或Candida sonorensis;和毕赤酵母属,优选树干毕赤酵母(Pichia stipitis)的菌株,如树干毕赤酵母CBS5773的菌株。优选的戊糖发酵酵母包括管囊酵母属(Pachysolen),优选嗜鞣管囊酵母(Pachysolen tannophilus)的菌株。不能够发酵戊糖如木糖和阿拉伯糖的生物可通过本领域已知方法遗传修饰而发酵戊糖。
能有效地将己糖和戊糖发酵成乙醇的细菌包括,例如,凝结芽孢杆菌(Bacillus coagulans)、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、Clostridium phytofermentans、地芽孢杆菌属菌种、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)和运动发酵单胞菌(Zymomonas mobilis)(Philippidis,1996,见上文)。
其它发酵生物包括芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如Candidasonorensis、C.methanosorbosa、迪丹斯假丝酵母(Candida diddensii)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、C.blankii、C.entomophilia、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(Candida pseudotropicalis)、博伊丁假丝酵母(Candida boidinii)、产朊假丝酵母(Candida utilis)和休哈塔假丝酵母(C.scehatae);梭菌属,如丙酮丁醇梭菌、热纤维梭菌和C.phytofermentans;大肠杆菌,特别是经遗传修饰促进乙醇产生的大肠杆菌菌株;地芽孢杆菌属菌种;汉逊酵母属,如异常汉逊酵母(Hansenula anomala);克雷伯氏菌属(Klebsiella),如产酸克雷伯氏菌(Klebsiella oxytoca);克鲁维酵母属,如马克斯克鲁维酵母、乳酸克鲁维酵母(K.lactis)、K.thermotolerans和脆壁克鲁维酵母;裂殖酵母属,如粟酒裂殖酵母(S.pombe);热厌氧杆菌属(Thermoanaerobacter),如解糖热厌氧杆菌,和发酵单胞菌属(Zymomonas),如运动发酵单胞菌的菌株。
在一个优选的方面,酵母是酒香酵母属(Bretannomyces)。在一个更优选的方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)。在另一个更优选的方面,酵母是假丝酵母。在另一个更优选的方面,酵母是Candida sonorensis。在另一个更优选的方面,酵母是博伊丁假丝酵母。在另一个更优选的方面,酵母是Candida blankii。在另一个更优选的方面,酵母是芸薹假丝酵母。在另一个更优选的方面,酵母是迪丹斯假丝酵母。在另一个更优选的方面,酵母是Candidaentomophiliia。在另一个更优选的方面,酵母是假热带假丝酵母。在另一个更优选的方面,酵母是休哈塔假丝酵母。在另一个更优选的方面,酵母是产朊假丝酵母。在另一个优选的方面,酵母是棒孢酵母属(Clavispora)。在另一个更优选的方面,酵母是葡萄牙棒孢酵母(Clavispora lusitaniae)。在另一个更优选的方面,酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选的方面,酵母是克鲁维酵母。在另一个更优选的方面,酵母是脆壁克鲁维酵母。在另一个更优选的方面,酵母是马克斯克鲁维酵母。在另一个更优选的方面,酵母是Kluyveromyces thermotolerans。在另一个优选的方面,酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,酵母是嗜鞣管囊酵母。在另一个优选的方面,酵母是毕赤酵母。在另一个更优选的方面,酵母是树干毕赤酵母。在另一个优选的方面,酵母是酵母属菌种。在另一个优选的方面,酵母是酿酒酵母。在另一个更优选的方面,酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选的方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。
在一个优选的方面,细菌是芽孢杆菌属。在一个更优选的方面,细菌是凝结芽孢杆菌。在另一个更优选的方面,细菌是梭菌属。在另一个更优选的方面,细菌是丙酮丁醇梭菌。在另一个更优选的方面,细菌是Clostridiumphytofermentans。在另一个更优选的方面,细菌是热纤维梭菌。在另一个更优选的方面,细菌是地芽孢杆菌属菌种。在另一个更优选的方面,细菌是热厌氧杆菌属。在另一个更优选的方面,细菌是解糖热厌氧杆菌。在另一个更优选的方面,细菌是发酵单胞菌属。在另一个更优选的方面,细菌是运动发酵单胞菌。
商业上可得到的适合乙醇产生的酵母包括,例如BIOFERMTMAFT和XR(NABC-North American Bioproducts Corporation,GA,USA),ETHANOLREDTM酵母(Red Star/Lesaffre,USA)、FALITM(Fleischmann’s Yeast,Burns PhilpFood Inc.,USA),FERMIOLTM(DSM Specialties),GERT STRANDTM(GertStrand AB,Sweden)以及SUPERSTARTTM和THERMOSACCTM新鲜酵母(Ethanol Technology,WI,USA)。
在一个优选的方面,发酵微生物已经经过遗传修饰从而提供发酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。
已经通过将异源基因克隆入多种发酵微生物构建了能将己糖和戊糖转化成乙醇(共发酵)的生物体(Chen和Ho,1993,Cloning and improving the expression ofPichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,Genetically engineered Saccharomyces yeastcapable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,Xylose fermentation by Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomyces cerevisiae strains overexpressing the TKL1and TAL1genes encodingthe pentose phosphate pathway enzymes transketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,Minimal metabolic engineering ofSaccharomyces cerevisiae for efficient anaerobic xylose fermentation:a proof ofprinciple,FEMS Yeast Research4:655-664;Beall等,1991,Parametric studies ofethanol production from xylose and other sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolic engineering of bacteria forethanol production,Biotechnol.Bioeng.58:204-214;Zhang等,1995,Metabolicengineering of a pentose metabolism pathway in ethanologenic Zymomonas mobilis,Science267:240-243;Deanda等,1996,Development of an arabinose-fermentingZymomonas mobilis strain by metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470;WO2003/062430,xylose isomerase)。
在一个优选的方面,经过遗传修饰的发酵微生物是Candida sonorensi。在另一个优选的方面,经过遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面,经过遗传修饰的发酵微生物是产酸克雷伯氏菌。在另一个优选的方面,所述经遗传修饰的发酵微生物是马克斯克鲁维酵母。在另一个优选的方面,所述经遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面,经过遗传修饰的发酵微生物是运动发酵单胞菌。
本领域中公知的是,上述生物体还能用于产生其它物质,如本文所述。
通常向降解的纤维素材料或含木聚糖材料或水解物加入发酵微生物,并进行约8至约96小时,例如约24至约60小时发酵。温度通常为约26℃至约60℃,例如约32℃或50℃,并且在约pH3至约pH8,例如约pH4-5、6或7。
在一个方面,对降解的纤维素材料或含木聚糖材料施用酵母和/或另一种微生物,并进行约12至约96小时,如通常为24-60小时发酵。在另一个方面,温度优选为约20℃至约60℃,例如约25℃至约50℃,并且约32℃至约50℃,约32℃至约50℃,并且pH通常为约pH3至约pH7,例如约pH4至约pH7。然而,一些发酵生物体例如细菌,具有更高的最适发酵温度。酵母或另一种微生物优选以约105-1012,优选约107-1010,特别是约2x108活细胞计数每ml发酵液的量施用。关于使用酵母进行发酵的进一步指导可见于例如“The AlcoholTextbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,Nottingham University Press,United Kingdom1999),其通过提述并入本文。
发酵刺激剂可以与本文所述的任何方法组合使用,以进一步改进发酵工艺,特别是改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸(盐)、烟酸、内消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improvingethanol production and viability of Saccharomyces cerevisiae by a vitamin feedingstrategy during fed-batch process,Springer-Verlag(2002),其通过提述并入本文。矿物质的实例包括能够提供营养物的矿物质和矿物质盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
发酵产物:发酵产物可以是源自发酵的任何物质。发酵产物可以是,不限于,醇(例如,阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷);环烷烃(例如环戊烷、环己烷、环庚烷、和环辛烷);烯烃(例如戊烯、己烯、庚烯和辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。发酵产物还可以是作为高价值产品的蛋白质。
在一个优选的方面,发酵产物是醇。可理解的是,术语“醇”包括包含一个或多个羟基基团的物质。在更优选的方面,所述醇是正丁醇。在另一个更优选的方面,所述醇是异丁醇。在另一个更优选的方面,所述醇是乙醇。在另一个更优选的方面,所述醇是甲醇。在另一个更优选的方面,所述醇是阿拉伯糖醇。在另一个更优选的方面,所述醇是丁二醇。在另一个更优选的方面,所述醇是乙二醇。在另一个更优选的方面,所述醇是丙三醇(glycerin)。在另一个更优选的方面,所述醇是甘油(glycerol)。在另一个更优选的方面,所述醇是1,3-丙二醇。在另一个更优选的方面,所述醇是山梨醇。在另一个更优选的方面,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in BiochemicalEngineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,The biotechnologicalproduction of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.和Singh,D.,1995,Processes for fermentative production of xylitol–a sugar substitute,Process Biochemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanol and ethanol by Clostridium beijerinckii BA101and in situ recovery by gas stripping,World Journal of Microbiology andBiotechnology19(6):595-603。
在另一个优选的方面,所述发酵产物是烷烃。所述烷烃是未支化或支化的烷烃。在另一个更优选的方面,所述烷烃是戊烷。在另一个更优选的方面,所述烷烃是己烷。在另一个更优选的方面,所述烷烃是庚烷。在另一个更优选的方面,所述烷烃是辛烷。在另一个更优选的方面,所述烷烃是壬烷。在另一个更优选的方面,所述烷烃是癸烷。在另一个更优选的方面,所述烷烃是十一烷。在另一个更优选的方面,所述烷烃是十二烷。
在另一个优选的方面,所述发酵产物是环烷烃。在另一个更优选的方面,所述环烷烃是环戊烷。在另一个更优选的方面,所述环烷烃是环己烷。在另一个更优选的方面,所述环烷烃是环庚烷。在另一个更优选的方面,所述环烷烃是环辛烷。
在另一个优选的方面,所述发酵产物是烯烃。所述烯烃可为未支化或支化的烯烃。在另一个更优选的方面,所述烯烃是戊烯。在另一个更优选的方面,所述烯烃是己烯。在另一个更优选的方面,所述烯烃是庚烯。在另一个更优选的方面,所述烯烃是辛烯。
在另一个优选的方面,所述发酵产物是氨基酸。在另一个更优选的方面,所述有机酸是天冬氨酸。在另一个更优选的方面,所述氨基酸是谷氨酸。在另一个更优选的方面,所述氨基酸是甘氨酸。在另一个更优选的方面,所述氨基酸是赖氨酸。在另一个更优选的方面,所述氨基酸是丝氨酸。在另一个更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,A.和Margaritis,A.,2004,Empiricalmodeling of batch fermentation kinetics for poly(glutamic acid)production and othermicrobial biopolymers,Biotechnology and Bioengineering87(4):501-515。
在另一个优选的方面,所述物质是气体。在另一个更优选的方面,所述气体是甲烷。在另一个更优选的方面,所述气体是H2。在另一个更优选的方面,所述气体是CO2。在另一个更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studies on hydrogen production bycontinuous culture system of hydrogen-producing anaerobic bacteria,WaterScience and Technology36(6-7):41-47;和Gunaseelan,V.N.,于Biomass andBioenergy,Vol.13(1-2),pp83-114,1997,Anaerobic digestion of biomass formethane production:A review。
在另一个优选的方面,所述发酵产物是异戊二烯。
在另一个优选的方面,所述发酵产物是酮。应理解的是,术语“酮”涵盖了含有一个或多个酮模块的酮。在另一个更优选的方面,所述酮是丙酮。参见,例如Qureshi和Blaschek,2003,见上文。
在另一个优选的方面,所述发酵产物是有机酸。在另一个更优选的方面,所述有机酸是乙酸。在另一个更优选的方面,所述有机酸是醋酮酸。在另一个更优选的方面,所述有机酸是己二酸。在另一个更优选的方面,所述有机酸是抗坏血酸。在另一个更优选的方面,所述有机酸是柠檬酸。在另一个更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,所述有机酸是甲酸。在另一个更优选的方面,所述有机酸是反丁烯二酸。在另一个更优选的方面,所述有机酸是葡糖二酸。在另一个更优选的方面,所述有机酸是葡糖酸。在另一个更优选的方面,所述有机酸是葡糖醛酸。在另一个更优选的方面,所述有机酸是戊二酸。在另一个优选的方面,所述有机酸是3-羟基丙酸。在另一个更优选的方面,所述有机酸是衣康酸。在另一个更优选的方面,所述有机酸是乳酸。在另一个更优选的方面,所述有机酸是苹果酸。在另一个更优选的方面,所述有机酸是丙二酸。在另一个更优选的方面,所述有机酸是草酸。在另一个更优选的方面,所述有机酸是丙酸。在另一个更优选的方面,所述有机酸是琥珀酸。在另一个更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acidproduction from cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选的方面,所述物质是聚酮化合物。
回收可以使用本领域已知的任何方法,任选地从发酵培养基回收发酵产物,所述方法包括,但不限于,层析、电泳方法、差示溶解度、蒸馏或提取。例如,通过常规蒸馏方法从发酵的纤维素材料或含木聚糖材料分离并纯化醇。可以获得纯度高达约96vol.%的乙醇,其能用作,例如,燃料乙醇、饮用乙醇(即,可饮用的中性含酒精饮料),或工业乙醇。
信号肽
本发明还涉及编码信号肽的分离的多核苷酸,所述信号肽包含或组成为SEQ ID NO:2的氨基酸1至20,SEQ ID NO:4的氨基酸1至17,SEQ ID NO:6的氨基酸1至18,SEQ ID NO:8的氨基酸1至22,SEQ ID NO:10的氨基酸1至18,SEQ ID NO:12的氨基酸1至20,SEQ ID NO:14的氨基酸1至17,SEQID NO:16的氨基酸1至19,SEQ ID NO:18的氨基酸1至17,或SEQ ID NO:20的氨基酸1至17。所述多核苷酸可进一步包含编码蛋白的基因,其可操作地连接于信号肽。所述蛋白优选对于所述信号肽是外源的。在一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:1的核苷酸1至60。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:3的核苷酸1至51。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:5的核苷酸1至54。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:7的核苷酸1至66。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:9的核苷酸1至54。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:11的核苷酸1至60。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:13的核苷酸1至51。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:15的核苷酸1至57。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:17的核苷酸1至51。在另一个方面,编码所述信号肽的多核苷酸是SEQ ID NO:19的核苷酸1至51。
本发明还涉及包含此种多核苷酸的核酸构建体、表达载体和重组宿主细胞。
本发明还涉及用于产生蛋白质的方法,包括:(a)培养包含此种多核苷酸的重组宿主细胞;和任选地(b)回收所述蛋白质。
所述蛋白质对于宿主细胞可为天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此涵盖肽、寡肽和多肽。术语“蛋白质”还涵盖经组合以形成编码产物的两种以上多肽。所述蛋白质还包括杂合多肽和融合多肽。
优选蛋白质是激素、酶、受体或其部分、抗体或其部分,或报告蛋白(reporter)。例如,所述蛋白质可为水解酶、异构酶、连接酶、裂合酶(lyase)、氧化还原酶或转移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
基因可以从任何原核、真核或其它来源获得。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
菌株
命名为NN047338的真菌菌株通过在45℃在PDA平板上稀释然后通过转移单个分生孢子至YG琼脂平板上从来自中国湖南省的土壤样品分离。该菌株NN047338基于形态特征和ITS rDNA序列鉴定为嗜热柱顶孢。
命名为NN051564的真菌菌株从PCS琼脂平板上由在中国收集的堆肥样品分离。菌株NN051564基于形态特征和ITS rDNA序列鉴定为樟绒枝霉。
命名为NN044758的真菌菌株通过在45℃在PDA平板上稀释然后通过转移单个分生孢子至YG琼脂平板上纯化来从在中国收集的土壤样品分离。菌株NN044758基于形态特征和ITS rDNA序列鉴定为樟绒枝霉。
命名为NN000308的真菌菌株从真菌菌种保藏中心(Centraalbureau VoorSchimmelcultures)获得(编号为CBS174.70)。菌株NN000308基于形态特征和ITSrDNA序列鉴定为嗜热棒囊壳(同种异名弗格斯毁丝霉(Myceliophthora fergusii))。
命名为NN051380的真菌菌种从在中国收集的土壤样品分离。菌株NN051380基于形态特征和ITS rDNA序列鉴定为草酸青霉。
培养基
PDA平板由39克的马铃薯右旋糖琼脂和去离子水加至1升构成。
YG琼脂平板由5g的酵母提取物,10g的葡萄糖,20g的琼脂,和去离子水加至1升构成。
PCS琼脂平板由25g的PCS,20g的琼脂,1g的Bacto Peptone(细菌用蛋白胨),5g的酵母提取物,2.5g的葡萄糖,5g的NaNO3,3g的NH4Cl,2g的MES,2.5g的柠檬酸,0.2g的CaCl22H2O,0.2g的MgSO47H2O,4g的K2HPO4,1ml的COVE痕量元素溶液,和去离子水加至1升构成。
COVE痕量元素溶液由0.04g的Na2B4O7·10H2O,0.4g的CuSO4·5H2O,1.2g的FeSO4·7H2O,0.7g的MnSO4·H2O,0.8g的Na2MoO2·2H2O,10g的ZnSO4·7H2O,和去离子水加至1升构成。
YPG培养基由去离子水中的0.4%的酵母提取物,0.1%的KH2PO4,0.05%的MgSO4·7H2O,和1.5%葡萄糖构成。
YPM培养基由去离子水中的1%的酵母提取物,2%的蛋白胨,和2%的麦芽糖构成。
Czapek’s培养基由1升最终体积的去离子水中的30g的蔗糖,3g的NaNO3,0.5g的MgSO4·7H2O,0.01g的FeSO4·7H2O,1g的K2HPO4和0.5g的KCl构成。pH用1M HCl调整至pH4。
基本培养基平板由342g的蔗糖,20ml的盐溶液,20g的琼脂,和去离子水加至1升构成。盐溶液由2.6%KCl,2.6%MgSO4·7H2O,7.6%KH2PO4,2ppm Na2B4O7·10H2O,20ppm CuSO4·5H2O,40ppm FeSO4·7H2O,40ppmMnSO4·2H2O,40ppm Na2MoO4·2H2O,和400ppm ZnSO4·7H2O构成。
NNCYP-PCS培养基由5.0g的NaNO3,3.0g的NH4Cl,2.0g的MES,2.5g的柠檬酸,0.2g的CaCl22H2O,1.0g的细菌用蛋白胨,5.0g的酵母提取物,0.2g的MgSO47H2O,4.0g的K2HPO4,1.0ml的COVE痕量元素溶液,2.5g的葡萄糖,25.0g的PCS,和去离子水加至1升构成。
COVE痕量元素溶液由0.04g的Na2B4O7·10H2O,0.4g的CuSO4·5H2O,1.2g的FeSO4·7H2O,0.7g的MnSO4·H2O,0.8g的Na2MoO2·2H2O,10g的ZnSO4·7H2O,和去离子水加至1升构成。
实施例1:基因组DNA提取
将嗜热柱顶孢菌株NN047338接种于PDA平板上并在45℃避光温育3日。将数个菌丝体-PDA栓接种入含有100ml的YPG培养基的500ml摇瓶。将瓶在45℃在160rpm振荡下温育3日。菌丝体通过经由(Calbiochem,La Jolla,CA,USA)过滤来收集并在液氮中冻结。将冻结的菌丝体通过研钵和杵磨碎至细粉,并使用Plant Maxi Kit(QIAGENGmbH,Hilden,Germany)遵循生产商的指示分离基因组DNA。
将樟绒枝霉NN051564接种于PDA平板上并在37℃在160rpm振荡下温育4-5日。将菌丝体从琼脂平板在直接收集入灭菌的研钵并在液氮下冻结。将冻结的菌丝体通过研钵和杵磨碎至细粉,并使用Plant Mini Kit分离基因组DNA。
将樟绒枝霉菌株NN044758接种于PDA平板上并在45℃避光温育3日。将数个菌丝体-PDA栓接种入含有100ml的YPG培养基的500ml摇瓶。将瓶在45℃在160rpm振荡下温育3日。菌丝体通过经由过滤来收集并在液氮中冻结。将冻结的菌丝体通过研钵和杵磨碎至细粉,并使用Large-Scale Column Fungal DNAout(BAOMAN BIOTECHNOLOGY,Shanghai,China)根据生产商的指示分离基因组DNA。
将嗜热棒囊壳菌株NN000308接种于PDA平板上并在45℃避光温育3日。将数个菌丝体-PDA栓接种入含有100ml的YPG培养基的500ml摇瓶。将瓶在45℃在160rpm振荡下温育4日。菌丝体通过经由过滤来收集并在液氮中冻结。将冻结的菌丝体通过研钵和杵磨碎至细粉,并使用Plant Maxi Kit分离基因组DNA。
将草酸青霉菌株NN051380接种于PDA平板上并在25℃避光温育5日。将数个菌丝体-PDA栓接种入含有100ml的Czapek’s培养基的500ml摇瓶。将瓶在30℃在160rpm振荡下温育3日。菌丝体通过经由过滤来收集并在液氮中冻结。将冻结的菌丝体通过研钵和杵磨碎至细粉,并使用Plant Maxi Kit分离基因组DNA。
实施例2:樟绒枝霉菌株NN051564GH10木聚糖酶编码序列的鉴定
樟绒枝霉GH10木聚糖酶编码序列通过樟绒枝霉菌株NN051564的cDNA文库的转座子协助的信号捕获来鉴定。
将樟绒枝霉菌株接种于PDA平板上并在45℃避光温育4日。将数个菌丝体-PDA栓接种入含有100ml的NNCYP-PCS培养基的500ml摇瓶。将瓶在45℃在160rpm振荡下温育6日。分别在第3、第4、第5和第6日收集菌丝体。然后将来自每日的菌丝体冻结于液氮并储藏于-80℃冷冻箱直至使用。将冻结的菌丝体转移入液氮预冷的研钵和杵,并磨碎至细粉。从每日的粉末状的菌丝体通过用TRIzol试剂(Invitrogen Corporation,Carlsbad,CA,USA)提取来制备总RNA。polyA富集的RNA通过mTRAPTMTotal Kit(Active Motif,Carlsbad,CA,USA)分离。来自每日的双链cDNA用SMART cDNA LibraryConstruct Kit(Takara Bio Inc.,Otsu,Shiga,Japan)合成。将cDNA用Sfi I切割,并将cDNA通过使用44mM Tris碱,44mM硼酸,0.5mM EDTA缓冲液的0.8%琼脂糖凝胶电泳大小分级。将500bp和更大的cDNA级分从凝胶切出并使用PCR DNA and Gel Band Purification Kit(GE Healthcare,Piscataway,NJ,USA)根据生产商的指示纯化。然后将等量的来自每日的cDNA汇集以供文库构建。
然后将制备的cDNA通过使用T4连接酶(New England Biolabs,Inc.,Beverly,MA,USA)根据生产商的指示连接入经Sfi I切割的pMHas7(WO2009/037253)来定向克隆。将连接混合物使用GENEAnd PulseController(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)以25μF,25mAmp,1.8kV用1mm间隔小杯(cuvette)根据生产商的步骤电穿孔入大肠杆菌ELECTROMAXTMDH10BTM细胞(Invitrogen Corporation,Carlsbad,CA,USA)。
将经电穿孔的细胞铺板于补充每升50mg的卡那霉素的LB平板上。从原始pMHas7载体连接的100,000各总转化体制备cDNA质粒库。使用PlasmidKit(QIAGEN GmbH,Hilden,Germany)从该库的菌落直接制备质粒DNA。
转座子协助的信号捕获方法描述于WO2001/77315。TAST质粒库由SinoGenoMax Company Limited(Beijing,China)测序。从由SinoGenoMax释放的cDNA序列鉴定出了樟绒枝霉菌株NN051564GH10木聚糖酶的开读框。樟绒枝霉GH10木聚糖酶的cDNA序列通过针对数种已知的GH10木聚糖酶蛋白序列作为查询序列(query)进行TFasty检索而鉴定。TFasty针对DNA序列数据库比较蛋白序列,在移码至正向和反向取向来计算相似度,并允许密码子内的移码。Tfasty是FASTA3程序套件(Pearson等,2000,Methods Mol.Biol.132:185-219)的一部分。鉴定出的cDNA序列列为SEQ ID NO:21。
实施例3:嗜热柱顶孢菌株NN047338,樟绒枝霉菌株NN044758,嗜热棒囊壳菌株NN000308和草酸青霉菌株NN051380的基因组测序、汇编和注释
将提取的基因组DNA样品递送至Beijing Genome Institute(BGI,Shenzhen,China)以供使用GA2System(Illumina,Inc.,San Diego,CA,USA)的基因组测序。将粗读取在BGI使用SOAPdenovo程序(Li等,2010,Genome Research20(2):265-72)进行汇编。将汇编的序列使用标准生物信息学方法进行分析以供基因搜寻(gene finding)和功能预测。简言之,使用geneID(Parra等,2000,Genome Research10(4):511-515)进行基因预测。使用Blastall版本2.2.10(Altschul等,1990,J.Mol.Biol.215(3):403-410,National Center forBiotechnology Information(NCBI),Bethesda,MD,USA)和HMMER版本2.1.1(National Center for Biotechnology Information(NCBI),Bethesda,MD,USA)基于结构同源性预测功能。GH10木聚糖通过Blast结果的分析直接鉴定。使用Agene程序(Munch和Krogh,2006,BMC Bioinformatics7:263)和SignalP程序(Nielsen等,1997,Protein Engineering10:1-6)鉴定起始密码子。进一步使用SignalP程序预测信号肽。使用Pepstats(Rice等,2000,Trends Genet.16(6):276-277)预测推导的氨基酸序列的等电点和分子量。
实施例4:从基因组DNA克隆嗜热柱顶孢菌株NN047338GH10木聚糖酶编码序列
选择四个下表1中所示的嗜热柱顶孢菌株NN047338GH10木聚糖酶编码序列用于克隆。
表1:GH10木聚糖酶基因
基因名称 | DNA序列 | 蛋白序列 |
GH10_ZY577198_20 | SEQ ID NO:1 | SEQ ID NO:2 |
GH10_ZY577319_22 | SEQ ID NO:3 | SEQ ID NO:4 |
GH10_ZY577226_23 | SEQ ID NO:5 | SEQ ID NO:6 |
GH10_ZY577198_133 | SEQ ID NO:7 | SEQ ID NO:8 |
基于从基因组测序获得的DNA信息(SEQ ID NO:1,3,5,和7)设计了下示的寡核苷酸引物以从嗜热柱顶孢NN047338的基因组DNA扩增四个GH10木聚糖酶编码序列。引物由Invitrogen,Beijing,China合成。
SEQ ID1_正向:
ACACAACTGGGGATCCACCatggcgaggctc(SEQ ID NO:22)
SEQ ID1_反向:
GTCACCCTCTAGATCTcgacccccaaagaaatgggta(SEQ ID NO:23)
SEQ ID3_正向:
ACACAACTGGGGATCCACCatgcgtttctccgcc(SEQ ID NO:24)
SEQ ID3_反向:
GTCACCCTCTAGATCTaaattgcggtcacagagtccag(SEQ ID NO:25)
SEQ ID5_正向:
ACACAACTGGGGATCCACCatgcatctcgcttcgtcgc(SEQ ID NO:26)
SEQ ID5_反向:
GTCACCCTCTAGATCTaagtctccacccgcatcgac(SEQ ID NO:27)
SEQ ID7_正向:
ACACAACTGGGGATCCACCatgagagctccgtc(SEQ ID NO:28)
SEQ ID7_反向:
GTCACCCTCTAGATCT gacaaatcttcacacagcccaatg(SEQ ID NO:29)
小写字母在正向引物中代表基因的编码序列,而在反向引物中代表基因的侧翼区,而大写部分同源于WO2011005867中所述的pPFJO355载体的插入位点。
对于每个基因,将20皮摩尔的每个引物对(正向和反向引物)用于PCR反应,所述反应由2μl的嗜热柱顶孢NN047338基因组DNA,10μl的5X GCBuffer(Finnzymes Oy,Espoo,Finland),1.5μl的DMSO,各2.5mM的dATP、dTTP、dGTP和dCTP,和0.6单位的PHUSIONTMHigh-Fidelity DNA Polymerase(Finnzymes Oy,Espoo,Finland)构成,最终体积为50μl。扩增使用PeltierThermal Cycler(MJ Research Inc.,South San Francisco,CA,USA)进行,其程序如下:在98℃变性1分钟,6个循环,每个在98℃变性15秒,在63℃退火30秒,每循环降低1℃,和在72℃延伸100秒;23个循环,每个在98℃进行15秒,在62℃进行30秒,和72℃进行100秒;并在72℃最终延伸7分钟。然后加热块进入4℃浸泡循环。
PCR产物通过使用90mM Tris-硼酸和1mM EDTA(TBE)缓冲液的1.0%琼脂糖凝胶电泳分离,其中观察到来自每个PCR反应如表2中所示的产物条带。然后使用ILLUSTRATMGFXTMPCR DNA and Gel Band Purification Kit(GEHealthcare,Buckinghamshire,UK)根据生产商的指示从溶液纯化PCR产物。
表2:PCR产物的大小
基因名称 | PCR产物的大小 |
GH10_ZY577198_20 | 1.4kb |
GH10_ZY577319_22 | 1.4kb |
GH10_ZY577226_23 | 1.2kb |
GH10_ZY577198_133 | 1.1kb |
将质粒pPFJO355用Bam HI和Bgl II消化,通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,并使用ILLUSTRATMGFXTMPCR DNA and Gel BandPurification Kit根据生产商的指示纯化。
表3:质粒
基因名称 | 质粒 | DNA图 |
GH10_ZY577198_20 | pGH10_ZY577198_20 | 图1 |
GH10_ZY577319_22 | pGH10_ZY577319_22 | 图2 |
GH10_ZY577226_23 | pGH10_ZY577226_23 | 图3 |
GH10_ZY577198_133 | pGH10_ZY577198_133 | 图4 |
将PCR产物和消化的质粒使用CF Dry-down PCR Cloning Kit(Clontech Laboratories,Inc.,Mountain View,CA,USA)连接在一起,得到质粒(表3)pGH10_ZY577198_20(图1),pGH10_ZY577319_22(图2),pGH10_ZY577226_23(图3),和pGH10_ZY577198_133(图4),其中嗜热柱顶孢GH10木聚糖酶编码序列的转录处于米曲霉α-淀粉酶基因启动子的调控下。对于每个连接反应,将30ng的用Bam HI和Bgl II消化的pPFJO355,和60ng的纯化的各嗜热柱顶孢GH10木聚糖酶PCR产物添加至单独的反应小瓶,并通过添加去离子水重悬于10μl的最终体积。将反应在37℃温育15分钟然后在50℃温育15分钟。使用三μl的各反应转化大肠杆菌TOP10感受态细胞(TIANGENBiotech(Beijing)Co.Ltd.,Beijing,China)。含有每种表达构建体的大肠杆菌转化体通过菌落PCR检测。菌落PCR是用于直接从大肠杆菌菌落快速筛选质粒插入的方法。简言之,在每个PCR管中的预混合的PCR溶液等分试样(包含PCR缓冲液,MgCl2,dNTP,和PCR片段生成所用的引物对)中,通过用灭菌的移液尖挑取,并将所述移液尖在反应溶液中旋转来添加单个菌落。通常筛选了7-10个菌落。在PCR之后,将反应通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳来进行分析。来使用Spin Miniprep Kit(QIAGEN GmbH,Hilden,Germany)从显示具有期待的大小的插入物的菌落制备质粒DNA。pGH10_ZY577198_20,pGH10_ZY577319_22,pGH10_ZY577226_23,和pGH10_ZY577198_133中插入的嗜热柱顶孢GH10木聚糖酶基因通过使用3730XL DNA Analyzer(AppliedBiosystems Inc.,Foster City,CA,USA)的DNA测序来确认。
实施例5:从基因组DNA克隆樟绒枝霉菌株NN051564GH10木聚糖酶编码序列
基于从转座子协助的基因捕获获得的cDNA信息(SEQ ID NO:21),设计了下示的寡核苷酸引物以从樟绒枝霉菌株NN051564的基因组DNA扩增GH10木聚糖酶编码序列(xyn13)。引物由Invitrogen,Beijing,China合成。
正向引物:
ACACAACTGGGGATCCACCatgcgcatatcactcgttcttc(SEQ ID NO:30)
反向引物:
GTCACCCTCTAGATCTctactgcaaggactgggcaacag(SEQ ID NO:31)
小写字母代表基因的编码区,而大写字母为同源于质粒pPFJO355的插入位点的区。
将二十皮摩尔的两个引物用于PCR反应,所述反应由4μl的樟绒枝霉NN051564基因组DNA,10μl的5X GC Buffer,1.5μl的DMSO,各2.5mM的dATP、dTTP、dGTP和dCTP,和0.6单位的PHUSIONTMHigh-Fidelity DNAPolymerase构成,最终体积为50μl。扩增使用Peltier Thermal Cycler进行,其程序如下:在94℃变性3分钟,5个循环,在94℃变性40秒,在63℃退火40秒,每循环升高1℃,和在72℃延伸90秒;24个循环,每个在94℃进行40秒,68℃进行40秒,和72℃进行90秒;和在72℃最终延伸10分钟。然后加热块进入10℃浸泡循环。
将三μl的PCR反应通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳进行分析,其中观察到大约1.6kb的单个条带。将剩余的PCR反应使用ILLUSTRATMGFXTMPCR DNA and Gel Band Purification Kit纯化。
将质粒pPFJO355用Bam HI和Bgl II消化,通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,并使用ILLUSTRATMGFXTMPCR DNA and Gel BandPurification Kit根据生产商的指示纯化。将PCR产物和消化的载体使用CF Dry-down PCR Cloning Kit连接在一起,得到质粒pxyn13(图5),其中樟绒枝霉GH10木聚糖酶编码序列的转录处于米曲霉α-淀粉基因启动子的调控下。对于连接反应,将30ng用Bam HI和Bgl II消化的pPFJO355,和60ng纯化的樟绒枝霉GH10木聚糖酶PCR产物添加至反应小瓶,并通过添加去离子水重悬于10μl的最终体积。将反应在37℃温育15分钟,然后在50℃温育15分钟。使用三μl的反应转化大肠杆菌TOP10感受态细胞。含有表达构建体的大肠杆菌转化体通过菌落PCR如实施例4中所述检测,并使用SpinMiniprep Kit制备质粒DNA。在pxyn13中插入的樟绒枝霉GH10木聚糖酶通过使用3730XL DNA Analyzer的DNA测序来确认。樟绒枝霉GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示为SEQ ID NO:9和10。
实施例6:从基因组DNA克隆樟绒枝霉菌株NN044758GH10木聚糖酶编码序列
基于从樟绒枝霉菌株NN044758的基因组测序获得的DNA信息,设计了下示的寡核苷酸引物来从樟绒枝霉NN044758的基因组DNA扩增GH10木聚糖酶编码序列,GH10_ZY582331_279。引物由Invitrogen,Beijing,China合成。
正向引物:
ACACAACTGGGGATCCACCatggtgaagctactcccagtcatcg(SEQ ID NO:32)
反向引物:
GTCACCCTCTAGATCTcgccaacagatcctaatgggac(SEQ ID NO:33)
小写字母在正向引物中代表基因的编码区,和在反向引物中代表基因的侧翼区,而大写部分同源于pPFJO355载体的插入位点。
将二十皮摩尔的各正向和反向引物用于PCR反应,所述反应由2μl的樟绒枝霉NN044758基因组DNA,10μl的5X GC Buffer,1.5μl的DMSO,各2.5mM的dATP、dTTP、dGTP和dCTP,和0.6单位的PHUSIONTMHigh-FidelityDNA Polymerase构成,最终体积为50μl。扩增使用Peltier Thermal Cycler进行,其程序如下:在94℃变性1分钟;6个循环,每个在94℃变性15秒,在68℃退火30秒,每循环减少1℃,并在72℃延伸100秒;23个循环,每个在94℃进行15秒,63℃进行30秒,和在72℃进行100秒;和在72℃最终延伸5分钟。加热块然后进入4℃浸没循环。
PCR产物通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,其中观察到1.4kb的单个产物条带。然后将PCR产物使用ILLUSTRATMGFXTMPCRDNA and Gel Band Purification Kit根据生产商的指示从溶液纯化。
将质粒pPFJO355用Bam HI和Bgl II消化,通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,并使用LLUSTRATMGFXTMPCR DNA and Gel BandPurification Kit根据生产商的指示纯化。使用CF Dry-downCloning Kit将片段直接克隆入表达载体pPFJO355,无需限制性消化和连接。将PCR产物和消化的载体使用CF Dry-down PCR Cloning Kit连接在一起,得到质粒pGH10_ZY582331_279(图6),其中樟绒枝霉GH10木聚糖酶编码序列的转录处于米曲霉α-淀粉酶基因启动子的调控下。对于连接反应,将30ng用Bam HI和Bgl II消化的pPFJO355,和60ng纯化的樟绒枝霉GH10木聚糖酶PCR产物添加至反应小瓶,并通过添加去离子水重悬于10μl的最终体积。将反应在37℃温育15分钟,然后在50℃温育15分钟。使用三μl的反应转化大肠杆菌TOP10感受态细胞。含有表达构建体的大肠杆菌转化体通过菌落PCR如实施例4中所述检测,并使用SpinMiniprep Kit制备质粒DNA。在pGH10_ZY582331_279中插入的樟绒枝霉GH10木聚糖酶编码序列通过使用3730XL DNA Analyzer的DNA测序确认。
基因组DNA序列和推导的氨基酸序列分别示为SEQ ID NO:11和SEQID NO:12。
实施例7:从基因组DNA克隆嗜热棒囊壳CBS174.70GH10木聚糖酶编码序列
选择了示于下表4的来自嗜热棒囊壳菌株CBS174.70的三个GH10木聚糖酶基因进行克隆。
表4:GH10木聚糖酶基因
基因名称 | DNA序列 | 蛋白序列 |
GH10_Mf4036 | SEQ ID NO:13 | SEQ ID NO:14 |
GH10_Mf2809 | SEQ ID NO:15 | SEQ ID NO:16 |
GH10_Mf0530 | SEQ ID NO:17 | SEQ ID NO:18 |
基于从嗜热棒囊壳菌株CBS174.70的基因组测序获得的DNA信息,设计了下示的寡核苷酸引物从嗜热棒囊壳菌株CBS174.70的基因组DNA扩增GH10木聚糖酶编码序列。引物由Invitrogen,Beijing,China合成。
SEQ ID14_正向:
ACACAACTGGGGATCCACCatgcggttttctgcgcctc(SEQ ID NO:34)
SEQ ID14_反向:
GTCACCCTCTAGATCTaccgtccaccgttcctcttagag(SEQ ID NO:35)
SEQ ID16_正向:
ACACAACTGGGGATCCACCatgcgactctccgcg(SEQ ID NO:36)
SEQ ID16_反向:
GTCACCCTCTAGATCTcacaggttggggggatgag(SEQ ID NO:37)
SEQ ID18_正向:
ACACAACTGGGGATCCACCatgcgtactctcgccttcg(SEQ ID NO:38)
SEQ ID18_反向:
GTCACCCTCTAGATCTacccatccatcacaatcacac(SEQ ID NO:39)
小写字母代表正向引物中的基因的编码序列,并代表反向引物中的侧翼序列,而大写部分同源于pPFJO355载体的插入位点。
对于每个基因,将二十皮摩尔的各引物对(正向和反向引物)用于PCR反应,所述反应由2μl的嗜热棒囊壳NN000308基因组DNA,10μl的5X HF/GCBuffer(Finnzymes Oy,Espoo,Finland),1.5μl的DMSO,各2.5mM的dATP、dTTP、dGTP和dCTP,和0.6单位的PHUSIONTMHigh-Fidelity DNA Polymerase(Finnzymes Oy,Espoo,Finland)构成,最终体积为50μl。
GH10_Mf0530的扩增使用Peltier Thermal Cycler进行,其程序如下:在98℃变性1分钟;10个循环,每个在98℃变性15秒,在70℃退火30秒,每循环下降1℃,和在72℃延伸90秒;20个循环,每循环在94℃进行30秒,在60℃进行30秒,和在72℃进行90秒;和在72℃最终延伸5分钟。然后加热块进入4℃浸泡循环。
GH10_Mf4036和GH10_Mf2809的扩增使用Peltier Thermal Cycler进行,其程序如下:在98℃变性1分钟;7个循环,在65℃退火30秒,每循环下降1℃,和在72℃延伸2分钟;25个循环,每循环在94℃进行30秒,在60℃进行30秒,和在72℃进行2分钟;和在72℃最终延伸5分钟。加热块然后进入4℃浸泡循环。
将PCR产物通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,其中观察到如表5中所示来自每个PCR反应的产物条带。然后将PCR产物使用ILLUSTRATMGFXTMPCR DNA and Gel Band Purification Kit根据生产商的指示从溶液纯化。GH10_Mf4036和GH10_Mf5030均显示在大约1.4kb的PCR产物,而GH10_Mf2809显示在大约1.5kb的PCR产物。
表5:PCR产物的大小
基因名称 | PCR产物的大小 |
GH10_Mf4036 | ~1.4kb |
GH10_Mf2809 | ~1.5kb |
GH10_Mf0530 | ~1.4kb |
将质粒pPFJO355用Bam HI和Bgl II消化,通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,并使用ILLUSTRATMGFXTMPCR DNA and Gel BandPurification Kit根据生产商的指示纯化。
表6:质粒
基因名称 | 质粒 | DNA图 |
GH10_Mf4036 | pGH10_Mf4036 | 图7 |
GH10_Mf2809 | pGH10_Mf2809 | 图8 |
GH10_Mf0530 | pGH10_Mf0530 | 图9 |
将PCR产物和消化的载体使用CF Dry-down PCR CloningKit连接在一起,得到质粒(表6)pGH10_Mf4036(图7),pGH10_Mf2809(图8),和pGH10_Mf0530(图9),其中嗜热棒囊壳GH10木聚糖酶编码序列的转录处于米曲霉α-淀粉酶基因启动子的调控下。简言之,对于每个连接反应,将30ng用Bam HI和Bgl II消化的pPFJO355,和各60ng的纯化的嗜热棒囊壳GH10木聚糖酶PCR产物添加至个别的反应小瓶,并通过添加去离子水重悬于10μl的最终体积。将反应在37℃温育15分钟,然后在50℃温育15分钟。使用三μl的每个反应用于转化大肠杆菌TOP10感受态细胞(TIANGENBiotech(Beijing)Co.Ltd.,Beijing,China)。含有每个表达构建体的大肠杆菌转化体通过菌落PCR如实施例4中所述进行检测。插入pGH10_Mf4036,pGH10_Mf2809,和pGH10_Mf0530的嗜热棒囊壳GH10木聚糖酶基因通过使用3730XL DNA Analyzer(Applied BiosystemsInc,Foster City,CA,USA)的DNA测序来确认。
实施例8:从基因组DNA克隆草酸青霉菌株NN051380GH10木聚糖酶编码序列
基于通过对草酸青霉菌株NN051380进行的基因组测序获得的基因信息,设计了下示的寡核苷酸引物来从草酸青霉菌株NN051380的基因组DNA扩增GH10木聚糖酶编码序列,GH10_ZY569164_676。
正向引物:
ACACAACTGGGGATCCACCatgcgctccacgttcatgg(SEQ ID NO:40)
反向引物:
GTCACCCTCTAGATCTgaagcatcctctagtgaggcctatcaa(SEQ ID NO:41)
小写字母代表正向引物中的基因的编码区和在反向引物中代表基因的侧翼区,而大写部分同源于pPFJO355载体的插入位点。
使用CF Dry-down Cloning Kit将片段直接克隆入表达载体pPFJO355,无需限制性消化和连接。
将二十皮摩尔的各上述引物用于PCR反应,所述反应由2μl的草酸青霉基因组DNA,10μl的5X GC Buffer,1.5μl的DMSO,各2.5mM的dATP、dTTP、dGTP和dCTP,和0.6单位的PHUSIONTMHigh-Fidelity DNA Polymerase构成,最终体积为50μl。扩增使用Peltier Thermal Cycler进行,其程序如下:在98℃变性1分钟;6个循环,每个在98℃变性15秒,在65℃退火30秒,每循环降低1℃,和在72℃延伸70秒;25个循环,每个在98℃进行15秒,在62℃进行30秒,和在72℃进行70秒;和在72℃最终延伸5分钟。然后加热块进入4℃浸泡循环。
反应产物通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,其中大约1.2kb产物条带从凝胶切出,并使用ILLUSTRATMGFXTMPCR DNA and GelBand Purification Kit根据生产商的指示纯化。
将质粒pPFJO355用Bam HI和Bgl II消化,通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离,和使用ILLUSTRATMGFXTMPCR DNA and Gel BandPurification Kit根据生产商的指示纯化。将PCR产物和消化的载体使用CF Dry-down PCR Cloning Kit连接在一起,得到pGH10_ZY569164_676(图10),其中草酸青霉GH10木聚糖酶编码序列的转录处于米曲霉α-淀粉酶基因启动子的调控下。对于连接反应,将30ng用BamHI和Bgl II消化的pPFJO355,和60ng的草酸青霉GH10木聚糖酶纯化PCR产物添加至反应小瓶,并通过添加去离子水重悬于10μl的最终体积。将反应在37℃温育15分钟,然后在50℃温育15分钟。使用三μl的反应转化大肠杆菌TOP10感受态细胞。含有pGH10_ZY569164_676的大肠杆菌转化体通过菌落PCR如实施例4中所述检测,和使用Spin Miniprep Kit制备质粒DNA。插入pGH10_ZY569164_676中的草酸青霉GH10木聚糖酶基因通过使用3730XL DNA Analyzer的DNA测序确认。
基因组DNA序列和推导的氨基酸序列分别示为SEQ ID NO:19和SEQID NO:20。
实施例9:编码GH10木聚糖酶的基因组DNA的表征
嗜热柱顶孢GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:1(D822JR)和SEQ ID NO:2(P244XT)。编码序列为1314bp,包括终止密码子,其由一个89bp的内含子(核苷酸374至462)中断。编码的预测的蛋白是406个氨基酸。使用SignalP程序(Nielsen等,1997,Protein Engineering10:1-6),预测了20个残基的信号肽。预测的成熟蛋白含有386个氨基酸,具有42.38kDa的预测的分子量,和4.61的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的嗜热柱顶孢基因组DNA的推导的氨基酸序列与来自禾生炭疽菌(Colletotrichum graminicola)的GH10木聚糖酶的推导的氨基酸序列(UNIPROTE3Q8L2)具有54.62%同一性(排除缺口)。
嗜热柱顶孢GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:3(D822JT)和SEQ ID NO:4(P244XW)。编码序列为1350bp,包含终止密码子,其由54bp(核苷酸84至137),80bp(核苷酸542至621),75bp(核苷酸669至743),和58bp(核苷酸1158至1215)的四个内含子中断。编码的预测的蛋白是360个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了17个残基的信号肽。预测的成熟蛋白含有343个氨基酸,具有38.93kDa的预测的分子量和7.17的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的嗜热柱顶孢基因组DNA的推导的氨基酸序列与来自颖枯壳针孢(Phaeosphaeria nodorum)的GH10木聚糖酶的推导的氨基酸序列(UNIPROT B6DQK8)具有68.28%同一性(排除缺口)。
嗜热柱顶孢GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:5(D822JW)和SEQ ID NO:6(P244Y1)。编码序列为1199bp,包含终止密码子,其由68bp(核苷酸265至332)的一个内含子中断。编码的预测的蛋白是376个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了18个残基的信号肽。预测的成熟蛋白含有358个氨基酸,具有40.29kDa的预测的分子量和6.30的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的嗜热柱顶孢基因组DNA的推导的氨基酸序列与来自Corynascus heterothallicus的GH10木聚糖酶的推导的氨基酸序列(GENESEQP AEB00303)具有78.59%同一性(排除缺口)。
嗜热柱顶孢GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:7(D822JX)和SEQ ID NO:8(P244Y2)。编码序列为1104bp,包含终止密码子,无任何内含子。编码的预测的蛋白是367个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了22个残基的信号肽。预测的成熟蛋白含有345个氨基酸,具有39.03kDa的预测的分子量和5.42的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的嗜热柱顶孢基因组DNA的推导的氨基酸序列与来自鹅柄孢壳菌(Podospora anserina)的GH10木聚糖酶的推导的氨基酸序列(UNIPROT B2B789)具有77.98%同一性(排除缺口)。
樟绒枝霉GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:9(D6RM)和SEQ ID NO:10(P23DM4)。编码序列为1623bp,包含终止密码子,其由76bp(核苷酸239至314),59bp(核苷酸356至414),68bp(核苷酸464至531),63bp(核苷酸654至716),62bp(核苷酸863至925),60bp(核苷酸1015至1074),68bp(核苷酸1094至1161),56bp(核苷酸1189至1244),73bp(核苷酸1334至1406),和58bp(核苷酸1473至1530)的十个内含子中断。编码的预测的蛋白是326个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了18个残基的信号肽。预测的成熟蛋白含有308个氨基酸,具有33.52kDa的预测的分子量和4.89的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的樟绒枝霉基因组DNA的推导的氨基酸序列与来自禾生炭疽菌的GH10木聚糖酶的推导的氨基酸序列(UNIPROT E3QSE3)具有66.88%同一性(排除缺口)。
樟绒枝霉GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:11(D82DB2)和SEQ ID NO:12(P249XY)。编码序列为1365bp,包含终止密码子,其由772bp(核苷酸78至149),84bp(核苷酸319至402),66bp(核苷酸536至601),和78bp(核苷酸716至793)的四个内含子中断。编码的预测的蛋白是354个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了20个残基的信号肽。预测的成熟蛋白含有334个氨基酸,具有38.70kDa的预测的分子量和6.17的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的樟绒枝霉基因组DNA的推导的氨基酸序列与来自烟曲霉的GH10木聚糖酶的推导的氨基酸序列(UNIPROT AZI24748)具有61.56%同一性(排除缺口)。
嗜热棒囊壳GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:13(D1316T)和SEQ ID NO:14(P24MCW)。编码序列为1513bp,包含终止密码子,其由120bp(核苷酸81至200),182bp(核苷酸602至783),和143bp(核苷酸1245至1387)的三个内含子中断。编码的预测的蛋白是355个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了17个残基的信号肽。预测的成熟蛋白含有338个氨基酸,具有37.98kDa的预测的分子量和5.08的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的嗜热棒囊壳基因组DNA的推导的氨基酸序列与来自颖枯壳针孢的GH10木聚糖酶的推导的氨基酸序列(UNIPROT B6DQK8)具有70.25%同一性(排除缺口)。
嗜热棒囊壳GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:15(D1315U)和SEQ ID NO:16(P24MCX)。编码序列为1101bp,包含终止密码子,无内含子。编码的预测的蛋白是366个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了19个残基的信号肽。预测的成熟蛋白含有347个氨基酸,具有39.58kDa的预测的分子量和7.77的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的嗜热棒囊壳基因组DNA的推导的氨基酸序列与来自鹅柄孢壳菌的GH10木聚糖酶的推导的氨基酸序列(UNIPROT B2B789)具有74.93%同一性(排除缺口)。
嗜热棒囊壳GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:17(D82PQC)和SEQ ID NO:18(P24FVF)。编码序列为1365bp,包含终止密码子,其由74bp(核苷酸74至147),67bp(核苷酸212至278),和78bp(核苷酸530至607)的三个内含子中断。编码的预测的蛋白是381个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了17个残基的信号肽。预测的成熟蛋白含有364个氨基酸,具有39.42kDa的预测的分子量和6.37的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的嗜热棒囊壳基因组DNA的推导的氨基酸序列与来自金孢子菌属种(Chrysosporium sp.)的GH10木聚糖酶的推导的氨基酸序列(GENESEQP ABB05060)具有86.98%同一性(排除缺口)。
草酸青霉GH10木聚糖酶编码序列的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:19(D72UED)和SEQ ID NO:20(P241KU)。编码序列为1168bp,包含终止密码子,其由79bp(核苷酸235至313)的一个内含子中断。编码的预测的蛋白是362个氨基酸。使用SignalP程序(Nielsen等,1997,见上文),预测了17个残基的信号肽。预测的成熟蛋白含有345个氨基酸,具有38.06kDa的预测的分子量和5.73的预测的等电点。
使用Needleman和Wunsch算法(Needleman和Wunsch,1970,见上文)以10的缺口开放罚分、0.5的缺口延伸罚分和EBLOSUM62矩阵确定了氨基酸序列的比较性逐对全局比对。比对显示编码GH10木聚糖酶的草酸青霉基因组DNA的推导的氨基酸序列与来自变灰青霉(Penicillium canescens)的GH10木聚糖酶的推导的氨基酸序列(UNIPROT C3VEV9)具有82.22%同一性(排除缺口)。
实施例10:嗜热柱顶孢GH10木聚糖酶编码序列的表达
米曲霉HowB101(WO95/35385)原生质体根据Christensen等,1988,Bio/Technology6:1419-1422的方法制备,并分别用3μg的pGH10_ZY577319_22,3μg的pGH10_ZY577226_23,和3μg的pGH10_ZY577198_133转化。对于每个转化,转化产生大约50个转化体。将来自每个转化的八个转化体分离至单独的基本培养基平板。
将来自每次转化的四个转化体分别接种入24孔板中的3ml的YPM培养基,并在30℃在150rpm混合下温育。在3日温育之后,将来自每个培养的20μl的上清通过使用具有MES的4-12%Bis-Tris Gel(Invitrogen Corporation,Carlsbad,CA,USA)的SDS-PAGE根据生产商的指示来分析。将所得的凝胶用INSTANTBLUETM(Expedeon Ltd.,BabrahamCambridge,UK)染色。培养的SDS-PAGE概貌显示所述三个编码序列表达下表7中所示的蛋白。表达菌株如第二栏中所示命名。
表7:嗜热柱顶孢GH10木聚糖酶编码序列的表达
质粒 | 表达菌株 | 重组蛋白的大小(Kd) |
pGH10_ZY577319_22 | O5KR9 | 40kDa |
pGH10_ZY577226_23 | O5KRD | 在45kDa(强)和40kDa(弱)的两条条带 |
pGH10_ZY577198_133 | O5KRG | 在46kDa和40kDa的两条条带 |
实施例11:樟绒枝霉NN051564GH10木聚糖酶编码序列的表达
米曲霉HowB101原生质体根据Christensen等,1988,见上文的方法制备,并用3μg的pxyn13转化。转化产生约50个转化体。将八个转化体分离至单个基本培养基平板。
将四个转化体分别接种入24孔板中的3ml的YPM培养基,并在30℃在150rpm混合下温育。在3日温育之后,将来自每个培养的20μl的上清通过使用具有MES的4-12%Bis-Tris Gel的SDS-PAGE根据生产商的指示进行分析。将所得的凝胶用INSTANTBLUETM染色。培养物的SDS-PAGE概貌显示4个转化体中的2个表达大约34kDa的蛋白。将表达菌株,转化体4,命名为米曲霉EXP02789。
实施例12:嗜热棒囊壳CBS174.70GH10木聚糖酶编码序列的表达
米曲霉HowB101原生质体根据Christensen等,1988,Bio/Technology6:1419-1422的方法制备,并分别用3μg的pGH10_Mf4036,和3μg的pGH10_Mf0530转化。每个转化产生大约50个转化体。将来自每个转化的八个转化体分离至单独的基本培养基平板。
将来自每次转化的四个转化体分别接种入24孔板中的3ml的YPM培养基,并在30℃在150rpm混合下温育。在3日温育之后,将来自每个培养的20μl的上清通过使用具有MES的4-12%Bis-Tris Gel的SDS-PAGE根据生产商的指示来分析。将所得的凝胶用INSTANTBLUETM(Expedeon Ltd.,Babraham Cambridge,UK)染色。培养的SDS-PAGE概貌显示所述三个编码序列表达下表8中所示的蛋白。表达菌株如第二栏中所示命名。
表8:嗜热棒囊壳CBS174.70GH10木聚糖酶编码序列的表达
质粒 | 表达菌株 | 重组蛋白的大小 |
pGH10_Mf4036 | O7R3T | 42kDa |
pGH10_Mf0530 | O7J26 | 40kDa |
实施例13:草酸青霉GH10木聚糖酶基因的表达
米曲霉HowB101原生质体根据Christensen等,1988,见上文的方法制备,并用3μg的pGH10_ZY569164_676转化。转化产生约50个转化体。将四个转化体分离至单个基本培养基平板。
将四个转化体分别接种入24孔板中的3ml的YPM培养基,并在30℃在150rpm混合下温育。在3日温育之后,将来自每个培养的20μl的上清通过使用具有MES的4-12%Bis-Tris Gel的SDS-PAGE根据生产商的指示进行分析。将所得的凝胶用INSTANTBLUETM染色。培养物的SDS-PAGE概貌显示多数转化体在大约46kDa具有主要条带。将表达菌株命名为米曲霉O4S5C。
实施例14:表达菌株的发酵
使用每个转化体的斜面接种4至6个含有400ml的YPM的2L摇瓶。每个表达菌株的总培养体积示于表9。然后将摇瓶在30℃,80rpm振荡3日。将培养物在第3日收获,并使用0.45μmMembrane(Millipore,Bedford,MA,USA)过滤。
表9:表达菌株的发酵
表达菌株 | 培养体积(ml) |
O5KR9 | 2400 |
O5KRD | 1600 |
EXP02789 | 1600 |
O7R3T | 3200 |
O4S5C | 2000 |
实施例15:从米曲霉菌株O5KR9,O5KRD,EXP02789,O4S5C和O7R3T纯化重组的GH10木聚糖酶
将2400ml体积的米曲霉O5KR9上清用硫酸铵(80%饱和)沉淀,重新溶解于50ml的20mM乙酸钠pH5.5,针对同一缓冲液透析,并通过0.45μm过滤器过滤。最终体积为80ml。将溶液施于用20mM乙酸钠pH5.5平衡的30ml SPFast Flow柱(GE Heathcare Life Sciences,Piscataway,NJ,USA),并将蛋白使用线性0-0.5M NaCl梯度洗脱。收集级分并施于用20mM乙酸钠pH5.5平衡的QFast Flow柱(GE Heathcare LifeSciences,Piscataway,NJ,USA)。收集级分,并通过使用具有MES的 4-12%Bis-Tris Gel的SDS-PAGE分析。汇集含有在大约40kDa的条带的级分,并通过超滤浓缩。
将1600ml体积的米曲霉O5KRD上清用硫酸铵(80%饱和)沉淀,重新溶解于50ml的20mM乙酸钠pH5.5,针对同一缓冲液透析,并通过0.45μm过滤器过滤。最终体积为60ml。将溶液施于用20mM乙酸钠pH5.0平衡的40ml QFast Flow柱并将蛋白使用线性0-0.5M NaCl梯度洗脱。收集级分并施于40ml Phenyl6Fast Flow柱(GE HeathcareLife Sciences,Piscataway,NJ,USA)。收集级分,并通过使用具有MES的4-12%Bis-Tris Gel的SDS-PAGE分析。汇集含有在大约40kDa的条带的级分,并通过超滤浓缩。
将1600ml体积的米曲霉EXP02789上清用硫酸铵(80%饱和)沉淀,重新溶解于50ml的25mM Bis-Tris pH6.0,针对同一缓冲液透析,并通过0.45μm过滤器过滤。最终体积为60ml。将溶液施于用25mM Bis-Tris pH6.0平衡的40ml QFast Flow柱并将蛋白使用线性0-0.5M NaCl梯度洗脱。将级分收集、汇集,并针对25mM Bis-Tris pH5.5透析,施于用25mMBis-Tris pH5.5平衡的40ml SPFast Flow柱。收集级分,并通过使用具有MES的4-12%Bis-Tris Gel的SDS-PAGE分析。汇集含有在大约34kDa的条带的级分,并通过超滤浓缩。
将2000ml体积的米曲霉O4S5C上清用硫酸铵(80%饱和)沉淀,重新溶解于50ml的20mM Tris-HCl pH7.5,针对同一缓冲液透析,并通过0.45μm过滤器过滤。最终体积为80ml。将溶液施于用20mM Tris-HCl pH7.5平衡的40ml QFast Flow柱并将蛋白使用线性0-0.5M NaCl梯度洗脱。收集级分并通过使用具有MES的4-12%Bis-Tris Gel的SDS-PAGE分析。汇集含有在大约46kDa的条带的级分,并通过超滤浓缩。
将3200ml体积的米曲霉O7R3T上清用硫酸铵(80%饱和)沉淀,重新溶解于50ml20mM Bis-Tris pH6.5,针对同一缓冲液透析,并通过0.45μm过滤器过滤。最终体积为110ml。将溶液施于在20mM Bis-Tris pH6.5中平衡的40ml QFast Flow柱并将蛋白使用线性0.0-0.2M NaCl梯度洗脱。收集用0.1-0.2M洗脱的级分并使用40ml Phenyl6FastFlow柱以线性1.2-0M(NH4)2SO4梯度进一步纯化。通过使用具有MES的4-12%Bis-Tris Gel的SDS-PAGE评价级分。汇集含有大约42kDa的条带的级分,并通过超滤浓缩。
实施例16:樟绒枝霉P23DM4GH10木聚糖酶的表征
比活性:樟绒枝霉P23DM4GH10木聚糖酶的比活性使用桦木木聚糖(Sigma Chemical Co.,St.Louis,MO,USA)作为底物确定。桦木木聚糖的储液通过将2g的桦木木聚糖每升50mM乙酸钠pH5.0与0.01%20混合来制备。向190μl的桦木木聚糖储液添加10μl的樟绒枝霉GH10木聚糖酶(以不同的蛋白加载量)。蛋白浓度使用Microplate BCATMProtein Assay Kit(Thermo Fischer Scientific,Waltham,MA,USA)确定,其中使用牛血清白蛋白作为蛋白标样。包括了底物对照和酶对照。将反应在50℃温育30分钟,然后添加50μl的0.5M NaOH以终止反应。产生的还原糖使用如下所述的调适于96孔微孔板形式的对羟基苯甲酰肼(PHBAH,Sigma Chemical Co.,St.Louis,MO,USA)测定法来确定。简言之,将适当稀释的样品的100μl等分试样置于96孔锥底微滴定板中。反应通过添加2%NaOH中的50μl的1.5%(w/v)PHBAH起始。将平板在95℃不覆盖加热10分钟,然后允许其冷却至室温(RT),然后将50μl的蒸馏水添加至每个孔。将来自每个孔的100μl等分试样转移至平底96孔板,并使用Microplate Reader(Molecular Devices,Sunnyvale,CA,USA)测量在410nm的吸光度。使用葡萄糖标样(用0.4%氢氧化钠稀释的0.1-0.0125mg/ml)制备标准曲线将获得的A410nm值换算为葡萄糖当量。将酶加载量对产生的还原糖进行作图,并使用线性范围来计算M.cinnamomea P23DM4GH10木聚糖酶的比活性,表示为每mg酶每分钟产生的葡萄糖当量的微摩尔数,或IU/mg。M.cinnamomeaP23DM4GH10木聚糖酶对桦木木聚糖的比活性测量为53.2IU/mg酶。
热稳定性:将M.cinnamomea P23DM4GH10木聚糖酶稀释于含有0.01%20的50mM乙酸钠pH5至1g每升,然后在50℃温育3日,和在60℃温育3小时和24小时。将相同的样品储藏于4℃充当对照。在温育之后,测量了样品对桦木木聚糖的活性,测量遵循上述用于确定比活性的测定规程,但仅使用一个在比活性测定中给出<5%转化的酶加载量。将样品在4℃的活性标准化至100%,并将其他温育条件下样品的活性与4℃活性相比较。热稳定性确定的结果如下所示。
温育条件 | 对桦木木聚糖的剩余活性 |
4℃ | 100% |
50℃,3日 | 97% |
60℃,3小时 | 6% |
60℃,24小时 | 0% |
pH概貌:M.cinnamomea P23DM4GH10木聚糖酶的pH活性概貌使用上述用于确定比活性的相同规程来确定,但该测定在五个不同pH(4,5,6,7,和8)进行,且仅使用一个在比活性测定中给出<5%转化的酶加载量。使用了Britton Robinson缓冲液,其如下所示制备:制备100mM储液,其在1升去离子水中含有0.1摩尔硼酸,0.1摩尔乙酸,和0.1摩尔磷酸。然后将100mM储液使用5M NaOH滴定至4,5,6,7,或8,然后稀释至40mM。将桦木木聚糖在相同缓冲液中制备,并在50℃测量活性。将最高活性标准化至100%,并将在其他pH值的活性与最高活性相比较,并表示为%活性。pH概貌确定的结果如下所示。
pH值 | %活性 |
4.0 | 1% |
5.0 | 81% |
6.0 | 100% |
7.0 | 78% |
8.0 | 37% |
实施例17:木聚糖酶活性的测量
木聚糖酶活性使用AZCL-木聚糖(Megazyme,Bray,Ireland)作为底物来测量。0.2%AZCL-木聚糖悬液在20mM乙酸钠pH5.0缓冲液中通过轻柔地搅拌添加0.01%X-100来制备。然后将100μl的0.2%AZCL-木聚糖悬液与20μl的木聚糖酶样品在微滴定板中混合,并在反应之前置于冰上。测定通过将微滴定板转移至热混合仪来起始,所述热混合仪设定至50℃的温度。将平板在热混合仪上在700rpm对于微滴定板温育15-30分钟。反应通过将平板转移回冰浴来终止。然后将平板在冰冷的离心机中以1000g离心数分钟,并将100μl的上清转移至微滴定板。读取在595nm的吸光度作为木聚糖酶活性的量度。所有反应进行一式三次,亦进行无木聚糖酶的缓冲液对照。
对米曲霉表达菌株O5KR9,O5KRD,O4S5C,和O7R3T(参见实施例15)的纯化的木聚糖酶如上所述测定木聚糖酶活性。结果如下所示。
蛋白 | OD595 |
对照 | 0.1354 |
O5KR9 | 1.539 |
O5KRD | 0.9219 |
O4S5C | 1.4541 |
O7R3T | 1.2844 |
通过下述编号段落进一步描述本发明:
[1]一种具有木聚糖酶活性的分离的多肽,其选自下组:
(a)多肽,其与SEQ ID NO:2的成熟多肽具有至少60%序列同一性;与SEQ ID NO:12的成熟多肽具有至少65%序列同一性;与SEQ ID NO:4或SEQID NO:10的成熟多肽具有至少70%序列同一性;与SEQ ID NO:14或SEQ IDNO:16的成熟多肽具有至少75%序列同一性;与SEQ ID NO:6或SEQ ID NO:8的成熟多肽具有至少80%序列同一性;与SEQ ID NO:20的成熟多肽具有至少85%序列同一性;或与SEQ ID NO:18的成熟多肽具有至少90%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少中等-高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:9,或SEQ ID NO:11的成熟多肽编码序列,(ii)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:9,或SEQ ID NO:11的cDNA序列,或(iii)(i)或(ii)的全长互补链;或在至少高严格条件下与以下杂交:(i)SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19的成熟多肽编码序列,(ii)SEQ ID NO:5,SEQ ID NO:13,SEQ ID NO:17,或SEQ ID NO:19的cDNA序列,或(iii)(i)或(ii)的全长互补链。
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%序列同一性;与SEQ ID NO:11的成熟多肽编码序列或其cDNA序列具有至少65%序列同一性;与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列或SEQ ID NO:9或其cDNA序列具有至少70%序列同一性;与SEQ ID NO:13的成熟多肽编码序列或其cDNA序列或SEQ ID NO:15的成熟多肽编码序列具有至少75%序列同一性;与SEQID NO:5的成熟多肽编码序列或其cDNA序列或SEQ ID NO:7的成熟多肽编码序列具有至少80%序列同一性;与SEQ ID NO:19的成熟多肽编码序列或其cDNA序列具有至少85%序列同一性;或与SEQ ID NO:17的成熟多肽编码序列或其cDNA序列具有至少90%序列同一性;
(d)SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ IDNO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽在一个或多个(例如几个)位置包含取代、缺失和/或插入的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有木聚糖酶活性的片段。
[2]段1的多肽,其与SEQ ID NO:2的成熟多肽具有至少60%,至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:12的成熟多肽具有至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQID NO:4或SEQ ID NO:10的成熟多肽具有至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:14或SEQ ID NO:16的成熟多肽具有至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:6或SEQ ID NO:8的成熟多肽具有至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:20的成熟多肽具有至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:18的成熟多肽具有至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。
[3]段1或2的多肽,其由多核苷酸编码,所述多核苷酸在中等-高、高或非常高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ IDNO:9,或SEQ ID NO:11的成熟多肽编码序列,(ii)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:9,或SEQ ID NO:11的cDNA序列,或(iii)(i)或(ii)的全长互补链;或在至少高或非常高严格条件下与以下杂交:(i)SEQ ID NO:5,SEQ IDNO:7,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19的成熟多肽编码序列,(ii)SEQ ID NO:5,SEQ ID NO:13,SEQ ID NO:17,或SEQ ID NO:19的cDNA序列,或(iii)(i)或(ii)的全长互补链。
[4]段1-3任一项的多肽,其由多核苷酸编码,所述多核苷酸与SEQ IDNO:1的成熟多肽编码序列或其cDNA序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:11的成熟多肽编码序列或其cDNA序列具有至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列或SEQID NO:9的成熟多肽编码序列或其cDNA序列具有至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:13的成熟多肽编码序列或其cDNA序列或SEQ ID NO:15的成熟多肽编码序列具有至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列或SEQ ID NO:7的成熟多肽编码序列具有至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;与SEQ ID NO:19的成熟多肽编码序列或其cDNA序列具有至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性;或与SEQ ID NO:17的成熟多肽编码序列或其cDNA序列具有至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。
[5]段1-4任一项的多肽,其包含或组成为SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20或SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽。
[6]段5的多肽,其中所述成熟多肽是SEQ ID NO:2的氨基酸21至406,SEQ ID NO:4的氨基酸18至360,SEQ ID NO:6的氨基酸19至376,SEQ IDNO:8的氨基酸23至367,SEQ ID NO:10的氨基酸19至326,SEQ ID NO:12的氨基酸21至354,SEQ ID NO:14的氨基酸18至355,SEQ ID NO:16的氨基酸20至366,SEQ ID NO:18的氨基酸18至381,或SEQ ID NO:20的氨基酸18至362。
[7]段1-4任一项的多肽,其为SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ IDNO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽在一个或多个位置包含取代、缺失和/或插入的变体。
[8]段1-7任一项的多肽,其为SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ IDNO:16,SEQ ID NO:18,或SEQ ID NO:20的片段,其中所述片段具有木聚糖酶活性。
[9]一种组合物,其包含段1-8任一项的多肽。
[10]一种分离的多核苷酸,其编码段1-8任一项的多肽。
[11]一种核酸构建体或表达载体,其包含段10的多核苷酸,所述多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导所述多肽在表达宿主中的产生。
[12]一种重组宿主细胞,其包含段10的多核苷酸,所述多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导多肽的产生。
[13]一种产生段1-8中任一项的多肽的方法,其包括:在有助于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生所述多肽。
[14]段13的方法,其还包括回收所述多肽。
[15]一种产生具有木聚糖酶活性的多肽的方法,其包括:在有助于所述多肽产生的条件下培养段12的宿主细胞。
[16]段15的方法,其还包括回收所述多肽。
[17]一种转基因植物、植物部分或植物细胞,其经编码段1-8任一项的多肽的多核苷酸转化。
[18]一种产生具有木聚糖酶活性的多肽的方法,其包括:在有助于所述多肽产生的条件下培养段17的转基因植物或植物细胞。
[19]段18的方法,其还包括回收所述多肽。
[20]一种产生亲本细胞的突变体的方法,所述方法包括使编码段1-8中任一项的多肽的多核苷酸失活,导致突变体与亲本细胞相比产生更少的所述多肽。
[21]由段20的方法产生的突变细胞。
[22]段21的突变细胞,其进一步包含编码天然或异源蛋白的基因。
[23]一种产生蛋白的方法,其包括:在有助于所述蛋白产生的条件下培养段21或22的突变细胞。
[24]段23的方法,其还包括回收所述多肽。
[25]一种双链抑制性RNA(dsRNA)分子,其包含段10的多核苷酸的亚序列,其中任选地该dsRNA为siRNA或miRNA分子。
[26]段25的双链抑制性RNA(dsRNA)分子,其长度为约15、16、17、18、19、20、21、22、23、24、25个或更多个双链体核苷酸。
[27]一种抑制具有木聚糖酶的多肽在细胞中的表达的方法,其包括对细胞施用或者在细胞中表达段25或26的双链抑制性RNA(dsRNA)分子。
[28]由段27的方法产生的细胞。
[29]段28的细胞,其进一步包含编码天然或异源蛋白的基因。
[30]一种产生蛋白的方法,其包括:在有助于所述蛋白产生的条件下培养段28或29的细胞。
[31]段30的方法,其还包括回收所述多肽。
[32]一种分离的多核苷酸,其编码信号肽,所述信号肽包含或组成为SEQID NO:2的氨基酸1至20,SEQ ID NO:4的氨基酸1至17,SEQ ID NO:6的氨基酸1至18,SEQ ID NO:8的氨基酸1至22,SEQ ID NO:10的氨基酸1至18,SEQ ID NO:12的氨基酸1至20,SEQ ID NO:14的氨基酸1至17,SEQ ID NO:16的氨基酸1至19,SEQ ID NO:18的氨基酸1至17,或SEQ IDNO:20的氨基酸1至17。
[33]一种核酸构建体或表达载体,其包含可操作地连接于段32的多核苷酸的编码蛋白的基因,其中所述基因对于编码所述信号肽的多核苷酸是外源的。
[34]一种重组宿主细胞,其包含可操作地连接于段32的多核苷酸的编码蛋白的基因,其中所述基因对于编码所述信号肽的多核苷酸而言是外源的。
[35]一种产生蛋白的方法,其包括:在有助于所述蛋白产生的条件下培养重组宿主细胞,所述重组宿主细胞包含可操作地连接于段32的多核苷酸的编码蛋白的基因,其中所述基因对于编码所述信号肽的多核苷酸而言是外源的。
[36]段35的方法,其还包括回收所述多肽。
[37]一种降解纤维素材料或含木聚糖材料的方法,其包括:在段1-8中任一项的具有木聚糖活性的多肽存在下用酶组合物处理所述纤维素材料或含木聚糖材料。
[38]段37的方法,其中所述纤维素材料或含木聚糖材料经过预处理。
[39]段37或38任一项的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[40]段39的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
[41]段39的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
[42]段37-41中任一项的方法,还包括回收经降解的纤维素材料或含木聚糖材料。
[43]段42的方法,其中经降解的纤维素材料或含木聚糖材料是糖。
[44]段43的方法,其中所述糖选自下组:葡萄糖、木糖、甘露糖、半乳糖,和阿拉伯糖。
[45]一种产生发酵产物的方法,其包括:(a)在段1-8中任一项的具有木聚糖酶活性的多肽存在下,用酶组合物糖化纤维素材料或含木聚糖材料;(b)用一种或多种发酵微生物发酵经糖化的纤维素材料或含木聚糖材料以产生发酵产物;和(c)从发酵回收发酵产物。
[46]段45的方法,其中所述纤维素材料或含木聚糖材料是经预处理的。
[47]段45或46的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[48]段47的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
[49]段47的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
[50]段45-49中任一项的方法,其中步骤(a)和(b)在同时糖化和发酵中同时进行。
[51]段45-50中任一项的方法,其中发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[52]一种发酵纤维素材料或含木聚糖材料的方法,其包括:用一种或多种发酵微生物发酵纤维素材料或含木聚糖材料,其中所述纤维素材料或含木聚糖材料是在段1-8中任一项的具有木聚糖酶活性的多肽的存在下用酶组合物糖化的。
[53]段52的方法,其中所述纤维素材料或含木聚糖材料的发酵产生发酵产物。
[54]段53的方法,还包括从发酵回收发酵产物。
[55]段53或54的方法,其中发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[56]段52-55任一项的方法,其中所述纤维素材料或含木聚糖材料在糖化前经过预处理。
[57]段52-56任一项的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[58]段57的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
[59]段57的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
[60]一种全培养液配制物或细胞培养组合物,其包含段1-8任一项的多肽。
本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内,因为这些方面旨在作为本发明几个方面的说明。旨在将任何等同的方面包含于本发明的范围内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。
Claims (17)
1.一种具有木聚糖酶活性的分离的多肽,其选自下组:
(a)多肽,其与SEQ ID NO:2的成熟多肽具有至少60%序列同一性;与SEQID NO:12的成熟多肽具有至少65%序列同一性;与SEQ ID NO:4或SEQ ID NO:10的成熟多肽具有至少70%序列同一性;与SEQ ID NO:14或SEQ ID NO:16的成熟多肽具有至少75%序列同一性;与SEQ ID NO:6或SEQ ID NO:8的成熟多肽具有至少80%序列同一性;与SEQ ID NO:20的成熟多肽具有至少85%序列同一性;或与SEQ ID NO:18的成熟多肽具有至少90%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少中等-高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:9,或SEQ ID NO:11的成熟多肽编码序列,(ii)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:9,或SEQ ID NO:11的cDNA序列,或(iii)(i)或(ii)的全长互补链;或在至少高严格条件下与以下杂交:(i)SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,或SEQ ID NO:19的成熟多肽编码序列,(ii)SEQ ID NO:5,SEQ ID NO:13,SEQ ID NO:17,或SEQ ID NO:19的cDNA序列,或(iii)(i)或(ii)的全长互补链。
(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%序列同一性;与SEQ ID NO:11的成熟多肽编码序列或其cDNA序列具有至少65%序列同一性;与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列或SEQ ID NO:9或其cDNA序列具有至少70%序列同一性;与SEQ ID NO:13的成熟多肽编码序列或其cDNA序列或SEQ ID NO:15的成熟多肽编码序列具有至少75%序列同一性;与SEQID NO:5的成熟多肽编码序列或其cDNA序列或SEQ ID NO:7的成熟多肽编码序列具有至少80%序列同一性;与SEQ ID NO:19的成熟多肽编码序列或其cDNA序列具有至少85%序列同一性;或与SEQ ID NO:17的成熟多肽编码序列或其cDNA序列具有至少90%序列同一性;
(d)SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ IDNO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽在一个或多个(例如几个)位置包含取代、缺失和/或插入的变体;和
(e)(a)、(b)、(c)或(d)的多肽具有木聚糖酶活性的片段。
2.权利要求1-4任一项的多肽,其包含SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18或SEQ ID NO:20,或SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18或SEQ ID NO:20的成熟多肽;或由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20或SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,或SEQ ID NO:20的成熟多肽组成。
3.权利要求5的多肽,其中所述成熟多肽是SEQ ID NO:2的氨基酸21至406,SEQ ID NO:4的氨基酸18至360,SEQ ID NO:6的氨基酸19至376,SEQ ID NO:8的氨基酸23至367,SEQ ID NO:10的氨基酸19至326,SEQ IDNO:12的氨基酸21至354,SEQ ID NO:14的氨基酸18至355,SEQ ID NO:16的氨基酸20至366,SEQ ID NO:18的氨基酸18至381,或SEQ ID NO:20的氨基酸18至362。
4.一种分离的多核苷酸,其编码权利要求1-3任一项的多肽。
5.一种重组宿主细胞,其包含权利要求4的多核苷酸,所述多核苷酸可操作地连接于一个或多个指导多肽的产生的调控序列。
6.一种产生权利要求1-3中任一项的多肽的方法,其包括:
(a)在有助于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和任选地
(b)回收所述多肽。
7.一种产生具有木聚糖酶活性的多肽的方法,其包括:
(a)在有助于所述多肽产生的条件下培养权利要求5的宿主细胞;和任选地
(b)回收所述多肽。
8.一种转基因植物、植物部分或植物细胞,其用编码权利要求1-3中任一项的多肽的多核苷酸转化。
9.一种产生具有木聚糖酶活性的多肽的方法,其包括:
(a)在有助于所述多肽产生的条件下培养权利要求8的转基因植物或植物细胞;和任选地
(b)回收所述多肽。
10.一种产生亲本细胞的突变体的方法,所述方法包括使编码权利要求1-3中任一项的多肽的多核苷酸失活,其导致突变体与亲本细胞相比产生更少的所述多肽。
11.一种包含权利要求4的多核苷酸的亚序列的双链抑制性RNA(dsRNA)分子,其中任选地所述dsRNA是siRNA或miRNA分子。
12.一种分离的多核苷酸,其编码信号肽,所述信号肽包含SEQ ID NO:2的氨基酸1至20,SEQ ID NO:4的氨基酸1至17,SEQ ID NO:6的氨基酸1至18,SEQ ID NO:8的氨基酸1至22,SEQ ID NO:10的氨基酸1至18,SEQID NO:12的氨基酸1至20,SEQ ID NO:14的氨基酸1至17,SEQ ID NO:16的氨基酸1至19,SEQ ID NO:18的氨基酸1至17,或SEQ ID NO:20的氨基酸1至17;或由SEQ ID NO:2的氨基酸1至20,SEQ ID NO:4的氨基酸1至17,SEQ ID NO:6的氨基酸1至18,SEQ ID NO:8的氨基酸1至22,SEQ ID NO:10的氨基酸1至18,SEQ ID NO:12的氨基酸1至20,SEQ ID NO:14的氨基酸1至17,SEQ ID NO:16的氨基酸1至19,SEQ ID NO:18的氨基酸1至17,或SEQ ID NO:20的氨基酸1至17组成。
13.一种产生蛋白质的方法,其包括:
(a)在有助于所述蛋白质产生的条件下培养重组宿主细胞,所述重组宿主细胞包含与权利要求4的多核苷酸可操作连接的编码蛋白质的基因,其中所述基因对于编码信号肽的多核苷酸而言是外源的;和任选地
(b)回收所述蛋白质。
14.一种降解纤维素材料或含木聚糖材料的方法,其包括:在权利要求1-3中任一项的具有木聚糖酶活性的多肽存在下用酶组合物处理纤维素材料或含木聚糖材料。
15.一种产生发酵产物的方法,其包括:
(a)在权利要求1-3中任一项的具有木聚糖酶活性的多肽存在下,用酶组合物糖化纤维素材料或含木聚糖材料;
(b)用一种或多种发酵微生物发酵经糖化的纤维素材料或含木聚糖材料以产生发酵产物;和
(c)从所述发酵中回收所述发酵产物。
16.一种发酵纤维素材料或含木聚糖材料的方法,其包括:用一种或多种发酵微生物发酵纤维素材料或含木聚糖材料,其中所述纤维素材料或含木聚糖材料是在权利要求1-3中任一项的具有木聚糖酶活性的多肽的存在下用酶组合物糖化的。
17.一种全培养液配制物或细胞培养组合物,其包含权利要求1-3任一项的多肽。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201280065538.XA CN104039817A (zh) | 2011-10-28 | 2012-10-26 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011081495 | 2011-10-28 | ||
CNPCT/CN2011/081495 | 2011-10-28 | ||
CN201280065538.XA CN104039817A (zh) | 2011-10-28 | 2012-10-26 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
PCT/CN2012/083618 WO2013060293A1 (en) | 2011-10-28 | 2012-10-26 | Polypeptides having xylanase activity and polynucleotides encoding same |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104039817A true CN104039817A (zh) | 2014-09-10 |
Family
ID=51469668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280065538.XA Pending CN104039817A (zh) | 2011-10-28 | 2012-10-26 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104039817A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997027292A1 (en) * | 1996-01-22 | 1997-07-31 | Novo Nordisk A/S | An enzyme with xylanase activity |
WO2009033071A2 (en) * | 2007-09-07 | 2009-03-12 | Dyadic International, Inc. | Novel fungal enzymes |
US20110045544A1 (en) * | 2005-12-22 | 2011-02-24 | Roal Oy | Treatment of Cellulosic Material and Enzymes Useful Therein |
WO2011041405A1 (en) * | 2009-09-29 | 2011-04-07 | Novozymes, Inc. | Polypeptides having xylanase activity and polynucleotides encoding same |
-
2012
- 2012-10-26 CN CN201280065538.XA patent/CN104039817A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997027292A1 (en) * | 1996-01-22 | 1997-07-31 | Novo Nordisk A/S | An enzyme with xylanase activity |
US20110045544A1 (en) * | 2005-12-22 | 2011-02-24 | Roal Oy | Treatment of Cellulosic Material and Enzymes Useful Therein |
WO2009033071A2 (en) * | 2007-09-07 | 2009-03-12 | Dyadic International, Inc. | Novel fungal enzymes |
WO2011041405A1 (en) * | 2009-09-29 | 2011-04-07 | Novozymes, Inc. | Polypeptides having xylanase activity and polynucleotides encoding same |
Non-Patent Citations (1)
Title |
---|
FURNISS CAROLINE S M等: "The substrate specificity and susceptibility to wheat inhibitor proteins of Penicillium funiculosum xylanases from a commercial enzyme preparation", 《JOURNAL OF THE SCIENCE OF FOOD AND AGRICULTURE》, 26 November 2004 (2004-11-26) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103384678B (zh) | 具有纤维素水解增强活性的多肽及其编码多核苷酸 | |
CN102482680B (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN102712916B (zh) | 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸 | |
CN105886485B (zh) | β-葡糖苷酶变体及其编码多核苷酸 | |
CN102770534B (zh) | 具有纤维素分解增强活性的多肽及编码其的多核苷酸 | |
CN103517986A (zh) | 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸 | |
CN102597243A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN102648276A (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN102482652A (zh) | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 | |
CN102639697A (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN103797126A (zh) | 用于增强纤维素材料的降解或转化的方法 | |
CN102300986A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN102112604A (zh) | 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN102597228A (zh) | 纤维二糖水解酶变体及编码其的多核苷酸 | |
CN102695720A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN103998605A (zh) | 纤维二糖水解酶变体和编码它们的多核苷酸 | |
CN103703125A (zh) | 具有内切葡聚糖酶活性的多肽及其编码多核苷酸 | |
CN103282489A (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
CN103958675A (zh) | 具有木聚糖酶活性的多肽以及编码它们的多核苷酸 | |
CN103237891A (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
CN103068976A (zh) | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 | |
CN102918151A (zh) | 纤维二糖水解酶变体及编码其的多核苷酸 | |
CN104755617B (zh) | 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸 | |
CN103339252A (zh) | 具有纤维素分解增强活性的嵌合多肽及其编码多核苷酸 | |
CN103649308A (zh) | 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140910 |