CN101018862B - 用重组细胞合成长链多不饱和脂肪酸 - Google Patents
用重组细胞合成长链多不饱和脂肪酸 Download PDFInfo
- Publication number
- CN101018862B CN101018862B CN2005800206963A CN200580020696A CN101018862B CN 101018862 B CN101018862 B CN 101018862B CN 2005800206963 A CN2005800206963 A CN 2005800206963A CN 200580020696 A CN200580020696 A CN 200580020696A CN 101018862 B CN101018862 B CN 101018862B
- Authority
- CN
- China
- Prior art keywords
- cell
- seq
- pufa
- plant
- dha
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/80—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
- Y02A40/81—Aquaculture, e.g. of fish
- Y02A40/818—Alternative feeds for fish, e.g. in aquacultures
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明涉及在重组细胞(例如酵母或植物细胞)内合成长链多不饱和脂肪酸(特别是二十碳五烯酸、二十二碳五烯酸和二十二碳六烯酸)的方法。也提供了生产长链多不饱和脂肪酸的重组细胞或植物。此外,本发明涉及一组新的具有能应用于合成长链多不饱和脂肪酸的方法的去饱和酶或延长酶活性的酶。
Description
技术领域
本发明涉及在重组细胞例如酵母或植物细胞中合成长链脂肪酸、特别是二十碳五烯酸、二十二碳五烯酸和二十二碳六烯酸的方法。也提供了生产长链多不饱和脂肪酸的重组细胞或植物。此外,本发明涉及一组新的具有能用于合成长链多不饱和脂肪酸的方法的去饱和酶(desaturase)或延长酶(elongase)活性的酶。
背景技术
ω-3长链多不饱和脂肪酸现在被公认为是与人类及动物健康相关的重要化合物。可以从饮食来源中直接获得这些脂肪酸,或者通过转化亚油酸(LA,ω-6)或α亚麻酸(ALA,ω-3)等脂肪酸可以获得这些脂肪酸,这两种脂肪酸都被认为是人类饮食中的必需脂肪酸。虽然人类和多种其他的脊椎动物都能将来自于植物来源的LA或ALA转化成LC-PUFA,但是它们只能以非常低的效率进行这种转化。此外,绝大多数现代社会都有着失衡的饮食,其中至少90%的多不饱和脂肪酸是由ω-6脂肪酸组成,而不是4∶1或更低的ω-6∶ω-3比例,该比例被认为是理想的比例(Trautwein,2001)。人类的LC-PUFA例如二十碳五烯酸(EPA,20:5)和二十二碳六烯酸(DHA,22:6)的直接饮食来源绝大多数都来自于鱼或鱼油。专业保健人员因此推荐在人体饮食中常规地包括含有非常高水平LC-PUFA的鱼。鱼类来源的LC-PUFA油越来越多地被组合到食品中并且被用于婴儿配方。但是,因为全球和全国渔业的衰退,需要这些有益的强化健康的油的其他来源。
在人类饮食中包含ω-3 LC-PUFA例如EPA和DHA已经与许多种健康相关益处有关。这些益处包括预防或减少冠状动脉疾病、高血压、2型糖尿病、肾脏疾病、类风湿关节炎、溃疡性结肠炎和慢性阻塞性肺病,以及有助于脑部发育和生长(Simopoulos,2000)。最近,多个研究也已经表明ω-3 PUFA可以有益于婴儿营养和发育,以及有益于抗各种精神病例如精神分裂症、注意力缺陷多动症和Alzheimer病。
与动物相反,高等植物缺少合成链长大于18个碳的多不饱和脂肪酸的能力。具体地,农作物和园艺植物与其他的被子植物都不具有合成源自ALA的长链ω-3脂肪酸例如EPA、DPA和DHA所需的酶。植物生物技术学的一个重要目标因此是遗传工程化产大量LC-PUFA的农作物植物,特别是油籽农作物,据此提供了这些化合物的其他来源。
LC-PUFA合成的途径
通过如图1中图解所示的一系列交替的氧依赖性的去饱和反应和延长反应可以使得在生物体(例如微藻类、苔藓和真菌)体内发生从亚油酸和α亚麻酸脂肪酸向LC-PUFA的生物合成。在一种途径(图I,II)中,由Δ6、Δ5和Δ4去饱和酶催化去饱和反应,每种酶都给脂肪酸碳链增加一个额外双键,而每个Δ6和Δ5延长反应都添加一个二碳单位,以延长碳链。因此这些生物体中的ALA向DHA的转化要求三个去饱和反应和两个延长反应。已经从各种微生物和低等植物例如微藻类、苔藓和真菌中克隆出编码在该需氧途径中生产DHA所需的酶的基因。已经从脊椎动物包括哺乳动物中分离出编码其中一些酶(包括催化第五个步骤的酶,Δ5延长酶)的基因(Sayanova and Napier综述,2004)。但是,从人类细胞中分离到的Δ5延长酶并非特异于EPA到DPA的反应,其对脂肪酸底物具有广泛的特异性(Leonard et al.,2002)。
在一些生物体中,已经显示出存在着ALA到DHA途径的两个部分的其他途径。在某些原生生物和破囊壶菌(thraustochytrids)中,通过Δ9延长酶和Δ8去饱和酶的组合(所谓的Δ8去饱和途径,见图1,IV)可以实现ALA向ETA的转化,如分离到编码这些酶的基因所证实的那样(Wallisand Browse,1999;Qi et al.,2002)。在哺乳动物中,所谓的“Sprecher”途径可以通过不依赖Δ4去饱和酶的三个反应将DPA转化成DHA(Sprecheret al.,1995)。
除了这些去饱和酶/延长酶系统外,通过多种生物体例如Shewanella、Mortiella、和Schizhochytrium中的厌氧途径也可以合成EPA和DHA(Abbadi et al.,2001)。已经从一些细菌中克隆出编码这些聚酮化合物合酶(PKS)酶复合体的操纵子(Morita et al.,2000;Metz et al.,2001;Tanaka etal.,1999;Yazawa,1996;Yu et al.,2000;WO 00/42195)。已经在Synechococcus中表达从Shewanella spp中分离到的EPA PKS操纵子,以便容许其合成EPA(Takeyama et al.,1997)。编码这些酶的基因排列于相当大的操纵子上,还没有报道它们在转基因植物中的表达。因此,仍然需要研究厌氧的PKS样系统对于转基因合成LC-PUFA是否是更为经典的需氧的去饱和酶/延长酶的可能的替代系统。
去饱和酶
已经显示出参与LC-PUFA的去饱和酶都属于一组所谓的“前端”去饱和酶,它们的特点是在每种蛋白的N末端都具有细胞色素b5结构域。细胞色素b5可能作为去饱和作用所需的电子的受体(Napier et al.,1999;Sperling and Heinz,2001)。
Δ5去饱和酶催化C20LC-PUFA的更多的去饱和作用,导致产生了花生四烯酸(ARA,20:4ω6)和EPA(20:5ω3)。已经从多种生物体中分离出编码这个酶的基因,生物体包括藻类(破囊壶菌(Thraustochytrium sp.)Qiuet al.,2001)、真菌(M.alpine、畸雌腐霉(Pythium irregulare),Michaelsonet al.,1998;Hong et al.,2002)、秀丽隐杆线虫(Caenorhabditis elegans)和哺乳动物。也已经从斑马鱼中鉴定出编码双功能Δ5/Δ6去饱和酶的基因(Hasting et al.,2001)。编码这种酶的基因可能代表“前端去饱和酶”的祖先形式,之后其复制并进化出不同的功能。生产DHA的最后的去饱和步骤是由Δ4去饱和酶催化的,已经从淡水原生生物物种纤细眼虫(Euglenagracilis)和海洋物种破囊壶菌中分离出编码这个酶的基因(Qiu et al.,2001;Meyer et al.,2003)。
延长酶
已经分离出一些编码PUFA延长酶的基因(Sayanova and Napier,2004)。该基因家族的成员与高等植物体内的涉及饱和和单不饱和脂肪酸的延长的延长酶基因(例如拟南芥属(Arabidopsis)的FAE1)无关。后者的实例是芸苔属(Brassicas)中的芥酸(22:1)。在一些原始生物物种中,通过在用Δ8去饱和酶进行去饱和(图1,IV部分;“Δ8去饱和”途径)之前,用C2单位延长亚油酸或α亚麻酸可以合成LC-PUFA。在这些物种中没有检测到Δ6去饱和酶和Δ6延长酶活性。取而代之的是,在这些生物体中检测到了Δ9延长酶活性,支持这一点的是,最近已经从球等鞭金藻(Isochrysis galbana)中分离出了C18Δ9延长酶(Qi et al.,2002)。LC-PUFA的遗传工程化生产
已经提议将通过插入这些基因而被遗传工程化为生产主要LC-PUFA的转基因油籽作物作为营养重要的脂肪酸的恒定来源。但是,由于需要可能来自不同来源的基因所编码的五种新酶的协同表达及活性,这一直使得这个目标难以实现,该提议至今仍是一种推测。
通过共表达Δ6延长酶和Δ6及Δ5脂肪酸去饱和酶已经成功地在酵母中构建出产生EPA的LC-PUFA氧依赖性生物合成的途径(图1),造成了由外源供应的亚油酸和α亚麻酸所产生的ARA及EPA的少量的但显著的蓄积(Beaudoin et al.,2000;Zank et al.,2000)。这表明从属于LC-PUFA合成途径的基因能在异种生物体中发挥作用。但是,产生EPA的效率是非常低的。例如,在酵母中表达了来自秀丽隐杆线虫、琉璃苣(Boragoofficinalis)和高山被孢霉(Mortierella alpina)的三种基因(Beaudoin et al.,2000)。当给转化酵母供应18:2ω-3(LA)或18:3ω-3(ALA)时,只产生了少量的20:4ω-6或20:5ω-3,转化效率分别是0.65%和0.3%。其他研究者通过在酵母中应用表达两种去饱和酶和一种延长酶的基因,同样获得了非常低效率的EPA的产生(Domergue et al.,2003a;Zank et al.,2002)。因此,仍需要提高在生物体例如酵母中产生EPA的效率,使得能单独地产生需要提供附加的酶步骤的C22PUFA。
在探索将需氧的LC-PUFA生物合成途径引入到高等植物(包括油籽作物)内的研究中已经取得了一些进步(综述,Sayanova and Napier,2004;Drexler et al.,2003;Abbadi et al.,2001)。在转基因的烟草和拟南芥属中表达从琉璃苣中分离到的编码Δ6脂肪酸去饱和酶的基因,使得在转基因植物中产生了GLA(18:3ω6)和SDA(18:4ω3),它们是LC-PUFA的直接前体(Sayanova et al.,1997;1999)。但是,这仅仅提供了单个第一步骤。
Domergue等(2003a)在酵母和转基因亚麻子中使用了三种编码Δ6-和Δ5-脂肪酸去饱和酶及Δ6-延长酶的基因的组合。去饱和酶基因来自于硅藻三角褐指藻(Phaeodactylum tricornutum),以及延长酶基因来自于苔藓小立碗藓(Physcomitrella patens)。对于酵母细胞内源性产生的Δ6-脂肪酸,只获得了较低的延长产率(即组合第一个和第二个酶步骤),所形成的主要C20 PUFA产物是20:2Δ11,14,代表着不需要的副反应。Domergue等(2003a)也声称(没有显示数据)在转基因亚麻中表达三种基因的组合,随后产生了ARA和EPA,但是生产是无效率的。他们认为在高等植物的种子中存在着如在酵母中观察到的相同问题,以及需要解决在油籽作物中产生LC-PUFA的“瓶颈”。
WO 2004/071467(DuPont)报道了各种去饱和酶和延长酶在大豆细胞中的表达,但是没有显示DHA在重组植物或种子中的合成。
Abbadi等(2004)描述了在转基因亚麻中表达去饱和酶和延长酶的组合的尝试,但是只获得了低水平的EPA的合成。
Abbadi等(2004)表明他们的低水平的EPA的产生也是因为未知的“瓶颈”。
Qi等(2004)在叶中实现了合成,但是没有报道在种子中的结果。这是一个重要的问题,因为LC-PUFA合成的性能在叶和种子之间可以有所不同。具体地,油籽种子在种子中所储存的脂质大多数都是TAG,而叶合成的脂质大多数都是磷脂酰脂。此外,Qi等(2004)只产生了AA和EPA。
因此,需要更多的在重组细胞中产生长链多不饱和脂肪酸(特别是EPA、DPA和DHA)的方法。
发明内容
在第一方面,本发明提供了能合成长链多不饱和脂肪酸(LC-PUFA)的重组细胞,包括一种或多种编码至少两种酶的多核苷酸,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、Δ6延长酶、Δ4去饱和酶、Δ9延长酶、或Δ8去饱和酶,其中所述一种或多种多核苷酸与能指导所述多核苷酸在细胞内表达的一种或多种启动子可操纵地连接,其中所述重组细胞衍生自不能合成所述LC-PUFA的细胞。
在第二个方面,本发明提供了相对于等基因非重组细胞具有增强的合成LC-PUFA的能力的重组细胞,包括一种或多种编码至少两种酶的多核苷酸,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、Δ6延长酶、Δ4去饱和酶、Δ9延长酶、或Δ8去饱和酶,其中所述一种或多种多核苷酸与使得能在所述重组细胞内表达所述多核苷酸的一种或多种启动子可操纵地连接。
在一个实施方式中,至少一种酶是Δ5延长酶。
本发明者首次鉴定出具有比Δ6延长酶活性更高的Δ5延长酶活性的酶。因此,该酶提供了一种在重组细胞中产生DPA的有效方法,因为EPA的Δ5延长要优于SDA的Δ6延长。因此,在一种实施方式中,Δ5延长酶是相对特异的,即Δ5延长酶也具有Δ6延长酶活性,延长酶在从EPA合成DPA中比其在从SDA合成ETA中更为有效。
在另一个实施方式中,Δ5延长酶包括:
i)如SEQ ID NO:2所提供的氨基酸序列;
ii)与SEQ ID NO:2具有至少50%、更优选的至少80%、甚至更优选的至少90%相同性的氨基酸序列;或
iii)i)或ii)的生物学活性片段。
在另一个实施方式中,Δ5延长酶可纯化自藻类。
在另一个实施方式中,其中至少一种酶是Δ9延长酶。
本发明者首次鉴定出具有Δ9延长酶活性和Δ6延长酶活性的酶。当该酶在具有Δ6去饱和酶和Δ8去饱和酶的细胞内表达时,该酶利用两种可行途径从ALA产生ETA,从LA产生DGLA、或两者(见图1),因此增加了ETA和/或DGLA产生的效率。因此,在一个实施方式中,Δ9延长酶也具有Δ6延长酶活性。优选地,Δ9延长酶在从ALA合成ETrA中比其在从SDA合成ETA中更为有效。此外,在另一个实施方式中,在酵母细胞中,Δ9延长酶能将SDA延长为ETA、将GLA延长为DGLA,或两者均可。
在另一个实施方式中,Δ9延长酶包括:
i)如SEQ ID NO:3、SEQ ID NO:85或SEQ ID NO:86所提供的氨基酸序列;
ii)与SEQ ID NO:3、SEQ ID NO:85或SEQ ID NO:86具有至少50%、更优选的至少80%、甚至更优选的至少90%相同性的氨基酸序列;或
iii)i)或ii)的生物学活性片段。
优选地,可以从藻类或真菌中纯化出Δ9延长酶。
本领域公知的是,生物体中的转基因的数目越多,损害生物体的至少一种适应性参数的可能性就越大,所述适应性参数是例如至少一种转基因的表达水平、生长速度、油籽产生、繁殖能力等。因此,需要将重组细胞中的转基因的数目最小化。至今为止,本发明者已经提出了多种在细胞中产生LC-PUFA的策略,这些策略避免了相关途径中的每一步骤都对应于一个基因的需要。
因此,在另一个实施方式中,至少其中一种酶是Δ5/Δ6双功能去饱和酶或Δ5/Δ6双功能延长酶。用淡水鱼种可以天然地产生Δ5/Δ6双功能去饱和酶。
在一个具体实施方式中,Δ5/Δ6双功能去饱和酶包括:
i)如SEQ ID NO:15所提供的氨基酸序列;
ii)与SEQ ID NO:15具有至少50%、更优选的至少80%、甚至更优选的至少90%相同性的氨基酸序列;或
iii)i)或ii)的生物学活性片段。
优选地,用淡水鱼种可以天然地产生Δ5/Δ6双功能去饱和酶。
优选地,Δ5/Δ6双功能延长酶包括:
i)如SEQ ID NO:2或SEQ ID NO:14所提供的氨基酸序列;
ii)与SEQ ID NO:2或SEQ ID NO:14具有至少50%、更优选的至少80%、甚至更优选的至少90%相同性的氨基酸序列;或
iii)i)或ii)的生物学活性片段。
在另一个实施方式中,至少其中一种酶是Δ5去饱和酶。
在进一步的实施方式中,至少其中一种酶是Δ8去饱和酶。
在另一个实施方式中,LC-PUFA是二十二碳六烯酸(DHA)。
优选地,所引入的多核苷酸编码三种或四种酶,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、Δ6延长酶、或Δ4去饱和酶。更优选地,所述酶是如下组合中的任一组合:
i)Δ5/Δ6双功能去饱和酶、Δ5/Δ6双功能延长酶和Δ4去饱和酶;
ii)Δ5/Δ6双功能去饱和酶、Δ5延长酶、Δ6延长酶和Δ4去饱和酶;或
iii)Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、和Δ4去饱和酶。
在另一个实施方式中,LC-PUFA是DHA,以及所引入的多核苷酸编码五种酶,其中酶是如下组合中的任一组合:
i)Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5延长酶和Δ6延长酶;或
ii)Δ4去饱和酶、Δ5去饱和酶、Δ8去饱和酶、Δ5延长酶和Δ9延长酶。
在进一步的实施方式中,细胞是适合于发酵的生物体,酶是至少一种Δ5/Δ6双功能去饱和酶、Δ5延长酶、Δ6延长酶、和Δ4去饱和酶。
在另一个实施方式中,LC-PUFA是二十二碳五烯酸(DPA)。
优选地,所引入的多核苷酸编码两种或三种酶,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、或Δ6延长酶。更优选的,酶是如下组合中的任一组合:
i)Δ5/Δ6双功能去饱和酶和Δ5/Δ6双功能延长酶;
ii)Δ5/Δ6双功能去饱和酶、Δ5延长酶、和Δ6延长酶;或
iii)Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶。
在进一步的实施方式中,LC-PUFA是DPA,以及所引入的多核苷酸编码四种酶,其中酶是下面任一的组合:
i)Δ5去饱和酶、Δ6去饱和酶、Δ5延长酶和Δ6延长酶;或
ii)Δ5去饱和酶、Δ8去饱和酶、Δ5延长酶和Δ9延长酶。
在另一个实施方式中,细胞是适合于发酵的生物体,且所述酶至少是Δ5/Δ6双功能去饱和酶、Δ5延长酶和Δ6延长酶。
在进一步的实施方式中,LC-PUFA是二十碳五烯酸(EPA)。
优选地,所引入的多核苷酸编码Δ5/Δ6双功能去饱和酶和Δ5/Δ6双功延长酶。
在另一个实施方式中,所引入的多核苷酸编码三种酶,其中酶是如下组合中的任一组合:
i)Δ5去饱和酶、Δ6去饱和酶和Δ6延长酶;或
ii)Δ5去饱和酶、Δ8去饱和酶和Δ9延长酶。
至今为止的事实表明在至少一些重组细胞(特别是酵母)中所表达的去饱和酶具有相当低的活性。但是,本发明者已经鉴定出酶活性可能是去饱和酶在LC-PUFA合成中利用脂酰辅酶A作为底物的能力的函数。对此,也已经确定出脊椎动物来源的去饱和酶对于在重组细胞例如植物细胞、种子、或酵母中产生LC-PUFA是特别有用的。因此,在另一个优选的实施方式中,重组细胞包括:
i)至少一种催化细胞内的EPA转化成DPA的Δ5延长酶;或
ii)至少一种能作用于脂酰辅酶A底物的去饱和酶;或
iii)至少一种来自脊椎动物的去饱和酶或其去饱和酶变体;或
iv)i)、ii)或iii)的任一组合。
在一个具体的实施方式中,Δ5延长酶包括:
i)如SEQ ID NO:2提供的氨基酸序列;
ii)与SEQ ID NO:2具有至少50%相同性的氨基酸序列;或
iii)i)或ii)的生物学活性片段。
能作用于脂酰辅酶A底物或来自脊椎动物的去饱和酶可以是Δ5去饱和酶、Δ6去饱和酶或两者。在一个具体实施方式中,去饱和酶包括:
i)如SEQ ID NO:16、SEQ ID NO:21或SEQ ID NO:22提供的氨基酸序列;
ii)与SEQ ID NO:16、SEQ ID NO:21或SEQ ID NO:22具有至少50%相同性的氨基酸序列;或
iii)i)或ii)的生物学活性片段。
优选地,至少一种去饱和酶是由脊椎动物天然产生的。
或者,当细胞是酵母细胞时,LC-PUFA是DHA,且所述酶至少是Δ5/Δ6双功能去饱和酶、Δ5延长酶、Δ6延长酶、和Δ4去饱和酶。
或者,当细胞是酵母细胞时,LC-PUFA是DPA,且所述酶至少是Δ5/Δ6双功能去饱和酶、Δ5延长酶和Δ6延长酶。
尽管细胞可以是任一细胞类型,优选地,所述细胞能从内源性产生的亚油酸(LA)、α亚麻酸(ALA)或两者产生所述的LC-PUFA。更优选地,内源性产生的ALA与LA的比例至少是1∶1或至少是2∶1。
在一个实施方式中,细胞是植物细胞、被子植物的植物细胞、油籽种子植物细胞、或种子中的细胞。优选地,至少一种启动子是种子特异性启动子。
在另一个实施方式中,细胞是单细胞的微生物。优先地,单细胞的微生物适合于发酵。优选地,微生物是酵母。
在进一步的实施方式中,细胞是非人类动物细胞或体外的人体细胞。
在进一步的实施方式中,重组细胞产生了LC-PUFA,其整合于所述细胞的三酰甘油内。更优选地,在所述细胞中所产生的至少50%的LC-PUFA整合于三酰甘油内。
在另一个实施方式中,至少从藻类基因中获得了一种、两种或多种多核苷酸的蛋白编码区。优选地,藻类基因是来自于巴夫藻(Pavlova)属,例如来自Pavlova salina。
在另一个方面,本发明提供了能由脂肪酸例如ALA、LA、GLA、ARA、SDA、ETA、EPA、或它们的任一组合或混和物产生DHA的重组细胞,其中所述重组细胞衍生自不能合成DHA的细胞。
在进一步的方面,本发明提供了能由脂肪酸例如ALA、LA、GLA、ARA、SDA、ETA、EPA、或它们的任一组合或混和物产生DPA的重组细胞,其中所述重组细胞衍生自不能合成DPA的细胞。
仍在进一步的方面,本发明提供了能由脂肪酸例如ALA、LA、GLA、SDA、ETA、EPA、或它们的任一组合或混和物产生EPA的重组细胞,其中所述重组细胞衍生自不能合成EPA的细胞。
在另一个方面,本发明提供了能由ALA产生ETrA和由SDA产生ETA、以及能由脂肪酸例如ALA、LA、GLA、SDA、ETA、或它们的任一组合或混和物产生EPA的重组细胞,其中所述重组细胞衍生自不能合成ETrA、ETA或两者的细胞。
在进一步的方面,本发明提供了能用于发酵过程的生物体的重组细胞,其中所述细胞能由LA、ALA、花生四烯酸(ARA)、二十碳四烯酸(ETA)、或它们的任一组合或混和产生DPA,其中所述重组细胞衍生自不能合成DPA的细胞。
在另一个方面,本发明提供了能由LA、ALA、EPA、或它们的任一组合或混和产生DPA的重组植物细胞,其中植物细胞来自被子植物。
在一个实施方式中,植物细胞还能产生DHA。
仍在另一个方面中,本发明提供了能合成DGLA的重组细胞,包括编码下面的一种或两种多肽的多核苷酸:
a)一种多肽,其是Δ9延长酶,其中Δ9延长酶选自以下一组:
i)包括如SEQ ID NO:3、SEQ ID NO:85或SEQ ID NO:86提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:3、SEQ ID NO:85或SEQ ID NO:86具有至少40%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,和/或
b)一种多肽,其是Δ8去饱和酶,其中Δ8去饱和酶选自以下一组:
i)包括如SEQ ID NO:1提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:1具有至少40%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多核苷酸与一种或多种能指导所述多核苷酸在细胞表达的启动子可操纵地连接,且其中所述重组细胞衍生自不能合成DGLA的细胞。
在一个实施方式中,细胞能将DGLA转化成ARA。
在另一个实施方式中,细胞还包括编码Δ5去饱和酶的多核苷酸,其中编码Δ5去饱和酶的多核苷酸与一种或多种能指导所述多核苷酸在细胞内表达的启动子可操纵地连接,且其中细胞能产生ARA。
在具体的实施方式中,细胞缺乏ω3去饱和酶活性,并且不能产生ALA。这些细胞可以是天然存在的,或者通过用本领域公知的技术降低细胞的ω3去饱和酶活性可以产生这些细胞。
优选地,细胞是植物细胞或者是适合于发酵的生物体的细胞。
在进一步的实施方式中,本发明的重组细胞具有实施将EPA转化成DHA的“Sprecher”途径所需的酶。这些酶可能是细胞天然具有的或者重组产生的。这些酶至少包括一种Δ7延长酶、Δ6去饱和酶和将二十四碳六烯酸过氧化物酶体β氧化产生DHA所需的酶。
本发明者已经鉴定出一组新的去饱和酶和延长酶。因此,本发明的进一步的方面涉及这些酶以及它们的同源物/变体/衍生物。
多肽可以是融合蛋白,其还包括至少一种其他的多肽序列。
所述的至少一种其他的多肽可以是增强本发明多肽的稳定性的多肽,或者是有助于纯化融合蛋白的多肽。
也提供了分离的多核苷酸,其编码本发明的多肽。
在进一步的方面,本发明提供了包括或编码本发明的多核苷酸的载体。优选地,多核苷酸与种子特异性启动子可操纵地连接。
在另一个方面,本发明提供了包括本发明的分离的多核苷酸的重组细胞。
在进一步的方面,本发明提供了产生能合成一种或多种LC-PUFA的细胞的方法,所述方法包括将一种或多种编码至少两种酶的多核苷酸引入到细胞内,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、Δ6延长酶、Δ4去饱和酶、Δ9延长酶、或Δ8去饱和酶,其中所述一种或多种多核苷酸与能指导所述多核苷酸在细胞内表达的启动子可操纵地连接。
在另一个方面,本发明提供了产生具有增强的合成一种或多种LC-PUFA的能力的重组细胞,方法包括将一种或多种编码至少两种酶的多核苷酸引入到第一细胞,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、Δ6延长酶、Δ4去饱和酶、Δ9延长酶、或Δ8去饱和酶,其中所述一种或多种多核苷酸与一种或多种能指导所述多核苷酸在重组细胞内表达的启动子可操纵地连接,且其中所述重组细胞相对于所述的第一细胞具有增强的合成所述一种或多种LC-PUFA的能力。
自然要明白,与本发明的重组细胞有关的在此所述的每个实施方式都功能等同地应用于产生所述细胞的方法。
在进一步的方面,本发明提供了本发明的方法所产生的细胞。
在另一个方面,本发明提供了包括本发明的至少一种重组细胞的转基因植物。
优选地,植物是被子植物。更优选地,植物是油籽植物。
在进一步的实施方式中,转基因植物或其包括转基因种子的部分不包括编码酶的转基因,所述酶优先地将ω6 LC-PUFA转化成ω-3LC-PUFA。
在仍进一步的实施方式中,转基因植物或其包括转基因种子的部分包括编码Δ8去饱和酶和/或Δ9延长酶的转基因。
在进一步的方面,本发明提供了产生油籽的方法,所述方法包括:
i)在合适的条件下生长本发明的转基因的油籽植物,和
ii)收集植物的种子。
在进一步的方面,本发明提供了本发明的转基因植物的一部分,其中相对于等基因的非转化的植物的对应部分,所述部分在其脂肪酸中包含水平升高的LC-PUFA。
优选地,所述植物部分选自但不限于由种子、叶、茎、花、花粉、根或专门的储藏器官(例如块茎)构成的组。
先前还没有显示出可以在植物种子中产生LC-PUFA,这些LC-PUFA也不能被整合于植物油例如三酰甘油内。
因此,在另一个方面,本发明提供了包括LC-PUFA的转基因种子。
优选地,LC-PUFA选自:
i)EPA,
ii)DPA,
iii)DHA,
iv)EPA和DPA,和
v)EPA、DHA和DPA。
更优选地,LC-PUFA选自:
i)DPA,
ii)DHA,或
iii)DHA和DPA。
甚至更优选地,LC-PUFA是EPA、DHA、和DPA。
优选地,种子源自产LA和/或ALA的等基因非转基因种子。更优选地,等基因非转基因种子的脂肪酸包括比LA更高浓度的ALA。甚至更优选地,等基因非转基因种子的脂肪酸包括至少约13%ALA或至少约27%ALA或至少约50%ALA。
优选地,种子油中的总脂肪酸包括至少9%的C20脂肪酸。
优选地,种子源自油籽植物。更优选地,油籽植物是油籽油菜(Brassicanapus)、玉米(Zea mays)、向日葵(Helianthus annuus)、大豆(Glycine max)、高梁(Sorghum bicolor)、亚麻(Linum usitatissimum)、蔗糖(Saccharumofficinarum)、甜菜(Beta vulgaris)、棉花(Gossypium hirsutum)、花生(Arachishypogaea)、罂粟(Papaver somniferum)、芥菜(Sinapis alba)、蓖麻(Ricinuscommunis)、芝麻(Sesamum indicum)或红花(Carthamus tinctorius)。
优选的是种子具有与等基因非转基因种子基本相同的发芽率。
更优选的是种子的发芽时机与等基因非转基因种子的发芽时机基本相同。
优选地,至少25%、或至少50%、或至少75%的LC-PUFA构成了种子中的三酰甘油的部分。
出乎意料的是,本发明者已经发现利用本发明的方法所产的转基因种子具有与等基因非转基因种子基本相同的ALA和LA水平。因此,优选的是,转基因种子具有与等基因非转基因种子基本相同的ALA和LA水平。此外,出乎意料地发现,利用本发明的方法所产的转基因种子降低了单不饱和脂肪酸的水平。因此,在更优选的实施方式中,转基因种子比等基因非转基因种子具有降低了水平的单不饱和脂肪酸。
在另一个方面,本发明提供了生产本发明的转基因种子的方法,所述方法包括:
i)将一种或多种编码至少两种酶的多核苷酸引入到种子的祖细胞中,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、Δ6延长酶、Δ4去饱和酶、Δ9延长酶、或Δ8去饱和酶,其中所述一种或多种多核苷酸与一种或多种能指导所述多核苷酸在细胞内表达的启动子可操纵地连接,据此产生重组的祖细胞;
ii)培养所述的重组祖细胞,以便产生包括所述转基因种子的植物;和
iii)从所产植物中收集种子。
在仍进一步的方面,本发明提供了生产转基因种子的方法,其包括培养产本发明的转基因种子的转基因植物,并从植物中采收所述的转基因种子。
在进一步的方面,本发明提供了本发明的转基因植物、或本发明的植物部分、或本发明的种子的提取物,其中相对于等基因非转化植物的相应提取物,所述提取物在其脂肪酸中包含水平升高的LC-PUFA。
优选地,提取物是基本上纯化的油,其包括至少50%三酰甘油。
在进一步的方面,本发明提供了非人类的转基因动物,其包括至少一种本发明的重组细胞。
也提供了产生LC-PUFA的方法,所述方法包括在合适的条件下培养本发明的重组细胞。
在一个实施方式中,细胞是适合于发酵的生物体的细胞,且所述方法还包括将细胞暴露于至少一种LC-PUFA前体。
优选地,LC-PUFA前体是至少一种亚油酸或α-亚麻酸。在一个具体的实施方式中,用植物油提供LC-PUFA前体。
在另一个实施方式中,细胞是藻类细胞,以及方法还包括在合适的条件下生长藻类细胞,以便产生所述的LC-PUFA。
在进一步的不服那,本发明提供了生产一种或多种LC-PUFA的方法,所述方法包括在合适的条件下培养本发明的转基因植物。
在另一个方面,本发明提供了生产包括至少一种LC-PUFA的油的方法,其包括获得本发明的转基因植物、或本发明的植物部分、或本发明的种子,以及从所述植物、植物部分或种子中提取出油。
优选地,通过压榨所述种子从种子中提取出所述的油。
在另一个方面,本发明提供了由EPA产生DPA的方法,所述方法包括在合适的条件下将EPA暴露于本发明的多肽和脂肪酸前体。
在一个实施方式中,可以在细胞内实现方法,其利用聚酮化合物样系统生产EPA。
在仍另一个方面,本发明提供了发酵过程,其包括步骤:
i)提供含有液体组合物的容器,所述液体组合物包括本发明的细胞以及发酵和脂肪酸生物合成所需的组分;和
ii)提供有助于所述容器中所含的液体组合物的发酵的条件。
优选地,发酵和脂肪酸生物合成所需的组分是LA。
优选地,细胞是酵母细胞。
在另一个方面,本发明提供了包括本发明的细胞、或其提取物或其包括LC-PUFA的部分、以及合适载体的组合物。
在另一个方面,本发明提供了包括本发明的转基因植物、或本发明的植物部分、或本发明的种子、或其提取物或其包括LC-PUFA的部分、以及合适载体的组合物。
在仍另一个方面,本发明提供了包括本发明的细胞、本发明的植物、本发明的植物部分、本发明的种子、本发明的提取物、本发明的方法的产物、或本发明的发酵过程的产物、或本发明的组合物的饲料。
优选地,饲料至少包括DPA,其中用细胞内的重组酶进行至少一个DPA生产中的酶反应。
此外,优选的是饲料至少包括DHA,其中用细胞内的重组酶进行至少一个DPA生产中的酶反应。
在进一步的方面,本发明提供了制备饲料的方法,所述方法包括混和本发明的细胞、本发明的植物、本发明的植物部分、本发明的种子、本发明的提取物、本发明的方法的产物、本发明的发酵过程的产物、或本发明的组合物和合适的载体。
优选地,饲料是给哺乳动物或鱼食用的饲料。
在进一步的方面,本发明提供了增加生物体中的LC-PUFA水平的方法,所述方法包括给生物体施用本发明的细胞、本发明的植物、本发明的植物部分、本发明的种子、本发明的提取物、本发明的方法的产物、本发明的发酵过程的产物、或本发明的组合物、或本发明的饲料。
优选地,施用途径是口服。
优选地,生物体是脊椎动物。更优选地,脊椎动物是人、鱼、宠物或家畜动物。
在进一步的方面,本发明提供了治疗或预防可从LC-PUFA中获益的疾病的方法,所述方法包括给对象施用本发明的细胞、本发明的植物、本发明的植物部分、本发明的种子、本发明的提取物、本发明的方法的产物、本发明的发酵过程的产物、或本发明的组合物、或本发明的饲料。
优选地,疾病是心律不齐、血管成形术、炎症、哮喘、牛皮癣、骨质疏松症、肾结石、AIDS、多发性硬化、类风湿关节炎、Crohn病、精神分裂症、癌症、胎儿乙醇综合征、注意缺陷多动症、囊性纤维化、苯丙酮尿症、单相抑郁症、进攻性敌意(aggressive hostility)、脑白质肾上腺萎缩症、冠状动脉疾病、高血压、糖尿病、肥胖症、Alzheimer病、慢性阻塞性肺病、溃疡性结肠炎、血管成形术后再狭窄、湿疹、高血压、血细胞聚集、胃肠道出血、子宫内膜异位症、经前综合征、肌痛性脑脊髓炎、病毒感染后慢性疲劳或眼部疾病。
虽然给对象提供任一量的LC-PUFA都将有益于对象,但是优选地施用治疗疾病的有效量。
在另一个方面,本发明提供了本发明的细胞、本发明的植物、本发明的植物部分、本发明的种子、本发明的提取物、本发明的方法的产物、本发明的发酵过程的产物、或本发明的组合物、或本发明的饲料在制备用于治疗或预防可从LC-PUFA中获益的疾病的药物中的用途。
先前已经在酵母中表达秀丽隐杆线虫Δ6延长酶,其已经显示出能将十八碳四烯酸转化成二十碳四烯酸。但是,本发明者已经出乎意料地发现该酶也具有Δ5延长酶活性,能将二十碳五烯酸转化成二十二碳五烯酸。
在进一步的实施方式中,本发明提供了生产包括22个碳原子的不分支的LC-PUFA的方法,所述方法包括将不分支的20个碳原子的LC-PUFA与多肽一起温育,所述多肽选自以下一组:
i)包括如SEQ ID NO:2或SEQ ID NO:14提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:2或SEQ ID NO:14具有至少50%相同性的氨基酸序列的多肽,和
iii)i)或ii)的生物学活性片段,
其中多肽也具有Δ6延长酶活性。
优选地,包括22个碳原子的不分支的LC-PUFA是DPA,以及不分支的20个碳原子的LC-PUFA是EPA。
优选地,在重组细胞内实施生产多肽和EPA的方法。
在仍进一步的方面,本发明提供了基本上纯化的抗体、或其片段,所述抗体或其片段与本发明的多肽特异性结合。
在另一个方面,本发明提供了鉴定出能合成一种或多种LC-PUFA的重组细胞、组织或生物体的方法,所述方法包括检测在所述细胞、组织或生物体中是否存在一种或多种多核苷酸,所述多核苷酸编码至少两种酶,所述酶是Δ5/Δ6双功能去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ5/Δ6双功能延长酶、Δ5延长酶、Δ6延长酶、Δ4去饱和酶、Δ9延长酶、或Δ8去饱和酶,其中所述一种或多种多核苷酸与一种或多种能指导所述多核苷酸在细胞、组织或生物体内表达的启动子可操纵地连接。
优选地,方法包括核酸扩增步骤、核酸杂交步骤、检测细胞、组织或生物体内是否存在转基因的步骤、或确定出细胞、组织或生物体内的脂肪酸含量或组成的步骤。
优选地,生物体是动物、植物、被子植物或微生物。
在另一个方面,本发明提供了由EPA产生DPA的方法,所述方法包括在合适的条件下将EPA暴露于本发明的Δ5延长酶和脂肪酸前体。
优选地,在细胞内实现利用聚酮化合物样系统产生EPA的方法。
包括在此所提供的新的多核苷酸的重组(转基因)细胞、植物、非人类动物也可以天然地产生其他的延长酶和/或去饱和酶,例如在此所定义的延长酶和/或去饱和酶。
显而易见的是,本发明的一个方面的优选的特点和特征都可应用于本发明的许多其他的部分。
在本说明书全文中,词语“包括”或“包含”都被理解为包含给定的元件、整体或步骤、或元件、整体或步骤的组,但不排除任何其他的元件、整体或步骤、或元件、整体或步骤的组。
此后通过下面的非限制性实施例并参照附图描述本发明。
附图说明
图1:ω3和ω 6LC-PUFA合成的可能途径。标记为I、II、III和IV的部分分别对应于ω6(Δ6)、ω3(Δ6)、ω6(Δ8)、和ω3(Δ)途径。I和II部分中的化合物是ω6化合物,而II和IV部分中的那些化合物是ω3化合物。“Des”表示途径中的经所示的去饱和酶催化的去饱和酶步骤,而“Elo”表示经所示的延长酶催化的延长酶步骤。虚线箭头代表在哺乳动物细胞内进行的用于由DPA产生DHA的“Sprecher”途径中的步骤。
图2:LC-PUFA在微藻类纲中的分布。绿藻纲和Prasinophyceae被描述为“绿藻”;Eustigmatophyceae为“黄绿藻”;红藻纲为“红藻”、以及Bacillariophyceae和Prymnesiophyceae为硅藻和金褐藻。
图3:用于在细胞内表达LC-PUFA生物合成途径的遗传构建体。
图4:去饱和酶的PILEUP。d8-atg-Pavlova salina Δ8去饱和酶、眼虫属(euglena)-AAD45877(Δ8去饱和酶,纤细眼虫)、根霉属(rhizopus)-AAP83964(Δ6去饱和酶、根霉属NK030037)、毛霉菌属(mucor)-BAB69055(Δ6去饱和酶,Mucor circinelloides)、mortierella-AAL73948(Δ6去饱和酶,Mortierella isabellina)、malpina-BAA85588(Δ6去饱和酶,高山被孢霉)、physcomitrella-CAA11032(Δ6酰基脂去饱和酶,小立碗藓)、ceratadon-CAB94992(Δ6脂肪乙炔酶,角齿藓(Ceratodon purpureus))。
图5:PCR产物与Elo1或Elo2探针杂交的Southern印迹。
图6:延长酶的PILEUP。
图7:用于在拟南芥属中表达编码LC-PUFA生物合成酶的基因的转基因构建体。“EPA构建体”pSSP-5/6D.6E(在实施例5中也称作pZebdesatCeloPWvec8)(图7A)含有斑马鱼的双功能的Δ5/Δ6去饱和酶(D5/D6Des)和线虫的Δ6延长酶(D6Elo),两者都受截断的napin启动子(Fp1)驱动,以及受CaMV-35S(35SP)启动子驱动的潮霉素耐药性选择标记物基因(hph)。“DHA构建体”pXZP355(图7B)包括都受截断的napin启动子(Fp11)驱动的Pavlova salina的Δ4去饱和酶(D4Des)和Δ5延长酶(D5Elo)基因、以及受胭脂氨酸(nopaline)合酶启动子(NosP)驱动的卡那霉素耐药性选择标记物基因(nptII)。所有基因的3’端侧翼都是胭脂氨酸合酶终止子(NosT)。
图8:A:显示携带EPA和DHA基因构建体的拟南芥(Arabidopsisthaliana)株DO11的脂肪酸谱的气相色谱(GLC)。B:从拟南芥株DO11中获得的EPA和DHA的质谱。
图9:如实施例12所示的,在低严格性或高严格性的条件下,用由如右侧所示的P.salina基因编码区构成的放射性标记探针与上方所示的各种微藻类物种的DNA所进行的点印迹杂交的放射自显像图。
图10:高等植物的Δ6和Δ8去饱和酶的氨基酸序列排列。用PILEUP(GCG,Wisconsin,USA)排列来自E.plantagineum(EplD6Des)(SEQ IDNO:64)、E.gentianoides(EgeD6Des,登录号AY055117)(SEQ ID NO:65)、E.pitardii(EpiD6Des,AY055118)(SEQ ID NO:66)、琉璃苣(BofD6Des,U79010)(SEQ ID NO:67)Δ6去饱和酶以及来自琉璃苣(BofD8Des,AF133728)(SEQ ID NO:68)、向日葵(Helianthus annus)(HanD8Des,S68358)(SEQ ID NO:69)、和拟南芥(AtD8DesA、AAC62885.1;和AtD8DesB、CAB71088.1)(分别是SEQ ID NO:70和SEQ ID NO:71)的Δ8去饱和酶的氨基酸序列。HBI、HBII、HBIII是三个保守的组氨酸框。F1和R1是用于扩增cDNA的简并引物EpD6Des-F1和EpD6Des-R1的对应区域。也显示了具有保守的HPGG基序的N末端的细胞色素b5结构域。
图11:所分离到的变体EplD6Des酶以及代表性的酶活性。具有细胞色素b5、组氨酸框I、II和III的EplD6Des分别被显示为b5、HBI、HBII、和HBIII。在A组中以下面的格式显示了所分离到的变体:野生型氨基酸-位点编号-变体氨基酸。空心菱形表示显著降低酶活性的突变,而实心菱形表示对酶活性没有显著影响的变体。B组显示了两种变体的转基因烟草叶子中的GLA及SDA产量与野生型酶的比较。
图12:由ALA(18:3)合成ω3 LC-PUFA SDA(18:4)、EPA(20:5)和DHA(22:6)的其他途径。分别用实心箭头、空心箭头和虚线显示出了去饱和酶、延长酶和酰基转移酶。仅仅在脂酰辅酶A底物上出现链的延长,而去饱和作用可以出现于酰基PC(A&B)或脂酰辅酶A底物。还没有确定出最终的Δ4去饱和酶步骤在酰基PC或脂酰辅酶A之间的底物偏向性。涉及酰基PC去饱和酶的途径需要酰基转移酶介导的PC和辅酶A底物之间的酰基的穿梭变位。组A和B分别显示了酰基PC去饱和酶途径的“Δ6途径”以及“Δ8途径”。组C显示了在本研究中所表达的途径,其中斑马鱼Δ6/Δ5双功能去饱和酶编码脂酰辅酶AΔ6和Δ5去饱和酶活性。通过相同组的反应可以合成ω6 LC-PUFA例如ARA(20:4),只是开始时用LA(18:2)作为初始底物。
图13:Synechococcus 7002在22℃、25℃、30℃的生长率。
图14:不同生长温度下的Synechococcus 7002的亚油酸和亚麻酸水平。
序列列表
SEQ ID NO:1-Pavlova salina的Δ8去饱和酶;
SEQ ID NO:2-Pavlova salina的Δ5延长酶;
SEQ ID NO:3-Pavlova salina的Δ9延长酶;
SEQ ID NO:4-Pavlova salina的Δ4去饱和酶;
SEQ ID NO:5-编码Pavlova salina的Δ8去饱和酶的开放读框的cDNA;
SEQ ID NO:6-编码Pavlova salina的Δ8去饱和酶的全长cDNA;
SEQ ID NO:7-编码Pavlova salina的Δ5延长酶的开放读框的cDNA;
SEQ ID NO:8-编码Pavlova salina的Δ5延长酶的全长cDNA;
SEQ ID NO:9-编码Pavlova salina的Δ9延长酶的开放读框的cDNA;
SEQ ID NO:10-编码Pavlova salina的Δ9延长酶的全长cDNA;
SEQ ID NO:11-编码Pavlova salina的Δ4去饱和酶的N末端部分的部分cDNA;
SEQ ID NO:12-编码Pavlova salina的Δ4去饱和酶的开放读框的cDNA;
SEQ ID NO:13-编码Pavlova salina的Δ4去饱和酶的全长cDNA;
SEQ ID NO:14-秀丽隐杆线虫的Δ5/Δ6双功能延长酶;
SEQ ID NO:15-斑马鱼(Danio rerio)的Δ5/Δ6双功能去饱和酶;
SEQ ID NO:16-人类的Δ5去饱和酶(Genbank登录号No:AAF29378);
SEQ ID NO:17-畸雌腐霉的Δ5去饱和酶(Genbank登录号No:AAL13311);
SEQ ID NO:18-破囊壶菌的Δ5去饱和酶(Genbank登录号No:AAM09687);
SEQ ID NO:19-高山被孢霉的Δ5去饱和酶(Genbank登录号No:O74212);
SEQ ID NO:20-秀丽隐杆线虫的Δ5去饱和酶(Genbank登录号No:T43319);
SEQ ID NO:21-人类的Δ6去饱和酶(Genbank登录号No:AAD20018);
SEQ ID NO:22-小鼠的Δ6去饱和酶(Genbank登录号No:NP_062673);
SEQ ID NO:23-畸雌腐霉的Δ6去饱和酶(Genbank登录号No:AAL13310);
SEQ ID NO:24-琉璃苣的Δ6去饱和酶(Genbank登录号No:AAD01410);
SEQ ID NO:25-Anemone leveillei的Δ6去饱和酶(Genbank登录号No:AAQ10731);
SEQ ID NO:26-角齿藓的Δ6去饱和酶(Genbank登录号No:CAB94993);
SEQ ID NO:27-小立碗藓的Δ6去饱和酶(Genbank登录号No:CAA11033);
SEQ ID NO:28-高山被孢霉的Δ6去饱和酶(Genbank登录号No:BAC82361);
SEQ ID NO:29-秀丽隐杆线虫的Δ6去饱和酶(Genbank登录号No:AAC15586);
SEQ ID NO:30-人类的Δ5延长酶(Genbank登录号No:NP_068586);
SEQ ID NO:31-小立碗藓的Δ6延长酶(Genbank登录号No:AAL84174);
SEQ ID NO:32-高山被孢霉的Δ6延长酶(Genbank登录号No:AAF70417);
SEQ ID NO:33-破囊壶菌的Δ4去饱和酶(Genbank登录号No:AAM09688);
SEQ ID NO:34-纤细眼虫的Δ4去饱和酶(Genbank登录号No:AAQ19605);
SEQ ID NO:35-球等鞭金藻的Δ9延长酶(Genbank登录号No:AAL37626);
SEQ ID NO:36-纤细眼虫的Δ8去饱和酶(Genbank登录号No:AAD45877);
SEQ ID NO:37-编码秀丽隐杆线虫的Δ5/Δ6双功能延长酶的cDNA;
SEQ ID NO:38-编码斑马鱼(Danio rerio)的Δ5/Δ6双功能去饱和酶的cDNA;
SEQ ID NO:39至42、46、47、50、51、53、54、56、57、81、82、83、84和87-寡核苷酸引物;
SEQ ID NO:43至45、48、49和52-各种去饱和酶/延长酶的保守基序;
SEQ ID NO:55-编码Pavlova salina FAE样延长酶的部分cDNA;
SEQ ID NO:58-编码Pavlova salina的Δ5去饱和酶的全长cDNA;
SEQ ID NO:59-编码Pavlova salina的Δ5去饱和酶的开放读框的cDNA;
SEQ ID NO:60-Pavlova salina的Δ5去饱和酶;
SEQ ID NO:61和62-Echium pitardii的Δ6去饱和酶的片段;
SEQ ID NO:63-编码Echium plantagineum的Δ6去饱和酶的开放读框的cDNA;
SEQ ID NO:64-Echium plantagineum的Δ6去饱和酶;
SEQ ID NO:65-Echium gentianoides的Δ6去饱和酶(Genbank登录号No:AY055117);
SEQ ID NO:66-Echium pitardii的Δ6去饱和酶(Genbank登录号No:AY055118);
SEQ ID NO:67-琉璃苣的Δ6去饱和酶(Genbank登录号No:U79010);
SEQ ID NO:68-琉璃苣的Δ8去饱和酶(Genbank登录号No:AF133728);
SEQ ID NO:69-向日葵的Δ8去饱和酶(Genbank登录号No:S68358);
SEQ ID NO:70-拟南芥的Δ8去饱和酶A(Genbank登录号No:AAC62885.1);
SEQ ID NO:71-拟南芥的Δ8去饱和酶B(Genbank登录号No:CAB71088.1);
SEQ ID NO:72和73-Δ6-和Δ8-去饱和酶的保守基序;
SEQ ID NO:74-破囊壶菌的Δ6延长酶(Genbank登录号No:AX951565);
SEQ ID NO:75-斑马鱼的Δ9延长酶(Genbank登录号No:NM~199532);
SEQ ID NO:76-Pavlova lutheri的Δ9延长酶;
SEQ ID NO:77-斑马鱼的Δ5延长酶(Genbank登录号No:AF532782);
SEQ ID NO:78-Pavlova lutheri的Δ5延长酶;
SEQ ID NO:79-编码延长酶的Heterocapsa niei的部分基因序列;
SEQ ID NO:80-由SEQ ID NO:79编码的蛋白,终止密码子的存在说明
SEQ IDNO:79内存在一个内含子;
SEQ ID NO:85-Pavlova salina的Δ9延长酶,由SEQ ID NO:9的位点31上的替代起始密码子编码;
SEQ ID NO:86-Pavlova salina的Δ9延长酶,由SEQ ID NO:9的位点85上的替代起始密码子编码;
SEQ ID NO:88-直链藻属(Melosira sp.)的部分延长酶氨基酸序列;
SEQ ID NO:89-编码直链藻属的部分延长酶的cDNA序列。
发明详述
一般技术和定义
除非有特殊的不同定义,在此所用的所有技术和科学术语都应当具有如本领域(例如细胞培养、植物生物学、分子遗传学、免疫学、免疫组织化学、蛋白化学、脂肪酸合成、和生物化学)的一般人员通常所理解的相同的含义。
除非另有说明,本发明所用的重组核酸、重组蛋白、细胞培养和免疫学技术都是本领域技术人员公知的标准方法。在文献中已经充分地描述和解释了这些技术,例如J.Perbal,A Practical Guide to MolecularCloning,John Wiley and Sons(1984);J.Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbour Laboratory Press(1989);T.A.Brown(editor),Essential Molecular Biology:A Practical Approach,Volumes1 and 2,IRL Press(1991);D.M.Glover and B.D.Hames(editors),DNACloning:A Practical Approach,Volumes 1-4,IRL Press(1995 and 1996);和F.M.Ausubel et al.(editors),Current Protocols in Molecular Biology,GreenePub.Associates and Wiley-Interscience(1988,包括最近的所有更新);EdHarlow and David Lane(editors)Antibodies:A Laboratory Manual,ColdSpring Harbour Laboratory,(1988);和J.E.Coligan etal.(editors)CurrentProtocols in Immunology,John Wiley & Sons(包括最近的所有更新),并通过引用将其并入本申请。
术语“长链多不饱和脂肪酸”、“LC-PUFA”或“C20+多不饱和脂肪酸”指的是其碳链上包括至少20个碳原子以及至少三个碳-碳双键的脂肪酸。术语“超长链多不饱和脂肪酸”、“VLC-PUFA”或“C22+多不饱和脂肪酸”在此指的是其碳链上包括至少22个碳原子以及至少三个碳-碳双键的脂肪酸。脂肪酸碳链上的碳原子的数目一般指的都是非分支的碳链。如果碳链有分支,那么碳原子的数目要除外侧向基团上的那些碳原子数目。在一个实施方式中,长链多不饱和脂肪酸是ω3脂肪酸,即在脂肪酸的甲基末端起的第三个碳-碳键中具有不饱和性(碳-碳双键)的脂肪酸。在另一个实施方式中,长链多不饱和脂肪酸是ω6脂肪酸,即在脂肪酸的甲基末端起的第6个碳-碳键中具有不饱和性(碳-碳双键)的脂肪酸。在进一步的实施方式中,长链多不饱和脂肪酸选自由花生四烯酸(ARA,20:4Δ5,8,11,14;ω6)、二十碳四烯酸(ETA,20:4Δ8,11,14,17;ω3)、二十碳五烯酸(EPA,20:5Δ5,8,11,14,17;ω3)、二十二碳五烯酸(DPA,22:5Δ7,10,13,16,19;ω3)、或二十二碳六烯酸(DHA,22:6Δ4,7,10,13,16,19;ω3)构成的组。LC-PUFA也可以是dihomo-γ-亚油酸(DGLA)或二十碳三烯酸(ETrA,20:3Δ11,14,17;ω3)。显而易见的是,本发明所生产的LC-PUFA可以是上面的任一或所有脂肪酸的混和物,或者可以包括其他的LC-PUFA或任一这些LC-PUFA的衍生物。在优选的实施方式中,ω3脂肪酸是EPA、DPA或DHA,甚至更优选地是DPA或DHA。
此外,术语“长链多不饱和脂肪酸”或“超长链多不饱和脂肪酸”在此指的是游离状态的脂肪酸或者是酯化形式的脂肪酸,例如作为甘油三酯、甘油双酯、甘油单酯、结合脂酰辅酶A的形式或其他的结合形式。脂肪酸可以被酯化成磷脂,例如磷酸卵磷脂、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰甘油、磷脂酰肌醇、或双磷脂酰甘油形式。因此,LC-PUFA可以表现为细胞内脂质形式的混和物或纯化的油或从细胞、组织或生物体中提取到的脂质。在优选的实施方式中,本发明提供了包括至少75%或85%甘油三酯的油,剩余的部分表现为其他形式的脂质,例如那些上面所提及的脂质,以及至少所述的甘油三酯包括LC-PUFA。可以进一步地纯化或处理油,例如用强碱水解,以便释放出游离的脂肪酸,或通过分镏、蒸镏等。
缩写“LC-PUFA”和“VLC-PUFA”在此可以表示单一类型的脂肪酸或者多种类型的脂肪酸。例如,产生LC-PUFA的本发明的转基因植物可以产生EPA、DPA和DHA。
可以用于本发明的去饱和酶和延长酶蛋白以及编码所述蛋白的基因是本领域已知的任一蛋白和基因或者它们的同源物或衍生物。在表1中罗列了这些基因以及所编码的蛋白的实例。已经显示出参与LC-PUFA生物合成的去饱和酶都属于所谓的“前端”去饱和酶组,其特点是在每个蛋白的N末端都具有细胞色素b5样结构域。细胞色素b5样结构域可能作为去饱和作用所需的电子的受体(Napier et al.,1999;Sperling and Heinz,2001)。
表1:所克隆的参与LC-PUFA生物合成的基因。
酶 | 生物体类型 | 物种 | 登录号 | 蛋白质大小(aa’s) | 参考文献 |
Δ4-去饱和酶 | 藻类 | Euglena gracilis | AY278558 | 541 | Meyer et al.,2003 |
Pavlova lutherii | AY332747 | 445 | Tonon et al.,2003 | ||
Thraustochytriumsp. | AF489589 | 519 | Qiu et al.,2001 | ||
Thraustochytriumaureum | AF391543-5 | 515 | (NCBI) | ||
Δ5-去饱和酶 | 哺乳动物 | Homo sapiens | AF199596 | 444 | Cho et al.,1999bLeonard et al.,2000b |
线虫 | Caenorhabditiselegans | AF11440,NM_069350 | 447 | Michaelson etal.,1998b;Wattsand Browse,1999b | |
真菌 | Mortierellaalpina | AF067654 | 446 | Michaelson etal.,1998a;Knutzon et al.,1998 | |
Pythiumirregulare | AF419297 | 456 | Hong et al.,2002a | ||
Dictyosteliumdiscoideum | AB022097 | 467 | Saito et al.,2000 | ||
Saprolegniadiclina | 470 | WO02081668 | |||
硅藻 | Phaeodactylumtricornutum | AY082392 | 469 | Domergue et al.,2002 | |
藻类 | Thraustochytriumsp | AF489588 | 439 | Qiu et al.,2001 | |
Thraustochytriumaureum | 439 | WO02081668 | |||
Isochrysisgalbana | 442 | WO02081668 | |||
苔藓 | Marchantiapolymorpha | AY583465 | 484 | Kajikawa et al.,2004 |
酶 | 生物体类型 | 物种 | 登录号 | 蛋白质大小(aa’s) | 参考文献 |
Δ6-延长酶 | 线虫 | Caenorhabditiselegans | NM_069288 | 288 | Beaudoin et al.,2000 |
苔藓 | Physcomitrellapatens | AF428243 | 290 | Zank et al.,2002 | |
Marchantiapolymorpha | AY583464 | 290 | Kajikawa et al.,2004 | ||
真菌 | Mortierellaalpina | AF206662 | 318 | Parker-Barnes etal.,2000 | |
藻类 | Pavlova lutheri** | 501 | WO 03078639 | ||
Thraustochytrium | AX951565 | 271 | WO 03093482 | ||
Thraustochytriumsp** | AX214454 | 271 | WO 0159128 | ||
PUFA-延长酶 | 哺乳动物 | Homo sapiens | AF231981 | 299 | Leonard et al.,2000b;Leonard et al.,2002 |
Rattus norvegicus | AB071985 | 299 | Inagaki et al.,2002 | ||
Rattusnorvegicus** | AB071986 | 267 | Inagaki et al.,2002 | ||
Mus musculus | AF170907 | 279 | Tvrdik et al.,2000 | ||
Mus musculus | AF170908 | 292 | Tvrdik et al.,2000 | ||
鱼 | Danio rerio | AF532782 | 291(282) | Agaba et al.,2004 | |
Danio rerio** | NM_199532 | 266 | Lo et al.,2003 | ||
蠕虫 | Caenorhabditiselegans | Z68749 | 309 | Abbott et al 1998Beaudoin et al2000 | |
藻类 | Thraustochytriumaureum** | AX464802 | 272 | WO 0208401-A2 | |
Pavlova lutheri** | ? | WO 03078639 | |||
Δ9-延长酶 | 藻类 | Isochrysisgalbana | AF390174 | 263 | Qi et al.,2002 |
*
http://www.ncbi.nlm.nih.gov/
**功能未证实/未探明
通过在细胞例如酵母细胞或植物细胞内表达编码酶的基因,以及确定出细胞是否比未表达酶的对照细胞具有了增强的产生LC-PUFA的能力,可以测试本发明所用的任一延长酶或去饱和酶的活性。
除非有不同的说明,本发明的涉及细胞、植物、种子等以及生产所述细胞、植物、种子等的方法、并提到在此所提供的列表中的“两种酶”(或至少“三种酶”等)的那些实施方式,表示其中所述多核苷酸编码至少两种列表中所提供的“不同的”酶,而不是基本上编码同一种酶的两个相同的(或者非常相似的,只有很小的差异,以致基本上不会改变所编码的酶的活性)开放读框。
除非有不同的说明,术语“基本上相同”或其变异在此表示所分析的两个来自不同来源的样品例如两种种子是基本上相同的,只要它们在所研究的性状上只有约+/-10%的差异。
术语“优先地将ω6 LC-PUFA转化成ω3 LC-PUFA的酶”在此表示酶能比其在图1的途径II或III中所列出的去饱和反应中所实施的效率更高的效率实施所述转化。
虽然某些酶在此被特异地描述为“双功能的”,但是缺少该术语的缺乏并非一定表示特殊的酶不具有所特异定义的活性以外的其他活性。
去饱和酶
“Δ5/Δ6双功能去饱和酶”或“Δ5/Δ6去饱和酶”在此至少能i)将α亚麻酸转化成十八碳四烯酸,和ii)将二十碳四烯酸转化成二十碳五烯酸。即,Δ5/Δ6双功能酶是Δ5去饱和酶和Δ6去饱和酶,以及Δ5/Δ6双功能去饱和酶可以被认为是它们每种的一种亚型。已经从斑马鱼中鉴定出编码Δ5/Δ6去饱和酶的基因(Hasting et al.,2001)。编码该酶的基因可能代表着“前端去饱和酶”的祖先形式,其后来复制以及拷贝进化成不同的Δ5和Δ6去饱和酶功能。在一个实施方式中,Δ5/Δ6用淡水鱼种天然地产生Δ5/Δ6双功能去饱和酶。在一个具体的实施方式中,Δ5/Δ6双功能去饱和酶包括:
i)如SEQ ID NO:15提供的氨基酸序列;
ii)与SEQ ID NO:15具有至少50%相同性的氨基酸序列;或
iii)i)或ii)的生物学活性片段。
“Δ5去饱和酶”在此至少能将二十碳四烯酸转化成二十碳五烯酸。在一个实施方式中,酶Δ5去饱和酶催化C20LC-PUFA的去饱和作用,将DGLA转化成花生四烯酸(ARA,20:4ω6)以及将ETA转化成EPA(20:5ω3)。已经从多种生物体中分离出编码该酶的基因,所述生物体包括藻类(破囊壶菌,Qiu et al,2001)、真菌(M.alpine、畸雌腐霉、三角褐指藻、Dictyostelium)、秀丽隐杆线虫和哺乳动物(表1)。在另一个实施方式中,Δ5去饱和酶包括(i)如SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:60提供的氨基酸序列;(ii)与SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:20或SEQ ID NO:60中的任一序列具有至少50%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,Δ5去饱和酶包括(i)如SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQID NO:20或SEQ ID NO:60提供的氨基酸序列;(ii)与SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:20或SEQ ID NO:60中的任一序列具有至少90%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,由表1所列的其中一种Δ5去饱和酶基因或与之基本相同的基因的蛋白编码区编码Δ5去饱和酶。
“Δ6去饱和酶”在此至少能将α亚麻酸转化成十八碳四烯酸。在一个实施方式中,酶Δ6去饱和酶催化C18 LC-PUFA的去饱和作用,将LA转化成GLA以及将ALA转化成SDA。在另一个实施方式中,Δ6去饱和酶包括(i)如SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQ IDNO:67提供的氨基酸序列;(ii)与SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66或SEQ ID NO:67中的任一序列具有至少50%相同性的氨基酸序列;(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,Δ6去饱和酶包括与SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQ ID NO:67中的任一序列具有至少90%相同性的氨基酸序列。在进一步的实施方式中,由表1所列的其中一种Δ6去饱和酶基因或与之基本相同的基因的蛋白编码区编码Δ6去饱和酶。
“Δ4去饱和酶”在此至少能将二十二碳五烯酸转化成二十二碳六烯酸。在非哺乳动物的生物体中,Δ4去饱和酶催化由DPA产生DHA的去饱和步骤,已经从淡水原生动物物种纤细眼虫和海洋物种破囊壶菌中分离到了编码该酶的基因(Qiu et al.,2001;Meyer et al.,2003)。在一个实施方式中,Δ4去饱和酶包括(i)如SEQ ID NO:4、SEQ ID NO:33或SEQ IDNO:34提供的氨基酸序列;(ii)与SEQ ID NO:4、SEQ ID NO:33或SEQ IDNO:34具有至少50%相同性的氨基酸序列;(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,由表1所列的其中一种Δ4去饱和酶基因或与之基本相同的基因的蛋白编码区编码Δ4去饱和酶。
“Δ8去饱和酶”在此至少能将20:3Δ11,14,17ω3转化成二十碳四烯酸。在一个实施方式中,Δ8去饱和酶相对特异于Δ8底物。即,它在去饱和Δ8底物上具有比其他底物更高的活性,特别是对于/Δ6去饱和的底物。在一个优选的实施方式中,当在酵母细胞内表达时,Δ8去饱和酶只有很小的或没有Δ6去饱和酶活性。在另一个实施方式中,Δ8去饱和酶包括(i)如SEQ ID NO:1、SEQ ID NO:36、SEQ ID NO:68、SEQ ID NO:69、SEQ IDNO:70或SEQ ID NO:71提供的氨基酸序列;(ii)与SEQ ID NO:1、SEQ IDNO:36、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70或SEQ ID NO:71具有至少50%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,Δ8去饱和酶包括(i)如SEQ ID NO:1提供的氨基酸序列;(ii)与SEQ ID NO:1具有至少90%相同性的氨基酸序列;(iii)i)或ii)的生物学活性片段。
“Δ3去饱和酶”在此至少能将LA转化成ALA和/或将GLA转化成SDA和/或将ARA转化成EPA。Δ3去饱和酶的实例包括如Pereira et al.(2004)、Horiguchi et al.(1998)、Berberich et al.(1998)和Spychalla et al.(1997)所述的那些Δ3去饱和酶。在一个实施方式中,本发明的细胞是缺乏Δ3去饱和酶活性的植物细胞。利用本领域公知的基因敲除技术可以产生这些细胞。这些细胞可以被用于特异地产生大量的ω6 LC-PUFA例如DGLA。
延长酶
生物化学证据说明脂肪酸延长由4个步骤组成:缩合、还原、脱水和第二次还原。在本发明的上下文中,“延长酶”指的是在合适的生理条件下,在存在延长复合物的其他成分时,催化缩合步骤的多肽。已经显示,只有延长蛋白复合物的缩合组分(“延长酶”)在细胞内的异源或同源表达对于相应脂酰链的延长是必需的。因此,所引用的延长酶能成功地恢复转基因宿主的还原和脱水活性,以便实现成功的脂酰延长。认为延长反应相对于脂肪酸底物的链长以及去饱和程度的特异性存在于缩合组分内。该组分也被认为是延长反应中的速度限制性的组分。
至今已经鉴定出两组缩合酶。第一组涉及饱和和单不饱和脂肪酸(C18-22)的延长,例如拟南芥的FAE1基因。在芸苔中所形成的产物的实例是芥酸(22:1)。该组被称为FAE样酶,并且在LC-PUFA生物合成中没有表现出作用。其他被鉴定出的脂肪酸延长酶的组被称作延长酶的ELO家族,按ELO基因命名,其活性对于在酵母中合成神经鞘脂的超长链脂肪酸是必需的。从合成LC-PUFA的生物体如藻类、苔藓、真菌和线虫中分离出的ELO型延长酶的表观形似物已经显示出涉及LC-PUFA的延长和合成。也已经分离出一些编码这些PUFA延长酶的基因(表1)。这些基因在核苷酸或氨基酸序列上与高等植物中的FAE样延长酶基因无关。
“Δ5/Δ6双功能延长酶”或“Δ5/Δ6延长酶”在此至少能i)将十八碳四烯酸转化成二十碳四烯酸;和ii)将二十碳五烯酸转化成二十二碳五烯酸。即,Δ5/Δ6双功能延长酶是Δ5延长酶和Δ6延长酶,以及Δ5/Δ6双功能延长酶可以被认为是每种酶的一种亚型。在一个实施方式中,当给植物提供EPA来源时,Δ5/Δ6双功能延长酶能催化植物细胞(例如高等植物细胞)内的EPA延长产生DPA。可以外源地或优选地内源地提供EPA。已经从无脊椎动物秀丽隐杆线虫中分离出编码这样一种延长酶的基因(Beaudoin et al.,2000),尽管之前并不知道它能催化Δ5延长步骤。在一个实施方式中,Δ5/Δ6双功能延长酶包括(i)如SEQ ID NO:2或SEQ IDNO:14提供的氨基酸序列;(ii)与SEQ ID NO:2或SEQ ID NO:14具有至少50%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。
“Δ5延长酶”在此至少能将二十碳五烯酸转化成二十二碳五烯酸。在一个实施方式中,Δ5延长酶来自无脊椎动物来源例如藻类或真菌来源。在所实现的延长反应的特异性方面,这些延长酶具有优势(例如SEQ IDNO:2提供的Δ5延长酶)。在一个优选的实施方式中,Δ5延长酶相对地特异于C20底物,而不是C22底物。例如,当在酵母细胞内表达时,其对C22底物的活性(延长为C24脂肪酸)比其对相应的C20底物的活性至少低10倍。优选的是,当使用C20A5去饱和底物时,其活性是高的,例如当在酵母细胞内表达时,其提供了20:5ω3向22:5ω3的至少7%的转化率。在另一个实施方式中,Δ5延长酶相对特异于Δ5去饱和底物,而不是Δ6去饱和底物。例如,当在酵母细胞内表达时,其对Δ6去饱和C18底物的活性比对Δ5去饱和C20底物的活性至少低10倍。在进一步的实施方式中,Δ5延长酶包括(i)如SEQ ID NO:2、SEQ ID NO:30、SEQ IDNO:77或SEQ ID NO:78提供的氨基酸序列;(ii)与SEQ ID NO:2、SEQ IDNO:30、SEQ ID NO:77或SEQ ID NO:78具有至少50%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。在另一个实施方式中,Δ5延长酶包括(i)如SEQ ID NO:2提供的氨基酸序列;(ii)与SEQ ID NO:2具有至少90%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,由表1所列的其中一种Δ5延长酶基因或与之基本相同的基因的蛋白编码区编码Δ5延长酶。
“Δ6延长酶”在此至少能将十八碳四烯酸转化成二十碳四烯酸。在一个实施方式中,Δ6延长酶包括(i)如SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:74、SEQ ID NO:85、SEQ IDNO:86或SEQ ID NO:88提供的氨基酸序列;(ii)与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:74、SEQ ID NO:85、SEQ ID NO:86或SEQ ID NO:88具有至少50%相同性的氨基酸序列;(iii)i)或ii)的生物学活性片段。在另一个实施方式中,Δ6延长酶包括(i)如SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:32、SEQ ID NO:85、SEQ IDNO:86或SEQ ID NO:88提供的氨基酸序列;(ii)与SEQ ID NO:2、SEQ IDNO:3或SEQ ID NO:32、SEQ ID NO:85、SEQ ID NO:86或SEQ ID NO:88具有至少90%相同性的氨基酸序列;(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,由表1所列的其中一种Δ6延长酶基因或与之基本相同的基因的蛋白编码区编码Δ6延长酶。
在一些原生生物物种中,通过在用Δ8去饱和酶去饱和之前,用C2单位延长亚油酸或α亚麻酸合成LC-PUFA(图1IV部分;“Δ8去饱和作用”途径)。在这些生物体中没有检测到Δ6去饱和酶和Δ6延长酶。取而代之的是,在这些生物体中检测到了Δ9延长酶,支持这一点的是,最近已经从球等鞭金藻分离到了C18Δ19延长酶基因(Qi et al.,2002)。“Δ9延长酶”在此至少能将α亚麻酸转化成20:3Δ11,14,17。在一个实施方式中,Δ9延长酶包括(i)如SEQ ID NO:3、SEQ ID NO:35、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:85或SEQ ID NO:86提供的氨基酸序列;(ii)与SEQ ID NO:3、SEQ ID NO:35、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:85或SEQ IDNO:86具有至少50%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。在一个实施方式中,Δ9延长酶包括(i)如SEQ ID NO:3、SEQ IDNO:85或SEQ ID NO:86提供的氨基酸序列;(ii)与SEQ ID NO:3、SEQ IDNO:85或SEQ ID NO:86具有至少90%相同性的氨基酸序列;或(iii)i)或ii)的生物学活性片段。在进一步的实施方式中,由表1所列的Δ9延长酶基因或与之基本上相同的基因的蛋白编码区编码Δ9延长酶。在另一个实施方式中,/Δ9延长酶也具有Δ6延长酶活性。在此实施方式中的延长酶还能将SDA转化成ETA和/或将GLA转化成DGLA(Δ6延长酶活性),除了将ALA转化成ETrA(Δ9延长酶)以外。在一个优选的实施方式中,这样一种延长酶来自藻类或真菌来源例如巴夫藻属。
“Δ4延长酶”在此至少能将二十二碳六烯酸转化成24:6Δ6,9,12,15,18,21ω3。
细胞
本发明的合适的细胞包括任何可以被编码在此所述的多肽/酶的多核苷酸转化的细胞,以及所述细胞据此能用于产生LC-PUFA。可以引入多核苷酸的宿主细胞可以是未转化细胞或已经被至少一种核酸分子所转化的细胞。这些核酸分子可以与LC-PUFA合成相关,或不相关。本发明的宿主细胞可以内源性地(即天然地)能产生本发明的蛋白或者仅仅在被至少一种核酸分子转化后才能产生这些蛋白。
术语“具有增强的合成长链多不饱和脂肪酸的能力的细胞”是相对术语,其中本发明的重组细胞与天然细胞相比较,重组细胞比天然细胞产生更多的长链多不饱和脂肪酸,或更高浓度的LC-PUFA例如EPA、DPA或DHA(相对于其他脂肪酸)。
细胞可以是原核细胞或真核细胞。本发明的宿主细胞可以是任何能产生至少一种在此所述的蛋白的细胞,其包括细菌的、真菌的(包括酵母)、寄生虫的、节肢动物的、动物的和植物的细胞。优选的宿主细胞是酵母和植物细胞。在一个优选的实施方式中,植物细胞是种子细胞。
在一个实施方式中,细胞是动物细胞或藻类细胞。动物细胞可以是任一类型动物的细胞,例如非人的动物细胞、非人的脊椎动物细胞、非人的哺乳动物细胞、或水生动物例如鱼或甲壳动物的细胞、无脊椎动物细胞、昆虫细胞等。
能用作本发明的宿主细胞的细菌细胞的一个实例是Synechococcusspp(也称作Synechocystis spp.),例如Synechococcus elongatus。
细胞可以是适合于发酵的生物体。术语“发酵过程”在此指的是任何发酵过程或任何包括发酵步骤的过程。发酵过程不受限制地包括用于产生醇(例如乙醇、甲醇、丁醇)、有机酸(例如柠檬酸、乙酸、亚甲基丁二酸、乳酸、葡糖酸)、酮(例如丙酮)、氨基酸(例如谷氨酸)、气体(例如H2和CO2)、抗生素(例如青霉素和四环素)、酶、维生素(例如核黄素、β-胡萝卜素)、和激素的发酵过程。发酵过程也包括用于消耗性乙醇工业(例如啤酒和白酒)、食品工业(例如发酵奶制品)、皮革工业和烟草工业的发酵过程。优选的发酵过程包括本领域公知的乙醇发酵过程。优选的发酵过程是本领域公知的厌氧发酵过程。
合适的发酵细胞(通常是微生物)能发酵,即能将糖(例如葡萄糖或麦芽糖)直接或间接地转化成所需的发酵产物。发酵微生物的实例包括真菌生物体例如酵母。“酵母”在此包括糖酵母属(Saccharomyces spp.)、啤酒糖酵母(Saccharomyces cerevisiae)、卡尔斯伯糖酵母(Saccharomycescarlbergensis)、假丝酵母属(Candida spp.)、克鲁维氏酵母属(Kluveromycesspp.)、毕赤氏酵母属(Pichia spp.)、汉逊氏酵母属(Hansenula spp.)、木霉属(Trichoderma spp.)、斯达氏油脂酵母(Lipomyces starkey)、和Yarrowialipolytica。优选的酵母包括糖酵母属的菌株,特别是啤酒糖酵母。商业可获得的酵母包括例如Red Star/Lesaffre Ethanol Red(购自RedStar/Lesaffre,USA)FALI(购自Fleischmann′s Yeast,a division of Bums Philp Food Inc.,USA)、SUPERSTART(购自Alltech)、GERT STRAND(购自Gert Strand AB,Sweden)和FERMIOL(购自DSM Specialties)。
至今为止的证据都说明在酵母中异源表达的一些去饱和酶在与一些延长酶组合时具有相当低的活性。但是,本发明者已经发现通过提供具有在LC-PUFA合成中利用脂肪酸的脂酰辅酶A形式作为底物的能力的去饱和酶可以解决这个问题,这在非酵母的重组细胞中被认为是有优势的。在这个方面,也已经确定出脊椎动物来源的去饱和酶对于产生LC-PUFA是特别有用的。因此,在本发明的实施方式中,(i)至少一种酶是催化细胞内的EPA转化成DPA的Δ5延长酶;(ii)至少一种去饱和酶能作用于脂酰辅酶A底物;(iii)至少一种去饱和酶来自于脊椎动物或其变体;或(iv)ii)和iii)的组合。
在一个特别优选的实施方式中,宿主细胞是植物细胞,例如在此更为详细描述的那些植物细胞。
“种子的祖细胞”在此是能分裂和/或分化成本发明的转基因种子的细胞的细胞,和/或能分裂和/或分化成产本发明的转基因种子的转基因植物的细胞。
产生的LC-PUFA的水平
在重组细胞中所产生的LC-PUFA的水平是重要的。水平可以被表示为如用本领域已知的方法可以测定的特殊的LC-PUFA或相关LC-PUFA组例如ω3 LC-PUFA或ω6 LC-PUFA、或C22+LC-PUFA等在总脂肪酸中的组成(百分比)。水平也可以表达为LC-PUFA含量,例如LC-PUFA在包括重组细胞的物质干重中的百分比,例如LC-PUFA占种子干重的百分比。要明白,对于LC-PUFA含量而言,在油籽中所产的LC-PUFA可能要比不用于油籽产生的蔬菜或农作物所产的LC-PUFA明显更高,但是两者可以具有相似的LC-PUFA组成,两者都可以被用作为用于人类和动物消费的LC-PUFA的来源。
用本领域已知的任一方法可以确定出LC-PUFA水平。例如,可以从细胞、组织或生物体中提取出总脂质,以及在用气相色谱法(GC)分析前,脂肪酸被转化成了甲酯。在实施例1中描述了这些技术。色谱中的峰位置可以被用于鉴定出每种特殊的脂肪酸,以及可以整合每个峰下的面积确定出脂肪酸的量。除非有不同的说明,样品中的特殊脂肪酸的百分比在此被确定为脂肪酸峰下面积占色谱中的脂肪酸的总面积的百分比。这主要对应于重量百分比(w/w)。如实施例1所述的那样,用GC-MS可以确定出脂肪酸的相同性。
在某些实施方式中,其中重组细胞能用于发酵过程例如酵母细胞,所产的EPA水平可以是细胞内总脂肪酸的至少0.21%,优选地至少0.82%或至少2%以及更优选地至少5%。
在其他实施方式中,重组细胞的总脂肪酸可以包括至少1.5%的EPA,优选地至少2.1%的EPA,和更优选地至少2.5%、至少3.1%、至少4%或至少5.1%EPA。
在进一步的实施方式中,其中重组细胞能用于发酵过程或者是植物细胞,以及产生DPA,细胞内的总脂肪酸可以包括至少0.1%的DPA,优选地至少0.13%或至少0.15%以及更优选地至少0.5%或至少1%DPA。
在进一步的实施方式中,细胞的总脂肪酸可以包括至少2%C20LC-PUFA,优选地至少3%或至少4%C20 LC-PUFA,更优选地至少4.7%或至少7.9%C20 LC-PUFA以及最优选地至少10.2%C20 LC-PUFA。
在进一步的实施方式中,细胞的总脂肪酸可以包括至少2.5%C20ω3LC-PUFA,优选地至少4.1%或更优选地至少5%C20ω3 LC-PUFA。
在其他实施方式中,其中在细胞内合成EPA和DPA,所获得的EPA水平是至少1.5%、至少2.1%或至少2.5%,以及DPA水平是至少0.13%、至少0.5%或至少1.0%。
在这些实施方式的每一个中,重组细胞可以是适合于发酵的生物体的细胞,例如单细胞微生物,其可以是原核生物或真核生物例如酵母,或植物细胞。在一个优选的实施方式中,细胞是被子植物(高等植物)的细胞。在进一步优选的实施方式中,细胞是种子细胞,例如油籽或农作物或谷类植物。
重组细胞中的LC-PUFA的产生水平也可以被表达为转化率,即所形成的LC-PUFA的量占一种或多种底物PUFA或LC-PUFA的百分比。例如对于EPA,可以表达为EPA水平(占总脂肪酸的百分比)与底物脂肪酸(ALA、SDA、ETA或ETrA)水平的比例。在一个优选的实施方式中,转化效率是从ALA到EPA。在一个具体实施方式中,在重组细胞中产生EPA的转化率可以是至少0.5%、至少1%、或至少2%。在另一个实施方式中,ALA到EPA的转化效率是至少14.6%。在进一步的实施方式中,重组细胞内的由EPA产生DPA的转化率是至少5%、至少7%、或至少10%。在其他实施方式中,所产的作为Δ6去饱和产物的总ω3脂肪酸(即18:3ω3(ALA)的下游,计算为18:4ω3(SDA)、20:4ω3(ETA)、20:5ω3(DPA)的百分比的总和)是至少4.2%。在一个具体的实施方式中,在重组细胞(优选的植物细胞,更优选的种子细胞)中经Δ6去饱和步骤和/或Δ9延长步骤将ALA转化成ω3产物的转化率是至少22%或至少24%。其他要说明的是,在本实施方式中,细胞内的源自ALA的产物与ALA(产物:ALA)的比值是至少1∶3.6。
如果选择用于引入基因的亲代细胞,使得所产的或外源提供的脂肪酸底物水平最优化,就可以使得重组细胞内的LC-PUFA的含量最大化。在一个具体实施方式中,细胞外源性地产生占总脂肪酸至少30%、至少50%、或至少66%水平的ALA。通过在最佳条件下生长或培养细胞也可以将LC-PUFA水平最大化。最佳条件例如是比细胞的标准温度稍微更低的温度,该温度被认为是有助于蓄积多不饱和脂肪酸。
将所需LC-PUFA的产量最大化是有优势的,虽然将副反应的程度最小化。在具体的实施方式中,检测到了很少的或没有检测到ETrA(小于0.1%),而EPA水平是至少2.1%。
至于本发明的转基因植物,在一个实施方式中,至少一个植物部分合成EPA,其中植物部分的总脂肪酸包括至少1.5%、至少2.1%、或至少2.5%的EPA。
在另一个实施方式中,至少一个植物部分合成DPA,其中植物部分的总脂肪酸包括至少0.1%、至少0.13%、或至少0.5%DPA。
在进一步的实施方式中,至少一个植物部分合成DHA。
在另一种实施方式中,至少一个植物部分合成DHA,其中植物部分的总脂肪酸包括至少0.1%、至少0.2%或至少0.5%DHA。
在另一个实施方式中,至少一个植物部分合成至少一种ω3 C20LC-PUFA,其中植物部分的总脂肪酸包括至少2.5%、或至少4.1%ω3 C20LC-PUFA。
仍在另一个实施方式中,至少一个植物部分合成EPA,其中在植物部分中的ALA到EPA的转化效率是至少2%或至少14.6%。
在进一步的实施方式中,至少一个植物部分合成ω3多不饱和脂肪酸,其是对ALA的Δ6去饱和作用的产物和/或对ALA的Δ9延长的产物,其中植物部分中的ALA到所述产物的转化效率是至少22%或至少24%。
仍在另一个实施方式中,至少一个植物部分从EPA合成DPA,其中在植物部分中的EPA到DPA的转化效率是至少5%或至少7%。
对于本发明的转基因种子,在一个实施方式中,在种子中合成EPA,种子的总脂肪酸包括至少1.5%、至少2.1%或至少2.5%的EPA。
在另一个实施方式中,在种子中合成DPA,种子的总脂肪酸包括至少0.1%、至少0.13%、或至少0.5%DPA。
在进一步的实施方式中,在种子中合成DHA。
在另一个实施方式中,在种子中合成DHA,以及种子的总脂肪酸包括至少0.1%、至少0.2%或至少0.5%DHA。
仍在进一步的实施方式中,在种子中合成至少一种ω3 C20LC-PUFA,以及种子的总脂肪酸包括至少2.5%、或至少4.1%ω3 C20LC-PUFA。
在进一步的实施方式中,在种子中合成EPA,以及种子中的ALA到EPA的转化效率是至少2%或至少14.6%。
在另一个实施方式中,在种子中合成ω3多不饱和脂肪酸,其是对ALA的Δ6去饱和作用的产物和/或对ALA的Δ9延长作用的产物,种子中的ALA到所述产物的转化效率是至少22%或至少24%。
在进一步的实施方式中,在种子中从EPA合成DPA,以及种子中的EPA到DPA的转化效率是至少5%或至少7%。
对于本发明的提取物,在一个实施方式中,提取物的总脂肪酸含量包括至少1.5%、至少2.1%或至少2.5%EPA。
在另一个实施方式中,提取的总脂肪酸含量包括至少0.1%、至少0.13%、或至少0.5%DPA。
在进一步的实施方式中,提取物包括DHA。
在另一个实施方式中,提取物的总脂肪酸含量包括至少0.1%、至少0.2%、或至少0.5%DHA。
在另一个实施方式中,提取物的总脂肪酸含量包括至少0.25%、或至少4.1%ω3C20 LC-PUFA。
仍在另一个实施方式中,提取物包括ARA、EPA、DPA、DHA、或它们的甘油三酯的任一混和物。
对于本发明的用于产生LC-PUFA的方法,在一个实施方式中,细胞包括至少一种C20 LC-PUFA,以及细胞的总脂肪酸包括至少2%、至少4.7%、或至少7.9%C20 LC-PUFA。
在另一个实施方式中,细胞包括至少一种ω3C20 LC-PUFA,以及细胞的总脂肪酸包括至少2.5%、或至少4.1%ω3C20 LC-PUFA。
在进一步的实施方式中,细胞包括ω3多不饱和脂肪酸,其是对ALA的Δ6去饱和作用的产物和/或对ALA的Δ9延长作用的产物,以及细胞内的ALA向所述产物的转化效率是至少22%或至少24%。
仍在另一个实施方式中,细胞包括DPA,以及细胞的总脂肪酸包括至少0.1%、至少0.13%、或至少0.5%DPA。
在进一步的实施方式中,细胞包括DPA,以及细胞内的EPA向DPA的转化效率是至少5%或至少7%。
在另一个实施方式中,细胞包括EPA,且其中细胞的总脂肪酸包括至少1.5%、至少2%、或至少2.5%EPA。
在进一步的实施方式中,细胞包括EPA,以及细胞内的ALA向EPA的转化效率是至少2%或至少14.6%。
多肽
在一个方面,本发明提供了基本上纯化的多肽,其选自由下面的多肽组成的组:
i)包括如SEQ ID NO:1提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:1具有至少40%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多肽具有Δ8去饱和酶活性。
优选地,Δ8去饱和酶也不具有Δ6去饱和酶活性。
在另一个方面,本发明提供了基本上纯化的多肽,其选自以下一组:
i)包括如SEQ ID NO:2提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:2具有至少60%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多肽具有Δ5延长酶和/或Δ6延长酶活性。
优选地,多肽具有Δ5延长酶和Δ6延长酶活性,其中多肽从EPA合成DPA比其从SDA合成ETA更为有效。更优选地,可以从藻类中纯化出多肽。此外,当其在酵母细胞内表达时,其延长C20LC-PUFA比延长C22LC-PUFA更为有效。
在另一个方面,本发明提供了基本上纯化的多肽,其选自以下一组:
i)包括如SEQ ID NO:3、SEQ ID NO:85或SEQ ID NO:86提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:3、SEQ ID NO:85或SEQ ID NO:86具有至少40%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多肽具有Δ9延长酶和/或Δ6延长酶活性。
优选地,多肽具有Δ9延长酶和Δ6延长酶活性。优选地,多肽在从ALA合成ETrA上比其在从SDA合成ETA上更为有效。此外,优选的是,从藻类或真菌中纯化出多肽。
仍在另一个方面,本发明提供了基本上纯化的多肽,其选自以下一组:
i)包括如SEQ ID NO:4提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:4具有至少70%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多肽具有Δ4去饱和酶活性。
在进一步的实施方式中,本发明提供了基本上纯化的多肽,其选自以下一组:
i)包括如SEQ ID NO:60提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:60具有至少55%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多肽具有Δ5去饱和酶活性。
仍在另一个实施方式中,本发明提供了基本上纯化多肽,其选自以下一组:
i)包括如SEQ ID NO:64提供的氨基酸序列多肽;
ii)包括与SEQ ID NO:64具有至少90%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多肽具有Δ6去饱和酶活性。
仍在另一个方面,本发明提供了基本上纯化的多肽,其选自由下面多肽构成的组:
i)包括如SEQ ID NO:88提供的氨基酸序列的多肽;
ii)包括与SEQ ID NO:88具有至少76%相同性的氨基酸序列的多肽;和
iii)i)或ii)的生物学活性片段,
其中多肽具有Δ6延长酶活性。
优选地,与上面部分中的任一部分有关的是,优选地可以从选自由巴夫藻和直链藻构成的组中的物种中分离出所述多肽。
“基本上纯化的多肽”表示多肽已经至少部分与脂质、核酸、其他多肽、和其他与多肽的天然状态相关的污染分子分离开。优选地,基本上纯化的多肽至少60%、优选地至少75%、以及最优选地至少90%游离于与其天然相连的其他组分。此外,术语“多肽”在此与术语“蛋白”可以互换使用。
用GAP(Needleman and Wunsch,1970)分析(GCG程序)确定出多肽的相同性百分比,其中缺口产生补偿=5,以及缺口延伸补偿=0.3。除非有不同的说明,查询序列的长度至少是15个氨基酸,以及GAP分析在至少15个氨基酸的区域内排列两个序列。更优选地,查询序列的长度至少是50个氨基酸,以及GAP分析在至少50个氨基酸的区域内排列两个序列。甚至更优选地,查询序列的长度至少是100个氨基酸,以及GAP分析在至少100个氨基酸的区域内排列两个序列。
对于给定的多肽/酶,要明白比上面所提供的相同性百分比更高的相同性百分比数值将构成优选的实施方式。因此,在适用的情况下,对于最小的相同性百分比数值,多肽优选地包括与相关命名的SEQ ID NO有着至少60%、更优选地至少65%、更优选地至少70%、更优选地至少75%、更优选地至少76%、更优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、更优选地至少95%、更优选地至少96%、更优选地至少99%、更优选地至少99.1%、更优选地至少99.2%、更优选地至少99.3%、更优选地至少99.4%、更优选地至少99.5%、更优选地至少99.6%、更优选地至少99.7%、更优选地至少99.8%、以及甚至更优选地至少99.9%相同性的氨基酸序列。
在进一步的实施方式中,本发明涉及与在此特异描述的那些多肽基本上相同的多肽。对于多肽而言,术语“基本上相同的”在此表示一个或数个(例如2、3、或4个)氨基酸的缺失、插入和/或取代,同时保持天然蛋白的至少一种活性。
术语“生物学活性片段”在此指的是仍保留去饱和酶或延长酶活性(无论哪个相关的酶)的给定多肽/酶的一部分。通过对全长蛋白进行一系列缺失并测试所形成的片段的活性可以容易地确定出这些生物学活性片段。
通过往编码多肽的核酸中引入适当的核苷酸变化,或者通过体外合成所需的多肽都可以制备出在此所定义的多肽/酶的氨基酸序列突变体/变体。这些突变体包括例如氨基酸序列内的残基的缺失、插入或取代。可以在终产物中实现缺失、插入和取代的组合,只要终末蛋白产物具有所需的特征。
在设计氨基酸序列突变体时,突变位点的定位以及突变的性质将依赖于所修饰的特征。可以单个地或次序地修饰突变的位点,例如通过(1)首先用保守氨基酸选择进行取代,然后根据所实现的结果进行更重要的选择;(2)缺失靶向残基;或(3)在定向位点的邻近部位插入其他残基。
氨基酸序列缺失的范围通常从约1个到30个残基,更优选地从约1个到10个残基以及常常时从约1个到5个连续残基。
取代突变体去除了多肽分子中的至少一个氨基酸残基以及在其位置上插入了不同的残基。最相关的用于取代诱变的位点包括被鉴定为活性或结合位点的位点。其他相关的位点是那些其中从不同菌株或物种中获得的特殊残基都是相同的位点。这些位点对于生物学活性可能是重要的。以相对保守的方式优选地取代这些位点,特别是在至少三个其他的相同保守位点的序列内的那些位点。
表2显示了这些保守取代。
表2:示例的取代
原残基 | 示例性取代 |
Ala(A) | val;leu;ile;gly |
Arg(R) | lys |
Asn(N) | gln;his |
Asp(D) | glu |
Cys(C) | ser |
Gln(Q) | asn;his |
Glu(E) | asp |
Gly(G) | pro,ala |
His(H) | asn;gln |
Ile(I) | leu;val;ala |
Leu(L) | ile;val;met;ala;phe |
Lys(K) | arg |
Met(M) | leu;phe |
Phe(F) | leu;val;ala |
Pro(P) | gly |
Ser(S) | thr |
Thr(T) | ser |
Trp(W) | tyr |
Tyr(Y) | trp;phe |
Val(V) | ile;leu;met;phe,ala |
此外,如果需要,可以将非天然的氨基酸或化学氨基酸类似物作为取代引入到或添加到本发明多肽中。这些氨基酸包括,但不限于常见氨基酸的D异构体、2,4二氨基丁酸、α-氨基异丁酸、4-氨基丁酸、2-氨基丁酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、鸟氨酸、正亮氨酸、戊氨酸、羟脯氨酸、肌氨酸、瓜氨酸、高瓜氨酸、磺丙氨酸、t-丁甘氨酸、t-丁丙氨酸、苯基甘氨酸、丙氨酸环己酯、β-丙氨酸、氟氨基酸、设计物氨基酸例如β-甲基氨基酸、Cα-甲基氨基酸、Nα-甲基氨基酸、和常用的氨基酸类似物。
在合成过程中或在之后被不同地修饰的本发明的多肽也被包含在本发明的范围内,所述修饰是例如通过生物素化、苄基化、糖基化、乙酰化、磷酸化、酰胺化、已知保护/封闭基团的衍生化、蛋白裂解性降解、与抗体分子或其他细胞配体相连接等。这些修饰可以作为增加本发明的多肽的稳定性和/或生物活性。
可以用多种方法产生本发明的多肽,所述方法包括产生并回收天然蛋白、产生并回收重组蛋白、以及化学合成蛋白。在一个实施方式中,通过在足以产生多肽的条件下培养能表达多肽的细胞,和回收多肽来产生本发明的分离的多肽。所培养的优选的细胞是本发明的重组细胞。有效的培养条件包括,但不限于容许蛋白产生的有效的培养基、生物反应器、温度、pH值和氧气条件。有效的培养基指的是任何能在其中培养细胞产生本发明的多肽的培养基。这些培养基通常包括具有可同化的碳、氮和磷来源、和适当的盐、矿物质、金属和其他养分例如维生素的水性培养基。可以在传统的发酵反应器、摇晃瓶、试管、微量滴定皿、和petri培养板中培养本发明的细胞。可以在适合于重组细胞的温度、pH值和氧含量下进行培养。这些培养条件都是在本领域一般人员的专业知识范围内。
多核苷酸
在一个方面,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:5或SEQ ID NO:6提供的核苷酸序列;
ii)编码本发明的多肽的序列;
iii)与SEQ ID NO:5或SEQ ID NO:6具有至少50%相同性的核苷酸序列;和
iv)在高严格性的条件下,与i)到iii)中任一序列杂交的序列。
在另一个方面,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:7或SEQ ID NO:8提供的核苷酸序列;
ii)编码本发明的多肽的序列;
iii)与SEQ ID NO:7或SEQ ID NO:8具有至少51%相同性的核苷酸序列;和
iv)在高严格性的条件下,与i)到iii)中任一序列杂交的序列。
仍在另一个方面,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:9或SEQ ID NO:10提供的核苷酸序列;
ii)编码本发明的多肽的序列;
iii)与SEQ ID NO:9或SEQ ID NO:10具有至少51%相同性的核苷酸序列;和
iv)在高严格性的条件下,与i)到iii)中任一序列杂交的序列。
在一个优选的实施方式中,编码本发明的多肽的序列是SEQ ID NO:9的31到915位核苷酸或者SEQ ID NO:9的85位到915位核苷酸。
在进一步的方面,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:13提供的核苷酸序列;
ii)编码本发明的多肽的序列;
iii)与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:13具有至少70%相同性的核苷酸序列;和
iv)在高严格性的条件下,与i)到iii)中任一序列杂交的序列。
在另一个方面,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:58或SEQ ID NO:59提供的核苷酸序列;
ii)编码本发明的多肽的序列;
iii)与SEQ ID NO:58或SEQ ID NO:59具有至少55%相同性的核苷酸序列;和
iv)在高严格性的条件下,与i)到iii)中任一序列杂交的序列。
在另一个方面,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:63提供的核苷酸序列;
ii)编码本发明的多肽的序列;
iii)与SEQ ID NO:63具有至少90%相同性的核苷酸序列;和
iv)在高严格性的条件下,与i)到iii)中任一序列杂交的序列。
在另一个方面,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:89提供的核苷酸序列;
ii)编码本发明的多肽的序列;
iii)与SEQ ID NO:89具有至少76%相同性的核苷酸序列;和
iv)在高严格性的条件下,与i)到iii)中任一序列杂交的序列。
本发明者也首次从非高等植物中分离到了编码酮-脂酰合酶样脂肪酸延长酶的多核苷酸。
因此,在进一步的实施方式中,本发明提供了包括选自由下面的序列构成的组的核苷酸序列的分离的多核苷酸:
i)如SEQ ID NO:55提供的核苷酸序列;
ii)与SEQ ID NO:55至少40%相同性的核苷酸序列;和
iii)在高严格性的条件下,与i)到ii)中任一序列杂交的序列。
“分离的多核苷酸”包括DNA、RNA、或它们的组合物、单链的或双链的、有义或反义取向的或它们的组合、dsRNA等,其表示至少与与其天然状态相关的或连接的多核苷酸序列部分分离开的多核苷酸。
优选地,分离的多核苷酸至少60%游离、优选地至少75%游离、和最优选地至少90%游离于与所述多核苷酸天然相连的其他组分。此外,术语“多核苷酸”在此与术语“核酸分子”可互换使用。
用GAP(Needleman and Wunsch,1970)分析(GCG程序)确定出多核苷酸相同性百分比,其中缺口产生补偿=5,缺口延伸补偿=0.3。除非有其他的说明,查询序列的长度至少是45个核苷酸,GAP分析在至少45个核苷酸的区域上排列两个序列。优选地,查询序列的长度至少是150个核苷酸,GAP分析在至少150个核苷酸的区域上排列两个序列。更优选地,查询序列的长度至少是300个核苷酸,GAP分析在至少300个核苷酸的区域上排列两个序列。
对于给定的多核苷酸,要明白比上面所提供的相同性百分比更高的相同性百分比数值将构成优选的实施方式。因此,在适用的情况下,对于最小的相同性百分比数值,多核苷酸优选地包括与相关命名的SEQ IDNO有着至少60%、更优选地至少65%、更优选地至少70%、更优选地至少75%、更优选地至少76%、更优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、更优选地至少93%、更优选地至少94%、更优选地至少95%、更优选地至少96%、更优选地至少97%、更优选地至少98%、更优选地至少99%、更优选地至少99.1%、更优选地至少99.2%、更优选地至少99.3%、更优选地至少99.4%、更优选地至少99.5%、更优选地至少99.6%、更优选地至少99.7%、更优选地至少99.8%、以及甚至更优选地至少99.9%相同性的核苷酸序列。
在进一步的实施方式中,本发明涉及与在此特异描述的那些多核苷酸基本上相同的多核苷酸。对于多核苷酸而言,术语“基本上相同的”在此表示一个或数个(例如2、3、或4个)核苷酸的取代,同时保留了核苷酸所编码的天然蛋白的至少一种活性。另外,该术语包括核苷酸的添加或缺失,其造成了所编码的天然蛋白增加或减少了一个或数个(例如2、3、或4个)氨基酸,同时保留了多核苷酸所编码的天然那蛋白的至少一种活性。
本发明的寡核苷酸可以是RNA、DNA、或它们的衍生物。这些寡核苷酸的最小尺寸是寡核苷酸和本发明的核酸分子上的互补序列之间形成稳定的杂交体所需的尺寸。优选地,寡核苷酸的长度是至少15个核苷酸,更优选地至少18个核苷酸,更优选地至少19个核苷酸,更优选地至少20个核苷酸,甚至更优选地至少25个核苷酸。本发明包括可以用作例如鉴定核酸分子的探针、或产生核苷酸分子的引物的寡核苷酸。本发明的用作探针的寡核苷酸通常与标记相缀合,标记例如是放射性同位素、酶、生物素、荧光分子或化学发光分子。
本发明的多核苷酸和寡核苷酸包括那些在严格性条件下与如SEQ IDNO:5到13所提供的序列杂交的多核苷酸和寡核苷酸。严格性条件在此是(1)采用低离子强度和高温度的洗涤,例如0.015M NaCl/0.0015M柠檬酸钠/0.1%NaDodSO4,温度为50℃;(2)在杂交期间采用变性剂例如甲酰胺,例如50%(体积/体积)甲酰胺和0.1%牛血清白蛋白、0.1%Ficoll、0.1%聚乙烯吡咯烷酮、50mM磷酸钠缓冲液(pH值6.5)以及750mMNaCl、75mM柠檬酸钠,温度为42℃;或者(3)采用50%甲酰胺、5xSSC(0.75M NaCl、0.075M柠檬酸钠)、50mM磷酸钠(pH值6.8)、0.1%焦磷酸钠、5x Denhardt溶液、超声处理过的鲑鱼精子DNA(50g/ml)、0.1%SDS和10%硫酸葡聚糖,温度为42℃,在0.2xSSC和0.1%SDS中。
当与天然存在的分子比较时,本发明的多核苷酸可以具有一个或多个突变,所述突变是核苷酸残基的缺失、插入、或取代。突变体可以是天然存在的(也就是说,从天然来源中分离到的)或者合成的(例如,通过对核酸进行定位诱变合成的)。
也提供了反义的和/或催化的核酸(例如核酶),其与本发明的多核苷酸杂交,并因此抑制了编码蛋白的产生。此外,提供了dsRNA分子,特别是具有约21个核苷酸的双链区的小dsRNA分子,其可以被用于RNA干扰,以便抑制细胞内的本发明的多肽的产生。可以用这些抑制分子改变细胞(例如动物细胞、苔藓、或藻类细胞)所产的脂肪酸的类型。这些反义、催化核酸和dsRNA分子的产生都在本领域技术人员的能力范围之内(见例如,G.Hartmann and S.Endres,Manual of Antisense Methodology,Kluwer(1999);Haseloff and Gerlach,1988;Perriman et al.,1992;Shippy etal.,1999;Waterhouse et al.(1998);Smith et al.(2000);WO 99/32619、WO 99/53050、WO 99/49029、和WO01/34815)。
基因构建体和载体
本发明的一个实施方式包括重组载体,其包括至少一种编码在此所定义的多肽/酶的分离的多核苷酸分子,所述多核苷酸分子被插入到任一能将核酸分子转移到宿主细胞内的载体中。这种载体含有异源的核酸序列,即没有天然地发现其与本发明的核酸分子相接近的核酸序列,和优选地源自非本发明的核酸分子所来源的物种的物种的核酸序列。载体可以是RNA或DNA,原核或真核载体,以及通常是病毒或质粒。
一种类型的重组载体包括与表达载体可操纵地连接的本发明的核酸分子。如上所示的,词语“可操纵地连接”指的是以使得当核酸分子被转化到宿主细胞内时能被表达的方式将核酸分子插入到表达载体内。表达载体在此时能转化宿主细胞并实现特异的核酸分子的表达的DNA或RNA载体。优选地,表达载体也能在宿主细胞内复制。表达载体可以是原核的或真核的载体,并且通常是病毒或质粒。本发明的表达载体包括任一能在本发明的重组细胞内发挥作用(即指导基因表达)的载体,重组细胞包括细菌、真菌、内寄生虫、节肢动物、其他动物、和植物细胞。本发明的优选的表达载体可以指导酵母、动物或植物细胞内的基因表达。
具体地,本发明的表达载体含有调节序列,例如转录控制序列、翻译控制序列、复制起点、和其他能与宿主细胞兼容并控制本发明的核酸分子的表达的调节序列。具体地,本发明的重组分子包括转录控制序列。转录控制序列是控制转录的起始、延伸和终止的序列。特别重要的转录控制序列是那些控制转录起始的序列,例如启动子、增强子、操纵子和抑制子序列。合适的转录控制许里包括任一能在至少一种本发明的重组细胞内发挥作用的转录控制序列。本领域技术人员已知多种这样的转录控制序列。
本发明的另一个实施方式包括重组细胞,其包括经本发明的一种或多种重组分子所转化的宿主细胞。通过可以将核酸分子插入到细胞内的任一方法可以完成核酸分子向细胞内的转化。转化技术包括,但不限于转染、电穿孔、微注射、脂染、吸附、和原生质体融合。重组细胞可以仍然是单细胞的或者可以生长成组织、器官或多细胞生物体。所转化的核酸分子可以仍然是染色体外的或者可以以保留其被表达的能力的方式将所转化的核酸分子整合于转化细胞(即重组细胞)的染色体内的一个或多个位点中。
转基因植物及其部分
术语“植物”在此作为表示整个植物的名词,但是也作为表示植物所含的、从植物中获得的、从植物中衍生到的、或与植物相关的任何物质的形容词,例如植物器官(例如叶、茎、根、花)、单细胞(例如花粉)、种子、植物细胞等。本发明所提供的或者预期用于本发明实践的植物包括单子叶和双子叶植物。在优选的实施方式中,本发明的植物是农作物植物(例如谷类和豆类、玉米、小麦、马铃薯、树薯、水稻、高梁、小米、木薯、大麦、或豌豆)、或其他豆类。植物可以生长成用于生产可食用的根、根茎、叶、茎、花或水果。植物可以是蔬菜或观赏植物。本发明的植物可以是:玉米(Zea mays)、芸苔(Brassica napus,Brassica rapa ssp.)、业麻(Linum usitatissimum)、苜蓿(Medicago sativa)、水稻(Oryza sativa)、黑麦(Secale cerale)、高梁(Sorghum bicolour,Sorghumvulgare)、向日葵(Helianthus annus)、小麦(Tritium aestivum)、大豆(Glycine max)、烟草(Nicotiana tabacum)、马铃薯(Solanum tuberosum)、花生(Arachis hypogaea)、棉花(Gossypium hirsutum)、红薯(Lopmoea batatus)、木薯(Manihotesculenta)、咖啡(Cofea spp.)、椰子(Cocosnucifera)、波萝(Anana comosus)、柠檬树(Citrus spp.)、可可(Theobroma cacao)、茶(Camellia senensis)、香蕉(Musa spp.)、酪梨(Persea americana)、无花果(Ficus casica)、番石榴(Psidiumguajava)、芒果(Mangifer indica)、橄榄(Olea europaea)、木瓜(Carica papaya)、腰果(Anacardium occidentale)、macadamia(Macadamia intergrifolia)、杏仁(Prunus amygdalus)、甜菜(Beta vulgaris)、燕麦、或大麦。
在一个实施方式中,植物是油籽植物,优选的是油籽农作物植物。“油籽植物”在此是用于从植物种子中商品化产生油的植物物种。油籽植物可以是油籽油菜(例如芸苔)、玉米、向日葵、大豆、高梁、亚麻(亚麻子)、或甜菜。此外,油籽植物可以是其他的芸苔属、棉花、花生、罂粟、芥菜、蓖麻子、芝麻、红花、或产坚果植物。植物可以在其果实中产生高水平的油,例如橄榄、油棕榈或椰子。本发明可以应用的园艺植物是莴苣、菊苣、或蔬菜芸苔包括甘蓝、花茎甘蓝、或花椰菜。本发明也可以应用于烟草、葫芦、胡萝卜、草莓、番茄、或胡椒。
当需要产生ω3 LC-PUFA时,可以被转化的植物物种所具有的内源性的ALA与LA的比值优选地是至少1∶1,更优选地是至少2∶1。实例包括绝大多数(即使不是全部)的油籽植物例如亚麻子。这使得可用于产生SDA、ETA、ETrA、EPA、DPA和DHA的ALA底物的量最大化。
利用本发明的方法所产的植物可以是在此所详细所述的那些植物的转基因植物和/或被附加基因所转化的植物。在一个实施方式中,本发明的转基因植物也产生重组的ω3去饱和酶。如在先前的段落中所指出的那样,重组的ω3去饱和酶的存在增加了植物中的ALA与LA的比例,便得LC-PUFA例如SDA、ETA、ETrA、EPA、DPA和DHA的产生最大化。
提供相关种子的农作物植物包括油籽植物和豆科植物。相关的种子包括农作物种子例如玉米、小麦、大麦、水稻、高梁、黑麦等。豆科植物包括豆类和豌豆。豆类包括瓜尔豆(guar)、刺槐豆(locust bean)、胡芦巴、黄豆、四季豆、豇豆、绿豆、利马豆、蚕豆、扁豆、鹰嘴豆等。
术语“植物的提取物或部分”指的是植物的任何部分。“部分”一般指的是特异的组织或器官例如种子或根,而“提取物”通常包括破坏细胞壁以及对所形成的物质的可能地部分纯化。天然地,“植物的提取物或部分”将包括至少一种LC-PUFA。利用本领域的标准技术可以制备提取物。
如在本发明上下文中所定义的,转基因植物包括已经用重组技术遗传学修饰的植物及其子代。这一般引起或增强在所需植物或植物器官内产生至少一种在此定义的蛋白/酶。转基因植物部分包括所述植物的所有部分和细胞,例如所培养的组织、愈伤组织、原生质体。转化植物含有它们在转化前所没有含有的遗传物质。遗传物质被优选地稳定地整合于植物的基因组中。所引入的遗传物质可以包括在同一物种中天然存在的但具有重排的次序或不同的元件排列的序列,例如反义序列。这些植物在此包含于“转基因植物”的范围内。“非转基因植物”是还没有被用重组DNA技术通过引入遗传物质遗传修饰的植物。在一个优选的实施方式中,转基因植物中的已经被引入的每一个基因(转基因)都是纯合子的,使得它们的子代不会丧失所需的表型。
存在着一些将外来遗传物质引入到植物细胞内的技术。这些技术包括加速涂层到微粒上的遗传物质直接地进入到细胞内(见,例如美国4,945,050和美国5,141,131)。可以用土壤杆菌技术转化植物(见,例如美国5,177,010、美国5,104,310、美国5,004,863、美国5,159,135)。也已经用电穿孔转化植物(见,例如WO 87/06614、美国5,472,869、5,384,253、WO 92/09696和WO 93/21335)。除了多种用于转化植物的技术以外,与外来基因相接触的组织类型也可以有所不同。这些组织可以包括但不限于胚胎发生组织、I型和II型愈伤组织组织、胚轴、分生组织等。利用在此所述的合适技术可以在发育和/或分化期间转化几乎所有的植物组织。
在例如Pouwels et al.,Cloning Vectors:A Laboratory Manual,1985,supp.1987;Weissbach and Weissbach,Methods for Plant Molecular Biology,Academic Press,1989;and Gelvin et al.,Plant Molecular Biology Manual,Kluwer Academic Publishers,1990中已经描述了大量的适用于稳定地转染植物细胞或者用于建立转基因植物的载体。植物表达载体通常包括例如一个或多个处于5’和3’调控序列的转录控制下的克隆的植物基因和显性可选择性标记物。这些植物表达载体也可以含有启动子调节区(例如控制诱导型或组成型表达、环境或发育调节型表达、或细胞或组织特异性表达的调节区)、转录起始位点、核糖体结合位点、RNA加工信号、转录终止位点、和/或多聚腺苷酸化信号。
植物启动子的实例包括,但不限于核酮糖-1,6-二磷酸羧化酶小亚基、β-conglycinin启动子、菜豆球蛋白启动子、高分子量麦谷蛋白(HMW-GS)启动子、淀粉生物合成基因启动子、ADH启动子、热休克启动子和组织特异性启动子。启动子也可以含有可以提供转录效率的增强子序列。常用的增强子包括但不限于Adh-intron 1和Adh-intron 6。
组成型启动子指导所有细胞类型中的以及所有时间的持续的基因表达(例如,肌动蛋白、泛素蛋白、CaMV35S)。组织特异性启动子造成了特异细胞或组织类型中的基因表达,例如叶或种子(例如,zein、oleosin、napin、ACP、globulin等),也可以使用这些启动子。启动子也可以在植物发育的某个阶段是有活性的以及在植物组织和器官中是有活性的。这些启动子的实例包括但不限于花粉特异的、胚胎特异的、玉米穗特异的、棉花纤维特异的、根特异的、种子胚乳特异的启动子等。
在特别优选的实施方式中,启动子指导其中发生脂质和油生物合成的组织和器官内的表达,特别是在种子细胞例如胚乳细胞和发育中胚胎的细胞内的表达。合适的启动子是油籽油菜napin基因启动子(US5,608,152)、蚕豆USP启动子(Baumlein et al.,1991)、拟南芥油质蛋白启动子(WO 98/45461)、菜豆菜豆素启动子(US 5,504,200)、芸苔Bce4启动子(WO 91/13980)或豆球蛋白B4启动子(Baumlein et al.,1992),以及导致在单子叶植物例如玉米、大麦、小麦、黑麦、水稻等的种子特异性表达的启动子。著名的合适的启动子是大麦lpt2或lpt1基因启动子(WO95/15389和WO 95/23230)或在WO 99/16890中所述的启动子(来自大麦hordein基因、水稻谷蛋白基因、水稻oryzin基因、水稻prolamin基因、小麦gliadin基因、小麦glutelin基因、玉米zein基因、燕麦glutelin基因、高梁kasirin基因、黑麦secalin基因的启动子)。其他启动子包括Broun等(1998)和US20030159173所述的那些启动子。
在某些情况中,可能需要使用诱导型启动子。诱导型启动子造成了应答于特异信号的基因表达,所述特异信号是例如物理刺激(热休克基因)、光(RUBP羧化酶)、激素(Em)、代谢物、和应激。也可以使用在植物中发挥作用的其他所需的转录和翻译元件。
除了植物启动子,可以在植物细胞中有效地使用来自各种来源的启动子,以便表达外来基因。例如,可以使用细菌来源的启动子例如章鱼碱(octopine)合酶启动子、胭脂氨酸合酶启动子、甘露碱(mannopine)合酶启动子;病毒来源的启动子,例如花椰菜花叶病毒(35S和19S)等。
显而易见的是,适合于生产在此所述的LC-PUFA(特别是DHA)的转基因植物可以被直接食用,或者可以将其作为提取必需脂肪酸的来源,其中DHA是一种组分。
“发芽”在此指的是在吸胀之后根尖突破种皮。“发芽率”指的是在吸胀之后,在一段时间(例如7或10天)内已经发芽的种子在群体中的百分比。可以在数天内每天评价种子群,以便确定出一段时间内的发芽百分比。
对于本发明的种子,术语“基本上相同的发芽率”在此表示转基因种子的发芽率是等基因非转基因种子的至少60%、更优选地至少80%、以及甚至更优选地至少90%。用本领域已知的技术可以计算出发芽率。
进一步关于本发明的种子,术语“种子的发芽时机是基本上相同的”在此表示转基因种子的发芽时机是等基因非转基因种子的至少60%、更优选地至少80%、以及甚至更优选地至少90%。用本领域已知的技术可以计算出发芽时机。
本发明者已经发现,至少在某些情况中,当细胞具有纯合子的转基因时,增加了重组细胞内的LC-PUFA的产生。因此,优选地重组细胞(优选地是转基因植物)具有至少一种纯合子的去饱和酶和/或延长酶基因。在一个实施方式中,细胞/植物具有纯合子的斑马鱼的Δ6/Δ5去饱和酶和/或秀丽隐杆线虫的延长酶。
转基因的非人类动物
用于产生转基因动物的技术在本领域是公知的。关于此主题的有用的普通教科书是Houdebine,Transgenic animals-Generation and Use(Harwood Academic,1997)。
可以将例如异源的DNA引入到受精过的哺乳动物卵内。例如,可以用微注射、磷酸钙介导的沉淀、脂质体融合、逆转录病毒感染或其他方式转化全能或多能干细胞,然后将所转化的细胞引入到胚胎内,然后胚胎发育成转基因动物。在高度优选的方法中,用含有所需DNA的逆转录病毒感染发育胚胎,并从所感染的胚胎中产生转基因动物。但是,在最优选的方法中,将合适的DNA共注射到胚胎(优选地是单细胞胚胎)的前核或细胞浆内,胚胎被容许发育成成熟的转基因动物。
用于产生转基因动物的另一种方法包括用标准方法将核酸微注射到前核阶段的卵内。然后在被转移到假孕受体的输卵管之前,培养注射过的卵。
也可以用核转移技术产生转基因动物。利用该方法,用整合了在调节序列控制下的相关结合区或结合伴侣的编码序列的质粒稳定地转染来自供体动物的成纤维细胞。然后稳定的转化体与去核的卵母细胞融合,培养并将其转移到雌性受体中。
饲料
本发明包括可以作为饲料的组合物。对于本发明的目的,“饲料”包括任何用于人类或动物消费(包括肠道和/或肠外消费)的食物或产品,当其被摄入到体内后,其作用为(a)营养或构建组织或供应能量;和/或(b)保持、储存或支持足够的营养状态或代谢功能。本发明的饲料包括婴儿和/或儿童的营养组合物。
本发明的饲料例如包括本发明的细胞、本发明的植物、本发明的植物细胞、本发明的种子、本发明的提取物、本发明的产品、本发明的发酵过程的产品、或与合适载体在一起的组合物。广义使用的术语“载体”包括任何可以具有或可以不具有营养价值的组分。本领域技术人员要明白,载体必需适用于饲料,使得它不会对消费饲料的生物体造成有害的作用。
本发明的饲料包括油、脂肪酸酯、或用在此所述的方法、细胞或植物直接或间接产生的脂肪酸。组合物可以是固体形式或液体形式。另外,本组合物可以包括特殊应用所需量的可食用的大量营养素、维生素、和/或矿物质。这些组分的量将依赖于组合物是否打算用于正常的个体或用于具有特殊需要的个体,例如患有代谢性疾病等的个体。
具有营养价值的合适载体的实例包括,但不限于大量营养素例如可食用脂肪、碳水化合物和蛋白。这些可食用脂肪的实例包括,但不限于椰子油、琉璃苣油、真菌油、黑加仑油、大豆油、以及甘油单酯和甘油二酯。这些碳水化合物的实例包括(但不限于):葡萄糖、可食用乳糖、和水解淀粉。另外,可以用于本发明的营养组合物的蛋白的实例包括(但不限于)大豆蛋白、电透析的乳清、电透析的脱脂奶、乳清、或这些蛋白的水解产物。
对于维生素和矿物质,可以将下面的维生素和矿物质添加到本发明的饲料组合物内:钙、磷、钾、钠、氯、镁、锰、铁、铜、锌、硒、碘、和维生素A、E、D、C、和B复合物。也可以添加其他的维生素和矿物质。
在本发明的饲料组合物中所用的组分可以是半纯化或纯化的来源。半纯化的或纯化的表示已经通过纯化天然物质或通过原位合成制备的物质。
也可以将本发明的饲料组合物加入到食品中,甚至当不需要饮食添加物时。例如,可以将本组合物加入到任何类型的食物中,其包括(但不限于):人造黄油、修饰黄油、乳酪、牛奶、酸奶、巧克力、糖果、点心、色拉油、烹调油、烹调脂肪、肉、鱼和饮料。
糖酵母属被用于啤酒和酒的制备,也被用作烘烤(具体地是面包)的材料。酵母是蔬菜提取物的主要组分。酵母也被用作动物饲养的添加剂。显而易见的是,可以提供遗传学加工过的酵母菌株,其适合于合成在此所述的LC-PUFA。然后这些酵母菌株可以用于食物和酒以及啤酒的制备,以便提供具有增加了的脂肪酸含量(具体地是DHA含量)的产物。
另外,本发明所产的LC-PUFA或者含有并表达目标基因的转化细胞也可以用于动物食品添加剂,以便改变动物组织或牛奶脂肪酸组成,使得其更符合人体或动物的需求。这些动物的实例包括绵羊、牛、马等。
此外,本发明的饲料可以被用与水产养殖,以便增加用于人或动物消费的鱼中的LC-PUFA水平。
在哺乳动物中,所谓的“Sprecher”途径通过三种反应将DPA转化成DHA,其独立于Δ7延长酶、Δ4去饱和酶、和β氧化步骤(Sprecher et al.,1995)(图1)。因此,在用于哺乳动物消费的饲料(例如用于人类婴儿消费的制剂)中,可能仅仅必需提供利用本发明所产的DPA,因为通过利用“Sprecher”途径将DPA转化成DHA,哺乳动物对象应当能满足其对DHA的需求。因此,在本发明的一个实施方式中,在此所述的用于哺乳动物消费的饲料至少包括DPA,其中用细胞内的重组酶实现至少一种DPA生产中的酶反应。
组合物
本发明也包括组合物,特别是药物组合物,其包括一种或多种用本发明的方法产生的脂肪酸和/或所形成的油。
药物组合物可以包括一种或多种LC-PUFA和/或油,其与标准的、熟知的、无毒的可药用载体、佐剂或赋形物(例如磷酸缓冲盐、水、乙醇、多元醇、植物油)、湿润剂或乳化剂例如水/油乳剂一起组合使用。组合物可以是液体或固体形式。例如,组合物可以是片剂、胶囊、可吸收液体或粉末的形式、可注射形式或可局部施用的软膏或乳膏形式。对于分散相而言,通过保持所需的颗粒大小以及通过使用表面活性剂可以保持合适的流动性。包括等张剂例如糖、氯化钠等也可能是需要的。除了这些惰性稀释剂之外,本组合物也可以包括佐剂,例如湿润剂、乳化剂和悬浮剂,甜味剂、调味剂和芳香剂。
除了活性组合物外,悬浮液可以包括悬浮剂例如乙氧基化的异硬脂醇、聚氧乙烯山梨醇和山梨聚糖酯、微晶纤维素、aluminum metahydroxide、皂土、琼脂-琼脂、和西黄蓍胶或这些物质的混和物。
利用本领域公知的技术可以制备固体剂型形式例如片剂和胶囊。例如,用传统的片剂基质(例如乳糖、蔗糖和玉米淀粉)联合结合剂(例如阿拉伯胶、玉米淀粉或明胶)、润滑剂(例如硬脂酸或硬脂酸镁)可以将本发明所产的LC-PUFA片剂化。通过将这些赋形剂和抗氧化剂和相关LC-PUFA一起整合于凝胶胶囊内可以制备胶囊。
对于静脉内施用,可以将本发明所产的PUFA或其衍生物整合于商品化剂型中。
特殊脂肪酸的常用剂量是从0.1mg到20g,每天服用1到5次(最大到每天100g),优选地的范围是从每天约10mg到约1、2、5或10g(一次或多次剂量服用)。如本领域已知的那样,需要的最小量是约每天300mgLC-PUFA。但是,要明白任何量的LC-PUFA将有益于对象。
施用本发明的药物组合物的可能途径包括例如肠内(例如口服和直肠)、和肠外途径。例如,可以口服或直肠施用液体制剂。另外,均质混和物可以被完全地分散在水中、在无菌条件下与生理可接受的稀释剂、防腐剂、缓冲剂或推进剂混和形成喷雾剂或吸入剂。
本领域的一般人员可以确定出施用给患者的组合物的剂量,这将依赖于多种因素,例如患者的体重、患者的年龄、患者的总体健康、患者的既往史、患者的免疫状态等。
另外,本发明的组合物可以被用于美容目的。它可以被添加到预先存在的美容组合物中使得形成混和物,或者本发明所产生的LC-PUFA可以用作美容组合物中的唯一的“活性”组分。
医学、兽医、农业或水产业用途
本发明也包括用在此所述的药物和/或饲料组合物治疗各种疾病。具体地,本发明的组合物可以被用于治疗血管成形术后的再狭窄。此外,也可以用本发明的组合物(包括饲料)治疗炎症、类风湿关节炎、哮喘和牛皮癣的症状。事实也表明LC-PUFA可以涉及钙代谢,因此,本发明的组合物可以被用于治疗或预防骨质疏松症和肾脏或泌尿道结石。
另外,本发明的组合物也可以用于治疗癌症。恶性细胞已经显示出能改变脂肪酸组成。添加脂肪酸已经显示出能减缓恶性细胞的生长、引起细胞死亡并增加它们对化疗药物的敏感性。此外,本发明的组合物也可以用于治疗与癌症相关的恶液质。
本发明的组合物也可以用于治疗糖尿病,因此在糖尿病动物中已经证实具有改变了的脂肪酸代谢和组成。
此外,包括通过本发明的细胞的应用直接或间接产生的LC-PUFA的本发明的组合物也可以用于治疗湿疹以及降低血压。另外,本发明的组合物可以用于抑制血细胞聚集,诱导血管扩张,减少胆固醇水平,抑制血管壁肌肉和纤维组织的增殖,减少或预防胃肠道出血以及非甾体类抗炎药的其他副作用(美国4,666,701),预防或治疗子宫内膜异位症和经前综合征(美国4,758,592),以及治疗肌痛性脑脊髓炎和病毒感染后的慢性疲劳(美国5,116,871)。
本发明的进一步的用途包括,但不限于,用于治疗或预防心脏的心律失常、血管成形术、AIDS、多发性硬化、Crohn病、精神分裂症、胎儿乙醇综合征、注意缺陷多动症、囊性纤维化、苯丙酮尿症、单相抑郁症、进攻性敌意、脑白质肾上腺萎缩症、冠状动脉疾病、高血压、肥胖症、Alzheimer病、慢性阻塞性肺病、溃疡性结肠炎或眼部疾病,以及用于保持一般健康。
此外,上述的药物和营养组合物可以用于动物(即家养的或非家养的动物,包括哺乳动物、鸟、爬行动物、蜥蜴)以及人,因为动物具有许多与人类相同的需要和疾病。例如,本发明的油或脂肪酸可以用于动物饲养添加剂、动物饲养取代物、动物维生素或动物局部用软膏。
组合物例如本发明的饲料也可以用于农业,以便增加人或动物消费的鱼体内的LC-PUFA水平。
任何量的LC-PUFA都将有益于对象。但是,优选地是,给对象施用治疗相关疾病的“治疗有效量”。能有效治疗疾病(将从施用LC-PUFA中获益)的剂量是本领域人员已知的。例如,至少数周(更优选地更长)的至少每天300mg的LC-PUFA剂量将适用于多种情况。
抗体
本发明也提供了与本发明的至少一种多肽或其片段特异性结合的单克隆的和/或多克隆的抗体。因此,本发明还提供了用于产生针对本发明的多肽的单克隆或多克隆抗体的方法。
术语“特异性结合”指的是抗于与本发明的重组细胞(特别是重组植物细胞)内的至少一种本发明的蛋白结合,而不与细胞内的其他蛋白结合的能力。
术语“表位”在此指的是抗体所结合的本发明的蛋白的区域。可以给动物施用表位,以产生抗所述表位的抗体,但是,本发明的抗体优选地与整个蛋白中的表位区域特异性结合。
如果需要多克隆抗体,用免疫原性多肽免疫接种所选的哺乳动物(例如,小鼠、兔、山羊、马等)。用已知的方法收集并处理被免疫动物的血清。如果含有多克隆抗体的血清含有其他抗原的抗体,可以用免疫亲和色谱法纯化多克隆抗体。用于产生并加工多克隆抗血清的技术在本领域是已知的。为了可以产生这些抗体,本发明也提供了用作动物或人体的免疫原的被其他多肽半抗原化的本发明的多肽或其片段。
本领域的技术人员也能容易地产生针对本发明的多肽的单克隆抗体。用杂交瘤制备单克隆单抗的普遍方法是公知的。通过细胞融合,和通过其他技术例如用致癌性DNA直接转化B淋巴细胞、或用Epstein-Barr病毒转染也可以产生永久的产抗体的细胞株。可以筛选所产生的单克隆抗体组的各种性能,即同种型和表位亲和力。
另一种技术涉及筛选噬菌体展示文库,其中例如噬菌体在其被膜的表面上表达具有多种互补决定区(CDR)的scFv片段。该技术在本领域是公知的。
对于本发明的目的,除非有不同的说明,术语“抗体”包括全抗体的片段,其保留了全抗体与靶抗原的结合活性。这些片段包括Fv、F(ab’)和F(ab,)2以及单链抗体(scFv)。此外,抗体和其片段可以是人源化抗体,例如在EP-A-239400中所述的抗体。
本发明的抗体可以与固体支持物结合,和/或与合适的试剂、对照、说明书等一起被包装成合适容器中的试剂盒。
优选地,本发明的抗体是被可检测地标记。容许直接测定抗体的实例的可检测标记包括放射性标记、荧光团、染料、磁珠、化学发光物、胶粒等。容许间接测定结合力的标记实例包括酶,其中底物可以提供可显色的或荧光的产物。其他示例的可检测标记包括在添加合适底物后能提供可检测产物信号的共价结合的酶。用于缀合物的合适的酶的实例包括辣根过氧化物酶、碱性磷酸酶、苹果酸脱氢酶等。尽管不能商业化获得,用本领域技术人员已知的技术可以任意地产生这些抗体-酶缀合物。更多的示例的可见测标记包括生物素(其以高亲和力与抗生物素蛋白或抗生物素蛋白链菌素结合)、荧光染料(例如,藻胆蛋白、藻红蛋白和别藻蓝蛋白、萤光素和得克萨斯红,其可以用于荧光激活细胞分类器)、半抗原等。优选地,可检测标记容许在平板发光计中进行直接测定,例如生物素。在本领域已知的检测本发明蛋白的技术可以使用这些标记抗体。
实施例
实施例1:材料和方法
培养Pavlova salina
在标准培养条件下培养包括来自CSIRO Collection of LivingMicroalgae的菌株CS-49的Pavlova salina分离株(http://www.marine.csiro.au/microalgae)。亚培养来自保藏中心的原种培养物,通过连续地转移到1L锥形瓶,然后转移到10L聚碳酸盐酸瓶内,在1∶10稀释物中进行扩增,。培养基是f/2,含有半强度营养的Guillard和Ryther′s(1962)f培养基的修饰物,以及生长温度是20±1℃。其他培养温度包括光强度为100μmol.光子PAR.m-2.s-1,明∶暗光照周期为12∶12小时,以及以200mL.L-1.min-1的速度充入1%CO2空气。
用前体脂肪酸培养和喂养酵母
通过热休克将质粒引入到酵母内,在含有作为唯一碳源的2%棉子糖的酵母基本培养基(YMM)板上选择转化体。在含有作为唯一碳源的2%棉子糖的液态YMM中建立起克隆接种培养物。将其中的试验培养物接种到YMM+1%NP-40中,使得最初OD600为0.3。在30℃摇晃(60rpm)下培养培养物,直到DO600接近1.0。此时,加入终浓度为2%的半乳糖,以及加入终浓度为0.5mM的前体脂肪酸。在离心收集之前,20℃摇晃下再次孵育培养物48个小时。用1%NP-40、0.5%NP-40和水洗涤细胞沉淀物,以便从细胞的表面去除任何未结合的脂肪酸。
脂肪酸的气相色谱(GC)分析
脂肪酸制备
在装配有具有Teflon线纹的螺旋帽的玻璃试管中,通过用MeOH-CHCl3-HCl(10∶1∶1,v/v/v)在90-100℃下加热2个小时而对经离心的酵母沉淀物或拟南芥种子的转酯基作用产生甲基脂肪酸酯(FAME)。将FAME提取到己烷-二氯甲烷(4∶1,v/v)中,并用GC和GC-MS进行分析。
毛细管液相色谱法(GC)
用分别装配有HP 7673A或6980系列自动化注射器和火焰电离检测器(FID)的惠普5890GC或Agilent6890气相色谱仪分析FAME。注射器和检测器的温度分别是290℃和310℃。在50℃下,将FAME样品注射到非极性的交联甲基硅酮熔凝的毛细管柱(HP-5,50m×0.32mm i.d.;0.17μm薄膜厚度)内。在1分钟后,加热炉温度以30℃.min-1的速度上升到210℃,然后以3℃.min-1的速度达到最终温度280℃,在保持此温度5分钟。氦是载气,操纵杆的排出压力为65KPa,阀门在注射后2分钟打开。根据与标准FAME的相对滞留时间数据的比较进行峰的鉴定,利用质谱法进行确认。用进行定量的Empower软件(Waters)或Chemstation(Agilent)整合峰面积。
气相色谱-质谱法(GC-MS)
用安装有柱头注射设备的Finnigan GCQ Plus GC-MS离子收集器在4℃下进行GC-MS。利用AS2000自动加样器将样品注射到与HP-5超2键合相柱(50m×0.32mm i.d.×0.17m薄膜厚度)的滞留缺口中。保持最初温度45℃1分钟,随后以30℃.min-1的速度将温度升高到140℃,然后以3℃.min-1的速度升高到310℃,并保持12分钟。将氦气用作载气。质谱仪操作条件是:电子轰击能量为70eV;发射电流为250amp;转移线为310℃;放射源温度为240℃;扫描速度为0.8scans.s-1;以及质谱范围为40-650道尔顿。用XcalibuTM软件获得并处理质谱。
P.salina cDNA文库的构建
为了构建cDNA文库,利用下面的方法从P.salina细胞中分离出mRNA:在液氮中,用研钵和研棒将2g(湿重)P.salina细胞粉末化,并将其缓慢地撒入到被恒定搅拌的含有20ml提取缓冲液的烧杯中。往其中加入5%不可溶的聚乙烯吡咯烷酮、90mM 2-巯基乙醇、和10mM二硫苏糖醇,在被转移到CorexTM管内之前,再搅拌混和物10分钟。加入18.4ml 3M乙酸铵,并很好地混和。然后在6000xg、4℃下离心样品20分钟。将上清液转移到新的试管内,通过加入0.1体积的3M NaAc(pH值5.2)和0.5体积的冷异丙醇沉淀出核酸。在-20℃下孵育1个小时之后,将样品在悬臂旋转器中6000xg下离心30分钟。将沉淀物重悬于1ml水中,并用苯酚/氯仿提取。将水相转移到新的试管内,并在此加入0.1体积的3M NaAc(pH值5.2)和2.5体积的冷异丙醇沉淀出核酸。将沉淀物重悬于水中,确定出核酸的浓度,并用Oligotex mRNA系统(Qiagen)分离出mRNA。
利用ZAP-cDNA合成试剂盒((Stratagene-cat#200400)所提供的寡dT引物和逆转录酶SuperscriptIII(Invitrogen)合成第一条cDNA。将双链cDNA与EcoRI/XhoI接头连接,并如在附带的说明书手册(Stratagene-cat#200400)中所述的那样,用ZAP-cDNA合成试剂盒从中构建出文库。初级文库的滴度是2.5×105噬斑形成单位(pfu)/ml,扩增文库的滴度是2.5×109pfu/ml。在文库中的cDNA插入物的平均插入物大小是1.3千对碱基,文库中的重组体百分比是74%。
实施例2:微藻及其多不饱和脂肪含量
活体微藻的CSIRO保藏中心
CSIRO建立并维持了一个含有超过140种的800株的微藻的活体微藻保藏中心,其代表大多数的海洋微藻类和一些淡水微藻类(可获得的微藻株可从http://www.marine.csiro.au中下载到)。也保留了一些微小的异养藻株。
该保藏中心是澳大利亚最大的和最丰富的微藻培养物保藏中心。CLM着重于来自澳大利亚水域的分离株,超过80%的分离株是从不同的位置和气候带、从热带的澳大利亚北部到澳大利亚南极区,从海洋的、近海岸的、海岸的、港湾的、潮区的以及淡水环境中分离到的。另外,重点在于代表单一物种的不同群,通常超过一种藻株。培养物收集所中的所有藻株都是单种藻的以及大多数都是克隆性的。藻株亚型是无菌的。另一个收集所是日本保持的NIES收集所(国立环境研究所,环境署)。
已知微藻具有形态学物种水平上的共同性,只显示出了非常低的地方特性。但是,这种形态学的共同性可以隐藏物种内水平上的广泛的多样性。利用方法例如杂交繁殖、同工酶、生长率和大量分子技术广泛地研究了不同微藻的遗传学多样性。这些研究所鉴定出的多样性范围是从大区域和全球级(Chinain et al.,1997)到群体之间和群体内(Gallagher,1980;Medlin et al.,1996;Bolch et al.,1999a,b)。利用从环境中分离到的以及在实验室中培养的藻株通常仅仅能鉴定到形态学不可区分的微藻之间的种内水平上的变异。
在培养物保藏中心中具有已鉴定的和稳定的基因型是必需的。虽然在长期培养物中有记录到的特殊表征的改变或丢失的例子(Coleman,1977),但是培养一般能保证特殊藻株的遗传连续性和稳定性。深低温保存策略也能用于限制遗传偏移的可能性。
微藻及其在水产业中的用途
因为微藻的化学/营养组合物包括PUFA,微藻在水产业中被用作为各种海洋生物体的活饲料。这些微藻必须是利于被摄取并被容易消化的合适尺寸。它们必须具有快速的生长率,能形成大块培养物,并且在培养物中随着温度、光照和营养素的起伏也是稳定的,因为这些都可以出现在孵卵系统中。符合这些条件的藻株有利于并被广泛地用于水产业,其包括北半球藻株例如等鞭金藻(Isochrysis sp.)(T.ISO)CS-177、Pavlovalutheri CS-182、Chaetoceros calcitrans CS-178、牟氏角毛藻(Chaetocerosmuelleri)CS-176、中肋骨条藻(Skeletonema costatum)CS-181、假微型海链藻(Thalassiosira pseudonana)CS-173、Tetraselmis suecica CS-187和Nannochloropsis oculata CS-189。所用的澳大利亚藻株包括Pavlovapinguis CS-375、骨条藻属(Skeletonema sp.)CS-252、Nannochloropsis sp.CS-246、Rhodomonas salina CS-24和Navicula jeffreyi CS-46。对在水产业中所用的(或可能用的)超过50株微藻的生化评价发现生长到对数生长晚期的细胞通常含有30到40%蛋白、10到20%脂质和5到15%碳水化合物(Brown et al.,1997)。
包括微藻的PUFA内容物的脂质组合物
对于含有高含量的营养重要的长链多不饱和脂肪酸(LC-PUFA)(具体地是EPA(二十碳五烯酸,20:5(ω3))和DHA(二十二碳六烯酸,22:6(ω3))的微藻是相对有兴趣的,因为这些脂肪酸都是人类和水产养殖动物的健康所必需的脂肪酸。虽然可以从鱼油中获得这些PUFA,微藻是EPA和DHA的主要生产者。
保证出了大量微藻(46株)的脂质组成以及微藻脂质中的重要PUFA的比例和含量。不同藻纲的微藻株的C18-C22PUFA组成在光养藻纲间有着显著的不同(表3、图2,也见于Dunstan et.al.,1994;Volkmanet al.,1989;Mansour et al.,.1999a)。硅藻和Eustigmatophytes富含EPA,并产生少量的较少见的PUFA、ARA以及可忽略不计量的DHA。另外,硅藻产生少见的C16PUFA例如16:4(ω1)和16:3(ω4)。相反地,甲藻具有高浓度的DHA,以及中到高比例的EPA和前体C18PUFA(18:5(ω3)和18:4(ω3)SDA、十八碳四烯酸)。金藻也含有EPA和DHA,其中EPA是占优势的PUFA。隐滴虫是C18 PUFA18:3(ω3)(ALA,α-亚麻酸)和SDA、以及EPA和DHA的丰富来源。绿藻(例如Chlorophytes,如Dunaliella spp.和小球藻属(Chlorella spp.))相当地缺少C20和C22 PUFA,尽管一些物种具有少量的EPA(最多到3%),通常含有丰富的ALA和18:2(ω6),也能产生16:4(ω3)。少见的C16 PUFA(例如16:4(ω3)、16:4(ω1)、16:3(ω4))和C18 PUFA(例如18:5(ω3)和STA)的生化或营养重要性并不清楚。但是,现在感兴趣于C18 PUFA例如SDA,其现在正逐渐被认识为有益EPA和DHA的前体,不象ALA仅仅局限于被转化成EPA和DHA。
分离出了澳大利亚破囊壶菌的新株。当被检查时,这些破囊壶菌从单细胞到细胞簇、复杂网状系统和运动阶段都表现出极大的形态学多样性。破囊壶菌是一组生产高的油和LC-PUFA含量的单细胞生物体。它们最初被认为是原始真菌,尽管最近已经被分类到了破囊壶菌亚纲((Chromista,Heterokonta),这将其与其他的不等鞭毛藻(例如硅藻和褐藻)排列得更为紧密。在培养下,破囊壶菌可以比其他的微藻获得显著更高的生物量产率(>20g/L)。另外,破囊壶菌可以生长在加有有机碳源的发酵罐中,因此其代表了非常有吸引力的、可更新的以及无污染的、ω-3油的来源。
表3:所选的PUFA和LC-PUFA在微藻和其他组、以及应用领域中的分布。
缩写:γ-亚麻酸,GLA,18:3ω6∶20:5ω3,二十碳五烯酸,EPA,20:5ω3:二十二碳六烯酸,DHA,22:6ω3;花生四烯酸,ARA,20:4ω6。
表4显示了所选的澳大利亚破囊壶菌的代表性的脂肪酸谱。O株是特别吸引人的,因为它含有非常高含量的DHA(61%)。其他的PUFA每种含量都小于5%。含高DHA的破囊壶菌也常常含有高比例的22:5ω6(二十二碳五烯酸),如在A、C和H株中所看到的那样。在所采用的培养条件下,DPA仅仅是O株中的较小的组分,使得该株是特别令人感兴趣的。A株含有作为主要LC-PUFA的DHA(28%)和EPA(16%)。C株和H株不同于其他的株,其中ARA(10-13%)也作为主要的LC-PUFA。破囊壶菌中存在着大量的其他的LC-PUFA,其包括DPA(3)和22:4ω6和其他的组分。
表4:破囊壶菌株的脂肪酸组分(占总量的百分比)
可以用于分离涉及LC-PUFA合成中的基因的微藻和破囊壶菌分离株是下面的属或种:
硅藻纲(硅藻)
Attheya septentrionalis、Aulacoseira sp.、窄隙角毛藻(Chaetocerosaffinis)、Chaetoceros calcitrans、Chaetoceros calcitrans f.pumilum、Chaetoceros cf.mitra、秘鲁角毛藻(Chaetoceros cf.peruvianus)、放射角毛藻(Chaetoceros cf.radians)、双突角毛藻(Chaetoceros didymus)、Chaetoceros difficile、Chaetoceros gracilis、牟氏角毛藻(Chaetocerosmuelleri)、Chaetoceros simplex、聚生角毛藻(Chaetoceros socialis)、角毛藻属(Chaetoceros sp.)Chaetoceros cf.minus、Chaetoceros cf.tenuissimus、威氏圆筛藻(Coscinodiscus wailesii)、其他Coscinodiscus spp.、Dactyliosolenfragilissimus、Detonula pumila、布氏双尾藻(Ditylum brightwellii)、Eucampiazodiacus、Extubocellulus spinifera、环纹劳德藻(Lauderia annulata)、丹麦细柱藻(Leptocylindrus danicus)、念珠直链藻(Melosira moniliformis)、直链藻属(Melosira sp.)、小盘藻(Minidiscus trioculatus)、多形微眼藻(Minutocellus polymorphus)、Odontella aurita、Odontella mobiliensis、Odontella regia、Odontella rhombus、Odontella sp.、Papiliocellulus simplex、浮球藻属(Planktosphaerium sp.)Proboscia alata、覆瓦根管藻(Rhizosoleniaimbricate)、刚毛根管藻(Rhizosolenia setigera)、根管藻(Rhizosolenia sp.)、中肋骨条藻(Skeletonema costatum)、Skeletonema pseudocostatum、骨条藻属(Skeletonema sp.)、热带骨条藻(Skeletonema tropicum)、其他骨条藻、塔形冠盖藻(Stephanopyxis turris)、鞘藻属(Streptotheca sp.)、Streptothecatamesis、鞘藻属、条纹藻属(Striatella sp.)、精致海链藻(Thalassiosiradelicatula)、离心列海链藻(Thalassiosira eccentrica)、Thalassiosiramediterranea、Thalassiosira oceanica、厄氏海链藻(Thalassiosira oestrupii)、深奥海链藻(Thalassiosira profunda)、假微型海链藻(Thalassiosirapseudonana)、圆海链藻(Thalassiosira rotula)、Thalassiosira stellaris、其他海链藻、美丽曲壳藻(Achnanthes cf.amoena)、翼茧形藻(Amphiprora cf.alata)、Amphiprora hyalina、双眉藻(Amphora spp.)、冰河星杆藻(Asterionella glacialis)、Asterionellopsis glacialis、盒形藻属(Biddulphiasp.)、卵形藻属(Cocconeis sp.)、新月细柱藻(Cylindrotheca closterium)、Cylindrotheca fusiformis、槽藻属(Delphineis sp.)、双壁藻(Diploneis sp.)、Entomoneis sp、Fallacia carpentariae、海洋斑条藻(Grammatophoraoceanica)、Haslea ostrearia、楔形藻属(Licmophora sp.)Manguinea sp.、Navicula cf.jeffieyi、Navicula jeffreyi、其他舟形藻(Navicula spp.)、Nitzschiacf.bilobata、缢缩菱形藻(Nitzschia cf.constricta)、Nitzschia cf.cylindrus、碎片菱形藻(Nitzschia cf.frustulum)、铲状菱形藻(Nitzschia cf paleacea)、Nitzschia closterium、Nitzschia fraudulenta、碎片菱形藻(Nitzschiafrustulum)、菱形藻属(Nitzschia sp.)、三角褐指藻、柔弱斜纹藻(Pleurosigmadelicatulum)、其他斜纹藻(Pleurosigma spp.)、Pseudonitzschia australis、优美伪菱形藻(Pseudonitzschia delicates sima)、Pseudonitzschiafraudulenta、Pseudonitzschia pseudodelicatissima、Pseudonitzschia pungens、伪菱形藻属(Pseudonitzschia sp.)、Pseudostaurosira shiloi、菱形海线藻(Thalassionema nitzschioides)、或Thalassiothrix heteromorpha。
金藻纲
Chrysolepidomonas cf.marina、Hibberdia spp.、丹麦棕鞭藻(Ochromonas danica)、Pelagococcus subviridis、Phaeoplaca spp.、Synurashagnicola或其他Chrysophyte spp.。
隐藻纲
Chroomonas placoidea、Chroomonas sp.、Geminigera cryophila、Hemiselmis simplex、Hemiselmis sp.、Rhodomonas baltica、Rhodomonasmaculata、Rhodomonas salina、Rhodomonas sp.或其他Cryptomonad spp.。
甲藻纲(甲藻)
Alexandrium affine、Alexandrium catenella、Alexandrium margalefi、Alexandrium minutum、Alexandrium protogonyaulox、Alexandriumtamarense、Amphidinium carterae、Amphidinium cfbritannicum、Amphidiniumklebsii、Amphidinium sp.、Amphidinium steinii、Amylaxtricantha、Ciyptothecodinium cohnii、Ensiculifera sp.、Fragilidium spp.、Gambierdiscustoxicus、Gymnodinium catenatum、Gymnodinium galathaneum、Gymnodiniumgalatheanum、Gymnodinium nolleri、Gymnodinium sanguineum、或其他Gymnodinium spp.、Gyrodinium pulchellum、或其他Gyrodinium spp.、Heterocapsa niei、Heterocapsa rotundata、Katodinium cf.rotundatum、Kryptoperidinium foliaceum、Peridinium balticum、Prorocentrum gracile、Prorocentrum mexicanum、原甲藻(Prorocentrum micans)、Protoceratiumreticulatum、Pyrodinium bahamense、Scrippsiella cf.precaria、或其他Scrippsiella spp.、Symbiodinium microadriaticum、或Woloszynskia sp.。
裸藻纲
纤细眼虫。
绿枝藻纲(Prasinophyceae)
Pycnococcus sp.、Mantoniella sauamata、Micromonas pusilla、Nephroselmis minuta、Nephroselmis pyriformes、Nephroselmis rotunda、肾藻属(Nephroselnis spp.)、或其他Prasinophyte spp.、Pseudoscourfieldiamarina、Pycnococcus provasolii、Pyramimonas cordata、Pyramimonasgelidicola、Pyramimonas grossii、Pyramimonas oltmansii、Pyraminionaspropulsa、其他Pyramimonas spp.、Tetraselmis antarctica、Tetraselmis chuii、Tetraselmis sp、Tetraselmis suecica、或其他Tetraselmis spp.。
定鞭金藻纲(Prymnesiophyceae)
Chrysochromulina acantha、Chrysochromulina apheles、Chrysochromulina brevifilum、Chrysochromulina camella、Chrysochromulinahirta、帽形金色藻(Chrysochromulina kappa)、Chrysochromulina minor、Chrysochromulina pienaar、Chrysochromulina simplex、Chrysochromulinasp.、Chrysochromulina spinifera、Chrysochromulina strobilus、和其他Chrysophy spp.、Chrysotila lamellosa、Cricosphaera carterae、Ctystallolithus hyalinus、Diacronema vlkianuni、Dicrateria inornata、Dicrateria sp.、Emiliania huxleyi、Gephyrocapsa oceanica、Imantoniarotunda、和其他等边金藻(Isochrysis spp.)、Ochrosphaera neapolitana、Pavlova cf.pinguis、Pavlova gyrans、Pavlova lutheri、Pavlova pinguis、Pavlova salina、Pavlova sp.、Phaeocystis cf.pouchetii、Phaeocystis globosa、Phaeocystis pouchetii、其他棕囊藻属(Phaeocystis spp.)、Pleurochrysis aff.Carterae、小定鞭金藻(Prymnesium parvum)、Prynznesium patelliferum、其他Prymnesium spp.、或Pseudoisochrysis paradoxa。
Raphidophyceae纲
Chattonella antiqua、其他卡顿氏藻属(Chattonella spp.)、Fibrocapsajaponica、其他Fibrocapsa spp.、Heterosigma akashiwo、Heterosigmacarterae、或其他Heterosigma spp.。
Thraustochytridae纲
Schizochytrium spp.、Thraustochytrium aureum、Thraustochytriumroseum、或其他破囊壶菌。
作为用于EPA产生的基因来源的Eustigmatophytae纲
Eustigmatos vischeri、Monodus subterraneus、Nannochloropsis oculata、Nannochloropsis salina、Vischeria helvetica、Vischeria punctata、Chloridellaneglecta、简单小绿藻(Chloridella simplex)、整齐绿葡萄藻(Chlorobotrysregularis)、Ellipsoidon parvum、Ellipsoidon solitare、Eustigmatos magnus、Eustigmatos polyphem、纹筋角绿藻(Goniochloris sculpta)、Monodussubterraneus、Monodus unipapilla、Nannochloropsis gaditana、Nannochloropsis granulata、Nannochloropsis limnetica、Pseudocharaciopsis、ovalis、Pseudocharaciopsis texensis、Pseudostaurastrum limneticum、或Vischeria stellata。
实施例3:分离斑马鱼Δ5/6去饱和酶以及其在酵母中的功能表征
与微藻一样,一些其他的生物体也具有由前体例如α-亚麻酸(18:3,ALA)合成LC-PUFA的能力(见图1),并已经分离出了一些作用于这种合成的基因(见Sayanova和Napier,2004)。已经从各种生物体(包括藻类、真菌、苔藓、植物、线虫和哺乳动物)中分离出涉及ω-3C20+PUFA生物合成的基因。根据目前对涉及ω-3C20+PUFA合成的基因的了解,植物中EPA的合成需要转移编码至少两种去饱和酶和一种PUFA延长酶的基因。植物中从EPA合成DHA需要另外转移更多的一种去饱和酶和更多的一种延长酶(Sayanova和Napier,2004)。这些酶是:对于EPA的合成,需要Δ6去饱和酶、Δ6延长酶和Δ5去饱和酶的次序活性。根据在一些藻类中的另一可操纵的途径,通过Δ9延长酶、Δ8去饱和酶和Δ5去饱和酶的次序活性也可以合成EPA(Wallis and Browse,1999;Qi et al.,2002)。对于植物中的EPA向DHA的进一步的转化,需要进一步的转移Δ5延长酶和Δ4去饱和酶(Sayanova和Napier,2004)。
Hasting等(2001)从斑马鱼(Daniorerio)中分离到编码Δ5/Δ6双功能去饱和酶的基因,并显示出如果在酵母中表达所述酶时,该去饱和酶能催化Δ6(GLA和SDA)和Δ5(20:4和EPA)脂肪酸的合成。该去饱和酶因此能作用于ω6和ω3底物。
斑马鱼Δ5/Δ6去饱和酶的分离
根据产品说明书(Qiagen),用RNAeasy系统从新分离下的斑马鱼肝脏中提取出RNA。根据已发表的序列(Hastings et al.2001),设计出了斑马鱼Δ5/6 ORF的5’和3’端的有义引物(5′-CCCAAGCTTACTATGGGTGGCGGAGGACAGC-3′)(SEQ ID NO:39)和反义引物(5′-CCGCTGGAGTTATTTGTTGAGATACGC-3′)(SEQ IDNO:40),并将其与所提取的RNA用于一步逆转录PCR(RT-PCR,Promega),利用产家所推荐的缓冲液条件。得到了单一的1335bp大小的扩增物,并将其连接到pGEM-Teasy(Promega)内,确定出该序列与已发表的序列相同。
切割下含有完整编码区(SEQ ID NO:38)的片段,并将其连接到酵母穿梭载体pYES2(Invitrogen)内。载体pYES2带有URA3基因,该基因容许根据尿嘧啶原养型筛选酵母转化体。所插入的编码区处于诱导型GAL1启动子和pYES2的多聚腺苷酸化信号的控制之下。所形成的质粒称为pYES2-zfΔ5/6,用于被转入酵母(啤酒糖酵母)内并在其中表达。斑马鱼Δ5/Δ6去饱和酶在酵母中的表达
将基因构建体pYES2-zfΔ5/6引入到酵母株S288内。因为一些原因,酵母是用于分析异源的潜在的LC-PUFA生物合成基因(包括去饱和酶和延长酶)的好宿主。它是容易被转化的。它本身不会合成LC-PUFA,因此容易检测出任何新的PUFA,因为没有任何背景问题。此外,酵母细胞容易将生长培养基中的脂肪酸整合于细胞的脂质中,据此容许给含有编码新酶的基因的转化细胞呈递合适的前体,容许验证它们的酶活性。
生物化学分析
经pYES2-zfΔ5/6转化的酵母细胞生长在YMM培养基中,加入半乳糖进行诱导。脂肪酸18:3ω3(ALA,0.5mM)或20:4ω3(ETA,0.5mM)加入到如上所述的培养基中。在孵育48个小时之后,收集细胞并用如在实施例1中所述的毛细管气液相色谱法(GC)分析脂肪酸。分析显示18:4ω3(1.9%总脂肪酸)是由18:3ω3形成的,以及20:5ω3(0.24%脂肪酸)是由20:4ω3形成的,分别证实了Δ6去饱和酶活性和Δ5去饱和酶活性。
表5中概括了这些数据,并验证了Hastings等的结果(2001)。
实施例4:分离秀丽隐杆线虫延长酶及其在酵母中的功能表征秀丽隐杆线虫延长酶基因的克隆
Beaudin等从线虫秀丽隐杆线虫中分离出了编码ELO型脂肪酸延长酶的基因(Beaudoin et al.,2000),如下分离该基因。根据延长酶编码区的5’和3’端的序列,设计并合成具有序列5′-GCGGGTACCATGGCTCAGCATCCGCTC-3′(SEQ ID NO:41)(有义方向)和5′-GCGGGATCCTTAGTTGTTCTTCTTCTT-3′(SEQ ID NO:42)(反义方向)的寡核苷酸引物。这些引物被用于PCR反应,以便从秀丽隐杆线虫混和期基因文库中扩增出867个碱基对的编码区,退火温度为58℃和延伸时间为1分钟。进行PCR扩增30个循环。将扩增产物插入到了载体pGEMTM T-easy(Promega)内,并验证了核苷酸序列(SEQ ID NO:37)。切割下包括整个编码区的片段,并将其插入到pSEC-TRP(Stratagene)的EcoRI/BglII位点,产生了用于引入并在酵母中表达的pSEC-Ceelo。pSEC-TRP含有TRP1基因(容许用色氨酸原养型筛选酵母中的转化体),和GALL启动子(在生长培养基中含有半乳糖时,该启动子以诱导的方式控制嵌合基因的表达)。
表5酵母和拟南芥中的酶活性。
TR,痕量,未精确测定。
秀丽隐杆线虫延长酶基因在酵母中的功能表征
用在实施例1中所述的方法,用载体pYES2-zfΔ5/6和pSEC-Ceelo转化酵母株S288,用缺乏色氨酸和尿嘧啶的YMM培养基筛选双重转化体。转化体在基本培养基和富集培养基中都能很好地生长,这与单独携带pSEC-Ceelo的、不含pYES2-zfΔ5/6的S288株转化体相反,其生长得相当的差。双重转化体生长在YMM培养基中,并通过加入半乳糖进行诱导。往培养基中加入脂肪酸18:3ω3(ALA,0.5mM),在孵育48个小时之后,收集细胞,并用实施例1所述的毛细管气液相色谱法(GC)进行脂肪酸分析。分析显示出18:4ω3(0.82%总脂肪酸)和20:3ω3(0.20%)是由18:3ω3形成的,以及20:4ω3(0.02%脂肪酸)是由两种中的任一种脂肪酸形成的,证实了除了斑马鱼去饱和酶(表5)的Δ6去饱和酶活性和Δ5去饱和酶活性以外的延长酶活性的协同作用。先前还没有报道过双功能Δ5/6去饱和酶基因和延长酶基因的协同作用。具体地,如果该酶在植物细胞中显示出相同的活性,双功能酶的应用将减少需要被引入并表达的基因的数目。先前也没有报道过这一点。
实施例5:脂肪酸去饱和酶和延长酶在植物中的协同表达
用于在植物细胞中共表达斑马鱼Δ6/Δ5去饱和酶和秀丽隐杆线虫延长酶的遗传构建体
Beaudoin和同事(2000)显示,当在酵母中表达秀丽隐杆线虫Δ6延长酶蛋白时,该延长酶能延长C18Δ6去饱和的脂肪酸GLA和SDA,即其具有C18底物的Δ6延长酶活性。他们也显示蛋白对酵母中的C20底物不具有Δ5延长酶活性。我们因此检验了该延长酶是否能在拟南芥种子中延长Δ6去饱和脂肪酸GLA和SDA。拟南芥种子已经显示出含有ω-6(18:2,LA)和ω-3(18:3,ALA)脂肪酸(Singh et al,2001)。18:3的存在特别使得拟南芥种子成为极好的研究能导致合成ω-3C20+PUFA(如EPA和DHA)的基因表达的系统。
对于拟南芥中的延长酶活性的检测需要在种子中协同表达Δ6去饱和酶,以便首先合成GLA或SDA。我们选择表达与上面所述的斑马鱼去饱和酶基因结合的延长酶基因。先前没有关于在植物细胞中(单独地或共同地)表达斑马鱼Δ6/Δ5去饱和酶和秀丽隐杆线虫延长酶基因的报道。
通过独立地将基因放置于-309 napin启动子片段(称作Fp1)的控制之下,获得了斑马鱼Δ6/Δ5去饱和酶和秀丽隐杆线虫延长酶基因的种子特异性共表达(Stalberg et al.,1993)。对于植物转化,基因被插入到包括作为选择标记物的强化潮霉素耐药基因的二元载体pWvec8内(Wang et al.,1997)。为了实现这一点,插入实施例4的秀丽隐杆线虫延长酶编码区,作为二元载体pWvec8的Fp1和Nos 3’多聚腺苷酸化/终止子片段之间的钝端片段,形成了pCeloPWvec8。最初插入实施例3的斑马鱼Δ5/Δ6去饱和酶编码区,作为Fp1和Nos 3’终止子序列之间的钝端片段,并在pBluescript克隆载体(Stratagene)的HindIII和ApaI克隆位点之间装配出该表达盒。随后,将含有去饱和酶表达盒的完整载体插入到pCeloPWvec8的HindIII位点,形成了pZebdesatCeloPWvec8。通过转化到拟南芥(Columbia生态型)之前的电穿孔,将如在图3中所图解的构建体引入到土壤杆菌株AGLI内(Valvekens et al.,1988)。构建体也称为“DO”构建体,用字首“DO”表示经该构建体转化所得到的植物。
植物转化和分析
用花浸染法进行植物转化(Clough and Bent,1998)。将处理过的植物(TO植物)的种子(T1种子)铺板到潮霉素(20mg/l)选择性培养基上,筛选所转化的植物,并将其转移到土壤内,以便建立起T1植物。从初次筛选中回收一个潮霉素耐药植物,并将其建立在土壤中。重复转化试验,回收并在土壤中建立了24个经确认的T1转基因植物。预计绝大多数这些T1植物都具有杂合子的所引入的转基因。
在成熟期,收集25个转基因植物的T2种子,并分析其脂肪酸组成。如表6中所概括的那样,未转化的拟南芥(Columbia生态型)含有显著量的ω6和ω3,C18脂肪酸前体LA和ALA,但不含有任何Δ6去饱和的C18(18:3ω6或18:4ω3)、Δ6去饱和的C20PUFA或Δ3-去饱和的C20PUFA。相反地,包括斑马鱼Δ5/Δ6去饱和酶和秀丽隐杆线虫延长酶基因构建体的转化植物的种子油中的脂肪酸含有18:3ω6、18:4ω3和全系列的ω6-和ω3-C20 PUFA。这都是因为去饱和酶和延长酶对相应C18前体的次序作用。最重要的和最不可思议的是,转基因种子含有20:5ω3(EPA)(达到了种子油中的总脂肪酸的至少2.3%)和22:5ω3(DPA)(达到了种子油脂肪酸的至少0.3%)。转基因种子油中所产生的总C20脂肪酸达到了至少9.0%。所产生的总ω3脂肪酸是Δ6去饱和化的产物(即,18:3ω3(ALA)的下游产物),计算为18:4ω3(SDA)、20:4ω3(ETA)、20:5ω3(EPA)和22:5ω3(DPA)的百分比的总和),其达到了至少4.2%。这些水平代表了经Δ6去饱和化步骤由ALA转化为ω3产物的转化效率(至少为28%),其在用于转化的野生型拟南芥植物的种子油中的水平约为13-15%。其他要说明的是,种子油中的ALA产物与ALA(产物:ALA)的比值至少是1∶3.6。特别明显地是,拟南芥的种子油比其他商品化油籽农作物具有相对更少量的ALA。
在此所述的T2系包括具有纯合子和杂合子的转基因的T2系。为了区分出表达最高水平的转基因的纯合子或杂合子,从含有最高EPA水平的5个株系的T2种子建立起T2植物,利用在含有潮霉素(15mg/L)的MS培养基上的选择确定出转基因的存在。例如,使用来自称为DO11的T1植物的T2种子,其含有2.3%的EPA,并显示出3∶1的潮霉素培养基上的耐药子代对敏感子代的分离率,说明D011含有单一遗传位点上的转基因。鉴定出纯合子株系。例如,如其T3子代的均一的潮霉素耐药性所显示的那样,T2子代植物DO11-5是纯合子。其他的T2植物的潮霉素标记物是杂合子。
分析了DO11-5和DO11的其他T2子代的T3种子堆的脂肪酸谱,并在表7中显示了数据。如预期的那样,EPA含量反映出了DO构建体的分离。从T3系中所获得的种子油的脂肪酸中的EPA水平可以分出三组:可略的(无DO构建体)、1.6-2.3%范围内(DO构建体杂合子)、以及达到了至少3.1%(DO构建体纯合子)。在纯合子中获得的水平比杂合体更高,说明了基因剂量效应。DO11-5的T3种子合成了总共9.6%的新ω3和ω6PUFA,包括3.2%的EPA、1.6%ARA、0.1%的DPA、0.6%SDA和1.8%GLA(表7)。这种种子中的EPA合成水平比先前在亚麻子中所获得的0.8%水平高出4倍(Abbadi et al.,2004)。也考虑到拟南芥种子中的用于EPA合成的ALA水平小于亚麻子中所具有的ALA水平的三分之一,说明能以比在亚麻子中所表达的脂酰-PC依赖性途径明显更高的效率实施上面所述的包括能利用脂酰辅酶A底物的去饱和酶的LC-PUFA途径。
通过检查DO11-5中的由底物脂肪酸向产物脂肪酸(包括之后的衍生物)的转化百分比可以评价EPA构建体所编码的单个酶步骤的相对效率。斑马鱼Δ5/Δ6去饱和酶表现出强的Δ5去饱和作用,其中89%的20:4ω3转化成了EPA和DPA,以及45%的20:3ω6转化成了ARA,这与先前所报道的该酶优先转化ω3 PUFA,而不是转化ω6PUFA底物相一致(Hastingset al.,2001)。与之可比较的,以显著更低的水平发生Δ6去饱和作用,其中32%的ALA和14%的LA转化成了Δ6去饱和的PUFA。鉴于先前的酵母研究显示该酶确实具有比Δ5去饱和酶活性更高的Δ6去饱和酶活性,在拟南芥种子中所获得的更低的Δ6去饱和水平可以反映出在脂酰辅酶A池中有限可获得的ALA和LA底物(Singh等,待发表)。高度有效地实现Δ6延长酶的作用,其中延长了86%的GLA和67%的SDA,说明该酶可能稍微优先延长ω6-PUFA底物。
在MS培养基和土壤中评价了T2(分离的)和T3种子(纯合子群)的发芽能力。含有EPA和DPA的株系DO11和DO11-5的种子显示出与野生型种子相同的发芽时机和频率,以及T2和T3植物没有任何明显异常的形态学特征。也不影响体外或土壤中的植物生长率以及从植物中所获得的种子的质量。包括了所获得的DO11的T1种子所发芽,因此观察了三代的DO11株的种子的正常发芽。另外,也观察了其他含EPA和DPA种子的正常发芽率和时机。这个特点是重要的,并且是不可预知的,因为高等植物不能天然地产生EPA或DPA,以及它们的种子因此先前从来都不含有这些LC-PUFA。发芽要求代谢所储存的种子油,并用于生长,以及作为能量供应。所观察到的正常的发芽率显示植物种子能实施这些利用EPA和DPA的过程,并且这些化合物是无毒的。
已经报道了,从破囊壶菌分离到的基因所编码的并在芥菜(Brassicajuncea)中表达的Δ4去饱和酶能将外源供应的DPA转化成DHA(Qiu et al.,2001)。在此所述的植物种子中所产的DPA可以作为DHA生产的前体。
通过将Δ4去饱和酶基因引入到产DPA的植物细胞内可以在植物细胞中实现DPA向DHA的转化(实施例11)。
讨论
22:5ω3在拟南芥种子油中的存在说明植物细胞中的秀丽隐杆线虫延长酶基因不仅具有Δ6延长酶活性,也具有Δ5延长酶活性。鉴于这个基因在酵母中已经被证实缺乏Δ5延长酶活性,这个结果是最出乎意料的。此外,这证实仅仅两个基因可以被用于植物细胞中的ALA向DPA的合成。先前还没有报道过高等植物中的DPA合成。此外,种子中的至少28%的ALA向其ω3产物(包括EPA、DPA或两者)的转化效率是惊人的。
用Δ6去饱和作用途径在植物(例如植物细胞)中合成LC-PUFA(例如EPA和DHA)要求PUFA去饱和酶和延长酶的次序作用。在一个途径中,所需的去饱和酶具有Δ6、Δ5和Δ4去饱和活性,按此次序,所需的PUFA延长酶对Δ6和Δ5底物都具有延长活性。在藻类、苔藓、真菌、硅藻、线虫和一些淡水鱼中都进行该经典途径(Sayanova and Napier,2004)。选自藻类、真菌、苔藓和蠕虫的PUFA去饱和酶可以用于酯化于磷酸卵磷脂(PC)的sn-2位点的脂肪酸的去饱和作用,同时PUFA延长酶作用于在组织的脂酰辅酶A池中的脂酰辅酶A底物形式的脂肪酸。相反地,脊椎动物的Δ6去饱和酶已经显示出能去饱和脂酰辅酶A底物(Domergueet al.,2003a)。
要想在植物细胞和其他细胞中重建LC-PUFA途径,必须考虑到对去饱和酶和延长酶的作用位点的不同和对底物的需要。例如,PUFA延长酶是膜结合的,甚至可能是完整的膜蛋白,其利用出现于内质网(ER)的特殊池中的脂酰辅酶A。该脂酰辅酶A池生理学上不同于ER的PC组分,因此对于被次序去饱和和延长的PUFA脂肪酸,其必须在ER的PC和脂酰辅酶A池之间相互转移。因此,早先已经报道了用低等和高等植物、真菌和蠕虫的去饱和酶和延长酶在酵母中构建LC-PUFA生物合成的尝试是无效的。另外,所重建的途径已经导致仅仅合成C20PUFA例如ARA和EPA。先前还没有关于在酵母中合成C22 PUFA例如DPA和DHA的报道(Beaudoin et al.,2000,Domergue et al.,2003a)。
上面描述的策略利用了脊椎动物去饱和酶,在这个实施例中,斑马鱼的Δ5/Δ6去饱和酶和秀丽隐杆线虫的Δ6延长酶具有的优点是两种去饱和酶和延长酶对脂酰辅酶A池中的脂酰辅酶A底物都具有活性。这可能解释这个策略在合成LC-PUFA上更为有效的原因。此外,利用显示出双重Δ5/Δ6去饱和酶活性的双功能去饱和酶容许通过仅仅2个基因的作用合成EPA,而不是其他研究者所用的3个基因(Beaudoin et al.,2000;Domergue et al.,2003a)。双功能Δ5/Δ6延长酶在植物细胞中的应用也容许通过仅仅插入三个基因(一个延长酶和两个去饱和酶)或例如仅仅插入两个基因(双功能延长酶和双功能去饱和酶)来由ALA形成DPA。这些方面都是出乎意料的和不可思议的。
生物化学证据表明脂肪酸延长是由4个步骤组成,包括缩合、还原、脱水和第二次还原。至今已经鉴定出了两组缩合酶。第一组涉及合成饱和的和单饱和的脂肪酸(C18-22)。这些酶是FAE样酶,以及在LC-PUFA生物合成上没有显示出作用。所鉴定出的其他类型延长酶属于ELO族延长酶(按ELO基因家族命名),在酵母中合成神经鞘磷脂的超长链脂肪酸需要这些酶的活性。从合成LC-PUFA的生物体例如藻类、苔藓、真菌和线虫中分离出的ELO型延长酶的表观形似物已经显示出涉及LC-PUFA的延长和合成。已经显示延长相应的脂酰链只需要表达延长酶的所含组分。因此,所引入的延长酶的缩合组分能成功地从转基因宿主中募集到还原和脱水活性,以便实现成功的脂酰延长。因此,通过异源表达ELO型延长酶已经在酵母中证实了C16和C18 PUFA的成功延长。在这个方面,当在酵母中表达上面所述的秀丽隐杆线虫延长酶时,其不能延长C20PUFA(Beaudoin et al,2000)。我们证实,当在植物中表达秀丽隐杆线虫延长酶时,其能延长C20:5脂肪酸EPA,如在拟南芥种子中产生DPA所证明的那样,这时一个新的和不可思议的结果。关于秀丽隐杆线虫延长酶为什么能在植物中延长C20PUFA,而不能在酵母中延长的一种解释可能是因为其成功地干扰了植物的延长过程中的其他组分与C20底物的结合及作用。
这个实施例显示非脊椎动物生物体的ELO型延长酶能延长植物细胞中的C20 PUFA。Leonard等(2002)报道,当在酵母中表达从人类中分离到的ELO型延长酶基因时,其能将EPA延长为DPA,但是是以非选择性的方式。
实施例6:从P.salina中分离Δ8去饱和酶基因以及其在酵母中的功能表征。
除了高等植物中的不涉及LC-PUFA生物合成的Δ8神经鞘脂去饱和酶之外,微藻是唯一已经被报道含有Δ8去饱和酶的生物体。已经从纤细眼虫中分离出编码Δ8去饱和酶的基因(Wallis and Browse,1999)。可以预测在球等鞭金藻中存在着Δ8去饱和酶,因为其含有Δ9延长酶(Qi etal.,2002),Δ9延长酶的产物20:3n-3是Δ8去饱和酶的前体(见图1)。但是,微藻的脂肪酸谱不能单独地为鉴定哪些微藻含有Δ8去饱和酶基因提供有效的基础,因为多种途径都可以产生LC-PUFA。
Δ8去饱和酶基因片段的分离
通过排列Δ6去饱和酶氨基酸序列和来自下面的Genbank登录号AF465283、AF007561、AAC15586的氨基酸序列鉴定出共同氨基酸序列组块DHPGGS(SEQ ID NO:43)、WWKDKHN(SEQ ID NO:44)和QIEHHLF(SEQ ID NO:45),后面两个序列组块分别对应于AF465283的氨基酸位点204-210和394-400。DHPGSS对应于先前已经鉴定出的“细胞色素b5结构域”组块(Mitchell and Martin,1995)。WWKDKHN是先前还没有被鉴定出的或用于涉及分离去饱和酶基因的引物的共同组块。QIEHHLF组块或其变体对应于所需的含组氨酸的基序,其在去饱和酶中是保守的。其之前已经被鉴定并被用作设计产生用于去饱和酶基因分离的寡核苷酸的“第三His框”(Michaelson et al.,1998)。先前还没有用这种组块的组合分离去饱和酶基因。
根据第二个和第三个保守氨基酸组块,合成了简并引物5′-TGGTGGAARCAYAARCAYAAY-3′(SEQ ID NO:46)和5′-GCGAGGGATCCAAGGRAANARRTGRTGYTC-3′(SEQ ID NO:47)。利用DNAeasy系统(Qiagen)分离出P.salina的基因组DNA。在20μL的反应体积中进行PCR扩增,其利用20pmol每种引物、200ng P.salina基因组DNA和Hostar Taq DNA聚合酶(Qiagen)以及指定的缓冲液和核苷酸组分。循环条件为:1个循环的95℃15分钟;5个循环的95℃1分钟、38℃1分钟、72℃1分钟;之后35循环的95℃35秒、52℃30秒、72℃1分钟以及最后1个循环的72℃10分钟。产生了515个碱基对的扩增子,其被连接到pGEM-T easy(Promega)内,测序并用作筛选P.salina cDNA文库的探针。
从P.salina中分离编码Δ8去饱和酶的cDNA
用Zap-cDNA合成试剂盒(Stratagene)在λ噬菌体中构建出P.salinacDNA文库(见实施例1)。以每板~50,000个噬斑的浓度铺板文库,用Hybond N+膜取出挖取物,并用标准方法进行处理(Ausubel et al.,1988,见上)。用32P-dCTP放射性标记用PCR产生的515bp去饱和酶片段,在下面的高等严格性条件下用所述标记片段探测挖取物:摇晃下在6X SSC中65℃下过夜杂交,用2X SSC/0.1%SDS洗涤5分钟,随后用0.2XSSC/0.1%SDS洗涤两次10分钟。
筛选了15个初级文库板(150mm)与所标记的515bp片段的杂交。鉴定出40个强杂交的噬斑,将其中10个噬斑进行第二次筛选。根据产家方案(Stratagene),用ExAssist辅助噬菌体切割下与515bp探针杂交的5个次级噬斑中的质粒。用ABI Prism Big Dye Terminator试剂盒(PEApplied Biosystems)鉴定出插入物的核苷酸序列。鉴定出所重叠的核苷酸序列,说明所有5个插入物都来自同一基因。5个插入物中的其中一个显示出含有整个编码区,下面显示其来自Δ8去饱和酶基因。该序列被称为SEQ ID NO:6。
根据BLAST分析,全长氨基酸序列(SEQ ID NO:1)发现分离的cDNA编码推定的Δ6或Δ8去饱和酶。这两种类型的去饱和酶在其氨基酸水平是非常相似的,因此不可能单独地预测序列所编码的活性。P.salina去饱和酶和其他去饱和酶(BLASTX)之间的最大相同性程度是27-30%,虽然利用容许在排列中插入“缺口”的GAP程序的分析显示出P.salina去饱和酶和纤细眼虫的AAD45877的整个编码区的最大的总氨基酸相同性是45%。图4提供了与P.salina去饱和酶相似的其他序列的Pileup图。
将在EcoRI/XhoI片段中所含的该克隆的整个编码区插入到pYES2(Invitrogen)内,产生了pYES2-psΔ8,其被用于酵母中的导入和功能表征。如实施例1所述的,用pYES2-psΔ8转化酵母株S288的细胞,并在无尿嘧啶的培养基上选择转化体。将含有pYES2-psΔ8的酵母细胞生长在培养基中,然后用半乳糖诱导。在往培养基中加入18:3ω3或20:3ω3(0.5mM)以及在30℃下再培养48个小时之后,如实施例1所述的分析了细胞脂质中的脂肪酸。当往培养基中加入18:3ω3(Δ9,12,15)时,没有检测到18:4ω3(Δ6,9,12,15)。但是,当往培养基中加入20:3ω3(Δ11,14,17)时,检测到在酵母转化体的细胞脂质中存在着20:4ω3(Δ8,11,14,17)(0.12%)。结论是,转基因在酵母细胞中编码具有Δ8但不具有Δ6去饱和酶活性的多肽。
先前还没有报道对编码也不具有Δ6去饱和酶活性的Δ8脂肪酸去饱和酶的基因的分离。所分离到的唯一先前报道过的编码Δ8去饱和酶的基因(来自纤细眼虫)能催化18:3ω3和20:3ω3的去饱和化(Wallis andBrowse,1999)。此外,先前还没有报道过编码Δ8去饱和酶的基因在高等植物中的表达。
如图1所示,Δ8去饱和酶和Δ9延长酶(例如编码ELO2的基因-见下)和Δ5去饱和酶(例如斑马鱼Δ5/Δ6基因或来自P.salina或其他微藻的等价基因)的协同表达将引起在植物中合成EPA。
除了提供细胞内产生EPA的另一条途径之外,联合Δ8去饱和酶使用Δ9延长酶的粗略也可以提供一个优点,即延长(出现于脂肪酸与辅酶A的结合)先于去饱和(出现于脂肪酸与PC的集合),因此保证能得到随后Δ8和Δ5去饱和酶的去饱和化所用的PC上的新延长的C20 PUFA,这可能造成更为有效的EPA合成。也就是说,反应的次序(一个延长反应后紧跟着两个去饱和反应)将减少需要发生的底物连接变换的次数。P.salinaΔ8去饱和酶所提供的特异性的增加也是另一个优点。
实施例7:分离P.salina的ELO1和ELO2脂肪酸延长酶
根据EST或基因组测序策略已经从生物体例如线虫、真菌和苔藓中鉴定出ELO型PUFA延长酶。利用简并引物的PCR方法从球等鞭金藻中分离出了编码对18:3ω3(ALA)具有活性的Δ9延长酶的基因,所述Δ9延长酶在供应有外源性18:2ω6(LA)或18:3ω3(ALA)的酵母细胞中显示出具有活性,分别形成了C20脂肪酸20:2ω6和20:3ω3。基因IgASE1的编码区编码具有预期分子量约为30kDa的263个氨基酸的蛋白,其与其他的延长蛋白具有有限的同源性(最大为27%相同性)。
从P.salina中分离延长酶基因片段。
根据脂肪酸延长酶的多个氨基酸序列排列,鉴定出共同氨基酸组块FLHXYH(SEQ ID NO:48)和MYXYYF(SEQ ID NO:49),并合成了相应的简并引物5′-CAGGATCCTTYYTNCATNNNTAYCA-3′(SFQ ID NO:50)(有义)和5′GATCTAGARAARTARTANNNRTACAT-3′(SEQ ID NO:51)(反义)。先前还没有描述过为基序FLHXYH的引物以及其与MYXYYF引物的联合应用。在20μL反应体积的PCR扩增中使用这些引物,其利用20pmol每种引物、200ng P.salina基因组DNA和Hostar Taq DNA聚合酶(Qiagen)以及产家指定的缓冲液和核苷酸组分。反应如下循环:1个循环的95℃15分钟;5个循环的95℃1分钟、38℃1分钟、72℃1分钟;之后35循环的95℃35秒、52℃30秒、72℃1分钟;1个循环的72℃10分钟。产生了近150个碱基对的片段,其被连接到pGEM-T easy(Promega)内,用于序列分析。
在所分离到的35个克隆中,两个克隆具有与已知延长酶相似的核苷酸或氨基酸序列。它们被称作Elo1和Elo2。用P-dCTP放射性标记两种基因片段,并用于在下面的高严格性杂交条件下探测P.salina cDNA文库:摇晃下在6X SSC中65℃下过夜杂交,用2X SSC/0.1%SDS洗涤5分钟,随后用0.2X SSC/0.1%SDS洗涤两次10分钟。用Elo1或Elo2探针筛选10个初级文库板(150mm)。Elo1与每个板上的数个噬斑强杂交,而Elo2仅与所筛选的10个文库板中的3个噬斑杂交。从单个文库板中拣取出所有的Elo1杂交噬斑,并将其进行二级筛选,同时将所有3个Elo2杂交噬斑进行二级筛选。然后将每个二级噬斑用作PCR模板,所述PCR利用在pBluescript噬菌粒中的多个克隆位点的侧面的前向和反向引物,在1%TAR凝胶中电泳PCR产物。在电泳之后,将凝胶印迹到Hybond N+膜上,膜与32P标记的Elo1和Elo2探针杂交过夜。所扩增的Elo1次级噬斑中的6个和所扩增的El02次级噬斑中的严格与Elo1/2探针杂交(图5)。
根据其与Elo1和Elo2探针的杂交,在P.salina cDNA文库中鉴定出了两组延长酶样序列。用ExAssist辅助噬菌体(Stratagene)切割下与每种标记片段都强杂交的噬菌粒,并用ABI Prism Big Dye Terminator试剂盒(PE Applied Biosystems)测序。所有5个与Elo1探针杂交的插入物都显示出来自相同的基因。对与Elo2探针杂交的2个插入物的相似的DNA测序显示出它们来自相同的基因。Elo1克隆的cDNA序列是如SEQ IDNO:8提供的序列,以及编码蛋白是如SEQ ID NO:2提供的序列,其中Elo2克隆的cDNA序列是如SEQ ID NO:10提供的序列,以及所编码的蛋白如SEQ ID NO:3、SEQ ID NO:85和SEQ ID NO:86使用了三个可能的起始甲硫氨酸。
利用PILEUP软件(NCBI)对Elo1和Elo2和数据库的其他已知的PUFA延长酶进行比较,并在图6中显示了结果。
Elo1 cDNA是1234个核苷酸长度,以及具有编码302个氨基酸残基的蛋白的开放读框。根据PILEUP分析,Elo1与其他的与延长包括Δ6去饱和脂肪酸的PUFA相关的Elo型序列簇集在一起(图6)。Elo1蛋白与来自苔藓、小立碗藓(登录号AF428243)的延长酶在整个编码区上具有最高程度的相同性(33%)。Elo1蛋白也具有在所有其他Elo型延长酶中所发现的保守氨基酸基序。
Elo2 cDNA是1246个核苷酸长度,以及具有编码304个氨基酸残基的蛋白的开放读框。根据PILEUP分析,Elo2与其他的与延长PUFA相关的Elo型序列(包括那些对Δ6或Δ9PUFA具有活性的序列)簇集在一起(图6)。Elo2位于与从球等鞭金藻分离到的Δ9延长酶(AX571775)相同的亚分支中。Elo2与等鞭金藻基因在其整个编码区上显示出31%的相同性。Elo2 ORF也具有在所有其他Elo型延长酶中所发现的保守氨基酸基序。
实施例8:Δ5脂肪酸延长酶在酵母和植物细胞中的功能表征酵母
将P.salina Elo1基因的整个编码区连接到pYES2内,产生pYES2-psELO1,用于研究其在酵母中的表征。将这个遗传构建体引入到酵母株内,并通过在含有如表8中所列的外源脂肪酸的培养基中的生长测试其活性。含有pYES2-psELO1的酵母细胞能将20:5ω3转化成22:5ω3,确认了对C20底物的Δ5延长酶活性。7%的转回率说明了对该底物的高活性。相同的酵母细胞将18:4ω3(Δ6,9,12,15)转化成了20:4ω3以及将18:3ω6(Δ6,9,12)转化成了20:3ω6,说明该延长酶在酵母细胞内也具有Δ6延长酶活性,但是转化率比前者低近10倍(表8)。这说明Elo基因在酵母细胞中编码特异的或选择性的Δ5延长酶。这是第一个关于特异性Δ5延长酶的报道,即酶具有比Δ6延长酶活性更高的Δ5延长酶活性。该分子也是第一个从藻类来源中分离到的Δ5延长酶。这个酶在EPA向DPA的转化中是关键的酶(图1)。
植物
在植物中表达从巴夫藻中分离到Δ5延长酶Elo1,以验证其在植物中发挥作用的能力。首先,制备了用于组成型表达Elo1的植物表达构建体。对此,将Elo1序列放置在植物二元载体pBI121(Clontech)中的35S启动子的控制之下。利用上面所述的花浸染法将该构建体引入到拟南芥内。利用对叶子脂质的分析确定出Elo1序列所延长的脂肪酸的特异性。在另一种方法中,Elo1构建体和斑马鱼Δ5/Δ6去饱和酶/秀丽隐杆线虫延长酶构建体以及从巴夫藻中分离到的Δ4去饱和酶的共表达造成了拟南芥种子中的ALA向DHA的合成,证实了Δ5延长酶在细胞内产生DHA中的用途。在一个进一步的方法中,可以与Δ6去饱和酶和Δ5去饱和酶基因、或Δ6/Δ5双功能去饱和酶基因共表达Elo1,以便在细胞(特别是植物细胞)中由ALA产生DPA。在另一个方法中,联合生产EPA的Schewanella的PKS基因(Takeyama et al.,1997),Δ5延长酶和Δ4延长酶基因被用于在植物中合成DHA。
表8:经表达Elo1或Elo2的遗传构建体转化的酵母细胞中的脂肪酸的转化
克隆 | 脂肪酸前体(占总FA的%) | 形成的脂肪酸(占总FA的%) | 转化比率(%) |
pYES2-psELO1 | 20:5n-3/3% | 22:5n-3/0.21% | 7% |
pYES2-psELO1 | 18:4n-3/16.9% | 20:4n-3/0.15% | 0.89% |
pYES2-psELO1 | 18:3n-6/19.8% | 20:3n-6/0.14% | 0.71% |
pYES2-psELO2 | 20:5n-3/2.3% | 22:5n-3/tr | - |
pYES2-psELO2 | 18:4n-3/32.5% | 20:4n-3/0.38% | 1.2% |
pYES2-psELO2 | 18:3n-6/12.9% | 20:3n-6/0.08% | 0.62% |
pYES2-psELO2 | 18:2n-6/30.3% | 20:2n-6/0.12% | 0.40% |
pYES2-psELO2 | 18:3n-3/42.9% | 18:3n-3/0.20% | 0.47% |
tr:检测道痕量(<0.02%)。
实施例9:Δ脂肪酸延长酶在酵母和植物细胞中的功能表征
在酵母细胞中表达
将编码304个氨基酸(SEQ ID NO:3)的P.salina Elo2基因的整个编码区连接到pYES2内,产生了pYES2-psELO2,用于研究其在酵母中的表征。将这个遗传构建体引入到酵母株内,并通过在含有外源脂肪酸的培养基中的生长测试其活性。含有pYES2-psELO2的酵母细胞能将18:2ω6转化成20:2ω6(0.12%总脂肪酸),以及将18:3ω3转化成了20:3ω3(0.20%),确认了其对C18底物的Δ9延长酶活性(表8)。这些细胞也能将18:3ω6转化成20:3ω6,以及将18:4ω3转化成了20:4ω3,确认了其在酵母中对C18底物的Δ6延长酶活性。但是,因为18:3ω6和18:4ω3底物也在其Δ9位点上具有去饱和性,所以Elo2酶特异于Δ9去饱和的脂肪酸,不论它们是否具有Δ6去饱和性。细胞能将20:5ω3转化成22:5产物DPA。这个是第一个关于也具有来自非脊椎动物来源(特别是来自真菌或藻类来源)的Δ6延长酶活性的Δ9延长酶的报道。
因为编码区含有三个可能的ATG起始密码子(对应于SEQ ID NO:3的位点1、11(SEQ ID NO:85)和29(SEQ ID NO:86)上的甲硫氨酸(Met)氨基酸),所以测试了开始于氨基酸位点11或29的多肽也可以是有活性的可能性。利用对应于这些区域的核苷酸序列的5’寡核苷酸(有义)引物,进行编码区的PCR扩增,用EcoRI消化所形成的产物。将片段克隆到pYES2内,形成了pYES2-psELO2-11和pYES2-psELO2-29。两种质粒在酵母中显示出能表达活性的Δ9延长酶。也可以在Synechococcus或其他细胞例如植物细胞中表达这三种多肽来验证活性。
在植物细胞中表达
在植物中表达从巴夫藻中分离到的Δ9延长酶基因Elo2,以确认其在植物中发挥作用的能力。首先,制备了用于组成型表达Elo2的植物表达构建体。对此,将开始于SEQ ID NO:3的氨基酸位点1的Elo2编码序列放置在植物二元载体pBI121(Clontech)中的35S启动子的控制之下。利用上面所述的花浸染法将该构建体引入到拟南芥内。利用对叶子脂质的分析表明了Elo2序列所延长的脂肪酸的特异性。
Δ9延长酶和Δ8去饱和酶基因在转化细胞中共表达。
将P.salinaΔ8去饱和酶和Δ9延长酶克隆到单个二元载体内,每个都处于组成型35S启动子和nos终止子的控制之下。在这个基因构建体中,用HindIII和ClaI(钝端化的)切割下含有Δ8去饱和酶序列的pBI121,以释放出含有35S启动子和Δ8去饱和酶基因的片段,然后将其连接到经HindIII+SacI(钝端化的)切割的pXZP143/Δ9延长酶载体内,以便产生中间物pJRP013。然后用HindIII打开该中间物,并将其连接到pWvec8/Δ9延长酶二元载体(也经HindIII打开的)内,以便形成构建体pJRP014,其在左侧和右侧T-DNA边之间含有两个基因,以及合适于植物转化的潮霉素选择性标记基因。
利用标准的拟南芥介导的转化技术,用该双基因构建体转化烟草。在将构建体引入到拟南芥株AGL1内之后,用单一转化的克隆接种20mLLB培养基,并摇晃下28℃温育48个小时。离心沉淀细胞(1000g 10分钟),倒去上清液,并将沉淀重悬在20mL无菌的MS培养基中。在往新鲜切割的W38品种的烟草叶(1平方厘米)中加入该拟南芥溶液之前,重复该步骤。在轻微混和之后,将烟草叶块和拟南芥溶液在室温下放置10分钟。将叶块转移到MS板中,密封,并在24℃下温育(共培养)2天。在含有潮霉素的培养基中筛选转化细胞,并产生嫩芽。割下嫩芽,将其转移到MS根培养基盆中,进行根生长,最后转移到土壤中。分些这些植物的叶和种子脂质中的20:2ω6、20:3ω6、20:3ω3和20:4ω3脂肪酸的存在,验证了两个基因的共表达。
讨论
生物化学证实表明脂肪酸延长是由4个步骤组成:缩合、还原、脱水和第二次还原,以及用四个蛋白的复合物催化反应,其中第一种蛋白催化缩合步骤,并通常称作延长酶。至今已经鉴定出了两组缩合酶。第一种涉及合成饱和的和单饱和的脂肪酸(C18-22)。它们是FAE样酶,并且在LC-PUFA生物合成中没有起到任何作用。所鉴定出的其他型延长酶属于ELO族延长酶(按ELO基因家族命名),在酵母中合成神经鞘脂的超LC脂肪酸需要这些酶的活性。从LC-PUFA合成生物体如藻类、苔藓、真菌和线虫中分离到的ELO型延长酶的表观形似物也已经显示出涉及LC-PUFA的延长和合成。已经显示出相应脂酰链的延长仅仅需要表达延长酶的缩合组分。因此,所引入的延长酶的缩合组分能成功地从转基因宿主中募集到还原和脱水活性,以实施成功的脂酰延长。这对于P.salinaΔ9延长酶也是正确的。
实施例10:从P.salina中分离出编码Δ4去饱和酶的基因。
用往脂肪酸的碳链的Δ4位点中引入双键的Δ4去饱和酶催化非脊椎动物的生物体(例如微生物、低等植物包括藻类、苔藓、真菌以及可能低等动物)中的DHA合成的需氧途径中的终末步骤。利用不同的方法已经从裸藻、巴夫藻以及从破囊壶菌中分离出编码这种酶的基因。例如用对克隆EST的随机测序(EST方法,Meyer et al.,2003;Tonon et al.,2003)从Pavlova lutheri和纤细眼虫中分离出了Δ4去饱和酶基因,以及用利用对应于细胞色素b5 HPGG结构域以及组氨酸框III区的引物的RT-PCR从破囊壶菌ATCC21685中分离出了Δ4去饱和酶基因(Qiu et al.,2001)。所克隆到的Δ4去饱和酶基因编码前端去饱和酶,其成员的特征是存在N末端的细胞色素b5样结构域(Napier et al.,1999;Sayanova and Napier,2004)。
P.salina的Δ4去饱和酶基因的基因片段的分离
对已知苔藓和微藻的Δ4去饱和酶的比较发现一些保守基序,包括HPGG基序(SEQ ID NO:52),其中预期细胞色素b5样结构域以及三个组氨酸框基序是活性所需的基序。为了扩增P.salina去饱和酶基因(特别是Δ4去饱和酶基因),设计出了新的简并PCR引物PavD4Des-F3(5′-AGCACGACGSSARCCACGGCG-3′)(SEQ ID NO:53)和PavD4Des-R3(5′-GTGGTGCAYCABCACGTGCT-3′)(SEQ ID NO:54),其分别对应于组氨酸框I的保守氨基酸序列以及与编码组氨酸框II的氨基酸序列的核苷酸序列互补。先前还没有报道过对应于Δ4去饱和酶的组氨酸框I和组氨酸框II区的简并PCR引物的用途。
用P.salina的第一链cDNA作为模板进行利用这些引物的PCR扩增反应,循环为1个循环的95℃5分钟;35循环的94℃30秒、57℃30秒、72℃30秒;和1个循环的72℃5分钟。将PCR产物克隆到pGEM-T-easy(Promega)载体内,并利用pGEM-Teasy载体的反向引物,用ABI3730自动化测序仪确定出核苷酸序列。在所测序的14个克隆中,3个克隆显示出与Δ4去饱和酶基因同源。在一个引物末端上截断三个克隆中的两个克隆。第三个克隆1803的cDNA插入物的核苷酸序列被称作SEQ IDNO:11。
利用BLASTX软件,用SEQ ID NO:11所编码的氨基酸序列搜索NCBI蛋白序列数据库。结果表明该序列与已知的Δ4去饱和酶同源。P.salina基因片段的氨基酸序显示出分别与P.lutheri、破囊壶菌ATCC21685、Thraustochytrium aureum和纤细眼虫有着65%、49%、46%和46%的相同性。
分离全长Δ4去饱和酶基因
切割下克隆1803的插入物,并将其作为分离对应于推定的Δ4去饱和酶基因片段的全长cDNA的探针。高严格性地筛选约750,000pfu P.salinacDNA文库。在60℃下过夜进行杂交,用2xSSC/0.1%SDS 65℃下洗涤30分钟,然后用0.2x SSC/0.1%SDS 65℃下洗涤30分钟。分离出18个杂交克隆,并在相同的杂交条件下进行对6个克隆的次级筛选。从对这6个克隆的次级筛选中分离出单个噬斑。从5个单个噬斑中切割下质粒,并用ABI3730自动化测序仪和载体的反向及前向引物确定出插入物的核苷酸序列。测序结果显示4个克隆每个都含有长度为近1.7kb的Δ4去饱和酶cDNA,每个克隆都具有相同的编码序列以及每个编码序列显然都是全长序列。它们在5’和3’UTR上有着轻微的不同,尽管它们都含有相同的蛋白编码区。最长的P.salina Δ4去饱和酶cDNA的cDNA序列被称作SEQID NO:13,以及编码的蛋白被称作SEQ ID NO:4。
全长cDNA的长度为1687个核苷酸,并且具有编码447个氨基酸的编码区。Pavlova salina Δ4去饱和酶都显示出“前端去饱和酶”的经典的保守基序,包括N末端的细胞色素b5样结构域以及3个保守的富含组氨酸的基序。通过与其他Δ4去饱和酶基因比较核苷酸和氨基酸序列显示出其与P.lutheriΔ4去饱和酶(登录号AY332747)具有最高程度的同源性,其核苷酸序列在蛋白编码区上具有69.4%相同性,以及氨基酸序列具有67.2%相同性。
证实Pavlova salinaΔ4去饱和酶基因的酶活性
将包括Pavlova salinaΔ4去饱和酶cDNA编码区的DNA片段切割为EcoRI-SalI cDNA片段,并将其插入到利用EcoRI和XhoI位点的pYES2酵母表达载体内。将所形成的质粒转化到酵母细胞内。为了证实酶活性以及表达基因所能作用到的底物的范围,将转化体生长在YMM培养基中,并在存在所添加的(外源的)ω6和ω3脂肪酸时,添加半乳糖诱导基因。往培养基中单独地加入每种脂肪酸22:5ω3(DPA,1.0mM)、20:4n-3(ETA,1.0mM)、22:4ω6(DTAG,1.0mM)和20:4ω6(ARA,1.0mM)。在温育72个小时之后,收集细胞,并用如实施例1所述的毛细管气相色谱法(GC)进行脂肪酸分析。表9显示了所获得的数据。
表9:显示出Δ4去饱和酶基因的活性的酵母PUFA喂养
这显示所克隆的编码Δ4去饱和酶的基因能在Δ4位点上去饱和C22:4ω6(3.0%转化成22:5ω6)以及C22:5ω3(2.4%转化成22:6ω3)。当给酵母转化体喂养C20:3ω6或C20:4ω3时,酶没有显示出任何Δ5去饱和活性。
实施例11:P.salinaΔ4去饱和酶基因在植物细胞中的表达以及DHA的产生
为了证实Δ4去饱和酶基因在植物细胞中的活性,可以分开地表达编码区,以便容许DPA转化成DHA,或者与其他的LC-PUFA合成基因例如Δ5延长酶基因一起用于将EPA转化成DHA。为了作为分开基因进行表达,可以将Δ4去饱和酶编码区切割为BamHI-SalI片段,并将其插入到例如载体pGNAP的种子特异性启动子和多聚腺苷酸化/转录终止序列之间(Lee et al.,1998),使得其在种子特异性启动子的控制下进行表达。然后可以将表达盒插入到二元载体内,并将其引入到植物细胞内。用于转化的植物材料可以是未转化的植物或含有表达斑马鱼Δ5/Δ6双重去饱和酶基因和秀丽隐杆线虫延长酶基因(每个基因都处于种子特异性启动子的控制之下)的转化植物(实施例5)。含有后一双重基因构建体的转基因拟南芥已经在种子中成功地产生了EPA和DPA,以及与Δ4去饱和酶基因的组合将容许植物细胞中的DPA转化成DHA,如下面所证实的那样。
为了证实Δ5延长酶基因和Δ4去饱和酶基因在重组细胞(特别是植物细胞内)的共表达,以及容许产生DHA,如下将P.salina的Δ4去饱和酶和Δ5延长酶基因(实施例8)组合到二元载体内。两个编码区都被放置在种子特异性(napin)启动子和nos3’终止子的控制之下,并且二元载体构建体具有卡那霉素耐药基因,其被作为植物细胞选择的选择性标记物。从其cDNA克隆中切割下Δ5延长酶基因的编码区,作为PstI-SacII片段,并将其插入到中间质粒(pXZP143)的启动子和终止子之间,形成了质粒pXZP144。从其cDNA克隆中切割下Δ4去饱和酶基因的编码区,作为BamHI-SalI片段,并将其插入到质粒pXZP143的启动子和nos3’转录终止子之间,形成了质粒pXZP150。通过将pXZP144(包括启动子-Elo1-nos3’)的HindIII-ApaI片段插入到pXZP150的StuI和ApaI位点之间,这两个表达盒被组合到一个载体内,形成了质粒pXZP191。来自含有两个表达盒的pXZP191的HindIII-StuI片段克隆到二元载体pXZP330内(pBI121的衍生物),形成了植物表达载体pXZP355。图7图解地显示了该载体。
植物转化
通过土壤杆菌介导的花浸染转化法将pXZP355上的Δ5延长酶和Δ4去饱和酶基因引入到称为DO11的拟南芥植物(实施例5)内,所述DO11已经是斑马鱼Δ5/Δ6双功能去饱和酶和秀丽隐杆线虫Δ5/Δ6双功能延长酶基因的转基因植物。因为那些转基因都与作为选择性标记基因的潮霉素耐药基因相连接,用利用卡那霉素耐药选择的pXZP355进行次级转化,因此能区分出两组转基因。获得了5株转基因植物,称为“DW”植物。因为DO11能分开斑马鱼Δ5/Δ6双功能去饱和酶以及秀丽隐杆线虫Δ5/Δ6双功能延长酶基因,因此预期一些转化植物是这些基因的杂合子。分析了5株转化植物的种子(T2种子),并显示出在其种子油中含有最多至少0.1%的DPA以及最多至少0.5%DHA。表10显示了两株植物的数据。用质谱法(GC-MS)对在GC分析中被鉴定为EPA和DHA峰中的脂肪酸的分析证明了它们是真正的EPA和DHA(图8)。
对T2种子油的脂肪酸分析证实在DW2和DW5株中已经发生了EPA向DHA的显著转化,分别具有0.2%和0.5%DHA。对含有更高水平DHA的植物DW5中的酶效率的检查显示出其种子中所产生的17%的EPA被P.salinaΔ5延长酶延长为了DPA,以及超过80%的这种DPA被P.salinaΔ4去饱和酶转化成了DHA。因为Δ5延长酶和Δ4去饱和酶基因在T2种子中是可分离的,脂肪酸组成数据代表了所汇总的这些基因的裸、杂合子和纯合子的基因型的平均值。预计具有均匀纯合的这些基因的DW5子代株的种子中的DHA水平将更高。
表10:来自拟南芥(Columbia生态型)以及携带EPA和DHA基因构建体的衍生物的种子油的脂肪酸组成(总脂肪酸百分比)-转基因种子中的EPA、DPA和DHA的合成
a18:1Δ9和衍生的LC-MUFA的总和(=18:1Δ9+20:1Δ11+22:1Δ13)
b18:2+18:3
c所有新ω6和ω3-PUFA的总和每个DW2和DW5的50个T2种子在含潮霉素培养基中的发芽年十出DW5T1植物具有纯合的(50/50)Δ5/Δ6双功能去饱和酶和Δ5/Δ6双功能延长酶,而DW2种子按3∶1比例(耐药∶敏感)分离这些基因,因此DW2是杂合子。这与在DW5种子中比在DW2种子中观察到了更高水平的EPA相一致,并且解释了在这些基因纯合子的种子中所产生的增高水平了的DHA。这还证实了对具有纯合性状的种子的需求性。
我们也注意到了LC-PUFA合成对这些种子中的总脂肪酸谱的影响。尽管我们观察到超过8%水平的新ω6和ω3 PUFA(即Δ6去饱和作用的产物)在DW5种子中的蓄积,这些种子具有与野生型种子几乎相同的前体脂肪酸LA和ALA。虽然没有去除LA和ALA,但显著地降低了单不饱和脂肪酸C18:1Δ9及其延长衍生物(20:1Δ11和22:1Δ13)的水平。因此,这表明C18-PUFA向LC-PUFA的转化造成了18:1向LA和ALA转化的增加,以及相应的用于延长的18:1的减少。
含有Δ4去饱和酶和Δ5延长酶基因的植物表达载体pXZP355也被用于将基因引入到同源株DO11-5植物内,获得了20株转基因的T1植物。这些植物的种子中的DHA和DPA水平与在DW5种子中观察到的水平相似。在这些种子中也观察到了单不饱和脂肪酸水平的减少。
对DW5种子的总种子脂质的分镏发现它们是由89%TAG和11%极性脂质(主要由磷脂组成)组成的。此外,对DW5种子的TAG部分的脂肪酸分析显示出新合成的EPA和DHA正被整合于种子油中,以及总种子脂质的脂肪酸组成中的EPA和DHA比例主要反映了TAG部分的水平(表10)。
实施例12:其他来源的同源基因的分离
通过与源自基因(特别是源自部分或全部编码区)的标记探针的杂交,例如通过Southern印迹杂交或点印迹杂交法可以容易地检测出其他微藻或其他来源中的在此所述的去饱和酶和延长酶例如P.salina基因的同源物。可以从这些生物体的基因组或cDNA文库中,或者通过利用对应于保守区域的引物的PCR扩增分离出同源基因。相似地,用利用斑马鱼Δ5/Δ6去饱和酶的探针的相似方法可以分离出与脂酰辅酶A具有高亲和力的脊椎动物去饱和酶和/或淡水鱼双功能去饱和酶的同源物。
点印迹杂交
根据产品说明书,用DNAeasy试剂盒(Qiagen)分离出6种微藻物种的基因组DNA,并将其用于点印迹杂交分析,以便鉴定出涉及这些物种中的LC-PUFA合成的同源基因。这也容许评价这些基因与从Pavlovasalina分离到的那些基因相比较的序列趋异性。在这个分析中所检查的微藻物种是来自直链藻、Rhodomonas、Heterosigma、Nannochloropsis、Heterocapsa和Tetraselmis属。根据Hasle,G.R.& Syvertsen,E.E.1996Dinoflagellates.In:Tomas,C.R.(ed.)Marine Phytoplankton.Academic Press,San Diego,CA.pp 531-532鉴定这些物种。当体外培养时(实施例2),根据EPA、DHA或两者的存在,该分析包括这些微藻。
将从每个微藻中分离到的基因组DNA(近100g)点斑到Hybond N+膜条(Amersham)上。在空气晾干后,将每个膜条都放置于一层经0.4MNaOH饱和的3MM滤纸上20分钟,以便变性DNA,然后在2x SSC溶液中进行简单冲洗。将膜条空气晾干,DNA在紫外线下与膜交叉连接。制备经32P核苷酸标记的以及由不含大量巴夫藻衍生基因的未翻译区的编码区构成的探针,其包括Δ8、Δ5和Δ4去饱和酶以及Δ9和Δ5延长酶,并将其与每个膜条/DNA点印迹杂交。在含有50mM Tris-HCl(pH 7.5)、1M NaCl、50%甲酰胺、10x Denhardt溶液、10%硫酸葡聚糖、1%SDS、0.1%焦磷酸钠、和0.1mg/ml鲱精DNA的缓冲液中,膜条与每种探针在42℃下杂交过夜,然后在含有2x SSC、0.5%SDS的溶液中、50℃下洗涤3次,每次15分钟(在本试验中是低严格性的洗涤)或者在0.2x SSC、0.5%SDS中、65℃下洗涤3次,每次20分钟。
已经了解到在DNA印迹/杂交中所采用的洗涤条件的严格性可以揭示关于基因的序列亲缘性的有用信息。因此,当进行高严格性洗涤时能保持杂交,说明高水平的序列亲缘性(例如至少100-200个核苷酸上的80%以上的核苷酸相同性),而仅仅在低严格性洗涤过程中所保持的杂交说明两个基因之间的相对低程度的DNA保守性(例如在至少200个核苷酸上的60%以上的核苷酸相同性)。
将所杂交的点印迹暴露于BioMax X光片(Kodak),图9显示了放射自显影图。放射自显影图揭示了在这些物种中存在着与P.salina LC-PUFA基因的同源物,根据在高和低严格性条件下所看到的不同水平的杂交还揭示了同源性的范围。着表明一些被检查的微藻物种具有基本上不同于P.salina中的基因的LC-PUFA基因,而其他基因的序列更为相关。例如,根据杂交的强度,Tetraselmis sp的基因表现出与来自Pavlova salina的Δ4和Δ5去饱和酶及Δ5延长酶高度相似。相反地,在直链藻属中所鉴定到的所有LC-PUFA基因都表现出与P.salina基因更低程度的相似性。
Heterocapsa sp.的LC-PUFA延长酶基因的分离
Heterocapsa spp.例如CSIRO收集所中的Heterocapsa niei(实施例2)是甲藻,其被鉴定为LC-PUFA包括EPA和DHA的生产者。为了举例说明来自这些甲藻的LC-PUFA合成基因的分离,从1977年最初在澳大利亚NSW的Port Hacking所分离到的Heterocapsa niei株的细胞中纯化出DNA。根据产品说明,用DNAeasy试剂盒(Qiagen)分离出DNA。根据已发表的脂肪酸延长酶的多个氨基酸序列排列(Qi et al.,2002;Parker-Barnes et al.,2000),鉴定出共同氨基酸组块FLHXYH(SEQ IDNO:48)和MYXYYF(SEQ ID NO:49),并且合成了相应的编码这些序列5′-CAGGATCCTTYYTNCATNNNTAYCA-3′(SEQ ID NO:50)(有义)或与这些序列5′-GATCTAGARAARTARTANNNRTACAT-3′(SEQ ID NO:51)互补的(反义)简并引物。在20μL的反应体积中进行PCR扩增反应,其利用20pmol每种引物、200ng Heterocapsa sp.基因组DNA和Hostar TaqDNA聚合酶(Qiagen)以及产家所指定的缓冲液和核苷酸组分。如下循环反应:1个循环的95℃15分钟;5个循环的95℃1分钟、38℃1分钟、72℃1分钟;35循环的95℃35秒、52℃30秒、72℃1分钟以及1个循环的72℃10分钟。产生了近350bp的片段,并将其连接到pGEM-Teasy内,用于序列分析。
在所分离到的8个克隆中,两个相同的克隆具有与已知延长酶的区域相似的核苷酸以及所编码的氨基酸序列。它们被称作Het350Elo,以及核苷酸和氨基酸序列都被分别称作SEQ ID NO:79和SEQ ID NO:80。BLAST分析以及骨架内终止密码子的存在都说明在近似位点33和211之间存在着一个内含子。
与氨基酸序列最为匹配的是动物延长酶序列,见例如Meyer et al.(2004),说明所分离到的Heterocapsa基因序列可能涉及C18和C20脂肪酸底物的延长。
通过筛选Heterocapsa cDNA文库或者通过本领域熟知的5’和3’RACE技术可以容易地分离出延长酶的全长克隆。
直链藻属cDNA文库的构建和EST测序
利用下面的方法从直链藻属细胞中分离出用于构建cDNA文库的mRNA。在液氮中,用研钵和研棒将2g(湿重)直链藻属细胞粉末化,并将其缓慢地撒入到被恒定搅拌的含有20ml提取缓冲液的烧杯中。往其中加入5%不可溶的聚乙烯吡咯烷酮、90mM 2-巯基乙醇、和10mM二硫苏糖醇,在被转移到CorexTM管内之前,再搅拌混和物10分钟。加入18.4ml3M乙酸铵,并很好地混和。然后在6000xg、4℃下离心样品20分钟。将上清液转移到新的试管内,通过加入0.1体积的3M NaAc(pH值5.2)和0.5体积的冷异丙醇沉淀出核酸。在-20℃下温育1个小时之后,将样品在悬臂旋转器中6000xg下离心30分钟。将沉淀物重悬于1ml水中,并用苯酚/氯仿提取。将水相转移到新的试管内,并再次加入0.1体积的3M NaAc(pH值5.2)和2.5体积的冷异丙醇沉淀出核酸。将沉淀物重悬于水中,确定出核酸的浓度,并用Oligotex mRNA系统(Qiagen)分离出mRNA。
利用ZAP-cDNA合成试剂盒((Stratagene-cat#200400)所提供的寡dT连接子引物和逆转录酶SuperscriptIII(Invitrogen)合成第一条cDNA。将双链cDNA与EcoRI接头连接,并如在附带的说明书手册(Stratagene-cat#200400)中所述的那样,用ZAP-cDNA合成试剂盒从中构建出文库。获得了1.6×106噬斑形成单位(pfu)的初级文库。依据于47个随机噬斑的数据,文库中的cDNA插入物的平均插入物大小是0.9千对碱基,文库中的重组体百分比是99%。
利用ABI BigDye系统,用SK引物(5′-CGCTCTAGAACTAGTGGATC-3′)(SEQ ID NO:87)进行对8684所表达的序列标记(EST)的单个通过(pass)核苷酸测序。6570EST序列的长度超过了400个核苷酸,显示出插入物至少是这个大小。用BlastX分析鉴定出了显示出与一些脂肪酸去饱和酶以及一个PUFA延长酶同源的EST。
cDNA克隆Mm301461所编码的氨基酸序列(部分)(SEQ ID NO:88)显示出与假微型海链藻脂肪酸延长酶1(登录号AY591337)有着75%的相同性。EST克隆Mm301461的核苷酸序列称作SEQ ID NO:89。与已知延长酶的高度相同性使得Mm301461编码直链藻脂肪酸延长酶是非常可能的。可以容易地用RACE技术分离出编码延长酶的全长克隆。
实施例13:P.salina的FAE样延长酶基因片段的分离
用EST方法测序了P.salina cDNA文库的随机cDNA克隆。在最初一轮的测序中,测序了73个克隆。根据BLASTX分析,一个被称作11.B1的克隆被鉴定为编码具有与已知的β酮脂酰合酶样脂肪酸延长酶相似的序列的蛋白(部分序列)。自3’末端的11.B1的核苷酸序列称作SEQ IDNO:55。
这些植物延长酶不同于ELO型延长酶,其中已知它们涉及C16向C18脂肪酸的延长以及也涉及超长链饱和和单不饱和脂肪酸的延长。克隆11.B1代表所分离的第一种该类型的非高等植物基因。
实施例14:编码P.salina的Δ5去饱和酶的基因的分离
P.salina的Δ5去饱和酶基因的基因片段的分离
为了分离出P.salina的Δ5去饱和酶基因,设计出了去饱和酶的保守区的寡核苷酸。制备出下面所示的称为d5A和d5B的寡核苷酸,其对应于Pavlova lutheri的Δ5去饱和酶基因的短DNA序列。寡d5A:5′-TGGGTTGAGTACTCGGCCAACCACACGACCAACTGCGCGCCCTCGTGGTGGTGCGACTGGTGGATGTCTTACCTCAACTACCAGATCGAGCATCATCTGT-3′(已发表的国际专利申请WO03078639-A2的115-214位核苷酸,图4a)(SEQ ID NO:56),以及寡d5B:5′ATAGTGCAGCCCGTGCTTCTCGAAGAGCGCCTTGACGCGCGGCGCGATCGTCGGGTGGCGGAATTGCGGCATGGACGGGAACAGATGATGCTCGATCTGG-3′(对应于WO03078639-A2的195-294位核苷酸的互补序列,图4a)(SEQ ID NO:57)。在PCR反应中退火并延长这些寡核苷酸。将PCR产物插入到了pGEM-T Easy载体内,并验证了核苷酸序列。
标记所克隆的片段,并将其作为在中等严格性条件下筛选Pavlovasalina cDNA文库的杂交探针,在SSC杂交溶液中、55℃下杂交过夜,并用2xSSC/0.1%SDS在60℃洗涤印迹3次,每次10分钟。从对约500,000个噬斑的筛选中分离出60个噬斑,每个至少都给出了弱的杂交信号。在所测序的13个克隆中,一个称作p1918的克隆含有部分长度cDNA,其编码与已知Δ5去饱和酶基因同源的氨基酸序列。例如氨基酸序列与破囊壶菌Δ5去饱和酶基因(登录号AF489588)的C末端区的氨基酸残基210-430有着53%的相同性。
全长Δ5去饱和酶基因的分离
用p1918的部分长度序列设计出一对序列特异性引物,然后将其用于对上面所提及的60个分离噬斑的PCR筛选中。60个中的10个为阳性,具有相同的或相似的cDNA序列。其中一个显示出强杂交信号(用部分长度序列作为探针)的克隆被用于确定称作SEQ ID NO:58的全长序列以及所编码的称作SEQ ID NO:60的氨基酸序列(425个氨基酸长度)。
利用BLASTX软件,用氨基酸序列搜索NCBI蛋白序列数据库。结果显示该序列与已知的Δ5去饱和酶同源。P.salina蛋白的氨基酸序列显示出与WO03/078639-A2中的无明确活性的P.lutheri序列有着81%相同性,以及与破囊壶菌(登录号AF489588)的Δ5去饱和酶有着50%相同性。Pavlova salina的Δ5去饱和酶显示出“前端去饱和酶”所特有的所有的保守基序,其包括N末端的细胞色素b5样结构域和3个富含组氨酸基序。
Δ9延长酶、Δ8去饱和酶和Δ5去饱和酶基因在转化细胞中的共表达
如下在细胞中实现了Δ5去饱和酶基因以及Δ9延长酶(Elo2,实施例7)和Δ8去饱和酶基因(实施例6)的共表达。构建了植物表达载体pXZP354,其含有3个基因,每个基因都来自P.salina,每个都表达于种子特异性napin启动子。首先将cDNA克隆(上面的)的P.salinaΔ8去饱和酶编码区作为BamHI-NcoI片段插入到pXZP143的种子特异性napin启动子和Nos终止子之间,形成了质粒pXZP146。类似地将来自其cDNA克隆的P.salinaΔ9延长酶基因作为PstI-XhoI插入到pXZP143内,形成了质粒pXZP143-Elo2。也将来自其cDNA克隆的P.salinaΔ5去饱和酶基因作为PstI-BssHII片段插入到pXZP143内,形成了质粒pXZP147。然后,将含有pXZP143-Elo2的Δ9延长酶表达盒的HindIII-ApaI片段插入到pXZP146中的Δ8去饱和酶表达盒的下游,形成了质粒pXZP148。将含有pXZP147的Δ5去饱和酶表达盒的HindIII-ApaI片段插入到pXZP148中的Δ8去饱和酶以及Δ9延长酶表达盒的下游,形成了质粒pXZP149。然后,在最后一步中,将含有pXZP149的3个基因的HindIII-ApaI片段插入到二元载体pART27的衍生物内,其含有潮霉素耐药基因选择标记物,形成了植物表达质粒pXZP354。
或在同时存在或不存在含有P.salinaΔ5延长酶和Δ4去饱和酶基因的表达质粒pXZP355(实施例11)时,用土壤杆菌介导的花浸染法将质粒pXZP354引入到拟南芥中。可以获得载体的共转化,因为它们含有不同的选择性标记基因。在后一情况中,用潮霉素作为选择剂筛选转基因植物(称作“DR”植物),而在前一种情况中,用潮霉素和卡那霉素筛选植物(“DU”植物)。
获得了21株DR植物(T1植物)。对来自10株这些植物的T2种子的种子油的脂肪酸分析显示出存在着低水平的20:2ω(EDA)、20:3ω6(DGLA)和20:4ω6(ARA),最多包括0.4%ARA。对7株DU植物的T2种子的种子油的脂肪酸分析显示出相似水平的这些脂肪酸。
从这些脂肪酸的相对比例中,可以得出结论:Δ6去饱和酶和Δ8去饱和酶可以有效地在经pXZP354转化的种子中发挥作用,但是Δ9延长酶基因的活性是欠佳的。缩短N末端的编码区是有可能的,以便从SEQ IDNO:3(实施例9)的氨基酸位点11或29(见SEQ ID NO:85和86)开始翻译,这将提高Δ9延长酶基因的活性水平。由种子特异性启动子而不是napin启动子表达一种或两种基因,使得不都由napin启动子表达这些基因,预计这也将提高Δ9延长酶基因的表达水平。
实施例15:Echium plantagineum中的编码Δ6去饱和酶的基因的分离一些植物物种例如月见草(月见草)、普通琉璃苣、黑醋栗(黑醋栗)、以及一些术语紫草科的蓝蓟属种在其叶子脂质以及种子TAG种都含有ω-6和ω-3不饱和C18脂肪酸、γ亚麻酸(18:3ω6,GLA)以及十八碳四烯酸(18:4ω3,SDA)(Guil-Guerrero et al.,2000)。GLA和SDA被认为是人类健康的有益脂肪酸。合成LC-PUFA的第一个步骤是Δ6去饱和作用。用Δ6去饱和酶合成GLA,所述酶将双键引入到LA的Δ6位点。相同的酶也能将双键引入到ALA的Δ6位点,产生SDA。已经从紫草科成员如琉璃苣(Sayanova et al.,1997)和两个蓝蓟物种(Garcia-Maroto et al.,2002)中克隆出了Δ6去饱和酶基因。
Echium plantagineum是欧洲和北非的冬季一年生植物。它的植物油是不同寻常的,其中它具有独特的ω3和ω6脂肪酸的比例,以及含有大量的GLA(9.2%)和SDA(12.9%)(Guil-Guerrero et al.,2000),说明在植物的种子内存在着涉及ω3和ω6脂肪酸的去饱和化的Δ6去饱和酶活性。E.platangineum EplD6Des基因的克隆
利用校正DNA聚合酶Pfu(Stratagene),用内含有XbaI或SacI限制性位点的对应于已知Echium pitardii和Echium gentianoides(Garcia-Maroto et al.,2002)的Δ6去饱和酶的N及C末端氨基酸序列MANAIKKY(SEQ ID NO:61)和EALNTHG(SEQ ID NO:62)的简并引物进行对E.platangineum的Δ6去饱和酶序列的RT-PCR扩增。将1.35kbPCR扩增产物插入了pBluescript SK(+)的XbaI和SacI位点,产生了质粒pXZP106。确定出了插入物的核苷酸序列(SEQ ID NO:63)。它包括编码438个氨基酸残基的多肽(SEQ ID NO:64)的开放读框,其与其他已报道的E.gentianoides(SEQ ID NO:65)、E.pitardii(SEQ ID NO:66)、琉璃苣(SEQ ID NO:67和68)、Helianthus annuus(SEQ ID NO:69)和拟南芥(SEQ ID NO:70和SEQ ID NO:71)的Δ6和Δ8去饱和酶具有高度同源性(图10)。与所报道的其他Δ6和Δ8去饱和酶一样(Sayanova et al.1997;Napier et al.1999),其N末端也具有细胞色素b5结构域,所述结构域在亚铁血红素结合区含有HPGG(SEQ ID NO:72)基序。另外,E.platangineum Δ6去饱和酶含有3个保守组氨酸框,包括含有绝大多数“前端”去饱和酶中所具有的称为QXXHH(SEQ ID NO:73)基序的第三个组氨酸框(图10)(Napier et al.,1999)。包括Δ6和Δ8去饱和酶的代表性成员的群分析显示出所克隆出的基因与其他Δ6去饱和酶(特别是蓝蓟物种的那些Δ6去饱和酶)清楚的编组在一起。
E.platangineumΔ6去饱和酶基因在酵母中的异源表达
进行酵母中的表达试验,以便验证所克隆的E.platangineum基因编码Δ6去饱和酶。将基因片段作为XbaI-SacI片段插入到含有组成型ADHI启动子的酵母表达载体pSOS(Stratagene)的SmaI-SacI位点内,形成了质粒pXZP271。用热休克法将其转化到酵母株S288C内,通过在基本培养基板上的铺板筛选转化体克隆。对于酶活性的分析,将2mL酵母克隆培养物在含有0.1%NP-40的酵母基本培养基中、30℃摇晃下生长到O.D.600值为1.0。加入前体游离脂肪酸(作为25mM乙醇储存液的亚油酸或亚麻酸),使得脂肪酸的终浓度为0.5mM。将培养物转移到20℃,并在摇晃下生长2-3天。通过反复离心收集酵母细胞,首先用0.1%NP-40洗涤,然后用0.05%NP-40以及最后用水洗涤。提取脂肪酸并分析。用GC-MS确认脂肪酸的峰身份。
表达Echium EplD6Des的转基因酵母细胞能分别将LA和ALA转化成GLA和SDA。约2.9%LA被转化成了GLA,以及2.3%ALA转化成了SDA,确认了所克隆基因编码的Δ6去饱和酶活性。
E.platangineumΔ6去饱和酶基因在转基因烟草中的功能表达
为了验证EplD6Des基因能使得在转基因植物中合成Δ6不饱和脂肪酸,在烟草植物中表达基因。为此,从Pxzp106中切割下基因片段,作为XbaI-SacI片段,并将其克隆到植物表达载体pBI121(Clonetech)的XbaI和SacI位点上,处于组成型35S CaMV启动子的控制之下,产生了植物表达质粒pXZP341。将其引入到根瘤土壤杆菌AGL1内,并用于转化烟草W38植物组织,用卡那霉素进行选择。
进行对转化植物的Northern印迹杂交分析,以检测出所引入基因的表达,并如上所述的分析野生型烟草W38和转化的烟草植物的叶子脂质中的总脂肪酸。未转化植物的叶子脂质中含有可估计量的LA(21%总脂肪酸)和ALA(37%总脂肪酸)。如所预期的那样,在未转化叶子中都没有检测到GLA或SDA(Δ6去饱和作用的产物)。此外,经pBI121载体转化的转基因烟草植物与未转化的W38植物具有相似的叶子脂肪酸组成。相反地,表达EplD6Des基因的转基因烟草植物的叶显示出存在着具有对应于GLA和SDA的滞留时间的附加峰。用GC-MS确认了GLA和SDA峰的身份。值得注意的是,表达EplD6Des基因的植物的叶子脂肪酸都恒定地含有比SDA高2倍浓度的GLA,甚至当其叶子脂质中的总Δ6不饱和脂肪酸的量最大达到了30%总脂肪酸时(图11)。
表11:转基因烟草叶子的脂质中的脂肪酸组成
对多个独立的转基因烟草株的Northern分析显示出不同水平的EplD6Des转录物,其一般与植物中所合成的Δ不饱和产物的水平相关。例如,含有低水平EplD6Des转录物的转基因植物ET27-2仅仅合成占1.95%的总叶子脂质的Δ6不饱和脂肪酸。另一方面,转基因植物ET27-4含有显著更高水平的EplD6Des转录物,以及在其叶子脂质中也含有更高比例(30%)的Δ不饱和脂肪酸。
对单个烟草植物的分析显示无一例外地存在着比SDA更高浓度的GLA,尽管在未转化植物中含有比LA更高浓度的ALA。相反地,EplD6Des在酵母中的表达造成了LA向GLA以及ALA向SDA的近乎相同的转化水平。另一方面,Echium plantagineum种子含有比GLA更高水平的SDA。EplD6Des可能在Echium plantagineum种子中体内实现其对酯化成了磷脂酰胆碱(PC)的LA和ALA的去饱和作用(Jones andHarwood 1980)。在烟草叶检测中,酶最可能将酯化成了叶绿体脂质单半乳糖二酯酰甘油酯(MGDG)的LA和ALA去饱和化(Browse and Slack,1981)。在酵母检测中,添加到培养基中的脂肪酸前体LA和ALA最可能进入脂酰辅酶A池,并可用于被EplD6Des以这种形式发挥作用。E.platangineumΔ6去饱和酶基因在转基因种子中的功能表达
为了显示EchiumΔ6去饱和酶基因的种子特异性表达,如下将编码区插入到种子特异性表达盒内。将包括Δ6去饱和酶编码区的NcoI-SacI片段插入到了pXZP6(含有Nos终止子的pBluescriptSK衍生物)内,形成了质粒pXZP157。将含有编码区及终止子EplD6Des-NosT的SmaI-ApaI片段插入到了pWVec8-Fp1的Fp1启动子的下游内,形成了质粒pXZP345。用质粒pXZP345转化野生型拟南芥植物(Columbia生态型),并用潮霉素B选择转基因植物。经该基因所转化的转基因植物称作“DP”植物。
对来自经构建体转化的11株T1植物的T2种子的种子油的脂肪酸组成分析显示在所有的植物株中都存在着GLA和SDA,Δ6去饱和产物的水平达到了至少11%(表12)。这验证了对种子中的LA和ALA的有效的Δ6去饱和作用。
表12:表达Echium的Δ6去饱和酶的转基因拟南芥种子的脂肪酸组成
实施例16:对E.platangineum EplD6Des基因的诱变作用
为了是否可以将变异性引入到Δ6去饱和酶基因内并仍保留去饱和酶活性,如Zhou和Christie(1997)所述的,在存在dITP时,用利用Taq聚合酶和EPD6DesF1及EPD6DesR1引物的PCR随机诱变E.platangineum的Δ6去饱和酶cDNA。克隆PCR产物,作为pBluescript SK(+)的XbaI和SacI位点上的XbaI-SacI片段,并确定出随机选择的克隆的序列。筛选具有氨基酸变化的随机变体,并将其作为XbaI-SacI片段克隆到pBI121内,并如上所述的用于野生型基因的方法表征出这些变体转基因烟草叶中所表达的蛋白的酶活性。
图11A表示当EplD6Des序列变体在烟草植物中表达时的活性。根据其实现Δ6去饱和作用的能力可以将变体分成两大类型。用空心方块表示的突变显示出Δ6去饱和活性的显著减低,而用实心方块表示的突变对所编码的Δ6去饱和酶活性只有很少的或没有影响。图11B表示EplD6Des基因突变选择对Δ6去饱和酶活性的定量效应。EplD6Des的细胞色素b5结构域中的L14P突变以及组氨酸框II和组氨酸框III之间的S301P突变造成了其Δ6去饱和酶活性的显著减低,与W38植物中的野生型酶比较,造成了总Δ6不饱和脂肪酸量减少了3到5倍。相反地,如S205N突变所举例说明的,所检测的绝大多数变体对EplD6Des基因的Δ6去饱和活性没有影响。
实施例17:用于在细胞内产生LC-PUFA的脂酰辅酶A和脂酰PC底物依赖性去饱和酶比较
如上所述,用传统的Δ6去饱和途径在细胞内合成LC-PUFA例如EPA和DHA需要PUFA去饱和酶和延长酶的次序作用,如图12A部分所图示说明的那样。该传统途径在藻类、苔藓、真菌、硅藻、线虫以及一些淡水鱼中发挥作用(Sayanova and Napier,2004)。来自藻类、真菌、苔藓和蠕虫的PUFA去饱和酶可选择性地将酯化于磷脂酰胆碱(PC)的sn-2位点的脂肪酸,而PUFA延长酶作用于内质网(ER)中的脂酰辅酶A池中所具有的脂酰辅酶A底物形式的脂肪酸,其生理上与ER的PC组分相分离。因此,对脂肪酸底物的次序去饱和及延长反应需要脂肪酸在ER的脂酰PC和脂酰辅酶A池之间的相互转移。这需要能调节LC-PUFA底物的脂酰转移酶。这种“底物转换”需要可能造成了在早期已报道的重建LC-PUFA生物合成的尝试中所观察到了低效率(Beaudoin et al.,2000;Domergue et al.,2003a)。另一种Δ8去饱和途径(图12B部分)有着需要“底物转换”的相同的缺点。
如实施例5所示的,利用能去饱和脂酰辅酶A底物的脊椎动物去饱和酶的策略提供了植物细胞(包括种子)中的相当有效的LC-PUFA产生。在实施例5中,斑马鱼的Δ5/Δ6去饱和酶以及秀丽隐杆线虫的Δ6延长酶的组合具有的优点是去饱和酶和延长酶都对脂酰辅酶A池中的脂酰辅酶A底物具有活性。这可以解释该策略能更有效地合成LC-PUFA。为了提供使用脂酰辅酶A底物依赖性去饱和酶与脂酰PC底物依赖性去饱和酶的相当效率的比较,我们进行了下面的试验。该试验比较了EchiumΔ6去饱和酶(实施例15)和P.salinaΔ5去饱和酶(实施例14)(两种酶都使用脂酰PC底物)与斑马鱼Δ6/Δ5去饱和酶(其使用脂酰辅酶A底物)(实施例5)。
制备出构建体,其含有与秀丽隐杆线虫Δ6延长酶组合在一起的两种称为EchiumΔ6去饱和酶和P.salinaΔ5去饱和酶的脂酰PC依赖性去饱和酶。将NcoI-SacI片段上的EchiumΔ6去饱和酶插入到了pXZP143(实施例15)内,形成了pXZP192。将pCeloPWVec8的HindIII-ApaI片段(实施例5)上的秀丽隐杆线虫Δ6延长酶基因(Fp1-CeElo-NosT表达盒)插入到了pXZP147(实施例14)的StuI-ApaI位点内,形成了pXZP193。将含有基因(Fp1-PsD5Des-NosT和Fp1-CeElo-NosT)的pXZP193的HindIII-ApaI片段插入到了pXZP192的ApaI-StuI位点内,形成了含有3个表达盒的质粒pXZP194。将pXZP194的XbaI-ApaI片段插入到了pWvec8衍生物内,形成了pXZP357。
通过土壤杆菌介导的花浸染法,用质粒pXZP357转化野生型拟南芥Columbia生态型植物,在潮霉素B(20mg/L)选择之后获得了6株转基因植物。转基因的T1植物称作“DT”植物。将潮霉素耐药的转化植物转移到了土壤内,并自我受精。收集T2种子,并分析两株DT1和DT2的种子脂肪酸组成。DT1和DT2的种子脂肪酸都含有低水平的18:3ω6和18:4ω4(分别是0.9和0.8%GLA,0.3%和0.1%SDA,表13)。另外,DT1和DT2种子叶含有0.3%和0.1%20:4ω6(ARA)。但是,在T2种子株中都没有明显的ω3脂肪酸EPA的合成,这可能反映了Echium Δ6去饱和酶对ω6底物LA比对ω3底物ALA(实施例15)具有更高的去饱和活性。
表13:DT1和DT2的T2种子的种子油的脂肪酸组成,脂肪酸值是总脂肪酸百分比
该数据与上面实施例5的结果明显相反,其中斑马鱼的脂酰辅酶A依赖性去饱和酶与Δ6延长酶的组合造成产生了T2种子脂肪酸的至少1.1%ARA和2.3%的EPA。因此,这表明脂酰PC依赖性去饱和酶在驱动植物细胞中的LC-PUFA合成方面比脂酰辅酶A依赖性去饱和酶更为无效。
实施例18:LC-PUFA基因在Synechococcus中的表达
Synechococcus spp.(细菌、蓝细菌、Chroococcales、Synechococcus种例如Synechococcus elongatus,也叫做Synechocystis spp.)依次是单细胞的、光合的、海产的或淡水的细菌,蓝细菌利用采光设备中的叶绿素a。物种包括海洋环境中的重要的初级生产者。Synechococcus的一种特殊的生化特点是存在藻红蛋白,它是一种能在540nm的激发波长时被检测到的橙色荧光化合物,这可以被用于鉴定Synechococcus。海产Synechococcus组的成员在16s rRNA水平紧密相关。它们是海洋专属的,以及对Na+、Cl-、Mg2+、和Ca2+具有提高了的生长要求,但是可以容易地生长于天然的和人工的海水液体培养基以及培养板中(Waterbury etal.1988)。因为它们具有快速的异养的或自养的生长率,含有脂肪酸前体例如LA和ALA,以及相对容易转化,因此它们适用于涉及LC-PUFA合成基因、或用于在发酵型生产系统中产生LC-PUFA的功能研究。菌株例如Synechococcus sp.菌株WH8102、PCC7002(7002,海产)、或PCC7942(淡水)可以容易地生长,并且能进行生化的和遗传学的加工处理(Carr,N.G.,and N.H.Mann.1994.The oceanic cyanobacterial picoplankton,p.27-48.In D.A.Bryant(ed.),the Molecular biology of cyanobacteria.KluwerAcademic publishers,Boston)。例如,Synechococcus可以用作去饱和酶的异源表达系统(Domergue 2003b)。
野生型Synechococcus7002脂肪酸谱和生长率
为了显示蓝细菌Synechococcus 7002是一种转化脂肪酸合成基因的合适宿主,以及该表达系统能快速地检测脂肪酸合成基因的功能和特异性,首先在22℃、25℃、和30℃分析野生型菌株7002的生长,并用气相色谱法分析在22℃和30℃下生长的菌株所形成的脂肪酸谱(表14)。
表14:野生型Synechococcus 7002在22℃和30℃生长温度下的脂肪酸谱(总脂肪酸的百分比)
温度 | 肉豆蔻酸 | 棕榈酸 | 棕榈油酸 | 硬脂酸 | 油酸 | 18:1iso | 亚油酸 | GLA | 亚麻酸 |
22℃ | 0.79 | 42.5 | 10.6 | 0.92 | 8.4 | 1.5 | 7.5 | 0.54 | 27.1 |
30℃ | 0.76 | 47.1 | 10.9 | 0.67 | 17.0 | 0.34 | 20.4 | 2.9 |
在30℃比在22℃生长的更快,25℃的生长速度居中(图13)。发现细胞含有亚油酸(LA,18:2ω6)和亚麻酸(ALA,18:3ω3),其可以作为LC-PUFA合成的前体。尽管在30℃产生了一些优选的前体ALA,但是在22℃获得了更高的水平。也进行测试以确认细胞是否可以在30℃生长,随后在获得足够多生物量后将温育温度降低到22℃,以便确定这是否会造成向更高产量的亚麻酸的偏移(图14)。在这个试验中,所获得的ALA大于5%。在进一步的试验中,25℃用作菌株7002的优选温度,提供了足够的生长速度以及合适的前体脂肪酸谱。
转化策略
复制型质粒载体以及非复制型同源重组载体先前已经被用于转化各种蓝细菌物种,包括Synechococcus7002(Williams and Szalay,1983;Ikedaet al.,2002;Akiyama et al.,1998a)。重组载体在某些应用中可以是优选的,并且已经被用于灭活基因而不是产生表达株。
构建重组载体,使得其适用于将一个或多个脂肪酸合成基因引入到Synechococcus株例如7002株的染色体内。该载体在pBluescript质粒骨架中含有Synechococcus7002sul2基因,其提供了作为选择标记物的氨苄西林基因,并容许物种例如大肠杆菌中的细菌复制。遗传工程化载体,使得其含有与下游多克隆位点融合的大肠杆菌的plac启动子,以及近似插入到sul2基因中心的两个元件。Synechococcus的Sul2基因编码低亲和力的硫酸,其在正常生长条件下并非必需的。可以筛选Sul2外的任一基因(优选地非必需基因),用于整合于重组载体内。
根据近似相同的序列,用基因特异性引物在PCC6803株内扩增Synechococcus7002基因组DNA的sul2基因(Genbank登录号NC_000911,从核苷酸2902831到2904501),并将其插入到载体pGEM-T内。用引物5′-gctacgcccggggatcctcgaggctggcgcaacgcaattaatgtga-3′(SEQ IDNO:81)(有义)和5′-cacaggaaacagcttgacatcgattaccggcaattgtacggcggccgctacggatatcctcgctcgagctcgcccggggtagct-3′(SEQ ID NO:82)(反义)扩增pBluescript的plac启动子,这也往启动子序列末端引入多个限制性位点。然后用SmaI消化所扩增的片段,并将其与包括β内酰胺酶基因的pBluescript的大PvuII片段连接。然后用EcoRV和SacI消化该中间载体,并将其与sul2基因的HpaI到SacI片段(称作sul2b)连接。用BamHI消化处理所形成的质粒,用DNA聚合酶I(Klenow片段)处理以填充末端,并与sul2基因的SmaI到HpaI片段(称作sul2a)连接。然后通过用SacI和SpeI消化从该载体中去除过多的限制性位点,用T4DNA聚合酶钝化末端,以及再连接。最后,通过用ClaI和NotI消化载体以及与pBluescript的ClaI到NotI片段连接,将多克隆位点引入到plac启动子的下游,产生了重组载体,称作pJRP3.2。
用PCR方法改造各种与LC-PUFA合成相关的基因,使得其包括侧面的限制性位点以及适用于在原核细胞(Synechococcus)中表达的核糖体结合位点(RBS)序列。例如,用引物5′-AGCACATCGATGAAGGAGATATACCCatggctaatgcaatcaagaa-3′(SEQ IDNO:83)(有义)和5′-ACGATGCGGCCGCTCAACCATGAGTATTAAGAGCTT-3′(SEQ IDNO:84)(反义)扩增Echium plantagineum的Δ6去饱和酶(实施例15)。
用ClaI和NotI消化所扩增的产物,并将其克隆到pJRP3.2的ClaI到NotI位点内。将pbsA启动子(pbsA-CAT)下游的包括氯霉素乙酰转移酶编码区(CAT)(catB3基因,登录号AAC53634)的选择标记物基因插入到pJRP3.2的XhoI位点内,产生了载体pJRP3.3。将选择标记物基因插入到了sulB基因内,使得在将重组载体引入到Synechococcus内后可以便利地筛选同源重组事件。
如下在对数生长期、在发生DNA摄取期间,通过混和载体DNA和细胞实现了对Synechococcus7002的转化。将重悬于100μL 10mMTris-HCl中的近1g重组载体DNA加入到900μL生长于BG-11肉汤中的对数中期细胞内。在30℃下温育细胞90分钟,然后往2mL BG-11肉汤内加入光密度为20μmol光量子.m-2.s-1的250μL部分,将其与2mL熔化琼脂(1.5%)混和,并将其倾倒到含有用于选择重组细胞的50μg/mL氯霉素(Cm)的BG-11琼脂糖培养板上。在可以清楚地看到Cm耐药性克隆之前,将培养板在相同的温度/光照条件下温育10到14天。然后将这些克隆重新涂划到新鲜的BG-11/Cm50板上数次。在选择培养板上重新涂划数轮后,将液体培养基与单个克隆一起温育,将培养物温育在25℃。
含有经重组载体插入到sulB基因内的以及受plac启动子控制表达的Echium/Δ6去饱和酶基因的Synechococcus7002细胞显示出能分别从作为底物的内源性亚油酸(LA)和亚麻酸(ALA)产生GLA(18:3,Δ6,9,12)和SDA(18:4,Δ6,9,12,15)。
附加型载体也可以用于Synechococcus,而不是上面所述的一体化/重组载体。Synechococcus物种具有已经被应用于转化的天然质粒,例如pAQ-EX1,其中天然质粒pAQ1(登录号NC_005025)的片段与大肠杆菌质粒融合,形成了具有大肠杆菌和Synechococcus复制起点的穿梭载体(Ikeda et al.,2002;Akiyama et al.,1998b)。
本领域技术人员明白,只要不脱离广泛描述的本发明的精神或范围,可以对如在特异实施方式中所示的本发明进行各种变异和/或修饰。因此,在所有部分中,本实施方式都被认为是举例说明的,而不是限制性的。
在此通过引用将上面所讨论的所有文献并入本申请。
已经包含在本发明说明书中的对文件、技术、材料、装置、物品等的任何讨论都被独自地用于为本发明提供背景的目的。这不能被认为是承认,由于其存在于本申请的每个权利要求的优先权日期之前,这些内容中的任一或全部便构成了现有技术基础的一部分或者是与本发明相关领域的常用一般知识。
参考文献
Abbadi,A.et al.,(2001)Eur.J.Lipid.Sci.Technol.103:106-113.
Abbadi,A.,et al.(2004)Plant Cell 16:2734-2748.
Abbott et al.,(1998)Science 282:2012-2018.
Agaba,M.et al.,(2004)Marine Biotechnol(NY)6:251-261.
Akiyama,H.et al.(1998a)DNA Res.5:327-334.
Akiyama,H.et al.(1998b)DNA Res.5:127-129.
Baumlein,H.et al.,(1991)Mol.Gen.Genet.225:459-467.
Baumlein,H.et al.,(1992)Plant J.2:233-239.
Beaudoin,F.et al.,(2000)Proc.Natl.Acad.Sci U.S.A.97:6421-6426.
Berberich,T.et al.,(1998)Plant Mol.Biol.36:297-306.
Bolch,C.J.et al.,(1999a)J.Phycology 35:339-355.
Bolch,C.J.et al.,(1999b)J.Phycology 35:356-367.
Broun,P.et al.,(1998)Plant J.13:201-210.
Brown,M.R.et al.,(1997)Aquaculture 151:315-331.
Browse,J.A.and Slack,C.R.(1981)FEBS Letters 131:111-114.
Chinain,M.et al.,(1997)J.Phycology 33:36-43.
Cho,H.P.et al.,(1999a)J.Biol.Chem.274:471-477.
Cho,H.P.et al.,(1999b)J.Biol Chem 274:37335-37339.
Clough,S.J.and Bent,A.F.(1998)Plant J.16:735-43.
Coleman,A.W.(1977)Am.J.Bot.64:361-368.
Domergue,F.et al.,(2002)Eur.J.Biochem.269:4105-4113.
Domergue,F.et al.,(2003a)J.Biol.Chem.278:35115-35126.
Domergue,F.et al.,(2003b)Plant Physiol.131:1648-1660.
Drexler,H.et al.,(2003)J.Plant Physiol.160:779-802.
Dunstan,G.A.et al.,(1994)Phytochemistry 35:155-161.
Gallagher,J.C.(1980)J.Phycology 16:464-474.
Garcia-Maroto,F.et al.,(2002)Lipids 37:417-426.
Girke,T.et al.,(1998)Plant J.15:39-48.
Guil-Guerrero,J.L.et al.,(2000).Phytochemistry 53:451-456.
Haseloff,J.and Gerlach,W.L.(1988)Nature 334:585-591.
Hastings,N.et al.,(2001)Proc.Natl.Acad.Sci.U.S.A.98:14304-14309.
Hong,H.et al.,(2002)Lipids 37:863-868.
Hong,H.et al.,(2002a)Lipids 37:863-868.
Horiguchi,G.et al.,(1998)Plant Cell Physiol.39:540-544.
Huang,Y.S.et al.,(1999)Lipids 34:649-659.
Ikeda,K.et al.(2002)World J.Microbiol.Biotech.18:55-56.
Inagaki,K.et al.,(2002)Biosci Biotechnol Biochem 66:613-621.
Jones,A.V.and Harwood,J.L(1980)Biochem J.190:851-854.
Kajikawa,M.et al.,(2004)Plant Mol Biol 54:335-52.
Knutzon,D.S.et al.,(1998)J.Biol Chem.273:29360-6.
Lee,M.et al.,(1998)Science 280:915-918.
Leonard,A.E.et al.,(2000)Biochem.J.347:719-724.
Leonard,A.E.et al.,(2000b)Biochem.J.350:765-770.
Leonard,A.E.et al.,(2002)Lipids 37:733-740.
Lo,J.et al.,(2003)Genome Res.13:455-466.
Mansour,M.P.et al.,(1999a)J.Phycol.35:710-720.
Medlin,L.K.et al.,(1996)J.Marine Systems 9:13-31.
Metz,J.G.et al.,(2001)Science 293:290-293.
Meyer,A.et al.,(2003)Biochemistry 42:9779-9788.
Meyer,A.et al.,(2004)Lipid Res 45:1899-1909.
Michaelson,L.V.et al.,(1998a)J.Biol.Chem.273:19055-19059.
Michaelson,L.V.et al.,(1998b)FEBS Lett.439:215-218.
Mitchell,A.G.and Martin,C.E.(1995)J.Biol.Chem.270:29766-29772.
Morita,N.et al.,(2000)Biochem.Soc.Trans.28:872-879.
Napier,J.A.et al.,(1998)Biochem J.330:611-614.
Napier,J.A.et al.,(1999)Trends in Plant Sci 4:2-4.
Napier,J.A.et al.,(1999)Curr.Op.Plant Biol.2:123-127.
Needleman,S.B.and Wunsch,C.D.(1970)J.Mol.Biol.48:443-453.
Parker-Bames,J.F.et al.,(2000)Proc Natl Acad Sci USA 97:8284-8289.
Pereira,S.L.et al.,(2004)Biochem.J.378:665-671.
Perriman,R.et al.,(1992)Gene 113:157-163.
Qi,B.et al.,(2002)FEBS Lett.510:159-165.
Qiu,X.et al.,(2001)J.Biol.Chem.276:31561-31566.
Reddy,A.S.et al.,(1993)Plant Mol.Biol.22:293-300.
Saito,T.et al.,(2000)Eur.J.Biochem.267:1813-1818.
Sakuradani,E.et al.,(1999)Gene 238:445-453.
Sayanova,O.V.et al.,(1997)Proc.Natl.Acad.Sci.U.S.A.94:4211-4216.
Sayanova,O.V.et al.,(1999)Plant Physiol.121:641-646.
Sayanova,O.V.et al.,(2003)FEBS Lett.542:100-104.
Sayanova,O.V.and Napier,J.A.(2004)Phytochemistry 65:147-158.
Shippy,R.et al.,(1999)Mol.Biotech.12:117-129.
Simopoulos,A.P.(2000)Poultry Science 79:961-970.
Singh,S.et al.,(2001)Planta 212:872-879.
Smith,N.A.et al.,(2000)Nature 407:319-320.
Sperling,P.et al.,(2000)Eur.J.Biochem.267:3801-3811.
Sperling,P.and Heinz,E.(2001)Eur.J.Lipid Sci.Technol 103:158-180.
Sprecher,H.et al.,(1995)J.Lipid Res.36:2471-2477.
Spychalla,P.J.et al.,(1997)Proc.Natl.Acad.Sci.U.S.A.94:1142-1147.
Stalberg,K.et al.,(1993)Plant.Mol.Biol.23:671-683.
Takeyama,H.et al.,(1997)Microbiology 143:2725-2731.
Tanaka,M.et al.,(1999)Biotechnol.Lett.21:939-945.
Tonon,T.et al.,(2003)FEBS Lett.553:440-444.
Trautwein,E.A.(2001)Eur.J.Lipid Sci.Technol.103:45-55.
Tvrdik,P.(2000)J.Cell Biol.149:707-718.
Valvekens,D.et al.,(1988)Proc.Natl.Acad.Sci.USA.85:5536-5540.
Volkman,J.K.et al.,(1989)J.Exp.Mar.Biol.Ecol.128:219-240.
Wallis,J.G.and Browse,J.(1999)Arch.Biochem.Biophys.365:307-316.
Wang,M.B.et al.,(1997)J.Gen.Breed.51:325-334.
Waterbury,J.B.et al.(1988)Methods Enzymol.167:100-105.
Waterhouse,P.M.et al.,(1998)Proc.Natl.Acad.Sci.USA 95:13959-13964.
Watts,J.L.and Browse,J.(1999b)Arch Biochem Biophys 362:175-182.
Williams,J.G.and Szalay,A.A.(1983)Gene 24:37-51.
Whitney,H.M.et al.,(2003).Planta 217:983-992.
Yazawa,K.(1996)Lipids 31:S297-S300.
Yu,R.et al.,(2000)Lipids 35:1061-1064.
Zank,T.K.et al.,(2000)Plant J.31:255-268.
Zank,TK.et al.,(2002)Plant J.31:255-268.
Zhang,Q.et al.,(2004)FEBS Lett.556:81-85.
Zhou,X.R.and Christie,P.J.(1997)J Bacteriol 179:5835-5842.
序列表
<110>联邦科学技术研究组织
<120>用重组细胞合成长链多不饱和脂肪酸
<130>503364
<160>89
<170>PatentIn version 3.3
<210>1
<211>427
<212>PRT
<213>Pavlova salina
<400>1
Met Gly Arg Gly Gly Asp Ser Ser Gly Gln Ala His Pro Ala Ala Glu
1 5 10 15
Leu Ala Val Pro Ser Asp Arg Ala Glu Val Ser Asn Ala Asp Ser Lys
20 25 30
Ala Leu His Ile Val Leu Tyr Gly Lys Arg Val Asp Val Thr Lys Phe
35 40 45
Gln Arg Thr His Pro Gly Gly Ser Lys Val Phe Arg Ile Phe Gln Asp
50 55 60
Arg Asp Ala Thr Glu Gln Phe Glu Ser Tyr His Ser Lys Arg Ala Ile
65 70 75 80
Lys Met Met Glu Gly Met Leu Lys Lys Ser Glu Asp Ala Pro Ala Asp
85 90 95
Thr Pro Leu Pro Ser Gln Ser Pro Met Gly Lys Asp Phe Lys Ala Met
100 105 110
Ile Glu Arg His Val Ala Ala Gly Tyr Tyr Asp Pro Cys Pro Leu Asp
115 120 125
Glu Leu Phe Lys Leu Ser Leu Val Leu Leu Pro Thr Phe Ala Gly Met
130 135 140
Tyr Met Leu Lys Ala Gly Val Gly Ser Pro Leu Cys Gly Ala Leu Met
145 150 155 160
Val Ser Phe Gly Trp Tyr Leu Asp Gly Trp Leu Ala His Asp Tyr Leu
165 170 175
His His Ser Val Phe Lys Gly Ser Val Ala Arg Thr Val Gly Trp Asn
180 185 190
Asn Ala Ala Gly Tyr Phe Leu Gly Phe Val Gln Gly Tyr Ala Val Glu
195 200 205
Trp Trp Arg Ala Arg His Asn Thr His His Val Cys Thr Asn Glu Asp
210 215 220
Gly Ser Asp Pro Asp Ile Lys Thr Ala Pro Leu Leu Ile Tyr Val Arg
225 230 235 240
Asn Lys Pro Ser Ile Ala Lys Arg Leu Asn Ala Phe Gln Arg Tyr Gln
245 250 255
Gln Tyr Tyr Tyr Val Pro Val Met Ala Ile Leu Asp Leu Tyr Trp Arg
260 265 270
Leu Glu Ser Ile Ala Tyr Val Ala Met Arg Leu Pro Lys Met Leu Pro
275 280 285
Gln Ala Leu Ala Leu Val Ala His Tyr Ala Ile Val Ala Trp Val Phe
290 295 300
Ala Gly Asn Tyr His Leu Leu Pro Leu Val Thr Val Leu Arg Gly Phe
305 310 315 320
Gly Thr Gly Ile Thr Val Phe Ala Thr His Tyr Gly Glu Asp Ile Leu
325 330 335
Asp Ala Asp Gln Val Arg His Met Thr Leu Val Glu Gln Thr Ala Leu
340 345 350
Thr Ser Arg Asn Ile Ser Gly Gly Trp Leu Val Asn Val Leu Thr Gly
355 360 365
Phe Ile Ser Leu Gln Thr Glu His His Leu Phe Pro Met Met Pro Thr
370 375 380
Gly Asn Leu Met Thr Ile Gln Pro Glu Val Arg Ala Phe Phe Lys Lys
385 390 395 400
His Gly Leu Glu Tyr Arg Glu Gly Asn Leu Ile Glu Cys Val Arg Gln
405 410 415
Asn Ile Arg Ala Leu Ala Phe Glu His Leu Leu
420 425
<210>2
<211>302
<212>PRT
<213>Pavlova salina
<400>2
Met Lys Ala Ala Ala Gly Lys Val Gln Gln Glu Ala Glu Arg Leu Thr
1 5 10 15
Ala Gly Leu Trp Leu Pro Met Met Leu Ala Ala Gly Tyr Leu Leu Val
20 25 30
Leu Ser Ala Asn Arg Ala Ser Phe Tyr Glu Asn Ile Asn Asn Glu Lys
35 40 45
Gly Ala Tyr Ser Thr Ser Trp Phe Ser Leu Pro Cys Val Met Thr Ala
50 55 60
Val Tyr Leu Gly Gly Val Phe Gly Leu Thr Lys Tyr Phe Glu Gly Arg
65 70 75 80
Lys Pro Met Gln Gly Leu Lys Asp Tyr Met Phe Thr Tyr Asn Leu Tyr
85 90 95
Gln Val Ile Ile Asn Val Trp Cys Ile Ala Ala Phe Val Val Glu Val
100 105 110
Arg Arg Ala Gly Met Ser Ala Val Gly Asn Lys Val Asp Leu Gly Pro
115 120 125
Asn Ser Phe Arg Leu Gly Phe Val Thr Trp Val His Tyr Asn Asn Lys
130 135 140
Tyr Val Glu Leu Leu Asp Thr Leu Trp Met Val Leu Arg Lys Lys Thr
145 150 155 160
Gln Gln Val Ser Phe Leu His Val Tyr His His Val Leu Leu Ile Trp
165 170 175
Ala Trp Phe Cys Val Val Lys Phe Cys Asn Gly Gly Asp Ala Tyr Phe
180 185 190
Gly Gly Met Leu Asn Ser Ile Ile His Val Met Met Tyr Ser Tyr Tyr
195 200 205
Thr Met Ala Leu Leu Gly Trp Ser Cys Pro Trp Lys Arg Tyr Leu Thr
210 215 220
Gln Ala Gln Leu Val Gln Phe Cys Ile Cys Leu Ala His Ala Thr Trp
225 230 235 240
Ala Ala Ala Thr Gly Val Tyr Pro Phe His Ile Cys Leu Val Glu Ile
245 250 255
Trp Val Met Val Ser Met Leu Tyr Leu Phe Thr Lys Phe Tyr Asn Ser
260 265 270
Ala Tyr Lys Gly Ala Ala Lys Gly Ala Ala Ala Ser Ser Asn Gly Ala
275 280 285
Ala Ala Pro Ser Gly Ala Lys Pro Lys Ser Ile Lys Ala Asn
290 295 300
<210>3
<211>304
<212>PRT
<213>Pavlova salina
<400>3
Met Gly Pro Leu Ser Thr Leu Leu Ala Trp Met Pro Thr Trp Gly Glu
1 5 10 15
Phe Val Ala Gly Leu Thr Tyr Val Glu Arg Gln Gln Met Ser Glu Glu
20 25 30
Leu Val Arg Ala Asn Lys Leu Pro Leu Ser Leu Ile Pro Glu Val Asp
35 40 45
Phe Phe Thr Ile Ala Ser Val Tyr Val Gly Asp His Trp Arg Ile Pro
50 55 60
Phe Thr Ala Ile Ser Ala Tyr Leu Val Leu Ile Thr Leu Gly Pro Gln
65 70 75 80
Leu Met Ala Arg Arg Pro Pro Leu Pro Ile Asn Thr Leu Ala Cys Leu
85 90 95
Trp Asn Phe Ala Leu Ser Leu Phe Ser Phe Val Gly Met Ile Val Thr
100 105 110
Trp Thr Thr Ile Gly Glu Arg Leu Trp Lys Asn Gly Ile Glu Asp Thr
115 120 125
Val Cys Gly His Pro Ile Phe Met Gly Tyr Gly Trp Iie Gly Tyr Val
130 135 140
Met Leu Ala Phe Ile Trp Ser Lys Leu Phe Glu Leu Ile Asp Thr Val
145 150 155 160
Phe Leu Val Ala Lys Lys Ala Asp Val Ile Phe Leu His Trp Tyr His
165 170 175
His Val Thr Val Leu Leu Tyr Cys Trp His Ser Tyr Ala Val Arg Ile
180 185 190
Pro Ser Gly Ile Trp Phe Ala Ala Met Asn Tyr Phe Val His Ala Ile
195 200 205
Met Tyr Ala Tyr Phe Gly Met Thr Gln Ile Gly Pro Arg Gln Arg Lys
210 215 220
Leu Val Arg Pro Tyr Ala Arg Leu Ile Thr Thr Phe Gln Leu Ser Gln
225 230 235 240
Met Gly Val Gly Leu Ala Val Asn Gly Leu Ile Ile Arg Tyr Pro Ser
245 250 255
Ile Gly His His Cys His Ser Asn Lys Thr Asn Thr Ile Leu Ser Trp
260 265 270
Ile Met Tyr Ala Ser Tyr Phe Val Leu Phe Ala Ala Leu Tyr Val Lys
275 280 285
Asn Tyr Ile Phe Ser Lys Leu Lys Ser Pro Lys Arg Lys Lys Val Glu
290 295 300
<210>4
<211>447
<212>PRT
<213>Pavlova salina
<400>4
Met Pro Pro Ser Ala Ala Lys Gln Met Gly Ala Ser Thr Gly Val His
1 5 10 15
Ala Gly Val Thr Asp Ser Ser Ala Phe Thr Arg Lys Asp Val Ala Asp
20 25 30
Arg Pro Asp Leu Thr Ile Val Gly Asp Ser Val Tyr Asp Ala Lys Ala
35 40 45
Phe Arg Ser Glu His Pro Gly Gly Ala His Phe Val Ser Leu Phe Gly
50 55 60
Gly Arg Asp Ala Thr Glu Ala Phe Met Glu Tyr His Arg Arg Ala Trp
65 70 75 80
Pro Lys Ser Arg Met Ser Arg Phe His Val Gly Ser Leu Ala Ser Thr
85 90 95
Glu Glu Pro Val Ala Ala Asp Glu Gly Tyr Leu Gln Leu Cys Ala Arg
100 105 110
Ile Ala Lys Met Val Pro Ser Val Ser Ser Gly Phe Ala Pro Ala Ser
115 120 125
Tyr Trp Val Lys Ala Gly Leu Ile Leu Gly Ser Ala Ile Ala Leu Glu
130 135 140
Ala Tyr Met Leu Tyr Ala Gly Lys Arg Leu Leu Pro Ser Ile Val Leu
145 150 155 160
Gly Trp Leu Phe Ala Leu Ile Gly Leu Asn Ile Gln His Asp Ala Asn
165 170 175
His Gly Ala Leu Ser Lys Ser Ala Ser Val Asn Leu Ala Leu Gly Leu
180 185 190
Cys Gln Asp Trp Ile Gly Gly Ser Met Ile Leu Trp Leu Gln Glu His
195 200 205
Val Val Met His His Leu His Thr Asn Asp Val Asp Lys Asp Pro Asp
210 215 220
Gln Lys Ala His Gly Ala Leu Arg Leu Lys Pro Thr Asp Ala Trp Ser
225 230 235 240
Pro Met His Trp Leu Gln His Leu Tyr Leu Leu Pro Gly Glu Thr Met
245 250 255
Tyr Ala Phe Lys Leu Leu Phe Leu Asp Ile Ser Glu Leu Val Met Trp
260 265 270
Arg Trp Glu Gly Glu Pro Ile Ser Lys Leu Ala Gly Tyr Leu Phe Met
275 280 285
Pro Ser Leu Leu Leu Lys Leu Thr Phe Trp Ala Arg Phe Val Ala Leu
290 295 300
Pro Leu Tyr Leu Ala Pro Ser Val His Thr Ala Val Cys Ile Ala Ala
305 310 315 320
Thr Val Met Thr Gly Ser Phe Tyr Leu Ala Phe Phe Phe Phe Ile Ser
325 330 335
His Asn Phe Glu Gly Val Ala Ser Val Gly Pro Asp Gly Ser Ile Thr
340 345 350
Ser Met Thr Arg Gly Ala Ser Phe Leu Lys Arg Gln Ala Glu Thr Ser
355 360 365
Ser Asn Val Gly Gly Pro Leu Leu Ala Thr Leu Asn Gly Gly Leu Asn
370 375 380
Tyr Gln Ile Glu His His Leu Phe Pro Arg Val His His Gly Phe Tyr
385 390 395 400
Pro Arg Leu Ala Pro Leu Val Lys Ala Glu Leu Glu Ala Arg Gly Ile
405 410 415
Glu Tyr Lys His Tyr Pro Thr Ile Trp Ser Asn Leu Ala Ser Thr Leu
420 425 430
Arg His Met Tyr Ala Leu Gly Arg Arg Pro Arg Ser Lys Ala Glu
435 440 445
<210>5
<211>1235
<212>DNA
<213>Pavlova salina
<400>5
atgggacgcg gcggagacag cagtgggcag gcgcatccgg cggcggagct ggcggtcccg 60
agcgaccgcg cggaggtgag caacgctgac agcaaagcgc tgcacatcgt gctgtatggc 120
aagcgcgtgg atgtgaccaa gttccaacgc acgcacccgg gtggtagcaa ggtcttccgg 180
atcttccagg accgcgatgc gacggagcag ttcgagtcct accactcgaa gcgcgcgatc 240
aagatgatgg agggcatgct caagaagtct gaggatgctc ccgccgacac gcccttgccc 300
tcccagtcac cgatggggaa ggacttcaag gcgatgatcg agcggcacgt tgcagcgggt 360
tactacgatc catgcccgct cgatgagctg ttcaagctca gcctcgtgct cctcccgacc 420
tttgcgggca tgtacatgct caaggcgggc gtcggctccc cgctctgcgg cgccctcatg 480
gtgagctttg gctggtacct cgatggctgg ctcgcgcacg actatctgca ccactccgtc 540
ttcaaggggt ccgtcgcacg caccgtcggg tggaacaacg cggcgggcta cttcctcggc 600
ttcgtgcagg ggtatgcggt cgagtggtgg cgcgcgcggc ataacacgca ccacgtgtgc 660
accaatgagg acggctcgga ccccgacatc aaaacggcgc cgctgctcat atacgtgcgc 720
aacaagccga gcatcgccaa gcgcctgaac gccttccagc gctaccagca gtactactat 780
gtgccggtga tggcaatcct cgacctgtac tggcggctcg agtcgatcgc ctacgtcgcg 840
atgcgcctgc cgaagatgct gccgcaggcc ctcgcactcg tcgcgcacta cgccatcgtc 900
gcgtgggtct ttgcgggcaa ctaccacctg ctcccgctcg tgacggttct gcgcgggttt 960
ggcactggga tcaccgtttt cgcgacgcac tacggtgagg acattctcga cgcggaccag 1020
gtgcgtcaca tgacgctcgt cgagcagacg gcactcacct cgcgcaacat ctcgggcggc 1080
tggctcgtga acgtgctcac cggcttcatc tcactgcaga cggagcacca cctgttcccg 1140
atgatgccaa ccggcaacct catgactatc cagcccgagg tgcgcgcctt cttcaagaag 1200
cacggacttg agtaccgcga gggcaacctc attga 1235
<210>6
<211>1700
<212>DNA
<213>Pavlova salina
<400>6
ggcacgaggc agctggccgc cgtcgagaga acgccagggg ggtcatggga cgcggcggag 60
acagcagtgg gcaggcgcat ccggcggcgg agctggcggt cccgagcgac cgcgcggagg 120
tgagcaacgc tgacagcaaa gcgctgcaca tcgtgctgta tggcaagcgc gtggatgtga 180
ccaagttcca acgcacgcac ccgggtggta gcaaggtctt ccggatcttc caggaccgcg 240
atgcgacgga gcagttcgag tcctaccact cgaagcgcgc gatcaagatg atggagggca 300
tgctcaagaa gtctgaggat gctcccgccg acacgccctt gccctcccag tcaccgatgg 360
ggaaggactt caaggcgatg atcgagcggc acgttgcagc gggttactac gatccatgcc 420
cgctcgatga gctgttcaag ctcagcctcg tgctcctccc gacctttgcg ggcatgtaca 480
tgctcaaggc gggcgtcggc tccccgctct gcggcgccct catggtgagc tttggctggt 540
acctcgatgg ctggctcgcg cacgactatc tgcaccactc cgtcttcaag gggtccgtcg 600
cacgcaccgt cgggtggaac aacgcggcgg gctacttcct cggcttcgtg caggggtatg 660
cggtcgagtg gtggcgcgcg cggcataaca cgcaccacgt gtgcaccaat gaggacggct 720
cggaccccga catcaaaacg gcgccgctgc tcatatacgt gcgcaacaag ccgagcatcg 780
ccaagcgcct gaacgccttc cagcgctacc agcagtacta ctatgtgccg gtgatggcaa 840
tcctcgacct gtactggcgg ctcgagtcga tcgcctacgt cgcgatgcgc ctgccgaaga 900
tgctgccgca ggccctcgca ctcgtcgcgc actacgccat cgtcgcgtgg gtctttgcgg 960
gcaactacca cctgctcccg ctcgtgacgg ttctgcgcgg gtttggcact gggatcaccg 1020
ttttcgcgac gcactacggt gaggacattc tcgacgcgga ccaggtgcgt cacatgacgc 1080
tcgtcgagca gacggcactc acctcgcgca acatctcggg cggctggctc gtgaacgtgc 1140
tcaccggctt catctcactg cagacggagc accacctgtt cccgatgatg ccaaccggca 1200
acctcatgac tatccagccc gaggtgcgcg ccttcttcaa gaagcacgga cttgagtacc 1260
gcgagggcaa cctcattgag tgcgtgcggc agaacatccg tgcgcttgca ttcgagcacc 1320
tgctttgagc gctctccgct tccaagggcg ggatcggcgc atccgttggt gctgcggcac 1380
caacgcttcc gctctcgagc gcagatgttg gttgcatcac gcatcacacc cacccccagc 1440
cggatcaccc agctcccgat gcttggcgta cctagccgcg tcctcccagc atgcactgca 1500
actcattcac cacctgctac agtttcggcc taatccatgg cccgactgct tgccgccttg 1560
cacaccgacg agtacgccga ctcggtccaa tgcctcggcg taatctgctg gcgtgctgcg 1620
gcactgtgat tcattcattg atcgcacagt tcacagcatg ttcgctgaca caacgtttgc 1680
tgacctcata gacagtagaa 1700
<210>7
<211>909
<212>DNA
<213>Pavlova salina
<400>7
atgaaagctg cggcaggcaa ggtgcagcag gaggcggagc gcctcacggc gggcctctgg 60
ctgccgatga tgcttgcggc cggttatctg ctggttctct ctgcaaaccg cgcgagcttc 120
tacgagaaca tcaacaacga gaagggcgcc tactcgacgt cgtggttctc gctgccgtgc 180
gtcatgacgg ctgtgtacct gggcggtgtg tttggcttga ccaagtactt tgagggtcgc 240
aagccgatgc agggcctgaa ggattacatg tttacgtaca acctgtacca ggtgatcatc 300
aacgtgtggt gcatcgcggc tttcgtcgtg gaggtgaggc gcgcgggcat gagcgcggtg 360
ggcaacaagg tcgacctcgg ccccaactcc ttcaggctcg gctttgtgac gtgggtgcac 420
tacaacaaca agtacgtcga gctgctcgac acgctgtgga tggtgctgcg caagaagacg 480
cagcaggtct ccttcctgca cgtgtaccac cacgtgctgc tcatctgggc gtggttctgc 540
gtagtcaaat tctgcaacgg cggcgacgcc tactttggcg gcatgctcaa ctcgatcatc 600
cacgtgatga tgtactcgta ctacacgatg gcgctgctcg gctggagttg tccatggaag 660
cgatacctca ctcaggcgca gctcgtgcag ttctgcattt gcctcgcgca cgcgacgtgg 720
gcggccgcga cgggcgtgta ccccttccac atttgcctcg tcgagatctg ggtgatggtg 780
tcgatgctgt acctgttcac caagttctac aactctgcgt acaagggcgc agcaaagggc 840
gcagcagcga gcagcaacgg tgcggcggcg ccgagcggag ccaagcctaa gagcatcaag 900
gccaactga 909
<210>8
<211>1216
<212>DNA
<213>Pavlova salina
<400>8
gaattcggca cgaggtcttc ttccagctgt ggtcgtcatg aaagctgcgg caggcaaggt 60
gcagcaggag gcggagcgcc tcacggcggg cctctggctg ccgatgatgc ttgcggccgg 120
ttatctgctg gttctctctg caaaccgcgc gagcttctac gagaacatca acaacgagaa 180
gggcgcctac tcgacgtcgt ggttctcgct gccgtgcgtc atgacggctg tgtacctggg 240
cggtgtgttt ggcttgacca agtactttga gggtcgcaag ccgatgcagg gcctgaagga 300
ttacatgttt acgtacaacc tgtaccaggt gatcatcaac gtgtggtgca tcgcggcttt 360
cgtcgtggag gtgaggcgcg cgggcatgag cgcggtgggc aacaaggtcg acctcggccc 420
caactccttc aggctcggct ttgtgacgtg ggtgcactac aacaacaagt acgtcgagct 480
gctcgacacg ctgtggatgg tgctgcgcaa gaagacgcag caggtctcct tcctgcacgt 540
gtaccaccac gtgctgctca tctgggcgtg gttctgcgta gtcaaattct gcaacggcgg 600
cgacgcctac tttggcggca tgctcaactc gatcatccac gtgatgatgt actcgtacta 660
cacgatggcg ctgctcggct ggagttgtcc atggaagcga tacctcactc aggcgcagct 720
cgtgcagttc tgcatttgcc tcgcgcacgc gacgtgggcg gccgcgacgg gcgtgtaccc 780
cttccacatt tgcctcgtcg agatctgggt gatggtgtcg atgctgtacc tgttcaccaa 840
gttctacaac tctgcgtaca agggcgcagc aaagggcgca gcagcgagca gcaacggtgc 900
ggcggcgccg agcggagcca agcctaagag catcaaggcc aactgaggcc tggcacgcgg 960
gcgaggccgc ggcacgccgc gcagttccgg tcggcgcaac gtcgcggctg cgccgcgcta 1020
cgcaccacgc aggcagtggt tcaggtggcg aagtgtgcag cctgtctgtc gcctgcacac 1080
ccattgattg gtcccgctcg cgctactctg cgcactgcca agtcgccaag acctgtacgt 1140
gtatgatctg actgataccg catacggatg tcccgtatgc gacgactgcc atacgtgctg 1200
cacacgttgt ccaacc 1216
<210>9
<211>915
<212>DNA
<213>Pavlova salina
<400>9
atggggccgt tgagcacgct gctagcgtgg atgcccacct ggggcgagtt tgtcgccggg 60
ctgacctatg tcgagcgcca gcagatgtca gaggagctcg tgcgcgcaaa taagctcccg 120
ctgtcgctca tcccggaggt ggacttcttc acgatcgcgt cagtctacgt gggcgaccat 180
tggcggatcc cattcacggc catctcggct tatctggtct tgatcacgct cgggccgcag 240
ctcatggcca ggcggccgcc attgccaatc aacaccttgg cgtgcctctg gaatttcgcg 300
ctgtcgctct ttagttttgt cggcatgatt gttacgtgga cgaccatcgg cgagcgcctg 360
tggaaaaatg gtatcgagga cacagtgtgc ggccatccga tattcatggg gtacggctgg 420
atcggatatg ttatgcttgc cttcatctgg tcgaagctct tcgagctgat cgacaccgta 480
ttcctcgtcg cgaagaaggc cgacgtcatc ttcctgcact ggtaccacca cgtgacggtg 540
ctgctatact gctggcattc gtacgctgtt cgtatcccgt ccggcatctg gtttgccgcg 600
atgaattatt tcgtacacgc catcatgtac gcctactttg gcatgacaca gattgggccg 660
aggcagcgca agctcgtgcg accgtacgca cggctcatca ccacgttcca gctgtcgcag 720
atgggcgtcg gtctggccgt caatggcctt atcatccgct acccgtcgat aggccatcat 780
tgccactcga acaagacgaa caccattttg agctggatca tgtacgcgag ctactttgtg 840
cttttcgccg cactatacgt gaagaactac atcttctcca agctgaagtc gcccaagagg 900
aagaaggtgg aatga 915
<210>10
<211>1219
<212>DNA
<213>Pavlova salina
<400>10
gaattcggca cgaggtgcag ccttgagcct tacgcaggcc gactcgcccg tggctagcac 60
gcagcgcgcc caaccccatg gggccgttga gcacgctgct agcgtggatg cccacctggg 120
gcgagtttgt cgccgggctg acctatgtcg agcgccagca gatgtcagag gagctcgtgc 180
gcgcaaataa gctcccgctg tcgctcatcc cggaggtgga cttcttcacg atcgcgtcag 240
tctacgtggg cgaccattgg cggatcccat tcacggccat ctcggcttat ctggtcttga 300
tcacgctcgg gccgcagctc atggccaggc ggccgccatt gccaatcaac accttggcgt 360
gcctctggaa tttcgcgctg tcgctcttta gttttgtcgg catgattgtt acgtggacga 420
ccatcggcga gcgcctgtgg aaaaatggta tcgaggacac agtgtgcggc catccgatat 480
tcatggggta cggctggatc ggatatgtta tgcttgcctt catctggtcg aagctcttcg 540
agctgatcga caccgtattc ctcgtcgcga agaaggccga cgtcatcttc ctgcactggt 600
accaccacgt gacggtgctg ctatactgct ggcattcgta cgctgttcgt atcccgtccg 660
gcatctggtt tgccgcgatg aattatttcg tacacgccat catgtacgcc tactttggca 720
tgacacagat tgggccgagg cagcgcaagc tcgtgcgacc gtacgcacgg ctcatcacca 780
cgttccagct gtcgcagatg ggcgtcggtc tggccgtcaa tggccttatc atccgctacc 840
cgtcgatagg ccatcattgc cactcgaaca agacgaacac cattttgagc tggatcatgt 900
acgcgagcta ctttgtgctt ttcgccgcac tatacgtgaa gaactacatc ttctccaagc 960
tgaagtcgcc caagaggaag aaggtggaat gattgactcg agctcgtgtt tccgccatct 1020
gtcattttac ggctcctcct gatgcggacg gcagctctga tctttgccac aggaccgatg 1080
acggccgatg gtgtctggtt ccagctggct ctgtcattcg cggctcatgg gcacccgggt 1140
gggagcacca gctgtcagac cggactcgat gagatagcgg tgacagacgg accgtgacca 1200
cgagtctcat catctgttg 1219
<210>11
<211>125
<212>DNA
<213>Pavlova salina
<400>11
agcacgacgg gaaccacggc gcgctctcca agtcggcctc ggtcaacctg gcgctcgggt 60
tgtgccagca ctggatcggc gggagcatga tcctctggct gcaggagcac gtgatgatgc 120
accac 125
<210>12
<211>1344
<212>DNA
<213>Pavlova salina
<400>12
atgcctccga gcgcggcgaa gcagatgggc gcgagcacgg gcgtgcatgc gggcgtcaca 60
gattcgtcgg ccttcacgcg caaggatgtc gccgacaggc cggacctcac gatcgtgggt 120
gacagcgtgt acgatgcgaa ggcgttccgc tccgagcatc cgggtggcgc gcactttgtg 180
tcgctgttcg gcgggcgcga tgccacggag gcgttcatgg agtaccaccg gcgcgcctgg 240
cccaagtcgc gcatgtcgcg cttccacgtc ggctctctgg catcgaccga ggagcccgtc 300
gccgccgatg agggctacct ccagctgtgc gctcgcatcg ccaagatggt gccgtcggtc 360
agcagcgggt tcgcgccggc gtcgtactgg gtgaaggccg ggctgatcct cggctccgcg 420
atcgcgctcg aggcgtacat gctgtacgcg ggcaagcgcc tgctcccgtc gatcgtgctc 480
gggtggctgt ttgcgctgat tggcctgaac atccagcacg atgccaacca cggcgcgctc 540
tccaagtcgg cctcggtcaa cctggcgctc gggttgtgcc aggactggat cggcgggagc 600
atgatcctct ggctgcagga gcacgttgtc atgcaccact tgcacaccaa cgacgttgac 660
aaggacccgg accagaaggc gcacggcgcc ctgcggctca agccgaccga cgcgtggagc 720
ccgatgcact ggctgcagca cctctacctg ctgcctgggg agacgatgta cgccttcaag 780
ctgctgtttc tcgacatcag cgagctggtg atgtggcggt gggagggcga gcccatcagc 840
aagctggccg ggtacctctt catgccctcg ctgctcctca agctcacctt ctgggcgcgc 900
tttgtcgcgc tgccgctgta cctcgcgccc agcgtgcaca cggcggtgtg catcgcggcg 960
acggtaatga cggggagctt ctacctcgcc ttcttcttct tcatctcgca caacttcgag 1020
ggcgtggcga gcgtcggacc ggacggcagc atcaccagca tgacgcgcgg cgcatccttc 1080
ctcaagcggc aggccgagac ctcgtccaac gtgggcggcc cgctgctcgc cacgctcaac 1140
ggcggcctca actaccaaat cgagcaccac ctcttcccca gggtgcacca cggcttctac 1200
cctcgcctcg cgccgttggt caaggcggag ctcgaggcgc gcggcattga gtacaagcac 1260
taccccacca tatggagcaa cctggcatcc acgctgaggc acatgtacgc gctcggccgc 1320
aggccgcgca gcaaggcgga gtga 1344
<210>13
<211>1687
<212>DNA
<213>Pavlova salina
<400>13
ctcctgtgag accgcgttgc gccagcgcaa ggaccgacct gcacgcgcga tgcctccgag 60
cgcggcgaag cagatgggcg cgagcacggg cgtgcatgcg ggcgtcacag attcgtcggc 120
cttcacgcgc aaggatgtcg ccgacaggcc ggacctcacg atcgtgggtg acagcgtgta 180
cgatgcgaag gcgttccgct ccgagcatcc gggtggcgcg cactttgtgt cgctgttcgg 240
cgggcgcgat gccacggagg cgttcatgga gtaccaccgg cgcgcctggc ccaagtcgcg 300
catgtcgcgc ttccacgtcg gctctctggc atcgaccgag gagcccgtcg ccgccgatga 360
gggctacctc cagctgtgcg ctcgcatcgc caagatggtg ccgtcggtca gcagcgggtt 420
cgcgccggcg tcgtactggg tgaaggccgg gctgatcctc ggctccgcga tcgcgctcga 480
ggcgtacatg ctgtacgcgg gcaagcgcct gctcccgtcg atcgtgctcg ggtggctgtt 540
tgcgctgatt ggcctgaaca tccagcacga tgccaaccac ggcgcgctct ccaagtcggc 600
ctcggtcaac ctggcgctcg ggttgtgcca ggactggatc ggcgggagca tgatcctctg 660
gctgcaggag cacgttgtca tgcaccactt gcacaccaac gacgttgaca aggacccgga 720
ccagaaggcg cacggcgccc tgcggctcaa gccgaccgac gcgtggagcc cgatgcactg 780
gctgcagcac ctctacctgc tgcctgggga gacgatgtac gccttcaagc tgctgtttct 840
cgacatcagc gagctggtga tgtggcggtg ggagggcgag cccatcagca agctggccgg 900
gtacctcttc atgccctcgc tgctcctcaa gctcaccttc tgggcgcgct ttgtcgcgct 960
gccgctgtac ctcgcgccca gcgtgcacac ggcggtgtgc atcgcggcga cggtaatgac 1020
ggggagcttc tacctcgcct tcttcttctt catctcgcac aacttcgagg gcgtggcgag 1080
cgtcggaccg gacggcagca tcaccagcat gacgcgcggc gcatccttcc tcaagcggca 1140
ggccgagacc tcgtccaacg tgggcggccc gctgctcgcc acgctcaacg gcggcctcaa 1200
ctaccaaatc gagcaccacc tcttccccag ggtgcaccac ggcttctacc ctcgcctcgc 1260
gccgttggtc aaggcggagc tcgaggcgcg cggcattgag tacaagcact accccaccat 1320
atggagcaac ctggcatcca cgctgaggca catgtacgcg ctcggccgca ggccgcgcag 1380
caaggcggag tgacgagcct cccaatcggc tgcccaggct gctggcagct tgggtcgacc 1440
atcggcatcg actcggcgac gccgacgcca gccgtggtcg cacaaacggc tcggcgttgg 1500
ttcttcggct accgcgccgg aaccggggca cgcacctgac tcggtgacga ttgcggtcgc 1560
accagcagaa gcgctcaccc ccgcccccgc tcggatcggg cggcatagag catacatcta 1620
gcgcgttctt actatatgcc actgtgtaga ctagtcttct agcgccggaa aatctgctat 1680
caacaat 1687
<210>14
<211>288
<212>PRT
<213>Caenorhabditis elegans
<400>14
Met Ala Gln His Pro Leu Val Gln Arg Leu Leu Asp Val Lys Phe Asp
1 5 10 15
Thr Lys Arg Phe Val Ala Ile Ala Thr His Gly Pro Lys Asn Phe Pro
20 25 30
Asp Ala Glu Gly Arg Lys Phe Phe Ala Asp His Phe Asp Val Thr Ile
35 40 45
Gln Ala Ser Ile Leu Tyr Met Val Val Val Phe Gly Thr Lys Trp Phe
50 55 60
Met Arg Asn Arg Gln Pro Phe Gln Leu Thr Ile Pro Leu Asn Ile Trp
65 70 75 80
Asn Phe Ile Leu Ala Ala Phe Ser Ile Ala Gly Ala Val Lys Met Thr
85 90 95
Pro Glu Phe Phe Gly Thr Ile Ala Asn Lys Gly Ile Val Ala Ser Tyr
100 105 110
Cys Lys Val Phe Asp Phe Thr Lys Gly Glu Asn Gly Tyr Trp Val Trp
115 120 125
Leu Phe Met Ala Ser Lys Leu Phe Glu Leu Val Asp Thr Ile Phe Leu
130 135 140
Val Leu Arg Lys Arg Pro Leu Met Phe Leu His Trp Tyr His His Ile
145 150 155 160
Leu Thr Met Ile Tyr Ala Trp Tyr Ser His Pro Leu Thr Pro Gly Phe
165 170 175
Asn Arg Tyr Gly Ile Tyr Leu Asn Phe Val Val His Ala Phe Met Tyr
180 185 190
Ser Tyr Tyr Phe Leu Arg Ser Met Lys Ile Arg Val Pro Gly Phe Ile
195 200 205
Ala Gln Ala Ile Thr Ser Leu Gln Ile Val Gln Phe Ile Ile Ser Cys
210 215 220
Ala Val Leu Ala His Leu Gly Tyr Leu Met His Phe Thr Asn Ala Asn
225 230 235 240
Cys Asp Phe Glu Pro Ser Val Phe Lys Leu Ala Val Phe Met Asp Thr
245 250 255
Thr Tyr Leu Ala Leu Phe Val Asn Phe Phe Leu Gln Ser Tyr Val Leu
260 265 270
Arg Gly Gly Lys Asp Lys Tyr Lys Ala Val Pro Lys Lys Lys Asn Asn
275 280 285
<210>15
<211>444
<212>PRT
<213>Danio rerio
<400>15
Met Gly Gly Gly Gly Gln Gln Thr Asp Arg Ile Thr Asp Thr Asn Gly
1 5 10 15
Arg Phe Ser Ser Tyr Thr Trp Glu Glu Val Gln Lys His Thr Lys His
20 25 30
Gly Asp Gln Trp Val Val Val Glu Arg Lys Val Tyr Asn Val Ser Gln
35 40 45
Trp Val Lys Arg His Pro Gly Gly Leu Arg Ile Leu Gly His Tyr Ala
50 55 60
Gly Glu Asp Ala Thr Glu Ala Phe Thr Ala Phe His Pro Asn Leu Gln
65 70 75 80
Leu Val Arg Lys Tyr Leu Lys Pro Leu Leu Ile Gly Glu Leu Glu Ala
85 90 95
Ser Glu Pro Ser Gln Asp Arg Gln Lys Asn Ala Ala Leu Val Glu Asp
100 105 110
Phe Arg Ala Leu Arg Glu Arg Leu Glu Ala Glu Gly Cys Phe Lys Thr
115 120 125
Gln Pro Leu Phe Phe Ala Leu His Leu Gly His Ile Leu Leu Leu Glu
130 135 140
Ala Ile Ala Phe Met Met Val Trp Tyr Phe Gly Thr Gly Trp Ile Asn
145 150 155 160
Thr Leu Ile Val Ala Val Ile Leu Ala Thr Ala Gln Ser Gln Ala Gly
165 170 175
Trp Leu Gln His Asp Phe Gly His Leu Ser Val Phe Lys Thr Ser Gly
180 185 190
Met Asn His Leu Val His Lys Phe Val Ile Gly His Leu Lys Gly Ala
195 200 205
Ser Ala Gly Trp Trp Asn His Arg His Phe Gln His His Ala Lys Pro
210 215 220
Asn Ile Phe Lys Lys Asp Pro Asp Val Asn Met Leu Asn Ala Phe Val
225 230 235 240
Val Gly Asn Val Gln Pro Val Glu Tyr Gly Val Lys Lys Ile Lys His
245 250 255
Leu Pro Tyr Asn His Gln His Lys Tyr Phe Phe Phe Ile Gly Pro Pro
260 265 270
Leu Leu Ile Pro Val Tyr Phe Gln Phe Gln Ile Phe His Asn Met Ile
275 280 285
Ser His Gly Met Trp Val Asp Leu Leu Trp Cys Ile Ser Tyr Tyr Val
290 295 300
Arg Tyr Phe Leu Cys Tyr Thr Gln Phe Tyr Gly Val Phe Trp Ala Ile
305 310 315 320
Ile Leu Phe Asn Phe Val Arg Phe Met Glu Ser His Trp Phe Val Trp
325 330 335
Val Thr Gln Met Ser His Ile Pro Met Asn Ile Asp Tyr Glu Lys Asn
340 345 350
Gln Asp Trp Leu Ser Met Gln Leu Val Ala Thr Cys Asn Ile Glu Gln
355 360 365
Ser Ala Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
His His Leu Phe Pro Thr Val Pro Arg His Asn Tyr Trp Arg Ala Ala
385 390 395 400
Pro Arg Val Arg Ala Leu Cys Glu Lys Tyr Gly Val Lys Tyr Gln Glu
405 410 415
Lys Thr Leu Tyr Gly Ala Phe Ala Asp Ile Ile Arg Ser Leu Glu Lys
420 425 430
Ser Gly Glu Leu Trp Leu Asp Ala Tyr Leu Asn Lys
435 440
<210>16
<211>444
<212>PRT
<213>Homo sapiens
<400>16
Met Ala Pro Asp Pro Leu Ala Ala Glu Thr Ala Ala Gln Gly Leu Thr
1 5 10 15
Pro Arg Tyr Phe Thr Trp Asp Glu Val Ala Gln Arg Ser Gly Cys Glu
20 25 30
Glu Arg Trp Leu Val Ile Asp Arg Lys Val Tyr Asn Ile Ser Glu Phe
35 40 45
Thr Arg Arg His Pro Gly Gly Ser Arg Val Ile Ser His Tyr Ala Gly
50 55 60
Gln Asp Ala Thr Asp Pro Phe Val Ala Phe His Ile Asn Lys Gly Leu
65 70 75 80
Val Lys Lys Tyr Met Asn Ser Leu Leu Ile Gly Glu Leu Ser Pro Glu
85 90 95
Gln Pro Ser Phe Glu Pro Thr Lys Asn Lys Glu Leu Thr Asp Glu Phe
100 105 110
Arg Glu Leu Arg Ala Thr Val Glu Arg Met Gly Leu Met Lys Ala Asn
115 120 125
His Val Phe Phe Leu Leu Tyr Leu Leu His Ile Leu Leu Leu Asp Gly
130 135 140
Ala Ala Trp Leu Thr Leu Trp Val Phe Gly Thr Ser Phe Leu Pro Phe
145 150 155 160
Leu Leu Cys Ala Val Leu Leu Ser Ala Val Gln Ala Gln Ala Gly Trp
165 170 175
Leu Gln His Asp Phe Gly His Leu Ser Val Phe Ser Thr Ser Lys Trp
180 185 190
Asn His Leu Leu His His Phe Val Ile Gly His Leu Lys Gly Ala Pro
195 200 205
Ala Ser Trp Trp Asn His Met His Phe Gln His His Ala Lys Pro Asn
210 215 220
Cys Phe Arg Lys Asp Pro Asp Ile Asn Met His Pro Phe Phe Phe Ala
225 230 235 240
Leu Gly Lys Ile Leu Ser Val Glu Leu Gly Lys Gln Lys Lys Asn Tyr
245 250 255
Met Pro Tyr Asn His Gln His Lys Tyr Phe Phe Leu Ile Gly Pro Pro
260 265 270
Ala Leu Leu Pro Leu Tyr Phe Gln Trp Tyr Ile Phe Tyr Phe Val Ile
275 280 285
Gln Arg Lys Lys Trp Val Asp Leu Ala Trp Met Ile Thr Phe Tyr Val
290 295 300
Arg Phe Phe Leu Thr Tyr Val Pro Leu Leu Gly Leu Lys Ala Phe Leu
305 310 315 320
Gly Leu Phe Phe Ile Val Arg Phe Leu Glu Ser Asn Trp Phe Val Trp
325 330 335
Val Thr Gln Met Asn His Ile Pro Met His Ile Asp His Asp Arg Asn
340 345 350
Met Asp Trp Val Ser Thr Gln Leu Gln Ala Thr Cys Asn Val His Lys
355 360 365
Ser Ala Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
His His Leu Phe Pro Thr Met Pro Arg His Asn Tyr His Lys Val Ala
385 390 395 400
Pro Leu Val Gln Ser Leu Cys Ala Lys His Gly Ile Glu Tyr Gln Ser
405 410 415
Lys Pro Leu Leu Ser Ala Phe Ala Asp Ile Ile His Ser Leu Lys Glu
420 425 430
Ser Gly Gln Leu Trp Leu Asp Ala Tyr Leu His Gln
435 440
<210>17
<211>456
<212>PRT
<213>Pythium irregulare
<400>17
Met Gly Thr Asp Gln Gly Lys Thr Phe Thr Trp Gln Glu Val Ala Lys
1 5 10 15
His Asn Thr Ala Lys Ser Ala Trp Val Ile Ile Arg Gly Glu Val Tyr
20 25 30
Asp Val Thr Glu Trp Ala Asp Lys His Pro Gly Gly Ser Glu Leu Ile
35 40 45
Val Leu His Ser Gly Arg Glu Cys Thr Asp Thr Phe Tyr Ser Tyr His
50 55 60
Pro Phe Ser Asn Arg Ala Asp Lys Ile Leu Ala Lys Tyr Lys Ile Gly
65 70 75 80
Lys Leu Val Gly Gly Tyr Glu Phe Pro Val Phe Lys Pro Asp Ser Gly
85 90 95
Phe Tyr Lys Glu Cys Ser Glu Arg Val Ala Glu Tyr Phe Lys Thr Asn
100 105 110
Asn Leu Asp Pro Lys Ala Ala Phe Ala Gly Leu Trp Arg Met Val Phe
115 120 125
Val Phe Ala Val Ala Ala Leu Ala Tyr Met Gly Met Asn Glu Leu Ile
130 135 140
Pro Gly Asn Val Tyr Ala Gln Tyr Ala Trp Gly Val Val Phe Gly Val
145 150 155 160
Phe Gln Ala Leu Pro Leu Leu His Val Met His Asp Ser Ser His Ala
165 170 175
Ala Cys Ser Ser Ser Pro Ala Met Trp Gln Ile Ile Gly Arg Gly Val
180 185 190
Met Asp Trp Phe Ala Gly Ala Ser Met Val Ser Trp Leu Asn Gln His
195 200 205
Val Val Gly His His Ile Tyr Thr Asn Val Ala Gly Ala Asp Pro Asp
210 215 220
Leu Pro Val Asp Phe Glu Ser Asp Val Arg Arg Ile Val His Arg Gln
225 230 235 240
Val Leu Leu Pro Ile Tyr Lys Phe Gln His Ile Tyr Leu Pro Pro Leu
245 250 255
Tyr Gly Val Leu Gly Leu Lys Phe Arg Ile Gln Asp Val Phe Glu Thr
260 265 270
Phe Val Ser Leu Thr Asn Gly Pro Val Arg Val Asn Pro His Pro Val
275 280 285
Ser Asp Trp Val Gln Met Ile Phe Ala Lys Ala Phe Trp Thr Phe Tyr
290 295 300
Arg Ile Tyr Ile Pro Leu Val Trp Leu Lys Ile Thr Pro Ser Thr Phe
305 310 315 320
Trp Gly Val Phe Phe Leu Ala Glu Phe Thr Thr Gly Trp Tyr Leu Ala
325 330 335
Phe Asn Phe Gln Val Ser His Val Ser Thr Glu Cys Glu Tyr Pro Cys
340 345 350
Gly Asp Ala Pro Ser Ala Glu Val Gly Asp Glu Trp Ala Ile Ser Gln
355 360 365
Val Lys Ser Ser Val Asp Tyr Ala His Gly Ser Pro Leu Ala Ala Phe
370 375 380
Leu Cys Gly Ala Leu Asn Tyr Gln Val Thr His His Leu Tyr Pro Gly
385 390 395 400
Ile Ser Gln Tyr His Tyr Pro Ala Ile Ala Pro Ile Ile Ile Asp Val
405 410 415
Cys Lys Lys Tyr Asn Ile Lys Tyr Thr Val Leu Pro Thr Phe Thr Glu
420 425 430
Ala Leu Leu Ala His Phe Lys His Leu Lys Asn Met Gly Glu Leu Gly
435 440 445
Lys Pro Val Glu Ile His Met Gly
450 455
<210>18
<211>439
<212>PRT
<213>Thraustochytrium sp.
<400>18
Met Gly Lys Gly Ser Glu Gly Arg Ser Ala Ala Arg Glu Met Thr Ala
1 5 10 15
Glu Ala Asn Gly Asp Lys Arg Lys Thr Ile Leu Ile Glu Gly Val Leu
20 25 30
Tyr Asp Ala Thr Asn Phe Lys His Pro Gly Gly Ser Ile Ile Asn Phe
35 40 45
Leu Thr Glu Gly Glu Ala Gly Val Asp Ala Thr Gln Ala Tyr Arg Glu
50 55 60
Phe His Gln Arg Ser Gly Lys Ala Asp Lys Tyr Leu Lys Ser Leu Pro
65 70 75 80
Lys Leu Asp Ala Ser Lys Val Glu Ser Arg Phe Ser Ala Lys Glu Gln
85 90 95
Ala Arg Arg Asp Ala Met Thr Arg Asp Tyr Ala Ala Phe Arg Glu Glu
100 105 110
Leu Val Ala Glu Gly Tyr Phe Asp Pro Ser Ile Pro His Met Ile Tyr
115 120 125
Arg Val Val Glu Ile Val Ala Leu Phe Ala Leu Ser Phe Trp Leu Met
130 135 140
Ser Lys Ala Ser Pro Thr Ser Leu Val Leu Gly Val Val Met Asn Gly
145 150 155 160
Ile Ala Gln Gly Arg Cys Gly Trp Val Met His Glu Met Gly His Gly
165 170 175
Ser Phe Thr Gly Val Ile Trp Leu Asp Asp Arg Met Cys Glu Phe Phe
180 185 190
Tyr Gly Val Gly Cys Gly Met Ser Gly His Tyr Trp Lys Asn Gln His
195 200 205
Ser Lys His His Ala Ala Pro Asn Arg Leu Glu His Asp Val Asp Leu
210 215 220
Asn Thr Leu Pro Leu Val Ala Phe Asn Glu Arg Val Val Arg Lys Val
225 230 235 240
Lys Pro Gly Ser Leu Leu Ala Leu Trp Leu Arg Val Gln Ala Tyr Leu
245 250 255
Phe Ala Pro Val Ser Cys Leu Leu Ile Gly Leu Gly Trp Thr Leu Tyr
260 265 270
Leu His Pro Arg Tyr Met Leu Arg Thr Lys Arg His Met Glu Phe Val
275 280 285
Trp Ile Phe Ala Arg Tyr Ile Gly Trp Phe Ser Leu Met Gly Ala Leu
290 295 300
Gly Tyr Ser Pro Gly Thr Ser Val Gly Met Tyr Leu Cys Ser Phe Gly
305 310 315 320
Leu Gly Cys Ile Tyr Ile Phe Leu Gln Phe Ala Val Ser His Thr His
325 330 335
Leu Pro Val Thr Asn Pro Glu Asp Gln Leu His Trp Leu Glu Tyr Ala
340 345 350
Ala Asp His Thr Val Asn Ile Ser Thr Lys Ser Trp Leu Val Thr Trp
355 360 365
Trp Met Ser Asn Leu Asn Phe Gln Ile Glu His His Leu Phe Pro Thr
370 375 380
Ala Pro Gln Phe Arg Phe Lys Glu Ile Ser Pro Arg Val Glu Ala Leu
385 390 395 400
Phe Lys Arg His Asn Leu Pro Tyr Tyr Asp Leu Pro Tyr Thr Ser Ala
405 410 415
Val Ser Thr Thr Phe Ala Asn Leu Tyr Ser Val Gly His Ser Val Gly
420 425 430
Ala Asp Thr Lys Lys Gln Asp
435
<210>19
<211>446
<212>PRT
<213>Mortierella alpina
<400>19
Met Gly Thr Asp Gln Gly Lys Thr Phe Thr Trp Glu Glu Leu Ala Ala
1 5 10 15
His Asn Thr Lys Gly Asp Leu Phe Leu Ala Ile Arg Gly Arg Val Tyr
20 25 30
Asp Val Thr Lys Phe Leu Ser Arg His Pro Gly Gly Val Asp Thr Leu
35 40 45
Leu Leu Gly Ala Gly Arg Asp Val Thr Pro Val Phe Glu Met Tyr His
50 55 60
Ala Phe Gly Ala Ala Asp Ala Ile Met Lys Lys Tyr Tyr Val Gly Thr
65 70 75 80
Leu Val Ser Asn Glu Leu Pro Val Phe Pro Glu Pro Thr Val Phe His
85 90 95
Lys Thr Ile Lys Thr Arg Val Glu Gly Tyr Phe Thr Asp Arg Asp Ile
100 105 110
Asp Pro Lys Asn Arg Pro Glu Ile Trp Gly Arg Tyr Ala Leu Ile Phe
115 120 125
Gly Ser Leu Ile Ala Ser Tyr Tyr Ala Gln Leu Phe Val Pro Phe Val
130 135 140
Val Glu Arg Thr Trp Leu Gln Val Val Phe Ala Ile Ile Met Gly Phe
145 150 155 160
Ala Cys Ala Gln Val Gly Leu Asn Pro Leu His Asp Ala Ser His Phe
165 170 175
Ser Val Thr His Asn Pro Thr Val Trp Lys Ile Leu Gly Ala Thr His
180 185 190
Asp Phe Phe Asn Gly Ala Ser Tyr Leu Val Trp Met Tyr Gln His Met
195 200 205
Leu Gly His His Pro Tyr Thr Asn Ile Ala Gly Ala Asp Pro Asp Val
210 215 220
Ser Thr Phe Glu Pro Asp Val Arg Arg Ile Lys Pro Asn Gln Lys Trp
225 230 235 240
Phe Val Asn His Ile Asn Gln Asp Met Phe Val Pro Phe Leu Tyr Gly
245 250 255
Leu Leu Ala Phe Lys Val Arg Ile Gln Asp Ile Asn Ile Leu Tyr Phe
260 265 270
Val Lys Thr Asn Asp Ala Ile Arg Val Asn Pro Ile Ser Thr Trp His
275 280 285
Thr Val Met Phe Trp Gly Gly Lys Ala Phe Phe Val Trp Tyr Arg Leu
290 295 300
Ile Val Pro Leu Gln Tyr Leu Pro Leu Gly Lys Val Leu Leu Leu Phe
305 310 315 320
Thr Val Ala Asp Met Val Ser Ser Tyr Trp Leu Ala Leu Thr Phe Gln
325 330 335
Ala Asn His Val Val Glu Glu Val Gln Trp Pro Leu Pro Asp Glu Asn
340 345 350
Gly Ile Ile Gln Lys Asp Trp Ala Ala Met Gln Val Glu Thr Thr Gln
355 360 365
Asp Tyr Ala His Asp Ser His Leu Trp Thr Ser Ile Thr Gly Ser Leu
370 375 380
Asn Tyr Gln Ala Val His His Leu Phe Pro Asn Val Ser Gln His His
385 390 395 400
Tyr Pro Asp Ile Leu Ala Ile Ile Lys Asn Thr Cys Ser Glu Tyr Lys
405 410 415
Val Pro Tyr Leu Val Lys Asp Thr Phe Trp Gln Ala Phe Ala Ser His
420 425 430
Leu Glu His Leu Arg Val Leu Gly Leu Arg Pro Lys Glu Glu
435 440 445
<210>20
<211>447
<212>PRT
<213>Caenorhabditis elegans
<400>20
Met Val Leu Arg Glu Gln Glu His Glu Pro Phe Phe Ile Lys Ile Asp
1 5 10 15
Gly Lys Trp Cys Gln Ile Asp Asp Ala Val Leu Arg Ser His Pro Gly
20 25 30
Gly Ser Ala Ile Thr Thr Tyr Lys Asn Met Asp Ala Thr Thr Val Phe
35 40 45
His Thr Phe His Thr Gly Ser Lys Glu Ala Tyr Gln Trp Leu Thr Glu
50 55 60
Leu Lys Lys Glu Cys Pro Thr Gln Glu Pro Glu Ile Pro Asp Ile Lys
65 70 75 80
Asp Asp Pro Ile Lys Gly Ile Asp Asp Val Asn Met Gly Thr Phe Asn
85 90 95
Ile Ser Glu Lys Arg Ser Ala Gln Ile Asn Lys Ser Phe Thr Asp Leu
100 105 110
Arg Met Arg Val Arg Ala Glu Gly Leu Met Asp Gly Ser Pro Leu Phe
115 120 125
Tyr Ile Arg Lys Ile Leu Glu Thr Ile Phe Thr Ile Leu Phe Ala Phe
130 135 140
Tyr Leu Gln Tyr His Thr Tyr Tyr Leu Pro Ser Ala Ile Leu Met Gly
145 150 155 160
Val Ala Trp Gln Gln Leu Gly Trp Leu Ile His Glu Phe Ala His His
165 170 175
Gln Leu Phe Lys Asn Arg Tyr Tyr Asn Asp Leu Ala Ser Tyr Phe Val
180 185 190
Gly Asn Phe Leu Gln Gly Phe Ser Ser Gly Gly Trp Lys Glu Gln His
195 200 205
Asn Val His His Ala Ala Thr Asn Val Val Gly Arg Asp Gly Asp Leu
210 215 220
Asp Leu Val Pro Phe Tyr Ala Thr Val Ala Glu His Leu Asn Asn Tyr
225 230 235 240
Ser Gln Asp Ser Trp Val Met Thr Leu Phe Arg Trp Gln His Val His
245 250 255
Trp Thr Phe Met Leu Pro Phe Leu Arg Leu Ser Trp Leu Leu Gln Ser
260 265 270
Ile Ile Phe Val Ser Gln Met Pro Thr His Tyr Tyr Asp Tyr Tyr Arg
275 280 285
Asn Thr Ala Ile Tyr Glu Gln Val Gly Leu Ser Leu His Trp Ala Trp
290 295 300
Ser Leu Gly Gln Leu Tyr Phe Leu Pro Asp Trp Ser Thr Arg Ile Met
305 310 315 320
Phe Phe Leu Val Ser His Leu Val Gly Gly Phe Leu Leu Ser His Val
325 330 335
Val Thr Phe Asn His Tyr Ser Val Glu Lys Phe Ala Leu Ser Ser Asn
340 345 350
Ile Met Ser Asn Tyr Ala Cys Leu Gln Ile Met Thr Thr Arg Asn Met
355 360 365
Arg Pro Gly Arg Phe Ile Asp Trp Leu Trp Gly Gly Leu Asn Tyr Gln
370 375 380
Ile Glu His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Thr
385 390 395 400
Val Met Pro Leu Val Lys Glu Phe Ala Ala Ala Asn Gly Leu Pro Tyr
405 410 415
Met Val Asp Asp Tyr Phe Thr Gly Phe Trp Leu Glu Ile Glu Gln Phe
420 425 430
Arg Asn Ile Ala Asn Val Ala Ala Lys Leu Thr Lys Lys Ile Ala
435 440 445
<210>21
<211>444
<212>PRT
<213>Homo sapiens
<400>21
Met Gly Lys Gly Gly Asn Gln Gly Glu Gly Ala Ala Glu Arg Glu Val
1 5 10 15
Ser Val Pro Thr Phe Ser Trp Glu Glu Ile Gln Lys His Asn Leu Arg
20 25 30
Thr Asp Arg Trp Leu Val Ile Asp Arg Lys Val Tyr Asn Ile Thr Lys
35 40 45
Trp Ser Ile Gln His Pro Gly Gly Gln Arg Val Ile Gly His Tyr Ala
50 55 60
Gly Glu Asp Ala Thr Asp Ala Phe Arg Ala Phe His Pro Asp Leu Glu
65 70 75 80
Phe Val Gly Lys Phe Leu Lys Pro Leu Leu Ile Gly Glu Leu Ala Pro
85 90 95
Glu Glu Pro Ser Gln Asp His Gly Lys Asn Ser Lys Ile Thr Glu Asp
100 105 110
Phe Arg Ala Leu Arg Lys Thr Ala Glu Asp Met Asn Leu Phe Lys Thr
115 120 125
Asn His Val Phe Phe Leu Leu Leu Leu Ala His Ile Ile Ala Leu Glu
130 135 140
Ser Ile Ala Trp Phe Thr Val Phe Tyr Phe Gly Asn Gly Trp Ile Pro
145 150 155 160
Thr Leu Ile Thr Ala Phe Val Leu Ala Thr Ser Gln Ala Gln Ala Gly
165 170 175
Trp Leu Gln His Asp Tyr Gly His Leu Ser Val Tyr Arg Lys Pro Lys
180 185 190
Trp Asn His Leu Val His Lys Phe Val Ile Gly His Leu Lys Gly Ala
195 200 205
Ser Ala Asn Trp Trp Asn His Arg His Phe Gln His His Ala Lys Pro
210 215 220
Asn Ile Phe His Lys Asp Pro Asp Val Asn Met Leu His Val Phe Val
225 230 235 240
Leu Gly Glu Trp Gln Pro Ile Glu Tyr Gly Lys Lys Lys Leu Lys Tyr
245 250 255
Leu Pro Tyr Asn His Gln His Glu Tyr Phe Phe Leu Ile Gly Pro Pro
260 265 270
Leu Leu Ile Pro Met Tyr Phe Gln Tyr Gln Ile Ile Met Thr Met Ile
275 280 285
Val His Lys Asn Trp Val Asp Leu Ala Trp Ala Val Ser Tyr Tyr Ile
290 295 300
Arg Phe Phe Ile Thr Tyr Ile Pro Phe Tyr Gly Ile Leu Gly Ala Leu
305 310 315 320
Leu Phe Leu Asn Phe Ile Arg Phe Leu Glu Ser His Trp Phe Val Trp
325 330 335
Val Thr Gln Met Asn His Ile Val Met Glu Ile Asp Gln Glu Ala Tyr
340 345 350
Arg Asp Trp Phe Ser Ser Gln Leu Thr Ala Thr Cys Asn Val Glu Gln
355 360 365
Ser Phe Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
His His Leu Phe Pro Thr Met Pro Arg His Asn Leu His Lys Ile Ala
385 390 395 400
Pro Leu Val Lys Ser Leu Cys Ala Lys His Gly Ile Glu Tyr Gln Glu
405 410 415
Lys Pro Leu Leu Arg Ala Leu Leu Asp Ile Ile Arg Ser Leu Lys Lys
420 425 430
Ser Gly Lys Leu Trp Leu Asp Ala Tyr Leu His Lys
435 440
<210>22
<211>444
<212>PRT
<213>Mus musculus
<400>22
Met Gly Lys Gly Gly Asn Gln Gly Glu Gly Ser Thr Glu Arg Gln Ala
1 5 10 15
Pro Met Pro Thr Phe Arg Trp Glu Glu Ile Gln Lys His Asn Leu Arg
20 25 30
Thr Asp Arg Trp Leu Val Ile Asp Arg Lys Val Tyr Asn Val Thr Lys
35 40 45
Trp Ser Gln Arg His Pro Gly Gly His Arg Val Ile Gly His Tyr Ser
50 55 60
Gly Glu Asp Ala Thr Asp Ala Phe Arg Ala Phe His Leu Asp Leu Asp
65 70 75 80
Phe Val Gly Lys Phe Leu Lys Pro Leu Leu Ile Gly Glu Leu Ala Pro
85 90 95
Glu Glu Pro Ser Leu Asp Arg Gly Lys Ser Ser Gln Ile Thr Glu Asp
100 105 110
Phe Arg Ala Leu Lys Lys Thr Ala Glu Asp Met Asn Leu Phe Lys Thr
115 120 125
Asn His Leu Phe Phe Phe Leu Leu Leu Ser His Ile Ile Val Met Glu
130 135 140
Ser Leu Ala Trp Phe Ile Leu Ser Tyr Phe Gly Thr Gly Trp Ile Pro
145 150 155 160
Thr Leu Val Thr Ala Phe Val Leu Ala Thr Ser Gln Ala Gln Ala Gly
165 170 175
Trp Leu Gln His Asp Tyr Gly His Leu Ser Val Tyr Lys Lys Ser Ile
180 185 190
Trp Asn His Val Val His Lys Phe Val Ile Gly His Leu Lys Gly Ala
195 200 205
Ser Ala Asn Trp Trp Asn His Arg His Phe Gln His His Ala Lys Pro
210 215 220
Asn Ile Phe His Lys Asp Pro Asp Ile Lys Ser Leu His Val Phe Val
225 230 235 240
Leu Gly Glu Trp Gln Pro Leu Glu Tyr Gly Lys Lys Lys Leu Lys Tyr
245 250 255
Leu Pro Tyr Asn His Gln His Glu Tyr Phe Phe Leu Ile Gly Pro Pro
260 265 270
Leu Leu Ile Pro Met Tyr Phe Gln Tyr Gln Ile Ile Met Thr Met Ile
275 280 285
Ser Arg Arg Asp Trp Val Asp Leu Ala Trp Ala Ile Ser Tyr Tyr Met
290 295 300
Arg Phe Phe Tyr Thr Tyr Ile Pro Phe Tyr Gly Ile Leu Gly Ala Leu
305 310 315 320
Val Phe Leu Asn Phe Ile Arg Phe Leu Glu Ser His Trp Phe Val Trp
325 330 335
Val Thr Gln Met Asn His Leu Val Met Glu Ile Asp Leu Asp His Tyr
340 345 350
Arg Asp Trp Phe Ser Ser Gln Leu Ala Ala Thr Cys Asn Val Glu Gln
355 360 365
Ser Phe Phe Asn Asp Trp Phe Ser Gly His Leu Asn Phe Gln Ile Glu
370 375 380
His His Leu Phe Pro Thr Met Pro Arg His Asn Leu His Lys Ile Ala
385 390 395 400
Pro Leu Val Lys Ser Leu Cys Ala Lys His Gly Ile Glu Tyr Gln Glu
405 410 415
Lys Pro Leu Leu Arg Ala Leu Ile Asp Ile Val Ser Ser Leu Lys Lys
420 425 430
Ser Gly Glu Leu Trp Leu Asp Ala Tyr Leu His Lys
435 440
<210>23
<211>459
<212>PRT
<213>Pythium irregulare
<400>23
Met Val Asp Leu Lys Pro Gly Val Lys Arg Leu Val Ser Trp Lys Glu
1 5 10 15
Ile Arg Glu His Ala Thr Pro Ala Thr Ala Trp Ile Val Ile His His
20 25 30
Lys Val Tyr Asp Ile Ser Lys Trp Asp Ser His Pro Gly Gly Ser Val
35 40 45
Met Leu Thr Gln Ala Gly Glu Asp Ala Thr Asp Ala Phe Ala Val Phe
50 55 60
His Pro Ser Ser Ala Leu Lys Leu Leu Glu Gln Phe Tyr Val Gly Asp
65 70 75 80
Val Asp Glu Thr Ser Lys Ala Glu Ile Glu Gly Glu Pro Ala Ser Asp
85 90 95
Glu Glu Arg Ala Arg Arg Glu Arg Ile Asn Glu Phe Ile Ala Ser Tyr
100 105 110
Arg Arg Leu Arg Val Lys Val Lys Gly Met Gly Leu Tyr Asp Ala Ser
115 120 125
Ala Leu Tyr Tyr Ala Trp Lys Leu Val Ser Thr Phe Gly Ile Ala Val
130 135 140
Leu Ser Met Ala Ile Cys Phe Phe Phe Asn Ser Phe Ala Met Tyr Met
145 150 155 160
Val Ala Gly Val Ile Met Gly Leu Phe Tyr Gln Gln Ser Gly Trp Leu
165 170 175
Ala His Asp Phe Leu His Asn Gln Val Cys Glu Asn Arg Thr Leu Gly
180 185 190
Asn Leu Ile Gly Cys Leu Val Gly Asn Ala Trp Gln Gly Phe Ser Val
195 200 205
Gln Trp Trp Lys Asn Lys His Asn Leu His His Ala Val Pro Asn Leu
210 215 220
His Ser Ala Lys Asp Glu Gly Phe Ile Gly Asp Pro Asp Ile Asp Thr
225 230 235 240
Met Pro Leu Leu Ala Trp Ser Lys Glu Met Ala Arg Lys Ala Phe Glu
245 250 255
Ser Ala His Gly Pro Phe Phe Ile Arg Asn Gln Ala Phe Leu Tyr Phe
260 265 270
Pro Leu Leu Leu Leu Ala Arg Leu Ser Trp Leu Ala Gln Ser Phe Phe
275 280 285
Tyr Val Phe Thr Glu Phe Ser Phe Gly Ile Phe Asp Lys Val Glu Phe
290 295 300
Asp Gly Pro Glu Lys Ala Gly Leu Ile Val His Tyr Ile Trp Gln Leu
305 310 315 320
Ala Ile Pro Tyr Phe Cys Asn Met Ser Leu Phe Glu Gly Val Ala Tyr
325 330 335
Phe Leu Met Gly Gln Ala Ser Cys Gly Leu Leu Leu Ala Leu Val Phe
340 345 350
Ser Ile Gly His Asn Gly Met Ser Val Tyr Glu Arg Glu Thr Lys Pro
355 360 365
Asp Phe Trp Gln Leu Gln Val Thr Thr Thr Arg Asn Ile Arg Ala Ser
370 375 380
Val Phe Met Asp Trp Phe Thr Gly Gly Leu Asn Tyr Gln Ile Asp His
385 390 395 400
His Leu Phe Pro Leu Val Pro Arg His Asn Leu Pro Lys Val Asn Val
405 410 415
Leu Ile Lys Ser Leu Cys Lys Glu Phe Asp Ile Pro Phe His Glu Thr
420 425 430
Gly Phe Trp Glu Gly Ile Tyr Glu Val Val Asp His Leu Ala Asp Ile
435 440 445
Ser Lys Glu Phe Ile Thr Glu Phe Pro Ala Met
450 455
<210>24
<211>448
<212>PRT
<213>Borago officinalis
<400>24
Met Ala Ala Gln Ile Lys Lys Tyr Ile Thr Ser Asp Glu Leu Lys Asn
1 5 10 15
His Asp Lys Pro Gly Asp Leu Trp Ile Ser Ile Gln Gly Lys Ala Tyr
20 25 30
Asp Val Ser Asp Trp Val Lys Asp His Pro Gly Gly Ser Phe Pro Leu
35 40 45
Lys Ser Leu Ala Gly Gln Glu Val Thr Asp Ala Phe Val Ala Phe His
50 55 60
Pro Ala Ser Thr Trp Lys Asn Leu Asp Lys Phe Phe Thr Gly Tyr Tyr
65 70 75 80
Leu Lys Asp Tyr Ser Val Ser Glu Val Ser Lys Asp Tyr Arg Lys Leu
85 90 95
Val Phe Glu Phe Ser Lys Met Gly Leu Tyr Asp Lys Lys Gly His Ile
100 105 110
Met Phe Ala Thr Leu Cys Phe Ile Ala Met Leu Phe Ala Met Ser Val
115 120 125
Tyr Gly Val Leu Phe Cys Glu Gly Val Leu Val His Leu Phe Ser Gly
130 135 140
Cys Leu Met Gly Phe Leu Trp Ile Gln Ser Gly Trp Ile Gly His Asp
145 150 155 160
Ala Gly His Tyr Met Val Val Ser Asp Ser Arg Leu Asn Lys Phe Met
165 170 175
Gly Ile Phe Ala Ala Asn Cys Leu Ser Gly Ile Ser Ile Gly Trp Trp
180 185 190
Lys Trp Asn His Asn Ala His His Ile Ala Cys Asn Ser Leu Glu Tyr
195 200 205
Asp Pro Asp Leu Gln Tyr Ile Pro Phe Leu Val Val Ser Ser Lys Phe
210 215 220
Phe Gly Ser Leu Thr Ser His Phe Tyr Glu Lys Arg Leu Thr Phe Asp
225 230 235 240
Ser Leu Ser Arg Phe Phe Val Ser Tyr Gln His Trp Thr Phe Tyr Pro
245 250 255
Ile Met Cys Ala Ala Arg Leu Asn Met Tyr Val Gln Ser Leu Ile Met
260 265 270
Leu Leu Thr Lys Arg Asn Val Ser Tyr Arg Ala Gln Glu Leu Leu Gly
275 280 285
Cys Leu Val Phe Ser Ile Trp Tyr Pro Leu Leu Val Ser Cys Leu Pro
290 295 300
Asn Trp Gly Glu Arg Ile Met Phe Val Ile Ala Ser Leu Ser Val Thr
305 310 315 320
Gly Met Gln Gln Val Gln Phe Ser Leu Asn His Phe Ser Ser Ser Val
325 330 335
Tyr Val Gly Lys Pro Lys Gly Asn Asn Trp Phe Glu Lys Gln Thr Asp
340 345 350
Gly Thr Leu Asp Ile Ser Cys Pro Pro Trp Met Asp Trp Phe His Gly
355 360 365
Gly Leu Gln Phe Gln Ile Glu His His Leu Phe Pro Lys Met Pro Arg
370 375 380
Cys Asn Leu Arg Lys Ile Ser Pro Tyr Val Ile Glu Leu Cys Lys Lys
385 390 395 400
His Asn Leu Pro Tyr Asn Tyr Ala Ser Phe Ser Lys Ala Asn Glu Met
405 410 415
Thr Leu Arg Thr Leu Arg Asn Thr Ala Leu Gln Ala Arg Asp Ile Thr
420 425 430
Lys Pro Leu Pro Lys Asn Leu Val Trp Glu Ala Leu His Thr His Gly
435 440 445
<210>25
<211>446
<212>PRT
<213>Anemone leveillei
<400>25
Met Ala Glu Lys Arg Arg Ser Ile Ser Ser Asp Asp Leu Arg Ser His
1 5 10 15
Asn Lys Pro Gly Asp Val Trp Ile Ser Ile Gln Gly Lys Ile Tyr Asp
20 25 30
Val Thr Glu Trp Gly Lys Asp His Pro Gly Gly Glu Gly Pro Leu Leu
35 40 45
Asn Leu Ala Gly Gln Asp Val Thr Asp Ala Phe Val Ala Phe His Pro
50 55 60
Gly Ser Ala Trp Lys Asn Leu Asp Lys Phe His Ile Gly Tyr Leu Gln
65 70 75 80
Asp Tyr Val Val Ser Asp Val Ser Lys Asp Tyr Arg Lys Leu Val Ser
85 90 95
Glu Phe Ser Lys Ala Gly Leu Tyr Glu Lys Lys Gly His Gly His Leu
100 105 110
Ile Arg Leu Leu Val Met Ser Leu Val Phe Ile Ala Ser Val Ser Gly
115 120 125
Val Val Leu Ser Asp Lys Thr Ser Val His Val Gly Ser Ala Val Leu
130 135 140
Leu Ala Val Ile Trp Met Gln Phe Gly Phe Ile Gly His Asp Ser Gly
145 150 155 160
His Tyr Asn Ile Met Thr Ser Pro Glu Leu Asn Arg Tyr Met Gln Ile
165 170 175
Phe Ser Val Asn Val Val Ser Gly Val Ser Val Gly Trp Trp Lys Arg
180 185 190
Tyr His Asn Ala His His Ile Ala Val Asn Ser Leu Glu Tyr Asp Pro
195 200 205
Asp Leu Gln Tyr Val Pro Phe Leu Val Val Ser Thr Ala Ile Phe Asp
210 215 220
Ser Leu Thr Ser His Phe Tyr Arg Lys Lys Met Thr Phe Asp Ala Val
225 230 235 240
Ala Arg Phe Leu Val Ser Phe Gln His Trp Thr Phe Tyr Pro Leu Met
245 250 255
Ala Ile Gly Arg Val Ser Phe Leu Ala Gln Ser Ile Gly Val Leu Leu
260 265 270
Ser Lys Lys Pro Leu Pro Asp Arg His Leu Glu Trp Phe Gly Leu Val
275 280 285
Val Phe Trp Ala Trp Tyr Ser Leu Leu Ile Ser Cys Leu Pro Asn Trp
290 295 300
Trp Glu Arg Val Ile Phe Ile Ala Val Asn Phe Ala Val Thr Gly Ile
305 310 315 320
Gln His Val Gln Phe Cys Leu Asn His Tyr Ser Ala Gln Thr Tyr Ile
325 330 335
Gly Ala Pro Cys Ala Asn Asp Trp Phe Glu Lys Gln Thr Lys Gly Ser
340 345 350
Ile Asp Ile Ser Cys Ser Pro Trp Thr Asp Trp Phe His Gly Gly Leu
355 360 365
Gln Phe Gln Ile Glu His His Leu Phe Pro Arg Met Pro Arg Cys Asn
370 375 380
Leu Arg Lys Ile Ser Pro Phe Val Lys Glu Leu Cys Arg Lys His Asn
385 390 395 400
Leu Val Tyr Thr Ser Val Ser Phe Phe Glu Gly Asn Arg Arg Thr Leu
405 410 415
Ala Thr Leu Lys Asn Ala Ala Leu Lys Ala Arg Asp Leu Thr Ser Pro
420 425 430
Ile Pro Lys Asn Leu Val Trp Glu Ala Val His Thr His Gly
435 440 445
<210>26
<211>520
<212>PRT
<213>Ceratodon purpureus
<400>26
Met Val Ser Gln Gly Gly Gly Leu Ser Gln Gly Ser Ile Glu Glu Asn
1 5 10 15
Ile Asp Val Glu His Leu Ala Thr Met Pro Leu Val Ser Asp Phe Leu
20 25 30
Asn Val Leu Gly Thr Thr Leu Gly Gln Trp Ser Leu Ser Thr Thr Phe
35 40 45
Ala Phe Lys Arg Leu Thr Thr Lys Lys His Ser Ser Asp Ile Ser Val
50 55 60
Glu Ala Gln Lys Glu Ser Val Ala Arg Gly Pro Val Glu Asn Ile Ser
65 70 75 80
Gln Ser Val Ala Gln Pro Ile Arg Arg Arg Trp Val Gln Asp Lys Lys
85 90 95
Pro Val Thr Tyr Ser Leu Lys Asp Val Ala Ser His Asp Met Pro Gln
100 105 110
Asp Cys Trp Ile Ile Ile Lys Glu Lys Val Tyr Asp Val Ser Thr Phe
115 120 125
Ala Glu Gln His Pro Gly Gly Thr Val Ile Asn Thr Tyr Phe Gly Arg
130 135 140
Asp Ala Thr Asp Val Phe Ser Thr Phe His Ala Ser Thr Ser Trp Lys
145 150 155 160
Ile Leu Gln Asn Phe Tyr Ile Gly Asn Leu Val Arg Glu Glu Pro Thr
165 170 175
Leu Glu Leu Leu Lys Glu Tyr Arg Glu Leu Arg Ala Leu Phe Leu Arg
180 185 190
Glu Gln Leu Phe Lys Ser Ser Lys Ser Tyr Tyr Leu Phe Lys Thr Leu
195 200 205
Ile Asn Val Ser Ile Val Ala Thr Ser Ile Ala Ile Ile Ser Leu Tyr
210 215 220
Lys Ser Tyr Arg Ala Val Leu Leu Ser Ala Ser Leu Met Gly Leu Phe
225 230 235 240
Ile Gln Gln Cys Gly Trp Leu Ser His Asp Phe Leu His His Gln Val
245 250 255
Phe Glu Thr Arg Trp Leu Asn Asp Val Val Gly Tyr Val Val Gly Asn
260 265 270
Val Val Leu Gly Phe Ser Val Ser Trp Trp Lys Thr Lys His Asn Leu
275 280 285
His His Ala Ala Pro Asn Glu Cys Asp Gln Lys Tyr Thr Pro Ile Asp
290 295 300
Glu Asp Ile Asp Thr Leu Pro Ile Ile Ala Trp Ser Lys Asp Leu Leu
305 310 315 320
Ala Thr Val Glu Ser Lys Thr Met Leu Arg Val Leu Gln Tyr Gln His
325 330 335
Leu Phe Phe Leu Val Leu Leu Thr Phe Ala Arg Ala Ser Trp Leu Phe
340 345 350
Trp Ser Ala Ala Phe Thr Leu Arg Pro Glu Leu Thr Leu Gly Glu Lys
355 360 365
Leu Leu Glu Arg Gly Thr Met Ala Leu His Tyr Ile Trp Phe Asn Ser
370 375 380
Val Ala Phe Tyr Leu Leu Pro Gly Trp Lys Pro Val Val Trp Met Val
385 390 395 400
Val Ser Glu Leu Met Ser Gly Phe Leu Leu Gly Tyr Val Phe Val Leu
405 410 415
Ser His Asn Gly Met Glu Val Tyr Asn Thr Ser Lys Asp Phe Val Asn
420 425 430
Ala Gln Ile Ala Ser Thr Arg Asp Ile Lys Ala Gly Val Phe Asn Asp
435 440 445
Trp Phe Thr Gly Gly Leu Asn Arg Gln Ile Glu His His Leu Phe Pro
450 455 460
Thr Met Pro Arg His Asn Leu Asn Lys Ile Ser Pro His Val Glu Thr
465 470 475 480
Leu Cys Lys Lys His Gly Leu Val Tyr Glu Asp Val Ser Met Ala Ser
485 490 495
Gly Thr Tyr Arg Val Leu Lys Thr Leu Lys Asp Val Ala Asp Ala Ala
500 505 510
Ser His Gln Gln Leu Ala Ala Ser
515 520
<210>27
<211>525
<212>PRT
<213>Physcomitrella patens
<400>27
Met Val Phe Ala Gly Gly Gly Leu Gln Gln Gly Ser Leu Glu Glu Asn
1 5 10 15
Ile Asp Val Glu His Ile Ala Ser Met Ser Leu Phe Ser Asp Phe Phe
20 25 30
Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser Ile Gln
35 40 45
Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala
50 55 60
Val Gln Cys Ile Ser Ala Glu Val Gln Arg Asn Ser Ser Thr Gln Gly
65 70 75 80
Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg
85 90 95
Ser Ser Gln Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val
100 105 110
His Asn Lys Pro Ser Asp Cys Trp Ile Val Val Lys Asn Lys Val Tyr
115 120 125
Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val Ile Ser
130 135 140
Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala
145 150 155 160
Ala Ser Thr Trp Lys Ile Leu Gln Asp Phe Tyr Ile Gly Asp Val Glu
165 170 175
Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg
180 185 190
Ala Leu Phe Leu Arg Glu Gln Leu Phe Lys Ser Ser Lys Leu Tyr Tyr
195 200 205
Val Met Lys Leu Leu Thr Asn Val Ala Ile Phe Ala Ala Ser Ile Ala
210 215 220
Ile Ile Cys Trp Ser Lys Thr Ile Ser Ala Val Leu Ala Ser Ala Cys
225 230 235 240
Met Met Ala Leu Cys Phe Gln Gln Cys Gly Trp Leu Ser His Asp Phe
245 250 255
Leu His Asn Gln Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly
260 265 270
Tyr Val Ile Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys
275 280 285
Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gln Thr
290 295 300
Tyr Gln Pro Ile Asp Glu Asp Ile Asp Thr Leu Pro Leu Ile Ala Trp
305 310 315 320
Ser Lys Asp Ile Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg Ile
325 330 335
Leu Gln Tyr Gln His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg
340 345 350
Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu
355 360 365
Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr
370 375 380
Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro
385 390 395 400
Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly
405 410 415
Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser
420 425 430
Lys Glu Phe Val Ser Ala Gln Ile Val Ser Thr Arg Asp Ile Lys Gly
435 440 445
Asn Ile Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gln Ile Glu
450 455 460
His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys Ile Ala
465 470 475 480
Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp
485 490 495
Val Ser Ile Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu
500 505 510
Val Ala Glu Ala Ala Ala Glu Gln His Ala Thr Thr Ser
515 520 525
<210>28
<211>457
<212>PRT
<213>Mortierella alpina
<400>28
Met Ala Ala Ala Pro Ser Val Arg Thr Phe Thr Arg Ala Glu Ile Leu
1 5 10 15
Asn Ala Glu Ala Leu Asn Glu Gly Lys Lys Asp Ala Glu Ala Pro Phe
20 25 30
Leu Met Ile Ile Asp Asn Lys Val Tyr Asp Val Arg Glu Phe Val Pro
35 40 45
Asp His Pro Gly Gly Ser Val Ile Leu Thr His Val Gly Lys Asp Gly
50 55 60
Thr Asp Val Phe Asp Thr Phe His Pro Glu Ala Ala Trp Glu Thr Leu
65 70 75 80
Ala Asn Phe Tyr Val Gly Asp Ile Asp Glu Ser Asp Arg Ala Ile Lys
85 90 95
Asn Asp Asp Phe Ala Ala Glu Val Arg Lys Leu Arg Thr Leu Phe Gln
100 105 110
Ser Leu Gly Tyr Tyr Asp Ser Ser Lys Ala Tyr Tyr Ala Phe Lys Val
115 120 125
Ser Phe Asn Leu Cys Ile Trp Gly Leu Ser Thr Phe Ile Val Ala Lys
130 135 140
Trp Gly Gln Thr Ser Thr Leu Ala Asn Val Leu Ser Ala Ala Leu Leu
145 150 155 160
Gly Leu Phe Trp Gln Gln Cys Gly Trp Leu Ala His Asp Phe Leu His
165 170 175
His Gln Val Phe Gln Asp Arg Phe Trp Gly Asp Leu Phe Gly Ala Phe
180 185 190
Leu Gly Gly Val Cys Gln Gly Phe Ser Ser Ser Trp Trp Lys Asp Lys
195 200 205
His Asn Thr His His Ala Ala Pro Asn Val His Gly Glu Asp Pro Asp
210 215 220
Ile Asp Thr His Pro Leu Leu Thr Trp Ser Glu His Ala Leu Glu Met
225 230 235 240
Phe Ser Asp Val Pro Asp Glu Glu Leu Thr Arg Met Trp Ser Arg Phe
245 250 255
Met Val Leu Asn Gln Thr Trp Phe Tyr Phe Pro Ile Leu Ser Phe Ala
260 265 270
Arg Leu Ser Trp Cys Leu Gln Ser Ile Met Phe Val Leu Pro Asn Gly
275 280 285
Gln Ala His Lys Pro Ser Gly Ala Arg Val Pro Ile Ser Leu Val Glu
290 295 300
Gln Leu Ser Leu Ala Met His Trp Thr Trp Tyr Leu Ala Thr Met Phe
305 310 315 320
Leu Phe Ile Lys Asp Pro Val Asn Met Ile Val Tyr Phe Leu Val Ser
325 330 335
Gln Ala Val Cys Gly Asn Leu Leu Ala Ile Val Phe Ser Leu Asn His
340 345 350
Asn Gly Met Pro Val Ile Ser Lys Glu Glu Ala Val Asp Met Asp Phe
355 360 365
Phe Thr Lys Gln Ile Ile Thr Gly Arg Asp Val His Pro Gly Leu Phe
370 375 380
Ala Asn Trp Phe Thr Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu
385 390 395 400
Phe Pro Ser Met Pro Arg His Asn Phe Ser Lys Ile Gln Pro Ala Val
405 410 415
Glu Thr Leu Cys Lys Lys Tyr Gly Val Arg Tyr His Thr Thr Gly Met
420 425 430
Ile Glu Gly Thr Ala Glu Val Phe Ser Arg Leu Asn Glu Val Ser Lys
435 440 445
Ala Ala Ser Lys Met Gly Lys Ala Gln
450 455
<210>29
<211>443
<212>PRT
<213>Caenorhabditis elegans
<400>29
Met Val Val Asp Lys Asn Ala Ser Gly Leu Arg Met Lys Val Asp Gly
1 5 10 15
Lys Trp Leu Tyr Leu Ser Glu Glu Leu Val Lys Lys His Pro Gly Gly
20 25 30
Ala Val Ile Glu Gln Tyr Arg Asn Ser Asp Ala Thr His Ile Phe His
35 40 45
Ala Phe His Glu Gly Ser Ser Gln Ala Tyr Lys Gln Leu Asp Leu Leu
50 55 60
Lys Lys His Gly Glu His Asp Glu Phe Leu Glu Lys Gln Leu Glu Lys
65 70 75 80
Arg Leu Asp Lys Val Asp Ile Asn Val Ser Ala Tyr Asp Val Ser Val
85 90 95
Ala Gln Glu Lys Lys Met Val Glu Ser Phe Glu Lys Leu Arg Gln Lys
100 105 110
Leu His Asp Asp Gly Leu Met Lys Ala Asn Glu Thr Tyr Phe Leu Phe
115 120 125
Lys Ala Ile Ser Thr Leu Ser Ile Met Ala Phe Ala Phe Tyr Leu Gln
130 135 140
Tyr Leu Gly Trp Tyr Ile Thr Ser Ala Cys Leu Leu Ala Leu Ala Trp
145 150 155 160
Gln Gln Phe Gly Trp Leu Thr His Glu Phe Cys His Gln Gln Pro Thr
165 170 175
Lys Asn Arg Pro Leu Asn Asp Thr Ile Ser Leu Phe Phe Gly Asn Phe
180 185 190
Leu Gln Gly Phe Ser Arg Asp Trp Trp Lys Asp Lys His Asn Thr His
195 200 205
His Ala Ala Thr Asn Val Ile Asp His Asp Gly Asp Ile Asp Leu Ala
210 215 220
Pro Leu Phe Ala Phe Ile Pro Gly Asp Leu Cys Lys Tyr Lys Ala Ser
225 230 235 240
Phe Glu Lys Ala Ile Leu Lys Ile Val Pro Tyr Gln His Leu Tyr Phe
245 250 255
Thr Ala Met Leu Pro Met Leu Arg Phe Ser Trp Thr Gly Gln Ser Val
260 265 270
Gln Trp Val Phe Lys Glu Asn Gln Met Glu Tyr Lys Val Tyr Gln Arg
275 280 285
Asn Ala Phe Trp Glu Gln Ala Thr Ile Val Gly His Trp Ala Trp Val
290 295 300
Phe Tyr Gln Leu Phe Leu Leu Pro Thr Trp Pro Leu Arg Val Ala Tyr
305 310 315 320
Phe Ile Ile Ser Gln Met Gly Gly Gly Leu Leu Ile Ala His Val Val
325 330 335
Thr Phe Asn His Asn Ser Val Asp Lys Tyr Pro Ala Asn Ser Arg Ile
340 345 350
Leu Asn Asn Phe Ala Ala Leu Gln Ile Leu Thr Thr Arg Asn Met Thr
355 360 365
Pro Ser Pro Phe Ile Asp Trp Leu Trp Gly Gly Leu Asn Tyr Gln Ile
370 375 380
Glu His His Leu Phe Pro Thr Met Pro Arg Cys Asn Leu Asn Ala Cys
385 390 395 400
Val Lys Tyr Val Lys Glu Trp Cys Lys Glu Asn Asn Leu Pro Tyr Leu
405 410 415
Val Asp Asp Tyr Phe Asp Gly Tyr Ala Met Asn Leu Gln Gln Leu Lys
420 425 430
Asn Met Ala Glu His Ile Gln Ala Lys Ala Ala
435 440
<210>30
<211>299
<212>PRT
<213>Homo sapiens
<400>30
Met Glu His Phe Asp Ala Ser Leu Ser Thr Tyr Phe Lys Ala Leu Leu
1 5 10 15
Gly Pro Arg Asp Thr Arg Val Lys Gly Trp Phe Leu Leu Asp Asn Tyr
20 25 30
Ile Pro Thr Phe Ile Cys Ser Val Ile Tyr Leu Leu Ile Val Trp Leu
35 40 45
Gly Pro Lys Tyr Met Arg Asn Lys Gln Pro Phe Ser Cys Arg Gly Ile
50 55 60
Leu Val Val Tyr Asn Leu Gly Leu Thr Leu Leu Ser Leu Tyr Met Phe
65 70 75 80
Cys Glu Leu Val Thr Gly Val Trp Glu Gly Lys Tyr Asn Phe Phe Cys
85 90 95
Gln Gly Thr Arg Thr Ala Gly Glu Ser Asp Met Lys Ile Ile Arg Val
100 105 110
Leu Trp Trp Tyr Tyr Phe Ser Lys Leu Ile Glu Phe Met Asp Thr Phe
115 120 125
Phe Phe Ile Leu Arg Lys Asn Asn His Gln Ile Thr Val Leu His Val
130 135 140
Tyr His His Ala Ser Met Leu Asn Ile Trp Trp Phe Val Met Asn Trp
145 150 155 160
Val Pro Cys Gly His Ser Tyr Phe Gly Ala Thr Leu Asn Ser Phe Ile
165 170 175
His Val Leu Met Tyr Ser Tyr Tyr Gly Leu Ser Ser Val Pro Ser Met
180 185 190
Arg Pro Tyr Leu Trp Trp Lys Lys Tyr Ile Thr Gln Gly Gln Leu Leu
195 200 205
Gln Phe Val Leu Thr Ile Ile Gln Thr Ser Cys Gly Val Ile Trp Pro
210 215 220
Cys Thr Phe Pro Leu Gly Trp Leu Tyr Phe Gln Ile Gly Tyr Met Ile
225 230 235 240
Ser Leu Ile Ala Leu Phe Thr Asn Phe Tyr Ile Gln Thr Tyr Asn Lys
245 250 255
Lys Gly Ala Ser Arg Arg Lys Asp His Leu Lys Asp His Gln Asn Gly
260 265 270
Ser Met Ala Ala Val Asn Gly His Thr Asn Ser Phe Ser Pro Leu Glu
275 280 285
Asn Asn Val Lys Pro Arg Lys Leu Arg Lys Asp
290 295
<210>31
<211>290
<212>PRT
<213>Physcomitrella patens
<400>31
Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser
1 5 10 15
Gln Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp
20 25 30
Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro Ile
35 40 45
Val Leu Gly Val Ser Val Tyr Leu Thr Ile Val Ile Gly Gly Leu Leu
50 55 60
Trp Ile Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu
65 70 75 80
Leu Gln Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser
85 90 95
Leu Tyr Met Cys Val Gly Ile Ala Tyr Gln Ala Ile Thr Trp Arg Tyr
100 105 110
Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala Ile
115 120 125
Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr
130 135 140
Val Ile Met Ile Leu Lys Arg Ser Thr Arg Gln Ile Ser Phe Leu His
145 150 155 160
Val Tyr His His Ser Ser Ile Ser Leu Ile Trp Trp Ala Ile Ala His
165 170 175
His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly
180 185 190
Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg
195 200 205
Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu
210 215 220
Thr Gln Phe Gln Met Phe Gln Phe Met Leu Asn Leu Val Gln Ala Tyr
225 230 235 240
Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gln Trp Leu Ile Lys Ile
245 250 255
Leu Phe Tyr Tyr Met Ile Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr
260 265 270
Val Gln Lys Tyr Ile Lys Pro Ser Asp Gly Lys Gln Lys Gly Ala Lys
275 280 285
Thr Glu
290
<210>32
<211>318
<212>PRT
<213>Mortierella alpina
<400>32
Met Glu Ser Ile Ala Pro Phe Leu Pro Ser Lys Met Pro Gln Asp Leu
1 5 10 15
Phe Met Asp Leu Ala Thr Ala Ile Gly Val Arg Ala Ala Pro Tyr Val
20 25 30
Asp Pro Leu Glu Ala Ala Leu Val Ala Gln Ala Glu Lys Tyr Ile Pro
35 40 45
Thr Ile Val His His Thr Arg Gly Phe Leu Val Ala Val Glu Ser Pro
50 55 60
Leu Ala Arg Glu Leu Pro Leu Met Asn Pro Phe His Val Leu Leu Ile
65 70 75 80
Val Leu Ala Tyr Leu Val Thr Val Phe Val Gly Met Gln Ile Met Lys
85 90 95
Asn Phe Glu Arg Phe Glu Val Lys Thr Phe Ser Leu Leu His Asn Phe
100 105 110
Cys Leu Val Ser Ile Ser Ala Tyr Met Cys Gly Gly Ile Leu Tyr Glu
115 120 125
Ala Tyr Gln Ala Asn Tyr Gly Leu Phe Glu Asn Ala Ala Asp His Thr
130 135 140
Phe Lys Gly Leu Pro Met Ala Lys Met Ile Trp Leu Phe Tyr Phe Ser
145 150 155 160
Lys Ile Met Glu Phe Val Asp Thr Met Ile Met Val Leu Lys Lys Asn
165 170 175
Asn Arg Gln Ile Ser Phe Leu His Val Tyr His His Ser Ser Ile Phe
180 185 190
Thr Ile Trp Trp Leu Val Thr Phe Val Ala Pro Asn Gly Glu Ala Tyr
195 200 205
Phe Ser Ala Ala Leu Asn Ser Phe Ile His Val Ile Met Tyr Gly Tyr
210 215 220
Tyr Phe Leu Ser Ala Leu Gly Phe Lys Gln Val Ser Phe Ile Lys Phe
225 230 235 240
Tyr Ile Thr Arg Ser Gln Met Thr Gln Phe Cys Met Met Ser Val Gln
245 250 255
Ser Ser Trp Asp Met Tyr Ala Met Lys Val Leu Gly Arg Pro Gly Tyr
260 265 270
Pro Phe Phe Ile Thr Ala Leu Leu Trp Phe Tyr Met Trp Thr Met Leu
275 280 285
Gly Leu Phe Tyr Asn Phe Tyr Arg Lys Asn Ala Lys Leu Ala Lys Gln
290 295 300
Ala Lys Ala Asp Ala Ala Lys Glu Lys Ala Arg Lys Leu Gln
305 310 315
<210>33
<211>519
<212>PRT
<213>Thraustochytrium sp.
<400>33
Met Thr Val Gly Tyr Asp Glu Glu Ile Pro Phe Glu Gln Val Arg Ala
1 5 10 15
His Asn Lys Pro Asp Asp Ala Trp Cys Ala Ile His Gly His Val Tyr
20 25 30
Asp Val Thr Lys Phe Ala Ser Val His Pro Gly Gly Asp Ile Ile Leu
35 40 45
Leu Ala Ala Gly Lys Glu Ala Thr Val Leu Tyr Glu Thr Tyr His Val
50 55 60
Arg Gly Val Ser Asp Ala Val Leu Arg Lys Tyr Arg Ile Gly Lys Leu
65 70 75 80
Pro Asp Gly Gln Gly Gly Ala Asn Glu Lys Glu Lys Arg Thr Leu Ser
85 90 95
Gly Leu Ser Ser Ala Ser Tyr Tyr Thr Trp Asn Ser Asp Phe Tyr Arg
100 105 110
Val Met Arg Glu Arg Val Val Ala Arg Leu Lys Glu Arg Gly Lys Ala
115 120 125
Arg Arg Gly Gly Tyr Glu Leu Trp Ile Lys Ala Phe Leu Leu Leu Val
130 135 140
Gly Phe Trp Ser Ser Leu Tyr Trp Met Cys Thr Leu Asp Pro Ser Phe
145 150 155 160
Gly Ala Ile Leu Ala Ala Met Ser Leu Gly Val Phe Ala Ala Phe Val
165 170 175
Gly Thr Cys Ile Gln His Asp Gly Asn His Gly Ala Phe Ala Gln Ser
180 185 190
Arg Trp Val Asn Lys Val Ala Gly Trp Thr Leu Asp Met Ile Gly Ala
195 200 205
Ser Gly Met Thr Trp Glu Phe Gln His Val Leu Gly His His Pro Tyr
210 215 220
Thr Asn Leu Ile Glu Glu Glu Asn Gly Leu Gln Lys Val Ser Gly Lys
225 230 235 240
Lys Met Asp Thr Lys Leu Ala Asp Gln Glu Ser Asp Pro Asp Val Phe
245 250 255
Ser Thr Tyr Pro Met Met Arg Leu His Pro Trp His Gln Lys Arg Trp
260 265 270
Tyr His Arg Phe Gln His Ile Tyr Gly Pro Phe Ile Phe Gly Phe Met
275 280 285
Thr Ile Asn Lys Val Val Thr Gln Asp Val Gly Val Val Leu Arg Lys
290 295 300
Arg Leu Phe Gln Ile Asp Ala Glu Cys Arg Tyr Ala Ser Pro Met Tyr
305 310 315 320
Val Ala Arg Phe Trp Ile Met Lys Ala Leu Thr Val Leu Tyr Met Val
325 330 335
Ala Leu Pro Cys Tyr Met Gln Gly Pro Trp His Gly Leu Lys Leu Phe
340 345 350
Ala Ile Ala His Phe Thr Cys Gly Glu Val Leu Ala Thr Met Phe Ile
355 360 365
Val Asn His Ile Ile Glu Gly Val Ser Tyr Ala Ser Lys Asp Ala Val
370 375 380
Lys Gly Thr Met Ala Pro Pro Lys Thr Met His Gly Val Thr Pro Met
385 390 395 400
Asn Asn Thr Arg Lys Glu Val Glu Ala Glu Ala Ser Lys Ser Gly Ala
405 410 415
Val Val Lys Ser Val Pro Leu Asp Asp Trp Ala Val Val Gln Cys Gln
420 425 430
Thr Ser Val Asn Trp Ser Val Gly Ser Trp Phe Trp Asn His Phe Ser
435 440 445
Gly Gly Leu Asn His Gln Ile Glu His His Leu Phe Pro Gly Leu Ser
450 455 460
His Glu Thr Tyr Tyr His Ile Gln Asp Val Phe Gln Ser Thr Cys Ala
465 470 475 480
Glu Tyr Gly Val Pro Tyr Gln His Glu Pro Ser Leu Trp Thr Ala Tyr
485 490 495
Trp Lys Met Leu Glu His Leu Arg Gln Leu Gly Asn Glu Glu Thr His
500 505 510
Glu Ser Trp Gln Arg Ala Ala
515
<210>34
<211>541
<212>PRT
<213>Euglena gracilis
<400>34
Met Leu Val Leu Phe Gly Asn Phe Tyr Val Lys Gln Tyr Ser Gln Lys
1 5 10 15
Asn Gly Lys Pro Glu Asn Gly Ala Thr Pro Glu Asn Gly Ala Lys Pro
20 25 30
Gln Pro Cys Glu Asn Gly Thr Val Glu Lys Arg Glu Asn Asp Thr Ala
35 40 45
Asn Val Arg Pro Thr Arg Pro Ala Gly Pro Pro Pro Ala Thr Tyr Tyr
50 55 60
Asp Ser Leu Ala Val Ser Gly Gln Gly Lys Glu Arg Leu Phe Thr Thr
65 70 75 80
Asp Glu Val Arg Arg His Ile Leu Pro Thr Asp Gly Trp Leu Thr Cys
85 90 95
His Glu Gly Val Tyr Asp Val Thr Asp Phe Leu Ala Lys His Pro Gly
100 105 110
Gly Gly Val Ile Thr Leu Gly Leu Gly Arg Asp Cys Thr Ile Leu Ile
115 120 125
Glu Ser Tyr His Pro Ala Gly Arg Pro Asp Lys Val Met Glu Lys Tyr
130 135 140
Arg Ile Gly Thr Leu Gln Asp Pro Lys Thr Phe Tyr Ala Trp Gly Glu
145 150 155 160
Ser Asp Phe Tyr Pro Glu Leu Lys Arg Arg Ala Leu Ala Arg Leu Lys
165 170 175
Glu Ala Gly Gln Ala Arg Arg Gly Gly Leu Gly Val Lys Ala Leu Leu
180 185 190
Val Leu Thr Leu Phe Phe Val Ser Trp Tyr Met Trp Val Ala His Lys
195 200 205
Ser Phe Leu Trp Ala Ala Val Trp Gly Phe Ala Gly Ser His Val Gly
210 215 220
Leu Ser Ile Gln His Asp Gly Asn His Gly Ala Phe Ser Arg Asn Thr
225 230 235 240
Leu Val Asn Arg Leu Ala Gly Trp Gly Met Asp Leu Ile Gly Ala Ser
245 250 255
Ser Thr Val Trp Glu Tyr Gln His Val Ile Gly His His Gln Tyr Thr
260 265 270
Asn Leu Val Ser Asp Thr Leu Phe Ser Leu Pro Glu Asn Asp Pro Asp
275 280 285
Val Phe Ser Ser Tyr Pro Leu Met Arg Met His Pro Asp Thr Ala Trp
290 295 300
Gln Pro His His Arg Phe Gln His Leu Phe Ala Phe Pro Leu Phe Ala
305 310 315 320
Leu Met Thr Ile Ser Lys Val Leu Thr Ser Asp Phe Ala Val Cys Leu
325 330 335
Ser Met Lys Lys Gly Ser Ile Asp Cys Ser Ser Arg Leu Val Pro Leu
340 345 350
Glu Gly Gln Leu Leu Phe Trp Gly Ala Lys Leu Ala Asn Phe Leu Leu
355 360 365
Gln Ile Val Leu Pro Cys Tyr Leu His Gly Thr Ala Met Gly Leu Ala
370 375 380
Leu Phe Ser Val Ala His Leu Val Ser Gly Glu Tyr Leu Ala Ile Cys
385 390 395 400
Phe Ile Ile Asn His Ile Ser Glu Ser Cys Glu Phe Met Asn Thr Ser
405 410 415
Phe Gln Thr Ala Ala Arg Arg Thr Glu Met Leu Gln Ala Ala His Gln
420 425 430
Ala Ala Glu Ala Lys Lys Val Lys Pro Thr Pro Pro Pro Asn Asp Trp
435 440 445
Ala Val Thr Gln Val Gln Cys Cys Val Asn Trp Arg Ser Gly Gly Val
450 455 460
Leu Ala Asn His Leu Ser Gly Gly Leu Asn His Gln Ile Glu His His
465 470 475 480
Leu Phe Pro Ser Ile Ser His Ala Asn Tyr Pro Thr Ile Ala Pro Val
485 490 495
Val Lys Glu Val Cys Glu Glu Tyr Gly Leu Pro Tyr Lys Asn Tyr Val
500 505 510
Thr Phe Trp Asp Ala Val Cys Gly Met Val Gln His Leu Arg Leu Met
515 520 525
Gly Ala Pro Pro Val Pro Thr Asn Gly Asp Lys Lys Ser
530 535 540
<210>35
<211>263
<212>PRT
<213>Isochrysis galbana
<400>35
Met Ala Leu Ala Asn Asp Ala Gly Glu Arg Ile Trp Ala Ala Val Thr
1 5 10 15
Asp Pro Glu Ile Leu Ile Gly Thr Phe Ser Tyr Leu Leu Leu Lys Pro
20 25 30
Leu Leu Arg Asn Ser Gly Leu Val Asp Glu Lys Lys Gly Ala Tyr Arg
35 40 45
Thr Ser Met Ile Trp Tyr Asn Val Leu Leu Ala Leu Phe Ser Ala Leu
50 55 60
Ser Phe Tyr Val Thr Ala Thr Ala Leu Gly Trp Asp Tyr Gly Thr Gly
65 70 75 80
Ala Trp Leu Arg Arg Gln Thr Gly Asp Thr Pro Gln Pro Leu Phe Gln
85 90 95
Cys Pro Ser Pro Val Trp Asp Ser Lys Leu Phe Thr Trp Thr Ala Lys
100 105 110
Ala Phe Tyr Tyr Ser Lys Tyr Val Glu Tyr Leu Asp Thr Ala Trp Leu
115 120 125
Val Leu Lys Gly Lys Arg Val Ser Phe Leu Gln Ala Phe His His Phe
130 135 140
Gly Ala Pro Trp Asp Val Tyr Leu Gly Ile Arg Leu His Asn Glu Gly
145 150 155 160
Val Trp Ile Phe Met Phe Phe Asn Ser Phe Ile His Thr Ile Met Tyr
165 170 175
Thr Tyr Tyr Gly Leu Thr Ala Ala Gly Tyr Lys Phe Lys Ala Lys Pro
180 185 190
Leu Ile Thr Ala Met Gln Ile Cys Gln Phe Val Gly Gly Phe Leu Leu
195 200 205
Val Trp Asp Tyr Ile Asn Val Pro Cys Phe Asn Ser Asp Lys Gly Lys
210 215 220
Leu Phe Ser Trp Ala Phe Asn Tyr Ala Tyr Val Gly Ser Val Phe Leu
225 230 235 240
Leu Phe Cys His Phe Phe Tyr Gln Asp Asn Leu Ala Thr Lys Lys Ser
245 250 255
Ala Lys Ala Gly Lys Gln Leu
260
<210>36
<211>419
<212>PRT
<213>Euglena gracilis
<400>36
Met Lys Ser Lys Arg Gln Ala Leu Ser Pro Leu Gln Leu Met Glu Gln
1 5 10 15
Thr Tyr Asp Val Val Asn Phe His Pro Gly Gly Ala Glu Ile Ile Glu
20 25 30
Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val Met His Phe
35 40 45
Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile Asn Pro Ser
50 55 60
Phe Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln Glu Asp Phe
65 70 75 80
Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe Asp Ala Ser
85 90 95
Pro Leu Trp Tyr Ser Tyr Lys Ile Ser Thr Thr Leu Gly Leu Gly Val
100 105 110
Leu Gly Tyr Phe Leu Met Val Gln Tyr Gln Met Tyr Phe Ile Gly Ala
115 120 125
Val Leu Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu Ser His Asp
130 135 140
Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn Asn Leu Val
145 150 155 160
Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val Thr Cys Trp
165 170 175
Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val Gln Gly His
180 185 190
Asp Pro Asp Ile Asp Asn Leu Pro Pro Leu Ala Trp Ser Glu Asp Asp
195 200 205
Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln Phe Gln Gln
210 215 220
Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile Trp Cys Phe
225 230 235 240
Gln Cys Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp Asn Gln Phe
245 250 255
Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala Leu His Trp
260 265 270
Thr Leu Lys Ala Leu Phe His Leu Phe Phe Met Pro Ser Ile Leu Thr
275 280 285
Ser Leu Leu Val Phe Phe Val Ser Glu Leu Val Gly Gly Phe Gly Ile
290 295 300
Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys Ile Gly Asp
305 310 315 320
Pro Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile His Glu Thr
325 330 335
Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe Gly Gly Leu
340 345 350
Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro Arg His Asn
355 360 365
Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln Lys His Asn
370 375 380
Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val Ile Leu Leu
385 390 395 400
Arg Tyr Leu Ala Val Phe Ala Arg Met Ala Glu Lys Gln Pro Ala Gly
405 410 415
Lys Ala Leu
<210>37
<211>867
<212>DNA
<213>Caenorhabditis elegans
<400>37
atggctcagc atccgctcgt tcaacggctt ctcgatgtca aattcgacac gaaacgattt 60
gtggctattg ctactcatgg gccaaagaat ttccctgacg cagaaggtcg caagttcttt 120
gctgatcact ttgatgttac tattcaggct tcaatcctgt acatggtcgt tgtgttcgga 180
acaaaatggt tcatgcgtaa tcgtcaacca ttccaattga ctattccact caacatctgg 240
aatttcatcc tcgccgcatt ttccatcgca ggagctgtca aaatgacccc agagttcttt 300
ggaaccattg ccaacaaagg aattgtcgca tcctactgca aagtgtttga tttcacgaaa 360
ggagagaatg gatactgggt gtggctcttc atggcttcca aacttttcga acttgttgac 420
accatcttct tggttctccg taaacgtcca ctcatgttcc ttcactggta tcaccatatt 480
ctcaccatga tctacgcctg gtactctcat ccattgaccc caggattcaa cagatacgga 540
atttatctta actttgtcgt ccacgccttc atgtactctt actacttcct tcgctcgatg 600
aagattcgcg tgccaggatt catcgcccaa gctatcacat ctcttcaaat cgttcaattc 660
atcatctctt gcgccgttct tgctcatctt ggttatctca tgcacttcac caatgccaac 720
tgtgatttcg agccatcagt attcaagctc gcagttttca tggacacaac atacttggct 780
cttttcgtca acttcttcct ccaatcatat gttctccgcg gaggaaaaga caagtacaag 840
gcagtgccaa agaagaagaa caactaa 867
<210>38
<211>1335
<212>DNA
<213>Danio rerio
<400>38
atgggtggcg gaggacagca gacagaccga atcaccgaca ccaacggcag attcagcagc 60
tacacctggg aggaggtgca gaaacacacc aaacatggag atcagtgggt ggtggtggag 120
aggaaggttt ataacgtcag ccagtgggtg aagagacacc ccggaggact gaggatcctc 180
ggacactatg ctggagaaga cgccacggag gcgttcactg cgtttcatcc aaaccttcag 240
ctggtgagga aatacctgaa gccgctgcta atcggagagc tggaggcgtc tgaacccagt 300
caggaccggc agaaaaacgc tgctctcgtg gaggatttcc gagccctgcg tgagcgtctg 360
gaggctgaag gctgttttaa aacgcagccg ctgtttttcg ctctgcattt gggccacatt 420
ctgctcctgg aggccatcgc tttcatgatg gtgtggtatt tcggcaccgg ttggatcaac 480
acgctcatcg tcgctgttat tctggctact gcacagtcac aagctggatg gttgcagcat 540
gacttcggtc atctgtccgt gtttaaaacc tctggaatga atcatttggt gcacaaattt 600
gtcatcggac acctgaaggg agcgtctgcg ggctggtgga accatcggca cttccagcat 660
cacgctaaac ccaacatctt caagaaggac ccggacgtca acatgctgaa cgcctttgtg 720
gtgggaaacg tgcagcccgt ggagtatggc gttaagaaga tcaagcatct gccctacaac 780
catcagcaca agtacttctt cttcattggt cctcccctgc tcatcccagt gtatttccag 840
ttccaaatct ttcacaatat gatcagtcat ggcatgtggg tggacctgct gtggtgtatc 900
agctactacg tccgatactt cctttgttac acgcagttct acggcgtctt ttgggctatt 960
atcctcttta atttcgtcag gtttatggag agccactggt ttgtttgggt cacacagatg 1020
agccacatcc ccatgaacat tgactatgag aaaaatcagg actggctcag catgcagctg 1080
gtcgcgacct gtaacatcga gcagtctgcc ttcaacgact ggttcagcgg acacctcaac 1140
ttccagatcg agcatcatct ctttcccaca gtgcctcggc acaactactg gcgcgccgct 1200
ccacgggtgc gagcgttgtg tgagaaatac ggagtcaaat accaagagaa gaccttgtac 1260
ggagcatttg cggatatcat taggtctttg gagaaatctg gcgagctctg gctggatgcg 1320
tatctcaaca aataa 1335
<210>39
<211>31
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<400>39
cccaagctta ctatgggtgg cggaggacag c 31
<210>40
<211>27
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<400>40
ccgctggagt tatttgttga gatacgc 27
<210>41
<211>27
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<400>41
gcgggtacca tggctcagca tccgctc 27
<210>42
<211>27
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<400>42
gcgggatcct tagttgttct tcttctt 27
<210>43
<211>6
<212>PRT
<213>Artificial sequence
<220>
<223>Conserved region
<400>43
Asp His Pro Gly Gly Ser
1 5
<210>44
<211>7
<212>PRT
<213>Artificial sequence
<220>
<223>Conserved region
<400>44
Trp Trp Lys Asp Lys His Asn
1 5
<210>45
<211>7
<212>PRT
<213>Artificial sequence
<220>
<223>Conserved region
<400>45
Gln Ile Glu His His Leu Phe
1 5
<210>46
<211>21
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<400>46
tggtggaarc ayaarcayaa y 21
<210>47
<211>30
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<220>
<221>misc_feature
<222>(19)..(19)
<223>n=any nucleotide
<400>47
gcgagggatc caaggraana rrtgrtgytc 30
<210>48
<211>6
<212>PRT
<213>Artificial sequence
<220>
<223>Conserved region
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>X=any amino acid
<400>48
Phe Leu His Xaa Tyr His
1 5
<210>49
<211>6
<212>PRT
<213>Artificial sequence
<220>
<223>Conserved region
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>X=any amino acid
<400>49
Met Tyr Xaa Tyr Tyr Phe
1 5
<210>50
<211>25
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<220>
<221>misc_feature
<222>(14)..(14)
<223>n=any nucleotide
<220>
<221>misc_feature
<222>(18)..(18)
<223>n=any nucleotide
<220>
<221>misc_feature
<222>(19)..(19)
<223>n=any nucleotide
<220>
<221>misc_feature
<222>(20)..(20)
<223>n=any nucleotide
<400>50
caggatcctt yytncatnnn tayca 25
<210>51
<211>26
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<220>
<221>misc_feature
<222>(18)..(18)
<223>n=any nucleotide
<220>
<221>misc_feature
<222>(19)..(19)
<223>n=any nucleotide
<220>
<221>misc_feature
<222>(20)..(20)
<223>n=any nucleotide
<400>51
gatctagara artartannn rtacat 26
<210>52
<211>4
<212>PRT
<213>Artificial sequence
<220>
<223>Conserved region
<400>52
His Pro Gly Gly
1
<210>53
<211>21
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<400>53
agcacgacgs sarccacggc g 21
<210>54
<211>20
<212>DNA
<213>Artificial sequence
<220>
<223>Oligonucleotide primer
<400>54
gtggtgcayc abcacgtgct 20
<210>55
<211>642
<212>DNA
<213>Pavlova salina
<220>
<221>misc_feature
<222>(13)..(13)
<223>n=unknown
<220>
<221>misc_feature
<222>(39)..(39)
<223>n=unknown
<220>
<221>misc_feature
<222>(51)..(51)
<223>n=unknown
<220>
<221>misc_feature
<222>(77)..(77)
<223>n=unknown
<220>
<221>misc_feature
<222>(302)..(302)
<223>n=unknown
<220>
<221>misc_feature
<222>(639)..(639)
<223>n=unknown
<400>55
ggctgcgcaa ctnttggaag ggcgatcggt gcgggcctnt tcgttattac nccagctggc 60
gaaaggggga tgtgctncaa ggcgattaag ttgggtaacg ccaggttttc ccagtcacga 120
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 180
gggccccccc tcgagaagtc gggtcgcatc ctgcggggcg acaagatctg gcagattggc 240
tttggcagtg ggttcaagtg caactcggcc gtgtggcagg cgaacaggag cgttgagcca 300
tntgagctcg actgacgagc tcggagctgc ggtacagaca ctgtcggcgg ctcgagaggg 360
ctgcgacttc agacgtgatc gggagattgt gcattggtgc gccgccgggc gcggcctgcc 420
gcccgggcgc tgcacgtcat cgtcagtagt cacggtcggc atcagcgccc ggcccgtggt 480
tggtacgtgg tagcgcaggc tgcgcagctg ccaacagccg ccgcccgagg tgggtggtgg 540
gactccgggt gtcagtcaca ctcagtggcg gccgccggca gtaggccgtg actctgccgt 600
ggcgttagta tcagtggcag tcagctgctg tcgtcaatnt tt 642
<210>56
<211>100
<212>DNA
<213>Artificial Sequence
<220>
<223>Oligonucleotide primer
<400>56
tgggttgagt actcggccaa ccacacgacc aactgcgcgc cctcgtggtg gtgcgactgg 60
tggatgtctt acctcaacta ccagatcgag catcatctgt 100
<210>57
<211>100
<212>DNA
<213>Artificial Sequence
<220>
<223>Oligonucleotide primer
<400>57
atagtgcagc ccgtgcttct cgaagagcgc cttgacgcgc ggcgcgatcg tcgggtggcg 60
gaattgcggc atggacggga acagatgatg ctcgatctgg 100
<210>58
<211>1612
<212>DNA
<213>Pavlova salina
<400>58
gccttctgga cgactgtcat gccgccgcgc gatagctact cgtacgccgc cccgccgtcg 60
gcccagctgc acgaggtcga taccccgcag gagcatgata agaaggagct cgtcatcggt 120
gaccgcgcgt acgacgtgac caactttgtg aagcgccacc cgggtggcaa gatcatcgca 180
taccaggttg gcacagatgc gacggacgcg tacaagcagt tccatgtgcg gtctgccaag 240
gcggacaaga tgctcaagtc gctgccttcg cgcccggtgc acaagggcta ctcgccccgc 300
cgcgctgacc tcattgccga cttccaggag ttcaccaagc agctggaggc ggagggcatg 360
tttgagccgt cgctgccgca cgtggcatac cgcctggcgg aggtgatcgc gatgcacgtg 420
gccggcgccg cgctcatctg gcacgggtac accttcgcgg gcattgccat gctcggcgtt 480
gtgcagggcc gctgcggctg gctcatgcac gagggcggcc actactcgct cacgggcaac 540
attgcttttg accgtgccat ccaagtcgcg tgctacggcc ttggctgcgg catgtcgggc 600
gcgtggtggc gcaaccagca caacaagcac cacgcgacgc cgcagaagtt gcagcacgac 660
gtcgacctcg acaccctccc gctcgtcgcc ttccacgagc ggatagccgc caaggtgaag 720
agccccgcga tgaaggcgtg gcttagtatg caggcgaagc tcttcgcgcc agtgaccacg 780
ctgctggtcg cgctgggctg gcagctgtac ctgcacccgc gccatatgct gcgcaccaag 840
cactacgacg agctcgcgat gctcggcatt cgctacggcc ttgtcggcta cctcgcggcg 900
aactacggcg cggggtacgt gctcgcgtgc tacctgctgt acgtgcagct cggcgccatg 960
tacatcttct gcaactttgc cgtgtcgcac acacacctgc cggttgtcga gcctaacgag 1020
cacgcaacgt gggtggagta cgccgcgaac cacacgacca actgctcgcc ctcgtggtgg 1080
tgcgactggt ggatgtcgta cctcaactac cagatcgagc accacctcta cccgtccatg 1140
ccgcagttcc gccacccgaa gattgcgccg cgggtgaagc agctcttcga gaagcacggc 1200
ctgcactacg acgtgcgtgg ctacttcgag gccatggcgg acacgtttgc caaccttgac 1260
aacgtcgcgc acgcgccgga gaagaagatg cagtgagcgc gcgagtgagc aacgccaagc 1320
gtccaccgcg gagtcgcccg tggtcctcct gccgatcgcg gcctgtctct ccagctgaca 1380
tctctgcttt gcttgcccat gatcgacgtc gcctccctct ctctccacac gatgtgcctg 1440
acgaatgacc tgcgggataa tcagcgctcg catgcccatg ccagcgccaa tggcagctgc 1500
tgcggcagcc gccaagtggt aatccatgac acgctgctcc acgacgcgca cgccttccat 1560
cttgacaatc agcatggacg tagcatcatc agttcagtga ctaattcctt tc 1612
<210>59
<211>1278
<212>DNA
<213>Pavlova salina
<400>59
atgccgccgc gcgatagcta ctcgtacgcc gccccgccgt cggcccagct gcacgaggtc 60
gataccccgc aggagcatga taagaaggag ctcgtcatcg gtgaccgcgc gtacgacgtg 120
accaactttg tgaagcgcca cccgggtggc aagatcatcg cataccaggt tggcacagat 180
gcgacggacg cgtacaagca gttccatgtg cggtctgcca aggcggacaa gatgctcaag 240
tcgctgcctt cgcgcccggt gcacaagggc tactcgcccc gccgcgctga cctcattgcc 300
gacttccagg agttcaccaa gcagctggag gcggagggca tgtttgagcc gtcgctgccg 360
cacgtggcat accgcctggc ggaggtgatc gcgatgcacg tggccggcgc cgcgctcatc 420
tggcacgggt acaccttcgc gggcattgcc atgctcggcg ttgtgcaggg ccgctgcggc 480
tggctcatgc acgagggcgg ccactactcg ctcacgggca acattgcttt tgaccgtgcc 540
atccaagtcg cgtgctacgg ccttggctgc ggcatgtcgg gcgcgtggtg gcgcaaccag 600
cacaacaagc accacgcgac gccgcagaag ttgcagcacg acgtcgacct cgacaccctc 660
ccgctcgtcg ccttccacga gcggatagcc gccaaggtga agagccccgc gatgaaggcg 720
tggcttagta tgcaggcgaa gctcttcgcg ccagtgacca cgctgctggt cgcgctgggc 780
tggcagctgt acctgcaccc gcgccatatg ctgcgcacca agcactacga cgagctcgcg 840
atgctcggca ttcgctacgg ccttgtcggc tacctcgcgg cgaactacgg cgcggggtac 900
gtgctcgcgt gctacctgct gtacgtgcag ctcggcgcca tgtacatctt ctgcaacttt 960
gccgtgtcgc acacacacct gccggttgtc gagcctaacg agcacgcaac gtgggtggag 1020
tacgccgcga accacacgac caactgctcg ccctcgtggt ggtgcgactg gtggatgtcg 1080
tacctcaact accagatcga gcaccacctc tacccgtcca tgccgcagtt ccgccacccg 1140
aagattgcgc cgcgggtgaa gcagctcttc gagaagcacg gcctgcacta cgacgtgcgt 1200
ggctacttcg aggccatggc ggacacgttt gccaaccttg acaacgtcgc gcacgcgccg 1260
gagaagaaga tgcagtga 1278
<210>60
<211>425
<212>PRT
<213>Pavlova salina
<400>60
Met Pro Pro Arg Asp Ser Tyr Ser Tyr Ala Ala Pro Pro Ser Ala Gln
1 5 10 15
Leu His Glu Val Asp Thr Pro Gln Glu His Asp Lys Lys Glu Leu Val
20 25 30
Ile Gly Asp Arg Ala Tyr Asp Val Thr Asn Phe Val Lys Arg His Pro
35 40 45
Gly Gly Lys Ile Ile Ala Tyr Gln Val Gly Thr Asp Ala Thr Asp Ala
50 55 60
Tyr Lys Gln Phe His Val Arg Ser Ala Lys Ala Asp Lys Met Leu Lys
65 70 75 80
Ser Leu Pro Ser Arg Pro Val His Lys Gly Tyr Ser Pro Arg Arg Ala
85 90 95
Asp Leu Ile Ala Asp Phe Gln Glu Phe Thr Lys Gln Leu Glu Ala Glu
100 105 110
Gly Met Phe Glu Pro Ser Leu Pro His Val Ala Tyr Arg Leu Ala Glu
115 120 125
Val Ile Ala Met His Val Ala Gly Ala Ala Leu Ile Trp His Gly Tyr
130 135 140
Thr Phe Ala Gly Ile Ala Met Leu Gly Val Val Gln Gly Arg Cys Gly
145 150 155 160
Trp Leu Met His Glu Gly Gly His Tyr Ser Leu Thr Gly Asn Ile Ala
165 170 175
Phe Asp Arg Ala Ile Gln Val Ala Cys Tyr Gly Leu Gly Cys Gly Met
180 185 190
Ser Gly Ala Trp Trp Arg Asn Gln His Asn Lys His His Ala Thr Pro
195 200 205
Gln Lys Leu Gln His Asp Val Asp Leu Asp Thr Leu Pro Leu Val Ala
210 215 220
Phe His Glu Arg Ile Ala Ala Lys Val Lys Ser Pro Ala Met Lys Ala
225 230 235 240
Trp Leu Ser Met Gln Ala Lys Leu Phe Ala Pro Val Thr Thr Leu Leu
245 250 255
Val Ala Leu Gly Trp Gln Leu Tyr Leu His Pro Arg His Met Leu Arg
260 265 270
Thr Lys His Tyr Asp Glu Leu Ala Met Leu Gly Ile Arg Tyr Gly Leu
275 280 285
Val Gly Tyr Leu Ala Ala Asn Tyr Gly Ala Gly Tyr Val Leu Ala Cys
290 295 300
Tyr Leu Leu Tyr Val Gln Leu Gly Ala Met Tyr Ile Phe Cys Asn Phe
305 310 315 320
Ala Val Ser His Thr His Leu Pro Val Val Glu Pro Asn Glu His Ala
325 330 335
Thr Trp Val Glu Tyr Ala Ala Asn His Thr Thr Asn Cys Ser Pro Ser
340 345 350
Trp Trp Cys Asp Trp Trp Met Ser Tyr Leu Asn Tyr Gln Ile Glu His
355 360 365
His Leu Tyr Pro Ser Met Pro Gln Phe Arg His Pro Lys Ile Ala Pro
370 375 380
Arg Val Lys Gln Leu Phe Glu Lys His Gly Leu His Tyr Asp Val Arg
385 390 395 400
Gly Tyr Phe Glu Ala Met Ala Asp Thr Phe Ala Asn Leu Asp Asn Val
405 410 415
Ala His Ala Pro Glu Lys Lys Met Gln
420 425
<210>61
<211>8
<212>PRT
<213>Echium pitardii
<400>61
Met Ala Asn Ala Ile Lys Lys Tyr
1 5
<210>62
<211>7
<212>PRT
<213>Echium pitardii
<400>62
Glu Ala Leu Asn Thr His Gly
1 5
<210>63
<211>1347
<212>DNA
<213>Echium plantagineum
<400>63
atggctaatg caatcaagaa gtacattact gcagaggagc tgaagaagca tgataaagca 60
ggggatctct ggatctccat tcaaggaaaa atctatgatg tttcagattg gttgaaggac 120
catccaggtg ggaacttccc cttgctgagc cttgctggcc aagaggtaac tgatgcattt 180
gttgcatttc attctggtac aacttggaag cttcttgaaa aattcttcac tggttattac 240
cttaaagatt actctgtttc tgaggtgtcc aaagattaca ggaagcttgt gtttgagttt 300
aataaaatgg gcttgtttga caaaaagggt catattgttc ttgtgactgt cttgtttata 360
gctatgttgt ttggtatgag tgtttatggg gttttgtttt gtgagggtgt tttggtacat 420
ttgcttgctg gggggttgat gggttttgtc tggattcaga gtggttggat tggtcatgat 480
gctgggcatt atattgttat gcctgatgct aggcttaata agcttatggg tattgttgct 540
gccaattgtt tatctggaat aagcattggt tggtggaaat ggaaccataa tgcacatcac 600
attgcctgta atagcctcga ttacgacccg gatttgcagt acattccgtt tcttgttgtg 660
tcgtccaagt tgtttagctc gctcacctct catttctatg aaaagaaact gacatttgac 720
tctttatcga gattctttgt aagccatcag cattggacgt tttacccggt tatgtgtatg 780
gctagggtta atatgtttgt gcagtctctg ataatgttgt tgactaagcg aaatgtgttc 840
tatagaagtc aagaactgtt gggattggtg gtgttttgga tttggtaccc gttgcttgtt 900
tcttgcttgc ctaattgggg agaacgagta atgttcgttg ttgctagtct ctcggtgact 960
ggaatgcaac aagtgcagtt ctctttgaac catttctcgt cgagtgttta tgttggtcag 1020
cctaaaggga acgattggtt cgagaaacaa acatgtggga cgctcgacat ttcttgccct 1080
tcgtggatgg attggtttca tggtggattg caattccaag ttgagcatca tttgttccct 1140
aagctgccca gatgccacct tcggaaaatc tccccgttcg tgatggagtt atgcaagaag 1200
cataatttgt cttacaattg tgcatctttc tccgaggcca acaatatgac actcagaaca 1260
ttaagggaca cagcattgca agctcgcgat ttaaccaagc cgctccccaa gaatttggta 1320
tgggaagctc ttaatactca tggttga 1347
<210>64
<211>448
<212>PRT
<213>Echium plantagineum
<400>64
Met Ala Asn Ala Ile Lys Lys Tyr Ile Thr Ala Glu Glu Leu Lys Lys
1 5 10 15
His Asp Lys Ala Gly Asp Leu Trp Ile Ser Ile Gln Gly Lys Ile Tyr
20 25 30
Asp Val Ser Asp Trp Leu Lys Asp His Pro Gly Gly Asn Phe Pro Leu
35 40 45
Leu Ser Leu Ala Gly Gln Glu Val Thr Asp Ala Phe Val Ala Phe His
50 55 60
Ser Gly Thr Thr Trp Lys Leu Leu Glu Lys Phe Phe Thr Gly Tyr Tyr
65 70 75 80
Leu Lys Asp Tyr Ser Val Ser Glu Val Ser Lys Asp Tyr Arg Lys Leu
85 90 95
Val Phe Glu Phe Asn Lys Met Gly Leu Phe Asp Lys Lys Gly His Ile
100 105 110
Val Leu Val Thr Val Leu Phe Ile Ala Met Leu Phe Gly Met Ser Val
115 120 125
Tyr Gly Val Leu Phe Cys Glu Gly Val Leu Val His Leu Leu Ala Gly
130 135 140
Gly Leu Met Gly Phe Val Trp Ile Gln Ser Gly Trp Ile Gly His Asp
145 150 155 160
Ala Gly His Tyr Ile Val Met Pro Asp Ala Arg Leu Asn Lys Leu Met
165 170 175
Gly Ile Val Ala Ala Asn Cys Leu Ser Gly Ile Ser Ile Gly Trp Trp
180 185 190
Lys Trp Asn His Asn Ala His His Ile Ala Cys Asn Ser Leu Asp Tyr
195 200 205
Asp Pro Asp Leu Gln Tyr Ile Pro Phe Leu Val Val Ser Ser Lys Leu
210 215 220
Phe Ser Ser Leu Thr Ser His Phe Tyr Glu Lys Lys Leu Thr Phe Asp
225 230 235 240
Ser Leu Ser Arg Phe Phe Val Ser His Gln His Trp Thr Phe Tyr Pro
245 250 255
Val Met Cys Met Ala Arg Val Asn Met Phe Val Gln Ser Leu Ile Met
260 265 270
Leu Leu Thr Lys Arg Asn Val Phe Tyr Arg Ser Gln Glu Leu Leu Gly
275 280 285
Leu Val Val Phe Trp Ile Trp Tyr Pro Leu Leu Val Ser Cys Leu Pro
290 295 300
Asn Trp Gly Glu Arg Val Met Phe Val Val Ala Ser Leu Ser Val Thr
305 310 315 320
Gly Met Gln Gln Val Gln Phe Ser Leu Asn His Phe Ser Ser Ser Val
325 330 335
Tyr Val Gly Gln Pro Lys Gly Asn Asp Trp Phe Glu Lys Gln Thr Cys
340 345 350
Gly Thr Leu Asp Ile Ser Cys Pro Ser Trp Met Asp Trp Phe His Gly
355 360 365
Gly Leu Gln Phe Gln Val Glu His His Leu Phe Pro Lys Leu Pro Arg
370 375 380
Cys His Leu Arg Lys Ile Ser Pro Phe Val Met Glu Leu Cys Lys Lys
385 390 395 400
His Asn Leu Ser Tyr Asn Cys Ala Ser Phe Ser Glu Ala Asn Asn Met
405 410 415
Thr Leu Arg Thr Leu Arg Asp Thr Ala Leu Gln Ala Arg Asp Leu Thr
420 425 430
Lys Pro Leu Pro Lys Asn Leu Val Trp Glu Ala Leu Asn Thr His Gly
435 440 445
<210>65
<211>448
<212>PRT
<213>Echium gentianoides
<400>65
Met Ala Asn Ala Ile Lys Lys Tyr Ile Thr Ala Glu Glu Leu Lys Lys
1 5 10 15
His Asp Lys Glu Gly Asp Leu Trp Ile Ser Ile Gln Gly Lys Val Tyr
20 25 30
Asp Val Ser Asp Trp Leu Lys Asp His Pro Gly Gly Lys Phe Pro Leu
35 40 45
Leu Ser Leu Ala Gly Gln Glu Val Thr Asp Ala Phe Val Ala Phe His
50 55 60
Ser Gly Ser Thr Trp Lys Phe Leu Asp Ser Phe Phe Thr Gly Tyr Tyr
65 70 75 80
Leu Lys Asp Tyr Ser Val Ser Glu Val Ser Lys Asp Tyr Arg Lys Leu
85 90 95
Val Phe Glu Phe Asn Lys Met Gly Leu Phe Asp Lys Lys Gly His Ile
100 105 110
Val Leu Val Thr Val Leu Phe Ile Ala Met Met Phe Ala Met Ser Val
115 120 125
Tyr Gly Val Leu Phe Cys Glu Gly Val Leu Val His Leu Leu Ala Gly
130 135 140
Gly Leu Met Gly Phe Val Trp Ile Gln Ser Gly Trp Ile Gly His Asp
145 150 155 160
Ala Gly His Tyr Ile Val Met Pro Asn Pro Arg Leu Asn Lys Leu Met
165 170 175
Gly Ile Val Ala Gly Asn Cys Leu Ser Gly Ile Ser Ile Gly Trp Trp
180 185 190
Lys Trp Asn His Asn Ala His His Ile Ala Cys Asn Ser Leu Asp Tyr
195 200 205
Asp Pro Asp Leu Gln Tyr Ile Pro Phe Leu Val Val Ser Ser Lys Leu
210 215 220
Phe Ser Ser Leu Thr Ser His Phe Tyr Glu Lys Lys Leu Thr Phe Asp
225 230 235 240
Ser Leu Ser Arg Phe Phe Val Ser His Gln His Trp Thr Phe Tyr Pro
245 250 255
Val Met Cys Ser Ala Arg Val Asn Met Phe Val Gln Ser Leu Ile Met
260 265 270
Leu Leu Thr Lys Arg Asn Val Phe Tyr Arg Ser Gln Glu Leu Leu Gly
275 280 285
Leu Val Val Phe Trp Ile Trp Tyr Pro Leu Leu Val Ser Cys Leu Pro
290 295 300
Asn Trp Gly Glu Arg Ile Met Phe Val Val Ala Ser Leu Ser Val Thr
305 310 315 320
Gly Met Gln Gln Val Gln Phe Ser Leu Asn His Phe Ser Ala Ser Val
325 330 335
Tyr Val Gly Gln Pro Lys Gly Asn Asp Trp Phe Glu Lys Gln Thr Cys
340 345 350
Gly Thr Leu Asp Ile Ser Cys Pro Ser Trp Met Asp Trp Phe His Gly
355 360 365
Gly Leu Gln Phe Gln Val Glu His His Leu Phe Pro Lys Leu Pro Arg
370 375 380
Cys His Leu Arg Lys Ile Ser Pro Phe Val Met Glu Leu Cys Lys Lys
385 390 395 400
His Asn Leu Ser Tyr Asn Cys Ala Ser Phe Ser Glu Ala Asn Glu Met
405 410 415
Thr Leu Arg Thr Leu Arg Asp Thr Ala Leu Gln Ala Arg Asp Leu Thr
420 425 430
Lys Pro Leu Pro Lys Asn Leu Val Trp Glu Ala Leu Asn Thr His Gly
435 440 445
<210>66
<211>448
<212>PRT
<213>Echium pitardii
<400>66
Met Ala Asn Ala Ile Lys Lys Tyr Ile Thr Ala Glu Glu Leu Lys Lys
1 5 10 15
His Asp Lys Glu Gly Asp Leu Trp Ile Ser Ile Gln Gly Lys Val Tyr
20 25 30
Asp Val Ser Asp Trp Leu Lys Asp His Pro Gly Gly Lys Phe Pro Leu
35 40 45
Leu Ser Leu Ala Gly Gln Glu Val Thr Asp Ala Phe Val Ala Phe His
50 55 60
Ser Gly Ser Thr Trp Lys Leu Leu Asp Ser Phe Phe Thr Gly Tyr Tyr
65 70 75 80
Leu Lys Asp Tyr Ser Val Ser Glu Val Ser Lys Asp Tyr Arg Lys Leu
85 90 95
Val Phe Glu Phe Asn Lys Met Gly Leu Phe Asp Lys Lys Gly His Ile
100 105 110
Val Leu Val Thr Val Phe Phe Ile Ala Met Met Phe Ala Met Ser Val
115 120 125
Tyr Gly Val Leu Phe Cys Glu Gly Val Leu Val His Leu Leu Ala Gly
130 135 140
Gly Leu Met Gly Phe Val Trp Ile Gln Ser Gly Trp Ile Gly His Asp
145 150 155 160
Ala Gly His Tyr Ile Val Met Pro Asn Pro Lys Leu Asn Lys Leu Met
165 170 175
Gly Ile Val Ala Ser Asn Cys Leu Ser Gly Ile Ser Ile Gly Trp Trp
180 185 190
Lys Trp Asn His Asn Ala His His Ile Ala Cys Asn Ser Leu Asp Tyr
195 200 205
Asp Pro Asp Leu Gln Tyr Ile Pro Phe Leu Val Val Ser Ser Lys Leu
210 215 220
Phe Ser Ser Leu Thr Ser His Phe Tyr Glu Lys Lys Leu Thr Phe Asp
225 230 235 240
Ser Leu Ser Arg Phe Phe Val Ser His Gln His Trp Thr Phe Tyr Pro
245 250 255
Val Met Cys Ser Ala Arg Val Asn Met Phe Val Gln Ser Leu Ile Met
260 265 270
Leu Leu Thr Lys Arg Asn Val Phe Tyr Arg Ser Gln Glu Leu Leu Gly
275 280 285
Leu Val Val Phe Trp Ile Trp Tyr Pro Leu Leu Val Ser Cys Leu Pro
290 295 300
Asn Trp Gly Glu Arg Ile Met Phe Val Val Ala Ser Leu Ser Val Thr
305 310 315 320
Gly Leu Gln Gln Val Gln Phe Ser Leu Asn His Phe Ala Ala Ser Val
325 330 335
Tyr Val Gly Gln Pro Lys Gly Ile Asp Trp Phe Glu Lys Gln Thr Cys
340 345 350
Gly Thr Leu Asp Ile Ser Cys Pro Ser Trp Met Asp Trp Phe His Gly
355 360 365
Gly Leu Gln Phe Gln Val Glu His His Leu Phe Pro Lys Leu Pro Arg
370 375 380
Cys His Leu Arg Lys Ile Ser Pro Phe Val Met Glu Leu Cys Lys Lys
385 390 395 400
His Asn Leu Ser Tyr Asn Cys Ala Ser Phe Ser Gln Ala Asn Glu Met
405 410 415
Thr Leu Arg Thr Leu Arg Asp Thr Ala Leu Gln Ala Arg Asp Leu Thr
420 425 430
Lys Pro Leu Pro Lys Asn Leu Val Trp Glu Ala Leu Asn Thr His Gly
435 440 445
<210>67
<211>448
<212>PRT
<213>Borago officinalis
<400>67
Met Ala Ala Gln Ile Lys Lys Tyr Ile Thr Ser Asp Glu Leu Lys Asn
1 5 10 15
His Asp Lys Pro Gly Asp Leu Trp Ile Ser Ile Gln Gly Lys Ala Tyr
20 25 30
Asp Val Ser Asp Trp Val Lys Asp His Pro Gly Gly Ser Phe Pro Leu
35 40 45
Lys Ser Leu Ala Gly Gln Glu Val Thr Asp Ala Phe Val Ala Phe His
50 55 60
Pro Ala Ser Thr Trp Lys Asn Leu Asp Lys Phe Phe Thr Gly Tyr Tyr
65 70 75 80
Leu Lys Asp Tyr Ser Val Ser Glu Val Ser Lys Asp Tyr Arg Lys Leu
85 90 95
Val Phe Glu Phe Ser Lys Met Gly Leu Tyr Asp Lys Lys Gly His Ile
100 105 110
Met Phe Ala Thr Leu Cys Phe Ile Ala Met Leu Phe Ala Met Ser Val
115 120 125
Tyr Gly Val Leu Phe Cys Glu Gly Val Leu Val His Leu Phe Ser Gly
130 135 140
Cys Leu Met Gly Phe Leu Trp Ile Gln Ser Gly Trp Ile Gly His Asp
145 150 155 160
Ala Gly His Tyr Met Val Val Ser Asp Ser Arg Leu Asn Lys Phe Met
165 170 175
Gly Ile Phe Ala Ala Asn Cys Leu Ser Gly Ile Ser Ile Gly Trp Trp
180 185 190
Lys Trp Asn His Asn Ala His His Ile Ala Cys Asn Ser Leu Glu Tyr
195 200 205
Asp Pro Asp Leu Gln Tyr Ile Pro Phe Leu Val Val Ser Ser Lys Phe
210 215 220
Phe Gly Ser Leu Thr Ser His Phe Tyr Glu Lys Arg Leu Thr Phe Asp
225 230 235 240
Ser Leu Ser Arg Phe Phe Val Ser Tyr Gln His Trp Thr Phe Tyr Pro
245 250 255
Ile Met Cys Ala Ala Arg Leu Asn Met Tyr Val Gln Ser Leu Ile Met
260 265 270
Leu Leu Thr Lys Arg Asn Val Ser Tyr Arg Ala His Glu Leu Leu Gly
275 280 285
Cys Leu Val Phe Ser Ile Trp Tyr Pro Leu Leu Val Ser Cys Leu Pro
290 295 300
Asn Trp Gly Glu Arg Ile Met Phe Val Ile Ala Ser Leu Ser Val Thr
305 310 315 320
Gly Met Gln Gln Val Gln Phe Ser Leu Asn His Phe Ser Ser Ser Val
325 330 335
Tyr Val Gly Lys Pro Lys Gly Asn Asn Trp Phe Glu Lys Gln Thr Asp
340 345 350
Gly Thr Leu Asp Ile Ser Cys Pro Pro Trp Met Asp Trp Phe His Gly
355 360 365
Gly Leu Gln Phe Gln Ile Glu His His Leu Phe Pro Lys Met Pro Arg
370 375 380
Cys Asn Leu Arg Lys Ile Ser Pro Tyr Val Ile Glu Leu Cys Lys Lys
385 390 395 400
His Asn Leu Pro Tyr Asn Tyr Ala Ser Phe Ser Lys Ala Asn Glu Met
405 410 415
Thr Leu Arg Thr Leu Arg Asn Thr Ala Leu Gln Ala Arg Asp Ile Thr
420 425 430
Lys Pro Leu Pro Lys Asn Leu Val Trp Glu Ala Leu His Thr His Gly
435 440 445
<210>68
<211>446
<212>PRT
<213>Borago officinalis
<400>68
Met Glu Gly Thr Lys Lys Tyr Ile Ser Val Gly Glu Leu Glu Lys His
1 5 10 15
Asn Gln Leu Gly Asp Val Trp Ile Ser Ile Gln Gly Lys Val Tyr Asn
20 25 30
Val Thr Asp Trp Ile Lys Lys His Pro Gly Gly Asp Val Pro Ile Met
35 40 45
Asn Leu Ala Gly Gln Asp Ala Thr Asp Ala Phe Ile Ala Tyr His Pro
50 55 60
Gly Thr Ala Trp Lys Asn Leu Glu Asn Leu Phe Thr Gly Tyr His Leu
65 70 75 80
Glu Asp Tyr Leu Val Ser Glu Ile Ser Lys Asp Tyr Arg Lys Leu Ala
85 90 95
Ser Glu Phe Ser Lys Ala Gly Leu Phe Glu Lys Lys Gly His Thr Val
100 105 110
Ile Tyr Cys Leu Ser Phe Ile Ala Leu Leu Leu Cys Gly Cys Val Tyr
115 120 125
Gly Val Leu Cys Ser Asn Ser Leu Trp Val His Met Leu Ser Gly Ala
130 135 140
Met Leu Gly Met Cys Phe Ile Gln Ala Ala Tyr Leu Gly His Asp Ser
145 150 155 160
Gly His Tyr Thr Met Met Ser Ser Lys Gly Tyr Asn Lys Phe Ala Gln
165 170 175
Val Leu Asn Gly Asn Cys Leu Thr Gly Ile Ser Ile Ala Trp Trp Lys
180 185 190
Trp Thr His Asn Ala His His Ile Ala Cys Asn Ser Leu Asp Tyr Asp
195 200 205
Pro Asp Leu Gln His Leu Pro Val Phe Ala Val Pro Ser Ser Phe Phe
210 215 220
Lys Ser Leu Thr Ser Arg Phe Tyr Gly Arg Glu Leu Thr Phe Asp Gly
225 230 235 240
Leu Ser Arg Phe Leu Val Ser Tyr Gln His Phe Thr Ile Tyr Leu Val
245 250 255
Met Ile Phe Gly Arg Ile Asn Leu Tyr Val Gln Thr Phe Leu Leu Leu
260 265 270
Phe Ser Thr Arg Lys Val Pro Asp Arg Ala Leu Asn Ile Ile Gly Ile
275 280 285
Leu Val Tyr Trp Thr Trp Phe Pro Tyr Leu Val Ser Cys Leu Pro Asn
290 295 300
Trp Asn Glu Arg Val Leu Phe Val Leu Thr Cys Phe Ser Val Thr Ala
305 310 315 320
Leu Gln His Ile Gln Phe Thr Leu Asn His Phe Ala Ala Asp Val Tyr
325 330 335
Val Gly Pro Pro Thr Gly Thr Asn Trp Phe Glu Lys Gln Ala Ala Gly
340 345 350
Thr Ile Asp Ile Ser Cys Ser Ser Trp Met Asp Trp Phe Phe Gly Gly
355 360 365
Leu Gln Phe Gln Leu Glu His His Leu Phe Pro Arg Met Pro Arg Cys
370 375 380
Gln Leu Arg Asn Ile Ser Pro Ile Val Gln Asp Tyr Cys Lys Lys His
385 390 395 400
Asn Leu Pro Tyr Arg Ser Leu Ser Phe Phe Asp Ala Asn Val Ala Thr
405 410 415
Ile Lys Thr Leu Arg Thr Ala Ala Leu Gln Ala Arg Asp Leu Thr Val
420 425 430
Val Pro Gln Asn Leu Leu Trp Glu Ala Phe Asn Thr His Gly
435 440 445
<210>69
<211>458
<212>PRT
<213>Helianthus annus
<400>69
Met Val Ser Pro Ser Ile Glu Val Leu Asn Ser Ile Ala Asp Gly Lys
1 5 10 15
Lys Tyr Ile Thr Ser Lys Glu Leu Lys Lys His Asn Asn Pro Asn Asp
20 25 30
Leu Trp Ile Ser Ile Leu Gly Lys Val Tyr Asn Val Thr Glu Trp Ala
35 40 45
Lys Glu His Pro Gly Gly Asp Ala Pro Leu Ile Asn Leu Ala Gly Gln
50 55 60
Asp Val Thr Asp Ala Phe Ile Ala Phe His Pro Gly Thr Ala Trp Lys
65 70 75 80
His Leu Asp Lys Leu Phe Thr Gly Tyr His Leu Lys Asp Tyr Gln Val
85 90 95
Ser Asp Ile Ser Arg Asp Tyr Arg Lys Leu Ala Ser Glu Phe Ala Lys
100 105 110
Ala Gly Met Phe Glu Lys Lys Gly His Gly Val Ile Tyr Ser Leu Cys
115 120 125
Phe Val Ser Leu Leu Leu Ser Ala Cys Val Tyr Gly Val Leu Tyr Ser
130 135 140
Gly Ser Phe Trp Ile His Met Leu Ser Gly Ala Ile Leu Gly Leu Ala
145 150 155 160
Trp Met Gln Ile Ala Tyr Leu Gly His Asp Ala Gly His Tyr Gln Met
165 170 175
Met Ala Thr Arg Gly Trp Asn Lys Phe Ala Gly Ile Phe Ile Gly Asn
180 185 190
Cys Ile Thr Gly Ile Ser Ile Ala Trp Trp Lys Trp Thr His Asn Ala
195 200 205
His His Ile Ala Cys Asn Ser Leu Asp Tyr Asp Pro Asp Leu Gln His
210 215 220
Leu Pro Met Leu Ala Val Ser Ser Lys Leu Phe Asn Ser Ile Thr Ser
225 230 235 240
Val Phe Tyr Gly Arg Gln Leu Thr Phe Asp Pro Leu Ala Arg Phe Phe
245 250 255
Val Ser Tyr Gln His Tyr Leu Tyr Tyr Pro Ile Met Cys Val Ala Arg
260 265 270
Val Ash Leu Tyr Leu Gln Thr Ile Leu Leu Leu Ile Ser Lys Arg Lys
275 280 285
Ile Pro Asp Arg Gly Leu Asn Ile Leu Gly Thr Leu Ile Phe Trp Thr
290 295 300
Trp Phe Pro Leu Leu Val Ser Arg Leu Pro Asn Trp Pro Glu Arg Val
305 310 315 320
Ala Phe Val Leu Val Ser Phe Cys Val Thr Gly Ile Gln His Ile Gln
325 330 335
Phe Thr Leu Asn His Phe Ser Gly Asp Val Tyr Val Gly Pro Pro Lys
340 345 350
Gly Asp Asn Trp Phe Glu Lys Gln Thr Arg Gly Thr Ile Asp Ile Ala
355 360 365
Cys Ser Ser Trp Met Asp Trp Phe Phe Gly Gly Leu Gln Phe Gln Leu
370 375 380
Glu His His Leu Phe Pro Arg Leu Pro Arg Cys His Leu Arg Ser Ile
385 390 395 400
Ser Pro Ile Cys Arg Glu Leu Cys Lys Lys Tyr Asn Leu Pro Tyr Val
405 410 415
Ser Leu Ser Phe Tyr Asp Ala Asn Val Thr Thr Leu Lys Thr Leu Arg
420 425 430
Thr Ala Ala Leu Gln Ala Arg Asp Leu Thr Asn Pro Ala Pro Gln Asn
435 440 445
Leu Ala Trp Glu Ala Phe Asn Thr His Gly
450 455
<210>70
<211>449
<212>PRT
<213>Arabidopsis thaliana
<400>70
Met Ala Asp Gln Thr Lys Lys Arg Tyr Val Thr Ser Glu Asp Leu Lys
1 5 10 15
Lys His Asn Lys Pro Gly Asp Leu Trp Ile Ser Ile Gln Gly Lys Val
20 25 30
Tyr Asp Val Ser Asp Trp Val Lys Ser His Pro Gly Gly Glu Ala Ala
35 40 45
Ile Leu Asn Leu Ala Gly Gln Asp Val Thr Asp Ala Phe Ile Ala Tyr
50 55 60
His Pro Gly Thr Ala Trp His His Leu Glu Lys Leu His Asn Gly Tyr
65 70 75 80
His Val Arg Asp His His Val Ser Asp Val Ser Arg Asp Tyr Arg Arg
85 90 95
Leu Ala Ala Glu Phe Ser Lys Arg Gly Leu Phe Asp Lys Lys Gly His
100 105 110
Val Thr Leu Tyr Thr Leu Thr Cys Val Gly Val Met Leu Ala Ala Val
115 120 125
Leu Tyr Gly Val Leu Ala Cys Thr Ser Ile Trp Ala His Leu Ile Ser
130 135 140
Ala Val Leu Leu Gly Leu Leu Trp Ile Gln Ser Ala Tyr Val Gly His
145 150 155 160
Asp Ser Gly His Tyr Thr Val Thr Ser Thr Lys Pro Cys Asn Lys Leu
165 170 175
Ile Gln Leu Leu Ser Gly Asn Cys Leu Thr Gly Ile Ser Ile Ala Trp
180 185 190
Trp Lys Trp Thr His Asn Ala His His Ile Ala Cys Asn Ser Leu Asp
195 200 205
His Asp Pro Asp Leu Gln His Ile Pro Ile Phe Ala Val Ser Thr Lys
210 215 220
Phe Phe Asn Ser Met Thr Ser Arg Phe Tyr Gly Arg Lys Leu Thr Phe
225 230 235 240
Asp Pro Leu Ala Arg Phe Leu Ile Ser Tyr Gln His Trp Thr Phe Tyr
245 250 255
Pro Val Met Cys Val Gly Arg Ile Ash Leu Phe Ile Gln Thr Phe Leu
260 265 270
Leu Leu Phe Ser Lys Arg His Val Pro Asp Arg Ala Leu Asn Ile Ala
275 280 285
Gly Ile Leu Val Phe Trp Thr Trp Phe Pro Leu Leu Val Ser Phe Leu
290 295 300
Pro Asn Trp Gln Glu Arg Phe Ile Phe Val Phe Val Ser Phe Ala Val
305 310 315 320
Thr Ala Ile Gln His Val Gln Phe Cys Leu Asn His Phe Ala Ala Asp
325 330 335
Val Tyr Thr Gly Pro Pro Asn Gly Asn Asp Trp Phe Glu Lys Gln Thr
340 345 350
Ala Gly Thr Leu Asp Ile Ser Cys Arg Ser Phe Met Asp Trp Phe Phe
355 360 365
Gly Gly Leu Gln Phe Gln Leu Glu His His Leu Phe Pro Arg Leu Pro
370 375 380
Arg Cys His Leu Arg Thr Val Ser Pro Val Val Lys Glu Leu Cys Lys
385 390 395 400
Lys His Asn Leu Pro Tyr Arg Ser Leu Ser Trp Trp Glu Ala Asn Val
405 410 415
Trp Thr Ile Arg Thr Leu Lys Asn Ala Ala Ile Gln Ala Arg Asp Ala
420 425 430
Thr Asn Pro Val Leu Lys Asn Leu Leu Trp Glu Ala Val Asn Thr His
435 440 445
Gly
<210>71
<211>449
<212>PRT
<213>Arabidopsis thaliana
<400>71
Met Ala Glu Glu Thr Glu Lys Lys Tyr Ile Thr Asn Glu Asp Leu Lys
1 5 10 15
Lys His Asn Lys Ser Gly Asp Leu Trp Ile Ala Ile Gln Gly Lys Val
20 25 30
Tyr Asn Val Ser Asp Trp Ile Lys Thr His Pro Gly Gly Asp Thr Val
35 40 45
Ile Leu Asn Leu Val Gly Gln Asp Val Thr Asp Ala Phe Ile Ala Phe
50 55 60
His Pro Gly Thr Ala Trp His His Leu Asp His Leu Phe Thr Gly Tyr
65 70 75 80
His Ile Arg Asp Phe Gln Val Ser Glu Val Ser Arg Asp Tyr Arg Arg
85 90 95
Met Ala Ala Glu Phe Arg Lys Leu Gly Leu Phe Glu Asn Lys Gly His
100 105 110
Val Thr Leu Tyr Thr Leu Ala Phe Val Ala Ala Met Phe Leu Gly Val
115 120 125
Leu Tyr Gly Val Leu Ala Cys Thr Ser Val Phe Ala His Gln Ile Ala
130 135 140
Ala Ala Leu Leu Gly Leu Leu Trp Ile Gln Ser Ala Tyr Ile Gly His
145 150 155 160
Asp Ser Gly His Tyr Val Ile Met Ser Asn Lys Ser Tyr Asn Arg Phe
165 170 175
Ala Gln Leu Leu Ser Gly Asn Cys Leu Thr Gly Ile Ser Ile Ala Trp
180 185 190
Trp Lys Trp Thr His Asn Ala His His Leu Ala Cys Asn Ser Leu Asp
195 200 205
Tyr Asp Pro Asp Leu Gln His Ile Pro Val Phe Ala Val Ser Thr Lys
210 215 220
Phe Phe Ser Ser Leu Thr Ser Arg Phe Tyr Asp Arg Lys Leu Thr Phe
225 230 235 240
Asp Pro Val Ala Arg Phe Leu Val Ser Tyr Gln His Phe Thr Tyr Tyr
245 250 255
Pro Val Met Cys Phe Gly Arg Ile Asn Leu Phe Ile Gln Thr Phe Leu
260 265 270
Leu Leu Phe Ser Lys Arg Glu Val Pro Asp Arg Ala Leu Asn Phe Ala
275 280 285
Gly Ile Leu Val Phe Trp Thr Trp Phe Pro Leu Leu Val Ser Cys Leu
290 295 300
Pro Asn Trp Pro Glu Arg Phe Phe Phe Val Phe Thr Ser Phe Thr Val
305 310 315 320
Thr Ala Leu Gln His Ile Gln Phe Thr Leu Asn His Phe Ala Ala Asp
325 330 335
Val Tyr Val Gly Pro Pro Thr Gly Ser Asp Trp Phe Glu Lys Gln Ala
340 345 350
Ala Gly Thr Ile Asp Ile Ser Cys Arg Ser Tyr Met Asp Trp Phe Phe
355 360 365
Gly Gly Leu Gln Phe Gln Leu Glu His His Leu Phe Pro Arg Leu Pro
370 375 380
Arg Cys His Leu Arg Lys Val Ser Pro Val Val Gln Glu Leu Cys Lys
385 390 395 400
Lys His Asn Leu Pro Tyr Arg Ser Met Ser Trp Phe Glu Ala Asn Val
405 410 415
Leu Thr Ile Asn Thr Leu Lys Thr Ala Ala Tyr Gln Ala Arg Asp Val
420 425 430
Ala Asn Pro Val Val Lys Asn Leu Val Trp Glu Ala Leu Asn Thr His
435 440 445
Gly
<210>72
<211>4
<212>PRT
<213>Artificial Sequence
<220>
<223>Conserved motif
<400>72
His Pro Gly Gly
1
<210>73
<211>5
<212>PRT
<213>Artificial Sequence
<220>
<223>Conserved motif
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>X=any amino acid
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>X=any amino acid
<400>73
Gln Xaa Xaa His His
1 5
<210>74
<211>271
<212>PRT
<213>Thraustochytrium sp.
<400>74
Met Met Glu Pro Leu Asp Arg Tyr Arg Ala Leu Ala Glu Leu Ala Ala
1 5 10 15
Arg Tyr Ala Ser Ser Ala Ala Phe Lys Trp Gln Val Thr Tyr Asp Ala
20 25 30
Lys Asp Ser Phe Val Gly Pro Leu Gly Ile Arg Glu Pro Leu Gly Leu
35 40 45
Leu Val Gly Ser Val Val Leu Tyr Leu Ser Leu Leu Ala Val Val Tyr
50 55 60
Ala Leu Arg Asn Tyr Leu Gly Gly Leu Met Ala Leu Arg Ser Val His
65 70 75 80
Asn Leu Gly Leu Cys Leu Phe Ser Gly Ala Val Trp Ile Tyr Thr Ser
85 90 95
Tyr Leu Met Ile Gln Asp Gly His Phe Arg Ser Leu Glu Ala Ala Thr
100 105 110
Cys Glu Pro Leu Lys His Pro His Phe Gln Leu Ile Ser Leu Leu Phe
115 120 125
Ala Leu Ser Lys Ile Trp Glu Trp Phe Asp Thr Val Leu Leu Ile Val
130 135 140
Lys Gly Asn Lys Leu Arg Phe Leu His Val Leu His His Ala Thr Thr
145 150 155 160
Phe Trp Leu Tyr Ala Ile Asp His Ile Phe Leu Ser Ser Ile Lys Tyr
165 170 175
Gly Val Ala Val Asn Ala Phe Ile His Thr Val Met Tyr Ala His Tyr
180 185 190
Phe Arg Pro Phe Pro Lys Gly Leu Arg Pro Leu Ile Thr Gln Leu Gln
195 200 205
Ile Val Gln Phe Ile Phe Ser Ile Gly Ile His Thr Ala Ile Tyr Trp
210 215 220
His Tyr Asp Cys Glu Pro Leu Val His Thr His Phe Trp Glu Tyr Val
225 230 235 240
Thr Pro Tyr Leu Phe Val Val Pro Phe Leu Ile Leu Phe Phe Asn Phe
245 250 255
Tyr Leu Gln Gln Tyr Val Leu Ala Pro Ala Lys Thr Lys Lys Ala
260 265 270
<210>75
<211>266
<212>PRT
<213>Dabio rerio
<400>75
Met Ser Val Leu Ala Leu Gln Glu Tyr Glu Phe Glu Arg Gln Phe Asn
1 5 10 15
Glu Asp Glu Ala Ile Arg Trp Met Gln Glu Asn Trp Lys Lys Ser Phe
20 25 30
Leu Phe Ser Ala Leu Tyr Ala Ala Cys Ile Leu Gly Gly Arg His Val
35 40 45
Met Lys Gln Arg Glu Lys Phe Glu Leu Arg Lys Pro Leu Val Leu Trp
50 55 60
Ser Leu Thr Leu Ala Ala Phe Ser Ile Phe Gly Ala Ile Arg Thr Gly
65 70 75 80
Gly Tyr Met Val Asn Ile Leu Met Thr Lys Gly Leu Lys Gln Ser Val
85 90 95
Cys Asp Gln Ser Phe Tyr Asn Gly Pro Val Ser Lys Phe Trp Ala Tyr
100 105 110
Ala Phe Val Leu Ser Lys Ala Pro Glu Leu Gly Asp Thr Leu Phe Ile
115 120 125
Val Leu Arg Lys Gln Lys Leu Ile Phe Leu His Trp Tyr His His Ile
130 135 140
Thr Val Leu Leu Tyr Ser Trp Tyr Ser Tyr Lys Asp Met Val Ala Gly
145 150 155 160
Gly Gly Trp Phe Met Thr Met Asn Tyr Leu Val His Ala Val Met Tyr
165 170 175
Ser Tyr Tyr Ala Leu Arg Ala Ala Gly Phe Lys Ile Ser Arg Lys Phe
180 185 190
Ala Met Phe Ile Thr Leu Thr Gln Ile Thr Gln Met Val Met Gly Cys
195 200 205
Val Val Asn Tyr Leu Val Tyr Leu Trp Met Gln Gln Gly Gln Glu Cys
210 215 220
Pro Ser His Val Gln Asn Ile Val Trp Ser Ser Leu Met Tyr Leu Ser
225 230 235 240
Tyr Phe Val Leu Phe Cys Gln Phe Phe Phe Glu Ala Tyr Ile Thr Lys
245 250 255
Arg Lys Ser Asn Ala Ala Lys Lys Ser Gln
260 265
<210>76
<211>320
<212>PRT
<213>Pavlova lutheri
<400>76
His Glu Ala Ser Cys Arg Ile Arg His Glu Ala Ala Leu Trp Ser Trp
1 5 10 15
Leu Pro Thr Tyr Asp Glu Phe Val Asp Gly Leu Ser Phe Val Asp Arg
20 25 30
Glu Lys Ile Gly Val His Met Val Asp Gln Gly Val Ile Thr Ser Ala
35 40 45
Glu Trp Ala Ala Ile Ser Val Asp Lys His Met Ser Phe Phe Ser Asp
50 55 60
Ala Ala Glu Phe Thr Gly Asp His Trp Ile Ile Pro Leu Val Ala Val
65 70 75 80
Ala Leu Tyr Leu Val Met Ile Val Val Gly Pro Met Ile Met Ala Asn
85 90 95
Arg Pro Pro Leu Pro Val Asn Gly Leu Ala Cys Ala Trp Asn Trp Phe
100 105 110
Leu Ala Ala Phe Ser Thr Phe Gly Val Ala Cys Thr Trp His Cys Ile
115 120 125
Phe Thr Arg Leu Arg Ser Arg Gly Phe Glu Ser Thr Thr Cys Gly Ser
130 135 140
Ala Met Phe Met Ser Gln Gly Tyr Val Gly Leu Ala Met Leu Leu Phe
145 150 155 160
Ile Tyr Ser Lys Leu Phe Glu Leu Ile Asp Thr Phe Phe Leu Ile Ala
165 170 175
Lys Lys Ala Asp Val Ile Phe Leu His Trp Tyr His His Val Thr Val
180 185 190
Leu Leu Tyr Cys Trp His Ser His Ser Val Arg Ile Pro Ser Gly Ile
195 200 205
Trp Phe Ala Ala Met Asn Tyr Phe Val His Ala Ile Met Tyr Ser Tyr
210 215 220
Phe Ala Met Thr Gln Met Gly Pro Arg Tyr Arg Lys Leu Val Arg Pro
225 230 235 240
Tyr Ala Arg Leu Ile Thr Thr Leu Gln Ile Ser Gln Met Phe Val Gly
245 250 255
Leu Ile Val Asn Gly Ser Ile Ile Tyr Phe Thr Ser Leu Gly His Ala
260 265 270
Cys Lys Ser Ser Lys Thr Asn Thr Ile Leu Ser Trp Leu Met Tyr Leu
275 280 285
Ser Tyr Phe Val Leu Phe Gly Leu Leu Tyr Leu Arg Asn Tyr Ile Leu
290 295 300
Gly Thr His Gly Lys Pro Ala Gly Lys Arg Ala Lys Gly Lys Ala Glu
305 310 315 320
<210>77
<211>282
<212>PRT
<213>Danio rerio
<400>77
Met Glu Thr Phe Ser His Arg Val Asn Ser Tyr Ile Asp Ser Trp Met
1 5 10 15
Gly Pro Arg Asp Leu Arg Val Thr Gly Trp Phe Leu Leu Asp Asp Tyr
20 25 30
Ile Pro Thr Phe Ile Phe Thr Val Met Tyr Leu Leu Ile Val Trp Met
35 40 45
Gly Pro Lys Tyr Met Lys Asn Arg Gln Ala Tyr Ser Cys Arg Ala Leu
50 55 60
Leu Val Pro Tyr Asn Leu Cys Leu Thr Leu Leu Ser Leu Tyr Met Phe
65 70 75 80
Tyr Glu Leu Val Met Ser Val Tyr Gln Gly Gly Tyr Asn Phe Phe Cys
85 90 95
Gln Asn Thr His Ser Gly Gly Asp Ala Asp Asn Arg Met Met Asn Val
100 105 110
Leu Trp Trp Tyr Tyr Phe Ser Lys Leu Ile Glu Phe Met Asp Thr Phe
115 120 125
Phe Phe Ile Leu Arg Lys Asn Asn His Gln Ile Thr Phe Leu His Val
130 135 140
Tyr His His Ala Thr Met Leu Asn Ile Trp Trp Phe Val Met Asn Trp
145 150 155 160
Val Pro Cys Gly His Ser Tyr Phe Gly Ala Thr Phe Asn Ser Phe Ile
165 170 175
His Val Leu Met Tyr Ser Tyr Tyr Gly Leu Ser Ala Val Pro Ala Leu
180 185 190
Arg Pro Tyr Leu Trp Trp Lys Lys Tyr Ile Thr Gln Gly Gln Leu Val
195 200 205
Gln Phe Val Leu Thr Met Phe Gln Thr Ser Cys Ala Val Val Trp Pro
210 215 220
Cys Gly Phe Pro Met Gly Trp Leu Tyr Phe Gln Ile Ser Tyr Met Val
225 230 235 240
Thr Leu Ile Leu Leu Phe Ser Asn Phe Tyr Ile Gln Thr Tyr Lys Lys
245 250 255
Arg Ser Gly Ser Val Asn Gly His Thr Asn Gly Val Met Ser Ser Glu
260 265 270
Lys Ile Lys His Arg Lys Ala Arg Ala Asp
275 280
<210>78
<211>396
<212>PRT
<213>Pavlova lutheri
<400>78
Arg Gly Leu Val Pro Asn Ser Ala Arg Gly Leu Arg Asp Asp Lys Asp
1 5 10 15
Asp Gly Ser Leu Ser Ala Thr Ser Asp Phe Phe Arg Ser Thr Ile Thr
20 25 30
Asp Cys Gly Asn Phe Cys Asp Glu Ser Val Asp Phe Gln Met Lys Leu
35 40 45
Phe Glu Arg Asn Gln Ile Ser Glu Arg Cys Tyr Phe Pro Pro Gly Ile
50 55 60
Arg Ala Tyr Arg Lys Gly Glu Arg Asp Phe Asp Phe Ser Met Ala Ala
65 70 75 80
Ala Arg Lys Glu Phe Glu Thr Val Val Phe Thr Thr Val Asp Glu Leu
85 90 95
Leu Ala Lys Thr Gly Val Lys Pro Arg Asp Ile Asp Ile Leu Val Val
100 105 110
Asn Cys Ser Leu Phe Asn Pro Thr Pro Ser Leu Ala Ala Ile Val Ile
115 120 125
Asn His Tyr Gln Met Lys Asp Ser Val Gln Ser Tyr Ser Leu Gly Gly
130 135 140
Met Gly Cys Ser Ala Gly Leu Ile Ser Ile His Leu Ala Lys Asp Leu
145 150 155 160
Leu Gln Val Tyr Pro Arg Lys Arg Ala Leu Val Ile Ser Thr Glu Asn
165 170 175
Ile Thr Gln Asn Phe Tyr Gln Gly Asn Glu Lys Ser Met Leu Ile Ser
180 185 190
Asn Thr Leu Phe Arg Met Gly Gly Ala Ala Val Leu Leu Ser Gly Arg
195 200 205
His Ala Asp Arg Arg Val Ala Lys Tyr Gln Leu Leu His Thr Val Arg
210 215 220
Thr His Lys Gly Ala Asp Pro Asp Ala Tyr Arg Cys Val Phe Gln Glu
225 230 235 240
Glu Asp Lys Ala Gly His Val Gly Val Arg Leu Ser Lys Asp Val Met
245 250 255
Glu Cys Ala Gly Ala Ala Met Lys Thr Asn Ile Ser Val Leu Ala Pro
260 265 270
Leu Ile Leu Pro Val Ser Glu Gln Val Arg Phe Leu Ala Asn Tyr Val
275 280 285
Ala Arg Lys Trp Leu Arg Met Lys Gly Val Lys Gly Tyr Val Pro Asp
290 295 300
Phe Thr Thr Ala Val Gln His Phe Cys Ile His Thr Gly Gly Arg Ala
305 310 315 320
Val Leu Asp Ala Leu Gln Ala Asn Leu Ser Leu Ser Asp Tyr Tyr Leu
325 330 335
Glu Pro Ser Arg Tyr Ser Leu Trp Arg Trp Gly Asn Val Ser Ser Ala
340 345 350
Ser Val Trp Tyr Glu Leu Asp Trp Leu Glu Lys Ser Gly Arg Ile Arg
355 360 365
Arg Gly Asp Lys Val Trp Gln Ile Gly Phe Gly Ser Gly Phe Lys Cys
370 375 380
Asn Ser Ala Val Trp Arg Ala Cys Arg Ala Met Pro
385 390 395
<210>79
<211>315
<212>DNA
<213>Heterocapsa niei
<400>79
gattcaggat cctttttgca taggtaccac tccaccatgt ttccgatctg gtagggttgt 60
gtgcgtggtc cacgcctctt cacttggaca agtgccgtcg ggccaagtgc cgtcgggcca 120
agtgccgtcg ggccaaggaa agcactccag cgctcacaac cacctcaccc ccccctcccg 180
ccccccgctt cgttttcgct tgctttcagg tggatggggg cccgctgggt gcctggaggc 240
cagtcgtatt tttgtgcgac catcaattcc accgtgcatg ttgtcatgta cgcctattac 300
ttttctagat caatc 315
<210>80
<211>100
<212>PRT
<213>Artificial Sequence
<220>
<223>Protein encoded by SEQ ID NO:79which comprises a stop codon
between residues 17 and 18 suggesting the presence of an intron
<400>80
Asp Ser Gly Ser Phe Leu His Arg Tyr His Ser Thr Met Phe Pro Ile
1 5 10 15
Trp Gly Cys Val Arg Gly Pro Arg Leu Phe Thr Trp Thr Ser Ala Val
20 25 30
Gly Pro Ser Ala Val Gly Pro Ser Ala Val Gly Pro Arg Lys Ala Leu
35 40 45
Gln Arg Ser Gln Pro Pro His Pro Pro Leu Pro Pro Pro Ala Ser Phe
50 55 60
Ser Leu Ala Phe Arg Trp Met Gly Ala Arg Trp Val Pro Gly Gly Gln
65 70 75 80
Ser Tyr Phe Cys Ala Thr Ile Asn Ser Thr Val His Val Val Met Tyr
85 90 95
Ala Tyr Tyr Phe
100
<210>81
<211>46
<212>DNA
<213>Artificial Sequence
<220>
<223>Oligonucleotide primer
<400>81
gctacgcccg gggatcctcg aggctggcgc aacgcaatta atgtga 46
<210>82
<211>84
<212>DNA
<213>Artificial Sequence
<220>
<223>Oligonucleotide primer
<400>82
cacaggaaac agcttgacat cgattaccgg caattgtacg gcggccgcta cggatatcct 60
cgctcgagct cgcccggggt agct 84
<210>83
<211>46
<212>DNA
<213>Artificial Sequence
<220>
<223>Oligonucleotide primer
<400>83
agcacatcga tgaaggagat atacccatgg ctaatgcaat caagaa 46
<210>84
<211>36
<212>DNA
<213>Artificial Sequence
<220>
<223>Oligonucleotide primer
<400>84
acgatgcggc cgctcaacca tgagtattaa gagctt 36
<210>85
<211>294
<212>PRT
<213>Pavlova salina
<400>85
Met Pro Thr Trp Gly Glu Phe Val Ala Gly Leu Thr Tyr Val Glu Arg
1 5 10 15
Gln Gln Met Ser Glu Glu Leu Val Arg Ala Asn Lys Leu Pro Leu Ser
20 25 30
Leu Ile Pro Glu Val Asp Phe Phe Thr Ile Ala Ser Val Tyr Val Gly
35 40 45
Asp His Trp Arg Ile Pro Phe Thr Ala Ile Ser Ala Tyr Leu Val Leu
50 55 60
Ile Thr Leu Gly Pro Gln Leu Met Ala Arg Arg Pro Pro Leu Pro Ile
65 70 75 80
Asn Thr Leu Ala Cys Leu Trp Asn Phe Ala Leu Ser Leu Phe Ser Phe
85 90 95
Val Gly Met Ile Val Thr Trp Thr Thr Ile Gly Glu Arg Leu Trp Lys
100 105 110
Asn Gly Ile Glu Asp Thr Val Cys Gly His Pro Ile Phe Met Gly Tyr
115 120 125
Gly Trp Ile Gly Tyr Val Met Leu Ala Phe Ile Trp Ser Lys Leu Phe
130 135 140
Glu Leu Ile Asp Thr Val Phe Leu Val Ala Lys Lys Ala Asp Val Ile
145 150 155 160
Phe Leu His Trp Tyr His His Val Thr Val Leu Leu Tyr Cys Trp His
165 170 175
Ser Tyr Ala Val Arg Ile Pro Ser Gly Ile Trp Phe Ala Ala Met Asn
180 185 190
Tyr Phe Val His Ala Ile Met Tyr Ala Tyr Phe Gly Met Thr Gln Ile
195 200 205
Gly Pro Arg Gln Arg Lys Leu Val Arg Pro Tyr Ala Arg Leu Ile Thr
210 215 220
Thr Phe Gln Leu Ser Gln Met Gly Val Gly Leu Ala Val Asn Gly Leu
225 230 235 240
Ile Ile Arg Tyr Pro Ser Ile Gly His His Cys His Ser Asn Lys Thr
245 250 255
Asn Thr Ile Leu Ser Trp Ile Met Tyr Ala Ser Tyr Phe Val Leu Phe
260 265 270
Ala Ala Leu Tyr Val Lys Asn Tyr Ile Phe Ser Lys Leu Lys Ser Pro
275 280 285
Lys Arg Lys Lys Val Glu
290
<210>86
<211>276
<212>PRT
<213>Pavlova salina
<400>86
Met Ser Glu Glu Leu Val Arg Ala Asn Lys Leu Pro Leu Ser Leu Ile
1 5 10 15
Pro Glu Val Asp Phe Phe Thr Ile Ala Ser Val Tyr Val Gly Asp His
20 25 30
Trp Arg Ile Pro Phe Thr Ala Ile Ser Ala Tyr Leu Val Leu Ile Thr
35 40 45
Leu Gly Pro Gln Leu Met Ala Arg Arg Pro Pro Leu Pro Ile Asn Thr
50 55 60
Leu Ala Cys Leu Trp Asn Phe Ala Leu Ser Leu Phe Ser Phe Val Gly
65 70 75 80
Met Ile Val Thr Trp Thr Thr Ile Gly Glu Arg Leu Trp Lys Asn Gly
85 90 95
Ile Glu Asp Thr Val Cys Gly His Pro Ile Phe Met Gly Tyr Gly Trp
100 105 110
Ile Gly Tyr Val Met Leu Ala Phe Ile Trp Ser Lys Leu Phe Glu Leu
115 120 125
Ile Asp Thr Val Phe Leu Val Ala Lys Lys Ala Asp Val Ile Phe Leu
130 135 140
His Trp Tyr His His Val Thr Val Leu Leu Tyr Cys Trp His Ser Tyr
145 150 155 160
Ala Val Arg Ile Pro Ser Gly Ile Trp Phe Ala Ala Met Asn Tyr Phe
165 170 175
Val His Ala Ile Met Tyr Ala Tyr Phe Gly Met Thr Gln Ile Gly Pro
180 185 190
Arg Gln Arg Lys Leu Val Arg Pro Tyr Ala Arg Leu Ile Thr Thr Phe
195 200 205
Gln Leu Ser Gln Met Gly Val Gly Leu Ala Val Asn Gly Leu Ile Ile
210 215 220
Arg Tyr Pro Ser Ile Gly His His Cys His Ser Asn Lys Thr Asn Thr
225 230 235 240
Ile Leu Ser Trp Ile Met Tyr Ala Ser Tyr Phe Val Leu Phe Ala Ala
245 250 255
Leu Tyr Val Lys Asn Tyr Ile Phe Ser Lys Leu Lys Ser Pro Lys Arg
260 265 270
Lys Lys Val Glu
275
<210>87
<211>20
<212>DNA
<213>Artificial Sequence
<220>
<223>Oligonucleotide primer
<400>87
cgctctagaa ctagtggatc
<210>88
<211>223
<212>PRT
<213>Melosira sp.
<400>88
Thr Ile Phe Lys Ser Asn Ala Val Pro Ala Leu Asp Pro Tyr Pro Ile
1 5 10 15
Lys Phe Val Tyr Asn Val Ser Gln Ile Met Met Cys Ala Tyr Met Thr
20 25 30
Ile Glu Ala Gly Leu Val Ala Tyr Arg Ser Gly Tyr Thr Val Met Pro
35 40 45
Cys Asn Asp Tyr Asn Thr Asn Asn Pro Pro Val Gly Asn Leu Leu Trp
50 55 60
Leu Phe Tyr Ile Ser Lys Val Trp Asp Phe Trp Asp Thr Ile Phe Ile
65 70 75 80
Val Ile Gly Lys Lys Trp Lys Gln Leu Ser Phe Leu His Val Tyr His
85 90 95
His Thr Thr Ile Phe Leu Phe Tyr Trp Leu Asn Ser His Val Asn Tyr
100 105 110
Asp Gly Asp Ile Tyr Leu Thr Ile Leu Leu Asn Gly Phe Ile His Thr
115 120 125
Val Met Tyr Thr Tyr Tyr Phe Val Cys Met His Thr Lys Val Pro Glu
130 135 140
Thr Gly Lys Ser Leu Pro Ile Trp Trp Lys Ser Ser Leu Thr Met Met
145 150 155 160
Gln Met Ile Gln Phe Val Thr Met Met Ser Gln Ala Ser Tyr Leu Leu
165 170 175
Val Thr Asn Cys Glu Lys Thr Ser Arg Gly Val Val Ile Ala Tyr Phe
180 185 190
Val Tyr Ile Phe Thr Leu Leu Val Leu Phe Ala Gln Phe Phe Arg Ala
195 200 205
Ser Tyr Met Lys Pro Lys Gly Lys Lys Ala Lys Met Lys Lys Val
210 215 220
<210>89
<211>683
<212>DNA
<213>Melosira sp.
<400>89
acgatcttca agtcaaacgc cgtccctgcc ctggatccat accccatcaa attcgtttac 60
aatgtgtccc agatcatgat gtgcgcgtac atgacgatcg aggcaggcct ggtggcctac 120
cgcagtggct atactgtcat gccatgcaac gactacaaca ccaacaaccc ccctgtcggg 180
aacctgctgt ggctgtttta catttccaaa gtttgggact tttgggacac catctttatc 240
gtgattggca aaaagtggaa gcagctgagc ttcttgcacg tgtaccacca caccaccatc 300
tttttgttct actggctcaa ctcgcatgtc aactacgacg gagatattta tctgacgatt 360
ctgttgaacg gcttcatcca caccgtcatg tacacttatt acttcgtttg catgcacacg 420
aaggtgcccg agactggaaa gtcgttgccc atttggtgga aatccagtct caccatgatg 480
caaatgatcc aattcgtcac catgatgagc caggcttcgt acttgctcgt gacgaactgc 540
gaaaagacca gtcggggggt cgttattgcg tactttgtgt acattttcac tctactcgtc 600
ttatttgctc agttcttccg agcatcttac atgaagccca agggaaagaa ggcgaaaatg 660
aagaaggtat aagctgctgg cat 683
Claims (59)
1.能从二十二碳五烯酸(DPA)合成二十二碳六烯酸(DHA)的重组植物细胞或酵母细胞,其包括编码Δ4去饱和酶的多核苷酸,其中所述多核苷酸与能指导所述多核苷酸在细胞内表达的启动子可操纵地连接,其中所述重组细胞衍生自不能合成DHA的细胞,且其中所述Δ4去饱和酶的氨基酸序列为SEQ ID NO:4。
2.权利要求1的细胞,其包括至少一种在细胞内合成的C20LC-PUFA,且其中细胞的总脂肪酸包括至少2%的C20 LC-PUFA。
3.权利要求1的细胞,其包括至少一种在细胞内合成的ω3 C20LC-PUFA,且其中细胞的总脂肪酸包括至少2.5%的ω3 C20 LC-PUFA。
4.权利要求1的细胞,其中所述细胞能从内源性产生的亚油酸(LA)、α-亚麻酸(ALA)或两者产生DHA。
5.权利要求4的细胞,其中内源性产生的ALA与LA的比例是至少1∶1。
6.权利要求1-5任一项的细胞,其中所述植物细胞来自油籽。
7.权利要求1-5任一项的细胞,其中至少一种启动子是种子特异性启动子。
8.权利要求1的细胞,其中至少部分所述DHA整合于所述细胞的三酰甘油内。
9.权利要求1的细胞,其中至少50%在所述细胞内产生的DHA整合于三酰甘油内。
10.相对于同基因非重组细胞而言从二十二碳五烯酸(DPA)合成二十二碳六烯酸(DHA)的能力增强的重组植物细胞或酵母细胞,其包括编码Δ4去饱和酶的多核苷酸,其中所述多核苷酸与能在所述重组细胞中表达所述多核苷酸的启动子可操纵地连接,且其中所述Δ4去饱和酶的氨基酸序列为SEQ ID NO:4。
11.产生能从二十二碳五烯酸(DPA)合成二十二碳六烯酸(DHA)的植物细胞或酵母细胞的方法,所述方法包括向细胞内引入编码Δ4去饱和酶的多核苷酸,其中所述多核苷酸与能指导所述多核苷酸在细胞内表达的启动子可操纵地连接,且其中所述Δ4去饱和酶的氨基酸序列为SEQ ID NO:4。
12.权利要求11的方法,其中所述细胞能从内源性产生的亚油酸(LA)、α-亚麻酸(ALA)或两者产生DHA。
13.权利要求12的方法,其中内源性产生的ALA与LA的比例是至少1∶1。
14.权利要求11-13任一项的方法,其中所述植物细胞来自油籽。
15.权利要求11-13任一项的方法,其中至少一种启动子是种子特异性启动子。
16.权利要求11的方法,其中至少部分DHA整合于所述细胞的三酰甘油内。
17.权利要求16的方法,其中至少50%在所述细胞内产生的DHA整合于三酰甘油内。
18.权利要求11的方法,还包括在引入所述多核苷酸之后确定所述细胞的脂肪酸含量或组成的步骤。
19.权利要求11的方法,还包括鉴定或筛选相对于等基因非转化细胞具有改进的脂肪酸含量或组成的细胞的步骤。
20.权利要求11-19任一项的方法,其还包括产生包含至少一种所述细胞的转基因植物。
21.权利要求20的方法,其还包括产生所述转基因植物的前身。
22.权利要求21的方法,其中植物是被子植物。
23.权利要求20的方法,其包括至少一个合成DHA的植物部分。
24.权利要求20的方法,其中所述转基因植物包括至少一个合成至少一种ω3 C20 LC-PUFA的植物部分,且其中所述植物部分的总脂肪酸包括至少2.5%的ω3 C20 LC-PUFA。
25.权利要求20的方法,其中所述转基因植物包括至少一个合成ω3多不饱和脂肪酸的植物部分,所述ω3多不饱和脂肪酸是ALA的Δ6去饱和作用的产物和/或ALA的Δ9延长作用的产物,且其中植物部分中的ALA向所述产物的转化效率为至少22%。
26.权利要求20的方法,其中植物是油籽植物。
27.产生从二十二碳五烯酸(DPA)合成二十二碳六烯酸(DHA)的能力增强的重组植物细胞或酵母细胞的方法,其包括将编码Δ4去饱和酶的多核苷酸引入第一种细胞,其中所述多核苷酸与能指导所述多核苷酸在所述重组细胞内表达的启动子可操纵地连接,其中所述Δ4去饱和酶的氨基酸序列为SEQ ID NO:4,且其中所述重组细胞相对于所述第一种细胞而言具有增强的合成DHA的能力。
28.生产包含DHA的油籽植物的方法,所述方法包括:
i)使得在种子中产生DHA的转基因油籽植物生长;和
ii)收集植物的种子,
其中所述种子包含权利要求1-10之一的重组细胞。
29.权利要求28的方法,其中产生转基因种子的等基因非转基因种子产生LA和/或ALA。
30.权利要求29的方法,其中所述等基因非转基因种子在其脂肪酸中包含的ALA的浓度高于LA的浓度。
31.权利要求29的方法,其中所述等基因非转基因种子在其脂肪酸中包含至少约13%的ALA。
32.权利要求28的方法,其中种子的油中的总脂肪酸包括至少9%的C20脂肪酸。
33.权利要求28的方法,其中油籽植物是油籽油菜、玉米、向日葵、大豆、高梁、亚麻、甜菜、棉花、花生、罂粟、芥菜、蓖麻子、芝麻、或红花。
34.权利要求28的方法,其中所述种子具有与等基因非转基因种子基本上相同的发芽率。
35.权利要求28的方法,其中所述种子还包含至少一种在所述种子中合成的ω3 C20 LC-PUFA,且其中所述种子的总脂肪酸包含至少2.5%的ω3 C20 LC-PUFA。
36.权利要求28的方法,其中所述种子包含ω3多不饱和脂肪酸,所述ω3多不饱和脂肪酸是ALA的Δ6去饱和作用的产物和/或ALA的Δ9延长作用的产物,所述产物是在所述种子中合成的,且其中所述种子中的ALA向所述产物的转化效率为至少22%。
37.权利要求28的方法,其中所述种子中的至少25%的DHA组成三酰甘油部分。
38.一种提取物,其来自权利要求1-10任一项的细胞、包含权利要求1-10任一项的细胞的转基因植物或其部分、通过权利要求11-27任一项的方法产生的细胞、包含通过权利要求11-27任一项的方法产生的细胞的转基因植物或其部分、或通过权利要求28-37任一项的方法产生的油籽或其部分,其中所述提取物包含DHA。
39.权利要求38的提取物,其是包含至少50%三酰甘油的基本上纯化的油。
40.权利要求38的提取物,其中总脂肪酸含量中还包含至少2.5%ω3C20 LC-PUFA。
41.产生DHA的方法,所述方法包括在合适的条件下培养权利要求1-10任一项的重组细胞。
42.权利要求41的方法,其中细胞是适用于发酵的生物体的细胞,且所述方法还包括将细胞暴露于至少一种DHA前体。
43.权利要求42的方法,其中DHA前体是至少一种亚油酸或α-亚麻酸。
44.权利要求42的方法,其中在植物油中提供DHA前体。
45.权利要求41的方法,其中细胞是藻类细胞,且所述方法还包括在合适的条件下生长用于产生DHA的藻类细胞。
46.权利要求41的方法,其中所述细胞还包含至少一种C20LC-PUFA,且其中所述细胞的总脂肪酸包含至少2%的C20 LC-PUFA。
47.权利要求41的方法,其中所述细胞还包含至少一种ω3 C20LC-PUFA,且其中所述细胞的总脂肪酸包含至少2.5%的ω3 C20 LC-PUFA。
48.权利要求41的方法,其中所述细胞还包含ω3多不饱和脂肪酸,所述ω3多不饱和脂肪酸是ALA的Δ6去饱和作用的产物和/或ALA的Δ9延长作用的产物,且其中所述细胞内的ALA向所述产物的转化效率是至少22%。
49.生产DHA的方法,所述方法包括在合适的条件下培育包含权利要求1-10任一项的细胞的转基因植物或其部分、包含通过权利要求11-27任一项的方法产生的细胞的转基因植物、或通过权利要求28-37任一项的方法产生的油籽。
50.生产包含DHA的油的方法,包括获得包含权利要求1-10任一项的细胞的转基因植物或其部分、包含通过权利要求11-27任一项的方法产生的细胞的转基因植物或其部分、或通过权利要求28-37任一项的方法产生的油籽或其部分,以及从所述植物或其部分中提取油。
51.权利要求50的方法,其中所述油是通过压榨所述植物的种子而从所述种子中提取的。
52.一种发酵方法,其包括以下步骤:
i)提供含有液体组合物的容器,所述液体组合物包括权利要求1-10任一项的细胞以及发酵和脂肪酸生物合成所需的组分;和
ii)提供有助于所述容器所含的液体组合物的发酵的条件。
53.权利要求52的发酵方法,其中发酵和脂肪酸生物合成所需的组分是LA。
54.一种组合物,其包括权利要求1-10任一项的细胞、或其包括DHA的提取物或部分、以及合适载体。
55.一种组合物,其包括包含DHA的权利要求38的提取物以及合适载体。
56.一种饲料,其包括权利要求1-10任一项的细胞、包含权利要求1-10任一项的细胞的转基因植物或其部分、通过权利要求11-27任一项的方法产生的细胞、包含通过权利要求11-27任一项的方法产生的细胞的转基因植物或其部分、或通过权利要求28-37任一项的方法产生的油籽或其部分、权利要求38-40中任一项的提取物、权利要求41-51中任一项的方法的产物、权利要求52或权利要求53的发酵方法的产物、或权利要求54或权利要求55的组合物。
57.权利要求56的饲料,其至少包括DHA,其中用重组酶在细胞内进行至少一种生产DHA的酶反应。
58.制备饲料的方法,所述方法包括将权利要求1-10任一项的细胞、包含权利要求1-10任一项的细胞的转基因植物或其部分、通过权利要求11-27任一项的方法产生的细胞、包含通过权利要求11-27任一项的方法产生的细胞的转基因植物或其部分、或通过权利要求28-37任一项的方法产生的油籽或其部分、权利要求38-40中任一项的提取物、权利要求41-51中任一项的方法的产物、权利要求52或权利要求53的发酵方法的产物、或权利要求54或权利要求55的组合物与合适的营养素和/或载体混和。
59.权利要求1-10任一项的细胞、包含权利要求1-10任一项的细胞的转基因植物或其部分、通过权利要求11-27任一项的方法产生的细胞、包含通过权利要求11-27任一项的方法产生的细胞的转基因植物或其部分、或通过权利要求28-37任一项的方法产生的油籽或其部分、权利要求38-40中任一项的提取物、权利要求41-51中任一项的方法的产物、权利要求52或权利要求53的发酵方法的产物、或权利要求54或权利要求55的组合物在生产用于治疗或预防可从LC-PUFA中获益的疾病的药物中的用途。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210006139.8A CN102559364B (zh) | 2004-04-22 | 2005-04-22 | 用重组细胞合成长链多不饱和脂肪酸 |
CN201310392524.5A CN103451246B (zh) | 2004-04-22 | 2005-04-22 | 用重组细胞合成长链多不饱和脂肪酸 |
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US56462704P | 2004-04-22 | 2004-04-22 | |
US60/564,627 | 2004-04-22 | ||
US61386104P | 2004-09-27 | 2004-09-27 | |
US60/613,861 | 2004-09-27 | ||
US66870505P | 2005-04-05 | 2005-04-05 | |
AU2005901673A AU2005901673A0 (en) | 2005-04-05 | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells | |
AU2005901673 | 2005-04-05 | ||
US60/668,705 | 2005-04-05 | ||
PCT/AU2005/000571 WO2005103253A1 (en) | 2004-04-22 | 2005-04-22 | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310392524.5A Division CN103451246B (zh) | 2004-04-22 | 2005-04-22 | 用重组细胞合成长链多不饱和脂肪酸 |
CN201210006139.8A Division CN102559364B (zh) | 2004-04-22 | 2005-04-22 | 用重组细胞合成长链多不饱和脂肪酸 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101018862A CN101018862A (zh) | 2007-08-15 |
CN101018862B true CN101018862B (zh) | 2013-10-09 |
Family
ID=38727204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800206963A Active CN101018862B (zh) | 2004-04-22 | 2005-04-22 | 用重组细胞合成长链多不饱和脂肪酸 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101018862B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT2337791E (pt) * | 2008-10-14 | 2013-11-29 | Monsanto Technology Llc | Utilização de ácido gordo-dessaturases de espécies de hemiselmis |
JP6068800B2 (ja) * | 2008-11-18 | 2017-01-25 | コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション | オメガ−3脂肪酸を産生するための酵素および方法 |
DK2429317T4 (da) * | 2009-04-17 | 2019-05-13 | Natac Pharma S L | Sammensætninger med højt indhold af omega-3-fedtsyrer og med lavt indhold af phytansyre |
JP5893555B2 (ja) * | 2009-06-16 | 2016-03-23 | イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニーE.I.Du Pont De Nemours And Company | エイコサペンタエン酸を高産生するよう改良されたヤロウイア・リポリティカ(Yarrowia lipolytica)最適化株 |
MX351063B (es) * | 2011-02-02 | 2017-09-29 | Terravia Holdings Inc | Aceites adaptados producidos a partir de microorganismos oleaginosos recombinantes. |
CN104853596B (zh) * | 2012-06-15 | 2018-10-09 | 联邦科学技术研究组织 | 在植物细胞中产生长链多不饱和脂肪酸 |
-
2005
- 2005-04-22 CN CN2005800206963A patent/CN101018862B/zh active Active
Non-Patent Citations (2)
Title |
---|
Domergue F et al..Acyl carriers used as substrates by the desaturases and elongases involved in very long-chain polyunsaturated fatty acids biosynthesis reconstituted in yeast.《The journal of biological chemistry》.2003,第278卷(第37期),35115-35126. * |
黄锐之等.植物中多不饱和脂肪酸生物合成的基因工程.《植物生理学通讯》.2001,第37卷(第6期),547-550. * |
Also Published As
Publication number | Publication date |
---|---|
CN101018862A (zh) | 2007-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11597953B2 (en) | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells | |
US20220186269A1 (en) | Synthesis of long-chain polyunsaturated fatty acids by recombinant cell | |
CN101018862B (zh) | 用重组细胞合成长链多不饱和脂肪酸 | |
AU2005235627B2 (en) | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells | |
AU2015243035B2 (en) | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |