一种生物催化合成西他列汀及其中间体的方法
技术领域
本发明涉及分子生物学技术领域,特别是西他列汀的生物合成领域。具体而言,本发明提供了式I和式II所示化合物、或其药学上可接受的盐,一种能够催化所述式I化合物生成式II化合物的多肽,编码所述多肽的核酸,含有所述核酸的载体和细胞。此外,本发明还提供了使用所述多肽和式I化合物来生产式II化合物以及西他列汀的方法,以及制备所述多肽的方法。
背景技术
西他列汀(Sitagliptin,结构如下所示),化学名为(3R)-3-氨基-1-[3-(三氟甲基)-5,6,7,8-四氢-1,2,4-三唑并[4,3-a]吡嗪-7-基]-4-(2,4,5-三氟苯基)丁-1-酮,为一种口服降糖药。其可以单独应用也可以与其他口服降糖药组成复方药物(如二甲双胍或噻唑烷二酮)来治疗2型糖尿病。相比其他口服类降糖药,西他列汀在控制血液中葡萄糖含量时副作用更少(更低几率导致低血糖和体重增加)。
西他列汀结构中含有一个手性中心,该手性中心的构建是合成西他列汀最为关键的一步。现有研究中关于该手性中心的构建方法主要有以下几种:(1)生成烯胺底物后利用手性催化剂进行不对称氢化;(2)以手性氨化合物为原料;(3)手性拆分;(4)以β-羰基酯类化合物为底物,经转氨酶催化制备。然而,上述方法中存在诸如,成本昂贵、手性纯度低、后处理困难和收率低等。
近年来,由于生物酶法具有高选择性及环境友好的优势,逐步成为合成手性医药化学品及其中间体的优选方案。
转氨酶(transaminase)又称氨基转移酶,是不对称合成高光学纯手性氨的关键酶,在动植物和微生物中广泛分布。其中,许多ω-转氨酶基因己被克隆,部分氨基转移酶的基因已在不同的宿主(大肠杆菌、毕赤酵母等)中表达,获得了酶活和选择性都较高的基因工程菌。ω-转氨酶也被用于生产西他列汀。然而,对于R-型选择性转氨的天然ω-转氨酶报道很少,且这些ω-转氨酶催化的底物谱较窄,往往是为特定反应筛选的最适生物催化剂。
因此,寻找构建西他列汀手性中心的方法,尤其是生物酶法对于解决该药物合成中所面临的问题提供了新的选择。
发明内容
本发明人对野生型节杆菌转氨酶基因序列进行突变获得一种新的酶,其可立体专一地催化β-羰基酰胺生成R-型手性胺。本发明人在此基础上,开发了一种新的合成西他列汀的方法。
因此,在一个方面,本申请提供构建西他列汀手性中心的一个关键中间体,其为β-羰基酰胺类化合物,可作为所述酶的底物,立体专一地转化为R-型胺。所述式I所示化合物、或其药学上可接受的盐具有下述结构,
其中,R1和R2各自独立地选自氢、C1-6烷基、3-8元环烷基、3-8元杂环烷基、6-10元芳基和5-10元杂芳基;或者,R1和R2与相连的N原子形成4-7元杂环。
在某些优选的实施方案中,R1和R2各自独立地选自氢、C1-4烷基、3-6元环烷基、3-6元杂环烷基、6-10元芳基和5-6元杂芳基;或者,R1和R2与相连的N原子形成5-6元脂杂环或5-6元芳杂环。
在某些优选的实施方案中,R1和R2各自独立地选自氢和C1-4烷基;或者,R1和R2与相连的N原子形成5-6元脂杂环或5-6元芳杂环。
在某些优选的实施方案中,R1和R2与相连的N原子形成吡咯环、咪唑环、吡咯烷环、噁唑烷环、异噁唑烷环、哌啶环、吗啉环或哌嗪环。
在另一个方面,本发明提供西他列汀的手性中间体式II所示化合物、或其药学上可接受的盐,
其中,R1和R2各自独立地选自氢、C1-6烷基、3-8元环烷基、3-8元杂环烷基、6-10元芳基和5-10元杂芳基;或者,R1和R2与相连的N原子形成4-7元杂环。
在某些优选的实施方案中,R1和R2各自独立地选自氢、C1-4烷基、3-6元环烷基、3-6元杂环烷基、6-10元芳基和5-6元杂芳基;或者,R1和R2与相连的N原子形成5-6元脂杂环或5-6元芳杂环。
在某些优选的实施方案中,R1和R2各自独立地选自氢和C1-4烷基;或者,R1和R2与相连的N原子形成5-6元脂杂环或5-6元芳杂环。
在某些优选的实施方案中,R1和R2与相连的N原子形成吡咯环、咪唑环、吡咯烷环、噁唑烷环、异噁唑烷环、哌啶环、吗啉环或哌嗪环。
在另一个方面,本发明提供一种多肽,其具有催化羰基向氨基转化的活性,并且具有选自下列的氨基酸序列:
1)如SEQ ID NO:1所示的氨基酸序列;
2)与SEQ ID NO:1具有至少90%同一性的氨基酸序列;和
(3)与SEQ ID NO:1相异在于一个或几个氨基酸残基的置换、缺失或添加的氨基酸序列。
在某些优选的实施方案中,本发明多肽的氨基酸序列与SEQ ID NO:1具有至少90%同一性,优选至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、或至少99%同一性。
在某些优选的的实施方案中,本发明多肽的氨基酸序列与SEQ ID NO:1相异在于一个或几个(例如,1个、2个、3个、4个、5个、6个、7个、8个或9个)氨基酸残基的置换、缺失或添加。
在某些优选的实施方案中,本发明多肽具有催化式I化合物产生式II化合物的活性,所述式I化合物和式II化合物的定义如文中所述。
在另一个方面,本发明提供了一种分离的核酸,其编码如上所述的多肽。
在另一个方面,本发明还提供了一种载体,其包含所述分离的核酸。在某些优选的实施方案中,本发明的分离的核酸编码具有SEQ ID NO:1的氨基酸序列的多肽。可用于插入目的核苷酸的载体是本领域公知的,包括但不限于克隆载体和表达载体。在一个实施方案中,载体可以是例如质粒,粘粒,噬菌体等等。
在另一个方面,本发明还提供了包含上述分离的核酸和/或载体的细胞。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌细胞和芽孢杆菌细胞(例如嗜碱性芽孢杆菌,枯草芽孢杆菌),以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞。在某些优选的实施方案中,所述分离的核酸相对于所述细胞而言是异源的或外源的。
在另一个方面,本发明还提供了一种组合物,其含有上文所述的多肽。
在某些优选的实施方案中,所述组合物通过以下方法制备得到:
(a)培养宿主细胞,所述宿主细胞包含并表达编码前文所述多肽的核酸;(b)收集并破碎所述宿主细胞,得细胞破碎液;(c)过滤所述细胞破碎液;和(d)收集滤液。
在某些优选的实施方案中,通过离心或膜过滤收集所述宿主细胞;优选地,离心或膜过滤收集得到所述宿主细胞后,还包括用磷酸盐缓冲溶液洗涤所述宿主细胞的过程。
在另一个方面,本发明提供一种生产式II所示化合物、或其药学上可接受的盐的方法,其包括使用上述的多肽或组合物将式I化合物转化为式II化合物的步骤,其中,
所述式I和式II化合物、或其药学上可接受的盐如前文中所定义。
在某些优选的实施方案中,所述方法包括,(a)将所述式I化合物与氨基供体在所述多肽或组合物和氨基传递体存在的条件下发生反应;(b)收集步骤(a)产生的式II化合物。
催化剂的用量可根据本领域的常规技术手段所确定。在某些优选的实施方案中,步骤(a)中,V多肽或组合物:m式I化合物=(4-5):1。
在某些优选的实施方案中,在步骤(a)中,所述氨基供体选自C1-6烷胺和无机铵盐。在某些优选的实施方案中,所述C1-6烷胺为异丙胺。在某些优选的实施方案中,所述无机铵盐选自甲酸铵、氯化铵和硫酸铵。在某些优选的实施方案中,所述氨基供体为异丙胺。在某些优选的实施方案中,式I化合物与所述氨基供体的摩尔比为1:(1-3)。在某些优选的实施方案中,式I化合物与所述氨基供体的摩尔比为1:(1.2-3)。
在某些优选的实施方案中,在步骤(a)中,所述氨基传递体选自磷酸吡哆醛和磷酸吡哆胺。
在某些优选的实施方案中,在步骤(a)中,所述反应在水相中进行。在某些优选的实施方案中,可先将所述式I化合物用醇类溶剂溶解后再加入反应体系中。在某些优选的实施方案中,可将所述式I化合物用醇类溶剂溶解成1-5Kg/L的溶液,例如1-4Kg/L,例如3-4Kg/L。在某些优选的实施方案中,所述醇类试剂选自甲醇、乙醇和异丙醇。在某些优选的实施方案中,反应体系中式I化合物的浓度为100-250g/L。
在某些优选的实施方案中,在步骤(a)中,所述反应在30-50℃进行。在某些优选的实施方案中,在步骤(a)中,所述反应在45℃进行。
在某些优选的实施方案中,在步骤(a)中,反应体系pH值为7.0-9.0。在某些优选的实施方案中,反应体系pH值为8.0-9.0。在某些优选的实施方案中,用有机胺调节反应体系pH值。在某些优选的实施方案中,所述有机胺选自异丙胺、丁胺和戊胺。
在某些优选的实施方案中,在步骤(a)中,反应体系与空气接触。
在某些优选的实施方案中,在步骤(b)中,通过如下方法收集式II化合物:将步骤(a)中所得产物用有机溶剂萃取、浓缩。在某些优选的实施方案中,所述有机溶剂选自二氯甲烷、乙酸乙酯和乙酸异丙酯。
在另一个方面,本发明提供一种西他列汀或其盐的合成方法,其包括以下步骤:
第一步:式I化合物经不对称催化反应生成式II化合物;
第二步:式II化合物在碱的存在下水解得到式III化合物;
第三步:将式III化合物中的氨基进行保护得到式IV化合物;
第四步:式IV化合物与式V化合物进行缩合反应并脱除氨基保护基生成西他列汀或其盐;
其中,-Pg表示氨基保护基,R1和R2的定义如前文中所定义。
在某些优选的实施方案中,所述氨基保护基为Boc、Cbz、Fmoc或Alloc。
在某些优选的实施方案中,所述式I化合物可通过如下方法制得:
a)化合物1和化合物2在非质子溶剂中,有机碱存在下,室温或加热反应生成化合物3;
b)化合物3与NHR1R2在非醇类溶剂中,加热生成式I化合物。
在某些优选的实施方案中,化合物1和化合物2在EtOAc、DCM、DMF、DMA或DMSO中反应。在某些优选的实施方案中,化合物1和化合物2在DMA中反应。
在某些优选的实施方案中,化合物1和化合物2在甲胺、三乙胺、正丁胺或叔丁胺存在的条件下反应。在某些优选的实施方案中,化合物1和化合物2在三乙胺存在的条件下反应。
在某些优选的实施方案中,化合物1和化合物2在20-50℃发生反应。在某些优选的实施方案中,化合物1和化合物2在35℃发生反应。
在某些优选的实施方案中,化合物1和化合物2的摩尔比为1:(1-5)。
在某些优选的实施方案中,化合物1和化合物2反应后,还包括加入酸化试剂的步骤。在某些优选的实施方案中,所述酸化试剂选自盐酸、二氯亚砜和特戊酰氯。在某些优选的实施方案中,所述酸化试剂为盐酸。在某些优选的实施方案中,所述酸化试剂的加入量为使得反应体系pH呈酸性。
在某些优选的实施方案中,化合物3与NHR1R2在苯、甲苯或四氢化萘中反应。
在某些优选的实施方案中,化合物3与NHR1R2经无机碱催化发生反应。在某些优选的实施方案中,所述无机碱为氢氧化钠或氢氧化钾。
在某些优选的实施方案中,化合物3与NHR1R2在40-120℃发生反应。在某些优选的实施方案中,化合物3与NHR1R2在100-105℃发生反应。
在某些优选的实施方案中,化合物3与NHR1R2的摩尔比为1:(2-4)。
在某些优选的实施方案中,在第一步中,所述不对称催化反应为不对称还原胺化反应。在某些优选的实施方案中,催化所述还原胺化的催化剂选自手性铑、钯和钌的金属配合物催化剂。在某些优选的实施方案中,所述手性铑、钯和钌的金属配合物催化剂选自双(二叔丁基苯基膦)二氯化钯、(对伞花烃)钌和双[(α,α,α',α'-四甲基-1,3-苯二丙酸)铑]。
在某些优选的实施方案中,不对称催化反应所用催化剂为上文所述的多肽或组合物。
在某些优选的实施方案中,所述不对称催化式I化合物生成式II化合物的反应条件如前文中所定义。
在某些优选的实施方案中,式II化合物在无机碱存在的条件水解得到式III化合物。在某些优选的实施方案中,所述无机碱为氢氧化钠或氢氧化钾。
在某些优选的实施方案中,用Boc酸酐与式III化合物在碱的存在下反应进行氨基保护。在某些优选的实施方案中,式III化合物、Boc酸酐与碱的摩尔比为1:(1.5-3):(2-4)。在某些优选的实施方案中,所述碱选自氢氧化钠、氢氧化钾还和三乙胺。
在某些优选的实施方案中,将式IV化合物经其活性中间体与式V化合物发生缩合反应。在某些优选的实施方案中,所述式IV化合物的活性中间体为其酰氯、酸酐或酰胺形式。
在某些优选的实施方案中,式IV化合物与式V化合物的摩尔比为1:(1-1.2)。
在某些优选的实施方案中,所述缩合反应在非醇类溶剂中进行。在某些优选的实施方案中,所述非醇类试剂为乙酸乙酯,二氯甲烷或三氯甲烷。
在某些优选的实施方案中,所述缩合反应在室温条件下进行(例如25℃)。
在某些优选的实施方案中,所述缩合反应在碱的存在下进行。在某些优选的实施方案中,所述碱为三乙胺。
在另一个方面,本发明提供一种制备前文所述多肽的方法,其包括,(a)培养宿主细胞,所述宿主细胞包含并表达编码所述多肽的核酸;和,(b)收集所述细胞表达的所述多肽。
用于蛋白表达的各种宿主细胞是本领域技术人员公知的,其包括但不限于,原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。特别优选地,所述宿主细胞为大肠杆菌。
在另一个方面,本发明提供前文所述式I或式II化合物、或其药学上可接受的盐、所述多肽或组合物在制备西他列汀或其中间体中的用途。
相关术语的定义和解释
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的相关实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文中所使用的,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如Align程序(DNAstar,Inc)方便地进行的Needleman等人(1970)J.Mol.Biol.48:443-453的方法来实现。还可使用已整合入ALIGN程序(版本2.0)的E.Meyers和W.Miller(Comput.ApplBiosci.,4:11-17(1988))的算法,使用PAM120权重残基表(weight residue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外,可使用已整合入GCG软件包(可在www.gcg.com上获得)的GAP程序中的Needleman和Wunsch(J MoIBiol.48:444-453(1970))算法,使用Blossum 62矩阵或PAM250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。
如本文中使用的,表述“核酸/多肽相对于细胞是异源的”意指,所述核酸/多肽不天然存在于所述细胞中。也即,所述细胞在天然状态下不包含或表达所述核酸/多肽。
如本文中使用的,表述“核酸/多肽相对于细胞是外源的”意指,所述核酸/多肽是通过人工方式外源导入所述细胞中。应当理解,此类核酸/多肽可以不天然存在于所述细胞中(即,相对于所述细胞是异源的),其用于在细胞中引入异源的核酸/多肽;或者,也可以与天然存在于所述细胞中的内源核酸/多肽相同,其用于增加所述细胞中的内源核酸/多肽的拷贝数或表达。
如本文中使用的,表述“C1-6烷基”是指具有1~6,即1、2、3、4、5或6个碳原子的直链或支链烷基,典型地为甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基、新戊基、戊基和己基等。相似地,术语“C1-4烷基”意指具有1、2、3或4个碳原子的直链或支链烷基,包括甲基、乙基、正丙基、异丙基和正丁基等。
如本文中所使用的,术语“3-8元环烷基”意指含有3-8个环成员的饱和环状烃基,其可以是单环或者多环稠合系统,而且可以稠合在芳环上。包括例如3-6元环烷基、4-6元环烷基、5-6元环烷基等。这些基团的实例包括但不限于环丙基、环丁基、环戊基和环己基。
如本文中所使用的,术语“3-8元杂环烷基”是指含有3-8个环成员且其中至少一个和最多四个为独立地选自N、O或S的杂原子的单环或双环饱和或部分饱和的环状基团,例如3-6元杂环烷基、4-6元杂环烷基或5-6元杂环烷基。优选地,所述杂原子为1个N、2个N、1个N和1个O或1个N和1个S。这些基团的实例包括但不限于吡咯烷环、噁唑烷环、异噁唑烷环、咪唑烷环、哌啶环、吗啉环、硫吗啉环或哌嗪环等。
如本文中所使用的,术语“6-10元芳基”是指包含至少一个芳环的含有6-10个环成员的芳香基团。例如苯基、萘基等。
如本文中所使用的,术语“5-10元杂芳基”是指含有5-10个环成员且其中至少一个为独立地选自N、O和S的杂原子的具有芳香性的基团,例如5-6元杂芳基等。这些基团的实例包括但不限于吡咯基、呋喃基、噻吩基、咪唑基、吡唑基、三唑基、四唑基、噁唑基、异噁唑基、噁二唑基、噻唑基、异噻唑基、噻二唑基、吡啶基、嘧啶基、三嗪基、苯并咪唑基、苯并噁唑基、苯并噻唑基、苯并呋喃基、苯并噻吩基、吲哚基、异吲哚基、哒嗪基、吡嗪基、喹啉基等。
如本文中所使用的,术语“4-7元杂环”是指含有4-7个环成员且其中至少一个为独立地选自N、O和S的杂原子的环状基团。包括4-7元脂杂环和芳杂环,例如5-6元脂杂环、5-6元芳杂环。具体的实例包括但不限于吡咯烷环、咪唑烷环、噁唑烷环、异噁唑烷环、哌啶环、哌嗪环、吗啉环、硫吗啉环、吡咯环、咪唑环、噁唑环、咪唑环、吡唑环、三唑环、四唑环、噁唑环、异噁唑环、噁二唑环、噻唑环、异噻唑环、噻二唑环、吡啶环、嘧啶环、三嗪环、哒嗪环、吡嗪环等。
本文中所用氨基酸和其代号具有以下对应关系:
发明的有益效果
本发明提供一种多肽或含有所述多肽的组合物,其可立体专一地催化β-羰基酰胺生成R-型手性胺,从而用于西他列汀的合成。与现有技术中西他列汀的合成方法及其手性中心的构建方法相比,本发明具备成本低廉、操作简单、环境污染小、整体收率高和/或产物纯度高等优点,适合工业化生产。
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
附图说明
图1显示了00-8重组质粒图谱;
图2显示了00-8重组质粒酶切位点;
图3显示了经实施例3.3条件1制备得到的化合物IV的1HNMR图谱;
图4显示了经实施例3.3条件2制备得到的化合物IV的1HNMR图谱;
图5显示了经实施例3.5条件1制备得到的西他列汀的化学纯度HPLC图谱;
图6显示了经实施例3.5条件1制备得到的西他列汀的手性纯度HPLC图谱;
图7显示了经实施例3.5条件2制备得到的西他列汀的化学纯度HPLC图谱;
图8显示了经实施例3.5条件2制备得到的西他列汀的手性纯度HPLC图谱。
序列信息
本发明涉及的序列的信息提供于下面的表1中。
表1:序列的描述
序列1(SEQ ID NO:1)
SVLHRGQQRRRFHIQFPVTTDNALGNRTRHTVRNGITIDRNERPDATAGGATQNFVSIVQFCRRDIGQNRFVAQRFRDFQNGLARNTRQSCTTRATNHTIFDDNHIKARTFSQQVVTIQQQRQFETAIMGFLDCTNQVAPLKVLHLRINGTTRGATDALCNHQVHTVADTIERNNPLVRARTHIHLRAMFGDITFKRRRAIAAGNRHGDHGFTQFGLGHQFQRDFFDFILRQRRDQANRFCIAEQAFNVVAQTESITVPNMKRGVGCVRRIETLIKDGNTGFTRRHKRTLNPCCTASQRVCRVQFVVAVGNVVQARIVGVNNFRRVCGECHRILAVVMMVMAA
序列2(SEQ ID NO:2)
ATGGCCTCTATGGACAAAGTCTTTTCGGGATATTATGCGCGCCAGAAGCTGCTTGAACGGAGCGACAATCCTTTCTCTAAGGGCATTGCTTATGTGGAAGGAAAGCTCGTCTTTCCTAGTGATGCTAGAATACCGCTACTCGACGAAGGTTTCATGCACAGTGACCTAACCTATGATGTTATATCGGTTTGGGATGGTCGCTTCTTTCGATTGGACGATCATTTGCAACGGATTTTGGAAAGCTGCGATAAGATGCGGCTCAAGTTCCCACTTGCACTGAGCACCGTGGAAAATATTCTGGCTGAGATGGTCGCCAAGAGTGGTATCCGGGATGCGTTTGTGGAAGTTATTGTGACACGTGGTCTGACAGGTGTACGTGGTTCGAAGCCTGAGGATCTGTATAATAACAACATATACCTGCTTGTTCTTCCATACATTTGGGTTATGGCGCCTGAGAACCAGCTCCATGGTGGCGAGGCTATCATTACAAGGACAGTGCGACGAACACCCCCAGGTGCATTTGATCCTACTATCAAAAATCTACAGTGGGGTGATTTAACAAAGGGACTTTTTGAGGCAATGGACCGTGGCGCCACATACCCATTTCTCACTGATGGAGACACCAACCTTACTGAAGGATCTGGTTTCAACATTGTTTTGGTGAAGAACGGTATTATCTATACCCCTGATCGAGGTGTCTTGCGAGGGATCACACGTAAAAGTGTGATTGACGTTGCCCGAGCCAACAGCATCGACATCCGCCTTGAGGTCGTACCAGTGGAGCAGGCTTATCACTCTGATGAGATCTTCATGTGCACAACTGCCGGCGGCATTATGCCTATAACATTGCTTGATGGTCAACCTGTTAATGACGGCCAGGTTGGCCCAATCACAAAGAAGATATGGGATGGCTATTGGGAGATGCACTACAATCCGGCGTATAGTTTTCCTGTTGACTATGGCAGTGGCTAA
序列3(SEQ ID NO:3)
AAAITIITTARIRYCTGVSREEDSTFSSQGRRMIDWVTGPGTPSEIGLPSTETNGQTPPPVVQPRTSSASSSSARVMSARIASGPRDSAISRTVLRVIPGRAAASRPSPSSSSGASKPRSWVSGTARIRSPHWKFLTCGSIEERGVRRTDGATIAGTPSRMRSNGTIHWYGTAYMGTCGRCLVMSRSPGVEEGPRVIETETTASRSSVLATSSRAISLTSSWVSGGMIRIDSALENRRSMWSSRRKALPFQTWNPVGVTSECRGPWSKIEIRASDGGTKAPSIQAAPPASGLAGSSSGSEGVIGSRPVSWVGTISEVSAEKA
序列4(SEQ ID NO:4)
GCAGCAGCCATCACCATCATCACCACAGCCAGGATCCGGTACTGTACCGGGGTCAGCAGAGAAGAAGATTCAACGTTCAGTTCCCAGTAACGACGGATGATAGACTGGGTAACCGGACCCGGAACACCGTCAGAGATCGGGTTACCGTCAACAGAAACGAACGGCCAAACACCACCACCGGTAGTGCAACCCAGAACTTCGTCAGCGTCCAGCAGTTCAGCCAGGGTGATGTCAGCCAGGATAGCTTCGTGACCCAGAGATTCAGCGATTTCCAGAACGGTTTTACGGGTGATACCCGGCAGAGCAGCAGCCAGCAGACCGTCACCGTCCAGCAGCAGCGGAGCTTCGAAACCACGGTCGTGGGTTTCCTGAACTGCACGGATCAGGTCACCCCACTGGAAGTTTTTAACCTGCGGGTCGATAGAAGAACGCGGAGTACGACGAACAGACTGAGCAACCATAGCGTGAACACCGTCACGGATGCGGTCAAACGGTACGATCCACTGGTACGGAACAGCGTACATGTAAACCTGCGGACGATGTTTGGTGATGTCACGTTCACCTGGGGTAGAAGAGTAACCACGGGTGATAGAAACAGAAACGACTGCTTCACGCAGTTCGGTTTTAGCAACCAGTTCCAGAGCGATTTCTTTAACTTCGTCCTGGGTCAGCGGCGGGATGATACGCATAGATTCAGCGTTAGAGAACAGACGTTCGATGTGGTCGTCCAGACGGAAAGCGTTACCGTTCCAAACGTGGAACCCGGTGTAGGTAACGTCAGAGTGCAGGTAACCCTGGTCGAAGATAGAGATACGAGCTTCAGACGGCGGAACGAAAGCACCTTCGATCCAAGCAGCACCACCAGCCAGCGGGTTAGCCGGGTCCAGTTCGTAGTCAGAGTAGGTGATATAGTCCAGACCGGTGTCGTGGGTGTAAACGATTTCAGAGGTGTCAGCAGAGAAAGCCAT
序列5(SEQ ID NO:5)
AAAITIITTARIRYCTGVSREEDSTFSSQGRRMIDWVTGPGTPSEIGLPSTETNGQTPPPVEQPRTSSASSSSARVMSARIASGPRDSAISRTVLRVIPGRAARPGERTTPSLITTTLKPGPSASRPSPSSSSGSSKPRSWVSGIARIRSPHWKFLTCGSIEERGVRRTDGATIAGTPSRMRSNGTIHWYGTAYMGTCGRCLVMSRIYGVEEGPRVIETETIASRSSVLATSSRAISLTSSWVSGGMIRIDSALENRRSMWSSRRKALPFQTWNPVGVASEVRGPWSKIEIRASDGGTKAPSIQAAPPASGLAGSSSWSEGVIGSRPVSWVGTISEVSAEKA
序列6(SEQ ID NO:6)
GCAGCAGCCATCACCATCATCACCACAGCCAGGATCCGGTACTGTACCGGGGTCAGCAGAGAAGAAGATTCAACGTTCAGTTCCCAGTAACGACGGATGATAGACTGGGTAACCGGACCCGGAACACCGTCAGAGATCGGGTTACCGTCAACAGAAACGAACGGCCAAACACCACCACCGGTTGAGCAACCCAGAACTTCGTCAGCGTCCAGCAGTTCAGCCAGGGTGATGTCAGCCAGGATAGCTTCGTGACCCAGAGATTCAGCGATTTCCAGAACGGTTTTACGGGTGATACCCGGCAGAGCAGCACGACCCGGAGAACGAACAACACCGTCTTTGATAACAACAACGTTGAAACCCGGACCTTCAGCCAGCAGACCGTCACCGTCCAGCAGCAGCGGCAGCTCGAAACCACGGTCGTGGGTTTCCTGAATTGCACGGATCAGGTCACCCCACTGGAAGTTTTTAACCTGCGGGTCGATAGAAGAACGCGGAGTACGACGAACAGACTGAGCAACCATAGCGTGAACACCGTCACGGATGCGGTCAAACGGTACGATCCACTGGTACGGAACAGCGTACATGTAAACCTGCGGACGATGTTTGGTGATGTCACGAATATATGGGGTAGAAGAGTAACCACGGGTGATAGAAACAGAAACGATTGCTTCACGCAGTTCGGTTTTAGCAACCAGTTCCAGAGCGATTTCTTTAACTTCGTCCTGGGTCAGCGGCGGGATGATACGCATAGATTCAGCGTTAGAGAACAGACGTTCGATGTGGTCGTCCAGACGGAAAGCGTTACCGTTCCAAACGTGGAACCCGGTGTAGGTAGCGTCAGAGGTCAGGTAACCCTGGTCGAAGATAGAGATACGAGCTTCAGACGGCGGAACGAAAGCACCTTCGATCCAAGCAGCACCACCAGCCAGCGGGTTAGCCGGGTCCAGTTCGTGGTCAGAGTAGGTGATATAGTCCAGACCGGTGTCGTGGGTGTAAACGATTTCAGAGGTGTCAGCAGAGAAAGCCAT
序列7(SEQ ID NO:7)
AAAITIITTARIRYCTGVSREEDSTFSSQGRRMIDWVTGPGTPSEIGLPSTETNGQTPPPVEQPRTSSASSSSARVMSARIASGPRDSAISRTVLRVIPGRAARPGERTTPSLITTTLKPGPSASRPSQSSSSGSSKPRSWVSGIARIRSPHWKFLTCGSIEERGVRRTDGATIAGTPSRMRSNGTIHWYGTAYMGTCGRCLVMSRSNGVEEGPRVIETETIASRSSVLATSSRAISLTSSWVSGGMIRIDSALENRRSMWSSRRKALPFQTWKVVGVASEVGGPWSKIEIRASDGGTKAPSIQAAPPASGLAGSSSGSEGVIGSRPVSWVGTISEVSAEKA
序列8(SEQ ID NO:8)
GCAGCAGCCATCACCATCATCACCACAGCCAGGATCCGGTACTGTACCGGGGTCAGCAGAGAAGAAGATTCAACGTTCAGTTCCCAGTAACGACGGATGATAGACTGGGTAACCGGACCCGGAACACCGTCAGAGATCGGGTTACCGTCAACAGAAACGAACGGCCAAACACCACCACCGGTTGAGCAACCCAGAACTTCGTCAGCGTCCAGCAGTTCAGCCAGGGTGATGTCAGCCAGGATAGCTTCGTGACCCAGAGATTCAGCGATTTCCAGAACGGTTTTACGGGTGATACCCGGCAGAGCAGCACGACCCGGAGAACGAACAACACCGTCTTTGATAACAACAACGTTGAAACCCGGACCTTCAGCCAGCAGACCGTCGCAGTCCAGCAGCAGCGGCAGCTCGAAACCACGGTCGTGGGTTTCCTGAATTGCACGGATCAGGTCACCCCACTGGAAGTTTTTAACCTGCGGGTCGATAGAAGAACGCGGAGTACGACGAACAGACTGAGCAACCATAGCGTGAACACCGTCACGGATGCGGTCAAACGGTACGATCCACTGGTACGGAACAGCGTACATGTAAACCTGCGGACGATGTTTGGTGATGTCACGCTCGAATGGGGTAGAAGAGTAACCACGGGTGATAGAAACAGAAACGATTGCTTCACGCAGTTCGGTTTTAGCAACCAGTTCCAGAGCGATCTCTTTAACTTCGTCCTGGGTCAGCGGCGGGATGATACGGATAGATTCCGCGTTAGAGAACAGACGTTCGATGTGGTCGTCCAGACGGAAAGCGTTACCGTTCCAAACGTGGAAGGTGGTGTAGGTAGCGTCAGAAGTATAGTAACCCTGGTCGAAGATAGAGATACGAGCTTCAGACGGCGGAACGAAAGCACCTTCGATCCAAGCAGCACCACCAGCCAGCGGGTTAGCCGGGTCCAGTTCGTAGTCAGAGTAGGTGATATAGTCCAGACCGGTGTCGTGGGTGTAAACGATTTCAGAGGTGTCAGCTGAGAAAGCCAT
具体实施方式
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。
除非特别指明,本发明中所使用的分子生物学实验方法基本上参照J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995中所述的方法进行;所使用的检测方法均是本领域的常规检测方法,其按照相关文献中记载的步骤或者按照所使用仪器的制造商推荐的步骤来进行。
实施例1节杆菌转氨酶突变体蛋白的表达
将节杆菌转氨酶野生序列,进行人工设计,设计后的基因序列如SEQ ID 2、4、6和8所示,将所述各序列通过全基因合成,通过Xhol和Ncol 2个酶切位点克隆入PET24a质粒,将如上构建的质粒转入大肠杆菌DH5α感受态细胞,挑选阳性转化子并测序鉴定后,得到重组表达载体,命名为00-8质粒(见图1和图2)。将重组表达载体00-8质粒转入大肠杆菌BL21(DE3)菌株中,获得可以诱导表达节杆菌转氨酶突变体的基因工程菌。
将用于表达节杆菌转氨酶突变体的基因工程菌在卡那霉素抗性的LB固体培养基上划线,于37℃生化培养箱中培养过夜,挑选较大的菌落接种到含有卡那霉素抗性的LB液体培养基中,于摇床37℃220rpm培养6~8h,或30℃ 200rpm培养过夜,得到一级种子培养液;将一级种子培养液按照1%的接种量接种到含有卡那霉素抗性的TB液体培养基中,于摇床37℃ 220rpm培养4~6h,至目测菌液较浑浊,得到二级种子培养液。按照1%的接种量,将二级种子接种到发酵罐中进行培养(将二级种子培养液按表2中培养基配方分三组接种到发酵罐中)。初始控制:37℃通气保压培养。当溶氧降低,逐步提高通气量、转速、罐压来提高溶氧,罐压不高于0.08MPa。发酵期间,适当补营养料(补料方案如表3所示),以控制溶氧在20-40%,当OD600达25左右时,分别降温到28℃、30℃和25℃,加入浓度为0.15mM、0.2mM和0.3mM的IPTG。发酵液通过离心或者膜过滤收集菌体,采用磷酸盐缓冲液将收集后的菌体进行洗涤,将洗涤后的菌体置于超声波破碎仪或高压均质机中进行破胞,然后离心或者膜过滤细胞破碎液,得到的上清液即为节杆菌转氨酶突变体蛋白,由此获得突变体1。
表2发酵罐中培养基配方(以30L的发酵液演示,单位:g)
注:称取上述原料后,加入发酵罐中,加水至合适体积,开搅拌充分混合溶解后用片碱调pH值到7。
表3补料培养基配方(以30L的发酵液补料6L演示,单位:g)
序号 |
配料品名 |
第一组 |
第二组 |
第三组 |
1 |
甘油 |
7400 |
2400 |
3400 |
2 |
鱼蛋白胨 |
140 |
140 |
240 |
3 |
酵母浸粉 |
1080 |
1080 |
180 |
4 |
硫酸镁 |
15.6 |
14.6 |
25.6 |
5 |
消泡剂 |
3 |
3 |
3 |
根据上述方法,获得突变体2-4。
实施例2突变体酶活能力测试
酶活检测方法:
(1)配制4M异丙胺盐酸盐100mL:称取100%含量的异丙胺23.64克,加约40mL水,通风橱内低温条件下缓慢滴加HCl(约30mL,起雾严重)至pH到8.5,最后加水定容到100mL备用。
(2)配制质量分数为40%的异丙胺水溶液。
(3)底物溶液配置:将底物3-氧代-4-(2,4,5-三氟苯基)丁酰基哌嗪按每100克溶解在200mL乙醇中的比例配置底物溶液,将配置好的底物溶液装入流加瓶中保温45℃备用。
(4)加水600mL(与酶液总体积1000mL),4M异丙胺盐酸盐(1.2eq)99.4mL,TEA 3g和辅酶磷酸吡哆醛0.7g,温度升到45℃,用40%异丙胺调节pH至8.5。加入酶液400mL,通入适量空气(控制起泡)。以相对固定的速度流加底物溶液(总约270mL)至反应体系中,5h-7h流加完。45℃反应12小时,期间用40%异丙胺控制pH在8.5。如液位降低,补加适量纯水。产物用乙酸乙酯萃取,收集乙酸乙酯相并浓缩,将浓缩得到的残余物用HPLC进行定性和定量检测。以底物转化率记为酶活指数,由此评价突变体1-4的催化活性,结果见下表。
酶活对比表
序号 |
SEQ ID NO. |
酶活指数 |
1 |
1 |
100 |
2 |
3 |
30 |
3 |
5 |
35 |
4 |
7 |
40 |
实施例3西他列汀的合成
本申请以2,4,5-三氟苯乙酸、米氏酸、NHR1R2和3-三氟甲基-5,6,7,8-四氢-[1,2,4]三唑并[4,3-a]吡嗪盐酸盐为原料,通过制备转氨化底物β-羰基酰胺化合物I,而后利用本申请获得的节杆菌转氨酶突变体催化羰基转氨化反应,获得高光学纯度的β-氨基酰胺化合物II,经水解、氨基保护、与3-三氟甲基-5,6,7,8-四氢-[1,2,4]三唑并[4,3-a]吡嗪盐酸盐缩合和脱保护高收率地制得西他列汀。具体合成路线如下所示:
1.化合物3的合成:
条件1:
在800毫升二乙基乙酰胺中,加入190克2,4,5-三氟苯乙酸,加入米氏酸210克,升温到35℃,加入50克三乙胺,保温反应5小时后,降温到室温加入2000毫升的水,用盐酸酸化到ph=2,结晶2小时后过滤,干燥后得到303克化合物3的干品,纯度99.2%,收率96%。
条件2;
在782毫升二甲基甲酰胺中,加入220克2,4,5-三氟苯乙酸,加入米氏酸260克,升温到35℃,加入61克三乙胺,保温反应4-7小时,降温到室温加入2500毫升水,加入89克特戊酰氯,结晶2小时后过滤,干燥后得到348克化合物3的干品,纯度99.1%,收率95%。
2.化合物I的合成:
条件1,其中化合物I中R1和R2形成咪唑环,此时式I化合物结构如下所示:
在300毫升甲苯中,加入30克化合物3,再加入咪唑12克,加入0.3克氢氧化钠,升温到105度,反应10分钟,降温到室温结晶,得到粗品,固体水洗干燥得到3-氧代-4-(2,4,5-三氟苯基)丁酰基咪唑25.3克,纯度99.5%,收率94%。
1HNMR(d6-DMSO)δ(ppm,)8.26(1H),7.69(1H),7.25(1H),6.73(1H),6.54(1H),3.71(2H),3.56(2H).
条件2,其中化合物I中R1和R2形成哌嗪环,此时式I化合物结构如下所示:
在400毫升四氢化萘中,加入35克的化合物3,在加入哌嗪17克,升温到100℃,加入氢氧化钠0.25克,反应20分钟,降温到室温得到粗品,固体水洗干燥得到3-氧代-4-(2,4,5-三氟苯基)丁酰基哌嗪31.7克,纯度99.4%,收率95%。
1HNMR(d6-DMSO)δ(ppm,)6.73(1H),6.54(1H),3.71(2H),3.34(2H),3.32(4H),2.81(4H),2.0(1H).
条件3,其中化合物I中R1和R2形成异噁唑烷环,此时式I化合物结构如下所示:
500毫升甲苯中,加入化32克化合物3,再加入4-氢异噁唑盐酸盐25克,升温到101℃,加入氢氧化钠40克,反应30分钟,降温到室温过滤,水洗得到3-氧代-4-(2,4,5-三氟苯基)丁酰基-4-氢异噁唑28克,纯度99.4%,收率96%。
1HNMR(d6-DMSO)δ(ppm,)6.73(1H),6.54(1H),3.71(2H),3.53(2H),3.34(2H),3.20(2H),1.74(2H).
3.化合物II的合成:
条件1:
在1000ml水中,加入100ml 4M异丙胺盐酸盐,2g TEA,和0.1g磷酸吡哆醛,升温至45℃,用40%异丙胺水溶液调节pH至8.5。加入实施例1中制得的含突变体1的细胞上清液600ml,通入适量空气(控制起泡)。以相对固定的速度流加化合物3-氧代-4-(2,4,5-三氟苯基)丁酰基-4-氢异噁唑溶液(3-氧代-4-(2,4,5-三氟苯基)丁酰基-4-氢异噁唑150克溶解在40毫升甲醇中)至反应体系中,5h-7h流加完。期间用40%异丙胺控制pH值。45℃反应12小时,HPLC显示转化率大于99.9%,结束后用200毫升二氯甲烷萃取,回收二氯甲烷,得到R-3-氨基-4-(2,4,5-三氟苯基)丁酰基-4-氢异噁唑142.5克,纯度99.7%,收率95%。
1HNMR(d6-DMSO)δ(ppm,)6.79(1H),6.61(1H),3.32(4H),3.23(1H),2.81(4H),2.77(2H),2.40(2H),2.0(1H),2.0(2H).
参照上述反应条件,以Codeixs公司专利US8293507中公开的多肽序列SEQ ID NO:86为催化剂催化上述反应,HPLC显示转化率为22.1%。
条件2:
在1000ml水中,加入90ml 4M异丙胺盐酸盐,1g TEA,和0.5g磷酸吡哆醛,升温至40℃,用40%异丙胺水溶液调节pH至8.0。加入实施例1中制得的含突变体1的细胞上清液1100ml,通入适量空气(控制起泡)。以相对固定的速度流加化合物3-氧代-4-(2,4,5-三氟苯基)丁酰基-哌嗪溶液(3-氧代-4-(2,4,5-三氟苯基)丁酰基-哌嗪250克溶解在80毫升乙醇中)至反应体系中,5h-7h流加完。期间用40%异丙胺控制pH值。40℃反应12小时,HPLC显示转化率大于99.9%,结束后用350毫升乙酸乙酯萃取,回收乙酸乙酯,得到R-3-氨基-4-(2,4,5-三氟苯基)丁酰基哌嗪240克,纯度99.8%,收率96%。
1HNMR(d6-DMSO)δ(ppm,)6.79(1H),6.61(1H),3.32(2H),3.23(1H),3.34(2H),3.20(2H),1.74(2H).
参照上述反应条件,以Codeixs公司专利US8293507中公开的多肽序列SEQ ID NO:86为催化剂催化上述反应,HPLC显示转化率为12%。
4.化合物IV的合成:
条件1:
在500毫升水中,加入80克R-3-氨基-4-(2,4,5-三氟苯基)丁酰基-4-氢异噁唑,再加入氢氧化钠27克,升温到50℃反应2小时,降温到室温加入Boc酸酐91克,室温反应4-5小时,结束后用盐酸酸化到pH=1.5,结晶过滤,水洗,干燥得到88.8克,收率96%,化学纯度99.5%。产物1HNMR图谱如图3所示。
条件2:
350毫升水中,加入30克的R-3-氨基-4-(2,4,5-三氟苯基)丁酰基哌嗪,再加入10克的氢氧化钠,升温到60℃反应3小时,降温到室温加入Boc酸酐43克,室温反应6小时,结束后用盐酸酸化到pH=1.7,结晶过滤,水洗,干燥得到31.5克,收率95%,化学纯度99.4%。产物1HNMR图谱如图4所示。
5.西他列汀的合成:
条件1:
在300毫升二氯甲烷中加入30克的化合物IV,降温至15℃,加入二氯亚砜26.8克,升温到25℃,反应2小时,加入20克三乙胺,再加入3-(三氟甲基)-5,6,7,8-四氢-[1,2,4]三唑并[4,3-a]吡嗪盐酸盐22.7克,维持温度25℃反应5-6小时,结束后加入100毫升水,分层,有机层浓缩结晶得到西他列汀干品34.8克,纯度99.8%,手性纯度99.9%,收率95%。产物化学纯度和手性纯度的HPLC图谱分别见图5和图6。
条件2:
在250毫升乙酸乙酯中加入化合物30克的化合物V,降温在15℃,加入二氯亚砜28克,升温到26℃,反应2小时,加入23克三乙胺,在加入3-(三氟甲基)-5,6,7,8-四氢-[1,2,4]三唑并[4,3-a]吡嗪盐酸盐223克,维持温度25℃反应5-6小时,结束后加入200毫升水,分层,有机层浓缩结晶得到西他列汀干品35.2克,纯度99.9%,手性纯度100%,收率96%。产物化学纯度和手性纯度的HPLC图谱分别见图7和图8。
手性纯度的检测方法:
色谱柱:CHIRALPAK AD-H 4.6mm x 250mm,5um;
波长:210nm;
柱温:40℃;
流速:1.0mL/min;
进样量:20uL;
流动相:正己烷:乙醇:异丙醇:二乙胺=400:500:100:3;
稀释剂:甲醇:流动相=50:50(用稀释剂处理样品,同时用稀释剂做空白);
化学纯度检测方法:
色谱柱:Kromasil 100-5-C18 4.6mm x 250mm,5um;
流速:1.0ml/min;
波长:210nm;
进样量:20ul;
柱温:30℃;
缓冲液的配制:
9.6g的柠檬酸在1L的水中,用5%的氢氧化钠调节pH到4,待用。
流动相A的配制:缓冲液:甲醇=800:200,混合,过滤,超气待用。
流动相B的配制:甲醇:四氢呋喃=900::100,混合,过滤,超气待用。
稀释液的配制:甲醇:水=50:50。
程序:
时间(min) |
A% |
B% |
0 |
90 |
10 |
15 |
60 |
40 |
20 |
90 |
10 |
50 |
90 |
10 |
尽管本发明的具体实施方式已经得到详细的描述,根据已经公开的所有教导,本领域技术人员可以对本发明技术方案的细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
SEQUENCE LISTING
<110> 中国国际医药卫生有限公司
南京红杉生物科技有限公司
<120> 一种生物催化合成西他列汀及其中间体的方法
<130> IDC180044
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 343
<212> PRT
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体1的氨基酸序列
<400> 1
Ser Val Leu His Arg Gly Gln Gln Arg Arg Arg Phe His Ile Gln Phe
1 5 10 15
Pro Val Thr Thr Asp Asn Ala Leu Gly Asn Arg Thr Arg His Thr Val
20 25 30
Arg Asn Gly Ile Thr Ile Asp Arg Asn Glu Arg Pro Asp Ala Thr Ala
35 40 45
Gly Gly Ala Thr Gln Asn Phe Val Ser Ile Val Gln Phe Cys Arg Arg
50 55 60
Asp Ile Gly Gln Asn Arg Phe Val Ala Gln Arg Phe Arg Asp Phe Gln
65 70 75 80
Asn Gly Leu Ala Arg Asn Thr Arg Gln Ser Cys Thr Thr Arg Ala Thr
85 90 95
Asn His Thr Ile Phe Asp Asp Asn His Ile Lys Ala Arg Thr Phe Ser
100 105 110
Gln Gln Val Val Thr Ile Gln Gln Gln Arg Gln Phe Glu Thr Ala Ile
115 120 125
Met Gly Phe Leu Asp Cys Thr Asn Gln Val Ala Pro Leu Lys Val Leu
130 135 140
His Leu Arg Ile Asn Gly Thr Thr Arg Gly Ala Thr Asp Ala Leu Cys
145 150 155 160
Asn His Gln Val His Thr Val Ala Asp Thr Ile Glu Arg Asn Asn Pro
165 170 175
Leu Val Arg Ala Arg Thr His Ile His Leu Arg Ala Met Phe Gly Asp
180 185 190
Ile Thr Phe Lys Arg Arg Arg Ala Ile Ala Ala Gly Asn Arg His Gly
195 200 205
Asp His Gly Phe Thr Gln Phe Gly Leu Gly His Gln Phe Gln Arg Asp
210 215 220
Phe Phe Asp Phe Ile Leu Arg Gln Arg Arg Asp Gln Ala Asn Arg Phe
225 230 235 240
Cys Ile Ala Glu Gln Ala Phe Asn Val Val Ala Gln Thr Glu Ser Ile
245 250 255
Thr Val Pro Asn Met Lys Arg Gly Val Gly Cys Val Arg Arg Ile Glu
260 265 270
Thr Leu Ile Lys Asp Gly Asn Thr Gly Phe Thr Arg Arg His Lys Arg
275 280 285
Thr Leu Asn Pro Cys Cys Thr Ala Ser Gln Arg Val Cys Arg Val Gln
290 295 300
Phe Val Val Ala Val Gly Asn Val Val Gln Ala Arg Ile Val Gly Val
305 310 315 320
Asn Asn Phe Arg Arg Val Cys Gly Glu Cys His Arg Ile Leu Ala Val
325 330 335
Val Met Met Val Met Ala Ala
340
<210> 2
<211> 972
<212> DNA
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体1的基因序列
<400> 2
atggcctcta tggacaaagt cttttcggga tattatgcgc gccagaagct gcttgaacgg 60
agcgacaatc ctttctctaa gggcattgct tatgtggaag gaaagctcgt ctttcctagt 120
gatgctagaa taccgctact cgacgaaggt ttcatgcaca gtgacctaac ctatgatgtt 180
atatcggttt gggatggtcg cttctttcga ttggacgatc atttgcaacg gattttggaa 240
agctgcgata agatgcggct caagttccca cttgcactga gcaccgtgga aaatattctg 300
gctgagatgg tcgccaagag tggtatccgg gatgcgtttg tggaagttat tgtgacacgt 360
ggtctgacag gtgtacgtgg ttcgaagcct gaggatctgt ataataacaa catatacctg 420
cttgttcttc catacatttg ggttatggcg cctgagaacc agctccatgg tggcgaggct 480
atcattacaa ggacagtgcg acgaacaccc ccaggtgcat ttgatcctac tatcaaaaat 540
ctacagtggg gtgatttaac aaagggactt tttgaggcaa tggaccgtgg cgccacatac 600
ccatttctca ctgatggaga caccaacctt actgaaggat ctggtttcaa cattgttttg 660
gtgaagaacg gtattatcta tacccctgat cgaggtgtct tgcgagggat cacacgtaaa 720
agtgtgattg acgttgcccg agccaacagc atcgacatcc gccttgaggt cgtaccagtg 780
gagcaggctt atcactctga tgagatcttc atgtgcacaa ctgccggcgg cattatgcct 840
ataacattgc ttgatggtca acctgttaat gacggccagg ttggcccaat cacaaagaag 900
atatgggatg gctattggga gatgcactac aatccggcgt atagttttcc tgttgactat 960
ggcagtggct aa 972
<210> 3
<211> 322
<212> PRT
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体2的氨基酸序列
<400> 3
Ala Ala Ala Ile Thr Ile Ile Thr Thr Ala Arg Ile Arg Tyr Cys Thr
1 5 10 15
Gly Val Ser Arg Glu Glu Asp Ser Thr Phe Ser Ser Gln Gly Arg Arg
20 25 30
Met Ile Asp Trp Val Thr Gly Pro Gly Thr Pro Ser Glu Ile Gly Leu
35 40 45
Pro Ser Thr Glu Thr Asn Gly Gln Thr Pro Pro Pro Val Val Gln Pro
50 55 60
Arg Thr Ser Ser Ala Ser Ser Ser Ser Ala Arg Val Met Ser Ala Arg
65 70 75 80
Ile Ala Ser Gly Pro Arg Asp Ser Ala Ile Ser Arg Thr Val Leu Arg
85 90 95
Val Ile Pro Gly Arg Ala Ala Ala Ser Arg Pro Ser Pro Ser Ser Ser
100 105 110
Ser Gly Ala Ser Lys Pro Arg Ser Trp Val Ser Gly Thr Ala Arg Ile
115 120 125
Arg Ser Pro His Trp Lys Phe Leu Thr Cys Gly Ser Ile Glu Glu Arg
130 135 140
Gly Val Arg Arg Thr Asp Gly Ala Thr Ile Ala Gly Thr Pro Ser Arg
145 150 155 160
Met Arg Ser Asn Gly Thr Ile His Trp Tyr Gly Thr Ala Tyr Met Gly
165 170 175
Thr Cys Gly Arg Cys Leu Val Met Ser Arg Ser Pro Gly Val Glu Glu
180 185 190
Gly Pro Arg Val Ile Glu Thr Glu Thr Thr Ala Ser Arg Ser Ser Val
195 200 205
Leu Ala Thr Ser Ser Arg Ala Ile Ser Leu Thr Ser Ser Trp Val Ser
210 215 220
Gly Gly Met Ile Arg Ile Asp Ser Ala Leu Glu Asn Arg Arg Ser Met
225 230 235 240
Trp Ser Ser Arg Arg Lys Ala Leu Pro Phe Gln Thr Trp Asn Pro Val
245 250 255
Gly Val Thr Ser Glu Cys Arg Gly Pro Trp Ser Lys Ile Glu Ile Arg
260 265 270
Ala Ser Asp Gly Gly Thr Lys Ala Pro Ser Ile Gln Ala Ala Pro Pro
275 280 285
Ala Ser Gly Leu Ala Gly Ser Ser Ser Gly Ser Glu Gly Val Ile Gly
290 295 300
Ser Arg Pro Val Ser Trp Val Gly Thr Ile Ser Glu Val Ser Ala Glu
305 310 315 320
Lys Ala
<210> 4
<211> 968
<212> DNA
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体2的基因序列
<400> 4
gcagcagcca tcaccatcat caccacagcc aggatccggt actgtaccgg ggtcagcaga 60
gaagaagatt caacgttcag ttcccagtaa cgacggatga tagactgggt aaccggaccc 120
ggaacaccgt cagagatcgg gttaccgtca acagaaacga acggccaaac accaccaccg 180
gtagtgcaac ccagaacttc gtcagcgtcc agcagttcag ccagggtgat gtcagccagg 240
atagcttcgt gacccagaga ttcagcgatt tccagaacgg ttttacgggt gatacccggc 300
agagcagcag ccagcagacc gtcaccgtcc agcagcagcg gagcttcgaa accacggtcg 360
tgggtttcct gaactgcacg gatcaggtca ccccactgga agtttttaac ctgcgggtcg 420
atagaagaac gcggagtacg acgaacagac tgagcaacca tagcgtgaac accgtcacgg 480
atgcggtcaa acggtacgat ccactggtac ggaacagcgt acatgtaaac ctgcggacga 540
tgtttggtga tgtcacgttc acctggggta gaagagtaac cacgggtgat agaaacagaa 600
acgactgctt cacgcagttc ggttttagca accagttcca gagcgatttc tttaacttcg 660
tcctgggtca gcggcgggat gatacgcata gattcagcgt tagagaacag acgttcgatg 720
tggtcgtcca gacggaaagc gttaccgttc caaacgtgga acccggtgta ggtaacgtca 780
gagtgcaggt aaccctggtc gaagatagag atacgagctt cagacggcgg aacgaaagca 840
ccttcgatcc aagcagcacc accagccagc gggttagccg ggtccagttc gtagtcagag 900
taggtgatat agtccagacc ggtgtcgtgg gtgtaaacga tttcagaggt gtcagcagag 960
aaagccat 968
<210> 5
<211> 342
<212> PRT
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体3的氨基酸序列
<400> 5
Ala Ala Ala Ile Thr Ile Ile Thr Thr Ala Arg Ile Arg Tyr Cys Thr
1 5 10 15
Gly Val Ser Arg Glu Glu Asp Ser Thr Phe Ser Ser Gln Gly Arg Arg
20 25 30
Met Ile Asp Trp Val Thr Gly Pro Gly Thr Pro Ser Glu Ile Gly Leu
35 40 45
Pro Ser Thr Glu Thr Asn Gly Gln Thr Pro Pro Pro Val Glu Gln Pro
50 55 60
Arg Thr Ser Ser Ala Ser Ser Ser Ser Ala Arg Val Met Ser Ala Arg
65 70 75 80
Ile Ala Ser Gly Pro Arg Asp Ser Ala Ile Ser Arg Thr Val Leu Arg
85 90 95
Val Ile Pro Gly Arg Ala Ala Arg Pro Gly Glu Arg Thr Thr Pro Ser
100 105 110
Leu Ile Thr Thr Thr Leu Lys Pro Gly Pro Ser Ala Ser Arg Pro Ser
115 120 125
Pro Ser Ser Ser Ser Gly Ser Ser Lys Pro Arg Ser Trp Val Ser Gly
130 135 140
Ile Ala Arg Ile Arg Ser Pro His Trp Lys Phe Leu Thr Cys Gly Ser
145 150 155 160
Ile Glu Glu Arg Gly Val Arg Arg Thr Asp Gly Ala Thr Ile Ala Gly
165 170 175
Thr Pro Ser Arg Met Arg Ser Asn Gly Thr Ile His Trp Tyr Gly Thr
180 185 190
Ala Tyr Met Gly Thr Cys Gly Arg Cys Leu Val Met Ser Arg Ile Tyr
195 200 205
Gly Val Glu Glu Gly Pro Arg Val Ile Glu Thr Glu Thr Ile Ala Ser
210 215 220
Arg Ser Ser Val Leu Ala Thr Ser Ser Arg Ala Ile Ser Leu Thr Ser
225 230 235 240
Ser Trp Val Ser Gly Gly Met Ile Arg Ile Asp Ser Ala Leu Glu Asn
245 250 255
Arg Arg Ser Met Trp Ser Ser Arg Arg Lys Ala Leu Pro Phe Gln Thr
260 265 270
Trp Asn Pro Val Gly Val Ala Ser Glu Val Arg Gly Pro Trp Ser Lys
275 280 285
Ile Glu Ile Arg Ala Ser Asp Gly Gly Thr Lys Ala Pro Ser Ile Gln
290 295 300
Ala Ala Pro Pro Ala Ser Gly Leu Ala Gly Ser Ser Ser Trp Ser Glu
305 310 315 320
Gly Val Ile Gly Ser Arg Pro Val Ser Trp Val Gly Thr Ile Ser Glu
325 330 335
Val Ser Ala Glu Lys Ala
340
<210> 6
<211> 1028
<212> DNA
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体3的基因序列
<400> 6
gcagcagcca tcaccatcat caccacagcc aggatccggt actgtaccgg ggtcagcaga 60
gaagaagatt caacgttcag ttcccagtaa cgacggatga tagactgggt aaccggaccc 120
ggaacaccgt cagagatcgg gttaccgtca acagaaacga acggccaaac accaccaccg 180
gttgagcaac ccagaacttc gtcagcgtcc agcagttcag ccagggtgat gtcagccagg 240
atagcttcgt gacccagaga ttcagcgatt tccagaacgg ttttacgggt gatacccggc 300
agagcagcac gacccggaga acgaacaaca ccgtctttga taacaacaac gttgaaaccc 360
ggaccttcag ccagcagacc gtcaccgtcc agcagcagcg gcagctcgaa accacggtcg 420
tgggtttcct gaattgcacg gatcaggtca ccccactgga agtttttaac ctgcgggtcg 480
atagaagaac gcggagtacg acgaacagac tgagcaacca tagcgtgaac accgtcacgg 540
atgcggtcaa acggtacgat ccactggtac ggaacagcgt acatgtaaac ctgcggacga 600
tgtttggtga tgtcacgaat atatggggta gaagagtaac cacgggtgat agaaacagaa 660
acgattgctt cacgcagttc ggttttagca accagttcca gagcgatttc tttaacttcg 720
tcctgggtca gcggcgggat gatacgcata gattcagcgt tagagaacag acgttcgatg 780
tggtcgtcca gacggaaagc gttaccgttc caaacgtgga acccggtgta ggtagcgtca 840
gaggtcaggt aaccctggtc gaagatagag atacgagctt cagacggcgg aacgaaagca 900
ccttcgatcc aagcagcacc accagccagc gggttagccg ggtccagttc gtggtcagag 960
taggtgatat agtccagacc ggtgtcgtgg gtgtaaacga tttcagaggt gtcagcagag 1020
aaagccat 1028
<210> 7
<211> 342
<212> PRT
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体4的氨基酸序列
<400> 7
Ala Ala Ala Ile Thr Ile Ile Thr Thr Ala Arg Ile Arg Tyr Cys Thr
1 5 10 15
Gly Val Ser Arg Glu Glu Asp Ser Thr Phe Ser Ser Gln Gly Arg Arg
20 25 30
Met Ile Asp Trp Val Thr Gly Pro Gly Thr Pro Ser Glu Ile Gly Leu
35 40 45
Pro Ser Thr Glu Thr Asn Gly Gln Thr Pro Pro Pro Val Glu Gln Pro
50 55 60
Arg Thr Ser Ser Ala Ser Ser Ser Ser Ala Arg Val Met Ser Ala Arg
65 70 75 80
Ile Ala Ser Gly Pro Arg Asp Ser Ala Ile Ser Arg Thr Val Leu Arg
85 90 95
Val Ile Pro Gly Arg Ala Ala Arg Pro Gly Glu Arg Thr Thr Pro Ser
100 105 110
Leu Ile Thr Thr Thr Leu Lys Pro Gly Pro Ser Ala Ser Arg Pro Ser
115 120 125
Gln Ser Ser Ser Ser Gly Ser Ser Lys Pro Arg Ser Trp Val Ser Gly
130 135 140
Ile Ala Arg Ile Arg Ser Pro His Trp Lys Phe Leu Thr Cys Gly Ser
145 150 155 160
Ile Glu Glu Arg Gly Val Arg Arg Thr Asp Gly Ala Thr Ile Ala Gly
165 170 175
Thr Pro Ser Arg Met Arg Ser Asn Gly Thr Ile His Trp Tyr Gly Thr
180 185 190
Ala Tyr Met Gly Thr Cys Gly Arg Cys Leu Val Met Ser Arg Ser Asn
195 200 205
Gly Val Glu Glu Gly Pro Arg Val Ile Glu Thr Glu Thr Ile Ala Ser
210 215 220
Arg Ser Ser Val Leu Ala Thr Ser Ser Arg Ala Ile Ser Leu Thr Ser
225 230 235 240
Ser Trp Val Ser Gly Gly Met Ile Arg Ile Asp Ser Ala Leu Glu Asn
245 250 255
Arg Arg Ser Met Trp Ser Ser Arg Arg Lys Ala Leu Pro Phe Gln Thr
260 265 270
Trp Lys Val Val Gly Val Ala Ser Glu Val Gly Gly Pro Trp Ser Lys
275 280 285
Ile Glu Ile Arg Ala Ser Asp Gly Gly Thr Lys Ala Pro Ser Ile Gln
290 295 300
Ala Ala Pro Pro Ala Ser Gly Leu Ala Gly Ser Ser Ser Gly Ser Glu
305 310 315 320
Gly Val Ile Gly Ser Arg Pro Val Ser Trp Val Gly Thr Ile Ser Glu
325 330 335
Val Ser Ala Glu Lys Ala
340
<210> 8
<211> 1028
<212> DNA
<213> 人工序列
<220>
<223> 节杆菌来源的转氨酶突变体4的基因序列
<400> 8
gcagcagcca tcaccatcat caccacagcc aggatccggt actgtaccgg ggtcagcaga 60
gaagaagatt caacgttcag ttcccagtaa cgacggatga tagactgggt aaccggaccc 120
ggaacaccgt cagagatcgg gttaccgtca acagaaacga acggccaaac accaccaccg 180
gttgagcaac ccagaacttc gtcagcgtcc agcagttcag ccagggtgat gtcagccagg 240
atagcttcgt gacccagaga ttcagcgatt tccagaacgg ttttacgggt gatacccggc 300
agagcagcac gacccggaga acgaacaaca ccgtctttga taacaacaac gttgaaaccc 360
ggaccttcag ccagcagacc gtcgcagtcc agcagcagcg gcagctcgaa accacggtcg 420
tgggtttcct gaattgcacg gatcaggtca ccccactgga agtttttaac ctgcgggtcg 480
atagaagaac gcggagtacg acgaacagac tgagcaacca tagcgtgaac accgtcacgg 540
atgcggtcaa acggtacgat ccactggtac ggaacagcgt acatgtaaac ctgcggacga 600
tgtttggtga tgtcacgctc gaatggggta gaagagtaac cacgggtgat agaaacagaa 660
acgattgctt cacgcagttc ggttttagca accagttcca gagcgatctc tttaacttcg 720
tcctgggtca gcggcgggat gatacggata gattccgcgt tagagaacag acgttcgatg 780
tggtcgtcca gacggaaagc gttaccgttc caaacgtgga aggtggtgta ggtagcgtca 840
gaagtatagt aaccctggtc gaagatagag atacgagctt cagacggcgg aacgaaagca 900
ccttcgatcc aagcagcacc accagccagc gggttagccg ggtccagttc gtagtcagag 960
taggtgatat agtccagacc ggtgtcgtgg gtgtaaacga tttcagaggt gtcagctgag 1020
aaagccat 1028