CN101970465A - 能够结合rna帽的流感病毒pb2蛋白可溶性片段 - Google Patents
能够结合rna帽的流感病毒pb2蛋白可溶性片段 Download PDFInfo
- Publication number
- CN101970465A CN101970465A CN2008801199689A CN200880119968A CN101970465A CN 101970465 A CN101970465 A CN 101970465A CN 2008801199689 A CN2008801199689 A CN 2008801199689A CN 200880119968 A CN200880119968 A CN 200880119968A CN 101970465 A CN101970465 A CN 101970465A
- Authority
- CN
- China
- Prior art keywords
- virus
- leu
- amino acid
- arg
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B65—CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
- B65D—CONTAINERS FOR STORAGE OR TRANSPORT OF ARTICLES OR MATERIALS, e.g. BAGS, BARRELS, BOTTLES, BOXES, CANS, CARTONS, CRATES, DRUMS, JARS, TANKS, HOPPERS, FORWARDING CONTAINERS; ACCESSORIES, CLOSURES, OR FITTINGS THEREFOR; PACKAGING ELEMENTS; PACKAGES
- B65D1/00—Containers having bodies formed in one piece, e.g. by casting metallic material, by moulding plastics, by blowing vitreous material, by throwing ceramic material, by moulding pulped fibrous material, by deep-drawing operations performed on sheet material
- B65D1/02—Bottles or similar containers with necks or like restricted apertures, designed for pouring contents
- B65D1/0223—Bottles or similar containers with necks or like restricted apertures, designed for pouring contents characterised by shape
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B65—CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
- B65D—CONTAINERS FOR STORAGE OR TRANSPORT OF ARTICLES OR MATERIALS, e.g. BAGS, BARRELS, BOTTLES, BOXES, CANS, CARTONS, CRATES, DRUMS, JARS, TANKS, HOPPERS, FORWARDING CONTAINERS; ACCESSORIES, CLOSURES, OR FITTINGS THEREFOR; PACKAGING ELEMENTS; PACKAGES
- B65D2501/00—Containers having bodies formed in one piece
- B65D2501/0009—Bottles or similar containers with necks or like restricted apertures designed for pouring contents
- B65D2501/0018—Ribs
- B65D2501/0036—Hollow circonferential ribs
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2299/00—Coordinates from 3D structures of peptides, e.g. proteins or enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/005—Assays involving biological materials from specific organisms or of a specific nature from viruses
- G01N2333/08—RNA viruses
- G01N2333/11—Orthomyxoviridae, e.g. influenza virus
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/04—Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Oncology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Communicable Diseases (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- General Chemical & Material Sciences (AREA)
- Mechanical Engineering (AREA)
- Ceramic Engineering (AREA)
- Pulmonology (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Containers Having Bodies Formed In One Piece (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本发明涉及流感病毒RNA依赖性RNA聚合酶亚基PB2的可溶性片段及其变体,及其包含RNA帽(RNA cap)类似物的结晶复合物。本发明还涉及使用所述复合物的结构坐标来筛选和设计与RNA帽结合口袋(RNA cap binding pocket)相互作用之化合物的计算方法。另外,本发明涉及通过使用PB2多肽片段(优选以高通量形式)来鉴定与包含RNA帽结合口袋的PB2多肽片段相结合的化合物的方法,所述化合物优选抑制与RNA帽或其类似物的相互作用。本发明还涉及用于治疗由负链单链RNA病毒引起的病毒感染疾病状况的包含所鉴定化合物的化合物和药物组合物。
Description
发明领域
本发明涉及流感病毒RNA依赖性RNA聚合酶亚基PB2的可溶性片段及其变体,及其包含RNA帽(RNA cap)类似物的结晶复合物。本发明还涉及使用所述复合物的结构坐标来筛选和设计与RNA帽结合口袋(RNA cap binding pocket)相互作用之化合物的计算方法。另外,本发明涉及通过使用PB2多肽片段来鉴定(优选以高通量形式鉴定)与包含RNA帽结合口袋的PB2多肽片段相结合(优选抑制与RNA帽或其类似物的相互作用)之化合物的方法。本发明还涉及用于治疗由负链单链RNA病毒引起的病毒感染疾病状况的包含所鉴定化合物的化合物和药物组合物。
背景技术
流行性感冒在世界范围内导致很高的发病率和死亡率,被许多人认为是对人类来说最为重要的病毒威胁。每年流行性感冒席卷全球,偶见的新毒株导致破坏力巨大的大范围流行。目前,控制流感病毒的主要方法是接种疫苗。但是,很快产生避开接种疫苗作用的突变流感病毒。由于产生新的流感疫苗需要约6个月,所以尤其需要替代性治疗方法(即抗病毒药物)来作为对抗迅速传播的大流行的第一道防线。
开发抗病毒药物的一个很好的出发点是病毒必需蛋白的结构数据。因此,对流感病毒表面抗原神经氨酸酶的晶体结构测定(von Itzstein等,1993)直接导致开发出了具有抗病毒活性的神经氨酸酶抑制剂,其阻止病毒从细胞释放,但是不阻止病毒产生。这些药物及其衍生物随后被开发成抗流感药物扎那米韦(Glaxo)和奥司他韦(Roche),许多国家都储备它们用作对抗万一发生的大流行的第一道防线。但是,这些药物仅仅提供临床疾病持续时间的缩短。或者,其它抗流感化合物例如金刚烷胺和金刚乙胺靶向病毒包膜中的离子通道蛋白,即M2蛋白,干扰病毒在细胞内部的脱壳。但是,由于其副作用和抗性病毒突变株的迅速产生,它们尚未被广泛应用(Magden等,2005)。另外,更加非特异性的病毒药物(例如利巴韦林)已经显示出可用于治疗流感感染(Eriksson等,1977)。但是,可能由于严重的副作用,利巴韦林仅在少数国家得到批准(Furuta等,2005)。显然,需要新型抗病毒化合物,其优选针对不同的靶标。
流感病毒以及索戈托病毒(Thogotovirus)属于正粘病毒科(Orthomyxoviridae),其与布尼亚病毒科(Bunyaviridae)(包括汉坦病毒(Hantavirus)、内罗病毒(Nairovirus)、正布尼亚病毒(Orthobunyavirus)和白蛉热病毒(Phlebovirus))都是负链RNA病毒。它们的基因组是分段的,并作为核蛋白微粒,其包含RNA依赖性RNA聚合酶,其进行(i)最初将单链病毒体RNA(vRNA)复制为病毒mRNA以及(ii)vRNA复制。对于病毒mRNA的产生来说,所述聚合酶利用所谓的“帽攫取(cap-snatching)”机制(Plotch等,1981;Kukkonen等,2005;Leahy等,1997;Noah and Krug,2005)。其与细胞mRNA分子的5′RNA帽结合,并将RNA帽与一段核苷酸一起切割下来。加帽的RNA片段用作病毒mRNA合成的引物。所述聚合酶由三个亚基构成:PB1(聚合酶碱性蛋白)、PB2和PA。PB1具有核酸内切酶和聚合酶活性,而PB2含有RNA帽结合结构域。
所述聚合酶复合物似乎是合适的抗病毒药物靶标,因为其对于病毒mRNA的合成和病毒复制来说是必需的,并含有几个很可能显著区别于宿主细胞蛋白质中的功能性活性位点(Magden等,2005)。因此,例如,尝试了通过类似于PB1内PA结合结构域的25个氨基酸的肽干扰聚合酶亚基的装配(Ghanem等,2007)。此外,已靶向了所述聚合酶的核酸内切酶活性,并已鉴定出一系列4-取代的2,4-二氧代丁酸化合物作为流感病毒中此活性的选择性抑制剂(Tomassini等,1994)。另外,氟他胺(在真菌Delitschia confertaspora的提取物中鉴定到的取代的2,6-二酮哌嗪)已经显示出抑制流感病毒的核酸内切酶(Tomassini等,1996)。此外,也已经尝试了通过核苷类似物干扰病毒转录,例如2′-脱氧-2′-氟鸟苷(Tisdale等,1995),并已经显示T-105(取代的吡嗪化合物)可用作流感病毒RNA聚合酶的特异性抑制剂(Furuta等,2005)。最后,通过对人帽结合蛋白eIF4E与RNA帽结构之间结合模式与流感病毒RNP与RNA帽结构相互作用的比较研究,Hooker等(2003)鉴定出与流感病毒选择性相互作用但是不与人帽结合蛋白相互作用的新型帽类似物。但是,目前为止,鉴定与PB2的RNA帽结合口袋相互作用并且可能干扰RNA帽结合并由此干扰RNA聚合酶活性的化合物的主要障碍在于,所述结合口袋的结构和身份是未知的。
已经有一些努力试图阐明RNA帽结合位点,但是结果有争论。交联实验显示,PB2的两个独立的序列(一个临近N端(242-282)的区段,一个临近C端(538-577)的区段)组成流感病毒RNA聚合酶的RNA帽结合位点(Honda等,1999)。另外的交联实验鉴定了PB2蛋白亚基中从533位氨基酸至564位氨基酸的序列(特别是氨基酸残基Trp552)作为RNA帽的潜在相互作用位点(Li等,2001)。此外,突变分析得到PB2中的潜在RNA帽结合氨基酸残基Phe363和Phe404(Fechter等,2003)。
本发明的一个目的是:(i)通过X射线晶体衍射提供RNA帽结合口袋的高分辨率结构数据,(ii)提供鉴定可结合PB2的RNA结合口袋(优选与RNA帽结合竞争并由此干扰RNA聚合酶活性)的化合物的计算机和体外方法,优选高通量形式,以及(iii)提供针对由利用帽攫取机制合成病毒mRNA的病毒所致感染性疾病的包含这些化合物的药物组合物。
本发明使得第一次可以对独立折叠的结构域中PB2RNA帽结合位点进行精确定义。迄今为止,对于所述位点可能位于哪里还有很多争论。通常认为功能性帽结合位点需要全部三个聚合酶亚基,可能还需要病毒RNA(Cianci等,1995;Li等,2001)。本发明人出人意料的成果是重组产生包含RNA帽结合口袋的可溶性PB2多肽片段,这使得能够使用易于从直接表达系统得到的材料对流感病毒聚合酶功能性位点的抑制剂进行体外高通量筛选。之前对帽结合抑制剂的工作已经使用了例如从流感病毒体中纯化的完整核糖核蛋白颗粒(Hooker等,2003)。此外,通过提供PB2内RNA帽结合口袋的详细结构坐标,本发明人使得可以使用基于结构的帽结合抑制剂设计方法,即计算机(in silico)筛选并导致最优化。
发明内容
在第一方面中,本发明涉及可溶性多肽片段,其中所述多肽片段(i)来源于流感病毒RNA依赖性RNA聚合酶亚基PB2或其变体,并且(ii)能够结合RNA帽或其类似物。
在另一个方面中,本发明涉及包含本发明可溶性多肽片段以及RNA帽或其类似物的复合物。
在又一个方面中,本发明涉及编码本发明分离可溶性多肽片段的分离的多核苷酸。
在另一个方面中,本发明涉及包含本发明分离多核苷酸的重组载体。
在另一个方面中,本发明涉及包含本发明分离多核苷酸或者本发明重组载体的重组宿主细胞。
在又一个方面中,本发明涉及用于鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的全部或一部分相结合的化合物的方法,其包括以下步骤:
(a)构建如图18所示本发明复合物的结构坐标所定义的所述结合口袋的计算机模型;
(b)通过选自下组的方法选择潜在的结合化合物:
(i)将分子片段组装成所述化合物,
(ii)从小分子数据库中选择化合物,和
(iii)对所述化合物进行配体的从头设计;
(c)利用计算机方法进行所述化合物与所述结合口袋的计算机模型之间的拟合程序运算,以提供所述化合物在所述结合口袋中能量最低的构型;以及
(d)评价所述拟合运算的结果来对所述化合物和所述结合口袋模型之间的结合进行定量,其中对所述化合物与所述结合口袋相结合的能力进行评价。
在又一个方面中,本发明涉及可通过本发明计算机方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮或T-705,并且能够结合PB2或其变体的RNA帽结合口袋。
在又一个方面中,本发明涉及可通过本发明计算机方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮或T-705,并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。
在另一个方面中,本发明涉及鉴定与PB2的RNA帽结合口袋或PB2多肽变体的结合口袋相结合的化合物的方法,包括以下步骤:(i)将本发明的多肽片段或本发明的重组宿主细胞与测试化合物相接触,以及(ii)分析所述测试化合物结合PB2的能力。
在又一个方面中,本发明涉及可根据本发明的体外方法产生的药物组合物。
在又一个方面中,本发明涉及可通过本发明体外方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮或T-705,并且能够结合PB2多肽、其变体或其片段。
在另一个方面,本发明涉及可通过本发明的体外方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮或T-705,并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。
在另一个方面中,本发明涉及针对PB2的RNA帽结合结构域的抗体。
在又一个方面中,本发明涉及本发明化合物、本发明药物组合物或本发明抗体在制备用于治疗、改善或预防负链ssRNA病毒感染所引起疾病的药物中的用途。
附图说明
图1显示了具有与流感病毒聚合酶PB1亚基之潜在结合位点以及现有技术所预测的潜在RNA帽结合位点(Cap-N/Cap-C参见Honda等(1999),Cap-C(Trp552)参见Li等(2001),Cap-M参见Fechter等(2003))的全长PB2。另外,显示了为进行细菌表达而产生的PB2片段。所有这些构建体均以高水平表达并且是可溶性的。从上到下显示了由13个分离的克隆编码的PB2片段的长度,其编码7个独特的PB2片段。所分离的克隆跨越SEQ ID NO:25的以下核苷酸:克隆68:886位至1449位,克隆16:871至1452位,克隆15:871至1452位,克隆57:844至1449位,克隆13:844至1449位,克隆10:832至1443位,克隆28:805至1452位,克隆23:805至1452位,克隆12:723至1425位,克隆4:706至1491位,克隆30:706至1491位,克隆07:706至1491位,以及克隆05:706至1491位。
图2A显示了在Superdex 75凝胶过滤柱上纯化PB2多肽片段318位至483位氨基酸的示意图。将以任意单位(arbitrary unit)计的280nm吸光度对洗脱时间和级分号作图。
图2B显示凝胶过滤之后PB2多肽片段(318位至483位氨基酸)的级分24-34的考马斯染色的SDS PAGE凝胶。分子量标准品具有以下大小:116-66.2-45-35-25-18.4和14.4kD。
图3A显示使用沉淀溶液1.6M甲酸钠、0.1M柠檬酸pH 4.6形成的与m7GTP(5mM)形成复合物的PB2多肽片段(318位至483位氨基酸)的天然结晶。
图3B显示了使用沉淀溶液1.6M甲酸钠、0.1M柠檬酸pH 4.6与m7GTP(5mM)形成复合物的部分硒代甲硫氨酸化PB2多肽片段(318位至483位氨基酸)的结晶。
图4显示在欧洲同步加速器辐射设施(European SynchrotronRadiation Facility)以光束线BM14在天然晶体上获得的X射线衍射图样。衍射图样指标位于空间群C2221,晶胞大小为a=92.2,b=94.4,c=220.4埃。右上插图显示衍射扩展至2.4埃解析度。右下插图显示用于数据收集的冷冻晶体,其大小约为15×15×50μm3。
图5显示与m7GTP形成复合物的PB2多肽片段(318至483位氨基酸)结构的带状图。根据DSSP计算标出二级结构元件(Holm,L和Sander,C.,1993),深灰色为α螺旋,浅灰色为β链。GTP以球棒模型显示,如Phe323、Phe404和His357的侧链。标出了以348和420位为中心的重要的环,如在该结构中可见N端和C端残基(分别为320和483位)。
图6显示与m7GTP形成复合物的PB2多肽片段(318至483位氨基酸)结构的另一视图,显示420-环伸入溶剂中。
图7显示被形成PB2中RNA帽结合口袋的一些氨基酸所围绕的m7GTP的构象和无偏实验性电子密度。所述电子密度对应于使用实验相和在0.95σ处等高的非晶体学对称平均化通过RESOLVE获得的图像。
图8显示包埋于PB2中具有潜在相互作用原子的RNA帽结合口袋中的帽类似物m7GTP。推定氢键由虚线表示。
图9显示来自甲型流感病毒(Influenza A)(毒株A/Victoria/3/1975)和乙型流感病毒(毒株B/Lee/40)的PB2RNA帽结合结构域的氨基酸序列比对。在序列比对上方显示A/Victoria/3/1975的二级结构(由DSSP(Holm和Sander,1993)计算)。使用ESPRIPT(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)对基于结构的序列比对进行作图。实心黑色背景上的残基在两个序列中是相同的。三角表示与帽类似物m7GTP相互作用的主要残基。
图10显示来自甲型流感病毒(Influenza A)(毒株A/Victoria/3/1975)、乙型流感病毒(毒株B/Lee/40)和丙型流感病毒(毒株Ann Arbor/1/50)的PB2RNA帽结合结构域的氨基酸序列比对。注释同图9。
图11显示了RNA帽类似物m7GTP与PB2内RNA帽结合口袋之间的相互作用。帽类似物m7GTP(标记为M7G)以深灰色条绘制,蛋白质残基以中等灰色条绘制,水分子以浅灰色圆绘制。氢键以虚线显示,供体和受体之间的距离以埃计。深灰色圆的细线条部分显示与配体发生范德华力接触的残基。该图对应于坐标文件中具有B链的分子。非对称单元中的四个其它分子(A、B、D和F链)给出相似的图,在距离和水的位置上略有差异。该图使用LIGPLOT(Wallace等,1995)制成。
图12显示在4℃下与m7GTP Sepharose 4B树脂结合之后,所示野生型和单点突变PB2帽结合结构域洗脱结果的考马斯染色SDS PAGE凝胶。在野生型蛋白发生结合的条件下,突变体E361A、F404A、H357A和K376A无法与m7GTP Sepharose 4B树脂结合,而F323A有弱的残余结合活性,F325A几乎与野生型一样与树脂结合,但是,此结合活性在37℃下显著降低(见表3)。还制备了H357W突变体,因为甲型和乙型流感病毒在此位置具有此残基。可溶性地纯化此突变体,发现与m7GTP Sepharose 4B树脂的结合与野生型相比略微增强。突变体ΔVQ通过将残基Val421-Gln426替换为三个甘氨酸(420-环)来产生,并显示帽结合活性。
图13显示野生型或突变体重组聚合酶复合物的帽结合活性。将HEK293T细胞培养物共转染表达PB1和PA(Φ)的质粒,或者共转染表达PB1、PB2-His或其突变体以及PA的质粒。通过在4℃下使用m 7GTP-Sepharose的下拉测定(pull down)分析细胞提取物。通过使用PA特异性抗体的Western印迹显示保留并被m7GTP洗脱的聚合酶复合物。IN和E分别表示输入细胞提取物和洗脱蛋白。PA特异性条带的位置在右侧标出,分子量标准品的移动在左侧显示。突变体ΔVQ通过将残基Val421-Gln426替换为三个甘氨酸(420-环)来产生。
图14显示野生型或突变体聚合酶的复制活性。在体内重构野生型和突变体微RNP并使用Ni2+-NTA-琼脂糖通过亲和色谱进行纯化。通过使用抗PA和抗NP抗体的Western印迹测定后代RNP的累积。数据以野生型值的百分比显示,为两个实验的平均值和范围。突变体ΔVQ通过将残基Val421-Gln426替换为三个甘氨酸(420-环)来产生。
图15显示纯化的野生型或突变体RNP使用ApG作为引物的体外转录活性。数据显示为两个实验的平均值和范围。突变体ΔVQ通过将残基Val421-Gln426替换为三个甘氨酸(420-环)来产生。
图16显示纯化的野生型或突变体RNP使用β-珠蛋白mRNA作为引物的体外转录活性。数据显示为两个实验的平均值和范围。突变体ΔVQ通过将残基Val421-Gln426替换为三个甘氨酸(420-环)来产生。
图17显示纯化的野生型或突变体RNP的ApG依赖性与β-珠蛋白mRNA依赖性体外转录活性的比值。数据显示为两个实验的平均值和范围。突变体ΔVQ通过将残基Val421-Gln426替换为三个甘氨酸(420-环)来产生。
图18列举了具有Lys389的SEQ ID NO.1PB2多肽片段318位至483位氨基酸的精细原子结构坐标。该片段具有SEQ ID NO:11的氨基酸序列,其与RNA帽类似物7-甲基-鸟苷三磷酸(m7GTP)形成复合物。具有链A、B、D、E、F的不对称单元中有5个分子。RNA帽类似物m7GTP是每个链的第一个残基。有293个水分子。文件头给出了有关结构精细化的信息。“Atom”指其坐标被测定的元素。该列中的第一个字母定义元素。给出各个氨基酸的三字母代码以及氨基酸序列位置。“Atom”列中的前3个值定义所测元素的原子位置。第四个值对应于占位率(occupancy),第五个(最后一个)值是温度因子(B因子)。占位因子指分子中每个原子占据以坐标表示之位置的比例。值为“1”表示各个原子在晶体的所有分子中均具有相同的构象,即相同位置。B是温度因子,其度量原子围绕其原子中心的运动。在标记为“ANISOU”的列中给出各向异性温度因子。此命名对应于PDB文件格式。
发明详述
在下文对本发明详细描述之前,应理解本发明不局限于本文所述的具体方法、方案和试剂,因为它们可发生变化。还应理解,本文所用术语仅用于描述具体的实施方案,而不意欲限制本发明的范围,本发明的范围仅仅由所附加权利要求限定。除非另外定义,否则本发明中所有的技术和科学名词具有与本发明所属领域技术人员通常所理解相同的含义。
优选地,本文所用术语如″A multilingual glossary of biotechnologicalterms:(IUPAC Recommendations)″,H.G.W.Leuenberger,B.Nagel和编辑,Helvetica Chimica Acta,CH-4010Basel,Switzerland,(1995)中所述。
在本说明书及其权利要求书通篇中,除非上下文另有要求,否则“包含”这一用语及其变化例如“包括”和“含有”应理解为表示包含所述整体、步骤或者整体或步骤的组,但是不排除任何其它的整体、步骤或者整体或步骤的组。
在本说明书中引用了一些文献。本文所引用的每个文献(包括所有专利、专利申请、科技出版物、制造商说明、说明书等),不论上文所述或下文所述,都通过引用以整体并入本文。本文中的任何内容均不视作认可本发明不能由于在先发明而早于这些公开内容。
术语“多肽片段”指单个氨基酸链构成的蛋白质的一部分。术语“蛋白质”包括呈现二级和三级结构的多肽片段,还指由形成四级结构的数个氨基酸链(即数个亚基)组成的蛋白质。术语“肽”指最多50个氨基酸的短氨基酸链,其不一定呈现二级或三级结构。“拟肽”是由N-取代的甘氨酸寡聚装配产生的肽类似物。
如果两个或多个多肽中的残基在多肽结构中占据类似的位置,则所述残基称为彼此“对应”。如现有技术中公知的,两个或多个多肽中的类似位置可基于氨基酸顺序或结构相似性通过多肽序列比对来确定。这样的比对工具对本领域技术人员来说是公知的,可以例如获得自万维网(WouldWide Web),例如使用标准设置的ClustalW(www.ebi.ac.uk/clustalw)或Align(http://www.ebi.ac.uk/emboss/align/index.html),优选AlignEMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5。本领域技术人员理解,为产生满意的比对,可能需要在序列中引入缺口。例如,甲型流感病毒PB2亚基中的220至510位残基分别对应于乙型和丙型流感病毒PB2亚基中的222至511位残基和227至528位残基。这样产生的对三个PB2亚基的比对在图10中显示。如果两个或更多流感病毒PB2亚基中的残基在最佳序列比对中对齐,则称其为“对应”。两个多肽之间的“最佳序列比对”定义为产生最大数量对齐的相同残基的比对。如果两个比对序列的序列相似性(优选同一性)在10、20或30个氨基酸的长度上降至低于30%,优选低于20%,更优选低于10%,更优选在10、20或30个氨基酸的长度上低于30%,则″最佳序列比对区域″结束并由此确定为测定相似性分数的比较序列的长度边界。甲型(315至498位aa)、乙型(317至499位aa)和丙型(327至516位aa)流感病毒PB2亚基的最佳序列比对部分显示于图9和10。
本发明包括流感病毒RNA依赖性RNA聚合酶PB2亚基的可溶性片段,其能够结合RNA帽或其类似物。术语“RNA依赖性RNA聚合酶亚基PB2”优选表示甲型流感病毒、乙型流感病毒和丙型流感病毒的PB2,优选具有SEQ ID NO:1、2或3所示的氨基酸序列。“RNA依赖性RNA聚合酶亚基PB2变体”与SEQ ID NO:1、2或3所示氨基酸序列使用最佳序列比对在整个片段的长度上和/或在最佳序列比对区域上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列相似性,优选序列同一性,其中所述最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5。优选地,当天然PB2变体与SEQ ID NO:1、2或3的PB2亚基比对时,比对在两个蛋白质的全长上进行,因此在此基础上确定比对得分。但是,有可能天然变体可包含C端/N端或内部的缺失或添加,例如通过N端或C端的融合。在此情况下,仅将最佳比对区域用于分别评估相似性和同一性。
优选地,并且如下文详细描述地,来源于这些变体的可溶性片段分别显示所示相似性和同一性,优选在RNA帽结合所需的区域内。因此,SEQID NO:1、2或3与PB2变体之间的任意比对应优选包含RNA帽结合口袋。因此,上述序列与SEQ ID NO:1、2或3的相似性和同一性分别至少对应于100、110、120、130、140、150、160、165、170、180、190、200、210、220、230、240、250、300或更多个氨基酸的长度,优选包含RNA帽结合口袋。因此,在一个优选实施方案中,RNA依赖性RNA聚合酶亚基PB2变体与SEQ ID NO:1在100个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在110个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在120个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在130个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在140个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在150个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在160个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在165个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在170个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在180个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在190个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在200个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在210个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在220个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在230个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在240个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在250个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:1在300个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性。
在一个优选实施方案中,RNA依赖性RNA聚合酶亚基PB2变体与SEQ ID NO:2在100个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在110个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在120个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在130个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在140个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在150个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在160个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在165个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在170个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在180个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在190个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在200个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在210个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在220个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在230个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在240个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在250个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:2在300个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性。
在一个优选实施方案中,RNA依赖性RNA聚合酶亚基PB2变体与SEQ ID NO:3在100个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在110个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在120个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在130个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在140个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在150个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在160个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在165个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在170个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在180个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在190个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在200个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在210个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在220个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在230个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在240个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在250个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,与SEQ ID NO:3在300个氨基酸的长度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性。
SEQ ID NO:1、2或3的大量天然PB2序列变体是已知的,并已记载于文献中。所有这些PB2变体均包括在内,并可以是本发明可溶性片段的基础。对于甲型流感病毒,如果SEQ ID NO:1用作参考序列的话,优选实例包含一个或多个下列氨基酸位置的突变:Val227、Arg251、Ile255、Ser271、Gln288、Ile338、Val344、Arg355、Ile373、Leu374、Asn456、Val 461和/或Ser497。在一个优选实施方案中,所述变体包含下列突变中的一个或多个:Val227Met、Arg251Lys、Ile255Val、Ile255Thr、Ser271Ala、Gln288Leu、Ile338Val、Ile338Thr、Val344Leu、Arg355Lys、Ile373Thr、Leu374Ile、Asn456Ser、Val461Ile和/或Ser497Asn。优选的甲型流感病毒PB2亚基变体包含导致氨基酸从精氨酸变成赖氨酸的389位突变(例如SEQ ID NO:11),其任选地与上述突变中的一个或多个相组合。如果SEQID NO:2用作参考序列的话,乙型流感病毒PB2亚基的优选变体包含一个或多个下列氨基酸位置的突变:Thr254、Met261、Ile269、Thr301、Ile303、Leu319、Ile346、Lys380、Arg382、Met383、Lys385、Lys397、Asn442、Ser456、Glu467、Leu468和/或Thr494。在一个优选实施方案中,PB2亚基变体包含下列突变中的一个或多个:Thr254Ala、Met261Thr、Ile269Val、Thr301Ala、Ile303Leu、Leu319Gln、Ile346Val、Lys380Gln、Arg382Lys、Met383Leu、Lys385Arg、Lys397Arg、Asn442Ser、Ser456Pro、Glu467Gly、Leu468Ser和/或Thr494Ile。如果SEQ ID NO:3用作参考序列的话,乙型流感病毒PB2亚基的优选变体包含下列一个或多个氨基酸位置的突变:Leu311、Pro330和/或Ser436。在一个优选实施方案中,所述突变为:Leu311Pro、Pro330Gln和/或Ser436Thr。
因此,本发明可溶性片段基于如上定义的RNA依赖性RNA聚合酶亚基PB2或其变体。因此,在下面的说明中,术语“可溶性多肽片段”和“PB2多肽片段”均包括来自SEQ ID NO:1、2或3所示PB2蛋白的片段以及来自如上所述其PB2蛋白变体的片段,其能够结合RNA帽或其类似物。但是,本说明书也使用术语“PB2多肽片段变体”或“PB2片段变体”具体表示来自RNA依赖性RNA聚合酶亚基PB2变体的能够结合RNA帽或其类似物的可溶性PB2片段。因此,本发明的可溶性PB2片段优选包含天然流感病毒亚基PB2的序列、基本由其组成或者由其组成。但是,也认为PB2片段变体还含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个氨基酸位置处的氨基酸取代,并在使用最佳序列比对的全长上和/或在最佳序列比对区域中与SEQ ID NO:1、2或3所示氨基酸序列具有至少60%、65%、70%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5。应理解,本发明的PB2片段可包含不来自于PB2的其它氨基酸,例如标签、酶等等,在此类比对中不考虑这些其它氨基酸,即在比对得分的计算中将其排除在外。在一个优选实施方案中,在将片段序列与SEQ ID NO:1、2或3比对时在至少100、110、120、130、140、150、160、165、170、180、190、200、210、220、230、240、250、260或270个氨基酸的长度上获得上述比对分数,其中SEQ IDNO:1、2或3的各自序列优选包含RNA帽结合口袋。
在一个优选实施方案中,可溶性PB2多肽片段变体包含至少对应于甲型流感病毒PB2的323至404位氨基酸残基(SEQ ID NO:13)的氨基酸残基,或者由其组成,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO:13所示氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5,更优选所述PB2多肽片段变体包含至少对应于甲型流感病毒PB2的318至483位氨基酸残基(SEQ ID NO:11)的氨基酸残基,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQID NO:11所示氨基酸序列具有至少70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5,更优选所述PB2多肽片段变体包含至少对应于甲型流感病毒PB2的235至496位氨基酸残基(SEQ ID NO:4)的氨基酸残基,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ IDNO:4所示氨基酸序列具有至少60%、更优选65%、更优选70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5,更优选所述PB2多肽片段变体包含至少对应于甲型流感病毒PB2的220至510位氨基酸残基的氨基酸残基,并且与SEQ ID NO:1中所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少60%、更优选65%、更优选70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5。在一些优选实施方案中,本发明的甲型流感病毒PB2多肽片段变体与SEQ ID NO:1相比包含突变,优选天然突变,例如下列氨基酸残基中一个或多个的突变:Val227、Arg251、Ile255、Ser271、Gln288、Ile338、Val344、Arg355、Ile373、Leu374、Lys389、Asn456、Val 461和/或Ser497。在一些优选实施方案中,所述突变如下:Val227Met、Arg251Lys、Ile255Val、Ile255Thr、Ser271Ala、Gln288Leu、Ile338Val、Ile338Thr、Val344Leu、Arg355Lys、Ile373Thr、Leu374Ile、Lys389、Asn456Ser、Val461Ile和/或Ser497Asn。甲型流感病毒PB2亚基片段的一个优选变体包含导致氨基酸由精氨酸变成赖氨酸的389位突变(例如SEQ ID NO:11),其任选地与一个或多个前述突变相组合。
在一个优选实施方案中,PB2多肽片段变体包含至少对应于乙型流感病毒PB2的325至406位氨基酸残基(来自于SEQ ID NO:2)的氨基酸残基,或者由其组成,并且与SEQ ID NO:2所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5,更优选地,所述PB2多肽片段变体包含至少对应于乙型流感病毒PB2的320至484位氨基酸残基(来自于SEQ ID NO:2)的氨基酸残基,并且与SEQ ID NO:2所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少70%,更优选75%,更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5,更优选地,所述PB2多肽片段变体包含至少对应于乙型流感病毒PB2的237至497位氨基酸残基(来自于SEQ ID NO:2)的氨基酸残基,并且与SEQ ID NO:2中所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少60%,更优选65%,更优选70%,更优选75%,更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5,更优选地,所述PB2多肽片段变体包含至少对应于乙型流感病毒PB2的222至511位氨基酸残基(来自于SEQ ID NO:2)的氨基酸残基,并且与SEQ ID NO:2中所示氨基酸序列在使用最佳序列比对的全长上和/或在最佳序列比对区域中具有至少60%,更优选65%,更优选70%,更优选75%,更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,优选序列同一性,其中最佳序列比对可使用本领域已知工具获得,例如Align,其使用标准设置,优选EMBOSS::needle、Matrix:Blosum62、缺口打开10.0、缺口延伸0.5。。在一些优选实施方案中,本发明的乙型流感病毒PB2多肽片段变体与SEQ ID NO:2相比包含下列氨基酸残基中一个或多个的突变,优选天然突变:Thr254、Met261、Ile269、Thr301、Ile303、Leu319、Ile346、Lys380、Arg382、Met383、Lys385、Lys397、Asn442、Ser456、Glu467、Leu468和/或Thr494。在一些优选实施方案中,所述片段变体包含一个或多个下列突变:Thr254Ala、Met261Thr、Ile269Val、Thr301Ala、Ile303Leu、Leu319Gln、Ile346Val、Lys380Gln、Arg382Lys、Met383Leu、Lys385Arg、Lys397Arg、Asn442Ser、Ser456Pro、Glu467Gly、Leu468Ser和/或Thr494Ile。
在一个优选实施方案中,所述PB2多肽片段变体包含至少对应于丙型流感病毒PB2的335至416位氨基酸残基(来源于SEQ ID NO:3)的氨基酸残基或由其组成,并且在片段全长上与SEQ ID NO:3所示氨基酸序列具有至少80%,优选85%,更优选90%,最优选95%的序列相似性,更优选地,所述PB2多肽片段变体包含至少对应于丙型流感病毒PB2的330至501位氨基酸残基(来源于SEQ ID NO:3)的氨基酸残基,并且在片段全长上与SEQ ID NO:3所示氨基酸序列具有至少70%,更优选75%,更优选80%,优选85%,最优选90%的序列相似性,更优选地,所述PB2多肽片段变体包含至少对应于丙型流感病毒PB2的242至514位氨基酸残基(来源于SEQ ID NO:3)的氨基酸残基,并且在片段全长上与SEQ IDNO:3所示氨基酸序列具有至少60%,更优选65%,更优选70%,更优选75%,更优选80%,优选85%,最优选90%的序列相似性,更优选地,所述PB2多肽片段变体包含至少对应于丙型流感病毒PB2的227至528位氨基酸残基(来源于SEQ ID NO:3)的氨基酸残基,并且在片段全长上与SEQ ID NO:3所示氨基酸序列具有至少60%,更优选65%,更优选70%,更优选75%,更优选80%,优选85%,最优选90%的序列相似性。在一些优选实施方案中,本发明的丙型流感病毒PB2多肽片段变体与SEQID NO:3相比包含突变,优选天然突变,例如一个或多个下列氨基酸残基的突变:Leu311、Pro330和/或Ser436。在一个优选实施方案中,所述片段变体包含一个或多个下列突变:Leu311Pro、Pro330Gln和/或Ser436Thr。
术语“序列相似性”表示最佳序列比对中相同位置处的氨基酸相同或相似,优选相同。“相似氨基酸”具有相似的特征,例如极性、溶解度、亲水性、疏水性、电荷或者大小。相似氨基酸优选为亮氨酸、异亮氨酸和缬氨酸;苯丙氨酸、色氨酸和酪氨酸;赖氨酸、精氨酸和组氨酸;谷氨酸和天冬氨酸;甘氨酸、丙氨酸和丝氨酸;苏氨酸、天冬酰胺、谷氨酰胺和甲硫氨酸。本领域技术人员非常了解序列相似性检索工具,例如可从万维网(World Wide Web)获得(例如www.ebi.ac.uk/Tools/similarity.html)。
本文所用的术语“可溶”表示在生理等渗条件(例如0.14M氯化钠或蔗糖)下,在蛋白质浓度高达5mg/ml时,不含有效浓度变性剂(例如胍或尿素)的水性缓冲液中以100000×g离心30分钟后保留在上清液中的多肽片段。检测其溶解度的蛋白质片段优选在下文所述细胞表达系统之一中表达。特别优选地,这些蛋白质片段的表达(优选还有纯化)如下文实施例2中更详细描述地那样进行。
涉及多肽时,术语“纯化的”不需要是绝对纯化的,例如均一制备物,而是表示所述多肽相对于自然环境中来说相对更纯。通常,纯化的多肽基本上不含其它蛋白质、脂类、碳水化合物或与其天然相关的物质,优选为功能显著性水平,例如至少85%纯,更优选至少95%纯,最优选至少99%纯。表述“纯化至适于结晶的程度”指蛋白质的纯度为85%至100%,优选90%至100%,更优选95%至100%,并可浓缩至高于3mg/ml,优选高于10mg/ml,更优选高于18mg/ml,而没有沉淀。本领域技术人员可使用蛋白质纯化的标准技术来纯化多肽。基本纯化的多肽会在非还原性聚丙烯酰胺凝胶上产生单个主要条带。
在使用本发明方法鉴定化合物的上下文中使用的术语“相结合”表示部分(即化学实体或化合物或其部分或片段)与PB2的结合口袋之间接近的状态。所述结合可以是非共价的,即例如氢键、范德华力、静电或疏水性相互作用在能量上有利于接近,或者也可以是共价的。
术语“RNA帽”指可见于mRNA分子5′端的帽结构,其由通过非常见5′至5′三磷酸键连接到mRNA的鸟苷酸组成。此鸟苷在7位甲基化。其它修饰包括mRNA 5′端前三个核糖中2′羟基的可能的甲基化。“RNA帽类似物”指类似于RNA帽结构的结构。RNA帽类似物的实例包括:7-甲基鸟苷(m7G)、7-甲基鸟苷单磷酸(m7GMP)、7-甲基鸟苷三磷酸(m7GTP)、通过5’至5’三磷酸键连接到鸟苷的7-甲基鸟苷(m7GpppG)、通过5’至5’三磷酸键连接到在核糖2’OH位发生甲基化之鸟苷的7-甲基鸟苷(m7GpppGm)、通过5’至5’三磷酸键连接到腺苷的7-甲基鸟苷(m7GpppA)、通过5’至5’三磷酸键连接到在核糖2’OH位发生甲基化之腺苷的7-甲基鸟苷(m7GpppAm)、通过5’至5’三磷酸键连接到胞苷的7-甲基鸟苷(m7GpppC)、通过5’至5’三磷酸键连接到在核糖2’OH位发生甲基化之胞苷的7-甲基鸟苷(m7GpppCm)、通过5’至5’三磷酸键连接到尿苷的7-甲基鸟苷(m7GpppU)、通过5’至5’三磷酸键连接到在核糖2’OH位发生甲基化之尿苷的7-甲基-鸟苷(m7GpppUm)。因此,在本发明的一个优选实施方案中,所述帽类似物选自:m7G、m7GMP、m7GTP、m7GpppN、m7GpppNm,其中N是核苷酸,优选G、A、U或C。在另一个优选实施方案中,RNA帽类似物可包含另外的例如1至15个核苷酸,即1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个,其中所述核苷酸优选独立地选自A、C、G、U和/或T。这些另外的核苷酸优选通过磷酸酯、磷酸二酯或者磷酸三酯键或者其不可水解的类似物连接至m7GpppN或m7GpppNm中的第一核苷酸N。
本文使用的术语“核苷酸”表示由在1′位与戊糖相连的嘌呤、氮杂嘌呤或嘧啶核苷酸碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶、胸腺嘧啶、氮杂腺嘌呤、氮杂鸟嘌呤等)组成的化合物,包括2′-脱氧和2′-羟基形式,例如Kornberg and Baker,DNA Replication,第二版(Freeman,SanFrancisco,1992)中所述的,还包括但不限于具有经修饰碱基部分和/或经修饰糖部分的合成核苷,例如由Scheit,Nucleotide Analogs(John Wiley,N.Y.,1980)中一般性描述的。
术语“结合口袋”表示由本发明多肽片段形成的三维结构,即PB2的RNA帽结合结构域,其由直接接触RNA帽的氨基酸残基或者使直接接触RNA帽的氨基酸残基定位的氨基酸残基(第二层氨基酸残基)排列而成,所述氨基酸残基为例如Arg332和Ser337。由于其形状,所述结合口袋接纳RNA帽或其类似物。PB2的RNA帽结合口袋由结构坐标所定义,所述结构坐标来自于对包含RNA帽结合位点的PB2多肽片段与RNA帽类似物之间的复合物的晶体结构数据分析。术语“结合口袋”还包含PB2多肽片段变体的结合口袋。
术语“PB2的RNA帽结合结构域”表示在其天然三维结构中包含RNA结合口袋的PB2最小多肽片段。
术语“分离的多核苷酸”表示这样的多核苷酸,其为(i)从其天然环境中分离,(ii)通过聚合酶链式反应扩增的,或者(iii)全部或部分合成的,还表示脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链多聚体,包括DNA和RNA分子,有义和反义链。该术语包括cDNA,基因组DNA以及重组DNA。多核苷酸可由完整基因或其部分组成。
本文使用术语“重组载体”包括本领域技术人员已知的任何载体,包括质粒载体、粘粒载体、噬菌体载体(例如λ噬菌体)、病毒载体(例如腺病毒或杆状病毒载体)、或者人工染色体载体(例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或者P1人工染色体(PAC))。所述载体包括表达载体及克隆载体。表达载体包括质粒和病毒载体,一般含有所需的编码序列以及在特定宿主生物(例如细菌、酵母、植物、昆虫或哺乳动物)中或体外表达系统中表达与其有效连接之编码序列的合适DNA序列。克隆载体一般用于改造和扩增某些需要的DNA片段,可能缺乏表达所需DNA片段需要的功能序列。
本文使用的“重组宿主细胞”表示包含编码目的多肽片段(即本发明的PB2多肽片段或其变体)的多核苷酸的宿主细胞。此多核苷酸可以如下方式存在于宿主细胞中:(i)自由分散的,(ii)并入重组载体中,或者(iii)整合在宿主细胞基因组或线粒体DNA中。重组细胞可用于表达目的多核苷酸,或者用于扩增本发明的多核苷酸或重组载体。术语“重组宿主细胞”包括以本发明多核苷酸或重组载体进行转化、转染或感染的原始细胞的后代。重组宿主细胞可以是细菌细胞,例如大肠杆菌细胞;酵母细胞例如酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichia pastoris);植物细胞;昆虫细胞例如SF9或Hi5细胞;或者哺乳动物细胞。优选的哺乳动物细胞实例有中国仓鼠卵巢(CHO)细胞、非洲绿猴肾(COS)细胞、人胚肾(HEK293)细胞、HELA细胞,等等。
本文使用的术语“晶体”或“结晶”表示这样的结构(例如三维固体聚集体),其中平面以确定的角度相交,并且其中化学组成物质有规则的结构(例如内部结构)。术语“晶体”可包括下列任一项:固体物理晶形例如实验制备的晶体,来源于晶体的晶体结构(包括二级和/或三级和/或四级结构元件),基于晶体结构的2D和/或3D模型,其表示例如其略图或者图示,或者用于计算机的其数据集。在一个方面中,所述晶体可用于X射线晶体衍射技术。在这里,所用的晶体可承受暴露于X射线束并用于产生解析X射线晶体结构所需的衍射图样数据。晶体可以表征为能够以T.L.Blundell和L.N.Johnson,″Protein Crystallography″,Academic Press,New York(1976)所示晶形之一所定义的衍射X射线图样。
术语“晶胞”指基本的平行六面体形的单元。晶体的整个体积可以由规则装配的这些单元构建而成。每个晶胞包含图样单元的完整表示,对其进行重复而构建出所述晶体。
术语“空间群”指晶体对称元素的排布。在空间群的命名中,大写字母表示晶格类型,其它符号表示可以在不改变外观的情况下对不对称单元内容进行的对称操作。
术语“结构坐标”指定义一个或多个氨基酸残基相对于坐标系的位置的一组数值。该术语指定义分子三维结构的数据集(例如笛卡儿坐标、温度因子和占位率)。结构坐标可略微改变,但仍保持几乎相同的三维结构。独特结构坐标组的度量是所得结构的均方根差。本领域普通技术人员可以将产生均方根差小于3埃、2埃、1.5埃、1.0埃或0.5埃的彼此偏差的三维结构(特别是结合口袋的三维结构)的结构坐标视为非常类似的。
术语“均方根差”表示与平均值的偏差的平方的算术平均值的平方根。这是表示与趋势或目标的偏差或偏离的一种方法。出于本发明的目的,“均方根差”定义了PB2多肽片段变体主链或者其中RNA帽结合口袋与图18的PB2-m7GTP复合物的结构坐标所定义的PB2主链或者其中RNA帽结合口袋之间的偏差。
本文所使用的术语“构建计算机模型”包括基于原子结构信息和相互作用模型进行的分子结构和/或功能的定量和定性分析。术语“建模”包括常规基于数字的分子动力学和能量最低化模型,交互式计算机图像模型,经修改的分子力学模型,距离几何以及其它基于结构的约束模型。
术语“拟合程序操作”表示利用化学实体、结合口袋、分子或分子复合物或其部分的结构坐标从而将所述化学实体与结合口袋、分子或分子复合物或其部分相结合的操作。这可通过在所述结合口袋中定位、旋转或移动所述化学实体以匹配所述结合口袋的形状和静电互补性来实现。可对共价相互作用、非共价相互作用(例如氢键、静电、疏水、范德华力相互作用以及非互补静电相互作用例如排斥电荷-电荷、偶极-偶极和电荷-偶极相互作用)进行优化。或者,可使得所述化学实体与所述结合口袋的结合形变能量最小化。
本文使用的术语“测试化合物”指包含测试其结合所述目的多肽片段之能力的化合物、分子或复合物的物质,即包含RNA帽结合口袋的本发明PB2多肽片段或其变体。测试化合物可以是任何物质,包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂类、金属、核苷酸、核苷酸类似物、核苷、核酸、小有机或无机分子、化合物、元素、糖类、同位素、碳水化合物、造影剂、脂蛋白、糖蛋白、酶、分析探针、聚胺以及其组合和衍生物。术语“小分子”指分子量为50至约2500道尔顿、优选200-800道尔顿的分子。另外,本发明的测试化合物可任选地包含检测标记。这些标记包括但不限于,酶标记、放射性同位素或者放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。可使用公知方法将这些检测标记连接到测试化合物。本发明的测试化合物还可包含物质的复杂混合物,例如含有天然产物的提取物,或者混合的组合合成的产物。它们也可以被测试,并且可在后续步骤中从所述混合物中纯化出结合靶标多肽片段的组分。测试化合物可衍生自或选自合成或天然化合物的文库。例如,合成化合物文库可购自Maybridge Chemical Co.(Trevillet,Cornwall,UK),ChemBridge Corporation(San Diego,CA)或Aldrich(Milwaukee,WI)。天然化合物文库例如可得自TimTec LLC(Newark,DE)。或者,可使用细菌、真菌、植物和动物细胞以及组织提取物形式的天然化合物文库。另外,测试化合物可使用组合化学法作为单个化合物或混合物合成产生。使用组合化学法制成的化合物集合在本文中称为组合文库。
术语“高通量形式”指多种类型的高通量筛选测定和技术,其用于筛选测试化合物文库结合目的多肽片段的能力。通常,以多孔形式进行高通量测定,其包括无细胞测定以及基于细胞的测定。
术语“抗体”表示单克隆和多克隆抗体,即任何免疫球蛋白或其能够识别抗原或半抗原的部分,即识别PB2的RNA帽结合结构域或其肽。抗原结合部分可通过重组DNA技术或者酶或化学切割完整抗体的方法产生。在一些实施方案中,抗原结合部分包括Fab、Fab′、F(ab′)2、Fd、Fv、dAb以及互补性决定区(CDR)片段、单链抗体(scFv)、嵌合抗体例如人源化抗体、双抗体以及含有抗体中至少足以赋予与多肽特异性抗原结合的部分的多肽。
术语“可药用盐”指可通过本发明方法鉴定的化合物或本发明化合物的盐。合适的可药用盐包括酸加成盐,其可以例如通过将本发明化合物的溶液与可药用酸(如盐酸、硫酸、延胡索酸、马来酸、琥珀酸、乙酸、苯甲酸、柠檬酸、酒石酸、碳酸或磷酸)的溶液混合来形成。此外,当所述化合物带有酸性部分时,合适的可药用盐可包括碱金属盐(例如钠盐或钾盐);碱土金属盐(例如钙或镁盐);以及由合适的有机配体形成的盐(例如铵,季铵,以及使用反阴离子(counteranion)例如卤化物、氢氧化物、羧酸根、硫酸根、磷酸根、硝酸根、烷基磺酸根和芳基磺酸根形成的胺阳离子)。可药用盐的示例性实例包括但不限于:乙酸盐、己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、碳酸氢盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、乙二胺四乙酸钙、樟脑酸盐、樟脑磺酸盐、右旋樟脑磺酸盐、碳酸盐、氯化物、柠檬酸盐、克拉维酸盐、环戊烷丙酸盐、二葡萄糖酸盐、二盐酸盐、十二烷基硫酸盐、依地酸盐、乙二磺酸盐、依托酸盐、乙磺酸盐(esylate)、乙磺酸盐(ethanesulfonate)、甲酸盐、延胡索酸盐、葡庚糖酸盐、葡萄糖酸盐、葡糖酸盐、谷氨酸盐、甘油磷酸盐、羟乙酰基对氨基苯基砷酸盐、半硫酸盐、庚酸盐、己酸盐、己基间苯二酸盐、海胺盐(hydrabamine)、氢溴酸盐、盐酸盐、氢碘酸盐、2-羟基-乙磺酸盐、羟基萘酸盐、碘化物、异硫代硫酸盐(isothionate)、乳酸盐、乳糖酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、扁桃酸盐、甲磺酸盐(mesylate)、甲磺酸盐(methanesulfonate)、甲基硫酸盐、粘酸盐、2-萘磺酸盐、萘磺酸盐、烟酸盐、硝酸盐、N-甲基葡糖胺铵盐、油酸盐、草酸盐、扑酸盐(双羟萘酸盐)、软脂酸盐、泛酸盐、pectinate、过硫酸盐、3-苯基丙酸盐、磷酸盐/二磷酸盐、苦味酸盐、特戊酸盐、多聚半乳糖醛酸盐、丙酸盐、水杨酸盐、硬脂酸盐、硫酸盐、碱式醋酸盐、琥珀酸盐、单宁酸盐、酒石酸盐、茶氯酸盐、甲苯磺酸盐、三乙基碘化物、十一酸盐、戊酸盐等(参见例如S.M.Berge等,″Pharmaceutical Salts″,J.Pharm.Sci.,66,1-19页(1977))。
在用于本文时术语“赋形剂”用于表示药物制剂中不是活性成分的所有物质,例如载体、粘合剂、润滑剂、增稠剂、表面活性剂、防腐剂、乳化剂、缓冲剂、调味剂或着色剂。
术语“可药用载体”包括例如碳酸镁、硬脂酸镁、滑石、糖、乳糖、果胶、糊精、淀粉、明胶、黄芪胶、甲基纤维素、羧甲基纤维素钠、低熔点蜡、可可脂等。
本发明人发现了来自流感病毒RNA依赖性RNA聚合酶亚基PB2的片段,其为可溶性的并且能够结合RNA帽或其类似物,因此适于进行结晶以得到结构信息,同时还使用重组蛋白质进行了结合研究。本发明的一个方面提供了可溶性多肽片段,其中所述多肽片段(i)来自流感病毒RNA依赖性RNA聚合酶亚基PB2,并且(ii)能够结合RNA帽或其类似物。作为本发明可溶性片段之来源的RNA依赖性RNA聚合酶亚基PB2优选来自甲型、乙型或丙型流感病毒。本发明可溶性片段的最小长度由结合RNA帽或其类似物的能力决定。因此,优选本发明的PB2多肽片段包含至少SEQ ID NO:1的323至404位或320至483位氨基酸残基或者例如PB2多肽片段变体中相应的氨基酸,或者由其组成;包含至少SEQ ID NO:2的325至406位或者320至484位氨基酸残基,或者例如PB2多肽片段变体中相应的氨基酸或者由其组成;包含至少SEQ ID NO:3的335至416位或者330至501位氨基酸残基或者例如PB2多肽片段变体中相应的氨基酸,或者由其组成。另一方面,已观察到,如果长度超出某些C端和/或N端边界,则所述片段的溶解度降低。对于来自甲型流感的可溶性片段,优选这些边界(参照SEQ ID NO:1)在N端为220位氨基酸或者变体中与其对应的氨基酸,C端为510位氨基酸或者变体中与其对应的氨基酸。对于来自乙型流感的可溶性片段,优选这些边界(参照SEQ ID NO:2)在N端为222位氨基酸或者变体中与其对应的氨基酸,在C端为511位氨基酸或者变体中与其对应的氨基酸。对于来自丙型流感的可溶性片段,优选这些边界(参照SEQ ID NO:3)在N端为227位氨基酸或者变体中与其对应的氨基酸,在C端为528位氨基酸或者变体中与其对应的氨基酸。在此背景下,术语“可溶”表示多肽片段能以至少0.1mg/ml溶剂的浓度溶解,更优选至少0.5mg/ml,更优选至少1mg/ml,更优选5mg/ml或更高。合适的溶剂是缓冲体系,其包含浓度0.01M至3M的TrisHCl,优选0.05M至2M,更优选0.1M至1M,pH3至pH9,优选pH4至pH9,更优选pH7至pH9,并任选地包含浓度为1mM至20mM的还原剂例如二硫苏糖醇(DTT)或者TCEP.HCl(Tris(2-羧乙基)膦盐酸盐)。
在一个优选实施方案中,所述多肽片段纯化至适于结晶的程度。优选地,纯度为至少95%、96%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%。可通过标准方法评估蛋白质的纯度,包括SDS聚丙烯酰胺凝胶电泳和通过银染进行染色,或者HPLC并在280nm检测。
在另一个优选实施方案中,
(i)所述多肽片段的N端与SEQ ID NO:1的PB2氨基酸序列中220位更高位或例如225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320或323位的氨基酸相同或相对应,所述多肽片段的C端与SEQ ID NO:1的PB2氨基酸序列中510位或更低位例如505、500、495、490、489、488、487、486、485、484或483位的氨基酸相同或相对应,更优选地,所述多肽片段的N端与220位氨基酸相同或相对应,所述多肽片段的C端与510、505、500、495、490、489、488、487、486、485、484或483位的氨基酸相同或相对应;更优选地,所述多肽片段的N端与225位或更高位氨基酸相同或相对应,所述多肽片段的C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与230位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与235位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与240位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与245位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与250位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与255位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与260位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与265位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与270位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与275位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与280位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与280位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与285位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与290位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与295位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与300位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与305位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与310位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与315位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;更优选地,所述多肽片段的N端与320位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;或者;更优选地,所述多肽片段的N端与323位或更高位氨基酸相同或相对应,C端与510位或更低位,特别是505、500、495、490、489、488、487、486、485、484或483位氨基酸相同或相对应;
(ii)所述多肽片段的N端与根据SEQ ID NO:2的PB2氨基酸序列中222位或更高位例如225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325位氨基酸相同或相对应,C端与根据SEQ ID NO:2的PB2氨基酸序列中511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与222位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与225位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与230位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与235位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与240位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与245位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与250位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与255位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与260位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与265位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与270位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与275位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与280位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与285位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与290位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与295位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与300位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与305位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与310位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与315位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;更优选地,所述多肽片段的N端与320位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;或者更优选地,所述多肽片段的N端与325位或更高位氨基酸相同或相对应,C端与511位或更低位例如510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相对应;或者
(iii)所述多肽片段的N端与根据SEQ ID NO:3的PB2氨基酸序列中227位或更高位例如230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、315、320、325、330或335位氨基酸相同或相对应,C端与根据SEQ ID NO:3的PB2氨基酸序列中528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与227位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与230位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与235位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与240位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与245位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与250位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与255位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与260位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与265位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与270位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与275位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与280位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与285位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与290位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与295位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与300位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与305位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与227位或更高位相同或相对应,C端与310位氨基酸或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与315位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与320位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与325位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;更优选地,所述多肽片段的N端与330位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应;或者更优选地,所述多肽片段的N端与335位或更高位氨基酸相同或相对应,C端与528位或更低位例如525、520、519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或501位氨基酸相同或相对应。
在另一个实施方案中,所述多肽片段由选自下列的氨基酸序列组成、基本由其组成或者与其对应:根据SEQ ID NO:4至13的氨基酸序列及其变体,其保留与RNA帽或其类似物相结合的能力并且可溶。在一些优选实施方案中,所述多肽片段中包含氨基酸取代、插入或缺失,优选如上文所述的天然突变。优选地,本发明的PB2多肽片段具有235至496位(SEQID NO:4)、241至483位(SEQ ID NO:5)、268至483位(SEQ ID NO:6)、277至480位(SEQ ID NO:7)、281至482位(SEQ ID NO:8)、290至483位(SEQ ID NO:9)、295至482位(SEQ ID NO:10)、318至483位(SEQID NO:11)、320至483位(SEQ ID NO:12)或者323至404位(SEQ IDNO:13)氨基酸残基或与其对应。
在另一个方面中,本发明提供了包含如上所述PB2多肽片段和RNA帽或其类似物的复合物。优选地,所述帽类似物选自:m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU和m7GpppUm。在本发明的一个实施方案中,所述复合物中的多肽片段由SEQ ID NO:11的氨基酸序列组成,所述帽类似物是m7GTP,所述复合物具有图18所示结构坐标所定义的结构。在一个优选实施方案中,任何本发明的复合物包含晶型,优选空间群C2221,晶胞尺寸a=9.2纳米,b=9.4纳米,e=22.0纳米±0.3纳米。优选地,所述晶体以3.0埃或更高的解析度衍射X射线,优选地2.8埃或更高,更优选2.6埃或更高,最优选2.4埃或更高。
在一个实施方案中,适于结晶的蛋白质溶液可在水溶液中包含5mg/ml至20mg/ml、优选8mg/ml至18mg/ml、更优选11mg/ml至15mg/ml浓度的PB2多肽片段或其变体,2mM至10mM、优选3mM至8mM、更优选4mM至6mM浓度的RNA帽类似物,并任选地包含缓冲体系例如浓度为0.01M至3M、优选0.05M至2M、更优选0.1M至1M,pH3至pH9、优选pH4至pH9、更优选pH7至pH9的Tris-HCl,并任选地包含还原剂例如浓度为1mM至20mM的二硫苏糖醇(DTT)或TCEP.HCl(Tris(2-羧乙基)膦盐酸盐)。在结晶溶液中,PB2多肽片段或其变体或者包含所述PB2多肽片段或其变体和RNA帽或其类似物的复合物的纯度优选为85%至100%,更优选90%至100%,甚至更优选95%至100%。为了产生晶体,将适于结晶的蛋白质溶液与等体积的沉淀剂溶液例如甲酸钠、硫酸铵、多种大小的聚乙二醇相混合。在一个优选实施方案中,结晶介质包含0.05至2μl、优选0.8至1.2μl适于结晶的蛋白质溶液,其与相似体积、优选等体积的包含1.5至2M甲酸钠和0.05至0.15M柠檬酸pH4至pH5的沉淀剂溶液混合。在另一个实施方案中,所述沉淀剂溶液包含7%PEG6000、1MLiCl、0.1M柠檬酸pH5.0,10mM TCEP.HCl。
可通过任何本领域技术人员已知的方法生长晶体,包括但不限于悬滴和坐滴技术(sitting drop)、夹心滴(sandwich-drop)、透析以及微批量或微管批量设备。对本领域技术人员来说很明显的是,可以改变上述结晶条件,来鉴定产生单独或与化合物相复合的本发明PB2多肽片段或其变体的晶体的其它结晶条件。这些变化包括但不限于改变pH、蛋白质浓度和/或结晶温度,改变所用盐和/或沉淀剂的种类或浓度,使用不同的结晶方法,或者引入添加剂例如去污剂(例如吐温20(单月桂酯)、LDOA、Brij 30(4月桂基醚))、糖(例如葡萄糖、麦芽糖)、有机化合物(例如二噁烷、二甲基甲酰胺)、镧系元素离子或者帮助结晶的多聚离子化合物。可使用高通量结晶测定来帮助发现或优化结晶条件。
可使用微接种(microseeding)来增加晶体的尺寸和品质。简言之,将微晶体破碎以产生原种(stock seed)溶液。对所述原种溶液进行系列稀释。使用针、玻璃棒或毛绳,将来自每个稀释液的小样品添加到一组平衡滴中,其中含有蛋白质,其浓度等于或小于在没有种子时产生晶体所需的浓度。目的是最后得到用在滴中发挥晶体生长晶核作用的单个晶种。
如本文所述,获得如图18所示结构坐标、对所述坐标的解读及其在了解蛋白质结构中的应用的方式为本领域技术人员公知,并参考标准教科书,例如J.Drenth,″Principles of protein X-ray crystallography″,第二版,Springer Advanced Texts in Chemistry,New York(1999);和G.E.Schulz和R.H.Schirmer,″Principles of Protein Structure″,SpringerVerlag,New York(1985)。例如,首先获得X射线衍射数据,经常使用冷冻至100K的低温保护(例如用20%至30%甘油)的晶体,例如,使用同步加速器设备的线束或者旋转阳极作为X射线源。然后,通过公知的方法解决相位问题,例如多波长异常衍射(multiwavelength anomalousdiffraction,MAD)、多重同晶置换(multiple isomorphous replacement,MIR)、单波长异常衍射(single wavelength anomalous diffraction,SAD)或者分子置换(molecular replacement,MR)。可使用SHELXD解出亚结构(Schneider和Sheldrick,2002),使用SHARP计算相位(Vonrhein等,2006),以及使用溶剂平滑化及非结晶学对称平均化进行改进(例如使用RESOLVE(Terwilliger,2000))。可使用例如ARP/wARP(Perrakis等,1999)进行模型自构建并使用例如REFMAC进行精细化(Murshudov,1997)。此外,本发明所提供PB2片段的结构坐标(图18)可用于正粘病毒科其他属的PB2多肽或者使用分子替换方法具有氨基酸取代、缺失和/或插入的PB2多肽变体的结构测定。
本发明的另一个方面是提供编码上述PB2多肽片段及其变体的分离的多核苷酸。用于获得这些分离核苷酸片段的分子生物学方法是本领域技术人员公知(对于标准分子生物学方法,参见Sambrook等编辑,″MolecularCloning:A Laboratory Manual″,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York(1989),其通过引用并入本文)。例如,可从被流感病毒感染的细胞中分离RNA,应用逆转录聚合酶链式反应(RT-PCR)产生cDNA,其中使用随机引物(例如随机六聚体或十聚体)或者用于产生目的片段的特异性引物。可通过标准PCR使用片段特异性引物扩增目的片段。
在一个优选实施方案中,编码可溶性PB2多肽片段的优选实施方案的分离多核苷酸来源于SEQ ID NO:23(甲型流感病毒)、26(乙型流感病毒)或者27(丙型流感病毒)。在一个优选实施方案中,编码可溶性甲型流感病毒PB2多肽片段或其变体的分离多核苷酸来源于SEQ ID NO:25,其与SEQ NO:1相比包含389位精氨酸变成赖氨酸的氨基酸替换。在一个更优选的实施方案中,编码甲型流感病毒PB2多肽片段或其变体的分离多核苷酸来源于SEQ ID NO:26,它是针对大肠杆菌密码子使用而进行了优化的DNA序列。在这种情况下,“来源于”表示SEQ ID NO:23、24、25、26或27编码全长PB2多肽,因此编码优选PB2多肽片段的多核苷酸根据各个所编码PB2多肽片段的需要而在多核苷酸的5′和3′端包含缺失。
在一个实施方案中,本发明涉及包含所述分离多核苷酸的重组载体。本领域技术人员十分了解用于将目的多核苷酸序列引入载体的技术(也参见Sambrook等,1989)。这些载体包括任何本领域技术人员已知的载体,包括质粒载体、粘粒载体、噬菌体载体例如λ噬菌体、病毒载体例如腺病毒或杆状病毒,或者人工染色体载体例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或P1人工染色体(PAC)。所述载体可以是适于原核或真核表达的表达载体。所述质粒可包含复制起点(ori)、多克隆位点和调节序列例如启动子(组成型或诱导型)、转录起始位点、核糖体结合位点、转录终止位点、多腺苷酸信号以及选择标记,例如抗生素抗性或基于对突变或缺失进行回补(complementation)的营养缺陷型标记。在一个实施方案中,所述目的多核苷酸序列与调节序列有效连接。
在另一个实施方案中,所述载体包含编码有助于纯化目的多肽片段的表位、肽或蛋白质标签的核苷酸序列。这些表位、肽、或蛋白质标签包括但不限于红细胞凝集素(HA-)、FLAG、myc标签、多His标签、谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白(MBP)、NusA以及硫氧还蛋白标签,或者荧光蛋白标签例如(增强型)绿色荧光蛋白((E)GFP)、(增强型)黄色荧光蛋白((E)YFP)、来源于海葵(Discosoma)物种(DsRed)或者单体(mRFP)的红色荧光蛋白(RFP)、青色荧光蛋白(CFP),等等。在一个优选实施方案中,可将表位、肽或蛋白质标签从目的多肽片段上切下,例如,使用如凝血酶、因子Xa、PreScission、TEV蛋白酶等等的蛋白酶。这些蛋白酶的识别位点是本领域技术人员公知的。在另一个实施方案中,所述载体包括导致目的多肽片段分泌到重组寄主细胞培养基中或者细菌的周质间隙中的功能性序列。所述信号序列片段通常编码信号肽,其由引导所述蛋白质从细胞中分泌出来的疏水氨基酸构成。所述蛋白质分泌到培养基中(革兰氏阳性菌)或者位于细胞外膜和内膜之间的周质间隙中(革兰氏阴性菌)。优选地,在信号肽片段与外源基因之间编码有加工位点,其可被体内或体外切割。
在另一个方面中,本发明提供包含所述分离多核苷酸或所述重组载体的重组宿主细胞。所述重组宿主细胞可以是原核细胞例如古细菌和细菌细胞或者真核细胞例如酵母、植物、昆虫或哺乳动物细胞。在一个优选实施方案中,所述宿主细胞是细菌细胞例如大肠杆菌细胞。本领域技术人员了解将所述多核苷酸或所述重组载体引入所述宿主细胞的方法。例如,细菌细胞可直接使用例如化学转化(如氯化钙法)或者电穿孔容易地进行转化。酵母细胞可以例如使用醋酸锂转化法或电穿孔进行转化。其它真核细胞可例如使用市售基于脂质体的转染试剂盒例如LipofectamineTM(Invitrogen)、市售的基于脂类的转染试剂盒例如Fugene(RocheDiagnostics)、基于聚乙二醇的转染、磷酸钙沉淀、基因枪(生物射弹)、电穿孔或者病毒感染进行转染。在本发明的一个优选实施方案中,所述重组宿主细胞表达目的多核苷酸片段。在一个更优选的实施方案中,所述表达产生本发明的可溶性多肽片段。这些多肽片段可利用本领域技术人员公知的蛋白质纯化方法进行纯化,任选地利用上述表位、肽或蛋白质标签。
在另一个方面中,本发明涉及鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的全部或一部分相结合的化合物的方法,其包括下列步骤:(a)构建由图18所示复合物的结构坐标定义的所述结合口袋的计算机模型;(b)通过选自下列的方法选自可能的结合化合物:
(i)将分子片段组装成所述化合物,
(ii)从小分子数据库中选择化合物,和
(iii)从头设计所述化合物的配体;
(c)利用计算工具进行所述化合物与所述结合口袋的计算机模型之间的拟合程序运算,以提供所述化合物在所述结合口袋中的能量最小化构型;以及
(d)评价所述拟合运算的结果,以对所述化合物和所述结合口袋模型之间的结合进行定量,由此对所述化合物与所述结合口袋相结合的能力进行评价。
本发明首次允许使用分子设计技术,基于图18所述结合口袋的结构坐标来鉴定、选择或设计PB2的RNA帽结合口袋或者PB2多肽变体的RNA帽结合口袋的潜在结合配偶体,优选RNA帽结合的抑制剂。鉴于制备和测试多种可能结合所述结合口袋的化合物的更高成本,这样的预测模型非常有价值。为了使用针对与RNA帽类似物形成复合物的PB2多肽片段的结构坐标,必须将该结构坐标转变为三维形状。这通过使用市售软件完成,所述软件能够从一组结构坐标产生分子或其部分的三维图示。这样的计算机程序的实例有MODELER(A.Sali和T.L.Blundell,J.Mol.Biol.,234,779-815页(1993),在Insight II Homology软件包(Insight II(97.0),Molecular Simulations Incorporated,San Diego,CA)中)。
本领域技术人员可使用多种方法来筛选化学实体或片段结合PB2或PB2多肽变体RNA帽结合口袋的能力。此过程可从对例如基于根据图18的结构坐标的PB2RNA帽结合口袋的三维计算机模型进行肉眼观察开始。然后,可将选定的片段或化合物以多种方向置于或者对接入结合口袋内。可使用软件例如Cerius、Quanta和Sybyl(Tripos Associates,St.Louis,MO)完成对接,然后是具有标准分子动力学力场的能量最小化和分子动力学,例如OPLS-AA、CHARMM和AMBER。其它可在选择合适化合物或片段的过程中协助本领域技术人员的专门计算机程序包括,例如(i)AUTODOCK(D.S.Goodsell等,″Automated Docking of Substrates toProteins by Simulated Annealing″,Proteins:Struct.,Funct.,Genet.,8,195-202页(1990);AUTODOCK可获得自Scripps Research Institute,LaJolla,CA)以及(ii)DOCK(I.D.Kuntz等,″A Geometric Approach toMacromolecule-Ligand Interactions″,J.Mol.Biol.,161,269-288页(1982);DOCK可获得自University of California,San Francisco,CA)。
一旦选择了合适的化合物或片段,则可将其设计或组装成单个化合物或复合物。这一手动模型构建利用软件例如Quanta或Sybyl进行。在单个化合物或片段的连接中协助本领域技术人员的可用程序包括,例如(i)CAVEAT(P.A.Bartlett等,″CAVEAT:A Program to Facilitate theStructure-Derived Design of Biologically Active Molecules″,in MolecularRecognition in Chemical and Biological Problems″,Special Publication,Royal Chem.Soc,78,182-196页(1989);G.Lauri和P.A.Bartlett,″CAVEAT:A Program to Facilitate the Design of Organic Molecules″,J.Comp.Aid.Mol.Des.,8,51-66页(1994);CAVEAT可获得自University ofCalifornia,Berkley,CA),(ii)3D Database系统例如ISIS(MDLInformation Systems,San Leandro,CA;综述于Y.C.Martin,″3DDatabase Searching in Drug Design″,J.Med.Chem.,35,2145-2154页(1992)),和(iii)HOOK(M.B.Eisen等,″HOOK:A Program for FindingNovel Molecular Architectures that Satisfy the Chemical and StericRequirements of a Macromolecule Binding Site″,Proteins:Struct.,Funct.,Genet.,19,199-221页(1994);HOOK可获得自Molecular SimulationsIncorporated,San Diego,CA)。
实现本发明的另一种方法是在小分子数据库中用计算机筛选可与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的整体或一部分相结合的化合物。在此筛选中,这些化合物与所述结合口袋的合适程度可由形状互补性或者由估计的相互作用能来判断(E.C.Meng等,J.Comp.Chem.,13,505-524页(1992))。
或者,PB2的RNA帽结合口袋的可能结合配偶体(优选RNA帽结合抑制剂)可基于与根据图18的RNA帽类似物复合的PB2多肽片段的3D结构从头设计。有本领域技术人员可得到的多种从头设计配体的方法。这些方法包括(i)LUDI(H.-J.Bohm,″The Computer Program LUDI:ANew Method for the De Novo Design of Enzyme Inhibitors″,J.Comp.Aid.Mol.Des.,6,61-78页(1992);LUDI可得自Molecular SimulationsIncorporated,San Diego,CA),(ii)LEGEND(Y.Nishibata和A.Itai,Tetrahedron,47,8985-8990页(1991);LEGEND可得自MolecularSimulations Incorporated,San Diego,CA),(iii)LeapFrog(可得自TriposAssociates,St.Louis,MO),(iv)SPROUT(V.Gillet等,″SPROUT:AProgram for Structure Generation″,J.Comp.Aid.Mol.Des.,7,127-153页(1993);SPROUT可得自University of Leeds,UK),(v)GROUPBUILD(S.H.Rotstein和M.A.Murcko″GroupBuild:A Fragment-BasedMethod for De Novo Drug Design″,J.Med.Chem.,36,1700-1710页(1993)),以及(vi)GROW(J.B.Moon和W.J.Howe,″ComputerDesign of Bioactive Molecules:A Method for Receptor-Based De NovoLigand Design″,Proteins,11,314-328页(1991))。
另外,可支持本领域技术人员从头设计潜在的RNA帽结合口袋相互作用化合物以及建模的若干分子建模方法已有描述,包括如N.C.Cohen等,″Molecular Modeling Software and Methods for Medicinal Chemistry″,J.Med.Chem.,33,883-894页(1990);M.A.Navia和M.A.Murcko,″TheUse of Structural Information in Drug Design″,Curr.Opin.Struct.Biol.,2,pp.202-210(1992);L.M.Balbes等,″A Perspective in Modern Methods inComputer-Aided Drug Design″,Reviews in Computational Chemistry,Vol.5,K.B.Lipkowitz和D.B.Boyd编辑,VCH,New York,37-380页(1994);W.C.Guida,″Software for Structure-Based Drug Design″,Curr.Opin.Struct.Biol.,4,777-781页(1994)。
被设计或选择用作与PB2的RNA帽结合口袋或者PB2变体的结合口袋相结合的分子可以进一步通过计算进行优化,从而使其在结合状态下优选与目标区域不存在排斥性静电相互作用。这些非互补性(例如静电)相互作用包括排斥性电荷-电荷、偶极-偶极以及电荷-偶极相互作用。具体地,在结合状态下所述结合化合物与所述结合口袋之间所有静电相互作用的总和优选地对结合焓有中性的或有利的贡献。本领域有可评价化合物形变能和静电相互作用的具体计算机程序可用。合适的程序实例包括(i)Gaussian 92修订版C(M.J.Frisch,Gaussian,Incorporated,Pittsburgh,PA),(ii)AMBER,4.0版(P.A.Kollman,University of California,SanFrancisco,CA),(iii)QUANTA/CHARMM(Molecular SimulationsIncorporated,San Diego,CA),(iv)OPLS-AA(W.L.Jorgensen,″OPLSForce Fields″,Encyclopedia of Computational Chemistry,Schleyer编辑,Wiley,New York(1998)Vol.3,1986-1989页),以及(v)Insight II/Discover(Biosysm Technologies Incorporated,San Diego,CA)。这些程序可使用例如Silicon Graphics工作站、IRIS 4D/35或IBM RISC/6000工作站550型来执行。其它硬件系统和软件包是本领域技术人员已知的。
一旦如上所述选择或设计了目的分子,就可对其进行一些原子或侧链基团进行取代以改进或改变其结合特性。一般来说,最初的取代是保守的,即,取代基团与原始基团具有大致相同的大小、形状、疏水性和电荷。当然,应理解的是,应避免本领域中已知改变构象的组分。然后可通过如上详细所述相同的计算方法分析这些取代化合物与PB2的RNA帽结合口袋或者PB2变体的结合口袋匹配的效率。
在本发明上述方法的一个实施方案中,PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋包含根据SEQ ID NO:1的PB2的Phe323、His357和Phe404氨基酸或者其对应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、Phe404、Phe325、Phe330和Phe363或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330和Phe363或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361和Lys376或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Ser320、Arg332、Ser337和Gln406或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361和Lys376或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、Arg332、Ser337和Gln406或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337和Gln406或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361、Lys376、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337和Gln406或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Met431或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363和Met431或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376和Met431或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ IDNO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406和Met431或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429、His432和Met431或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Glu361和Lys376或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe363、Glu361和Lys376或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361和Lys376或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361和Ser337或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337和Met431或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337、Met431、Lys339、Arg355、Asn429和His432或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Phe325或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Glu361或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Lys376或者其相应氨基酸。在另一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361和Lys376或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQID NO:1的氨基酸Phe323、His357、Phe404、Phe325和Glu361或者其相应氨基酸。在又一个实施方案中,所述结合口袋包含根据SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325和Lys376或者其相应氨基酸。此外,在其它一些实施方案中,上述定义的结合口袋可任选地包含对应于根据SEQ ID NO:1的氨基酸Met431的氨基酸或者其相应氨基酸。
在本发明上述方法的另一个方面中,PB2的RNA帽结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357和Phe404的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、Phe404、Phe325、Phe330和Phe363的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330和Phe363的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361和Lys376的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Ser320、Arg332、Ser337和Gln406的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Lys339、Arg355、Asn429和His432的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ IDNO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363Glu361和Lys376的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363Ser320、Arg332、Ser337和Gln406的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337和Gln406的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361、Lys376、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ IDNO:1的氨基酸Phe323、His357、Phe404、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337和Gln406的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQID NO:1的氨基酸Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Met431的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363和Met431的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ IDNO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363Glu361、Lys376和Met431的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406和Met431的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429、His432和Met431的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Glu361和Lys376的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe363、Glu361和Lys376的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361和Lys376的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361和Ser337的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337和Met431的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337、Met431、Lys339、Arg355、Asn429和His432的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Phe325的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Glu361的结构坐标来定义。在又一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404和Lys376的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2 SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Glu361和Lys376的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325和Glu361的结构坐标来定义。在另一个实施方案中,所述结合口袋由根据图18的PB2SEQ ID NO:1的氨基酸Phe323、His357、Phe404、Phe325和Lys376的结构坐标来定义。此外,在其它一些实施方案中,如上定义的结合口袋可任选地另外由根据图18的PB2SEQ ID NO:氨基酸Met431定义。
在一个方面中,本发明提供了根据上述方法用计算机筛选能够与根据图18的PB2的RNA帽结合口袋变体的结合口袋相结合的化合物的方法。在一个实施方案中,根据图18,所述结合口袋的所述变体与下列氨基酸主链的均方根差不超过3埃:氨基酸Phe323、His357和Phe404;氨基酸Phe323、Phe404、Phe325、Phe330和Phe363;氨基酸Phe323、His357、Phe404、Phe325、Phe330和Phe363;氨基酸Phe323、His357、Phe404、Glu361和Lys376;氨基酸Phe323、His357、Phe404、Ser 320、Arg332、Ser337和Gln406;氨基酸Phe323、His357、Phe404、Lys339、Arg355、Asn429和His432;氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361和Lys376;氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、Arg332、Ser337和Gln406;氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Lys339、Arg355、Asn429和His432;氨基酸Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337和Gln406;氨基酸Phe323、His357、Phe404、Glu361、Lys376、Lys339、Arg355、Asn429和His432;氨基酸Phe323、His357、Phe404、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432;氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337和Gln406;氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Lys339、Arg355、Asn429和His432;氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432;氨基酸Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432;氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429和His432、氨基酸Phe323、His357、Phe404和Met431、氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363和Met431、氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376和Met431、氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406和Met431、氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429、His432和Met431、氨基酸Phe323、His357、Phe404、Phe325、Glu361和Lys376、氨基酸Phe323、His357、Phe404、Phe325、Phe363、Glu361和Lys376、氨基酸Phe323、His357、Phe404、Glu361和Lys376、氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361和Ser337、氨基酸His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337和Met431、氨基酸His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337、Met431、Lys339、Arg355、Asn429和His432、氨基酸Phe323、His357、Phe404和Phe325、氨基酸Phe323、His357、Phe404和Glu361、氨基酸Phe323、His357、Phe404和Lys376、氨基酸Phe323、His357、Phe404、Glu361和Lys376、氨基酸Phe323、His357、Phe404、Phe325和Glu361、氨基酸Phe323、His357、Phe404、Phe325和Lys376,上述氨基酸组合任选地包含氨基酸Met431。在另一个实施方案中,所述均方根差不超过2.5埃。在另一个实施方案中,所述均方根差不超过2埃。在另一个实施方案中,所述均方根差不超过1.5埃。在另一个实施方案中,所述均方根差不超过1埃。在另一个实施方案中,所述均方根差不超过0.5埃。
在一个优选实施方案中,m7GTP夹在溶剂侧的His357与蛋白侧5个苯丙氨酸的簇之间,主要是Phe323和Phe404,还有Phe325、Ph330和Phe363。在该优选实施方案中,鸟苷碱基的特异性识别主要由Glu361氢键键合到鸟苷的N2和N1位来实现,这也有助于中和m7GTP的离域正电荷。Lys376也与O6形成长氢键。在配体口袋中有两个有序的埋藏水分子,其与Glu361、Lys376和Gln406相互作用而不是直接与配体相互作用。重要的第二层残基优选为Arg332和Ser337,其与His357成氢键。在碱基N2的氢键距离内有水分子或Ser320。N7甲基与Gln406的侧链以范德华力接触(3.4埃),Phe404的羰基氧(3.4埃)略远地与Met431的侧链相接触。在该实施方案中,三磷酸向碱基弯曲。α-磷酸与His432和Asn429相互作用,γ-磷酸与碱性残基His357、Lys339和Arg355相互作用。
如果根据本文上述方法的计算机建模显示化合物与PB2的RNA结合口袋或者PB2多肽变体的结合口袋结合,则可合成所述化合物,并任选地体外或体内测试所述化合物与所述结合口袋结合的能力,其包括另外的步骤:(e)合成所述化合物,以及任选地(f)将所述化合物与PB2多肽片段或其变体或者本发明的重组宿主细胞以及RNA帽或其类似物相接触,以测定所述化合物抑制所述多肽片段与所述RNA帽或其类似物之间结合的能力。这些化合物与所述结合口袋的合适程度可由形状互补性或者预计的相互作用能来判断(E.C.Meng等,J.Comp.Chem.,13,505-524页(1992)。用于合成所述化合物的方法是本领域技术人员公知的,或者这些化合物可以是市售的。用于测定所鉴定化合物的RNA帽结合抑制作用的方法实例在下文有述。
本发明的另一个方面是提供可通过上述方法鉴定的化合物,前提是所述化合物不是选自下列的任何RNA帽类似物:m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC和m7GpppCm、m7GpppU、以及m7GpppUm或者RNA帽结合的小分子抑制剂2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮(RO0794238、Hooker等、2003)或者T-705(Furuta等、2005),并且能够结合PB2的RNA帽结合口袋。在另一个方面中,本发明涉及可通过上述方法鉴定的化合物,前提是所述化学不是选自下列的RNA帽类似物:m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、和m7GpppCm、m7GpppU、以及m7GpppUm或者RNA帽结合的小分子抑制剂2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮或者T-705,并且能够抑制PB2多肽片段与RNA帽或其类似物之间的结合。本发明的化合物可以是包括下列但不限于此的任何物质:肽、拟肽、多肽、蛋白质(包括抗体)、脂类、金属、核苷酸、核苷、核酸、有机或无机小分子、化合物、元素、糖类、同位素、碳水化合物、造影剂、脂蛋白、糖蛋白、酶、分析用探针、多胺及其组合和衍生物。术语“小分子”表示分子量在50至约2500道尔顿优选200-800道尔顿的分子。另外,根据本发明的测试化合物可任选地包含检测标记。这些标记包括但不限于酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。
在另一个方面中,本发明提供了鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合的化合物的方法,其包括以下步骤:(i)将本发明的PB2多肽片段或重组宿主细胞与测试化合物相接触以及(ii)分析所述测试化合物与PB2多肽片段或其变体结合的能力。
在一个实施方案中,可以下拉测定的形式分析PB2多肽片段或其变体与测试化合物之间的相互作用。例如,PB2多肽片段可以是纯化的或者固定在珠上。在一个实施方案中,可以将固定在珠的PB2多肽片段与例如(i)另一种纯化的蛋白质、多肽片段或肽,(ii)蛋白质、多肽片段或肽的混合物,或者(iii)细胞或组织提取物相接触,可通过聚丙烯酰胺凝胶电泳结合考马斯染色或western印迹验证蛋白质、多肽片段或肽的结合。可通过质谱分析鉴定未知的结合配偶体。
在另一个实施方案中,可以基于酶联免疫吸附测定(ELISA)实验的形式分析PB2多肽片段或其变体与测试化合物之间的相互作用。在一个实施方案中,根据本发明的PB2多肽片段或其变体可以固定于ELISA板的表面上并与测试化合物相接触。可例如针对带有蛋白质、多肽、肽和表位标签的化合物,通过测试化合物或表位标签的特异性抗体来验证测试化合物的结合。这些抗体可以直接偶联到酶或者用与所述酶偶联的二抗检测,所述酶与合适的底物相组合发生化学发光反应(例如辣根过氧化物酶)或显色反应(例如碱性磷酸酶)。在另一个实施方案中,不能被抗体检测到的化合物结合可通过直接与所述测试化合物偶联的标记来验证。这些标记可包括但不限于酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在另一个实施方案中,所述测试化合物可以固定于ELISA板上并与根据本发明的可溶性PB2多肽片段或其变体相接触。可通过如上所述的PB2多肽片段特异性抗体和化学发光或显色反应来验证所述多肽的结合。
在另一个实施方案中,纯化的可溶性PB2多肽片段可以与肽阵列一起孵育,并可通过例如PB2多肽特异性抗体、针对与所述PB2多肽片段融合的表位标签的抗体、或者通过由于PB2多肽片段偶联的荧光标签发射的荧光信号来分析所述PB2多肽片段与对应于特定肽序列的特异性肽斑点的结合。
在另一个实施方案中,将根据本发明的重组宿主细胞与测试化合物相接触。这可以通过将测试蛋白质或多肽的共表达并通过荧光能量共振转移(FRET)或免疫共沉淀验证相互作用来实现。在另一个实施方案中,可将直接标记的测试化合物添加到重组宿主细胞的培养基中。例如可通过所述多肽的免疫沉淀与验证所述标记的存在来验证测试化合物穿透膜并与所述PB2多肽片段结合的可能性。
在一个优选实施方案中,上述用于鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合的化合物的方法包括添加RNA帽或其类似物的额外步骤。在所述方法的另一个实施方案中,分析所述测试化合物在所述RNA帽或其类似物存在下与PB2结合的能力,或者所述测试化合物抑制所述RNA帽或其类似物与PB2结合的能力。如果所述化合物在与RNA帽或RNA帽类似物相同的摩尔浓度下使结合减少超过20%、超过30%、超过40%、超过50%、优选超过60%、优选超过70%、优选超过80%、优选超过90%,则认为化合物抑制RNA帽或RNA帽类似物结合。在一些优选实施方案中,上述下拉、ELISA、肽阵列、FRET以及免疫共沉淀实验可以在RNA帽结构或其类似物(优选带标记的RNA帽结构或其类似物)存在下并在测试化合物存在或者不存在时进行。在一个实施方案中,在添加所述测试化合物之前添加RNA帽或其类似物。在另一个实施方案中,在添加所述测试化合物的同时添加RNA帽或其类似物。在又一个实施方案中,在添加所述测试化合物之后添加RNA帽或其类似物。
在一个优选实施方案中,可通过在存在或不存在所述化合物的情况下将所述多肽片段与7-甲基-GTP Sepharose 4B树脂(GE Healthcare)一起孵育并比较(优选定量)所结合的带有和不带有所述化合物的PB2多肽片段(例如在考马斯染色的SDS PAGE凝胶上或者使用Western印迹分析)来测定可鉴定测试化合物干扰本发明PB2多肽片段与RNA帽或其类似物相互作用的能力。
在测试化合物存在或不存在的情况下评价RNA帽或其类似物与本发明PB2片段或其变体相结合的能力。在一个实施方案中,这可使用荧光标记的RNA帽类似物、荧光标记的7-甲基鸟苷单磷酸酯(m7GMP)在如Natarajan等(2004)所述的荧光极化测定中来实现。或者,在另一个实施方案中,核糖二醇修饰的荧光帽类似物氨茴酰基-m7GTP可用于如Ren等(1996)所示的荧光分光光度测定中。在另一个实施方案中,放射性标记的RNA帽可以在存在或不存在测试化合物的情况下与PB2多肽片段或其变体一起孵育,其中RNA帽可在添加所述测试化合物之前、同时或之后添加。通过如Hooker等(2003)所述的凝胶电泳对帽结合反应进行UV-交联、变性和分析。在另一个实施方案中,本发明的PB2多肽片段可固定于微滴定板上,在存在或不存在测试化合物的情况下与带标记的RNA帽或其类似物一起孵育,其中可在添加所述测试化合物之前、同时或之后添加RNA帽或其类似物,通过在彻底清洗所述板之后验证标记的存在来分析帽结合。将含有测试化合物的孔中RNA帽或RNA帽类似物标记的信号强度与不含测试化合物的所述标记的信号强度进行比较,如上所述,如果结合减少超过50%、优选超过60%、优选超过70%、优选超过80%、优选超过90%,则认为化合物抑制RNA帽或RNA帽类似物结合。
在一个优选实施方案中,用于鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合(优选抑制RNA帽或其类似物结合)的化合物的上述方法以高通量方式进行。在一个优选实施方案中,所述方法如上所述使用根据本发明已固定PB2多肽片段或其变体以及带标记的RNA帽或其类似物在多孔微滴定板中进行。在一个优选实施方案中,所述测试化合物来自合成或天然化合物文库。例如,合成化合物文库可购自Maybridge Chemical Co.(Trevillet,Cornwall,UK),ChemBridgeCorporation(San Diego,CA),或Aldrich(Milwaukee,WI)。天然化合物文库例如可获得自TimTec LLC(Newark,DE)。或者,可使用细菌、真菌、植物和动物提取物形式的天然化合物文库。另外,可使用组合化学法以合成方式产生单种化合物或者混合物形式的测试化合物。RNA帽或其类似物可在添加文库化合物之前、同时或者之后添加。可如上所述评估所述化合物抑制RNA帽结合的能力。
在另一个实施方案中,可在体内形式中检测所鉴定化合物对流感病毒生命周期的抑制作用。可以在存在或不存在已鉴定化合物的情况下用流感病毒感染对流感病毒感染敏感的细胞系例如293T人胚肾细胞、Madin-Darby狗肾细胞或者鸡胚胎成纤维细胞。在一个优选实施方案中,可将多种浓度的已鉴定化合物添加到所述细胞培养基中。病毒蚀斑的形成可用作流感病毒感染能力的读出值,可将用已鉴定化合物处理的细胞与未处理的细胞进行比较。
在本发明的另一个实施方案中,在任意上述方法中应用的测试化合物是小分子。在一个优选实施方案中,所述小分子来源于文库,例如小分子抑制剂文库。在另一个实施方案中,所述测试化合物是肽或蛋白质。在一个优选实施方案中,所述肽或蛋白质来源于肽或蛋白质文库。
在用于对与本发明PB2多肽片段或变体的RNA帽结合口袋相结合的化合物和/或抑制RNA帽结合所述结合口袋的化合物进行计算机以及体外鉴定的上述方法的另一个实施方案中,所述方法还包括将可鉴定的化合物或其可药用盐与一种或多种可药用赋形剂和/或载体配制在一起的步骤。在另一个方面中,本发明提供了可根据上述方法产生的药物组合物。根据本发明的化合物可单独施用,但是在人疗法中,一般会与根据预定施用途径和标准药物实践所选择的合适药物赋形剂、稀释剂或载体混合施用(参见下文)。
在PB2的RNA帽结合口袋或者PB2变体的结合口袋的结合配偶体进行计算机建模或者筛选的方面中,可以将对作为药物施用的分子有利的化学部分引入目的分子。例如,可以将可能并非直接影响所述分子与靶区域结合而是例如对所述分子在可药用载体中的总体溶解度、所述分子的生物利用度和/或所述分子的毒性有贡献的化学部分引入目的分子或者从中除去。优化目的分子的药理学情况的注意事项和方法可见于,例如″Goodman and Gilman′s The Pharmacological Basis of Therapeutics″,第八版,L.S.Goodman,A.Gilman,T.W.Rail,A.S.Nies,& P.Taylor编辑,Pergamon Press(1985);W.L.Jorgensen & E.M.Duffy,Bioorg.Med.Chem.Lett,10,1155-1158页(2000)。另外,计算机程序″Qik Prop″可用于提供对身体重要性描述和有机目的分子药物相关性质的快速预测。“五项标准(Rule of Five)”概率图表可用于预测新合成化合物的口服吸收(C.A.Lipinski等,Adv.Drug Deliv.Rev.,23,3-25页(1997))。适于药效团选择和设计的程序包括(i)DISCO(Abbot Laboratories,Abbot Park,IL),(ii)Catalyst(Bio-CAD Corp.,Mountain View,CA),和(iii)Chem DBS-3D(Chemical Design Ltd.,Oxford,UK)。
本发明涉及的药物组合物可以本领域技术人员公知的多种方式进行配制。例如,本发明的药物组合物可以是固体形式例如片剂、丸剂、胶囊剂(包括软胶囊剂)、扁囊剂、锭剂、卵形剂、粉剂、颗粒剂或者栓剂,或者液体形式例如酊剂、溶液剂、乳剂或者混悬剂。
固体施用形式可含有赋形剂例如微晶纤维素、乳糖、柠檬酸钠、碳酸钙、磷酸氢钙、甘氨酸和淀粉(优选玉米、马铃薯或木薯淀粉),崩解剂例如羟乙酸淀粉钠、交联羧甲基纤维素钠和某些复合硅酸盐,以及颗粒粘合剂例如聚乙烯吡咯烷酮、羟丙基甲基纤维素(HPMC)、羟丙基纤维素(HPC)、蔗糖、明胶和阿拉伯胶。另外,可包含润滑剂例如硬脂酸镁、硬脂酸、山嵛酸甘油酯以及滑石。相似类型的固体组合物还可用作明胶胶囊的填充剂。在这一点上优选的赋形剂包括乳糖、淀粉、纤维素、乳糖或者高分子量聚乙二醇。
对于适于经口施用的水混悬剂、溶液、酊剂和乳剂,可以将所述化合物与多种甜味剂或调味剂、着色物质或染料、乳化剂和/或混悬剂以及与稀释剂例如水、乙醇、丙二醇和甘油以及其组合相组合。
本发明的药物组合物可含有释放速率修饰剂,包括例如羟丙基甲基纤维素、甲基纤维素、羧甲基纤维素钠、乙基纤维素、醋酸纤维素酯、聚氧化乙烯、黄原胶、卡波姆、铵甲丙烯酸共聚物、氢化蓖麻油、加拿巴蜡、石蜡、醋酸邻苯二甲酸纤维素、邻苯二甲酸羟丙基甲基纤维素、甲基丙烯酸共聚物及其混合物。
本发明的药物组合物可以是快速分散或溶解的剂量形式(fastdispersing or dissolving dosage formulation,FDDF)的形式,并且可含有下列成分:阿司帕坦、乙酰磺胺酸钾、柠檬酸、交联羧甲纤维素钠、交聚维酮、diascorbic acid、丙烯酸乙酯、乙基纤维素、明胶、羟丙基甲基纤维素、硬脂酸镁、甘露醇、甲基丙烯酸甲酯、薄荷调味剂、聚乙二醇、煅制二氧化硅、二氧化硅、淀粉羟基乙酸钠、硬脂酰基反丁烯二酸钠、山梨醇、木糖醇。
对于制备栓剂而言,可首先熔化低熔点蜡例如脂肪酸甘油酯的混合物或可可脂,然后通过如搅拌将活性组分均匀地分散于其中。接着,将熔化的均匀混合物倾倒入便利大小的模,使之冷却,由此固化。
适于胃肠外施用的本发明药物组合物最佳地以无菌水溶液的形式使用,其可含有其它物质,例如足够的盐或葡萄糖以使得溶液与血液等渗。如果需要,水溶液应该合适地缓冲(优选pH 3至9)。
适于鼻内施用和吸入施用的药物组合物最佳地以下列形式递送:干粉吸入器或来自使用合适推进剂的加压容器、泵、喷雾器或喷洒器的气溶胶喷雾形式,所述推进剂例如二氯二氟甲烷、三氯氟甲烷、克立氟烷、氢氟烷例如1,1,1,2-四氟乙烷(HFA 134A.TM)或者1,1,1,2,3,3,3-六氟丙烷(HFA 227EA.TM),二氧化碳或者其它合适气体。所述加压容器、泵、喷雾器或喷洒器可含有所述活性化合物的溶液或悬液,例如使用乙醇和推进剂的混合物作为溶剂,其可另外包含润滑剂,例如三油酸山梨坦。
在另一个实施方案中,本发明提供了可由上述方法鉴定的化合物,其包括将本发明的PB2多肽片段或者PB2多肽片段变体或者本发明的重组宿主细胞与测试化合物接触的步骤,所述测试化合物不同于选自下列的RNA帽类似物:m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU和m7GpppUm以及帽结合的小分子抑制剂2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮(RO0794238、Hooker等、2003)和T-705(Furuta等、2005),并且能够结合PB2。在一个优选方面中,本发明涉及可通过上述方法鉴定的化合物,其包括将本发明的PB2多肽片段或者其变体或者本发明的重组宿主细胞与测试化合物接触的步骤,所述测试化合物不同于选自下列的RNA帽类似物:m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU和m7GpppUm以及帽结合的小分子抑制剂2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮和T-705,并且能够抑制PB2和RNA帽或其类似物的结合。
在另一个方面中,本发明提供了针对PB2的RNA帽结合结构域的抗体。在一个优选实施方案中,所述抗体识别如上所述多肽片段或片段变体的RNA帽结合结构域,特别的选自SEQ ID NO:14至22定义的多肽。特别的,所述抗体特异性结合包含一个或多个上述定义结合口袋之氨基酸的表位。在这一点上,术语“表位”具有本领域公认的意义,优选表示4至20个氨基酸、优选5至18、6至16或7至14个氨基酸的片段。因此,优选表位具有4至20、5至18优选6至16或7至14个氨基酸的长度,并包含SEQ ID NO:1的Ser320、Phe323、Phe325、Phe330、Arg332、Ser337、Lys339、Arg355、His357、Glu361、Phe363、Lys376、Phe404、Gln406、Met431和/或His432中的一个或多个或者相应的氨基酸。本发明的抗体可以是单克隆或多克隆抗体或其部分。可通过重组DNA技术或者酶或化学切割完整抗体的方法产生抗原结合部分。在一些实施方案中,抗原结合部分包括Fab、Fab′、F(ab′)2、Fd、Fv、dAb以及互补性决定区(CDR)片段、单链抗体(scFv)、嵌合抗体例如人源化抗体、双抗体以及至少含有抗体中足以赋予多肽特异性抗原结合的部分的多肽。本发明的抗体根据标准方案产生。例如,可根据本领域技术人员公知的标准方法通过使用目的抗原任选地与佐剂例如弗氏完全或不完全佐剂、RIBI(胞壁酰二肽)或ISCOM(免疫刺激复合物)相组合来免疫动物,例如小鼠、大鼠、兔、山羊、绵羊、猪、牛或马,从而产生多克隆抗体。针对PB2或其片段的RNA帽结合结构域的多克隆抗血清通过对所免疫的动物放血或处死而获得自该动物。所述血清(i)可以以从动物处获得的形式原样使用,(ii)可从所述血清获得免疫球蛋白级分,或者(iii)可从所述血清纯化PB2或其片段的RNA帽结合结构域的特异性抗体。单克隆抗体可通过本领域技术人员公知的方法产生。简言之,在免疫后处死动物,通过本领域已知的任何方式使淋巴结和/或脾B细胞永生化。使细胞永生化的方法包括但不限于:用癌基因对其进行转染、用致癌病毒对其进行感染以及在选择永生化细胞的条件下对其进行培养,使其经受致癌或致突变化合物,将其与永生化细胞(例如骨髓瘤细胞)融合,以及使肿瘤抑制基因失活。使用PB2或其片段的RNA帽结合结构域筛选永生化细胞。选择产生抗PB2或其片段的RNA帽结合结构域的抗体的细胞,例如杂交瘤,克隆,并对其理想的特征进行进一步筛选,包括生长健壮、高抗体产生以及理想的抗体特征。在(i)同基因动物体内,(ii)缺少免疫系统的动物,例如裸鼠,或者(iii)体外细胞培养物中扩增杂交瘤。选择、克隆和扩增杂交瘤的方法是本领域技术人员公知的。本领域技术人员可参考标准教科书例如″Antibodies:ALaboratory Manual″,E.Harlow和D.Lane编辑,Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York(1990),其通过引用并入本文,以作为针对抗体产生的支持。
在另一个方面中,本发明涉及可通过上述方法鉴定的能够结合PB2多肽的RNA帽结合口袋或者PB2多肽变体的结合口袋和/或能够抑制RNA帽或其类似物与所述结合口袋结合的化合物、如上所述药物组合物或者本发明的抗体在制备用于治疗、缓解或预防单链负链RNA病毒感染所造成疾病的药剂上的用途。在一个优选实施方案中,所述疾病由不分段单链负链RNA病毒的病毒感染造成,即单链负链病毒目,包括博尔纳病毒科、丝状病毒科、副粘病毒科和弹状病毒科。在一个更优选的实施方案中,所述疾病由分段单链负链RNA病毒引起,包括正粘病毒科,包括甲型流感病毒属、乙型流感病毒属、丙型流感病毒属、索戈托病毒属和感染性鲑鱼贫血病毒属(Isavirus),沙粒病毒科和布尼亚病毒科,包括汉坦病毒属、内罗病毒属、正布尼亚病毒属、白蛉病毒属和番茄斑萎病毒属(Tospovirus)。在一个更优选的实施方案中,所述疾病由选自下列的病毒物种感染造成:博纳病毒、马尔堡病毒、埃博拉病毒、仙台病毒、腮腺炎病毒、麻疹病毒、人呼吸道合胞体病毒、火鸡鼻气管炎病毒、印第安纳型水疱性口炎病毒、尼帕病毒、亨德拉病毒(henda virus)、狂犬病毒、牛流行热病毒、传染性造血组织坏死病毒、索戈托病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、汉坦病毒、克里米亚-刚果出血热病毒、裂谷热病毒、La Crosse病毒,优选甲型流感病毒、乙型流感病毒、丙型流感病毒、索戈托病毒或汉坦病毒,更优选甲型流感病毒、乙型流感病毒、丙型流感病毒,最优选甲型流感病毒。
为治疗、减轻或预防所述疾病状态,本发明的药剂可经口、口腔、舌下、鼻内、通过肺途径例如通过吸入、通过直肠途径或者胃肠外,例如海绵体内、静脉内、动脉内、腹膜内、鞘内、心室内、尿道内、胸内、颅内、肌内或皮下施用给动物患者,优选哺乳动物患者,优选人患者,它们可通过输注或者无针注射技术进行施用。
本发明涉及的药物组合物可以本领域技术人员公知的多种方式进行配制。例如,本发明的药物组合物可以是固体形式例如片剂、丸剂、胶囊剂(包括软胶囊剂)、扁囊剂、锭剂、卵形剂、粉剂、颗粒剂或者栓剂,或者液体形式例如酊剂、溶液剂、乳剂或者混悬剂。
固体施用形式可含有赋形剂例如微晶纤维素、乳糖、柠檬酸钠、碳酸钙、磷酸氢钙、甘氨酸和淀粉(优选玉米、马铃薯或木薯淀粉),崩解剂例如羟乙酸淀粉钠、交联羧甲基纤维素钠和某些复合硅酸盐,以及颗粒粘合剂例如聚乙烯吡咯烷酮、羟丙基甲基纤维素(HPMC)、羟丙基纤维素(HPC)、蔗糖、明胶和阿拉伯胶。另外,可包含润滑剂例如硬脂酸镁、硬脂酸、山嵛酸甘油酯以及滑石。相似类型的固体组合物还可用作明胶胶囊的填充剂。在这一点上优选的赋形剂包括乳糖、淀粉、纤维素、乳糖或者高分子量聚乙二醇。
对于适于经口施用的水混悬剂、溶液、酊剂和乳剂,可以将所述化合物与多种甜味剂或调味剂、着色物质或染料、乳化剂和/或混悬剂以及与稀释剂例如水、乙醇、丙二醇和甘油以及其组合相组合。
本发明的药物组合物可含有释放速率修饰剂,包括例如羟丙基甲基纤维素、甲基纤维素、羧甲基纤维素钠、乙基纤维素、醋酸纤维素酯、聚氧化乙烯、黄原胶、卡波姆、铵甲丙烯酸共聚物、氢化蓖麻油、加拿巴蜡、石蜡、醋酸邻苯二甲酸纤维素、邻苯二甲酸羟丙基甲基纤维素、甲基丙烯酸共聚物及其混合物。
本发明的药物组合物可以是快速分散或溶解的剂量形式(fastdispersing or dissolving dosage formulation,FDDF)的形式,并且可含有下列成分:阿斯巴甜、乙酰磺胺酸钾、柠檬酸、交联羧甲纤维素钠、交聚维酮、二抗坏血酸(diascorbic acid)、丙烯酸乙酯、乙基纤维素、明胶、羟丙基甲基纤维素、硬脂酸镁、甘露醇、甲基丙烯酸甲酯、薄荷调味剂、聚乙二醇、煅制二氧化硅、二氧化硅、淀粉羟基乙酸钠、硬脂酰基反丁烯二酸钠、山梨醇、木糖醇。
对于制备栓剂而言,可首先熔化低熔点蜡例如脂肪酸甘油酯的混合物或可可脂,然后通过如搅拌将活性组分均匀地分散于其中。接着,将熔化的均匀混合物倾倒入便利大小的模,使之冷却,由此固化。
适于胃肠外施用的本发明药物组合物最佳地以无菌水溶液的形式使用,其可含有其它物质,例如足够的盐或葡萄糖以使得溶液与血液等渗。如果需要,水溶液应该合适地缓冲(优选pH 3至9)。
适于鼻内施用和吸入施用的药物组合物最佳地以下列形式递送:干粉吸入器或来自使用合适抛射剂的加压容器、泵、喷雾器或喷洒器的气溶胶喷雾形式,所述抛射剂例如二氯二氟甲烷、三氯氟甲烷、克立氟烷、氢氟烷例如1,1,1,2-四氟乙烷(HFA 134A.TM)或者1,1,1,2,3,3,3-六氟丙烷(HFA 227EA.TM),二氧化碳或者其它合适气体。所述加压容器、泵、喷雾器或喷洒器可含有所述活性化合物的溶液或悬液,例如使用乙醇和推进剂的混合物作为溶剂,其可另外包含润滑剂,例如三油酸山梨坦。
所述药物制剂优选地是单位剂型。在这样的形式中,所述制剂被分成含有合适量活性组分的单位剂量。所述单位剂型可以是包装的制剂,所述包装含有离散的制剂量,例如包装的片剂、胶囊剂以及瓶或安瓿中的粉剂。另外,所述单位剂型可以是胶囊、片剂、扁囊剂或锭剂本身,或者可以是合适数量的任何这些包装形式。
根据具体应用和所述活性成分的效力,在本发明用途中在单位剂量制剂中施用的活性成分的量可以从约1mg至约1000mg/m2变化或者调节,优选5mg至约150mg/m2。
本发明医学用途中使用的化合物以约每天0.05mg/kg至约20mg/kg的初始剂量施用。优选约0.05mg/kg至约2mg/kg的每日剂量范围,最优选约0.05mg/kg至约1mg/kg的每日剂量。但是,所述剂量可以根据患者的需要、所治疗状况的严重程度以及所使用的化合物而有所不同。特定状况的合适剂量的确定在医师的技能范围之内。一般地,治疗从较小的剂量开始,其低于化合物的最适剂量。之后,少量的增加剂量,直至达到在该情况下的最佳效果。为了方便起见,如果需要,可将每天的总剂量分为一天中的几部分并施用。
实施例
为了进一步阐释本发明并更好地理解,设计了实施例。不以任何方式将它们视作对本发明范围的限制。
实施例1:产生PB2表达构建体
将基于甲型流感病毒/Victoria/3/1975(H3N2)PB2氨基酸序列(dela Luna等,1989)的经大肠杆菌密码子优化的PB2基因(Geneart)SEQ IDNO:25克隆到pET9a(Novagen)载体中,其经过修饰引入了5′Aatll/AscI和3′Nsil/NotI限制性位点对,以用于定向截短核酸外切酶III,并提供编码C端生物素受体肽GLNDIFEAQKIEWHE的3’序列。从3’端产生了第一非定向截短质粒文库(Tarendeau等,2007),合并并用作5’缺失反应的底物。从琼脂糖凝胶中分离编码150至250个氨基酸的插入片段的线性化质粒,再连接,然后用于转化含有RIL质粒(Stratagene)的大肠杆菌BL21A1,以使用Alexa488链霉亲和素(Invitrogen)与菌落印迹杂交进行表达筛选(Tarendeau等,2007)。根据其荧光信号对克隆进行排名,通过Ni2+亲和色谱对前36个克隆测试可纯化蛋白的表达。鉴定到13个克隆,对其测序,显示目的区域中的7个独特构建体(参见图1):
nt 703-1488(aa 235-496),
nt 721-1449(aa 241-483),
nt 802-1449(aa 268-483),
nt 829-1440(aa 277-480),
nt 841-1446(aa 281-482),
nt 868-1449(aa 290-483),
nt 883-1446(aa 295-482)
通过使用合成基因作为模板的聚合酶链式反应(PCR)产生这些PB2多核苷酸片段,并将其克隆进表达载体pETM11质粒(EMBL)的NcoI和XhoI位点之间。pETM11表达载体允许表达带His6标签的融合蛋白。可使用TEV蛋白酶将His6标签从融合蛋白上切下。
实施例2:鉴定最小帽结合片段
使用实施例1中所述的质粒构建体和实施例3中所述的一般性表达和纯化方案在大肠杆菌中表达PB2多肽片段235-496、241-483、268-483和290-483。发现纯化的PB2片段235-496仅在低浓度下可溶,而片段241-483、268-483和290-483溶解度更好并且可特异性结合m7GTPsepharose柱,指示了帽结合活性。对于这些测定,将0.2mg蛋白质上样到50μl 7-甲基-GTP Sepharose 4B树脂(GE Healthcare)上,在4℃下孵育3小时进行结合。在用含有50mM Tris.HCl(pH 8.0)、200mM NaCl、2mM DTT的缓冲液清洗之后,使用含有1mM m7GTP的相同缓冲液通过离心洗脱蛋白质,在SDS-PAGE进行分析。在这些实验的过程中,注意到较小的降解片段也可结合m7GTP,这可通过N端测序及质谱鉴定为残基318-483,此外,此片段对于蛋白水解是稳定的。将相应的多核苷酸片段(nt952-1449)如实施例1所述克隆进pETM11中。
实施例3:PB2片段的表达和纯化
使用化学转化将所述质粒转化进大肠杆菌。在LB培养基中的大肠杆菌菌株BL21-CodonPlus-RIL(Stratagene)中表达所述蛋白质。在25℃下用0.2mM异丙基-β-硫代半乳糖苷(IPTG)诱导16至20小时后,收获细胞,重悬于裂解缓冲液中(50mM Tris·HCl(pH 8.0)、300mM NaCl、5mM 2-巯基乙醇)并超声处理。离心后,将澄清的裂解液直接上样于镍亲和柱(来自GE Healthcare的螯合sepharose,载有Ni2+离子)。用50mMTris·HCl(pH 8.0)、1M NaCl、15mM咪唑、mM 2-巯基乙醇缓冲液彻底清洗Ni-sepharose树脂,然后用50mM Tris·HCl(pH 8.0)、200mM NaCl、50mM咪唑、5mM 2-巯基乙醇缓冲液清洗。然后,用50mM Tris·HCl(pH8.0)、200mM NaCl、0.5M咪唑、5mM 2-巯基乙醇缓冲液洗脱蛋白质。在10℃下将纯化的蛋白质孵育过夜进行TEV蛋白酶切割。在以50mMTris·HCl(pH 8.0)、200mM NaCl、15mM咪唑、5mM 2-巯基乙醇缓冲液透析之后,进行第二镍亲和步骤,以除去以His标签标记的TEV蛋白酶。回收未结合的蛋白质,浓缩为5-8mg/ml在Superdex 75柱(GE Healthcare)上进行凝胶过滤,以提高纯度。PB2多肽片段(318至483位氨基酸)的凝胶过滤结果在图2A中显示。可以将该片段(318至483位氨基酸)浓缩至高达24mg/ml。通过SDS PAGE和考马斯染色评价所述蛋白质的纯度(参见图2B)。典型产率为120mg纯蛋白质/升细菌培养物。
实施例4:PB2和m7GTP的共结晶
使用50mM Tris-HCl(pH 8.0)、200mM NaCl、2mM二硫苏糖醇(DTT)、5mM m7GTP(Sigma)中11-15mg/ml的PB2片段318-483的蛋白质溶液进行结晶试验。使用机器人(Cartesian)筛选576种结晶条件,其使用坐滴蒸发扩散法(sitting drop vapor diffusion method),通过将100μl蛋白质溶液与0.1μl不同沉淀溶液混合来进行。在两种不同条件下鉴定晶体。使用悬滴蒸发扩散法手动优化这些条件,其使用与1μl沉淀溶液混合的1μl蛋白质溶液。使用包含0.1M柠檬酸pH 4.6、1.6-1.8M甲酸钠的沉淀溶液获得最佳的晶体。这些晶体为空间群C2221,晶胞尺寸为a=9.2nm,b=9.4nm,c=22.0nm±0.3nm埃。一些较小的晶体得到分辨率为至少2.4埃的X射线衍射。发现较大的晶体无法使用,因为它们不是单晶。在所发现的第二结晶条件下,沉淀溶液包含:7%PEG6000、1M LiCl、0.1M柠檬酸pH 5.0、10mM TCEP HCl。该条件得到薄的片状晶体,空间群未确定,显示至少3.3埃分辨率的衍射,但是衍射品质差得多,不再继续研究这些晶体。
实施例5:制备以硒代甲硫氨酸标记的蛋白质
如所述在基本M9培养基中产生硒代甲硫氨酸化的蛋白质(VanDuyne,1993)。因为完全硒代甲硫氨酸化的蛋白质不结晶,所以使用50mg/l硒代甲硫氨酸和5mg/l甲硫氨酸(而不是60mg/l硒甲硫氨酸)产生部分标记的蛋白质。表达、裂解和纯化条件如同天然蛋白质一样(实施例3)。电喷雾质谱显示,对应于11/11个甲硫氨酸被取代,完全硒代甲硫氨酸化蛋白质具有19654道尔顿的MW,而部分标记的蛋白质具有19578的平均分子质量(9.4/11,即85%被取代),对于具有7-11个硒的蛋白质种类获得了各个峰。
实施例6:结构确定和精细化
使用单波长异常衍射(SAD)法确定结构,其使用如实施例5中所述的部分硒代甲硫氨酸化蛋白质。部分硒代甲硫氨酸化蛋白质实际上产生比野生型更大的单晶体。在ESRF的射束BM14上,在空间群C2221以及晶胞尺寸为a=92.2,b=94.4,c=220.4埃的小晶体(尺寸15x15x50微米)上收集2.4埃分辨率的原始数据(图4)。在ID29上以2.9埃的分辨率测定部分硒代甲硫氨酸标记的蛋白质晶体,以确定精细化结构,然后对于较大的晶体在ID14-EH1上以2.3埃的分辨率测定,以精制结构。通过SAD法使用AUTOSHARP解析结构(Vonrhein等,2006)。发现50/55个硒原子位。使用RESOLVE(Terwilliger,2000)利用由硒位置确定的4次非晶体学对称改进相位和图,尽管发现在非对称单元中实际有五个分子(溶剂含量55%)。它们以不常见的方式排列。命名为A-D的4个有序的分子(平均B因子约)以4次点对称排列。第五个分子介导了晶体学c-轴方向上的四聚体堆积,但是是部分无序的(平均B因子约)。在将相位转移成原始数据之后,ARP/wARP(Perrakis等,1999)能够自动构建大部分结构。观察到与每个分子结合的m7GTP的明显剩余电子密度。利用REFMAC(Murshudov,1997),对于每个分子中的大部分使用紧密NCS约束,对于作为整体的每个分子使用TLS参数,进行精制。最终R因子(R-自由度)为0.186(0.235),具有293个水分子。根据MOLPROBITY(Lovell等,2003),如该服务器输出所示,结构品质非常优秀:
REMARK 40
REMARK 40MOLPROBITY STRUCTURE VALIDATION
REMARK 40MOLPROBITY OUTPUT SCORES
REMARK 40ALL-ATOM CLASHSCORE 8 40
REMARK 40BAD ROTAMERS 34%24/708(TARGET 0-1%)
REMARK 40RAMACHANDRAN OUTLIERS 00%0/795(TARGET 02%)
REMARK 40RAMACHANDRAN FAVORED 977% 777/795(TARGET 98 0%)
PB2的帽结合结构域具有致密、高度有序的混合α-β折叠,其具有显著的反向平行β-片层,包含链β1、β2、β5、β6和β7,其堆积在包含α1、α2、α3和α4螺旋的束上,最长的螺旋α1和α3大致以反向平行排列。β2和β5之间的连接延伸为长β发夹,其包含链β3和β4以及348-环,其与分子的螺旋侧相交叉。α2和α3之间晶序差的环称为420-环,突出到溶剂中(图4和图5)。在甲型流感病毒PB2帽结合结构域中,m7G位于主要由Phe-323(来自β1,更加朝向核糖堆叠)和Phe-404(来自螺旋α1的C端,更加朝向碱基堆叠)形成的疏水平台上,但是两者都不是精确地与碱基平行。这两个芳香残基是显著的五苯丙氨酸簇的一部分,其还包括Phe-325、Phe-330和Phe-363。在配体的溶剂侧,由之前未在此功能中观察到的残基类型His-357(来自β4的C末端)完成夹心。关键酸性残基是Glu-361,其与鸟嘌呤的N1和N2位以氢键键合,Lys-376也通过与O6的相互作用参与碱基特异性识别(图6、7和10)。对于帽结合蛋白来说不寻常的是,没有与核糖羟基的直接相互作用。三磷酸向碱基弯曲。α-磷酸与His-432和Asn-429相互作用,γ-磷酸与碱性残基His-357、Lys-339和Arg-355相互作用。
实施例7:帽结合位点的突变分析
为了验证结构上观察到的蛋白质-配体相互作用对于体外帽结合是重要的,我们使用QuickChange位点定向诱变试剂盒(Stratagene)制备了与m7GTP接触的七个残基的丙氨酸突变(F323,F325,E361,F363,F404,H357,K376)。这些单点突变体预期显示帽结合活性降低,通过其在4℃下结合m7GTP-Sepharose树脂的能力对其进行评估(表4,图12)。如实施例3中针对野生型PB2所述对突变体进行纯化。在大肠杆菌中突变体F363A表达不佳,并且溶解度差,可能是由于错误折叠,不对其进行进一步的研究。突变体H357A、E361A、K376A和F404A良好地表达为可溶形式,但是在测定条件下不结合m7GTP-Sepharose,而F323A具有弱的结合活性(图12)。出人意料地,突变体F325A尽管表达不佳,但几乎与野生型一样地结合树脂。我们显示该突变体的活性是强温度依赖性的(表3)。还制备了H357W取代,与预计改善朝向碱基的堆叠一致,该突变体结构域显示m7GTP结合增强。结果显示于图12和表4。
实施例8:使用表面等离振子共振测定对帽结合亲和性进行定量分析
为了对多种突变体的结合亲和性提供更为量化的比较,我们用具有固定化的帽结合结构域和m7GTP作为分析物进行了表面等离振子共振(surface plasmon resonance,SPR)测定。SPR分析在装有CM5传感器芯片(Biacore AB Uppsala,Sweden)的Biacore T100仪器上进行。将野生型和突变体PB2帽结合结构域在10mM醋酸钠pH6.0中稀释到50μg/mL,并使用标准胺偶联化学将其固定在传感器表面。活化/去活化的传感器表面作为参比。将0.47-1mM的m7GTP、m7GpppG和GTP两倍连续稀释物以30μl/分钟的流速注射到已固定PB2蛋白和参比表面上。运行缓冲液是10mM Hepes,pH 7.4,其含有150mM NaCl和1mM DTT。为了测试温度对结合的作用,在5、15、25和37℃下进行实验。使用双参比处理所有获得的传感图,通过使用Biacore T100评价软件进行的稳态亲和评价确定平衡解离常数。由于与固定化相关的表面化学和分子取向可影响该值,所以这些被称为“表观”解离常数。误差与软件所报告的拟合相关。使用不同蛋白质固定的实验之间的变异<25%(数据未显示)。在25℃下获得的表观平衡解离常数KD结果(表1)显示与m7GTP-Sepharose结合结果一致的趋势,H357W突变体具有最高的亲和力(KD=24±3uM),然后是野生型(KD=177±34uM),E361A和K376A突变体具有最低的亲和力(KD>1500uM)。
表1:在25℃下由SPR测定的m7GTP与PB2帽-结合结构域的不同点突变体之间相互作用的表观平衡解离常数(KD)。
蛋白质 KD(μM) |
野生型 177±34H357W 24±3F323A 285±45F325A 418±99H357A 831±45F404A 1277±120E361A >1500K376A >1500 |
综上,上述数据证实了在体外PB2结构域的这些与m7GTP接触的残基的功能重要性。其它的针对二核苷酸帽类似物、m7GpppG和GTP与野生型帽结合结构域结合的结果显示于表2。
表2:在25℃下由SPR测定的PB2的野生型帽结合结构域与不同的帽类似物之间相互作用的表观平衡解离常数(KD),与由帽类似物对加帽RNA交联抑制所测定的IC50值的比较(Hooker等2003)
分析物 | KD(μM) | IC50(μM) |
m7GpppG | 171±19 | 127 |
m7GTP | 177±34 | 113 |
GTP | 1019±100 | 550 |
为了研究帽结合结构域与m7GTP之间结合的温度依赖性,我们在最高37℃的多个温度下对野生型和所选的突变体结构域进行了KD的SPR测定(表3)。所有蛋白质的帽结合亲和力随着温度的增加显著降低。但是,在5℃和37℃之间野生型的表观KD提高为2.7倍,而F325A突变体则提高为超过20倍。此外,与野生型结构域不同,在37℃下孵育之后F325A突变体的结合活性不可逆地丧失(数据未显示),推测是由于热变性。因此,这种温度敏感性提供了所观察到的F325A突变体在4℃下接近正常的帽结合活性(结构域和三聚体中均如此)以及在37℃下F325A突变体聚合酶的功能性损失的一致原理(参见实施例10)。
表3:m7GTP与帽结合结构域的不同点突变体之间相互作用的平衡解离常数(KD)的温度依赖性。
实施例9:野生型和突变体聚合酶复合物的帽结合活性
为了研究帽结合位点对于流感RNP生物活性的相关性,我们向甲型流感病毒/Victoria/3/75全长PB2中引入相同突变,并检测其所得三聚化聚合酶或重组RNP的活性。在聚合酶复合物背景中表达时,突变无一改变PB2的积累,也没有改变PB2形成三聚化聚合酶复合物的能力(表4)。
对于三聚化聚合酶的帽结合,用以下质粒共转染HEK293T细胞:编码PB1亚基的pCMVPB1、编码PB2野生型亚基或其突变体的pCMVPB2His和编码流感病毒RNA聚合酶的PA亚基的pCMVPA,转染后24小时制备细胞提取物。在pH7.5的含有50mM Tris-HCl、100mMNaCl、5mM EDTA、1mM DTT、0.2%NP40、蛋白质抑制剂(Roche,Complete cocktail)的缓冲液中制备提取物,与m7GTP-Sepharose(GEHealthcare)一起在4℃下孵育3小时。在用100倍体积的相同缓冲液清洗之后,用含有1mM m7GTP的相同缓冲液洗脱保留的蛋白质,通过使用PA特异性抗体的Western印迹进行分析(图13)。在这些条件下,野生型聚合酶未保留在对照Sepharose树脂上。突变体H357W表现为同野生型一样,而所有其它突变体没有结合,只有F325A仍然结合,与从分离的结构域获得的结果相同。
实施例10:野生型和突变体重组微RNP的复制和转录活性
通过测定在体内重组系统中RNP的积累来检测野生型或突变体聚合酶的复制活性(Ortega等,2000;Martin-Benito等,2001)。对于RNP重建,使用磷酸钙沉淀方案用质粒pCMVPB1、pCMVPB2His、pCMVPA、pCMVNP和pHHclone23共转染HEK293T细胞。在转染后24小时,制备提取物,通过使用Ni2+-NTA-琼脂糖树脂的色谱法如所述(Area等,2004)纯化RNP。使用PA和NP特异性的抗体进行Western印迹。提取后代RNP,纯化并使用抗PA和抗NP抗体监测其积累。大多数突变未显著改变RNP的复制活性(图14和表4)。只有突变F325A和K376A部分减少RNP的积累。
在体外使用ApG或β-珠蛋白作为引物,检测纯化的野生型或突变体RNP的转录活性,以分别显示帽非依赖性或帽依赖性转录。对于体外RNA合成,在含有50mM Tris-HCl(pH 8.0)、2mM MgCl2、100mM KCl、1mM二硫苏糖醇、各0.5mM的ATP、CTP和UTP、10μM α-32P-GTP(0.5uCi/nmol)、10μg/ml放线菌素D、1U/ml的人胎盘RNA酶抑制剂以及100μM ApG或10μg/ml的β-珠蛋白mRNA的20μl反应混合物中将如Western印迹所确定的等量的纯化RNP在30℃下孵育60分钟。TCA沉淀合成的RNA,通过在点印迹装置中过滤进行回收。使用磷光成像仪对掺入进行定量。在用ApG引发时,大部分突变体RNP具有完全活性(图15和表4):突变H357A和F404A导致比野生型更有效的RNP转录,仅有突变体F325A显示强缺陷。
相反,对于大部分突变体,β-珠蛋白mRNA依赖性转录受到严重影响,只有突变H357W和H357A分别具有完全及部分的活性(图16和表4)。β-珠蛋白对ApG引发的转录活性的比例(图17和表4)显示除了H357W之外的所有突变体使用β-珠蛋白mRNA作为转录引物的能力受到严重影响。
除了一个之外,设计用于减少帽结合活性的所有突变都消除了与m7GTP-Sepharose的相互作用,作为蛋白质结构域和突变体聚合酶复合物都是这样(表4,图12和13)。例外的F325A在结构域情况下表达很差,在37℃下聚合酶或RNP水平上的大部分功能性测定中受到严重地影响(表4)。但是,其在4℃下保留了合理的帽结合亲和力(图12和13),表明可能为温度敏感性表型。
表4:PB2帽结合位点突变体的生物化学和生物学活性汇总
nd:未测定
实施例11:帽依赖性转录需要完整的424-环
显著暴露的420-环(图5和6)引起了我们的兴趣,其序列在甲型和乙型流感病毒之间相对保守(图9)。为了研究该环可能的功能,我们通过用三个甘氨酸替代残基Val421-Gln426来将其缩短(突变体AVQ)。带有此突变的分离帽结合结构域在m7GTP-Sepharose结合活性(图12)和表观KD(数据未显示)上与野生型表现相同。在三聚体聚合酶和重组RNP的情况下,该突变体保留了结合帽类似物树脂的能力(虽然程度降低),并且产生野生型水平的复制和ApG引发的转录活性(图14和15)。相反地,在体外该突变体不能进行β-珠蛋白依赖性转录(图16、17和表4)。因此,AVQ突变体在帽依赖性转录上有缺陷,而在帽结合上没有。我们推测该环可能在调控PB1亚基活性中起到变构的作用。
参考文献
Area,E.et al.,(2004),“3D structure of influenza virus polymerase complex:localization ofsubunit domains”,PNAS USA,101,pp.308-313
Balbes,L.M.et al.,(1994),“A Perspective in Modern Methods in Computer-Aided DrugDesign”,Reviews in Computational Chemistry,Vol.5,K.B.Lipkowitz and D.B.Boyd,Eds.,VCH,New York,pp.37-380
Bartlett,P.A.et al.,(1989),“CAVEAT:A Program to Facilitate the Structure-DerivedDesign of Biologically Active Molecules”,in Molecular Recognition in Chemical andBiological Problems”,Special Publication,Royal Chem.Soc.,78,pp.182-196Berge,S.M.et al.,(1977),″Pharmaceutical Salts″,J.Pharm.Sci.,66,pp.1-19Blundell,T.L.and Johnson,L.N.,(1976),“Protein Crystallography”,Academic Press,NewYork
Bohm,H.-J.,(1992),“The Computer Program LUDI:A New Method for the De Novo Designof Enzyme Inhibitors”,J.Comp.Aid.Mol.Des.,6,pp.61-78
Cianci,C.et al.,(1995),“Differential activation of the influenza virus polymerase viatemplate RNA binding”,J.Virol.,69,pp.3995-3999.
Cohen,N.C.et al.,(1990),“Molecular Modeling Software and Methods for MedicinalChemistry”,J.Med.Chem.,33,pp.883-894
Drenth,J.,“Principles of protein X-ray crystallography”,2nd Ed.,Springer Adyanced Texts inChemistry,New York(1999)
Eisen,M.B.et al.,(1994),“HOOK:A Program for Finding Novel Molecular Architecturesthat Satisfy the Chemical and Steric Requirements of a Macromolecule Binding Site”,Proteins:Struct.,Funct.,Genet.,19,pp.199-221
Eriksson,B.et al.,(1977),Inhibition of Influenza virus ribonucleic acid polymerase byribavirin triphosphate.Antimicrob.Agents Chemother.,11,pp.946-951
Fechter,P.et al.,(2003),“Two aromatic residues in the PB2subunit of influenza A RNApolymerase are crucial for cap binding”,J.Biol.Chem.,278,pp.2038l-20388
Furuta,Y.et al.,(2005),“Mechanism of action of T-705 against influenza virus”,Antimicrob.Agents Chemother.,49,pp.981-986
Ghanem,A.et al.,(2007),“Peptide-mediated interference with influenza A viruspolymerase”.J.Virol.,81,pp.7801-7804
Gillet,V.et al.,(1993),“SPROUT:A Program for Structure Generation”,J.Comp.Aid.Mol.Des.,7,pp.127-153
Goodman,L.S.et al.,Eds.,(1985),“Goodman and Gilman′s The Pharmacological Basis ofTherapeutics″,8th Edition,Pergamon Press
Goodsell,D.S.et al.,(1990),“Automated Docking of Substrates to Proteins by SimulatedAnnealing”,Proteins:Struct.,Funct.,Genet.,8,pp.195-202
Guida,W.C.,(1994),“Software for Structure-Based Drug Design”,Curr.Opin.Struct.Biol.,4,pp.777-781
Harlow,E.and Lane,D.,Eds.,(1990),“Antibodies:A Laboratory Manual”,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York
Holm,L.and Sander,C.,(1993),“Protein structure comparison by alignment of distancematrices”,J.Mol.Biol.,233,pp.123-138.
Honda,A.et al.,(1999),“Two separate sequences of PB2 subunit constitute the RNA cap-binding site of influenza virus RNA polymerase”,Genes to Cells,4,pp.475-485
Hooker,L.et al.,(2003),“Quantitative analysis of the influenza virus RNP interaction withRNA cap structures and comparison to human cap binding protein eIF4E”,Biochemistry,42,pp.6234-6240
Jorgensen,W.L.,(1998),″OPLS Force Fields″,Encyclopedia of Computational Chemistry,Schleyer,Ed.,Wiley,New York,Vol.3,pp.1986-1989
Kukkonen,S.K.et al(2005),“L protein,the RNA-dependent RNA polymerase ofhantaviruses”,Arch.Virol.,150,pp.533-556
Kuntz,I.D.et al.,(1982),“A Geometric Approach to Macromolecule-Ligand Interactions”,J.Mol.Biol.,161,pp.269-288
Lauri,G.and Bartlett,P.A.,(1994),“CAVEAT:A Program to Facilitate the Design ofOrganic Molecules”,J.Comp.Aid.Mol.Des.,8,pp.51-66
Leahy,M.B.et al,(2005),“In Vitro Polymerase Activity of Thogoto Virus:Evidence for aUnique Cap-Snatching Mechanism in a Tick-Borne Orthomyxovirus”,J.Virol.,71,pp.8347-8351
Leuenberger,H.G.W.et al.,Eds.,(1995),“A Multilingual Glossary of BiotechnologicalTerms:IUPAC Recommendations“,Helvetica Chimica Acta,CH-4010Basel,Switzerland,Li,M.-L.et al.,(2001),“The active site of the influenza cap-dependent endonuclease are ondifferent polymerase subunits”,EMBO J.,20,pp.2078-2086
Lipinski,C.A.et al.,(1997),“Experimental and computational approaches to estimatesolubility and permeability in drug discovery and development settings”,Adv.Drug Deliv.Rev.,23,pp.3-25
Lovell,S.C.et al.,(2003),“Structure validation by Calpha geometry:phi,psi and Cbetadeviation”,Proteins,50,pp.437-450.
Magden,J.et al.,(2005),“Inhibitors of virus replication:recent developments and prospects”,Appl.Microbiol.Biotechnol.,66,pp.612-621
Martin,Y.C.,(1992),“3D Database Searching in Drug Design”,J.Med.Chem.,35,pp.2145-2154
Martin-Benito,J et al.,(2001),“Three-dimensional reconstruction of a recombinant influenzavirus ribonucleoprotein particle”,EMBO Rep.,2,pp.313-317
Meng,E.C.et al.,(1992),“Automated Docking with Grid-Based Energy Evaluation″,J.Comp.Chem.,13,pp.505-524
Moon,J.B.and Howe,W.J.,(1991),″Computer Design of Bioactive Molecules:A Methodfor Receptor-Based De Novo Ligand Design″,Proteins,11,pp.314-328
Murshudov,G.N.,(1997),“Refinement of macromolecular structures by the maximum-likelihood method”,Acta Crystallogr.D.Biol.Crystallogr.53,pp.240-255.
Natarajan,A.et al.,(2004),Synthesis of fluorescein labeled 7-methylguanosinemono-phosphate.Bioorg.Med.Chem.Lett.,14,pp.2657-2660
Navia,M.A.and Murcko,M.A.,(1992),“The Use of Structural Information in DrugDesign”,Curr.Opin.Struct.Biol.,2,pp.202-210
Nishibata,Y.and Itai,A.,(1991),“Automatic creation of drug candidate structures based onreceptor structure.Starting point for artificial lead generation”,Tetrahedron,47,pp.8985-8990
Noah,D.L.and Krug,R.M.,(2005),“Influenza virus virulence and its moleculardeterminants”,Adv.Virus Res.,65,pp.121-145
Ortega,J.et al.,(2000),“Ultrastructural and functional analyses of recombinant influenzavirusribonucleoproteins suggest dimerization of nucleoprotein during virus amplification”,J.Virol.,74,pp.156-163
Perrakis A.et al.,(1999),“Automated protein model building combined with iterativestructure refinement”,Nat.Struct.Biol.,6,pp.458-63
Plotch,S.J.et al.,(1981),“A unique cap(m7GpppXm)-dependent influenza virion endo-nuclease cleaves capped RNAs to generate the primers that initiate viral RNA transcription”,Cell,23,pp.847-858
Ren,J.et al.,(1996),“Synthesis of a fluorescent 7-methylguanosine analog and afluorescence spectroscopic study of its reaction with wheat germ cap binding proteins”,Nucleic Acids Res.,15,pp.3629-3634
Rotstein,S.H.and Murcko,M.A.,(1993),″GroupBuild:A Fragment-Based Method for DeNovo Drug Design″,J.Med.Chem.,36,pp.1700-1710
Ryder,S.P.and Strobel,S.A.,(1999),“Nucleotide analog interference mapping”,Methods,18,pp.38-50
Sali,A.and Blundell,T.L.,(1993),“Comparative protein modelling by satisfaction of spatialrestraints”,J.Mol.Biol.,234,pp.779-815
Sambrook,J.et al.,Eds.,(1989),“Molecular Cloning:A Laboratory Manual”,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York
Schneider T.R.and Sheldrick G.M.,(2002),“Substructure solution with SHELXD”,ActaCrystallogr.D.Biol.Crystallogr.(Pt 10Pt 2),pp.1772-1779
Schulz,G.E.and Schirmer,R.H.,(1985),“Principles of Protein Structure”,Springer Verlag,New York
Tarendeau,F.et al.,(2007),“Structure and nuclear import function of the C-terminal domainof influenza virus polymerase PB2 subunit”,Nat.Struct.Mol.Biol.,14,pp.229-233
Terwilliger,T.C.,(2000),″Maximum likelihood density modification,″Acta Cryst.D.Biol.Crystallogr.,56,pp.965-972
Tisdale,M.et al.,(1995),“Inhibition of influenza virus transcription by 2’-deoxy-2’-fluoroguanosine”,Antimicrob.Agents Chemother.,39,pp.2454-2458
Tomassini,J.et al.,(1994),“Inhibition of cap(m7GpppXm)-dependent endonuclease ofinfluenza virus by 4-substituted 2,4-diocobutanic acid compounds”,Antimicrob.AgentsChemother.,38,pp.2827-2837
Tomassini,J.et al.,(1996),“A novel antiviral agent which inhibits the endonuclease ofinfluenza viruses”,Antimicrob.Agents Chemother.,40,pp.1189-1193
Van Duyne,G.D.et al.,(1993),“Atomic structures of the human immunophilin FKBP-12complexes with FK506 and rapamycin”,J.Mol.Biol.,229,pp.105-124
Von Itzstein,M.et al.,(1993),“Rational design of potent sialidase-based inhibitors ofinfluenza virus replication”,Nature,363,pp.418-423
Vonrhein C.et al.,(2006),“Automated Structure Solution With autoSHARP”,Methods Mol.Biol.,364,pp.215-30
Wallace,A.C.et al.,(1995).“LIGPLOT:A program to generate schematic diagrams ofprotein-ligand interactions”,Prot.Eng.,8,pp.127-134.
序列表
<110>欧洲分子生物学实验室
<120>可溶性RNA帽结合口袋片段及其用途
<130>492-11PCT
<140>
<141>2008/10/09
<160>27
<170>PatentIn versi on 3.4
<210>1
<211>759
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2
<222>(1)..(759)
<400>1
Met Glu Arg Ile Lys Glu Leu Arg Asn Leu Met Ser Gln Ser Arg Thr
1 5 10 15
Arg Glu Ile Leu Thr Lys Thr Thr Val Asp His Met Ala Ile Ile Lys
20 25 30
Lys Tyr Thr Ser Gly Arg Gln Glu Lys Asn Pro Ser Leu Arg Met Lys
35 40 45
Trp Met Met Ala Met Lys Tyr Pro Ile Thr Ala Asp Lys Arg Ile Thr
50 55 60
Glu Met Val Pro Glu Arg Asn Glu Gln Gly Gln Thr Leu Trp Ser Lys
65 70 75 80
Met Ser Asp Ala Gly Ser Asp Arg Val Met Val Ser Pro Leu Ala Val
85 90 95
Thr Trp Trp Asn Arg Asn Gly Pro Val Thr Ser Thr Val His Tyr Pro
100 105 110
Lys Val Tyr Lys Thr Tyr Phe Asp Lys Val Glu Arg Leu Lys His Gly
115 120 125
Thr Phe Gly Pro Val His Phe Arg Asn Gln Val Lys Ile Arg Arg Arg
130 135 140
Val Asp Ile Asn Pro Gly His Ala Asp Leu Ser Ala Lys Glu Ala Gln
145 150 155 160
Asp Val Ile Met Glu Val Val Phe Pro Asn Glu Val Gly Ala Arg Ile
165 170 175
Leu Thr Ser Glu Ser Gln Leu Thr Ile Thr Lys Glu Lys Lys Glu Glu
180 185 190
Leu Gln Asp Cys Lys Ile Ser Pro Leu Met Val Ala Tyr Met Leu Glu
195 200 205
Arg Glu Leu Val Arg Lys Thr Arg Phe Leu Pro Val Ala Gly Gly Thr
210 215 220
Ser Ser Val Tyr Ile Glu Val Leu His Leu Thr Gln Gly Thr Cys Trp
225 230 235 240
Glu Gln Met Tyr Thr Pro Gly Gly Glu Val Arg Asn Asp Asp Ile Asp
245 250 255
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Ser Val
260 265 270
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
275 280 285
Ile Gly Gly Thr Arg Met Val Asp Ile Leu Arg Gln Asn Pro Thr Glu
290 295 300
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
305 310 315 320
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
325 330 335
Ser Ile Lys Arg Glu Glu Glu Val Leu Thr Gly Asn Leu Gln Thr Leu
340 345 350
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Lys
355 360 365
Arg Ala Thr Ala Ile Leu Arg Lys Ala Thr Arg Arg Leu Val Gln Leu
370 375 380
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
385 390 395 400
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
405 410 415
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
420 425 430
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
435 440 445
Trp Gly Ile Glu His Ile Asp Asn Val Met Gly Met Val Gly Val Leu
450 455 460
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Met Arg Gly Ile Arg Val
465 470 475 480
Ser Lys Met Gly Val Asp Glu Tyr Ser Ser Thr Glu Arg Val Val Val
485 490 495
Ser Ile Asp Arg Phe Leu Arg Val Arg Asp Gln Arg Gly Asn Val Leu
500 505 510
Leu Ser Pro Glu Glu Val Ser Glu Thr His Gly Thr Glu Arg Leu Thr
515 520 525
Ile Thr Tyr Ser Ser Ser Met Met Trp Glu Ile Asn Gly Pro Glu Ser
530 535 540
Val Leu Val Asn Thr Tyr Gln Trp Ile Ile Arg Asn Trp Glu Thr Val
545 550 555 560
Lys Ile Gln Trp Ser Gln Asn Pro Thr Met Leu Tyr Asn Lys Met Glu
565 570 575
Phe Glu Pro Phe Gln Ser Leu Val Pro Lys Ala Ile Arg Gly Gln Tyr
580 585 590
Ser Gly Phe Val Arg Thr Leu Phe Gln Gln Met Arg Asp Val Leu Gly
595 600 605
Thr Phe Asp Thr Thr Gln Ile Ile Lys Leu Leu Pro Phe Ala Ala Ala
610 615 620
Pro Pro Lys Gln Ser Arg Met Gln Phe Ser Ser Leu Thr Val Asn Val
625 630 635 640
Arg Gly Ser Gly Met Arg Ile Leu Val Arg Gly Asn Ser Pro Val Phe
645 650 655
Asn Tyr Asn Lys Thr Thr Lys Arg Leu Thr Ile Leu Gly Lys Asp Ala
660 665 670
Gly Thr Leu Ile Glu Asp Pro Asp Glu Ser Thr Ser Gly Val Glu Ser
675 680 685
Ala Val Leu Arg Gly Phe Leu Ile Leu Gly Lys Glu Asp Arg Arg Tyr
690 695 700
Gly Pro Ala Leu Ser Ile Asn Glu Leu Ser Asn Leu Ala Lys Gly Glu
705 710 715 720
Lys Ala Asn Val Leu Ile Gly Gln Gly Asp Val Val Leu Val Met Lys
725 730 735
Arg Lys Arg Asp Ser Ser Ile Leu Thr Asp Ser Gln Thr Ala Thr Lys
740 745 750
Arg Ile Arg Met Ala Ile Asn
755
<210>2
<211>770
<212>PRT
<213>乙型流感病毒
<220>
<221>PB2
<222>(1)..(770)
<400>2
Met Thr Leu Ala Lys Ile Glu Leu Leu Lys Gln Leu Leu Arg Asp Asn
1 5 10 15
Glu Ala Lys Thr Val Leu Lys Gln Thr Thr Val Asp Gln Tyr Asn Ile
20 25 30
Ile Arg Lys Phe Asn Thr Ser Arg Ile Glu Lys Asn Pro Ser Leu Arg
35 40 45
Met Lys Trp Ala Met Cys Ser Asn Phe Pro Leu Ala Leu Thr Lys Gly
50 55 60
Asp Met Ala Asn Arg Ile Pro Leu Glu Tyr Lys Gly Ile Gln Leu Lys
65 70 75 80
Thr Asn Ala Glu Asp Ile Gly Thr Lys Gly Gln Met Cys Ser Ile Ala
85 90 95
Ala Val Thr Trp Trp Asn Thr Tyr Gly Pro Ile Gly Asp Thr Glu Gly
100 105 110
Phe Glu Lys Val Tyr Glu Ser Phe Phe Leu Arg Lys Met Arg Leu Asp
115 120 125
Asn Ala Thr Trp Gly Arg Ile Thr Phe Gly Pro Val Glu Arg Val Arg
130 135 140
Lys Arg Val Leu Leu Asn Pro Leu Thr Lys Glu Met Pro Pro Asp Glu
145 150 155 160
Ala Ser Asn Val Ile Met Glu Ile Leu Phe Pro Lys Glu Ala Gly Ile
165 170 175
Pro Arg Glu Ser Thr Trp Ile His Arg Glu Leu Ile Lys Glu Lys Arg
180 185 190
Glu Lys Leu Lys Gly Thr Met Ile Thr Pro Ile Val Leu Ala Tyr Met
195 200 205
Leu Glu Arg Glu Leu Val Ala Arg Arg Arg Phe Leu Pro Val Ala Gly
210 215 220
Ala Thr Ser Ala Glu Phe Ile Glu Met Leu His Cys Leu Gln Gly Glu
225 230 235 240
Asn Trp Arg Gln Ile Tyr His Pro Gly Gly Asn Lys Leu Thr Glu Ser
245 250 255
Arg Ser Gln Ser Met Ile Val Ala Cys Arg Lys Ile Ile Arg Arg Ser
260 265 270
Ile Val Ala Ser Asn Pro Leu Glu Leu Ala Val Glu Ile Ala Asn Lys
275 280 285
Thr Val Ile Asp Thr Glu Pro Leu Lys Ser Cys Leu Thr Ala Ile Asp
290 295 300
Gly Gly Asp Val Ala Cys Asp Ile Ile Arg Ala Ala Leu Gly Leu Lys
305 310 315 320
Ile Arg Gln Arg Gln Arg Phe Gly Arg Leu Glu Leu Lys Arg Ile Ser
325 330 335
Gly Arg Gly Phe Lys Asn Asp Glu Glu Ile Leu Ile Gly Asn Gly Thr
340 345 350
Ile Gln Lys Ile Gly Ile Trp Asp Gly Glu Glu Glu Phe His Val Arg
355 360 365
Cys Gly Glu Cys Arg Gly Ile Leu Lys Lys Ser Lys Met Arg Met Glu
370 375 380
Lys Leu Leu Ile Asn Ser Ala Lys Lys Glu Asp Met Lys Asp Leu Ile
385 390 395 400
Ile Leu Cys Met Val Phe Ser Gln Asp Thr Arg Met Phe Gln Gly Val
405 410 415
Arg Gly Glu Ile Asn Phe Leu Asn Arg Ala Gly Gln Leu Leu Ser Pro
420 425 430
Met Tyr Gln Leu Gln Arg Tyr Phe Leu Asn Arg Ser Asn Asp Leu Phe
435 440 445
Asp Gln Trp Gly Tyr Glu Glu Ser Pro Lys Ala Ser Glu Leu His Gly
450 455 460
Ile Asn Glu Leu Met Asn Ala Ser Asp Tyr Thr Leu Lys Gly Val Val
465 470 475 480
Val Thr Lys Asn Val Ile Asp Asp Phe Ser Ser Thr Glu Thr Glu Lys
485 490 495
Val Ser Ile Thr Lys Asn Leu Ser Leu Ile Lys Arg Thr Gly Glu Val
500 505 510
Ile Met Gly Ala Asn Asp Val Ser Glu Leu Glu Ser Gln Ala Gln Leu
515 520 525
Met Ile Thr Tyr Asp Thr Pro Lys Met Trp Glu Met Gly Thr Thr Lys
530 535 540
Glu Leu Val Gln Asn Thr Tyr Gln Trp Val Leu Lys Asn Leu Val Thr
545 550 555 560
Leu Lys Ala Gln Phe Leu Leu Gly Lys Glu Asp Met Phe Gln Trp Asp
565 570 575
Ala Phe Glu Ala Phe Glu Ser Ile Ile Pro Gln Lys Met Ala Gly Gln
580 585 590
Tyr Ser Gly Phe Ala Arg Ala Val Leu Lys Gln Met Arg Asp Gln Glu
595 600 605
Val Met Lys Thr Asp Gln Phe Ile Lys Leu Leu Pro Phe Cys Phe Ser
610 615 620
Pro Pro Lys Leu Arg Ser Asn Gly Glu Pro Tyr Gln Phe Leu Arg Leu
625 630 635 640
Val Leu Lys Gly Gly Gly Glu Asn Phe Ile Glu Val Arg Lys Gly Ser
645 650 655
Pro Leu Phe Ser Tyr Asn Pro Gln Thr Glu Val Leu Thr Ile Cys Gly
660 665 670
Arg Met Met Ser Leu Lys Gly Lys Ile Glu Asp Glu Glu Arg Asn Arg
675 680 685
Ser Met Gly Asn Ala Val Leu Ala Gly Phe Leu Val Ser Gly Lys Tyr
690 695 700
Asp Pro Asp Leu Gly Asp Phe Lys Thr rle Glu Glu Leu Glu Lys Leu
705 710 715 720
Lys Pro Gly Glu Lys Ala Asn Ile Leu Leu Tyr Gln Gly Lys Pro Val
725 730 735
Lys Val Val Lys Arg Lys Arg Tyr Ser Ala Leu Ser Asn Asp Ile Ser
740 745 750
Gln Gly Ile Lys Arg Gln Arg Met Thr Val Glu Ser Met Gly Trp Ala
755 760 765
Leu Ser
770
<210>3
<211>774
<212>PRT
<213>丙型流感病毒
<220>
<221>PB2
<222>(1)..(774)
<400>3
Met Ser Phe Leu Leu Thr Ile Ala Lys Glu Tyr Lys Arg Leu Cys Gln
1 5 10 15
Asp Ala Lys Ala Ala Gln Met Met Thr Val Gly Thr Val Ser Asn Tyr
20 25 30
Thr Thr Phe Lys Lys Trp Thr Thr Ser Arg Lys Glu Lys Asn Pro Ser
35 40 45
Leu Arg Met Arg Trp Ala Met Ser Ser Lys Phe Pro Ile Ile Ala Asn
50 55 60
Lys Arg Met Leu Glu Glu Ala Gln Ile Pro Lys Glu His Asn Asn Val
65 70 75 80
Ala Leu Trp Glu Asp Thr Glu Asp Val Ser Lys Arg Asp His Val Leu
85 90 95
Ala Ser Ala Ser Cys Ile Asn Tyr Trp Asn Phe Cys Gly Pro Cys Val
100 105 110
Asn Asn Ser Glu Val Ile Lys Glu Val Tyr Lys Ser Arg Phe Gly Arg
115 120 125
Leu Glu Arg Arg Lys Glu Ile Met Trp Lys Glu Leu Arg Phe Thr Leu
130 135 140
Val Asp Arg Gln Arg Arg Arg Val Asp Thr Gln Pro Val Glu Gln Arg
145 150 155 160
Leu Arg Thr Gly Glu Ile Lys Asp Leu Gln Met Trp Thr Leu Phe Glu
165 170 175
Asp Glu Ala Pro Leu Ala Ser Lys Phe Ile Leu Asp Asn Tyr Gly Leu
180 185 190
Val Lys Glu Met Arg Ser Lys Phe Ala Asn Lys Pro Leu Asn Lys Glu
195 200 205
Val Val Ala His Met Leu Glu Lys Gln Phe Asn Pro Glu Ser Arg Phe
210 215 220
Leu Pro Val Phe Gly Ala Ile Arg Pro Glu Arg Met Glu Leu Ile His
225 230 235 240
Ala Leu Gly Gly Glu Thr Trp Ile Gln Glu Ala Asn Thr Ala Gly Ile
245 250 255
Ser Asn Val Asp Gln Arg Lys Asn Asp Met Arg Ala Val Cys Arg Lys
260 265 270
Val Cys Leu Ala Ala Asn Ala Ser Ile Met Asn Ala Lys Ser Lys Leu
275 280 285
Val Glu Tyr Ile Lys Ser Thr Ser Met Arg Ile Gly Glu Thr Glu Arg
290 295 300
Lys Leu Glu Glu Leu Ile Leu Glu Thr Asp Asp Val Ser Pro Glu Val
305 310 315 320
Thr Leu Cys Lys Ser Ala Leu Gly Gly Pro Leu Gly Lys Thr Leu Ser
325 330 335
Phe Gly Pro Met Leu Leu Lys Lys Ile Ser Gly Ser Gly Val Lys Val
340 345 350
Lys Asp Thr Val Tyr Ile Gln Gly Val Arg Ala Val Gln Phe Glu Tyr
355 360 365
Trp Ser Glu Gln Glu Glu Phe Tyr Gly Glu Tyr Lys Ser Ala Thr Ala
370 375 380
Leu Phe Ser Arg Lys Glu Arg Ser Leu Glu Trp Ile Thr Ile Gly Gly
385 390 395 400
Gly Ile Asn Glu Asp Arg Lys Arg Leu Leu Ala Met Cys Met Ile Phe
405 410 415
Cys Arg Asp Gly Asp Tyr Phe Lys Asp Ala Pro Ala Thr Ile Thr Met
420 425 430
Ala Asp Leu Ser Thr Lys Leu Gly Arg Glu Ile Pro Tyr Gln Tyr Val
435 440 445
Met Met Asn Trp Ile Gln Lys Ser Glu Asp Asn Leu Glu Ala Leu Leu
450 455 460
Tyr Ser Arg Gly Ile Val Glu Thr Asn Pro Gly Lys Met Gly Ser Ser
465 470 475 480
Met Gly Ile Asp Gly Ser Lys Arg Ala Ile Lys Ser Leu Arg Ala Val
485 490 495
Thr Ile Gln Ser Gly Lys Ile Asp Met Pro Glu Ser Lys Glu Lys Ile
500 505 510
His Leu Glu Leu Ser Asp Asn Leu Glu Ala Phe Asp Ser Ser Gly Arg
515 520 525
Ile Val Ala Thr Ile Leu Asp Leu Pro Ser Asp Lys Lys Val Thr Phe
530 535 540
Gln Asp Val Ser Phe Gln His Pro Asp Leu Ala Val Leu Arg Asp Glu
545 550 555 560
Lys Thr Ala Ile Thr Lys Gly Tyr Glu Ala Leu Ile Lys Arg Leu Gly
565 570 575
Thr Gly Asp Asn Asp Ile Pro Ser Leu Ile Ala Lys Lys Asp Tyr Leu
580 585 590
Ser Leu Tyr Asn Leu Pro Glu Val Lys Leu Met Ala Pro Leu Ile Arg
595 600 605
Pro Asn Arg Lys Gly Val Tyr Ser Arg Val Ala Arg Lys Leu Val Ser
610 615 620
Thr Gln Val Thr Thr Gly His Tyr Ser Leu His Glu Leu Ile Lys Val
625 630 635 640
Leu Pro Phe Thr Tyr Phe Ala Pro Lys Gln Gly Met Phe Glu Gly Arg
645 650 655
Leu Phe Phe Ser Asn Asp Ser Phe Val Glu Pro Gly Val Asn Asn Asn
660 665 670
Val Phe Ser Trp Ser Lys Ala Asp Ser Ser Lys Ile Tyr Cys His Gly
675 680 685
Ile Ala Ile Arg Val Pro Leu Val Val Gly Asp Glu His Met Asp Thr
690 695 700
Ser Leu Ala Leu Leu Glu Gly Phe Ser Val Cys Glu Asn Asp Pro Arg
705 710 715 720
Ala Pro Met Val Thr Arg Gln Asp Leu Ile Asp Val Gly Phe Gly Gln
725 730 735
Lys Val Arg Leu Phe Val Gly Gln Gly Ser Val Arg Thr Phe Lys Arg
740 745 750
Thr Ala Ser Gln Arg Ala Ala Ser Ser Asp Val Asn Lys Asn Val Lys
755 760 765
Lys Ile Lys Met Ser Asn
770
<210>4
<211>262
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2235至496位
<222>(1)..(262)
<400>4
Thr Gln Gly Thr Cys Trp Glu Gln Met Tyr Thr Pro Gly Gly Glu Val
1 5 10 15
Arg Asn Asp Asp Ile Asp Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile
20 25 30
Val Arg Arg Ala Ser Val Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu
35 40 45
Met Cys His Ser Thr Gln Ile Gly Gly Thr Arg Met Val Asp Ile Leu
50 55 60
Arg Gln Asn Pro Thr Glu Glu Gln Ala Val Asp Ile Cys Lys Ala Ala
65 70 75 80
Met Gly Leu Arg Ile Ser Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe
85 90 95
Lys Arg Thr Ser Gly Ser Ser Ile Lys Arg Glu Glu Glu Val Leu Thr
100 105 110
Gly Asn Leu Gln Thr Leu Lys Ile Arg Val His Glu Gly Tyr Glu Glu
115 120 125
Phe Thr Met Val Gly Lys Arg Ala Thr Ala Ile Leu Arg Lys Ala Thr
130 135 140
Arg Arg Leu Val Gln Leu Ile Val Ser Gly Arg Asp Glu Gln Ser Ile
145 150 155 160
Ala Glu Ala Ile Ile Val Ala Met Val Phe Ser Gln Glu Asp Cys Met
165 170 175
Ile Lys Ala Val Arg Gly Asp Leu Asn Phe Val Asn Arg Ala Asn Gln
180 185 190
Arg Leu Asn Pro Met His Gln Leu Leu Arg His Phe Gln Lys Asp Ala
195 200 205
Lys Val Leu Phe Gln Asn Trp Gly Ile Glu His Ile Asp Asn Val Met
210 215 220
Gly Met Val Gly Val Leu Pro Asp Met Thr Pro Ser Thr Glu Met Ser
225 230 235 240
Met Arg Gly Ile Arg Val Ser Lys Met Gly Val Asp Glu Tyr Ser Ser
245 250 255
Thr Glu Arg Val Val Val
260
<210>5
<211>243
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2241至483位
<222>(1)..(243)
<400>5
Glu Gln Met Tyr Thr Pro Gly Gly Glu Val Arg Asn Asp Asp Ile Asp
1 5 10 15
Gln Ser Leu Ile Ile Ala Ala Arg Asn Ile Val Arg Arg Ala Ser Val
20 25 30
Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln
35 40 45
Ile Gly Gly Thr Arg Met Val Asp Ile Leu Arg Gln Asn Pro Thr Glu
50 55 60
Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser
65 70 75 80
Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser
85 90 95
Ser Ile Lys Arg Glu Glu Glu Val Leu Thr Gly Asn Leu Gln Thr Leu
100 105 110
Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Lys
115 120 125
Arg Ala Thr Ala Ile Leu Arg Lys Ala Thr Arg Arg Leu Val Gln Leu
130 135 140
Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
145 150 155 160
Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly
165 170 175
Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His
180 185 190
Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn
195 200 205
Trp Gly Ile Glu His Ile Asp Asn Val Met Gly Met Val Gly Val Leu
210 215 220
Pro Asp Met Thr Pro Ser Thr Glu Met Ser Met Arg Gly Ile Arg Val
225 230 235 240
Ser Lys Met
<210>6
<211>216
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2268至483位
<222>(1)..(216)
<400>6
Arg Arg Ala Ser Val Ser Ala Asp Pro Leu Ala Ser Leu Leu Glu Met
1 5 10 15
Cys His Ser Thr Gln Ile Gly Gly Thr Arg Met Val Asp Ile Leu Arg
20 25 30
Gln Asn Pro Thr Glu Glu Gln Ala Val Asp Ile Cys Lys Ala Ala Met
35 40 45
Gly Leu Arg Ile Ser Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys
50 55 60
Arg Thr Ser Gly Ser Ser Ile Lys Arg Glu Glu Glu Val Leu Thr Gly
65 70 75 80
Asn Leu Gln Thr Leu Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe
85 90 95
Thr Met Val Gly Lys Arg Ala Thr Ala Ile Leu Arg Lys Ala Thr Arg
100 105 110
Arg Leu Val Gln Leu Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala
115 120 125
Glu Ala Ile Ile Val Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile
130 135 140
Lys Ala Val Arg Gly Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg
145 150 155 160
Leu Asn Pro Met His Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys
165 170 175
Val Leu Phe Gln Asn Trp Gly Ile Glu His Ile Asp Asn Val Met Gly
180 185 190
Met Val Gly Val Leu Pro Asp Met Thr Pro Ser Thr Glu Met Ser Met
195 200 205
Arg Gly Ile Arg Val Ser Lys Met
210 215
<210>7
<211>204
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2277至480位
<222>(1)..(204)
<400>7
Leu Ala Ser Leu Leu Glu Met Cys His Ser Thr Gln Ile Gly Gly Thr
1 5 10 15
Arg Met Val Asp Ile Leu Arg Gln Asn Pro Thr Glu Glu Gln Ala Val
20 25 30
Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser Ser Ser Phe Ser
35 40 45
Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser SerIle Lys Arg
50 55 60
Glu Glu Glu Val Leu Thr Gly Asn Leu Gln Thr Leu Lys Ile Arg Val
65 70 75 80
His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Lys Arg Ala Thr Ala
85 90 95
Ile Leu Arg Lys Ala Thr Arg Arg Leu Val Gln Leu Ile Val Ser Gly
100 105 110
Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val Ala Met Val Phe
115 120 125
Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly Asp Leu Asn Phe
130 135 140
Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His Gln Leu Leu Arg
145 150 155 160
His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn Trp Gly Ile Glu
165 170 175
His Ile Asp Asn Val Met Gly Met Val Gly Val Leu Pro Asp Met Thr
180 185 190
Pro Ser Thr Glu Met Ser Met Arg Gly Ile Arg Val
195 200
<210>8
<211>202
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2281至482位
<222>(1)..(202)
<400>8
Leu Glu Met Cys His Ser Thr Gln Ile Gly Gly Thr Arg Met Val Asp
1 5 10 15
Ile Leu Arg Gln Asn Pro Thr Glu Glu Gln Ala Val Asp Ile Cys Lys
20 25 30
Ala Ala Met Gly Leu Arg Ile Ser Ser Ser Phe Ser Phe Gly Gly Phe
35 40 45
Thr Phe Lys Arg Thr Ser Gly Ser Ser Ile Lys Arg Glu Glu Glu Val
50 55 60
Leu Thr Gly Asn Leu Gln Thr Leu Lys Ile Arg Val His Glu Gly Tyr
65 70 75 80
Glu Glu Phe Thr Met Val Gly Lys Arg Ala Thr Ala Ile Leu Arg Lys
85 90 95
Ala Thr Arg Arg Leu Val Gln Leu Ile Val Ser Gly Arg Asp Glu Gln
100 105 110
Ser Ile Ala Glu Ala Ile Ile Val Ala Met Val Phe Ser Gln Glu Asp
115 120 125
Cys Met Ile Lys Ala Val Arg Gly Asp Leu Asn Phe Val Asn Arg Ala
130 135 140
Asn Gln Arg Leu Asn Pro Met His Gln Leu Leu Arg His Phe Gln Lys
145 150 155 160
Asp Ala Lys Val Leu Phe Gln Asn Trp Gly Ile Glu His Ile Asp Asn
165 170 175
Val Met Gly Met Val Gly Val Leu Pro Asp Met Thr Pro Ser Thr Glu
180 185 190
Met Ser Met Arg Gly Ile Arg Val Ser Lys
195 200
<210>9
<211>194
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2290至483位
<222>(1)..(194)
<400>9
Gly Gly Thr Arg Met Val Asp Ile Leu Arg Gln Asn Pro Thr Glu Glu
1 5 10 15
Gln Ala Val Asp Ile Cys Lys Ala Ala Met Gly Leu Arg Ile Ser Ser
20 25 30
Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser Ser
35 40 45
Ile Lys Arg Glu Glu Glu Val Leu Thr Gly Asn Leu Gln Thr Leu Lys
50 55 60
Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Lys Arg
65 70 75 80
Ala Thr Ala Ile Leu Arg Lys Ala Thr Arg Arg Leu Val Gln Leu Ile
85 90 95
Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val Ala
100 105 110
Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg Gly Asp
115 120 125
Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met His Gln
130 135 140
Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln Asn Trp
145 150 155 160
Gly Ile Glu His Ile Asp Asn Val Met Gly Met Val Gly Val Leu Pro
165 170 175
Asp Met Thr Pro Ser Thr Glu Met Ser Met Arg Gly Ile Arg Val Ser
180 185 190
Lys Met
<210>10
<211>188
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2295至482位
<222>(1)..(188)
<400>10
Val Asp Ile Leu Arg Gln Asn Pro Thr Glu Glu Gln Ala Val Asp Ile
1 5 10 15
Cys Lys Ala Ala Met Gly Leu Arg Ile Ser Ser Ser Phe Ser Phe Gly
20 25 30
Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser Ser Ile Lys Arg Glu Glu
35 40 45
Glu Val Leu Thr Gly Asn Leu Gln Thr Leu Lys Ile Arg Val His Glu
50 55 60
Gly Tyr Glu Glu Phe Thr Met Val Gly Lys Arg Ala Thr Ala Ile Leu
65 70 75 80
Arg Lys Ala Thr Arg Arg Leu Val Gln Leu Ile Val Ser Gly Arg Asp
85 90 95
Glu Gln Ser Ile Ala Glu Ala Ile Ile Val Ala Met Val Phe Ser Gln
100 105 110
Glu Asp Cys Met Ile Lys Ala Val Arg Gly Asp Leu Asn Phe Val Asn
115 120 125
Arg Ala Asn Gln Arg Leu Asn Pro Met His Gln Leu Leu Arg His Phe
130 135 140
Gln Lys Asp Ala Lys Val Leu Phe Gln Asn Trp Gly Ile Glu His Ile
145 150 155 160
Asp Asn Val Met Gly Met Val Gly Val Leu Pro Asp Met Thr Pro Ser
165 170 175
Thr Glu Met Ser Met Arg Gly Ile Arg Val Ser Lys
180 185
<210>11
<211>166
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2318至483R389K位
<222>(1)..(166)
<400>11
Arg Ile ser ser ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr
1 5 10 15
Ser Gly Ser Ser Ile Lys Arg Glu Glu Glu Val Leu Thr Gly Asn Leu
20 25 30
Gln Thr Leu Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met
35 40 45
Val Gly Lys Arg Ala Thr Ala Ile Leu Arg Lys Ala Thr Arg Arg Leu
50 55 60
Val Gln Leu Ile Val Ser Gly Lys Asp Glu Gln Ser Ile Ala Glu Ala
65 70 75 80
Ile Ile Val Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala
85 90 95
Val Arg Gly Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Ara Leu Asn
100 105 110
Pro Met His Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu
115 120 125
Phe Gln Asn Trp Gly Ile Glu His Ile Asp Asn Val Met Gly Met Val
130 135 140
Gly Val Leu Pro Asp Met Thr Pro Ser Thr Glu Met Ser Met Arg Gly
145 150 155 160
Ile Arg Val Ser Lys Met
165
<210>12
<211>164
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2320至483位
<222>(1)..(164)
<400>12
Ser Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly
1 5 10 15
Ser Ser Ile Lys Arg Glu Glu Glu Val Leu Thr Gly Asn Leu Gln Thr
20 25 30
Leu Lys Ile Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly
35 40 45
Lys Arg Ala Thr Ala Ile Leu Arg Lys Ala Thr Arg Arg Leu Val Gln
50 55 60
Leu Ile Val Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile
65 70 75 80
Val Ala Met Val Phe Ser Gln Glu Asp Cys Met Ile Lys Ala Val Arg
85 90 95
Gly Asp Leu Asn Phe Val Asn Arg Ala Asn Gln Arg Leu Asn Pro Met
100 105 110
His Gln Leu Leu Arg His Phe Gln Lys Asp Ala Lys Val Leu Phe Gln
115 120 125
Asn Trp Gly Ile Glu His Ile Asp Asn Val Met Gly Met Val Gly Val
130 135 140
Leu Pro Asp Met Thr Pro Ser Thr Glu Met Ser Met Arg Gly Ile Arg
145 150 155 160
Val Ser Lys Met
<210>13
<211>82
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2323至404位
<222>(1)..(82)
<400>13
phe Ser Phe Gly Gly Phe Thr Phe Lys Arg Thr Ser Gly Ser Ser Ile
1 5 10 15
Lys Arg Glu Glu Glu Val Leu Thr Gly Asn Leu Gln Thr Leu Lys Ile
20 25 30
Arg Val His Glu Gly Tyr Glu Glu Phe Thr Met Val Gly Lys Arg Ala
35 40 45
Thr Ala Ile Leu Arg Lys Ala Thr Arg Arg Leu Val Gln Leu Ile Val
50 55 60
Ser Gly Arg Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val Ala Met
65 70 75 80
Val Phe
<210>14
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2320至330位
<222>(1)..(11)
<400>14
Ser Ser Ser Phe Ser Phe Gly Gly Phe Thr Phe
1 5 10
<210>15
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2330至340位
<222>(1)..(11)
<400>15
Phe Lys Arg Thr Ser Gly Ser Ser Ile Lys Arg
1 5 10
<210>16
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2340至350位
<222>(1)..(11)
<400>16
Arg Glu Glu Glu Val Leu Thr Gly Asn Leu Gln
1 5 10
<210>17
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2350至360位
<222>(1)..(11)
<400>17
Gln Thr Leu Lys Ile Arg Val His Glu Gly Tyr
1 5 10
<210>18
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2360至370位
<222>(1)..(11)
<400>18
Tyr Glu Glu Phe Thr Met Val Gly Lys Arg Ala
1 5 10
<210>19
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2370至380位
<222>(1)..(11)
<400>19
Ala Thr Ala Ile Leu Arg Lys Ala Thr Arg Arg
1 5 10
<210>20
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2380至390位
<222>(1)..(11)
<400>20
Arg Leu Val Gln Leu Ile Val Ser Gly Arg Asp
1 5 10
<210>21
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221>PB2390至400位
<222>(1)..(11)
<400>21
Asp Glu Gln Ser Ile Ala Glu Ala Ile Ile Val
1 5 10
<210>22
<211>11
<212>PRT
<213>甲型流感病毒
<220>
<221> PB2400至410位
<222>(1)..(11)
<400>22
Val Ala Met Val Phe Ser Gln Glu Asp Cys Met
1 5 10
<210>23
<211>2277
<212>DNA
<213>甲型流感病毒
<220>
<221>PB2野生型
<222>(1)..(2277)
<400>23
atggaaagaa taaaagaact acggaacctg atgtcacagt ctcgcactcg cgagatacta 60
acaaaaacca cagtggacca catggccata attaagaaat acacatcagg gagacaggaa 120
aagaacccgt cacttaggat gaaatggatg atggcaatga aatatccaat tacagctgac 180
aagaggataa cagaaatggt tcctgagaga aatgagcaag gacaaaccct atggagtaaa 240
atgagtgatg ccgggtcaga tcgagtgatg gtatcacctt tggcagtgac atggtggaat 300
agaaatggac cagtgacaag tacggttcat tatccaaaag tctacaagac ttattttgat 360
aaagtcgaaa ggttaaaaca tggaaccttt ggccctgtcc attttagaaa ccaagtcaaa 420
atacgccgaa gagttgacat aaaccctggt catgcagacc tcagtgccaa ggaggcacaa 480
gatgtaatca tggaagttgt tttccccaat gaagtggggg ccaggatact aacgtcggaa 540
tcacaattga caataaccaa agagaaaaaa gaagaactcc aagattgcaa aatttctcct 600
ttgatggttg catacatgtt agagagagaa cttgtccgaa aaacgagatt tctcccagtt 660
gctggtggaa caagcagtgt gtacattgaa gtgttacact tgactcaagg aacgtgttgg 720
gaacagatgt acactccagg tggagaagtg aggaatgacg atattgacca aagcctaatt 780
attgcagcca ggaacatagt gagaagagca tcagtatcag cagatccact agcatcttta 840
ttggagatgt gccacagcac acaaattggc gggacaagga tggtggacat tcttagacag 900
aacccgacgg aagaacaagc tgtggatata tgcaaggctg caatgggact gagaatcagc 960
tcatccttca gttttggtgg gttcacattt aagagaacaa gcgggtcatc aatcaaaaga 1020
gaggaagaag tgcttacggg caatctccaa acattgaaaa taagggtgca tgaagggtac 1080
gaggagttca caatggtggg gaaaagggca acagctatac tcagaaaagc aaccaggaga 1140
ttggttcagc ttatagtgag tggaagggac gagcagtcaa tagccgaagc gataattgta 1200
gccatggtgt tttcacaaga ggattgcatg ataaaagcag ttagaggtga cctgaatttc 1260
gttaacaggg caaatcagcg gttgaatccc atgcaccaac ttttaaggca ttttcagaaa 1320
gatgcgaaag tgctttttca gaattgggga attgaacata ttgacaatgt gatgggaatg 1380
gttggagtat taccagacat gactccaagc acagagatgt caatgagagg aataagagtc 1440
agcaaaatgg gcgtggatga atactccagc acagagaggg tagtggttag cattgatcgg 1500
tttttgagag ttcgagacca acgtgggaat gtattactat ctcctgagga ggtcagtgaa 1560
acacatggga cagagagact gacaataact tactcatcgt caatgatgtg ggagattaat 1620
ggccctgagt cagtgttggt caatacctat caatggatca tcagaaattg ggaaactgtt 1680
aaaattcaat ggtctcagaa tcctacaatg ttgtacaaca aaatggaatt tgagccattt 1740
cagtctttag ttcctaaggc cattagaggc caatacagtg gatttgtcag aactctattc 1800
caacaaatga gggatgtact tgggacattt gataccaccc agataataaa gcttctcccc 1860
tttgcagccg ccccaccaaa gcaaagtaga atgcagttct cttcattgac tgtgaatgtg 1920
aggggatcag ggatgagaat acttgtaagg ggcaattctc ctgtattcaa ctacaacaag 1980
accactaaaa gactaacaat tctcggaaaa gatgctggca ctttaattga agacccagat 2040
gaaagcacat ccggagtgga gtccgctgtt ttgagaggat ttctcattct aggtaaggaa 2100
gatagaagat acggaccagc attaagcatc aatgaactga gcaaccttgc aaaaggagaa 2160
aaggctaatg tgctaattgg gcaaggagac gtggtgttgg taatgaaacg aaaacgggac 2220
tctagcatac ttactgacag ccagacagcg accaaaagaa ttcggatggc catcaat 2277
<210>24
<211>2277
<212>DNA
<213>甲型流感病毒
<220>
<221>PB2Arg389Lys
<222>(1)..(2277)
<400>24
atggaaagaa taaaagaact acggaacctg atgtcacagt ctcgcactcg cgagatacta 60
acaaaaacca cagtggacca catggccata attaagaaat acacatcagg gagacaggaa 120
aagaacccgt cacttaggat gaaatggatg atggcaatga aatatccaat tacagctgac 180
aagaggataa cagaaatggt tcctgagaga aatgagcaag gacaaaccct atggagtaaa 240
atgagtgatg ccgggtcaga tcgagtgatg gtatcacctt tggcagtgac atggtggaat 300
agaaatggac cagtgacaag tacggttcat tatccaaaag tctacaagac ttattttgat 360
aaagtcgaaa ggttaaaaca tggaaccttt ggccctgtcc attttagaaa ccaagtcaaa 420
atacgccgaa gagttgacat aaaccctggt catgcagacc tcagtgccaa ggaggcacaa 480
gatgtaatca tggaagttgt tttccccaat gaagtggggg ccaggatact aacgtcggaa 540
tcacaattga caataaccaa agagaaaaaa gaagaactcc aagattgcaa aatttctcct 600
ttgatggttg catacatgtt agagagagaa cttgtccgaa aaacgagatt tctcccagtt 660
gctggtggaa caagcagtgt gtacattgaa gtgttacact tgactcaagg aacgtgttgg 720
gaacagatgt acactccagg tggagaagtg aggaatgacg atattgacca aagcctaatt 780
attgcagcca ggaacatagt gagaagagca tcagtatcag cagatccact agcatcttta 840
ttggagatgt gccacagcac acaaattggc gggacaagga tggtggacat tcttagacag 900
aacccgacgg aagaacaagc tgtggatata tgcaaggctg caatgggact gagaatcagc 960
tcatccttca gttttggtgg gttcacattt aagagaacaa gcgggtcatc aatcaaaaga 1020
gaggaagaag tgcttacggg caatctccaa acattgaaaa taagggtgca tgaagggtac 1080
gaggagttca caatggtggg gaaaagggca acagctatac tcagaaaagc aaccaggaga 1140
ttggttcagc ttatagtgag tggaaaggac gagcagtcaa tagccgaagc gataattgta 1200
gccatggtgt tttcacaaga ggattgcatg ataaaagcag ttagaggtga cctgaatttc 1260
gttaacaggg caaatcagcg gttgaatccc atgcaccaac ttttaaggca ttttcagaaa 1320
gatgcgaaag tgctttttca gaattgggga attgaacata ttgacaatgt gatgggaatg 1380
gttggagtat taccagacat gactccaagc acagagatgt caatgagagg aataagagtc 1440
agcaaaatgg gcgtggatga atactccagc acagagaggg tagtggttag cattgatcgg 1500
tttttgagag ttcgagacca acgtgggaat gtattactat ctcctgagga ggtcagtgaa 1560
acacatggga cagagagact gacaataact tactcatcgt caatgatgtg ggagattaat 1620
ggccctgagt cagtgttggt caatacctat caatggatca tcagaaattg ggaaactgtt 1680
aaaattcaat ggtctcagaa tcctacaatg ttgtacaaca aaatggaatt tgagccattt 1740
cagtctttag ttcctaaggc cattagaggc caatacagtg gatttgtcag aactctattc 1800
caacaaatga gggatgtact tgggacattt gataccaccc agataataaa gcttctcccc 1860
tttgcagccg ccccaccaaa gcaaagtaga atgcagttct cttcattgac tgtgaatgtg 1920
aggggatcag ggatgagaat acttgtaagg ggcaattctc ctgtattcaa ctacaacaag 1980
accactaaaa gactaacaat tctcggaaaa gatgctggca ctttaattga agacccagat 2040
gaaagcacat ccggagtgga gtccgctgtt ttgagaggat ttctcattct aggtaaggaa 2100
gatagaagat acggaccagc attaagcatc aatgaactga gcaaccttgc aaaaggagaa 2160
aaggctaatg tgctaattgg gcaaggagac gtggtgttgg taatgaaacg aaaacgggac 2220
tctagcatac ttactgacag ccagacagcg accaaaagaa ttcggatggc catcaat 2277
<210>25
<211>2277
<212>DNA
<213>甲型流感病毒
<220>
<221>PB2合成基因,针对大肠杆菌密码子使用进行优化
<222>(1)..(2274)
<400>25
atggaacgca ttaaagaact gcgcaacctg atgagccaga gccgtacccg tgaaattctg 60
accaaaacca ccgtggatca catggcgatc atcaaaaaat ataccagcgg ccgtcaggaa 120
aaaaatccga gcctgcgcat gaaatggatg atggcgatga aatatccgat caccgcggat 180
aaacgcatta ccgaaatggt gccggaacgt aatgaacagg gccagaccct gtggagcaaa 240
atgagcgatg cgggtagcga tcgtgttatg gttagcccgc tggcggttac ctggtggaat 300
cgtaatggtc cggttaccag caccgtgcat tatccgaaag tgtacaaaac ctatttcgat 360
aaagtggaac gcctgaaaca tggcaccttt ggcccggtgc attttcgtaa ccaggtgaaa 420
attcgtcgtc gcgtggatat taatccgggt catgcggatc tgagcgcgaa agaagcgcaa 480
gacgttatca tggaagttgt tttcccgaac gaagttggtg cgcgtattct gaccagcgaa 540
agccagctga ccatcaccaa agaaaaaaaa gaagaactgc aggattgcaa aattagcccg 600
ctgatggtgg cgtatatgct ggaacgtgaa ctggttcgta aaacccgttt tctgccggtt 660
gcgggtggca ccagcagcgt gtatattgaa gtgctgcatc tgacccaggg cacctgttgg 720
gaacagatgt ataccccggg tggtgaagtg cgtaacgatg atatcgatca gagcctgatt 780
attgcggcgc gtaacattgt tcgtcgtgcg agcgttagcg cggatccgct ggcgagcctg 840
ctggaaatgt gtcatagcac ccagattggt ggcacccgta tggttgatat tctgcgtcag 900
aacccgaccg aagaacaggc ggtggatatt tgtaaagcgg cgatgggtct gcgtattagc 960
agcagcttta gctttggcgg ctttaccttt aaacgtacca gcggcagcag cattaaacgt 1020
gaagaagaag tgctgaccgg taatctgcag accctgaaaa ttcgtgtgca cgaaggctat 1080
gaagaattca cgatggttgg caaacgtgcg accgcgattc tgcgtaaagc gacccgtcgt 1140
ctggttcagc tgattgtgag cggcaaagat gaacagagca ttgcggaagc gattatcgtt 1200
gcgatggttt tcagccagga agattgcatg attaaagcgg ttcgtggcga tctgaacttt 1260
gtgaaccgtg cgaaccagcg tctgaatccg atgcaccagc tgctgcgcca ttttcagaaa 1320
gatgcgaaag tgctgtttca gaactggggc atcgaacata tcgataacgt gatgggcatg 1380
gttggtgttc tgccggatat gaccccgagc accgaaatga gcatgcgtgg tattcgtgtg 1440
agcaaaatgg gcgtggatga atacagcagc accgaacgtg tggttgtgag cattgatcgt 1500
tttctgcgtg tgcgtgatca gcgtggtaat gttctgctga gcccggagga ggttagcgaa 1560
acgcacggca ccgaacgtct gaccattacc tatagcagca gcatgatgtg ggagattaac 1620
ggtccggaaa gcgtgctggt gaacacctat cagtggatca ttcgcaactg ggaaaccgtg 1680
aaaattcagt ggagccagaa tccgaccatg ctgtacaaca aaatggaatt cgaaccgttt 1740
cagagcctgg ttccgaaagc gattcgtggt cagtatagcg gttttgtgcg taccctgttt 1800
cagcagatgc gtgatgttct gggcaccttt gataccaccc agatcattaa actgctgccg 1860
tttgcggcgg caccgccgaa acagagccgt atgcagttta gcagcctgac cgtgaatgtt 1920
cgtggtagcg gcatgcgtat tctggttcgt ggtaacagcc cggtgttcaa ctataacaaa 1980
accaccaaac gcctgaccat tctgggtaaa gatgcgggca ccctgattga agatccggat 2040
gaaagcacca gcggcgttga aagcgcggtt ctgcgcggtt ttctgattct gggcaaggag 2100
gatcgtcgtt acggtccggc gctgagcatt aacgaactga gcaatctggc gaaaggcgaa 2160
aaagcgaacg ttctgattgg tcagggtgat gtggtgctgg tgatgaaacg taaacgcgat 2220
agcagcattc tgaccgatag ccagaccgcg accaaacgta ttcgtatggc gattaat 2277
<210>26
<211>2313
<212>DNA
<213>乙型流感病毒
<220>
<221>PB2
<222>(1)..(2313)
<400>26
atgacattgg ctaaaattga attgttaaaa caactgttaa gggacaatga agccaaaaca 60
gtattgaaac aaacaacggt agaccaatat aacataataa gaaaattcaa tacatcaaga 120
attgaaaaga acccttcatt aaggatgaag tgggcaatgt gttctaattt tcccttggct 180
ttgaccaagg gtgacatggc aaacagaatc cccttggaat acaagggaat acaacttaaa 240
acaaatgctg aagacatagg aaccaaaggc caaatgtgct caatagcagc agttacctgg 300
tggaatacat atggaccaat aggagatact gaaggtttcg aaaaagtcta cgaaagcttt 360
tttctcagaa agatgagact tgacaatgcc acttggggcc gaataacttt tggcccagtt 420
gaaagagtaa gaaaaagggt actgctaaac cctctcacta aggaaatgcc tccagatgaa 480
gcaagtaatg tgataatgga aatattgttc cctaaggaag caggaatacc aagagaatct 540
acttggatac atagggaact gataaaagaa aaaagagaaa aattgaaagg aacgatgata 600
actcccattg tactggcata catgcttgag agggaattgg ttgccaggag aaggttcctg 660
ccggtggcag gagcaacatc agctgagttc atagaaatgc tacactgctt acaaggtgaa 720
aattggagac aaatatacca cccgggaggg aataaactaa ctgaatctag gtctcaatcg 780
atgattgtgg cttgtagaaa gataatcaga agatcaatag tcgcatcaaa cccattggag 840
ctggctgtag aaattgcaaa caagactgtg atagatactg aacctttaaa atcatgtctg 900
acagccatag acggaggtga tgtcgcctgt gacataataa gagctgcatt aggactaaag 960
atcagacaaa gacaaagatt tggacgactt gaactaaaaa ggatatcagg aagaggattc 1020
aaaaatgatg aagaaatatt aatcgggaac ggaacaatac agaagattgg aatatgggac 1080
ggagaagagg agttccatgt aagatgtggt gaatgcaggg gaatattaaa aaagagcaaa 1140
atgagaatgg aaaaactact aataaattca gctaaaaagg aagacatgaa agatttaata 1200
atcttgtgca tggtattttc tcaagacact aggatgttcc aaggagtaag gggagaaata 1260
aattttctta atagagcagg ccaactttta tctccaatgt accaactcca aagatatttt 1320
ttgaatagaa gtaacgatct ctttgatcaa tgggggtatg aggaatcacc caaagcaagt 1380
gagctacatg ggataaatga attaatgaat gcatctgact acactttgaa aggggttgta 1440
gtaacaaaaa atgtgattga tgattttagt tctactgaaa cagaaaaagt atctataaca 1500
aaaaatctta gtttaataaa aagaactggg gaagtcataa tgggggccaa tgacgtaagt 1560
gaattagaat cacaagctca gctaatgata acatatgata cacctaagat gtgggagatg 1620
ggaacaacca aggaactggt gcaaaacacc tatcaatggg tgctaaaaaa tttggtaaca 1680
ctgaaggctc agtttcttct aggaaaagaa gacatgttcc aatgggatgc atttgaagca 1740
tttgaaagca taatccccca gaagatggct ggccaataca gtggatttgc aagagcagtg 1800
ctcaaacaaa tgagagacca agaggtcatg aaaactgacc agttcataaa gttgttgccc 1860
ttttgtttct caccaccaaa gttaaggagc aatggggagc cttatcagtt cttgaggctt 1920
gtattgaagg gaggaggaga aaatttcatc gaagtaagga aagggtctcc tctattctct 1980
tacaatccac aaacagaagt cctaactata tgcggcagaa tgatgtcatt aaaagggaaa 2040
attgaagatg aagaaaggaa tagatcaatg gggaatgcag tgttggcggg ttttcttgtt 2100
agtggcaagt atgacccaga tcttggagat ttcaaaacta ttgaagaact tgaaaagcta 2160
aaaccggggg agaaagcaaa catcttactt tatcaaggaa agcccgttaa agtagttaaa 2220
aggaaaagat atagtgcttt atccaatgac atttcacaag gaattaagag acaaagaatg 2280
acagttgagt ccatggggtg ggccttgagc taa 2313
<210>27
<211>2325
<212>DNA
<213>丙型流感病毒
<220>
<221>PB2
<222>(1)..(2325)
<400>27
atgtcttttc tattgacaat agcaaaggaa tacaaaagac tatgccaaga tgctaaggca 60
gctcaaatga tgacagtagg aactgtatca aactacacta cgttcaagaa atggactaca 120
tcaaggaagg aaaagaatcc ttcactaaga atgagatggg caatgagcag caaattccca 180
ataatagcta acaagagaat gctggaagaa gctcaaattc ctaaagaaca caacaatgta 240
gccctttggg aagacacaga agatgtttca aaaagggatc atgttcttgc aagcgcctct 300
tgtataaatt attggaattt ttgtggacct tgtgtcaaca attcagaagt gatcaaagaa 360
gtttataaat ctagatttgg aagattagaa agaaggaaag aaataatgtg gaaagaactt 420
agatttacat tagttgatag acaacgaaga agagttgaca ctcagcctgt agaacaaaga 480
ttgagaactg gagaaattaa agacttgcaa atgtggactt tgttcgaaga tgaagctcct 540
cttgctagca aatttatttt agacaattat ggtctagtca aagaaatgag atcaaagttt 600
gcaaacaaac ctctgaataa agaagtagtt gcacacatgt tagaaaaaca attcaatccg 660
gaaagtagat tcttgcctgt tttcggagct ataaggccag aaagaatgga attgatccat 720
gcattaggag gagaaacttg gatacaagaa gctaacactg cagggatttc caatgttgat 780
caaaggaaaa atgatatgag agcagtatgt aggaaagttt gtcttgcagc aaatgcaagt 840
ataatgaacg ccaaaagcaa actggttgag tatataaaaa gtacaagtat gagaattgga 900
gaaacagaaa gaaagcttga agaacttata cttgaaaccg atgatgtctc acctgaagta 960
acattatgta aatctgcttt aggaggacca ttaggaaaaa ctctatcttt tgggcccatg 1020
ctactcaaga aaatttctgg ttccggagta aaagttaaag atacagtata tatccaaggt 1080
gtcagagcag tacaatttga atactggagt gagcaagaag aattctatgg agaatataag 1140
tcagccaccg ctttattcag cagaaaggaa agatcactag aatggattac aataggagga 1200
ggaataaatg aagacagaaa gagacttcta gctatgtgca tgatattttg cagagatgga 1260
gattatttta aagacgcccc tgcaacaata acaatggcag atttaagtac gaagttagga 1320
agagaaattc catatcaata tgtgatgatg aattggatac aaaaatcaga agataatctc 1380
gaagccttat tatacagtag gggaattgta gaaaccaatc caggaaaaat ggggagctca 1440
atgggaattg atggttccaa aagagcaatt aaatctttaa gggctgtcac aatacaatca 1500
ggaaagattg acatgccaga atcaaaagaa aaaattcacc ttgagctctc tgataatctt 1560
gaagcatttg attcatcagg aagaattgtt gcaacaattt tagaccttcc tagtgacaaa 1620
aaggtaacat ttcaggatgt aagctttcaa catcctgatc tggcagtatt gagagatgag 1680
aaaacggcca taacaaaagg gtatgaagcg ctaatcaaaa ggctaggaac aggggacaat 1740
gatattcctt ccttaattgc aaagaaggat tatttgtctc tttataattt accagaagta 1800
aaattaatgg ctcccttaat cagacccaat agaaaaggag tttattccag agttgctaga 1860
aaattagtgt ctacacaagt tactactgga cattattcat tacatgaatt gataaaggtc 1920
ttacccttta cttatttcgc cccaaaacag ggaatgtttg aaggaaggct tttctttagc 1980
aacgatagct ttgttgagcc tggagtaaat aacaatgtat tttcttggag taaggctgac 2040
agttctaaaa tatattgtca tggaatagcg ataagggtac ctttagttgt tggagatgaa 2100
cacatggaca cttcgttagc actattagaa gggtttagtg tttgtgaaaa cgaccccaga 2160
gcaccaatgg taacaagaca agatttaatt gatgtgggat ttgggcaaaa agttagactc 2220
ttcgtaggcc aagggagcgt tagaaccttc aagcgaactg cctcacaaag ggctgcatca 2280
agcgatgtaa ataagaatgt gaaaaagata aagatgtcta actaa 2325
1/30
Claims (47)
1.可溶性多肽片段,其中所述多肽片段(i)来自流感病毒RNA依赖性RNA聚合酶亚基PB2或其变体,并且(ii)能够结合RNA帽或其类似物。
2.权利要求1的多肽片段,其中所述多肽片段被纯化至适于进行结晶的程度。
3.权利要求1或2的多肽片段,其中流感病毒RNA依赖性RNA聚合酶亚基PB2来自甲型、乙型或丙型流感病毒或其变体。
4.根据权利要求1至3任一项的多肽片段,其中
(i)N端与SEQ ID NO:1的PB2氨基酸序列中220位或更高位氨基酸相同或相对应,C端与其510位或更低位氨基酸相同或相对应,
(ii)N端与SEQ ID NO:2的PB2氨基酸序列的222位或更高位氨基酸相同或相对应,C端与其511位或更低位氨基酸相同或相对应,或者
(iii)N端与SEQ ID NO:3的PB2氨基酸序列的227位或更高位氨基酸相同或相对应,C端与其528位或更低位氨基酸相同或相对应,
以及以上的变体,其保留与RNA帽或其类似物相结合的能力。
5.根据权利要求4的多肽片段,其中所述多肽片段具有选自以下的氨基酸序列或者与其相对应:SEQ ID NO:4至13的氨基酸序列及其变体,其保留与RNA帽或其类似物相结合的能力。
6.包含权利要求1至5中任一项所述多肽片段以及RNA帽或其类似物的复合物。
7.根据权利要求6的复合物,其中所述帽类似物选自m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU和m7GpppUm。
8.根据权利要求6的复合物,其中所述多肽片段由SEQ ID NO:11的氨基酸序列组成,所述帽类似物是m7GTP,所述复合物具有如图18所示结构坐标定义的结构。
9.根据权利要求8的复合物,其中所述复合物具有空间群为C2221的晶型,晶胞尺寸为a=9.2nm,b=9.4nm;c=22.0nm(±0.3nm)。
10.根据权利要求8和9的复合物,其中所述晶体以为3.0埃或更高、优选2.4埃或更高的分辨率衍射X射线。
11.编码权利要求1至5中任一项所述分离多肽的分离的多核苷酸。
12.包含权利要求11所述分离多核苷酸的重组载体。
13.包含权利要求11所述分离多核苷酸或者权利要求12所述重组载体的重组宿主细胞。
14.鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋的全部或一部分相结合的化合物的方法,其包括下列步骤:
(a)构建如图18所示权利要求8所述复合物的结构坐标所定义的所述结合口袋的计算机模型;
(b)通过选自下列的方法选择潜在的结合化合物:
(i)将分子片段组装成所述化合物,
(ii)从小分子数据库中选择化合物,和
(iii)从头设计所述化合物的配体;
(c)利用计算工具进行所述化合物与所述结合口袋的计算机模型之间的拟合程序运算,以提供所述化合物在所述结合口袋中的能量最小化构型;以及
(d)评价所述拟合运算的结果,以对所述化合物与所述结合口袋模型之间的结合进行定量,由此评价所述化合物与所述结合口袋相结合的能力。
15.根据权利要求14的方法,其中所述结合口袋包含SEQ ID NO:1的PB2的氨基酸Phe323、His357和Phe404或与其相对应的氨基酸。
16.根据权利要求15的方法,其中所述结合口袋还包含SEQ ID NO:1的PB2的氨基酸Phe325、Phe330和Phe363或与其相对应的氨基酸。
17.根据权利要求15或16的方法,其中所述结合口袋还包含SEQ IDNO:1的PB2的氨基酸Glu361和Lys376或与其相对应的氨基酸。
18.根据权利要求15至17中任一项的方法,其中所述结合口袋还包含氨基酸Ser320、Arg332、Ser337和Gln406。
19.根据权利要求15至18中任一项的方法,其中所述结合口袋还包含SEQ ID NO:1的PB2的氨基酸Lys339、Arg355、Asn429和His432或与其相对应的氨基酸。
20.根据权利要求14的方法,其中所述结合口袋由图18中PB2SEQ ID NO:1的氨基酸Phe323、His357和Phe404的结构坐标来定义。
21.根据权利要求20的方法,其中所述结合口袋还由图18中PB2SEQID NO:1的氨基酸Phe325、Phe330和Phe363的结构坐标来定义。
22.根据权利要求20或21的方法,其中所述结合口袋还由图18中PB2SEQ ID NO:1的氨基酸Glu361和Lys376的结构坐标来定义。
23.根据权利要求20或22中任一项的方法,其中所述结合口袋还由图18中PB2SEQ ID NO:1的氨基酸Ser320、Arg332、Ser337和Gln406的结构坐标来定义。
24.根据权利要求20至23中任一项的方法,其中所述结合口袋还由图18中PB2SEQ ID NO:1的氨基酸Lys339、Arg355、Asn429和His432的结构坐标来定义。
25.根据权利要求20的方法,其中PB2多肽变体的结合口袋与所述结合口袋的氨基酸Phe323、His357和Phe404的主链原子具有不超过2.5埃的均方根差。
26.根据权利要求14至25中任一项的方法,其还包括下列步骤:
(e)合成所述化合物,并任选地将所述化合物或其可药用盐与一种或多种可药用赋形剂和/或载体配制在一起。
27.根据权利要求26的方法,其还包括下列步骤:
(f)将所述化合物、权利要求1至4中任一项的多肽片段或者根据权利要求12的重组宿主细胞与RNA帽或其类似物相接触,以确定所述化合物抑制所述PB2多肽片段与所述RNA帽或其类似物之间结合的能力。
28.可通过权利要求14至27的方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮、T-705或m7Gppp(N)1-15,其中N是A、Am、G、Gm、C、Cm、U或Um,并且能与PB2或其变体的RNA帽结合口袋结合。
29.可通过权利要求14至27的方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮、T-705或m7Gppp(N)1-15,其中N是A、Am、G、Gm、C、Cm、U或Um,并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。
30.一种鉴定与PB2的RNA帽结合口袋或者PB2多肽变体的结合口袋相结合的化合物的方法,包括以下步骤:(i)将权利要求1至4的所述多肽片段或权利要求13的所述重组宿主细胞与测试化合物相接触,以及(ii)分析所述测试化合物结合PB2的能力。
31.根据权利要求30的方法,其还包括添加RNA帽或其类似物的步骤。
32.根据权利要求31的方法,其中分析所述测试化合物在所述RNA帽或其类似物存在下与PB2或其变体结合的能力,或者分析所述测试化合物抑制所述RNA帽或其类似物与PB2或其变体结合的能力。
33.根据权利要求31或32的方法,其中所述RNA帽或其类似物在添加所述测试化合物之前、同时或之后添加。
34.根据权利要求30至33中任一项的方法,其以高通量形式进行。
35.根据权利要求30至34中任一项的方法,其中所述测试化合物是小分子。
36.根据权利要求30至34中任一项的方法,其中所述测试化合物是肽或蛋白质。
37.根据权利要求26、27或者30至36中任一项的方法,其中所述方法还包括将所述化合物或其可药用盐与一种或多种可药用赋形剂和/或载体配制在一起的步骤。
38.可根据权利要求27或37的方法产生的药物组合物。
39.可通过权利要求30至37中任一项的方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮、T-705或m7Gppp(N)1-15,其中N是A、Am、G、Gm、C、Cm、U或Um,并且能与PB2多肽、其变体或其片段结合。
40.可通过权利要求29至36中任一项的方法鉴定的化合物,前提为所述化合物不是m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9-(4-羟基丁基)-1,9-二氢嘌呤-6-酮、T-705或m7Gppp(N)1-15,其中N是A、Am、G、Gm、C、Cm、U或Um,并且能够抑制PB2多肽、其变体或其片段与RNA帽或其类似物之间的结合。
41.针对PB2的RNA帽结合结构域的抗体。
42.根据权利要求41的抗体,其中所述抗体识别选自SEQ ID NO:14至22所定义多肽的多肽片段。
43.根据权利要求28、29、39或40的化合物、根据权利要求36的药物组合物或者根据权利要求41或42的抗体在制备用于治疗、改善或预防负链ssRNA病毒感染引起的疾病的药物中的用途。
44.根据权利要求43的用途,其中所述疾病是由包含博尔纳病毒科(Bornaviridae)、丝状病毒科(Filoviridae)、副粘病毒科(Paramyxoviridae)和弹状病毒科(Rhabdoviridae)的单链负链病毒目(Mononegavirales)的病毒感染引起的。
45.根据权利要求43的用途,其中所述疾病由正粘病毒科(Orthomyxoviridae)、沙粒病毒科(Arenaviridae)或布尼亚病毒科(Bunyaviridae)引起。
46.根据权利要求43的用途,其中所述疾病由选自以下的病毒引起:博纳病毒、马尔堡病毒、埃博拉病毒、仙台病毒、腮腺炎病毒、麻疹病毒、人呼吸道合胞病毒、火鸡鼻气管炎病毒、印第安纳型水疱性口炎病毒、尼帕病毒、亨德拉病毒、狂犬病毒、牛流行热病毒、感染性造血组织坏死病毒、索戈托病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、汉坦病毒、克里米亚-刚果出血热病毒、裂谷热病毒和La Crosse病毒
47.根据权利要求43的用途,其中所述疾病由选自以下的病毒引起:甲型流感病毒、乙型流感病毒、丙型流感病毒、索戈托病毒和汉坦病毒。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US99839807P | 2007-10-09 | 2007-10-09 | |
US60/998,398 | 2007-10-09 | ||
US7079208P | 2008-03-25 | 2008-03-25 | |
US61/070,792 | 2008-03-25 | ||
US12345608P | 2008-04-08 | 2008-04-08 | |
US61/123,456 | 2008-04-08 | ||
PCT/EP2008/008543 WO2009046983A1 (en) | 2007-10-09 | 2008-10-09 | Soluble fragments of influenza virus pb2 protein capable of binding rna-cap |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101970465A true CN101970465A (zh) | 2011-02-09 |
CN101970465B CN101970465B (zh) | 2016-03-16 |
Family
ID=40364724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880119968.9A Expired - Fee Related CN101970465B (zh) | 2007-10-09 | 2008-10-09 | 能够结合rna帽的流感病毒pb2蛋白可溶性片段 |
Country Status (11)
Country | Link |
---|---|
US (1) | US9045248B2 (zh) |
EP (2) | EP2574619A3 (zh) |
JP (3) | JP5725861B2 (zh) |
KR (1) | KR101672554B1 (zh) |
CN (1) | CN101970465B (zh) |
AU (1) | AU2008309939B2 (zh) |
CA (1) | CA2701362A1 (zh) |
ES (1) | ES2454773T3 (zh) |
IL (3) | IL204891A (zh) |
SG (1) | SG185289A1 (zh) |
WO (1) | WO2009046983A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105002149A (zh) * | 2014-04-22 | 2015-10-28 | 中国科学院生物物理研究所 | 流感病毒rna聚合酶纯化或结晶的方法 |
CN105018441A (zh) * | 2014-04-22 | 2015-11-04 | 中国科学院生物物理研究所 | 流感病毒rna聚合酶结晶的方法 |
US10792275B2 (en) | 2016-04-13 | 2020-10-06 | Sinoclone Ltd | Inhibiting binding of influenza-virus PB2 subunit to RNA cap |
CN111944864A (zh) * | 2020-08-20 | 2020-11-17 | 深圳市瑞吉生物科技有限公司 | 一种新型Cap2结构5′帽子类似物及其制备方法 |
CN114741315A (zh) * | 2022-04-28 | 2022-07-12 | 深圳市紫光同创电子有限公司 | 用例更新方法、装置、电子设备及存储介质 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2701362A1 (en) * | 2007-10-09 | 2009-04-16 | European Molecular Biology Laboratory (Embl) | Soluble fragments of influenza virus pb2 protein capable of binding rna-cap |
GEP20207129B (en) | 2009-06-17 | 2020-07-10 | Vertex Pharma | Inhibitors of influenza viruses replication |
KR20130075726A (ko) * | 2010-03-16 | 2013-07-05 | 유럽피안 몰레큘러 바이올로지 래보러토리 | 유행성 인플루엔자 바이러스 a 2009 h1n1로부터의 rna 의존성 rna 폴리머라제의 pa 아단위의 단편 및 이의 용도 |
RU2013132681A (ru) | 2010-12-16 | 2015-01-27 | Вертекс Фармасьютикалз Инкорпорейтед | Ингибиторы репликации вирусов гриппа |
UA118010C2 (uk) | 2011-08-01 | 2018-11-12 | Вертекс Фармасьютікалз Інкорпорейтед | Інгібітори реплікації вірусів грипу |
AU2013292617A1 (en) * | 2012-07-19 | 2015-01-22 | Zoetis Llc | Bovine influenza C virus compositions |
LT3421468T (lt) | 2013-11-13 | 2021-01-11 | Vertex Pharmaceuticals Incorporated | Gripo virusų replikacijos inhibitorių paruošimo būdai |
HUE044667T2 (hu) | 2013-11-13 | 2019-11-28 | Vertex Pharma | Influenza vírus replikáció inhibitorok |
WO2016183116A1 (en) | 2015-05-13 | 2016-11-17 | Vertex Pharmaceuticals Incorporated | Methods of preparing inhibitors of influenza viruses replication |
EP3294735B8 (en) | 2015-05-13 | 2022-01-05 | Vertex Pharmaceuticals Incorporated | Inhibitors of influenza viruses replication |
CL2018003871A1 (es) * | 2018-12-28 | 2021-01-15 | Univ Pontificia Catolica Chile | Anticuerpos monoclonales específicos para el antígeno pb2 del virus de la influenza humana (flu), secuencias nucleotídicas; método y kit de diagnóstico de infección producida por flu |
WO2020239822A1 (en) | 2019-05-27 | 2020-12-03 | The European Molecular Biology Laboratory | Nucleic acid construct binding to influenza polymerase pb1 rna synthesis active site |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5837852A (en) * | 1993-10-14 | 1998-11-17 | Bristol-Myers Squibb Company | Capped nucleic acid oligomers that inhibit cap-dependent transcription of the influenza virus endonuclease |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2701362A1 (en) * | 2007-10-09 | 2009-04-16 | European Molecular Biology Laboratory (Embl) | Soluble fragments of influenza virus pb2 protein capable of binding rna-cap |
JP6614523B2 (ja) * | 2014-03-28 | 2019-12-04 | 地方独立行政法人神奈川県立産業技術総合研究所 | インフルエンザウイルスのrna依存性rnaポリメラーゼのpb2サブユニットに対するモノクローナル抗体 |
-
2008
- 2008-10-09 CA CA2701362A patent/CA2701362A1/en not_active Abandoned
- 2008-10-09 WO PCT/EP2008/008543 patent/WO2009046983A1/en active Application Filing
- 2008-10-09 EP EP12175945.0A patent/EP2574619A3/en not_active Withdrawn
- 2008-10-09 ES ES08838119.9T patent/ES2454773T3/es active Active
- 2008-10-09 JP JP2010528317A patent/JP5725861B2/ja not_active Expired - Fee Related
- 2008-10-09 SG SG2012075354A patent/SG185289A1/en unknown
- 2008-10-09 CN CN200880119968.9A patent/CN101970465B/zh not_active Expired - Fee Related
- 2008-10-09 EP EP08838119.9A patent/EP2197901B1/en not_active Not-in-force
- 2008-10-09 KR KR1020107008765A patent/KR101672554B1/ko active IP Right Grant
- 2008-10-09 AU AU2008309939A patent/AU2008309939B2/en not_active Ceased
- 2008-10-09 US US12/681,974 patent/US9045248B2/en not_active Expired - Fee Related
-
2010
- 2010-04-06 IL IL204891A patent/IL204891A/en not_active IP Right Cessation
-
2012
- 2012-11-12 IL IL222997A patent/IL222997A0/en unknown
-
2014
- 2014-10-08 JP JP2014207447A patent/JP5937169B2/ja not_active Expired - Fee Related
-
2015
- 2015-03-23 IL IL237903A patent/IL237903A/en not_active IP Right Cessation
-
2016
- 2016-05-10 JP JP2016094331A patent/JP6309563B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5837852A (en) * | 1993-10-14 | 1998-11-17 | Bristol-Myers Squibb Company | Capped nucleic acid oligomers that inhibit cap-dependent transcription of the influenza virus endonuclease |
Non-Patent Citations (3)
Title |
---|
AYAE HONDA ET AL: "Two separate sequences of PB2 subunit constitute the RNA cap-binding site of influenza virus RNA polymerse", 《GENES TO CELLS》 * |
PIERRE FECHTER ET AL: "Recoginition of mRNA cap structures by viral and cellular proteins", 《JOURNAL OF GENERAL VIROLOGY》 * |
PIERRE FECHTER ET AL: "Two Aromotic Residues in the PB2 Subunit of Influenza A RNA Polymerase Are Crucial for Cap Binding", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105002149A (zh) * | 2014-04-22 | 2015-10-28 | 中国科学院生物物理研究所 | 流感病毒rna聚合酶纯化或结晶的方法 |
CN105018441A (zh) * | 2014-04-22 | 2015-11-04 | 中国科学院生物物理研究所 | 流感病毒rna聚合酶结晶的方法 |
CN105002149B (zh) * | 2014-04-22 | 2018-04-06 | 中国科学院生物物理研究所 | 流感病毒rna聚合酶纯化或结晶的方法 |
US10792275B2 (en) | 2016-04-13 | 2020-10-06 | Sinoclone Ltd | Inhibiting binding of influenza-virus PB2 subunit to RNA cap |
CN111944864A (zh) * | 2020-08-20 | 2020-11-17 | 深圳市瑞吉生物科技有限公司 | 一种新型Cap2结构5′帽子类似物及其制备方法 |
CN111944864B (zh) * | 2020-08-20 | 2021-06-22 | 深圳市瑞吉生物科技有限公司 | 一种Cap2结构5'帽子类似物及其制备方法 |
CN114741315A (zh) * | 2022-04-28 | 2022-07-12 | 深圳市紫光同创电子有限公司 | 用例更新方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2011501942A (ja) | 2011-01-20 |
ES2454773T3 (es) | 2014-04-11 |
CA2701362A1 (en) | 2009-04-16 |
SG185289A1 (en) | 2012-11-29 |
JP5725861B2 (ja) | 2015-05-27 |
IL237903A (en) | 2017-10-31 |
JP6309563B2 (ja) | 2018-04-11 |
EP2574619A3 (en) | 2013-07-31 |
JP2016176955A (ja) | 2016-10-06 |
IL204891A (en) | 2015-04-30 |
IL222997A0 (en) | 2012-12-31 |
AU2008309939A1 (en) | 2009-04-16 |
JP5937169B2 (ja) | 2016-06-22 |
EP2574619A2 (en) | 2013-04-03 |
AU2008309939B2 (en) | 2013-11-14 |
JP2015062417A (ja) | 2015-04-09 |
US20110008348A1 (en) | 2011-01-13 |
KR20100074212A (ko) | 2010-07-01 |
EP2197901B1 (en) | 2013-12-11 |
EP2197901A1 (en) | 2010-06-23 |
IL204891A0 (en) | 2010-11-30 |
CN101970465B (zh) | 2016-03-16 |
WO2009046983A1 (en) | 2009-04-16 |
US9045248B2 (en) | 2015-06-02 |
KR101672554B1 (ko) | 2016-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101970465B (zh) | 能够结合rna帽的流感病毒pb2蛋白可溶性片段 | |
US20180010109A1 (en) | Polypeptide fragments comprising endonuclease activity and their use | |
US20180044649A1 (en) | Influenza a 2009 pandemic h1n1 polypeptide fragments comprising endonuclease activity and their use |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160316 Termination date: 20181009 |
|
CF01 | Termination of patent right due to non-payment of annual fee |