具体实施方式
下面通过实施例详细描述本发明。本领域的普通技术人员可以理解,下述实施例仅是用于举例说明的目的。本发明的精神和范围由后附的权利要求所限定。
实施例1:单克隆抗体CC4的制备及鉴定。
应用杂交瘤技术(Kohler and Milstein 1975;Yeh,Hellstrom et al.1979;Yeh,Hellstrom et al.1982)产生并筛选获得抗体CC4。简述如下:以人结直肠癌细胞LS 174T活细胞(ATCC)为抗原免疫BALB/c小鼠(北京实验动物中心),经4次加强免疫后将小鼠杀死,取脾脏,并将脾细胞悬浮于RPMI培养基中。在聚乙二醇(PEG)存在下,将脾细胞和SP2/0-Ag14鼠骨髓瘤细胞(ATCC)进行融合,并用HAT选择性培养基对杂交瘤进行筛选。具体方法见参考文献(Kohler and Milstein 1975)。
用培养于96孔细胞培养板内并经固定的LS 174T细胞作为抗原,ELISA法筛选各杂交瘤细胞培养上清。细胞ELISA方法简介如下:(1)将LS 174T细胞接种于96孔细胞培养板,培养至近于汇片(sub-confluence);
(2)吸去96孔细胞培养板中的培养基,PBS洗涤细胞,用-20℃预冷的丙酮/甲醇(1∶1)固定孔内的细胞,1min;吸去固定剂,PBS洗涤;
(3)用PBS配制的5%脱脂牛奶加入各孔至满,室温孵育1h封闭,PBS洗涤;
(4)将收集的各个杂交瘤细胞克隆的培养上清50μl分别加入各孔中,室温孵育1h,PBS洗涤三次;
(5)各孔内加入PBS稀释(1∶5000稀释)的HRP-羊抗鼠IgG(SantaCruz)50μl,室温孵育1h,PBS洗涤三次;
(6)各孔内加入底物(200ng/ml TMB(Ameresco),0.03%H2O2(北京化学试剂公司),pH4.5)显色,用酶标仪测定各孔在450nm处的光吸收值。选择读数高的克隆进行进一步的鉴定实验。
在细胞ELISA实验中,杂交瘤克隆cc4分泌的抗体CC4表现出与靶细胞强烈而稳定的结合。将单克隆抗体杂交瘤细胞株cc4(其分泌抗体CC4)于2008年5月19日保藏于中国微生物菌种保藏管理委员会普通微生物中心(CGMCC,中国,北京,朝阳区大屯路,中国科学院微生物研究所),保藏号为CGMCC No.2504。
大量培养扩增杂交瘤细胞cc4,收集含有CC4抗体的培养上清;同时将杂交瘤细胞cc4用无血清RPMI-1640培养基制成细胞悬液,用于制备抗体腹水。腹水制备方法如下:取6-8周周龄的BALB/c小鼠,腹腔注射0.5ml降植烷(Pristane),10天后腹腔注射5×106个杂交瘤细胞,两周后处死小鼠,抽取小鼠腹水,保存于-70℃。
用Protein A Sepharose Fast Flow(Amersham Pharmacia)从杂交瘤培养上清或小鼠腹水中纯化小鼠抗体,纯化方法参见产品说明书。
应用BD Pharmingen公司鼠抗体亚型鉴定试剂盒(目录号550487),ELISA方法鉴定出抗体CC4属于IgG1,κ亚型,如图1所示。
实施例2:单克隆抗体CC4对肿瘤组织及肿瘤细胞的特异性研究。
为系统研究本发明所述单克隆抗体CC4对人体正常和肿瘤组织的结合特异性,应用免疫组化的方法筛选了29例人正常组织和24例人肿瘤组织的冰冻切片标本。
具体实验方法如下:将人正常组织或肿瘤组织用OCT(冰冻组织包埋液,Sakura提供)包埋,进行冰冻切片。切片在预冷的丙酮里固定5分钟,然后在含有0.3%H2O2的甲醇中室温闭光孵育30分钟去除内源性过氧化物酶的干扰。PBS洗涤三次之后,用5%马血清(北京中杉金桥,PBS稀释马血清)封闭切片,然后分别在含有CC4和不含有CC4(阴性对照)的一抗稀释液(1∶2000封闭液稀释)中4℃孵育过夜。之后用生物素标记的二抗(生物素偶联的羊抗鼠IgG,Vector公司,1∶1000封闭液稀释)和辣根过氧化物酶偶联的链霉抗生物素蛋白作为三抗(Vector, 1∶1000PBS稀释),37℃孵育组织切片,最后用新鲜配置的DAB显色试剂盒(北京中杉金桥,产品编号:ZLI-9033)显色。显色完毕之后用苏木素复染细胞核。
如表1所示,CC4在正常组织中的分布主要包括胃粘膜上皮细胞、小肠和大肠等的腺上皮细胞、肝细胞、宫颈鳞状上皮及前列腺的腺上皮等,在所有检测过的正常组织标本中的阳性率为11/29,胃、肠、肝和子宫的阳性率为7/16。CC4与所测试的绝大多数肿瘤组织有结合,阳性率为22/24,主要集中于消化道肿瘤以及生殖系统肿瘤,其中,胃癌、结肠癌、肝癌和子宫内膜癌的阳性率为15/16;而且,CC4与肿瘤组织的结合信号强度普遍高于与相应正常组织的结合信号,证实了CC4与肿瘤组织的特异性结合。
表1单克隆抗体CC4对肿瘤组织特异性的免疫组化分析
正常组织 |
阳性例数/总例数 |
肿瘤组织 |
阳性例数/总例数 |
胃 |
1/3 |
胃癌 |
2/2 |
肠 |
2/8 |
结肠癌 |
7/7 |
肝 |
1/1 |
肝癌 |
3/3 |
子宫 |
3/7 |
子宫内膜癌 |
3/4 |
大脑 |
0/1 |
肺癌 |
1/2 |
心脏 |
0/2 |
食管癌 |
1/1 |
脾 |
2/2 |
卵巢癌 |
4/4 |
胰 |
0/2 |
乳腺癌 |
1/1 |
肾 |
1/2 |
|
|
甲状腺 |
0/1 |
|
|
睾丸 |
0/1 |
|
|
前列腺 |
1/1 |
|
|
膀胱 |
0/1 |
|
|
CC4与肝癌和结肠癌肿瘤组织表现出尤为强烈的结合。以结直肠癌为例,如图2所示,CC4对于结直肠癌组织的典型着色可以看出,CC4主要结合在腺上皮细胞胞浆内(如图2的箭头所示),同时在上皮围成的腔 内和基底膜外也有弥漫的信号存在(如图2的箭头所示)。除此之外,CC4还与肝癌组织癌细胞、胃癌组织的胃粘膜,子宫内膜癌组织的内膜等上皮组织有结合(结果未显示)。
用细胞免疫荧光等实验手段,以CC4为一抗,以FITC-羊抗鼠IgG为二抗,检测了单克隆抗体CC4与人肿瘤细胞系的结合。
简单方法如下:
(1)培养在盖玻片上的单层细胞用-20℃预冷的丙酮/甲醇(1∶1)或4%甲醛固定1min,PBS洗涤;
(2)5%(v/v)羊血清(北京中杉金桥)封闭,室温,30min;
(3)稀释1000倍的单抗CC4腹水与样本孵育,室温,1h,PBS洗涤三次;
(4)400倍稀释的FITC-羊抗鼠IgG(Sigma)与样本孵育,室温,30min,PBS洗涤三次;
(5)用普通荧光显微镜或激光共聚焦激光扫描显微镜观察样本,拍照。
如表2所示,在检验的16株肿瘤细胞中,CC4与其中的8株有特异性结合。这8株细胞分别属于结直肠癌、肝癌和胰腺癌。可以看出大部分的结直肠癌细胞都表达CC4抗原,能够被CC4识别。
表2免疫荧光分析单克隆抗体CC4对人肿瘤细胞的特异性
*上列所有癌细胞系均来自ATCC。
图3显示了免疫荧光实验中,CC4与两株结直肠癌细胞LS 174T和SW1116的结合。可以看出,CC4抗原分布在细胞膜上,在细胞的接触面上有更显著的表达(如图3的箭头所示)。这一结果提示,CC4抗原可能与细胞间黏附有关。
实施例3:单克隆抗体CC4的抗原鉴定。
应用免疫印迹的实验方法发现CC4识别存在于LS 174T细胞及结直肠癌组织中的大小为130kD的蛋白。具体操作如下:收集与CC4强烈结合的人源结直肠癌细胞LS 174T(ATCC),用预冷的PBS洗涤细胞两遍,4℃800rpm离心5分钟,细胞沉淀用裂解液(Tris-HCl 50mM pH 8.0,NaCl150mM,EDTA 1mM,NP-40 1%,Glycerol 10%,PMSF 100μg/ml)裂解细胞,4℃12000g离心15分钟,收集上清,分别加入含有DTT(终浓度100mM)(二硫苏糖醇)和不含有DTT的上样缓冲液(5x上样缓冲液:0.313MTris-HCl,pH6.8,10%SDS,0.05%溴酚蓝,50%甘油),100℃煮样。10%SDS-PAGE分离全细胞蛋白,之后半干电转移至硝酸纤维素膜。5%脱脂牛奶封闭后,用CC4腹水作为一抗(1∶10000用封闭液5%脱脂牛奶/TBST稀释)4℃孵育膜过夜,然后用辣根过氧化物酶偶联的羊抗鼠IgG二抗(Pierce,1∶2000封闭液5%脱脂牛奶/TBST稀释)室温孵育1小时,用Pierce公司提供的显色底物(产品编号:34076,400μl 3%H2O2+400μlLuminol溶液/miniblot)检测。如图4所示,CC4在还原和非还原状态下结合LS 174T细胞裂解液中130kD左右的蛋白。证明CC4结合的抗原表位是一个不依赖于二硫键的线性表位。而且CC4识别条带呈现弥散状, 结合CC4靶抗原的细胞膜分布形式,提示CC4靶抗原可能存在较高程度的糖基化。
接着利用免疫沉淀的办法在LS 174T细胞裂解液中富集CC4靶抗原,并进行胶内酶解和液相色谱-质谱(LC-MS)鉴定该靶抗原。
免疫沉淀的具体方法简述如下:5×107LS 174T(同上)细胞在2mL冰预冷的上述裂解液中裂解30分钟,4℃12000g离心15分钟,收集上清。先加入20μl 50%slurry(50%与PBS或TE混合)的protein A-Agarose(SantaCruz),进行预清除。然后分别加入5μg CC4和正常鼠IgG(Sigma),4℃孵育过夜。之后加入50μl 50%slurry的protein A-Agarose捕获抗原-抗体复合物,用PBS洗涤沉淀三次,加入80μl 1x上样缓冲液(将上述5x上样缓冲液稀释5倍),100℃加热煮样10分钟。蛋白沉淀用免疫印迹的方法检测(实验方法同上所述),CC4作为检测一抗。
如图5所示,用CC4免疫沉淀富集了CC4靶抗原,而阴性对照小鼠IgG不能捕获CC4靶抗原(泳道5和6)。并且经过CC4免疫沉淀之后的细胞裂解液中,CC4靶抗原含量下降明显(泳道3)也反映了CC4抗体富集靶抗原的效率。
用SDS-PAGE分离CC4靶抗原之后,银染色,切取胶上130kD条带,利用胰酶进行胶内酶解,用LC-MS方法鉴定抗原蛋白。
具体操作如下:
(1).将所选择的胶条带用1.5mm切胶笔切下,并切成1mm3大小的碎块,置于eppendorf(EP)管或96孔PCR板中;
(2).加50μL DD.H2O洗两次,10min/次;
(3).加100mmol硫代硫酸钠和30mmol铁氰化钾(1∶1)溶液50μL,超声脱色5min或37℃脱色20min,吸干;
(4).重复步骤3,直至颜色褪去;
(5).加乙腈50μL脱水至胶粒完全变白,真空抽干5min;
(6).加10mM DTT(10μL 1M DTT,990μL 25mM NH4HCO3配制)20μL,56℃水浴1hr;
(7).冷却到室温后,吸干,快速加55mM IAM(55μL 1M IAM,945μL 25mM NH4HCO3配制)20μL,置于暗室45min;
(8).依次用25mM NH4HCO3、50%乙腈溶液和乙腈洗,乙腈脱水到胶粒完全变白为止,真空抽干5min;
(9).将0.1μg/μL的酶储液以25mM NH4HCO3稀释10倍,每EP管加2μL,稍微离心一下,让酶液充分与胶粒接触,4℃或冰上放置30min,待溶液被胶块完全吸收,加25mM NH4HCO3 10-15μL置37℃,消化过夜;
(10).加入2%FA(甲酸)终止反应,使FA终浓度为0.1%,振荡混匀,离心。
(11).将上清吸取20μl,上机检测。(中国科学院生物物理所质谱平台,LC-MS蛋白鉴定服务)。
(12).通过在线工具及在线软件可以鉴定蛋白序列。
Masco(http:∥www.matrixscience.com/search_form_select.html)
蛋白鉴定结果如表3所示,符合理论预测的4个肽段被鉴定出来,蛋白则被鉴定为CEACAM5,得分40.34,分子量76,795。
表3LC-MS鉴定的CC4抗原肽段列表
进一步的实验证实了CC4的靶抗原就是CEA蛋白(即CEACAM5)。从武汉三鹰生物技术有限公司购买CEACAM5的cDNA(克隆在pCMV-SPORTS6载体上),序列为SEQ ID NO:11所示,将CEACAM5亚克隆至pcDNA3.1(-)b(Invitrogen),利用限制性内切酶NotI和HindIII(NEB提供)及引物5’-AAA TAT GCG GCC GCA TGG AGT CTC CCTCGG CCC-3’(SEQ ID NO:12)和5’-CCC AAG CTT GGC TGC TAT ATCAGA GCAAC-3’(SEQ ID NO:13)。
将构建好的pcDNA3.1(-)b-CEACAM5质粒以Lipofectamine 2000(Invitrogen)介导转染至CC4不结合的人膀胱癌细胞T2-4(ATCC)中。方法简介如下:
(1).以1-3×105细胞/孔的密度接种T2-4细胞至六孔板,37℃培养过夜,细胞生长至70-80%汇片。
(2).将5μl Lipofectamine2000(Invitrogen)稀释到125μl的Opti-MEM(Gibco)中,混合均匀。
(3).将2μg质粒DNA稀释到另一125μl的DMEM(Gibco)中混合均匀,室温孵育5分钟。
(4).将上述两种稀释液混合均匀,室温孵育20分钟。
(5).将混合液逐滴滴加到细胞培养板各孔中,摇动培养板使其均匀混合。48小时后收集细胞进行流式细胞术检测。
用CC4抗体分别对转染CEACAM5 cDNA及空载体的T2-4细胞进行流式细胞术检测。方法简述如下:
(1)用0.03%EDTA消化细胞,用含有0.1%BSA的PBS(PBSB)洗涤,重悬,细胞浓度约106/ml;
(2)加入1000倍稀释的CC4腹水做一抗,以加入正常小鼠IgG(Sigma)的细胞作为空白对照;4℃孵育45分钟;PBSB洗涤;
(3)加入400倍稀释的FITC-羊抗鼠IgG(Sigma),4℃避光孵育30分钟;PBSB洗涤;
(4)将细胞重悬于PBS,FACS检测。
结果如图6所示,转染空载体的T2-4/Control不能被CC4抗体所识别,但转染T2-4/CEACAM5的细胞却能够被CC4强烈结合。这一实验证实了CC4对CEACAM5蛋白的特异性结合。
实施例4:抗体CC4的抗原表位鉴定
运用分别重组表达的人CEA蛋白(即CEACAM5)胞外区段的不同缺失突变体,以及免疫印迹的实验方法鉴定了本发明所述的抗体CC4识别的抗原表位。
如图7所示,结构域1-3分别表示CEA最靠近胞外N端的三个结构域。重叠的序列被设计来防止可能的表位丢失。结构域1(序列为SEQ IDNO:1的人CEA序列中的位置35-155的氨基酸,如SEQ ID NO:14所示)、结构域2(序列为SEQ ID NO:1的人CEA序列中的位置139-273的氨基 酸,如SEQ ID NO:15所示)以及结构域3(序列为SEQ ID NO:1的人CEA序列中的位置230-355的氨基酸,如SEQ ID NO:16所示)分别克隆在pET32a(Novagen)上,表达出来的分别是Trx-His6-S tag融合的Trx-His6-S-D1,Trx-His6-S-D2和Trx-His6-S-D3。
克隆过程简述如下:用相应的一对引物D1S和D1A(用于结构域1),D2S和D2A(用于结构域2),D3S和D3A(用于结构域3),及模板pcDNA3.1(-)b-CEA(如前实施例3所述)作PCR反应,条件为95℃5分钟;95℃45秒,56℃40秒,72℃50秒,30个循环;72℃5分钟。分别扩增出编码结构域1-3的核苷酸序列。
引物列表如下,正义链引物带有Nco I酶切位点(如下划线所示),反义链引物带有Hind III酶切位点(如下划线所示):
引物名称引物序列5’至3’
D1S 5’catgCCATGGctAAGCTCACTATTGAATCCAC 3’(SEQ IDNO:17)
D1A 5’cccAAGCTTttaTTTGGAGTTGTTGCTGGAGA 3’(SEQID NO:18)
D2S 5’catgCCATGGctCGGGTATACCCGGAGCTGC 3’(SEQ IDNO:19)
D2A 5’cccAAGCTTttaGACAAACCAAGAGTACTGTG 3’(SEQID NO:20)
D3S 5’catgCCATGGctATCCTGAATGTCCTCTATGG 3’(SEQ IDNO:21)
D3A 5’cccAAGCTTttaCAGGTAGGTTGTGTTCTGAA 3’(SEQID NO:22)
PCR产物用2%琼脂糖凝胶(Biowest Agarose)分离,用Tiangen公司提供的琼脂糖凝胶DNA回收试剂盒(产品编号:DP209-03)回收PCR产物,然后用Takara公司提供的pMD18 T-simple kit将片段连接到T载体(试剂盒内提供了载体和酶)上,并转化Top10感受态细胞(Tiangen提供)。加有氨苄青霉素的LB培养板上长出来的单克隆D1-T(插入了结构 域1的核苷酸序列),D2-T(插入了结构域2的核苷酸序列)和D3-T(插入了结构域3的核苷酸序列),用带有氨苄青霉素的LB培养基培养37℃过夜,并用Tiangen提供的质粒小提试剂盒(产品编号:DP103-03)抽提质粒,用Nco I和Hind III(NEB)双酶切pET32a、提取的质粒(即分别插入了结构域1-3的核苷酸序列的T载体)。之后用2%琼脂糖凝胶(Biowest Agarose)分离,用Tiangen公司提供的琼脂糖凝胶DNA回收试剂盒(产品编号:DP209-03)回收T载体的酶切小片段(即结构域1-3的核苷酸序列)及pET32a酶切开的质粒片段。D1-T,D2-T及D3-T的酶切小片段与pET32a酶切开的质粒片段连接,用NEB公司提供的T4DNA连接酶建立连接反应,16℃连接过夜。转化Top10感受态细胞(Tiangen),pET32a-D1,pET32a-D2和pET32a-D3用含氨苄霉素(100ng/ml)的半固体LB培养板筛选。过夜培养获得的单克隆分别用含有抗生素的LB培养基培养,并抽提质粒,获得的质粒用于转化Bl21(DE3)感受态细胞(Tiangen)。
重组蛋白Trx-His6-S-D1(简称D1),Trx-His6-S-D2(简称D2)和Trx-His6-S-D3(简称D3)的诱导表达:转化了pET32a-D1,pET32a-D2和pET32a-D3的Bl21(DE3)单克隆,在含有相应抗生素的5ml LB培养液中37℃培养过夜。过夜菌1∶100接种至相应新鲜的培养基中37℃培养,待细菌生长至OD600为0.6时,加入1mM IPTG(Ameresco)37℃诱导表达6小时或者0.2mM IPTG 16℃诱导过夜。图8的左图显示了重组表达的D1-3蛋白。
D1,D2和D3由IPTG诱导表达之后,大部分呈现可溶状态,用Ni柱纯化。具体方法如下:菌体重悬于25mM Tris-HCl(pH7.4),300W超声2×99个循环,每个循环超声4秒,暂停8秒,共12秒。4℃12000g离心30分钟,收集上清,过0.45mm滤膜去除杂质。Ni-NTA sepharose 6 Fast Flow(GE Health Care)填柱,用超纯水洗涤后,在50mM Tris-HCl(pH7.4),150mM NaCl的平衡溶液中平衡。然后将含有His6-tag的蛋白的离心可溶上清上样挂柱,用洗涤溶液(50mM Tris-HCl,pH7.4,150mM NaCl,50mM咪唑)洗柱。最后洗脱溶液(50mM Tris-HCl,pH7.4,150mM NaCl,300mM咪唑)洗脱柱上的蛋白。
利用免疫印迹实验鉴定CC4所识别的结构域。简单过程如下:用15%SDS-PAGE分离原核表达纯化的D1-D3蛋白,然后用Bio-rad半干转印仪将胶上的蛋白转移到硝酸纤维素膜上。用溶解在PBST中的5%脱脂牛奶室温封闭2小时,然后用上述5%脱脂牛奶/PBST稀释(1∶5000)的一抗溶液(CC4)4℃孵育过夜。接着PBST洗5遍,用上述5%脱脂牛奶/PBST稀释(1∶2000)的二抗(辣根过氧化物酶偶联的羊抗鼠IgG抗体,Pierce)溶液室温孵育1小时。PBST洗5遍之后,用Pierce公司的显色底物(产品编号:34076,400μl 3%H2O2+400μl Luminol溶液/miniblot)显色。如图8右图所示,D1-3因为都带有His-tag,都能够被anti-His-tag的抗体所识别。然而CC4只结合D1,不结合相邻的D2,证实了其抗原表位处于结构域1中,即CEA蛋白氨基酸35-138的一段蛋白区段中。
进一步的研究利用四个重组表达的不同蛋白片段更细化的鉴定CC4结合的抗原表位。
如图7所示,片段42-273,片段62-273,片段80-273以及片段101-273分别表示四个针对于结构域1的CEA蛋白截短体。用于找出CC4抗体所识别的抗原表位序列。片段42-273(序列为SEQ ID NO:1的人CEA序列中的位置42-273的氨基酸,如SEQ ID NO:23所示)、片段62-273(序列为SEQ ID NO:1的人CEA序列中的位置62-273的氨基酸,如SEQ IDNO:24所示)、片段80-273(序列为SEQ ID NO:1的人CEA序列中的位置80-273的氨基酸,如SEQ ID NO:25所示)以及片段101-273(序列为SEQ ID NO:1的人CEA序列中的位置101-273的氨基酸,如SEQ IDNO:26所示)分别克隆在pET32a(Novagen)上,表达出来的分别是Trx-His6-S tag融合的Trx-His6-S-F42-273,Trx-His6-S-F62-273,Trx-His6-S-F80-273和Trx-His6-S-F101-273。
克隆过程同结构域1-3克隆过程相同。用相应的一对引物42S和D2A(用于片段42-273),62S和D2A(用于片段62-273),80S和D2A(用于片段80-273),101S和D2A(用于片段101-273)及模板pcDNA3.1(-)b-CEA(如前实施例3所述)作PCR反应,条件为95℃5分钟;95℃45秒,55℃40秒,72℃50秒,30个循环;72℃5分钟。分别扩增出编码上述四个片段的核苷酸序列。
引物列表如下,带有Nco I酶切位点(如下划线所示):
引物名称引物序列5’至3’
42S 5’catgCCATGGctCCGTTCAATGTCGCAGAGG 3’(SEQ IDNO:27)
62S 5’catgCCATGGctCTTTTTGGCTACAGCTGGT 3’(SEQ IDNO:28)
80S 5’catgCCATGGctATAGGATATGTAATAGGAAC 3’(SEQID NO:29)
101S 5’catgCCATGGctATATACCCCAATGCATCCC 3’(SEQ IDNO:30)
克隆和表达过程与前述结构域1-3的克隆表达过程完全相同。图9左图显示了重组表达的四个蛋白片段。
重组蛋白Trx-His6-S-F42-273(简称F42-273),Trx-His6-S-F62-273(简称F62-273),Trx-His6-S-F80-273(简称F80-273)和Trx-His6-S-F101-273(简称F101-273)诱导表达之后大部分呈不可溶的包涵体状态。包涵体纯化和洗涤方法如下:菌体重悬于25mM Tris-HCl(pH7.4),300W超声2×99个循环,每个循环超声4秒,暂停8秒,共12秒。4℃12000g离心30分钟。包涵体沉淀重悬于溶液1(2.5M NaCl)中,4℃搅拌30分钟,4℃12000g离心30分钟。包涵体沉淀重悬于溶液2(0.5%Triton X-100,10mM EDTA,pH8.0)中,4℃搅拌30分钟,4℃12000g离心30分钟。包涵体沉淀重悬于溶液3(2M Urea,50mM Tris,1mM EDTA,pH8.0)中,4℃搅拌30分钟,4℃12000g离心30分钟。随后,包涵体溶解在溶液4(8M Urea,25mM Tris,150mM NaCl,25mM DTT,pH 8.0)中。
利用免疫印迹实验鉴定CC4抗体所识别的蛋白片段以及抗原表位。实验方法同验证CC4与D1-3结合的免疫印迹方法完全相同。如图9右图所示,F42-273,F62-273,F80-273及F101-273都带有His-tag,都能够被anti-His-tag的抗体所识别。但只有F42-273能够被CC4所识别,而其他三个蛋白片段均不结合CC4,说明CC4的识别位点位于CEA氨基酸序列aa 42-61中。
接着,发明者利用标准的重叠PCR法构建了缺失aa42-61一段氨基酸序列的全长CEA突变体(如图10A所示),其氨基酸序列如SEQ ID NO:31所示,DNA序列如SEQ ID NO:32所示。方法简单描述如下:先用引物C5-EcoRI-sense和C5-Antisense-splicer,PCR扩增得到C5-Δ42-61-F1片段,用引物C5-Sense-splicer和C5-BglII-antisense,PCR扩增获得C5-Δ42-61-F2;接着利用C5-Δ42-61-F1和C5-Δ42-61-F2互为模板和引物,以54℃为退火温度,PCR扩增5个循环,之后加入引物C5-EcoRI-sense和C5-BglII-antisense,以56℃为退火温度,PCR扩增25个循环。PCR产物用1%琼脂糖凝胶电泳分离鉴定,用Tiangen公司提供的琼脂糖凝胶DNA回收试剂盒(产品编号:DP209-03)回收PCR产物,用NEB公司提供的EcoRI和BglII双酶切pcDNA3.1(-)b-CEACAM5(前述构建)和PCR产物,再用琼脂糖凝胶电泳分离,并回收DNA片段(同上)。将酶切过的载体和PCR产物连接,用NEB公司提供的T4DNA连接酶建立连接反应,16℃连接过夜。转化Top10感受态细胞(Tiangen),含有质粒pcDNA3.1(-)b-CEACAM5-Δ42-61的阳性克隆用含氨苄霉素(100ng/ml)的半固体LB培养板筛选。过夜培养获得的单克隆分别用含有抗生素的LB培养基培养,并抽提质粒。
C5-EcoRI-sense:5’-CCGGAATTCATGGAGTCTCCCTCGGCCC-3’(SEQ ID NO:33)
C5-Antisense-splicer:5’-GCCAAAAAGCGTGGATTCAATAGTGAGC-3’(SEQ IDNO:34)
C5-Sense-splicer:5’-TGAATCCACGCTTTTTGGCTACAGCTGGT-3’(SEQ ID NO:35)
C5-BglII-antisense:5’-GGAAGATCTGACTTTATGACGTG-3’(SEQ ID NO:36)
获得的pcDNA3.1(-)b-CEACAM5-Δ42-61质粒用于转染293T细胞。同时转染pcDNA3.1(-)b-CEACAM5质粒作为阳性对照(转染方法同前)。将转染的细胞用CC4或者RACEA(抗人CEA家族蛋白兔多抗,DakoCytomation公司提供)染色,并进行流式细胞术检测(FACS方法同前,FITC标记抗兔二抗由Sigma公司提供)。结果显示未转染的293T细胞不能被CC4或者RACEA识别,转染了CEACAM5野生型cDNA的细胞能够同时被CC4和RACEA识别,但是转染了CEACAM5-Δ42-61突变体的293T细胞只能被RACEA识别,但不能被CC4结合(如图10B所示)。
上述实验结果说明CC4的抗原表位存在于序列为SEQ ID NO:1的人CEA序列中的位置42-61之间,具体序列如SEQ ID NO:2所示。
对比鉴定出的抗原表位在CEA家族蛋白中的相似程度,发现该抗原表位保守地存在于CEA家族蛋白各成员当中。如图11所示,斜体表示与CEA蛋白同源序列。分析发现CEA蛋白(即CEACAM5)中位于氨基酸序列42-61的CC4所识别的抗原表位,除少数几的氨基酸存在变异外,保守地存在于CEA家族蛋白其他成员中,如CEACAM1、CEACAM3、CEACAM6、CEACAM7及CEACAM8。
因此,发明者以CEACAM1为例,验证了CC4与CEA蛋白家族其他成员的结合,及CC4识别的抗原表位是否同时存在于CEA蛋白家族其他成员相应的氨基酸序列中。
CEACAM1的cDNA购自武汉三鹰生物技术有限公司,序列为SEQ IDNO:37,亚克隆至pcDNA3.1(-)b,利用限制性内切酶EcoRI和HindIII(NEB提供)及引物5’-CCG GAA TTC ATG GGG CAC CTC TCA GCC C-3’(SEQID NO:38)和5’-CCC AAG CTT GGT CTT GTT AGG TGG GTC ATT-3’(SEQ ID NO:39)。同时发明者利用前述重叠PCR的方法,在CEACAM1野生型的基础上,构建了缺乏aa42-61这一段氨基酸片段的CEACAM1突变体,CEACAM1-Δ42-61,其氨基酸序列如SEQ ID NO:40所示,DNA序列如SEQ ID NO:41所示(如图12A)。利用的引物如下:
C1-EcoR I-Sense:5’-CCGGAATTCATGGGGCACCTCTCAGCC-3’(SEQ ID NO:42)
C1-BamH I-antisense:5’-CGCGGATCCACTATTATTCACA-3’(SEQ ID NO:43)
C1-Sense-splicer:5’-TGAATCCATGCTTTTTGGCTACAGCTGGT-3’(SEQ ID NO:44)
C1-antisense-splicer:5’-GCCAAAAAGCATGGATTCAGTAGTGAGC-3’(SEQ IDNO:45)
同样,将获得的质粒pcDNA3.1(-)b-CEACAM1及pcDNA3.1(-)b-CEACAM1-Δ42-61转染293T细胞,用CC4和RACEA染色细胞,进行流式细胞术检测(方法同前述)。结果显示转染CEACAM1的293T细胞能够被CC4和RACEA结合,但是转染突变体CEACAM1-Δ42-61的293T细胞只能被RACEA识别,而无法与CC4结合(如图12B)。因此,CC4 能够识别CEA家族成员CEACAM1,而且识别位点位于,处在同一位置的,序列为SEQ ID NO:46的人CEACAM1氨基酸序列中的位置42-61之间,具体序列如SEQ ID NO:47所示。
针对,CC4所识别氨基酸序列保守的存在于CEA家族不同成员蛋白之中这一现象,发明者又研究了CC4抗体与另外两个具有代表意义的CEA家族蛋白成员,CEACAM6和CEACAM8,的结合情况。
CEACAM6 cDNA购自武汉三鹰生物技术有限公司,序列为SEQ IDNO:48,亚克隆至pcDNA3.1(-)b质粒,利用NEB公司提供的EcoRI和HindIII,及引物5’-CCG GAA TTC ATG GGA CCC CCC TCA GCCCCT-3’(SEQ ID NO:49)和5’-CCC AAG CTT CTA TAT CAG AGC CACCCT GGC-3’(SEQ ID NO:50)。CEACAM8 cDNA购自武汉三鹰生物技术有限公司,序列为SEQ ID NO:51,亚克隆至pcDNA3.1(-)b质粒,利用NEB公司提供的EcoRI和HindIII,及引物5’-CCG GAA TTC CGC AGGCAG CAG AGA CCA TG-3’(SEQ ID NO:52)和5’-CCC AAG CTT ACACCA GAG CTA CTA TAT CAG-3’(SEQ ID NO:53)。
将pcDNA3.1(-)b-CEACAM6及pcDNA3.1(-)b-CEACAM8质粒分别转染293T细胞,用CC4和RACEA分别染色细胞,进行流式细胞术检测。如图13所示,CC4能够与表达CEACAM6及表达CEACAM8的293T细胞结合,说明了CC4能够与CEACAM6分子结合,结合位点基本可以确定存在于序列为SEQ ID NO:54的人CEACAM6序列中的位置42-61之间,具体序列如SEQ ID NO:55所示;CC4能够与CEACAM8分子结合,结合位点基本可以确定存在于序列为SEQ ID NO:56的人CEACAM8序列中的位置42-61之间,具体序列如SEQ ID NO:57所示。
此外,发明者还检测了与人CEA家族蛋白具有同源性的小鼠CEACAM1蛋白与单克隆抗体CC4的结合情况。
含有小鼠CEACAM1 cDNA,序列为SEQ ID NO:58,的真核细胞表达质粒pERFP-N1-mCEACAM1,购自武汉三鹰生物技术有限公司。将pERFP-N1-mCEACAM1质粒转染293T细胞,用CC4和RACEA分别染色细胞,进行流式细胞术检测。如图14所示,RACEA能够与表达mCEACAM1的细胞结合,但是CC4却不能结合转染的细胞。说明CC4 不结合存在于氨基酸序列为SEQ ID NO:59的小鼠CEACAM1序列中的位置42-61之间的抗原表位(如图11所示),其具体氨基酸序列为SEQ IDNO:60.
综上所述,经过一系列的实验,发明者证实了CC4与CEA家族蛋白许多成员之间的结合,并鉴定出了CC4结合的是一段广泛存在于不同CEA家族蛋白成员之间的保守的抗原表位。这段保守序列存在于人CEACAM1,CEACAM5,CEACAM6及CEACAM8的氨基酸序列中的位置42-61之间。通过分析小鼠CEACAM1的氨基酸序列及CC4的结合情况,发明者发现CC4不与小鼠CEACAM1结合的原因在于,存在于小鼠CEACAM1氨基酸序列位置46-53的一段表位,具体为SEQ ID NO:61,与完全保守存在于人CEA家族蛋白中的表位不一致,具体可以用存在于序列为SEQ ID NO:1的人CEACAM5氨基酸序列位置46-53的表位来表示,具体为SEQ ID NO:62。
因此,发明者基于CC4与共同存在于人CEACAM1,CEACAM5,CEACAM6及CEACAM8中的以SEQ ID NO:62所示的抗原表位结合,而不与存在于小鼠CEACAM1中的以SEQ ID NO:61所示的抗原表位结合这一现象,得出结论:CC4结合的抗原表位是由SEQ ID NO:2,47,55和57共同含有的保守的序列为SEQ ID NO:62的一段氨基酸序列。
实施例5:CC4在活体荧光影像中特异性靶向小鼠荷瘤部位。
利用参考文献(Jin,Josserand et al.2006;Jin,Razkin et al.2007)中所述的活体荧光影像的方法,检测CC4特异性靶向肿瘤能力。
实验方法简单描述如下:
发明者首先用免疫荧光的方法检测了CC4与人肺癌细胞系A549(ATCC)的结合(免疫荧光的方法同前),结果证实了A549表达CC4的抗原,CC4能够结合A549细胞,如图15A所示。
将2×107A549细胞皮下注射于6-8周裸鼠(Janvier,Le Genest SaintIsle,France),4-6周形成6-8mm直径的荷瘤。将Cy5标记的CC4抗体20μg/200μl静脉注射于荷瘤鼠,对照荷瘤鼠注射Cy5标记的小鼠IgG(Sigma),注射了抗体的荷瘤鼠直接应用活体荧光影像观察。利用基于 Hamamatsu光学成像系统的活体荧光反射成像技术,发明者观察了荧光标记抗体在荷瘤鼠体内的活体分布情况。简单的说,小鼠被麻醉后置于一个黑盒子中,用633nm波长的激光(50μW·cm-2)激发,激发出来的荧光透过RG 665的滤光片,并用一个-70℃制冷的数码CCD镜头(Hamamatsu digitalcamera C4742-98-26LWGS,Hamamatsu Photonics K.K.,Japan)收集荧光。所有的荧光影像收集的曝光时间均为100ms,其他参数在实验中保持不变。图像以16-bit的TIFF文件获得,并用Wasabi软件(Hamamatsu)分析。对于肿瘤/背景对比度的计算,现分别计算肿瘤区域的荧光强度(记为T),然后计算较远距离之外的皮肤背景荧光强度(记为S),T/S就被认为是肿瘤组织和背景的荧光水平差异。
结果如图15B所示,注射Cy5标记的CC4 50个小时之后肿瘤/背景比就接近4,达到最大值。而注射Cy5标记IgG的对照鼠,肿瘤/背景比直低于2(如图15C)。IgG只在肝脏代谢,而抗体CC4能够靶向积累于荷瘤部位。实验说明了抗体CC4在动物模型上有很好的肿瘤靶向作用。
实施例6:CC4的体内及体外抑瘤活性研究。
CC4在荷瘤裸鼠模型中抑制肿瘤生长。将结直肠癌细胞LS 174T接种裸鼠,荷瘤部位局部注射单克隆抗体CC4,观察其对肿瘤生长的影响。具体做法如下:
(1)收集培养的LS 174T细胞,无血清培养基洗涤,以2×107个/ml的密度重悬于无血清培养基中;
(2)皮下注射1×107个LS 174T细胞于裸鼠(购自中国医学科学院动物繁育中心)肩胛部位,并在接种部位局部多点注射纯化的单克隆抗体,100μg/只;设置对照组,以相同体积PBS代替抗体注射该组裸鼠;之后每周两次按照同样方法注射;
(3)待肿瘤长至明显可见时,于注射当天用游标卡尺测量肿瘤长径和短径;按照公式:肿瘤体积=长径×短径2/2计算肿瘤体积;
(4)实验至裸鼠开始出现死亡时结束。
结果如图16所示,注射单克隆抗体CC4的裸鼠荷瘤生长明显抑制,肿瘤大小与注射PBS的对照组相比明显较小。利用体内荷瘤模型证明了 单克隆抗体CC4能够显著抑制肿瘤的生长。
基于CC4在体内实验中显示的抑瘤活性,发明者进一步研究了CC4在体外的抗肿瘤活性,即对体外培养的肿瘤细胞的增殖、迁移、粘附及侵袭的影响。
利用CFSE染色研究CC4对于结直肠肿瘤细胞LS 174T增殖的影响。方法简介如下:
(1)将LS 174T细胞重悬于预热的PBS/0.1%BSA溶液中,终浓度为1×106个/ml。CFSE固体粉末购自Molecular Probes,用DMSO溶解配制成5mM储存液。
(2)每毫升细胞悬液加入2μl 5mM的CFSE溶液,CFSE终浓度为10μM。37℃孵育10分钟。
(3)加入5倍体积冰预冷的细胞培养液,淬灭未进入细胞的CFSE染色剂。冰上孵育5分钟。离心收集细胞。
(4)将细胞沉淀重悬在新鲜的培养液中洗涤细胞,然后离心收集细胞。重复重悬和离心过程至少三次以洗涤细胞。
(5)将CFSE标记的细胞接种到6孔板,每孔2×106个细胞。
(6)24小时后收集细胞,用流式细胞仪检测。
结果如图17所示,25μg/ml CC4抗体就足以抑制超过10%的LS 174T细胞分裂增殖,说明CC4抗体能够显著抑制肿瘤细胞增殖。
接下来的研究用PI染色细胞测定细胞内DNA含量,分析了CC4对肿瘤细胞细胞周期产生的影响。方法简介如下:
(1)接种2×106LS 174T细胞(ATCC)到10cm细胞培养皿中,培养过夜。更换成无血清培养液。进行血清饥饿24小时。
(2)更换成10%血清的培养液,培养12h。用PBS洗涤细胞一次。
(3)加入1ml胰酶溶液消化细胞,吹打均匀,转移至离心管中,加入10ml PBS。离心收集细胞,800rpm离心10min。
(4)弃去上清,加入1ml PBS,重悬沉淀并吹打混匀细胞。加入10ml冰预冷的70%乙醇,吹打混匀细胞,固定过夜。800rpm 4℃离心10分钟,收集细胞。
(5)弃去上清,加入1ml PBS,重悬沉淀并吹打混匀细胞。再加入9mlPBS,混匀。800rpm 4℃离心10分钟,收集细胞。
(6)弃去上清,用1ml PBS重悬细胞沉淀,混匀,4C自然沉降5分钟。
(7)转移上相800μl至新管,2500rpm 4℃离心10分钟,收集细胞。
(8)加入新配制的PI溶液[0.1%(v/v)TritonX-100;200μg/mlDNase-free RNase A(BBI);20μg/ml PI(sigma)]重悬细胞沉淀,37℃孵育30分钟,上机检测。
检测结果如图18所示25μg/ml CC4抗体就可以抑制近20%的细胞由S期向G2期转变,这证明了CC4抗体对于细胞周期的抑制作用,解释了CC4抑制肿瘤细胞增殖的作用。
利用Transwell系统(Corning HTS Transwell-96 Cell MigrationProducts)研究CC4抗体对于细胞迁移的影响。方法简述如下:
(1)LS 174T细胞(ATCC)以无血清培养基制成单细胞悬液(105/ml),按不同浓度向培养细胞中加入抗体与对照。
(2)Transwell下室加入含10%胎牛血清的培养液(200μl/孔),上室加入细胞悬液(50μl/孔,每个浓度设三个平行孔),在37℃二氧化碳培养箱中孵育12小时。
(3)将膜上层的细胞用棉签擦掉,下层细胞以4%多聚甲醛固定后,用1%结晶紫染色,镜检计数。
实验结果如图19所示,CC4处理的实验组每孔穿过的细胞数明显减少,说明CC4能够显著抑制LS 174T细胞的迁移,而且这种抑制呈现浓度依赖。
同时发明者也研究了CC4对于细胞的粘附和聚集的影响。方法主要如参考文献(Takeichi 1977)所述,简述如下:
(1)为了增强粘附效率,LS 174T细胞培养在低钙(0.1mM Ca2+)的含5%FCS的MEM培养液中培养过夜。
(2)用不含Mg2+和Ca2+的PBS洗涤细胞两次,然后用含1mM EDTA 的HBSS缓冲液37℃消化细胞10到20分钟。
(3)将消化好的细胞吹起,800rpm离心10分钟收集细胞。将细胞用含有1%BSA的HBSS洗涤两次,并重悬于1%BSA/HBSS中,将细胞通过18-gauge针头,制成单细胞悬液(5×105cells/ml)。
(4)将细胞悬液接种在24孔板中(0.5ml/孔),24孔培养板事先用2%BSA/HBSS包被。在37℃摇床上孵育3小时。加入的CaCl2和EGTA终浓度均为1mM。
(5)每孔加入0.5ml 5%的戊二醛终止反应。镜检。
(6)至少三个细胞聚集在一起作为聚集的细胞,计算单细胞比率%单细胞=[1-(N0-Nt)/N0]×100。其中N0为总细胞数,Nt为聚集在一起的细胞数。
实验结果如20所示,上图显示加入抗体CC4后单细胞比率明显降低,且呈现浓度依赖,说明CC4抗体能够抑制肿瘤细胞相互聚集和粘附。下图显示,假如EGTA或者Ca2+均不会影响CC4抗体的作用,说明CC4抗体靶向的CEA蛋白介导的细胞-细胞相互粘附是Ca2+非依赖的。
由于CC4抗体的亚型是IgG2a,κ亚型,这一亚型的抗体理论上具有抗体介导的细胞毒活性,即ADCC活性。发明者利用LDH释放的方法研究了CC4抗体介导的免疫细胞对肿瘤细胞杀伤活性。具体方法如试剂盒(CytoTox-ONETM Homogeneous Membrane Integrity Assay,Promega,货号G7890)中所介绍。效应细胞选择BALB/c小鼠的脾脏细胞,用注射器活塞磨碎后,用红细胞裂解液[144mM NH4Cl,1mMNaHCO3,1mMEDAT(pH8.0)]破碎红细胞,重悬于PBS中即制得脾细胞悬液。在96孔板中接种5000个LS 174T或A375细胞(ATCC)(靶细胞)培养过夜,加入不同浓度抗体CC4及5×105个小鼠脾细胞(E:T=100),37℃杀伤4小时。用前述试剂盒测定释放的LDH,计算杀伤率。
杀伤率由以下公式计算:
%细胞毒性=(Exp-T.spon.-Effe.spon.)/(Tmax.-T.spon)
Exp表示的实验组读值,T.spon表示的是只有靶细胞的对照组读值,Effe.spon表示的是只有效应细胞的对照组读值,Tmax表示的是将靶细胞 裂解后得到的全细胞LDH最大释放组读值。
实验结果如图21所示,CC4能够对表达CEA的LS 174T细胞引起较强的ADCC反应,而不对CC4不结合的A375细胞引起特异性杀伤。而且ADCC的效果是随着CC4抗体浓度的增加而变强的。此项实验证明了CC4能够引起抗体介导的特异性免疫反应,从而部分解释了在裸鼠模型上的抑瘤活性。
主要参考文献:
Beauchemin,N.,T.Kunath,et al.(1997).″Association of biliaryglycoprotein with protein tyrosine phosphatase SHP-1 in malignant colonepithelial cells.″Oncogene 14(7):783-90.
Blumenthal,R.D.,L.Osorio,et al.(2005).″Carcinoembryonic antigenantibody inhibits lung metastasis and augments chemotherapy in a humancolonic carcinoma xenograft.″Cancer Immunol Immunother 54(4):315-27.
Duffy,M.J.(2001).″Carcinoembryonic antigen as a marker forcolorectal cancer:is it clinically useful?″Clin Chem 47(4):624-30.
Gold,P.and S.O.Freedman(1965).″Demonstration of Tumor-SpecificAntigens in Human Colonic Carcinomata by Immunological Tolerance andAbsorption Techniques.″J Exp Med 121:439-62.
Gold,P.and S.O.Freedman(1965).″Specific carcinoembryonic antigensof the human digestive system.″J Exp Med 122(3):467-81.
Hammarstrom,S.(1999).″The carcinoembryonic antigen(CEA)family:structures,suggested functions and expression in normal and malignanttissues.″Semin Cancer Biol 9(2):67-81.
Hammarstrom,S.and V.Baranov(2001).″Is there a role for CEA ininnate immunity in the colon?″Trends Microbiol 9(3):119-25.
Hashino,J.,Y.Fukuda,et al.(1994).″Metastatic potential of humancolorectal carcinoma SW1222 cells transfected with cDNA encodingcarcinoembryonic antigen.″Clin Exp Metastasis 12(4):324-8.
Imakiire,T.,M.Kuroki,et al.(2004).″Generation,immunologic characterization and antitumor effects of human monoclonal antibodies forcarcinoembryonic antigen.″Int J Cancer 108(4):564-70.
Jin,Z.H.,V.Josserand,et al.(2006).″Noninvasive optical imaging ofovarian metastases using Cy5-labeled RAFT-c(-RGDfK-)4.″Mol Imaging5(3):188-97.
Jin,Z.H.,J.Razkin,et al.(2007).″In vivo noninvasive optical imagingof receptor-mediated RGD internalization using self-quenched Cy5-labeledRAFT-c(-RGDfK-)(4).″Mol Imaging6(1):43-55.
Kharitonenkov,A.,Z.Chen,et al.(1997).″A family of proteins thatinhibit signalling through tyrosine kinase receptors.″Nature 386(6621):181-6.
Kim,J.C.,S.A.Roh,et al.(1997).″Adhesive function ofcarcinoembryonic antigen in the liver metastasis of KM-12c colon carcinomacell line.″Dis Colon Rectum 40(8):946-53.
Kohler,G.and C.Milstein(1975).″Continuous cultures of fused cellssecreting antibody of predefined specificity.″Nature 256(5517):495-7.
Maxwell,P.(1999).″Carcinoembryonic antigen:cell adhesion moleculeand useful diagnostic marker.″Br J Biomed Sci 56(3):209-14.
Mayer,A.,K.A.Chester,et al.(1999).″Taking engineered anti-CEAantibodies to the clinic.″J Immunol Methods 231(1-2):261-73.
Solimene,A.C.,C.R.Carneiro,et al.(2001).″Functional differencesbetween two morphologically distinct cell subpopulations within a humancolorectal carcinoma cell line.″Braz J Med Biol Res 34(5):653-61.
Stein,R.and D.M.Goldenberg(2004).″A humanized monoclonalantibody to carcinoembryonic antigen,labetuzumab,inhibits tumor growthand sensitizes human medullary thyroid cancer xenografts to dacarbazinechemotherapy.″Mol Cancer Ther 3(12):1559-64.
Takeichi,M.(1977).″Functional correlation between cell adhesiveproperties and some cell surface proteins.″J Cell Biol 75(2 Pt 1):464-74.
Thomas,P.and C.A.Toth(1990).″Carcinoembryonic antigen binding to Kupffer cells is via a peptide located at the junction of the N-terminal and firstloop domains.″Biochem Biophys Res Commun 170(1):391-6.
Thompson,J.A.,F.Grunert,et al.(1991).″Carcinoembryonic antigengene family:molecular biology and clinical perspectives.″J Clin Lab Anal5(5):344-66.
Thomson,D.M.,J.Krupey,et al.(1969).″The radioimmunoassay ofcirculating carcinoembryonic antigen of the human digestive system.″ProcNatl Acad Sci U S A 64(1):161-7.
Yeh,M.Y.,I.Hellstrom,et al.(1982).″A cell-surface antigen which ispresent in the ganglioside fraction and shared by human melanomas.″Int JCancer 29(3):269-75.
Yeh,M.Y.,I.Hellstrom,et al.(1979).″Cell surface antigens of humanmelanoma identified by monoclonal antibody.″Proc Natl Acad Sci U S A76(6):2927-31.
Zhou,H.,C.P.Stanners,et al.(1993).″Specificity ofanti-carcinoembryonic antigen monoclonal antibodies and their effects onCEA-mediated adhesion.″Cancer Res 53(16):3817-22.
SEQUENCE LISTING
<110>中国科学院生物物理研究所
<120>抗人CEA的单克隆抗体CC4,包含其的组合物,及其用途
<130>IB085940
<160>62
<170>PatentIn version 3.1
<210>1
<211>702
<212>PRT
<213>人
<400>1
Met Glu Ser Pro Ser Ala Pro Pro His Arg Trp Cys Ile Pro Trp Gln
1 5 10 15
Arg Leu Leu Leu Thr Ala Ser Leu Leu Thr Phe Trp Asn Pro Pro Thr
20 25 30
Thr Ala Lys Leu Thr Ile Glu Ser Thr Pro Phe Asn Val Ala Glu Gly
35 40 45
Lys Glu Val Leu Leu Leu Val His Asn Leu Pro Gln His Leu Phe Gly
50 55 60
Tyr Ser Trp Tyr Lys Gly Glu Arg Val Asp Gly Asn Arg Gln Ile Ile
65 70 75 80
Gly Tyr Val Ile Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Tyr Ser
85 90 95
Gly Arg Glu Ile Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Ile
100 105 110
Ile Gln Asn Asp Thr Gly Phe Tyr Thr Leu His Val Ile Lys Ser Asp
115 120 125
Leu Val Asn Glu Glu Ala Thr Gly Gln Phe Arg Val Tyr Pro Glu Leu
130 135 140
Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Lys Pro Val Glu Asp Lys
145 150 155 160
Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Thr Gln Asp Ala Thr Tyr
165 170 175
Leu Trp Trp Val Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu Gln
180 185 190
Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Phe Asn Val Thr Arg Asn
195 200 205
Asp Ser Ala Ser Tyr Lys Cys Glu Thr Gln Asn Pro Val Ser Ala Arg
210 215 220
Arg Ser Asp Ser Val Ile Leu Asn Val Leu Tyr Gly Pro Asp Ala Pro
225 230 235 240
Thr Ile Ser Pro Leu Asn Thr Ser Tyr Arg Ser Gly Glu Asn Leu Asn
245 250 255
Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Phe
260 265 270
Val Asn Gly Thr Phe Gln Gln Ser Thr Gln Glu Leu Phe Ile Pro Asn
275 280 285
Ile Thr Val Asn Asn Ser Gly Ser Tyr Thr Cys Gln Ala His Asn Ser
290 295 300
Asp Thr Gly Leu Asn Arg Thr Thr Val Thr Thr Ile Thr Val Tyr Ala
305 310 315 320
Glu Pro Pro Lys Pro Phe Ile Thr Ser Asn Asn Ser Asn Pro Val Glu
325 330 335
Asp Glu Asp Ala Val Ala Leu Thr Cys Glu Pro Glu Ile Gln Asn Thr
340 345 350
Thr Tyr Leu Trp Trp Val Asn Asn Gln Ser Leu Pro Val Ser Pro Arg
355 360 365
Leu Gln Leu Ser Asn Asp Asn Arg Thr Leu Thr Leu Leu Ser Val Thr
370 375 380
Arg Asn Asp Val Gly Pro Tyr Glu Cys Gly Ile Gln Asn Glu Leu Ser
385 390 395 400
Val Asp His Ser Asp Pro Val Ile Leu Asn Val Leu Tyr Gly Pro Asp
405 410 415
Asp Pro Thr Ile Ser Pro Ser Tyr Thr Tyr Tyr Arg Pro Gly Val Asn
420 425 430
Leu Ser Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser
435 440 445
Trp Leu Ile Asp Gly Asn Ile Gln Gln His Thr Gln Glu Leu Phe Ile
450 455 460
Ser Asn Ile Thr Glu Lys Asn Ser Gly Leu Tyr Thr Cys Gln Ala Asn
465 470 475 480
Asn Ser Ala Ser Gly His Ser Arg Thr Thr Val Lys Thr Ile Thr Val
485 490 495
Ser Ala Glu Leu Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Lys Pro
500 505 510
Val Glu Asp Lys Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Ala Gln
515 520 525
Asn Thr Thr Tyr Leu Trp Trp Val Asn Gly Gln Ser Leu Pro Val Ser
530 535 540
Pro Arg Leu Glu Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Phe Asn
545 550 555 560
Val Thr Arg Asn Asp Ala Arg Ala Tyr Val Cys Gly Ile Gln Asn Ser
565 570 575
Val Ser Ala Asn Arg Ser Asp Pro Val Thr Leu Asp Val Leu Tyr Gly
580 585 590
Pro Asp Thr Pro Ile Ile Ser Pro Pro Asp Ser Ser Tyr Leu Ser Gly
595 600 605
Ala Asu Leu Asn Leu Ser Cys His Ser Ala Ser Asn Pro Ser Pro Gln
610 615 620
Tyr Ser Trp Arg Ile Asn Gly Ile Pro Gln Gln His Thr Gln Val Leu
625 630 635 640
Phe Ile Ala Lys Ile Thr Pro Asn Asn Asn Gly Thr Tyr Ala Cys Phe
645 650 655
Val Ser Asn Leu Ala Thr Gly Arg Asn Asn Ser Ile Val Lys Ser Ile
660 665 670
Thr Val Ser Ala Ser Gly Thr Ser Pro Gly Leu Ser Ala Gly Ala Thr
675 680 685
Val Gly Ile Met Ile Gly Val Leu Val Gly Val Ala Leu Ile
690 695 700
<210>2
<211>20
<212>PRT
<213>人工序列
<400>2
Pro Phe Asn Val Ala Glu Gly Lys Glu Val Leu Leu Leu Val His Asn
1 5 10 15
Leu Pro Gln His
20
<210>3
<211>8
<212>PRT
<213>人工序列
<400>3
Gly Phe Asp Phe Ser Arg Tyr Trp
1 5
<210>4
<211>8
<212>PRT
<213>人工序列
<400>4
Ile Asn Pro Gly Ser Ser Thr Ile
1 5
<210>5
<211>11
<212>PRT
<213>人工序列
<400>5
Ala Thr Ser Tyr Gly Asn Ser Pro Met Asp Tyr
1 5 10
<210>6
<211>10
<212>PRT
<213>人工序列
<400>6
Glu Ser Val Asp Thr Tyr Ala Val Ser Phe
1 5 10
<210>7
<211>3
<212>PRT
<213>人工序列
<400>7
Thr Ala Ser
1
<210>8
<211>9
<212>PRT
<213>人工序列
<400>8
Gln Gln Ser Lys Glu Val Pro Trp Thr
1 5
<210>9
<211>118
<212>PRT
<213>人工序列
<400>9
Asp Val Lys Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Asn Leu Ser Cys Ala Ala Ser Gly Phe Asp Phe Ser Arg Tyr
20 25 30
Trp Met Ser Trp Ala Arg Gln Ala Pro Gly Lys Gly Gln Glu Trp Ile
35 40 45
Gly Glu Ile Asn Pro Gly Ser Ser Thr Ile Asn Tyr Thr Pro Ser Leu
50 55 60
Lys Asp Lys Phe Ile Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Ser Lys Val Arg Ser Glu Asp Thr Ala Leu Tyr Tyr Cys
85 90 95
Ala Thr Ser Tyr Gly Asn Ser Pro Met Asp Tyr Trp Gly Gln Gly Thr
100 105 110
Met Val Thr Val Ser Ser
115
<210>10
<211>112
<212>PRT
<213>人工序列
<400>10
Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Leu Gly
1 5 10 15
Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Glu Ser Val Asp Thr Tyr
20 25 30
Ala Val Ser Phe Met Asn Trp Phe Gln Gln Lys Pro Gly Gln Pro Pro
35 40 45
Lys Leu Leu Ile Tyr Thr Ala Ser Lys Gln Gly Ser Gly Val Pro Ala
50 55 60
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Ser Leu Asn Ile His
65 70 75 80
Pro Met Glu Glu Asp Asp Ala Ala Met Tyr Phe Cys Gln Gln Ser Lys
85 90 95
Glu Val Pro Trp Thr Phe Gly Gly Gly Thr Lys Gln Glu Ile Lys Arg
100 105 110
<210>11
<211>2109
<212>DNA
<213>人工序列
<400>11
atggagtctc cctcggcccc tccccacaga tggtgcatcc cctggcagag gctcctgctc 60
acagcctcac ttctaacctt ctggaacccg cccaccactg ccaagctcac tattgaatcc 120
acgccgttca atgtcgcaga ggggaaggag gtgcttctac ttgtccacaa tctgccccag 180
catctttttg gctacagctg gtacaaaggt gaaagagtgg atggcaaccg tcaaattata 240
ggatatgtaa taggaactca acaagctacc ccagggcccg catacagtgg tcgagagata 300
atatacccca atgcatccct gctgatccag aacatcatcc agaatgacac aggattctac 360
accctacacg tcataaagtc agatcttgtg aatgaagaag caactggcca gttccgggta 420
tacccggagc tgcccaagcc ctccatctcc agcaacaact ccaaacccgt ggaggacaag 480
gatgctgtgg ccttcacctg tgaacctgag actcaggacg caacctacct gtggtgggta 540
aacaatcaga gcctcccggt cagtcccagg ctgcagctgt ccaatggcaa caggaccctc 600
actctattca atgtcacaag aaatgactca gcaagctaca aatgtgaaac ccagaaccca 660
gtgagtgcca ggcgcagtga ttcagtcatc ctgaatgtcc tctatggccc ggatgccccc 720
accatttccc ctctaaacac atcttacaga tcaggggaaa atctgaacct ctcctgccac 780
gcagcctcta acccacctgc acagtactct tggtttgtca atgggacttt ccagcaatcc 840
acccaagagc tctttatccc caacatcact gtgaataata gtggatccta tacgtgccaa 900
gcccataact cagacactgg cctcaatagg accacagtca cgacgatcac agtctatgca 960
gagccaccca aacccttcat caccagcaac aactccaacc ccgtggagga tgaggatgct 1020
gtagccttaa cctgtgaacc tgagattcag aacacaacct acctgtggtg ggtaaataat 1080
cagagcctcc cggtcagtcc caggctgcag ctgtccaatg acaacaggac cctcactcta 1140
ctcagtgtca caaggaatga tgtaggaccc tatgagtgtg gaatccagaa cgaattaagt 1200
gttgaccaca gcgacccagt catcctgaat gtcctctatg gcccagacga ccccaccatt 1260
tccccctcat acacctatta ccgtccaggg gtgaacctca gcctctcctg ccatgcagcc 1320
tctaacccac ctgcacagta ttcttggctg attgatggga acatccagca acacacacaa 1380
gagctcttta tctccaacat cactgagaag aacagcggac tctatacctg ccaggccaat 1440
aactcagcca gtggccacag caggactaca gtcaagacaa tcacagtctc tgcggagctg 1500
cccaagccct ccatctccag caacaactcc aaacccgtgg aggacaagga tgctgtggcc 1560
ttcacctgtg aacctgaggc tcagaacaca acctacctgt ggtgggtaaa tggtcagagc 1620
ctcccagtca gtcccaggct gcagctgtcc aatggcaaca ggaccctcac tctattcaat 1680
gtcacaagaa atgacgcaag agcctatgta tgtggaatcc agaactcagt gagtgcaaac 1740
cgcagtgacc cagtcaccct ggatgtcctc tatgggccgg acacccccat catttccccc 1800
ccagactcgt cttacctttc gggagcgaac ctcaacctct cctgccactc ggcctctaac 1860
ccatccccgc agtattcttg gcgtatcaat gggataccgc agcaacacac acaagttctc 1920
tttatcgcca aaatcacgcc aaataataac gggacctatg cctgttttgt ctctaacttg 1980
gctactggcc gcaataattc catagtcaag agcatcacag tctctgcatc tggaacttct 2040
cctggtctct cagctggggc cactgtcggc atcatgattg gagtgctggt tggggttgct 2100
ctgatatag 2109
<210>12
<211>33
<212>DNA
<213>人工序列
<400>12
aaatatgcgg ccgcatggag tctccctcgg ccc 33
<210>13
<211>29
<212>DNA
<213>人工序列
<400>13
cccaagcttg gctgctatat cagagcaac 29
<210>14
<211>121
<212>PRT
<213>人工序列
<400>14
Lys Leu Thr Ile Glu Ser Thr Pro Phe Asn Val Ala Glu Gly Lys Glu
1 5 10 15
Val Leu Leu Leu Val His Asn Leu Pro Gln His Leu Phe Gly Tyr Ser
20 25 30
Trp Tyr Lys Gly Glu Arg Val Asp Gly Asn Arg Gln Ile Ile Gly Tyr
35 40 45
Val Ile Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Tyr Ser Gly Arg
50 55 60
Glu Ile Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Ile Ile Gln
65 70 75 80
Asn Asp Thr Gly Phe Tyr Thr Leu His Val Ile Lys Ser Asp Leu Val
85 90 95
Asn Glu Glu Ala Thr Gly Gln Phe Arg Val Tyr Pro Glu Leu Pro Lys
100 105 110
Pro Ser Ile Ser Ser Asn Asn Ser Lys
115 120
<210>15
<211>135
<212>PRT
<213>人工序列
<400>15
Arg Val Tyr Pro Glu Leu Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser
1 5 10 15
Lys Pro Val Glu Asp Lys Asp Ala Val Ala Phe Thr Cys Glu Pro Glu
20 25 30
Thr Gln Asp Ala Thr Tyr Leu Trp Trp Val Asn Asn Gln Ser Leu Pro
35 40 45
Val Ser Pro Arg Leu Gln Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu
50 55 60
Phe Asn Val Thr Arg Asn Asp Ser Ala Ser Tyr Lys Cys Glu Thr Gln
65 70 75 80
Asn Pro Val Ser Ala Arg Arg Ser Asp Ser Val Ile Leu Asn Val Leu
85 90 95
Tyr Gly Pro Asp Ala Pro Thr Ile Ser Pro Leu Asn Thr Ser Tyr Arg
100 105 110
Ser Gly Glu Asn Leu Asn Leu Ser Cys His Ala Ala Ser Asn Pro Pro
115 120 125
Ala Gln Tyr Ser Trp Phe Val
130 135
<210>16
<211>126
<212>PRT
<213>人工序列
<400>16
Ile Leu Asn Val Leu Tyr Gly Pro Asp Ala Pro Thr Ile Ser Pro Leu
1 5 10 15
Asn Thr Ser Tyr Arg Ser Gly Glu Asn Leu Asn Leu Ser Cys His Ala
20 25 30
Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Phe Val Asn Gly Thr Phe
35 40 45
Gln Gln Ser Thr Gln Glu Leu Phe Ile Pro Asn Ile Thr Val Asn Asn
50 55 60
Ser Gly Ser Tyr Thr Cys Gln Ala His Asn Ser Asp Thr Gly Leu Asn
65 70 75 80
Arg Thr Thr Val Thr Thr Ile Thr Val Tyr Ala Glu Pro Pro Lys Pro
85 90 95
Phe Ile Thr Ser Asn Asn Ser Asn Pro Val Glu Asp Glu Asp Ala Val
100 105 110
Ala Leu Thr Cys Glu Pro Glu Ile Gln Asn Thr Thr Tyr Leu
115 120 125
<210>17
<211>32
<212>DNA
<213>人工序列
<400>17
catgccatgg ctaagctcac tattgaatcc ac 32
<210>18
<211>32
<212>DNA
<213>人工序列
<400>18
cccaagcttt tatttggagt tgttgctgga ga 32
<210>19
<211>31
<212>DNA
<213>人工序列
<400>19
catgccatgg ctcgggtata cccggagctg c 31
<210>20
<211>32
<212>DNA
<213>人工序列
<400>20
cccaagcttt tagacaaacc aagagtactg tg 32
<210>21
<211>32
<212>DNA
<213>人工序列
<400>21
catgccatgg ctatcctgaa tgtcctctat gg 32
<210>22
<211>32
<212>DNA
<213>人工序列
<400>22
cccaagcttt tacaggtagg ttgtgttctg aa 32
<210>23
<211>232
<212>PRT
<213>人工序列
<400>23
Pro Phe Asn Val Ala Glu Gly Lys Glu Val Leu Leu Leu Val His Asn
1 5 10 15
Leu Pro Gln His Leu Phe Gly Tyr Ser Trp Tyr Lys Gly Glu Arg Val
20 25 30
Asp Gly Asn Arg Gln Ile Ile Gly Tyr Val Ile Gly Thr Gln Gln Ala
35 40 45
Thr Pro Gly Pro Ala Tyr Ser Gly Arg Glu Ile Ile Tyr Pro Asn Ala
50 55 60
Ser Leu Leu Ile Gln Asn Ile Ile Gln Asn Asp Thr Gly Phe Tyr Thr
65 70 75 80
Leu His Val Ile Lys Ser Asp Leu Val Asn Glu Glu Ala Thr Gly Gln
85 90 95
Phe Arg Val Tyr Pro Glu Leu Pro Lys Pro Ser Ile Ser Ser Asn Asn
100 105 110
Ser Lys Pro Val Glu Asp Lys Asp Ala Val Ala Phe Thr Cys Glu Pro
115 120 125
Glu Thr Gln Asp Ala Thr Tyr Leu Trp Trp Val Asn Asn Gln Ser Leu
130 135 140
Pro Val Ser Pro Arg Leu Gln Leu Ser Asn Gly Asn Arg Thr Leu Thr
145 150 155 160
Leu Phe Asn Val Thr Arg Asn Asp Ser Ala Ser Tyr Lys Cys Glu Thr
165 170 175
Gln Asn Pro Val Ser Ala Arg Arg Ser Asp Ser Val Ile Leu Asn Val
180 185 190
Leu Tyr Gly Pro Asp Ala Pro Thr Ile Ser Pro Leu Asn Thr Ser Tyr
195 200 205
Arg Ser Gly Glu Asn Leu Asn Leu Ser Cys His Ala Ala Ser Asn Pro
210 215 220
Pro Ala Gln Tyr Ser Trp Phe Val
225 230
<210>24
<211>212
<212>PRT
<213>人工序列
<400>24
Leu Phe Gly Tyr Ser Trp Tyr Lys Gly Glu Arg Val Asp Gly Asn Arg
1 5 10 15
Gln Ile Ile Gly Tyr Val Ile Gly Thr Gln Gln Ala Thr Pro Gly Pro
20 25 30
Ala Tyr Ser Gly Arg Glu Ile Ile Tyr Pro Asn Ala Ser Leu Leu Ile
35 40 45
Gln Asn Ile Ile Gln Asn Asp Thr Gly Phe Tyr Thr Leu His Val Ile
50 55 60
Lys Ser Asp Leu Val Asn Glu Glu Ala Thr Gly Gln Phe Arg Val Tyr
65 70 75 80
Pro Glu Leu Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Lys Pro Val
85 90 95
Glu Asp Lys Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Thr Gln Asp
100 105 110
Ala Thr Tyr Leu Trp Trp Val Asn Asn Gln Ser Leu Pro Val Ser Pro
115 120 125
Arg Leu Gln Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Phe Asn Val
130 135 140
Thr Arg Asn Asp Ser Ala Ser Tyr Lys Cys Glu Thr Gln Asn Pro Val
145 150 155 160
Ser Ala Arg Arg Ser Asp Ser Val Ile Leu Asn Val Leu Tyr Gly Pro
165 170 175
Asp Ala Pro Thr Ile Ser Pro Leu Asn Thr Ser Tyr Arg Ser Gly Glu
180 185 190
Asn Leu Asn Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr
195 200 205
Ser Trp Phe Val
210
<210>25
<211>194
<212>PRT
<213>人工序列
<400>25
Ile Gly Tyr Val Ile Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Tyr
1 5 10 15
Ser Gly Arg Glu Ile Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn
20 25 30
Ile Ile Gln Asn Asp Thr Gly Phe Tyr Thr Leu His Val Ile Lys Ser
35 40 45
Asp Leu Val Asn Glu Glu Ala Thr Gly Gln Phe Arg Val Tyr Pro Glu
50 55 60
Leu Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Lys Pro Val Glu Asp
65 70 75 80
Lys Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Thr Gln Asp Ala Thr
85 90 95
Tyr Leu Trp Trp Val Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu
100 105 110
Gln Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Phe Asn Val Thr Arg
115 120 125
Asn Asp Ser Ala Ser Tyr Lys Cys Glu Thr Gln Asn Pro Val Ser Ala
130 135 140
Arg Arg Ser Asp Ser Val Ile Leu Asn Val Leu Tyr Gly Pro Asp Ala
145 150 155 160
Pro Thr Ile Ser Pro Leu Asn Thr Ser Tyr Arg Ser Gly Glu Asn Leu
165 170 175
Asn Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp
180 185 190
Phe Val
<210>26
<211>173
<212>PRT
<213>人工序列
<400>26
Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Ile Ile Gln Asn Asp
1 5 10 15
Thr Gly Phe Tyr Thr Leu His Val Ile Lys Ser Asp Leu Val Asn Glu
20 25 30
Glu Ala Thr Gly Gln Phe Arg Val Tyr Pro Glu Leu Pro Lys Pro Ser
35 40 45
Ile Ser Ser Asn Asn Ser Lys Pro Val Glu Asp Lys Asp Ala Val Ala
50 55 60
Phe Thr Cys Glu Pro Glu Thr Gln Asp Ala Thr Tyr Leu Trp Trp Val
65 70 75 80
Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu Gln Leu Ser Asn Gly
85 90 95
Asn Arg Thr Leu Thr Leu Phe Asn Val Thr Arg Asn Asp Ser Ala Ser
100 105 110
Tyr Lys Cys Glu Thr Gln Asn Pro Val Ser Ala Arg Arg Ser Asp Ser
115 120 125
Val Ile Leu Asn Val Leu Tyr Gly Pro Asp Ala Pro Thr Ile Ser Pro
130 135 140
Leu Asn Thr Ser Tyr Arg Ser Gly Glu Asn Leu Asn Leu Ser Cys His
145 150 155 160
Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Phe Val
165 170
<210>27
<211>32
<212>DNA
<213>人工序列
<400>27
catgccatgg ctccgttcaa tgtcgcagag gr 32
<210>28
<211>31
<212>DNA
<213>人工序列
<400>28
catgccatgg ctctttttgg ctacagctgg t 31
<210>29
<211>32
<212>DNA
<213>人工序列
<400>29
catgccatgg ctataggata tgtaatagga ac 32
<210>30
<211>31
<212>DNA
<213>人工序列
<400>30
catgccatgg ctatataccc caatgcatcc c 31
<210>31
<211>682
<212>PRT
<213>人工序列
<400>31
Met Glu Ser Pro Ser Ala Pro Pro His Arg Trp Cys Ile Pro Trp Gln
1 5 10 15
Arg Leu Leu Leu Thr Ala Ser Leu Leu Thr Phe Trp Asn Pro Pro Thr
20 25 30
Thr Ala Lys Leu Thr Ile Glu Ser Thr Leu Phe Gly Tyr Ser Trp Tyr
35 40 45
Lys Gly Glu Arg Val Asp Gly Asn Arg Gln Ile Ile Gly Tyr Val Ile
50 55 60
Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Tyr Ser Gly Arg Glu Ile
65 70 75 80
Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Ile Ile Gln Asn Asp
85 90 95
Thr Gly Phe Tyr Thr Leu His Val Ile Lys Ser Asp Leu Val Asn Glu
100 105 110
Glu Ala Thr Gly Gln Phe Arg Val Tyr Pro Glu Leu Pro Lys Pro Ser
115 120 125
Ile Ser Ser Asn Asn Ser Lys Pro Val Glu Asp Lys Asp Ala Val Ala
130 135 140
Phe Thr Cys Glu Pro Glu Thr Gln Asp Ala Thr Tyr Leu Trp Trp Val
145 150 155 160
Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu Gln Leu Ser Asn Gly
165 170 175
Asn Arg Thr Leu Thr Leu Phe Asn Val Thr Arg Asn Asp Ser Ala Ser
180 185 190
Tyr Lys Cys Glu Thr Gln Asn Pro Val Ser Ala Arg Arg Ser Asp Ser
195 200 205
Val Ile Leu Asn Val Leu Tyr Gly Pro Asp Ala Pro Thr Ile Ser Pro
210 215 220
Leu Asn Thr Ser Tyr Arg Ser Gly Glu Asn Leu Asn Leu Ser Cys His
225 230 235 240
Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Phe Val Asn Gly Thr
245 250 255
Phe Gln Gln Ser Thr Gln Glu Leu Phe Ile Pro Asn Ile Thr Val Asn
260 265 270
Asn Ser Gly Ser Tyr Thr Cys Gln Ala His Asn Ser Asp Thr Gly Leu
275 280 285
Asn Arg Thr Thr Val Thr Thr Ile Thr Val Tyr Ala Glu Pro Pro Lys
290 295 300
Pro Phe Ile Thr Ser Asn Asn Ser Asn Pro Val Glu Asp Glu Asp Ala
305 310 315 320
Val Ala Leu Thr Cys Glu Pro Glu Ile Gln Asn Thr Thr Tyr Leu Trp
325 330 335
Trp Val Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu Gln Leu Ser
340 345 350
Asn Asp Asn Arg Thr Leu Thr Leu Leu Ser Val Thr Arg Asn Asp Val
355 360 365
Gly Pro Tyr Glu Cys Gly Ile Gln Asn Glu Leu Ser Val Asp His Ser
370 375 380
Asp Pro Val Ile Leu Asn Val Leu Tyr Gly Pro Asp Asp Pro Thr Ile
385 390 395 400
Ser Pro Ser Tyr Thr Tyr Tyr Arg Pro Gly Val Asn Leu Ser Leu Ser
405 410 415
Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Leu Ile Asp
420 425 430
Gly Asn Ile Gln Gln His Thr Gln Glu Leu Phe Ile Ser Asn Ile Thr
435 440 445
Glu Lys Asn Ser Gly Leu Ty rThr Cys Gln Ala Asn Asn Ser Ala Ser
450 455 460
Gly His Ser Arg Thr Thr Val Lys Thr Ile Thr Val Ser Ala Glu Leu
465 470 475 480
Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Lys Pro Val Glu Asp Lys
485 490 495
Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Ala Gln Asn Thr Thr Tyr
500 505 510
Leu Trp Trp Val Asn Gly Gln Ser Leu Pro Val Ser Pro Arg Leu Gln
515 520 525
Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Phe Asn Val Thr Arg Asn
530 535 540
Asp Ala Arg Ala Tyr Val Cys Gly Ile Gln Asn Ser Val Ser Ala Asn
545 550 555 560
Arg Ser Asp Pro Val Thr Leu Asp Val Leu Tyr Gly Pro Asp Thr Pro
565 570 575
Ile Ile Ser Pro Pro Asp Ser Ser Tyr Leu Ser Gly Ala Asn Leu Asn
580 585 590
Leu Ser Cys His Ser Ala Ser Asn Pro Ser Pro Gln Tyr Ser Trp Arg
595 600 605
Ile Asn Gly Ile Pro Gln Gln His Thr Gln Val Leu Phe Ile Ala Lys
610 615 620
Ile Thr Pro Asn Asn Asn Gly Thr Tyr Ala Cys Phe Val Ser Asn Leu
625 630 635 640
Ala Thr Gly Arg Asn Asn Ser Ile Val Lys Ser Ile Thr Val Ser Ala
645 650 655
Ser Gly Thr Ser Pro Gly Leu Ser Ala Gly Ala Thr Val Gly Ile Met
660 665 670
Ile Gly Val Leu Val Gly Val Ala Leu Ile
675 680
<210>32
<211>2049
<212>DNA
<213>人工序列
<400>32
atggagtctc cctcggcccc tccccacaga tggtgcatcc cctggcagag gctcctgctc 60
acagcctcac ttctaacctt ctggaacccg cccaccactg ccaagctcac tattgaatcc 120
acgctttttg gctacagctg gtacaaaggt gaaagagtgg atggcaaccg tcaaattata 180
ggatatgtaa taggaactca acaagctacc ccagggcccg catacagtgg tcgagagata 240
atatacccca atgcatccct gctgatccag aacatcatcc agaatgacac aggattctac 300
accctacacg tcataaagtc agatcttgtg aatgaagaag caactggcca gttccgggta 360
tacccggagc tgcccaagcc ctccatctcc agcaacaact ccaaacccgt ggaggacaag 420
gatgctgtgg ccttcacctg tgaacctgag actcaggacg caacctacct gtggtgggta 480
aacaatcaga gcctcccggt cagtcccagg ctgcagctgt ccaatggcaa caggaccctc 540
actctattca atgtcacaag aaatgactca gcaagctaca aatgtgaaac ccagaaccca 600
gtgagtgcca ggcgcagtga ttcagtcatc ctgaatgtcc tctatggccc ggatgccccc 660
accatttccc ctctaaacac atcttacaga tcaggggaaa atctgaacct ctcctgccac 720
gcagcctcta acccacctgc acagtactct tggtttgtca atgggacttt ccagcaatcc 780
acccaagagc tctttatccc caacatcact gtgaataata gtggatccta tacgtgccaa 840
gcccataact cagacactgg cctcaatagg accacagtca cgacgatcac agtctatgca 900
gagccaccca aacccttcat caccagcaac aactccaacc ccgtggagga tgaggatgct 960
gtagccttaa cctgtgaacc tgagattcag aacacaacct acctgtggtg ggtaaataat 1020
cagagcctcc cggtcagtcc caggctgcag ctgtccaatg acaacaggac cctcactcta 1080
ctcagtgtca caaggaatga tgtaggaccc tatgagtgtg gaatccagaa cgaattaagt 1140
gttgaccaca gcgacccagt catcctgaat gtcctctatg gcccagacga ccccaccatt 1200
tccccctcat acacctatta ccgtccaggg gtgaacctca gcctctcctg ccatgcagcc 1260
tctaacccac ctgcacagta ttcttggctg attgatggga acatccagca acacacacaa 1320
gagctcttta tctccaacat cactgagaag aacagcggac tctatacctg ccaggccaat 1380
aactcagcca gtggccacag caggactaca gtcaagacaa tcacagtctc tgcggagctg 1440
cccaagccct ccatctccag caacaactcc aaacccgtgg aggacaagga tgctgtggcc 1500
ttcacctgtg aacctgaggc tcagaacaca acctacctgt ggtgggtaaa tggtcagagc 1560
ctcccagtca gtcccaggct gcagctgtcc aatggcaaca ggaccctcac tctattcaat 1620
gtcacaagaa atgacgcaag agcctatgta tgtggaatcc agaactcagt gagtgcaaac 1680
cgcagtgacc cagtcaccct ggatgtcctc tatgggccgg acacccccat catttccccc 1740
ccagactcgt cttacctttc gggagcgaac ctcaacctct cctgccactc ggcctctaac 1800
ccatccccgc agtattcttg gcgtatcaat gggataccgc agcaacacac acaagttctc 1860
tttatcgcca aaatcacgcc aaataataac gggacctatg cctgttttgt ctctaacttg 1920
gctactggcc gcaataattc catagtcaag agcatcacag tctctgcatc tggaacttct 1980
cctggtctct cagctggggc cactgtcggc atcatgattg gagtgctggt tggggttgct 2040
ctgatatag 2049
<210>33
<211>28
<212>DNA
<213>人工序列
<400>33
ccggaattca tggagtctcc ctcggccc 28
<210>34
<211>28
<211>DNA
<213>人工序列
<400>34
gccaaaaagc gtggattcaa tagtgagc 28
<210>35
<211>29
<212>DNA
<213>人工序列
<400>35
tgaatccacg ctttttggct acagctggt 29
<210>36
<211>23
<212>DNA
<213>人工序列
<400>36
ggaagatctg actttatgac gtg 23
<210>37
<211>1407
<212>DNA
<213>人工序列
<400>37
atggggcacc tctcagcccc acttcacaga gtgcgtgtac cctggcaggg gcttctgctc 60
acagcctcac ttctaacctt ctggaacccg cccaccactg cccagctcac tactgaatcc 120
atgccattca atgttgcaga ggggaaggag gttcttctcc ttgtccacaa tctgccccag 180
caactttttg gctacagctg gtacaaaggg gaaagagtgg atggcaaccg tcaaattgta 240
ggatatgcaa taggaactca acaagctacc ccagggcccg caaacagcgg tcgagagaca 300
atatacccca atgcatccct gctgatccag aacgtcaccc agaatgacac aggattctac 360
accctacaag tcataaagtc agatcttgtg aatgaagaag caactggaca gttccatgta 420
tacccggagc tgcccaagcc ctccatctcc agcaacaact ccaaccctgt ggaggacaag 480
gatgctgtgg ccttcacctg tgaacctgag actcaggaca caacctacct gtggtggata 540
aacaatcaga gcctcccggt cagtcccagg ctgcagctgt ccaatggcaa caggaccctc 600
actctactca gtgtcacaag gaatgacaca ggaccctatg agtgtgaaat acagaaccca 660
gtgagtgcga accgcagtga cccagtcacc ttgaatgtca cctatggccc ggacaccccc 720
accatttccc cttcagacac ctattaccgt ccaggggcaa acctcagcct ctcctgctat 780
gcagcctcta acccacctgc acagtactcc tggcttatca atggaacatt ccagcaaagc 840
acacaagagc tctttatccc taacatcact gtgaataata gtggatccta tacctgccac 900
gccaataatt cagtcactgg ctgcaacagg accacagtca agacgatcat agtcactgag 960
ctaagtccag tagtagcaaa gccccaaatc aaagccagca agaccacagt cacaggagat 1020
aaggactctg tgaacctgac ctgctccaca aatgacactg gaatctccat ccgttggttc 1080
ttcaaaaacc agagtctccc gtcctcggag aggatgaagc tgtcccaggg caacaccacc 1140
ctcagcataa accctgtcaa gagggaggat gctgggacgt attggtgtga ggtcttcaac 1200
ccaatcagta agaaccaaag cgaccccatc atgctgaacg taaactataa tgctctacca 1260
caagaaaatg gcctctcacc tggggccatt gctggcattg tgattggagt agtggccctg 1320
gttgctctga tagcagtagc cctggcatgt tttctgcatt tcgggaagac cggcaggacc 1380
actccaatga cccacctaac aagatga 1407
<210>38
<211>28
<212>DNA
<213>人工序列
<400>38
ccggaattca tggggcacct ctcagccc 28
<210>39
<211>30
<212>DNA
<213>人工序列
<400>39
cccaagcttg gtcttgttag gtgggtcatt 30
<210>40
<211>448
<212>PRT
<213>人工序列
<400>40
Met Gly His Leu Ser Ala Pro Leu His Arg Val Arg Val Pro Trp Gln
1 5 10 15
Gly Leu Leu Leu Thr Ala Ser Leu Leu Thr Phe Trp Asn Pro Pro Thr
20 25 30
Thr Ala Gln Leu Thr Thr Glu Ser Met Leu Phe Gly Tyr Ser Trp Tyr
35 40 45
Lys Gly Glu Arg Val Asp Gly Asn Arg Gln Ile Val Gly Tyr Ala Ile
50 55 60
Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Asn Ser Gly Arg Glu Thr
65 70 75 80
Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Val Thr Gln Asn Asp
85 90 95
Thr Gly Phe Tyr Thr Leu Gln Val Ile Lys Ser Asp Leu Val Asn Glu
100 105 110
Glu Ala Thr Gly Gln Phe His Val Tyr Pro Glu Leu Pro Lys Pro Ser
115 120 125
Ile Ser Ser Asn Asn Ser Asn Pro Val Glu Asp Lys Asp Ala Val Ala
130 135 140
Phe Thr Cys Glu Pro Glu Thr Gln Asp Thr Thr Tyr Leu Trp Trp Ile
145 150 155 160
Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu Gln Leu Ser Asn Gly
165 170 175
Asn Arg Thr Leu Thr Leu Leu Ser Val Thr Arg Asn Asp Thr Gly Pro
180 185 190
Tyr Glu Cys Glu Ile Gln Asn Pro Val Ser Ala Asn Arg Ser Asp Pro
195 200 205
Val Thr Leu Asn Val Thr Tyr Gly Pro Asp Thr Pro Thr Ile Ser Pro
210 215 220
Ser Asp Thr Tyr Tyr Arg Pro Gly Ala Asn Leu Ser Leu Ser Cys Tyr
225 230 235 240
Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Leu Ile Asn Gly Thr
245 250 255
Phe Gln Gln Ser Thr Gln Glu Leu Phe Ile Pro Asn Ile Thr Val Asn
260 265 270
Asn Ser Gly Ser Tyr Thr Cys His Ala Asn Asn Ser Val Thr Gly Cys
275 280 285
Asn Arg Thr Thr Val Lys Thr Ile Ile Val Thr Glu Leu Ser Pro Val
290 295 300
Val Ala Lys Pro Gln Ile Lys Ala Ser Lys Thr Thr Val Thr Gly Asp
305 310 315 320
Lys Asp Ser Val Asn Leu Thr Cys Ser Thr Asn Asp Thr Gly Ile Ser
325 330 335
Ile Arg Trp Phe Phe Lys Asn Gln Ser Leu Pro Ser Ser Glu Arg Met
340 345 350
Lys Leu Ser Gln Gly Asn Thr Thr Leu Ser Ile Asn Pro Val Lys Arg
355 360 365
Glu Asp Ala Gly Thr Tyr Trp Cys Glu Val Phe Asn Pro Ile Ser Lys
370 375 380
Asn Gln Ser Asp Pro Ile Met Leu Asn Val Asn Tyr Asn Ala Leu Pro
385 390 395 400
Gln Glu Asn Gly Leu Ser Pro Gly Ala Ile Ala Gly Ile Val Ile Gly
405 410 415
Val Val Ala Leu Val Ala Leu Ile Ala Val Ala Leu Ala Cys Phe Leu
420 425 430
His Phe Gly Lys Thr Gly Arg Thr Thr Pro Met Thr His Leu Thr Arg
435 440 445
<210>41
<211>1347
<212>DNA
<213>人工序列
<400>41
atggggcacc tctcagcccc acttcacaga gtgcgtgtac cctggcaggg gcttctgctc 60
acagcctcac ttctaacctt ctggaacccg cccaccactg cccagctcac tactgaatcc 120
atgctttttg gctacagctg gtacaaaggg gaaagagtgg atggcaaccg tcaaattgta 180
ggatatgcaa taggaactca acaagctacc ccagggcccg caaacagcgg tcgagagaca 240
atatacccca atgcatccct gctgatccag aacgtcaccc agaatgacac aggattctac 300
accctacaag tcataaagtc agatcttgtg aatgaagaag caactggaca gttccatgta 360
tacccggagc tgcccaagcc ctccatctcc agcaacaact ccaaccctgt ggaggacaag 420
gatgctgtgg ccttcacctg tgaacctgag actcaggaca caacctacct gtggtggata 480
aacaatcaga gcctcccggt cagtcccagg ctgcagctgt ccaatggcaa caggaccctc 540
actctactca gtgtcacaag gaatgacaca ggaccctatg agtgtgaaat acagaaccca 600
gtgagtgcga accgcagtga cccagtcacc ttgaatgtca cctatggccc ggacaccccc 660
accatttccc cttcagacac ctattaccgt ccaggggcaa acctcagcct ctcctgctat 720
gcagcctcta acccacctgc acagtactcc tggcttatca atggaacatt ccagcaaagc 780
acacaagagc tctttatccc taacatcact gtgaataata gtggatccta tacctgccac 840
gccaataact cagtcactgg ctgcaacagg accacagtca agacgatcat agtcactgag 900
ctaagtccag tagtagcaaa gccccaaatc aaagccagca agaccacagt cacaggagat 960
aaggactctg tgaacctgac ctgctccaca aatgacactg gaatctccat ccgttggttc 1020
ttcaaaaacc agagtctccc gtcctcggag aggatgaagc tgtcccaggg caacaccacc 1080
ctcagcataa accctgtcaa gagggaggat gctgggacgt attggtgtga ggtcttcaac 1140
ccaatcagta agaaccaaag cgaccccatc atgctgaacg taaactataa tgctctacca 1200
caagaaaatg gcctctcacc tggggccatt gctggcattg tgattggagt agtggccctg 1260
gttgctctga tagcagtagc cctggcatgt tttctgcatt tcgggaagac cggcaggacc 1320
actccaatga cccacctaac aagatga 1347
<210>42
<211>27
<212>DNA
<213>人工序列
<400>42
ccggaattca tggggcacct ctcagcc 27
<210>43
<211>22
<212>DNA
<213>人工序列
<400>43
cgcggatcca ctattattca ca 22
<210>44
<211>29
<212>DNA
<213>人工序列
<400>44
tgaatccatg ctttttggct acagctggt 29
<210>45
<211>28
<212>DNA
<213>人工序列
<400>45
gccaaaaagc atggattcag tagtgagc 28
<210>46
<211>468
<212>PRT
<213>人工序列
<400>46
Met Gly His Leu Ser Ala Pro Leu His Arg Val Arg Val Pro Trp Gln
1 5 10 15
Gly Leu Leu Leu Thr Ala Ser Leu Leu Thr Phe Trp Asn Pro Pro Thr
20 25 30
Thr Ala Gln Leu Thr Thr Glu Ser Met Pro Phe Asn Val Ala Glu Gly
35 40 45
Lys Glu Val Leu Leu Leu Val His Asn Leu Pro Gln Gln Leu Phe Gly
50 55 60
Tyr Ser Trp Tyr Lys Gly Glu Arg Val Asp Gly Asn Arg Gln Ile Val
65 70 75 80
Gly Tyr Ala Ile Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Asn Ser
85 90 95
Gly Arg Glu Thr Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Val
100 105 110
Thr Gln Asn Asp Thr Gly Phe Tyr Thr Leu Gln Val Ile Lys Ser Asp
115 120 125
Leu Val Asn Glu Glu Ala Thr Gly Gln Phe His Val Tyr Pro Glu Leu
130 135 140
Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Asn Pro Val Glu Asp Lys
145 150 155 160
Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Thr Gln Asp Thr Thr Tyr
165 170 175
Leu Trp Trp Ile Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu Gln
180 185 190
Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Leu Ser Val Thr Arg Asn
195 200 205
Asp Thr Gly Pro Tyr Glu Cys Glu Ile Gln Asn Pro Val Ser Ala Asn
210 215 220
Arg Ser Asp Pro Val Thr Leu Asn Val Thr Tyr Gly Pro Asp Thr Pro
225 230 235 240
Thr Ile Ser Pro Ser Asp Thr Tyr Tyr Arg Pro Gly Ala Asn Leu Ser
245 250 255
Leu Ser Cys Tyr Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Leu
260 265 270
Ile Asn Gly Thr Phe Gln Gln Ser Thr Gln Glu Leu Phe Ile Pro Asn
275 280 285
Ile Thr Val Asn Asn Ser Gly Ser Tyr Thr Cys His Ala Asn Asn Ser
290 295 300
Val Thr Gly Cys Asn Arg Thr Thr Val Lys Thr Ile Ile Val Thr Glu
305 310 315 320
Leu Ser Pro Val Val Ala Lys Pro Gln Ile Lys Ala Ser Lys Thr Thr
325 330 335
Val Thr Gly Asp Lys Asp Ser Val Asn Leu Thr Cys Ser Thr Asn Asp
340 345 350
Thr Gly Ile Ser Ile Arg Trp Phe Phe Lys Asn Gln Ser Leu Pro Ser
355 360 365
Ser Glu Arg Met Lys Leu Ser Gln Gly Asn Thr Thr Leu Ser Ile Asn
370 375 380
Pro Val Lys Arg Glu Asp Ala Gly Thr Tyr Trp Cys Glu Val Phe Asn
385 390 395 400
Pro Ile Ser Lys Asn Gln Ser Asp Pro Ile Met Leu Asn Val Asn Tyr
405 410 415
Asn Ala Leu Pro Gln Glu Asn Gly Leu Ser Pro Gly Ala Ile Ala Gly
420 425 430
Ile Val Ile Gly Val Val Ala Leu Val Ala Leu Ile Ala Val Ala Leu
435 440 445
Ala Cys Phe Leu His Phe Gly Lys Thr Gly Arg Thr Thr Pro Met Thr
450 455 460
His Leu Thr Arg
465
<210>47
<211>20
<212>PRT
<213>人工序列
<400>47
Pro Phe Asn Val Ala Glu Gly Lys Glu Val Leu Leu Leu Val His Asn
1 5 10 15
Leu Pro Gln Gln
20
<210>48
<211>1035
<212>DNA
<213>人工序列
<400>48
atgggacccc cctcagcccc tccctgcaga ttgcatgtcc cctggaagga ggtcctgctc 60
acagcctcac ttctaacctt ctggaaccca cccaccactg ccaagctcac tattgaatcc 120
acgccattca atgtcgcaga ggggaaggag gttcttctac tcgcccacaa cctgccccag 180
aatcgtattg gttacagctg gtacaaaggc gaaagagtgg atggcaacag tctaattgta 240
ggatatgtaa taggaactca acaagctacc ccagggcccg catacagtgg tcgagagaca 300
ctatacccca atgcatccct gctgatccag aacgtcaccc agaatgacac aggattctat 360
accctacaag tcataaagtc agatcttgtg aatgaagaag caaccggaca gttccatgta 420
tacccggagc tgcccaagcc ctccatctcc agcaacaact ccaaccccgt ggaggacaag 480
gatgctgtgg ccttcacctg tgaacctgag gttcagaaca caacctacct gtggtgggta 540
aatggtcaga gcctcccggt cagtcccagg ctgcagctgt ccaatggcaa catgaccctc 600
actctactca gcgtcaaaag gaacgatgca ggatcctatg aatgtgaaat acagaaccca 660
gcgagtgcca accgcagtga cccagtcacc ctgaatgtcc tctatggccc agatggcccc 720
accatttccc cctcaaaggc caattaccgt ccaggggaaa atctgaacct ctcctgccac 780
gcagcctcta acccacctgc acagtactct tggtttatca atgggacgtt ccagcaatcc 840
acacaagagc tctttatccc caacatcact gtgaataata gcggatccta tatgtgccaa 900
gcccataact cagccactgg cctcaatagg accacagtca cgatgatcac agtctctgga 960
agtgctcctg tcctctcagc tgtggccacc gtcggcatca cgattggagt gctggccagg 1020
gtcgctctga tatag 1035
<210>49
<211>30
<212>DNA
<213>人工序列
<400>49
ccggaattca tgggaccccc ctcagcccct 30
<210>50
<211>30
<212>DNA
<213>人工序列
<400>50
cccaagcttc tatatcagag ccaccctggc 30
<210>51
<211>1050
<212>DNA
<213>人工序列
<400>51
atggggccca tctcagcccc ttcctgcaga tggcgcatcc cctggcaggg gctcctgctc 60
acagcctcac ttttcacctt ctggaacccg cccaccactg ctcagctcac tattgaagct 120
gtgccatcca atgctgcaga ggggaaggag gttcttctac ttgtccacaa tctgccccag 180
gaccctcgtg gctacaactg gtacaaaggg gaaacagtgg atgccaaccg tcgaattata 240
ggatatgtaa tatcaaatca acagattacc ccagggcctg catacagcaa tcgagagaca 300
atatacccca atgcatccct gctgatgcgg aacgtcacca gaaatgacac aggatcctac 360
accctacaag tcataaagct aaatcttatg agtgaagaag taactggcca gttcagcgta 420
catccggaga ctcccaagcc ctccatctcc agcaacaact ccaaccccgt ggaggacaag 480
gatgctgtgg ccttcacctg tgaacctgag actcagaaca caacctacct gtggtgggta 540
aatggtcaga gtctcccggt cagtcccagg ctgcagctgt ccaatggcaa caggaccctc 600
actctactca gtgtcacaag gaatgacgta ggaccctatg aatgtgaaat acagaaccca 660
gcgagtgcaa acttcagtga cccagtcacc ctgaatgtcc tctatggccc agatgccccc 720
accatttccc cttcagacac ctattaccat gcaggggtaa atctcaacct ctcctgccat 780
gcggcctcta atccaccctc acagtattct tggtctgtca atggcacatt ccagcaatac 840
acacaaaagc tctttatccc caacatcact acaaagaaca gcggatccta tgcctgccac 900
accactaact cagccactgg ccgcaacagg accacagtca ggatgatcac agtctctgat 960
gctttagtac aaggaagttc tcctggcctc tcagctagag ccactgtcag catcatgatt 1020
ggagtactgg ccagggtggc tctgatatag 1050
<210>52
<211>29
<212>DNA
<213>人工序列
<400>52
ccggaattcc gcaggcagca gagaccatg 29
<210>53
<211>30
<212>DNA
<213>人工序列
<400>53
cccaagctta caccagagct actatatcag 30
<210>54
<211>344
<212>PRT
<213>人工序列
<400>54
Met Gly Pro Pro Ser Ala Pro Pro Cys Arg Leu His Val Pro Trp Lys
1 5 10 15
Glu Val Leu Leu Thr Ala Ser Leu Leu Thr Phe Trp Asn Pro Pro Thr
20 25 30
Thr Ala Lys Leu Thr Ile Glu Ser Thr Pro Phe Asn Val Ala Glu Gly
35 40 45
Lys Glu Val Leu Leu Leu Ala His Asn Leu Pro Gln Asn Arg Ile Gly
50 55 60
Tyr Ser Trp Tyr Lys Gly Glu Arg Val Asp Gly Asn Ser Leu Ile Val
65 70 75 80
Gly Tyr Val Ile Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Tyr Ser
85 90 95
Gly Arg Glu Thr Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Val
100 105 110
Thr Gln Asn Asp Thr Gly Phe Tyr Thr Leu Gln Val Ile Lys Ser Asp
115 120 125
Leu Val Asn Glu Glu Ala Thr Gly Gln Phe His Val Tyr Pro Glu Leu
130 135 140
Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Asn Pro Val Glu Asp Lys
145 150 155 160
Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Val Gln Asn Thr Thr Tyr
165 170 175
Leu Trp Trp Val Asn Gly Gln Ser Leu Pro Val Ser Pro Arg Leu Gln
180 185 190
Leu Ser Asn Gly Asn Met Thr Leu Thr Leu Leu Ser Val Lys Arg Asn
195 200 205
Asp Ala Gly Ser Tyr Glu Cys Glu Ile Gln Asn Pro Ala Ser Ala Asn
210 215 220
Arg Ser Asp Pro Val Thr Leu Asn Val Leu Tyr Gly Pro Asp Gly Pro
225 230 235 240
Thr Ile Ser Pro Ser Lys Ala Asn Tyr Arg Pro Gly Glu Asn Leu Asn
245 250 255
Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Phe
260 265 270
Ile Asn Gly Thr Phe Gln Gln Ser Thr Gln Glu Leu Phe Ile Pro Asn
275 280 285
Ile Thr Val Asn Asn Ser Gly Ser Tyr Met Cys Gln Ala His Asn Ser
290 295 300
Ala Thr Gly Leu Asn Arg Thr Thr Val Thr Met Ile Thr Val Ser Gly
305 310 315 320
Ser Ala Pro Val Leu Ser Ala Val Ala Thr Val Gly Ile Thr Ile Gly
325 330 335
Val Leu Ala Arg Val Ala Leu Ile
340
<210>55
<211>20
<212>PRT
<213>人工序列
<400>55
Pro Phe Asn Val Ala Glu Gly Lys Glu Val Leu Leu Leu Ala His Asn
1 5 10 15
Leu Pro Gln Asn
20
<210>56
<211>349
<212>PRT
<213>人工序列
<400>56
Met Gly Pro Ile Ser Ala Pro Ser Cys Arg Trp Arg Ile Pro Trp Gln
1 5 10 15
Gly Leu Leu Leu Thr Ala Ser Leu Phe Thr Phe Trp Asn Pro Pro Thr
20 25 30
Thr Ala Gln Leu Thr Ile Glu Ala Val Pro Ser Asn Ala Ala Glu Gly
35 40 45
Lys Glu Val Leu Leu Leu Val His Asn Leu Pro Gln Asp Pro Arg Gly
50 55 60
Tyr Asn Trp Tyr Lys Gly Glu Thr Val Asp Ala Asn Arg Arg Ile Ile
65 70 75 80
Gly Tyr Val Ile Ser Asn Gln Gln Ile Thr Pro Gly Pro Ala Tyr Ser
85 90 95
Asn Arg Glu Thr Ile Tyr Pro Asn Ala Ser Leu Leu Met Arg Asn Val
100 105 110
Thr Arg Asn Asp Thr Gly Ser Tyr Thr Leu Gln Val Ile Lys Leu Asn
115 120 125
Leu Met Ser Glu Glu Val Thr Gly Gln Phe Ser Val His Pro Glu Thr
130 135 140
Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Asn Pro Val Glu Asp Lys
145 150 155 160
Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Thr Gln Asn Thr Thr Tyr
165 170 175
Leu Trp Trp Val Asn Gly Gln Ser Leu Pro Val Ser Pro Arg Leu Gln
180 185 190
Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Leu Ser Val Thr Arg Asn
195 200 205
Asp Val Gly Pro Tyr Glu Cys Glu Ile Gln Asn Pro Ala Ser Ala Asn
210 215 220
Phe Ser Asp Pro Val Thr Leu Asn Val Leu Tyr Gly Pro Asp Ala Pro
225 230 235 240
Thr Ile Ser Pro Ser Asp Thr Tyr Tyr His Ala Gly Val Asn Leu Asn
245 250 255
Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ser Gln Tyr Ser Trp Ser
260 265 270
Val Asn Gly Thr Phe Gln Gln Tyr Thr Gln Lys Leu Phe Ile Pro Asn
275 280 285
Ile Thr Thr Lys Asn Ser Gly Ser Tyr Ala Cys His Thr Thr Asn Ser
290 295 300
Ala Thr Gly Arg Asn Arg Thr Thr Val Arg Met Ile Thr Val Ser Asp
305 310 315 320
Ala Leu Val Gln Gly Ser Ser Pro Gly Leu Ser Ala Arg Ala Thr Val
325 330 335
Ser Ile Met Ile Gly Val Leu Ala Arg Val Ala Leu Ile
340 345
<210>57
<211>20
<212>PRT
<213>人工序列
<400>57
Pro Ser Asn Ala Ala Glu Gly Lys Glu Val Leu Leu Leu Val His Asn
1 5 10 15
Leu Pro Gln Asp
20
<210>58
<211>1566
<212>DNA
<213>人工序列
<400>58
atggagctgg cctcagcaca tctccacaaa gggcaggttc cctggggagg actactgctc 60
acagcctcac ttttagcctc ctggagccct gccaccactg ctgaagtcac cattgaggct 120
gtgccgcccc aggttgctga agacaacaat gttcttctac ttgttcacaa tctgcccctg 180
gcgcttggag cctttgcctg gtacaaggga aacactacgg ctatagacaa agaaattgca 240
cgatttgtac caaatagtaa tatgaatttc acggggcaag catacagcgg cagagagata 300
atatacagca atggatccct gctcttccaa atgatcacca tgaaggatat gggagtctac 360
acactagata tgacagatga aaactatcgt cgtactcagg cgactgtgcg atttcatgta 420
caccccatat tattaaagcc caacatcaca agcaacaact ccaatcccgt ggagggtgac 480
gactccgtat cattaacctg tgactcttac actgaccctg ataatataaa ctacctgtgg 540
agcagaaatg gtgaaagcct ttcagaaggt gacaggctga agctgtctga gggcaacagg 600
actctcactt tactcaatgt cacgaggaat gacacaggac cctatgtgtg tgaaacccgg 660
aatccagtga gtgtcaaccg aagtgaccca ttcagcctga acattatcta tggtccggac 720
accccgatta tatccccctc agatatttat ttgcatccag ggtcaaacct caacctctcc 780
tgccatgcag cctctaaccc acctgcacag tacttttggc ttatcaatga gaagccccat 840
gcatcctccc aagagctctt tatccccaac atcactacta ataatagcgg aacctatacc 900
tgcttcgtca ataactctgt cactggcctc agtaggacca cagtcaagaa cattacagtc 960
cttgagccag tgactcagcc cttcctccaa gtcaccaaca ccacagtcaa agaactagac 1020
tctgtgaccc tgacctgctt gtcgaatgac attggagcca acatccagtg gctcttcaat 1080
agccagagtc ttcagctcac agagagaatg acactctccc agaacaacag catcctcaga 1140
atagacccta ttaagaggga agatgccggc gagtatcagt gtgaaatctc gaatccagtc 1200
agcgtcagga ggagcaactc aatcaagctg gacataatat ttgacccaac acaaggaggc 1260
ctctcagatg gcgccattgc tggcatcgtg attggagttg tggctggggt ggctctaata 1320
gcagggctgg catatttcct ctattccagg aagtctggcg ggggaagtga ccagcgagat 1380
ctcacagagc acaaaccctc agcctccaac cacaatctgg ctccttctga caactctcct 1440
aacaaggtgg atgacgtcgc atacactgtc ctgaacttca attcccagca acccaaccgg 1500
ccaacttcag ccccttcttc tccaagagcc acagaaacag tttattcaga agtaaaaaag 1560
aagtga 1566
<210>59
<211>521
<212>PRT
<213>人工序列
<400>59
Met Glu Leu Ala Ser Ala His Leu His Lys Gly Gln Val Pro Trp Gly
1 5 10 15
Gly Leu Leu Leu Thr Ala Ser Leu Leu Ala Ser Trp Ser Pro Ala Thr
20 25 30
Thr Ala Glu Val Thr Ile Glu Ala Val Pro Pro Gln Val Ala Glu Asp
35 40 45
Asn Asn Val Leu Leu Leu Val His Asn Leu Pro Leu Ala Leu Gly Ala
50 55 60
Phe Ala Trp Tyr Lys Gly Asn Thr Thr Ala Ile Asp Lys Glu Ile Ala
65 70 75 80
Arg Phe Val Pro Asn Ser Asn Met Asn Phe Thr Gly Gln Ala Tyr Ser
85 90 95
Gly Arg Glu Ile Ile Tyr Ser Asn Gly Ser Leu Leu Phe Gln Met Ile
100 105 110
Thr Met Lys Asp Met Gly Val Tyr Thr Leu Asp Met Thr Asp Glu Asn
115 120 125
Tyr Arg Arg Thr Gln Ala Thr Val Arg Phe His Val His Pro Ile Leu
130 135 140
Leu Lys Pro Asn Ile Thr Ser Asn Asn Ser Asn Pro Val Glu Gly Asp
145 150 155 160
Asp Ser Val Ser Leu Thr Cys Asp Ser Tyr Thr Asp Pro Asp Asn Ile
165 170 175
Asn Tyr Leu Trp Ser Arg Asn Gly Glu Ser Leu Ser Glu Gly Asp Arg
180 185 190
Leu Lys Leu Ser Glu Gly Asn Arg Thr Leu Thr Leu Leu Asn Val Thr
195 200 205
Arg Asn Asp Thr Gly Pro Tyr Val Cys Glu Thr Arg Asn Pro Val Ser
210 215 220
Val Asn Arg Ser Asp Pro Phe Ser Leu Asn Ile Ile Tyr Gly Pro Asp
225 230 235 240
Thr Pro Ile Ile Ser Pro Ser Asp Ile Tyr Leu His Pro Gly Ser Asn
245 250 255
Leu Asn Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Phe
260 265 270
Trp Leu Ile Asn Glu Lys Pro His Ala Ser Ser Gln Glu Leu Phe Ile
275 280 285
Pro Asn Ile Thr Thr Asn Asn Ser Gly Thr Tyr Thr Cys Phe Val Asn
290 295 300
Asn Ser Val Thr Gly Leu Ser Arg Thr Thr Val Lys Asn Ile Thr Val
305 310 315 320
Leu Glu Pro Val Thr Gln Pro Phe Leu Gln Val Thr Asn Thr Thr Val
325 330 335
Lys Glu Leu Asp Ser Val Thr Leu Thr Cys Leu Ser Asn Asp Ile Gly
340 345 350
Ala Asn Ile Gln Trp Leu Phe Asn Ser Gln Ser Leu Gln Leu Thr Glu
355 360 365
Arg Met Thr Leu Ser Gln Asn Asn Ser Ile Leu Arg Ile Asp Pro Ile
370 375 380
Lys Arg Glu Asp Ala Gly Glu Tyr Gln Cys Glu Ile Ser Asn Pro Val
385 390 395 400
Ser Val Arg Arg Ser Asn Ser Ile Lys Leu Asp Ile Ile Phe Asp Pro
405 410 415
Thr Gln Gly Gly Leu Ser Asp Gly Ala Ile Ala Gly Ile Val Ile Gly
420 425 430
Val Val Ala Gly Val Ala Leu Ile Ala Gly Leu Ala Tyr Phe Leu Tyr
435 440 445
Ser Arg Lys Ser Gly Gly Gly Ser Asp Gln Arg Asp Leu Thr Glu His
450 455 460
Lys Pro Ser Ala Ser Asn His Asn Leu Ala Pro Ser Asp Asn Ser Pro
465 470 475 480
Asn Lys Val Asp Asp Val Ala Tyr Thr Val Leu Asn Phe Asn Ser Gln
485 490 495
Gln Pro Asn Arg Pro Thr Ser Ala Pro Ser Ser Pro Arg Ala Thr Glu
500 505 510
Thr Val Tyr Ser Glu Val Lys Lys Lys
515 520
<210>60
<211>20
<212>PRT
<213>人工序列
<400>60
Pro Pro Gln Val Ala Glu Asp Asn Asn Val Leu Leu Leu Val His Asn
1 5 10 15
Leu Pro Leu Ala
20
<210>61
<211>9
<212>PRT
<213>人工序列
<400>61
Ala Glu Asp Asn Asn Val Leu Leu Leu
1 5
<210>62
<211>9
<212>PRT
<213>人工序列
<400>62
Ala Glu Gly Lys Glu Val Leu Leu Leu
1 5