KR20160020516A - 오메가-수산화 지방산 유도체를 생성하는 방법들 - Google Patents
오메가-수산화 지방산 유도체를 생성하는 방법들 Download PDFInfo
- Publication number
- KR20160020516A KR20160020516A KR1020167000963A KR20167000963A KR20160020516A KR 20160020516 A KR20160020516 A KR 20160020516A KR 1020167000963 A KR1020167000963 A KR 1020167000963A KR 20167000963 A KR20167000963 A KR 20167000963A KR 20160020516 A KR20160020516 A KR 20160020516A
- Authority
- KR
- South Korea
- Prior art keywords
- fatty acid
- omega
- cyp153a
- polypeptide
- hydroxylase
- Prior art date
Links
- 229940053200 antiepileptics fatty acid derivative Drugs 0.000 title claims abstract description 171
- 238000000034 method Methods 0.000 title claims abstract description 128
- 244000005700 microbiome Species 0.000 claims abstract description 119
- 238000000855 fermentation Methods 0.000 claims abstract description 63
- 230000004151 fermentation Effects 0.000 claims abstract description 63
- 239000000194 fatty acid Substances 0.000 claims description 329
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 308
- 229930195729 fatty acid Natural products 0.000 claims description 308
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 239
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 239
- 229920001184 polypeptide Polymers 0.000 claims description 238
- 150000004665 fatty acids Chemical class 0.000 claims description 136
- 230000004927 fusion Effects 0.000 claims description 134
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 133
- 229910052799 carbon Inorganic materials 0.000 claims description 133
- 102000037865 fusion proteins Human genes 0.000 claims description 94
- 108020001507 fusion proteins Proteins 0.000 claims description 94
- 230000000694 effects Effects 0.000 claims description 80
- 235000019387 fatty acid methyl ester Nutrition 0.000 claims description 75
- 150000007523 nucleic acids Chemical group 0.000 claims description 71
- 238000004519 manufacturing process Methods 0.000 claims description 69
- 102000005297 Cytochrome P-450 CYP4A Human genes 0.000 claims description 61
- 108010081498 Cytochrome P-450 CYP4A Proteins 0.000 claims description 61
- 230000035772 mutation Effects 0.000 claims description 52
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 51
- 239000008103 glucose Substances 0.000 claims description 51
- 239000000203 mixture Substances 0.000 claims description 49
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 claims description 47
- 108020002982 thioesterase Proteins 0.000 claims description 47
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 44
- 102000005488 Thioesterase Human genes 0.000 claims description 44
- 108010021809 Alcohol dehydrogenase Proteins 0.000 claims description 43
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 40
- 238000001727 in vivo Methods 0.000 claims description 37
- 102000007698 Alcohol dehydrogenase Human genes 0.000 claims description 36
- 230000037361 pathway Effects 0.000 claims description 36
- 108010025188 Alcohol oxidase Proteins 0.000 claims description 29
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 19
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 claims description 18
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 18
- 102000003929 Transaminases Human genes 0.000 claims description 18
- 108090000340 Transaminases Proteins 0.000 claims description 18
- 102200074510 rs2015352 Human genes 0.000 claims description 18
- 238000004113 cell culture Methods 0.000 claims description 17
- 102100027841 Acyl-CoA wax alcohol acyltransferase 2 Human genes 0.000 claims description 16
- 101710129019 Long-chain acyl-[acyl-carrier-protein] reductase Proteins 0.000 claims description 16
- 239000002028 Biomass Substances 0.000 claims description 15
- 102100035762 Diacylglycerol O-acyltransferase 2 Human genes 0.000 claims description 15
- 102000003960 Ligases Human genes 0.000 claims description 15
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 235000021588 free fatty acids Nutrition 0.000 claims description 15
- 235000011187 glycerol Nutrition 0.000 claims description 15
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 14
- OJURWUUOVGOHJZ-UHFFFAOYSA-N methyl 2-[(2-acetyloxyphenyl)methyl-[2-[(2-acetyloxyphenyl)methyl-(2-methoxy-2-oxoethyl)amino]ethyl]amino]acetate Chemical compound C=1C=CC=C(OC(C)=O)C=1CN(CC(=O)OC)CCN(CC(=O)OC)CC1=CC=CC=C1OC(C)=O OJURWUUOVGOHJZ-UHFFFAOYSA-N 0.000 claims description 14
- 229920000642 polymer Polymers 0.000 claims description 14
- 108090000364 Ligases Proteins 0.000 claims description 13
- 102000005369 Aldehyde Dehydrogenase Human genes 0.000 claims description 12
- 108020002663 Aldehyde Dehydrogenase Proteins 0.000 claims description 12
- 108091023020 Aldehyde Oxidase Proteins 0.000 claims description 12
- 102000048262 Aldehyde oxidases Human genes 0.000 claims description 12
- 229930006000 Sucrose Natural products 0.000 claims description 12
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 11
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 11
- 239000005720 sucrose Substances 0.000 claims description 11
- 239000002699 waste material Substances 0.000 claims description 11
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 claims description 10
- 240000008042 Zea mays Species 0.000 claims description 10
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 10
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 10
- 239000007789 gas Substances 0.000 claims description 10
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 9
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 9
- 235000005822 corn Nutrition 0.000 claims description 9
- 239000011347 resin Substances 0.000 claims description 9
- 229920005989 resin Polymers 0.000 claims description 9
- 240000000111 Saccharum officinarum Species 0.000 claims description 8
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 101710186512 3-ketoacyl-CoA thiolase Proteins 0.000 claims description 7
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 claims description 7
- 239000001569 carbon dioxide Substances 0.000 claims description 7
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 7
- 229920002678 cellulose Polymers 0.000 claims description 7
- 239000001913 cellulose Substances 0.000 claims description 7
- 235000010980 cellulose Nutrition 0.000 claims description 7
- 239000011248 coating agent Substances 0.000 claims description 7
- 238000000576 coating method Methods 0.000 claims description 7
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 claims description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 claims description 6
- 102100026608 Aldehyde dehydrogenase family 3 member A2 Human genes 0.000 claims description 6
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 claims description 6
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 claims description 6
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 claims description 6
- 241001520808 Panicum virgatum Species 0.000 claims description 6
- 229920002472 Starch Polymers 0.000 claims description 6
- 125000000217 alkyl group Chemical group 0.000 claims description 6
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 claims description 6
- 239000008107 starch Substances 0.000 claims description 6
- 235000019698 starch Nutrition 0.000 claims description 6
- 239000002023 wood Substances 0.000 claims description 6
- 244000025254 Cannabis sativa Species 0.000 claims description 5
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 claims description 5
- 229930091371 Fructose Natural products 0.000 claims description 5
- 239000005715 Fructose Substances 0.000 claims description 5
- 229920002488 Hemicellulose Polymers 0.000 claims description 5
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 claims description 5
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 claims description 5
- 108010069175 acyl-CoA transferase Proteins 0.000 claims description 5
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 claims description 5
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 5
- 239000001768 carboxy methyl cellulose Substances 0.000 claims description 5
- 235000021255 galacto-oligosaccharides Nutrition 0.000 claims description 5
- 150000003271 galactooligosaccharides Chemical class 0.000 claims description 5
- 229930182830 galactose Natural products 0.000 claims description 5
- 229920000609 methyl cellulose Polymers 0.000 claims description 5
- 239000001923 methylcellulose Substances 0.000 claims description 5
- 229920001277 pectin Polymers 0.000 claims description 5
- 239000001814 pectin Substances 0.000 claims description 5
- 235000010987 pectin Nutrition 0.000 claims description 5
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 claims description 5
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 claims description 5
- 239000010902 straw Substances 0.000 claims description 5
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 claims description 5
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2r,3r,4s,5r,6s)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2s,3r,4s,5r,6r)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2r,3r,4s,5r,6r)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 claims description 4
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims description 4
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims description 4
- DRQXUCVJDCRJDB-UHFFFAOYSA-N Turanose Natural products OC1C(CO)OC(O)(CO)C1OC1C(O)C(O)C(O)C(CO)O1 DRQXUCVJDCRJDB-UHFFFAOYSA-N 0.000 claims description 4
- FTSSQIKWUOOEGC-RULYVFMPSA-N fructooligosaccharide Chemical compound OC[C@H]1O[C@@](CO)(OC[C@@]2(OC[C@@]3(OC[C@@]4(OC[C@@]5(OC[C@@]6(OC[C@@]7(OC[C@@]8(OC[C@@]9(OC[C@@]%10(OC[C@@]%11(O[C@H]%12O[C@H](CO)[C@@H](O)[C@H](O)[C@H]%12O)O[C@H](CO)[C@@H](O)[C@@H]%11O)O[C@H](CO)[C@@H](O)[C@@H]%10O)O[C@H](CO)[C@@H](O)[C@@H]9O)O[C@H](CO)[C@@H](O)[C@@H]8O)O[C@H](CO)[C@@H](O)[C@@H]7O)O[C@H](CO)[C@@H](O)[C@@H]6O)O[C@H](CO)[C@@H](O)[C@@H]5O)O[C@H](CO)[C@@H](O)[C@@H]4O)O[C@H](CO)[C@@H](O)[C@@H]3O)O[C@H](CO)[C@@H](O)[C@@H]2O)[C@@H](O)[C@@H]1O FTSSQIKWUOOEGC-RULYVFMPSA-N 0.000 claims description 4
- 229940107187 fructooligosaccharide Drugs 0.000 claims description 4
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 4
- 108090001018 hexadecanal dehydrogenase (acylating) Proteins 0.000 claims description 4
- 239000010813 municipal solid waste Substances 0.000 claims description 4
- 229920000728 polyester Polymers 0.000 claims description 4
- 239000010865 sewage Substances 0.000 claims description 4
- RULSWEULPANCDV-PIXUTMIVSA-N turanose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](C(=O)CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RULSWEULPANCDV-PIXUTMIVSA-N 0.000 claims description 4
- 229920001221 xylan Polymers 0.000 claims description 4
- 150000004823 xylans Chemical class 0.000 claims description 4
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 3
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims description 3
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 claims description 3
- 102100034337 Long-chain-fatty-acid-CoA ligase 6 Human genes 0.000 claims description 3
- 240000006394 Sorghum bicolor Species 0.000 claims description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 3
- 235000021536 Sugar beet Nutrition 0.000 claims description 3
- 239000003365 glass fiber Substances 0.000 claims description 3
- 229920005906 polyester polyol Polymers 0.000 claims description 3
- 229920001225 polyester resin Polymers 0.000 claims description 3
- 239000004645 polyester resin Substances 0.000 claims description 3
- 239000004814 polyurethane Substances 0.000 claims description 3
- 229920002635 polyurethane Polymers 0.000 claims description 3
- 229920005992 thermoplastic resin Polymers 0.000 claims description 3
- 239000003546 flue gas Substances 0.000 claims description 2
- 108020005199 Dehydrogenases Proteins 0.000 claims 2
- 125000001183 hydrocarbyl group Chemical group 0.000 claims 2
- 210000004027 cell Anatomy 0.000 description 270
- 108090000623 proteins and genes Proteins 0.000 description 136
- 102000004190 Enzymes Human genes 0.000 description 93
- 108090000790 Enzymes Proteins 0.000 description 93
- 229940088598 enzyme Drugs 0.000 description 91
- 241000588724 Escherichia coli Species 0.000 description 75
- 108091033319 polynucleotide Proteins 0.000 description 70
- 102000040430 polynucleotide Human genes 0.000 description 70
- 239000002157 polynucleotide Substances 0.000 description 70
- 230000014509 gene expression Effects 0.000 description 61
- 102000004169 proteins and genes Human genes 0.000 description 58
- 235000018102 proteins Nutrition 0.000 description 56
- ZDHCZVWCTKTBRY-UHFFFAOYSA-N 12-hydroxylauric acid Chemical compound OCCCCCCCCCCCC(O)=O ZDHCZVWCTKTBRY-UHFFFAOYSA-N 0.000 description 47
- 150000001875 compounds Chemical class 0.000 description 46
- -1 hydroxy aliphatic alcohols Chemical class 0.000 description 46
- 239000013598 vector Substances 0.000 description 44
- 239000000047 product Substances 0.000 description 43
- 102000004316 Oxidoreductases Human genes 0.000 description 42
- 108090000854 Oxidoreductases Proteins 0.000 description 42
- 101150053185 P450 gene Proteins 0.000 description 41
- 238000006243 chemical reaction Methods 0.000 description 40
- 150000002500 ions Chemical class 0.000 description 35
- IJOOHPMOJXWVHK-UHFFFAOYSA-N chlorotrimethylsilane Chemical compound C[Si](C)(C)Cl IJOOHPMOJXWVHK-UHFFFAOYSA-N 0.000 description 28
- 108020004414 DNA Proteins 0.000 description 27
- 241000894007 species Species 0.000 description 26
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 25
- 239000013604 expression vector Substances 0.000 description 25
- 230000001965 increasing effect Effects 0.000 description 24
- 241000196324 Embryophyta Species 0.000 description 23
- 239000013612 plasmid Substances 0.000 description 23
- 241000894006 Bacteria Species 0.000 description 22
- 239000002253 acid Substances 0.000 description 22
- 235000001014 amino acid Nutrition 0.000 description 22
- 230000001580 bacterial effect Effects 0.000 description 22
- GHLKSLMMWAKNBM-UHFFFAOYSA-N dodecane-1,12-diol Chemical compound OCCCCCCCCCCCCO GHLKSLMMWAKNBM-UHFFFAOYSA-N 0.000 description 20
- 241000193830 Bacillus <bacterium> Species 0.000 description 19
- 238000001819 mass spectrum Methods 0.000 description 18
- 239000000463 material Substances 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 239000000126 substance Substances 0.000 description 18
- 230000002255 enzymatic effect Effects 0.000 description 17
- 239000012634 fragment Substances 0.000 description 17
- 229940024606 amino acid Drugs 0.000 description 16
- 150000002148 esters Chemical class 0.000 description 16
- 239000000284 extract Substances 0.000 description 16
- 239000000543 intermediate Substances 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 16
- 241000589516 Pseudomonas Species 0.000 description 15
- 150000001720 carbohydrates Chemical class 0.000 description 15
- 238000013467 fragmentation Methods 0.000 description 15
- 238000006062 fragmentation reaction Methods 0.000 description 15
- 125000003729 nucleotide group Chemical group 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 150000001413 amino acids Chemical class 0.000 description 14
- 235000014633 carbohydrates Nutrition 0.000 description 14
- 230000001939 inductive effect Effects 0.000 description 14
- 239000003550 marker Substances 0.000 description 14
- 238000002703 mutagenesis Methods 0.000 description 14
- 231100000350 mutagenesis Toxicity 0.000 description 14
- 239000002773 nucleotide Substances 0.000 description 14
- 239000000758 substrate Substances 0.000 description 14
- 239000005051 trimethylchlorosilane Substances 0.000 description 14
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 13
- 238000001212 derivatisation Methods 0.000 description 13
- 239000001963 growth medium Substances 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- HQHCYKULIHKCEB-UHFFFAOYSA-N tetradecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCC(O)=O HQHCYKULIHKCEB-UHFFFAOYSA-N 0.000 description 13
- 239000004474 valine Substances 0.000 description 13
- PBLZLIFKVPJDCO-UHFFFAOYSA-N 12-aminododecanoic acid Chemical compound NCCCCCCCCCCCC(O)=O PBLZLIFKVPJDCO-UHFFFAOYSA-N 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 230000001851 biosynthetic effect Effects 0.000 description 12
- 230000009088 enzymatic function Effects 0.000 description 12
- 150000002430 hydrocarbons Chemical group 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 108091000080 Phosphotransferase Proteins 0.000 description 11
- 235000004279 alanine Nutrition 0.000 description 11
- 101150016526 fadE gene Proteins 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 11
- 238000000338 in vitro Methods 0.000 description 11
- 150000004702 methyl esters Chemical class 0.000 description 11
- 230000000813 microbial effect Effects 0.000 description 11
- 102000020233 phosphotransferase Human genes 0.000 description 11
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 10
- 101710198130 NADPH-cytochrome P450 reductase Proteins 0.000 description 10
- 125000000539 amino acid group Chemical group 0.000 description 10
- 230000001588 bifunctional effect Effects 0.000 description 10
- 235000000346 sugar Nutrition 0.000 description 10
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- 230000003197 catalytic effect Effects 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000003208 petroleum Substances 0.000 description 9
- JOSXCARTDOQGLV-UHFFFAOYSA-N 14-hydroxymyristic acid Chemical compound OCCCCCCCCCCCCCC(O)=O JOSXCARTDOQGLV-UHFFFAOYSA-N 0.000 description 8
- BZUNJUAMQZRJIP-UHFFFAOYSA-N 15-hydroxypentadecanoic acid Chemical compound OCCCCCCCCCCCCCCC(O)=O BZUNJUAMQZRJIP-UHFFFAOYSA-N 0.000 description 8
- 241000228212 Aspergillus Species 0.000 description 8
- 102000018832 Cytochromes Human genes 0.000 description 8
- 108010052832 Cytochromes Proteins 0.000 description 8
- 108090000371 Esterases Proteins 0.000 description 8
- 108090001060 Lipase Proteins 0.000 description 8
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 8
- 230000004136 fatty acid synthesis Effects 0.000 description 8
- GJBXIPOYHVMPQJ-UHFFFAOYSA-N hexadecane-1,16-diol Chemical compound OCCCCCCCCCCCCCCCCO GJBXIPOYHVMPQJ-UHFFFAOYSA-N 0.000 description 8
- UQDUPQYQJKYHQI-UHFFFAOYSA-N methyl laurate Chemical compound CCCCCCCCCCCC(=O)OC UQDUPQYQJKYHQI-UHFFFAOYSA-N 0.000 description 8
- 229960004793 sucrose Drugs 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 7
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 7
- 239000004475 Arginine Substances 0.000 description 7
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 7
- 102220498987 Phosphatidylinositol 4-phosphate 5-kinase type-1 beta_F87A_mutation Human genes 0.000 description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 7
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 7
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 7
- 125000004432 carbon atom Chemical group C* 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 101150115959 fadR gene Proteins 0.000 description 7
- 239000011521 glass Substances 0.000 description 7
- 150000003951 lactams Chemical class 0.000 description 7
- WVYBBOXJKXXXOY-UHFFFAOYSA-N methyl 12-hydroxydodecanoate Chemical compound COC(=O)CCCCCCCCCCCO WVYBBOXJKXXXOY-UHFFFAOYSA-N 0.000 description 7
- 150000002894 organic compounds Chemical class 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- UGAGPNKCDRTDHP-UHFFFAOYSA-N 16-hydroxyhexadecanoic acid Chemical compound OCCCCCCCCCCCCCCCC(O)=O UGAGPNKCDRTDHP-UHFFFAOYSA-N 0.000 description 6
- 241000194107 Bacillus megaterium Species 0.000 description 6
- 101100114750 Bacillus megaterium (strain ATCC 14581 / DSM 32 / JCM 2506 / NBRC 15308 / NCIMB 9376 / NCTC 10342 / NRRL B-14308 / VKM B-512) cyp102A1 gene Proteins 0.000 description 6
- 101100276525 Bacillus subtilis (strain 168) cypB gene Proteins 0.000 description 6
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 6
- 102000004882 Lipase Human genes 0.000 description 6
- 239000004367 Lipase Substances 0.000 description 6
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 6
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 6
- 239000004473 Threonine Substances 0.000 description 6
- 102000004357 Transferases Human genes 0.000 description 6
- 108090000992 Transferases Proteins 0.000 description 6
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 6
- 230000002238 attenuated effect Effects 0.000 description 6
- 230000008827 biological function Effects 0.000 description 6
- RWGFKTVRMDUZSP-UHFFFAOYSA-N cumene Chemical compound CC(C)C1=CC=CC=C1 RWGFKTVRMDUZSP-UHFFFAOYSA-N 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 235000019421 lipase Nutrition 0.000 description 6
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- NDBSIOZEOQUDBF-UHFFFAOYSA-N methyl 12-aminododecanoate Chemical compound COC(=O)CCCCCCCCCCCN NDBSIOZEOQUDBF-UHFFFAOYSA-N 0.000 description 6
- AOTMRIXFFOGWDT-UHFFFAOYSA-N omega-hydroxyhexadecanoic acid methyl ester Natural products COC(=O)CCCCCCCCCCCCCCCO AOTMRIXFFOGWDT-UHFFFAOYSA-N 0.000 description 6
- 238000007254 oxidation reaction Methods 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 101150087812 tesA gene Proteins 0.000 description 6
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 5
- 101100012355 Bacillus anthracis fabH1 gene Proteins 0.000 description 5
- 101100012357 Bacillus subtilis (strain 168) fabHA gene Proteins 0.000 description 5
- 241000193403 Clostridium Species 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 208000031912 Endemic Flea-Borne Typhus Diseases 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 101000937642 Homo sapiens Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Proteins 0.000 description 5
- 102100027329 Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Human genes 0.000 description 5
- 206010028282 Murine typhus Diseases 0.000 description 5
- 241000186359 Mycobacterium Species 0.000 description 5
- 102000004020 Oxygenases Human genes 0.000 description 5
- 108090000417 Oxygenases Proteins 0.000 description 5
- 241000187747 Streptomyces Species 0.000 description 5
- 208000037386 Typhoid Diseases 0.000 description 5
- 101150070497 accC gene Proteins 0.000 description 5
- 235000009582 asparagine Nutrition 0.000 description 5
- 229960001230 asparagine Drugs 0.000 description 5
- 239000012298 atmosphere Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000036983 biotransformation Effects 0.000 description 5
- 238000006473 carboxylation reaction Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- LQZZUXJYWNFBMV-UHFFFAOYSA-N dodecan-1-ol Chemical compound CCCCCCCCCCCCO LQZZUXJYWNFBMV-UHFFFAOYSA-N 0.000 description 5
- 101150090981 fabG gene Proteins 0.000 description 5
- 101150035981 fabH gene Proteins 0.000 description 5
- 101150072202 fabV gene Proteins 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 239000000411 inducer Substances 0.000 description 5
- 229930027917 kanamycin Natural products 0.000 description 5
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 5
- 229960000318 kanamycin Drugs 0.000 description 5
- 229930182823 kanamycin A Natural products 0.000 description 5
- 101150068528 mabA gene Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000002018 overexpression Effects 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- 108040006686 pyruvate synthase activity proteins Proteins 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 150000008163 sugars Chemical class 0.000 description 5
- 230000000153 supplemental effect Effects 0.000 description 5
- 201000008297 typhoid fever Diseases 0.000 description 5
- KQGAHNAFXMVSGY-UHFFFAOYSA-N 11-hydroxylauric acid Chemical compound CC(O)CCCCCCCCCC(O)=O KQGAHNAFXMVSGY-UHFFFAOYSA-N 0.000 description 4
- DMCZWEUMVOFXBT-UHFFFAOYSA-N 11-hydroxymyristic acid Chemical compound CCCC(O)CCCCCCCCCC(O)=O DMCZWEUMVOFXBT-UHFFFAOYSA-N 0.000 description 4
- KGEACANGAYABKT-UHFFFAOYSA-N 12-oxododecanoic acid Chemical compound OC(=O)CCCCCCCCCCC=O KGEACANGAYABKT-UHFFFAOYSA-N 0.000 description 4
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 4
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 4
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 108010018763 Biotin carboxylase Proteins 0.000 description 4
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 101710088194 Dehydrogenase Proteins 0.000 description 4
- 101100390711 Escherichia coli (strain K12) fhuA gene Proteins 0.000 description 4
- 101150071111 FADD gene Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- JHWNWJKBPDFINM-UHFFFAOYSA-N Laurolactam Chemical group O=C1CCCCCCCCCCCN1 JHWNWJKBPDFINM-UHFFFAOYSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 125000002252 acyl group Chemical group 0.000 description 4
- 150000001412 amines Chemical class 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 229910021538 borax Inorganic materials 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 150000005829 chemical entities Chemical class 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- QQHJDPROMQRDLA-UHFFFAOYSA-N hexadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCC(O)=O QQHJDPROMQRDLA-UHFFFAOYSA-N 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000037353 metabolic pathway Effects 0.000 description 4
- 239000011368 organic material Substances 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 230000029553 photosynthesis Effects 0.000 description 4
- 238000010672 photosynthesis Methods 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 239000004328 sodium tetraborate Substances 0.000 description 4
- 235000010339 sodium tetraborate Nutrition 0.000 description 4
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 4
- 229960000268 spectinomycin Drugs 0.000 description 4
- BGHCVCJVXZWKCC-UHFFFAOYSA-N tetradecane Chemical compound CCCCCCCCCCCCCC BGHCVCJVXZWKCC-UHFFFAOYSA-N 0.000 description 4
- 125000000026 trimethylsilyl group Chemical group [H]C([H])([H])[Si]([*])(C([H])([H])[H])C([H])([H])[H] 0.000 description 4
- RILFOORPZLBCJK-UHFFFAOYSA-N 12-hydroxydodec-2-enoic acid Chemical compound OCCCCCCCCCC=CC(O)=O RILFOORPZLBCJK-UHFFFAOYSA-N 0.000 description 3
- JQNQKNGCSLCPDE-UHFFFAOYSA-N 18-hydroxyoctadec-2-enoic acid Chemical compound OCCCCCCCCCCCCCCCC=CC(O)=O JQNQKNGCSLCPDE-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 102100037885 Calcium-independent phospholipase A2-gamma Human genes 0.000 description 3
- 241000192700 Cyanobacteria Species 0.000 description 3
- 101000836720 Dictyostelium discoideum Aldose reductase A Proteins 0.000 description 3
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 108010074122 Ferredoxins Proteins 0.000 description 3
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 241000187492 Mycobacterium marinum Species 0.000 description 3
- 108010045510 NADPH-Ferrihemoprotein Reductase Proteins 0.000 description 3
- 102100036777 NADPH:adrenodoxin oxidoreductase, mitochondrial Human genes 0.000 description 3
- 101710192343 NADPH:adrenodoxin oxidoreductase, mitochondrial Proteins 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 101710104207 Probable NADPH:adrenodoxin oxidoreductase, mitochondrial Proteins 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 3
- 241000235070 Saccharomyces Species 0.000 description 3
- 241000607626 Vibrio cholerae Species 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 150000001298 alcohols Chemical class 0.000 description 3
- 150000001335 aliphatic alkanes Chemical class 0.000 description 3
- 150000001336 alkenes Chemical class 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 238000012219 cassette mutagenesis Methods 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- VCIQTMGWJDEYRX-UHFFFAOYSA-N dodec-1-ene-1,12-diol Chemical compound OCCCCCCCCCCC=CO VCIQTMGWJDEYRX-UHFFFAOYSA-N 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 101150026389 fabF gene Proteins 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 239000003205 fragrance Substances 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 150000003278 haem Chemical class 0.000 description 3
- IWTMSCUHCJHPPR-UHFFFAOYSA-N hexadec-2-enedioic acid Chemical compound OC(=O)CCCCCCCCCCCCC=CC(O)=O IWTMSCUHCJHPPR-UHFFFAOYSA-N 0.000 description 3
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 3
- 229930195733 hydrocarbon Natural products 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- QFZLQCAXDXMEFE-UHFFFAOYSA-N methyl 12-oxododecanoate Chemical compound COC(=O)CCCCCCCCCCC=O QFZLQCAXDXMEFE-UHFFFAOYSA-N 0.000 description 3
- VBKONVSYRQSMHY-UHFFFAOYSA-N methyl 14-hydroxytetradecanoate Chemical compound COC(=O)CCCCCCCCCCCCCO VBKONVSYRQSMHY-UHFFFAOYSA-N 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000003345 natural gas Substances 0.000 description 3
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 3
- BNJOQKFENDDGSC-UHFFFAOYSA-N octadecanedioic acid Natural products OC(=O)CCCCCCCCCCCCCCCCC(O)=O BNJOQKFENDDGSC-UHFFFAOYSA-N 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 239000011846 petroleum-based material Substances 0.000 description 3
- 235000019833 protease Nutrition 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- SYRJDMLRVYRYNE-UHFFFAOYSA-N trimethylsilyl 12-trimethylsilyloxydodecanoate Chemical compound C[Si](C)(C)OCCCCCCCCCCCC(=O)O[Si](C)(C)C SYRJDMLRVYRYNE-UHFFFAOYSA-N 0.000 description 3
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- DNIAPMSPPWPWGF-GSVOUGTGSA-N (R)-(-)-Propylene glycol Chemical compound C[C@@H](O)CO DNIAPMSPPWPWGF-GSVOUGTGSA-N 0.000 description 2
- WNZVVHVYAKZZBU-UHFFFAOYSA-N 1,17-Heptadecanediol Chemical compound OCCCCCCCCCCCCCCCCCO WNZVVHVYAKZZBU-UHFFFAOYSA-N 0.000 description 2
- XAUQWYHSQICPAZ-UHFFFAOYSA-N 10-amino-decanoic acid Chemical compound NCCCCCCCCCC(O)=O XAUQWYHSQICPAZ-UHFFFAOYSA-N 0.000 description 2
- YJCJVMMDTBEITC-UHFFFAOYSA-N 10-hydroxycapric acid Chemical compound OCCCCCCCCCC(O)=O YJCJVMMDTBEITC-UHFFFAOYSA-N 0.000 description 2
- BJBZLNPBZRNMAI-UHFFFAOYSA-N 14-hydroxytetradec-2-enoic acid Chemical compound OCCCCCCCCCCCC=CC(O)=O BJBZLNPBZRNMAI-UHFFFAOYSA-N 0.000 description 2
- ZVRQKBZSJNBTCW-UHFFFAOYSA-N 15-hydroxypentadec-2-enoic acid Chemical compound OCCCCCCCCCCCCC=CC(O)=O ZVRQKBZSJNBTCW-UHFFFAOYSA-N 0.000 description 2
- QJGFZBNNVXTCLL-UHFFFAOYSA-N 16-aminohexadecanoic acid Chemical compound NCCCCCCCCCCCCCCCC(O)=O QJGFZBNNVXTCLL-UHFFFAOYSA-N 0.000 description 2
- YSNNTXAJZMWJCI-UHFFFAOYSA-N 16-hydroxyhexadec-2-enoic acid Chemical compound OCCCCCCCCCCCCCC=CC(O)=O YSNNTXAJZMWJCI-UHFFFAOYSA-N 0.000 description 2
- NKVUEIHJDGURIA-UHFFFAOYSA-N 16-oxohexadecanoic acid Chemical compound OC(=O)CCCCCCCCCCCCCCC=O NKVUEIHJDGURIA-UHFFFAOYSA-N 0.000 description 2
- JHRQMZPLCYCFPI-UHFFFAOYSA-N 17-hydroxymargaric acid Chemical compound OCCCCCCCCCCCCCCCCC(O)=O JHRQMZPLCYCFPI-UHFFFAOYSA-N 0.000 description 2
- PSPLRVUNJCIFMU-UHFFFAOYSA-N 18-aminooctadec-2-enoic acid Chemical compound NCCCCCCCCCCCCCCCC=CC(O)=O PSPLRVUNJCIFMU-UHFFFAOYSA-N 0.000 description 2
- LLWAJHROFZNFHK-UHFFFAOYSA-N 18-oxooctadec-2-enoic acid Chemical compound OC(=O)C=CCCCCCCCCCCCCCCC=O LLWAJHROFZNFHK-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- BNWKMHUFFKDAMV-UHFFFAOYSA-N 7-hydroxylauric acid Chemical compound CCCCCC(O)CCCCCC(O)=O BNWKMHUFFKDAMV-UHFFFAOYSA-N 0.000 description 2
- KDMSVYIHKLZKET-UHFFFAOYSA-N 8-hydroxyoctanoic acid Chemical compound OCCCCCCCC(O)=O KDMSVYIHKLZKET-UHFFFAOYSA-N 0.000 description 2
- QGFSQVPRCWJZQK-UHFFFAOYSA-N 9-Decen-1-ol Chemical compound OCCCCCCCCC=C QGFSQVPRCWJZQK-UHFFFAOYSA-N 0.000 description 2
- XKNUGGWMUJBFJT-UHFFFAOYSA-N 9-hydroxylauric acid Chemical compound CCCC(O)CCCCCCCC(O)=O XKNUGGWMUJBFJT-UHFFFAOYSA-N 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- 101000935487 Agrobacterium fabrum (strain C58 / ATCC 33970) 3-oxopimeloyl-[acyl-carrier-protein] synthase Proteins 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 2
- 241000995051 Brenda Species 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 101100173127 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) fabZ gene Proteins 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 241000252867 Cupriavidus metallidurans Species 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 241000701988 Escherichia virus T5 Species 0.000 description 2
- 101710172177 Fasciclin-2 Proteins 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 102000016901 Glutamate dehydrogenase Human genes 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102100031415 Hepatic triacylglycerol lipase Human genes 0.000 description 2
- QCNWZROVPSVEJA-UHFFFAOYSA-N Heptadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCCC(O)=O QCNWZROVPSVEJA-UHFFFAOYSA-N 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical group OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- BAVYZALUXZFZLV-UHFFFAOYSA-N Methylamine Chemical compound NC BAVYZALUXZFZLV-UHFFFAOYSA-N 0.000 description 2
- 241000521981 Mycodrosophila aqua Species 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- BTZVDPWKGXMQFW-UHFFFAOYSA-N Pentadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCC(O)=O BTZVDPWKGXMQFW-UHFFFAOYSA-N 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- 241001472610 Polaromonas sp. Species 0.000 description 2
- 102000004005 Prostaglandin-endoperoxide synthases Human genes 0.000 description 2
- 108090000459 Prostaglandin-endoperoxide synthases Proteins 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 244000044822 Simmondsia californica Species 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 2
- 238000004760 accelerator mass spectrometry Methods 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 101150112926 alkJ gene Proteins 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 238000007845 assembly PCR Methods 0.000 description 2
- 239000011942 biocatalyst Substances 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- OCKPCBLVNKHBMX-UHFFFAOYSA-N butylbenzene Chemical compound CCCCC1=CC=CC=C1 OCKPCBLVNKHBMX-UHFFFAOYSA-N 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000021523 carboxylation Effects 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 150000001793 charged compounds Chemical class 0.000 description 2
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 2
- 210000000078 claw Anatomy 0.000 description 2
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 2
- 239000005516 coenzyme A Substances 0.000 description 2
- 229940093530 coenzyme a Drugs 0.000 description 2
- 239000000571 coke Substances 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 230000007797 corrosion Effects 0.000 description 2
- 238000005260 corrosion Methods 0.000 description 2
- 125000004093 cyano group Chemical group *C#N 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 2
- 150000002009 diols Chemical class 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- SNRUBQQJIBEYMU-UHFFFAOYSA-N dodecane Chemical compound CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 2
- MHTWXBYRJHQAET-UHFFFAOYSA-N dodecane-1,11-diol Chemical compound CC(O)CCCCCCCCCCO MHTWXBYRJHQAET-UHFFFAOYSA-N 0.000 description 2
- 239000003792 electrolyte Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 208000028104 epidemic louse-borne typhus Diseases 0.000 description 2
- 239000003822 epoxy resin Substances 0.000 description 2
- 101150078207 fabA gene Proteins 0.000 description 2
- 101150015067 fabB gene Proteins 0.000 description 2
- 230000004133 fatty acid degradation Effects 0.000 description 2
- 230000004129 fatty acid metabolism Effects 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 229940013640 flavin mononucleotide Drugs 0.000 description 2
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 2
- FVTCRASFADXXNN-UHFFFAOYSA-N flavin mononucleotide Natural products OP(=O)(O)OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-UHFFFAOYSA-N 0.000 description 2
- 239000011768 flavin mononucleotide Substances 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 235000013355 food flavoring agent Nutrition 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- LNEPOXFFQSENCJ-UHFFFAOYSA-N haloperidol Chemical compound C1CC(O)(C=2C=CC(Cl)=CC=2)CCN1CCCC(=O)C1=CC=C(F)C=C1 LNEPOXFFQSENCJ-UHFFFAOYSA-N 0.000 description 2
- IVJLSPVMJRCRPF-UHFFFAOYSA-N hexadec-15-en-1-ol Chemical compound OCCCCCCCCCCCCCCC=C IVJLSPVMJRCRPF-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 150000002576 ketones Chemical class 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000000314 lubricant Substances 0.000 description 2
- 150000007931 macrolactones Chemical class 0.000 description 2
- 239000013028 medium composition Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- MXPGNULHXUWMNA-UHFFFAOYSA-N methyl 14-aminotetradecanoate Chemical compound COC(=O)CCCCCCCCCCCCCN MXPGNULHXUWMNA-UHFFFAOYSA-N 0.000 description 2
- XHBGHEJULUAFGB-UHFFFAOYSA-N methyl 16-aminohexadecanoate Chemical compound COC(=O)CCCCCCCCCCCCCCCN XHBGHEJULUAFGB-UHFFFAOYSA-N 0.000 description 2
- ADTIBIOIERBRIB-UHFFFAOYSA-N methyl 8-hydroxyoctanoate Chemical compound COC(=O)CCCCCCCO ADTIBIOIERBRIB-UHFFFAOYSA-N 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- YDPSQMGOAILWPE-UHFFFAOYSA-N octadec-2-enedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCC=CC(O)=O YDPSQMGOAILWPE-UHFFFAOYSA-N 0.000 description 2
- RZJRJXONCZWCBN-UHFFFAOYSA-N octadecane Chemical compound CCCCCCCCCCCCCCCCCC RZJRJXONCZWCBN-UHFFFAOYSA-N 0.000 description 2
- LUUFSCNUZAYHAT-UHFFFAOYSA-N octadecane-1,18-diol Chemical compound OCCCCCCCCCCCCCCCCCCO LUUFSCNUZAYHAT-UHFFFAOYSA-N 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 235000006408 oxalic acid Nutrition 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000003348 petrochemical agent Substances 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 229920006122 polyamide resin Polymers 0.000 description 2
- 229920000647 polyepoxide Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Chemical class 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000006337 proteolytic cleavage Effects 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 239000012925 reference material Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 235000019231 riboflavin-5'-phosphate Nutrition 0.000 description 2
- NNNVXFKZMRGJPM-KHPPLWFESA-N sapienic acid Chemical compound CCCCCCCCC\C=C/CCCCC(O)=O NNNVXFKZMRGJPM-KHPPLWFESA-N 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- CXMXRPHRNRROMY-UHFFFAOYSA-N sebacic acid Chemical compound OC(=O)CCCCCCCCC(O)=O CXMXRPHRNRROMY-UHFFFAOYSA-N 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- XLKZJJVNBQCVIX-UHFFFAOYSA-N tetradecane-1,14-diol Chemical compound OCCCCCCCCCCCCCCO XLKZJJVNBQCVIX-UHFFFAOYSA-N 0.000 description 2
- TUNFSRHWOTWDNC-UHFFFAOYSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- WCAVMUSBVBDXDE-UHFFFAOYSA-N trimethyl(12-trimethylsilyloxydodecoxy)silane Chemical compound C[Si](C)(C)OCCCCCCCCCCCCO[Si](C)(C)C WCAVMUSBVBDXDE-UHFFFAOYSA-N 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 206010061393 typhus Diseases 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Chemical group OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- XSMIOONHPKRREI-UHFFFAOYSA-N undecane-1,11-diol Chemical compound OCCCCCCCCCCCO XSMIOONHPKRREI-UHFFFAOYSA-N 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 229940118696 vibrio cholerae Drugs 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- GGQQNYXPYWCUHG-RMTFUQJTSA-N (3e,6e)-deca-3,6-diene Chemical compound CCC\C=C\C\C=C\CC GGQQNYXPYWCUHG-RMTFUQJTSA-N 0.000 description 1
- QHBZHVUGQROELI-SOFGYWHQSA-N (E)-10-hydroxydec-2-enoic acid Chemical compound OCCCCCCC\C=C\C(O)=O QHBZHVUGQROELI-SOFGYWHQSA-N 0.000 description 1
- NVIPUOMWGQAOIT-UHFFFAOYSA-N (E)-7-Hexadecen-16-olide Natural products O=C1CCCCCC=CCCCCCCCCO1 NVIPUOMWGQAOIT-UHFFFAOYSA-N 0.000 description 1
- BRBMYNGGGPTKKL-UHFFFAOYSA-N 1,9-decanediol Chemical compound CC(O)CCCCCCCCO BRBMYNGGGPTKKL-UHFFFAOYSA-N 0.000 description 1
- GYSCBCSGKXNZRH-UHFFFAOYSA-N 1-benzothiophene-2-carboxamide Chemical compound C1=CC=C2SC(C(=O)N)=CC2=C1 GYSCBCSGKXNZRH-UHFFFAOYSA-N 0.000 description 1
- GBMPJGRZJKHERD-UHFFFAOYSA-N 10-hydroxylauric acid Chemical compound CCC(O)CCCCCCCCC(O)=O GBMPJGRZJKHERD-UHFFFAOYSA-N 0.000 description 1
- WWQJYRLZAYKMGV-UHFFFAOYSA-N 10-hydroxymyristic acid Chemical compound CCCCC(O)CCCCCCCCC(O)=O WWQJYRLZAYKMGV-UHFFFAOYSA-N 0.000 description 1
- FYURGFQVSMALOD-UHFFFAOYSA-N 10-oxocapric acid Chemical compound OC(=O)CCCCCCCCC=O FYURGFQVSMALOD-UHFFFAOYSA-N 0.000 description 1
- DWYPQNGEJSYCSO-UHFFFAOYSA-N 10-oxododecanoic acid Chemical compound CCC(=O)CCCCCCCCC(O)=O DWYPQNGEJSYCSO-UHFFFAOYSA-N 0.000 description 1
- QFGCFKJIPBRJGM-UHFFFAOYSA-N 12-[(2-methylpropan-2-yl)oxy]-12-oxododecanoic acid Chemical compound CC(C)(C)OC(=O)CCCCCCCCCCC(O)=O QFGCFKJIPBRJGM-UHFFFAOYSA-N 0.000 description 1
- RPTGBPWFRSJPOM-UHFFFAOYSA-N 13-hydroxyhexadecanoic acid Chemical compound CCCC(O)CCCCCCCCCCCC(O)=O RPTGBPWFRSJPOM-UHFFFAOYSA-N 0.000 description 1
- VCQPBSIAFYGMDJ-UHFFFAOYSA-N 13-hydroxytridec-2-enoic acid Chemical compound OCCCCCCCCCCC=CC(O)=O VCQPBSIAFYGMDJ-UHFFFAOYSA-N 0.000 description 1
- SHKBDFZQUYIIBZ-UHFFFAOYSA-N 14-aminotetradec-2-enoic acid Chemical compound NCCCCCCCCCCCC=CC(O)=O SHKBDFZQUYIIBZ-UHFFFAOYSA-N 0.000 description 1
- KBDZCYDPGRYCRM-UHFFFAOYSA-N 14-hydroxypalmitic acid Chemical compound CCC(O)CCCCCCCCCCCCC(O)=O KBDZCYDPGRYCRM-UHFFFAOYSA-N 0.000 description 1
- WQPQDBIUAFINBH-UHFFFAOYSA-N 15-hydroxypalmitic acid Chemical compound CC(O)CCCCCCCCCCCCCC(O)=O WQPQDBIUAFINBH-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- XUNMWLWTZWWEIE-UHFFFAOYSA-N 2-decenedioic acid Chemical compound OC(=O)CCCCCCC=CC(O)=O XUNMWLWTZWWEIE-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- YDZIJQXINJLRLL-UHFFFAOYSA-N 2-hydroxydodecanoic acid Chemical class CCCCCCCCCCC(O)C(O)=O YDZIJQXINJLRLL-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- WXBXVVIUZANZAU-UHFFFAOYSA-N 2E-decenoic acid Natural products CCCCCCCC=CC(O)=O WXBXVVIUZANZAU-UHFFFAOYSA-N 0.000 description 1
- WTKWFNIIIXNTDO-UHFFFAOYSA-N 3-isocyanato-5-methyl-2-(trifluoromethyl)furan Chemical compound CC1=CC(N=C=O)=C(C(F)(F)F)O1 WTKWFNIIIXNTDO-UHFFFAOYSA-N 0.000 description 1
- NVIPUOMWGQAOIT-DUXPYHPUSA-N 7-hexadecen-1,16-olide Chemical compound O=C1CCCCC\C=C\CCCCCCCCO1 NVIPUOMWGQAOIT-DUXPYHPUSA-N 0.000 description 1
- UQXNEWQGGVUVQA-UHFFFAOYSA-N 8-aminooctanoic acid Chemical compound NCCCCCCCC(O)=O UQXNEWQGGVUVQA-UHFFFAOYSA-N 0.000 description 1
- UEXYJHLCLUYOFA-UHFFFAOYSA-N 8-oxooctanoic acid Chemical compound OC(=O)CCCCCCC=O UEXYJHLCLUYOFA-UHFFFAOYSA-N 0.000 description 1
- ZGXJTSGNIOSYLO-UHFFFAOYSA-N 88755TAZ87 Chemical compound NCC(=O)CCC(O)=O ZGXJTSGNIOSYLO-UHFFFAOYSA-N 0.000 description 1
- 240000000073 Achillea millefolium Species 0.000 description 1
- 235000007754 Achillea millefolium Nutrition 0.000 description 1
- 241000122231 Acinetobacter radioresistens Species 0.000 description 1
- 241000588625 Acinetobacter sp. Species 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 101710146995 Acyl carrier protein Proteins 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108010031025 Alanine Dehydrogenase Proteins 0.000 description 1
- 241000611270 Alcanivorax borkumensis Species 0.000 description 1
- 241000864489 Alcanivorax borkumensis SK2 Species 0.000 description 1
- 241000908790 Alcanivorax jadensis Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101100388296 Arabidopsis thaliana DTX51 gene Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000722910 Burkholderia mallei Species 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- 210000003771 C cell Anatomy 0.000 description 1
- HJHAVTKVUQHXLS-UHFFFAOYSA-N C(=CCCCCCCCCCCCCCCCO)O Chemical compound C(=CCCCCCCCCCCCCCCCO)O HJHAVTKVUQHXLS-UHFFFAOYSA-N 0.000 description 1
- 102220617216 CPX chromosomal region candidate gene 1 protein_F88V_mutation Human genes 0.000 description 1
- XWTAWJQRJVYINL-UHFFFAOYSA-N C[Si](OC=CCCCCCCCCCCO[Si](C)(C)C)(C)C Chemical compound C[Si](OC=CCCCCCCCCCCO[Si](C)(C)C)(C)C XWTAWJQRJVYINL-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 241000010804 Caulobacter vibrioides Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000191382 Chlorobaculum tepidum Species 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000186566 Clostridium ljungdahlii Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 241001464430 Cyanobacterium Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- GHVNFZFCNZKVNT-UHFFFAOYSA-N Decanoic acid Natural products CCCCCCCCCC(O)=O GHVNFZFCNZKVNT-UHFFFAOYSA-N 0.000 description 1
- 102100037458 Dephospho-CoA kinase Human genes 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000644323 Escherichia coli C Species 0.000 description 1
- 241000901842 Escherichia coli W Species 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 101710172176 Fasciclin-1 Proteins 0.000 description 1
- 102000000476 Fatty Acid Transport Proteins Human genes 0.000 description 1
- 108010055870 Fatty Acid Transport Proteins Proteins 0.000 description 1
- 102000003983 Flavoproteins Human genes 0.000 description 1
- 108010057573 Flavoproteins Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 244000158996 Hedysarum boreale Species 0.000 description 1
- 101000836620 Homo sapiens Nucleic acid dioxygenase ALKBH1 Proteins 0.000 description 1
- 101000642431 Homo sapiens Pre-mRNA-splicing factor SPF27 Proteins 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 241001619535 Hyphomonas neptunium Species 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 241000567769 Isurus oxyrinchus Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- NNJVILVZKWQKPM-UHFFFAOYSA-N Lidocaine Chemical compound CCN(CC)CC(=O)NC1=C(C)C=CC=C1C NNJVILVZKWQKPM-UHFFFAOYSA-N 0.000 description 1
- 235000019738 Limestone Nutrition 0.000 description 1
- 108030006555 Lysine 6-dehydrogenases Proteins 0.000 description 1
- 241000206597 Marinobacter hydrocarbonoclasticus Species 0.000 description 1
- 241000018377 Methylococcaceae bacterium Species 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 102000002568 Multienzyme Complexes Human genes 0.000 description 1
- 108010093369 Multienzyme Complexes Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 241000187488 Mycobacterium sp. Species 0.000 description 1
- XCOBLONWWXQEBS-KPKJPENVSA-N N,O-bis(trimethylsilyl)trifluoroacetamide Chemical compound C[Si](C)(C)O\C(C(F)(F)F)=N\[Si](C)(C)C XCOBLONWWXQEBS-KPKJPENVSA-N 0.000 description 1
- 229910052781 Neptunium Inorganic materials 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000192656 Nostoc Species 0.000 description 1
- 102100027051 Nucleic acid dioxygenase ALKBH1 Human genes 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 229920000299 Nylon 12 Polymers 0.000 description 1
- USYPCJSLOVEJGC-UHFFFAOYSA-N OCCCCCCCCC=CO Chemical compound OCCCCCCCCC=CO USYPCJSLOVEJGC-UHFFFAOYSA-N 0.000 description 1
- NLNJBCNCLWUPKI-UHFFFAOYSA-N OCCCCCCCCCCCCCCC=CC(O)=O Chemical compound OCCCCCCCCCCCCCCC=CC(O)=O NLNJBCNCLWUPKI-UHFFFAOYSA-N 0.000 description 1
- 241000795633 Olea <sea slug> Species 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 241000930992 Paraburkholderia fungorum Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 235000004347 Perilla Nutrition 0.000 description 1
- 244000124853 Perilla frutescens Species 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 241000512220 Polaromonas Species 0.000 description 1
- 102100036347 Pre-mRNA-splicing factor SPF27 Human genes 0.000 description 1
- 241000192138 Prochlorococcus Species 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 101100378793 Pseudomonas oleovorans alkH gene Proteins 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000235402 Rhizomucor Species 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000191023 Rhodobacter capsulatus Species 0.000 description 1
- 241000158504 Rhodococcus hoagii Species 0.000 description 1
- 241001524101 Rhodococcus opacus Species 0.000 description 1
- 241000187563 Rhodococcus ruber Species 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 1
- 101100215626 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADP1 gene Proteins 0.000 description 1
- 241000235088 Saccharomyces sp. Species 0.000 description 1
- 241001466077 Salina Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241001047198 Scomberomorus semifasciatus Species 0.000 description 1
- 241000287219 Serinus canaria Species 0.000 description 1
- 229910020175 SiOH Inorganic materials 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 241001135759 Sphingomonas sp. Species 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- 241000192581 Synechocystis sp. Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- 101710151118 Thioesterase TesA Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 101000692921 Uncultured bacterium HF130_AEPn_1 2-amino-1-hydroxyethylphosphonate dioxygenase (glycine-forming) Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- 241000588902 Zymomonas mobilis Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000002210 biocatalytic effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- OCCHGMDNQHGUHB-UHFFFAOYSA-N bis(trimethylsilyl) tetradecanedioate Chemical compound C[Si](C)(C)OC(=O)CCCCCCCCCCCCC(=O)O[Si](C)(C)C OCCHGMDNQHGUHB-UHFFFAOYSA-N 0.000 description 1
- 235000012467 brownies Nutrition 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229940074375 burkholderia mallei Drugs 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001722 carbon compounds Chemical class 0.000 description 1
- 230000006860 carbon metabolism Effects 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-N carbonic acid Chemical class OC(O)=O BVKZGUZCCUSVTD-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 108010078934 cytochrome P-450 CYP153 (Acinetobacter) Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- FOTKYAAJKYLFFN-UHFFFAOYSA-N decane-1,10-diol Chemical compound OCCCCCCCCCCO FOTKYAAJKYLFFN-UHFFFAOYSA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 108010049285 dephospho-CoA kinase Proteins 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 150000005690 diesters Chemical class 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- MAZWDMBCPDUFDJ-UHFFFAOYSA-N dodec-2-enedioic acid Chemical compound OC(=O)CCCCCCCCC=CC(O)=O MAZWDMBCPDUFDJ-UHFFFAOYSA-N 0.000 description 1
- BWELVAFPJUDDFX-UHFFFAOYSA-N dodecane-1,10-diol Chemical compound CCC(O)CCCCCCCCCO BWELVAFPJUDDFX-UHFFFAOYSA-N 0.000 description 1
- PKBPBCBNUCWCBN-UHFFFAOYSA-N dodecane-1,9-diol Chemical compound CCCC(O)CCCCCCCCO PKBPBCBNUCWCBN-UHFFFAOYSA-N 0.000 description 1
- ZVGGSNOEUBCUDC-UHFFFAOYSA-N dodecanoic acid 12-hydroxydodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O.OCCCCCCCCCCCC(O)=O ZVGGSNOEUBCUDC-UHFFFAOYSA-N 0.000 description 1
- 229940069096 dodecene Drugs 0.000 description 1
- 239000010791 domestic waste Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 101150004992 fadA gene Proteins 0.000 description 1
- 101150069125 fadB gene Proteins 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000010794 food waste Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- IVSXFFJGASXYCL-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=NC=N[C]21 IVSXFFJGASXYCL-UHFFFAOYSA-N 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- BQJBHRUQFJFNTO-UHFFFAOYSA-N heptadec-2-enedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCC=CC(O)=O BQJBHRUQFJFNTO-UHFFFAOYSA-N 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- QILZKVKOYZPEQK-UHFFFAOYSA-N hexadec-1-ene-1,16-diol Chemical compound OCCCCCCCCCCCCCCC=CO QILZKVKOYZPEQK-UHFFFAOYSA-N 0.000 description 1
- SRYDOKOCKWANAE-UHFFFAOYSA-N hexadecane-1,1-diol Chemical compound CCCCCCCCCCCCCCCC(O)O SRYDOKOCKWANAE-UHFFFAOYSA-N 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-M hydroxide Chemical compound [OH-] XLYOFNOQVPJJNP-UHFFFAOYSA-M 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 239000002440 industrial waste Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 1
- 238000010930 lactamization Methods 0.000 description 1
- 229960004194 lidocaine Drugs 0.000 description 1
- 239000002029 lignocellulosic biomass Substances 0.000 description 1
- 239000006028 limestone Substances 0.000 description 1
- 239000010871 livestock manure Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000003120 macrolide antibiotic agent Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000005555 metalworking Methods 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- SZGHOKWWURKSHG-UHFFFAOYSA-N methyl 10-aminodecanoate Chemical compound COC(=O)CCCCCCCCCN SZGHOKWWURKSHG-UHFFFAOYSA-N 0.000 description 1
- UWJQRRLFMAEIOB-UHFFFAOYSA-N methyl 10-hydroxydec-2-enoate Chemical compound COC(=O)C=CCCCCCCCO UWJQRRLFMAEIOB-UHFFFAOYSA-N 0.000 description 1
- NFJQGHRDVMDLKM-UHFFFAOYSA-N methyl 10-hydroxydecanoate Chemical compound COC(=O)CCCCCCCCCO NFJQGHRDVMDLKM-UHFFFAOYSA-N 0.000 description 1
- KNNDKDDGXNZUIT-UHFFFAOYSA-N methyl 12-hydroxytetradecanoate Chemical compound CCC(O)CCCCCCCCCCC(=O)OC KNNDKDDGXNZUIT-UHFFFAOYSA-N 0.000 description 1
- KSQCFERAKOHFJI-UHFFFAOYSA-N methyl 14-trimethylsilyloxytetradecanoate Chemical compound COC(=O)CCCCCCCCCCCCCO[Si](C)(C)C KSQCFERAKOHFJI-UHFFFAOYSA-N 0.000 description 1
- GTYMDEWSAQEWDO-UHFFFAOYSA-N methyl 16-hydroxyhexadec-2-enoate Chemical compound COC(=O)C=CCCCCCCCCCCCCCO GTYMDEWSAQEWDO-UHFFFAOYSA-N 0.000 description 1
- WULNKGRWRDHKKB-UHFFFAOYSA-N methyl 18-aminooctadecanoate Chemical compound COC(=O)CCCCCCCCCCCCCCCCCN WULNKGRWRDHKKB-UHFFFAOYSA-N 0.000 description 1
- RFSYYTXJXIOCNI-UHFFFAOYSA-N methyl 18-hydroxyoctadec-2-enoate Chemical compound COC(=O)C=CCCCCCCCCCCCCCCCO RFSYYTXJXIOCNI-UHFFFAOYSA-N 0.000 description 1
- ZYKOKVARXPKXFW-UHFFFAOYSA-N methyl 8-aminooctanoate Chemical compound COC(=O)CCCCCCCN ZYKOKVARXPKXFW-UHFFFAOYSA-N 0.000 description 1
- HVAXGLYKECRETN-UHFFFAOYSA-N methyl 8-oxooctanoate Chemical compound COC(=O)CCCCCCC=O HVAXGLYKECRETN-UHFFFAOYSA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- TVIDDXQYHWJXFK-UHFFFAOYSA-N n-Dodecanedioic acid Natural products OC(=O)CCCCCCCCCCC(O)=O TVIDDXQYHWJXFK-UHFFFAOYSA-N 0.000 description 1
- YRHYCMZPEVDGFQ-UHFFFAOYSA-N n-decanoic acid methyl ester Natural products CCCCCCCCCC(=O)OC YRHYCMZPEVDGFQ-UHFFFAOYSA-N 0.000 description 1
- AFFLGGQVNFXPEV-UHFFFAOYSA-N n-decene Natural products CCCCCCCCC=C AFFLGGQVNFXPEV-UHFFFAOYSA-N 0.000 description 1
- LFNLGNPSGWYGGD-UHFFFAOYSA-N neptunium atom Chemical compound [Np] LFNLGNPSGWYGGD-UHFFFAOYSA-N 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- ZWJRQHCSTUSCDK-UHFFFAOYSA-N octadec-1-ene-1,18-diol Chemical compound OCCCCCCCCCCCCCCCCC=CO ZWJRQHCSTUSCDK-UHFFFAOYSA-N 0.000 description 1
- 229940038384 octadecane Drugs 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 description 1
- OEIJHBUUFURJLI-UHFFFAOYSA-N octane-1,8-diol Chemical compound OCCCCCCCCO OEIJHBUUFURJLI-UHFFFAOYSA-N 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- ZBPYFGWSQQFVCJ-UHFFFAOYSA-N pentadecane-1,15-diol Chemical compound OCCCCCCCCCCCCCCCO ZBPYFGWSQQFVCJ-UHFFFAOYSA-N 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 239000013520 petroleum-based product Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000004014 plasticizer Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000002952 polymeric resin Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002910 solid waste Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000010421 standard material Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 125000000185 sucrose group Chemical group 0.000 description 1
- GPTONYMQFTZPKC-UHFFFAOYSA-N sulfamethoxydiazine Chemical compound N1=CC(OC)=CN=C1NS(=O)(=O)C1=CC=C(N)C=C1 GPTONYMQFTZPKC-UHFFFAOYSA-N 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 229920003002 synthetic resin Polymers 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 101150026728 tesB gene Proteins 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- HABBDUAFSHZDDO-UHFFFAOYSA-N tetradec-2-enedioic acid Chemical compound OC(=O)CCCCCCCCCCC=CC(O)=O HABBDUAFSHZDDO-UHFFFAOYSA-N 0.000 description 1
- BRGJIIMZXMWMCC-UHFFFAOYSA-N tetradecan-2-ol Chemical compound CCCCCCCCCCCCC(C)O BRGJIIMZXMWMCC-UHFFFAOYSA-N 0.000 description 1
- 229940095068 tetradecene Drugs 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- HOGWBMWOBRRKCD-BUHFOSPRSA-N trans-2-pentadecenoic acid Chemical compound CCCCCCCCCCCC\C=C\C(O)=O HOGWBMWOBRRKCD-BUHFOSPRSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- OXAJUFMPAOVNAC-UHFFFAOYSA-N tridec-1-ene-1,13-diol Chemical compound OCCCCCCCCCCCC=CO OXAJUFMPAOVNAC-UHFFFAOYSA-N 0.000 description 1
- QMTCVGUNYZWEJH-UHFFFAOYSA-N tridec-2-enedioic acid Chemical compound OC(=O)CCCCCCCCCC=CC(O)=O QMTCVGUNYZWEJH-UHFFFAOYSA-N 0.000 description 1
- RCJWLPSXENMRKS-UHFFFAOYSA-N undec-1-ene-1,11-diol Chemical compound OCCCCCCCCCC=CO RCJWLPSXENMRKS-UHFFFAOYSA-N 0.000 description 1
- PRHYKPOPIDLQKJ-UHFFFAOYSA-N undec-2-enedioic acid Chemical compound OC(=O)CCCCCCCC=CC(O)=O PRHYKPOPIDLQKJ-UHFFFAOYSA-N 0.000 description 1
- ZDPHROOEEOARMN-UHFFFAOYSA-N undecanoic acid Chemical compound CCCCCCCCCCC(O)=O ZDPHROOEEOARMN-UHFFFAOYSA-N 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 125000005023 xylyl group Chemical group 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0077—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/649—Biodiesel, i.e. fatty acid alkyl esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/14—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
- C12Y114/14001—Unspecific monooxygenase (1.14.14.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/15—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced iron-sulfur protein as one donor, and incorporation of one atom of oxygen (1.14.15)
- C12Y114/15003—Alkane 1-monooxygenase (1.14.15.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/0102—Diacylglycerol O-acyltransferase (2.3.1.20)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01075—Long-chain-alcohol O-fatty-acyltransferase (2.3.1.75)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01005—Lysophospholipase (3.1.1.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
- C12Y301/02014—Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01042—Hexadecanal dehydrogenase (acylating) (1.2.1.42), i.e. fatty acyl-CoA reductase
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 오메가-수산화 지방산 유도체들 및 이들을 생성하는 방법들에 관한 것이다. 본 명세서에서, 본 발명은 높은 순도 및 수율로 오메가-수산화 지방산 유도체들을 제공하는 신규하고 환경 친화적인 생성 방법을 포함한다. 또한, 선택 발효를 통해 오메가-수산화 지방산 유도체들을 생성하는 재조합 미생물들이 포함된다.
Description
본 출원은 2013년 6월 14일에 출원된 미국 가출원 61/835,464의 이익을 주장하며, 이의 전체 내용이 본 명세서에서 인용 참조된다.
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하며, 본 명세서에서 전문이 인용 참조된다. 2014년 6월 14일에 작성된 상기의 ASCII의 복사본은 파일명을 LS00048PCT_SL.txt라고 하였고, 크기는 342,103 바이트이다.
본 발명은 오메가-수산화 지방산 유도체들 및 이들을 생성하는 방법들에 관한 것이다. 본 명세서에서, 본 발명은 높은 순도 및 수율로 오메가-수산화 지방산 유도체들을 제공하는 신규하고 환경 친화적인 생성 방법을 포함한다. 또한, 선택 발효를 통해 오메가-수산화 지방산 유도체들을 생성하는 재조합 미생물들이 포함된다.
오메가-수산화(ω-하이드록시) 지방산 유도체들은 산업용 약품(industrial agent)의 성분들으로서 다수의 상업적인 용도를 갖는다. 해당 산업분야에는, ω-하이드록시 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-아미노 지방산들; ω-아미노 지방산 메틸 에스테르들; 알파-, 오메가-이산들(diacids)(α,ω-이산들); 오메가-카르복시 지방산 메틸 에스테르들(ω-카르복시 지방산 메틸 에스테르); 알파-, 오메가-디에스테르들(α,ω-디에스테르들); 알파-, 오메가-디올들(α,ω-디올들) 등을 포함하는 다양한 타입의 ω-하이드록시 지방산 유도체들이 알려져 있다. 또한, 이러한 분자들은 다양한 다른 화합물들에 대한 전구체들로서 중요하다. 예를 들어, α,ω-디카르복실산들 및 다른 α,ω-이작용성 분자(bifunctional molecule)들은 중합체 수지, 금속 가공 유체, 접착제, 부식 억제제, 커패시터 전해질, 디에스테르 합성 윤활제, 섬유, 분체 도료 경화제(powder coating curatives), 가소제, 폴리에스테르 도료, 에폭시 수지, 폴리아미드 수지, 향미제(flavors),향료(fragrances), 계면활성제, 세제, 첨가제 등의 산업적 적용들을 갖는 중요한 화학제들이다. 요즘에도, ω-하이드록시 지방산 유도체들은 여전히 석유계 재료들로 만들어지거나 파라핀과 지방산들의 생물전환(bioconversion)을 통해 만들어진다. 이러한 화합물들을 생성하는 화학적인 방법들은 유해 시약들의 사용을 필요로 하며, 에너지 집중적(energy intensive)이고, 환경 고비용적(environmentally costly)이다. 반대로, 그린 프로세스(green processe)들을 고려하면서 발현 경로(fermentation route)들을 밝혀내는 것은 여전히 너무 비용이 많이 들며, 만들어질 수 있는 생성물들의 타입들이 제한된다.
따라서, 재생가능한 공급원료(renewable feedstock)들로부터 다양한 타입들 및 기능들의 ω-하이드록시 지방산 유도체들의 직접적인 생성을 위한 공정이 환경에 대해 더 안전할 뿐만 아니라 또한 더 비용 효과적일 것이다. 본 발명은 이러한 필요성을 해결한다.
본 발명의 일 실시형태는, 재생가능한 공급원료로부터 탄소원의 존재 시 발효액(fermentation broth)에서 성장될 때 생체 내에서(in vivo) 오메가-수산화(ω-하이드록시) 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제(thioesterase); 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제(ester synthase); 및 EC 1.14.15.3의 변형된(modified) ω-하이드록실라아제(hydroxylase)를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된(engineered) 경로를 포함한다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제(monooxygenase) (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다(catalyze). 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체(hybrid fusion protein variant)이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제(reductase) 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적(self-sufficient) CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성(sequence identity)을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 본 명세서에서, ω-하이드록실라아제 혼성 융합 단백질 변이체는 아미노산 27, 82, 141, 178, 231, 309, 407, 415, 516, 666 및/또는 796 위치에서 적어도 하나의 돌연변이를 갖는다. 재조합 미생물은 ω-하이드록시 지방산들 및 ω-하이드록시 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).
본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 ω-옥소 지방산들 및 ω-옥소 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).
본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제(시토크롬 P450 모노옥시게나아제)를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 또한, 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또 다른 실시형태에서, 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 α,ω-이산들 또는 ω-카르복시 지방산 메틸 에스테르들인 ω-하이드록시 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).
또한, 본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 또 다른 실시형태에서, 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또 다른 실시형태에서, 재조합 미생물은 EC 6.2.1.3의 아실-CoA 리가아제(ligase) 또는 EC 2.8.3.6의 아실-CoA 트랜스퍼라아제(transferase)를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 α,ω-디에스테르들인 ω-하이드록시 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).
또한, 본 발명은, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 포함한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또 다른 실시형태에서, 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 ω-아미노 지방산들 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).
본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공한다. 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. 일 실시형태에서, 재조합 미생물은 EC 1.1.-.-의 알코올 디하이드로게나아제 및 1.2.99의 카르복실산 리덕타아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 재조합 미생물은 α,ω-디올들인 ω-하이드록시 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).
또한, 본 발명은 미생물(위 참조)을 포함하는 세포 배양물(cell culture)을 고려하며, 세포 배양물은 ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들을 포함하는 ω-하이드록시 지방산 유도체들을 생성한다(단, 이로 제한되지 않음).
본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는(isolating) 단계를 포함한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 ω-하이드록시 유리 지방산 또는 ω-하이드록시 지방산 메틸 에스테르이다.
본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 ω-하이드록실라아제(시토크롬 P450 모노옥시게나아제)를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 ω-옥소 지방산 또는 ω-옥소 지방산 메틸 에스테르이다.
본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 특정한 또 다른 실시형태에서, 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 α,ω-이산 또는 α,ω-지방산 디메틸 에스테르이다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다.
본 발명의 또 다른 실시형태는 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 특정한 또 다른 실시형태에서, 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 ω-아미노 지방산 또는 ω-아미노 지방산 메틸 에스테르이다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다.
또한, 본 발명은 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 고려하며, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 특정한 일 실시형태에서, 재조합 미생물은 EC 1.2.99.6의 카르복실산 리덕타아제 및 EC 1.1.-.-의 알코올 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작된다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 실시형태에서, 생성된 ω-하이드록시 지방산 유도체는 α,ω-디올이다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다.
본 발명의 또 다른 실시형태는 일 방법(위 참조)을 제공하며, 재생가능한 공급원료는 옥수수, 사탕수수, 수수, 사탕무, 스위치그래스(switchgrass), 목초, 짚, 목재, 펄프, 오수, 쓰레기, 셀룰로오스 도시 폐기물, 플루-가스(flu-gas), 합성-가스, 이산화탄소를 포함하는 탄소계이다(단, 이로 제한되지 않음). 일 실시형태에서, 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스(turanose), 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤 및 이의 혼합물들로부터 선택된다.
또한, 본 발명은 본 명세서에 개시된 방법들(위 참조)에 의해 생성되는 중합체 조성물을 고려하며, 중합체 조성물은 폴리우레탄, 폴리에스테르 폴리올, 폴리에스테르 수지, 알킬 코팅 수지, 유리섬유 수지, 겔 코팅 수지 및 폴리에스테르 열가소성 수지를 포함한다(단, 이로 제한되지 않음).
본 발명의 또 다른 실시형태는, 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물을 제공하며, 상기 미생물은 EC 1.2.1.42의 아실-ACP 리덕타아제, EC 1.1.-.-의 알코올 디하이드로게나아제 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다. ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성을 가지며, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 생성된 ω-하이드록시 지방산 유도체는 α,ω-디올이다. 또한, 일 실시형태에서는, 본 명세서에 개시된 미생물들(위 참조)을 포함하는 세포 배양물이 제공된다.
또한, 본 발명의 또 다른 실시형태는, 발효액에 재조합 미생물을 제공하는 단계를 포함하는 ω-하이드록시 지방산 유도체를 생성하는 방법을 제공하며, 상기 미생물은 EC 1.2.1.42의 아실-ACP 리덕타아제, EC 1.1.-.-의 알코올 디하이드로게나아제 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 갖는다. 또한, 상기 방법은 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계, 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 일 구현예에서, 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체이다. 또 다른 구현예에서, 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드이다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체인 변형된 ω-하이드록실라아제는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 가지며, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및/또는 A796V를 포함하는 하나 이상의 돌연변이를 갖는다. 여기서, ω-하이드록시 지방산 유도체는 α,ω-디올이다. 일 실시형태에서, 재생가능한 공급원료는 탄소계이며, 옥수수, 사탕수수, 수수, 사탕무, 스위치그래스, 목초, 짚, 목재, 펄프, 오수, 쓰레기, 셀룰로오스 도시 폐기물, 플루-가스, 합성-가스, 이산화탄소를 포함한다. 또 다른 실시형태에서, 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스(turanose), 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤 및 이의 혼합물들로부터 선택된다. 또한, 상기 방법에 의해 생성되는 중합체 조성물이 포함되며, 중합체 조성물은 폴리우레탄, 폴리에스테르 폴리올, 폴리에스테르 수지, 알킬 코팅 수지, 유리섬유 수지, 겔 코팅 수지 및 폴리에스테르 열가소성 수지를 포함한다(단, 이로 제한되지 않음).
또한, 본 발명은 본 명세서에 설명된 방법들(위 참조)에 의해 생성되는 향료 화학 조성물(fragrance chemical composition)을 고려하며, 향료 화학 조성물은 C9 내지 C16 포화 또는 불포화 매크로라이드(macrolide)이다. 향료 화학 조성물은 암브레톨리드(ambrettolide), 디하이드로 암브레톨리드, 15-하이드록시 펜타데칸산(pentadecanoic acid)의 매크로락톤(macrolactone), 및 15-하이드록시 펜타데센산(pentadecenoic acid)의 매크로락톤 등으로부터 선택된 화학적 개체들(chemical entities)을 포함한다.
본 발명은 바람직한 구현예들을 예시하는데 도움을 주는 첨부한 도면들과 연계하여 읽을 때 가장 잘 이해될 것이다. 하지만, 본 발명은 도면들에 개시된 특정 구현예들로 제한되지 않음을 이해할 것이다.
도 1은 ω-하이드록시-카르복실산, ω-옥소-카르복실산, ω-아미노-카르복실산 및 α,ω-이산을 만드는 경로들을 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 2a는 메틸 에스테르 중간체를 통해 ω-하이드록시-카르복실산, ω-아미노-카르복실산 및 α,ω-이산을 만드는 경로들을 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 2b는 디메틸 에스테르 중간체를 통해 α,ω-이산을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 3은 티오에스테라아제 및 카르복실산 리덕타아제를 이용하여 α,ω-디올을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 4는 아실-ACP 리덕타아제 리덕타아제를 이용하여 α,ω-디올을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 5는 ω-아미노 카르복실산을 락탐으로 전환시키는 경로를 예시한다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 6은 도데칸산을 제공했을 때 12-하이드록시 도데칸산 형성을 유도하는 cypl53A 오페론을 발현시키는 재조합 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주(MG1655 ΔfadD)로부터의 추출물의 GC/MS 크로마토그래프가 도시된다.
도 7a 내지 도 7c는 유도된 12-하이드록시 도데칸산(12.297 분에서 피크: 도 7a), 유도된 12-하이드록시 도데칸산 진정적 표준(authentic standard: 도 7b), 및 비-유도된 12-하이드록시 도데칸(11.393 분에서 피크: 도 7c)의 질량 스펙트럼을 예시한다. 유도제(derivatizing agent)는 BSTFA+1%TMCS이었다. 도 7a 및 도 7c의 질량 스펙트럼은 대장균 균주 sAS.321의 추출물로부터 얻어졌다.
도 8a 및 도 8b는 유도된 12-하이드록시도데칸산(12-트리메틸실릴옥시도데칸산 트리메틸실릴 에스테르: 도 8a) 및 비-유도된 12-하이드록시도데칸산(도 8b)의 이온 단편화 패턴(ion fragmentation pattern)을 예시한다.
도 9는 도데칸산이 공급되었을 때 12-하이드록시 도데칸산 형성을 야기하는 CYP153A 오페론들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 균주 sAS.335가 개선된 CYP153A 오페론을 발현시킨다.
도 10a 내지 도 10c는 도데칸산으로부터 12-하이드록시 도데칸산(도 10a), 도데칸산 메틸 에스테르로부터 12-하이드록시 도데칸산 메틸 에스테르(도 10b) 및 도데칸올로부터 1,12-도데칸디올(도 10c)의 형성을 야기하는 CYP153A-RedRhF 융합 단백질들을 발현시키는 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주 MG1655 ΔfadD 의 추출물이 도시된다.
도 11a 및 도 11b는 균주 sAS.336의 추출물로부터 유도된 1,12-도데칸디올(11.948 분에서 피크: 도 11a) 및 진정적 유도된 1,12-도데칸디올 표준(도 11b)의 질량 스펙트럼을 도시한다. 유도제는 BSTFA+1%TMCS이었다.
도 12a 및 도 12b는 균주 sAS.336의 추출물로부터의 12-하이드록시 도데칸산 메틸 에스테르의 질량 스펙트럼을 도시한다. 비-유도된(11.107 분에서 피크: 도 12a) 및 유도된(11.662 분에서 피크: 도 12b) 샘플들이 도시된다. 유도제는 BSTFA+1%TMCS이었다.
도 13a 및 도 13b는 유도화(derivatization)를 갖지 않는 1,12-도데칸디올(도 13a) 및 12-하이드록시도데칸산 메틸 에스테르(도 13b)의 이온 단편화 패턴을 예시한다.
도 14a 내지 도 14c는 ω-OH 지방산(도 14a), ω-OH 지방산 메틸 에스테르(도 14b) 또는 글루코오스로부터 α,ω-디올(도 14c)을 생성하는 CYP153A-RedRhF 융합 단백질들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 15는 ω-하이드록시 지방산이 생성 세포들로부터 효율적으로 분비(secret)되었음을 입증한다.
도 16은 글루코오스 상에서 성장되었을 때 2 개의 대장균 균주들로부터 생성된 ω-하이드록시 지방산들의 조성을 나타낸다.
도 17은 CYP153A-RedRhF 융합 단백질, 알코올 옥시다아제 및 α,ω-이산을 생성하는 알데히드 디하이드로게나아제를 발현시키는 재조합 대장균 균주들로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 18a 및 도 18b는 균주 sEP.690의 추출물로부터의 유도된 1,14-테트라데칸디오익산(tetradecanedioic acid)(13.367 분에서 피크: 도 18a) 및 진정적 유도된 1,14-테트라데칸디오익산 표준(도 18b)의 질량 스펙트럼을 도시한다. 유도제는 BSTFA+1%TMCS이었다.
도 19a는 유도된 1,14-테트라데칸디오익산의 이온 단편화 패턴을 예시한다. 유도제는 BSTFA+1%TMCS이었다.
도 20은 소량의 아말단(subterminally) (예를 들어, ω-1, ω-2 및/또는 ω-3) 수산화 지방산들을 생성하는 cyp102A1(F87A)을 발현시키는 재조합 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주 AlcV334의 추출물의 GC/MS 크로마토그래프가 도시된다. 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 21a 내지 도 21e는 11-하이드록시 도데칸산(도 21a), 10-하이드록시 도데칸산(도 21b), 9-하이드록시 도데칸산(도 21c), 8-하이드록시 도데칸산(도 21d), 7-하이드록시 도데칸산(도 21e)으로서 식별된 (도 20으로부터의) RT 7.195에서 7.510까지의 피크들의 질량 스펙트럼을 도시한다. 진단적 이온 단편들이 각각의 수산화 위치에 대해 설명된다. 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 22a 및 도 22b는 ω-1, ω-2 및 ω-3 하이드록시 지방산들(도 22a), 또는 글루코오스로부터 ω-1, ω-2 및 ω-3 하이드록시 지방족 알코올들(도 22b)을 생성하는 cyp102A7- 단백질들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 23a 내지 도 23c는 유도된 9-하이드록시 도데칸올(9.653 분에서 피크: 도 23a), 유도된 10-하이드록시 도데칸올(9.808 분에서 피크: 도 23b), 및 유도된 11-하이드록시 도데칸올(9.905 분에서 피크: 도 23c)의 질량 스펙트럼 및 이온 단편화 패턴들을 예시한다. 유도제는 BSTFA+1%TMCS이었다. 샘플들은 대장균 균주 XL963의 추출물들로부터 얻어졌다.
도 24a 및 도 24b는 아말단(예를 들어, ω-1, ω-2 및/또는 ω-3) 수산화 지방산들(도 24a), 및 cyp102A7을 발현시키는 재조합 대장균 균주들에 의해 글루코오스로부터 생성된 아말단 수산화 지방족 알코올들(도 24b)의 양을 나타낸다.
도 25는 대장균 균주 stEP.798에 의해 생성된 ω-수산화 지방산들을 나타낸다.
도 26은 대장균 L1017에 의해 생성된 α,ω-이산을 나타낸다.
도 27은 CYP153A-리덕타아제 혼성 융합 단백질 변이체들을 발현시키는 미생물들을 배양시킨 결과치들이다. 나타낸 바와 같이, V141T(SEQ ID: 46)를 갖는 변이체들이 가장 높은 ω-하이드록시 헥사데센산 역가(hexadecenoic acid titer) 및 헥사데센산으로부터의 가장 높은 전환을 생성하였다.
도 1은 ω-하이드록시-카르복실산, ω-옥소-카르복실산, ω-아미노-카르복실산 및 α,ω-이산을 만드는 경로들을 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 2a는 메틸 에스테르 중간체를 통해 ω-하이드록시-카르복실산, ω-아미노-카르복실산 및 α,ω-이산을 만드는 경로들을 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 2b는 디메틸 에스테르 중간체를 통해 α,ω-이산을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 3은 티오에스테라아제 및 카르복실산 리덕타아제를 이용하여 α,ω-디올을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 4는 아실-ACP 리덕타아제 리덕타아제를 이용하여 α,ω-디올을 만드는 경로를 도시한 도면이다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 5는 ω-아미노 카르복실산을 락탐으로 전환시키는 경로를 예시한다. 일 예시로서, 12 개의 탄소 원자들을 갖는 지방산 유도체가 도시되어 있다.
도 6은 도데칸산을 제공했을 때 12-하이드록시 도데칸산 형성을 유도하는 cypl53A 오페론을 발현시키는 재조합 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주(MG1655 ΔfadD)로부터의 추출물의 GC/MS 크로마토그래프가 도시된다.
도 7a 내지 도 7c는 유도된 12-하이드록시 도데칸산(12.297 분에서 피크: 도 7a), 유도된 12-하이드록시 도데칸산 진정적 표준(authentic standard: 도 7b), 및 비-유도된 12-하이드록시 도데칸(11.393 분에서 피크: 도 7c)의 질량 스펙트럼을 예시한다. 유도제(derivatizing agent)는 BSTFA+1%TMCS이었다. 도 7a 및 도 7c의 질량 스펙트럼은 대장균 균주 sAS.321의 추출물로부터 얻어졌다.
도 8a 및 도 8b는 유도된 12-하이드록시도데칸산(12-트리메틸실릴옥시도데칸산 트리메틸실릴 에스테르: 도 8a) 및 비-유도된 12-하이드록시도데칸산(도 8b)의 이온 단편화 패턴(ion fragmentation pattern)을 예시한다.
도 9는 도데칸산이 공급되었을 때 12-하이드록시 도데칸산 형성을 야기하는 CYP153A 오페론들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 균주 sAS.335가 개선된 CYP153A 오페론을 발현시킨다.
도 10a 내지 도 10c는 도데칸산으로부터 12-하이드록시 도데칸산(도 10a), 도데칸산 메틸 에스테르로부터 12-하이드록시 도데칸산 메틸 에스테르(도 10b) 및 도데칸올로부터 1,12-도데칸디올(도 10c)의 형성을 야기하는 CYP153A-RedRhF 융합 단백질들을 발현시키는 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주 MG1655 ΔfadD 의 추출물이 도시된다.
도 11a 및 도 11b는 균주 sAS.336의 추출물로부터 유도된 1,12-도데칸디올(11.948 분에서 피크: 도 11a) 및 진정적 유도된 1,12-도데칸디올 표준(도 11b)의 질량 스펙트럼을 도시한다. 유도제는 BSTFA+1%TMCS이었다.
도 12a 및 도 12b는 균주 sAS.336의 추출물로부터의 12-하이드록시 도데칸산 메틸 에스테르의 질량 스펙트럼을 도시한다. 비-유도된(11.107 분에서 피크: 도 12a) 및 유도된(11.662 분에서 피크: 도 12b) 샘플들이 도시된다. 유도제는 BSTFA+1%TMCS이었다.
도 13a 및 도 13b는 유도화(derivatization)를 갖지 않는 1,12-도데칸디올(도 13a) 및 12-하이드록시도데칸산 메틸 에스테르(도 13b)의 이온 단편화 패턴을 예시한다.
도 14a 내지 도 14c는 ω-OH 지방산(도 14a), ω-OH 지방산 메틸 에스테르(도 14b) 또는 글루코오스로부터 α,ω-디올(도 14c)을 생성하는 CYP153A-RedRhF 융합 단백질들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 15는 ω-하이드록시 지방산이 생성 세포들로부터 효율적으로 분비(secret)되었음을 입증한다.
도 16은 글루코오스 상에서 성장되었을 때 2 개의 대장균 균주들로부터 생성된 ω-하이드록시 지방산들의 조성을 나타낸다.
도 17은 CYP153A-RedRhF 융합 단백질, 알코올 옥시다아제 및 α,ω-이산을 생성하는 알데히드 디하이드로게나아제를 발현시키는 재조합 대장균 균주들로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 18a 및 도 18b는 균주 sEP.690의 추출물로부터의 유도된 1,14-테트라데칸디오익산(tetradecanedioic acid)(13.367 분에서 피크: 도 18a) 및 진정적 유도된 1,14-테트라데칸디오익산 표준(도 18b)의 질량 스펙트럼을 도시한다. 유도제는 BSTFA+1%TMCS이었다.
도 19a는 유도된 1,14-테트라데칸디오익산의 이온 단편화 패턴을 예시한다. 유도제는 BSTFA+1%TMCS이었다.
도 20은 소량의 아말단(subterminally) (예를 들어, ω-1, ω-2 및/또는 ω-3) 수산화 지방산들을 생성하는 cyp102A1(F87A)을 발현시키는 재조합 대장균 균주로부터의 추출물의 GC/MS 크로마토그래프를 나타낸다. 또한, 대조 균주 AlcV334의 추출물의 GC/MS 크로마토그래프가 도시된다. 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 21a 내지 도 21e는 11-하이드록시 도데칸산(도 21a), 10-하이드록시 도데칸산(도 21b), 9-하이드록시 도데칸산(도 21c), 8-하이드록시 도데칸산(도 21d), 7-하이드록시 도데칸산(도 21e)으로서 식별된 (도 20으로부터의) RT 7.195에서 7.510까지의 피크들의 질량 스펙트럼을 도시한다. 진단적 이온 단편들이 각각의 수산화 위치에 대해 설명된다. 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 22a 및 도 22b는 ω-1, ω-2 및 ω-3 하이드록시 지방산들(도 22a), 또는 글루코오스로부터 ω-1, ω-2 및 ω-3 하이드록시 지방족 알코올들(도 22b)을 생성하는 cyp102A7- 단백질들을 발현시키는 재조합 대장균 균주들로부터의 추출물들의 GC/MS 크로마토그래프를 나타낸다. 모든 샘플들은 BSTFA+1%TMCS로 유도되었다.
도 23a 내지 도 23c는 유도된 9-하이드록시 도데칸올(9.653 분에서 피크: 도 23a), 유도된 10-하이드록시 도데칸올(9.808 분에서 피크: 도 23b), 및 유도된 11-하이드록시 도데칸올(9.905 분에서 피크: 도 23c)의 질량 스펙트럼 및 이온 단편화 패턴들을 예시한다. 유도제는 BSTFA+1%TMCS이었다. 샘플들은 대장균 균주 XL963의 추출물들로부터 얻어졌다.
도 24a 및 도 24b는 아말단(예를 들어, ω-1, ω-2 및/또는 ω-3) 수산화 지방산들(도 24a), 및 cyp102A7을 발현시키는 재조합 대장균 균주들에 의해 글루코오스로부터 생성된 아말단 수산화 지방족 알코올들(도 24b)의 양을 나타낸다.
도 25는 대장균 균주 stEP.798에 의해 생성된 ω-수산화 지방산들을 나타낸다.
도 26은 대장균 L1017에 의해 생성된 α,ω-이산을 나타낸다.
도 27은 CYP153A-리덕타아제 혼성 융합 단백질 변이체들을 발현시키는 미생물들을 배양시킨 결과치들이다. 나타낸 바와 같이, V141T(SEQ ID: 46)를 갖는 변이체들이 가장 높은 ω-하이드록시 헥사데센산 역가(hexadecenoic acid titer) 및 헥사데센산으로부터의 가장 높은 전환을 생성하였다.
개관(General Overview)
ω-하이드록시 지방산 유도체들을 생성하는 새롭고 환경-친화적인 방법의 개발은 해당 산업 분야에 상당한 개선을 나타낸다. 상기 방법은 이러한 화합물들이 재생가능한 공급원료로부터 유도되는 단순한 탄소원으로부터 효율적으로 생성되게 한다. 특히, 상기 방법은 옥수수, 사탕수수 또는 목질계 바이오매스(lignocellulosic biomass)로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물(waste products); 또는 바이오매스 또는 천연 가스 또는 이산화탄소와 같은 유기 재료의 재형성물(reformation)과 같은 재생가능한 재료들로부터 ω-하이드록시 지방산 유도체들의 생성을 제공한다.
더 구체적으로, 본 발명은 탄수화물과 같은 재생가능한 공급원료들을, ω-하이드록시 지방산들; ω-하이드록시-지방산 메틸 에스테르들; ω-카르복시-지방산 메틸 에스테르들; ω-옥소 지방산들; ω-아미노 지방산들; ω-아미노 지방산 메틸 에스테르들, α,ω-이산들; α,ω-디에스테르들; α,ω-디올들 등을 포함하는 특정 ω-하이드록시 지방산 유도체들로 전환시키도록 조작된 신규한 재조합 미생물들을 제공한다. 이와 같이, 이작용성 분자들은 ω-하이드록시 지방산들; α,ω-하이드록시 지방족 알코올들; α,ω-하이드록시-지방산 메틸 에스테르들; α,ω-하이드록시 아민들; α,ω-이산들; α,ω-이-지방산(di-fatty acid) 메틸 에스테르들, α,ω-디올들 등을 포함한다(단, 이로 제한되지 않음). 재조합 미생물들은 이러한 화합물들의 생성을 위해 비용-효율적인 발효 공정들을 허용한다. 본 발명은 미생물 지방산 대사 및 이의 중간체들의 특정 화학물질들로의 전환을 포함한다.
본 발명의 장점들은 매우 많다. 본 발명은 더 단순한, 즉 다수의 화학적 및/또는 생체촉매적 공정들이기보다는 단순한 발효 과정을 이용하는 생성 방법을 제공하며, 이는 노폐물이 거의 생성되지 않기 때문에, 더 빠르고, 비용이 덜 들며, 더 환경-친화적이다. 원료 재료(source material)들로서 재생가능한 공급원료[지속가능한 원 재료(raw material)] 및/또는 산업 폐기물(예를 들어, 글리세롤)의 사용은 또 하나의 비용 이점을 추가하고, 환경을 보호한다. 본 발명은 특정 타겟 생성물들, 즉 선택적 사슬 길이 및 화학적 성질(chemistry)을 갖는 화학적 개체들을 포함하는 조성물들의 선택적인 제조를 제공한다. 다양한 화학적 기능들에 대한 접근은 새로운 타겟 시장 적용을 허용한다.
정의
본 명세서에서 사용되는 바와 같이, "오메가-수산화 지방산 유도체" 및 "ω-수산화 지방산 유도체" 및 "ω-하이드록시 지방산 유도체" 및 "ω-하이드록실 지방산 유도체" 및 "ω-OH 지방산 유도체"라는 용어들은 본 명세서에서 교환가능하게 사용되며, 지방산 대사로부터 발생되고, 오메가 위치에서 적어도 하나의 OH 기를 갖거나, 오메가 위치에서 적어도 하나의 OH 기를 갖는 중간체로부터 유도된 화학적 개체를 지칭한다. 본 명세서에서, "오메가 위치"는 그 1차 작용기에 대해 반대쪽 단부에 있는 지방산 유도체의 말단 탄소 원자를 지칭한다. 이러한 ω-하이드록시 지방산 유도체들은, ω-하이드록시 지방산들; ω-하이드록시-지방산 메틸 에스테르들; ω-카르복시-지방산 메틸 에스테르들; ω-옥소 지방산들; ω-아미노 지방산들; ω-아미노 지방산 메틸 에스테르들; 그리고 α,ω-이산들; α,ω-디에스테르들; 및 α,ω-디올들을 포함한다(단, 이로 제한되지 않음). "ω-하이드록시 지방산 유도체"라는 용어는 "α,ω-이작용성 지방산 유도체들"을 포함한다.
본 명세서에 언급된 바와 같은 "ω-하이드록시 지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생성되며, 통상적으로 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성을 갖는 특정 타입의 ω-하이드록시 지방산 유도체들의 혼합물(예를 들어, 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성의 α,ω-이산들; 또는 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성의 α,ω-디에스테르들; 또는 다양한 사슬 길이 및/또는 포화도 및/또는 분지 특성의 α,ω-디올들 등)을 포함한다. 몇몇 경우, ω-하이드록시 지방산 유도체 조성물은 주로 한 가지 타입의 ω-하이드록시 지방산 유도체, 예컨대 1,12-도데센디올, 또는 1,14-테트라데칸이올, 또는 16-하이드록시 헥사데칸산 메틸 에스테르, 또는 16-하이드록시-헥사데센산, 또는 15-하이드록시-펜타데칸산 또는 15-하이드록시펜타데센산, 또는 18-하이드록시 옥타세센산, 또는 이러한 지방산 유도체들 중 어느 것의 메틸 에스테르 등을 포함한다. 몇몇 다른 경우들에서, ω-하이드록시 지방산 유도체 조성물은 특이적으로 설계된 조성물을 제공하기 위해 하나 이상의 타입의 ω-하이드록시 지방산 유도체 조성물의 혼합물을 포함한다(예를 들어, 동일한 조성에서 약 20 %의 1,12-도세센디올 및 약 80 %의 1,16-헥사데칸디올은 이러한 일 예시를 제공할 것이다).
"아말단(subterminally)" 수산화 지방산 유도체라는 용어는 오메가-1 위치 및/또는 오메가-2 위치 및/또는 오메가-3 위치 및/또는 오메가-4 위치 등(예를 들어, ω-1, ω-2 및/또는 ω-3; 등)에서 적어도 하나의 OH 기를 갖는(또는 적어도 하나의 OH 기를 갖는 중간체로부터 유도된) 화학적 개체를 지칭한다. 예시적인 종은 ω-1, ω-2 및/또는 ω-3-하이드록시 지방산; 또는 ω-1-하이드록시 지방산 메틸 에스테르; 또는 ω-1, ω-2, ω-3, ω-4 및/또는 ω-5-하이드록시 도데칸 산; 등이 있다.
"효소 분류(enzyme classification: EC) 번호"라는 용어는 특정 효소 활성을 나타내는 번호를 지칭한다. EC 번호는 효소 명명법의 시스템 하에서 효소들이 촉매화하는 반응에 따라 효소들을 분류한다. EC 번호는 효소-촉매화 반응들을 특정화한다. 예를 들어, 상이한 유기체들로부터의 상이한 효소들이 동일한 반응을 촉매화하는 경우, 이들은 동일한 EC 번호를 갖는다. 또한, 상이한 단백질 폴드(protein fold)들이 동일한 반응을 촉매화할 수 있으므로, 동일한 EC 번호[예를 들어, 비상동성 동기능 효소들(non-homologous isofunctional enzymes) 또는 NISE]가 할당될 것이다. EC 번호는 생화학 및 분자생물학 국제 연합(international union of biochemistry and molecular biology: IUBMB)의 명명 위원회(nomenclature committee)에 의해 제정되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. 예를 들어, ω-하이드록실라아제 또는 ω-옥시게나아제 효소 활성을 포함하는 시토크롬 P450 모노옥시게나아제 (P450) 효소 활성은 EC 1.14.15.3으로 분류된다(또한, 긴-사슬형 아실-[아실-운반체-단백질] 리덕타아제로도 알려져 있다). P450 효소 계열에 속하는 효소들의 기능은 하나의 종으로부터 다음 종으로 대부분의 원핵생물들에 보존된다. 따라서, 상이한 미생물 종이 EC 1.14.15.3으로 분류된 동일한 효소 활성을 수행할 수 있다. EC 1.14.15.3에 의해 특성화된 효소 활성의 일 예시는 본 명세서에 설명된 바와 같은 CYP153A-리덕타아제 혼성 융합 폴리펩티드 또는 이의 변이체(위 참조)의 효소 활성이다.
"EC 1.14.15.3의 변형된 ω-하이드록실라아제" 및 "변형된 ω-하이드록실라아제"라는 용어는 본 명세서에서 교환가능하게 사용되며, 생체 내에서(예를 들어, 미생물에서) 탄화수소 사슬들의 ω 위치를 효율적으로 촉매화하는 시토크롬 P450 모노옥시게나아제 효소 활성을 지칭한다.
"EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 변이체" 및 "ω-하이드록실라아제 혼성 융합 단백질 변이체"라는 용어는 본 명세서에서 교환가능하게 사용되며, 재조합 숙주 세포들에서의 ω-하이드록실라아제 혼성 융합 단백질 변이체의 발현이, 대응하는 숙주 세포에서의 천연 P450 융합 단백질의 발현에 비해, ω-OH 지방산들 및/또는 ω-OH 지방산 유도체 조성물들의 개선된 역가, 수율 및/또는 생산성을 유도하도록, 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변형된 ω-하이드록실라아제 혼성 융합 폴리펩티드를 지칭한다. 예를 들어, 세포가 ω-하이드록실라아제 혼성 융합 단백질 변이체로 형질전환되었을 때, 이는 ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포(예를 들어, 재조합 숙주 세포)이다. 일 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포에 의해 생성된 ω-OH 지방산의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율의 적어도 2 배이다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포에 의해 생성된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 1 배, 적어도 약 2 배, 적어도 약 3 배, 적어도 약 4 배, 적어도 약 5 배, 적어도 약 6 배, 적어도 약 7 배, 적어도 약 8 배, 적어도 약 9 배, 또는 적어도 약 10 배 더 크다. 일 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체를 발현시키는 세포에 의해 생성된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 1 퍼센트, 약 2 퍼센트, 약 3 퍼센트, 약 4 퍼센트, 약 5 퍼센트, 약 6 퍼센트, 약 7 퍼센트, 약 8 퍼센트, 약 9 퍼센트, 약 10 퍼센트 더 크다. 또 다른 구현예에서, ω-하이드록실라아제 혼성 융합 단백질 변이체의 발현으로 인해 재조합 세포에서 생성된 ω-OH 지방산 또는 이의 유도체의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 20 퍼센트에서 적어도 약 80 퍼센트 더 크다. 몇몇 구현예들에서, 세포에 의해 생성된 ω-OH 지방산의 역가 및/또는 수율은 천연 P450 융합 단백질을 발현시키는 대응 세포의 역가 및/또는 수율보다 적어도 약 20 퍼센트, 적어도 약 25 퍼센트, 적어도 약 30 퍼센트, 적어도 약 35 퍼센트, 적어도 약 40 퍼센트, 적어도 약 45 퍼센트, 적어도 약 50 퍼센트, 적어도 약 55 퍼센트, 적어도 약 60 퍼센트, 적어도 약 65 퍼센트, 적어도 약 70 퍼센트, 적어도 약 75 퍼센트, 적어도 약 80 퍼센트, 적어도 약 85 퍼센트, 적어도 약 90 퍼센트, 적어도 약 95 퍼센트, 적어도 약 97 퍼센트, 적어도 약 98 퍼센트, 또는 적어도 약 100 퍼센트 더 크다.
"CYP153A-리덕타아제 혼성 융합 폴리펩티드"라는 용어는 SEQ ID NO: 6에 대해 적어도 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % 또는 100 % 서열 동일성을 갖는 폴리펩티드 서열을 지칭한다. CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적이며, 지방산의 ω-OH 지방산으로의 반응을 촉매화하는 ω-하이드록실라아제 효소 활성을 갖는다. CYP153A-리덕타아제 혼성 융합 폴리펩티드의 일 예시는 혼성 cypl53A-RedRhF-타입 융합 폴리펩티드이다.
"수탁 번호" 또는 "NCBI 수탁 번호" 또는 "GenBank 수탁 번호"는 특정한 핵산 서열을 나타내는 번호를 지칭한다. 본 명세서에 설명되는 서열 수탁 번호들은 미국 국립보건원에 의해 유지되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (UniProtKB 수탁 번호라고도 지칭되는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.
본 명세서에서 사용되는 바와 같이, "뉴클레오티드"라는 용어는 헤테로사이클릭 염기, 당 및 하나 이상의 인산기로 이루어진 폴리뉴클레오티드의 단위체 단위를 지칭한다. 자연적으로 발생하는 염기들[구아닌(G), 아데닌(A), 사이토신(C), 티민(T) 및 우라실(U)]은 통상적으로 퓨린 또는 피리미딘의 유도체들이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)들도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토오스(5-탄당)의 (DNA를 형성하는) 디옥시리보오스 또는 (RNA를 형성하는) 리보오스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체들도 포함되는 것으로 이해하여야 한다. 핵산은 통상적으로 핵산 또는 폴리뉴클레오티드를 형성하는 인산 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 해당 기술분야에 알려져 있다.
본 명세서에서 사용되는 바와 같이, "폴리뉴클레오티드"라는 용어는 리보뉴클레오티드(RNA) 또는 디옥시리보뉴클레오티드(DNA)의 중합체를 지칭하고, 이는 외가닥 또는 이중 가닥일 수 있으며, 비-자연적 또는 변경된 뉴클레오티드들을 함유할 수 있다. "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"이라는 용어는 여하한 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 지칭하는데 교환가능하게 사용된다. 이러한 용어는 분자의 일차 구조를 지칭하고, 따라서 이중 및 외가닥의 DNA, 및 이중 및 외가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된(capped) 폴리뉴클레오티드(단, 이로 제한되지 않음)와 같은 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하는(단, 이로 제한되지 않음) 여하한 형태로 존재할 수 있다.
본 명세서에서 사용되는 바와 같이, "폴리펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 지칭하는데 교환가능하게 사용된다. "재조합 폴리펩티드"라는 용어는 재조합 기술들에 의해 생성된 폴리펩티드를 지칭하며, 일반적으로 발현된 단백질을 코딩하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는데 사용되는 적합한 발현 벡터(expression vector) 내로 삽입된다.
본 명세서에서 사용되는 바와 같이, "동족체(homolog)" 및 "상동(homologous)"이라는 용어는 대응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50 % 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭한다. 바람직하게, 상동 폴리뉴클레오티드들 또는 폴리펩티드들은 대응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 약 99 % 상동성(homology)을 갖는 폴리뉴클레오티드 서열들 또는 아미노산 서열들을 갖는다. 본 명세서에서 사용되는 바와 같이, 서열 "상동성" 및 서열 "동일성"이라는 용어는 교환가능하게 사용된다. 해당 기술분야의 당업자라면, 2 이상의 서열들 간의 상동성을 결정하는 방법들을 잘 알고 있을 것이다. 간명하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 서열들은 최적의 비교를 위해 정렬된다[예를 들어, 최적의 정렬을 위해 제 1 및 제 2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)이 도입될 수 있으며, 비교를 위해 비-상동 서열들은 무시될 수 있다]. 바람직한 일 구현예에서, 비교를 위해 정렬되는 제 1 서열의 길이는 제 2 서열의 길이의 적어도 약 30 %, 바람직하게는 적어도 약 40 %, 더 바람직하게는 적어도 약 50 %, 훨씬 더 바람직하게는 적어도 약 60 %, 그리고 훨씬 더 바람직하게는 적어도 약 70 %, 적어도 약 75 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 또는 약 100 %이다. 이후, 제 1 및 제 2 서열들의 대응하는 아미노산 위치들 또는 뉴클레오티드 위치들에서의 아미노산 잔기들 또는 뉴클레오티드들이 비교된다. 제 1 서열의 위치가 제 2 서열의 대응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자들은 그 위치에서 동일하다. 두 서열들 간의 퍼센트 상동성은 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는, 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치들의 개수의 함수이다. 두 서열들 간의 퍼센트 상동성의 결정 및 서열의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다(Altschul 외(1990) J. Mol . Biol. 215(3):403-410). 또한, 두 아미노산 서열들 간의 퍼센트 상동성은 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다(Needleman 및 Wunsch(1970), J. Mol . Biol . 48:444-453). 또한, 두 뉴클레오티드 서열들 간의 퍼센트 상동성은 NWSgapdna.CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 해당 기술분야의 당업자는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항들의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들은 생물공학 분야에 알려져 있다(예를 들어, Rosenberg(2005) BMC Bioinformatics 6:278; Altschul 외(2005) FEBS J. 272(20):5101-5109).
"내인성" 폴리펩티드는 재조합 세포가 조작되거나 유래된 숙주 세포[예를 들어, 모 미생물 세포(parental microbial cell)]의 게놈에 의해 의해 코딩되는 폴리펩티드를 지칭한다.
"외인성" 폴리펩티드는 모 미생물 세포의 게놈에 의해 코딩되지 않은 폴리펩티드를 지칭한다. 변이(즉, 돌연변이) 폴리펩티드는 외인성 폴리펩티드의 일 예시이다.
"이종(heterologous)"이라는 용어는 일반적으로 상이한 종으로부터 유도되거나 상이한 유기체로부터 유도됨을 의미한다. 본 명세서에서 사용되는 바와 같이, 이는 특정 유기체에 자연적으로 존재하지 않는 뉴클레오티드 서열 또는 폴리펩티드 서열을 지칭한다. 이종 발현은 단백질 또는 폴리펩티드가 그 단백질을 정상적으로 발현시키지 않는 세포에 실험적으로 추가됨을 의미한다. 이와 같이, 이종은 전달된 단백질이 초기에 수용자(recipient)와 상이한 세포 타입 또는 상이한 종으로부터 유도된 사실을 지칭한다. 예를 들어, 식물 세포에 대해 내인성인 폴리뉴클레오티드 서열이 재조합 방법들에 의해 박테리아성 숙주 세포 내로 도입될 수 있으며, 이때 식물 폴리뉴클레오티드는 재조합 박테리아성 숙주 세포의 이종 폴리뉴클레오티드이다.
본 명세서에서 사용되는 바와 같이, 폴리펩티드의 "단편(fragment)"이라는 용어는 4 개의 아미노산 잔기에서부터 1 개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전체-길이 폴리펩티드 또는 단백질의 더 짧은 부분을 지칭한다. 본 발명의 특정 구현예들에서, 단편은 폴리펩티드 또는 단백질의 도메인(예를 들어, 기질 결합 도메인 또는 촉매 도메인)의 전체 아미노산 서열을 지칭한다.
본 명세서에서 사용되는 바와 같이, "돌연변이유발(mutagenesis)"이라는 용어는 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 지칭한다. 단백질 코딩 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 또한, 돌연변이유발은 변형된 단백질 활성을 유도하는 비-코딩 핵산 서열의 변화를 지칭한다.
본 명세서에서 사용되는 바와 같이, "유전자"라는 용어는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 코딩하는 핵산 서열뿐만 아니라, RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된 핵산 서열들(operably-linked nucleic acid sequences)[예를 들어, 이러한 서열들은 프로모터 또는 인핸서(enhancer) 서열들을 포함함(단, 이로 제한되지 않음)] 또는 RNA 또는 단백질의 발현에 영향을 주는 서열들을 코딩하는 작동가능하게-연결된 핵산 서열들[예를 들어, 이러한 서열들은 리보솜 결합 부위 또는 번역 조절 서열(translational control sequence)들을 포함함(단, 이로 제한되지 않음)]을 지칭한다.
발현 조절 서열(expression control sequence)들은 해당 기술분야에 알려져 있으며, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 증폭자, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열들은 구체적으로 전사에 관련된 세포성 단백질들과 상호작용한다(Maniatis 외(1987) Science 236:1237-1245). 예시적인 발현 조절 서열들은, 예를 들어 Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif.(1990)에 개시되어 있다.
본 발명의 방법들에서, 발현 조절 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된다. "작동가능하게 연결된"이라는 것은, 적절한 분자들(예를 들어, 전사 활성화인자 단백질들)이 발현 조절 서열(들)에 결합될 때, 폴리뉴클레오티드 서열 및 발현 조절 서열(들)이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류에 위치된다. 작동가능하게 연결된 인핸서는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류에 위치될 수 있다.
본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 벡터가 연결된 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 지칭한다. 일 유형의 유용한 벡터는 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 벡터가 연결된 핵산의 자율 복제 및/또는 발현이 가능한 벡터이다. 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터는 본 명세서에서 "발현 벡터"로 칭해진다. 일반적으로, 재조합 DNA 기술들에 유용한 발현 벡터는 흔히 "플라스미드"의 형태로 되어 있으며, 이는 일반적으로 벡터 형태로 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프를 지칭한다. 플라스미드가 가장 보편적으로 사용되는 벡터의 형태이므로, "플라스미드" 및 "벡터"라는 용어는 본 명세서에서 교환가능하게 사용된다. 하지만, 등가의 기능들을 제공하고, 이후에 해당 기술분야에 알려지는 이러한 다른 형태들의 발현 벡터도 포함된다. 몇몇 구현예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함한다. 몇몇 구현예들에서, 프로모터는 발달-조절된(developmentally-regulated), 세포소기관-특이적(organelle-specific), 조직-특이적(tissue-specific), 유도성(inducible), 구성적(constitutive), 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로, (a) 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; (b) 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; (c) 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; (d) 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티(purification moiety); (e) 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열(secretion sequence); 및 (f) 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열(targeting sequence)을 포함하는 적어도 하나의 서열을 포함한다. 특정 구현예들에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정하게 통합되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 구역의 제어를 받는다. 본 명세서에 사용되는 발현 벡터는 숙주 세포에서의 폴리뉴클레오티드 서열의 발현에 적합한 형태로 된 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 해당 기술분야의 당업자라면, 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 인자들에 의존할 수 있음을 이해할 것이다. 본 명세서에 설명되는 발현 벡터는 본 명세서에 설명되는 바와 같은 폴리뉴클레오티드 서열들에 의해 코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하기 위하여 숙주 세포들 내로 도입될 수 있다. 원핵생물, 예를 들어 대장균에서 폴리펩티드들을 코딩하는 유전자의 발현은 대부분 융합 및 비-융합 폴리펩티드들 중 어느 하나의 발현을 지향하는 구성적 또는 유도성 프로모터를 포함하는 벡터들로 수행된다. 융합 벡터들은 그 안에 코딩된 폴리펩티드에, 일반적으로는 재조합 폴리펩티드의 아미노- 또는 카르복시-말단에 다수의 아미노산들을 추가한다. 이러한 융합 벡터들은 통상적으로 다음의 세 가지 목적: (1) 재조합 폴리펩티드의 발현을 증가시키고; (2) 재조합 폴리펩티드의 용해도를 증가시키며; (3) 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 하나 이상을 제공한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위(proteolytic cleavage site)가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 특정 구현예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지(bacteriophage) T5로부터 유도된 프로모터에 작동가능하게 연결된다. 특정 구현예들에서, 숙주 세포는 효모 세포이고, 발현 벡터는 효모 발현 벡터이다. 효모인 S. 세레비지에(S. cerevisiae)에서의 발현을 위한 벡터들의 예시들은 pYepSec1(Baldari 외(1987) EMBO J. 6:229-234); pMFa(Kurjan 외(1982) Cell 30:933-943); pJRY88(Schultz 외(1987) Gene 54:113-123); pYES2(Invitrogen Corp., San Diego, CA), 및 picZ(Invitrogen Corp., San Diego, CA)를 포함한다. 다른 구현예들에서, 숙주 세포는 곤충 세포이고, 발현 벡터는 배큘로바이러스 발현 벡터이다. 배양된 곤충 세포들(예를 들어, Sf9 세포들)에서의 단백질들의 발현에 이용가능한 배큘로바이러스 벡터들은, 예를 들어 pAc 계열(series)(Smith 외(1983) Mol. Cell Biol . 3:2156-2165) 및 pVL 계열(Lucklow 외(1989) Virology 170:31-39)을 포함한다. 또 다른 구현예에서, 본 명세서에 설명된 폴리뉴클레오티드 서열들은 포유동물 발현 벡터를 이용하여 포유동물 세포들에서 발현될 수 있다. 원핵 및 진핵 세포들 둘 모두에 대한 다른 적절한 발현계들이 당업계에 잘 알려져 있다; 예를 들어, Sambrook 외, "Molecular Cloning: A Laboratory Manual", 제 2 판, Cold Spring Harbor Laboratory(1989)를 참조한다.
본 명세서에서 사용되는 바와 같이, "아실-CoA"는 조효소 A(CoA)의 4'-포스포판테티오닐 모이어티의 술피드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 지칭하고, 이는 화학식 R-C(O)S-CoA를 가지며, 여기서 R은 적어도 4 개의 탄소 원자들을 갖는 여하한의 알킬기이다.
본 명세서에서 사용되는 바와 같이, "아실-ACP"는 아실기 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 술피드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 지칭한다. 포스포판테테이닐 모이어티는 홀로(holo)-아실기 운반 단백질 신타아제(ACPS)인 포스포판테테이닐 트랜스퍼라아제의 작용에 의해 ACP 상의 보존된 세린 잔기에 이후-번역되도록(post-translationally) 부착된다. 몇몇 구현예들에서, 아실-ACP는 완전히 포화된 아실-ACP들의 합성에 있어서 중간체이다. 다른 구현예들에서, 아실-ACP는 불포화된 아실-ACP들의 합성에 있어서 중간체이다. 몇몇 구현예들에서, 탄소 사슬은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 26 개의 탄소들을 가질 것이다. 이러한 아실-ACP들의 각각은 이들을 지방산 유도체들로 전환시키는 효소들에 대한 기질들이다.
본 명세서에서 사용되는 바와 같이, "지방산 생합성 경로"라는 용어는 지방산들 및 이의 유도체들(ω-수산화 지방산 유도체들을 포함함)을 생성하는 생합성 경로를 의미한다. 지방산 생합성 경로는 의도한 특성들을 갖는 지방산 유도체들, 예컨대 ω-수산화 지방산 유도체들을 생성하기 위해 본 명세서에 기재된 것들 외에도 효소 활성을 갖는 폴리펩티드들 또는 추가 효소들을 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, "클론"이라는 용어는 통상적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포들의 그룹, 예를 들어 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니(cloned bacterial colony)의 박테리아를 지칭한다.
본 명세서에서 사용되는 바와 같이, "배양물"이라는 용어는 통상적으로 생세포(viable cell)들을 포함하는 액체 배지를 지칭한다. 일 구현예에서, 배양물은 제어된 조건들 하에서 사전설정된 배양 배지에서 번식하는 세포들, 예를 들어 선택된 탄소원 및/또는 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포들의 배양물을 포함한다. "배양하는" 또는 "배양"은 액체 또는 고체 배지의 적절한 조건들 하에서 재조합 숙주 세포들의 개체군을 성장시키는 것을 지칭한다. 특정 구현예들에서, 배양은 최종 생성물로의 기질의 발효성 생물전환(bioconversion)을 지칭한다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 각각의 성분들은 예를 들어 상표명 Difco™ 및 BBL™의 상용 공급원(commercial source)들로부터 이용가능하다. 비-제한적인 일 예시에서, 수성 영양 배지(aqueous nutrient medium)는 YP 배지와 같이 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이며, 이는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함한다. 추가적으로, 배양물의 숙주 세포는 미국 특허 5,000,000; 5,028,539; 5,424,202; 5,482,846; 5,602,030; WO 2010127318에 설명된 방법들에 따라, 탄소를 효율적으로 동화시키고 탄소원으로서 셀룰로오스 물질(cellulosic material)들을 사용하도록 조작될 수 있다. 또한, 몇몇 구현예들에서, 숙주 세포는 인버르타아제(invertase)를 발현시키도록 조작되어, 수크로오스가 탄소원으로서 사용될 수 있도록 한다.
본 명세서에서 사용되는 바와 같이, "유전적으로 조작된 폴리뉴클레오티드 서열을 발현시키기에 효과적인 조건들 하에서"라는 용어는 숙주 세포가 의도한 ω-하이드록시 지방산 유도체를 생성하게 하는 여하한 조건들을 의미한다. 적합한 조건들은, 예를 들어 발효 조건들을 포함한다.
"재조합 미생물"이라는 용어는, 유전적으로 변형되어 숙주 세포 내의 특정 효소 활성들이 모 세포(parent cell) 또는 원시 숙주 세포(native host cell)에 대해 변경, 추가 및/또는 결실된 숙주 세포를 지칭한다. 유전적으로 변형된 숙주 세포는 재조합 미생물의 일 예시이다. 이와 같이, 재조합 숙주 세포에서 효소와 같은 "단백질의 변형된 또는 변경된 수준의 활성"은 동일한 변형이 없는 모 또는 원시 숙주 세포에 대해 결정된 활성의 하나 이상의 특성의 차이를 지칭한다. 통상적으로, 활성의 차이는 변형된 활성을 갖는 재조합 숙주 세포와, 변형된 활성을 갖지 않는 대응하는 야생형 숙주 세포 사이에서 결정된다(예를 들어, 대응하는 야생형 숙주 세포에 대한 재조합 숙주 세포의 배양물의 비교). 예를 들어, 변형된 활성은 [예를 들어, 단백질을 코딩하는 DNA 서열의 증가 또는 감소된 수의 복제, 단백질을 코딩하는 증가 또는 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가 또는 감소된 양의 단백질 번역(protein translation)의 결과로서] 재조합 숙주 세포에 의해 발현되는 변형된 양의 단백질; 단백질의 구조 변화[예를 들어, 기질 특수성의 변화, 관찰되는 운동 파라미터들(kinetic parameters)의 변화를 유도하는 단백질 코딩 서열에 대한 변화와 같은 일차 구조에 대한 변화); 및 단백질 안정성의 변화(예를 들어, 단백질의 증가 또는 감소된 분해)의 결과일 수 있다. 몇몇 구현예들에서, 폴리펩티드는 본 명세서에 설명된 폴리펩티드 중 어느 하나의 돌연변이체 또는 변이체이다. 특정 경우에서, 본 명세서에 설명된 폴리펩티드들에 대한 코딩 서열은 특정 숙주 세포에서의 발현에 최적화된 코돈(codon)이다. 예를 들어, 대장균의 발현을 위해, 하나 이상의 코돈이 최적화될 수 있다(Grosjean 외(1982) Gene 18:199-209).
통상적으로, 본 명세서에서 사용되는 바와 같은 "조절 서열(regulatory sequences)"이라는 용어는 궁극적으로 단백질의 발현을 조절하는 단백질을 코딩하는 DNA 서열들에 작동가능하게-연결된, DNA의 염기 서열을 지칭한다. 조절 서열의 예시들은 RNA 프로모터 서열, 전사 인자 결합 서열(transcription factor binding sequences), 전사 종결 서열, (인핸서 요소와 같은) 전사의 조절인자(modulators), RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예컨대, 리보솜 결합 부위(예를 들어, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequences) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함한다(이로 제한되지 않음).
"변경된 수준의 발현" 및 "변형된 수준의 발현"이라는 용어는 교환가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드, 대사물질 또는 생성물(예컨대, ω-하이드록시 지방산 유도체)가 동일한 조건들 하에서 대응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다.
본 명세서에서 사용되는 바와 같이, "역가"라는 용어는 숙주 세포 배양물의 단위 부피당 생성된 ω-지방산 유도체의 양(quantity)을 지칭한다. 역가는 특정 ω-지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-지방산 유도체들의 조합을 지칭할 수 있다.
본 명세서에서 사용된 바와 같이, "숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체의 수율"은 투입된 탄소원이 숙주 세포의 생성물(예를 들어, ω-하이드록시 지방산, α,ω-이산 등)로 전환되는 효율을 지칭한다. 수율은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-하이드록시 지방산 유도체들의 조합을 지칭할 수 있다. ω-하이드록시 지방산 유도체들은 ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들과 같은 이작용성 화합물들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들을 포함한다(단, 이로 제한되지 않음).
본 명세서에서 사용되는 바와 같이, "생산성"이라는 용어는 단위 시간당 숙주 세포 배양물의 단위 부피당 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 양을 지칭한다. 생산성은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 지방산 유도체들의 조합을 지칭할 수 있다.
본 명세서에서 사용되는 바와 같이, "글루코오스 이용률"이라는 용어는 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양물에 사용되는 글루코오스의 양을 의미한다.
본 명세서에서 사용되는 바와 같이, "탄소원"이라는 용어는 원핵 또는 단순 진핵 세포 성장을 위한 탄소원으로서 사용되는데 적합한 기질 또는 화합물을 지칭한다. 탄소원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드 및 기체(예를 들어, CO 및 CO2)를 포함하는(단, 이로 제한되지 않음) 다양한 형태로 존재할 수 있다. 예시적인 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스 및 아라비노오스와 같은 단당류; 프럭토-올리고당 및 갈락토-올리고당과 같은 올리고당류; 녹말, 셀룰로오스, 펙틴 및 자일란과 같은 다당류; 수크로오스, 말토오스, 셀로비오스 및 투라노오스(turanose)와 같은 이당류; 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스 및 소듐 카르복시메틸 셀룰로오스와 같은 셀룰로오스 물질 및 변이체들; 숙시네이트, 락테이트 및 아세테이트; 에탄올, 메탄올 및 글리세롤과 같은 알코올류, 또는 이의 혼합물들을 포함한다(단, 이로 제한되지 않음). 또한, 탄소원은 글루코오스와 같은 광합성의 산물일 수 있다. 특정 구현예들에서, 탄소원은 바이오매스이다. 다른 구현예들에서, 탄소원은 글루코오스이다. 다른 구현예들에서, 탄소원은 수크로오스이다.
공급원을 참조하여 또는 단독으로 사용될 때 "재생가능한 공급원료로부터의 탄소원"이라는 용어는 유지화학물질(oleochemicals)[즉, 지방산, 지방산 에스테르, TAG, 하이드록시 지방산 등과 같이 식물 및 동물로부터의 정유(refined oils)] 및 석유화학물질(즉, 알칸, 알켄 등과 같이 석유로부터 유도된 화학물질)을 제외하고 탄소가 유래되는 (재생가능한 공급원료 및/또는 바이오매스 및/또는 노폐물을 포함하는) 여하한의 생물학적 물질을 포함한다. 따라서, 본 명세서에서 사용되는 바와 같은 "재생가능한 공급원료로부터의 탄소원"이라는 용어는 유지화학물질 및 석유화학물질로부터 유래된 탄소를 제외한다. 몇몇 구현예들에서, 탄소원은 당류 또는 탄수화물(예를 들어, 단당류, 이당류 또는 다당류)을 포함한다. 몇몇 구현예들에서, 탄소원은 글루코오스 및/또는 수크로오스이다. 다른 구현예들에서, 탄소원은 옥수수, 사탕수수 또는 목질계 바이오매스로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물; 또는 바이오매스 또는 천연 가스와 같은 유기 재료의 재형성물; 또는 광합성적으로 고정된(fixed photosynthetically) 이산화탄소와 같은 재생가능한 공급원료들로부터 유도된다. 다른 구현예들에서, 바이오매스는 탄소원으로 처리되며, 이는 생물전환에 적합하다. 다른 구현예들에서, 바이오매스는 탄소원으로의 추가적인 처리를 요구하지 않으며, 탄소원으로서 바로 사용될 수 있다. 이러한 바이오매스의 예시적인 탄소원은 스위치그래스와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 탄소원은 동물성 물질[예를 들어, 우분(cow manure)]과 같은 대사 노폐물을 포함한다. 또 다른 예시적인 탄소원은 조류(algae) 및 다른 해양 식물을 포함한다. 또한, (바이오매스를 포함하는) 또 다른 탄소원은 글리세롤/글리세린, 목초, 짚, 목재, 오수, 쓰레기, 마니플 고체 폐기물(maniple solid waste), 셀룰로오스 도시 폐기물 및 음식 쓰레기를 포함하는(단, 이로 제한되지 않음) 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다.
본 명세서에서 사용되는 바와 같이, (ω-하이드록시 지방산 유도체들과 같은) 생성물들에 대하여 "분리된(isolated)"이라는 용어는 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분별된(separated) 생성물들을 지칭한다. 본 명세서에 설명된 방법들에 의해 생성된 ω-하이드록시 지방산 유도체들 및 ω-하이드록시 지방산 유도체 조성물들은 세포질에서뿐만 아니라 발효액에서도 상대적으로 혼합되지 않을 수 있다. 그러므로, ω-하이드록시 지방산 유도체들 및 ω-하이드록시 지방산 유도체 조성물들은 세포내 또는 세포외에서 유기 상(organic phase)으로 수집될 수 있다. 바람직한 일 방법에서, ω-하이드록시 지방산 유도체들 및 ω-하이드록시 지방산 유도체 조성물들은 세포외에서 수집된다.
본 명세서에서 사용되는 바와 같이, "정제한다", "정제된" 또는 "정제"라는 용어는, 예를 들어 분리 또는 분별에 의해 그 환경으로부터 분자의 제거 또는 분리를 의미한다. "실질적으로 정제된" 분자는 연계된 다른 성분들로부터 적어도 약 60 % 유리(예를 들어, 적어도 약 70 % 유리, 적어도 약 75 % 유리, 적어도 약 85 % 유리, 적어도 약 90 % 유리, 적어도 약 95 % 유리, 적어도 약 97 % 유리, 적어도 약 99 % 유리)된다. 본 명세서에서 사용되는 바와 같이, 또한 이러한 용어는 샘플로부터 오염물의 제거를 지칭한다. 예를 들어, 오염물의 제거는 샘플에서의 지방산 유도체의 백분율의 증가를 유도할 수 있다. 예를 들어, ω-하이드록시 지방산 유도체가 재조합 숙주 세포에서 생성될 때, ω-하이드록시 지방산 유도체는 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제 후, 샘플에서의 ω-하이드록시 지방산 유도체의 백분율이 증가된다. "정제한다", "정제된" 및 "정제"라는 용어는 절대 순도를 필요로 하지 않는 상대적인 용어이다. 따라서, 예를 들어 ω-하이드록시 지방산 유도체가 재조합 숙주 세포들에서 생성될 때, 정제된 ω-하이드록시 지방산 유도체는 다른 세포 성분(예를 들어, 핵산, 폴리펩티드, 지질, 탄수화물 또는 다른 탄화수소)로부터 실질적으로 분리되는 ω-하이드록시 지방산 유도체이다.
명세서 및 청구항들을 위해 사용되는 바와 같은 "생체 내에서 ω-하이드록시 지방산 유도체를 생성"이라는 용어는 탄수화물 등과 같은 재생가능한 공급원료로부터 생육가능한(viable) 및/또는 유전적으로 변형된 숙주 세포들에서 ω-하이드록시 지방산 유도체를 생성함을 의미하며, 재생가능한 공급원료는 탄소원으로서 발효액에 추가되어, 발효 시 숙주 세포들이 탄소원을 흡수하고(take up) 대사시킬 수 있게 한다. 이는 ω-하이드록시 지방산 유도체들이 시험관 내에서 생성되는 방법들과 상이하고, 정제된 효소들 또는 세포 용해물들이 사용되며, 효소 전환을 위한 직접적 기질, 예를 들어 지방산 또는 지방산 유도체가 정제된 효소에 또는 세포 용해물 용액에 첨가된다. 또한, 이는 ω-하이드록시 지방산 유도체들이 생물형질전환(biotransformation)들로 생성되는 방법들과 상이하고, 휴지 세포(resting cell)들이 사용되며, 효소 전환을 위한 직접적 기질, 예를 들어 지방산 또는 지방산 유도체가 휴지 세포들에 외인성으로 첨가된다.
경로 조작 및 효소 활성
지방산 합성은 박테리아 생합성 기구의 대부분 보존된 시스템들 중 하나이다. 지방산 합성(FAS) 다중-효소 복합체가 모든 박테리아 및 진핵생물에 존재한다. FAS 관련 유전자들의 대부분은 세포 성장 및 생존에 필수적이다. 진핵생물 및 박테리아 FAS는 본질적으로 동일한 타입의 생화학적 형질전환을 구현한다. 진핵생물에서, FAS는 FAS I로 지칭되고, 그 촉매 도메인들의 대부분은 하나의 폴리펩티드 사슬(비-해리성)에 의해 코딩된다. 박테리아와 같은 원핵생물에서, FAS는 FAS II로 지칭되고, 그 개개의 촉매들 및 운반 단백질들은 별개의(해리성) 단백질들을 코딩하는 별도의 유전자들에 의해 코딩된다. 이와 같이, FAS II는 상당한 변동 및 뚜렷한 특이성을 갖는 복합계(complex system)이다.
FAS 경로에서 효소들과 함께 아실기 운반 단백질(ACP)이 원래의(native) 유기체에서 생성된 지방산들의 길이, 포화도 및 분지를 조절한다. 이 경로에서의 단계들이 아세틸-CoA 카르복실라아제(ACC) 유전자 계열들 및 지방산 생합성(FAB)의 효소들에 의해 촉매화된다. 예를 들어, FAS 경로에 포함될 수 있는 효소들은 AccABCD, FabD, FabH, FabG, FabA, FabZ, FabI, FabK, FabL, FabM, FabB 및 FabF를 포함한다. 의도한 생성물에 따라, 이러한 유전자들 중 하나 이상이 감쇠되거나 과발현될 수 있다. 이와 같이, 원핵생물은 글루코오스 또는 다른 탄소원들과 같은 재생가능한 공급원료로부터 지방산 유도체들의 생성을 증가시키도록 조작되었다. 여기서, 주요 목표는, 박테리아 균주를, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 및 지방족 알코올(FALC)를 포함하는 지방산 유도체 생성을 위한 미생물 공장(microbial factory)으로 전환시키기 위해, 지방산 유도체들의 생성을 조절하는 핵심 조절 효소들의 활성을 증가시키는 것이다(예를 들어, 본 명세서에 인용 참조되는 미국 특허 8,283,143 참조).
본 발명은 ω-하이드록시 지방산 유도체들과 같은 바람직한 화합물의 생성을 위한 효소 경로들을 변형시키기 위해 효소 기능(enzymatic function)의 폴리펩티드들을 코딩하는 폴리뉴클레오티드들을 식별한다. 본 명세서에서 효소 수탁 번호(EC 번호)에 의해 식별되는 이러한 폴리펩티드들은 ω-하이드록시 지방산 유도체들과 같은 이작용성 분자들의 생성을 유도하는 지방산 경로들을 조작하는데 유용하다. 도 1 내지 도 4는 이러한 화합물들을 생성하도록 조작된 경로들을 도시한다. 도 5는 나일론과 같은 중합체들 및 락탐들을 유도하는 경로를 도시한다.
일 구현예에서, ω-하이드록시 지방산 유도체들을 생성하기 위해 글루코오스와 같은 재생가능한 공급원료를 이용하는 경로들이 도 1 내지 도 4에 도시된다. 글루코오스는 원래의 유기체에 의해 아실-ACP로 전환된다(도 내지 도 4의 단계 1 참조). 지방산 분해 효소 활성을 갖는 폴리펩티드들을 코딩하는 폴리뉴클레오티드들은 의도한 생성물에 따라 선택적으로 감쇠될 수 있다(아래의 예시들을 참조). 이러한 폴리펩티드들의 비-제한적인 예시들은 아실-CoA 신테타아제(FadD) 및 아실-CoA 디하이드로게나아제(FadE)이다. 표 1은 해당 기술 분야에 알려진 방법들에 따라 선택적으로 감쇠될 수 있는 다양한 지방산 분해 효소들을 포함하는, 대사 경로 내의 효소 활성의 포괄적인 목록(아래 참조)을 제공한다(예를 들어, 위의 미국 특허 8,283,143 참조).
예를 들어, FadR(아래의 표 1 참조)은 지방산 분해 및 지방산 생합성 경로들에 관련된 핵심 조절 인자이다(Cronan 외, Mol. Microbiol., 29(4):937-943(1998)). 대장균 효소 FadD(아래의 표 1 참조) 및 지방산 수송 단백질 FadL은 지방산 흡수 시스템의 구성요소들이다. FadL는 지방산의 박테리아 세포로의 수송을 매개(mediate)하고, FadD는 아실-CoA 에스테르의 형성을 매개한다. 다른 탄소 공급원이 이용가능하지 않을 때, 외인성 지방산이 박테리아에 의해 흡수되고, 아실-CoA 에스테르로 전환되며, 이는 전사 인자 FadR에 결합할 수 있고, 지방산 수송(FadL), 활성화(FadD) 및 β-산화(FadA, FadB 및 FadE)를 담당하는 단백질들을 코딩하는 fad 유전자들의 발현을 저하(depress)시킬 수 있다. 대안적인 탄소원들이 이용가능할 때, 박테리아는 아실-ACP로서 지방산을 합성하며, 이는 β-산화에 대한 기질이 아니라, 인지질 합성에 사용된다. 따라서, 아실-CoA 및 아실-ACP 둘 모두는 상이한 최종 생성물을 유도할 수 있는 지방산들의 독립적인 공급원들이다(Caviglia 외, J. Biol . Chem ., 279(12):1163-1169(2004)).
표 1: 효소 활성
표 2A: ω-
하이드록실라아제
/ω-옥시게나아제(EC 1.14.15.3)의 예시들
표 2B: ω-
하이드록실라아제
/ω-옥시게나아제(EC 1.14.15.3)의 산화환원 파트너(Redox Partner)들의 예시들
표 2C: 자족적 ω-1, ω-2, ω-3-
하이드록실라아제
/
옥시게나아제
(EC 1.14.15.3) 융합 단백질들의 예시들
표 2D: 자족적 클래스-I P450-융합
PFOR
융합 단백질들의 예시들
표 3A: 알코올
디하이드로게나아제
(EC 1.1.1.1/2) 또는 알코올 옥시다아제(EC 1.1.3.13, EC 1.1.3.20)의 예시들
표 3B: 알데히드
디하이드로게나아제
(EC 1.2.1.3/4/5/) 또는 알데히드 옥시다아제(EC 1.2.3.1)의 예시들
표 4: 아미노
트랜스퍼라아제
/트랜스아미나아제(EC 2.6.1) 및
아민
디하이드로게나아제
(EC 1.4.9, EC 1.4.98, EC 1.4.
99)의
예시들
표 5: 에스테라아제(EC 3.1.1.1) 및 리파아제(EC 3.1.1.3)의 예시들
표 6:
하이드로라아제(EC 3.5.2.12)의
예시들
표 7: 아실-
CoA
신타아제
/아실-
CoA
리가아제(EC 6.2.1.3)/
트랜스퍼라아제(EC 2.8.3.6)의
예시들
표 8: 아미드
신타아제의
예시들
표 9: 에스테르
신타아제(EC 2.3.1.75 또는
EC 2.3.1.20)의 예시들
도 1 및 도 2는, 전구체 중간체(도 1 참조)로서 C12 유리 지방산(FFA)을 이용하거나 중간체(도 2a 및 도 2b 참조)로서 C12 지방산 메틸 에스테르(FAME)를 이용하는, 2 개의 유사한 경로들을 통해 아실-ACP가 α,ω-이산으로 전환될 수 있는 경로들을 각각 나타낸다.
일 구현예에서, 도 1은 ω-하이드록시 지방산들, ω-옥소 지방산들, α,ω-이산들 및 ω-아미노 지방산들을 포함하는 다양한 화학적 화합물들의 생성을 나타낸다. 도 1의 단계 2에서, 티오에스테라아제는 아실-ACP를 FFA로 전환시키는데 이용된다. 특정 구현예들에서, 티오에스테라아제를 코딩하는 유전자는 tesA, 'tesA, tesB, fatB1, fatB2, fatB3, fatA1 또는 fatA이다(또한, 이 단계를 촉매화하는데 사용될 수 있는 티오에스테라아제의 효소 활성을 갖는 폴리펩티드들을 나타내는 위의 표 1 참조). 또한, 단계 3에서, ω-옥시게나아제라고도 칭해지는 ω-하이드록실라아제가 ω-하이드록시 지방산들을 생성하는데 사용된다. 도 1에서 알 수 있는 바와 같이, 지방산의 오메가 위치는 하이드록시이다.
재조합 숙주 세포들에서 발현되는
CYP153A
-
리덕타아제
혼성 융합 폴리펩티드들
적절한 ω-하이드록실라아제/ω-옥시게나아제(EC 1.14.15.3) 및 이들의 산화환원 파트너의 예시들이 표 2A 및 2B에 목록화되어 있다(위 참조). 이들은 특정 비-헴 이철 옥시게나아제(non-heme di-iron oxygenase)[예를 들어, 슈도모나스 퓨 티다(Pseudomonas putida) GPol으로부터의 alkB], 또는 시토크롬 P450들으로도 알려진 특정 헴-타입 P450 옥시게나아제들[예를 들어, 마리노박터 아쿠애올레 이(Marinobacter aquaeolei)로부터의 cypl53A]이 존재한다. 시토크롬 P450들은 편재하여 분포된 효소들이며, 이는 높은 복잡성을 갖고, 광범위한 활성 분야를 나타낸다. 이들은 광범위하고 다양한 기질들을 전환시키고 다양한 화학적 반응들을 촉매화하는 유전자들의 상과(superfamily)에 의해 코딩되는 단백질들이다. Cyp153A는 ω-위치에 대해 높은 선택성을 갖는 탄화수소 사슬들을 수산화하는 가용성 박테리아 시토크롬 P450들의 아과(sub-family)이다(van Beilen 외(2006) Appl . Environ. Microbiol. 72:59-65). cyp153A 계열의 요소들은, 알칸, 지방산 또는 지방족 알코올, 예를 들어 미 코박테리움 종(Mycobacterium sp.) HXN-1500으로부터의 cyp153A6(Funhoff 외(2006) J. Bacteriol . 188:5220-5227), 미코박테리움 마리눔(Mycobacterium marinum)으로부터의 cyp153A16 그리고 폴라로모나스 종(Polaromonas sp.) JS666으로부터의 cyp153A(Scheps 외(2011) Org . Biomol . Chem. 9:6727-6733), 그리고 마리노박터 아쿠애올레이로부터의 cyp153A(Honda-Malca 외(2012) Chem . Commun. 48:5115-5117)의 ω-위치를 선택적으로 수산화하기 위해, 시험관 내에서(in vitro) 나타내어졌다.
모든 시토크롬 P450들과 마찬가지로, Cyp153A ω-하이드록실라아제들은 그들의 촉매 활성을 위해 전자들을 필요로 하며, 이들은 페레독신 및 페레독신 리덕타아제와 같은 특이적 산화환원 단백질들을 통해 제공된다. 이들은 cyp153A와 상호작용하는 별개의 단백질들이다. 자족적 혼성 [키메라(chimeric)] cyp153A 옥시게나아제(즉, 활성을 위해 페레독신 및 페레독신 리덕타아제 단백질들을 요구하지 않는 옥시게나아제)가, 플라빈 모노뉴클레오티드(FMN) 및 NADPH-결합 부위 및 [2FeS] 페레독신 중심(Hunter 외(2005) FEBS Lett. 579:2215-2220)을 포함하는 P450RhF로부터의 리덕타아제 도메인과 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis) SK2로부터의 cyp153A(Kubota 외(2005) Biosci . Biotechnol . Biochem . 69:2421-2430; Fujita 외(2009) Biosci . Biotechnol . Biochem. 73: 1825-1830)를 융합시킴으로써 이전에 생성되었다. P450RhF는 클래스-I P450-융합 PFOR(DeMot and Parret (2003) Trends Microbiol. 10: 502)에 속한다. 이 혼성 cyp153A-RedRhF 융합 단백질은 ω-위치의 옥탄을 수산화하고 또한 사이클로헥산 또는 부틸벤젠과 같은 다른 화합물들을 수산화하기 위해 시험관 내 생물형질전환으로 나타내어졌다. 천연 P450-리덕타아제 융합 단백질들의 예시들이 표 2C 및 2D에 나타나 있다(위 참조).
탄화수소 사슬들의 ω-위치를 향한 그들의 높은 선택성을 고려한다면, cyp153A 계열 옥시게나아제들은 재생가능한 탄소원으로부터 α,ω-이작용성 지방산 유도체들을 생성하는데 적합한 후보들의 좋은 예시들인 것으로 나타났다. 이는 상업적으로 실현가능한 공정들의 개발이 이러한 귀중한 화합물들을 생성하게 할 것이다. 그럼에도, 다른 시토크롬 P450들과 마찬가지로, cyp153A 계열 단백질들은 정제된 효소들 또는 원 세포 용해물(crude cell lysate)들을 갖는 시험관 내 실험들에 또는 지방산 유도체들 또는 탄화수소들이 외인성으로 추가되는 휴지 세포 생물형질전환들에 지금까지 대부분 적용되었다(Kubota 외, Fujita 외, Honda-Malca 외, 위 참조). 하지만, 혼성 융합-이용 시험관 내 절차들 또는 휴지 세포 생물형질전환들은 ω-하이드록시 지방산 유도체들의 대규모의 비용-효율적인 생성에 좋지 않다. 해당 기술 분야에 널리 수용되어 있는 지식은 다수의 시토크롬 P450 그리고 alkB-타입 ω-하이드록실라아제가 재조합 미생물들에서 기능적으로 발현시키기 쉽지 않다는 점이며, 이는 효소들이 흔히 비활성이고, 그들의 화학작용을 명확히 밝히기가 어려웠기 때문이다. 실제로, 지금까지 시도된 지방산-유도체들 이외의 재생가능한 탄소원을 이용한 생체 내 작용만이 alkB ω-하이드록실라아제를 이용하였고, 높은 세포 밀도 발효에서만 ω-하이드록시 지방산 유도체들의 낮은 역가를 달성했다(WO2013/024114A2).
본 출원인들은 재생가능한 탄소원으로부터 생체 내에서 ω-하이드록시 지방산 유도체들을 효율적으로 생성할 수 있는 CYP153A-리덕타아제 혼성 융합 단백질들 및 이의 변이체들을 생성하였다. 더 구체적으로, CYP153A(G307A) P450 촉매 도메인의 혼성 융합 단백질을 코딩하는 마리노박터 아쿠애올레이로부터의 유전자 - 이때, 글리신(G)은 307 위치에서 알라닌(A)으로 치환됨 - 는 로도코쿠스 종(Rhodococcus sp.) NCIMB9784(아래의 실시예 6 참조)로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 리덕타아제 도메인을 코딩하는 유전자와 융합되었다. 결과적인 폴리펩티드는 대응하는 핵산 서열(SEQ ID NO: 5)을 갖는 CYP153A-RedRhF 혼성 융합 폴리펩티드(SEQ ID NO: 6)이다. 이 CYP153A-리덕타아제 혼성 융합 단백질이 글루코오스와 같은 탄소원을 갖는 대장균 세포들에서 발현되었을 때, 지방산 유도체들이 ω-하이드록시 지방산 유도체들(아래의 예시들 참조)로 효율적으로 전환되었다. 유사한 CYP153A-리덕타아제 혼성 융합 폴리펩티드들을 생성하는데 사용될 수 있는 적합한 ω-하이드록실라아제들(EC 1.14.15.3) 및 이들의 산화환원 파트너들에 대한 다른 예시들이 표 2A 및 표 2B(위 참조)에 목록화되어 있다.
본 발명은 생체 내에서 α,ω-이작용성 지방산 유도체들을 포함하는 ω-하이드록시 지방산 유도체들을 효율적으로 그리고 선택적으로 생성할 수 있는 미생물들을 제공한다. 일 구현예에서, CYP153A-RedRhF 혼성 융합 단백질은 미생물에서 발현되도록 조작되었으며, 이는 도데칸산 또는 도데칸산 메틸 에스테르와 같은 화합물들을, 글루코오스와 같은 탄소원으로부터 생체 내에서 12-하이드록시 도데칸산 또는 12-하이드록시 도데칸산 메틸 에스테르로 효율적으로 전환시킬 수 있다. 글루코오스 대신 여하한의 재생가능한 공급원료가 탄소원으로서 사용될 수 있다. 따라서, 처음으로, 혼성 융합 단백질이 숙주 세포(예를 들어, 대장균)에서 티오에스테라아제로 공동발현되고(co-expressed), 재생가능한 공급원료로부터 탄소원을 공급할 때, P450 효소 활성을 갖는 조작된 혼성 융합 단백질(즉, CYP153A-RedRhF 혼성 융합 단백질을 통해 예시됨)이 생체 내에서 지방산들을 바람직한 특정 ω-수산화 화합물들(예를 들어, ω-하이드록시 지방산들; ω-하이드록시 지방산 메틸 에스테르들; α,ω-하이드록시 이산들; α,ω-하이드록시 디에스테르들; 및 α,ω-디올들)로 효율적으로 전환시킬 수 있음이 나타내어졌다(실시예 6 그리고 도 25 및 도 26 참조). 본 발명에 따라, cyp153A 단백질을 코딩하는 유전자와 같은 P450 유전자를, 예를 들어 클래스-I P450-융합 PFOR 단백질의 c-말단 리덕타아제 도메인 또는 다른 리덕타아제 도메인을 코딩하는 리덕타아제 유전자에 연결시킴으로써, 다른 혼성 융합 단백질들이 조작될 수 있다. 표 2A 및 2D(위 참조)는 각각 cyp153A 및 클래스-I P450-융합 PFOR 단백질들에 대한 예시를 제공한다. 이러한 지침에 따라, 유사한 융합 단백질들이 다른 타입의 ω-하이드록실라아제/ω-옥시게나아제로부터 생성될 수 있다.
ω-하이드록시 지방산 메틸 에스테르를 통한 도 2a에 도시된 바와 같은 α,ω-이산들 또는 ω-아미노 지방산들에 대한 루트(route), 또는 α,ω-지방산 디메틸 에스테르를 통한 도 2b에 도시된 바와 같은 α,ω-이산들에 대한 루트가 유익할 수 있는데, 이는 대규모 생산 및 회수(recovery)에 대한 장점들을 제공하는 메틸 에스테르가 하전(charge)되지 않기 때문이다. 또한, ω-하이드록시 지방산 메틸 에스테르를 통한 루트는 특정 하이드로라아제들에 의한 촉매화를 통한 직접적 효소 락탐화(enzymatic lactamization)를 허용한다. 또한, 도 1 또는 도 2a 및 도 2b의 단계 3에서, 알코올 디하이드로게나아제 또는 옥시다아제는 ω-하이드록시 지방산을 ω-옥소 지방산으로 전환시킬 수 있다(예를 들어, 위의 표 3A는 이 단계를 촉매화하는데 사용될 수 있는 알코올 디하이드로게나아제 또는 옥시다아제의 효소 활성을 갖는 폴리펩티드들을 나타낸다). 예를 들어, 12-하이드록시 도데칸산 또는 12-하이드록시 도데칸산 메틸 에스테르를 12-옥소 도데칸산 또는 12-옥소 도데칸산 메틸 에스테르로 산화시킬 수 있는 적절한 효소들은 알코올 옥시다아제들[플라빈단백질(flavoprotein), 예를 들어 슈도모나스 퓨티다(EC 1.1.3.13, EC 1.1.3.20)로부터의 alkJ(SEQ ID NO: 67 참조)] 또는 NAD(P)-의존성 알코올 디하이드로게나아제들[예를 들어, 로도코쿠스 루버(Rhodococcus ruber)(EC 1.1.1.1)로부터의 cddC(위의 표 3A 참조)]이다. 이 점에서, 경로는 여기서부터 2 개의 상이한 대안적인 경로들을 따를 수 있으며, 다시 말해 ω-옥소 지방산을, 알데히드 디하이드로게나아제 또는 옥시다아제를 통해, α,ω-이산으로 전환시킬 수 있거나(예를 들어, 위의 표 3B는 이 단계를 촉매화하는데 사용될 수 있는 알데히드 디하이드로게나아제 또는 옥시다아제의 효소 활성을 갖는 폴리펩티드들을 나타냄), ω-옥소 지방산을, 아미노트랜스퍼라아제 또는 트랜스아미나아제 또는 아미노산 디하이드로게나아제를 통해, ω-아미노 지방산으로 전환시킬 수 있다(예를 들어, 위의 표 4는 이 단계를 촉매화하는데 사용될 수 있는 아미노트랜스퍼라아제 또는 트랜스아미나아제 또는 아미노산 디하이드로게나아제의 효소 활성을 갖는 폴리펩티드들을 나타냄). 예를 들어, 12-옥소 라우르산 또는 12-옥소 라우르산 메틸 에스테르를 12-아미노 라우르산 또는 12-아미노 메틸 에스테르로 전환시키기에 적절한 트랜스아미나아제들이 표 4(위 참조)에 도시되어 있다. 이러한 효소들은 대응하는 말단 아민을 생성하기 위해 적절한 공여체로부터의 아민기를 ω-옥소산 또는 에스테르로 전달한다. 아민 공여체들(예를 들어, 알라닌 또는 글루탐산)의 가용성(availability)은 각각의 아미노산 디하이드로게나아제(예를 들어, 알라닌 디하이드로게나아제, 글루타메이트 디하이드로게나아제, 위의 표 4 참조)의 공동발현을 통해 생체 내에서 개선될 수 있다. 또한, NADPH 대신 NADH를 이용할 수 있는 글루타메이트 디하이드로게나아제의 동족체 또는 다른 변이체들의 과발현은 생성에 추가적인 개선들을 제공할 수 있다. 또한, 12-옥소 라우르산 또는 12-옥소 라우르산 메틸 에스테르를 12-아미노 라우르산 또는 12-아미노 메틸 에스테르로 전환시키기에 적절한, 메틸아민 디하이드로게나아제 또는 리신 6-디하이드로게나아제와 같은 효소들의 다른 부류들의 예시들이 표 4에 목록화되어 있다.
또 다른 구현예에서, 도 2a 및 도 2b는 중간체들로서 메틸 에스테르들을 통해 α,ω-이산들 및 ω-아미노 지방산들을 포함하는 다양한 화학적 화합물들의 생성을 나타낸다. 도 2b의 단계 6은 (아실-CoA 리가아제/트랜스퍼라아제를 이용하는) α,ω-디에스테르들의 생성을 나타낸다. 도 2a 및 도 2b의 단계 2에서, 아실-ACP를 지방산 메틸 에스테르(FAME)로 전환시키기 위해 에스테르 신타아제가 이용된다. 특정 구현예들에서, 에스테르 신타아제를 코딩하는 유전자는 효소 분류 EC 2.3.1.75 또는 EC 2.3.1.20의 효소를 코딩하는 유전자이며, 이는 호호바(Simmondsia chinensis), 아시네토박터 종(Acinetobacter sp .) ADP1, 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis), 슈도모나스에루지노사(Pseudomonas aeruginosa), 펀디박터 자덴시스(Fundibacter jadensis), 애기장대(Arabidopsis thaliana) 또는 알칼리제네스 유트로푸스(Alkaligenes eutrophus)로부터 왁스/dgat, 이작용성 에스테르 신타아제/아실-CoA:디아실글리세를 아실트랜스퍼라아제를 코딩하거나, 이는 AtfA1, AtfA2, ES9, 또는 ES8, 또는 이의 변이체를 코딩한다(또한, 이 단계를 촉매화하는데 사용될 수 있는 에스테르 신타아제의 효소 활성을 갖는 폴리펩티드들을 나타내는 위의 표 9를 참조). 단계 3에서, ω-하이드록시 지방산 메틸 에스테르들을 생성하기 위해 ω-하이드록실라아제(또는 ω-옥시게나아제)가 사용된다(예를 들어, 위의 표 2A는 이 단계를 촉매화하는데 사용될 수 있는 효소 활성을 갖는 폴리펩티드들을 나타낸다). 도 2a에서 알 수 있는 바와 같이, 지방산 메틸 에스테르의 오메가 위치는 하이드록시이다. 또한, 도 2a의 단계 3에서, 알코올 디하이드로게나아제 또는 옥시다아제가 ω-하이드록시 지방산 메틸 에스테르를 ω-옥소 지방산 메틸 에스테르로 전환시킬 수 있다(예를 들어, 위의 표 3A는 이 단계를 촉매화하는데 사용될 수 있는 알코올 디하이드로게나아제 또는 옥시다아제의 효소 활성을 갖는 폴리펩티드들을 나타낸다). 유사하게, 경로는 여기서부터 2 개의 상이한 대안적인 경로들을 따를 수 있으며, 다시 말해 일 경로는 ω-옥소 지방산 메틸 에스테르를, 알데히드 디하이드로게나아제 또는 옥시다아제(위의 표 3B 참조) 그리고 최종적으로 에스테라아제 또는 리파아제(위의 표 5 참조)를 통해, 또는 화학적 전환에 의해, α,ω-이산으로 전환시키는 한편; 또 다른 경로는 ω-옥소 지방산 메틸 에스테르를, 아미노트랜스퍼라아제 또는 트랜스아미나아제 또는 아미노산 디하이드로게나아제(위의 표 4 참조) 그리고 최종적으로 에스테라아제 또는 리파아제(위의 표 5 참조)를 통해, ω-아미노 지방산으로 전환시킨다. 최종 단계(즉, 에스테라아제 또는 리파아제가 α,ω-지방산 메틸 에스테르 또는 ω-아미노 지방산 메틸 에스테르의 나타낸 바와 같은 최종 생성물로의 전환을 촉매화함)는 효소적 및 화학적 전환 단계의 결과일 수 있다. 예를 들어, 이 단계를 가수분해할 수 있는 적합한 효소들이 표 5에 목록화되어 있다. 선택된 리파아제(EC 3.1.1.3) 또는 에스테라아제(EC 3.1.1.1)는 주변세포질(periplasm)에 위치되거나 상청액(supernatant)으로 분비된다. 적합한 분비 신호들 또는 고정 서열(anchoring sequence)들이 해당 기술 분야에 알려진 방법들에 따라 조작될 수 있다. 또 다른 구현예에서, 도 2b는 α,ω-지방산 디메틸 에스테르를 통한 α,ω-이산들의 생성을 나타낸다. 이 경로는 도 2a의 좌측 분지와 유사하지만, 이는 추가적인 아실-CoA 신타아제/아실-CoA 리가아제 또는 트랜스퍼라아제를 이용한다(적합한 후보들에 대한 위의 표 7 참조). 또한, 제 1 단계를 촉매화하는 에스테르 신타아제/아실트랜스퍼라아제가 페널티메이트 단계(penultimate step)를 촉매화할 수 있다.
또 다른 구현예에서, 세포에 생성되는 지방족 알코올(FALC)로부터 α,ω-디올들을 생성하기 위해 재생가능한 공급원료(예를 들어, 글루코오스)로부터 탄소원을 이용할 수 있는 경로들이 도 3 및 도 4에 도시된다. 일 구현예에서, 도 3은 티오에스테라아제 및 카르복실산 리덕타아제 활성을 이용함으로써 α,ω-디올들이 만들어지는 경로를 예시한다(이러한 단계들을 촉매화할 수 있는 폴리펩티드들에 대한 위의 표 1을 참조). 여기서, 티오에스테라아제는 단계 2에서 아실-ACP를 유리 지방산(FFA)으로 전환시킬 수 있다. 카르복실산 리덕타아제는 단계 3에서 결과적인 FFA를 지방족 알데히드로 전환시킬 수 있다. 단계 4에서, 알코올 디하이드로게나아제(위의 표 1 참조)는 지방족 알데히드를 지방족 알코올(FALC)로 전환시킬 수 있다. 마지막으로, 단계 5에서, ω-하이드록실라아제 또는 ω-옥시게나아제(위의 표 2A 참조)가 FALC를 α,ω-디올로 전환시킬 수 있다. 대안적으로, 아실-ACP가 도 4에 예시된 바와 같은 아실-ACP 리덕타아제에 의해 지방족 알데히드로 바로 전환될 수 있다. (위의 표 1은 이러한 단계들을 촉매화하기 위해 티오에스테라아제, 카르복실산 리덕타아제, 아실-ACP 리덕타아제 또는 알코올 디하이드로게나아제의 효소 활성을 갖는 폴리펩티드들을 나타낸다.)
또 다른 구현예에서, 중합체들로 화학적으로 전환될 수 있는 락탐을 생성하는 경로가 도시된다. 이는 아실-CoA-트랜스퍼라아제(위의 표 7 참조) 및 아미드 신타아제(위의 표 8 참조)를 통해 락탐으로 전환될 수 있는 12-아미노 라우르산과 같은 ω-아미노 지방산의 예시를 통해 도 5에 예시된다. 이 특정한 예시에서, 결과적인 락탐은 12-아미노도데카노락탐 또는 라우로락탐이다. 이의 유도된 중합체의 일 예시는 도 5에 도시된 바와 같은 나일론 12이다. 12-아미노 라우르산 메틸 에스테르를 대응하는 락탐으로 직접 락탐화하는 적절한 효소들은 라우로락탐의 직접적인 생성에 대해 동일한 생체촉매의 다른 효소들과 조합하여 사용될 수 있거나; 12-아미노 라우르산 메틸 에스테르의 별도의 생물형질전환으로 사용될 수 있는 특정 하이드로라아제들(위의 표 6 참조)이다. 또한, 리파아제 또는 에스테라아제(위의 표 5 참조)가 12-아미노 라우르산 메틸 에스테르를 대응하는 락탐으로 직접 락탐화할 수 있다.
본 발명은 재조합 숙주 세포들 및 생성 방법들에 유용한 효소 활성을 갖는 폴리펩티드들을 코딩하는 폴리뉴클레오티드들을 식별한다. 효소 활성을 갖는 폴리펩티드들은 화합물들을 포함하는 조성물들의 생성에 기여한다. 일반적으로는 이러한 폴리뉴클레오티드들에 대한 절대적 서열 동일성이 필수적인 것이 아님이 이해될 것이다. 예를 들어, 특정 폴리뉴클레오티드(예를 들어, 효소 기능을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드) 서열의 변화들이 이루어질 수 있으며, 코딩된 폴리펩티드가 활성에 대해 스크리닝될(screened) 수 있다. 이러한 변화들은 통상적으로 보존적 돌연변이들 및 잠재적 돌연변이들(예를 들어, 코돈 최적화)을 포함한다. 유전적으로 조작된 또는 변형된 폴리뉴클레오티드들 및 코딩된 변이 폴리펩티드들은, 해당 기술분야에 알려진 방법들을 이용하여, 증가된 촉매 활성, 증가된 안정성 또는 감소된 억제(예를 들어, 감소된 피드백 억제)를 포함하는(단, 이로 제한되지 않음) 의도한 기능에 대해 스크리닝될 수 있다.
또한, 본 발명은 효소 분류(Enzyme Classification: EC) 번호에 따라 본 명세서에 설명된 바와 같은 ω-수산화 지방산 유도체 생성(위 참조)에 관련된 조작된 경로들의 다양한 단계들(즉, 반응들)에 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 예시적인 폴리펩티드들(효소들) 및 이러한 폴리펩티드들을 코딩하는 예시적인 폴리뉴클레오티드들을 제공한다. 수탁 번호들 및/또는 서열 식별 번호(Sequence Identifier Number: SEQ ID NO)들에 의해 본 명세서에서 식별되는 이러한 예시적인 폴리펩티드들 및 폴리뉴클레오티드들은 본 명세서에 설명된 유전적으로 변형된 숙주 세포들을 얻기 위해 모 숙주 세포들의 α,ω-이산과 같은 다른 이작용성 분자들을 포함하는 ω-하이드록시 지방산 유도체들의 생성을 유도하는 지방산 경로들을 조작하는데 유용하다. 본 명세서에 설명된 폴리펩티드들 및 폴리뉴클레오티드들은 예시적이며 비-제한적이다. 본 명세서에 설명된 예시적인 폴리펩티드들의 상동의 서열들은, 다양한 데이터베이스들[예를 들어, 미국 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소(Swiss Institute of Bioinformatics)에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 기술대학(Technical University of Braunschweig)에 의해 제공되는 BRENDA 데이터베이스, 및 교토대 및 동경대의 생물정보학 센터(Bioinformatics Center of Kyoto University and University of Tokyo)에 의해 제공되는 KEGG 데이터베이스, 이 모두는 월드 와이드 웹에서 이용가능함]을 통해 해당 기술분야의 당업자들이 이용가능하다.
일 구현예에서, 본 명세서에 설명된 바와 같은 재조합 미생물들(위 참조)은 짝수 탄소 사슬을 갖는 ω-하이드록시 지방산 유도체들을 생성한다. 또 다른 구현예에서, 재조합 미생물들은 홀수 탄소 사슬을 갖는 ω-하이드록시 지방산 유도체들을 생성하도록 조작될 수 있다. 예를 들어, ω-하이드록실라아제 경로들은 홀수-사슬 지방산 유도체들을 과잉생성(overproduce)하는 재조합 세포들(예를 들어, 대장균)에서 발현될 수 있다(특정 박테리아 균주들을 통한 홀수-사슬 지방산 유도체들의 과잉생성은 미국 특허 공개공보 US2012/0070868호에 개시되어 있으며, 본 명세서에서 인용 참조된다). 이는 홀수-사슬 ω-수산화 지방산 유도체들의 생성을 허용한다. 일 구현예에서, ω-하이드록실라아제(예를 들어, CYP153A-RedRhF 혼성 융합 단백질) 및 oleT(예를 들어, Rude 외(2011) Appl . Environ. Microbiol. 77: 1718 참조)와 같은 지방산 디카르복실라아제의 발현과 조합될 때 홀수-사슬 지방산을 과잉생성하는 재조합 균주는, 예를 들어, 9-데센-1-올, 11-도데센-1-올, 13-테트라데센-1-올 및 15-헥사데센-1-올과 같은 말단 이중 결합을 갖는 짝수-사슬 지방족 알코올들을 생성한다.
또 다른 구현예에서, 아말단 수산화 지방산 유도체들이 제공된다. 이들은 오메가-1 위치 및/또는 오메가-2 위치 및/또는 오메가-3 위치 및/또는 오메가-4 위치 등(예를 들어, ω-1, ω-2 및/또는 ω-3; 등)에서 적어도 하나의 OH 기를 갖는 화합물들이다. 실시예 8 및 9는 cyp102A 계열(Whitehouse 외(2012) Chem . Soc . Rev. 41: 1218)로부터 시토크롬 P450 옥시게나아제들을 이용함으로써 유전적으로 변형된 숙주 세포들에서의 이러한 화합물들의 생성을 나타낸다. cyp102A 계열의 시토크롬 P450 옥시게나아제들은 아말단 수산화 지방산 유도체들을 생성하기에 적합하다. 하지만, 이러한 효소들은, ω-위치에서 지방산 유도체들을 우세하게 수산화하도록 그들의 기질 특수성이 변경되지 않는 한 - 이는 지금까지 부분적으로만 성공적이었음(Lentz 외(2006) ChemBioChem. 7: 345) -, 재조합 숙주들에서 ω-수산화 지방산 유도체들을 효율적으로 생성하기에 적합하지 않다.
재조합 숙주 세포들에서 발현된
CYP153A
-
리덕타아제
혼성 융합 폴리펩티드 변이체들
본 발명은 재조합 숙주 세포들에서 발현될 때 ω-수산화 지방산 유도체 조성물들의 높은 역가, 수율 및/또는 생산성을 유도하는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들을 식별한다. 본 발명의 비-제한적인 예시들에서, CYP153A(G307A)-RedRhF 혼성 융합 폴리펩티드(아래의 실시예 6 참조)는 증가된 양의 ω-OH 지방산들 및 ω-OH 지방산 유도체들을 생성하기 위해 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들(아래의 실시예들 14 내지 10 참조)을 효율적으로 조작하는 주형(template)으로서 사용되었다. 예를 들어, 숙주 세포에서 발현될 때 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 도데칸산과 같은 화합물들을, 글루코오스와 같은 단순한 탄소원으로부터 생체 내에서 12-하이드록시 도데칸산으로 효율적으로 전환시킬 수 있다. (부연하면, 조작된 CYP153A-RedRhF 혼성 융합 폴리펩티드 변이체를 통해 예시된) 조작된 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는, 재생가능한 공급원료로부터 탄소원(예를 들어, 글루코오스)을 이용함으로써 숙주 세포(예를 들어, 대장균)에서 티오에스테라아제로 공동발현될 때 생체 내에서 지방산들을 (ω-OH 지방산들을 포함하는) 바람직한 특정 화합물들로 효율적으로 전환시킬 수 있는 것으로 나타났다(아래의 예시들을 참조). 본 발명에 따라, CYP153A 단백질을 코딩하는 유전자와 같은 돌연변이된 유전자를, c-말단 리덕타아제 도메인을 코딩하는 돌연변이된 유전자에 연결시킴으로써 다른 혼성 융합 폴리펩티드 변이체들이 조작될 수 있다(위의 표 2A 내지 2D 참조). 두 유전자들(P450 및 리덕타아제 도메인)을 돌연변이화하거나 하나의 유전자(P450 또는 리덕타아제 도메인)를 돌연변이화하는 변이체들이 여기에 포함된다. 이러한 지침들에 따라, 유사한 융합 단백질 변이체들이 다른 타입의 ω-하이드록실라아제로부터 생성될 수 있으며, ω-OH 지방산 유도체들을 생성하기 위해 재조합 숙주 세포들에서 발현될 수 있다.
따라서, 본 발명은 탄소원(예를 들어, 글루코오스, 수크로오스 또는 재생가능한 공급원료로부터 유래된 여타의 탄소원)으로 배양될 때 ω-수산화 지방산 유도체 조성물들의 높은 역가, 수율 및/또는 생산성을 가져오는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들을 발현시키는 재조합 숙주 세포들에 관한 것이다. CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 CYP153A 도메인 또는 리덕타아제 도메인 또는 둘 모두에서 하나 이상의 돌연변이를 갖는다. 일 구현예에서, 본 발명은 SEQ ID NO: 6에 대해 적어도 약 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 99 %의 서열 동일성을 갖고, 27, 82, 141, 178, 231, 309, 407, 415, 516, 666 및/또는 796 위치를 포함하는 아미노산 위치에서 하나 이상의 돌연변이를 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체를 제공하며, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 생체 내에서 지방산의 ω-OH 지방산으로의 전환을 촉매화한다. 더 구체적으로, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는, 다음의 돌연변이들 - 예컨대, 아르기닌(R)이 리신(L)으로 치환된 R27L; 아르기닌(R)이 아스파르트산(D)으로 치환된 위치 R82D; 발린이 이소류신(I)으로 치환된 위치 V141I; 발린(V)이 글루타민(Q)으로 치환된 위치 V141Q; 발린(V)이 글리신(G)으로 치환된 V141G; 발린(V)이 메티오닌(M)으로 치환된 V141M; 발린(V)이 류신(L)으로 치환된 위치 V141L; 발린(V)이 트레오닌(T)으로 치환된 위치 V141T; 아르기닌(R)이 아스파라긴(N)으로 치환된 위치 R178N; 알라닌(A)이 트레오닌(T)으로 치환된 위치 A231T; 아스파라긴(N)이 아르기닌(R)으로 치환된 위치 N309R; 아스파라긴(N)이 알라닌(A)으로 치환된 N407A; 발린(V)이 아르기닌(R)으로 치환된 위치 V415R; 트레오닌(T)이 발린(V)으로 치환된 위치 T516V; 프롤린(P)이 알라닌(A)으로 치환된 위치 P666A; 프롤린(P)이 아스파르트산(D)으로 치환된 P666D; 및 알라닌(A)이 발린(V)으로 치환된 위치 A796V를 포함함 - 중 하나 이상을 갖는다. CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들의 예시들은 SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 및 SEQ ID NO: 46을 포함한다. 일 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 혼성 cyp153A-RedRhF-타입 융합 단백질 변이체이다. 또 다른 구현예에서, 재조합 숙주 세포에서의 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 대응하는 숙주 세포에서의 CYP153A-리덕타아제 혼성 융합 폴리펩티드의 발현에 의해 생성된 ω-OH 지방산 조성물의 역가에 비해 ω-OH 지방산 유도체 조성물의 더 높은 역가를 가져온다. 또 다른 구현예에서, 재조합 숙주 세포에서의 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는ω-OH C12, ω-OH C14, ω-OH C16, ω-OH C18, ω-OH C12:1, ω-OH C14:1, ω-OH C16:1 및 ω-OH C18:1 지방산 유도체 조성물을 포함하는(단, 이로 제한되지 않음) ω-OH 지방산 유도체 조성물의 더 높은 역가를 가져온다.
또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 아미노산 위치 141(V141I 및/또는 V141T를 포함함)에서 돌연변이를 갖는다. 여기서, 재조합 숙주 세포에서 돌연변이들 V141I 또는 V141T를 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체의 발현은, CYP153A-리덕타아제 혼성 융합 폴리펩티드의 발현에 의해 생성된 ω-OH C12 또는 C16 지방산 조성물의 역가에 비해 각각 ω-OH C12 또는 C16 지방산 조성물의 더 높은 역가를 가져온다. 일 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 V141I 및 A231T(SEQ ID NO: 32)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C12 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 R27L, R82D, V141M, R178N 및 N407A(SEQ ID NO: 34)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C12 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이 P666A(SEQ ID NO: 36)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C12 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이 A796V(SEQ ID NO: 38)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C12 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 A796V, P666D 및 T516V(SEQ ID NO: 40)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C12 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 V141I, A231T 및 A796V(SEQ ID NO: 42)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C12 및 C16 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 R27L, R82D, V141M, R178N, N407A 및 A796V(SEQ ID NO: 44)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C12 지방산을 생성한다. 또 다른 구현예에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 돌연변이들 V141T, A231T 및 A796V(SEQ ID NO: 46)를 가지며, 티오에스테라아제의 효소 기능을 갖는 숙주 세포에서 발현될 때 증가된 양의 ω-OH C16 지방산을 생성한다.
본 발명은 CYP153A-리덕타아제 혼성 융합-관련 폴리뉴클레오티드 및 폴리펩티드 변이체들을 식별한다. CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들은 SEQ ID NOS: 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 및 46을 포함한다. CYP153A-리덕타아제 혼성 융합 핵산 변이체들(DNA 서열들)은 SEQ ID NOS: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 및 47을 포함한다. 하지만, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들에 대한 절대적인 서열 동일성이 필수적인 것은 아님을 이해할 것이다. 예를 들어, 특정 폴리뉴클레오티드 서열의 변화가 이루어질 수 있으며, 코딩된 폴리펩티드가 활성에 대해 스크리닝될 수 있다. 이러한 변화는 통상적으로, 이를테면 코돈 최적화를 통해 보존적 돌연변이들 및 잠재적 돌연변이들을 포함한다. 변형된 또는 돌연변이된(즉, 돌연변이) 폴리뉴클레오티드들 및 코딩된 변이 폴리펩티드들은, 해당 기술분야에 알려진 방법들을 이용하여, 증가된 촉매 활성, 증가된 안정성 또는 감소된 억제(예를 들어, 감소된 피드백 억제)를 포함하는(단, 이로 제한되지 않음) 야생형 또는 주형 폴리펩티드에 비해 개선된 기능과 같은 의도한 기능에 대해 스크리닝될 수 있다. 본 발명은 효소 분류(Enzyme Classification: EC) 번호에 따라 본 명세서에 설명된 지방산 생합성 경로들의 다양한 단계들(즉, 반응들)과 관련된 효소 활성을 식별하며, 이러한 EC 번호에 의해 분류된 (예를 들어, 특정 효소들로서 기능하고 특정 효소 활성을 나타내는) 예시적인 폴리펩티드들 및 이러한 폴리펩티드들을 코딩하는 예시적인 폴리뉴클레오티드들을 제공한다. 서열 식별 번호(SEQ ID NO; 위 참조)들에 의해 본 명세서에서 식별되는 이러한 예시적인 폴리펩티드들 및 폴리뉴클레오티드들은 도 1에 도시된 것과 같은 숙주 세포들에서 지방산 경로들을 조작하는데 유용하다. 하지만, 본 명세서에 설명된 폴리펩티드들 및 폴리뉴클레오티드들은 예시이며, 따라서 비-제한적임을 이해하여야 한다. 본 명세서에 설명된 예시적인 폴리펩티드들의 상동의 서열들은, 데이터베이스들[예를 들어, 미국 국립 생물공학 정보센터(NCBI)에 의해 제공되는 Entrez 데이터베이스, 스위스 생물정보학 연구소(Swiss Institute of Bioinformatics)에 의해 제공되는 ExPasy 데이터베이스, 브라운슈바이크 기술대학(Technical University of Braunschweig)에 의해 제공되는 BRENDA 데이터베이스, 및 교토대 및 동경대의 생물정보학 센터(Bioinformatics Center of Kyoto University and University of Tokyo)에 의해 제공되는 KEGG 데이터베이스, 이 모두는 월드 와이드 웹에서 이용가능함]을 이용하여 해당 기술분야의 당업자들이 이용가능하다.
일 구현예에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 및 SEQ ID NO: 46에 대해 적어도 약 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % 또는 100 %의 서열 동일성을 갖는다. 몇몇 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 글리신(G)이 알라닌(A)으로 치환된 마리노박터 아쿠애올레이로부터의 CYP153A(G307A) 폴리펩티드로부터 유래되며, 로도코쿠스 종 NCIMB9784로부터의 P450RhF의 리덕타아제 도메인과 융합된다. 시토크롬 P450RhF는 자족적이고, 고도의 기질 무차별성(substrate promiscuity)을 나타내며, 광범위한 작용기들을 촉매화한다. 다른 구현예들에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 또는 SEQ ID NO: 46에 대해 적어도 약 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %의 서열 동일성을 가지며, 또한 본 명세서에 설명된 바와 같은 유용한 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함할 수 있다. 다른 구현예들에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28 또는 SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44 또는 SEQ ID NO: 46에 대해 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 94 %, 93 %, 92 %, 91 % 또는 90 %의 서열 동일성을 갖는다. 또 다른 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체의 P450 촉매 도메인은 마리노박터 아쿠애올레이 이외의 종들로부터 유래된다. 이러한 다른 종들은 아시네토박터 종, 미코박테리움 마리눔(Mycobacterium marinum), 폴라로모나스 종(Polaromonas sp .), 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고 룸(Burkholderia fungorum), 카울로박터 크레센투스(Caulobacter crescentus), 하 이호모나스 넵투늄(Hyphomonas neptunium), 로도슈도모나스 팔루스트리 스(Rhodopseudomonas palustris), 스핀고모나스 종(Sphingomonas sp .), 미코박테리 움 종을 포함한다(단, 이로 제한되지 않음). 또 다른 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체의 리덕타아제 도메인은 로도코쿠스 종 이외의 종들로부터 유래된다. 이러한 다른 종들은 로도코쿠스 에퀴(Rhodococcus equi), 아시네토박터 라디오레시스텐스(Acinetobacter radioresistens), 버크홀데리아 말 레 이(Burkholderia mallei), 버크홀데리아 말레이, 랄스토니아 유트로파(Ralstonia eutropha), 쿠프리아비두스 메탈리두란스(Cupriavidus metallidurans)를 포함한다(단, 이로 제한되지 않음).
관련 구현예에서, 본 발명은 SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45 또는 SEQ ID NO: 47에 대해 적어도 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %의 서열 동일성을 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체를 포함한다. 몇몇 구현예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 가져오는 하나 이상의 치환을 갖는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체를 코딩한다. 또 다른 관련 구현예에서, 본 발명을 구현하는데 사용하기 위한 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45 또는 SEQ ID NO: 47에 대해 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 94 %, 93 %, 92 %, 91 % 또는 90 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩된다. 또 다른 실시형태에서, 본 발명은 SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45 또는 SEQ ID NO: 47에 대응하는 핵산 서열의 실질적인 전체 길이에 걸쳐 엄격한 조건들 하에서 혼성화되는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체들에 관한 것이다. 몇몇 구현예들에서, CYP153A-리덕타아제 혼성 융합 폴리펩티드 변이체는 마리 노박터 아쿠애올레이 종들로부터 유래된다. 다른 구현예들에서, P450 혼성 융합 폴리펩티드는 아시네토박터 종, 미코박테리움 마리눔, 폴라로모나스 종, 알카니보락스 보르쿠멘시스, 버크홀데리아 펀고룸, 카울로박터 크레센투스, 하이호모나스 넵투늄, 로도슈도모나스 팔루스트리스, 스핀고모나스 종, 미코박테리움 종으로부터 유도된다.
변이들 및 돌연변이들
본 명세서에서 사용되는 바와 같은 변이 폴리펩티드는 적어도 하나의 아미노산에 의해 야생형 또는 주형 폴리펩티드와 상이한 아미노산 서열을 갖는 폴리펩티드를 지칭한다. 예를 들어, 변이체(예를 들어, 돌연변이체)는 다음의 보존적 아미노산 치환들 - 지방족 아미노산, 예컨대 알라닌, 발린, 류신, 및 이소류신의 또 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체; 트레오닌의 세린으로의 대체; 산성 잔기, 예컨대 아스파르트산 및 글루탐산의 또 다른 산성 잔기로의 대체; 아미드기를 지닌 잔기, 예컨대 아스파라긴 및 글루타민의 또 다른 아미드기를 지닌 잔기로의 대체; 염기성 잔기, 예컨대 리신 및 아르기닌의 또 다른 염기성 잔기로의 교체; 및 방향족 잔기, 예컨대 페닐알라닌 및 티로신의 또 다른 방향족 잔기로의 대체를 포함함 - 중 하나 이상을 포함할 수 있다(단, 이로 제한되지 않음). 몇몇 구현예들에서, 변이 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 아미노산 치환, 첨가, 삽입 또는 결실을 갖는다. 변이체 또는 돌연변이체로서 기능하는 폴리펩티드의 몇몇 바람직한 단편은 대응하는 야생형 폴리펩티드의 생물학적 기능(예를 들어, 효소 활성)의 일부 또는 전부를 보유한다. 몇몇 구현예들에서, 단편은 대응하는 야생형 폴리펩티드의 생물학적 기능의 적어도 75 %, 적어도 80 %, 적어도 90 %, 적어도 95 %, 또는 적어도 98 % 이상을 보유한다. 다른 구현예들에서, 단편 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능의 약 100 %를 보유한다. 다른 구현예들에서, 몇몇 단편들은 대응하는 야생형 폴리펩티드에 비해 증가된 생물학적 기능을 나타내었다. 어떤 아미노산 잔기들이 생물학적 활성에 영향을 주지 않고 치환, 삽입, 또는 결실될 수 있는지를 결정하는 가이던스(guidance)는 해당 기술분야에 잘 알려진 컴퓨터 프로그램들, 예를 들어 LASERGENE 소프트웨어(DNASTAR, Inc., Madison, WI)를 이용하여 찾을 수 있다. 몇몇 구현예들에서, 단편은 대응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 증가된 생물학적 기능을 나타낸다. 예를 들어, 단편은 대응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 효소 활성에 있어서 적어도 10 %, 적어도 25 %, 적어도 50 %, 적어도 75 %, 또는 적어도 90 %의 개선을 나타낼 수 있다. 다른 구현예들에서, 단편은 대응하는 야생형 폴리펩티드 또는 주형 폴리펩티드에 비해 효소 활성에 있어서 적어도 100 % 또는 적어도 200 % 또는 적어도 500 %의 개선을 나타낸다.
본 명세서에 설명된 폴리펩티드들은 추가적인 보존적 또는 비-필수 아미노산 치환들을 가질 수 있으며, 이는 폴리펩티드 기능에 실질적인 영향을 주지 않는다는 것을 이해한다. 특정 치환이 용인되는지(즉, ω-하이드록실라아제 효소 활성과 같은 의도한 생물학적 기능에 부정적인 영향을 주지 않는지)의 여부가 해당 기술분야에 알려진 바와 같이 결정될 수 있다(Bowie 외(1990) Science 247:1306-1310 참조). 보존적 아미노산 치환은 아미노산 잔기가 유사한 곁사슬(side chain)을 갖는 아미노산 잔기로 대체되는 것이다. 유사한 곁사슬들을 갖는 아미노산 잔기들의 계열들이 해당 기술분야에 정의되어 있다. 이 계열들은 염기성 곁사슬(예를 들어, 리신, 아르기닌, 히스티딘), 산성 곁사슬(예를 들어, 아스파르트산, 글루탐산), 비전하 극성 곁사슬(uncharged polar side chain)(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 무극성 곁사슬(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 곁사슬(예를 들어, 트레오닌, 발린, 이소류신), 및 방향족 곁사슬(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 갖는 아미노산들을 포함한다.
변이체들은 자연적으로 발생하거나 시험관 내에서 생성될 수 있다. 특히, 이러한 변이체들은 부위 지향 돌연변이(site directed mutagenesis), 무작위 화학적 돌연변이(random chemical mutagenesis), 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술들과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 이러한 변이체, 돌연변이체, 단편, 유사체, 또는 유도체는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 변이체를 만드는 방법들이 해당 기술분야에 잘 알려져 있다. 예를 들어, 변이체들은 무작위 및 부위 지향 돌연변이를 이용함으로써 제조(prepare)될 수 있다. 무작위 및 부위 지향 돌연변이는 일반적으로 당업계에 알려져 있다(예를 들어, Arnold(1993) Curr . Opin . Biotech. 4:450-455 참조). 무작위 돌연변이는 오류 유발(error prone) PCR(예를 들어, Leung 외(1989) Technique 1:11-15; 및 Caldwell 외(1992) PCR Methods Applic . 2:28-33 참조)을 이용하여 달성될 수 있다. 오류 유발 PCR에서, 실제 PCR은 DNA 폴리메라아제의 복사 정확도(copying fidelity)가 낮은 조건들 하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율(high rate of point mutations)이 얻어지도록 한다. 간명하게, 이러한 절차들에서, 돌연변이유발될 핵산(예를 들어, P450 단백질 또는 P450 혼성 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)은 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl2, MnCl2, Taq 폴리메라아제, 및 적절한 농도의 dNTP와 혼합된다. 예를 들어, 이러한 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mMKCl, 10 mM Tris HCl(pH 8.3), 0.01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl2, 0.5 mM MnCl2, 5 단위(unit)의 Taq 폴리메라아제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94 ℃에서 1 분, 45 ℃에서 1 분, 그리고 72 ℃에서 1 분의 30 회 주기 동안 수행될 수 있다. 하지만, 당업자라면 이러한 파라미터들은 적절하게 변동될 수 있음을 이해할 것이다. 이후, 돌연변이유발된 핵산은 적절한 벡터로 클로닝되며, 돌연변이유발된 핵산에 의해 코딩되는 폴리펩티드들의 활성이 평가된다. 부위 지향 돌연변이가 관심 있는 여하한의 클로닝된 DNA의 부위-특이적 돌연변이를 생성하기 위해 올리고뉴클레오티드-지향 돌연변이유발을 이용하여 달성될 수 있다. 올리고뉴클레오티드 돌연변이유발은 당업계에 기술되어 있다(예를 들어, Reidhaar-Olson 외(1988) Science 241:53-57 참조). 간명하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 하나 이상의 돌연변이를 지닌 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발될 클로닝된 DNA(예를 들어, P450 폴리펩티드 또는 P450 혼성 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열) 내로 삽입된다. 돌연변이유발된 DNA를 함유한 클론들이 회수되고, 이들이 코딩한 폴리펩티드의 활성이 평가된다.
변이체를 생성하는 또 다른 방법은 조립(assembly) PCR이다. 조립 PCR은 작은 DNA 단편들의 혼합으로부터 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알(vial)에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(priming)(미국 특허 5,965,408 참조). 변이체를 생성하는 또 다른 방법은 유성(sexual) PCR 돌연변이유발이다. 유성 PCR 돌연변이유발에서는, 강제된(forced) 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 단편화의 결과로서 시험관 내에서 상이하지만 고도로 관련된 DNA 서열들의 DNA 분자들 사이에 일어난다. 이후, PCR 반응의 프라이머 신장법(primer extension)에 의한 크로스오버(crossover)의 고정(fixation)이 후속된다. 유성 PCR 돌연변이유발은 당업계에 알려진 출간물에 기술되어 있다(예를 들어, Stemmer(1994) Proc . Natl . Acad . Sci., U.S.A. 91:10747-10751). 또한, 변이체들은 생체 내 돌연변이유발에 의해 생성될 수 있다. 몇몇 구현예들에서, 핵산 서열에서의 무작위 돌연변이는 DNA 보수 경로(repair pathway) 중 하나 이상에서 돌연변이를 갖는(carries) 박테리아 균주, 예컨대 대장균 균주에서의 서열을 증식시킴으로써 생성된다. 이러한 돌연변이유발 유전자 균주(mutator strain)는 야생형 균주보다 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열(예를 들어, P450 혼성 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)의 증식이 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체 내 돌연변이유발에 사용하기 적절한 돌연변이유발 유전자 균주는 해당 기술분야의 공보(예를 들어, 국제 특허 출원 공개공보 WO 1991/016427)에 기술되어 있다. 또한, 변이체들은 카세트 돌연변이유발(cassette mutagenesis)을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 영역이 원래의 서열과 상이한 합성 올리고뉴클레오티드 카세트로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 원래의 서열을 포함한다. 또한, 반복 앙상블 돌연변이유발(recursive ensemble mutagenesis)이 변이체들을 생성하는데 사용될 수 있다. 반복 앙상블 돌연변이유발은 표현형 관련 돌연변이체들(phenotypically related mutants)(이의 요소들은 아미노산 서열이 상이함)의 다양한 개체군들을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위해 피드백 메커니즘을 이용한다(예를 들어, Arkin 외(1992) Proc . Natl . Acad . Sci ., U.S.A . 89:7811-7815 참조). 몇몇 구현예들에서, 변이체들은 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)을 이용하여 생성된다. 지수 앙상블 돌연변이유발은 높은 백분율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리들(combinatorial libraries)을 생성하는 프로세스이며, 잔기들의 작은 그룹들이 기능성 단백질들을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다(예를 들어, Delegrave 외(1993) Biotech. Res. 11:1548-1552 참조). 몇몇 구현예들에서, 변이체들은 별개의 폴리펩티드들을 코딩하는 복수의 핵산들의 부분들이 함께 융합되어 키메라 폴리펩티드를 코딩하는 키메라 핵산 서열들을 생성하도록 셔플링 절차(shuffling procedure)들을 이용하여 생성된다(예를 들어, 미국 특허 5,965,408 및 5,939,250에 개시됨).
발현 벡터들
몇몇 구현예들에서, 폴리뉴클레오티드(또는 유전자) 서열이 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 재조합 벡터에 의해 숙주 세포에 제공된다. 특정 구현예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 몇몇 구현예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택되는 적어도 하나의 서열을 포함한다. 본 명세서에 설명된 발현 벡터들은 숙주 세포 내에서의 폴리뉴클레오티드 서열의 발현에 적절한 형태인 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 앞서 설명된 바와 같은 폴리뉴클레오티드 서열들(위 참조)에 의해 코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하도록 숙주 세포들에 도입될 수 있다. 흔히, 원핵생물, 예를 들어 대장균에서 폴리펩티드들을 코딩하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드들의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 융합 벡터들은 그 안에 코딩된 폴리펩티드에, 보통 재조합 폴리펩티드의 아미노- 또는 카르복시-말단에 다수의 아미노산들을 추가한다. 이러한 융합 벡터들은 통상적으로 다음의 세 가지 목적, 즉 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키며; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 하나 이상을 제공한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이러한 효소들 및 이들의 동족 인식 서열(cognate recognition sequence)들의 예시들은 Xa 인자(Factor Xa), 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX 벡터(Pharmacia Biotech, Inc., Piscataway, NJ; Smith 외(1988) Gene 67:31-40), pMAL 벡터(New England Biolabs, Beverly, MA), 및 pRITS 벡터(Pharmacia Biotech, Inc., Piscataway, N.J.)를 포함하고, 이들은 표적 재조합 폴리펩티드에 각각 글루타티온 S-트랜스퍼라아제(GST), 말토스 E 결합 단백질, 또는 단백질 A를 융합시킨다.
유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터(Amann 외(1988) Gene 69:301-315) 및 pET 11d 벡터(Studier 외, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif.(1990) 60-89)를 포함한다. pTrc 벡터로부터의 표적 유전자 발현은 혼성 trp-lac 융합 프로모터로부터의 숙주 RNA 폴리메라아제 전사에 의존한다. pET 11d 벡터로부터의 표적 유전자 발현은 공동발현되는 바이러스 RNA 폴리메라아제(T7 gn1)에 의해 매개되는 T7 gn10-lac 융합 프로모터로부터의 전사에 의존한다. 이 바이러스 폴리메라아제는 lacUV 5 프로모터의 전사 조절 하에서 T7 gn1 유전자를 보유하는 내재성 λ 프로파지(resident λ prophage)로부터 BL21(DE3) 또는 HMS174(DE3)와 같은 숙주 균주들에 의해 공급된다. 원핵 세포 및 진핵 세포 모두에 적절한 발현 시스템들이 해당 기술분야에서 잘 알려져 있다(예를 들어, Sambrook 외(1989) Molecular Cloning: A Laboratory Manual, second edition, Cold Spring Harbor Laboratory 참조). 유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터(Amann 외(1988) Gene 69:301-315) 및 PET 11d 벡터(Studier 외(1990) Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA, pp. 60-89)를 포함한다. 특정 구현예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유도된 프로모터에 작동가능하게 연결된다. 일 구현예에서, 숙주 세포는 효모 세포이다. 이 구현예에서, 발현 벡터는 효모 발현 벡터이다. 벡터들은 외래(foreign) 핵산(예를 들어, DNA)을 숙주 세포 내로 도입하기 위하여 본 기술분야에서 인정되는 다양한 기술들을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염(transfecting)시키는 적절한 방법들은, 예를 들어 Sambrook 외에서 찾아볼 수 있다(위 참조). 박테리아 세포들의 안정적인 형질전환을 위하여, (사용되는 발현 벡터 및 형질전환 기술에 따라) 세포들의 특정 부분이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이 형질전환체들을 식별하고 선택하기 위하여, 선별가능한 마커(예를 들어, 항생제에 대한 내성)를 코딩하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선별가능한 마커들은 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같은(단, 이로 제한되지 않음) 약물들에 대한 내성을 제공하는 것들을 포함한다. 선택가능한 마커를 코딩하는 핵산들은 본 명세서에서 설명되는 폴리펩티드를 코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에서 도입될 수 있다.
선택적인 경로 조작
본 발명의 숙주 세포들 또는 미생물들은, 효소 활성들에 대한 특정 돌연변이들의 효율성을 테스트하기 위해 변경들을 포함하도록 유전적으로 조작되거나 변형된 숙주 균주들 또는 숙주 세포들(즉, 재조합 세포들 또는 미생물들)을 포함한다. 다양한 선택적인 유전적 조정(manipulation) 및 변경이, 어떤 원래의 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 숙주 세포로 교환가능하게 사용될 수 있다. 일 구현예에서, 숙주 균주는 다른 생합성 폴리펩티드들(예를 들어, 효소들)과 조합하여 CYP153A-리덕타아제 혼성 융합 폴리펩티드 또는 이의 변이체의 발현을 테스트하는데 사용될 수 있다. 숙주 균주는, 발효 성분들, 탄소원(예를 들어, 공급원료), 온도, 압력, 감소된 배양 오염 조건들, 및 산소 수준들을 포함한 배양 조건들을 포함하는(단, 이로 제한되지 않음) 특정 변수들을 테스트하기 위해 다수의 유전적 변경들을 포함할 수 있다.
일 구현예에서, 숙주 균주는 선택적인 fadE 및 fhuA 결실을 포함한다. 아실-CoA 디하이드로게나아제(FadE)는 지방산을 대사시키는데 중요한 효소이다. 이는 지방산 이용(베타-산화)의 두번째 단계를 촉매화하며, 이는 지방산(아실-CoA)의 긴 사슬들을 아세틸-CoA 분자들로 쪼개는 공정이다. 더 구체적으로, 박테리아에서 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이는 FadE에 의해 촉매화된다. 대장균에 FadE가 없는 경우, 이는 탄소원으로서 지방산에서 성장할 수 없지만, 아세테이트에서 성장할 수 있다. 여하한의 사슬 길이의 지방산을 이용하는 불가능성(inability)은 fadE 균주들, 즉 FadE 기능이 파괴되는 fadE 돌연변이 균주들의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 지방산 유도체 경로에서 중간체일 수 있는 아실-CoA가 세포에 누적될 수 있도록 보장하여, 모든 아실-CoA가 지방산 유도체들로 효율적으로 전환될 수 있도록 한다. 하지만, fadE 감쇠는 탄소원으로서 당이 사용될 때 선택적인데, 이는 이러한 조건 하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며, 아실-CoA 기질에 대해 에스테르 신타아제 또는 다른 효소들과 효율적으로 경쟁할 수 없기 때문이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들은 지방산보다 당의 소모를 선호하므로, 두 공급원들이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 우선적으로 소모된다(D. Clark, J Bacteriol.(1981) 148(2):521-6 참조). 또한, 당의 부재 및 지방산의 존재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질들이 상향-조절되고(up-regulated) 아실-CoA에 대해 효율적으로 경쟁할 것이기 때문에, 아실-CoA 중간체들이 베타 산화 경로에 대해 손실될 수 있다. 따라서, fadE 유전자가 녹아웃되거나 감쇠되는 것이 유리할 수 있다. 대부분의 탄소원들이 주로 당 기반이기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 코딩하며, 이는 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다(V. Braun(2009) J Bacteriol. 191(11):3431-3436 참조). 이것의 결실은 선택적이다. fhuA 결실은 세포로 하여금 특정 발효 조건들에 유리할 수 있는 파지 공격(phage attack)에 대해 더 저항성 있게 한다. 따라서, 발효 진행 시 잠재적 오염을 겪기 쉬운 숙주 세포의 fhuA를 결실시키는 것이 바람직할 수 있다.
또한, 또 다른 구현예에서, 숙주 균주(위 참조)는 다음의 유전자들 - fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함함 - 중 하나 이상의 선택적인 과발현을 포함한다. 이러한 유전자들의 예시들은 대장균으로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 지방산 생합성에서의 조절제들 및 효소들을 코딩하는 이러한 유전자들 중 하나 이상의 과발현은 다양한 배양 조건들 하에서 ω-OH 지방산들 및 이의 유도체들을 포함하는 지방산 유도체 화합물들의 역가를 증가시키는 역할을 할 수 있다.
또 다른 구현예에서, ω-OH 지방산들 및 이의 유도체들의 생성을 위해 숙주 세포들로서 대장균 균주들이 사용된다. 이와 유사하게, 이러한 숙주 세포들은 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함하는(단, 이로 제한되지 않음) 다양한 배양 조건들 하에서 지방산 유도체들(예를 들어, ω-OH 지방산 및 α,ω-이산 등)과 같은 지방산 유도체 화합물들의 역가를 더 증가시키거나 증대(enhance)시킬 수 있는 하나 이상의 생합성 유전자들(즉, 지방산 생합성에서의 조절제들 및 효소들을 코딩하는 유전자들)의 선택적인 과발현을 제공한다. 유전적 변경의 예시들은 대장균으로부터의 fadR, 쥐티푸스균으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균으로부터의 fabV(YP_001217283), 및 클로 스트리디움 아세토부틸리쿰으로부터의 fabF(NP_350156)를 포함한다. 몇몇 구현예들에서, 이러한 생합성 유전자들을 운반하는 합성 오페론들이, 다양한 배양 조건들 하에서 P450 발현을 테스트하고, 및/또는 ω-OH 지방산 및 α,ω-이산 생성을 더 증대시키기 위해 세포들 내에서 조작되고 발현될 수 있다. 이러한 합성 오페론들은 하나 이상의 생합성 유전자를 함유한다. ifab138 오페론은, 예를 들어 특정 배양 조건들을 테스트하기 위해 지방산 유도체들의 과발현을 용이하게 하는데 사용될 수 있는 콜레라균으로부터의 fabV, 쥐티푸스균으로부터의 fabH, 쥐티푸스균으로부터의 fabD, 쥐티푸스균으로부터의 fabG, 쥐티푸스균으로부터의 fabA, 및/또는 클로스트리디움 아세토부틸리쿰으로부터의 fabF를 포함하는 선택적인 지방산 생합성 유전자들을 함유하는 조작된 오페론이다. 이러한 합성 오페론들의 한가지 장점은, ω-OH 지방산 유도체 생성률이 더 증가되거나 증대될 수 있다는 것이다.
몇몇 구현예들에서, ACP 및 생합성 효소들(예를 들어, ω-하이드록실라아제, 티오에스테라아제 등)을 발현시키는데 사용되는 숙주 세포들 또는 미생물들은, ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산 등과 같은 하나 이상의 특정 지방산 유도체(들)에 대한 생성을 증가시킬 수 있는 특정 효소 활성들을 포함하는 유전자들을 더 발현시킬 것이다. 일 구현예에서, 숙주 세포는 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 티오에스테라아제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C, 1.2.1.80) 활성 및/또는 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1) 및/또는 지방족 알코올 아실-CoA 리덕타아제(FAR)(E.C. 1.1.1.*) 활성 및/또는 카르복실산 리덕타아제(CAR)(E.C. 1.2.99.6) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알데히드의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 알칸 및 알켄의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 디카르보닐라아제(ADC) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-CoA 리덕타아제(E.C. 1.2.1.50) 활성, 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75), 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 케톤의 생성을 위해 OleA 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 내부 올레핀의 생성을 위해 OleBCD 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1)을 갖는다. 또 다른 구현예에서, 숙주 세포는 말단 올레핀을 만들기 위해 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 디카르복실라아제 활성을 갖는다. 미생물 및 미생물 세포에서의 효소 활성들의 발현은 미국 특허 8,097,439; 8,110,093; 8,110,670; 8,183,028; 8,268,559; 8,283,143; 8,232,924; 8,372,610; 및 8,530,221에 개시되어 있으며, 이들은 본 명세서에서 인용 참조된다. 다른 구현예들에서, ACP 및 다른 생합성 효소들을 발현시키는데 사용되는 숙주 세포들 또는 미생물들은 ω-OH 지방산, ω-OH 지방산 유도체, α,ω-이산과 같은 하나 이상의 특정 지방산 유도체(들)를 생성하기 위해 상향조절되거나 과발현되는 특정 원래의 효소 활성들을 포함할 것이다. 일 구현예에서, 숙주 세포는 티오에스테라아제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원래의 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.
본 발명은 CYP153A-리덕타아제 혼성 융합 폴리펩티드들 및 이의 변이체들 그리고 다른 생합성 효소들(위 참조)을 코딩하는 유전자들을 발현시키는 숙주 균주들 또는 미생물들을 포함한다. 재조합 숙주 세포들은, ω-하이드록시 지방산 유도체들(예를 들어, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들)을 포함하는 지방산 유도체들 및 이들의 조성물들 및 배합물(blend)들을 생성한다. 지방산 유도체들은 통상적으로 배양 배지로부터 회수되고, 및/또는 숙주 세포들로부터 분리된다. 일 구현예에서, 지방산 유도체들은 배양 배지(세포외)로부터 회수된다. 또 다른 구현예에서, 지방산 유도체들은 숙주 세포(세포내)로부터 분리된다. 또 다른 구현예에서, 지방산 유도체들은 배양 배지로부터 회수되고, 숙주 세포들로부터 분리된다. 숙주 세포에 의해 생성되는 지방산 유도체 조성물은, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들과 같은 이작용성 화합물들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들 등을 포함하는 ω-하이드록시 지방산들과 같은 지방산 유도체 조성물들의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체들의 분포를 결정하기 위해, 당업계에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다.
다른 구현예들에서, ACP 및 다른 생합성 효소들을 발현시키는데 사용되는 숙주 세포들 또는 미생물들은, ω-하이드록시 지방산 유도체들(예를 들어, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; α,ω-디에스테르들과 같은 이작용성 화합물들; ω-카르복시 지방산 메틸 에스테르들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들을 포함하는 ω-하이드록시 지방산들)을 포함하는 하나 이상의 특정 지방산 유도체를 생성하기 위해, 상향조절되거나 과발현되는 특정 원래의 효소 활성들을 포함할 것이다. 일 구현예에서, 숙주 세포는 티오에스테라아제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원래의(native) 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.
재조합 숙주 세포들 및 발효
ω-하이드록시 지방산 유도체들을 생성하기 위해, 생성 숙주 세포들(위 참조)에 대한 다수의 변형들이 이루어질 수 있다. 따라서, 본 발명은 비조작된 또는 원래의 숙주 세포들(예를 들어, 대조 세포들로서 기능하는 야생형 세포들)에 대해 ω-지방산 생합성 경로를 제공하도록 조작된 재조합 숙주 세포들을 제공하며, 이는 예를 들어 특정 균주 개선들을 통해 달성된다. 본 발명의 생성 숙주 유기체들은 식물, 동물 또는 미생물 세포들을 포함한다. 박테리아, 시아노박테리아, 효모, 조류 또는 사상균류(filamentous fungi)와 같은 미생물들 또는 미생물 세포들이 생성 숙주들로서 사용될 수 있다. 생성 숙주들로서 사용될 수 있는 미생물들의 비-제한적인 예시들은 대장균, 사카로마이세스 세레비지에 등(아래 참조)을 포함한다. 미생물 균주들은 재생가능한 공급원료로부터의 글루코오스 또는 다른 탄소원들을 지방산들 또는 지방산 에스테르들, 예컨대 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 및 지방족 알코올(FALC)로 효율적으로 전환시킨다. 이를 달성하기 위해, 균주들이 지방산들의 생성을 위해 티오에스테라아제(예를 들어, 대장균으로부터의 TesA)를 포함하거나 FAME의 생성을 위해 에스테르 신타아제[예를 들어, M. 하이드로카보노클라스티쿠스(M. hydrocarbonoclasticus)로부터의 ES9]를 포함하는 핵심 효소들을 발현시키도록 세심하게 조작되었다. 다양한 화합물들의 생성을 위한 고밀도 발효를 위한 프로토콜들 및 절차들이 기술되어 있다(본 명세서에서 인용 참조되는 미국 특허 8,372,610; 8,323,924; 8,313,934; 8,283,143; 8,268,599; 8,183,028; 8,110,670; 8,110,093; 및 8,097,439 참조).
도 1 및 도 2에 도시된 바와 같은 α,ω-이산들 그리고 도 3 및 도 4에 도시된 바와 같은 α,ω-디올들과 같은 이작용성 지방산 유도체들을 생성할 수 있는 능력을 갖는 신규한 미생물들을 생성하기 위해 유전자 조작 기술들을 이용하여 생체촉매로서 기능하는 이러한 미생물들에 본 명세서에 설명된 효소 단계들이 추가될 수 있다. 생성물들이 세포들 밖으로 분비될 것으로 예상되어, 원심분리를 통해 용이한 수득을 허용한다. 도 1 및 도 2에 예시된 바와 같은 12-아미노 라우르산 또는 12-아미노라우르산 메틸 에스테르와 같은 특정 화합물들의 직접적인 생성을 위해 하나의 미생물에서 특정 재조합 효소 단계들이 조합될 수 있다. 대안적으로, 재생가능한 자원들로부터 생성된 중간체들을 이용하는 생물형질전환들이 본 발명의 발효 방법들에 적용될 수 있다. 예를 들어, 티오에스테라아제 또는 에스테르 신타아제와 같은 효소들을 발현시키는 재조합 미생물로부터 얻어지는 라우르산 메틸 에스테르는 알코올 디하이드로게나아제 또는 옥시다아제; 아미노 트랜스퍼라아제 또는 트랜스아미나아제; 및/또는 에스테라아제 또는 라파아제와 같은 효소들을 발현시키는 재조합 미생물로 공급될 수 있다. 이와 같이, 특정 단계들을 촉매화하는 특정 효소들을 발현시키는 재조합 미생물로부터 얻어진 화학적 개체가 다른 단계들을 촉매화하는 효소들을 발현시키는 또 다른 재조합 미생물로 공급될 수 있다. 따라서, 숙주 세포들은 의도한 ω-하이드록시 지방산 유도체들을 생성하기 위해 중간체들이 교환가능하고 발효 절차들이 모든 숙주 세포들에 공급될 수 있는 생성 시스템을 제공한다. 특히, 글루코오스 또는 외인성 지방산들 또는 파라핀들 이외의 다른 재생가능한 공급원료들로부터, 예를 들어 α,ω-이산들; α,ω-디올들; 또는 ω-아미노 지방산들과 같은 ω-하이드록시 지방산 유도체들을 직접적으로 또한 효율적으로 생성하는 방법들이 이제까지 존재하지 않았다. 그럼에도, 이러한 이작용성 지방산 유도체들은 중합체 합성을 위한 중요한 전구체들이다. 본 명세서에 제시된 바와 같은 ω-하이드록시 지방산 유도체들의 생성을 위한 발효 기반 방법은 해당 기술 분야에 이용되는 화학적 방법들에 대해 빠르고 환경 친화적인 대안을 제공한다.
본 발명의 방법은 재생가능한 공급원료들(예를 들어, 옥수수, 사탕수수 또는 목질계 바이오매스로부터의 탄수화물; 또는 글리세롤, 플루-가스, 합성-가스와 같은 노폐물; 또는 바이오매스와 같은 유기 재료의 재형성물)로부터 유래되는 탄소원으로부터 ω-하이드록시 지방산 유도체들의 직접적인 생성을 제공한다. 일 구현예에서, 상기 방법은 이러한 중요한 화학물질들의 생성을 위한 비용 효율적이고 재생가능한 대안적인 공급원들에 의존한다. 상기 방법은, 발효액에서 재조합 미생물(예를 들어, 숙주 세포)을 제공함으로써 ω-하이드록시 지방산 유도체들을 생성하는 단계; 발효액에 재생가능한 공급원료를 첨가하는 단계; 및 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함한다. 특정 미생물의 숙주 세포는 티오에스테라아제 또는 에스테르 신타아제 및 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함한다.
본 명세서에서 사용되는 바와 같이, 발효라는 용어는 광범위하게 숙주 세포에 의한 유기 물질의 표적 물질로의 전환, 예를 들어 탄소원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 증식시킴으로써 재조합 숙주 세포에 의한 재생가능한 공급원료로부터 유도된 탄소원의 ω-OH 지방산 유도체 및 이의 조성물들로의 전환을 지칭한다. 생성을 위하여 허용되는 조건들은 숙주 세포로 하여금 의도한 생성물, 예컨대 ω-OH 지방산 유도체들을 생성하게 하는 여하한의 조건들을 지칭한다. 이와 유사하게, 벡터의 폴리뉴클레오티드 서열이 발현되는 조건 또는 조건들은 숙주 세포로 하여금 폴리펩티드를 합성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다. 발효 조건들은 온도 범위, 통기 수준, 공급량(feed rate), 및 배지 조성물을 포함하는(단, 이로 제한되지 않음) 다수 파라미터를 포함할 수 있다. 이러한 조건들의 각각은 개별적으로 그리고 조합하여 숙주 세포가 성장하게 한다. 발효는 호기성, 혐기성, 또는 [미-호기성(micro-aerobic)과 같은] 이의 변이성(variations)일 수 있다. 예시적인 배양 배지는 배양액(broth) 또는 겔(gel)을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 대사될 수 있는 탄소원을 포함한다. 또한, 효소들이 탄소원의 가동화(mobilization)[예를 들어, 전분 또는 셀룰로오스의 발효성 당들로의 해중합(depolymerization)] 및 탄소원의 후속 대사를 용이하게 하도록 배지에서 사용될 수 있다.
소규모 생성을 위해, 조작된 숙주 세포들은 예를 들어 약 100 μL, 200 μL, 300 μL, 400 μL, 500 μL, 1 mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L 또는 10 L의 뱃치(batch)에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열, 예컨대 CYP153A-리덕타아제 혼성 융합 폴리펩티드를 단독으로 또는 다른 효소 기능들과 조합하여 코딩하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대규모 생성을 위해, 조작된 숙주 세포들은 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L 및 1,000,000 L 또는 그 이상의 뱃치에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대안적으로, 대규모 유가배양식 발효(fed-batch fermentation)가 수행될 수 있다. 본 명세서에서 설명되는 ω-OH 지방산 유도체 조성물들은 재조합 숙주 세포 배양물의 세포외 환경에서 발견되고, 배양 배지로부터 쉽게 분리될 수 있다. ω-OH 지방산 또는 이의 유도체는 재조합 숙주 세포에 의해 분비될 수 있고, 세포외 환경으로 수송될 수 있거나 또는 수동적으로 재조합 숙주 세포 배양물의 세포외 환경으로 전달될 수 있다. 이의 ω-OH 지방산 유도체는 해당 기술분야에 알려진 통상의 방법들을 이용하여 재조합 숙주 세포 배양물로부터 분리된다.
몇몇 구현예들에서, 숙주 세포는 약 2 g/L 내지 약 100 g/L의 재생가능한 공급원료와 같은 탄소원의 초기 농도를 포함하는 배양 배지에서 배양된다. 다른 구현예들에서, 배양 배지는 약 2 g/L 내지 약 10 g/L의 탄소원, 약 10 g/L 내지 약 20 g/L의 탄소원, 약 20 g/L 내지 약 30 g/L의 탄소원, 약 30 g/L 내지 약 40 g/L의 탄소원, 또는 약 40 g/L 내지 약 50 g/L의 탄소원의 초기 농도를 포함한다. 몇몇 구현예들에서, 배양 배지에서의 탄소원의 수준에 대해 발효가 모니터링될 수 있다. 몇몇 구현예들에서, 이 방법은 배지에서의 탄소원의 수준이 약 0.5 g/L 미만일 때 배양 배지에 보충 탄소원을 첨가하는 단계를 더 포함한다. 몇몇 구현예들에서, 배지에서의 탄소원의 수준이 약 0.4 g/L 미만, 약 0.3 g/L 미만, 약 0.2 g/L 미만, 또는 약 0.1 g/L 미만일 때, 보충 탄소원이 배양 배지에 첨가된다. 몇몇 구현예들에서, 약 1 g/L 내지 약 25 g/L의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 몇몇 구현예들에서, 약 2 g/L 이상(예를 들어, 약 2 g/L 이상, 약 3 g/L 이상, 약 4 g/L 이상)의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 특정 구현예들에서, 약 5 g/L 이하(예를 들어, 약 5 g/L 이하, 약 4 g/L 이하, 약 3 g/L 이하)의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 몇몇 구현예들에서, 약 2 g/L 내지 약 5 g/L, 약 5 g/L 내지 약 10 g/L, 또는 약 10 g/L 내지 약 25 g/L의 탄소원 수준을 유지하기 위해 보충 탄소원이 첨가된다. 몇몇 구현예들에서, 탄소원은 글루코오스, 또는 글리세롤과 같은 다른 타입의 재생가능한 공급원료이다.
몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 1 g/L 내지 약 200 g/L의 농도로 생성된다. 몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 1 g/L 이상(예를 들어, 약 1 g/L 이상, 약 10 g/L 이상, 약 20 g/L 이상, 약 50 g/L 이상, 약 100 g/L 이상)의 농도로 생성된다. 몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 1 g/L 내지 약 170 g/L, 약 1 g/L 내지 약 10 g/L, 약 40 g/L 내지 약 170 g/L, 약 100 g/L 내지 약 170 g/L, 약 10 g/L 내지 약 100 g/L, 약 1 g/L 내지 약 40 g/L, 약 40 g/L 내지 약 100 g/L, 약 1 g/L 내지 약 100 g/L의 농도에서 생성된다.
몇몇 구현예들에서, ω-하이드록시 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L(2 g/L), 3 g/L, 5 g/L, 1O g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 80 g/L, 90 g/L, 1OO g/L 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위의 역가로 생성된다. 다른 구현예들에서, ω-지방산 유도체는 1OO g/L 초과, 200 g/L 초과 또는 300 g/L 초과, 또는 500 g/L, 700 g/L, 1000 g/L, 1200 g/L, 1500 g/L 또는 2000 g/L과 같은 더 높은 역가로 생성된다. 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체의 바람직한 역가는 5 g/L 내지 200 g/L, 1O g/L 내지 150 g/L, 20 g/L 내지 120 g/L, 및 30 g/L 내지 1OO g/L이다. 일 구현예에서, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-지방산 유도체의 역가는 약 1 g/L 내지 약 250 g/L, 더 구체적으로는 90 g/L 내지 약 120 g/L이다. 역가는 특정 ω-지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-지방산 유도체들의 조합을 지칭할 수 있다.
다른 구현예들에서, 본 발명의 방법들에 따라 ω-하이드록시 지방산 유도체들을 생성하도록 조작된 숙주 세포들은 적어도 1 %, 적어도 2 %, 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 6 %, 적어도 7 %, 적어도 8 %, 적어도 9 %, 적어도 10 %, 적어도 11 %, 적어도 12 %, 적어도 13 %, 적어도 14 %, 적어도 15 %, 적어도 16 %, 적어도 17 %, 적어도 18 %, 적어도 19 %, 적어도 20 %, 적어도 21 %, 적어도 22 %, 적어도 23 %, 적어도 24 %, 적어도 25 %, 적어도 26 %, 적어도 27 %, 적어도 28 %, 적어도 29 % 또는 적어도 30 % 또는 적어도 40 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위의 수율을 갖는다. 다른 구현예들에서, ω-하이드록시 지방산 유도체 또는 유도체들은 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 % 또는 그 이상을 초과하는 수율로 생성된다. 대안적으로 또는 추가적으로, 수율은 약 30 % 이하, 약 27 % 이하, 약 25 % 이하 또는 약 22 % 이하이다. 따라서, 수율은 상기 종단점들 중 어느 두 개의 값들에 의해 한정될 수 있다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 수율은 5 % 내지 15 %, 10 % 내지 25 %, 10 % 내지 22 %, 15 % 내지 27 %, 18 % 내지 22 %, 20 % 내지 28 %, 또는 20 % 내지 30 %일 수 있다. 특정 구현예에서, 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 수율은 약 10 % 내지 약 40 %이다. 또 다른 특정 구현예에서, 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 수율은 약 25 % 내지 약 30 %이다. 수율은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-하이드록시 지방산 유도체들의 조합을 지칭할 수 있다. 또한, 수율은 사용되는 공급원료에도 의존적일 것이다.
몇몇 구현예들에서, 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 생산성은 적어도 100 mg/L/시간, 적어도 200 mg/L/시간, 적어도 300 mg/L/시간, 적어도 400 mg/L/시간, 적어도 500 mg/L/시간, 적어도 600 mg/L/시간, 적어도 700 mg/L/시간, 적어도 800 mg/L/시간, 적어도 900 mg/L/시간, 적어도 1000 mg/L/시간, 적어도 1100 mg/L/시간, 적어도 1200 mg/L/시간, 적어도 1300 mg/L/시간, 적어도 1400 mg/L/시간, 적어도 1500 mg/L/시간, 적어도 1600 mg/L/시간, 적어도 1700 mg/L/시간, 적어도 1800 mg/L/시간, 적어도 1900 mg/L/시간, 적어도 2000 mg/L/시간, 적어도 2100 mg/L/시간, 적어도 2200 mg/L/시간, 적어도 2300 mg/L/시간, 적어도 2400 mg/L/시간, 또는 적어도 2500 mg/L/시간이다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 ω-하이드록시 지방산 유도체 또는 유도체들의 생산성은 500 mg/L/시간 내지 2500 mg/L/시간, 또는 700 mg/L/시간 내지 2000 mg/L/시간일 수 있다. 특정한 일 구현예에서, 생산성은 약 0.7 mg/L/h 내지 약 3 g/L/h이다. 생산성은 특정 ω-하이드록시 지방산 유도체 또는 주어진 재조합 숙주 세포 배양물에 의해 생성된 ω-하이드록시 지방산 유도체들의 조합을 지칭할 수 있다.
재조합 숙주 세포들에 의한 ω-OH 지방산 조성물들의 생성을 증가시키기 위한 전략들은 생성 숙주에 티오에스테라아제 유전자 및 CYP153A-리덕타아제 혼성 융합 유전자를 발현시킴으로써 지방산 생합성 경로를 통한 증가된 플럭스(flux)를 포함한다. 본 명세서에서 사용되는 바와 같이, 재조합 숙주 세포 또는 조작된 숙주 세포라는 용어는 유전적 구성(genetic makeup)이, 예를 들어 새로운 유전적 요소들의 의도적인 도입 및/또는 숙주 세포에 자연적으로 존재하는 유전적 요소들의 의도적인 변형에 의해 대응하는 야생형 숙주 세포에 대해 변경된 숙주 세포를 지칭한다. 또한, 이러한 재조합 숙주 세포들의 자손은 이러한 새로운 및/또는 변형된 유전적 요소들을 함유한다. 본 명세서에 설명된 본 발명의 실시형태들 중 어느 것에서, 숙주 세포는 식물 세포, 곤충 세포, 균류 세포[예를 들어, 칸디다 종(Candida sp .)과 같은 사상균류, 또는 사카로미세스 종(Saccharomyces sp.)과 같은 출아 효모], 조류 세포(algal cell) 및 박테리아 세포로부터 선택될 수 있다. 일 구현예에서, 재조합 숙주 세포들은 재조합 미생물들dl다. 미생물들인 숙주 세포들의 예시들은 에스체리치아(Escherichia), 바실러스(Bacillus), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나 스(Pseudomonas), 아스페르길루스(Aspergillus), 트리코데르마(Trichoderma), 뉴로스포라(Neurospora), 푸사리움(Fusarium), 후미콜라(Humicola), 리조무코르(Rhizomucor), 클루이베로미 세스(Kluyveromyces), 피치아(Pichia), 무코 르(Mucor), 미셀리오프토라(Myceliophtora), 페니실리움(Penicillium), 파네로카에 테(Phanerochaete), 플레우로투스(Pleurotus), 트라메테스(Trametes), 크리소스포리움(Chrysosporium), 사카로미세스(Saccharomyces), 스테노트로파모나스(Stenotrophamonas), 스키조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 또는 스트렙토미세스(Streptomyces)로부터의 세포들을 포함한다(단, 이로 제한되지 않음). 몇몇 구현예들에서, 숙주 세포는 그람-양성(Gram-positive) 박테리아 세포이다. 다른 구현예들에서, 숙주 세포는 그람-음성(Gram-negative) 박테리아 세포이다. 몇몇 구현예들에서, 숙주 세포는 대장균 세포이다. 몇몇 구현예에서, 숙주 세포는 대장균 B 세포, 대장균 C 세포, 대장균 K 세포, 또는 대장균 W 세포이다. 다른 구현예들에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실러스 리케니포르미스(Bacillus lichenoformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 투린지엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸리스(Bacillus subtilis) 세포, 또는 바실러스 아밀로리퀴파시엔스(Bacillus amyloliquefaciens) 세포이다. 다른 구현예들에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르에세이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길루스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길루스 포에티두스(Aspergillus foetidus) 세포, 아스페르길루스 니둘란스(Aspergillus nidulans) 세포, 아스페르길루스 니게르(Aspergillus niger) 세포, 아스페르길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스오파쿠스(Rhodococcusopacus) 세포, 리조무코르미에헤이(Rhizomucormiehei) 세포, 또는 무코르미에헤이(Mucormichei) 세포이다. 또 다른 구현예들에서, 숙주 세포는 스트렙토미세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토미세스 무리누 스(Streptomyces murinus) 세포이다. 또 다른 구현예들에서, 숙주 세포는 방선균(Actinomycetes) 세포이다. 몇몇 구현예들에서, 숙주 세포는 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 세포이다.
다른 구현예들에서, 숙주 세포는 진핵 식물(eukaryotic plant) 세포, 조류 세포, 남세균(cyanobacterium) 세포, 녹색-황 세균 세포, 녹색 비-황 세균(green non-sulfur bacterium) 세포, 자색 황 세균 세포, 자색 비-황 세균 세포, 극한 생물(extremophile) 세포, 효모 세포, 균류 세포, 본 명세서에 설명된 종들 중 어느 것의 조작된 세포, 또는 합성 유기체이다. 몇몇 구현예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 구현예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 몇몇 구현예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 몇몇 구현예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 특정 구현예들에서, 숙주 세포는 애기장대(Arabidopsis thaliana), 파니쿰 비르가툼(Panicum virgatum), 미스칸투스 기간테우스(Miscanthus giganteus), 제아 메이스(Zea mays), 보트리오코쿠스 브라우니(Botryococcuse braunii), 녹조류(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종(Synechocystis Sp .) PCC 6803, 서모시네코코쿠스 엘롱게이트(Thermosynechococcus elongates) BP-1, 클로로비움 테피둠(Chlorobium tepidum), 클로로프렉수스 아우란티쿠스(Chlorojlexus auranticus), 크로마티움 비 노숨(Chromatiumm vinosum), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 로도박터 캡술라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리디움 융달리(Clostridium ljungdahlii), 클로스트리디움 서모셀룸(Clostridium thermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아파스토리스(Pichiapastoris), 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 스키조사카로미세스 폼베(Schizosaccharomyces pombe), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다. 일 구현예에서, 미생물 세포는 프로클로로코쿠스(Prochlorococcus), 시네코코쿠스, 시네코시스티스, 시아노테세(Cyanothece), 및 노스톡 펑크티포르메(Nostoc Punctiforme)를 포함하는 시아노박테리아로부터의 세포이다(단, 이로 제한되지 않음). 또 다른 구현예에서, 미생물 세포는 시네코코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 시네코코쿠스 종 PCC7001을 포함하는 특정한 시아노박테리아 종들으로부터의 세포이다(단, 이로 제한되지 않음).
재조합 미생물들로부터 유도된 생성물
본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 미국 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 물질(Standard Reference Material: SRM) 4990B 및 4990C에 의해 정의된 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 14C/12C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 약 1.1이다. 바이오생성물(예를 들어, 본 발명에 따라 생성되는 ω-OH 지방산들 및 유도체들을 포함하는 지방산 유도체들)은 생물학적으로 생성되는 유기 화합물을 포함한다. 특히, 본 명세서의 지방산 생합성 경로를 이용하여 생성되는 지방산 유도체들(예를 들어, ω-OH 지방산들 및 이의 유도체들)은 재생가능한 공급원들로부터 생성되지 않았으며, 이를테면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유도되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예를 들어, 글루코오스 대 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예를 들어, 미국 특허 7,169,588 참조). 석유 기반 유기 화합물들과 바이오생성물들을 구별하는 능력은 상업적으로(in commerce) 이러한 물질들을 추적하는데 유익하다. 예를 들어, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 모두를 포함하는 유기 화합물들 또는 화학물질들은 석유 기반 물질들로만 만들어진 유기 화합물들 및 화학물질들과 구별될 수 있다. 따라서, 본 명세서의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플의 안정적인 탄소 동위원소 비율(13C/12C)을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물의 13C/12C 비율은, 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 13C/12C 비율의 결과이다. 또한, 이는 정확한 대사 경로를 반영한다. 또한, 국부적인 변이들도 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 13C/12C 및 대응하는 δ13C 값들에서 상당한 차이를 나타낸다. 또한, C3 및 C4 식물들의 지질 물질은 대사 경로의 결과로서 동일한 식물들의 탄수화물 성분들로부터 유래된 물질들과 상이하게 분석한다. 측정의 정확도 내에서, 13C은 동위원소 분별 효과(fractionation effect)들로 인하여 큰 변화들을 나타내며, 바이오생성물들에 대한 이의 가장 중요한 점은 광합성 메카니즘이다. 식물들에서의 탄소 동위원소 비율 차이의 주요한 원인은 식물들에서의 광합성 탄소 대사의 경로, 특히 일차 카르복실화(primary carboxylation)(즉, 대기 중 CO2의 초기 고정) 동안 발생하는 반응의 차이들과 밀접하게 관련된다. 식생의 크게 두 가지 부류들은 C3[또는 캘빈-벤슨(Calvin-Benson)] 광합성 사이클을 병합하는 것들 및 C4[또는 해치-슬랙(Hatch-Slack)] 광합성 사이클을 병합하는 것들이다. C3 식물들에서, 일차 CO2 고정 또는 카르복실화 반응은 효소인 리불로오스-1,5-디포스페이트 카르복실라아제를 수반하며, 첫번째 안정적인 생성물은 3-탄소 화합물이다. 경목(hardwood) 및 침엽수들과 같은 C3 식물들은 온대 기후 지역들에서 우세하다. C4 식물들에서, 또 다른 효소인 포스포엔올-피루베이트 카르복실라아제를 수반하는 부가적인 카르복실화 반응은 일차 카르복실화 반응이다. 첫번째 안정적인 탄소 화합물은 이후에 탈카르복실화되는 4-탄소산(carbon acid)이다. 이에 따라 방출된 CO2는 C3 사이클에 의해 재고정된다. C4 식물의 예시들은 열대형 목초들, 옥수수, 및 사탕수수이다. C4 및 C3 식물들이 모두 13C/12C 동위원소 비율의 범위를 나타내지만, 통상적인 값들은 C4 식물에 대해 약 -7 내지 약 -13 퍼밀(per mil)이고, C3 식물에 대해 약 -19 내지 약 -27 퍼밀이다[예를 들어, Stuiver 외(1977) Radiocarbon 19:355 참조]. 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다. 13C 측정 척도는 본래 Pee Dee Belemnite(PDB) 석회암에 의한 제로 세트(zero set)에 의해 정의되며, 여기서 값들은 이 재료로부터 천분율 편차로 주어진다. δ13C 값들은 천분율(퍼밀), 약어로는 ‰로 표현되고, 아래와 같이 계산된다:
PDB 표준 물질(RM)이 고갈되었으므로, 일련의 대안적인 RM들이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차에 대한 표기는 δ13C이다. 질량 44, 45 및 46의 분자 이온들에 대한 고정밀 안정 비율 질량 분석(high precision stable ratio mass spectrometry)(IRMS)에 의해 CO2에 대해 측정이 행해진다. 본 명세서에서 설명되는 조성물들은 본 명세서에서 설명되는 방법들 중 어느 하나에 의해 생성되는 바이오생성물을 포함하며, 예를 들어 지방산 유도성 생성물을 포함한다. 구체적으로, 바이오생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ13C를 가질 수 있다. 예를 들어, 바이오생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ13C를 가질 수 있다. 다른 경우들에서, 바이오생성물은 약 -10, -11, -12 또는 -12.3의 δ13C를 가질 수 있다. 또한, 본 명세서의 기재내용에 따라 생성되는 바이오생성물은 각 화합물의 14C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 14C는 핵 반감기가 5730년이기 때문에, 더 오래된 탄소를 함유한 석유 기반 연료가 더 새로운 탄소를 함유한 바이오생성물과 구별될 수 있다[예를 들어, Currie, Source Apportionment of Atmospheric Particles, Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series(Lewis Publishers, Inc.) 3-74, (1992) 참조]. 방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 14C 농도의 항상성(constancy)이 생물(living organism)의 14C의 항상성을 유도한다는 것이다. 하지만, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, 14C는 제 2의, 지구화학적인 시간 특성을 얻었다. 대기 CO2 및 이에 따른 생물권(living biosphere)에서의 그 농도는 1960년대 중반의 핵실험 피크의 거의 두 배였다. 이후, 7년 내지 10년의 근사적 이완 "반-감기"(approximate relaxation "half-life")를 갖는, 약 1.2×10-12의 정상-상태 우주기원(steady-state cosmogenic) (대기) 기준 동위원소 비율(14C/12C)로 점진적으로 복귀되었다. 이 후자의 반감기가 문자 그대로 받아들여져야 하는 것이 아니라; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 14C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 14C 시간 특성이다. 14C는 현대 탄소의 분율(fM)의 단위로 주어지는 결과들을 갖는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있다. fM은 미국 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의된다. 본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxⅡ로 알려져 있는 미국 국립표준기술연구소(NIST) 표준 물질(SRM) 4990B 및 4990C에 의해 정의되는 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 14C/12C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재에 거의 등가이다. 현재 생물권(식물 재료)에 대하여, fM은 약 1.1이다. 본 명세서에서 설명되는 조성물들은 적어도 약 1의 fM 14C를 가질 수 있는 바이오생성물을 포함한다. 예를 들어, 본 발명의 바이오생성물은 적어도 약 1.01의 fM 14C, 약 1 내지 약 1.5의 fM 14C, 약 1.04 내지 약 1.18의 fM 14C, 또는 약 1.111 내지 약 1.124의 fM 14C를 가질 수 있다.
14C의 또 다른 측정은 pMC(percent of modern carbon)로 알려져 있다. 14C 연대를 이용하는 고고학자 또는 지질학자에 대하여, AD 1950년은 0의 해(zero years old)와 같다. 또한, 이는 100 pMC를 나타낸다. 대기 중의 핵무기 탄소(bomb carbon)는 열(thermo)-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 근사화되었으며, AD 1950년 이후로 살아 있는 식물들 및 동물들에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이는 시간이 지나면서 107.5 pMC 부근인 현재의 값으로 점차 감소하였다. 이는 옥수수와 같은 신선한(fresh) 바이오매스 물질이 107.5 pMC 부근의 14C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물들은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유도할 것이다. 107.5 pMC가 오늘날의 바이오매스 물질의 14C 함량을 나타내고 0 pMC가 석유 기반 생성물의 14C 함량을 나타낸다고 가정함으로써, 물질에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들어, 오늘날의 콩으로부터 100 % 유도된 물질은 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 물질이 석유 기반 생성물로 50 % 희석되었다면, 이는 약 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 107.5 pMC와 같은 100 %, 및 0 pMC와 같은 0 %를 할당함으로써 유도된다. 예를 들어, 99 pMC로 측정된 샘플은 93 %의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값은 평균 생물학적 기반 탄소 결과로 지칭되며, 오늘날의 생물학적 물질 또는 석유 기반 물질 중 어느 하나로부터 비롯된 분석된 물질 내의 모든 성분을 가정한다. 본 명세서에서 설명되는 바와 같은 하나 이상의 지방산 유도체를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 90, 91, 92, 93, 94, 또는 94.2의 pMC를 가질 수 있다.
ω-
하이드록시
지방산 유도체들 및 조성들(Formulations)
ω-하이드록실 지방산 유도체들과 같은 화합물들은 다수의 산업 적용분야들에서 귀중하고 바람직한 분자들이다. 본 발명은 생체 내에서 재조합 미생물들을 통해 이러한 화합물들을 생성하고, 이에 의해 다양한 범위의 유용한 생성물들을 생성한다. 이러한 생성물들은 ω-하이드록시 지방산 유도체들을 포함한다. ω-하이드록시 지방산 유도체들은 ω-하이드록시 지방산들; ω-하이드록시-지방산 메틸 에스테르들; ω-아미노 지방산들; ω-옥소 지방산들; ω-아미노 지방산 메틸 에스테르들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디에스테르들; 및 α,ω-디올들 그리고 이의 화합물들을 포함한다(단, 이로 제한되지 않음). 대부분 짝수 사슬의 ω-하이드록시-지방산 유도체들이 본 명세서에 설명되지만, 7 개, 9 개, 11 개, 13 개, 15 개, 19 개 등의 탄소들과 같이 홀수 사슬의 ω-하이드록시-지방산 유도체들이 또한 포함된다.
ω-하이드록시 지방산의 예시들은 8-하이드록시 옥탄산, 10-하이드록시 데센산, 10-하이드록시 데칸산, 12-하이드록시 도데센산, 12-하이드록시 도데칸산, 14-하이드록시 테트라데센산, 14-하이드록시 테트라데칸산, 16-하이드록시 핵사데센산, 16-하이드록시 헥사데칸산, 18-하이드록시 옥타데센산, 및 18-하이드록시 옥타데센산을 포함한다(단, 이로 제한되지 않음).
ω-하이드록시-지방산 메틸 에스테르의 예시들은 8-하이드록시 옥탄산 메틸 에스테르, 10-하이드록시 데센산 메틸 에스테르, 10-하이드록시 데칸산 메틸 에스테르, 12-하이드록시 도데센산 메틸 에스테르, 12-하이드록시 도데칸산 메틸 에스테르, 14-하이드록시 테트라데센산 메틸 에스테르, 14-하이드록시 테트라데칸산 메틸 에스테르, 16-하이드록시 헥사데센산 메틸 에스테르, 16-하이드록시 헥사데칸산 메틸 에스테르, 18-하이드록시 옥타데센산 메틸 에스테르, 및 18-하이드록시 옥타데센산 메틸 에스테르를 포함한다(단, 이로 제한되지 않음).
ω-아미노 지방산의 예시들은 8-아미노 옥탄산, 10-아미노 데센산, 10-아미노 데칸산, 12-아미노 도데센산, 12-아미노 도데칸산, 14-아미노 테트라데센산, 14-아미노 테트라데칸산, 16-아미노 헥사데센산, 16-아미노 헥사데칸산, 18-아미노 옥타데센산, 및 18-아미노 옥타데센산을 포함한다(단, 이로 제한되지 않음).
ω-아미노 지방산 메틸 에스테르의 예시들은 8-아미노 옥탄산 메틸 에스테르, 10-아미노 데센산 메틸 에스테르, 10-아미노 데칸산 메틸 에스테르, 12-아미노 도데센산 메틸 에스테르, 12-아미노 도데칸산 메틸 에스테르, 14-아미노 테트라데센산 메틸 에스테르, 14-아미노 테트라데칸산 메틸 에스테르, 16-아미노 헥사데센산 메틸 에스테르, 16-아미노 헥사데칸산 메틸 에스테르, 18-아미노 옥타데센산 메틸 에스테르, 및 18-아미노 옥타데센산 메틸 에스테르를 포함한다(단, 이로 제한되지 않음).
ω-옥소 지방산의 예시들은 8-옥소 옥탄산, 10-옥소 데센산, 10-옥소 데칸산, 12-옥소 도데센산, 12-옥소 도데칸산, 14-옥소 테트라데센산, 14-옥소 테트라데칸산, 16-옥소 헥사데센산, 16-옥소 헥사데칸산, 18-옥소 옥타데센산, 및 18-옥소 옥타데센산을 포함한다(단, 이로 제한되지 않음).
ω-옥소 지방산 메틸 에스테르의 예시들은 8-옥소 옥탄산 메틸 에스테르, 10-옥소 데센 메틸 에스테르, 10-옥소 데칸 메틸 에스테르, 12-옥소 도데센 메틸 에스테르, 12-옥소 도데칸 메틸 에스테르, 14-옥소 테트라데센 메틸 에스테르, 14-옥소 테트라데칸 메틸 에스테르, 16-옥소 헥사데센 메틸 에스테르, 16-옥소 헥사데칸 메틸 에스테르, 18-옥소 옥타데센 메틸 에스테르, 및 18-옥소 옥타데센 메틸 에스테르를 포함한다(단, 이로 제한되지 않음).
α,ω-이산의 예시들은 1,8-옥탄도익산(octanedoic acid), 1,10-데센디오익산, 1,10-데칸디오익산, 1,12-도데센디오익산, 1,12-도데칸디오익산, 1,14-테트라데센디오익산, 1,14-테트라데칸디오익산, 1,16-헥사데센디오익산, 1,16-헥사데칸디오익산, 1,18-옥타데센디오익산, 1,18-옥타데칸디오익산을 포함한다(단, 이로 제한되지 않음).
α,ω-디에스테르의 예시들은 1,8-옥탄 디메틸에스테르, 1,10-데센 디메틸에스테르, 1,10-데칸 디메틸에스테르, 1,12-도데센 디메틸에스테르, 1,12-도데칸 디메틸에스테르, 1,14-테트라데센 디메틸에스테르, 1,14-테트라데칸 디메틸에스테르, 1,16-헥사데센 디메틸에스테르, 1,16-헥사데칸 디메틸에스테르, 1,18-옥타데센 디메틸에스테르, 1,18-옥타데칸 디메틸에스테르를 포함한다(단, 이로 제한되지 않음).
α,ω-디올의 예시들은 1,8-옥탄디올, 1,10-데센디올, 1,10-데칸디올, 1,12-도데센디올, 1,12-도데칸디올, 1,14-테트라데센디올, 1,14-테트라데칸디올, 1,16-헥사데센디올, 1,16-헥사데칸디올, 1,18-옥타데센디올 및 1,18-옥타데칸디올을 포함한다(단, 이로 제한되지 않음).
짝수 사슬 ω-하이드록시-지방산 유도체들이 본 명세서에 설명되지만, 7 개, 9 개, 11 개, 13 개, 15 개, 19 개 등의 탄소들과 같이 홀수 사슬 ω-하이드록시-지방산 유도체들이 또한 포함된다. 홀수-사슬 ω-하이드록시 지방산의 예시들은, 예를 들어 11-하이드록시 운데센산(undecenoic acid), 11-하이드록시 운데칸산(undecanoic acid), 13-하이드록시 트리데센산, 13-하이드록시 트리데칸산, 15-하이드록시 펜타데센산, 15-하이드록시 펜타데칸산, 17-하이드록시 헵타데센산 및 17-하이드록시 헵타데칸산을 포함한다(단, 이로 제한되지 않음). 홀수-사슬 α,ω-이산의 예시들은, 예를 들어 1,11-운데센디오익산(undecenedioc acid), 1,11-운데칸디오익산(undecanedioc acid), 1,13-트리데센디오익산, 13-트리데칸디오익산, 1,15-펜타데센디오익산, 1,15-펜타데칸디오익산, 1,17-헵타데센디오익산 및 1,17-헵타데칸디오익산을 포함한다(단, 이로 제한되지 않음). 홀수-사슬 α,ω-디올의 예시들은, 예를 들어 1,11-운데센디올, 1,11-운데칸디올, 1,13-트리데센디올, 13-트리데칸디올, 1,15-펜타데센디올, 1,15-펜타데칸디올, 1,17-헵타데센디올 및 1,17-헵타데칸디올을 포함한다(단, 이로 제한되지 않음).
본 발명의 ω-하이드록시 지방산 유도체들의 화합물들 및 조성들은, 향미제, 향료, 윤활제, 겔, 다양한 중합체, 수지, 산업 유체, 접착제, 부식 억제제, 커패시터 전해질, 섬유, 분체 도료 경화제, 가소제, 폴리에스테르 도료, 에폭시 수지, 폴리아미드 수지, 계면활성제, 세제, 첨가제 등을 포함하는 바람직한 생성물들이 만들어질 수 있도록 배합(formulate)될 수 있다.
실시예들
다음의 예시들은 본 발명을 더욱 예시하며, 어떠한 방식으로도 그 범위를 제한하는 것으로 해석되어서는 안 된다.
실시예
1: ω-
하이드록시
지방산 유도체들의 생성을 위한 재조합 대장균 균주들을 배양
균주들은 LB(Luria-Bertani) 배지에서 하룻밤(over night) 성장되었다. 배양물들은 신선한(fresh) LB 배지 내에서 1:10으로 희석되었고, 32 ℃에서 2 내지 3 시간(h) 동안 성장되었으며, 이후 정의된 FA2 배지에서 1:10으로 다시 희석되었다(아래의 도 10 참조). 몇몇 실험들에서, 배지는 0.5 mM δ-아미노레불린산(aminolevulinic acid) 및 미량의 비타민 용액으로 보충되었다. 균주들이 각각의 항생wp 내성 마커(antibiotic resistance marker)들을 갖는 플라스미드들을 함유할 때, 스펙티모사이신(100 ㎍/ml) 또는 카나마이신(50 ㎍/ml)과 같은 항생제들이 추가되었다. 32 ℃에서 4 내지 5 시간 동안 성장 후, 배양물들이 1 mM IPTG로 유도되었고, 동일한 온도에서 또 16 내지 18 시간 동안 배양되었다. 몇몇 실험들에서, 유도 시 1 g/L의 최종 농도에서 도데칸산, 도데칸올 또는 도데칸산 메틸 에스테르가 첨가되었다. 유도 시 지방산 메틸 에스테르들의 유도체들을 생성하기 위한 배양물들이 메탄올(2 %, v/v)로 보충되었다.
표 10: FA2 배지 조성
실시예
2: ω-수산화 지방산 유도체들의 분석
ω-하이드록시 지방산 유도체들을 생성한 배양물들이 수득되었고, 교반기(vortexer)(DVX-2500 멀티-튜브 교반기, VWR)를 이용하여 30 분 동안 2500 rpm으로 부틸 아세테이트로 추출되었다. 추출물은 실온에서 15 분 동안 15000 rpm으로 에펜도르프 원심분리기(Eppendorf centrifuge)(분리기 5424)에서 원심분리되었다. 상청액(100 μL)이 주입구를 갖는 GC 바이알로 피펫팅되었고, 100 μL의 N,O-비스(트리메틸실릴)트리플루오로아세트아미드(BSTFA) 및 1 %의 트리메틸클로로실란(TMCS)을 첨가함으로써 유도되었으며, 30 초 동안 교반기를 이용하여 혼합되었다. 유도화를 갖는 상청액 및 유도화를 갖지 않는 상청액 둘 모두가 화합물 식별을 위한 크로마토그램 및 질량 스펙트럼을 생성하기 위해 별도로 GC-MS에 주입되었다. GC-MS 파라미터들은 다음과 같다:
GC-MS 파라미터들:
분석 컬럼(Analytical Column): cat# J&W 122-1111E의 Agilent로부터 이용가능한 DB-1HT, 15 m × 250 ㎛ × 0.1 ㎛
오븐 온도: 초기에 50 ℃에서 5 분동안 유지, 25 ℃/min으로 300 ℃까지 상승, 24 분의 총 실행 시간에 대해 5.24 분 동안 유지
컬럼 플로우(Column flow): 1.2 mL/분
유입구 온도(Inlet temperature): 300 ℃
샘플 크기: 1μL
분할 비(Split ratio): 20:1
소프트웨어: ChemStation E.02.01.1177
MS 파라미터들
전달 라인 온도(Transfer line temperature): 300 ℃
MS 소스: 230 ℃
MS 쿼드(Quad): 150 ℃
오토샘플러(Autosampler)
LEAP Technologies에 의해 배포된 Combi PAL(CTC 분석)
GC/FID 파라미터들:
FID가 구비된 가스 크로마토그래프 애질런트(Gas Chromatograph Agilent) 7890, 또는 등가물
데이터 시스템 켐스테이션 소프트웨어(Data System ChemStation software) B.04.03, 또는 등가물
분석 컬럼: DB-1 (10 m × 0.18 mm × 0.2 μM), 또는 등가물
오토샘플러: Combi PAL, CTC 분석(LEAP Technologies)
초기 온도: 60 ℃로 0.5 분 동안 유지, 25 ℃/min으로 300 ℃까지 상승, 11 분의 총 실행 시간에 대해 0.9 분 동안 유지
주입기 온도(Injector Temperature): 320 ℃
검출기: FID(Flame ionization detector)
검출기 온도: 350 ℃
수소 플로우: 40 mL/분
공기 플로우: 450 mL/분
메이크-업 플로우(Make-up Flow): 45 mL/분(N2)
분할 비: 50:1
컬럼 플로우: 0.8 mL/분
샘플 크기: 1 μL
실시예
3: 2 개의
cyp153A
P450 옥시게나아제
오페론들을
발현시키는 대장균 균주들에 의한
도데칸산의
12(ω)-
하이드록시
도데칸산으로의
전환
본 실시예는 cyp153A P450 옥시게나아제 오페론들을 발현시키는 재조합 대장균 균주들에 의한 외인성으로 첨가된 지방산의 ω-하이드록시 지방산으로의 전환을 나타낸다. 이 실험의 목적은 cyp153A P450 옥시게나아제 오페론들의 효율성을 조사하기 위한 것이었다. cyp153A P450 옥시게나아제들은 지금까지 시험관 내에서만 이용되었으며(예를 들어, Honda-Malca 외(2012) Chem . Commun. 48:5115-5117), 이 실험의 목적은 이러한 오페론들이 생체 내에서 외인성 지방산들이 제공될 때 ω-하이드록시 지방산 유도체를 생성할 수 있는지를 테스트하기 위한 것이었다.
2 개의 박테리아, 마리노박터 아쿠애올레이(수탁 번호 YP_957888; SEQ ID NO: 3) 및 미코박테리움 마리눔(수탁 번호 YP_001851443; SEQ ID NO: 59)으로부터의 cyp153A 오페론들은 이러한 유기체들의 게놈 DNA로부터 PCR 증폭되었다. 오페론들은 페레독신(fd), cyp153A P450 옥시게나아제 및 페레독신 리덕타아제(fdR)(위의 표 2A 및 2B 참조)를 코딩하는 유전자들로 만들어진다. 유전자들 및 유전자간 부위(intergenic region)들의 본래 순서가 보전되었지만, M. 마리움으로부터의 cyp153A16에서의 GTG 개시 코돈은 크로스오버(crossover) PCR에 의해 ATG 개시 코돈으로 대체되었다. PCR 앰플리머(amplimer)들은 pCL1920-유도 벡터[SC101 레플리콘(replicon), 스펙티노마이신 내성 마커]로 클로닝되어, 오페론들의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드들, pAS.017(아래의 표 11 참조) 및 pAS.018은, (아실-CoA 디하이드로게나아제를 코딩하는) fadE 유전자 또는 (아실-CoA 신테타아제를 코딩하는) fadD 유전자 중 어느 하나가 결실된 대장균 MG1655로 형질전환되었다. 이러한 균주들은 지방산들을 분해시킬 수 없음에 따라, 이러한 유전자들 또는 fadA 또는 fadB와 같은 다른 지방산 분해 효소들을 코딩하는 유전자들을 결실시킴으로써, 생성물로의 증가된 전환을 위해 지방산들의 이용성을 증가시키는 것이 달성될 수 있다. 하지만, 이는 선택적이며, 유리 지방산들이 외인성으로 공급되거나 생성 경로의 중간체들인 때에 구현될 수 있다[표 1(위 참조)은 숙주 균주에서의 지방산들의 이용성을 증가시키기 위해 감쇠될 수 있는 다양한 지방산 분해 효소들을 포함하는, 대사 경로들 내의 효소 활성의 종합 목록을 제공한다]. 4 개의 결과적인 균주들이 표 12(아래 참조)에 요약되어 있다. 균주들은 실시예 1 및 2에 설명된 바와 같은 도데칸산의 12-하이드록시 도데칸산으로의 전환에 대해 분석되었다.
cyp153A 오페론을 발현시키지 않는 대조 균주 MG1655 ΔfadD와 비교 시, (BSTFA 유도화 후) RT 12.303 분에서 새로운 피크가 cyp153A 오페론들을 발현시키는 4 개의 모든 균주들의 GC-MS 크로마토그램에서 검출되었다(도 6 참조, 균주들 sAS.320 및 sAS.321만이 여기에 나타나 있다). RT 12.303 분에서 피크인 질량 스펙트럼이 도 7a에 도시되어 있다. 단편화 패턴은 이 피크가 12-하이드록시 도데칸산의 유도된 형태(derivatized form)인 12-트리메틸실릴옥시 도데칸산 트리메틸실릴 에스테르임을 나타내었다. 12-트리메틸실릴옥시 지방산 트리메틸실릴 에스테르들에 대한 특징적인 이온 단편들이 도 8a에 도시되어 있다. (도면에 도시되어 있지는 않지만 존재하는) m/z = 129, 147, 204 및 217의 이온들이 이러한 화합물들에 유용한 진단적 마커들이다. m /z 255의 이온은 이 화합물(도 8a 참조)의 하이드록실 측(side)으로부터의 (CH3)3SiOH 및 카르복실 측(m/z = 345)으로부터의 CH3의 손실 후 사슬 길이를 결정하는데 사용되었다. 또한, 이 피크의 정확한 식별(correct identification)은 그 보유 시간 및 질량 스펙트럼을 도 7b에 도시된 바와 같은 12-트리메틸실릴옥시 도데칸산 트리메틸 실릴 에스테르 진정적 표준과 비교함으로써 확인되었다. 또한, 유도화 전의 이 화합물의 질량 스펙트럼이 기록되었으며, 도 7c에 도시되어 있다. 유도되지 않은 화합물의 특징적인 이온 단편들이 도 8b에 도시되어 있다. (도시된) m/z = 98 및 84의 이온들은 ω-하이드록시 지방산들에 유용한 진단 마커들이다. m /z 186의 이온은 하이드록실 측으로부터의 CH2O의 손실에 의한 12-하이드록시도데칸산의 특징적 단편이다. 이 화합물의 분자는 m/z 186의 단편 이온에 CH2O를 추가함으로써 216이도록 결정될 수 있다.
따라서, 마리노박터 아쿠애올레이 및 미코박테리움 마리눔으로부터 cyp153A 오페론들을 발현시키는 대장균은 숙주 세포들 내에서 생체 내에서 외인성 도데칸산을 12-하이드록시 도데칸산으로 전환시켰다. 이와 같이, 효소가 실제적으로 ω-하이드록시 지방산 유도체들을 생성할 수 있음이 확인되었다. 하지만, 이 효소의 전환 효율성은 오히려 낮았다. 따라서, cyp153A 오페론들의 효소 활성은 그들 자체로는 ω-하이드록시 지방산 유도체들의 생성에 이상적이라고 예상되지 않으며, 더 높은 전환 효율성을 갖는 효소를 설계하기 위해서는 추가적인 조작이 요구된다고 판단되었다.
표 11: ω-수산화 지방산 유도체들의 생성을 위한 발현
플라즈마들
표 12: 지방산 유도체들의 ω-수산화 지방산 유도체들로의 전환을 위한 재조합
cyp153A
발현 대장균 균주들
실시예
4: 변형된
cyp153A
P450 옥시게나아제
오페론을
발현시키는 대장균 균주에 의한
도데칸산의
12(ω)-
하이드록시
도데칸산으로의
전환
본 실시예는 변형된 cyp153A P450 옥시게나아제 오페론을 발현시키는 재조합 대장균 균주에 의한 외인성으로 첨가된 지방산의 ω-하이드록시 지방산으로의 전환을 나타낸다. 유사하게, 이 실험의 목적은 생체 내에서 ω-하이드록시 지방산 유도체들의 생성을 위해 이 변형된 cyp153A P450 옥시게나아제 오페론의 능력 및 효율성을 조사하기 위한 것이었다.
글리신 307이 알라닌으로 대체된 M. 아쿠애올레이로부터의 cyp153A의 돌연변이체가 이전에 설명되었다(Honda-Malca 외(2012) Chem . Commun. 48:5115-5117 참조). 플라스미드 pAS.017(위의 실시예 3 참조)이 다음과 같은 방식으로 변형되었다: cypl53_Maqu의 Gly307을 특정화하는 코돈이 GGC로부터 Ala를 특정화하는 GCC로 변화되었고, 또한 cypl56 오페론의 2 개의 원래의 유전자간 부위(IGR)들이 합성 IGR들(TAAGGAGGAAAACAAA)(SEQ ID NO: 65)로 대체되었다. 결과적인 플라스미드는 pAS.022(위의 표 11 참조)로 명명되었고, 균주 sAS.335(위의 표 12 참조)를 제공하는 대장균 MG1655 ΔfadD로 형질전환되었다. 균주는 실시예 1 및 2(위 참조)에 설명된 바와 같이 도데칸산의 12-하이드록시 도데칸산으로의 전환에 대해 분석되었다. 도 9에서 알 수 있는 바와 같이, sAS.335는 sAS.320보다 더 많은 도데칸산을 12-하이드록시 도데칸산으로 전환시켰으며, 12-하이드록시 도데칸산의 양은 37.4 ± 0.3 mg/L로 정량화되었다.
따라서, 마리노박터 아쿠애올레이로부터의 변형된 cyp153A 오페론들을 발현시키는 대장균은 (실시예 3에 비해) 생체 내에서 외인성 지방산이 공급될 때 외인성 도데칸산의 12-하이드록시 도데칸산으로의 다소 개선된 전환을 나타내었다. 하지만, 이 효소의 효율성 전환은 여전히 너무 낮았다. 따라서, 마리노박터 아쿠애 올레이로부터의 변형된 cyp153A 오페론들의 효소 활성은 여전히 그들 자체로는 ω-하이드록시 지방산 유도체들의 생성에 이상적이라고 예상되지 않으며, 더 높은 전환 효율성을 갖는 효소를 설계하기 위해서는 여전히 추가적인 조작이 요구된다고 판단되었다.
실시예
5: 혼성
cyp153A
-
Red450RhF
융합 단백질을 발현시키는 대장균 균주에 의한 지방산 유도체들의 ω-수산화 지방산
유도체들으로의
전환
본 실시예는, cyp153A P450 옥시게나아제가 리덕타아제 도메인과 융합되는 혼성 단백질을 발현시키는 대장균 균주에 의한, 외인성으로 추가된 지방산들, 지방산 메틸 에스테르들 또는 지방족 알코올들의 각각 ω-하이드록시 지방산들, ω-하이드록시 지방산 메틸 에스테르들 또는 α,ω-디올들로의 전환을 나타낸다. 이 실험의 목적은, ω-하이드록시 지방산 유도체들의 상당히 개선된 생성을 위해 cyp153A P450 옥시게나아제가 리덕타아제 도메인과 융합되는 혼성 융합 단백질을 생성하는 것이었다.
자족적 시토크롬 P450 옥시게나아제들은 리덕타아제 파트너가 시토크롬 P450 촉매 단백질과 융합되는 효소들이다. 자족적 박테리아 시토크롬 P450 옥시게나아제들의 한 부류는 로도코쿠스 종 NCIMB 9784(Roberts 외(2003) J. Biol . Chem. 278: 48914; Hunter 외(2005) FEBS Lett . 579: 2215)로부터의 P450RhF에 의해 나타내어지며, "클래스-I P450-융합 PFOR"(DeMot and Parret(2002) Trends Microbiol . 10: 502)이라고도 지칭된다.
이 실험에서, 로도코쿠스 종 NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 리덕타아제 도메인 및 마리노박터 아쿠애올레이로부터의 cyp153A(G307A) P450 촉매 단백질로 만들어지는 혼성-융합 단백질을 코딩하는 유전자는 다음과 같이 생성되었다: cyp165A(G307A)_Maqu 유전자는 pAS.022로부터 증폭되었고, 크로스-오버 PCR에 의해 코돈-최적화 합성 P450RhF 리덕타아제 도메인과 융합되었다. 결과적인 융합 유전자(SEQ ID NO: 5)는 pCL1920-유도체[즉, SC101 레플리콘, 스펙티노마이신 내성 마커]로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 플라스미드는 pAS.023(위의 표 11 참조)으로 명명되었고, 균주 sAS.336(아래의 표 12 참조)를 제공하는 대장균 MG1655 ΔfadD로 형질전환되었다.
이후, 균주 sAS.336은, 실시예 1 및 2에 설명된 바와 같이, (i) 도데칸산의 12-하이드록시 도데칸산으로의 전환, (ii) 도데칸산 메틸 에스테르의 12-하이드록시 도데칸산으로의 전환, 및 (ⅲ) 도데칸올의 1,12-도데칸디올로의 전환에 대해 분석되었다. 대조 균주 MG1655 ΔfadD(위 참조)와 비교 시, GC/MS 크로마토그래피들의 추가된 3 개의 모든 화합물들에 대해 sAS.336에서 새로운 피크들이 식별되었다(BSTFA 유도화 후, 도 10a 내지 도 10c 참조). 12-하이드록시 도데칸산은 실시예 3(위 참조)에 설명된 바와 같이 식별되었다. (BSTFA 유도화 후) RT 11.946 및 RT 11.668 분에서의 새로운 피크들이 각각 1,12-도데칸디올 및 12-하이드록시 도데칸산 메틸 에스테르로서 식별되었다.
RT 11.948 분에서 피크인 질량 스펙트럼이 도 11a에 도시되어 있다. 이온 단편화 패턴은 이 피크가 1,12-도데칸디올의 유도된 형태인 1,12-비스(트리메틸실록시) 도데칸임을 나타내었다. 1,12-비스(트리메틸실록시)도데칸에 대한 이온 단편 패턴은 도 13a에 도시되어 있다. m /z = 147의 이온은 모든 디올-관련 화합물들에 대한 특징적 단편이고, m/z = 55, 69, 83, 97, 111 및 125의 이온들은 HOSi(CH3)3 모이어티의 손실 후의 특징적 알릴 절단 단편들이었다. m /z = 214의 이온은 도 13a에 도시된 바와 같이 α,ω-디올 화합물들의 사슬 길이를 결정하기 위한 특징적 진단 마커이다. 이 피크의 정확한 식별은 그 보유 시간과 질량 스펙트럼을 BSTFA+1%TMCS로 유도된 1,12-도데칸디올의 진정적 표준의 그것과 비교함으로써 더욱 확인되었다(도 11b). 다른 α,ω-디올들의 사슬 길이가 유사하게 결정될 수 있다. 예를 들어, 피크가 m/z 269에서 단편을 갖고, m/z 147, 149, 111, 97, 83, 69 및 55에서 다른 특징적 이온들을 갖는 경우, 이 피크는 1,14비스(트리메틸실록시)테트라데칸일 것이다. 불포화 α,ω-디올들의 식별을 위해 유사한 규칙들이 적용될 수 있다. 불포화 α,ω-디올들이 그들의 포화 상대방보다 더 적은 2 개의 질량 단위를 갖기 때문에, 특징적 진단 단편은 1,12-비스(트리메틸실록시)도데센에 대해 m/z = 239이다.
RT 11.668 분에서 피크인 질량 스펙트럼이 도 12a에 도시되어 있다. 이 피크는 이 화합물의 이온 단편화 패턴에 기초하여 12-트리메틸실록시도데칸산 메틸 에스테르로서 식별되었다. 도 13b에서 입증된 바와 같이, 분자는 m/z = 287(M-CH3) 및 255(M-CH3-HOCH3)에서 2 개의 지배적 이온들로 단편된다. 또한, 질량 스펙트럼은 m/z = 271(M-OCH3)에서 특징적 이온을 나타내었으며, 이때 이 분자는 메틸 에스테르 모이어티를 가짐을 암시한다. m /z = 103의 이온은 트리메틸실록시기가 말단 위치에 있음을 암시한다. 또한, m/z = 287 및 255의 이온들은 이 화합물의 사슬 길이를 결정하기 위한 특징적 이온들이다(도 13b 참조). 따라서, 피크가 m/z = 315 및 283에서 단편화 이온들을 갖고, m/z = 55 및 103에서 다른 이온들을 갖는 경우, 피크는 14-트리메틸실록시 테트라데칸산 메틸 에스테르로서 식별될 수 있다. 이 규칙은 균주 stEP677(아래의 실시예 6 참조)에 의해 생성된 상이한 사슬 길이의 ω-하이드록시 지방산 메틸 에스테르들을 식별하는데 사용되었다.
표 13(아래 참조)은 32 ℃에서 18h 이내에 균주 sAS.336에 의해 전환된 ω-수산화 지방산 유도체들의 양을 나타낸다. 표 13에서 알 수 있는 바와 같이, pAS.023으로부터 발현된 혼성 cyp153A-RedRhF 융합 단백질은 테스트되었던 다른 효소들(위 참조)과 비교 시 외인성 지방산 유도체들을 ω-수산화 지방산 유도체들로 효율적으로 전환시켰다. 따라서, 이 조작된 효소는 재생가능한 공급원료를 통한 조작된 생성 숙주들을 통해 생체 내에서 ω-하이드록시 지방산 유도체들의 생성을 위해 선택되었다(아래의 실시예 6 참조).
표 13: sAS.336에 의해 형성된 ω-수산화 지방산 유도체들
실시예
6:
CYP153A
-
Red450RhF
혼성 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-수산화 지방산 유도체들의 생성
본 실시예는 CYP153A P450 옥시게나아제가 리덕타아제 도메인과 융합되는 키메라 혼성 단백질을 발현시키는 재조합 대장균 숙주들에 의해, 글루오코스와 같은 재생가능한 탄수화물 공급원료로부터 ω-하이드록시 지방산, ω-하이드록시 지방산 메틸 에스테르 및 α,ω-디올들의 생성을 나타낸다.
CYP153A(G307A)-RedRhF 혼성 융합 유전자를 코딩하는 유전자가 pAS.023 으로부터 증폭되었고, pACYC 유도 벡터(p15a 레플리콘, 카나마이신 내성 마커)로 클로닝되어, 융합 유전자의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드는 pEP.125(위의 표 11 참조)로 명명되었다.
글루코오스와 같은 탄수화물 기질로부터 지방산들 또는 지방산 유도체들을 과잉생성하도록 별도로 조작된 6 개의 재조합 대장균 균주들(아래의 표 14 참조)은 ω-수산화 지방산 유도체-생성 균주들(아래의 표 15 참조)을 생성하기 위해 플라스미드 pAS.023 또는 pEP.125 중 어느 하나로 형질전환되었다. 또한, 과잉생성 지방산- 또는 지방산 유도체 균주들은 ω-수산화 지방산 유도체-생성 균주들의 새로운 화합물들을 용이하게 식별하기 위해 대조 균주들로서 역할하였다. 이러한 지방산- 또는 지방산 유도체-과잉생성 균주들은 여기서 간명하게 설명되지만, 제한하는 것으로 해석되어서는 안 된다. 균주 ALcV334 게놈은 다음과 같이 생성되었다: fadE(아실-CoA 디하이드로게나아제) 유전자가 결실되었고, 티오에스테라아제 tesA의 변이체가 과발현되었다. ALcV334의 유전자 조작에 덧붙여, 균주 XL897의 게놈은 다음의 조작들을 포함하였다: 포스포판테테이닐 트랜스퍼라아제 유전자 및 합성 지방산 생합성 오페론(표 1에 설명된 수 개의 유전자들을 포함함)이 과발현되었고, 카르복실산 리덕타아제(carB)의 변이체; 티오에스테라아제(tesA)의 변이체; 알코올 디하이드로게나아제(AlrA); 3-케토-아실-ACP 신타아제(fabB)의 변이체; 및 전사 조절인자(transcriptional regulator: fadR)를 포함하는 수 개의 오페론들이 통합되었다. 균주 DAM1 게놈은 다음과 같이 조절되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었고, 대장균 티오에스테라아제(tesA) 및 아실-CoA 신타아제(fadD) 유전자들이 과발현되었다.
균주들 stNH1293, KASH286 및 stNT29의 게놈들은 다음과 같이 조작되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었고, 전사 조절인자(fadR) 및 합성 지방산 생합성 오페론이 과발현되었다. 또한, 균주 stNH1293은 식물 티오에스테라아제, 아실기 운반 단백질(acp) 유전자 및 아세틸-CoA 카르복실라아제(acc) 유전자 복합체를 발현시키는 플라스미드를 함유하였다. 균주 KASH286은 에스테르 신타아제의 변이체를 발현시키는 플라스미드를 함유하였다. 균주 stNT29는 아실 ACP 리덕타아제(AAR)의 변이체, 알코올 디하이드로게나아제(AlrA), 아실기 운반 단백질(acp) 및 아세틸-CoA 카르복실라아제(acc) 유전자 복합체를 함유하였다.
표 14: 지방산들 또는 지방산 유도체들을 과잉생성하는 재조합 대장균 균주들
이후, ω-수산화 지방산 유도체들을 생성(생산)하도록 조작된 균주들(위 참조)은 실시예 1 및 2에 설명된 글루코오스와 같은 재생가능한 공급원료로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석되었다. ω-수산화 지방산들, 지방산 메틸 에스테르들 및 지방족 알코올들은 실시예 3 및 5에 설명된 바와 같이 식별되었다.
표 15: 재생가능한 탄수화물 공급원료들로부터의 ω-수산화 지방산 유도체들의 생성을 위한
cyp153A
(
G307A
)-
RedRhF
융합 단백질을 발현시키는 재조합 대장균 균주들
표 16: 글루코오스로부터의 재조합 대장균 균주들에 의해 생성된 ω-수산화 지방산 유도체들
대조 균주들(위의 표 14 참조)과 비교 시, (실시예 5에 설명된 바와 같이) ω-하이드록시 지방산들, ω-하이드록시 지방산 메틸 에스테르들 및 α,ω-디올들(도 14a 내지 도 14c 참조)에 대응하는 cyp153A-RedRhF 융합 단백질(위의 표 15 참조)을 발현시키는 모든 균주들에서 새로운 피크들이 식별되었다. 표 16은 20h(시간) 이내에 글루코오스로부터 이러한 재조합 균주들에 의해 생성된 ω-하이드록시 지방산 유도체들의 양을 나타낸다. 표 16으로부터 알 수 있는 바와 같이, 재조합 숙주 세포들에 의해 만들어진 ω-하이드록시 지방산 유도체들의 양은 상당하였다. 특히, ω-하이드록시 지방산 생성은 매우 효율적인 것으로 밝혀졌다. 균주 stEP675에 의해 생성된 ω-하이드록시 지방산들은 상청액에서 거의 독점적으로 발견된 점이 주목할 만하며(도 15 참조), 이는 세포들이 그들의 생성물을 상청액에 방출했음을 나타낸다. 도 16은 균주들 stEP675 및 stEP682에 의해 생성된 ω-하이드록시 지방산의 조성을 나타낸다. 균주 stEP682에 의해 생성된 가장 풍부한 ω-하이드록시 지방산은 12-하이드록시도데칸산(79 %)이었다. 14-하이드록시테트라데칸산(42 %)이 stEP675에 의해 생성된 가장 풍부한 ω-하이드록시 지방산이었다.
전반적으로, 균주들 stEP675는 다음과 같은 ω-하이드록시 지방산들: 12-하이드록시도데센산, 12-하이드록시도데칸산, 14-히드록시테트라데센산, 14-하이드록시테트라데칸산, 16-하이드록시헥사데센산, 16-하이드록시헥사데칸산 및 18-하이드록시옥타데센산을 생성하였다(도 14a 참조). 균주들 stEP682는 다음과 같은 ω-하이드록시 지방산들: 12-하이드록시도데센산, 12-하이드록시도데칸산, 14-하이드록시테트라데센산, 14-하이드록시테트라데칸산, 16-하이드록시헥사데센산 및 16-하이드록시헥사데칸산을 생성하였다. 균주들 stEP677은, ω-하이드록시 지방산들 이외에도, 다음과 같은 ω-하이드록시 지방산 메틸 에스테르들: 12-하이드록시도데칸산 메틸 에스테르, 14-하이드록시테트라데칸산 메틸 에스테르 및 16-하이드록시헥사데칸산 메틸 에스테르를 생성하였다(도 14b 참조). 균주들 stEP684는, ω-하이드록시 지방산들 이외에도, 다음과 같은 ω-하이드록시 지방산 메틸 에스테르들: 14-하이드록시테트라데칸산 메틸 에스테르, 16-하이드록시헥사데센산 메틸 에스테르 및 16-하이드록시헥사데칸산 메틸 에스테르를 생성하였다. 균주들 stEP676은 다음과 같은 α,ω-디올들: 1,12-도데센디올, 1,12-도데칸디올, 1,14-테트라데칸디올, 1,16-헥사데센디올 및 1,16-헥사데칸디올을 생성하였다(도 14c). 균주들 stEP685는 다음과 같은 α,ω-디올들: 1,14-테트라데칸디올, 1,16-헥사데센디올 및 1,16-헥사데칸디올을 생성하였다.
특히, 이 실시예는 CYP153A-RedRhF 혼성 융합 단백질의 발현과 조합될 때 지방산 유도체들을 과잉생성하도록 조작된 대장균 균주들이 유일한 탄소원으로부터 ω-수산화 지방산 유도체들을 효율적으로 생성했음을 나타내었다. 또한, ω-수산화 지방산들이 발효액 내로 효율적으로 분비되었으며(즉, 생성 세포들 또는 숙주 세포들이 발효액 내로 생성물을 분비함), 이는 본 발명의 바람직한 특성이다.
실시예
7: 재조합 대장균 균주에 의한 글루코오스로부터의
α,ω
-이산들의 생성
본 실시예는, cyp153A P450 옥시게나아제가 리덕타아제 도메인 및 알코올 옥시다아제 및 알데히드 디하이드로게나아제와 융합된 키메라 혼성 단백질을 발현시키는 재조합 대장균 균주에 의해, 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 α,ω-이산들의 생성을 입증한다.
알코올 옥시다아제 alkJ(수탁 번호 CAB54054)(SEQ ID NO: 66) 및 알데히드 디하이드로게나아제 alkH(수탁 번호 CAB51050)(SEQ ID NO: 68)를 코딩하는 유전자들은 슈도모나스 퓨티다 ATCC 29347의 게놈 DNA로부터 증폭되었고, pACYC 유도 벡터(p15a 레플리콘, 카나마이신 내성 마커)로 클로닝되어, 2 개의 유전자들이 오페론을 형성하고, 오페론의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드가 pEP.126로 명명되었다(위의 표 11 참조). 플라스미드 pEP.126은 균주 sEP690을 산출하는 균주 AlcV334(위의 표 14 참조)에 플라스미드 pAS.023와 동시형질전환(cotransform)되었다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 α,ω-이산들을 생성할 수 있는 능력에 대해 분석되었다. 대조 균주 AlcV334와 비교 시, 도 17에서 알 수 있는 바와 같이 sEP690에서 수 개의 새로운 피크들이 식별되었다. 이러한 피크들은 α,ω-이산들 및 α,ω-비스(트리메틸실릴) 지방산 에스테르의 유도된 형태들로서 식별되었다. α,ω-비스(트리메틸실릴) 지방산 에스테르들의 이온 단편화 패턴은, α,ω-비스(트리메틸실릴) 지방산 에스테르들이 m/z = 103의 이온을 생성하지 않는 것을 제외하고, α,ω-디올들의 유도된 형태들(실시예 3 참조)인 α,ω-비스(트리메틸실록시) 지방족 알코올들과 매우 유사하다. 그러므로, 이 이온은 α,ω-비스(트리메틸실릴) 지방산 에스테르들(그리고 아래에 설명되는 바와 같은 ω-1, ω-2 및 ω-3 트리메틸실록시 지방족 알코올들)과 α,ω-비스(트리메틸실록시) 지방족 알코올들을 구별하기 위한 중요한 정보이다.
균주들 stEP690에 의해 생성된 주요 화합물들은 1,12-도데칸디오익산, 1,14-테트라데센디오익산, 1,14-테트라데칸디오익산, 1,16-헥사데센디오익산, 1,16-헥사데칸디오익산, 1,18-옥타데센디오익산이었다(도 17 참조). 이 균주에 의해 생성된 가장 풍부한 화합물은 RT 13.367 분에서 1,14-테트라데칸디오익산이었다. BSTFA 유도화 후 이 화합물의 질량 스펙트럼은 도 18a에 도시되어 있다. 이 화합물에 대한 분자 이온은 m/z = 387(M-CH3)이며, 그 단편화 패턴이 도 19에 도시되어 있다. 1,14-테트라데칸디오익산 비스(트리메틸실릴) 에스테르의 식별은 그 질량 스펙트럼 및 보유 시간을 BSTFA 유도화 후의 진정화 표준 1,14-테트라데칸디오익산의 그것과 비교함으로써 더욱 확인되었다.
표 16은 20h 이내에 글루코오스로부터 균주 sEP690에 의해 생성된 α,ω-이산들의 양을 나타내며, 이는 ~ 550 g/L이었다. 이 실시예는, CYP153A-RedRhF 혼성 융합 단백질의 발현과 조합되고, 알코올 옥시다아제(SEQ ID NO: 67) 및 알데히드 디하이드로게나아제(SEQ ID NO: 69)의 발현과 조합될 때, 지방산 유도체들을 과잉생성하도록 조작된 대장균 균주들이 유일한 탄소원으로서 글루코오스로부터 α,ω-이산들을 효율적으로 생성했음을 나타내었다.
실시예
8:
바실러스
메가테리움
으로부터
cyp102A1을
발현시키는 대장균 균주들에 의한
아말단
수산화 지방산들의 생성
이 실험의 목적은, 바실러스 메가테리움으로부터 시토크롬 P450 cyp102Al (P450-BM3)의 F87A 변이체를 발현시키는 유전적으로 변형된 숙주 균주들을 이용함으로써 생체 내에서 ω-수산화 지방산들 또는 α,ω-이산들을 생성할 수 있는지를 조사하기 위한 것이였다. 소량의 아말단 수산화(ω-1, ω-2, ω-3, ω-4, ω-5) 지방산들의 생성은 이 cyp102Al 변이체를 발현시키는 재조합 대장균 균주들을 이용함으로써 가능하다는 것이 밝혀졌다. 하지만, 동일한 대장균 균주들을 이용하여 ω-하이드록시 지방산들 또는 α,ω-이산들을 생성하는 것이 가능하지 않았다.
87 위치에서 페닐알라닌이 알라닌으로 대체된(F87A) 바실러스 메가테리움(P450-BM3)으로부터 cyp102Al 유전자의 변이체를 코딩하는 유전자는 B. 메가테리움 게놈 DNA(수탁 번호 AAA87602; SEQ ID NO: 61)로부터 크로스-오버 PCR에 의해 생성되었다. 증폭된 DNA는 pCL 유도체(SC101 레플리콘, 스펙티노마이신 내성 마커) 및 pACYC 유도체(p15a 레플리콘, 카나마이신 내성 마커) 벡터들로 클로닝되어, 유전자들의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 결과적인 플라스미드들, pSN.012 및 pSN.009(아래의 표 17 참조)는 균주들 sSN.012 및 sSN.013(아래의 표 18 참조)을 제공하는 균주 AlcV334(위의 표 14 및 위의 실시예 6 참조)를 과잉생성하는 지방산으로 형질전환되었다. 이후, 균주들은 실시예 1 및 2에 설명된 바와 같이 글루코오스로부터 ω-수산화 지방산들을 생성할 수 있는 능력에 대해 분석되었다. 대조 균주 AlcV334와 비교 시, (BSTFA 유도화 후 도 20의 sSN.012에 대해 도시된) 두 균주들에서 작은 새로운 피크들이 식별되었다. RT 7.195 내지 7.510 사이 그리고 8.122 내지 8.414 사이의 새로운 피크들의 질량 스펙트럼의 단편화 패턴은 ω-하이드록시 지방산들(위의 실시예 3 참조)과 일치하지 않았지만, 이들은 아말단 ω-1, ω-2, ω-3, ω-4 및 ω-5 위치들에서 수산화된 지방산들의 예산된 단편화 패턴과 일치하였다. 아말단 수산화 지방산들이 ω-하이드록시 지방산들(유도된 12-하이드록시 도데칸산에 대한 도 8a 참조)과 유사한 이온 단편화 패턴들을 나타내지만, 이 화합물들은 유도화 후 m/z = 117(ω-1), 131(ω-2), 145(ω-3), 159(ω-4) 또는 173(ω-5)의 수산화 부위에 의존하는 추가 이온 단편들을 나타낸다(도 21a 내지 도 21e 참조). 사슬 길이에 관하여, m/z = 117 및 345의 이온들의 조합은 유도화 후 11ω-1)-하이드록시도데칸산에 대한 특징적 이온들이다. 유사하게, m/z = 131 및 331, m/z = 145 및 317, m/z = 159 및 303, m/z = 173 및 289의 이온들의 조합 쌍은 ω-2, ω-3, ω-4 및 ω-5 하이드록시도데칸산들에 대한 특징적 이온들이다. 그러므로, RT 7.195로부터 7.510까지의 피크들은 7(ω-5)-, 8(ω-4)-, 9(ω-3)-, 10(ω-2)- 및 11(ω-1)-하이드록시 도데칸산으로서 식별되었고, RT 8.122로부터 8.414까지의 피크들은 9(ω-5)-, 10(ω-4)-, 11(ω-3)-, 12(ω-2)- 및 13(ω-1)-하이드록시 테트라데칸산으로서 식별되었다. 또한, 균주들 sSN.012 및 sSN.013의 GC/MS 크로마토그래프들이 α,ω-이산들의 존재에 대해 세밀하게 검사되었지만, 이러한 이작용성 분자들이 검출되지 않았다.
결론적으로, 이 실시예는 B. 메가테리움으로부터의 cyp102A1의 F87A의 발현과 조합될 때 지방산들을 과잉생성하도록 조작된 대장균 균주들이 ω-수산화 지방산들을 생성하지 않고, 미량의 ω-1, ω-2, ω-3, ω-4 및 ω-5 하이드록시 지방산들을 생성함을 나타낸다. B . 메가테리움으로부터의 cyp102A1의 F87A 점 돌연변이가 시험관 내에서 효소의 기질 특수성을 변화시켜, 효소가 ω-위치에서 도데칸산 또는 테트라데칸산을 거의 독점적으로 수산화하는 것으로 보고되었다(Oliver 외(1997) Biochem. 36: 1567 참조). 또한, B. 서브틸리스(subtilis)로부터의 P450-BM3(cyp102A3) 및 P450-BM3(F87A)(cyp153(F87A))가 14-하이드록시 테트라데콘산 및 1,14, 테트라데칸디오익산을 생성하는 것으로 보고되었다(예를 들어, WO 2012/071439). 하지만, 이는 확인될 수 없으며, 본 연구결과들을 반박하는 것처럼 보인다. 더욱이, cyp102A1의 유사 동족체인 바실러스 서브틸리스의 cyp102A3의 기질 특수성을 변경시키는 것에 관한 최근 보고들은 여기에 제시된 데이터를 지지한다(Lentz 외(2004) J. Biotechnol . 108:41 및 Lentz 외(2006) ChemBioChem . 7:345). 이와 같이, cyp102A3의 등가 페닐알라닌 잔기의 발린으로의 돌연변이(F88V)는 ω-1, ω-2, ω-3 및 ω-4 위치들에서 주로 지방산들을 수산화하였으며, 기질들로서 도데칸산 또는 헥사데칸산을 갖는 ω-수산화 생성물들이 시험관 내에서 관찰되지 않았다. 따라서, B. 메가테리움으로부터의 cyp102A1 및 B. 서브틸리스로부터의 cyp102A3의 앞서 설명된 변이체들은 ω-하이드록시 지방산들 또는 α,ω-이산들을 생성하기에 적합하지 않다는 결론을 내릴 수 있는데, 이는 후자가 중간체들로서 ω-하이드록시 지방산들을 필요로 하기 때문이다.
표 17:
아말단
수산화 지방산 유도체들의 생성을 위해 구성된 발현
플라스미
드들
표 18:
재생가능한
탄수화물 공급원료들로부터
아말단
수산화 지방산 유도체들의 생성을 위한
cyp102A
단백질들을 발현시키는 재조합 대장균 균주들
실시예
9:
바실러스
리체니포르미스
(
Bacillus
licheniformis
)
로부터
cyp102A7을 발현시키는 대장균 균주들에 의한 글루코오스로부터의 ω-1, ω-2 및 ω-3-수산화 지방산들의 효율적인 생성
본 실시예의 목적은 아말단 수산화 지방산들의 생성을 위해 바실러스 리체니포르미스로부터의 시토크롬 P450-BM3-타입 옥시게나아제 cyp102A7을 발현시키는 대장균 균주들을 테스트하는 것이다. 데이터는 시토크롬 P450-BM3-타입 옥시게나아제 cyp102A7을 발현시키는 재조합 대장균 균주들에 의한 ω-1, ω-2 및 ω-3-하이드록시 지방산들 및 지방족 알코올들의 효율적인 생성을 입증하였다.
바실러스 리체니포르미스(Dietrich 외(2008) Appl . Microbiol . Biotechnol . 79: 931)로부터의 P450-BM3-타입 옥시게나아제 CYP102A7을 코딩하는 yrhJ 유전자는 바실러스 리체니포르미스 ATCC14580 게놈 DNA(수탁 번호 AAU41718; SEQ ID NO: 63)로부터 증폭되었다. 유전자는 pCL1920-유도체(SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 유도성 Ptrc 프로모터가 그 전사를 조절하였다. 또한, 유전자는 pCL1920-유도체로 클로닝되어, 유도성 Ptrc 프로모터가 (순서대로) yrhJ, 티오에스테라아제(tesA)의 변이체, 알코올 디하이드로게나아제(AlrA), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)로 만들어진 오페론을 조절한다. 플라스미드들은 각각 pHM105 및 pSL170.02로 명명되었으며, 대장균 균주들 LC972 및 XL959(위의 표 14 참조)로 형질전환되었다. 이 균주들은 여기에 간명하게 설명되어 있다(또한, 표 14 참조). 균주 LC972의 게놈은 다음과 같이 조작되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었다. 포스포판테테이닐 트랜스퍼라아제, 2 카피(copy)의 티오에스테라아제(tesA)의 변이체 및 합성 지방산 생합성 오페론(표 1에 기재된 수 개의 유전자들로 구성된)이 과발현되었다. 균주 XL959는 카르복실산 리덕타아제 carB의 변이체를 발현시키는 pACYC 유도체 플라스미드를 갖는 LC972이었다. 4 개의 새로운 재조합 대장균 균주들 XL960 - XL963(위의 표 18 참조)은, 35 ℃가 배양 온도로서 사용된 것을 제외하고, 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석되었다. 균주들 중 어느 것도 여하한의 ω-수산화 지방산들 또는 지방산 유도체들을 생성하지 않았다. 하지만, 모든 균주들은 실시예 8에 설명된 바와 같은 아말단 수산화 지방산 유도체들을 생성하였다. 도 22a는 균주 XL961로부터 BFTSA 유도화 후의 크로마토그래프를 나타낸다. 실시예 8에 설명된 바와 같이, 피크들은 다음의 ω-1, ω-2 및 ω-3-하이드록시 지방산들: 11-하이드록시 도데칸산(RT=10.563), 10-하이드록시 도데칸산(RT=10.512), 9-하이드록시 도데칸산(RT=10.412), 13-하이드록시 테트라데칸산(RT=11.279), 12-하이드록시 테트라데칸산(RT=11.233), 11-하이드록시 테트라데칸산(RT=11.133), 15-하이드록시 헥사데칸산(RT=11.679), 14-하이드록시 헥사데칸산(RT=11.623) 및 13-하이드록시 헥사데칸산(RT=11.439)로서 식별되었다. 또한, 아마도 불포화 아말단 수산화 지방산들에 가장 대응하는 작은 피크들이 검출되었다.
도 22b는 균주 XL963으로부터 BFTSA 유도화 후의 크로마토그래프를 나타낸다. 피크들은 다음의 ω-1, ω-2 및 ω-3 하이드록시 지방족 알코올들로서 식별되었다: RT 8.303, 8.480 및 8.572 분에서의 피크들은 각각 7, 8 및 9-하이드록시데칸올이었고, RT 9.264, 9.653 및 9.905에서의 피크들은 각각 9, 10 및 11-하이드록시도데칸올이었으며, RT 10.889, 11.044 및 11.124에서의 피크들은 각각 11, 12 및 13-테트라데칸올이었다. 9, 10 및 11-하이드록시도데칸올을 식별하는데 사용된 상세 질량 스펙트럼 및 이온 단편화 패턴이 도 23a, 도 23b 및 도 23c에 도시되어 있다. 실시예 8의 유사 균주들이 미량의 아말단 수산화 지방산들만을 생성했다면, 4 개의 모든 균주들이 상당한 양의 이 생성물들(~1.6 g/L 이하)을 생성했다는 것이 놀라웠고 예기치 못했었다. 도 24a는 균주들 XL960 및 XL961에 의해 생성된 ω-1, ω-2 및 ω-3-하이드록실 지방산들의 양을 나타내고, 도 24b는 균주들 XL962 및 XL963에 의해 생성된 ω-1, ω-2 및 ω-3-하이드록실 지방족 알코올들의 양을 나타낸다. 따라서, 이 실시예는 B. 리체니포르미스로부터의 cyp102A7의 발현과 조합될 때 지방산 유도체들을 과잉생성하도록 조작된 대장균 균주들이 유일한 탄소원으로서 글루코오스로부터 ω-1, ω-2 및 ω-3-하이드록실 지방산 유도체들을 효율적으로 생성하였다.
실시예
10: 재조합 대장균 균주들에 의한 글루코오스로부터의
α,ω
-
디에스테르들의
생성
아실-CoA 신테타아제/리가아제 또는 트랜스퍼라아제 유전자가 cyp153A-RedRhF 융합 단백질을 코딩하는 유전자의 하류에서 pCL 유도 벡터로 클로닝되어, 2 개의 유전자들이 오페론을 형성하고, 오페론의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절된다. 적합한 cyp153A 및 RedRhF 융합 파트너들의 예시들은 표 2A 및 표 2D에 제공되어 있다. 적합한 아실-CoA 신테타아제들/리가아제들 또는 트랜스퍼라아제들의 예시들이 표 7에 제공되어 있다. 결과적인 플라스미드는 대장균 균주, 예를 들어 KASH286(위의 실시예 6 및 표 14 참조)을 생성하는 지방산 메틸 에스테르로 형질전환된다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석된다. 균주는 α,ω-디에스테르들을 생성할 것으로 예상된다.
실시예
11: 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-아미노 지방산 유도체들의 생성
cyp153A-RedRhF 융합 단백질을 코딩하는 유전자, 알코올 옥시다아제 또는 디하이드로게나아제를 코딩하는 유전자 및 아미노트랜스퍼라아제 또는 트랜스아미나아제를 코딩하는 유전자가 pCL 유도 벡터로 클로닝되어, 3 개의 유전자들이 오페론을 형성하고, 오페론의 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절된다. 적합한 cyp153A 및 RedRhF 융합 파트너들의 예시들은 표 2A 및 표 2D에 제공되어 있다. 적합한 알코올 옥시다아제들 또는 디하이드로게나아제들의 예시들이 표 3A에 제공되어 있고, 적합한 아미노트랜스퍼라아제들 또는 트랜스아미나아제들의 예시들이 표 4에 제공되어 있다. 결과적인 플라스미드는 대장균 균주, 예를 들어 stNH1293(위의 실시예 6 및 표 14 참조)을 생성하는 지방산으로 형질전환된다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석된다. 균주는 ω-아미노 지방산들을 생성할 것으로 예상된다. 대안적으로, 결과적인 플라스미드는 대장균 균주, 예를 들어 KASH286(위의 실시예 6 및 표 14 참조)을 생성하는 지방산 메틸 에스테르로 형질전환된다. 균주는 실시예 1 및 2에 설명된 바와 같은 글루코오스로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석된다. 균주는 ω-아미노 지방산 메틸 에스테르들을 생성할 것으로 예상된다.
실시예
12: 다양한 공급원료들로부터 ω-수산화 지방산 유도체들의 생성
지방산 생합성은 자연에 편재되어 있으며, 또한 본 명세서에 제공된 실시예들은 본질적으로 탄수화물 이외의 공급원료들을 이용하는 다른 유기체들에서도 구현될 수 있다. 예를 들어, 이러한 경로들은 광합성 미생물에서 발현될 수 있으며, CO2로부터 ω-수산화 지방산 유도체들의 생성을 허용한다. 특히, 이들은, 광생물반응기(photobioreactor) 또는 개방 폰드(open pond)에서와 같이 적합한 조건들 하에서 성장될 때 이들이 배양물로부터 분리될 수 있는 ω-수산화 지방산 유도체들을 생성할, 시아노박테리아의 세포질에서 발현될 수 있다. 대안적으로, 당업자라면, 이러한 경로들이 클로스트리듐 속(genus Clostridia)으로부터의 것들과 같이 유기체를 이용하는 일산화탄소에서 발현될 수 있음을 알 수 있을 것이다. 예를 들어, 이러한 조작된 미생물들이 적절한 조건들에서[예를 들어, 제강소 플루 가스(steel mill flu gas), 또는 천연 가스나 바이오매스와 같은 유기 재료들의 재형성물로부터 유도된 합성 가스로부터 CO가 공급된 반응기에서] 성장될 때, 이들은 배양물로부터 회수될 수 있는 ω-수산화 지방산 유도체들을 생성할 것이다.
실시예
13: 다양한
CYP153A
-
리덕타아제
혼성 융합 단백질들을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-수산화 지방산 유도체들의 생성
본 실시예는 다양한 CYP153A P450 옥시게나아제 도메인들이 다양한 리덕타아제 도메인들과 융합되는 추가 키메라 혼성 단백질들을 발현시키는 재조합 대장균 균주에 의한, 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 ω-하이드록시 지방산들의 생성을 나타낸다.
이 실험에서, 3 개의 미생물들로부터의 CYP153A P450 촉매 단백질들 및 4 개의 미생물들로부터의 리덕타아제 도메인 단백질들을 코딩하는 유전자들은 게놈 DNA로부터 증폭되었거나, 코돈-최적화 DNA(아래의 표 19 참조)로 합성되었다. 리덕타아제 도메인 단백질들은 RedRhF-타입 그리고 BM3-타입 단백질들을 포함하였다. 키메라 혼성 단백질들을 코딩하는 유전자들이 조립되었고 실시예 5(위 참조)에 설명된 바와 같은 pCL1920-유도 벡터들로 클로닝되었다. 결과적인 플라스미드들은 균주 AlcV334(표 14 참조)로 형질전환되었다. 이후, ω-수산화 지방산 유도체들을 생성하도록 조작된 이 추가적인 6 개의 균주들은, 실시예 1 및 2에 설명된 글루코오스와 같은 재생가능한 공급원료로부터 ω-수산화 지방산 유도체들을 생성할 수 있는 능력에 대해 분석되었다. 아래의 표 20은 32 ℃에서 18h 이내에 StEP675와 비교 시 이러한 균주에 의해 생성된 ω-수산화 지방산들의 양을 나타낸다. StEP675는 M. 아쿠애올레이로부터의 CYP153A 및 로도코쿠스 종 NCIMB 9784(실시예 6 참조)로부터의 리덕타아제 도메인으로 구성된 키메라 단백질을 발현시키는 균주 AlcV334이다. 아래의 표 20에서 알 수 있는 바와 같이, CYP153A-리덕타아제 혼성 융합 단백질들을 발현시키는 대부분의 균주들은 유일한 탄소원으로서 글루코오스로부터 ω-수산화 지방산 유도체들을 효율적으로 생성하였다. 결론적으로, CYP153A 계열의 상이한 요소들 및 RedRhF-타입 또는 BM3-타입 리덕타아제 계열의 상이한 요소들로부터 단백질들을 구성하는 키메라 CYP153A-리덕타아제 혼성 융합 단백질들은, 대장균에서 발현될 때 유일한 탄소원으로서 글루코오스로부터 ω-수산화 지방산 유도체들을 효율적으로 생성하였다.
표 19: 재생가능한 탄수화물 공급원료들로부터 ω-수산화 지방산 유도체들의 생성을 위한 혼성
cyp153A
-
리덕타아제
융합 단백질들을 발현시키는 추가적인 재조합 대장균 균주들
표 20: 글루코오스로부터 추가적인 재조합 대장균 균주들에 의해 생성된 ω-수산화 지방산 유도체들
다음의 프로토콜들 및 방법들은 실시예 14 내지 19에 관한 것이다.
프로토콜들 및 방법들
라이브러리 스크리닝
본 명세서에 설명된 모든 프로토콜들은 배양물들을 성장시키기 위한 96 웰 플레이트(96 well plate)-마스터 블록-2mL 시스템(Greiner Bio-One, Monroe, NC 또는 Corning, Amsterdam, The Netherlands), 및 배양액으로부터 지방산 종을 추출하기 위한 플레이트들(Costar, Inc.)에 의존한다. 아래에 제공된 프로토콜들은 발효 조건들의 예시들이다. 지방산 종의 생성을 평가하기 위해 대안적인 프로토콜들이 사용될 수 있다.
32 ℃ Plim 배양 프로토콜:
(96 웰 플레이트에서 성장된 LB 배양물로부터) 30 μL LB 배양물이 290 μL Plim 배지(아래의 표 21)에 접종(inoculate)하는데 사용되었으며, 이는 이후 32 ℃ 진탕으로 약 16 시간 동안 배양되었다. 하룻밤이 지난 씨드(overnight seed)의 40 μL가 360 μL Plim 배지에 접종하는데 사용되었다. 2 시간 동안 32 ℃에서 성장한 후, 배양물들은 IPTG(최종 농도 1 mM)로 유도되었다(아래의 표 21). 이후, 배양물들은, 달리 명시되지 않았다면 20 시간 동안 32 ℃에서 진탕으로 배양되었으며, 이후 배양물들은 아래에 자세히 설명된 표준 추출 프로토콜에 따라 추출되었다.
35 ℃ Nlim 배양 프로토콜:
(96 웰 플레이트에서 성장된 LB 배양물로부터) 40 μL LB 배양물이 360 μL Nlim 배지(아래의 표 21)에 접종하는데 사용되었으며, 이는 이후 32 ℃ 진탕으로 약 4 시간 동안 배양되었다. LB 씨드의 40 μL가 360 μL Nlim 배지에 접종하는데 사용되었다. 32 ℃에서 2 시간 동안 35 ℃에서 성장한 후, 배양물들은 IPTG(최종 농도 1 mM)로 유도되었다(아래의 표 21). 이후, 배양물들은, 달리 명시되지 않았다면 20 시간 동안 35 ℃에서 진탕으로 배양되었으며, 이후 배양물들은 아래에 자세히 설명된 표준 추출 프로토콜에 따라 추출되었다.
표 21:
배지명
및 조성
지방산 종 표준 추출 프로토콜:
각각의 웰에 80 μL의 1M HCl이 추출되게 하기 위해, 이후 (내부 표준으로서 500 mg/L 펜타데칸올을 갖는) 400 μL의 부틸 아세테이트가 첨가되었다. 96 웰 플레이트들은 이후 플레이트 실러(plate sealer)(ALPS-300 가열기; Abgene, ThermoScientific, Rockford, IL)를 이용하여 열-융착되었고(heat-sealed), MIXMATE 혼합기(Eppendorf, Hamburg, Germany)를 이용하여 2000 rpm으로 15 분 동안 진탕되었다. 진탕 후, 플레이트들은 실온에서 4500 rpm으로 10 분 동안 원심분리되어(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA), 수성 및 유기 층들을 분리하였다. 100 μL의 유기 층이 96 웰 플레이트(폴리프로필렌, Corning, Amsterdam, The Netherlands)로 전달되었으며, 100 μL의 BSTFA로 유도화되었다. 플레이트는 이후 열-융착되었고, w-OH FFA 방법을 이용하여 GC-FID에 의해 평가될 때까지 -20 ℃로 저장되었으며, 이는 다음과 같이 수행되었다: 1 μL의 샘플이 1 내지 20 스플릿(split)을 갖는 불꽃 이온화 검출기(flame ionization detector: FID)를 갖는 Agilent 7890A GC Ultra 장치(Agilent, Santa Clara, CA)에서 분석 컬럼(DB-1, 10 m x 180 ㎛ x 0.2 μΜ 막 두께, JW 121-101A로부터 이용가능함) 상으로 접종되었다. 장비는 C10 내지 C18 지방산들 및 ω-하이드록시 지방산들을 검출 및 정량화하도록 셋업되었다. 앞서 자세히 설명된 프로토콜은 표준 조건들을 나타내며, 이는 분석 결과들을 최적화하기 위해 필요에 따라 변형될 수 있다.
오류 유발 라이브러리 구축
해당 기술분야의 당업자에게 알려진 표준 기술들은 오류 유발 라이브러리들을 제조하는데 사용되었다. 일 예시에서, 벡터 골격(vector backbone)은 벡터의 제한 엔도뉴클레아제(restriction endonuclease)들을 이용함으로써 제조된 한편, DNA 삽입체의 다양성(diversity)의 생성은 미스매치된 뉴클레오티드들의 통합에 우호적인 조건들 하에서 DNA 주형으로부터 PCR 증폭에 의해 생성되었다. 일 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 INFUSION Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행되었다.
포화 라이브러리(Saturation Libraries) 구축
해당 기술분야의 당업자에게 알려진 표준 기술들은 포화 라이브러리들을 제조하는데 사용되었다. 일 예시에서, 벡터 골격은 벡터의 제한 엔도뉴클레아제들을 이용함으로써 제조된 한편, DNA 삽입체의 다양성의 생성은 변성 프라이머(degenerate primer)들을 이용하여 생성되었다. 일 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 INFUSION Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행되었다.
조합 라이브러리 구축
유익한 것으로 식별된 돌연변이들이 ω-OH 지방산 유도체 종의 생성 시 CYP153-리덕타아제 혼성 융합 폴리펩티드 변이체들(예를 들어, CYP153A-RedRhF 혼성 융합 단백질 변이체들)에 추가 개선들을 제공하도록 조합되었다. 해당 기술분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리들을 제조하는데 사용되었다. 일 예시에서, 벡터 골격은 벡터의 제한 엔도뉴클레아제들을 이용함으로써 제조된 한편, DNA 삽입체의 다양성의 생성은 의도한 돌연변이들을 도입하기 위해 프라이머들을 이용하여 생성되었다. 앞서 설명된 바와 같이, 일 접근법에서, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 INFUSION Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행되었다. 조합 라이브러리는 tPCR(transfer PCR) 프로토콜을 이용하여 생성될 수 있다[Erijman 외(2011) J. Structural Bio.175:171-177].
라이브러리 스크리닝
라이브러리 다양성이 오류-유발, 포화 라이브러리 또는 조합 라이브러리에 생성되었으면, 이는 앞서 설명된 방법들 중 하나를 이용하여 스크리닝되었다. 두 가지 타입의 히트(hit)들이 식별되었다: (1) 증가된 양의 ω-하이드록시 지방산들(ωOH FFA 역가); 및/또는 (2) 지방산들의 ω-하이드록시 지방산들로의 증가된 전환. 각 히트 내의 혼성 cyp153A-RedRhF 단백질 변이체들의 돌연변이들은 해당 기술분야의 당업자에 의해 통상적으로 이용되는 표준 기술들을 이용하여 서열화함으로써 식별되었다. 아래의 표 23, 표 24 및 표 25는 포화 라이브러리들에 유익한 것으로 식별된 돌연변이들(히트들)을 목록화한 것이다.
실시예
14: 라이브러리 스크리닝을 위한 균주 및 플라스미드 구성
본 실시예는 포화 또는 조합 돌연변이유발 라이브러리 스크리닝을 위해 구성된 균주들 및 플라스미드들을 설명한다.
마리노박터 아쿠애올레이로부터의 CYP153A(G307A) P450 촉매 단백질로 만들어진 혼성-융합 단백질 및 로도코쿠스 종 NCIMB9784로부터의 P450RhF의 c-말단 FMN- 및 Fe/S-함유 리덕타아제 도메인을 코딩하는 유전자는 다음과 같이 생성되었다: cyp165A(G307A)_Maqu 유전자는 게놈 DNA로부터 증폭되었고, 크로스-오버 PCR에 의해 코돈-최적화 합성 P450RhF 리덕타아제 도메인과 융합되었다. 결과적인 융합 유전자(SEQ ID NO: 5)는 pACYC-유도체(즉, p15A 레플리콘, 카나마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었다. 플라스미드는 pEP125(아래의 표 22 참조)로 명명되었다. 또한, CYP153A(G307A)-Red450RhF 혼성 융합 단백질을 코딩하는 유전자가 pEP125로부터 증폭되었고, pCL1920-유도 벡터(SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 식물 티오에스테라아제(fatB1), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)를 코딩하는 유전자들을 갖는 오페론을 형성하였다. 플라스미드는 pLC81(아래의 표 22 참조)로 명명되었다.
추가 플라스미드들이 다음과 같이 생성되었다: 월계수(Umbellularia californica)로부터의 식물 티오에스테라아제(fatB1)를 코딩하는 유전자는 코돈-최적화 DNA로서 합성되었고, pCL1920-유도 벡터(SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 아세틸-CoA 카르복실라아제(accDACB), 비오틴 리가아제(birA) 및 아실기-운반 단백질을 코딩하는 유전자들을 갖는 오페론을 형성하였다. 플라스미드는 pNH305(아래의 표 22 참조)로 명명되었다. 플라스미드 pAS033은 pNH305의 fatB1을, 애기장대로부터의 코돈-최적화 합성 식물 티오에스테라아제(fatA3)로 대체함으로써 생성되었다(아래의 표 22 참조). 플라스미드 pEP146은 pLC81의 fatB1을, 애기장대로부터의 코돈-최적화 합성 식물 티오에스테라아제(fatA3)로 대체함으로써 생성되었다(아래의 표 22 참조). 또한, pEP146은 repA 단백질을 코딩하는 플라스미드 내에 돌연변이를 가졌다.
플라스미드 형질전환을 위해 사용되는 기본 균주들은 GLP077 및 BZ128이었다. 간명하게, 기본 균주 GLPH077의 게놈은 다음과 같이 조작되었다: 아실-CoA 디하이드로게나아제(fadE) 유전자가 결실되었고, 전사 조절인자(fadR) 및 합성 지방산 생합성 오페론이 과발현되었다. 간명하게, 기본 균주 BZ128의 게놈은 다음과 같이 조작되었다: fadE(아실-CoA 디하이드로게나아제) 유전자가 결실되었고, 합성 지방산 생합성 오페론, β-하이드록시 지방족 아실-ACP 탈수효소(fabZ) 및 티오에스테라아제(tesA)의 변이체가 과발현되었다. 또한, 균주는 이전에 전이인자(transposon) 그리고 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝을 거쳤다.
표 22: 라이브러리 스크리닝에 사용되는 플라스미드들
혼성 cyp153A(G307A)-Red450RhF 융합 단백질은 숙주 세포들에서의 발현이 ω-OH 지방산 유도체들을 생성할 수 있는지를 관찰하기 위해 테스트되었다. SEQ ID NO: 5를 발현시키는 미생물은 글루코오스로부터 1 g/L 이상의 ω-OH 지방산 유도체들을 생성할 수 있었다. 따라서, 이 조작된 효소는 또 다른 진화 연구들을 위해 선택되었다.
실시예
15:
cyp153A
(
G307A
)-
Red450RhF
융합 단백질의 P50 촉매 도메인의 포화 라이브러리들
CYP153A-Red450RhF 융합 단백질의 P450 촉매 도메인의 전체 포화 라이브러리가 구축되었고, CYP153A(G307A)-Red450RhF(즉, 주형 폴리펩티드)를 넘어선 개선들을 나타낸 변이체들에 대해 스크리닝되었다. G307A(글리신 잔기가 307 위치에서 알라닌을 대체함)는 CYP153A(Honda Malca 외(2012) Chem . Commun . 48:5115)의 ω-하이드록실라아제 활성을 개선하는 유익한 돌연변이이다. 히트들에 대한 선별 기준은, (1) 증가된 양의 ω-하이드록시 지방산들(ωOH FFA 역가); 및/또는 (2) 지방산들의 ω-하이드록시 지방산들로의 증가된 전환이었다.
해당 기술 분야의 당업자에게 알려진 표준 기술들은 포화 라이브러리들을 제조하는데 사용되었다. 플라스미드들 pEP125 및 pLC81(위의 표 22 참조)은 전체 포화 라이브러리들을 만드는데 사용되었다. 3 개의 포화 라이브러리들이 스크리닝되었다: 제 1 라이브러리에 대하여 pEP125는 pNH305와 함께 균주 GLPH077로 형질전환되었고, 제 2 라이브러리에 대하여 pLC81은 BZ128로 형질전환되었으며, 제 3 라이브러리에 대하여 pEP125는 pAS.033과 함께 GLPH077 균주로 형질전환되었다. 제 1 및 제 2 라이브러리는 특히 ω-하이드록시 도데칸산 형성 시 개선된 변이체들에 대해 스크리닝되었고, 제 3 라이브러리는 특히 ω-하이드록시 헥사데센산 형성 시 개선된 변이체들에 대해 스크리닝되었다. 라이브러리들은 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 개선된 변이체들이 아래의 표 23 내지 표 25(아래 참조)에 나타나 있다. 특히, 141 위치의 변이체들이 여러번 식별되었고, ω-하이드록시 도데칸산 및 ω-하이드록시 헥사데센산 형성 둘 모두에 대해 상당히 개선된 효소들인 것으로 밝혀졌다.
표 23:
CYP153A
(
G307A
)-
Red450RhF의
촉매 도메인의
제 1
부위 포화 라이브러리로부터의 개선된
변이체들의
개요
표 24:
CYP153A
(
G307A
)-
Red450RhF의
촉매 도메인의
제 2
부위 포화 라이브러리로부터의 개선된
변이체들의
개요
표 25:
CYP153A
(
G307A
)-
Red450RhF의
촉매 도메인의
제 3
부위 포화 라이브러리로부터의 개선된
변이체들의
개요
실시예
16:
CYP153A
(
G307A
)-
Red450RhF
융합 단백질의
리덕타아제
도메인의 부분 부위 포화 라이브러리들
혼성 CYP153A(G307A)-Red450RhF 융합 단백질의 리덕타아제 도메인들의 부분 포화 라이브러리(10 번째 아미노산마다 돌연변이됨)가 구축되었고, 촉매 P450 CYP153A 도메인의 부위 포화 돌연변이유발 라이브러리에서 식별된 변이체인 CYP153A(V141I, A231T, G307A)-Red450RhF(SEQ ID NO: 32)를 넘어서는 개선들을 나타낸 변이체들에 대해 스크리닝되었다. 히트들에 대한 선택 기준은, (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산의 ω-하이드록시 도데칸산으로의 증가된 전환이었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 포화 라이브러리들을 제조하는데 사용되었다. 라이브러리에 대하여, CYP153A(V141I, A231T, G307A)-Red450RhF를 포함하는(harboring) pLC81이 BZ128로 형질전환되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 개선된 변이체들이 아래의 표 26에 나타나 있다. 특히, 변이체들 A796V(SEQ ID: 42) 및 P666A가 상당히 개선된 효소들이었다.
표 26:
CYP153A
(
V141I
,
A231T
,
G307A
)-
Red450RhF의
리덕타아제
도메인의 부분 포화 라이브러리로부터의 개선된
변이체들의
개요
실시예
17:
CYP153A
(
G307A
)-
Red450RhF
융합 단백질의
리덕타아제
도메인의 조합 라이브러리
리덕타아제 도메인(실시예 17)의 부분 포화 라이브러리에서 식별된 유익한 돌연변이들은 CYP153A(G307A)-Red450RhF 융합 단백질을 더욱 개선하기 위한 조합 라이브러리의 기저(basis)였다. 선별 기준은, (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산의 ω-하이드록시 도데칸산으로의 증가된 전환이었다.
조합 라이브러리는 CYP153A(V141I, A231T, G307A)-Red450RhF(SEQ ID: 32)를 포함하는 pLC81에서 구축되었고, BZ128로 형질전환되었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리들을 제조하는데 사용되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 개선된 변이체들이 아래의 표 27에 나타나 있다.
표 27:
CYP153A
(
V141I
,
A231T
,
G307A
)-
Red450RhF의
리덕타아제
도메인의 조합 라이브러리로부터의 개선된
변이체들의
개요
실시예
18:
CYP153A
(
G307A
)-
Red450RhF
융합 단백질의 촉매 및
리덕타아제
도메인의 조합 라이브러리
포화 라이브러리들(실시예 16 및 17)에서 식별된 유익한 돌연변이들은 CYP153A(G307A)-Red450RhF 융합 단백질을 더욱 개선하기 위한 조합 라이브러리의 기저였다. 선택 기준은, (1) 증가된 양의 ω-하이드록시 도데칸산(ωOH FFA 역가); 및/또는 (2) 도데칸산의 ω-하이드록시 도데칸산으로의 증가된 전환이었다. 조합 라이브러리는 pLC81에서 구축되었고, BZ128로 형질전환되었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리들을 제조하는데 사용되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 2 개의 개선된 최적 변이체들이 표 28에 나타나 있다.
표 28:
CYP153A
(
G307A
)-
Red450RhF의
조합 라이브러리로부터의 최상의 개선된 변이체들
실시예
19:
CYP153A
(
G307A
,
A796V
)-
Red450RhF의
141 및 309 위치의 부위 포화 돌연변이유발
141 위치의 변화들은 기질 특수성에 영향을 미쳤음을 유의한다. 그러므로, 이 2 개의 위치들의 부위 포화 돌연변이유발이 CYP153A(G307A, A796V)-Red450RhF에서 수행되었다. 히트들에 대한 선별 기준은, (1) 증가된 양의 ω-하이드록시 헥사데센산; 및/또는 (2) 헥사데센산의 ω-하이드록시 헥사데센산으로의 증가된 전환이었다.
라이브러리에 대하여, CYP153A(G307A A796V)-Red450RhF(SEQ ID: 38)를 포함하는 pEP146은 BZ128로 형질전환되었다. 해당 기술 분야의 당업자에게 알려진 표준 기술들은 부위 포화 라이브러리들을 제조하는데 사용되었다. 라이브러리는 앞서 설명된 표준 프로토콜들 중 하나를 이용하여 스크리닝되었다. 특히 V141T(SEQ ID: 46)를 갖는 변이체들이 가장 높은 ω-하이드록시 헥사데센산 역가 및 헥사데센산으로부터의 가장 높은 전환을 나타내었다(도 27).
실시예
20: 개선된 혼성
CYP153A
-
Red450RhF
융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의 ω-수산화 지방산들의 높은
역가
생성
본 실시예는 개선된 혼성 CYP153A-Red450RhF 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 ω-하이드록시 지방산들의 고-수율 생성을 나타낸다.
변이 혼성 CYP153A-Red450RhF 융합 단백질(SEQ ID No: 46)을 코딩하는 유전자는 pCL1920-유도 벡터(변형된 SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 식물 티오에스테라아제(fatA3), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)를 갖는 오페론을 형성하였다. 플라스미드는 균주 stEP.798을 유도하는 균주 L439로 형질전환되었다. 간명하게, 기본 균주 L439의 게놈은 다음과 같이 조작되었다: fadE(아실-CoA 디하이드로게나아제) 유전자가 결실되었고, 합성 지방산 생합성 오페론 및 티오에스테라아제(tesA)의 변이체가 과발현되었다. 또한, 균주는 이전에 전이인자 그리고 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝을 거쳤다.
균주는 다음과 같은 생물반응기에서 진행되었다: 1 보다 큰 배양물의 OD 판독이 이루어질 때까지, 32 ℃에서 스펙티노마이신(115 mg/L)을 함유하는 LB 진탕 플라스크에서 균주의 세포 은행 바이알이 배양되었다. 이 배양물의 5 % v/v 전달(transfer)이 FA 시드 배지(seed media)(2 g/L 암모늄 클로라이드, 0.5 g/L 소듐 클로라이드, 0.3 g/L 포타슘 포스페이트 모노베이직, 1 mM 마그네슘 설페이트, 0.1 mM 칼슘 클로라이드, 20 g/L 글루코오스, 1 mL/L의 미량 원소 용액, 10 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 100 mM의 bis tris 완충액, 및 115 mg 스펙티노마이신) 내로 행해졌으며, 32 ℃에서 하룻밤 배양되었다. 이후, 이 시드 배양물은 생성을 위해 제조된 생물반응기에 접종하는데 사용되었다. 이 공정에 대한 초기 생물반응기 배지는: 0.5 g/L 암모늄 클로라이드, 1 g/L 소듐 클로라이드, 4 g/L 포타슘 포스페이트 모노베이직, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 140 mg/L 칼슘 클로라이드 디하이드레이트, 10 mL/L의 미량 원소 용액, 80 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 0.6 mL/L의 미량 비타민 용액, 및 5 g/L의 옥수수 침지 분말(corn steep powder)을 함유하였다. 생물반응기에 대한 후-살균 첨가제(post-sterile addition)들은: 0.2 mM 아미노레불린산, 30 g/L의 글루코오스 및 115 mg/L 스펙티노마이신을 포함하였다.
접종 전, 생물반응기 파라미터들이 안정화되었고, 제어 루프들은 - 용해된 산소 설정점: 30 %; 온도 설정점 29 ℃; 포기 설정점(aeration setpoint): 0.5 vvm; pH 설정점: 6.9에서 구현되었다(turned on). 생물반응기에 5 % v/v의 시드 배양물이 접종되었고, 배양물의 밀도가 OD 30보다 클 때 1 mM IPTG로 유도되었다. 복합체 글루코오스 공급 용액(586 g/L 글루코오스, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 0.4 g/L 포타슘 포스페이트 모노베이직, 80 mg/L 페릭 시트레이트 트리베이직 모노하이드레이트, 및 10 mL/L의 미량 원소 용액)이, 배지가 글루코오스로 고갈될 때를 제어기에 나타내기 위해 DO 트리거(trigger)를 이용하여, (공칭 배양물 부피에 기초하여) 10 g/L 글루코오스의 최대 속도로 배양물에 공급되었다. 생물반응기는 진행 내내 샘플링되었고, 72 시간 배양 후 수득되었다.
도 25는 30.5 ℃에서 72 h 동안 균주 stEP.798에 의해 생성된 ω-수산화 지방산의 양을 나타내며, 이는 72 h 후 16.0 g/L의 높은 역가에 도달하였다. 생성된 ω-수산화 지방산들은 63:1 % ω-하이드록시 헥사데센산(C16:1), 26.4 % ω-하이드록시 헥사데칸산(C16:0), 7.6 % ω-하이드록시 테트라데칸산(C14:0), 1.9 % ω-하이드록시 테트라데센산(C14:1) 및 소량의 ω-하이드록시 도데센산(C12:0) 및 ω-하이드록시 도데센산(C12:1)(C12는 1 % 미만)으로 구성되었다. 또한, stEP.798은 72h에서 3.0 g/L 지방산들을 생성하였다. 결론적으로, 지방산-과잉생성 대장균 균주에서의 개선된 혼성 CYP153A-Red450RhF 융합 단백질은 재생가능한 탄수화물 공급원료로부터 고-역가 ω-수산화 지방산 생성을 가능하게 했다.
실시예
21: 개선된 혼성
CYP153A
-
Red450RhF
융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스로부터의
α,ω
-이산들의 높은
역가
생성
본 실시예는 이종 알코올 옥시다아제(alkJ) 및 알데히드 디하이드로게나아제(alkH) 그리고 개선된 혼성 CYP153A-Red450RhF 융합 단백질을 발현시키는 재조합 대장균 균주들에 의한 글루코오스와 같은 재생가능한 탄수화물 공급원료로부터의 α,ω-이산들의 고-수율 생성을 나타낸다.
변이 혼성 CYP153A-Red450RhF 융합 단백질(SEQ ID NO: 42)을 코딩하는 유전자는 pCL1920-유도 벡터(변형된 SC101 레플리콘, 스펙티노마이신 내성 마커)로 클로닝되어, 그 전사가 IPTG-유도성 Ptrc 프로모터에 의해 조절되었으며, 이는 식물 티오에스테라아제(fatB1), 알코올 옥시다아제(alkJ), 알데히드 디하이드로게나아제(alkH), 3-케토-아실-ACP 신타아제(fabB)의 변이체 및 전사 조절인자(fadR)를 갖는 오페론을 형성하였다. 플라스미드는 균주 L1017을 유도하는 균주 L1012로 형질전환되었다. 간명하게, 기본 균주 L1012의 게놈은 다음과 같이 조작되었다: fadE(아실-CoA 디하이드로게나아제) 및 adhE(알코올 디하이드로게나아제) 유전자들이 결실되었고, 합성 지방산 생합성 오페론, β-하이드록시 지방족 아실-ACP 탈수효소(fabZ) 및 티오에스테라아제(tesA)의 변이체가 과발현되었다. 또한, 균주는 이전에 전이인자 그리고 N-메틸-N'-니트로-N-니트로소구아니딘(NTG) 돌연변이유발 및 스크리닝을 거쳤다.
균주는 다음과 같은 생물반응기에서 진행되었다: 1 보다 큰 배양물의 OD 판독이 이루어질 때까지, 32 ℃에서 스펙티노마이신(115 mg/L)을 함유하는 LB 진탕 플라스크에서 균주의 세포 은행 바이알이 배양되었다. 이 배양물의 2 % v/v 전달이 FA 시드 배지(2 g/L 암모늄 클로라이드, 0.5 g/L 소듐 클로라이드, 0.3 g/L 포타슘 포스페이트 모노베이직, 1 mM 마그네슘 설페이트, 0.1 mM 칼슘 클로라이드, 20 g/L 글루코오스, 1 mL/L의 미량 원소 용액, 10 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 100 mM의 bis tris 완충액, 및 115 mg 스펙티노마이신) 내로 행해졌으며, 32 ℃에서 하룻밤 배양되었다. 이후, 이 시드 배양물은 생성을 위해 제조된 생물반응기에 접종하는데 사용되었다. 이 공정에 대한 초기 생물반응기 배지는: 0.5 g/L 암모늄 클로라이드, 1 g/L 소듐 클로라이드, 4 g/L 포타슘 포스페이트 모노베이직, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 140 mg/L 칼슘 클로라이드 디하이드레이트, 10 mL/L의 미량 원소 용액, 80 mg/L의 페릭 시트레이트 트리베이직 모노하이드레이트, 0.6 mL/L의 미량 비타민 용액, 및 5 g/L의 옥수수 침지 분말을 함유하였다. 생물반응기에 대한 후-살균 첨가제들은: 0.2 mM 아미노레불린산, 30 g/L의 글루코오스 및 115 mg/L 스펙티노마이신을 포함하였다.
접종 전, 생물반응기 파라미터들이 안정화되었고, 제어 루프들은 - 용해된 산소 설정점: 30 %; 온도 설정점 31 ℃; 포기 설정점: 0.5 vvm; pH 설정점: 6.9에서 구현되었다. 생물반응기에 5 % v/v의 시드 배양물이 접종되었고, 배양물의 밀도가 OD 30보다 클 때 1 mM IPTG로 유도되었다. 복합체 글루코오스 공급 용액(586 g/L 글루코오스, 2.2 g/L 마그네슘 설페이트 헵타하이드레이트, 0.4 g/L 포타슘 포스페이트 모노베이직, 80 mg/L 페릭 시트레이트 트리베이직 모노하이드레이트, 및 10 mL/L의 미량 원소 용액)이, 배지가 글루코오스로 고갈될 때를 제어기에 나타내기 위해 pH 트리거를 이용하여, (공칭 배양물 부피에 기초하여) 10 g/L 볼루스(bolus)로서 배양물에 공급되었다. 생물반응기는 진행 내내 샘플링되었고, 48 시간 배양 후 수득되었다.
도 26은 30.5 ℃에서 48 h 동안 균주 L1017에 의해 생성된 α,ω-이산들의 양을 나타낸다. 균주는 31 h에서 21.2 g/L α,ω-이산들을 생성하였고, 48 h 후 23.9 g/L의 높은 역가에 도달하였다. 생성된 α,ω-이산들은 85.9 % α,ω-도데칸산(C12:0), 4.7 % α,ω-도데센산(C12:1), 5.7 % α,ω-테트라데칸산(C14:0), 2.9 % α,ω-테트라데센산(C14:1) 및 소량의 α,ω-헥사데센산(C16:1)(C16은 1 % 미만)으로 구성되었다. 또한, stEP.798은 48h에 9.3 g/L 지방산들을 생성하였다. ω-하이드록시 지방산들은 미량만 검출되었다. 결론적으로, 알코올 옥시다아제(alkJ) 및 알데히드 디하이드로게나아제(alkH)의 공동발현과 함께 지방산-과잉생성 대장균 균주에서의 개선된 혼성 CYP153A-Red450RhF 융합 단백질의 발현은 재생가능한 탄수화물 공급원료로부터 고-역가 α,ω-이산들의 생성을 가능하게 했다.
당업자라면 이해할 수 있는 바와 같이, 앞선 실시형태들 및 구현예들의 다양한 변형들 및 변경들이 본 발명의 기술사상 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.
SEQUENCE LISTING
<110> LS9, INC.
<120> METHODS OF PRODUCING OMEGA-HYDROXYLATED FATTY ACID
DERIVATIVES
<130> LS00048PCT
<140>
<141>
<150> 61/835,464
<151> 2013-06-14
<160> 69
<170> PatentIn version 3.5
<210> 1
<211> 1413
<212> DNA
<213> Marinobacter aquaeolei
<400> 1
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgg cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt taa 1413
<210> 2
<211> 470
<212> PRT
<213> Marinobacter aquaeolei
<400> 2
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Gly Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser
465 470
<210> 3
<211> 1413
<212> DNA
<213> Marinobacter aquaeolei
<400> 3
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt taa 1413
<210> 4
<211> 470
<212> PRT
<213> Marinobacter aquaeolei
<400> 4
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser
465 470
<210> 5
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 5
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 6
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 6
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 7
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 7
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 8
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 8
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 9
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 9
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 10
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 10
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 11
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 11
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 12
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 12
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 13
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 13
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
caggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 14
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 14
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gln Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 15
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 15
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
ggggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 16
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 16
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Gly Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 17
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 17
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 18
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 18
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 19
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 19
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
ctggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 20
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 20
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Leu Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 21
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 21
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 22
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 22
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 23
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 23
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 24
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 24
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 25
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 25
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggccgggat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 26
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 26
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Arg Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 27
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 27
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcggcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 28
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 28
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 29
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 29
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg ggcgtcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 30
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 30
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Arg His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 31
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 31
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 32
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 32
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 33
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 33
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 34
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 34
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 35
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 35
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcggcggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 36
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 36
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Ala Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 37
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 37
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
<210> 38
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 38
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 39
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 39
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaagtcct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcggacgg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
<210> 40
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 40
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Val Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Asp Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 41
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 41
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atcgaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
<210> 42
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 42
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Ile Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 43
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 43
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagct gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tgggacgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
atggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc aaacaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcgcggat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
<210> 44
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 44
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Leu Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Asp Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Met Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Asn Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Ala Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 45
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 45
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
acggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt acagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggtcct gcgcctctaa 2400
<210> 46
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 46
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Thr Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Thr Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Val Leu Arg Leu
785 790 795
<210> 47
<211> 2415
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 47
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtgctggcgc cacgtgacgc ggtccgcatc 1440
ggcgaaccga ctggcggcac caccggtcgc acgctcattg tcgagcgcgt cgagacggcc 1500
gcgcagggtg tgtcgcggat ccgcctggtt tcgcccgatg gtcgcgcact accgcgttgg 1560
tcgccgggct cgcatatcga catcgaatgc ggccacaccg gcatctcgcg ccagtattcg 1620
ctgtgcggcg accccgccga taccagcgcc ttcgagatcg cggtgctgcg cgagcccgaa 1680
agccgtggtg gatcggcgtg gattcatgcc agtctgcgcg caggcgacaa gctcaaggtt 1740
cgcggcccgc gcaatcactt ccggctcgac gagacctgcc gtcgcgcgat cttcatcgcc 1800
ggtggcattg gcgtgactcc ggtcagcgcc atggcaaggc gtgcgaaaga actgggcgtc 1860
gactacacct tccactattg cggccgcagc cgtgcctcca tggcgatgat cgatgaactg 1920
cgcgccctgc atggtgatcg cgtgcggatt catgccgcgg atgaaggcca gcgcgccgat 1980
ctcgcgcaag tgctcggcgc acccgatgcg aacacgcaga tctacgcttg tggaccggcc 2040
cggatgatcg aggcgctgga agccctgtgc gcgacatggc ccgaggattc gctgcgcgtc 2100
gaacacttca gttcgaaact tggaacgctc gatccctcca gggaacagcc gtttgcggtc 2160
gaactgaagg actcggggct gacgcttgaa gttcctccgg accagacgct gctcgccacc 2220
ctgcgcgccg cgaacatcga cgtgcaaagc gattgcgagg aaggcctgtg tggatcgtgt 2280
gaagtgcgcg tgctggccgg cgagatcgac caccgcgacg tcgtgctgac gcgcggcgag 2340
cgtgatgcga acaaccggat gatggcctgc tgctcgcgag cggcgaaggg cggaaagatc 2400
gtgctggggc tgtaa 2415
<210> 48
<211> 804
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 48
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu Ala Pro Arg Asp Ala Val Arg Ile
465 470 475 480
Gly Glu Pro Thr Gly Gly Thr Thr Gly Arg Thr Leu Ile Val Glu Arg
485 490 495
Val Glu Thr Ala Ala Gln Gly Val Ser Arg Ile Arg Leu Val Ser Pro
500 505 510
Asp Gly Arg Ala Leu Pro Arg Trp Ser Pro Gly Ser His Ile Asp Ile
515 520 525
Glu Cys Gly His Thr Gly Ile Ser Arg Gln Tyr Ser Leu Cys Gly Asp
530 535 540
Pro Ala Asp Thr Ser Ala Phe Glu Ile Ala Val Leu Arg Glu Pro Glu
545 550 555 560
Ser Arg Gly Gly Ser Ala Trp Ile His Ala Ser Leu Arg Ala Gly Asp
565 570 575
Lys Leu Lys Val Arg Gly Pro Arg Asn His Phe Arg Leu Asp Glu Thr
580 585 590
Cys Arg Arg Ala Ile Phe Ile Ala Gly Gly Ile Gly Val Thr Pro Val
595 600 605
Ser Ala Met Ala Arg Arg Ala Lys Glu Leu Gly Val Asp Tyr Thr Phe
610 615 620
His Tyr Cys Gly Arg Ser Arg Ala Ser Met Ala Met Ile Asp Glu Leu
625 630 635 640
Arg Ala Leu His Gly Asp Arg Val Arg Ile His Ala Ala Asp Glu Gly
645 650 655
Gln Arg Ala Asp Leu Ala Gln Val Leu Gly Ala Pro Asp Ala Asn Thr
660 665 670
Gln Ile Tyr Ala Cys Gly Pro Ala Arg Met Ile Glu Ala Leu Glu Ala
675 680 685
Leu Cys Ala Thr Trp Pro Glu Asp Ser Leu Arg Val Glu His Phe Ser
690 695 700
Ser Lys Leu Gly Thr Leu Asp Pro Ser Arg Glu Gln Pro Phe Ala Val
705 710 715 720
Glu Leu Lys Asp Ser Gly Leu Thr Leu Glu Val Pro Pro Asp Gln Thr
725 730 735
Leu Leu Ala Thr Leu Arg Ala Ala Asn Ile Asp Val Gln Ser Asp Cys
740 745 750
Glu Glu Gly Leu Cys Gly Ser Cys Glu Val Arg Val Leu Ala Gly Glu
755 760 765
Ile Asp His Arg Asp Val Val Leu Thr Arg Gly Glu Arg Asp Ala Asn
770 775 780
Asn Arg Met Met Ala Cys Cys Ser Arg Ala Ala Lys Gly Gly Lys Ile
785 790 795 800
Val Leu Gly Leu
<210> 49
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 49
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt actgccagac aaattaccag ttttcctatt 1440
ggagcgcctg atctcaaggc catgacccgc ccggtacgtg tccaggcagt ttatcctgaa 1500
gcagaagata ttatacgtat tgagctggct gctatacacg gtgaagaatt accacgctgg 1560
agtgccggtt cacatattga actggtattg cctaatggcc tgagccgtaa gtactctcta 1620
tgcggtttag cgactgatca attttatacg attgctgtaa agagagagca ggaaagccgg 1680
ggtggttcac aatggattca tcagtattta aaagcaggag aacagatcta cattaaggga 1740
cctaaaaact tttttaaatt aaatttacag gcgagccagt atgtgctgat cgcaggtggg 1800
ataggtatta ctcctattct gagcatggcc agcagcttac gtgaacaggg gcgcccttac 1860
cggctaattt atctttcacg ccagcgggct agtatggcat tacttaagga agttgctgcg 1920
catggtagtg ctgccgaact ctatatttct tctgaaggta aacggataga cctgcaacag 1980
ctcttgtcag cgctgcctgc cggtacacag gtttgtgcct gtggtccgga agcattactt 2040
gataccttga ccaactatac cgaagacttg tcacaggttc agctcacggt cgagcatttt 2100
ggttcaggga agaacctctt tttatatgaa aatgataccg actttgaagt tgaactgctg 2160
gatagcggtt taacgctgac agtagcccgg gatcagacct tattggactg tttgctggac 2220
aaaggaattg atgtcagctt tgactgtacc gagggtttat gtggaagctg tcagcttccg 2280
gttgaagaag gtgaaattga tcatcgcgac aaggtgttga cccgagccga gcgtgacgga 2340
atgaaatcgg taatcagttg ctgttcacga ggaaaaggaa aactcaaact caagctttaa 2400
<210> 50
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 50
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Thr Ala Arg Gln Ile Thr Ser Phe Pro Ile
465 470 475 480
Gly Ala Pro Asp Leu Lys Ala Met Thr Arg Pro Val Arg Val Gln Ala
485 490 495
Val Tyr Pro Glu Ala Glu Asp Ile Ile Arg Ile Glu Leu Ala Ala Ile
500 505 510
His Gly Glu Glu Leu Pro Arg Trp Ser Ala Gly Ser His Ile Glu Leu
515 520 525
Val Leu Pro Asn Gly Leu Ser Arg Lys Tyr Ser Leu Cys Gly Leu Ala
530 535 540
Thr Asp Gln Phe Tyr Thr Ile Ala Val Lys Arg Glu Gln Glu Ser Arg
545 550 555 560
Gly Gly Ser Gln Trp Ile His Gln Tyr Leu Lys Ala Gly Glu Gln Ile
565 570 575
Tyr Ile Lys Gly Pro Lys Asn Phe Phe Lys Leu Asn Leu Gln Ala Ser
580 585 590
Gln Tyr Val Leu Ile Ala Gly Gly Ile Gly Ile Thr Pro Ile Leu Ser
595 600 605
Met Ala Ser Ser Leu Arg Glu Gln Gly Arg Pro Tyr Arg Leu Ile Tyr
610 615 620
Leu Ser Arg Gln Arg Ala Ser Met Ala Leu Leu Lys Glu Val Ala Ala
625 630 635 640
His Gly Ser Ala Ala Glu Leu Tyr Ile Ser Ser Glu Gly Lys Arg Ile
645 650 655
Asp Leu Gln Gln Leu Leu Ser Ala Leu Pro Ala Gly Thr Gln Val Cys
660 665 670
Ala Cys Gly Pro Glu Ala Leu Leu Asp Thr Leu Thr Asn Tyr Thr Glu
675 680 685
Asp Leu Ser Gln Val Gln Leu Thr Val Glu His Phe Gly Ser Gly Lys
690 695 700
Asn Leu Phe Leu Tyr Glu Asn Asp Thr Asp Phe Glu Val Glu Leu Leu
705 710 715 720
Asp Ser Gly Leu Thr Leu Thr Val Ala Arg Asp Gln Thr Leu Leu Asp
725 730 735
Cys Leu Leu Asp Lys Gly Ile Asp Val Ser Phe Asp Cys Thr Glu Gly
740 745 750
Leu Cys Gly Ser Cys Gln Leu Pro Val Glu Glu Gly Glu Ile Asp His
755 760 765
Arg Asp Lys Val Leu Thr Arg Ala Glu Arg Asp Gly Met Lys Ser Val
770 775 780
Ile Ser Cys Cys Ser Arg Gly Lys Gly Lys Leu Lys Leu Lys Leu
785 790 795
<210> 51
<211> 2238
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 51
atggaacata caggacaaag cgcggcggcg acgatgccgc tcgattcgat cgacgtgagt 60
atcccagaac tcttctacaa cgacagtgtt ggcgaatatt tcaagcggct gcgcaaggat 120
gatccagtcc actattgcgc cgacagcgcg tttgggccct actggtccat cacgaaatat 180
aatgacataa tgcacgtcga cacaaatcat gacatcttct cgtccgatgc aggatatggc 240
ggcatcataa tcgatgacgg cattcaaaaa ggtggcgatg gcggactgga tcttcccaat 300
ttcatcgcga tggatcggcc gcgacacgac gaacaaagaa aagctgtaag cccgattgta 360
gcccccgcca atttggccgc gcttgaaggc accattcgcg aacgagttag caaaacgctc 420
gatggtcttc cggtgggtga ggagttcgat tgggtagatc gcgtgtcgat cgaaatcacc 480
actcaaatgc tcgccaccct gttcgacttt ccgtttgaag agcgccgcaa gcttacccgc 540
tggtcggatg tgacaaccgc agcacccggc ggcggagttg tcgaaagctg ggatcagaga 600
aaaaccgaat tgttggaatg tgccgcttat ttccaggtgc tttggaatga gcgtgtcaac 660
aaggaccccg gcaacgatct catttcgatg ctggcacatt cgccagccac gcggaacatg 720
acgcccgaag agtatctggg caatgtactt ctcctgatcg ttgccgggaa cgataccaca 780
cgcaattcga tgaccggtgg cgttttagct ctccacaaga atccggacca gtttgccaag 840
ctaaaagcca accctgcgct ggttgaaacg atggtccctg aaatcattcg ctggcaaaca 900
ccgcttgctc atatgcgccg cacggccatt gcagattccg aactgggtgg gaagaccatc 960
cgcaagggcg acaaggtcgt catgtggtat tattcgggta atcgcgatga cgaagtgatt 1020
gaccgtcccg aagaatttat catcgaccgc ccccggcccc gccagcattt gtcattcggc 1080
tttggcatcc accgttgcgt tggcaatcgg ctagccgaaa tgcagctccg gatattgtgg 1140
gaagaaattc tcacgcgttt cagtcgtatc gaagtgatgg ccgaaccgga acgggtccgt 1200
tcaaattttg tgcgcggtta cgccaagatg atggttcgcg tccacgcggt actccatcgt 1260
catcaacctg tcaccatcgg cgagccggcc gctcgtgctg tgagccgcac ggtgaccgtt 1320
gagcgtcttg atcgcattgc cgacgatgtc cttcgcctgg tccttcgcga tgctggaggt 1380
aaaaccctcc cgacgtggac gcctggcgct cacatcgacc tggatctggg tgctctgagc 1440
cgtcagtatt cgctctgcgg cgctccggat gctccgtcgt acgaaatcgc cgtgcactta 1500
gatccggaaa gccgtggtgg aagccgctat attcatgaac agctggaagt tggaagtccg 1560
ctgcgtatgc gtggcccacg caaccatttc gccctggatc cgggtgcgga acattacgtg 1620
tttgttgccg ggggtatcgg catcacgccg gtgctggcaa tggcggatca tgcccgtgcg 1680
cgtggttggt cgtacgaact gcattattgt ggtcgtaatc gtagcggtat ggcttacctg 1740
gaacgcgtcg cgggacatgg tgaccgcgct gccttgcacg tatctgaaga aggcacccgc 1800
attgatctgg cggcattact tgctgaaccg gcgccgggcg tgcaaatcta cgcctgcggt 1860
ccgggccgtt tattagcggg tcttgaagac gcgtctcgta attggccgga tggcgcgctt 1920
catgtggagc atttcacttc gagtttagcc gctttggatc cggatgtcga acatgccttt 1980
gatttggagc tgcgtgactc tggccttacc gttcgcgtcg agccaactca gaccgtttta 2040
gacgctttgc gtgcgaacaa tatcgacgtc ccgtcggatt gcgaagaggg gctgtgtggt 2100
tcttgcgaag tagccgttct ggatggcgag gttgatcacc gtgataccgt tctgactaag 2160
gccgagcgcg ccgcgaatcg tcagatgatg acttgctgca gtcgtgcatg cggtgatcgt 2220
ctggcgctgc gcctctaa 2238
<210> 52
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 52
Met Glu His Thr Gly Gln Ser Ala Ala Ala Thr Met Pro Leu Asp Ser
1 5 10 15
Ile Asp Val Ser Ile Pro Glu Leu Phe Tyr Asn Asp Ser Val Gly Glu
20 25 30
Tyr Phe Lys Arg Leu Arg Lys Asp Asp Pro Val His Tyr Cys Ala Asp
35 40 45
Ser Ala Phe Gly Pro Tyr Trp Ser Ile Thr Lys Tyr Asn Asp Ile Met
50 55 60
His Val Asp Thr Asn His Asp Ile Phe Ser Ser Asp Ala Gly Tyr Gly
65 70 75 80
Gly Ile Ile Ile Asp Asp Gly Ile Gln Lys Gly Gly Asp Gly Gly Leu
85 90 95
Asp Leu Pro Asn Phe Ile Ala Met Asp Arg Pro Arg His Asp Glu Gln
100 105 110
Arg Lys Ala Val Ser Pro Ile Val Ala Pro Ala Asn Leu Ala Ala Leu
115 120 125
Glu Gly Thr Ile Arg Glu Arg Val Ser Lys Thr Leu Asp Gly Leu Pro
130 135 140
Val Gly Glu Glu Phe Asp Trp Val Asp Arg Val Ser Ile Glu Ile Thr
145 150 155 160
Thr Gln Met Leu Ala Thr Leu Phe Asp Phe Pro Phe Glu Glu Arg Arg
165 170 175
Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Ala Pro Gly Gly Gly
180 185 190
Val Val Glu Ser Trp Asp Gln Arg Lys Thr Glu Leu Leu Glu Cys Ala
195 200 205
Ala Tyr Phe Gln Val Leu Trp Asn Glu Arg Val Asn Lys Asp Pro Gly
210 215 220
Asn Asp Leu Ile Ser Met Leu Ala His Ser Pro Ala Thr Arg Asn Met
225 230 235 240
Thr Pro Glu Glu Tyr Leu Gly Asn Val Leu Leu Leu Ile Val Ala Gly
245 250 255
Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu His
260 265 270
Lys Asn Pro Asp Gln Phe Ala Lys Leu Lys Ala Asn Pro Ala Leu Val
275 280 285
Glu Thr Met Val Pro Glu Ile Ile Arg Trp Gln Thr Pro Leu Ala His
290 295 300
Met Arg Arg Thr Ala Ile Ala Asp Ser Glu Leu Gly Gly Lys Thr Ile
305 310 315 320
Arg Lys Gly Asp Lys Val Val Met Trp Tyr Tyr Ser Gly Asn Arg Asp
325 330 335
Asp Glu Val Ile Asp Arg Pro Glu Glu Phe Ile Ile Asp Arg Pro Arg
340 345 350
Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val Gly
355 360 365
Asn Arg Leu Ala Glu Met Gln Leu Arg Ile Leu Trp Glu Glu Ile Leu
370 375 380
Thr Arg Phe Ser Arg Ile Glu Val Met Ala Glu Pro Glu Arg Val Arg
385 390 395 400
Ser Asn Phe Val Arg Gly Tyr Ala Lys Met Met Val Arg Val His Ala
405 410 415
Val Leu His Arg His Gln Pro Val Thr Ile Gly Glu Pro Ala Ala Arg
420 425 430
Ala Val Ser Arg Thr Val Thr Val Glu Arg Leu Asp Arg Ile Ala Asp
435 440 445
Asp Val Leu Arg Leu Val Leu Arg Asp Ala Gly Gly Lys Thr Leu Pro
450 455 460
Thr Trp Thr Pro Gly Ala His Ile Asp Leu Asp Leu Gly Ala Leu Ser
465 470 475 480
Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp Ala Pro Ser Tyr Glu Ile
485 490 495
Ala Val His Leu Asp Pro Glu Ser Arg Gly Gly Ser Arg Tyr Ile His
500 505 510
Glu Gln Leu Glu Val Gly Ser Pro Leu Arg Met Arg Gly Pro Arg Asn
515 520 525
His Phe Ala Leu Asp Pro Gly Ala Glu His Tyr Val Phe Val Ala Gly
530 535 540
Gly Ile Gly Ile Thr Pro Val Leu Ala Met Ala Asp His Ala Arg Ala
545 550 555 560
Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys Gly Arg Asn Arg Ser Gly
565 570 575
Met Ala Tyr Leu Glu Arg Val Ala Gly His Gly Asp Arg Ala Ala Leu
580 585 590
His Val Ser Glu Glu Gly Thr Arg Ile Asp Leu Ala Ala Leu Leu Ala
595 600 605
Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala Cys Gly Pro Gly Arg Leu
610 615 620
Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn Trp Pro Asp Gly Ala Leu
625 630 635 640
His Val Glu His Phe Thr Ser Ser Leu Ala Ala Leu Asp Pro Asp Val
645 650 655
Glu His Ala Phe Asp Leu Glu Leu Arg Asp Ser Gly Leu Thr Val Arg
660 665 670
Val Glu Pro Thr Gln Thr Val Leu Asp Ala Leu Arg Ala Asn Asn Ile
675 680 685
Asp Val Pro Ser Asp Cys Glu Glu Gly Leu Cys Gly Ser Cys Glu Val
690 695 700
Ala Val Leu Asp Gly Glu Val Asp His Arg Asp Thr Val Leu Thr Lys
705 710 715 720
Ala Glu Arg Ala Ala Asn Arg Gln Met Met Thr Cys Cys Ser Arg Ala
725 730 735
Cys Gly Asp Arg Leu Ala Leu Arg Leu
740 745
<210> 53
<211> 3180
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 53
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt tcacctagca ctgaacagtc tgctaaaaaa 1440
gtacgcaaaa aggcagaaaa cgctcataat acgccgctgc ttgtgctata cggttcaaat 1500
atgggaacag ctgaaggaac ggcgcgtgat ttagcagata ttgcaatgag caaaggattt 1560
gcaccgcagg tcgcaacgct tgattcacac gccggaaatc ttccgcgcga aggagctgta 1620
ttaattgtaa cggcgtctta taacggtcat ccgcctgata acgcaaagca atttgtcgac 1680
tggttagacc aagcgtctgc tgatgaagta aaaggcgttc gctactccgt atttggatgc 1740
ggcgataaaa actgggctac tacgtatcaa aaagtgcctg cttttatcga tgaaacgctt 1800
gccgctaaag gggcagaaaa catcgctgac cgcggtgaag cagatgcaag cgacgacttt 1860
gaaggcacat atgaagaatg gcgtgaacat atgtggagtg acgtagcagc ctactttaac 1920
ctcgacattg aaaacagtga agataataaa tctactcttt cacttcaatt tgtcgacagc 1980
gccgcggata tgccgcttgc gaaaatgcac ggtgcgtttt caacgaacgt cgtagcaagc 2040
aaagaacttc aacagccagg cagtgcacga agcacgcgac atcttgaaat tgaacttcca 2100
aaagaagctt cttatcaaga aggagatcat ttaggtgtta ttcctcgcaa ctatgaagga 2160
atagtaaacc gtgtaacagc aaggttcggc ctagatgcat cacagcaaat ccgtctggaa 2220
gcagaagaag aaaaattagc tcatttgcca ctcgctaaaa cagtatccgt agaagagctt 2280
ctgcaatacg tggagcttca agatcctgtt acgcgcacgc agcttcgcgc aatggctgct 2340
aaaacggtct gcccgccgca taaagtagag cttgaagcct tgcttgaaaa gcaagcctac 2400
aaagaacaag tgctggcaaa acgtttaaca atgcttgaac tgcttgaaaa atacccggcg 2460
tgtgaaatga aattcagcga atttatcgcc cttctgccaa gcatacgccc gcgctattac 2520
tcgatttctt catcacctcg tgtcgatgaa aaacaagcaa gcatcacggt cagcgttgtc 2580
tcaggagaag cgtggagcgg atatggagaa tataaaggaa ttgcgtcgaa ctatcttgcc 2640
gagctgcaag aaggagatac gattacgtgc tttatttcca caccgcagtc agaatttacg 2700
ctgccaaaag accctgaaac gccgcttatc atggtcggac cgggaacagg cgtcgcgccg 2760
tttagaggct ttgtgcaggc gcgcaaacag ctaaaagaac aaggacagtc acttggagaa 2820
gcacatttat acttcggctg ccgttcacct catgaagact atctgtatca agaagagctt 2880
gaaaacgccc aaagcgaagg catcattacg cttcataccg ctttttctcg catgccaaat 2940
cagccgaaaa catacgttca gcacgtaatg gaacaagacg gcaagaaatt gattgaactt 3000
cttgatcaag gagcgcactt ctatatttgc ggagacggaa gccaaatggc acctgccgtt 3060
gaagcaacgc ttatgaaaag ctatgctgac gttcaccaag tgagtgaagc agacgctcgc 3120
ttatggctgc agcagctaga agaaaaaggc cgatacgcaa aagacgtgtg ggctgggtaa 3180
<210> 54
<211> 1059
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 54
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Ser Pro Ser Thr Glu Gln Ser Ala Lys Lys
465 470 475 480
Val Arg Lys Lys Ala Glu Asn Ala His Asn Thr Pro Leu Leu Val Leu
485 490 495
Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly Thr Ala Arg Asp Leu Ala
500 505 510
Asp Ile Ala Met Ser Lys Gly Phe Ala Pro Gln Val Ala Thr Leu Asp
515 520 525
Ser His Ala Gly Asn Leu Pro Arg Glu Gly Ala Val Leu Ile Val Thr
530 535 540
Ala Ser Tyr Asn Gly His Pro Pro Asp Asn Ala Lys Gln Phe Val Asp
545 550 555 560
Trp Leu Asp Gln Ala Ser Ala Asp Glu Val Lys Gly Val Arg Tyr Ser
565 570 575
Val Phe Gly Cys Gly Asp Lys Asn Trp Ala Thr Thr Tyr Gln Lys Val
580 585 590
Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala Lys Gly Ala Glu Asn Ile
595 600 605
Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp Asp Phe Glu Gly Thr Tyr
610 615 620
Glu Glu Trp Arg Glu His Met Trp Ser Asp Val Ala Ala Tyr Phe Asn
625 630 635 640
Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys Ser Thr Leu Ser Leu Gln
645 650 655
Phe Val Asp Ser Ala Ala Asp Met Pro Leu Ala Lys Met His Gly Ala
660 665 670
Phe Ser Thr Asn Val Val Ala Ser Lys Glu Leu Gln Gln Pro Gly Ser
675 680 685
Ala Arg Ser Thr Arg His Leu Glu Ile Glu Leu Pro Lys Glu Ala Ser
690 695 700
Tyr Gln Glu Gly Asp His Leu Gly Val Ile Pro Arg Asn Tyr Glu Gly
705 710 715 720
Ile Val Asn Arg Val Thr Ala Arg Phe Gly Leu Asp Ala Ser Gln Gln
725 730 735
Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu Ala His Leu Pro Leu Ala
740 745 750
Lys Thr Val Ser Val Glu Glu Leu Leu Gln Tyr Val Glu Leu Gln Asp
755 760 765
Pro Val Thr Arg Thr Gln Leu Arg Ala Met Ala Ala Lys Thr Val Cys
770 775 780
Pro Pro His Lys Val Glu Leu Glu Ala Leu Leu Glu Lys Gln Ala Tyr
785 790 795 800
Lys Glu Gln Val Leu Ala Lys Arg Leu Thr Met Leu Glu Leu Leu Glu
805 810 815
Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser Glu Phe Ile Ala Leu Leu
820 825 830
Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg Val
835 840 845
Asp Glu Lys Gln Ala Ser Ile Thr Val Ser Val Val Ser Gly Glu Ala
850 855 860
Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile Ala Ser Asn Tyr Leu Ala
865 870 875 880
Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys Phe Ile Ser Thr Pro Gln
885 890 895
Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu Thr Pro Leu Ile Met Val
900 905 910
Gly Pro Gly Thr Gly Val Ala Pro Phe Arg Gly Phe Val Gln Ala Arg
915 920 925
Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu Gly Glu Ala His Leu Tyr
930 935 940
Phe Gly Cys Arg Ser Pro His Glu Asp Tyr Leu Tyr Gln Glu Glu Leu
945 950 955 960
Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr Leu His Thr Ala Phe Ser
965 970 975
Arg Met Pro Asn Gln Pro Lys Thr Tyr Val Gln His Val Met Glu Gln
980 985 990
Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp Gln Gly Ala His Phe Tyr
995 1000 1005
Ile Cys Gly Asp Gly Ser Gln Met Ala Pro Ala Val Glu Ala Thr
1010 1015 1020
Leu Met Lys Ser Tyr Ala Asp Val His Gln Val Ser Glu Ala Asp
1025 1030 1035
Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu Lys Gly Arg Tyr Ala
1040 1045 1050
Lys Asp Val Trp Ala Gly
1055
<210> 55
<211> 3246
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 55
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt ggcgctcagc ctgaagagaa cggacggcag 1440
gaagaacggc cttccgcacc ggcggcggaa aatacgcacg gaacccctct tcttgtgctc 1500
tacggttcaa atctcggcac agccgaagag attgcgaagg agcttgctga agaagcgcgt 1560
gagcaagggt ttcacagccg gacggcggag cttgatcaat acgcaggcgc catcccggca 1620
gaaggggctg ttatcattgt gacggcttcc tataacggaa acccgcccga ttgcgcaaag 1680
gaatttgtca attggcttga gcatgatcag acagacgatt tgcgtggtgt caaatatgcg 1740
gtattcggct gcggtaaccg cagctgggcc agcacctacc agcggattcc gcgcctgatt 1800
gacagcgtat tggaaaaaaa aggcgcccaa aggctgcaca agcttggaga aggggatgca 1860
ggcgatgatt ttgaaggaca gtttgagtca tggaaatatg atctgtggcc gcttttaaga 1920
accgaatttt cattggccga acccgagccg aatcaaacag aaacagacag gcaagcctta 1980
tctgtcgagt tcgtaaacgc acctgcggct tcgccgctgg ctaaagctta tcaggtgttc 2040
acagcgaaga tatcggcaaa ccgagaactg cagtgtgaaa agagcgggag aagcacaagg 2100
catattgaaa tatcgcttcc tgaaggcgcc gcatatcagg agggagacca tctcggtgtg 2160
ctaccgcaaa acagcgaagt gctgattggc cgcgtttttc agcggtttgg gctgaacgga 2220
aatgaacaaa ttctgattag cggccggaat caagcatcac atttgccttt ggagaggccc 2280
gttcatgtca aagacctttt tcaacattgc gtcgagctcc aggaaccggc cacaagggcc 2340
cagatacgcg agctggcggc tcatactgtt tgtccgcctc atcagcgcga gcttgaagac 2400
ctgctgaaag atgacgtcta taaggatcaa gtgttgaata agcggctgac aatgcttgac 2460
ctgcttgagc aatacccggc ctgtgaactg ccgttcgccc gttttctggc gcttcttcct 2520
ccgctaaaac cgaggtacta ttcgatttcc agttcgccgc agcttaaccc gcggcaaaca 2580
agcatcaccg tctctgtcgt aagtggcccg gcgttgagcg gccgcgggca ttataaggga 2640
gttgcatcga actatctcgc cggccttgag ccgggagacg cgatttcgtg tttcatcaga 2700
gagcctcagt caggcttccg gcttcccgaa gatcctgaaa caccggtgat catggtcggg 2760
ccgggcaccg gaatcgcccc ttaccgcgga tttcttcagg cgcgccgcat ccagcgcgat 2820
gccggtgtga agctcggtga agcgcatttg tacttcggct gccgccgtcc gaacgaagat 2880
tttctgtatc gagacgagtt ggagcaagcg gaaaaggacg gaatcgtcca tctgcataca 2940
gcgttttccc ggcttgaggg ccggccgaaa acatatgtgc aagatttgct cagagaggat 3000
gcagccttgc tgattcactt gttgaacgaa ggcggccgcc tgtatgtgtg cggagacgga 3060
agccgcatgg ctccagctgt tgaacaagct ttgtgcgagg cgtatcgcat agtacagggt 3120
gcgagtcggg aagagtcgca aagctggctg tccgcacttt tagaagaagg gcgctatgca 3180
aaggatgtat gggacggcgg cgtttcccaa cataatgtga aggcggactg cattgcaaga 3240
acgtaa 3246
<210> 56
<211> 1081
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 56
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Gly Ala Gln Pro Glu Glu Asn Gly Arg Gln
465 470 475 480
Glu Glu Arg Pro Ser Ala Pro Ala Ala Glu Asn Thr His Gly Thr Pro
485 490 495
Leu Leu Val Leu Tyr Gly Ser Asn Leu Gly Thr Ala Glu Glu Ile Ala
500 505 510
Lys Glu Leu Ala Glu Glu Ala Arg Glu Gln Gly Phe His Ser Arg Thr
515 520 525
Ala Glu Leu Asp Gln Tyr Ala Gly Ala Ile Pro Ala Glu Gly Ala Val
530 535 540
Ile Ile Val Thr Ala Ser Tyr Asn Gly Asn Pro Pro Asp Cys Ala Lys
545 550 555 560
Glu Phe Val Asn Trp Leu Glu His Asp Gln Thr Asp Asp Leu Arg Gly
565 570 575
Val Lys Tyr Ala Val Phe Gly Cys Gly Asn Arg Ser Trp Ala Ser Thr
580 585 590
Tyr Gln Arg Ile Pro Arg Leu Ile Asp Ser Val Leu Glu Lys Lys Gly
595 600 605
Ala Gln Arg Leu His Lys Leu Gly Glu Gly Asp Ala Gly Asp Asp Phe
610 615 620
Glu Gly Gln Phe Glu Ser Trp Lys Tyr Asp Leu Trp Pro Leu Leu Arg
625 630 635 640
Thr Glu Phe Ser Leu Ala Glu Pro Glu Pro Asn Gln Thr Glu Thr Asp
645 650 655
Arg Gln Ala Leu Ser Val Glu Phe Val Asn Ala Pro Ala Ala Ser Pro
660 665 670
Leu Ala Lys Ala Tyr Gln Val Phe Thr Ala Lys Ile Ser Ala Asn Arg
675 680 685
Glu Leu Gln Cys Glu Lys Ser Gly Arg Ser Thr Arg His Ile Glu Ile
690 695 700
Ser Leu Pro Glu Gly Ala Ala Tyr Gln Glu Gly Asp His Leu Gly Val
705 710 715 720
Leu Pro Gln Asn Ser Glu Val Leu Ile Gly Arg Val Phe Gln Arg Phe
725 730 735
Gly Leu Asn Gly Asn Glu Gln Ile Leu Ile Ser Gly Arg Asn Gln Ala
740 745 750
Ser His Leu Pro Leu Glu Arg Pro Val His Val Lys Asp Leu Phe Gln
755 760 765
His Cys Val Glu Leu Gln Glu Pro Ala Thr Arg Ala Gln Ile Arg Glu
770 775 780
Leu Ala Ala His Thr Val Cys Pro Pro His Gln Arg Glu Leu Glu Asp
785 790 795 800
Leu Leu Lys Asp Asp Val Tyr Lys Asp Gln Val Leu Asn Lys Arg Leu
805 810 815
Thr Met Leu Asp Leu Leu Glu Gln Tyr Pro Ala Cys Glu Leu Pro Phe
820 825 830
Ala Arg Phe Leu Ala Leu Leu Pro Pro Leu Lys Pro Arg Tyr Tyr Ser
835 840 845
Ile Ser Ser Ser Pro Gln Leu Asn Pro Arg Gln Thr Ser Ile Thr Val
850 855 860
Ser Val Val Ser Gly Pro Ala Leu Ser Gly Arg Gly His Tyr Lys Gly
865 870 875 880
Val Ala Ser Asn Tyr Leu Ala Gly Leu Glu Pro Gly Asp Ala Ile Ser
885 890 895
Cys Phe Ile Arg Glu Pro Gln Ser Gly Phe Arg Leu Pro Glu Asp Pro
900 905 910
Glu Thr Pro Val Ile Met Val Gly Pro Gly Thr Gly Ile Ala Pro Tyr
915 920 925
Arg Gly Phe Leu Gln Ala Arg Arg Ile Gln Arg Asp Ala Gly Val Lys
930 935 940
Leu Gly Glu Ala His Leu Tyr Phe Gly Cys Arg Arg Pro Asn Glu Asp
945 950 955 960
Phe Leu Tyr Arg Asp Glu Leu Glu Gln Ala Glu Lys Asp Gly Ile Val
965 970 975
His Leu His Thr Ala Phe Ser Arg Leu Glu Gly Arg Pro Lys Thr Tyr
980 985 990
Val Gln Asp Leu Leu Arg Glu Asp Ala Ala Leu Leu Ile His Leu Leu
995 1000 1005
Asn Glu Gly Gly Arg Leu Tyr Val Cys Gly Asp Gly Ser Arg Met
1010 1015 1020
Ala Pro Ala Val Glu Gln Ala Leu Cys Glu Ala Tyr Arg Ile Val
1025 1030 1035
Gln Gly Ala Ser Arg Glu Glu Ser Gln Ser Trp Leu Ser Ala Leu
1040 1045 1050
Leu Glu Glu Gly Arg Tyr Ala Lys Asp Val Trp Asp Gly Gly Val
1055 1060 1065
Ser Gln His Asn Val Lys Ala Asp Cys Ile Ala Arg Thr
1070 1075 1080
<210> 57
<211> 2400
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 57
atgtcaacga gttcaagtac aagtaatgac atccaggcaa aaataattaa cgccacatcc 60
aaagtcgtgc caatgcatct acagatcaag gcactaaaaa acttgatgaa ggtgaagcgg 120
aagaccattg gcacttcccg ccctcaggtg cactttgttg aaaccgattt gcctgacgtc 180
aatgatttgg cgatagaaga tatcgatacg agtaaccctt ttttataccg acaaggtaag 240
gcgaatgcgt actttaagcg gttgcgtgat gaagcgccgg tgcactatca gaagaacagt 300
gctttcgggc cgttctggtc ggtaacacgc tacgaagata tcgtcttcgt ggacaagagc 360
catgatttgt tttccgccga accccaaatt atcttgggtg atcctccgga aggcctgtcg 420
gttgaaatgt tcatcgctat ggatcctccc aagcacgacg tacagcgtcg ggcagtccag 480
ggtgttgttg cgcccaagaa cctgaaagaa atggaaggac tgatccgcaa gcgcaccggg 540
gacgtactgg atagcctgcc gttggacact ccgttcaact gggtgccggt ggtgtcgaaa 600
gagctgaccg ggcgcatgct agcctcactg ttagatttcc cgtatgacga acgcgaaaaa 660
ctggttggct ggtcggatcg attgtccggc gcgtcctcgg caaccggcgg cgagtttacg 720
aatgaagatg tgttttttga tgacgcggca gatatggcgt gggctttctc caagctttgg 780
cgtgataaag aagcccgtca aaaagcaggt gaagagccgg gtttcgattt gatcagcatg 840
cttcagtcca atgaagacac aaaagatctg atcaatcgtc ctttggaatt cattggtaat 900
ctcgcgttgt tgattgttgg cggtaatgac accacgcgta actcaatgag cgggggggtg 960
ctggctttaa atcagttccc agagcaattc gagaagctaa aggcgaaccc aaagcttatc 1020
cccaatatgg tctctgaaat cattcgctgg caaacgccgc ttgcgtatat gcgccgggtt 1080
gccaagcagg atgtggagct gaacggacag accatcaaga agggtgatcg cgtgctgatg 1140
tggtatgcgt cgggcaacca ggatgagaga aaatttgaga atcctgagca attcatcatc 1200
gaccgcaaag atacgcgtaa ccatgtgtcg tttggttatg gggttcaccg ttgtatgggc 1260
aaccgccttg ccgaactgca gctgcgtatt ctgtgggaag agcttctccc tcgctttgaa 1320
aacatcgaag tgatcggtga gccggagcgc gtgcaatcga actttgtgcg gggctattcc 1380
aagatgatgg ttaagttgac ggctaaaaaa gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 58
<211> 799
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 58
Met Ser Thr Ser Ser Ser Thr Ser Asn Asp Ile Gln Ala Lys Ile Ile
1 5 10 15
Asn Ala Thr Ser Lys Val Val Pro Met His Leu Gln Ile Lys Ala Leu
20 25 30
Lys Asn Leu Met Lys Val Lys Arg Lys Thr Ile Gly Thr Ser Arg Pro
35 40 45
Gln Val His Phe Val Glu Thr Asp Leu Pro Asp Val Asn Asp Leu Ala
50 55 60
Ile Glu Asp Ile Asp Thr Ser Asn Pro Phe Leu Tyr Arg Gln Gly Lys
65 70 75 80
Ala Asn Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Ala Phe Gly Pro Phe Trp Ser Val Thr Arg Tyr Glu
100 105 110
Asp Ile Val Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Arg Ala Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Lys Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Leu Asp Thr Pro Phe
180 185 190
Asn Trp Val Pro Val Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Ser Leu Leu Asp Phe Pro Tyr Asp Glu Arg Glu Lys Leu Val Gly Trp
210 215 220
Ser Asp Arg Leu Ser Gly Ala Ser Ser Ala Thr Gly Gly Glu Phe Thr
225 230 235 240
Asn Glu Asp Val Phe Phe Asp Asp Ala Ala Asp Met Ala Trp Ala Phe
245 250 255
Ser Lys Leu Trp Arg Asp Lys Glu Ala Arg Gln Lys Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Met Leu Gln Ser Asn Glu Asp Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Leu Glu Phe Ile Gly Asn Leu Ala Leu Leu
290 295 300
Ile Val Gly Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Val
305 310 315 320
Leu Ala Leu Asn Gln Phe Pro Glu Gln Phe Glu Lys Leu Lys Ala Asn
325 330 335
Pro Lys Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Val Ala Lys Gln Asp Val Glu Leu Asn
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Leu Met Trp Tyr Ala Ser
370 375 380
Gly Asn Gln Asp Glu Arg Lys Phe Glu Asn Pro Glu Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Thr Arg Asn His Val Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Leu Leu Pro Arg Phe Glu Asn Ile Glu Val Ile Gly Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Lys Met Met Val
450 455 460
Lys Leu Thr Ala Lys Lys Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 59
<211> 1392
<212> DNA
<213> Mycobacterium marinum
<400> 59
atgagcaata ttcgcgaggc agtcactgcc aaggctcagg caacaattcc gatggaccga 60
ataatccagg gcgcccacct ctacgacaga acgcggcgct gggtcaccgg caccaacggt 120
gaaaaaatct tcatcgagcg accgatcccg ccggctgacg aggttgaact gaccgacatc 180
gaccttagca atcctttcct ctatcgtcag ggtcgctgga agtcctatta cgagcgccta 240
cgcaacgagg ctcccgtgca ctatcaggcc cacagcgcgt tcggcccgtt ctggtcggtg 300
acgcggcatg ccgacatcgt ggccgtcgac aagaaccacg aggtcttctc ctccgagccg 360
ttcatcgtca tcgggagccc gccgcgcttc ctcgacattg cgatgttcat cgcgatggac 420
cccccaaaac acgaccggca acggcaggct gtccagggtg tggtcgcacc gaagaacctg 480
cgtgagatgg agggcctcat ccgcgagcgg gtggtagacg tgctcgacgc tctgccgctt 540
ggcgaaccgt tcaactgggt gcagcacgtc tcgatcgagc taaccgcgcg catgctggcc 600
acgctgctgg acttcccgtt cgagcagcgg cgcaagctcg tccaatggtc cgatctcgcc 660
acctccatgg agcaagccaa cggtgggccc tcggacaacg acgagatatt tcgcggcatg 720
gtcgatatgg ctagaggtct cagcgctcac tggcgggaca aggcagcccg gacagctgcc 780
ggagagctgc ccggcttcga tctgatcacc atgttgcaga gcgacgagag caccaaggac 840
ctgatcgatc gcccgatgga gttcttgggc aacttggtat tgctgatcgt gggtggcaac 900
gatacgaccc gcaattccat gagcggtggt gttctggcgc tgaacgagtt ccctgaccag 960
tttgagaagc tgaaggcgaa ccccgagctg atccccaaca tggtctcgga gatcatccgg 1020
tggcaaaccc cgctcgcgca tatgcgccgg atcgccaagg ccgacactgt gctcaacggg 1080
cagttcatcc gcaagggcga caaggtcctg atgtggtacg cctcgggcaa ccgcgacgag 1140
cgcgtgttcg atcggcccga tgacctgatt atcgatcggg ccaacgcccg taaccacatc 1200
tccttcggtt tcggcgtgca ccgctgtatg ggtaaccggc tggccgagat gcagttgcgg 1260
atcctgtggg aggagctgct tccgcggttc gagaacatcg aggtcgtcgg tgagcccgag 1320
tacgtgcagt ccaacttcgt gagggggatc agtaagctga tggtccgcct caccccgaaa 1380
ggtggcgcat ga 1392
<210> 60
<211> 463
<212> PRT
<213> Mycobacterium marinum
<400> 60
Met Ser Asn Ile Arg Glu Ala Val Thr Ala Lys Ala Gln Ala Thr Ile
1 5 10 15
Pro Met Asp Arg Ile Ile Gln Gly Ala His Leu Tyr Asp Arg Thr Arg
20 25 30
Arg Trp Val Thr Gly Thr Asn Gly Glu Lys Ile Phe Ile Glu Arg Pro
35 40 45
Ile Pro Pro Ala Asp Glu Val Glu Leu Thr Asp Ile Asp Leu Ser Asn
50 55 60
Pro Phe Leu Tyr Arg Gln Gly Arg Trp Lys Ser Tyr Tyr Glu Arg Leu
65 70 75 80
Arg Asn Glu Ala Pro Val His Tyr Gln Ala His Ser Ala Phe Gly Pro
85 90 95
Phe Trp Ser Val Thr Arg His Ala Asp Ile Val Ala Val Asp Lys Asn
100 105 110
His Glu Val Phe Ser Ser Glu Pro Phe Ile Val Ile Gly Ser Pro Pro
115 120 125
Arg Phe Leu Asp Ile Ala Met Phe Ile Ala Met Asp Pro Pro Lys His
130 135 140
Asp Arg Gln Arg Gln Ala Val Gln Gly Val Val Ala Pro Lys Asn Leu
145 150 155 160
Arg Glu Met Glu Gly Leu Ile Arg Glu Arg Val Val Asp Val Leu Asp
165 170 175
Ala Leu Pro Leu Gly Glu Pro Phe Asn Trp Val Gln His Val Ser Ile
180 185 190
Glu Leu Thr Ala Arg Met Leu Ala Thr Leu Leu Asp Phe Pro Phe Glu
195 200 205
Gln Arg Arg Lys Leu Val Gln Trp Ser Asp Leu Ala Thr Ser Met Glu
210 215 220
Gln Ala Asn Gly Gly Pro Ser Asp Asn Asp Glu Ile Phe Arg Gly Met
225 230 235 240
Val Asp Met Ala Arg Gly Leu Ser Ala His Trp Arg Asp Lys Ala Ala
245 250 255
Arg Thr Ala Ala Gly Glu Leu Pro Gly Phe Asp Leu Ile Thr Met Leu
260 265 270
Gln Ser Asp Glu Ser Thr Lys Asp Leu Ile Asp Arg Pro Met Glu Phe
275 280 285
Leu Gly Asn Leu Val Leu Leu Ile Val Gly Gly Asn Asp Thr Thr Arg
290 295 300
Asn Ser Met Ser Gly Gly Val Leu Ala Leu Asn Glu Phe Pro Asp Gln
305 310 315 320
Phe Glu Lys Leu Lys Ala Asn Pro Glu Leu Ile Pro Asn Met Val Ser
325 330 335
Glu Ile Ile Arg Trp Gln Thr Pro Leu Ala His Met Arg Arg Ile Ala
340 345 350
Lys Ala Asp Thr Val Leu Asn Gly Gln Phe Ile Arg Lys Gly Asp Lys
355 360 365
Val Leu Met Trp Tyr Ala Ser Gly Asn Arg Asp Glu Arg Val Phe Asp
370 375 380
Arg Pro Asp Asp Leu Ile Ile Asp Arg Ala Asn Ala Arg Asn His Ile
385 390 395 400
Ser Phe Gly Phe Gly Val His Arg Cys Met Gly Asn Arg Leu Ala Glu
405 410 415
Met Gln Leu Arg Ile Leu Trp Glu Glu Leu Leu Pro Arg Phe Glu Asn
420 425 430
Ile Glu Val Val Gly Glu Pro Glu Tyr Val Gln Ser Asn Phe Val Arg
435 440 445
Gly Ile Ser Lys Leu Met Val Arg Leu Thr Pro Lys Gly Gly Ala
450 455 460
<210> 61
<211> 3150
<212> DNA
<213> Bacillus megaterium
<400> 61
atgacaatta aagaaatgcc tcagccaaaa acgtttggag agcttaaaaa tttaccgtta 60
ttaaacacag ataaaccggt tcaagctttg atgaaaattg cggatgaatt aggagaaatc 120
tttaaattcg aggcgcctgg tcgtgtaacg cgctacttat caagtcagcg tctaattaaa 180
gaagcatgcg atgaatcacg ctttgataaa aacttaagtc aagcgcttaa atttgtacgt 240
gattttgcag gagacgggtt agctacaagc tggacgcatg aaaaaaattg gaaaaaagcg 300
cataatatct tacttccaag cttcagtcag caggcaatga aaggctatca tgcgatgatg 360
gtcgatatcg ccgtgcagct tgttcaaaag tgggagcgtc taaatgcaga tgagcatatt 420
gaagtaccgg aagacatgac acgtttaacg cttgatacaa ttggtctttg cggctttaac 480
tatcgcttta acagctttta ccgagatcag cctcatccat ttattacaag tatggtccgt 540
gcactggatg aagcaatgaa caagctgcag cgagcaaatc cagacgaccc agcttatgat 600
gaaaacaagc gccagtttca agaagatatc aaggtgatga acgacctagt agataaaatt 660
attgcagatc gcaaagcaag cggtgaacaa agcgatgatt tattaacgca tatgctaaac 720
ggaaaagatc cagaaacggg tgagccgctt gatgacgaga acattcgcta tcaaattatt 780
acattcttaa ttgcgggaca cgaaacaaca agtggtcttt tatcatttgc gctgtatttc 840
ttagtgaaaa atccacatgt attacaaaaa gcagcagaag aagcagcacg agttctagta 900
gatcctgttc caagctacaa acaagtcaaa cagcttaaat atgtcggcat ggtcttaaac 960
gaagcgctgc gcttatggcc aactgctcct gcgttttccc tatatgcaaa agaagatacg 1020
gtgcttggag gagaatatcc tttagaaaaa ggcgacgaac taatggttct gattcctcag 1080
cttcaccgtg ataaaacaat ttggggagac gatgtggaag agttccgtcc agagcgtttt 1140
gaaaatccaa gtgcgattcc gcagcatgcg tttaaaccgt ttggaaacgg tcagcgtgcg 1200
tgtatcggtc agcagttcgc tcttcatgaa gcaacgctgg tacttggtat gatgctaaaa 1260
cactttgact ttgaagatca tacaaactac gagctggata ttaaagaaac tttaacgtta 1320
aaacctgaag gctttgtggt aaaagcaaaa tcgaaaaaaa ttccgcttgg cggtattcct 1380
tcacctagca ctgaacagtc tgctaaaaaa gtacgcaaaa aggcagaaaa cgctcataat 1440
acgccgctgc ttgtgctata cggttcaaat atgggaacag ctgaaggaac ggcgcgtgat 1500
ttagcagata ttgcaatgag caaaggattt gcaccgcagg tcgcaacgct tgattcacac 1560
gccggaaatc ttccgcgcga aggagctgta ttaattgtaa cggcgtctta taacggtcat 1620
ccgcctgata acgcaaagca atttgtcgac tggttagacc aagcgtctgc tgatgaagta 1680
aaaggcgttc gctactccgt atttggatgc ggcgataaaa actgggctac tacgtatcaa 1740
aaagtgcctg cttttatcga tgaaacgctt gccgctaaag gggcagaaaa catcgctgac 1800
cgcggtgaag cagatgcaag cgacgacttt gaaggcacat atgaagaatg gcgtgaacat 1860
atgtggagtg acgtagcagc ctactttaac ctcgacattg aaaacagtga agataataaa 1920
tctactcttt cacttcaatt tgtcgacagc gccgcggata tgccgcttgc gaaaatgcac 1980
ggtgcgtttt caacgaacgt cgtagcaagc aaagaacttc aacagccagg cagtgcacga 2040
agcacgcgac atcttgaaat tgaacttcca aaagaagctt cttatcaaga aggagatcat 2100
ttaggtgtta ttcctcgcaa ctatgaagga atagtaaacc gtgtaacagc aaggttcggc 2160
ctagatgcat cacagcaaat ccgtctggaa gcagaagaag aaaaattagc tcatttgcca 2220
ctcgctaaaa cagtatccgt agaagagctt ctgcaatacg tggagcttca agatcctgtt 2280
acgcgcacgc agcttcgcgc aatggctgct aaaacggtct gcccgccgca taaagtagag 2340
cttgaagcct tgcttgaaaa gcaagcctac aaagaacaag tgctggcaaa acgtttaaca 2400
atgcttgaac tgcttgaaaa atacccggcg tgtgaaatga aattcagcga atttatcgcc 2460
cttctgccaa gcatacgccc gcgctattac tcgatttctt catcacctcg tgtcgatgaa 2520
aaacaagcaa gcatcacggt cagcgttgtc tcaggagaag cgtggagcgg atatggagaa 2580
tataaaggaa ttgcgtcgaa ctatcttgcc gagctgcaag aaggagatac gattacgtgc 2640
tttatttcca caccgcagtc agaatttacg ctgccaaaag accctgaaac gccgcttatc 2700
atggtcggac cgggaacagg cgtcgcgccg tttagaggct ttgtgcaggc gcgcaaacag 2760
ctaaaagaac aaggacagtc acttggagaa gcacatttat acttcggctg ccgttcacct 2820
catgaagact atctgtatca agaagagctt gaaaacgccc aaagcgaagg catcattacg 2880
cttcataccg ctttttctcg catgccaaat cagccgaaaa catacgttca gcacgtaatg 2940
gaacaagacg gcaagaaatt gattgaactt cttgatcaag gagcgcactt ctatatttgc 3000
ggagacggaa gccaaatggc acctgccgtt gaagcaacgc ttatgaaaag ctatgctgac 3060
gttcaccaag tgagtgaagc agacgctcgc ttatggctgc agcagctaga agaaaaaggc 3120
cgatacgcaa aagacgtgtg ggctgggtaa 3150
<210> 62
<211> 1049
<212> PRT
<213> Bacillus megaterium
<400> 62
Met Thr Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys
1 5 10 15
Asn Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys
20 25 30
Ile Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Arg
35 40 45
Val Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp
50 55 60
Glu Ser Arg Phe Asp Lys Asn Leu Ser Gln Ala Leu Lys Phe Val Arg
65 70 75 80
Asp Phe Ala Gly Asp Gly Leu Ala Thr Ser Trp Thr His Glu Lys Asn
85 90 95
Trp Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala
100 105 110
Met Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val
115 120 125
Gln Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu
130 135 140
Asp Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn
145 150 155 160
Tyr Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr
165 170 175
Ser Met Val Arg Ala Leu Asp Glu Ala Met Asn Lys Leu Gln Arg Ala
180 185 190
Asn Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu
195 200 205
Asp Ile Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg
210 215 220
Lys Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn
225 230 235 240
Gly Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg
245 250 255
Tyr Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly
260 265 270
Leu Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu
275 280 285
Gln Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro
290 295 300
Ser Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn
305 310 315 320
Glu Ala Leu Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu Tyr Ala
325 330 335
Lys Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp
340 345 350
Glu Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp
355 360 365
Gly Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser
370 375 380
Ala Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala
385 390 395 400
Cys Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly
405 410 415
Met Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu
420 425 430
Asp Ile Lys Glu Thr Leu Thr Leu Lys Pro Glu Gly Phe Val Val Lys
435 440 445
Ala Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr
450 455 460
Glu Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn
465 470 475 480
Thr Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly
485 490 495
Thr Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro
500 505 510
Gln Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly
515 520 525
Ala Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn
530 535 540
Ala Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val
545 550 555 560
Lys Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala
565 570 575
Thr Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala
580 585 590
Lys Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp
595 600 605
Asp Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp
610 615 620
Val Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys
625 630 635 640
Ser Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu
645 650 655
Ala Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu
660 665 670
Leu Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu
675 680 685
Leu Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile
690 695 700
Pro Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly
705 710 715 720
Leu Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu
725 730 735
Ala His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln
740 745 750
Tyr Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met
755 760 765
Ala Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu
770 775 780
Leu Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr
785 790 795 800
Met Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser
805 810 815
Glu Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile
820 825 830
Ser Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser
835 840 845
Val Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile
850 855 860
Ala Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys
865 870 875 880
Phe Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu
885 890 895
Thr Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg
900 905 910
Gly Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu
915 920 925
Gly Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr
930 935 940
Leu Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr
945 950 955 960
Leu His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val
965 970 975
Gln His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp
980 985 990
Gln Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro
995 1000 1005
Ala Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln
1010 1015 1020
Val Ser Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu
1025 1030 1035
Lys Gly Arg Tyr Ala Lys Asp Val Trp Ala Gly
1040 1045
<210> 63
<211> 3225
<212> DNA
<213> Bacillus licheniformis
<400> 63
atgaacaagt tagatggaat tccaatccct aaaacttacg ggccgctcgg caacctgcct 60
ttgcttgaca aaaacagggt ctcccagtca ctttggaaaa tcgcggatga gatggggcct 120
atctttcaat ttaagtttgc ggatgcgatt ggggtttttg tgtccagcca tgaactggtt 180
aaagaagtct ctgaagaatc ccgttttgac aaaaacatgg ggaaggggct attgaaagtt 240
cgcgagttca gcggagacgg gctctttaca agctggacgg aagaacccaa ttggcggaaa 300
gcccacaaca tccttctgcc gagcttcagc cagaaagcga tgaagggata ccatcccatg 360
atgcaggata tcgccgtcca gctcattcaa aagtggtccc gtctcaatca ggatgaaagc 420
attgatgtgc cggacgatat gacgcggctg acgctggaca cgatcggctt atgcgggttt 480
aactaccgct ttaacagctt ctaccgtgaa gggcagcatc cgtttattga gagcatggtc 540
cggggtttga gcgaagcgat gagacagacg aagcgcttcc cgctgcagga taagctgatg 600
attcaaacga agcgccggtt taacagcgat gtcgagtcga tgttttctct tgttgaccgg 660
atcatcgctg accggaagca ggccgagagt gaaagcggaa atgacctctt gtcgcttatg 720
cttcatgcga aagaccctga gaccggcgaa aaactggatg atgagaatat ccgctatcaa 780
attattacat ttttgattgc cggacacgag acgacgagcg gtttattatc gtttgcaatc 840
tatctgctcc tgaagcatcc ggataagctt aagaaagcgt atgaagaagc agaccgcgtg 900
ctgaccgatc ccgtcccatc ctacaaacag gttcagcagc tgaaatacat ccgaatgatt 960
ttgaatgaat cgataaggct ttggccgacg gcaccggctt tctctcttta tgcaaaagaa 1020
gaaacggtta tcgggggaaa atatttgatt ccaaaaggac agagcgttac agtgctcatc 1080
ccaaaactgc acagagatca aagcgtctgg ggagaagatg ccgaggcatt ccggcctgaa 1140
cggttcgagc agatggacag cattccggcg cacgcataca aaccgtttgg caacggccaa 1200
agggcatgca tcggcatgca gttcgccctt catgaagcga cgcttgtgct cggcatgatt 1260
cttcagtact ttgatcttga agatcatgca aactaccaat tgaagatcaa agaatcgctg 1320
acattaaaac cggatggttt cacaatccgg gtgaggccga ggaaaaaaga agcaatgacg 1380
gcgatgccgg gcgctcagcc tgaagagaac ggacggcagg aagaacggcc ttccgcaccg 1440
gcggcggaaa atacgcacgg aacccctctt cttgtgctct acggttcaaa tctcggcaca 1500
gccgaagaga ttgcgaagga gcttgctgaa gaagcgcgtg agcaagggtt tcacagccgg 1560
acggcggagc ttgatcaata cgcaggcgcc atcccggcag aaggggctgt tatcattgtg 1620
acggcttcct ataacggaaa cccgcccgat tgcgcaaagg aatttgtcaa ttggcttgag 1680
catgatcaga cagacgattt gcgtggtgtc aaatatgcgg tattcggctg cggtaaccgc 1740
agctgggcca gcacctacca gcggattccg cgcctgattg acagcgtatt ggaaaaaaaa 1800
ggcgcccaaa ggctgcacaa gcttggagaa ggggatgcag gcgatgattt tgaaggacag 1860
tttgagtcat ggaaatatga tctgtggccg cttttaagaa ccgaattttc attggccgaa 1920
cccgagccga atcaaacaga aacagacagg caagccttat ctgtcgagtt cgtaaacgca 1980
cctgcggctt cgccgctggc taaagcttat caggtgttca cagcgaagat atcggcaaac 2040
cgagaactgc agtgtgaaaa gagcgggaga agcacaaggc atattgaaat atcgcttcct 2100
gaaggcgccg catatcagga gggagaccat ctcggtgtgc taccgcaaaa cagcgaagtg 2160
ctgattggcc gcgtttttca gcggtttggg ctgaacggaa atgaacaaat tctgattagc 2220
ggccggaatc aagcatcaca tttgcctttg gagaggcccg ttcatgtcaa agaccttttt 2280
caacattgcg tcgagctcca ggaaccggcc acaagggccc agatacgcga gctggcggct 2340
catactgttt gtccgcctca tcagcgcgag cttgaagacc tgctgaaaga tgacgtctat 2400
aaggatcaag tgttgaataa gcggctgaca atgcttgacc tgcttgagca atacccggcc 2460
tgtgaactgc cgttcgcccg ttttctggcg cttcttcctc cgctaaaacc gaggtactat 2520
tcgatttcca gttcgccgca gcttaacccg cggcaaacaa gcatcaccgt ctctgtcgta 2580
agtggcccgg cgttgagcgg ccgcgggcat tataagggag ttgcatcgaa ctatctcgcc 2640
ggccttgagc cgggagacgc gatttcgtgt ttcatcagag agcctcagtc aggcttccgg 2700
cttcccgaag atcctgaaac accggtgatc atggtcgggc cgggcaccgg aatcgcccct 2760
taccgcggat ttcttcaggc gcgccgcatc cagcgcgatg ccggtgtgaa gctcggtgaa 2820
gcgcatttgt acttcggctg ccgccgtccg aacgaagatt ttctgtatcg agacgagttg 2880
gagcaagcgg aaaaggacgg aatcgtccat ctgcatacag cgttttcccg gcttgagggc 2940
cggccgaaaa catatgtgca agatttgctc agagaggatg cagccttgct gattcacttg 3000
ttgaacgaag gcggccgcct gtatgtgtgc ggagacggaa gccgcatggc tccagctgtt 3060
gaacaagctt tgtgcgaggc gtatcgcata gtacagggtg cgagtcggga agagtcgcaa 3120
agctggctgt ccgcactttt agaagaaggg cgctatgcaa aggatgtatg ggacggcggc 3180
gtttcccaac ataatgtgaa ggcggactgc attgcaagaa cgtaa 3225
<210> 64
<211> 1074
<212> PRT
<213> Bacillus licheniformis
<400> 64
Met Asn Lys Leu Asp Gly Ile Pro Ile Pro Lys Thr Tyr Gly Pro Leu
1 5 10 15
Gly Asn Leu Pro Leu Leu Asp Lys Asn Arg Val Ser Gln Ser Leu Trp
20 25 30
Lys Ile Ala Asp Glu Met Gly Pro Ile Phe Gln Phe Lys Phe Ala Asp
35 40 45
Ala Ile Gly Val Phe Val Ser Ser His Glu Leu Val Lys Glu Val Ser
50 55 60
Glu Glu Ser Arg Phe Asp Lys Asn Met Gly Lys Gly Leu Leu Lys Val
65 70 75 80
Arg Glu Phe Ser Gly Asp Gly Leu Phe Thr Ser Trp Thr Glu Glu Pro
85 90 95
Asn Trp Arg Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Lys
100 105 110
Ala Met Lys Gly Tyr His Pro Met Met Gln Asp Ile Ala Val Gln Leu
115 120 125
Ile Gln Lys Trp Ser Arg Leu Asn Gln Asp Glu Ser Ile Asp Val Pro
130 135 140
Asp Asp Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe
145 150 155 160
Asn Tyr Arg Phe Asn Ser Phe Tyr Arg Glu Gly Gln His Pro Phe Ile
165 170 175
Glu Ser Met Val Arg Gly Leu Ser Glu Ala Met Arg Gln Thr Lys Arg
180 185 190
Phe Pro Leu Gln Asp Lys Leu Met Ile Gln Thr Lys Arg Arg Phe Asn
195 200 205
Ser Asp Val Glu Ser Met Phe Ser Leu Val Asp Arg Ile Ile Ala Asp
210 215 220
Arg Lys Gln Ala Glu Ser Glu Ser Gly Asn Asp Leu Leu Ser Leu Met
225 230 235 240
Leu His Ala Lys Asp Pro Glu Thr Gly Glu Lys Leu Asp Asp Glu Asn
245 250 255
Ile Arg Tyr Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr
260 265 270
Ser Gly Leu Leu Ser Phe Ala Ile Tyr Leu Leu Leu Lys His Pro Asp
275 280 285
Lys Leu Lys Lys Ala Tyr Glu Glu Ala Asp Arg Val Leu Thr Asp Pro
290 295 300
Val Pro Ser Tyr Lys Gln Val Gln Gln Leu Lys Tyr Ile Arg Met Ile
305 310 315 320
Leu Asn Glu Ser Ile Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu
325 330 335
Tyr Ala Lys Glu Glu Thr Val Ile Gly Gly Lys Tyr Leu Ile Pro Lys
340 345 350
Gly Gln Ser Val Thr Val Leu Ile Pro Lys Leu His Arg Asp Gln Ser
355 360 365
Val Trp Gly Glu Asp Ala Glu Ala Phe Arg Pro Glu Arg Phe Glu Gln
370 375 380
Met Asp Ser Ile Pro Ala His Ala Tyr Lys Pro Phe Gly Asn Gly Gln
385 390 395 400
Arg Ala Cys Ile Gly Met Gln Phe Ala Leu His Glu Ala Thr Leu Val
405 410 415
Leu Gly Met Ile Leu Gln Tyr Phe Asp Leu Glu Asp His Ala Asn Tyr
420 425 430
Gln Leu Lys Ile Lys Glu Ser Leu Thr Leu Lys Pro Asp Gly Phe Thr
435 440 445
Ile Arg Val Arg Pro Arg Lys Lys Glu Ala Met Thr Ala Met Pro Gly
450 455 460
Ala Gln Pro Glu Glu Asn Gly Arg Gln Glu Glu Arg Pro Ser Ala Pro
465 470 475 480
Ala Ala Glu Asn Thr His Gly Thr Pro Leu Leu Val Leu Tyr Gly Ser
485 490 495
Asn Leu Gly Thr Ala Glu Glu Ile Ala Lys Glu Leu Ala Glu Glu Ala
500 505 510
Arg Glu Gln Gly Phe His Ser Arg Thr Ala Glu Leu Asp Gln Tyr Ala
515 520 525
Gly Ala Ile Pro Ala Glu Gly Ala Val Ile Ile Val Thr Ala Ser Tyr
530 535 540
Asn Gly Asn Pro Pro Asp Cys Ala Lys Glu Phe Val Asn Trp Leu Glu
545 550 555 560
His Asp Gln Thr Asp Asp Leu Arg Gly Val Lys Tyr Ala Val Phe Gly
565 570 575
Cys Gly Asn Arg Ser Trp Ala Ser Thr Tyr Gln Arg Ile Pro Arg Leu
580 585 590
Ile Asp Ser Val Leu Glu Lys Lys Gly Ala Gln Arg Leu His Lys Leu
595 600 605
Gly Glu Gly Asp Ala Gly Asp Asp Phe Glu Gly Gln Phe Glu Ser Trp
610 615 620
Lys Tyr Asp Leu Trp Pro Leu Leu Arg Thr Glu Phe Ser Leu Ala Glu
625 630 635 640
Pro Glu Pro Asn Gln Thr Glu Thr Asp Arg Gln Ala Leu Ser Val Glu
645 650 655
Phe Val Asn Ala Pro Ala Ala Ser Pro Leu Ala Lys Ala Tyr Gln Val
660 665 670
Phe Thr Ala Lys Ile Ser Ala Asn Arg Glu Leu Gln Cys Glu Lys Ser
675 680 685
Gly Arg Ser Thr Arg His Ile Glu Ile Ser Leu Pro Glu Gly Ala Ala
690 695 700
Tyr Gln Glu Gly Asp His Leu Gly Val Leu Pro Gln Asn Ser Glu Val
705 710 715 720
Leu Ile Gly Arg Val Phe Gln Arg Phe Gly Leu Asn Gly Asn Glu Gln
725 730 735
Ile Leu Ile Ser Gly Arg Asn Gln Ala Ser His Leu Pro Leu Glu Arg
740 745 750
Pro Val His Val Lys Asp Leu Phe Gln His Cys Val Glu Leu Gln Glu
755 760 765
Pro Ala Thr Arg Ala Gln Ile Arg Glu Leu Ala Ala His Thr Val Cys
770 775 780
Pro Pro His Gln Arg Glu Leu Glu Asp Leu Leu Lys Asp Asp Val Tyr
785 790 795 800
Lys Asp Gln Val Leu Asn Lys Arg Leu Thr Met Leu Asp Leu Leu Glu
805 810 815
Gln Tyr Pro Ala Cys Glu Leu Pro Phe Ala Arg Phe Leu Ala Leu Leu
820 825 830
Pro Pro Leu Lys Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Gln Leu
835 840 845
Asn Pro Arg Gln Thr Ser Ile Thr Val Ser Val Val Ser Gly Pro Ala
850 855 860
Leu Ser Gly Arg Gly His Tyr Lys Gly Val Ala Ser Asn Tyr Leu Ala
865 870 875 880
Gly Leu Glu Pro Gly Asp Ala Ile Ser Cys Phe Ile Arg Glu Pro Gln
885 890 895
Ser Gly Phe Arg Leu Pro Glu Asp Pro Glu Thr Pro Val Ile Met Val
900 905 910
Gly Pro Gly Thr Gly Ile Ala Pro Tyr Arg Gly Phe Leu Gln Ala Arg
915 920 925
Arg Ile Gln Arg Asp Ala Gly Val Lys Leu Gly Glu Ala His Leu Tyr
930 935 940
Phe Gly Cys Arg Arg Pro Asn Glu Asp Phe Leu Tyr Arg Asp Glu Leu
945 950 955 960
Glu Gln Ala Glu Lys Asp Gly Ile Val His Leu His Thr Ala Phe Ser
965 970 975
Arg Leu Glu Gly Arg Pro Lys Thr Tyr Val Gln Asp Leu Leu Arg Glu
980 985 990
Asp Ala Ala Leu Leu Ile His Leu Leu Asn Glu Gly Gly Arg Leu Tyr
995 1000 1005
Val Cys Gly Asp Gly Ser Arg Met Ala Pro Ala Val Glu Gln Ala
1010 1015 1020
Leu Cys Glu Ala Tyr Arg Ile Val Gln Gly Ala Ser Arg Glu Glu
1025 1030 1035
Ser Gln Ser Trp Leu Ser Ala Leu Leu Glu Glu Gly Arg Tyr Ala
1040 1045 1050
Lys Asp Val Trp Asp Gly Gly Val Ser Gln His Asn Val Lys Ala
1055 1060 1065
Asp Cys Ile Ala Arg Thr
1070
<210> 65
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 65
taaggaggaa aacaaa 16
<210> 66
<211> 1677
<212> DNA
<213> Pseudomonas putida
<400> 66
atgtacgact atataatcgt tggtgctgga tctgcaggat gtgtgcttgc taatcgtctt 60
tcggccgacc cctctaaaag agtttgttta cttgaagctg ggccgcgaga tacgaatccg 120
ctaattcata tgccgttagg tattgctttg ctttcaaata gtaaaaagtt gaattgggct 180
tttcaaactg cgccacagca aaatctcaac ggccggagcc ttttctggcc acgaggaaaa 240
acgttaggtg gttcaagctc aatcaacgca atggtctata tccgagggca tgaagacgat 300
taccacgcat gggagcaggc ggccggccgc tactggggtt ggtaccgggc tcttgagttg 360
ttcaaaaggc ttgaatgcaa ccagcgattc gataagtccg agcaccatgg ggttgacgga 420
gaattagctg ttagtgattt aaaatatatc aatccgctta gcaaagcatt cgtgcaagcc 480
ggcatggagg ccaatattaa tttcaacgga gatttcaacg gcgagtacca ggacggcgta 540
gggttctatc aagtaaccca aaaaaatgga caacgctgga gctcggcgcg tgcattcttg 600
cacggtgtac tttccagacc aaatctagac atcattactg atgcgcatgc atcaaaaatt 660
ctttttgaag accgtaaggc ggttggtgtt tcttatataa agaaaaatat gcaccatcaa 720
gtcaagacaa cgagtggtgg tgaagtactt cttagtcttg gcgcagtcgg cacgcctcac 780
cttctaatgc tttctggtgt tggggctgca gccgagctta aggaacatgg tgtttctcta 840
gtccatgatc ttcctgaggt ggggaaaaat cttcaagatc atttggacat cacattgatg 900
tgcgcagcaa attcgagaga gccgataggt gttgctcttt ctttcatccc tcgtggtgtc 960
tcgggtttgt tttcatatgt gtttaagcgc gaggggtttc tcactagtaa cgtggcagag 1020
tcgggtggtt ttgtaaaaag ttctcctgat cgtgatcggc ccaatttgca gtttcatttc 1080
cttccaactt atcttaaaga tcacggtcga aaaatagcgg gtggttatgg ttatacgcta 1140
catatatgtg atcttttgcc taagagccga ggcagaattg gcctaaaaag cgccaatcca 1200
ttacagccgc ctttaattga cccgaactat cttagcgatc atgaagatat taaaaccatg 1260
attgcgggta ttaagatagg gcgcgctatt ttgcaggccc catcgatggc gaagcatttt 1320
aagcatgaag tagtaccggg ccaggctgtt aaaactgatg atgaaataat cgaagatatt 1380
cgtaggcgag ctgagactat ataccatccg gtaggtactt gtaggatggg taaagatcca 1440
gcgtcagttg ttgatccgtg cctgaagatc cgtgggttgg caaatattag agtcgttgat 1500
gcgtcaatta tgccgcactt ggtcgcgggt aacacaaacg ctccaactat tatgattgca 1560
gaaaatgcgg cagaaataat tatgcggaat cttgatgtgg aagcattaga ggctagcgct 1620
gagtttgctc gcgagggtgc agagctagag ttggccatga tagctgtctg catgtaa 1677
<210> 67
<211> 558
<212> PRT
<213> Pseudomonas putida
<400> 67
Met Tyr Asp Tyr Ile Ile Val Gly Ala Gly Ser Ala Gly Cys Val Leu
1 5 10 15
Ala Asn Arg Leu Ser Ala Asp Pro Ser Lys Arg Val Cys Leu Leu Glu
20 25 30
Ala Gly Pro Arg Asp Thr Asn Pro Leu Ile His Met Pro Leu Gly Ile
35 40 45
Ala Leu Leu Ser Asn Ser Lys Lys Leu Asn Trp Ala Phe Gln Thr Ala
50 55 60
Pro Gln Gln Asn Leu Asn Gly Arg Ser Leu Phe Trp Pro Arg Gly Lys
65 70 75 80
Thr Leu Gly Gly Ser Ser Ser Ile Asn Ala Met Val Tyr Ile Arg Gly
85 90 95
His Glu Asp Asp Tyr His Ala Trp Glu Gln Ala Ala Gly Arg Tyr Trp
100 105 110
Gly Trp Tyr Arg Ala Leu Glu Leu Phe Lys Arg Leu Glu Cys Asn Gln
115 120 125
Arg Phe Asp Lys Ser Glu His His Gly Val Asp Gly Glu Leu Ala Val
130 135 140
Ser Asp Leu Lys Tyr Ile Asn Pro Leu Ser Lys Ala Phe Val Gln Ala
145 150 155 160
Gly Met Glu Ala Asn Ile Asn Phe Asn Gly Asp Phe Asn Gly Glu Tyr
165 170 175
Gln Asp Gly Val Gly Phe Tyr Gln Val Thr Gln Lys Asn Gly Gln Arg
180 185 190
Trp Ser Ser Ala Arg Ala Phe Leu His Gly Val Leu Ser Arg Pro Asn
195 200 205
Leu Asp Ile Ile Thr Asp Ala His Ala Ser Lys Ile Leu Phe Glu Asp
210 215 220
Arg Lys Ala Val Gly Val Ser Tyr Ile Lys Lys Asn Met His His Gln
225 230 235 240
Val Lys Thr Thr Ser Gly Gly Glu Val Leu Leu Ser Leu Gly Ala Val
245 250 255
Gly Thr Pro His Leu Leu Met Leu Ser Gly Val Gly Ala Ala Ala Glu
260 265 270
Leu Lys Glu His Gly Val Ser Leu Val His Asp Leu Pro Glu Val Gly
275 280 285
Lys Asn Leu Gln Asp His Leu Asp Ile Thr Leu Met Cys Ala Ala Asn
290 295 300
Ser Arg Glu Pro Ile Gly Val Ala Leu Ser Phe Ile Pro Arg Gly Val
305 310 315 320
Ser Gly Leu Phe Ser Tyr Val Phe Lys Arg Glu Gly Phe Leu Thr Ser
325 330 335
Asn Val Ala Glu Ser Gly Gly Phe Val Lys Ser Ser Pro Asp Arg Asp
340 345 350
Arg Pro Asn Leu Gln Phe His Phe Leu Pro Thr Tyr Leu Lys Asp His
355 360 365
Gly Arg Lys Ile Ala Gly Gly Tyr Gly Tyr Thr Leu His Ile Cys Asp
370 375 380
Leu Leu Pro Lys Ser Arg Gly Arg Ile Gly Leu Lys Ser Ala Asn Pro
385 390 395 400
Leu Gln Pro Pro Leu Ile Asp Pro Asn Tyr Leu Ser Asp His Glu Asp
405 410 415
Ile Lys Thr Met Ile Ala Gly Ile Lys Ile Gly Arg Ala Ile Leu Gln
420 425 430
Ala Pro Ser Met Ala Lys His Phe Lys His Glu Val Val Pro Gly Gln
435 440 445
Ala Val Lys Thr Asp Asp Glu Ile Ile Glu Asp Ile Arg Arg Arg Ala
450 455 460
Glu Thr Ile Tyr His Pro Val Gly Thr Cys Arg Met Gly Lys Asp Pro
465 470 475 480
Ala Ser Val Val Asp Pro Cys Leu Lys Ile Arg Gly Leu Ala Asn Ile
485 490 495
Arg Val Val Asp Ala Ser Ile Met Pro His Leu Val Ala Gly Asn Thr
500 505 510
Asn Ala Pro Thr Ile Met Ile Ala Glu Asn Ala Ala Glu Ile Ile Met
515 520 525
Arg Asn Leu Asp Val Glu Ala Leu Glu Ala Ser Ala Glu Phe Ala Arg
530 535 540
Glu Gly Ala Glu Leu Glu Leu Ala Met Ile Ala Val Cys Met
545 550 555
<210> 68
<211> 1452
<212> DNA
<213> Pseudomonas putida
<400> 68
atgaccatac caattagcct agccaagtta aactctagtg ccgataccca ttcagcgctt 60
gaagtattta atttgcagaa agttgcaagt agtgcgcgtc gtggtaaatt tggcatagca 120
gagcgcatcg ctgctcttaa tttacttaag gaaactattc agcgtcgtga gcctgaaatt 180
attgctgcac ttgcagcgga ctttcgcaag ccggcaagcg aggtgaagct aacagaaatc 240
tttccggtat tgcaagaaat taatcatgcc aaacggaacc ttaaagattg gatgaagcca 300
cggcgagtga gggcggcact tagtgtagcg ggcacgcggg caggacttcg ttacgagcct 360
aagggtgtct gtttgataat tgcgccgtgg aactatccat tcaaccttag tttcggtcct 420
cttgtatctg cgttagcggc aggaaatagc gttgttataa agccgtctga attgacacca 480
cacactgcaa cactgatcgg atctatagtc agggaggcat tctctgtcga cctagtcgct 540
gtggtggagg gtgatgccgc agtttcccag gagctgttgg ctctgccatt tgaccatatt 600
ttttttactg gtagtcctag ggtcggcaag ttagtgatgg aagcggcgtc aaaaacactc 660
gcttcggtta ctttggagtt aggcggaaaa tctccaacca ttattggacc aacagcaaat 720
ttgccgaaag ctgcgcgcaa catagtgtgg ggaaagtttt caaacaacgg ccagacgtgc 780
atagcgcctg atcacgtatt tgttcatcgg tgtatagccc agaaattcaa tgaaattctt 840
gtgaaagaga ttgtgcgagt ttatgggaag gattttgctg cgcagcgtag atcggcagac 900
tattgcagga tcgtcaatga tcaacatttc aatcgaatta ataaactcct gactgacgcg 960
aaagctaaag gtgcaaaaat tctgcaaggg ggtcaagttg acgcgactga gaggcttgtg 1020
gtgccaacgg ttttatctaa cgtcactgct gctatggata ttaaccatga ggaaatattc 1080
gggccgctac ttcctataat tgaatacgat gatatagatt ctgtaattaa gcgtgtgaat 1140
gacggtgaca agcccctggc gctgtatgtc ttttctgaag ataaacaatt tgtaaataac 1200
atcgtggctc gtacaagctc tggttcggtc ggagttaatc tgagtgtcgt gcactttttg 1260
caccctaatc tcccatttgg cggtgtcaat aatagtggta tcggcagtgc tcatggagtt 1320
tacgggttca gggcgttttc tcacgaaaaa ccagttctta tagataagtt ctcaatcacg 1380
cattggttgt ttccgcctta taccaagaag gtgaagcagt tgattggtat cacagttaag 1440
tatttgagct ga 1452
<210> 69
<211> 483
<212> PRT
<213> Pseudomonas putida
<400> 69
Met Thr Ile Pro Ile Ser Leu Ala Lys Leu Asn Ser Ser Ala Asp Thr
1 5 10 15
His Ser Ala Leu Glu Val Phe Asn Leu Gln Lys Val Ala Ser Ser Ala
20 25 30
Arg Arg Gly Lys Phe Gly Ile Ala Glu Arg Ile Ala Ala Leu Asn Leu
35 40 45
Leu Lys Glu Thr Ile Gln Arg Arg Glu Pro Glu Ile Ile Ala Ala Leu
50 55 60
Ala Ala Asp Phe Arg Lys Pro Ala Ser Glu Val Lys Leu Thr Glu Ile
65 70 75 80
Phe Pro Val Leu Gln Glu Ile Asn His Ala Lys Arg Asn Leu Lys Asp
85 90 95
Trp Met Lys Pro Arg Arg Val Arg Ala Ala Leu Ser Val Ala Gly Thr
100 105 110
Arg Ala Gly Leu Arg Tyr Glu Pro Lys Gly Val Cys Leu Ile Ile Ala
115 120 125
Pro Trp Asn Tyr Pro Phe Asn Leu Ser Phe Gly Pro Leu Val Ser Ala
130 135 140
Leu Ala Ala Gly Asn Ser Val Val Ile Lys Pro Ser Glu Leu Thr Pro
145 150 155 160
His Thr Ala Thr Leu Ile Gly Ser Ile Val Arg Glu Ala Phe Ser Val
165 170 175
Asp Leu Val Ala Val Val Glu Gly Asp Ala Ala Val Ser Gln Glu Leu
180 185 190
Leu Ala Leu Pro Phe Asp His Ile Phe Phe Thr Gly Ser Pro Arg Val
195 200 205
Gly Lys Leu Val Met Glu Ala Ala Ser Lys Thr Leu Ala Ser Val Thr
210 215 220
Leu Glu Leu Gly Gly Lys Ser Pro Thr Ile Ile Gly Pro Thr Ala Asn
225 230 235 240
Leu Pro Lys Ala Ala Arg Asn Ile Val Trp Gly Lys Phe Ser Asn Asn
245 250 255
Gly Gln Thr Cys Ile Ala Pro Asp His Val Phe Val His Arg Cys Ile
260 265 270
Ala Gln Lys Phe Asn Glu Ile Leu Val Lys Glu Ile Val Arg Val Tyr
275 280 285
Gly Lys Asp Phe Ala Ala Gln Arg Arg Ser Ala Asp Tyr Cys Arg Ile
290 295 300
Val Asn Asp Gln His Phe Asn Arg Ile Asn Lys Leu Leu Thr Asp Ala
305 310 315 320
Lys Ala Lys Gly Ala Lys Ile Leu Gln Gly Gly Gln Val Asp Ala Thr
325 330 335
Glu Arg Leu Val Val Pro Thr Val Leu Ser Asn Val Thr Ala Ala Met
340 345 350
Asp Ile Asn His Glu Glu Ile Phe Gly Pro Leu Leu Pro Ile Ile Glu
355 360 365
Tyr Asp Asp Ile Asp Ser Val Ile Lys Arg Val Asn Asp Gly Asp Lys
370 375 380
Pro Leu Ala Leu Tyr Val Phe Ser Glu Asp Lys Gln Phe Val Asn Asn
385 390 395 400
Ile Val Ala Arg Thr Ser Ser Gly Ser Val Gly Val Asn Leu Ser Val
405 410 415
Val His Phe Leu His Pro Asn Leu Pro Phe Gly Gly Val Asn Asn Ser
420 425 430
Gly Ile Gly Ser Ala His Gly Val Tyr Gly Phe Arg Ala Phe Ser His
435 440 445
Glu Lys Pro Val Leu Ile Asp Lys Phe Ser Ile Thr His Trp Leu Phe
450 455 460
Pro Pro Tyr Thr Lys Lys Val Lys Gln Leu Ile Gly Ile Thr Val Lys
465 470 475 480
Tyr Leu Ser
Claims (52)
- 재생가능한 공급원료로부터 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물에 있어서,
상기 미생물은:
(a) EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및
(b) EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는,
폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 재조합 미생물. - 제 1 항에 있어서,
상기 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 모노옥시게나아제 효소 활성을 갖고, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화하는 재조합 미생물. - 제 2 항에 있어서,
상기 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드인 재조합 미생물. - 제 3 항에 있어서,
상기 CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적(self-sufficient) CYP153A-RedRhF 혼성 융합 단백질인 재조합 미생물. - 제 1 항에 있어서,
상기 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체인 재조합 미생물. - 제 5 항에 있어서,
상기 ω-하이드록실라아제 혼성 융합 단백질 변이체는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성(sequence identity)을 갖고, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및 A796V로 구성된 그룹으로부터 선택되는 하나 이상의 돌연변이를 갖는 재조합 미생물. - 제 1 항에 있어서,
상기 재조합 미생물은 ω-하이드록시 지방산들 및 ω-하이드록시 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물. - 제 1 항에 있어서,
상기 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물. - 제 8 항에 있어서,
상기 재조합 미생물은 ω-옥소 지방산들 및 ω-옥소 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물. - 제 8 항에 있어서,
상기 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물. - 제 10 항에 있어서,
상기 재조합 미생물은 α,ω-이산들 또는 ω-카르복시 지방산 메틸 에스테르들인 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물. - 제 10 항에 있어서,
상기 재조합 미생물은 EC 6.2.1.3의 아실-CoA 리가아제 또는 EC 2.8.3.6의 아실-CoA 트랜스퍼라아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물. - 제 12 항에 있어서,
상기 재조합 미생물은 α,ω-디에스테르들인 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물. - 제 8 항에 있어서,
상기 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제들을 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물. - 제 14 항에 있어서,
상기 재조합 미생물은 ω-아미노 지방산들 및 ω-아미노 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 재조합 미생물. - 제 1 항에 있어서,
상기 재조합 미생물은 EC 1.1.-.-의 알코올 디하이드로게나아제 및 1.2.99의 카르복실산 리덕타아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 재조합 미생물. - 제 16 항에 있어서,
ω-하이드록시 지방산 유도체는 α,ω-디올인 재조합 미생물. - 제 1 항 내지 제 17 항 중 어느 한 항에 따른 미생물을 포함하는 세포 배양물(cell culture).
- 제 18 항에 있어서,
상기 세포 배양물은, ω-하이드록시 유리 지방산들; ω-하이드록시 지방산 메틸 에스테르들; ω-옥소 지방산들; ω-옥소 지방산 메틸 에스테르들; α,ω-이산들; α,ω-디올들; ω-아미노 지방산들; 및 ω-아미노 지방산 메틸 에스테르들로 구성된 그룹으로부터 선택되는 ω-하이드록시 지방산 유도체들을 생성하는 세포 배양물. - ω-하이드록시 지방산 유도체를 생성하는 방법에 있어서,
(a) 발효액에 재조합 미생물을 제공하는 단계로, 상기 미생물은 EC 3.1.2.-, 3.1.1.5, 또는 3.1.2.14의 티오에스테라아제; 또는 EC 2.3.1.75 또는 EC 2.3.1.20의 에스테르 신타아제; 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 2 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 단계;
(b) 탄소원을 함유한 재생가능한 공급원료를 발효액에 첨가하는 단계; 및
(c) 상기 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함하는 지방산 유도체 생성 방법. - 제 20 항에 있어서,
상기 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드인 지방산 유도체 생성 방법. - 제 21 항에 있어서,
상기 CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질인 지방산 유도체 생성 방법. - 제 20 항에 있어서,
상기 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체인 지방산 유도체 생성 방법. - 제 23 항에 있어서,
상기 ω-하이드록실라아제 혼성 융합 단백질 변이체는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 갖고, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및 A796V로 구성된 그룹으로부터 선택되는 하나 이상의 돌연변이를 갖는 지방산 유도체 생성 방법. - 제 20 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 ω-하이드록시 유리 지방산 또는 ω-하이드록시 지방산 메틸 에스테르인 지방산 유도체 생성 방법. - 제 20 항에 있어서,
상기 재조합 미생물은 EC 1.1.1.1/2의 알코올 디하이드로게나아제 또는 EC 1.1.3.13 또는 EC 1.1.3.20의 알코올 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법. - 제 26 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 ω-옥소 지방산 또는 ω-옥소 지방산 메틸 에스테르인 지방산 유도체 생성 방법. - 제 26 항에 있어서,
상기 재조합 미생물은 EC 1.2.1.3/4/5의 알데히드 디하이드로게나아제 또는 EC 1.2.3.1의 알데히드 옥시다아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법. - 제 28 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-이산 또는 α,ω-지방산 디메틸 에스테르인 지방산 유도체 생성 방법. - 제 26 항에 있어서,
상기 재조합 미생물은 EC 2.6.1의 아미노 트랜스퍼라아제 또는 EC 1.4.9, EC 1.4.98 또는 EC 1.4.99의 아민 디하이드로게나아제들을 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법. - 제 30 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 ω-아미노 지방산 또는 ω-아미노 지방산 메틸 에스테르인 지방산 유도체 생성 방법. - 제 20 항에 있어서,
상기 재조합 미생물은 EC 1.2.99.6의 카르복실산 리덕타아제 및 EC 1.1.-.-의 알코올 디하이드로게나아제를 포함하는 폴리펩티드를 코딩하는 핵산 서열을 더 발현시키도록 조작되는 지방산 유도체 생성 방법. - 제 32 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-디올인 지방산 유도체 생성 방법. - 제 1 항 내지 제 33 항 중 어느 하나의 방법에 있어서,
상기 재생가능한 공급원료는 탄소계인 지방산 유도체 생성 방법. - 제 34 항에 있어서,
상기 탄소계 재생가능한 공급원료는 옥수수, 사탕수수, 수수, 사탕무, 스위치그래스(switchgrass), 목초, 짚, 목재, 펄프, 오수, 쓰레기, 셀룰로오스 도시 폐기물(cellulosic urban waste), 플루-가스(flu-gas), 합성-가스, 바이오매스 가수분해물, 및 이산화탄소로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법. - 제 1 항에 있어서,
상기 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스(turanose), 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤, 노폐물 지방산(waste fatty acid), 및 이의 혼합물들로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법. - 제 1 항에 있어서,
상기 탄소원은 글루코오스, 글리세롤 또는 수크로오스인 지방산 유도체 생성 방법. - 제 20 항의 방법에 의해 생성된 중합체 조성물에 있어서,
상기 중합체 조성물은 폴리우레탄, 폴리에스테르 폴리올, 폴리에스테르 수지, 알킬 코팅 수지, 유리섬유 수지, 겔 코팅 수지 및 폴리에스테르 열가소성 수지로 구성된 그룹으로부터 선택되는 중합체 조성물. - 재생가능한 공급원료로부터의 탄소원의 존재 시 발효액에서 성장될 때 생체 내에서 ω-하이드록시 지방산 유도체를 생성하는 재조합 미생물에 있어서,
상기 미생물은:
(a) EC 1.2.1.42의 아실-ACP 리덕타아제;
(b) EC 1.1.-.-의 알코올 디하이드로게나아제; 및
(c) EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는,
폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 재조합 미생물. - 제 39 항에 있어서,
상기 변형된 ω-하이드록실라아제는 변형된 시토크롬 P450 효소 활성을 갖고, 생체 내에서 탄화수소 사슬들의 ω-위치를 효율적으로 촉매화하는 재조합 미생물. - 제 40 항에 있어서,
상기 변형된 ω-하이드록실라아제는 CYP153A-리덕타아제 혼성 융합 폴리펩티드인 재조합 미생물. - 제 41 항에 있어서,
상기 CYP153A-리덕타아제 혼성 융합 폴리펩티드는 자족적 CYP153A-RedRhF 혼성 융합 단백질인 재조합 미생물. - 제 39 항에 있어서,
상기 변형된 ω-하이드록실라아제는 EC 1.14.15.3의 ω-하이드록실라아제 혼성 융합 단백질 변이체인 재조합 미생물. - 제 43 항에 있어서,
상기 ω-하이드록실라아제 혼성 융합 단백질 변이체는 SEQ ID NO: 6에 대해 적어도 90 %의 서열 동일성을 갖고, V141I, V141T, V141Q, V141G, V141M, V141L, R27L, R82D, R178N, A231T, N309R, N407A, V415R, T516V, P666A, P666D 및 A796V로 구성된 그룹으로부터 선택되는 하나 이상의 돌연변이를 갖는 재조합 미생물. - 제 39 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-디올인 재조합 미생물. - 제 39 항 내지 제 45 항 중 어느 하나에 따른 미생물을 포함하는 세포 배양물.
- ω-하이드록시 지방산 유도체를 생성하는 방법에 있어서,
(a) 발효액에 재조합 미생물을 제공하는 단계로, 상기 미생물은 EC 1.2.1.42의 아실-ACP 리덕타아제, EC 1.1.-.-의 알코올 디하이드로게나아제, 및 EC 1.14.15.3의 변형된 ω-하이드록실라아제를 포함하는 폴리펩티드를 코딩하는 적어도 3 개의 핵산 서열들을 발현시키도록 조작된 경로를 포함하는 단계;
(b) 탄소원을 함유한 재생가능한 공급원료를 상기 발효액에 첨가하는 단계; 및
(c) 상기 발효액으로부터 ω-하이드록시 지방산 유도체를 분리시키는 단계를 포함하는 지방산 유도체 생성 방법. - 제 47 항에 있어서,
상기 ω-하이드록시 지방산 유도체는 α,ω-디올인 지방산 유도체 생성 방법. - 제 47 항 또는 제 48 항에 있어서,
상기 재생가능한 공급원료는 탄소계인 지방산 유도체 생성 방법. - 제 49 항에 있어서,
상기 탄소계 재생가능한 공급원료는 옥수수, 사탕수수, 스위치그래스, 목초, 짚, 목재, 오수, 쓰레기, 셀룰로오스 도시 폐기물, 플루-가스, 합성-가스, 및 이산화탄소로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법. - 제 47 항에 있어서,
상기 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스, 아라비노오스, 프럭토-올리고당, 갈락토-올리고당, 녹말, 셀룰로오스, 펙틴, 자일란, 수크로오스, 말토오스, 셀로비오스, 투라노오스, 헤미셀룰로오스, 메틸 셀룰로오스, 소듐 카르복시메틸 셀룰로오스, 숙시네이트, 락테이트, 아세테이트, 에탄올, 메탄올, 글리세롤, 및 이의 혼합물들로 구성된 그룹으로부터 선택되는 지방산 유도체 생성 방법. - 제 47 항에 있어서,
상기 탄소원은 글루코오스, 글리세롤 또는 수크로오스인 지방산 유도체 생성 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020217015238A KR102387905B1 (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361835464P | 2013-06-14 | 2013-06-14 | |
US61/835,464 | 2013-06-14 | ||
PCT/US2014/042594 WO2014201474A1 (en) | 2013-06-14 | 2014-06-16 | Methods of producing omega-hydroxylated fatty acid derivatives |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217015238A Division KR102387905B1 (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160020516A true KR20160020516A (ko) | 2016-02-23 |
KR102256678B1 KR102256678B1 (ko) | 2021-05-28 |
Family
ID=51177165
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217015238A KR102387905B1 (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
KR1020227012365A KR20220053681A (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
KR1020247011911A KR20240049856A (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
KR1020167000963A KR102256678B1 (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217015238A KR102387905B1 (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
KR1020227012365A KR20220053681A (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
KR1020247011911A KR20240049856A (ko) | 2013-06-14 | 2014-06-16 | 오메가-수산화 지방산 유도체를 생성하는 방법들 |
Country Status (12)
Country | Link |
---|---|
US (2) | US10711288B2 (ko) |
EP (2) | EP3745133A1 (ko) |
JP (3) | JP7004500B2 (ko) |
KR (4) | KR102387905B1 (ko) |
CN (3) | CN118374462A (ko) |
AU (2) | AU2014277874B2 (ko) |
BR (2) | BR122020002919B1 (ko) |
CA (1) | CA2915229A1 (ko) |
MX (1) | MX2015016947A (ko) |
MY (1) | MY197101A (ko) |
SI (1) | SI2984490T1 (ko) |
WO (1) | WO2014201474A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190072480A (ko) * | 2017-12-15 | 2019-06-25 | 건국대학교 산학협력단 | α,ω-디올류 생산하는 재조합 미생물 및 α,ω-디올류의 생산방법 |
KR20200009462A (ko) | 2018-07-19 | 2020-01-30 | 서울대학교산학협력단 | 레귤론 변이를 통한 지방산 및 지방산 유도체 생산에서 불포화도 감소 |
US11987833B2 (en) | 2018-04-16 | 2024-05-21 | Korea Research Institute Of Bioscience And Biotechnology | Method for producing multi-hydroxy derivatives of polyunsaturated fatty acids |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2915229A1 (en) | 2013-06-14 | 2014-12-18 | REG Life Sciences, LLC | Methods of producing omega-hydroxylated fatty acid derivatives |
WO2015157719A1 (en) | 2014-04-10 | 2015-10-15 | REG Life Sciences, LLC | Semisynthetic routes to organic compounds |
WO2015176020A1 (en) | 2014-05-16 | 2015-11-19 | Provivi, Inc. | Synthesis of olefinic alcohols via enzymatic terminal hydroxylation |
MX2016016565A (es) * | 2014-06-16 | 2017-04-25 | Reg Life Sciences Llc | Polipeptidos de fusion relacionados con omega-hidroxilasa con propiedades mejoradas. |
ES2700578T3 (es) | 2014-07-18 | 2019-02-18 | Reg Life Sciences Llc | Producción microbiana de 1,3-dioles |
EP3283618A4 (en) * | 2015-04-15 | 2018-12-05 | William Marsh Rice University | Modified fatty acid biosynthesis with acp-dependent thiolases |
US11091741B2 (en) | 2015-10-27 | 2021-08-17 | Korea Research Institute Of Bioscience And Biotechnology | Method for producing medium chain diol |
CN108473993A (zh) * | 2015-10-27 | 2018-08-31 | 韩国生命工学研究院 | 中链氨基羧酸的生产方法 |
WO2017101987A1 (en) * | 2015-12-15 | 2017-06-22 | REG Life Sciences, LLC | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
CN107201356A (zh) * | 2016-03-17 | 2017-09-26 | 中国科学院青岛生物能源与过程研究所 | 支撑p450脂肪酸脱羧酶活性的还原伴侣蛋白组合及其应用 |
CA3058950A1 (en) | 2017-04-03 | 2018-10-11 | Genomatica, Inc. | Thioesterase variants having improved activity for the production of medium-chain fatty acid derivatives |
TWI701040B (zh) * | 2018-03-19 | 2020-08-11 | 國立臺灣大學 | 蛋白質的用途及包含該蛋白質之全細胞催化系統及其應用 |
EP3824071A4 (en) * | 2018-07-17 | 2022-04-20 | Conagen Inc. | BIOSYNTHETIC MANUFACTURE OF GAMMA LACTONES |
CN112673016A (zh) | 2018-08-31 | 2021-04-16 | 基因组股份公司 | 用于改善的木糖利用或改善的葡萄糖和木糖共利用的xylr突变体 |
CN111218430B (zh) * | 2018-11-26 | 2022-06-14 | 中国科学院大连化学物理研究所 | 一种nadh类似物依赖型的细胞色素p450还原酶及其应用 |
CN111218485B (zh) * | 2018-11-26 | 2023-01-24 | 中国科学院大连化学物理研究所 | 一种生产ω-1-羟基脂肪酸的方法 |
CN111592996A (zh) * | 2019-12-09 | 2020-08-28 | 福建省水产研究所(福建水产病害防治中心) | 一种芽孢杆菌cqn-2高密度发酵培养方法 |
US20240229086A1 (en) * | 2021-03-29 | 2024-07-11 | Genomatica, Inc. | Production Of Non-Native Monounsaturated Fatty Acids In Bacteria |
WO2023178211A1 (en) | 2022-03-16 | 2023-09-21 | Genomatica, Inc. | Microorganisms and methods for production of fatty acid derivatives with reduced levels of byproducts |
CN114480513A (zh) * | 2022-04-01 | 2022-05-13 | 北京林业大学 | 一种基因编辑酵母体外合成麝香酮的方法 |
CN115537369B (zh) * | 2022-11-09 | 2024-03-01 | 云南农业大学 | 2-十二烯二酸促进蒙氏假单胞菌生长和定殖的应用 |
CN116790529A (zh) * | 2023-05-24 | 2023-09-22 | 天津大学 | P450 bm3蛋白突变体及其应用 |
CN117343970A (zh) * | 2023-10-24 | 2024-01-05 | 杭州佳嘉乐生物技术有限公司 | 一种提升植物油脂亲肤感的油脂发酵方法 |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1305083C (en) | 1987-02-18 | 1992-07-14 | Yoshiharu Kimura | Microorganism belonging to genus rhodococcus, and a process for producing alkene derivative and unsaturated fatty acid |
US5028539A (en) | 1988-08-31 | 1991-07-02 | The University Of Florida | Ethanol production using engineered mutant E. coli |
US5424202A (en) | 1988-08-31 | 1995-06-13 | The University Of Florida | Ethanol production by recombinant hosts |
US5482846A (en) | 1988-08-31 | 1996-01-09 | University Of Florida | Ethanol production in Gram-positive microbes |
US5000000A (en) | 1988-08-31 | 1991-03-19 | University Of Florida | Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes |
AU7791991A (en) | 1990-04-24 | 1991-11-11 | Stratagene | Methods for phenotype creation from multiple gene populations |
US5602030A (en) | 1994-03-28 | 1997-02-11 | University Of Florida Research Foundation | Recombinant glucose uptake system |
US6428767B1 (en) | 1995-05-12 | 2002-08-06 | E. I. Du Pont De Nemours And Company | Method for identifying the source of carbon in 1,3-propanediol |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
US5939250A (en) | 1995-12-07 | 1999-08-17 | Diversa Corporation | Production of enzymes having desired activities by mutagenesis |
EP1021551A1 (en) | 1997-10-06 | 2000-07-26 | Centre National De La Recherche Scientifique | Plant fatty acid hydroxylase genes |
US7576227B2 (en) | 2002-04-29 | 2009-08-18 | Union Carbide Chemicals & Plastics Technology Corporation | Integrate chemical processes for industrial utilization of seed oils |
US20040242831A1 (en) | 2003-05-30 | 2004-12-02 | Dong Tian | Enzyme catalyzed polyesters and polyol polymers |
US20080220419A1 (en) * | 2004-11-10 | 2008-09-11 | Marine Biotechnology Institute Co., Ltd. | Method of Isolating P450 Gene |
JP2009079057A (ja) | 2005-04-22 | 2009-04-16 | Mitsubishi Chemicals Corp | ポリエステル及びその製造方法 |
US20100242345A1 (en) | 2006-05-19 | 2010-09-30 | LS9, Inc | Production of fatty acids & derivatives thereof |
US8110670B2 (en) * | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
CA2650773C (en) | 2006-05-19 | 2014-12-02 | Jay D. Keasling | Microorganisms transformed with acetyl-coa carboxylase and wax synthase for production of fatty acid derivatives |
EP3281931A1 (en) | 2006-10-13 | 2018-02-14 | Elevance Renewable Sciences, Inc. | Methods of making organic compounds by metathesis |
CN102123979A (zh) | 2006-10-13 | 2011-07-13 | 埃莱文斯可更新科学公司 | 通过烯烃复分解由内烯烃合成末端烯烃的方法 |
US8110093B2 (en) | 2007-03-14 | 2012-02-07 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
AU2008230735A1 (en) | 2007-03-28 | 2008-10-02 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
US20080293060A1 (en) | 2007-04-23 | 2008-11-27 | Ls9, Inc. | Methods and Compositions for Identification of Hydrocarbon Response, Transport and Biosynthesis Genes |
ES2646815T3 (es) | 2007-05-22 | 2017-12-18 | REG Life Sciences, LLC | Genes que producen hidrocarburos y métodos para su uso |
JP5324129B2 (ja) | 2007-05-25 | 2013-10-23 | 神戸天然物化学株式会社 | Cyp153による芳香族化合物の製造方法 |
US20100199548A1 (en) | 2007-07-06 | 2010-08-12 | Ls9, Inc. | Systems and methods for the production of fatty esters |
FR2921362B1 (fr) | 2007-09-20 | 2012-09-21 | Arkema France | Procede de synthese d'acides gras omega-insatures |
WO2009042950A1 (en) | 2007-09-27 | 2009-04-02 | Ls9, Inc. | Reduction of the toxic effect of impurities from raw materials by extractive fermentation |
TWI351779B (en) | 2007-12-03 | 2011-11-01 | Advance Smart Ind Ltd | Apparatus and method for correcting residual capac |
WO2009085278A1 (en) | 2007-12-21 | 2009-07-09 | Ls9, Inc. | Methods and compositions for producing olefins |
MX343063B (es) | 2008-05-16 | 2016-10-21 | Reg Life Sciences Llc | Metodos y composiciones para producir hidrocarburos. |
US8232924B2 (en) | 2008-05-23 | 2012-07-31 | Alliant Techsystems Inc. | Broadband patch antenna and antenna system |
US8273694B2 (en) | 2008-07-28 | 2012-09-25 | Jeffrey A Brown | Synthetic compositions obtained from algae |
WO2010022090A1 (en) | 2008-08-18 | 2010-02-25 | Ls9, Inc. | Systems and methods for the production of mixed fatty esters |
KR101258347B1 (ko) | 2008-08-28 | 2013-04-30 | 미쓰이 가가쿠 가부시키가이샤 | 올레핀의 제조 방법 |
ES2692918T3 (es) | 2008-10-07 | 2018-12-05 | REG Life Sciences, LLC | Métodos y composiciones para producir aldehídos grasos |
CA3146669A1 (en) | 2008-10-28 | 2010-06-03 | Genomatica, Inc. | Methods for producing a fatty alcohol in a host cell |
US7989875B2 (en) | 2008-11-24 | 2011-08-02 | Nxp B.V. | BiCMOS integration of multiple-times-programmable non-volatile memories |
ES2730713T3 (es) | 2008-12-23 | 2019-11-12 | Reg Life Sciences Llc | Métodos y composiciones relacionados con enzimas tioesterasas |
US8071799B2 (en) | 2009-01-29 | 2011-12-06 | Energy & Environmental Research Center Foundation | Chain-selective synthesis of fuel components and chemical feedstocks |
JP5353768B2 (ja) | 2009-03-06 | 2013-11-27 | 国立大学法人東京工業大学 | 樹脂組成物 |
EP2417246A4 (en) | 2009-04-10 | 2015-11-04 | Reg Life Sciences Llc | PRODUCTION OF FATTY ACID DERIVATIVES |
CN111808892A (zh) | 2009-04-27 | 2020-10-23 | 基因组股份公司 | 脂肪酸酯的产生 |
WO2010127318A2 (en) | 2009-05-01 | 2010-11-04 | The Regents Of The University Of California | Product of fatty acid esters from biomass polymers |
WO2011038132A1 (en) | 2009-09-25 | 2011-03-31 | Ls9, Inc. | Production of fatty acid derivatives |
US8237003B2 (en) | 2009-11-09 | 2012-08-07 | Exxonmobil Chemical Patents Inc. | Metathesis catalyst and process for use thereof |
US8809563B2 (en) | 2009-11-09 | 2014-08-19 | Exxonmobil Chemical Patents Inc. | Metathesis catalyst and process for use thereof |
US8361769B1 (en) | 2009-11-16 | 2013-01-29 | U.S. Department Of Energy | Regioselective alkane hydroxylation with a mutant CYP153A6 enzyme |
WO2011062987A2 (en) | 2009-11-17 | 2011-05-26 | Ls9, Inc. | Methods and compositions for producing hydrocarbons |
US8530221B2 (en) | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
AR084377A1 (es) * | 2010-04-08 | 2013-05-15 | Ls9 Inc | Metodos y composiciones relacionados con enzimas de alcohol graso biosintetico |
SG10201504187YA (en) | 2010-05-28 | 2015-06-29 | Solazyme Inc | Tailored oils produced from recombinant heterotrophic microorganisms |
US8372610B2 (en) | 2010-09-15 | 2013-02-12 | Ls9, Inc. | Production of odd chain fatty acid derivatives in recombinant microbial cells |
JP2012097163A (ja) | 2010-10-29 | 2012-05-24 | Dainippon Printing Co Ltd | ポリエステル樹脂組成物 |
WO2012071439A1 (en) | 2010-11-22 | 2012-05-31 | The Regents Of The University Of California | Host cells and methods for producing diacid compounds |
MX351063B (es) | 2011-02-02 | 2017-09-29 | Terravia Holdings Inc | Aceites adaptados producidos a partir de microorganismos oleaginosos recombinantes. |
EP2729564B1 (en) * | 2011-07-06 | 2019-09-18 | Radici Chimica S.p.A. | Biological methods for preparing a fatty dicarboxylic acid |
DE102011110946A1 (de) | 2011-08-15 | 2016-01-21 | Evonik Degussa Gmbh | Biotechnologisches Syntheseverfahren von omegafunktionalisierten Carbonsäuren und Carbonsäure-Estern aus einfachen Kohlenstoffquellen |
EP2639308A1 (de) | 2012-03-12 | 2013-09-18 | Evonik Industries AG | Enzymatische omega-Oxidation und -Aminierung von Fettsäuren |
BR112015008191A2 (pt) * | 2012-10-15 | 2017-11-28 | Genomatica Inc | microorganismos e métodos para a produção de alcoóis graxos de comprimento específico e compostos relacionados |
FR3003577B1 (fr) | 2013-03-19 | 2016-05-06 | Ferropem | Inoculant a particules de surface |
CA2915229A1 (en) | 2013-06-14 | 2014-12-18 | REG Life Sciences, LLC | Methods of producing omega-hydroxylated fatty acid derivatives |
MX2016016565A (es) | 2014-06-16 | 2017-04-25 | Reg Life Sciences Llc | Polipeptidos de fusion relacionados con omega-hidroxilasa con propiedades mejoradas. |
-
2014
- 2014-06-16 CA CA2915229A patent/CA2915229A1/en active Pending
- 2014-06-16 KR KR1020217015238A patent/KR102387905B1/ko active IP Right Grant
- 2014-06-16 SI SI201431627T patent/SI2984490T1/sl unknown
- 2014-06-16 CN CN202410501856.0A patent/CN118374462A/zh active Pending
- 2014-06-16 MY MYPI2015002915A patent/MY197101A/en unknown
- 2014-06-16 KR KR1020227012365A patent/KR20220053681A/ko active Application Filing
- 2014-06-16 BR BR122020002919-6A patent/BR122020002919B1/pt active IP Right Grant
- 2014-06-16 KR KR1020247011911A patent/KR20240049856A/ko active Search and Examination
- 2014-06-16 WO PCT/US2014/042594 patent/WO2014201474A1/en active Application Filing
- 2014-06-16 CN CN201480033702.8A patent/CN105378486B/zh active Active
- 2014-06-16 EP EP20168885.0A patent/EP3745133A1/en active Pending
- 2014-06-16 BR BR112015031233A patent/BR112015031233A2/pt not_active Application Discontinuation
- 2014-06-16 JP JP2016519714A patent/JP7004500B2/ja active Active
- 2014-06-16 MX MX2015016947A patent/MX2015016947A/es active IP Right Grant
- 2014-06-16 AU AU2014277874A patent/AU2014277874B2/en active Active
- 2014-06-16 EP EP14738962.1A patent/EP2984490B1/en active Active
- 2014-06-16 US US14/897,285 patent/US10711288B2/en active Active
- 2014-06-16 CN CN202410503321.7A patent/CN118460487A/zh active Pending
- 2014-06-16 KR KR1020167000963A patent/KR102256678B1/ko active Application Filing
-
2019
- 2019-10-04 JP JP2019183765A patent/JP7168539B2/ja active Active
-
2020
- 2020-06-29 US US16/915,454 patent/US11981952B2/en active Active
- 2020-12-23 AU AU2020294235A patent/AU2020294235B2/en active Active
-
2021
- 2021-08-06 JP JP2021129428A patent/JP7406529B2/ja active Active
Non-Patent Citations (2)
Title |
---|
publication date of the thesis* * |
Sumire Honda Malca. An approved thesis presented to the Faculty of Energy Technology. 6 June 2013* * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190072480A (ko) * | 2017-12-15 | 2019-06-25 | 건국대학교 산학협력단 | α,ω-디올류 생산하는 재조합 미생물 및 α,ω-디올류의 생산방법 |
US11987833B2 (en) | 2018-04-16 | 2024-05-21 | Korea Research Institute Of Bioscience And Biotechnology | Method for producing multi-hydroxy derivatives of polyunsaturated fatty acids |
KR20200009462A (ko) | 2018-07-19 | 2020-01-30 | 서울대학교산학협력단 | 레귤론 변이를 통한 지방산 및 지방산 유도체 생산에서 불포화도 감소 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020294235B2 (en) | Methods of producing omega-hydroxylated fatty acid derivatives | |
US11421206B2 (en) | Omega-hydroxylase-related fusion polypeptides with improved properties | |
JP7458358B2 (ja) | 改良された特性を有するω-ヒドロキシラーゼ関連融合ポリペプチドバリアント |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
N231 | Notification of change of applicant | ||
A107 | Divisional application of patent |