CN112654704A - 包含蛋白质生产率提高表型的突变和遗传修饰的丝状真菌菌株及其方法 - Google Patents
包含蛋白质生产率提高表型的突变和遗传修饰的丝状真菌菌株及其方法 Download PDFInfo
- Publication number
- CN112654704A CN112654704A CN201980049956.1A CN201980049956A CN112654704A CN 112654704 A CN112654704 A CN 112654704A CN 201980049956 A CN201980049956 A CN 201980049956A CN 112654704 A CN112654704 A CN 112654704A
- Authority
- CN
- China
- Prior art keywords
- seq
- protein
- lov
- cell
- strain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012239 gene modification Methods 0.000 title claims abstract description 34
- 230000005017 genetic modification Effects 0.000 title claims abstract description 34
- 235000013617 genetically modified food Nutrition 0.000 title claims abstract description 34
- 230000002538 fungal effect Effects 0.000 title description 63
- 230000035772 mutation Effects 0.000 title description 41
- 230000014616 translation Effects 0.000 title description 39
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 466
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 327
- 230000001965 increasing effect Effects 0.000 claims abstract description 43
- 101150060800 lov gene Proteins 0.000 claims description 162
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 100
- 241000223259 Trichoderma Species 0.000 claims description 86
- 108091033319 polynucleotide Proteins 0.000 claims description 65
- 239000002157 polynucleotide Substances 0.000 claims description 65
- 102000040430 polynucleotide Human genes 0.000 claims description 65
- 150000007523 nucleic acids Chemical group 0.000 claims description 62
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 50
- 239000004473 Threonine Substances 0.000 claims description 50
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 48
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 38
- 230000014509 gene expression Effects 0.000 claims description 37
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 34
- 239000004472 Lysine Substances 0.000 claims description 34
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 claims description 32
- 238000009396 hybridization Methods 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 25
- 101100256357 Schizosaccharomyces pombe (strain 972 / ATCC 24843) seb1 gene Proteins 0.000 claims description 23
- 241000235349 Ascomycota Species 0.000 claims description 22
- 238000004519 manufacturing process Methods 0.000 claims description 22
- 241000228143 Penicillium Species 0.000 claims description 18
- 241000894007 species Species 0.000 claims description 17
- 241000228212 Aspergillus Species 0.000 claims description 16
- 241000221960 Neurospora Species 0.000 claims description 16
- 241000223218 Fusarium Species 0.000 claims description 14
- 241000226677 Myceliophthora Species 0.000 claims description 14
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 11
- 241000228341 Talaromyces Species 0.000 claims description 11
- 101150028463 NIK1 gene Proteins 0.000 claims description 10
- 101100275159 Arabidopsis thaliana COBL7 gene Proteins 0.000 claims description 9
- 101100180341 Arabidopsis thaliana IWS1 gene Proteins 0.000 claims description 9
- 101150011071 CRZ1 gene Proteins 0.000 claims description 9
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 claims description 9
- 101150005224 SBH1 gene Proteins 0.000 claims description 9
- 101100042408 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SFB3 gene Proteins 0.000 claims description 9
- 230000002708 enhancing effect Effects 0.000 claims description 9
- 101000633605 Homo sapiens Thrombospondin-2 Proteins 0.000 claims description 7
- 102100029529 Thrombospondin-2 Human genes 0.000 claims description 7
- 241000123346 Chrysosporium Species 0.000 claims description 5
- 241001619326 Cephalosporium Species 0.000 claims description 4
- 241000228257 Aspergillus sp. Species 0.000 claims 1
- 241000123350 Chrysosporium sp. Species 0.000 claims 1
- 241001149959 Fusarium sp. Species 0.000 claims 1
- 241000088436 Neurospora sp. Species 0.000 claims 1
- 241000228168 Penicillium sp. Species 0.000 claims 1
- 241001207467 Talaromyces sp. Species 0.000 claims 1
- 241001557886 Trichoderma sp. Species 0.000 claims 1
- 241000233866 Fungi Species 0.000 abstract description 57
- 230000012010 growth Effects 0.000 abstract description 9
- 238000011031 large-scale manufacturing process Methods 0.000 abstract description 6
- 235000018102 proteins Nutrition 0.000 description 308
- 210000004027 cell Anatomy 0.000 description 187
- 108700028369 Alleles Proteins 0.000 description 101
- 101100032157 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr2 gene Proteins 0.000 description 51
- 235000001014 amino acid Nutrition 0.000 description 50
- 108020004414 DNA Proteins 0.000 description 47
- 239000003550 marker Substances 0.000 description 45
- 229940024606 amino acid Drugs 0.000 description 41
- 150000001413 amino acids Chemical class 0.000 description 39
- -1 i.e. Proteins 0.000 description 28
- 108091026890 Coding region Proteins 0.000 description 27
- 125000003729 nucleotide group Chemical group 0.000 description 27
- 238000006467 substitution reaction Methods 0.000 description 27
- 239000002773 nucleotide Substances 0.000 description 26
- 238000000855 fermentation Methods 0.000 description 23
- 230000004151 fermentation Effects 0.000 description 23
- 102000039446 nucleic acids Human genes 0.000 description 22
- 108020004707 nucleic acids Proteins 0.000 description 22
- 230000002829 reductive effect Effects 0.000 description 22
- 101150002830 MPG1 gene Proteins 0.000 description 20
- 238000003780 insertion Methods 0.000 description 20
- 230000037431 insertion Effects 0.000 description 20
- 102000004196 processed proteins & peptides Human genes 0.000 description 18
- 108090000765 processed proteins & peptides Proteins 0.000 description 18
- 238000012217 deletion Methods 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 239000002609 medium Substances 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 17
- 229920001184 polypeptide Polymers 0.000 description 17
- 230000009466 transformation Effects 0.000 description 17
- 238000002703 mutagenesis Methods 0.000 description 16
- 231100000350 mutagenesis Toxicity 0.000 description 16
- 108091033409 CRISPR Proteins 0.000 description 15
- 102000004190 Enzymes Human genes 0.000 description 14
- 108090000790 Enzymes Proteins 0.000 description 14
- 241000499912 Trichoderma reesei Species 0.000 description 14
- 125000000539 amino acid group Chemical group 0.000 description 14
- 229940088598 enzyme Drugs 0.000 description 14
- 235000000346 sugar Nutrition 0.000 description 14
- 108020004459 Small interfering RNA Proteins 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 12
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 11
- 102100022624 Glucoamylase Human genes 0.000 description 11
- 235000010633 broth Nutrition 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 108010042407 Endonucleases Proteins 0.000 description 10
- 108700026244 Open Reading Frames Proteins 0.000 description 10
- 229910052799 carbon Inorganic materials 0.000 description 10
- 230000010354 integration Effects 0.000 description 10
- 101150089778 pyr-4 gene Proteins 0.000 description 10
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 239000008103 glucose Substances 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 108010059892 Cellulase Proteins 0.000 description 8
- 206010064571 Gene mutation Diseases 0.000 description 8
- 101710157392 Macrophage-expressed gene 1 protein Proteins 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 238000002887 multiple sequence alignment Methods 0.000 description 8
- 101100351303 Caenorhabditis elegans pdfr-1 gene Proteins 0.000 description 7
- 102000051366 Glycosyltransferases Human genes 0.000 description 7
- 108700023372 Glycosyltransferases Proteins 0.000 description 7
- 108020005004 Guide RNA Proteins 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 230000001131 transforming effect Effects 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 102000004157 Hydrolases Human genes 0.000 description 6
- 108090000604 Hydrolases Proteins 0.000 description 6
- 102000004316 Oxidoreductases Human genes 0.000 description 6
- 108090000854 Oxidoreductases Proteins 0.000 description 6
- 102000035195 Peptidases Human genes 0.000 description 6
- 108091005804 Peptidases Proteins 0.000 description 6
- 239000004365 Protease Substances 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 229940106157 cellulase Drugs 0.000 description 6
- 230000002950 deficient Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 101150095482 pyr2 gene Proteins 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 108010058643 Fungal Proteins Proteins 0.000 description 5
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 5
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 5
- 102000004357 Transferases Human genes 0.000 description 5
- 108090000992 Transferases Proteins 0.000 description 5
- 230000000692 anti-sense effect Effects 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 108010013043 Acetylesterase Proteins 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 102100036683 Growth arrest-specific protein 1 Human genes 0.000 description 4
- 108010072039 Histidine kinase Proteins 0.000 description 4
- 101001072723 Homo sapiens Growth arrest-specific protein 1 Proteins 0.000 description 4
- 102000004317 Lyases Human genes 0.000 description 4
- 108090000856 Lyases Proteins 0.000 description 4
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000224526 Trichomonas Species 0.000 description 4
- 239000001110 calcium chloride Substances 0.000 description 4
- 229910001628 calcium chloride Inorganic materials 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 238000012224 gene deletion Methods 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 101150071118 seb1 gene Proteins 0.000 description 4
- 238000011218 seed culture Methods 0.000 description 4
- 150000008163 sugars Chemical class 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 3
- 108010024976 Asparaginase Proteins 0.000 description 3
- 241001465318 Aspergillus terreus Species 0.000 description 3
- 102100032487 Beta-mannosidase Human genes 0.000 description 3
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 3
- 102000003846 Carbonic anhydrases Human genes 0.000 description 3
- 108090000209 Carbonic anhydrases Proteins 0.000 description 3
- 102000005575 Cellulases Human genes 0.000 description 3
- 108010084185 Cellulases Proteins 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 108090000371 Esterases Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000427940 Fusarium solani Species 0.000 description 3
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 3
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 3
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 3
- 108090000769 Isomerases Proteins 0.000 description 3
- 102000004195 Isomerases Human genes 0.000 description 3
- 108010029541 Laccase Proteins 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090001060 Lipase Proteins 0.000 description 3
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 3
- 108010090665 Mannosyl-Glycoprotein Endo-beta-N-Acetylglucosaminidase Proteins 0.000 description 3
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 238000010222 PCR analysis Methods 0.000 description 3
- 241000228150 Penicillium chrysogenum Species 0.000 description 3
- 108090000284 Pepsin A Proteins 0.000 description 3
- 102000057297 Pepsin A Human genes 0.000 description 3
- 241001326562 Pezizomycotina Species 0.000 description 3
- 108010059820 Polygalacturonase Proteins 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 108010030291 alpha-Galactosidase Proteins 0.000 description 3
- 102000005922 amidase Human genes 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 3
- 108010055059 beta-Mannosidase Proteins 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 108010005400 cutinase Proteins 0.000 description 3
- 108010091371 endoglucanase 1 Proteins 0.000 description 3
- 108010093305 exopolygalacturonase Proteins 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 230000028644 hyphal growth Effects 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 235000011073 invertase Nutrition 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 235000019799 monosodium phosphate Nutrition 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 3
- 229910000162 sodium phosphate Inorganic materials 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- 108090000344 1,4-alpha-Glucan Branching Enzyme Proteins 0.000 description 2
- 102000003925 1,4-alpha-Glucan Branching Enzyme Human genes 0.000 description 2
- 108010080981 3-phytase Proteins 0.000 description 2
- NGSWKAQJJWESNS-UHFFFAOYSA-N 4-coumaric acid Chemical compound OC(=O)C=CC1=CC=C(O)C=C1 NGSWKAQJJWESNS-UHFFFAOYSA-N 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 2
- 101150101112 7 gene Proteins 0.000 description 2
- 102000006267 AMP Deaminase Human genes 0.000 description 2
- 108700016228 AMP deaminases Proteins 0.000 description 2
- 108010051457 Acid Phosphatase Proteins 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 108010025188 Alcohol oxidase Proteins 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108700023418 Amidases Proteins 0.000 description 2
- 108090000915 Aminopeptidases Proteins 0.000 description 2
- 102000004400 Aminopeptidases Human genes 0.000 description 2
- 108010033764 Amylosucrase Proteins 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 241000131386 Aspergillus sojae Species 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 238000009010 Bradford assay Methods 0.000 description 2
- 108010053835 Catalase Proteins 0.000 description 2
- 102100035882 Catalase Human genes 0.000 description 2
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 108010035722 Chloride peroxidase Proteins 0.000 description 2
- 108090001069 Chymopapain Proteins 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 2
- 102100035149 Cytosolic endo-beta-N-acetylglucosaminidase Human genes 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- 108030002106 D-psicose 3-epimerases Proteins 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 108030001574 Deuterolysin Proteins 0.000 description 2
- 108010001682 Dextranase Proteins 0.000 description 2
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 108090000270 Ficain Proteins 0.000 description 2
- 229920001503 Glucan Polymers 0.000 description 2
- 108010022769 Glucan 1,3-beta-Glucosidase Proteins 0.000 description 2
- 108010032083 Glucan 1,4-beta-Glucosidase Proteins 0.000 description 2
- 108010015776 Glucose oxidase Proteins 0.000 description 2
- 239000004366 Glucose oxidase Substances 0.000 description 2
- 108010055629 Glucosyltransferases Proteins 0.000 description 2
- 102000000340 Glucosyltransferases Human genes 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 108010073324 Glutaminase Proteins 0.000 description 2
- 102000009127 Glutaminase Human genes 0.000 description 2
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 2
- 102100036269 Hexosaminidase D Human genes 0.000 description 2
- 101000795074 Homo sapiens Tryptase alpha/beta-1 Proteins 0.000 description 2
- 108010028688 Isoamylase Proteins 0.000 description 2
- 108010010525 Isomaltulose synthase Proteins 0.000 description 2
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 2
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 108010004098 Leucyl aminopeptidase Proteins 0.000 description 2
- 102000002704 Leucyl aminopeptidase Human genes 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 102100033468 Lysozyme C Human genes 0.000 description 2
- 108090000192 Methionyl aminopeptidases Proteins 0.000 description 2
- 102000034452 Methionyl aminopeptidases Human genes 0.000 description 2
- 102000048245 N-acetylneuraminate lyases Human genes 0.000 description 2
- 108700023220 N-acetylneuraminate lyases Proteins 0.000 description 2
- 108060004757 N-acyl-D-amino-acid deacylase Proteins 0.000 description 2
- 108030006755 N-acyl-aliphatic-L-amino acid amidohydrolases Proteins 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 101100032401 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pyr-4 gene Proteins 0.000 description 2
- 108010033272 Nitrilase Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108010026867 Oligo-1,6-Glucosidase Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108090000526 Papain Proteins 0.000 description 2
- 108010029182 Pectin lyase Proteins 0.000 description 2
- 108090000313 Pepsin B Proteins 0.000 description 2
- 102000003992 Peroxidases Human genes 0.000 description 2
- 102100026918 Phospholipase A2 Human genes 0.000 description 2
- 108090000553 Phospholipase D Proteins 0.000 description 2
- 101000830822 Physarum polycephalum Terpene synthase 2 Proteins 0.000 description 2
- 102000056251 Prolyl Oligopeptidases Human genes 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 108090000919 Pyroglutamyl-Peptidase I Proteins 0.000 description 2
- 102100031108 Pyroglutamyl-peptidase 1 Human genes 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 108030006203 Rhamnogalacturonan endolyases Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 102100038836 Superoxide dismutase [Cu-Zn] Human genes 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- 108030003984 Thiol oxidases Proteins 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- 108060008539 Transglutaminase Proteins 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 102100029637 Tryptase beta-2 Human genes 0.000 description 2
- 102000014384 Type C Phospholipases Human genes 0.000 description 2
- 108010079194 Type C Phospholipases Proteins 0.000 description 2
- 108060008724 Tyrosinase Proteins 0.000 description 2
- 102000003425 Tyrosinase Human genes 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 108010046334 Urease Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 102100039662 Xaa-Pro dipeptidase Human genes 0.000 description 2
- 229920002000 Xyloglucan Polymers 0.000 description 2
- 102100029089 Xylulose kinase Human genes 0.000 description 2
- 108010093941 acetylxylan esterase Proteins 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 108091022872 aldose 1-epimerase Proteins 0.000 description 2
- 102000020006 aldose 1-epimerase Human genes 0.000 description 2
- 102000005840 alpha-Galactosidase Human genes 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 2
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 229960003272 asparaginase Drugs 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 108010019077 beta-Amylase Proteins 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- 238000010170 biological method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 108010048610 cellobiose phosphorylase Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 108010042194 dextransucrase Proteins 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 108090000285 fruit bromelain Proteins 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- 229940116332 glucose oxidase Drugs 0.000 description 2
- 235000019420 glucose oxidase Nutrition 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010018734 hexose oxidase Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 125000003588 lysine group Chemical class [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 108090000346 stem bromelain Proteins 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 108010038851 tannase Proteins 0.000 description 2
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 102000003601 transglutaminase Human genes 0.000 description 2
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 108091022915 xylulokinase Proteins 0.000 description 2
- KDXKERNSBIXSRK-RGXOIRHWSA-N (2s)-6-amino-2-(deuterioamino)hexanoic acid Chemical compound [2H]N[C@H](C(O)=O)CCCCN KDXKERNSBIXSRK-RGXOIRHWSA-N 0.000 description 1
- YPUDISCJWPUYAX-VRPWFDPXSA-N (3S,4S,5R)-2-amino-2,5-bis(hydroxymethyl)oxolane-3,4-diol Chemical compound OCC1(N)O[C@H](CO)[C@@H](O)[C@@H]1O YPUDISCJWPUYAX-VRPWFDPXSA-N 0.000 description 1
- 108030002794 1,2-beta-oligoglucan phosphorylases Proteins 0.000 description 1
- 108050004163 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-1 Proteins 0.000 description 1
- 108050004626 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-3 Proteins 0.000 description 1
- 108050004186 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase delta-4 Proteins 0.000 description 1
- 108050004161 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase epsilon-1 Proteins 0.000 description 1
- 102100026201 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase eta-1 Human genes 0.000 description 1
- 108050004167 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase eta-1 Proteins 0.000 description 1
- 108050004168 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase eta-2 Proteins 0.000 description 1
- 108050004159 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase zeta-1 Proteins 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- CHUGKEQJSLOLHL-UHFFFAOYSA-N 2,2-Bis(bromomethyl)propane-1,3-diol Chemical compound OCC(CO)(CBr)CBr CHUGKEQJSLOLHL-UHFFFAOYSA-N 0.000 description 1
- DMSDCBKFWUBTKX-UHFFFAOYSA-N 2-methyl-1-nitrosoguanidine Chemical compound CN=C(N)NN=O DMSDCBKFWUBTKX-UHFFFAOYSA-N 0.000 description 1
- PDLPTSJWDUCMKS-UHFFFAOYSA-N 3-[4-(3-sulfopropyl)piperazin-1-yl]propane-1-sulfonic acid Chemical compound OS(=O)(=O)CCCN1CCN(CCCS(O)(=O)=O)CC1 PDLPTSJWDUCMKS-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 229940093681 4-coumaric acid Drugs 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 102100036426 Acid phosphatase type 7 Human genes 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 102100025677 Alkaline phosphatase, germ cell type Human genes 0.000 description 1
- KHOITXIGCFIULA-UHFFFAOYSA-N Alophen Chemical compound C1=CC(OC(=O)C)=CC=C1C(C=1N=CC=CC=1)C1=CC=C(OC(C)=O)C=C1 KHOITXIGCFIULA-UHFFFAOYSA-N 0.000 description 1
- 229920000310 Alpha glucan Polymers 0.000 description 1
- 101710199313 Alpha-L-arabinofuranosidase Proteins 0.000 description 1
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 1
- 102100025981 Aminoacylase-1 Human genes 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 102100023943 Arylsulfatase L Human genes 0.000 description 1
- 102000009133 Arylsulfatases Human genes 0.000 description 1
- 108010024957 Ascorbate Oxidase Proteins 0.000 description 1
- 101000709143 Aspergillus aculeatus Rhamnogalacturonate lyase A Proteins 0.000 description 1
- 241000981399 Aspergillus melleus Species 0.000 description 1
- 241000182988 Assa Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 238000000035 BCA protein assay Methods 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 101710204694 Beta-xylosidase Proteins 0.000 description 1
- 102100035687 Bile salt-activated lipase Human genes 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 108010051152 Carboxylesterase Proteins 0.000 description 1
- 102000013392 Carboxylesterase Human genes 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 241000024244 Chelis Species 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 102100039501 Chymotrypsinogen B Human genes 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241000252203 Clupea harengus Species 0.000 description 1
- 102100029057 Coagulation factor XIII A chain Human genes 0.000 description 1
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 1
- 108090000395 Cysteine Endopeptidases Proteins 0.000 description 1
- 102000003950 Cysteine Endopeptidases Human genes 0.000 description 1
- AEMOLEFTQBMNLQ-VANFPWTGSA-N D-mannopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@@H]1O AEMOLEFTQBMNLQ-VANFPWTGSA-N 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 108010012023 Dextrin dextranase Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 108010067722 Dipeptidyl Peptidase 4 Proteins 0.000 description 1
- 108700036010 EC 3.4.21.65 Proteins 0.000 description 1
- 108700033915 EC 3.4.23.22 Proteins 0.000 description 1
- 108700033917 EC 3.4.23.23 Proteins 0.000 description 1
- 101000935015 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) N-acetyl-6-hydroxytryptophan oxidase ivoB Proteins 0.000 description 1
- 101710111935 Endo-beta-1,4-glucanase Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 108010019236 Fucosyltransferases Proteins 0.000 description 1
- 102000006471 Fucosyltransferases Human genes 0.000 description 1
- 108700005088 Fungal Genes Proteins 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- 102000055441 Gastricsin Human genes 0.000 description 1
- 241000973882 Geosmithia Species 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- 108030002455 Glutathione amide-dependent peroxidases Proteins 0.000 description 1
- 108030004638 Glycoprotein-fucosylgalactoside alpha-N-acetylgalactosaminyltransferases Proteins 0.000 description 1
- 101001095266 Homo sapiens Prolyl endopeptidase Proteins 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- 108010042889 Inulosucrase Proteins 0.000 description 1
- 102400000471 Isomaltase Human genes 0.000 description 1
- 101710184220 Kappa-carrageenase Proteins 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 1
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 1
- 102100022119 Lipoprotein lipase Human genes 0.000 description 1
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 description 1
- 108020002496 Lysophospholipase Proteins 0.000 description 1
- 102100028524 Lysosomal protective protein Human genes 0.000 description 1
- 229920000057 Mannan Polymers 0.000 description 1
- 102000001696 Mannosidases Human genes 0.000 description 1
- 108010054377 Mannosidases Proteins 0.000 description 1
- 108030004673 Mannuronate-specific alginate lyases Proteins 0.000 description 1
- 108090000131 Metalloendopeptidases Proteins 0.000 description 1
- 102000003843 Metalloendopeptidases Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- GMPKIPWJBDOURN-UHFFFAOYSA-N Methoxyamine Chemical compound CON GMPKIPWJBDOURN-UHFFFAOYSA-N 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100032519 Mitochondrial ribonuclease P catalytic subunit Human genes 0.000 description 1
- 108020002334 Monoacylglycerol lipase Proteins 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 101710126437 N-acetylmuramyl-L-alanine amidase Proteins 0.000 description 1
- 101000728666 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) Putative rhamnogalacturonase Proteins 0.000 description 1
- 101100202924 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) tsp-2 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 102100021969 Nucleotide pyrophosphatase Human genes 0.000 description 1
- 241000235652 Pachysolen Species 0.000 description 1
- 102100033357 Pancreatic lipase-related protein 2 Human genes 0.000 description 1
- 108030006205 Pectate trisaccharide-lyases Proteins 0.000 description 1
- 108010073038 Penicillin Amidase Proteins 0.000 description 1
- 108010087702 Penicillinase Proteins 0.000 description 1
- 102100038551 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidase Human genes 0.000 description 1
- 108030006253 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidases Proteins 0.000 description 1
- 108700020962 Peroxidase Proteins 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 102100035200 Phospholipase A and acyltransferase 4 Human genes 0.000 description 1
- 102000011420 Phospholipase D Human genes 0.000 description 1
- 102100032967 Phospholipase D1 Human genes 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 241000233614 Phytophthora Species 0.000 description 1
- 108700015930 Prolyl Oligopeptidases Proteins 0.000 description 1
- 108030006244 Protein-glutamine glutaminases Proteins 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 101710148480 Putative beta-xylosidase Proteins 0.000 description 1
- 102100021702 Putative cytochrome P450 2D7 Human genes 0.000 description 1
- 101710193171 Pyranose dehydrogenase Proteins 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 102000004879 Racemases and epimerases Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 102400001107 Secretory component Human genes 0.000 description 1
- 102000003667 Serine Endopeptidases Human genes 0.000 description 1
- 108090000083 Serine Endopeptidases Proteins 0.000 description 1
- 108030000574 Serine-type carboxypeptidases Proteins 0.000 description 1
- 102000034328 Serine-type carboxypeptidases Human genes 0.000 description 1
- 108090000899 Serralysin Proteins 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- HIWPGCMGAMJNRG-ACCAVRKYSA-N Sophorose Natural products O([C@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O)[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HIWPGCMGAMJNRG-ACCAVRKYSA-N 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 102100027918 Sucrase-isomaltase, intestinal Human genes 0.000 description 1
- OUUQCZGPVNCOIJ-UHFFFAOYSA-M Superoxide Chemical compound [O-][O] OUUQCZGPVNCOIJ-UHFFFAOYSA-M 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 101710167005 Thiol:disulfide interchange protein DsbD Proteins 0.000 description 1
- ISWQCIVKKSOKNN-UHFFFAOYSA-L Tiron Chemical compound [Na+].[Na+].OC1=CC(S([O-])(=O)=O)=CC(S([O-])(=O)=O)=C1O ISWQCIVKKSOKNN-UHFFFAOYSA-L 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 241000894120 Trichoderma atroviride Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000024277 Trichoderma reesei QM6a Species 0.000 description 1
- 108030004601 Type 1 galactoside alpha-(1,2)-fucosyltransferases Proteins 0.000 description 1
- 101710158370 Xylan 1,4-beta-xylosidase Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 108090000350 actinidain Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000010564 aerobic fermentation Methods 0.000 description 1
- 108010081577 aldehyde dehydrogenase (NAD(P)+) Proteins 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 108010084650 alpha-N-arabinofuranosidase Proteins 0.000 description 1
- 108010061261 alpha-glucuronidase Proteins 0.000 description 1
- 108010048202 alternansucrase Proteins 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- 108010085377 beta-N-Acetylhexosaminidases Proteins 0.000 description 1
- HIWPGCMGAMJNRG-UHFFFAOYSA-N beta-sophorose Natural products OC1C(O)C(CO)OC(O)C1OC1C(O)C(O)C(O)C(CO)O1 HIWPGCMGAMJNRG-UHFFFAOYSA-N 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 108010052085 cellobiose-quinone oxidoreductase Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 229910052927 chalcanthite Inorganic materials 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000002962 chemical mutagen Substances 0.000 description 1
- 108010089807 chitosanase Proteins 0.000 description 1
- 108010025790 chlorophyllase Proteins 0.000 description 1
- 229960002976 chymopapain Drugs 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 108010027293 diisopropyl-fluorophosphatase Proteins 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229910052564 epsomite Inorganic materials 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010075712 fatty acid reductase Proteins 0.000 description 1
- 108010041969 feruloyl esterase Proteins 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000019836 ficin Nutrition 0.000 description 1
- POTUGHMKJGOKRI-UHFFFAOYSA-N ficin Chemical compound FI=CI=N POTUGHMKJGOKRI-UHFFFAOYSA-N 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 108010058100 fructan beta-fructosidase Proteins 0.000 description 1
- UVBUBMSSQKOIBE-DSLOAKGESA-N fumonisin B1 Chemical compound OC(=O)C[C@@H](C(O)=O)CC(=O)O[C@H]([C@H](C)CCCC)[C@@H](OC(=O)C[C@@H](CC(O)=O)C(O)=O)C[C@@H](C)C[C@H](O)CCCC[C@@H](O)C[C@H](O)[C@H](C)N UVBUBMSSQKOIBE-DSLOAKGESA-N 0.000 description 1
- QZIADBYRQILELJ-UHFFFAOYSA-N fumonisin B1 Natural products CCCCC(C)C(OC(=O)CC(CC(=O)O)C(=O)O)C(C)(CC(C)CC(O)CCCCC(O)CC(O)C(C)N)OC(=O)CC(CC(=O)O)C(=O)O QZIADBYRQILELJ-UHFFFAOYSA-N 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 1
- 108010002430 hemicellulase Proteins 0.000 description 1
- 229940059442 hemicellulase Drugs 0.000 description 1
- 235000019514 herring Nutrition 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 235000020778 linoleic acid Nutrition 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010031620 mandelonitrile lyase Proteins 0.000 description 1
- 229910000357 manganese(II) sulfate Inorganic materials 0.000 description 1
- 108010022356 mannan 1,2-(1,3)-alpha mannosidase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 238000012259 partial gene deletion Methods 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 108010087558 pectate lyase Proteins 0.000 description 1
- 108010072638 pectinacetylesterase Proteins 0.000 description 1
- 102000004251 pectinacetylesterase Human genes 0.000 description 1
- 108020004410 pectinesterase Proteins 0.000 description 1
- 230000002351 pectolytic effect Effects 0.000 description 1
- 229950009506 penicillinase Drugs 0.000 description 1
- 229940066716 pepsin a Drugs 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 108010064607 phosphoglucokinase Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 108010004131 poly(beta-D-mannuronate) lyase Proteins 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 108010066823 proline dipeptidase Proteins 0.000 description 1
- KCXFHTAICRTXLI-UHFFFAOYSA-N propane-1-sulfonic acid Chemical compound CCCS(O)(=O)=O KCXFHTAICRTXLI-UHFFFAOYSA-N 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 150000003214 pyranose derivatives Chemical class 0.000 description 1
- 108010001816 pyranose oxidase Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108010029529 rhamnogalacturonase A Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- PZDOWFGHCNHPQD-VNNZMYODSA-N sophorose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](C=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O PZDOWFGHCNHPQD-VNNZMYODSA-N 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 108090000135 streptogrisin A Proteins 0.000 description 1
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 108060007951 sulfatase Proteins 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 229910000368 zinc sulfate Inorganic materials 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
- 239000011686 zinc sulphate Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
- C12N9/2428—Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01003—Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明的菌株和本公开的方法涉及丝状真菌中的遗传修饰,所述遗传修饰产生包含蛋白质生产率提高表型的丝状真菌的变体菌株。更具体地,如本文所呈现、描述和举例说明,包含蛋白质生产率提高表型的丝状真菌的此类变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。
Description
技术领域
本公开总体上涉及生物学、遗传学、分子生物学、丝状真菌、工业蛋白生产等领域。更特别地,本发明的菌株和本公开的方法涉及丝状真菌中的遗传修饰,所述遗传修饰产生包含蛋白质生产率提高表型的丝状真菌的变体菌株。更具体地,如本文所呈现、描述和举例说明,包含蛋白质生产率提高表型的丝状真菌的此类变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。
相关申请的交叉引用
本申请要求2018年7月30日提交的美国临时专利申请序列号62/711,846的优先权,所述美国临时专利申请通过引用以其全文特此并入。
序列表的引用
名为“NB41504-WO-PCT_SequenceListing.txt”的文本文件序列表的电子提交的内容创建于2019年7月24日,并且大小为160KB,其通过引用以其全文特此并入。
背景技术
丝状真菌(例如,曲霉属(Aspergillus)物种、青霉属(Penicillium)物种、篮状菌属(Talaromyces)物种、镰刀菌属(Fusarium)物种、毁丝霉属(Myceliophthora)物种、脉孢菌属(Neurospora)物种、木霉属(Trichoderma)物种等)能够表达高水平的天然(内源)和异源蛋白,从而使其非常适用于大规模生产用于工业和/或商业应用(诸如药物应用、动物健康应用、食品应用、饮料应用等)的蛋白质(例如,酶)和/或代谢物。丝状真菌典型地在生物反应器(发酵罐)中的菌丝体深层培养中生长,所述生物反应器经调节以将氧气和营养素引入并分配到培养基(即,培养肉汤)中。例如,已知丝状真菌里氏木霉(Trichoderma reesei/T.reesei;真菌红褐肉座菌(Hypocrea jecorina)的无性型)是纤维素酶的有效生产者(例如,参见PCT国际公开号W0 1998/15619、WO 2005/028636、WO 2006/074005、WO 1992/06221、WO 1992/06209、WO 1992/06183和WO 2002/12465)。
因此,丝状真菌由于其生产如下蛋白质的能力而被利用,这些蛋白质在生产诸如纤维素(衍生的)乙醇、纺织品加工品、谷物加工品、洗涤剂、纤维、食品添加剂、饲料添加剂等的商品中是有价值的。例如,在此类真菌宿主菌株中重组基因表达是生产蛋白质(即,用于工业和商业目的)的常见方法,并且因此,真菌宿主菌株的蛋白质生产率改进是蛋白质生产成本的重要经济因素。因此,如本领域技术人员所理解,用于提高丝状真菌菌株中蛋白质产生的此类组合物和方法具有重要的商业意义。
如本文所述,本公开通常涉及包含蛋白质生产率提高/增加表型的遗传修饰的丝状真菌菌株,其解决了本领域中此类持续且未满足的需求。
发明内容
本文描述了与具有蛋白质生产率增加表型的丝状真菌有关的菌株、细胞、方法、构建体等。因此,本公开的某些实施例涉及衍生自亲代细胞的修饰的子囊菌门(Ascomycota)细胞,其中所述修饰的细胞包含编码变体LOV蛋白的多核苷酸序列,所述变体LOV蛋白与SEQID NO:2、SEQ ID NO:4、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基,其中例如当在相同条件下发酵/培养时,所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。在某些实施例中,所述亲代细胞包含编码天然LOV蛋白的野生型多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在相关实施例中,所述真菌细胞还包含编码目的蛋白(POI)的异源多核苷酸。在其他实施例中,所述细胞还包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸。在某些其他实施例中,所述修饰的细胞还包含至少一种遗传修饰,所述遗传修饰缺失、破坏或减少了选自由MPG1 SFB3、SEB1、CRZ1、TSP2、SSB7和GAS1组成的组的蛋白质的表达/产生。
在其他实施例中,所述子囊菌门细胞选自木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、假丝酵母属(Candida)物种、金孢霉属(Chrysosporium)物种、头孢霉属(Cephalosporium)物种、篮状菌属物种、脉孢菌属物种和毁丝霉属物种。
因此,在某些实施例中,亲代曲霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:11或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在另一个实施例中,亲代青霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:12或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。在其他实施例中,亲代篮状菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:13或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在另一个实施例中,亲代镰刀菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:14或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在某些其他实施例中,亲代毁丝霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:15或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在其他实施例中,亲代脉孢菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:16或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在另一个实施例中,亲代假丝酵母属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在某些其他实施例中,亲代木霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:2或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在其他实施例中,目的蛋白由本公开的修饰的细胞产生并且从其纯化。
在其他实施例中,本公开涉及衍生自包含野生型多核苷酸序列的亲代细胞的修饰的子囊菌门细胞,所述野生型多核苷酸序列在严格杂交条件下与编码SEQ ID NO:2、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17或SEQ ID NO:18的天然LOV蛋白的核酸序列杂交,且所述天然LOV蛋白在对应于SEQID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基,其中所述修饰的细胞包含修饰的多核苷酸序列,所述修饰的多核苷酸序列在严格杂交条件下与编码SEQ ID NO:2、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQID NO:17或SEQ ID NO:18的LOV蛋白的核酸序列杂交,且所述LOV蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。在某些实施例中,所述细胞还包含编码目的蛋白的异源多核苷酸。在另一个实施例中,所述细胞还包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸构建体。在其他实施例中,所述细胞还包含至少一种遗传修饰,所述遗传修饰缺失、破坏或减少了选自由MPG1 SFB3、SEB1、CRZ1、TSP2、SSB7和GAS1组成的组的蛋白质的表达/产生。
在某些其他实施例中,所述子囊菌门细胞选自木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、假丝酵母属物种、金孢霉属物种、头孢霉属物种、篮状菌属物种、脉孢菌属物种和毁丝霉属物种。
在某些实施例中,所述亲代曲霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:11或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在其他实施例中,所述亲代青霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:12或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在另一个实施例中,所述亲代篮状菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:13或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在某些其他实施例中,所述亲代镰刀菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:14或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在另一个实施例中,亲代毁丝霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:15或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在其他实施例中,亲代脉孢菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:16或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在某些其他实施例中,亲代假丝酵母属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
在其他实施例中,亲代木霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:2或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。其他实施例涉及由本公开的修饰的细胞产生的目的蛋白。
本公开的某些其他实施例涉及一种载体,所述载体包含编码变体LOV蛋白的多核苷酸,所述变体LOV蛋白与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
在其他实施例中,本公开涉及一种编码变体LOV蛋白的多核苷酸,所述变体LOV蛋白与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
在另一个实施例中,本公开涉及一种编码变体LOV蛋白的多核苷酸,其中编码所述变体蛋白的所述多核苷酸在严格杂交条件下与编码SEQ ID NO:2、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQID NO:18的LOV蛋白的核酸序列杂交,且所述LOV蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
在其他实施例中,本公开涉及一种衍生自亲代菌株的突变木霉属菌株,其中所述突变菌株包含编码LOV变体蛋白的基因,所述LOV变体蛋白与SEQ ID NO:4或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的序列位置处包含赖氨酸(K)残基。在某些实施例中,相对于所述亲代菌株,所述突变菌株包含蛋白质生产率提高表型。在其他实施例中,所述突变菌株还包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸构建体。在其他实施例中,所述突变菌株还包含一种遗传修饰,所述遗传修饰缺失、破坏或减少了编码选自由MPG1 SFB3、SEB1、CRZ1、TSP2、SSB7和GAS1组成的组的至少一种蛋白质的基因的表达/产生。因此,某些相关实施例涉及一种由所述突变菌株产生的目的蛋白。
本公开的其他实施例涉及用于构建包含蛋白质生产率提高表型的修饰的子囊菌门细胞的方法,所述方法包括(i)获得包含野生型lov基因的亲代细胞,所述lov基因在严格杂交条件下与编码SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18的LOV蛋白的核酸序列杂交,(ii)修饰步骤(i)的亲代细胞以产生包含编码LOV(变体)蛋白的基因的修饰的细胞,所述LOV(变体)蛋白在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含赖氨酸(K)残基,以及(iii)分离步骤(ii)的修饰的细胞,其中所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。
在其他实施例中,本公开涉及一种用于构建包含蛋白质生产率提高表型的修饰的子囊菌门细胞的方法,所述方法包括:(i)获得亲代子囊菌门细胞并将编码LOV变体蛋白的多核苷酸构建体引入所述细胞中,所述LOV变体蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基,和(ii)分离步骤(i)的修饰的细胞,其中所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。
因此,如本文所阐述和描述,本公开的各种实施例通常涉及包含蛋白质生产率提高表型的丝状真菌的变体菌株,所述变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。
生物学序列简述
SEQ ID NO:1是编码SEQ ID NO:2的(天然)LOV蛋白的野生型木霉属物种lov基因的核酸序列。
SEQ ID NO:2是由SEQ ID NO:1编码的(天然)LOV蛋白的氨基酸序列。
SEQ ID NO:3是编码SEQ ID NO:4的(变体)T813K(取代的)LOV蛋白的名为“lov(T813K)”的木霉属物种突变等位基因的核酸序列。
SEQ ID NO:4是由SEQ ID NO:3编码的(变体)T813K(取代的)LOV蛋白的氨基酸序列。
SEQ ID NO:5是木霉属物种MPG1蛋白的氨基酸序列。
SEQ ID NO:6是木霉属物种SEB1蛋白的氨基酸序列。
SEQ ID NO:7是木霉属物种SFB3蛋白的氨基酸序列。
SEQ ID NO:8是木霉属物种CRZ1蛋白的氨基酸序列。
SEQ ID NO:9是木霉属物种GAS1蛋白的氨基酸序列。
SEQ ID NO:10是木霉属物种TPS2蛋白的氨基酸序列。
SEQ ID NO:11是曲霉属物种LOV蛋白直系同源物的氨基酸序列。
SEQ ID NO:12是青霉属物种LOV蛋白直系同源物的氨基酸序列。
SEQ ID NO:13是篮状菌属物种LOV蛋白直系同源物的氨基酸序列。
SEQ ID NO:14是镰刀菌属物种LOV蛋白直系同源物的氨基酸序列。
SEQ ID NO:15是毁丝霉属物种LOV蛋白直系同源物的氨基酸序列。
SEQ ID NO:16是脉孢菌属物种LOV蛋白直系同源物的氨基酸序列。
SEQ ID NO:17是假丝酵母属物种LOV蛋白直系同源物的氨基酸序列。
SEQ ID NO:18包含木霉属物种(天然)LOV蛋白(SEQ ID NO:2)的C末端氨基酸残基位置500-894。
SEQ ID NO:19是变体木霉属组氨酸激酶(NIK1)的氨基酸序列,其在SEQ ID NO:19的氨基酸(残基)位置743处包含甲硫氨酸(M)至苏氨酸(T)取代。将编码SEQ ID NO:19的变体NIK1组氨酸激酶的基因命名为“nik1(M743T)”。
SEQ ID NO:20是编码SEQ ID NO:21的天然SSB7蛋白的野生型里氏木霉ssb7基因的核酸序列。
SEQ ID NO:21是由SEQ ID NO:20编码的天然里氏木霉SSB7蛋白的氨基酸序列。
SEQ ID NO:22是等位基因ssb7(fs)的核酸序列,所述核酸序列在外显子2中包含G缺失(ΔG),从而产生移码(fs)突变,并且在ssb7基因最后一个内含子前包含提前终止密码子。
SEQ ID NO:23是由SEQ ID NO:22的等位基因ssb7(fs)编码的变体SSB7蛋白的氨基酸序列。
SEQ ID NO:23是哈茨木霉(Trichoderma harzianum)LOV蛋白直系同源物的氨基酸序列。
附图说明
图1显示了表达葡糖淀粉酶的B7ms1(亲代)菌株(图1,灰色数据点/灰色线)和突变株衍生的(子代)B7ms1-SF12菌株(图1,黑色数据点/黑色线)的供给糖的总蛋白产率的比较。因此,评价了这些表达葡糖淀粉酶(GA)的菌株(包含mpg1和seb1基因的粘度降低突变)在发酵罐中的蛋白质生产率。图例显示了每种品系类型的菌株名称(基因型参见表1),其后括号中的是所述菌株中的lov等位基因。如图1所示,B7ms1-SF12(子代)菌株(图1,黑色线;即,包含突变lov(T813K)等位基因)相对于B7ms1(亲代)菌株(图1,灰色线;即,包含野生型lov基因)具有蛋白质生产率提高表型。例如,如图1所呈现,当存在lov(T813K)突变时,供给糖的蛋白质产率提高了44%。
图2是说明LOV蛋白的氨基酸保守性的图示。更具体地,图2是六百九十一(691)个盘菌亚门(Pezizomycotina)同源物的Geneious多序列比对的图示。在图2的底部是表示木霉属LOV蛋白的氨基酸序列的框,其中如果氨基酸(残基)在大于99%的比对序列中保守,则以黑色阴影框呈现(或否则为灰色)。LOV残基编号(SEQ ID NO:2)呈现在序列图示上方。如图2所呈现,在木霉属LOV中或在大于2%的多序列比对序列中存在的氨基酸序列缺口以灰色阴影线呈现。LOV(XP_006967324.1)的公共GenBank序列中的注释在序列图示下方显示为灰色框。如LOV的GenBank条目中所注释,假定活性位点残基在序列图示下方显示为黑色框。用淡灰色框注释菌株B7ms1-SF12中用赖氨酸(K)取代苏氨酸(T)813残基。还绘制了平均疏水性和等电点(PI),并呈现于图2中。比对中的氨基酸同一性绘制在序列正上方。较淡灰色条表示在比对中至少30%的序列中一致的残基,并且较深色条表示在比对中少于30%的序列中相同的残基。
图3呈现了全纤维素酶生产T4ms菌株(灰色线)和包含工程化的lov(T813K)等位基因的突变株衍生T4mls(黑色线)在发酵罐中的供给糖的总蛋白产率的比较。更特别地,图3呈现了在较低细胞密度(LCD,虚线,圆圈)和较高细胞密度(HCD,实线,方块)两种发酵条件下这些菌株的供给糖的总蛋白产率。图例显示了发酵条件(LCD相对于HCD),其后是菌株名称(基因型参见表1),并且括号中显示了存在的lov等位基因。因此,如图3所示,在LCD(虚线,圆圈)和HCD(实线,方块)两种发酵条件下,T4mls菌株(图3,黑色线;即,包含突变lov(T813K)等位基因)相对于T4ms菌株(图3,灰色线;即,包含野生型lov基因)均具有蛋白质生产率提高表型。例如,如图3所呈现,当存在lov(T813K)突变时,供给糖的蛋白质产率提高了42%(LCD)和32%(HCD)。
图4呈现了具有野生型lov等位基因(灰色线)的全纤维素酶生产菌株T4m(实线,方块)和T4s(虚线,圆圈)以及分别包含工程化的lov(dis)等位基因(黑色线)的其突变衍生物T4ml+(实线,方块)和T4sl+(虚线,圆圈)在发酵罐中的供给糖的总蛋白产率的比较。图例显示了每种品系类型的菌株名称(基因型参见表1),其后括号中显示的是所述菌株中的lov等位基因。如图4所呈现,T4ml+和T4sl+(子代)菌株(图4,黑色线;即,包含突变lov(dis)等位基因)相对于其T4m和T4s(亲代)菌株(图4,灰色线;即,包含野生型lov基因)不具有蛋白质生产率提高表型。
图5呈现了具有lov(T813K)等位基因、lov(dis)等位基因或野生型lov(+)等位基因且具有各种标记插入位点的菌株在摇瓶发酵中的相对总蛋白滴度的比较。更特别地,评价了全纤维素酶生产菌株在摇瓶中相对于平行操作的T4菌株和T4m菌株的总蛋白滴度。将发酵中的具有各种标记插入位点的菌株与野生型lov(+)等位基因(图5,最淡的灰色条)、突变lov(T813K)等位基因(图5,中等灰色条)或lov(dis)等位基因(图5,最深的灰色条)比较。因此,在所有评价的标记插入位点中,当存在lov(T813K)等位基因时,总蛋白滴度增加。然而,在lov基因本身(lov(dis)等位基因)中插入pyr4(图5,菌株“41G”)或pyr2标记(菌株T4和T4m)显示相对滴度没有显著改进。
图6显示了全纤维素酶生产T4mp菌株(图6,灰色数据点/灰色线)和lov(T813K)突变T4mlp菌株(图6,黑色数据点/黑色线)的供给糖的总蛋白产率的比较。因此,评价了这些全纤维素酶表达菌株在发酵罐中的蛋白质生产率。图例显示了每种品系类型的菌株名称(基因型参见表1),其后括号中的是所述菌株中的lov等位基因。如图6所示,T4mlp菌株(图6,黑色线;即,包含突变lov(T813K)等位基因)相对于T4mp(亲代)菌株(图6,灰色线;即,包含野生型lov基因)具有蛋白质生产率提高表型。例如,如图6所呈现,当存在lov(T813K)突变时,供给糖的蛋白质产率提高了28%。
图7呈现了木霉属物种(天然)LOV蛋白(SEQ ID NO:2)与七(7)个不同子囊菌门LOV直系同源物比对的Clustal W(1.83)多序列比对。例如,Clustal比对中使用的八(8)个蛋白质序列如图7A-图7B中所示(SEQ ID NO:2和SEQ ID NO:11-17),并且其Clustal比对如图7C-图7F中所示。更特别地,如图7C-图7F所呈现,将木霉菌物种(天然)LOV蛋白(SEQ ID NO:2;标记为“2”,以粗体大写的残基显示)与以下比对:曲霉属物种LOV蛋白直系同源物(SEQID NO:11,标记为“11”)、青霉属物种LOV蛋白直系同源物(SEQ ID NO:12,标记为“12”)、篮状菌属物种LOV蛋白直系同源物(SEQ ID NO:13,标记为“13”)、镰刀菌属物种LOV蛋白直系同源物(SEQ ID NO:14,标记为“14”)、毁丝霉属物种LOV蛋白直系同源物(SEQ ID NO:15,标记为“15”)、脉孢菌属物种LOV蛋白直系同源物(SEQ ID NO:16,标记为“16”)和假丝酵母属物种LOV蛋白直系同源物(SEQ ID NO:17,标记为“17”)。如图7C-图7F(即,在比对的氨基残基下方)中所示,星号“*”指示具有单个完全保守残基的位置,冒号“:”指示强类似特性(即,在Gonnet PAM 250矩阵中得分>0.5)的组之间的保守性,并且句号“.”指示弱类似特性(即,在Gonnet PAM 250矩阵中得分<0.5)的组之间的保守性。高度保守的苏氨酸(T)氨基酸在图7F中以粗体带下划线的T残基指示。
图8呈现了使用(天然)木霉属物种LOV蛋白序列(SEQ ID NO:2)的C末端残基位置500-894(SEQ ID NO:18)通过BLAST蛋白比对(NCBI;Blastp套件)进行的氨基酸序列比对。例如,如图8A-图8G所呈现,SEQ ID NO:18包含木霉属物种(天然)LOV蛋白的C末端氨基酸序列(即,包含394个氨基酸残基位置,所述位置对应于SEQ ID NO:2的氨基酸残基位置500-894),其中残基位置813处高度保守的苏氨酸(T)氨基酸(T813)以粗体带下划线的T表示。因此,将此394个残基的C末端氨基酸序列(SEQ ID NO:18)与子囊菌门LOV蛋白直系同源物(例如,SEQ ID NO:11-17;图8A-图8G)比对。如图8A所示,曲霉属物种LOV蛋白直系同源物(SEQID NO:11)与SEQ ID NO:18具有约50%氨基酸序列同一性,其中对应于SEQ ID NO:2的位置813的序列位置处的高度保守的苏氨酸(T)氨基酸为粗体且带下划线(图8A),青霉属物种LOV蛋白直系同源物(SEQ ID NO:12)与SEQ ID NO:18具有约50%氨基酸序列同一性,其中对应于SEQ ID NO:2的位置813的序列位置处的高度保守的苏氨酸(T)氨基酸为粗体且带下划线(图8B),篮状菌属物种LOV蛋白直系同源物(SEQ ID NO:13)与SEQ ID NO:18具有约60%氨基酸序列同一性,其中对应于SEQ ID NO:2的位置813的序列位置处的高度保守的苏氨酸(T)氨基酸为粗体且带下划线(图8C),镰刀菌属物种LOV蛋白直系同源物(SEQ ID NO:14)与SEQ ID NO:18具有约88%氨基酸序列同一性,其中对应于SEQ ID NO:2的位置813的序列位置处的高度保守的苏氨酸(T)氨基酸为粗体且带下划线(图8D),毁丝霉属物种LOV蛋白直系同源物(SEQ ID NO:15)与SEQ ID NO:18具有约90%氨基酸序列同一性,其中对应于SEQ ID NO:2的位置813的序列位置处的高度保守的苏氨酸(T)氨基酸为粗体且带下划线(图8E),脉孢菌属物种LOV蛋白直系同源物(SEQ ID NO:16)与SEQ ID NO:18具有约90%氨基酸序列同一性,其中对应于SEQ ID NO:2的位置813的序列位置处的高度保守的苏氨酸(T)氨基酸为粗体且带下划线(图8F),并且假丝酵母属物种LOV蛋白直系同源物(SEQ IDNO:17)与SEQ ID NO:18具有约50%氨基酸序列同一性,其中对应于SEQ ID NO:2的位置813的序列位置处的高度保守的苏氨酸(T)氨基酸为粗体且带下划线(图8G)。
具体实施方式
如本文阐述和描述,本公开解决了丝状真菌蛋白生产及其方法领域中某些持续存在且未满足的需求,包括但不限于丝状真菌的如下遗传修饰,所述遗传修饰产生包含蛋白质生产率提高表型的丝状真菌的变体菌株。更具体地,如本文所呈现、描述和举例说明,包含蛋白质生产率提高表型的丝状真菌的此类变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。
I.定义
在详细地描述本发明的菌株和方法之前,为了清楚起见定义以下术语。未定义的术语应当符合相关领域中所使用的常规含义。除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。
用于如本文所述操作、构建和使用的丝状真菌细胞通常来自子囊菌门盘菌亚门(Pezizomycotina),特别是具有营养菌丝状态的真菌。此类生物体包括用于生产商业上重要的工业和药物蛋白的丝状真菌细胞,包括但不限于木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、金孢属(Chrysosporium)物种、头孢霉属(Cephalosporium)物种、篮状菌属物种、疣青霉属(Geosmithia)物种、脉孢菌属物种、毁丝霉属物种等。例如,在某些实施例中,丝状真菌细胞及其菌株包括但不限于里氏木霉(先前分类为长枝木霉(Trichodermalongibrachiatum)和红褐肉座菌(Hypocrea jecorina))、黑曲霉(Aspergillus niger)、烟曲霉(Aspergillus fumigatus)、解乌头酸曲霉(Aspergillus itaconicus)、米曲霉(Aspergillus oryzae)、构巢曲霉(Aspergillus nidulans)、土曲霉(Aspergillusterreus)、酱油曲霉(Aspergillus sojae)、日本曲霉(Aspergillus japonicus)、粗糙脉孢菌(Neurospora crassa)、绳状青霉(Penicillium funiculosum)、产黄青霉(Penicilliumchrysogenum)、埃默森篮状菌(埃默森疣青霉)(Talaromyces(Geosmithia)emersonii)、腐皮镰刀菌(Fusarium venenatum)、嗜热毁丝霉菌(Myceliophthora thermophila)、勒克诺金孢菌(Chrysosporium lucknowense)(C1)等。
如本文所用,为便于描述,术语和短语诸如“一种或多种丝状真菌菌株”、“一种或多种真菌菌株”、“一种或多种丝状真菌细胞”、“一种或多种丝状真菌细胞”,“一种或多种真菌细胞”等可以互换使用,并且不欲限制本公开的范围。
在某些实施例中,用于如本文所述操作、构建和使用的丝状真菌细胞通常来自子囊菌门盘菌亚门,特别是具有营养菌丝状态并且包含lov基因(或一种或多种lov基因同源物)的真菌。
如本文所用,诸如“亲代细胞”、“亲代真菌细胞”、“亲代菌株”、“亲代真菌菌株”、“丝状真菌细胞的亲代菌株”、“参考菌株”等的短语可以互换使用,并且是指“未修饰的”亲代丝状真菌细胞。例如,“丝状真菌细胞的亲代菌株”是指丝状真菌的任何细胞或菌株,其中“亲代”细胞的基因组被修饰或可修饰(例如,通过仅引入亲代细胞的一种遗传修饰)以产生丝状真菌细胞的变体(子代)菌株,使得“亲代”和“子代”细胞仅一种遗传修饰不同。
如本文所用,诸如“变体细胞”、“子代细胞”、“变体菌株”、“子代菌株”、“变体或子代真菌菌株”、“丝状真菌细胞的变体或子代菌株”等的短语可以互换使用,并且是指来源于(即,获自或可获自)丝状真菌细胞的亲代(或参考)菌株的丝状真菌细胞的变体菌株,其中变体菌株仅包含亲代菌株中不存在的一种遗传修饰,因此,通过比较,“亲代”与“变体”菌株之间的表型差异可以归因于所述一种遗传修饰。换句话说,除了“引入”变体菌株的单一遗传修饰之外,亲代与变体菌株在其他方面是同基因的。因此,在本公开中,亲代和变体菌株可以被描述为具有某些特征,诸如遗传修饰、表达表型、形态表型等;然而,熟练的技术人员将理解,从技术上讲,是亲代或变体菌株的细胞具有此类特征,且为方便起见提及“菌株”。
在某些实施例中,未修饰的(亲代)细胞可以被称为“对照细胞”或“参考细胞”,特别是当与来源于其的遗传修饰的(变体/子代)细胞比较(相比)时。
如本文所用,术语“野生型”和“天然的”可互换使用,并是指天然发现的基因、蛋白、蛋白混合物或菌株。
如本文所用,本公开的某些里氏木霉菌株/细胞已按下表1所述命名/缩写。
表1
里氏木霉菌株和遗传修饰
如本文所用,粘度降低的木霉属菌株“B7ms1”是表达葡糖淀粉酶的菌株,所述菌株在国际PCT公开号WO 2012/145584(通过引用以其全文并入本文)中被称为“Morph TrGA77B7Δmpg1Δseb1”。
如本文所用,基因组坐标(例如,支架序列16上之425393)和蛋白质识别号(PID,例如,PID 50212)参考由美国能源部联合基因组研究所(Department of Energy JointGenome Institute,JGI)产生的里氏木霉QM6a基因组序列组装的版本2(The GenomePortal of the Department of Energy Joint Genome Institute[美国能源部联合基因组研究所的基因组门户],Grigoriev等人,Nucleic Acids Res[核酸研究]2012年1月;40(数据库特辑):D26-32.doi:10.1093/nar/gkr947)。JGI装配的支架序列的序列也已经以核苷酸登录号GL985056.1至GL985132.1保藏在GenBank(国家生物技术中心,The NationalCenter for Biotechnology)中。
如本文所用,名为“B7ms1-SF12”的突变(变体)木霉属菌株(衍生自B7ms1亲代菌株)包含蛋白质生产率增加表型(即,相对于B7ms1(亲代)菌株)。更特别地,木霉属B7ms1-SF12菌株中鉴别的突变改变了名为LOV的蛋白质(即,预测的蛋白质PID 50212;SEQ ID NO:2)的编码序列,其中在(突变)B7ms1-SF12菌株中,(天然)LOV蛋白(SEQ ID NO:2)的残基位置813处高度保守的苏氨酸(T)氨基酸(T813)被赖氨酸取代(T→K813)(即,T813K取代,例如,比较SEQ ID NO:2位置813与SEQ ID NO:4位置813)。例如,如以下实例部分中所述,菌株B7ms1-SF12中的lov突变等位基因在支架序列16上425393处包含由G(鸟嘌呤)变为T(胸腺嘧啶)的单个核苷酸变化,从而在编码的LOV(变体)蛋白(SEQ ID NO:4)中产生“T813K”取代,其在SEQ ID NO:4的氨基酸位置813处包含赖氨酸(K)(与SEQ ID NO:2的天然LOV蛋白相对比,所述天然LOV蛋白在氨基酸位置813处包含苏氨酸(T);SEQ ID NO:2)。
如本文所用,名为“T4”的木霉属菌株如国际PCT公开号WO 2016/130523(通过引用以其全文并入本文)中所述,通过掺入nik1(M743T)突变和化学诱变衍生自木霉属菌株RL-P37。
如本文所用,名为“nik1(M743T)”的等位基因包含编码变体组氨酸激酶(NIK1;SEQID NO:19)的突变组氨酸激酶基因(nik1),所述变体组氨酸激酶在SEQ ID NO:19的氨基酸(残基)位置743处包含甲硫氨酸(M)至苏氨酸(T)取代。
如本文所用,名为“T4_pyr2”的木霉属菌株通过使pyr2基因突变和功能缺失衍生自木霉属菌株T4,因此pyr2基因可用作转化选择标记。
如本文所用,名为“T4m”的木霉属菌株衍生自菌株T4,其中菌株T4m包含mpg1基因突变(Δmpg1)和nik1(M743T)基因。因此,菌株T4m包含编码天然lov蛋白(SEQ ID NO:2)的野生型lov等位基因(即,等位基因lov(+))。
如本文所用,名为“T4m_pyr2”的木霉属菌株衍生自菌株T4m,其中菌株T4m_pyr2包含mpg1基因突变(Δmpg1)、nik1(M743T)基因和无功能的pyr2基因。
如本文所用,名为“T4ml+”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4ml+包含mpg1基因突变(Δmpg1)和等位基因lov(dis)。
如本文所用,名为“T4ml”的木霉属菌株衍生自菌株T4ml+,其中菌株T4ml包含nik1(M743T)、mpg1基因突变(Δmpg1)、等位基因lov(T813K)和无功能的pyr2基因。
如本文所用,名为“T4mls”的木霉属菌株衍生自菌株T4ml,其中菌株T4mls包含nik1(M743T)、mpg1和seb1基因双重突变(Δmpg1;Δseb1)和等位基因lov(T813K)。
如本文所用,名为“T4ms”的木霉属菌株衍生自菌株T4m,其中菌株T4ms包含nik1(M743T)以及mpg1和seb1基因双重突变(Δmpg1;Δseb1)。
如本文所用,名为“T4s”的木霉属菌株衍生自菌株T4,其中菌株T4s包含nik1(M743T)和seb1基因突变(Δseb1)。
如本文所用,名为“T4s_pyr2”的木霉属菌株衍生自菌株T4s,其中菌株T4s_pyr2包含nik1(M743T)、seb1基因突变(Δseb1)和无功能的pyr2基因。
如本文所用,名为“T4sl+”的木霉属菌株衍生自菌株T4s_pyr2,其中菌株T4sl+包含nik1(M743T)、seb1基因突变(Δseb1)和等位基因lov(dis)。
如本文所用,名为“T4sl”的木霉属菌株衍生自菌株T4sl+,其中菌株T4sl包含nik1(M743T)、seb1基因突变(Δseb1)、等位基因lov(T813K)和无功能的pyr2基因。
如本文所用,名为“T4l+”的木霉属菌株衍生自菌株T4_pyr2,其中菌株T4l+包含nik1(M743T)和等位基因lov(dis)。
如本文所用,名为“41G”的木霉属菌株诱变衍生自菌株T4,其中菌株4lG包含nik1(M743T)和(野生型)lov(+)等位基因。
如本文所用,名为“41G_pyr4”的木霉属菌株衍生自菌株41G,其中菌株4lG_pyr4包含nik1(M743T)、(野生型)lov(+)等位基因并缺失了pyr4基因。
如本文所用,名为“41Gl+”的木霉属菌株衍生自菌株4lG_pyr4,其中菌株4lGl+包含nik1(M743T)和等位基因lov(dis)。
如本文所用,名为“T4mc”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4mc包含nik1(M743T)、Δmpg1、位点C的pyr2+插入和野生型lov(+)等位基因。
如本文所用,名为“T4mlc”的木霉属菌株衍生自菌株T4ml,其中菌株T4mlc包含nik1(M743T)、Δmpg1、位点C的pyr2+插入和等位基因lov(T813K)。
如本文所用,名为“T4md”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4md包含nik1(M743T)、Δmpg1、位点B的pyr2+插入和野生型lov(+)等位基因。
如本文所用,名为“T4mld”的木霉属菌株衍生自菌株T4ml,其中菌株T4mld包含nik1(M743T)、Δmpg1、位点B的pyr2+插入和等位基因lov(T813K)。
如本文所用,名为“T4mp”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4mp包含nik1(M743T)、Δmpg1、位点A的pyr2+插入和野生型lov(+)等位基因。
如本文所用,名为“T4mlp”的木霉属菌株衍生自菌株T4ml,其中菌株T4mlp包含nik1(M743T)、Δmpg1、位点A的pyr2+插入和等位基因lov(T813K)。
如本文所用,名为“T4sp”的木霉属菌株衍生自菌株T4s_pyr2,其中菌株T4sp包含nik1(M743T)、Δseb1、位点A的pyr2+插入和野生型lov(+)等位基因。
如本文所用,名为“T4slp”的木霉属菌株衍生自菌株T4sl,其中菌株T4slp包含nik1(M743T)、Δseb1、位点A的pyr2+插入和等位基因lov(T813K)。
如本文所用,“葡糖淀粉酶(GA)构建体”或“GA构建体”编码PCT公开号WO 2012/145584(特别通过引用以其全文并入本文)中描述的葡糖淀粉酶。
如本文所用,“等位基因lov(+)”包含编码天然LOV蛋白(例如,SEQ ID NO:2)的野生型lov DNA序列。
如本文所用,“等位基因lov(T813K)”包含突变的(lov)DNA序列(如上所述,在菌株B7ms1-SF12中鉴别),所述DNA序列编码包含“T813K”取代的变体LOV蛋白(上述SEQ ID NO:4)。
如本文所用,“等位基因lov(dis)”包含lov基因的破坏,其中将可选择标记pyr2或pyr4整合到lov编码序列中,如下文在实例3中进一步描述。
如本文所用,“全纤维素酶菌株”是指木霉属菌株,其中自然分泌组尚未通过遗传工程化主要纤维素酶基因而改变。
如本文所用,编码目的蛋白的“内源(或天然)丝状真菌基因”包括但不限于如本领域技术人员所已知和理解的编码糖苷水解酶(GH)家族酶(例如像EC No.3.2.1.1-3.2.1.206)的内源(丝状真菌)基因,编码蛋白酶、酯酶、脂肪酶等的内源基因。
因此,如本文一般描述,在等效于SEQ ID NO:4的(变体)LOV蛋白的位置813的氨基酸(残基)位置处,用赖氨酸(K)取代苏氨酸(T)氨基酸(T→K取代)已经在本文中鉴别为观察到的蛋白质生产率(增加)表型的原因。例如,在相同条件下发酵/培养时,本文公开的包含编码(突变)B7ms1-SF12菌株T813→813K取代的引入等位基因(例如,等位基因lov(T813K))的丝状真菌细胞,相对于缺乏此突变的同基因细胞(即,包含编码天然LOV蛋白的野生型lov基因,即等位基因lov(+))表现出蛋白质生产率提高表型。更特别地,如在以下实例部分中所呈现,本公开的丝状真菌细胞(包含此类蛋白质生产率提高表型)特别适用于在(有氧)深层培养中生长(例如像用于大规模生产用于商业应用的目的蛋白)。
如本文所用,使用SEQ ID NO:2的天然木霉属物种LOV蛋白的氨基酸残基编号(位置)对“给定氨基酸序列”中氨基酸残基的“位置”进行编号。例如,对于短语“在对应于SEQID NO:2的位置813的序列位置处包含苏氨酸(T)残基”和“在对应于SEQ ID NO:2的位置813的序列位置处包含赖氨酸(K)残基”,使用天然(木霉属物种)LOV蛋白的氨基酸序列(SEQ IDNO:2)作为参考(亲代)蛋白序列。
例如,如图7C-图7F中所示,可以使用本文所述的比对算法(和/或本领域已知的比对算法)将本文所述的给定氨基酸序列与天然木霉属物种LOV蛋白氨基酸序列(SEQ ID NO:2)比对,并且给定氨基酸序列中与天然序列中的氨基酸残基比对(优选最佳比对)的氨基酸残基可以方便地通过参考LOV序列中的对应氨基酸残基来编号。因此,图7呈现了标记为序列“2”的天然木霉属物种LOV蛋白(SEQ ID NO:2)与来自如下各种(子囊菌门)丝状真菌的LOV蛋白直系同源物的多序列比对,诸如标记为序列“12”的曲霉属物种(SEQ ID NO:12)、标记为序列“13”的青霉属物种(SEQ ID NO:13)、标记为序列“14”的篮状菌属物种(SEQ IDNO:14)、标记为序列“15”的镰刀菌属物种(SEQ ID NO:15)、标记为序列“16”的毁丝霉属物种(SEQ ID NO:16)、标记为序列“17”的脉孢菌属物种(SEQ ID NO:17)以及标记为序列“18”的假丝酵母属物种(SEQ ID NO:18)。
同样,为了与木霉属物种LOV蛋白(SEQ ID NO:2)的一级(1°)序列建立序列同源性或序列同一性,本领域技术人员可以使用本领域技术人员已知的序列比对算法、软件及其方法容易地将SEQ ID NO:2的一级序列与一种或多种候选LOV蛋白(直系同源物)序列进行比较。因此,在比对保守残基,允许进行必要的插入和缺失以维持比对(即,避免通过任意缺失和插入消除保守残基)后,定义了等效于子囊菌门LOV蛋白一级序列中特定氨基酸的残基。保守残基的比对优选应该保留此类残基的100%。然而,大于98%、95%、90%、85%、80%、75%、70%、50%或至少45%的保守残基的比对也足以定义等效残基。
因此,如本文所用,在对应(或等效)于SEQ ID NO:2的位置813的氨基酸(残基)位置处,用赖氨酸(K)氨基酸取代苏氨酸(T)氨基酸(T813→813K取代)包括在任何子囊菌门丝状真菌细胞中对应于SEQ ID NO:2的位置813的氨基酸(残基)位置处的任何T813→813K取代。
如本文所用,术语“基因”与术语“等位基因”同义,是指编码和指导蛋白或RNA表达的核酸。丝状真菌的营养体形式通常是单倍体,因此指定基因的单拷贝(即单个等位基因)足以赋予特定表型。
如本文所用,术语“多肽”和“蛋白质”(和/或其各自的复数形式)可互换地用来指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文中使用用于氨基酸残基的常规一字母或三字母代码。聚合物可以是线性的或支化的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。这些术语还包括天然地修饰的或通过干预而修饰的氨基酸聚合物;例如,通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分偶联。所述定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
如本文所用,术语“衍生多肽/蛋白”是指通过以下衍生的或可衍生的蛋白:向一个或多个N-末端和C-末端中的一个或两个添加一个或多个氨基酸,在氨基酸序列中一个或多个不同位点处取代一个或多个氨基酸,在蛋白的一端或两端或者在氨基酸序列的一个或多个位点处缺失一个或多个氨基酸,和/或在氨基酸序列中一个或多个位点处插入一个或多个氨基酸。蛋白衍生物的制备可以通过修饰编码天然蛋白的DNA序列、将该DNA序列转化到合适的宿主中、以及表达修饰的DNA序列以形成衍生蛋白来实现。
相关的(和衍生)蛋白包括“变体蛋白”。变体蛋白通过在少量氨基酸残基处的取代、缺失和/或插入而不同于参考/亲代蛋白(例如,野生型蛋白)。变体与亲代蛋白之间的不同氨基酸残基的数量可以是一个或多个,例如,1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、或更多个氨基酸残基。变体蛋白与参考蛋白可以共有至少约50%、至少约60%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或甚至至少约99%、或更多氨基酸序列同一性。变体蛋白也可以与参考蛋白在选择的基序、结构域、表位、保守区域等方面不同。
如本文所用,术语“类似序列”是指蛋白内提供与目的蛋白(即,典型地目的原始蛋白)类似的功能、三级结构和/或保守残基的序列。例如,在含有α-螺旋或β-折叠结构的表位区域中,类似序列中的置换氨基酸优选保持相同的特定结构。所述术语还指核苷酸序列以及氨基酸序列。在一些实施例中,开发了类似序列以使得氨基酸的置换产生显示类似或改进功能的变体酶。在一些实施例中,目的蛋白中氨基酸的三级结构和/或保守残基位于目的区段或片段处或附近。因此,当目的区段或片段含有例如α-螺旋或β-折叠结构时,置换氨基酸优选维持所述特定结构。
如本文所使用的,术语“同源蛋白”是指与参考蛋白具有相似活性和/或结构的蛋白。这并不旨在表示同源物必定在进化上相关。因此,其旨在表示所述术语涵盖从不同生物体获得的相同、类似或相应(即,在结构和功能方面)的一种或多种蛋白。在一些实施例中,期望鉴别与参考蛋白具有类似的四级、三级和/或一级结构的同源物。
序列之间的同源性程度可以使用本领域已知的任何合适的方法确定(参见,例如,Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;威斯康星遗传学软件包(Wisconsin Genetics Software Package)(威斯康星州麦迪逊市的遗传学电脑集团(Genetics Computer Group,Madison,WI))中的程序,诸如GAP、BESTFIT、FASTA和TFASTA;和Devereux等人,1984)。
例如,PILEUP是确定序列同源性水平的有用程序。PILEUP使用渐进的、两两比对创建了来自一组相关序列的多重序列比对。它还可以绘制显示用于创建所述比对的聚类关系的一个树。PILEUP使用Feng和Doolittle(1987)的渐进比对方法的简化。所述方法类似于Higgins和Sharp(1989)所述的方法。有用的PILEUP参数包括为3.00的默认空位权重,为0.10的默认空位长度权重,以及加权的末端空位。有用算法的另一个实例是Altschul等人,1990和Karlin等人,1993描述的BLAST算法。一种特别有用的BLAST程序是WU-BLAST-2程序(参见,例如,Altschul等人,1996)。参数“W”、“T”、以及“X”确定了所述比对的灵敏度与速度。所述BLAST程序使用字长(W)11、BLOSUM62得分矩阵(参见,例如,Henikoff和Henikoff,1989)比对(B)50、期望值(E)10、M'5、N'-4以及两条链的比较作为默认值。
如本文所使用的,在至少两个核酸或多肽的上下文中,短语“基本上相似”和“基本上相同”典型地意指多核苷酸或多肽包含与参考(即,野生型)序列相比具有至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约91%同一性、至少约92%同一性、至少约93%同一性、至少约94%同一性、至少约95%同一性、至少约96%同一性、至少约97%同一性、至少约98%同一性、或甚至至少约99%同一性、或更高同一性的序列。可以使用已知的程序(诸如BLAST、ALIGN和CLUSTAL)使用标准参数确定序列同一性。(参见,例如,Altschul等人,1990;Henikoff等人,1989;Karlin等人,1993;和Higgins等人,1988)。用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Center for Biotechnology Information)公开地获得。此外,可以使用FASTA搜索数据库(Pearson等人,1988)。两种多肽基本上相同的一个指示是第一多肽与第二多肽具有免疫交叉反应性。典型地,差别在于保守氨基酸取代的多肽具有免疫交叉反应性。因此,多肽与第二多肽基本上相同,例如,其中两个肽仅相差保守取代。两个核酸序列基本上相同的另一个指示是两个分子在严格条件下(例如,在中等至高严格性的范围内)彼此杂交。
如本文所用,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合成来源的DNA、cDNA和RNA,其可能是双链或单链,无论代表正义或反义链。
如本文所用,术语“表达”是指来源于本公开的核酸分子的正义(mRNA)或反义RNA的转录和稳定积累。表达也可指将mRNA翻译成多肽。因此,术语“表达”包括涉及多肽产生的任何步骤,这些步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。
如本文所用,组合术语“表达/产生”,如诸如“丝状真菌细胞的变体菌株表达/产生‘增加’量的目的蛋白(POI)”(即,相对于亲代细胞)的短语中所用,所述术语“表达/产生”意欲包括参与在本公开的此类变体丝状真菌菌株中表达和产生蛋白质的任何步骤。
在某些实施例中,包含“序列同源性”的编码LOV蛋白的基因、多核苷酸或核酸序列是指如下的DNA或RNA(核酸)序列,其与相应的核酸序列(与所述序列进行比较)具有极小序列差异,并且保留了与相应的核酸序列(与所述序列进行比较)基本上相同的生物学功能。例如,在某些实施例中,与编码LOV蛋白的基因、多核苷酸或核酸具有相当大序列同源性的核酸序列如本文中所述通过鉴别编码的基因产物(LOV蛋白)来评定。
在某些其他实施例中,使用核酸杂交方法确定/鉴别与编码LOV蛋白的基因、多核苷酸或核酸具有序列同源性的基因、多核苷酸或核酸序列。例如,在某些实施例中,与编码LOV蛋白(例如,SEQ ID NO:2)的基因具有相当大序列同源性的DNA/RNA序列通过此种DNA/RNA序列在严格条件下与本公开的指定核酸序列杂交的能力来鉴别。
如本文所用,“在严格条件下杂交”旨在描述用于杂交和洗涤的条件,在所述条件下彼此显著相同或同源的核苷酸序列保持彼此杂交。此类严格条件是本领域技术人员熟知的(参见,例如,Ausubel等人,1995;Sambrook等人,1989)。例如,在某些实施例中,严格杂交条件的非限制性实例包括在约65℃-70℃下在4X氯化钠/柠檬酸钠(SSC)中杂交(或在约42℃-50℃下在4×SSC加50%甲酰胺中杂交),随后在约65℃-70℃下用1×SSC洗涤一次或多次。同样,高度严格杂交条件的非限制性实例包括在约65℃-70℃下在1×SSC中杂交(或在约42℃-50℃下在4×SSC加50%甲酰胺中杂交),随后在约65℃-70℃下用0.3×SSC洗涤一次或多次。因此,高度严格杂交条件包括在约50℃-60℃下在4×SSC中杂交(或可替代地,在约40℃-45℃下在6×SSC加50%甲酰胺中杂交),随后在约50℃-60℃下用2×SSC洗涤一次或多次。本公开还意欲涵盖在上述值中间的范围,例如在65℃-70℃下或在42℃-50℃下。在某些实施例中,在杂交和洗涤缓冲液中可以用SSPE(1×SSPE为0.15M NaCl,10mM NaH2PO4和1.25mM EDTA,pH 7.4)取代SSC(1×SSPE为0.15M NaCl和15mM柠檬酸钠);杂交完成后,每次进行洗涤15分钟。预期长度小于50个碱基对的杂交体的杂交温度应比杂交体的解链温度(Tm)低5℃-10℃,其中Tm根据以下等式确定。对于长度小于18个碱基对的杂交体,Tm(℃)=2(A+T碱基数)+4(G+C碱基数)。对于长度在18个与49个碱基对之间的杂交体,Tm(℃)=81.5+16.6(log10[Na+])+0.41(%G+C)-(600/N),其中N是杂交体中的碱基数,并且[Na+]是杂交缓冲液中钠离子的浓度(1×SSC的[Na+]=0.165M)。熟练技术者还将认识到,可以将其他试剂添加到杂交和/或洗涤缓冲液中以减少核酸分子与膜例如硝酸纤维素膜或尼龙膜的非特异性杂交,所述其他试剂包括但不限于阻断剂(例如,BSA或鲑鱼或鲱鱼精子载体DNA)、去污剂(例如,SDS)、螯合剂(例如,EDTA)、Ficoll、PVP等。特别地,当使用尼龙膜时,严格杂交条件的另一个非限制性实例是在约65℃下在0.25-0.5M NaH2PO4、7%SDS中杂交,随后在65℃下在0.02M NaH2PO4、1%SDS中,或可替代地在0.2×SSC、1%SDS中洗涤一次或多次(参见,例如,Church和Gilbert,1984)。
因此,如上文一般性阐述,本公开的某些实施例涉及丝状真菌细胞的变体菌株,所述变体菌株包含编码LOV蛋白的基因的遗传修饰。如本文所用,术语“修饰”和“遗传修饰”可以互换使用,并且包括但不限于:(a)基因中一个或多个核苷酸的引入、取代或去除,或基因转录或翻译所需的调控元件中一个或多个核苷酸的引入、取代或去除,(b)基因破坏,(c)基因转化,(d)基因缺失,(e)基因(例如,反义RNA、siRNA、miRNA等)的下调,(f)本文公开的任何一个或多个基因的特异性诱变(包括但不限于基于CRISPR/Cas9的诱变)和/或(g)随机诱变。
如本文所用,包含遗传修饰的丝状真菌的变体菌株包括但不限于编码本文公开的LOV蛋白的基因的遗传修饰。因此,如下文进一步详细描述,各种分子生物学方法是本领域技术人员熟知的并且可用于产生/构建丝状真菌细胞的此类变体菌株。
如本文所用,“编码蛋白质的基因中一个或多个核苷酸的引入、取代或去除”,此类遗传修饰包括基因编码序列(即,外显子)和非编码插入(内含子)序列。
如本文所用,“基因的破坏”、“基因破坏”、“基因的灭活”和“基因灭活”可互换地使用,并且广泛地指基本上破坏/灭活靶基因的任何遗传修饰。基因破坏的示例性方法包括但不限于基因任何部分(包括多肽编码序列(CDS)、启动子、增强子或另外的调控元件)的完全或部分缺失或其诱变,其中诱变涵盖取代、插入、缺失、倒置及其任何组合和变化,其破坏/灭活一个或多个靶基因并基本上减少或阻止功能基因产物的表达/产生。在本公开的某些实施例中,此类基因破坏阻止宿主细胞表达/产生编码的lov基因产物。
在某些实施例中,使用已建立的基因编辑技术,诸如CRISPR/Cas9基因编辑、锌指核酸酶(ZFN)基因编辑、转录活化因子样效应子核酸酶编辑(TALEN)、归巢(大型)核酸酶编辑等,对编码LOV蛋白的基因、多核苷酸或核酸序列进行遗传修饰。
在其他实施例中,丝状真菌的变体菌株通过基因转化的过程(例如,参见Iglesias和Trautner,1983)构建(即,遗传修饰)。
在其他实施例中,通过如下方法对由本公开的子囊菌门细胞表达/产生的目的蛋白(例如,内源POI或异源POI)进行检测、鉴别、测量、测定等:蛋白定量方法、基因转录方法、mRNA翻译方法等,包括但不限于蛋白迁移/迁移率(SDS-PAGE)、质谱、HPLC、尺寸排阻、超速离心沉降速度分析、转录组学、蛋白组学、荧光标签、表位标签、荧光蛋白(GFP、RFP等)嵌合体/杂交体等。
如本文所用,功能上和/或结构上类似的蛋白被认为是“相关的蛋白”。此类相关的蛋白可以来源于不同属和/或物种的生物体,或甚至不同纲的生物体(例如,细菌和真菌)。相关的蛋白还涵盖通过一级序列分析确定的、通过二级或三级结构分析确定的、或者通过免疫交叉反应性确定的同源物和/或直系同源物。
如本文所使用的术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列3'(下游)。启动子能以其整体来自天然基因,或者由来自自然界中发现的不同启动子的不同元件构成,或甚至包含合成的核酸区段。本领域技术人员应该理解,不同启动子可以在不同细胞类型中、或在不同发育阶段、或响应于不同环境条件或生理条件来指导基因表达。引起基因在大多数细胞类型中表达的启动子大多数时候通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下还不能完全确定调控序列的确切边界,不同长度的DNA片段可具有相同的启动子活性。
如本文所使用的术语“有效地连接”是指核酸序列在单个核酸片段上的缔合,这样使得一个核酸片段的功能受到另一个影响。例如,当能够实现该编码序列的表达(即编码序列在启动子的转录控制下)时,启动子与该编码序列(例如ORF)有效地连接。编码序列可以在正义或反义方向上有效地连接到调控序列上。当核酸置于与另一个核酸序列的功能关系时,所述核酸与另一个核酸序列“有效地连接”。例如,如果编码分泌性前导子(即信号肽)的DNA表达为参与多肽分泌的前蛋白,那么所述编码分泌性前导子的DNA有效地连接到所述多肽的DNA;如果启动子或增强子影响编码序列的转录,那么所述启动子或增强子有效地连接到所述序列;或者如果核糖体结合位点被定位以便促进翻译,那么所述核糖体结合位点有效地连接到编码序列。通常,“有效地连接”意指被连接的DNA序列是连续的,并且在分泌性前导子的情况下,是连续的并且处于阅读相中。然而,增强子不必需是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用这些合成的寡核苷酸衔接子或接头。
如本文所定义,“合适的调控序列”是指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或翻译的核苷酸序列。调控序列可以包括启动子、翻译前导序列、RNA加工位点、效应子结合位点和茎环结构。
如本文中所定义,如短语诸如“向真菌细胞中引入”至少一种多核苷酸可读框(ORF)或其基因或其载体中所使用的术语“引入”,包括本领域中已知用于将多核苷酸引入细胞中的方法,包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染等。
如本文所用,“转化的”或“转化”指通过使用重组DNA技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、ORF或基因)插入细胞中而发生。所插入的核苷酸序列可以是异源核苷酸序列(即,在待转化的细胞中不是天然存在的序列)。
如本文所用,“转化”是指将外源DNA引入宿主细胞中,使得DNA保持为染色体整合体或自我复制的染色体外载体。如本文所用,“转化DNA”、“转化序列”和“DNA构建体”是指用于将序列引入宿主细胞中的DNA。可以通过PCR或任何其他合适的技术在体外产生DNA。在一些实施例中,转化DNA包含输入序列,而在其他实施例中,其还包含同源盒侧翼的输入序列。在又另一个实施例中,转化DNA包含添加到末端的其他非同源序列(即,填充序列或侧翼)。末端可以闭合,这样使得转化DNA形成闭环,诸如像,插入载体中。
如本文所用,“输入序列”是指引入真菌细胞染色体中的DNA序列。在一些实施例中,输入序列是DNA构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因、和/或突变的或修饰的基因。在可替代的实施例中,该输入序列编码功能性野生型基因或操纵子、功能性突变基因或操纵子、或非功能基因或操纵子。在一些实施例中,输入序列是插入基因中以破坏基因功能的非功能序列。在另一个实施例中,输入序列包括选择性标记。在一个另外的实施例中,输入序列包括两个同源盒。
如本文所用,“同源盒”是指与真菌细胞染色体中的序列同源的核酸序列。更具体地,根据本发明,同源盒是上游或下游区,所述上游或下游区与被缺失、破坏、灭活的、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导了在真菌细胞染色体中,DNA构建体的整合位置,并且指导了真菌细胞染色体的哪部分被输入序列替代。尽管不欲限制本公开,但同源盒可以包括约1个碱基对(bp)至200千碱基(kb)。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间、和0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5'和3'端在同源盒侧翼,其中所述同源盒包含紧密位于基因的编码区侧翼的核酸序列。
如本文所用,术语“编码可选择标记的核苷酸序列”是指核苷酸序列,所述核苷酸序列能够在宿主细胞中表达并且其中可选择标记的表达赋予含有表达的基因的细胞在不存在对应的选择性试剂或缺乏必需营养素的情况下生长的能力。
如本文所用,术语“可选择标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择含有载体的那些宿主。此类可选择标记的实例包括但不限于抗微生物剂。因此,术语“可选择标记”是指提供宿主细胞已经摄取了输入性目的DNA或者已经发生了一些其他反应的指示的基因。典型地,可选择标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将包含外源DNA的细胞与未接受任何外源序列的细胞区分开来。
如本文所定义,宿主细胞“基因组”、真菌细胞“基因组”或丝状真菌细胞“基因组”包括染色体基因和染色体外基因。
如本文所用,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和DNA序列连同适当3'未翻译序列引入到细胞中。
如本文所用,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或DNA片段(例如,“输入序列”)到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括病毒、噬菌体、前病毒、质粒、噬菌粒、转座子和人工染色体诸如YAC(酵母人工染色体)、BAC(细菌人工染色体)、PLAC(植物人工染色体)等,其为“附加体”(即,自主复制)或可以整合到宿主细胞的染色体中。
如本文所用,“转化盒”是指包含基因(或其ORF),并且具有除促进特定宿主细胞的转化的基因外的元件的特定载体。
“表达载体”是指具有在细胞中并入并表达异源DNA的能力的载体。许多原核和真核表达载体可商购获得并且是本领域技术人员熟知的。合适的表达载体的选择在本领域技术人员的知识范围内。
如本文所用,术语“表达盒”和“表达载体”是指重组或合成产生的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件的核酸构建体(即,这些是载体或载体元件,如上所述)。重组表达盒可以整合在质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括,除了其他序列之外,待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括一系列允许靶细胞中特定核酸转录的特定核酸元件。在某些实施例中,本公开的DNA构建体包含如本文所定义的选择性标记和灭活的染色体或基因或DNA区段。
如本文所用,“靶向载体”是一种载体,所述载体包括与所述靶向载体转化的宿主细胞的染色体中的区同源的多核苷酸序列并且可以驱动所述区的同源重组。例如,靶向载体可用于通过同源重组将遗传修饰引入宿主细胞染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端的其他非同源序列(即,填充序列或侧翼序列)。末端可以闭合,这样使得靶向载体形成闭环,诸如像,插入载体中。
如本文所用,包含“蛋白质生产率提高表型”的变体细胞(或菌株)包括但不限于包含体积生产率提高/增加的变体细胞(或菌株)、包含碳转化效率提高/增加的变体细胞(或菌株)、蛋白质产率提高/增加的变体细胞(或菌株)、比蛋白质生产率提高/增加的变体细胞(或菌株)等。例如,在某些实施例中,包含蛋白质生产率提高表型的变体细胞或菌株每克供给糖表达/产生至少0.1%或更多的总蛋白(g)(相对于亲代菌株),其中供给糖可以以生产阶段期间(即,供给开始后)添加到发酵罐中的糖的质量表示。
如本文所定义,短语“蛋白质生产率提高表型”和“蛋白质生产率增加表型”可以互换使用。
如本文所用,当描述未修饰的(亲代)细胞相对于修饰的(变体/子代)细胞的“蛋白质生产率提高/增加表型”时,应理解“亲代”和“变体”细胞在相同条件(例如,相同条件诸如培养基、温度、pH等)下生长/培养/发酵。类似地,当描述在未修饰的(亲代)细胞中“表达/产生”目的蛋白(POI)相对于在修饰的(变体/子代)细胞中“表达/产生”相同POI时,应理解“亲代”和“变体”细胞在基本上相同条件(例如,相同条件诸如培养基、温度、pH等)下生长/培养/发酵。
如本文所用,“有氧发酵”是指在氧气存在下生长。
如本文所用,术语“肉汤”、“细胞肉汤”、“发酵肉汤”和/或“培养肉汤”可以互换使用,并且总体上指液体(深层)培养中的(i)发酵(培养)培养基和(ii)细胞。
如本文所用,术语“细胞团”是指液体(深层)培养中存在的细胞组分(包括完整和裂解的细胞)。细胞团可以干细胞重量(DCW)或湿细胞重量(WCW)表示。
如本文所用,丝状真菌细胞的“粘度降低”菌株是指如下修饰的(子代)菌株,所述修饰的(子代)菌株产生的细胞肉汤与亲代菌株产生的等效细胞肉汤相比具有降低的粘度(即,对剪切应力或拉伸应力的抗性降低)。例如,等效细胞肉汤通常具有相当的细胞团。国际PCT公开号WO 2012/027580、WO 2012/145596、WO 2012/145596和WO 2012/145592,以及国际PCT申请序列号PCT/US 2019/27590(每个文献均特别通过引用以其全文并入本文)中详细描述了用于构建粘度降低的丝状真菌菌株的方法和用于比较其粘度的方法。
因此,在某些实施例中,本公开的变体菌株(例如,包含编码等位基因lov(T813K)的遗传修饰的变体菌株)包含蛋白质生产率提高/增加表型,所述变体菌株还包含编码MPG1、SFB3、SEB1、CRZ1、GAS1、TPS2和/或SSB7蛋白的基因的遗传修饰。
如本文所用,木霉属物种“MPG1蛋白”包含SEQ ID NO:5的氨基酸序列(如国际PCT公开号WO 2012/145584中所述,所述案通过引用以其全文并入本文)。
如本文所用,木霉属物种“SEB1蛋白”包含SEQ ID NO:6的氨基酸序列(如国际PCT公开号WO 2012/145595中所述,所述案通过引用以其全文并入本文)。
如本文所用,木霉属物种“SFB3蛋白”包含SEQ ID NO:7的氨基酸序列(如国际PCT公开号WO 2012/027580中所述,所述案通过引用以其全文并入本文)。
如本文所用,木霉属物种“CRZ1蛋白”包含SEQ ID NO:8的氨基酸序列(如国际PCT公开号WO 2012/145596中所述,所述案通过引用以其全文并入本文)。
如本文所用,木霉属物种“GAS1蛋白”包含SEQ ID NO:9的氨基酸序列(如国际PCT公开号WO 2012/145596和WO 2012/145592中所述,所述案各自通过引用以其全文并入本文)。
如本文所用,木霉属物种“TSP2蛋白”包含SEQ ID NO:10的氨基酸序列(如国际PCT公开号WO 2012/145598中所述,所述案通过引用以其全文并入本文)。
如本文所用,野生型“ssb7基因”编码天然“SSB7蛋白”,所述蛋白描述于2019年4月16日提交的国际PCT申请序列号PCT/US2019/27590中。例如,野生型里氏木霉“ssb7基因”(SEQ ID NO:20)编码SEQ ID NO:21的天然“SSB7蛋白”。
如本文所用,“等位基因ssb7(fs)”(SEQ ID NO:22)编码SEQ ID NO:23的变体SSB7蛋白,如国际PCT申请序列号PCT/US2019/27590中所述(特别通过引用以其全文并入本文)。
II.包含蛋白质生产率提高表型的丝状真菌菌株
如上文一般性阐述以及下文实例部分中进一步描述,本公开的某些实施例涉及衍生自亲代菌株的丝状真菌的突变和遗传修饰的(变体)菌株。更特别地,某些实施例涉及丝状真菌的突变和遗传修饰的(变体)菌株(及其方法),其中此类菌株包含蛋白质生产率提高表型,诸如改进的体积效率、较高的比生产率、改进的碳源产率、降低的生物反应器(发酵罐)操作成本等。
更特别地,如以下实例1中进一步描述,鉴别、分离了一株突变(子代)木霉属菌株并命名为“B7ms1-SF12”,所述(突变)菌株在发酵罐中的供给糖的蛋白质产率相对于其所衍生的亲代菌株(B7ms1)高40%(例如,参见图1)。随后对突变B7ms1-SF12菌株进行了基因组序列分析和遗传分析,以鉴别其中引起B7ms1-SF12(突变)菌株的观察到的(生产率增加)表型的一种或多种基因的一种或多种突变。更具体地,确定了所鉴别的突变能改变SEQ IDNO:2的(天然)LOV蛋白的编码序列,其中(天然)LOV蛋白(SEQ ID NO:2)的氨基酸(残基)位置813处高度保守的苏氨酸(T)(T813)突变(取代)为SEQ ID NO:4的(变体)LOV蛋白的位置813处的赖氨酸(813K)(即,T813K取代;例如,参见图2)。
科学文献和相关技术的评述指示,文献中尚未对任何生物体的LOV蛋白(SEQ IDNO:2)和/或相关LOV蛋白直系同源物(例如,SEQ ID NO:11-17)的功能表征进行描述。然而,如本公开的实例1中一般性阐述,保守结构域分析(NCBI)鉴别出与糖基转移酶家族2组(pfam13632,E值3.25x10-44,例如参见图2中的“Glyco trans 2 3”远相关的(保守)区域。例如,原核蛋白的此(糖基转移酶)家族成员包括推定的葡糖基转移酶,其参与细菌荚膜生物合成(PFAM)。更特别地,具有(糖基转移酶)家族2组结构域的真菌蛋白“ZtGT2”,其与木霉属PID 79396直系同源(即,其不是LOV,PID 50212),对于在固体表面上的菌丝生长是重要的(King等人,2017)。
最令人惊讶的是,LOV蛋白在担子菌门和子囊菌门的丝状真菌中广泛保守。例如,在NCBI非冗余数据库的最前面的BLASTp搜索结果中,在木霉属和大多数与工业相关的丝状真菌所属的盘菌亚门中,(天然)LOV蛋白位置813处的苏氨酸(T)(即,如本文所公开,其突变为赖氨酸(K)是有益的)是高度保守的(691/691;100%)。例如,来自这691个盘菌亚门同源物的Geneious多序列比对(www.geneious.com,Geneious 11.0,Biomatters有限公司)的图示如图2所呈现。同样,在MUSCLE多序列比对(Genetic软件包)中,在前1,000个BLASTp命中中,氨基酸残基位置813在975/1000(97.5%)的命中中相同(即,残基T813),其中残基位置813从未出现赖氨酸(K)(即,本文所述的引起蛋白质生产率提高的取代在BLASTp鉴别的前1000个直系同源物中未发现)。
因此,为进一步验证lov(T813K)等位基因是观察到的蛋白质生产率提高表型的原因,将lov(T813K)突变引入名为“T4”(例如,参见表1)的不同里氏木霉菌株谱系中,其中B7ms1和T4亲代谱系均为木霉属菌株RL-P37的不同菌株改进程序的诱变衍生物(Sheir-Neiss等人,1984;Montenecourt,1987)。例如,T4菌株与B7ms1菌株的显著不同之处在于T4菌株表达其(内源)纤维素酶天然混合物,并包含增加总蛋白产生的nik1(M743T)突变(例如,参见国际PCT公开号WO 2016/130523)。同样,类似于实例1中所阐述的B7ms1谱系的观察结果,包含lov(T813K)等位基因的T4谱系(菌株)(例如,参见实例2和实例4)的供给糖的总蛋白产率相对于包含野生型lov(+)等位基因的同基因菌株平均提高34%。
另外,为进一步证明lov(T813K)等位基因对于改进真菌菌株蛋白质生产率表型的效用,申请人在其他三个方便的基因组位置(即,名为位点A-C;也请参见实例4,表1和表2)整合了pyr2标记。例如,在摇瓶中评价了这些不同菌株的蛋白质产生,其中在所有此类情况下,lov(T813K)突变的存在相对于包含野生型lov(+)等位基因的原本同基因(亲代)菌株改进了总蛋白产生。
III.分子生物学
如上文一般性描述,本公开的某些实施例涉及衍生自亲代菌株的丝状真菌的突变和遗传修饰的(变体)菌株。更特别地,某些实施例涉及丝状真菌的突变和遗传修饰的(变体)菌株(及其方法),其中此类菌株包含蛋白质生产率提高表型,诸如改进的体积效率、较高的比生产率、改进的碳源产率、降低的生物反应器(发酵罐)操作成本等。
因此,本公开的某些实施例涉及衍生自亲代木霉属菌株(例如,亲代B7ms1)的突变(子代)木霉属菌株(例如,突变B7ms1-SF12),其中所述突变体(子代)木霉属菌株包含编码变体LOV蛋白的突变lov基因,所述变体LOV蛋白在对应于SEQ ID NO:4的氨基酸残基位置813的氨基酸位置处包含赖氨酸(K)残基。
因此,本公开的某些其他实施例涉及衍生自本文所述的亲代菌株的丝状真菌的遗传修饰菌株(下文的“变体”菌株)。例如,在某些实施例中,丝状真菌的变体菌株包含编码变体LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述变体LOV蛋白与SEQ ID NO:2(即,天然LOV蛋白序列)具有序列同源性,并且所述丝状真菌的变体菌株在对应于SEQ IDNO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。
因此,在某些实施例中,本公开的变体菌株包含编码LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述LOV蛋白与SEQ ID NO:2(或SEQ ID NO:4)的LOV蛋白具有至少约50%至约100%序列同源性并且在对应于SEQ ID NO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。在某些实施例中,本公开的变体菌株包含编码LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述LOV蛋白与SEQ ID NO:2(或SEQ ID NO:4)的LOV蛋白具有至少约50%至约100%序列同一性,并且在对应于SEQ ID NO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。
因此,在其他实施例中,本公开的变体菌株包含编码LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述LOV蛋白与SEQ ID NO:2或SEQ ID NO:4具有至少约50%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约55%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约60%序列同源性或同一性,与SEQ ID NO:2或SEQID NO:4具有至少约65%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约70%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约75%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约80%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约85%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约90%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约95%序列同源性或同一性,或与SEQ ID NO:2或SEQ ID NO:4具有高达且为约100%序列同源性或同一性,并且在对应于SEQ ID NO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。
因此,在某些实施例中,丝状真菌的变体菌株至少包含将等位基因lov(T813K)引入菌株中的遗传修饰。例如,在某些实施例中,丝状真菌的变体菌株可以包含如下遗传修饰,其包括但不限于:(a)引入、取代或去除基因(或ORF或其多核苷酸)中的一个或多个核苷酸,或者引入、取代或去除基因的转录或翻译所需的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转化,(d)基因缺失,(e)基因下调,(f)特异性诱变和/或(g)随机诱变。在其他实施例中,包含等位基因lov(T813K)的丝状真菌的变体菌株还包含编码如本文所述的NIK1蛋白、SSB7蛋白、MPG1蛋白、SFB3蛋白、SEB1蛋白、CRZ1蛋白、TSP2蛋白和/或GAS1蛋白的基因的一个或多个遗传修饰。
因此,在某些实施例中,可以通过基因缺失以消除给定基因产物(例如,LOV(+)、NIK1、SSB7、MPG1 SFB3、SEB1、CRZ1、TSP2、GAS1、内源(背景)蛋白酶、纤维素酶等)的表达/产生来构建包含遗传修饰的丝状真菌的变体菌株。在其他实施例中,可以通过部分基因缺失消除(或减少)给定基因产物的表达/产生来构建包含遗传修饰的丝状真菌的变体菌株。例如,在某些实施例中,修饰的丝状真菌菌株可以包含基因的部分缺失,其中部分缺失包括基因编码序列的任何部分的部分缺失。例如,在某些实施例中,此类变体菌株不表达/产生所编码蛋白质,或者此类变体菌株表达/产生减少量的所编码蛋白质(相对于亲代菌株),其中“减少”量的所编码蛋白质可以如本文所述进行测量、检测、测定等。
因此,如在实例部分中一般性阐述和描述,本领域技术人员可以进行以下遗传修饰(及在此部分中描述的其分子生物学方法),并通过参考本公开的一个或多个氨基酸序列(SEQ ID NO:2、4、11-19)和/或核酸序列(SEQ ID NO:1和2)来构建其此类(变体)丝状真菌菌株。
例如,基因缺失技术能够部分或完全去除基因,从而消除或减少蛋白质的表达/产生,和/或从而消除或减少所编码蛋白质的表达/产生。在此类方法中,基因的缺失可以通过使用整合质粒/载体进行同源重组来完成,所述整合质粒/载体已构建成连续含有基因侧翼的5'和3'区。可以将连续的5'和3'区例如在整合质粒/载体上在与可选择标记结合下引入丝状真菌细胞中以允许质粒整合在细胞中。
在其他实施例中,丝状真菌的变体菌株包含破坏或灭活编码本公开蛋白质的基因的遗传修饰。基因破坏/灭活的示例性方法包括破坏基因的任何部分,包括多肽编码序列(CDS)、启动子、增强子或另一种调控元件,所述破坏包括取代、插入、缺失、倒置及其组合和其变体。因此,在某些实施例中,通过基因破坏技术构建丝状真菌的变体菌株。基因破坏技术的非限制性实例包括向本公开的一个或多个基因中插入(整合)含有与所述基因同源的核酸片段的整合质粒,这将产生同源区域的重复,并在重复区域之间掺入(插入)载体DNA。
因此,在某些其他非限制性实例中,基因破坏技术包括向基因中插入含有与所述基因同源的核酸片段的整合质粒,这将产生同源区域的重复,并在重复区域之间掺入(插入)载体DNA,其中插入的载体DNA将例如基因的启动子与蛋白质编码区分开,或中断(破坏)基因的编码或非编码序列。因此,破坏性构建体可以是伴有与基因同源的5'和3'区的可选择标记基因(例如,pyr2;参见实例)。可选择标记使得能够鉴别含有破坏的基因的转化体。因此,在某些实施例中,基因破坏包括如下基因控制元件的修饰,诸如启动子、核糖体结合位点(RBS)、非翻译区(UTR)、密码子改变等。
在其他实施例中,通过引入、取代或去除基因或其转录或翻译所需的调控元件中的一个或多个核苷酸来构建(即,遗传修饰)丝状真菌的变体菌株。例如,可以插入或去除核苷酸,以便引入终止密码子,去除起始密码子或使开放阅读框(ORF)移码。此种修饰可以根据本领域中已知的方法,通过定点诱变或PCR产生的诱变来完成(例如,参见Botstein和Shortle,1985;Lo等人,1985;Higuchi等人,1988;Shimada,1996;Ho等人,1989;Horton等人,1989以及Sarkar和Sommer,1990)。同样,可以通过用编码等位基因lov(T813K)的位置813赖氨酸的核苷酸取代编码野生型lov(+)基因的位置813苏氨酸的核苷酸来构建包含本文所述的T813K取代的等位基因lov(T813K)。
在其他实施例中,丝状真菌的变体菌株通过基因转化的过程(例如,参见Iglesias和Trautner,1983)构建(即,遗传修饰)。例如,在基因转化方法中,将对应于靶基因的核酸序列在体外诱变以产生缺陷核酸序列,然后将所述核酸序列转化到亲代细胞中以产生包含缺陷基因的变体细胞。通过同源重组,缺陷核酸序列替换内源基因。可能是需要的,缺陷基因或基因片段也编码可用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择标记结合引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。选择导致基因替换的第二次重组事件是通过检查菌落损失可选择标记和获得突变基因来实现的(Perego,1993)。
在其他实施例中,丝状真菌的变体菌株通过建立的反义(基因沉默)技术,使用与基因的核酸序列互补的核苷酸序列来构建(Parish和Stoker,1997)。更具体地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除丝状真菌菌株的基因的表达,所述核苷酸序列在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许互补的反义核苷酸序列与mRNA杂交的条件下,由此降低或消除了所翻译的蛋白的量。此类反义方法包括但不限于RNA干扰(RNAi)、小干扰RNA(siRNA)、微小RNA(miRNA)、反义寡核苷酸等,所有这些都是本领域技术人员熟知的。
在其他实施例中,使用本领域中熟知的方法(包括但不限于化学诱变(参见,例如,Hopwood,1970)和转座(参见,例如,Youngman等人,1983)),通过随机或特异性诱变构建(即,遗传修饰)丝状真菌的变体菌株。可以通过对亲代细胞进行诱变并筛选其中基因表达已经减少或消除的突变细胞来进行基因的修饰。例如,本领域技术人员可以容易地更改和/或修改本文实例部分中阐述的筛选方法,以鉴别包含粘度降低表型的丝状真菌细胞的此类(诱变的)变体菌株。
诱变可以是特异性或随机的,可以通过例如使用合适的物理或化学诱变剂进行、通过使用合适的寡核苷酸进行或通过将所述DNA序列经受PCR产生的诱变来进行。此外,诱变可通过使用这些诱变方法的任意组合来进行。适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、N-甲基-N'-亚硝基胍(NTG)、邻甲基羟胺、亚硝酸、乙基甲磺酸(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,典型地通过如下方法来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲代细胞,并选择表现出基因表达降低或无基因表达的突变细胞。
例如,本文所公开的一个或多个基因的此类遗传修饰可以降低基因启动子的效率,降低增强子的效率,干扰基因mRNA的剪接或编辑,干扰基因mRNA的翻译,将终止密码子引入基因编码序列以阻止全长蛋白的翻译,改变蛋白的编码序列以产生活性较低或无活性的蛋白,减少与其他核蛋白组分的蛋白相互作用,改变蛋白的编码序列以产生较不稳定的蛋白或靶向蛋白以进行破坏,或导致蛋白错误折叠或被错误修饰(例如,通过糖基化),或干扰蛋白的细胞运输。
在某些其他实施例中,借助于位点特异性基因编辑技术构建(即,遗传修饰的)丝状真菌的变体菌株。例如,在某些实施例中,通过使用转录活化因子如内切核酸酶(TALEN)、锌指核酸内切酶(ZFN)、归巢(大型)核酸内切酶等来构建(即,遗传修饰)丝状真菌的变体菌株。更特别地,借助于ZFN基因编辑、TALEN基因编辑、归巢(大型)内切核酸酶等对基因中待修饰的部分(例如,编码区、非编码区、前导序列、前肽序列、信号序列、转录终止子、转录活化因子或表达编码区所要的其他调控元件)进行遗传修饰,所述修饰方法是本领域技术人员熟知并且可得到的。
因此,在某些实施例中,借助于CRISPR/Cas9编辑构建(即,遗传修饰)丝状真菌的变体菌株。更具体地,本领域中描述了并且熟知用CRISPR/Cas9系统进行真菌基因组修饰的组合物和方法(例如,参见,国际PCT公开号:WO 2016/100571、WO 2016/100568、WO 2016/100272、WO 2016/100562等)。例如,编码天然LOV蛋白的基因可以借助于核酸指导的内切核酸酶进行遗传修饰,所述核酸指导的内切核酸酶通过结合指导RNA(例如,Cas9)或指导DNA(例如,NgAgo)找到其靶DNA,这将内切核酸酶募集到DNA上的靶序列上,其中所述内切核酸酶可以在DNA中产生单链或双链断裂。此靶向DNA断裂成为DNA修复的底物,并且可以与提供的编辑模板重组以破坏或缺失所述基因。例如,编码核酸指导的内切核酸酶的基因(例如,来自化脓链球菌(S.pyogenes)的Cas9或编码Cas9核酸酶的密码子优化的基因)与丝状真菌细胞中的活性启动子和丝状真菌细胞中的活性终止子有效连接,从而产生丝状真菌Cas9表达盒。同样地,本领域技术人员容易鉴别目的基因特有的一个或多个靶位点。
例如,为了构造编码gRNA的针对目的基因内的靶位点的DNA构建体,可变的靶向结构域(VT)将包含为(PAM)前间区序列邻近基序(TGG)5'的靶位点的核苷酸,所述核苷酸与编码化脓链球菌Cas9的Cas9内切核酸酶识别结构域(CER)的DNA融合。组合编码VT结构域的DNA和编码CER结构域的DNA,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA有效连接到丝状真菌细胞中的活性启动子和丝状真菌细胞中的活性终止子来产生gRNA的丝状真菌表达盒。
在某些实施例中,由内切核酸酶诱导的DNA断裂用输入序列修复/替换。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供核苷酸编辑模板,使得细胞的DNA修复机构可以利用编辑模板。例如,靶基因的约500bp 5'可以与靶基因的约500bp 3'融合以产生编辑模板,所述模板由丝状真菌宿主的机构用于修复由RGEN(RNA指导的内切核酸酶)产生的DNA断裂。
可以使用许多不同的方法(例如,原生质体融合、电穿孔、自然感受态或诱导感受态)将Cas9表达盒、gRNA表达盒和编辑模板共同递送至丝状真菌细胞。通过用正向和反向引物扩增靶基因座,通过PCR来筛选转化的细胞。这些引物可以扩增野生型基因座或已经由RGEN编辑的修饰的基因座。然后使用测序引物对这些片段进行测序以鉴别编辑的菌落。
IV.目的蛋白
如前述部分中简要陈述,本发明的菌株和方法可用于在丝状真菌的深层培养中生产商业上重要的蛋白。本公开的目的蛋白(POI)可以是任何内源或异源蛋白,并且其可以是此种POI的变体。蛋白可以含有一个或多个二硫桥键,或者是其功能形式是单体或多聚体的蛋白,即蛋白具有四级结构并且由多个相同(同源的)或不相同的(异源的)亚基构成,其中POI或其变体POI优选是具有目的特性的POI。
在某些实施例中,丝状真菌的变体菌株相对于(未修饰的)亲代菌株表现出增加的蛋白质滴度,其中蛋白质滴度定义为每体积的蛋白质量(g/L)。例如,可以通过本领域已知的方法(例如,ELISA、HPLC、Bradford测定、LC/MS等)来测量滴度。因此,在某些实施例中,相比于未修饰的(亲代)细胞,丝状真菌的变体菌株包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的蛋白质滴度增加。
在某些实施例中,丝状真菌的变体菌株相对于(未修饰的)亲代菌株表现出增加的体积生产率,其中体积生产率定义为发酵期间每公称体积(L)生物反应器每总发酵时间产生的蛋白质的量(g)。例如,可以通过本领域已知的方法(例如,ELISA、HPLC、Bradford测定、LC/MS等)来测量体积生产率。因此,在某些实施例中,与未修饰的(亲代)细胞相比,丝状真菌的变体菌株包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的体积生产率增加。
在某些其他实施例中,丝状真菌的变体菌株表现出增加的总蛋白产率,其中总蛋白产率定义为相对于(未修饰的)亲代菌株每克碳水化合物供给产生的蛋白质的量(g)。因此,如本文所用,可以使用以下等式计算总蛋白产率(g/g):
Yf=Tp/Tc
其中“Yf”是总蛋白产率(g/g),“Tp”是发酵期间产生的总蛋白(g),并且“Tc”是发酵(生物反应器)操作期间供给的总碳水化合物(g)。在某些实施例中,修饰的菌株的总蛋白产率的增加(即,相对于亲代菌株)为与未修饰的(亲代)细胞相比增加至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多。
总蛋白产率也可以描述为碳转化效率/碳产率,例如,以供给的碳中掺入总蛋白中的百分比(%)的形式描述。因此,在某些实施例中,丝状真菌的变体菌株包含相对于(未修饰的)亲代菌株增加的碳转化效率(例如,供给的碳中掺入总蛋白中的百分比(%)的增加)。在某些实施例中,修饰的菌株的碳转化效率的增加(即,相对于亲代菌株)为与未修饰的(亲代)细胞相比增加至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多。
在某些实施例中,丝状真菌的变体菌株相对于(未修饰的)亲代菌株表现出增加的POI的比生产率(Qp)。例如,比生产率(Qp)的检测是用于评价蛋白质产生的合适方法。比生产率(Qp)可以使用以下等式确定:
“Qp=gP/gDCW·hr”
其中,“gP”是罐中产生的蛋白质的克数;“gDCW”是罐中的干细胞重量(DCW)的克数,并且“hr”是从接种时间开始的几小时内的发酵时间,其包括生产时间以及生长时间。因此,在某些实施例中,与未修饰的(亲代)细胞相比,丝状真菌的变体菌株包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产率(Qp)增加。
在某些实施例中,POI或其变体POI选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖苷水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露聚糖酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶及其组合。
在某些实施例中,POI或其变体POI选自如下酶学委员会(EC)编号,所述酶学委员会(EC)编号选自由EC 1、EC 2、EC 3、EC 4、EC 5或EC 6组成的组。
例如,在某些实施例中,POI是氧化还原酶,所述氧化还原酶包括但不限于选自以下的EC1(氧化还原酶)酶:EC 1.10.3.2(例如,漆酶)、EC 1.10.3.3(例如,L-抗坏血酸氧化酶)、EC 1.1.1.1(例如,醇脱氢酶)、EC 1.11.1.10(例如,氯化物过氧化物酶)、EC1.11.1.17(例如,过氧化物酶)、EC 1.1.1.27(例如,L-乳酸脱氢酶)、EC 1.1.1.47(例如,葡萄糖1-脱氢酶)、EC 1.1.3.X(例如,葡萄糖氧化酶)、EC 1.1.3.10(例如,吡喃糖氧化酶)、EC1.13.11.X(例如,双加氧酶)、EC 1.13.11.12(例如,亚油酸13S-脂氧合酶)、EC 1.1.3.13(例如,醇氧化酶)、EC 1.14.14.1(例如,单加氧酶)、EC 1.14.18.1(例如,单酚单加氧酶(monophenol monooxigenase))、EC 1.15.1.1(例如,超氧化物歧化酶)、EC 1.1.5.9(先前,EC 1.1.99.10,例如,葡萄糖脱氢酶)、EC 1.1.99.18(例如,纤维二糖脱氢酶)、EC1.1.99.29(例如,吡喃糖脱氢酶)、EC 1.2.1.X(例如,脂肪酸还原酶)、EC 1.2.1.10(例如,乙醛脱氢酶)、EC 1.5.3.X(例如,果糖基胺还原酶)、EC 1.8.1.X(例如,二硫还原酶)和EC1.8.3.2(例如,硫醇氧化酶)。
在某些实施例中,POI是转移酶,所述转移酶包括但不限于选自以下的EC 2(转移酶)酶:EC 2.3.2.13(例如,转谷氨酰胺酶)、EC 2.4.1.X(例如,己糖基转移酶)、EC2.4.1.40(例如,交替蔗糖酶(alternasucrase))、EC 2.4.1.18(例如,1,4α-葡聚糖分支酶)、EC 2.4.1.19(例如,环麦芽糖糊精葡聚糖转移酶)、EC 2.4.1.2(例如,糊精葡聚糖酶)、EC 2.4.1.20(例如,纤维二糖磷酸化酶)、EC 2.4.1.25(例如,4-α-葡聚糖转移酶)、EC2.4.1.333(例如,1,2-β-低聚葡糖磷酸转移酶)、EC 2.4.1.4(例如,淀粉蔗糖酶)、EC2.4.1.5(例如,葡聚糖蔗糖酶)、EC 2.4.1.69(例如,半乳糖苷2-α-L-岩藻糖基转移酶)、EC2.4.1.9(例如,菊粉蔗糖酶(inulosucrase))、EC 2.7.1.17(例如,木酮糖激酶)、EC2.7.7.89(原名EC 3.1.4.15,例如,[谷氨酰氨合成酶]-腺苷-L-酪氨酸磷酸化酶)、EC2.7.9.4(例如,α葡聚糖激酶)和EC 2.7.9.5(例如,磷酸葡聚糖激酶)。
在其他实施例中,POI是水解酶,所述水解酶包括但不限于选自以下的EC 3(水解酶)酶:EC 3.1.X.X(例如,酯酶)、EC 3.1.1.1(例如,果胶酶)、EC 3.1.1.14(例如,叶绿素酶)、EC 3.1.1.20(例如,鞣酸酶)、EC 3.1.1.23(例如,甘油酯酰基水解酶)、EC 3.1.1.26(例如,半乳糖脂酶)、EC 3.1.1.32(例如,磷脂酶A1)、EC 3.1.1.4(例如,磷脂酶A2)、EC3.1.1.6(例如,乙酰酯酶)、EC 3.1.1.72(例如,乙酰木聚糖酯酶)、EC 3.1.1.73(例如,阿魏酸酯酶)、EC 3.1.1.74(例如,角质酶)、EC 3.1.1.86(例如,鼠李糖半乳糖醛酸乙酰酯酶)、EC 3.1.1.87(例如,伏马菌素B1酯酶)、EC 3.1.26.5(例如,核糖核酸酶P)、EC 3.1.3.X(例如,磷酸单酯水解酶)、EC 3.1.30.1(例如,曲霉核酸酶S1)、EC 3.1.30.2(例如,粘质沙雷氏菌(Serratia marcescens)核酸酶)、EC 3.1.3.1(例如,碱性磷酸酶)、EC 3.1.3.2(例如,酸性磷酸酶)、EC 3.1.3.8(例如,3-植酸酶)、EC 3.1.4.1(例如,磷酸二酯酶I)、EC 3.1.4.11(例如,磷脂酰肌醇磷脂酶C)、EC 3.1.4.3(例如,磷脂酶C)、EC 3.1.4.4(例如,磷脂酶D)、EC3.1.6.1(例如,芳基硫酸酯酶)、EC 3.1.8.2(例如,二异丙基-氟磷酸酶)、EC 3.2.1.10(例如,寡-1,6-葡糖苷酶)、EC 3.2.1.101(例如,甘露聚糖内切-1,6-α-甘露糖苷酶)、EC3.2.1.11(例如,α-1,6-葡聚糖-6-葡聚糖水解酶)、EC 3.2.1.131(例如,木聚糖α-1,2-葡糖醛酸苷酶(glucuronosidase))、EC 3.2.1.132(例如,壳聚糖N-乙酰葡糖胺基水解酶)、EC3.2.1.139(例如,α-葡糖醛酸糖苷酶(glucuronidase))、EC 3.2.1.14(例如,几丁质酶)、EC3.2.1.151(例如,木葡聚糖特异性内切-β-1,4-葡聚糖酶)、EC 3.2.1.155(例如,木葡聚糖特异性外切-β-1,4-葡聚糖酶)、EC 3.2.1.164(例如,半乳聚糖内切-1,6-β-半乳糖苷酶)、EC 3.2.1.17(例如,溶菌酶)、EC 3.2.1.171(例如,鼠李半乳糖醛酸聚糖水解酶)、EC3.2.1.174(例如,鼠李半乳糖醛酸聚糖鼠李糖水解酶)、EC 3.2.1.2(例如,β-淀粉酶)、EC3.2.1.20(例如,α-葡糖苷酶)、EC 3.2.1.22(例如,α-半乳糖苷酶)、EC 3.2.1.25(例如,β-甘露糖苷酶)、EC 3.2.1.26(例如,β-果糖呋喃糖苷酶)、EC 3.2.1.37(例如,木聚糖1,4-β-木糖苷酶)、EC 3.2.1.39(例如,葡聚糖内切-1,3-β-D-葡糖苷酶)、EC 3.2.1.40(例如,α-L-鼠李糖苷酶)、EC 3.2.1.51(例如,α-L-岩藻糖苷酶)、EC 3.2.1.52(例如,β-N-乙酰己糖胺酶)、EC 3.2.1.55(例如,α-N-阿拉伯呋喃糖苷酶)、EC 3.2.1.58(例如,葡聚糖1,3-β-葡糖苷酶)、EC 3.2.1.59(例如,葡聚糖内切-1,3-α-葡糖苷酶)、EC 3.2.1.67(例如,半乳聚糖1,4-α-半乳糖醛酸酶)、EC 3.2.1.68(例如,异淀粉酶)、EC 3.2.1.7(例如,1-β-D-果聚糖果糖水解酶)、EC 3.2.1.74(例如,葡聚糖1,4-β-葡糖苷酶)、EC 3.2.1.75(例如,葡聚糖内切-1,6-β-葡糖苷酶)、EC 3.2.1.77(例如,甘露聚糖1,2-(1,3)-α-甘露糖苷酶)、EC 3.2.1.80(例如,果聚糖β-果糖苷酶)、EC 3.2.1.82(例如,外切-聚-α-半乳糖醛酸苷酶)、EC 3.2.1.83(例如,κ-角叉菜胶酶)、EC 3.2.1.89(例如,阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶)、EC3.2.1.91(例如,纤维素1,4-β-纤维二糖糖苷酶)、EC 3.2.1.96(例如,甘露糖基-糖蛋白内切-β-N-乙酰葡糖胺糖苷酶)、EC 3.2.1.99(例如,阿拉伯聚糖内切-1,5-α-L-阿拉伯糖苷酶)、EC 3.4.X.X(例如,肽酶)、EC 3.4.11.X(例如,氨肽酶)、EC 3.4.11.1(例如,亮氨酰氨肽酶)、EC 3.4.11.18(例如,甲硫氨酰氨肽酶)、EC 3.4.13.9(例如,Xaa-Pro二肽酶)、EC3.4.14.5(例如,二肽基-肽酶IV)、EC 3.4.16.X(例如,丝氨酸型羧肽酶)、EC 3.4.16.5(例如,羧肽酶C)、EC 3.4.19.3(例如,焦谷氨酰肽酶I)、EC 3.4.21.X(例如,丝氨酸内肽酶)、EC3.4.21.1(例如,胰凝乳蛋白酶)、EC 3.4.21.19(例如,谷氨酰内肽酶)、EC 3.4.21.26(例如,脯氨酰寡肽酶)、EC 3.4.21.4(例如,胰蛋白酶)、EC 3.4.21.5(例如,凝血酶)、EC3.4.21.63(例如,蜂蜜曲霉蛋白酶)、EC 3.4.21.65(例如,热霉菌素)、EC 3.4.21.80(例如,链霉菌素A)、EC 3.4.22.X(例如,半胱氨酸内肽酶)、EC 3.4.22.14(例如,肌动蛋白)、EC3.4.22.2(例如,木瓜蛋白酶)、EC 3.4.22.3(例如,无花果蛋白酶)、EC 3.4.22.32(例如,茎菠萝蛋白酶)、EC 3.4.22.33(例如,水果菠萝蛋白酶)、EC 3.4.22.6(例如,木瓜凝乳蛋白酶)、EC 3.4.23.1(例如,胃蛋白酶A)、EC 3.4.23.2(例如,胃蛋白酶B)、EC 3.4.23.22(例如,栗疫霉胃蛋白酶)、EC 3.4.23.23(例如,毛霉胃蛋白酶)、EC 3.4.23.3(例如,胃蛋白酶)、EC 3.4.24.X(例如,金属内肽酶)、EC 3.4.24.39(例如,氘代溶素(deuterolysin))、EC3.4.24.40(例如,粘质沙雷氏菌酶)、EC 3.5.1.1(例如,天冬酰胺酶)、EC 3.5.1.11(例如,青霉素酰胺酶)、EC 3.5.1.14(例如,N-酰基-脂族-L-氨基酸酰胺水解酶)、EC 3.5.1.2(例如,L-谷氨酰胺酰胺水解酶)、EC 3.5.1.28(例如,N-乙酰胞壁酰-L-丙氨酸酰胺酶)、EC3.5.1.4(例如,酰胺酶)、EC 3.5.1.44(例如,蛋白-L-谷氨酰胺酰胺水解酶)、EC 3.5.1.5(例如,脲酶)、EC 3.5.1.52(例如,肽-N(4)-(N-乙酰基-β-葡糖胺基)天冬酰胺酰胺酶)、EC3.5.1.81(例如,N-酰基-D-氨基酸脱酰基酶)、EC 3.5.4.6(例如,AMP脱氨酶)和EC 3.5.5.1(例如,腈水解酶)。
在其他实施例中,POI是裂解酶,所述裂解酶包括但不限于选自以下的EC 4(裂解酶)酶:EC 4.1.2.10(例如,扁桃腈裂解酶)、EC 4.1.3.3(例如,N-乙酰神经氨酸裂解酶)、EC4.2.1.1(例如,碳酸脱水酶)、EC 4.2.2.-(例如,鼠李半乳糖醛酸聚糖裂解酶)、EC4.2.2.10(例如,果胶裂解酶)、EC 4.2.2.22(例如,果胶三糖-裂解酶)、EC 4.2.2.23(例如,鼠李半乳糖醛酸聚糖内切裂解酶)和EC 4.2.2.3(例如,甘露糖醛特异性海藻酸裂解酶)。
在某些其他实施例中,POI是异构酶,所述异构酶包括但不限于选自以下的EC 5(异构酶)酶:EC 5.1.3.3(例如,醛糖1-差向异构酶)、EC 5.1.3.30(例如,D-阿洛酮糖3-差向异构酶)、EC 5.4.99.11(例如,异麦芽酮糖合酶)和EC 5.4.99.15(例如,(1→4)-α-D-葡聚糖1-α-D-葡糖基变位酶)。
在又其他实施例中,POI是连接酶,所述连接酶包括但不限于选自以下的EC 6(连接酶)酶:EC 6.2.1.12(例如,4-香豆酸:辅酶A连接酶)和EC 6.3.2.28(例如,L-氨基酸α-连接酶)。
鉴于本说明书和以下实例,本发明的菌株和方法的这些和其他方面以及实施例对于技术人员是显而易见的。
实例
根据以下实例可以进一步理解本公开的某些方面,所述实例不应被解释为限制性的。材料和方法的修改对本领域技术人员而言是显而易见的。
实例1
lov基因被鉴别为丝状真菌蛋白质产生增加的原因
A.概述
在本实例中,特别开发了名为“B7ms1”的粘度降低的木霉属菌株,即表达葡糖淀粉酶(GA)的构建体,以降低在摇瓶条件下成球的倾向。更特别地,鉴别、分离了B7ms1的突变株(菌株),并命名为“B7ms1-SF12”。(突变)B7ms1-SF12菌株在发酵罐中的供给糖的蛋白质产率相对于B7ms1(亲代)菌株高40%(例如,参见图1)。
因此,如本文所述,对B7ms1-SF12(突变)菌株进行了基因组序列分析和遗传分析,以鉴别其中引起B7ms1-SF12(突变)菌株的观察到的(生产率增加)表型的一种或多种基因的一种或多种个突变。如本文所公开,确定了所鉴别的突变能改变(天然)LOV蛋白的编码序列,其中(天然)LOV蛋白(SEQ ID NO:2)的氨基酸(残基)位置813处高度保守的苏氨酸(T)(T813)改变(取代)为(变体)LOV蛋白的位置813处的赖氨酸(813K)(SEQ ID NO:4,即,T813K取代)(参见图2)。
B.开发策略
丝状真菌物种(例如木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、金孢霉属物种、头孢霉属物种、篮状菌属物种、疣青霉属物种、脉孢菌属物种、毁丝霉属物种等)是在用于商业/工业发酵时通常产生浓稠的粘性发酵肉汤的有氧真菌。高发酵(肉汤)粘度典型地会降低溶氧(DO)的转移,从而限制细胞团量,并降低在此类有氧丝状真菌发酵中可达到的体积生产率。例如,粘度降低的丝状真菌突变株的分离得到产生粘度较低的发酵肉汤的突变菌株/细胞,其中使用此类粘度降低的菌株/细胞的发酵可以利用更多的细胞团,从而增加蛋白质生产率(例如,参见申请人国际PCT公开号WO 2012/145584、WO 2012/027580、WO 2012/145595、WO 2012/145596和WO 2012/145592)。更特别地,当申请人开始组合某些粘度降低的突变以产生其粘度进一步降低的菌株时,惊讶地观察到,其某些粘度(降低)的组合(即,突变)似乎更倾向于在摇瓶测定中形成菌丝体球。
更特别地,如本文所设想,如果观察到的在摇瓶中形成菌丝体球的倾向增加可以放大至发酵罐,则申请人寻求借助于定向开发实验来减轻上述成球表型。例如,在不希望受任何特定理论、作用机制或方式约束的情况下,本文设想形成菌丝体球的此种倾向可能不利地影响蛋白质的产生和/或此类蛋白质的下游加工。因此,申请人合理地认为,可以产生、筛选并分离这些菌株的“开发的”突变株,其中此类开发的菌株包含在摇瓶、发酵罐、生物反应器等中降低的菌丝体成球倾向。
例如,使木霉属菌株B7ms1的培养物在含有完全复合培养基的摇瓶中生长12-24小时,然后通过70微米(μm)的筛子。根据细胞密度,使用流通液接种新鲜培养基,或者将整个流通液转移到新鲜的摇瓶中。孵育后,连续数周重复所述过程,偶尔采集样品,然后将其铺板以分离可能的突变株。根据摇瓶形态的总体变化(例如,摇瓶形态的变化,包括但不限于成球或菌丝体结块)(单独地)对分离株进行视觉筛选。另外测试了在摇瓶中具有较均匀生长的那些分离株在摇瓶中,然后在发酵罐中的蛋白质产生。
C.木霉属突变菌株B7ms1-SF12的分离和表征
在上述开发方案中,申请人分离了一株名为“B7ms1-SF12”的突变菌株,其中(突变)B7ms1-SF12菌株相对于(亲代)B7ms1菌株在摇瓶中表现出较高的蛋白质产生(数据未显示)。因此,与对上述成球表型的任何影响无关,提高宿主菌株的蛋白质产生表型的任何一种或多种突变在其降低发酵/蛋白质生产成本的潜力方面均具有特殊价值。
因此,测定了(亲代)B7ms1菌株和自发突变(子代)菌株B7ms1-SF12在发酵罐中的总蛋白产生。使这些菌株在深层(液体培养)中在相同条件下生长,并且在14L发酵罐中比较了其供给糖的总蛋白产率。如图1所呈现,突变B7ms1-SF12菌株(图1;黑色线/黑色方块)显示相对于(亲代)B7ms1菌株,供给糖的产率改进增加了44%(图1;灰色线/灰色方块)。
简言之,将每种菌株的孢子分别添加到具有侧面和底部挡板两者的3L烧瓶中的500mL培养基中。使培养物在振荡培养箱中在34℃下在基本培养基中生长48小时。48小时后,将每个烧瓶的内含物分别添加到含有9.5L培养基的14L发酵罐中,所述培养基含有4.7g/L KHPO、1.0g/L MgSO7HO、4.3g/L(NH)SO和2.5mL/L 400X里氏木霉微量元素溶液(柠檬酸(无水),175g/L;FeSO4·7H2O,200g/L,ZnSO4·7H2O,16g/L,CuSO4·5H2O,3.2g/L;MnSO4H2O,1.4g/L;H3BO3,0.8g/L)。将这些组分在121℃下一起加热灭菌30分钟。将60%葡萄糖和0.48%CaCl2·2H2O的溶液分别高压灭菌,冷却并添加到发酵罐中,使最终浓度为75g/L葡萄糖和0.6g/L CaCl2·2H2O。用28%NH将培养基调节至pH 3.5,并在生长期间将温度维持在34℃下。一旦葡萄糖耗尽,将温度降至28℃,并且向培养物中供给葡萄糖-槐糖。测量干细胞重量(DCW)、总蛋白浓度和其他参数,并计算比总蛋白产生速率和供给糖的产率。
D.木霉突变菌株B7ms1-SF12的成因性lov(T813K)突变的鉴别
申请人对(亲代)B7ms1菌株和(突变)B7ms1-SF12(子代)菌株的基因组进行了测序,从而鉴别出两(2)种新突变,这些突变预计会改变B7ms1-SF12基因组中的编码序列,这些突变中的单独任一种(或组合)可能为观察到的蛋白质生产率(改进)表型所必需。更特别地,为了确定/鉴别这些突变中的哪些是重要的,通过用编码每个野生型基因座的DNA转化(突变)B7ms1-SF12菌株来使用互补分析。例如,仅一种基因座在转化时互补了突变表型,所述基因座被称为lov。lov基因编码预测的蛋白质PID 50212(SEQ ID NO:2),其中在(突变)B7ms1-SF12菌株中,lov突变体(等位基因)在支架序列16上425393处包含由G(鸟嘌呤)变为T(胸腺嘧啶)的单个核苷酸变化,从而在编码的LOV(变体)蛋白(SEQ ID NO:4)中产生氨基酸取代T813K,所述突变等位基因在本文中称为等位基因“lov(T813K)”,并且天然(野生型)等位基因在本文中称为“lov(+)”。
文献中尚未对任何生物体的LOV蛋白或LOV蛋白直系同源物的功能表征进行描述。如本文所述,保守结构域分析(NCBI)鉴别出与糖基转移酶家族2组(pfam13632,E值3.25x10-44,例如参见图2中的“Glyco trans 2 3”远相关的(保守)区域。例如,原核蛋白的此(糖基转移酶)家族成员包括推定的葡糖基转移酶,其参与细菌荚膜生物合成(PFAM)。更特别地,具有(糖基转移酶)家族2组结构域的真菌蛋白“ZtGT2”,其与木霉属PID 79396直系同源(即,其不是LOV,PID 50212),对于在固体表面上的菌丝生长是重要的(King等人,2017)。
最令人惊讶的是,LOV蛋白在担子菌门和子囊菌门的丝状真菌中广泛保守。例如,在NCBI非冗余数据库的最前面的BLASTp搜索结果中,在木霉属和大多数与工业相关的丝状真菌所属的盘菌亚门中,(天然)LOV蛋白位置813处的苏氨酸(T)(即,如本文所公开,其突变为赖氨酸(K)是有益的)是高度保守的(691/691;100%)。来自这691个盘菌亚门同源物的Geneious多序列比对(www.geneious.com,Geneious 11.0,Biomatters有限公司)的图示如图2所呈现。同样,在MUSCLE多序列比对(Genetic软件包)中,在前1,000个BLASTp命中中,残基位置813在975/1000(97.5%)的命中中相同(即,T813),其中残基813从未出现赖氨酸(K)(即,本文所述的引起蛋白质生产率提高的取代在BLASTp鉴别的前1000个直系同源物中未发现)。尽管保守的位置和突变可用于改进真菌蛋白的产生,但是T813残基不在Genebank中先前注释的任何区域内(图2)。LOV蛋白是木霉属基因组中此类蛋白质的唯一预测成员,而许多基因组具有超过一种预测成员。
实例2
在粘度降低的菌株中靶向引入lov(T813K)等位基因增加了发酵罐中的蛋白质生产率
A.概述
为了进一步验证lov(T813K)等位基因是观察到的蛋白质生产率改进的原因,将lov(T813K)突变引入不同的里氏木霉菌株谱系(本文中称为“T4”)中。B7ms1(实例1)和T4谱系均为来自木霉属菌株RL-P37的不同菌株改进程序的诱变衍生物(Sheir-Neiss等人,1984;Montenecourt,1987)。T4菌株与B7ms1的显著不同之处在于,T4菌株表达纤维素酶的天然混合物,并含有增加总蛋白产生的nik1(M743T)突变(US20180037919)。与先前B7ms1谱系(实例1)一样,在存在或不存在lov(T813K)等位基因的两种T4谱系中产生了粘度降低的双重突变株(Δmpg1;Δseb1)。例如,在发酵罐中,包含lov(T813K)等位基因的T4Δmpg1;Δseb1菌株的供给糖的总蛋白产率平均高37%。
B.用pyr4或pyr2选择标记构建包含lov破坏盒的质粒
使用标准分子生物学程序制备木霉属lov破坏盒质粒,其中相关领域的技术人员可以根据本文公开的信息容易地重建此质粒。所述质粒包括具有1.6Kb同源盒的DNA序列,所述同源盒与对应于支架序列16426947至425393的DNA序列(左侧翼)相同。左侧翼的最后一个核苷酸引入了单个核苷酸由G变为T的突变,所述突变对应于(突变)B7ms1-SF12菌株中鉴别的突变(实例1)。质粒中还包括具有1.5Kb同源盒的DNA序列,所述同源盒与对应于支架序列16 425392至423880的DNA序列(右侧翼)相同。设计这些序列以靶向lov基因,并用插入的盒序列替换左翼与右翼之间的基因组的核苷酸(支架序列16,425393)。
此等插入(盒)序列包括来自里氏木霉的pyr4选择标记(pRATT308)或来自阿特罗德木霉(Trichoderma atroviride)的pyr2选择标记(pRATT312)。紧邻选择标记下游的是具有0.5Kb区域的DNA序列(重复序列),所述区域与左侧翼的最3'0.5Kb区域同源。这些重复序列预期会促进选择标记的后续缺失,从而使得可以在将来的菌株开发中使用此标记,并在编码LOV(T813K)蛋白(SEQ ID NO:4)的LOV基因中留下单个核苷酸由G变为T的突变(支架序列16,425393)作为仅有的新靶向基因组修饰。
C.开发具有lov(T813K)等位基因的T4衍生菌株
基本上如美国专利号9,725,727(通过引用以其全文并入本文)中所述开发了T4菌株的衍生物,所述衍生物在本文中命名为菌株“T4m”和“T4m_pyr2”,其包含基因mpg1的降低粘度的破坏(Δmpg1)。因此,使用PEG介导的转化,用来自pRATT312(pyr2选择标记)的lov破坏盒转化T4m_pyr2菌株(Δmpg1;pyr2),并铺在含有1.2M山梨糖醇的Vogel基本培养基(Vogel,1956)上,以基于由pyr2标记获得的尿苷原养型来选择候选株。木霉属转化是众所周知的,并且在本领域中已有描述(例如,参见美国专利号5,246,853)。分离出单独的转化体,并通过转移到Vogel基本培养基中进行繁殖。使用本领域技术人员已知的方法按照以下指南,使用PCR分析鉴别lov破坏盒通过同源重组整合在lov基因座处的转化体。
仅重组细胞的亚组可以成功地利用同源侧翼正确地靶向目的基因的破坏,因此可能需要筛选许多转化体来鉴别具有所需事件的转化体。可以使用PCR来测试哪些重组细胞具有所需的靶向破坏。必须设计在每个同源盒区域内扩增的引物,其中一个引物在可选择标记内距最接近末端大于100bp的位置起始,并且其他引物在相邻基因组序列内超出同源盒区域的末端大于100bp的位置起始。可能含有正确的靶向破坏的细胞将成功建立跨越破坏盒左侧翼和右侧翼的PCR产物,而失败的转化事件将不会产生预期大小的产物。在此阶段,培养物可能是转化细胞和未转化细胞的混合物,因此可能需要纯化步骤。可以通过PCR针对跨越破坏位点的短PCR产物的缺失测试培养物的纯化。
更特别地,鉴别、分离了一株此种包含lov基因的pyr2破坏的T4m衍生菌株,并命名为“T4ml+”(即,与编码特定T813K取代的等位基因lov(T813K)相对比,其包含等位基因lov(dis))。因此,为了产生包含特定lov(T813K)等位基因的菌株,将菌株T4ml+(包含lov(dis)等位基因)的孢子悬浮液铺在含有5-氟乳清酸(FOA)的培养基上,以选择如下衍生菌株,其中在插入的选择标记侧翼的重复区域之间存在自发重组,并伴随选择标记自基因组缺失。分离尿苷营养缺陷型,并且通过PCR以测试选择标记的缺失,并对PCR产物进行测序以证实lov(T813K)等位基因的存在来分析。以此方式产生了一种包含lov(T813K)等位基因的菌株,并且在本文中称为“T4ml”。为了恢复嘧啶原养型以进行发酵罐评价,使T4ml和T4m_pyr2两种菌株的pyr2标记靶向粘度降低基因座seb1,基本上如美国专利号9,725,727所述,从而得到本文中称为“T4mls”(包含lov(T813K)等位基因)和“T4ms”(包含lov(+)等位基因)的菌株。
D.包含lov(T813K)等位基因的T4衍生菌株的发酵罐评价
因此,如实例1中所述,在发酵罐中评价了菌株T4mls(包含lov(T813K)等位基因)和T4ms(包含lov(+)等位基因)。另外,通过调节进料开始前提供的葡萄糖的量来在相对于实例1较低的细胞密度发酵下评价T4mls和T4ms菌株,以确保用lov(T813K)等位基因观察到的蛋白质产生表型不限于较高细胞密度发酵。如图3所示,在较低细胞密度(LCD;图3,T4mls,黑色圆圈/黑色虚线;T4ms,灰色圆圈/灰色虚线)发酵条件与较高细胞密度(HCD;图3,T4mls,黑色方块/黑色实线;T4ms,灰色方块/灰色实线)发酵条件下,当存在lov(T813K)等位基因时,供给糖的蛋白质产率分别增加42%和32%。
实例3
通过插入未能在发酵罐中改进生产率的pyr2选择标记来靶向破坏lov基因
A.概述
鉴于(天然)LOV蛋白(SEQ ID NO:2)的残基813位置处的苏氨酸(T)氨基酸高度保守,以会阻断LOV蛋白的表达/产生的任何方式破坏所述基因座似乎有可能也改进菌株的生产率。为了测试此假设,在发酵罐中比较了具有和不具有lov(dis)等位基因的真菌菌株,其中将pyr2选择标记插入lov基因中以破坏LOV蛋白表达。令人惊讶地,lov(dis)等位基因未改进发酵罐中的产生。
B.具有lov(dis)等位基因的菌株的发酵罐评价
T4m和T4ml+菌株的开发如上在实例2中所述。菌株T4ml+是T4m的衍生物,其中将pyr2标记插入菌株T4m_pyr2的lov编码序列中。在相同条件下评价14L发酵罐中的T4m和T4ml+菌株,所述发酵罐与实例1中所述基本上相同,但处于较低的细胞密度发酵下,这通过调节进料开始前提供的葡萄糖的量获得。
基本上如美国专利号9,725,727中所述开发了T4的衍生物,所述衍生物命名为“T4s”和“T4s_pyr2”(包含基因seb1的粘度降低破坏)。类似于实例2中对于菌株T4m_pyr2所述,将lov(dis)等位基因引入T4s_pyr2中,以产生菌株T4sl+。因此,在相同条件下,在2L生物反应器中评价了T4s和T4sl+菌株。具体地,对于2L生物反应器,为了产生种子培养物,将每种菌株的孢子分别添加到250mL烧瓶中的50mL柠檬酸盐基本培养基中。将培养物在振荡培养箱中在30℃和170rpm下生长48h。48小时后,用种子培养物接种调节至pH 3.5的145.6mL的50%葡萄糖和0.6g/kg的CaCl2。此后,将温度维持在34℃,并且将pH维持在3.5。分批葡萄糖耗尽后,之后引入葡萄糖-槐糖进料,并将温度降至25℃,pH增加至4.8。测量干细胞重量(DCW)、总蛋白浓度和其他参数,并计算比总蛋白产生速率和供给糖的产率。如图4所示,当lov(dis)突变存在于T4m背景下时,供给糖的蛋白质产率降低了17%,而当存在于T4s背景下时则没有变化。
实例4
在其他真菌菌株中靶向引进lov(T813K)等位基因改进了蛋白质生产率
A.概述
在实例2中,通过在seb1基因座处整合pyr2标记来恢复伴随等位基因lov(T813K)产生和标记缺失产生的pyr2营养缺陷型。因此,早已在实例1和实例2中,在总是同时含有mpg1和seb1粘度突变的菌株中例证了用lov(T813K)等位基因观察到的蛋白质产生的改进。为了证明lov(T813K)等位基因用于改进菌株生产率的更一般应用,将pyr2标记整合到三个其他方便的基因组位置处:位点A、位点B和位点C。在摇瓶中评价了这些不同菌株的蛋白质产生,其中在所有情况下,lov(T813K)突变的存在相对于具有野生型lov(+)等位基因的同基因菌株改进了总蛋白产生。相反地,包含lov(dis)突变的菌株在摇瓶中的蛋白质产生未显示出显著改进。
B.通过在不同基因组位置靶向整合pyr2选择标记,在T4ml和T4sl中恢复嘧啶营养缺陷型
使用本领域技术人员已知的方法,用将pyr2靶向整合到名为位点A-C的三个方便基因组位置的盒独立地转化具有或不具有lov(T318K)等位基因的菌株。简言之,在用pyr2盒进行PEG介导的转化后,将原生质体铺在含有1.2M山梨糖醇的Vogel基本培养基上,以基于由pyr2标记获得的尿苷原养型选择候选基因。分离出单独的转化体,并通过转移到Vogel基本培养基中进行繁殖。使用PCR分析鉴别pyr2盒整合在预期基因组位置处的转化子。孢子纯化后,进行进一步PCR分析以确保正确地发生整合并且转化体是同核的。
因此,将pyr2标记整合在pyr2突变菌株T4m_pyr2(lov(+))和T4ml(Δmpg1;lov(T318K))中位点A、位点B和位点C处,这在实例2中进行了描述(参见表1)。同样,将pyr2标记整合在突变菌株T4s_pyr2(Δseb1;lov(+))和T4sl(Δseb1;lov(T318K))中位点A处,这在实例3中进行了描述。另外,如实例2中所述分别使用质粒pRATT312和pRATT308将破坏等位基因lov(dis)添加到全纤维素酶菌株T4_pyr2(pyr2;lov(+))和41G_pyr4(pyr4;lov(+))中。
C.具有和不具有lov(T813K)或lov(dis)等位基因的菌株的摇瓶评价
在摇瓶发酵中评价了菌株的蛋白质产生。表1列出了所评价的菌株。在测试的所有遗传背景中,当存在lov(T813K)等位基因时,总蛋白滴度增加。但是,用pyr4(41G)或pyr2标记(T4和T4m)破坏lov基因lov(dis)等位基因未显示相对滴度显著改进。
液体限定(LD)培养基(例如,参见美国专利号8,455,631)含有以下组分。酪蛋白氨基酸,9g/L;(NH4)2SO4,5g/L;MgSO4·7H2O,1g/L;KH2PO4,4.5g/L;CaCl2·2H2O,1g/L,PIPPS,33g/L,400×里氏木霉微量元素,2.5ml/L;用NaOH将pH调节至5.5。灭菌后,添加乳糖或葡萄糖/槐糖混合物至最终浓度为1.6w/v%。
为了产生种子培养物,将每种菌株的孢子分别添加到250mL烧瓶中的50mL的YEG(5g/L酵母提取物、22g/L葡萄糖、H2O)中。将培养物在振荡培养箱中在28℃和200rpm下生长36-48小时。孵育后,将0.3mL种子培养物添加到带挡板的摇瓶中的50mL LD培养基中。使此生产培养物在28℃和180rpm下生长5天。藉由离心使细胞成球,然后收集上清液来收获分泌的蛋白质。用等体积的三氯乙酸(TCA)从上清液中沉淀出蛋白质,随后溶解在0.1N氢氧化钠(NaOH)中。然后按照制造商的方案,用BCA蛋白质测定(美国纽约州格兰德岛赛默飞世尔科学公司(ThermoFisher Scientific,Grand Island,N.Y.,USA))测量总蛋白。在所有摇瓶实验中,包括双份的原养型T4和T4m菌株。将BCA测定数值标准化为平行操作的这些对照的平均值,以使对总蛋白产生效率的任何周间变化的影响达最小。
如图5所示,除了上文例证的在生物反应器中的T4ms背景(实例2)之外,当lov(T813K)突变存在于T4mc(位点C)、T4md(位点B)、T4mp(位点A)和T4sp(位点A)背景中时,蛋白质滴度增加。相反地,包含破坏lov基因(即,等位基因lov(dis))的pyr2标记或pyr4标记的插入的遗传背景41G、T4和T4m未显示在摇瓶中蛋白质产生显著改进。
D.具有和不具有lov(T813K)等位基因的菌株T4mp的发酵罐评价
如实例1所述,进一步在14L发酵罐中评价了这些菌株T4mp和T4mlp(在位点A处插入pyr2)中的一个对,但在较低的细胞密度下。如图6所示,在lov(T813K)等位基因存在下,此遗传背景显示供给糖的总蛋白产率增加了28%。
参考文献
PCT申请序列号PCT/US 2019/27590
PCT国际公开号WO 1992/06183
PCT国际公开号WO 1992/06209
PCT国际公开号WO 1992/06221
PCT国际公开号WO 1998/15619
PCT国际公开号WO 2002/12465
PCT国际公开号WO 2005/028636
PCT国际公开号WO 2006/074005
PCT国际公开号WO 2012/027580
PCT国际公开号WO 2012/145584
PCT国际公开号WO 2012/145592
PCT国际公开号WO 2012/145595
PCT国际公开号WO 2012/145596
PCT国际公开号WO 2012/145598
PCT国际公开号WO 2016/100272
PCT国际公开号WO 2016/100562
PCT国际公开号WO 2016/100568
PCT国际公开号WO 2016/100571
PCT国际公开号WO 2016/130523
美国专利号5,246,853
美国专利号8,455,631
美国专利号9,725,727
美国专利公开号US 2018/0037919
Altschul et al.,J.Mol.Biol.215:403-10,1990.
Altschul et al.,Meth.Enzymol.266:460-80,1996.
Ausubel et al.,“Current Protocols in Molecular Biology”,Eds.,JohnWiley&Sons,Inc.,1995,sections 2,4 and 6.
Botstein and Shortle,Science 229:4719,1985.
Church and Gilbert,“Genomic Sequencing”,PNAS,U.S.A.,81,1991-1995,1984.
Devereux et al.,Nucleic Acids Res.12:387-95,1984.
Henikoff and Henikoff,Proc.Natl.Acad.Sci.USA 89:10915,1989.
Higgins and Sharp,CABIOS 5:151-53,1989.
Higgins et al.,Gene 73:237-244,1998.
Higuchi et al.,Nucleic Acids Research 16:7351,1988.
Ho et al.,Gene 77:61,1989.
Hopwood,The Isolation of Mutants in Methods in Microbiology(J.R.Norris and D.W.Ribbons,eds.)pp 363-433,Academic Press,New York,1970.
Horton et al.,Gene 77:61,1989.
Iglesias and Trautner,Molecular General Genetics 189:73-76,1983.
Karlin et al.,Proc.Natl.Acad.Sci.USA 90:5873-87,1993.
King et al.,“A conserved fungal glycosyltransferase facilitatespathogenesis of plants by enabling hyphal growth on solid surfaces”,PLoSPathology,13(10),1-26,2017.
Lo et al.,Proceedings of the National Academy of Sciences USA 81:2285,1985.
Montenecourt B.S.,Can.,1-20,1987.
Needleman and Wunsch,J.Mol.Biol.,48:443,1970.
Parish and Stoker,FEMS Microbiology Letters 154:151-157,1997.
Perego,1993,In A.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillussubtilis and Other Gram-Positive Bacteria,Chapter 42,American Society ofMicrobiology,Washington,D.C.
Sambrook et al.,“Molecular Cloning:A Laboratory Manual”,Cold SpringHarbor Press,Cold Spring Harbor,N.Y.(1989),chapters 7,9 and 11.
Sarkar and Sommer,BioTechniques 8:404,1990.
Sheir-Neiss et al.,Appl.Microbiol.Biotechnology,20:46-53,1984.
Shimada,Meth.Mol.Biol.57:157;1996.
Smith and Waterman,Adv.Appl.Math.2:482,1981.
The Genome Portal of the Department of Energy Joint Genome Institute,I.V.Grigoriev,H.Nordberg,I.Shabalov,A.Aerts,M.Cantor,D.Goodstein,A.Kuo,S.Minovitsky,R.Nikitin,R.A.Ohm,R.Otillar,A.Poliakov,I.Ratnere,R.Riley,T.Smirnova,D.Rokhsar,and I.Dubchak,Nucleic Acids Res.,2011 0:gkr947v1-gkr947.
Vogel,Microbiol.Genet.Bull.13:42-43,1956.
Wisconsin Genetics Software Package(Genetics Computer Group,Madison,WI)
Youngman et al.,Proc.Natl.Acad.Sci.USA 80:2305-2309,1983.
Claims (25)
1.一种衍生自亲代细胞的修饰的子囊菌门细胞,所述修饰的细胞包含编码变体LOV蛋白的多核苷酸序列,所述变体LOV蛋白与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基,其中当在相同条件下发酵时,所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。
2.如权利要求1所述的修饰的细胞,所述修饰的细胞包含编码目的蛋白(POI)的多核苷酸。
3.如权利要求1所述的修饰的细胞,所述修饰的细胞包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸构建体。
4.如权利要求1-3中任一项所述的修饰的细胞,所述修饰的细胞包含至少一种遗传修饰,所述遗传修饰缺失、破坏或减少了选自由SSB7、MPG1 SFB3、SEB1、CRZ1、TSP2和/或GAS1组成的组的蛋白质的表达/产生。
5.如权利要求1-4中任一项所述的修饰的细胞,其中所述子囊菌门细胞选自木霉属物种(Trichoderma sp.)、曲霉属物种(Aspergillus sp.)、镰刀菌属物种(Fusarium sp.)、青霉属物种(Penicillium sp.)、假丝酵母属物种(Candida sp.)、金孢霉属物种(Chrysosporium sp.)、头孢霉属物种(Cephalosporium sp.)、篮状菌属物种(Talaromycessp.)、脉孢菌属物种(Neurospora sp.)和毁丝霉属物种(Myceliophthora sp.)。
6.如权利要求5所述的修饰的细胞,其中亲代曲霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:11或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
7.如权利要求5所述的修饰的细胞,其中亲代青霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:12或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
8.如权利要求5所述的修饰的细胞,其中亲代篮状菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:13或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
9.如权利要求5所述的修饰的细胞,其中亲代镰刀菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:14或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
10.如权利要求5所述的修饰的细胞,其中亲代毁丝霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:15或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
11.如权利要求5所述的修饰的细胞,其中亲代脉孢菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:16或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
12.如权利要求5所述的修饰的细胞,其中亲代假丝酵母属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
13.如权利要求5所述的修饰的细胞,其中亲代木霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:2或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。
14.一种POI,所述POI由如权利要求1-13中任一项所述的修饰的细胞产生。
15.一种衍生自包含野生型多核苷酸序列的亲代细胞的修饰的子囊菌门细胞,所述野生型多核苷酸序列在严格杂交条件下与编码SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18的天然LOV蛋白的核酸序列杂交,且所述天然LOV蛋白在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基,其中所述修饰的细胞包含修饰的多核苷酸序列,所述修饰的多核苷酸序列在严格杂交条件下与编码SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ IDNO:18的LOV蛋白的核酸序列杂交,且所述LOV蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
16.一种载体,所述载体包含编码变体LOV蛋白的多核苷酸,所述变体LOV蛋白与SEQ IDNO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
17.一种编码变体LOV蛋白的多核苷酸,所述变体LOV蛋白与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
18.一种编码变体LOV蛋白的多核苷酸,其中编码所述变体蛋白的所述多核苷酸在严格杂交条件下与编码SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18的LOV蛋白的核酸序列杂交,且所述LOV蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
19.一种衍生自亲代菌株的突变木霉属菌株,其中所述突变菌株包含编码LOV变体蛋白的基因,所述LOV变体蛋白与SEQ ID NO:4或SEQ ID NO:18具有至少75%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。
20.如权利要求18所述的突变菌株,其中相对于所述亲代菌株,所述突变菌株包含蛋白质生产率提高表型。
21.如权利要求18或权利要求19所述的突变菌株,所述突变菌株包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸构建体。
22.如权利要求18-20中任一项所述的突变菌株,所述突变菌株包含如下遗传修饰,所述遗传修饰缺失、破坏或减少了编码至少一种选自由SSB7、MPG1 SFB3、SEB1、CRZ1、TSP2和GAS1组成的组的蛋白质的基因的表达/产生。
23.一种POI,所述POI由如权利要求18-21中任一项所述的突变菌株产生。
24.一种用于构建包含蛋白质生产率提高表型的修饰的子囊菌门细胞的方法,所述方法包括:
(a)获得亲代子囊菌门细胞并将编码LOV变体蛋白的多核苷酸构建体引入所述细胞中,所述LOV变体蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基,和
(b)分离步骤(a)的修饰的细胞,
其中所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。
25.一种用于构建包含蛋白质生产率提高表型的修饰的子囊菌门细胞的方法,所述方法包括:
(a)获得包含野生型lov基因的亲代细胞,所述lov基因在严格杂交条件下与编码SEQID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17或SEQ ID NO:18的LOV蛋白的核酸序列杂交,
(b)修饰步骤(a)的亲代细胞以产生包含编码LOV(变体)蛋白的基因的修饰的细胞,所述LOV(变体)蛋白在对应于SEQ ID NO:2的位置813的序列位置处包含赖氨酸(K)残基,以及
(c)分离步骤(b)的修饰的细胞,
其中所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862711846P | 2018-07-30 | 2018-07-30 | |
US62/711,846 | 2018-07-30 | ||
PCT/US2019/043348 WO2020028126A1 (en) | 2018-07-30 | 2019-07-25 | Mutant and genetically modified filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112654704A true CN112654704A (zh) | 2021-04-13 |
Family
ID=67539643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980049956.1A Pending CN112654704A (zh) | 2018-07-30 | 2019-07-25 | 包含蛋白质生产率提高表型的突变和遗传修饰的丝状真菌菌株及其方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US12116605B2 (zh) |
EP (1) | EP3830257A1 (zh) |
JP (1) | JP2021532775A (zh) |
KR (1) | KR20210038591A (zh) |
CN (1) | CN112654704A (zh) |
WO (1) | WO2020028126A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024137350A2 (en) | 2022-12-19 | 2024-06-27 | Danisco Us Inc. | Recombinant fungal strains and methods thereof for producing consistent proteins |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103502431A (zh) * | 2011-04-22 | 2014-01-08 | 丹尼斯科美国公司 | 具有粘度改变表型的丝状真菌 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5246853A (en) | 1990-10-05 | 1993-09-21 | Genencor International, Inc. | Method for treating cotton-containing fabric with a cellulase composition containing endoglucanase components and which composition is free of exo-cellobiohydrolase I |
WO1992006221A1 (en) | 1990-10-05 | 1992-04-16 | Genencor International, Inc. | Methods for treating cotton-containing fabrics with cellulase |
DK0553280T4 (da) | 1990-10-05 | 2010-11-15 | Genencor Int | Fremgangsmåde til behandling af bomuldsholdige tekstiler med cellulase |
WO1992006183A1 (en) | 1990-10-05 | 1992-04-16 | Genencor International, Inc. | Methods for treating cotton-containing fabrics with cellulase |
US6017870A (en) | 1996-10-09 | 2000-01-25 | Genencor International, Inc. | Purified cellulase and method of producing |
DK1305432T3 (da) | 2000-08-04 | 2010-12-06 | Genencor Int | Muterede trichoderma reesei EGIII-cellulaser, DNA, der koder for sådanne EGIII-sammensætninger og fremgangsmåder til at frembringe samme |
CN1898381B (zh) | 2003-03-21 | 2013-07-17 | 金克克国际有限公司 | Cbh1同源物和cbh1纤维素酶变体 |
MX2007007854A (es) | 2004-12-30 | 2007-08-17 | Genencor Int | Nuevas variantes de celulasas cbh2 de hypocrea jecorina. |
CA2699201C (en) | 2007-09-12 | 2017-04-18 | Danisco Us Inc. | Trichoderma promoter |
US10266832B2 (en) | 2010-08-25 | 2019-04-23 | Danisco Us Inc | Filamentous fungi having an altered viscosity phenotype |
DK2699667T3 (en) * | 2011-04-22 | 2016-08-01 | Danisco Us Inc | Filamentous fungi with an altered VISCOSITETSFÆNOTYPE |
JP6725513B2 (ja) | 2014-12-16 | 2020-07-22 | ダニスコ・ユーエス・インク | ヘルパー株媒介型真菌ゲノム改変用の組成物および方法 |
AU2015362784B2 (en) | 2014-12-16 | 2021-05-13 | Danisco Us Inc | Fungal genome modification systems and methods of use |
MX2017009937A (es) | 2015-02-09 | 2017-11-28 | Danisco Us Inc | Cepas fungicas y metodos de uso. |
-
2019
- 2019-07-25 CN CN201980049956.1A patent/CN112654704A/zh active Pending
- 2019-07-25 US US17/264,061 patent/US12116605B2/en active Active
- 2019-07-25 WO PCT/US2019/043348 patent/WO2020028126A1/en unknown
- 2019-07-25 EP EP19749547.6A patent/EP3830257A1/en active Pending
- 2019-07-25 KR KR1020217005248A patent/KR20210038591A/ko not_active Application Discontinuation
- 2019-07-25 JP JP2021505302A patent/JP2021532775A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103502431A (zh) * | 2011-04-22 | 2014-01-08 | 丹尼斯科美国公司 | 具有粘度改变表型的丝状真菌 |
Non-Patent Citations (4)
Title |
---|
FEI ZHANG等: "Improvement of cellulase production in Trichoderma reesei Rut-C30 by overexpression of a novel regulatory gene Trvib-1", BIORESOURCE TECHNOLOGY, vol. 247, pages 676 - 683 * |
MONIKA SCHMOLL等: "Envoy, a PAS/LOV Domain Protein of Hypocrea jecorina (Anamorph Trichoderma reesei), Modulates Cellulase Gene Transcription in Response to Light", EUKARYOTIC CELL, vol. 4, no. 12, pages 1998, XP055615560, DOI: 10.1128/EC.4.12.1998-2007.2005 * |
NCBI: "GenBank登录号:XP_006967324.1", NCBI GENBANK, pages 1 - 894 * |
李阜棣,胡正嘉主编: "微生物学(第六版)", 29 February 2008, 中国农业出版社, pages: 181 - 184 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020028126A1 (en) | 2020-02-06 |
JP2021532775A (ja) | 2021-12-02 |
EP3830257A1 (en) | 2021-06-09 |
KR20210038591A (ko) | 2021-04-07 |
US12116605B2 (en) | 2024-10-15 |
US20210301276A1 (en) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020508072A (ja) | バチルス・リケニフォルミスにおける増加したタンパク質産生のための組成物及び方法 | |
CN113366108A (zh) | 新颖启动子序列及其增强芽孢杆菌属细胞蛋白生产的方法 | |
JP7285780B2 (ja) | 誘導基質の非存在下における糸状菌細胞内でのタンパク質の産生 | |
JP7376505B2 (ja) | 粘性が低下した表現型を含む糸状菌株 | |
CN111670244B (zh) | 突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产生的方法 | |
EP3384002A1 (en) | Method of producing proteins in filamentous fungi with decreased clr2 activity | |
KR20140033048A (ko) | 변경된 점성 표현형을 갖는 사상균 | |
JP2023524334A (ja) | バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法 | |
EP4055177B1 (en) | Fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
US20230174998A1 (en) | Compositions and methods for enhanced protein production in filamentous fungal cells | |
EP3384003A1 (en) | Method of producing proteins in filamentous fungi with decreased clri activity | |
US10023872B2 (en) | Methods for producing heterologous polypeptides in mutants of trichoderma | |
US12116605B2 (en) | Mutant and genetically modified filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
CN115335503A (zh) | 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法 | |
WO2024102556A1 (en) | Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
KR20240110854A (ko) | 진균 세포에서의 향상된 단백질 생산을 위한 조성물 및 방법 | |
CN117716039A (zh) | 用于增强真菌细胞中的蛋白质产生的组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |