KR102092422B1 - 유전자 조작된 미생물로부터 뮤콘산의 생산 - Google Patents
유전자 조작된 미생물로부터 뮤콘산의 생산 Download PDFInfo
- Publication number
- KR102092422B1 KR102092422B1 KR1020147024229A KR20147024229A KR102092422B1 KR 102092422 B1 KR102092422 B1 KR 102092422B1 KR 1020147024229 A KR1020147024229 A KR 1020147024229A KR 20147024229 A KR20147024229 A KR 20147024229A KR 102092422 B1 KR102092422 B1 KR 102092422B1
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- delete delete
- cis
- leu
- ala
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0014—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
- C12N9/0016—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with NAD or NADP as acceptor (1.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1022—Transferases (2.) transferring aldehyde or ketonic groups (2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01025—Shikimate dehydrogenase (1.1.1.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01054—3-Deoxy-7-phosphoheptulonate synthase (2.5.1.54)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01118—3-Dehydroshikimate dehydratase (4.2.1.118)
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은, 재생가능한 탄소원을 유용한 화합물로 전환하는 능력을 증대시키기 위해 유전적으로 조작되는 생촉매를 이용하여 재생가능한 화학적 공급 원료를 생산하는 분야에 관한 것이다. 더 구체적으로, 본 발명은 유전적으로 개질된 유기체를 사용하여 재생가능한 탄소원으로부터 뮤콘산을 생산하기 위한 공정을 제공한다.
Description
본원은 2012년 1월 30일에 출원된 미국가출원번호 제61/632,777호에 대한 우선권을 주장한다.
본원은 재생 가능한 탄소원을 유용한 화합물로 전환하는 능력을 향상시키도록 유전자 조작된 생촉매를 사용하여 재생 가능한 화학물질 공급 원료을 생산하는 분야에 속한다. 더 구체적으로, 본 발명은 유전자 조작된 생촉매를 사용하여 재생 가능한 탄소원으로부터 뮤콘산 이성질체를 생산하는 공정을 제공한다.
아디프산은 나일론 66(Nylon 66)의 제조에서 사용된 대용량의 화학물질이다. 아디프산은 석유화학물질로부터 현재 만들어지지만, 합성은 환경친화적이지 못하다(Niu 등, 2002). 대안으로, 아디프산은 화학적 수소화에 의해 뮤콘산의 세 개의 이성질체(시스, 시스; 시트, 트랜스; 트랜스, 트랜스)들 중 어느 것으로부터 만들어질 수 있다. 재생 가능한 공급원을 미생물과 함께 발효하여 뮤콘산을 생산하고, 이어서 수소화하여 아디프산을 생산하는 것이 바람직한데, 그 이유는 이러한 아디프산을 제조하는 경로는 종래의 석유화학적 경로에 비해 더 환경 친화적이기 때문이다.
뮤콘산의 미생물학적 생산(microbial productiopn)에 대한 현재 노력은 세 개의 카테고리로 그룹화할 수 있다: (1) 다양한 방향족 화합물이 공급되고, 방향족의 벤젠 고리 부분이 산화되어 고리가 열리는, 뮤콘산 생산을 위한 대한 방향족 분해 경로; (2) 뮤콘산 백본(backbone)이 다양한 C2, C3, C4, 화합물 또는 리신으로 축적되는, 뮤콘산염 축적 경로; 및 (3) 뮤콘산이 많은 유기체에서 방향족 아미노산 생합성 경로의 중간체인 3-디히드로쉬키메이트(3-dehydroshikimate)로 만들어지는, 방향족 아미노산 생합성 뮤콘산 경로.
많은 미생물들은 방향족 고리를 분해하는 경로를 사용하여 페놀, 카테콜, 및 벤조산과 같은 벤젠고리를 함유하는 방향족 화합물을 분해하여, 시스, 시스-뮤콘산, 또는 3-카복시-시스, 시스-뮤콘산과 같은 비-방향족 화합물인 최종 또는 중간체 화합물을 만들었다(Niu 등, 2002; Perez-Pantoja 등, 2008). 과거에는, 많은 그룹들이 공업적 수준의 시스, 시스-뮤콘산의 생산에서 미생물의 이런 능력을 개발하려고 시도되어왔다(Mizuno 등, 1988; Yoshikawa 등, 1990; Choi 등, 1997). 1980년대 후반에는, 미국의 Celgene Corporation 및 일본의 Mitsubishi Chemical Industries는 톨루엔 및 벤조산 각각으로부터 뮤콘산을 제조하기 위한 공정을 개발하는데에 적극적이었으며, 이는 이 분야에서 많은 등록된 미국 및 일본 특허가 증명한다.
많은 미생물들은 톨루엔, 벤조산, 벤젠 또는 카테콜을 사용하여 시스, 시스-뮤콘산을 제조하는 것으로 보고되어 왔다. 예를 들어, 탄소원으로서 카테콜과 함께, 시스, 시스-뮤콘산 생산은 catA 유전자를 발현하는 재조합 대장균 세포를 사용하여 거의 100% 몰 전환 수율이 달성될 수 있으며, 상기 catA 유전자는 생촉매로서 카테콜의 오쏘-절단을 촉매하는 슈도모나스 푸티다(Pseudomonas putida) mt-2 카테콜 1,2-디옥시게나아제(Pseutomonas putida mt-2 catechol 1,2-dioxygenase)를 인코딩한다(Kaneko 등, 2011). 이런 시스템을 사용하는 뮤콘산의 연속적 생산을 위한 생물 반응 장치가 설명됐다.
고리형 C6 탄소 화학반응을 사용하는 시스, 시스-뮤콘산의 미생물학적 생산의 접근법은 전혀 상업적 현실화를 이루지 못했지만; 미생물에서 뮤콘산 생산을 위한 분해 경로에 있어서 효소의 기능을 이해하는데에 지속적인 학구적 관심이 있어왔다.
최근에, 공개된 국제출원공개 WO2011/017560은 뮤코네이트 경로를 갖는 생촉매 및 이러한 생촉매를 사용하는 뮤콘산 생산 방법을 청구한다. 간략하게는, 이런 공개된 특허출원은 뮤콘산을 생산하기 위한 4가지 다른 경로를 개시한다. 뮤콘산 생산을 위한 제1 경로는 숙시닐-Coa 및 아세틸-Coa와 함께 시작된다. 뮤콘산 생산을 위한 제2 경로는 피루베이트 및 말로네이트 세미알데히드와 함께 개시된다. 뮤콘산 생산을 위한 제3 경로는 피루베이트 및 숙신산 세미알데히드와 함께 시작한다. 뮤콘산 생산을 위한 제4 경로는 리신과 함께 시작한다. 본원에서 제안된 뮤콘산 생산을 위한 모든 이러한 경로는 컴퓨터 모델링에 기초하고, 이러한 생촉매들이 뮤콘산에 대해 상업적으로 용인되는 생산성 및 수율을 만들어 낼 수 있는지에 대해 아직 밝혀지지 않았다.
유전자 조작된 대장균 시스템을 사용하는 시스, 시스-뮤콘산으로의 발효 경로는 과학 논문(Niu 등, 2002) 및 특허문헌(US 5,616,496; US5,487,987; WO2011/085311 A1)에서 설명되지만, 선행기술의 공정들은 상업적으로 매력적이기 위하여 역가, 수율, 및 대규모의 상업적 생산에 대한 적합성에 관하여 실질적으로 개선될 필요성이 있다. 글루코오스로부터 시스, 시스-뮤콘산을 생산하기 위해 유전자 조작되된 사카로미세스 세레비시아(Saccharomyces cerevisiae) 효모에 대한 2개의 보고서가 있지만, 공개된 역가는 단지 1.5 mg/l 및 140 mg/l였다(Weber 등, 2012; Curran 등, 2012). 이러한 역가에서, 이러한 효모 공정들 중 어느 것도 상업적 생산에 매력적이지 않다. 본 발명은 당해 분야에 잘 알려진 공개된 공정과 비교할 때 대규모의 상업적 생산성에 대한 적합성 측면에서 실질적으로 개선된 발효에 의해 시스, 시스-뮤콘산 또는 시스, 트랜스-뮤콘산을 생산하는 공정을 설명한다.
본원에 개시된 발명의 목적들 중 하나는, 광합성 식물로부터 유래될 수 있는 당 또는 다른 간단한 탄소 화합물과 같은 재생 가능한 비-방향족 탄소원으로부터 대규모의 상업적 생산에 적합한 유전자 조작된 유기체를 사용하는 미생물의 발효에 의해 시스, 시스-뮤콘산을 생산하는 것이다.
2002년에, Nie 등은 아디프산을 생산하기 위한 "벤젠 없는" 경로를 개시하는데, 상기 경로는 시스, 시스-뮤콘산을 생산하기 위한 발효 공정을 사용한 후, 시스-시스-뮤콘산을 아디프산으로 전화하기 위한 촉재적 화학 공정을 사용했다. 이 공정은 특허받았지만, 본 발명자들도 아는 바와 같이, 이 공정은 상업화되지 않았다(US 5, 487,987; US 5,616,496). 이런 공개된 공정의 발효 부분은 유전자 조작된 대장균 균주를 사용했으며, 가장 좋은 것은 WN1/pWN2.248로 이름지어졌다. 경로는 자생 방향족 아미노산 생합성 경로("쉬킴산 경로(shikimic acid pathway)", "쉬키메이트 경로(shikimate pathway)", "코리스메이트 경로(chorismate pathway)", 또는 간단히 "방향족 경로"로도 알려져 있음)의 일부를 사용하며, 그 일부는 도 1에 도시된다. 본원에서, 유기체에 공급된 탄소원, 예를 들어 글루코오스로부터 하류에 있고 코리스메이트로 직접 또는 간접적으로 안내하는 임의의 생화학적 단계는, 쉬킴산 경로의 일부, 예를 들어 Glf, Glk, Zwf, TktA, TalB 및 Pps에 의해 촉매되는 단계를 포함하는 경로로서 여겨진다. 또한, 공개된 공정은 3-디히드로쉬키메이트(방향족 경로에서의 중간체)를 중간체 프로토카테추에이트(protocatechuate) 및 카테콜을 통해 시스, 시스-뮤콘산으로 전환하는 세개의 이종 효소를 사용한다. 유전자 조작된 숙주 균주는 aroE353, serA::(aroB, aroZ), lacZ::(tktA, aroZ)의 유전형을 갖는 대장균 K-12의 유도체이며, aroB는 3-디히드로퀴네이트 합성효소(이하, AroB로 칭함)를 인코딩하고, tktA는 트랜스케토라아제(transketolase)를 인코딩하고, 및 aroZ는 3-디히드로쉬키메이트 탈수효소를 인코딩하는 폐렴간균(Klebsiella pneumoniae)으로부터의 이종 유전자이다(이하, "AroZ"로 칭함). 유전자 조작된 균주는 pBR322로부터 유도된 다중복제 플라스미드, pWN2.248을 함유하고, catA, catX, aroY, aroF (피드백 내성), serA, lacI q , 및 암피실린 내성을 발현하는 유전자 카셋(cassettes)을 함유한다. 이종 유전자 catA 및 catX는 아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus)로부터 유래되고, 카테콜 1,2-디옥시게나아제(이하, "CatA"로 칭함)를 인코딩하고, CatA 활성을 향상시킬 수 있는 알려지지 않은 기능의 단백질("CatX")을 인코딩한다. 문헌에서, catX 유전자는 "orfl"(Neidle and Ornston, 1986)로도 불린다. 이 특허 명세서에서, 우리는 아시네토박터(Acinetobacter)로부터의 catA와 catX 유전자 쌍을 "catAX"로 부를 것이다. 이종 유전자 aroY는 폐렴간균으로부터 유래되고, 프로토카테츄에이트 디카복실라아제(이하, "AroY"로 칭함)를 인코딩한다.
전술한 등록 특허와 관련된 더 최근의 특허 출원서가 공개되었다(WO/2011/085311 A1). 이런 출원에서, 전술한 것과 동일한 균주 WN1/pWN2.248가 시스, 시스-뮤콘산을 생산하기 위해 사용되었으며, 이는 이후에 시스, 트랜스-뮤콘산으로 이성질화된다.
그러나, 균주 WN1/pWN2.248는 대규모 상업적 생산에 적합하지 않기 때문에, 더 개선된 공정이 필요된다. 본 발명은 시스, 시스-뮤콘산의 발효적 생산을 위한 개선된 생촉매를 제공한다.
WO2011/085311 A1에서 설명된 공정은 대규에서 실시하기에 비현실적으로 만드는 몇몇 다른 특징들을 가진다. 시스, 시스-뮤콘산 의 발효적 생산에 사용된 생촉매 WN1/pWN2.248에 포함되는 aroE353 돌연변이는, 시스, 시스-뮤콘산으로의 소정의 경로 안으로 탄소의 흐름을 최대화하기 위하여 쉬키메이트 경로의 하부로의 탄소의 흐름을 차단하는 기능을 한다. 그러나, aroE 돌연변이는 "삭제(null)" 돌연변이(모든 실험 목적을 위하여 유전자를 비활성화시키는 돌연변이)이며, 이는 균주가 방향족 아미노산(페닐알라닌, 티로신, 및 트립토판) 및 쉬키메이트 경로에서 만들어지는 방향족 비타민 또는 비타민-유사 중간체들(p-히드록시 벤조산, p-아미노 벤조산, 및 2,3-디히드록시 벤조산)에 대한 영양 요구체(auxotroph)가 되도록하는 결과를 가져왔다. 방향족 아미노산은 상대적으로 바씨고, 그의 필요성은 시스, 시스-뮤콘산의 생산 비용에 큰 부담을 부가할 것이다. 따라서, 성장 배지에 첨가될 이러한 비싼 영양성분을 필요로 하지 않는 공정에 대한 필요성도 존재한다.
또한, 시스, 시스-뮤콘산의 생산을 위한 현재 사용가능한 생촉매와 연관된 다른 문제점은 필수 유전자의 일부를 발현하기 위하여 다중복제 플라스미드를 유지할 필요성과 관련된다(Niu 등, 2002). 다중복제 플라스미드는 종종 대규모의 공업적 공정에서 사용하기에 너무 불안정하다. 또한, 플라스미드 상의 유전자들 중 적어도 하나는, 유도를 위해 이소프로필티오갈락토시드(IPTG) 또는 락토오스 중 어느 하나를 필요로 하는 프로모터, Ptac로부터 발현되고, 이러한 두 개의 화학물질은 상업적으로 매력적인 공정을 가능하게 하기에는 너무 비싸다. 따라서, 생산 균주의 염색체 안으로 안정하게 통합된 발현 카셋을 갖는 더 안정한 균주에 대한 필요성이 존재하고, 프로모터에 대한 화학적 유도제에 대한 필요성을 경감시키기 위해 구성 프로모터(constitutive promoters)로부터 높은 수준의 발현을 필요로 한다.
Altschul, S. F., Gish, W., Miller, W., Myers, E. W., and Lipman, D. J. (1990) Basic local alignment search tool, J Mol Biol 215, 403-410.
Altschul, S. F., Madden, T. L., Schaffer, A. A., Zhang, J., Zhang, Z., Miller, W., and Lipman, D. J. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs, Nucleic Acids Res 25, 3389-3402.
Barbe, V., Vallenet, D., Fonknechten, N., Kreimeyer, A., Oztas, S., Labarre, L., Cruveiller, S., Robert, C., Duprat, S., Wincker, P., Ornston, L. N., Weissenbach, J., Marliere, P., Cohen, G. N., and Medigue, C. (2004) Unique features revealed by the genome sequence of Acinetobacter sp. ADP1, a versatile and naturally transformation competent bacterium, Nucleic Acids Res 32, 5766-5779.
Bird, J. A. and Cain, R. B. (1968) cis-cis-muconate, the product inducer of catechol 1,2-oxygenase in Pseudomonas aeruginosa. Biochem. J. 109, 479-481.
Bongaerts, J., Kramer, M., Muller, U., Raven, L. and Wubbolts, M. (2001) Metabollic engineering for microbial producitnof aromatic acids and derived compunds. Met. Eng. 3, 289-300.
Chandran, S. S., Yi, J., Draths, K. M., von Daeniken, R., Weber, W. and Frost, J. W. (2003) Phosphoenolpyruvate availability and the biosynthesis of shikimic acid. Biotechnol. Prog. 19, 808-814.
Chen, R., Hatzimanikatis, V., Yap, W. M. G. J., Potma, P. W. and Bailey, J. E. (1997) Metabolic consequences of phosphotransferase (PTS) mutation in a phenylalanie-producing recombinant Escherichia coli. Biotechnol. Prog. 13, 768-775.
Chen, K., Dou, J., Tang, S., Yang, Y., Wang, H., Fang, H. and Zhou, C. (2012) Deletion of the aroK gene is essential for high shikimic acid accumulation through the shikimate in E. coli. Bioresource Technol, 119, 141-147.
Choi, W. J., Lee, E. Y., Cho, M. H., and Choi, C. Y. (1997) Enhanced production of cis, cis-muconate in a cell-recycle bioreactor. J. Fermentation and Bioengineering. 84, 70-76.
Curran, K. A., Leavitt, J. M., Karim, A. S. and Alper, H. S. (2012) Metabolic engineering of muconic acid production in Saccharomyces cerevisiae. Metabol. Engineer. 15, 55-66.
de Berardinis, V., Vallenet, D., Castelli, V., Besnard, M., Pinet, A., Cruaud, C., Samair, S., Lechaplais, C., Gyapay, G., Richez, C., Durot, M., Kreimeyer, A., Le Fevre, F., Schachter, V., Pezo, V., Doring, V., Scarpelli, C., Medigue, C., Cohen, G. N., Marliere, P., Salanoubat, M., and Weissenbach, J. (2008) A complete collection of single-gene deletion mutants of Acinetobacter baylyi ADP1, Mol Syst Biol 4, 174.
Draths, K. M., Pompliano, D. L., Conley, D. L., Frost, J. W., Berry, A., Disbrow, G. L., Staversky, R. J., and Lievense, J. C. (1992) Biocatalytic Synthesis of Aromatics from D-Glucose - the Role of Transketolase, Journal of the American Chemical Society 114, 3956-3962.
Draths, K. M., and Frost, J. W. (1995) Environmentally Compatible Synthesis of Catechol from D-Glucose, Journal of the American Chemical Society 117, 2395-2400.
Elsemore, D. A., and Ornston, L. N. (1995) Unusual ancestry of dehydratases associated with quinate catabolism in Acinetobacter calcoaceticus, J Bacteriol 177, 5971-5978.
Escalante, A., Calderon, R., Valdiva, A., de Anda, R., Hernandez, G., Ramirez, O. T., Gosset, G. and Boliver, F. (2010) Metabolic engineering for the production of shikimic acid in an evolved Escherichia coli strain lacking the phosphoenolpyrvate: carbohydrate phosphotransferase system. Microbial Cell Factories 9, 21-33.
Flores, N., Xiao, J., Berry, A., Bolivar, F. and Valle, F. (1996) Pathway engineering for the production of aromatic compounds in Escherichia coli. Nature Biotechn. 14, 620-623.
Fox, D. T., Hotta, K., Kim, C. Y., and Koppisch, A. T. (2008) The missing link in petrobactin biosynthesis: asbF encodes a (-)-3-dehydroshikimate dehydratase, Biochemistry 47, 12251-12253.
Ger, Y., Chen, S., Chiang, H., and Shiuan, D. (1994) A Single Ser-180 Mutation Desensitizes Feedback Inhibition of the Phyenylalanine-Sensitive 3-Deoxy-D-Arabino-Hepulosonate 7-Phosphate (DAHP) Synthetase in Eschericia coli, J Biochem 116, 986-990.
Grant, D. J., and Patel, J. C. (1969) The non-oxidative decarboxylation of p-hydroxybenzoic acid, gentisic acid, protocatechuic acid and gallic acid by Klebsiella aerogenes (Aerobacter aerogenes), Antonie Van Leeuwenhoek 35, 325-343.
Hansen, E. H., Moller, B. L., Kock, G. R., Bunner, C. M., Kristensen, C., Jensen, O. R., Okkels, F. T., Olsen, C. E., Motawia, M. S., and Hansen, J. (2009) De novo biosynthesis of vanillin in fission yeast (Schizosaccharomyces pombe) and baker's yeast (Saccharomyces cerevisiae), Appl Environ Microbiol 75, 2765-2774.
Hu, C., Jiang, P., Xu, J., Wu, Y., and Huang, W. (2003) Mutation analysis of the feedback inhibition site of phenylalanine-sensitive 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase of Escherichia coli, J Basic Microbiol 43, 399-406.
Iwagami, S. G., Yang, K., and Davies, J. (2000) Characterization of the protocatechuic acid catabolic gene cluster from Streptomyces sp. strain 2065, Appl Environ Microbiol 66, 1499-1508.
Jantama, K., Haupt, M. J., Svoronos, S. A., Zhang, X., Moore, J. C., Shanmugam, K. T., and Ingram, L. O. (2008a) Combining metabolic engineering and metabolic evolution to develop nonrecombinant strains of Escherichia coli C that produce succinate and malate, Biotechnol Bioeng 99, 1140-1153.
Jantama, K., Zhang, X., Moore, J. C., Shanmugam, K. T., Svoronos, S. A., and Ingram, L. O. (2008b) Eliminating side products and increasing succinate yields in engineered strains of Escherichia coli C, Biotechnol Bioeng 101, 881-893.
Kaneko, A., Ishii, Y., and Kirimura, K. (2011) High-yield production of cis, cis-muconic acid from catechol in aqueous solution by biocatalyst. Chem. Lett. 40, 381-383.
Kikuchi, Y., Tsujimoto, K., and Kurahashi, O. (1997) Mutational analysis of the feedback sites of phenylalanine-sensitive 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase of Escherichia coli, Appl Environ Microbiol 63, 761-762.
Kojima, Y., Fujisawa, H., Nakazawa, A., Nakazawa, T., Kanetsuna, F., Taniuchi, H., Nozaki, M., and Hayaishi, O. (1967) Studies on pyrocatechase. I. Purification and spectral properties, J Biol Chem 242, 3270-3278.
Kramer, M., Bongaerts, J., Bovenberg, R., Kremer, S., Muller, U., Orf, S., Wubbolts, M. and Raeven, L. (2003) Metabolic engineering for microbial production of shikimic acid. Metabol. Eng. 5, 277-283.
Lerner, C. G., and Inouye, M. (1990) Low copy number plasmids for regulated low-level expression of cloned genes in Escherichia coli with blue/white insert screening capability, Nucleic Acids Res 18, 4631.
Li, K. and Frost, J.W. (1999) Microbial synthesis of 3-dehydroshikimic acid: A comparative analysis of D-xylose, L-arabinose, and D-glucose carbon sources. Biotechnol. Prog. 15, 876-883.
Lu, J. L., and Liao, J. C. (1997) Metabolic engineering and control analysis for production of aromatics: Role of transaldolase, Biotechnol Bioeng 53, 132-138.
Lu, J., Tang, J., Liu, Y., Zhu, X. (2012) Combinatorial modulation of galP and glk gene expression for improves alternative glucose utilization. Appl. Microbiol. Biotechnol. 93, 2455-2462
Lutke-Eversloh, T., and Stephanopoulos, G. (2007) L-tyrosine production by deregulated strains of Escherichia coli, Appl Microbiol Biotechnol 75, 103-110.
Mizuno, S., Yoshikawa, N., Seki, M., Mikawa, T., and Imada, Y. (1988) Microbial production of cis, cis- muconic acid from benzoic acid. Appl Microbiol Biotechnol. 28, 20-25.
Nakazawa, A., Kojima, Y., and Taniuchi, H. (1967) Purification and properties of pyrocatechase from Pseudomonas fluorescens, Biochim Biophys Acta 147, 189-199.
Neidhardt, F. C., and Curtiss, R. (1996) Escherichia coli and Salmonella : cellular and molecular biology, 2nd ed., ASM Press, Washington, D.C.
Neidle, E. L., and Ornston, L. N. (1986) Cloning and expression of Acinetobacter calcoaceticus catechol 1,2-dioxygenase structural gene catA in Escherichia coli, J Bacteriol 168, 815-820.
Niu, W., Draths, K. M., and Frost, J. W. (2002) Benzene-free synthesis of adipic acid, Biotechnol Prog 18, 201-211.
Parker, C., Barnell, W. O., Snoep, J. L., Ingram, L. O., and Conway, T. (1995) Characterization of the Zymomonas mobilis glucose facilitator gene product (glf) in recombinant Escherichia coli: examination of transport mechanism, kinetics and the role of glucokinase in glucose transport, Mol Microbiol 15, 795-802.
Parsek, M. R., Shinabarger, D. .L., Rithmel, R. K. and Chakrabarty, A. M. (1992) Roles of CatR and cis, cis-Muconate in activation of the catBC operson, which is involved in benzoate degradationin Pseudomonas putida. J. Bacteriol. 174, 7798-7806.
Patnaik, R. and Liao, J. C. (1994) Engineering of Escherichia coli central metabolism for aromatic metabolite with near theoretical yiled. App. Env. Microbiol. 60, 3903-3908.
Pfleger, B. F., Kim, Y., Nusca, T. D., Maltseva, N., Lee, J. Y., Rath, C. M., Scaglione, J. B., Janes, B. K., Anderson, E. C., Bergman, N. H., Hanna, P. C., Joachimiak, A., and Sherman, D. H. (2008) Structural and functional analysis of AsbF: origin of the stealth 3,4-dihydroxybenzoic acid subunit for petrobactin biosynthesis, Proc Natl Acad Sci U S A 105, 17133-17138.
Perez-Pantoja, D., De la Iglesia, R., Pieper, D. H., and Gonzalez, B. (2008) Metabolic reconstruction of aromatic compounds degradation from the genome of the amazing pollutant-degrading bacterium Cupriavidus necator JMP134, FEMS Microbiol Rev 32, 736-794.
Perez-Pantoja, D., Donoso, R., Agullo, L., Cordova, M., Seeger, M., Pieper, D. H., and Gonzalez, B. (2011) Genomic analysis of the potential for aromatic compounds biodegradation in Burkholderiales, Environ Microbiol.
Pittard, J. and Wallace, B. J. (1966) Distribution and function of genes concerned with aromatic biosynthesis in Escherichia coli. J. Bacteriol. 91, 1494-1508.
Polen, T., Spelberg, M. and Bott, M. (2012) toward bitechnological produciton of adipic acid and precursors from biorenewables, J. Biotechnol, http://dx.doi.org/10.1016/j.biotec.2012-07.008.
Rutledge, B. J. (1984) Molecular characterization of the qa-4 gene of Neurospora crassa, Gene 32, 275-287.
Schirmer, F., and Hillen, W. (1998) The Acinetobacter calcoaceticus NCIB8250 mop operon mRNA is differentially degraded, resulting in a higher level of the 3' CatA-encoding segment than of the 5' phenolhydroxylase-encoding portion, Mol Gen Genet 257, 330-337.
Shumilin, I. A., Kretsinger, R. H., and Bauerle, R. H. (1999) Crystal structure of phenylalanine-regulated 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase from Escherichia coli, Structure 7, 865-875.
Shumilin, I. A., Zhao, C., Bauerle, R., and Kretsinger, R. H. (2002) Allosteric inhibition of 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase alters the coordination of both substrates, J Mol Biol 320, 1147-1156.
Shumilin, I. A., Bauerle, R., Wu, J., Woodard, R. W., and Kretsinger, R. H. (2004) Crystal structure of the reaction complex of 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase from Thermotoga maritima refines the catalytic mechanism and indicates a new mechanism of allosteric regulation, J Mol Biol 341, 455-466.
Shumkova, E. S., Solyanikova, I. P., Plotnikova, E. G. and Golovleva, L. A. (2009) Phenol degrdation by Rhodococcus opacus Strain 1G. App. Biocehm. Microbiol. 45, 43-49.
Sietmann, R., Uebe, R., Boer, E., Bode, R., Kunze, G., and Schauer, F. (2010) Novel metabolic routes during the oxidation of hydroxylated aromatic acids by the yeast Arxula adeninivorans, J Appl Microbiol 108, 789-799.
Smith, M. R. and Ratledge, C. (1989) Quantitative biotransformation of catechol to cis, cis muconate. Biotech. Lett. 11, 105-110.
Snoep, J. L., Arfman, N., Yomano, L. P., Fliege, R. K., Conway, T., and Ingram, L. O. (1994) Reconstruction of glucose uptake and phosphorylation in a glucose-negative mutant of Escherichia coli by using Zymomonas mobilis genes encoding the glucose facilitator protein and glucokinase, J Bacteriol 176, 2133-2135.
Sprenger, G. A. (1995) Genetics of pentose-phosphate pathway enzymes of Escherichia coli K-12, Arch Microbiol 164, 324-330.
Sprenger, G. A., Schorken, U., Sprenger, G., and Sahm, H. (1995a) Transketolase A of Escherichia coli K12. Purification and properties of the enzyme from recombinant strains, Eur J Biochem 230, 525-532.
Sprenger, G. A., Schorken, U., Sprenger, G., and Sahm, H. (1995b) Transaldolase B of Escherichia coli K-12: cloning of its gene, talB, and characterization of the enzyme from recombinant strains, J Bacteriol 177, 5930-5936.
Stroman, P., Reinert, W. R., and Giles, N. H. (1978) Purification and characterization of 3-dehydroshikimate dehydratase, an enzyme in the inducible quinic acid catabolic pathway of Neurospora crassa, J Biol Chem 253, 4593-4598.
Tang, J., Zhu, X., Lu, J. and Liu, P. (2012) Recruiting alternative glucose utilization pathways for improving succinate production. App Microbiol Biotechnol DOI 10, 1007/s00253-012-434.1
Tateoka, T., and Yasuda, I. (1995) 3-Dehydroshikimate dehydratase in mung hean cultured cells, Plant Cell Reports 15, 212-217.
Weaver, L. M., and Herrmann, K. M. (1990) Cloning of an aroF allele encoding a tyrosine-insensitive 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase, J Bacteriol 172, 6581-6584.
Weber, C., Bruckner, C., Weinreb, S., Lehr, C., Essl, C. and Bole, E. (2012) Biosynthesis of cis, cis-muconic acid and its aromatic precursors catechol and proteocatechuic acid, from renewable feedstocks by Saccharomyces cerevisiae, App Environ Microbiol. 78, 8421-8430.
Wheeler, K. A., Lamb, H. K., and Hawkins, A. R. (1996) Control of metabolic flux through the quinate pathway in Aspergillus nidulans, Biochem J 315 ( Pt 1), 195-205.
Wu, C-M., Wu, C-C., Su, C-C., Lee, S-N., Lee, Y-A. and Wu, J-Y. (2006) Microbial synthesis of cis,cis-muconic acid form benzoate by Sphingobacterium sp. Mutants. Biochem. Eng. J. 29, 35-40.
Xie, N., Tang, H., Feng, J., Tao, F., Ma, C. and Xu, P. (2009) Characterization of benzoate degradationby newly isolated bacterium Pseudomonas sp. XP-M2. Biochem. Eng. J. 46, 79-82.
Yi, J., Draths, K. M., Li, K. and Frost, J. W. (2003)Altered Glucose Transport and Shikimate Pathway Product Yields in E. coli. Biotechnol. Prog. 2003, 19, 1450-1459
Yoshikawa, N., Mizuno, S., Ohta, K., and Suzuki, M. (1990) Microbial production of cis, cis-muconic acid. J. Biotechnol. 14, 203-210
본 발명은 비-방향족 탄소원으로부터 시작하여 시스, 시스-뮤콘산을 생산하는 유전자 조작된 미생물을 제공한다. 유전자 조작된 미생물들은 소정의 표현형을 달성하기 위해서 필요한 특정 외인성 또는 이종 유전자를 가짐에도 불구하고, 유전자 조작된 미생물은 뮤콘산을 생산하기 위하여 어떤 외인성 플라스미드를 함유할 필요가 없다. 미생물 안으로 도입된 외인성 유전자는 염색체 DNA 안으로 안정하게 통합된다. 외인성 유전자와 이런 염색체 DNA의 통합의 결과로서, 플라스미드 운반 외인성 DNA를 유지하기 위한 항생제 또는 다른 선택적 방법의 사용에 대한 필요성은 완전히 없어졌다. 또한, 화학적 유도제를 필요로 하지 않는 강력한 프로모터는 글루코오스와 같은 탄소원으로부터 시스, 시스-뮤콘산으로의 경로를 위해 필요한 유전자를 발현시키기 위해 사용된다.
본 발명의 일 실시예에서, 방향족 아미노산 생합성의 음성 조절자의 활성은 유전적으로 조작된다. 본 발명의 일 양태에서, 음성 조절자 TyrR의 활성은 TyrR 단백질을 코딩하는 tyrR 유전자의 발현을 조절하는 것에 의해 실질적으로 감소된다. 본 발명의 또 다른 양태에서, 음성 조절자 TyrR의 활성은 미생물의 염색체 DNA로부터 tyrR 유전자를 제거하거나 비활성화하는 것에 의해 완전히 제거될 수 있다.
본 발명의 또 다른 실시예에서, 방향족 아미노산 경로에서 특정 대사산물에 의한 특정 효소의 피드백 억제는 유전자 조작을 통해 극복된다. 대부분의 야생형 대장균 균주에서, 디옥시아라비노-헵툴로소네이트 7-포스페이트(deoxyarabino-heptulosonate 7-phosphate)(DAHP) 합성효소는 aroG, aroF 및 aroH로 명명된 세 개의 유전자들에 의해 인코딩되는 것으로 알려진 세 개의 다른 동종효소로서 존재한다. 이러한 세 개의 유전자 각각에 의해 인코딩된 단백질은 방향족 아미노산 생합성의 원인이 되는 쉬킴산 경로의 하나 이상의 대사 산물에 의해 피드백 억제된다. 본 발명의 일 양태에서, 야생형 aroG 유전자는, 미생물 세포 내에서, 방향족 아미노산 경로에서 하나 이상의 대사 산물에 의한 피드백 억제에 대해 내성을 갖는 AroG 단백질을 코딩하는 개질된 aroG 유전자에 의해 치환된다. 본 발명의 또 다른 양태에서, 야생형 aroF 유전자는, 미생물 세포 내에서, 방향족 아미노산 경로에서 하나 이상의 대사 산물에 의한 피드백 억제에 대해 내성을 갖는 AroF 단백질을 코딩하는 개질된 aroF 유전자에 의해 치환된다. 본 발명의 또 다른 양태에서, 야생형 aroH 유전자는, 미생물 세포 내에서, 방향족 아미노산 경로에서 하나 이상의 대사 산물에 의한 피드백 억제에 대해 내성을 갖는 AroH 단백질을 코딩하는 개질된 aroH 유전자에 의해 치환된다. 본 발명의 또 다른 실시예에서, 시스, 시스-뮤콘산의 상업적 생산을 위해 선택된 생촉매는 디옥시아라비노-헵툴로소네이트 7-포스페이트(DAHP) 합성효소에 대한 하나 이상의 피드백 내성 동종효소를 가질 수 있다.
본 발명의 또 다른 실시예에서, 미생물 세포 내에서 방향족 아미노산 경로를 통한 탄소의 흐름에 수반된 하나 이상의 효소의 활성은 강화된다. 본 발명의 일 양태에서, 방향족 아미노산 경로 및/또는 뮤콘산 경로의 작동에 수반된 하나 이상의 효소의 활성 강화는 유전자 조작을 통해 달성된다. 본 발명의 바람직한 실시예에서, 효소 또는 단백질 AroF, AroG, AroH, AroB, TktA, TalB, AroZ, QutC, qa-4, asbF, QuiC, AroY, Rpe, Rpi, Pps, CatA 및 CatX 또는 그의 동종체 또는 유사체를 코딩하는 하나 이상의 유전자의 발현은 강화되어, 상기 효소들의 증가된 활성을 가져온다. Rpe는 리불로오스-5-포스페이트 에피머라아제(ribulose-5-phosphate epimerase)이고, Rpi는 리불로오스-5-포스페이트 이소머라아제(ribulose-5 -phosphate isomerase)이고, Pps는 포스포에놀 피루베이트 합성효소(phosphoenol pyruvate synthetase)이다(Neidhardt 및 Curtiss, 1996). 만일 숙주 균주가 효모 예를 들어, 사카로미세스 세레비지애(Saccharomyces cerevisiae) 또는 뉴로스포라 크라싸(Neurospora crassa)와 같은 사상균류(filamentous fungus)이면, 쉬키메이트 경로에서 반응을 촉매하는 몇몇 효소들은 사카로미세스 세리비시아(S. cerevisiae)의 경우에서 ARO1 유전자에 의해 인코딩된 Aro1p로 불리는 하나의 거대 단백질 또는 폴리펩티드 안으로 혼합될 수 있다. Aro1p는 AroB, AroD, AroE, AroK (또는 AroL), 및 AroA의 기능을 겸비한다. 이리하여, 본 발명의 목적에 있어서, Aro1p 및 ARO1, 또는 그의 일부는 치환체로서 사용될 수 있거나, AroB, AroD, AroE, AroK, 및/또는 AroA에 더하여 사용될 수 있다.
본 발명의 또 다른 실시예에서, 박테리아 세포 내에서 에리트로오스-4-포스페이트를 거친 플럭스는 펜토오스 포스페이트 경로의 작동에서 효소를 과다발현하는 것에 의해 강화된다. 본 발명의 일 양태에서, talB 또는 talA 유전자에 의해 코딩된 트랜스알돌라아제 효소의 과다 생성은 조작된다. 본 발명의 또 다른 양태에서, 트랜스알돌라아제 및 트랜스케토라아제 효소 모두를 인코딩하는 유전자의 발현은 유전자 조작에 의해 강화된다. 본 발명의 또 다른 양태에서, 리불로오스-5-포스페이트 에피머라아제 및 리불로오스-5-포스페이트 이소머라아제 모두 또는 그들 중 하나를 인코딩하는 유전자의 발현은 유전자 조작에 의해 강화된다.
본 발명의 또 다른 실시예에서, 방향족 아미노산 경로의 기능화를 위해 사용될 수 있는 PEP(포스포에놀 피루베이트)는 유전자 조작을 통해 증가된다. 본 발명의 일 양태에서, PEP 풀(pool)에 대한 경쟁은 글루코오스 활용을 위한 PEP 독립 시스템과 글루코오스의 활용을 위한 PEP-의존성 포스포트랜스퍼라아제 시스템(PTS)의 제거 및/또는 보완을 통해 감소된다. 본 발명의 또 다른 실시예에서, PEP의 이용율은 pps와 같은 PEP 합성효소를 인코딩하는 유전자의 발현을 증가시키는 것에 의해 증가된다.
도 1. 대장균에서 방향족 아미노산 생합성에 대한 경로.
도 2. 대장균에서 뮤콘산의 생산에 대한 경로.
도 3. 총 뮤콘산 및 생화학적 중간체의 HPLC 분석에 사용된 기준을 보여주는 크로마토그래프.
도 4. 뮤콘산 이성질체의 HPLC 분석에 사용된 기준을 보여주는 크로마토그래프.
도 5. 플라스미드 pCP32AMP, pCP14 및 pCP54로 형질전환된 대장균 균주 MYR34에서 DHS의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실되었다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG를 발현한다. 플라스미드 pCP14는 DHQ 합성 효소를 코딩하는 aroB 유전자를 발현한다. 플라스미드 pCP54는 aroB 및 aroG 유전자 모두를 발현한다.
도 6. 플라스미드 pCP32AMP 및 pCP54로 형질전환된 대장균 균주 MYR34 및 MYR170에서 DHS의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실되었다. MYR170 균주는 숙주 염색체 DNA의 ack 자리(ack locus)에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG 유전자를 발현한다. 플라스미드 pCP54는 aroB 및 aroG 유전자를 모두 발현한다.
도 7. 플라스미드 pMG37로만 형질전환되거나 pMG37 및 pCP32AMP 플라스미드와 함께 형질전환된 대장균 균주 MYR34 및 MYR170에서 시스, 시스-뮤콘산의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실된다. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG 유전자를 발현한다. 플라스미드 pMG37는 뮤콘산 경로에서 기능하는 단백질을 코딩하는 aroZ, aroY, 및 catAX 유전자들을 발현한다.
도 8. aroG 유전자만을 발현하는 플라스미드(pCP32AMP) 또는 aroG 및 tktA 유전자를 동시에 발현하는 플라스미드(pCP50)로 형질전환된 대장균의 MYR170 균주에서 DHS의 생산에 대한 역가. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다.
도 9. 플라스미드 pCP32AMP 및 pCP50으로 형질전환된 대장균 MYR34 및 MYR170 균주로부터 DHS 수율. DHS 수율은 소모된 글루코오스의 그램 당 생산된 DHS의 그램으로서 계산된다. 플라스미드 pCP32AMP는 pCP50이 aroG 및 tktA를 발현하는 동안 aroG 유전자를 발현한다. 박테리아 균주 MYR34는 aroE 유전자의 결실을 가진다. 대장균의 MYR170 균주는 MYR34로부터 유래되고, 염색체 DNA 상의 ack 자리에서 통합된 추가적인 aroB 유전자를 가진다.
도 10. 플라스미드 pCP32AMP 및 pCP50으로 형질전환된 대장균 MYR170 및 MYR261 균주로부터 DHS 역가. 플라스미드 pCP32AMP는 aroG 유전자를 발현하지만, pCP50는 aroB 및 tktA 유전자를 발현한다. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 대장균의 MYR261 균주는 대장균의 MYR170 균주로부터 유래된다. 대장균의 MYR261 균주는 염색체 DNA의 poxB 자리에서 통합된 그것의 네이티브 프로모터를 갖는 tktA 유전자의 제2 복제를 가진다.
도 11. 쉬킴산 생합성 경로에서 DAHP 합성효소를 코딩하는 aroG를 발현하는 플라스미드 pCP32AMP 및 뮤콘산 경로에서 작용하는 단백질을 코딩하는 aroZ, aroY 및 catAX 유전자를 발현하는 플라스미드 pMG37로 형질전환된 대장균 균주 MYR170, MYR261 및 MYR305에서 뮤콘산 및 아세트산 생산. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 삽입된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 추가 복제의 결실을 갖는다. MYR261 및 MYR305는 MYR170 균주의 유도체이다. MYR261은 숙주 염색체 DNA 상의 poxB 자리에서 통합된 tktA 유전자의 추가적인 복제를 갖는 반면, MYR305는 숙주 염색체 DNA 상의 poxB 자리에서 결실을 가진다.
도 12. 대장균 MYR34에 의해 생산된 내생성 DHS의 뮤콘산으로의 전환. 대장균의 MYR34 균주는 쉬키메이트 디히드로게나아제(shikimate dehydrogenase)를 코딩하는 aroE 유전자의 결실을 가진다. 그 결과, DHS의 축적이 발생한다. MYR34 균주가 뮤콘산 경로에서 작용하는 단백질을 코딩하는 aroZ, aroY 및 catAX 유전자를 발현하는 플라스미드로 형질전환되는 경우에, DHS의 뮤콘산으로의 전환이 발생한다. 그러나, MYR34 균주가 임의의 외부 유전자를 갖지 않는 비어있는 플라스미드 벡터(pCL1921)로 형질전환된 경우에, DHS의 뮤콘산으로의 전환은 발생하지 않는다.
도 13. DHS를 뮤콘산 경로로 전환하는 능력에 대한 aroZ 동족체의 비교. 세개의 다른 aroZ 동족체, 이름하여, 아시네토박터 sp.(Acinetobacter sp.) ADP1으로부터의 quiC, 바실러스 튜링겐시스(Bacillus thuringiensis)로부터의 asbF, 및 뉴로스포라 그라싸(Neurospora crassa)로부터의 qa-4는 P15 및 람다 PR 프로모터로부터 각각 catAX 및 aroY 유전자를 발현하는 저-모사 플라스미드(low-copy plasmid)에서 P26 프로모터 하에서 클로닝되었다. 이러한 세개의 다른 플라스미드 구조체는 형질전환을 통해 MYR34에서 발현되었고, 생산된 뮤콘산의 양은 측정되었다.
도 14. catAX, aroY 및 quiC의 단일 복제는 대장균의 MYR170 균주안으로 염색체로 통합되어(△aroE, △ack::P 15 -aroB), MYR352를 가져왔다(서열번호: 41). 또한, MYR170은, MYR219 균주로 이어지는 뮤콘산 경로의 작동에 필요한 모든 유전자를 가진 저-모사 플라스미드 pMG37로 형질전환되었다. MYR352 및 MYR219 모두는 YEp24(중-모사 비어있는 벡터(medium-copy empty vector)) 또는 pCP32AMP(중-모사 aroG 발현 플라스미드) 또는 pCP50(중-모사 aroG 및 tktA 발현 플라스미드)로 형질전환되었고, 생산된 PCA, 카테콜 및 뮤콘산의 양은 HPLC 방법을 사용하여 정량되었다.
도 15. catAX의 발현을 증가시키는 방법에 의한 MYR352에서 카테콜 축적의 제거. MYR352는 aroY만을 발현하는 플라스미드(pMG27) 또는 quiC만을 발현하는 플라스미드(pMG39) 또는 catAX, aroY 및 quiC의 세 개의 뮤콘산 경로 유전자를 발현하는 플라스미드(pMG37) 또는 catAX 및 aroY의 두 개의 뮤콘산 경로 유전자를 발현하는 플라스미드(pMG33)로 형질전환되었다. catAX만의 과다발현은 카테콜의 축적을 방지하기에 충분했다.
도 16. 글루코오스를 이입하기(importing) 위한 다른 시스템들을 사용하는 균주의 성장. ptsHI 및 galP(MYR31)의 결실은 최소 글루코오스 배지에서 성장의 결핍을 가져오지만, glf 및 glk 유전자(MYR217)의 도입은 다시 성장을 가져온다. 대조 균주 MYR34는 △aroE일 뿐, 야생형이었다. 세 개의 방향족 아미노산 및 세 개의 방향족 비타민은 영양요구성 균주의 성장을 허용하기 위해 배지에 첨가되었다.
도 17. 대장균의 MYR34 및 MYR217 균주에서 DHS 생산. DHS의 생산을 가져오는 플라스미드로 형질전환된 경우에, 글루코오스 이입을 위해 glf-glk를 활용하는 MYR217은, 포스포트랜스퍼라아제 시스템(phosphotransferase system (PTS))을 활용하는 MYR34의 형질전환체보다 더 높은 DHS 역가를 생산했다.
도 18. 7 리터 발효기에서 대장균의 MYR428 균주에 의해 뮤콘산의 생산. △aroE △ackA::P 15 -aroB △poxB::tktA의 유전자형을 갖는 대장균의 MYR261는 플라스미드 pCP32AMP 및 pMG37로 형질전환되어 대장균의 MYR428 균주를 생성했다.
도 2. 대장균에서 뮤콘산의 생산에 대한 경로.
도 3. 총 뮤콘산 및 생화학적 중간체의 HPLC 분석에 사용된 기준을 보여주는 크로마토그래프.
도 4. 뮤콘산 이성질체의 HPLC 분석에 사용된 기준을 보여주는 크로마토그래프.
도 5. 플라스미드 pCP32AMP, pCP14 및 pCP54로 형질전환된 대장균 균주 MYR34에서 DHS의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실되었다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG를 발현한다. 플라스미드 pCP14는 DHQ 합성 효소를 코딩하는 aroB 유전자를 발현한다. 플라스미드 pCP54는 aroB 및 aroG 유전자 모두를 발현한다.
도 6. 플라스미드 pCP32AMP 및 pCP54로 형질전환된 대장균 균주 MYR34 및 MYR170에서 DHS의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실되었다. MYR170 균주는 숙주 염색체 DNA의 ack 자리(ack locus)에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG 유전자를 발현한다. 플라스미드 pCP54는 aroB 및 aroG 유전자를 모두 발현한다.
도 7. 플라스미드 pMG37로만 형질전환되거나 pMG37 및 pCP32AMP 플라스미드와 함께 형질전환된 대장균 균주 MYR34 및 MYR170에서 시스, 시스-뮤콘산의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실된다. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG 유전자를 발현한다. 플라스미드 pMG37는 뮤콘산 경로에서 기능하는 단백질을 코딩하는 aroZ, aroY, 및 catAX 유전자들을 발현한다.
도 8. aroG 유전자만을 발현하는 플라스미드(pCP32AMP) 또는 aroG 및 tktA 유전자를 동시에 발현하는 플라스미드(pCP50)로 형질전환된 대장균의 MYR170 균주에서 DHS의 생산에 대한 역가. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다.
도 9. 플라스미드 pCP32AMP 및 pCP50으로 형질전환된 대장균 MYR34 및 MYR170 균주로부터 DHS 수율. DHS 수율은 소모된 글루코오스의 그램 당 생산된 DHS의 그램으로서 계산된다. 플라스미드 pCP32AMP는 pCP50이 aroG 및 tktA를 발현하는 동안 aroG 유전자를 발현한다. 박테리아 균주 MYR34는 aroE 유전자의 결실을 가진다. 대장균의 MYR170 균주는 MYR34로부터 유래되고, 염색체 DNA 상의 ack 자리에서 통합된 추가적인 aroB 유전자를 가진다.
도 10. 플라스미드 pCP32AMP 및 pCP50으로 형질전환된 대장균 MYR170 및 MYR261 균주로부터 DHS 역가. 플라스미드 pCP32AMP는 aroG 유전자를 발현하지만, pCP50는 aroB 및 tktA 유전자를 발현한다. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 대장균의 MYR261 균주는 대장균의 MYR170 균주로부터 유래된다. 대장균의 MYR261 균주는 염색체 DNA의 poxB 자리에서 통합된 그것의 네이티브 프로모터를 갖는 tktA 유전자의 제2 복제를 가진다.
도 11. 쉬킴산 생합성 경로에서 DAHP 합성효소를 코딩하는 aroG를 발현하는 플라스미드 pCP32AMP 및 뮤콘산 경로에서 작용하는 단백질을 코딩하는 aroZ, aroY 및 catAX 유전자를 발현하는 플라스미드 pMG37로 형질전환된 대장균 균주 MYR170, MYR261 및 MYR305에서 뮤콘산 및 아세트산 생산. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 삽입된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 추가 복제의 결실을 갖는다. MYR261 및 MYR305는 MYR170 균주의 유도체이다. MYR261은 숙주 염색체 DNA 상의 poxB 자리에서 통합된 tktA 유전자의 추가적인 복제를 갖는 반면, MYR305는 숙주 염색체 DNA 상의 poxB 자리에서 결실을 가진다.
도 12. 대장균 MYR34에 의해 생산된 내생성 DHS의 뮤콘산으로의 전환. 대장균의 MYR34 균주는 쉬키메이트 디히드로게나아제(shikimate dehydrogenase)를 코딩하는 aroE 유전자의 결실을 가진다. 그 결과, DHS의 축적이 발생한다. MYR34 균주가 뮤콘산 경로에서 작용하는 단백질을 코딩하는 aroZ, aroY 및 catAX 유전자를 발현하는 플라스미드로 형질전환되는 경우에, DHS의 뮤콘산으로의 전환이 발생한다. 그러나, MYR34 균주가 임의의 외부 유전자를 갖지 않는 비어있는 플라스미드 벡터(pCL1921)로 형질전환된 경우에, DHS의 뮤콘산으로의 전환은 발생하지 않는다.
도 13. DHS를 뮤콘산 경로로 전환하는 능력에 대한 aroZ 동족체의 비교. 세개의 다른 aroZ 동족체, 이름하여, 아시네토박터 sp.(Acinetobacter sp.) ADP1으로부터의 quiC, 바실러스 튜링겐시스(Bacillus thuringiensis)로부터의 asbF, 및 뉴로스포라 그라싸(Neurospora crassa)로부터의 qa-4는 P15 및 람다 PR 프로모터로부터 각각 catAX 및 aroY 유전자를 발현하는 저-모사 플라스미드(low-copy plasmid)에서 P26 프로모터 하에서 클로닝되었다. 이러한 세개의 다른 플라스미드 구조체는 형질전환을 통해 MYR34에서 발현되었고, 생산된 뮤콘산의 양은 측정되었다.
도 14. catAX, aroY 및 quiC의 단일 복제는 대장균의 MYR170 균주안으로 염색체로 통합되어(△aroE, △ack::P 15 -aroB), MYR352를 가져왔다(서열번호: 41). 또한, MYR170은, MYR219 균주로 이어지는 뮤콘산 경로의 작동에 필요한 모든 유전자를 가진 저-모사 플라스미드 pMG37로 형질전환되었다. MYR352 및 MYR219 모두는 YEp24(중-모사 비어있는 벡터(medium-copy empty vector)) 또는 pCP32AMP(중-모사 aroG 발현 플라스미드) 또는 pCP50(중-모사 aroG 및 tktA 발현 플라스미드)로 형질전환되었고, 생산된 PCA, 카테콜 및 뮤콘산의 양은 HPLC 방법을 사용하여 정량되었다.
도 15. catAX의 발현을 증가시키는 방법에 의한 MYR352에서 카테콜 축적의 제거. MYR352는 aroY만을 발현하는 플라스미드(pMG27) 또는 quiC만을 발현하는 플라스미드(pMG39) 또는 catAX, aroY 및 quiC의 세 개의 뮤콘산 경로 유전자를 발현하는 플라스미드(pMG37) 또는 catAX 및 aroY의 두 개의 뮤콘산 경로 유전자를 발현하는 플라스미드(pMG33)로 형질전환되었다. catAX만의 과다발현은 카테콜의 축적을 방지하기에 충분했다.
도 16. 글루코오스를 이입하기(importing) 위한 다른 시스템들을 사용하는 균주의 성장. ptsHI 및 galP(MYR31)의 결실은 최소 글루코오스 배지에서 성장의 결핍을 가져오지만, glf 및 glk 유전자(MYR217)의 도입은 다시 성장을 가져온다. 대조 균주 MYR34는 △aroE일 뿐, 야생형이었다. 세 개의 방향족 아미노산 및 세 개의 방향족 비타민은 영양요구성 균주의 성장을 허용하기 위해 배지에 첨가되었다.
도 17. 대장균의 MYR34 및 MYR217 균주에서 DHS 생산. DHS의 생산을 가져오는 플라스미드로 형질전환된 경우에, 글루코오스 이입을 위해 glf-glk를 활용하는 MYR217은, 포스포트랜스퍼라아제 시스템(phosphotransferase system (PTS))을 활용하는 MYR34의 형질전환체보다 더 높은 DHS 역가를 생산했다.
도 18. 7 리터 발효기에서 대장균의 MYR428 균주에 의해 뮤콘산의 생산. △aroE △ackA::P 15 -aroB △poxB::tktA의 유전자형을 갖는 대장균의 MYR261는 플라스미드 pCP32AMP 및 pMG37로 형질전환되어 대장균의 MYR428 균주를 생성했다.
본원에서 사용된 바와 같이, 문구 "예를 들어" 또는 "~와 같은"은 하나 이상의 방법, 접근법, 해결책, 또는 대상과 근접한 것의 조성물, 및 주어진 예들이 그 예시들로 제한되지 않는다는 것을 지시하는 것이다.
용어 "이종"은 유기체에서 천연 또는 자연적으로 발견되지 않지만 유전자 조작 기술, 예를 들어 형질전환, 교미, 또는 형질도입에 의해 유기체에 도입할 수 있는 유전자 또는 단백질을 지칭한다. 이종 유전자는 염색체 안으로 통합(삽입)되거나 플라스미드 상에 함유될 수 있다. 용어 " 외인성"은 유전자 조작 기술, 예를 들어 형질전환, 교미, 형질도입, 또는 돌연변이에 의해 활성을 증가, 감소 또는 제거하기 위한 목적으로 유기체 안으로 도입하거나 유기체에서 변형되는 유전자 또는 단백질을 지칭한다. 외인성 유전자 또는 단백질은 이종일 수 있거나, 이것은 숙주 유기체의 고유한 유전자 또는 단백질일 수 있지만, 하나 이상의 방법, 예를 들어 돌연변이, 결실, 프로모터의 변화, 종결자의 변화, 중복, 또는 염색체 또는 플라스미드에서 하나 이상의 추가적인 복제의 삽입에 의해 변형될 수 있다. 따라서, 예를 들어, 만일 aroB 유전자의 제2 복제가 네이티브 부위로부터 구별되는 염색체의 부위에서 삽입되면, 제2 복제는 외인성일 것이다.
본원에서 사용된 바와 같은 용어 "미생물"은 발효 공정을 통해 시스, 시스-뮤콘산의 상업적 생산을 위해 사용될 수 있는 박테리아, 고세균(archaea), 효모, 조류(algae) 및 사상균(filamentous fungi)을 포함한다.
명명을 위해서, 유전자 또는 코딩 영역은 이태릭체의 소문자로 보통 명명했으며, 예를 들어 aroZ는 효소 또는 단백질이 유전자에 의해 인코딩되는 한 동일한 문자로 명명될 수 있지만, 첫번째 문자는 대문자이고 이태릭체로, 예를 들어 "AroZ" 또는 "Aro1p"로 명명했으며, 이는 효모에서 효소 또는 단백질을 지정하기 위해 사용된 관습의 예이다. "p"는 지정된 유전자에 의해 인코딩된 단백질에 대한 약어이다. 효소 또는 단백질은 더 구체적인 이름에 의해 지칭될 수도 있는데, 예를 들어 AroZ는 3-디히드로쉬키메이트 탈수효소로 지칭될 수도 있다. 특정 촉매적 활성을 갖는 효소의 일 예를 인코딩하는 유전자 또는 코딩 영역은 다양한 이름을 가질 수 있는데, 그 이유는 이들이 역사적으로 다른 기원을 갖거나, 유전자가 다른 종들로부터 유래되기 때문이다. 예를 들어, 바실러스 튜링겐시스(Bacillus thuringiensis) 또는 바실러스 안트라시스(Bacillus anthracis)로부터 유래된 3-디히드로쉬키메이트 탈수효소를 인코딩하는 유전자는 aroZ 대신에 asbF로 명명될 수 있으며, 아스페르질루스 니둘란스(Aspergillus nidulans)로부터 유래된 관련 유전자는 qutC로 명명될 수 있으며, 뉴로스포라 크라싸(Neurospora crassa)로부터 유래된 관련 유전자는 qa-4로 명명될 수 있으며, 그리고 아시네토박터 바일이(Acinetobacter baylyi)(아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus) 및 아시네토박터 sp. ADP1 (Acinetobacter Sp. ADP1)로도 알려짐)로부터 유래된 관련 유전자는 quiC로 명명될 수 있다.
"플라스미드"는 염색체보다 실질적으로 작고, 염색체 또는 미생물의 염색체로부터 분리되고, 염색체 또는 염책체들로부터 별도로 복제하는 원형 또는 선형 DNA 분자를 의미한다. "플라스미드"는 세포 당 약 1회의 복제 또는 세포 당 1회 이상의 복제가 이루어질 수 있다. 미생물 세포 내에서 플라스미드의 일반적인 보존은 항생제 선택을 요구하지만, 영양요구의 상보성도 이용될 수도 있다.
박테리아 세포의 맥락에서 본 발명에서 사용된 바와 같은, 용어 "염색체" 또는 "염색체 DNA"는 플라스미드에 비해 실질적으로 큰 원형 DNA 분자이고, 어떤 항생제 선택도 필요로하지 않는다.
"발현 카셋(expression cassette)"은 적어도 프로모터, 및 효소 또는 다른 단백질을 코딩하는 유전자 또는 영역을 함유하는 염색체 또는 플라스미드의 일부일 수 있는 DNA 서열을 의미하는 것으로, 그 결과 코딩 영역은 프로모터에 의해 발현되고, 효소 또는 단백질은 DNA 서열을 함유하는 숙주 세포에 의해 생산된다. "발현 카셋"은 유전자 조작 방법에 의해 제작되거나 적어도 부분적으로 합성될 수 있어서, 코딩 영역은 코딩 영역과 자연발생적으로 연관되지 않은 프로모터로부터 발현된다. 임의적으로, "발현 카셋"은 코딩 영역과 자연발생적으로 연관되지 않은 종결자이거나 종결자가 아닐 수 있는 전사 종결자를 함유할 수 있다. "발현 카셋"은 하나 이상의 단백질에 대한 코딩 영역을 가질 수 있으며, 이 경우에서, 이것은 오페론(operon), 또는 합성 오페론이라고 불릴 수 있다.
유전자 또는 코딩 영역의 "과다발현"은 유전자 또는 코딩 영역에 의해 인코딩된 효소 또는 단백질이 동일하거나 유사한 성장 조건 하에서 숙주 미생물의 야생형에서 발견된 수준보다 높은 수준으로 숙주 미생물에서 생성되도록 유발하는 것을 의미한다. 이는 예를 들어, 하기 방법들 중 하나 이상에 의해 달성될 수 있다: 1) 더 강력한 프로모터의 도입, 2) 번역 시작 코돈의 약 4~10 염기 상류에 위치된 DNA 서열 5'-AGGAGG와 같은 더 강력한 리보솜 결합 부위의 도입, 3) 종결자 또는 더 강력한 종결자의 도입, 4) 코딩 영역들 중 하나 이상의 부위에서 코돈들의 선택을 개선, 5) mRNA 안정성을 개선, 및 6) 염색체에 다수의 복제를 도입하거나 다중복제(multicopy) 플라스미드 상에 카셋을 위치시키는 것에 의해 유전자의 복제 횟수를 증가시키는 것. 과다발현되는 유전자로부터 생산된 효소 또는 단백질은 "과다생산"이라 부른다. "과다발현"되는 유전자 또는 "과다생산"되는 단백질은 숙주 미생물에 대해 고유한 것일 수 있거나, 이것은 다른 유기체로부터 유전자 조작 방법에 의해 숙주 미생물 안으로 이식되는 것일 수 있으며, 이 경우에, 효소 또는 단백질 및 그 효소 또는 단백질을 인코딩하는 유전자 또는 코딩 영역은 "외래(foreign)" 또는 "이종"으로 불린다. 외래 또는 이종 유전자 및 단백질은 유전자 조작되지 않은 숙주 유기체에 존재하지 않기 때문에, 과다발현 및 과다생산을 정의한다.
제1 유전자, DNA 서열 또는 단백질의 "동족체"는 상기 제1 유전자, DNA 서열 또는 단백질과 유사한 생물학적 기능을 수행하는 제2 유전자, DNA 서열 또는 단백질이고, 서열 비교를 위한 BLAST 컴퓨터 프로그램(Altschul et al, 1990; Altschul et al, 1997)에 의해 결정된 바와 같이 상기 제1 유전자 또는 단백질과 25% 이상의 서열 상동성(단백질 서열을 비교하거나 유전자 서열로부터 유래된 단백질 서열을 비교하는 경우에)을 가지고, 결실과 삽입을 가능하게 한다. 대장균 aroG 유전자의 동족체의 예는 살모넬라 타이피뮤리움(Salmonella typhimurium)로부터 유래된 aroG일 것이다.
제1 유전자, DNA 서열 또는 단백질의 "유사체"는 상기 제1 유전자, DNA 서열 또는 단백질과 유사한 생물학적 기능을 수행하는 제2 유전자, DNA 서열 또는 단백질이고, 서열 비교를 위한 BLAST 컴퓨터 프로그램(Altschul et al, 1990; Altschul et al, 1997)에 의해 결정된 바와 같이 상기 제1 유전자 또는 단백질과 25% 미만의 서열 상동성(단백질 서열을 비교하거나 유전자 서열로부터 유래된 단백질 서열을 비교하는 경우에)을 가지고, 결실과 삽입을 가능하게 한다. 폐렴간균 AroZ 단백질의 유사체의 예는 아스페르질루스 니둘란스(Aspergillus nidulans)로부터 유래된 QutC 단백질일 것이며, 그 이유는 두 개의 단백질 모두 3-디히드로쉬키메이트 탈수 반응을 촉매하는 효소이지만, 두 개의 효소 또는 그들의 개별적인 유전자들 간에 유의한 서열 상동성이 없기 때문이다. 당해 분야의 통상의 기술자는 특정 생물학적 기능을 갖는 많은 효소 및 단백질, 예를 들어 DAHP 합성 효소 또는 3-디히드로쉬키메이트 탈수효소가 많은 다른 유기체들에서 동족체 또는 유사체로서 발견될 수 있다는 것을 알 것이고, 이러한 효소 또는 단백질 군들의 멤버들은 동일한 기능을 공유할 수 있기 때문에, 그들이 구조적으로 약간 또는 실질적으로 상이할 수 있다 하더라도, 동일한 군의 다른 멤버들은 많은 경우에서 현재 유전자 조작 방법을 사용하여 동일한 생물학적 기능을 수행하도록 사용될 수 있다. 따라서, 예를 들어, AorZ 효소 및 QutC 효소는 동일한 반응, DHS 탈수 효소를 촉진하고, 이들 중 어느 것이나 적당한 전후 사정에서 시스, 시스-뮤콘산의 생산을 가져올 것이고, 어느것을 사용할지에 대한 선택은 궁극적으로 유사한 발효 조건 하에서 시스, 시스-뮤콘산의 더 높은 역가를 가져오는 것을 선택함으로써 이루어질 수 있다.
"비-방향족 탄소원" 또는 "비-방향족 화합물"은 탄소 및/또는 에너지의 공급원으로서 발명의 미생물을 먹이기 위해 사용될 수 있는 탄소-함유 화합물이며, 여기서 상기 화합물은 벤젠과 관련된 6각형 고리를 함유하지 않는다. 비-방향족 탄소원의 예는 글루코오스, 자일로오스, 락토오스, 글리세롤, 아세테이트, 아라비노오스, 갈락토오스, 만노오스, 말토오스, 또는 수크로오스를 포함한다. "방향족 화합물"은 벤젠과 관련된 6각형 고리를 하나 이상 함유하는 화합물이다. 방향족 화합물의 예는 카테콜, 또는 1,2-디히드록시 벤젠이다.
"강력한 구성 프로모터(strong constitutive promoter)"는 RNA 중합효소에 의해 전사되는 DNA 서열 또는 유전자의 (관습적으로 5'에서 3'방향으로 제시되는 경우에 유전자의 5'측으로부터) 상류에 일반적으로 놓여있고, 상기 DNA 서열 또는 유전자가 RNA 중합효소에 의한 전사에 의해 발현되도록 하되, 임의의 적절한 검정 과정에 의해 직접 또는 간접적으로 손쉽게 검출되는 수준으로 발현되도록 유발하는 DNA 서열이다. 적절한 검정 과정의 예는 1) 정량적 역 전사효소 + PCR, 2) 인코딩된 효소의 효소 검정, 3) 쿠마시 블루-염색된(Coomassie Blue-stained) 단백질 겔, 또는 4) 상기 전사의 결과로서 간접적으로 생산되는 대사물의 주목할만한 생산, 그리고 이러한 주목할만한 전사는 전사, 대사, 또는 유도 화학물질의 수준을 특이적으로 조절하는 단백질의 존재 또는 부재에 상관없이 발생하는 것을 포함한다. "강력한 구성 프로모터"가 아닌 프로모터의 예는 대장균의 P1ac 프로모터인데, 그 이유는 락토오스 또는 유도자 IPTG의 부재하에서 억제물질에 의해 억제되기 때문이다. 당해 분야에 잘 알려진 방법을 사용함으로써, "강력한 구성 프로모터"는 네이티브 프로모터(DNA 서열 또는 유전자로부터 상류에 자연발생적으로 존재하는 프로모터)를 교체할 수 있으며, 그에 의하여 플라스미드 또는 염색체 중 어느 하나에 위치될 수 있고 소정의 DNA 서열 또는 유전자의 발현 수준을 네이티브 프로모터로부터의 수준에 비해 더 높은 수준으로 제공하는 발현 카셋을 얻었다. 강력한 구성 프로모터는 종 또는 속에 대해 특이적일 수 있지만, 박테리아로부터 유래된 강력한 구성 프로모터는 종종 먼 친척의 박테리아에서 잘 기능할 수 있다. 예를 들어, 고초균(Bacillus subtilis) 또는 고초균 상에서 정상적으로 성장하는 파지으로부터의 프로모터는 대장균에서 잘 기능할 수 있다. "강력한 구성 프로모터"는 Ptac와 같은 유도성 프로모터와 실질적으로 상이하며, 이때 상기 Ptac는 시스, 시스-뮤콘산의 선행 기술 생산에서 사용되어 왔고, 기능의 소정 수준을 위해 비싼 화학물질 또는 다른 환경적 변화를 필요로한다(Niu 등, 2002). 강력한 구성 프로모터의 예는 고초균 파지 SP01 및 대장균 분해 바이러스 람다 PR (서열번호: 1, 2 및 3)로부터의 P15, P26이다.
"뮤코닉 경로" 또는 "뮤콘산 경로"는 DHS로부터 PCA로, PCA로부터 카테콜로, 카테콜로부터 시스, 시스-뮤콘산으로의 생화학적 경로를 지칭하고, "뮤코닉 경로 유전자" 또는 "뮤콘산 경로 유전자"는 뮤코닉 경로의 단계를 촉진하는 효소를 인코딩하는 유전자이거나, 상기 효소들 중 하나의 활성을 향상시키는 역할을 하는 보조 기능을 인코딩하는 유전자, 예를 들어 aroZ, aroY, catA, catX, 및 qutC일 수 있다. DHS는 3-디히드로쉬키메이트에 대한 약어이고, PCA는 프로토카테큐산에 대한 약어이다. "뮤코닉 플라스미드"는 하나 이상의 뮤코닉 경로 유전자를 함유하는 플라스미드이다.
본 발명에서 사용된 유전자 조작기술 중 일부는 도 1에 도시된 박테리아 세포에서 존재하는 방향족 아미노산 생합성에 대한 공통 경로에 집중된다. 또한, 도 1에 도시된 바와 같은, DAHP 합성효소로부터 코리스메이트 합성효소로 방향족 아미노산 생합성을 위한 공통 경로는 "쉬킴산 경로"로 지칭된다.
방향족 아미노산, 페닐알라닌, 티로신 및 트립토판의 생산을 위한 미생물의 유전자 조작에 대해 연구한 방대한 양의 발행된 작업물들이 존재한다(US 4,681,852, US 4,753,883, US 6,180,373, 유럽특허출원 86300748.0). 접근법들은 피드백 내성 효소(AroF, AroG, PheA, TyrA), 전사의 억제의 탈조절(tyrR), 프로모터 강도를 증가시키는 것(Ptac, P1ac) 및 하나 이상의 유전자의 복제수를 증가시키는 것(tktA)의 다양한 조함들을 사용하는 것을 포함한다. 그러나, 상기 접근법들의 많은 특정 조합들은 시도되지 않았는데, 그 이유는 지나친 실험 없이는 너무 많은 조합들이 시도되어야 하기 때문이거나, 어떤 조합이 최고일지에 대한 통찰력의 결여 때문이다. 더 중요하게는, 재생가능한, 비-방향족 탄소원을 사용하는 뮤콘산의 상업적 생산을 위한 생촉매의 개발에서 유전자 조작의 임의의 이러한 조합들의 적합성은 아직 알려져 있지 않다.
방향족 아미노산 생합성 경로는 많은 미생물, 특히 대장균에 대해 잘 알려져 있다(Neidhardt 및 Curtiss, 1996). 야생형 세포에서, 경로는 피드백 억제 및 전사의 억제 모두에 의해 밀접하게 조절된다. 제1 개입단계는 디옥시-아라비노-헵툴로소네이트 7-포스페이트(DAHP) 합성효소(deoxy-arabino-heptulosonate 7-phosphate (DAHP) synthase)에 의해 촉매되며, 거기에는 aroF, aroG 및 aroH에 의해 인코딩되는 세 개의 동종효소가 존재한다. 세 개의 동종효소인 AroF, AroG 및 AroH는 티로신, 페닐알라닌 및 트립토판에 의해 각각 방향족 아미노 생합성 경로의 생성물들을 억제하는 피드백이다. 세 개 모두의 피드백 내성 돌연변이는 잘 알려져 있다(Draths 등, 1992; Lutke-Eversloh and Stephanopoulos, 2007; Hu 등, 2003; Shumilin 등, 1999). 본 발명의 일 양태는 AroF, AroG 및 AroH 효소 단백질을 발현하기 위하여 aroF, aroG 및 aroH 유전자의 피드백 내성 대립 유전자의 사용을 수반하는데, 상기 효소 단백질들은 방향족 아미노산 생합성 경로의 생성물들에 의한 피드백 억제에 대해 내성을 가진다. 방향족 경로에 수반된 몇몇 오페론의 전사는 tyrR 유전자에 의해 인코딩된 억제자 또는 trpR 유전자에 의해 인코딩된 억제자 중 어느 하나에 의해 조절되거나, 아니면 둘 모두에 의해 조절된다(Neidhardt 등, 1996). 특히 중요한 것은, TyrR 단백질이 하나 이상의 방향족 아미노산과 결합되는 경우에, TyrR 단백질에 의한 aroG 및 aroF의 전사의 음성 조절이다. 본 발명의 일 양태는 숙주 박테리아 균주의 염색체로부터 이러한 유전자를 없애는 방식으로 tyrR 또는 trpR 유전자에 의한 음성 조절의 제거를 수반한다.
본 발명의 대상은, 시스, 시스-뮤콘산 생산 균주의 대량 상업적 생산을 위한 발효 파라미터 및 적합성을 증가시키기 위한, 신규한 유전적으로 조작된 요소와 유전적으로 조작된 카셋의 신규한 조합의 창작물이다. 구체적으로, 시스, 시스-뮤콘산의 생산을 위한 선행기술은 유전적 요소의 특정 조합, 예를 들어 이에 제한되지않지만, 과다생산된 피드백 내성 AroG, 과다생산된 피드백 내성 AroF, 과다발현된 tktA, 과다발현된 talA, 강력한 구성 프로모터로부터 aroZ, aroY 및 catAX(또는 그의 유사체 또는 동족체)를 발현하기 위한 염색체로 통합된 카셋, 및 방향족 아미노산 및 비타민에 대해 프로토트로피(prototrophy)를 부여하지만 방향족 화합물의 현저한 분비를 가져오지 않는 AroE 효소를 인코딩하는 유전자로서 정의한 누출성 aroE 대립유전자의 다양한 조합을 교시하지 않았다.
본원에 개시된 균주 구조체의 모든 특정 예들은 야생형 대장균 C 균주(ATCC 8739), 또는 대장균 K-12 균주(YMC9 또는 MM294)로부터 유래되지만, 본원에 개시된 유전적 요소는 임의의 다른 적절한 대장균 균주에 결합될 수 있고, 본원에 개시된 유전적 요소의 발현 카셋 또는 적절한 유사체 및 동족체는, 발효 공정을 통한 시스, 시스-뮤콘산의 상업적 생산에 사용될 수 있는 박테리아, 고세균, 효모, 조류 및 사상균의 다른 종들과 같은 임의의 다른 적절한 미생물에 결합될 수 있다.
대장균에서, 글루코오스로부터 방향족 아미노산 생합성 경로는 펜토오스 포스페이트 경로(PPP)의 비-산화 분지(branch)로 시작한다. 비-산화 펜토오스 포스페이트 경로에서 4개의 주요 효소는 트랜스케토라아제(transketolase), 트랜스알돌라아제(transaldolase), 리불로오스-5-포스페이트 에피머라아제(ribulose-5-phosphate epimerase) 및 리불로오스-5-포스페이트 이소머라아제(ribulose-5-phosphate isomerase)이다. 이러한 효소는 헥소오스 또는 펜토오스 당으로부터 에리트로오스 4-포스페이트(E4P)의 형성을 가져오는 반응을 촉진한다. 대장균에서 E4P의 이용율을 증가시키기 위하여, 트랜스케토라아제를 인코딩하는 tktA 유전자는 과다발현될 수 있다(Niu 등, 2002). 유사하게, 트랜스알돌라아제 유전자의 과다발현도 일부 상황에서 E4P의 이용율을 증가시키는 것으로 예상된다(Bongaerts 등, 2001). 본 발명의 또 다른 양태에서, 트랜스케토라아제 및 트랜스알돌라아제 유전자 모두의 발현은 유전자 조작을 통해 향상되어, 트랜스케토라아제 및 트랜스알돌라아제 효소의 활성에 증가를 가져온다. 본 발명의 또 다른 양태에서, PPP의 비-산화 분지를 통한 플럭스는 리불로오스-5-포스페이트 에피머라아제 및 리불로오스-5-포스페이트 이소머라아제를 과다생산하는 것에 의해 증가된다.
공통 방향족 아미노산 경로에서 제1 개입단계 및 가장 긴밀히 조절된 반응은 DAHP 합성효소(aroG, aroF, 및 aroH에 의해 인코딩됨)에 의해 포스포에놀피루베이트(PEP) 및 E4P를 축합하여, 디옥시아라비노-헵툴로소네이트 7-포스페이트(DAHP)(deoxyarabino-heptulosonate 7-phosphate (DAHP))를 생산하는 것이다. 대장균에 의해 소비된 D-글루코오스는 일부 PPP를 통해 그리고 일부 해당 작용을 통해 방향족 생합성 안으로 이동된다. 트랜스케타로오스(tktA) 및 DAHP 합성 효소(aroG)의 동종효소가 그들의 복제수를 증가시키는 것에 의해 그들의 발현을 증가시키는 플라스미드로 형질전환하는 것을 통해 증폭되는 경우에, 방향족 경로 안으로 글루코오스의 흐름은 상당히 증가된다(Niu 등, 2002). 본 발명의 바람직한 양태에서, 외인성 aroG 및 tktA 유전자는 트랜스케토라아제 및 DAHP 합성효소 효소들의 활성을 증폭시키기 위한 목적으로 염색체 DNA 안으로 통합된다.
본 발명의 또 다른 실시예에서, 미생물 세포 내에서 PEP를 통한 플럭스는 DAHP의 합성에 대한 PEP 이용성을 증가시키는 것에 의해 개선된다. 많은 박테리아 세포 속(genera)은 포스포트랜스퍼라아제 시스템(PTS)을 사용하여 글루코오스를 세포막을 통과하여 운반하는데에 PEP를 소비하는데, 여기서 하나의 PEP 분자는 박테리아 외부막을 통과하여 운반된 글루코오스 각각의 분자에 대해 소비된다. PEP-의존성 PTS를 비-PEP 의존성(PEP 비의존성) 글루코오스 활용 기작으로 교체하거나 보완함으로써, 미생물 세포 내에서 방향족 아미노산 생합성 경로에 대해 이용가능한 PEP의 풀 크기를 증가시키는 것이 가능하다. 예를 들어, 당 활용을 위한 PTS 시스템은 GalP-기반의 당 활용 시스템 또는 Glf/Glk 단백질에 기초한 당 운반 시스템에 의해 교체되거나 보완될 수 있다(Chandran 등, 2003; Yi 등, 2003). 미생물 세포 내에서 PEP 풀을 보전하기 위하여 당 활용을 위한 PTS 시스템을 삭제하는 것 외에 본 발명의 바람직한 양태에서, GalP 기반 당 활용 시스템도 미생물 세포 내에서 ATP를 보전하기 위한 목적으로 비활성화된다. PTS 시스템 및 Gal-P 기반 당 활용 시스템(△PTS/△galP) 모두의 기능에 결함이 있는 미생물 세포에서, 당 활용은 Glf를 코딩하는 외인성 유전 또는 Glf(글루코오스 촉진 확산 단백질) 및 Glk(글루코키나아제) 단백질 모두를 인코딩하는 외인성 유전자를 도입하는 방식으로 달성될 수 있다. 본 발명에서 사용된 바와 같이, 용어 기능성 글루코오스-촉진 확산 단백질은 임의의 Glf 단백질을 말하는 것 뿐만 아니라, Glf에 대한 기능적 등가물이고 촉진 확산에 의해 당을 미생물 세포 안으로 운반하는 기능을 갖는 임의의 다른 단백질을 말한다. 본 발명의 일 양태에서, 글루코오스 촉진자 단백질 Glf를 코딩하는 유전자는 △PTS/△galP인 미생물 세포 안으로 도입되고, 미생물 세포 안으로 운반된 글루코오스는 내인성 글루코오스 키나아제에 의해 인산화된다. 본 발명의 또 다른 양태에서, Glf 및 Glk 단백질을 코딩하는 유전자는 △PTS/△galP인 미생물 세포 안으로 도임된다. 본 발명의 바람직한 양태에서, 미생물 세포 안으로 도입된 외인성 glf 및 glk 유전자는 숙주 염색체 DNA 안으로 통합된다.
본 발명의 또 다른 실시예에서, 성장 및 에너지를 위한 탄소원이 글루코오스신생합성을 위해 필요한 경우에(예를 들어, 만일 탄소원이 아세테이트 또는 숙시네이트이면), PEP 풀은 세포 내에 이미 존재하는 카복실화 효소, 예를 들어 PEP 카복시키나아제의 활성을 증가시키는 것에 의해 증가될 수 있으며, 상기 카복실화 효소는 외인성 카복실화 효소를 도입하거나 대장균에서 pck에 의해 인코딩된다. 바람직한 실시예에서, 카복실화 효소를 코딩하는 도입된 외인성 유전자는 숙주 염색체 안으로 안정하게 통합된다. 카복실화 효소를 코딩하는 유전자는 다양한 미생물 종으로부터 유래될 수 있다. 카복실화 효소를 코딩하는 유전자는 유전자 조작을 더 거칠 수 있어서, 시스, 시스-뮤콘산 생산용 생촉매 내에서 카복실화 효소의 발현이 현저히 향상된다.
본 발명의 또 다른 실시예에서, 미생물 세포 안의 PEP 풀은, PEP를 기질로서 사용하는 PykA 및 PykF와 같은 피루베이트 키나아제 효소의 활성을 감소시키거나 없애는 것에 의해 증가된다.
DAHP로부터, 방향족 아미노산 경로는 많은 중간체를 거쳐서 코리스메이트(CHA), 세 개의 방향족 아미노산, 즉, L-티로신(L-Tyr), L-페닐알라닌(L-Phe), 및 L-트립토판(L-Trp)의 생합성을 위한 분지점으로 진행한다.
공통 방향족 아미노산 경로의 초기 단계에서, 3-디히드로퀴네이트(DHQ) 합성효소(AroB)는 DAHP로부터 인산기를 제거하여, DHQ의 형성을 가져온다. 효소 DHQ 탈수효소(AroD)는 DHQ로부터 물 분자를 제거하여, 3-디히드로쉬키메이트(DHS)의 형성을 가져오며, 이는 이후에 쉬키메이트 디히드로게나아제(AroE)에 의해 쉬키메이트(SHK)로 환원된다. 쉬키메이트 키나아제 I/II(AroK, AroL)은 쉬키메이트를 쉬키메이트 3-포스페이트(S3P)로 인산화한다. S3P을 PEP와 축합하여, 5-에놀피루보일쉬키메이트 3-포스페이트(EPSP)(5 enolpyruvoylshikimate 3-phosphate (EPSP))의 형성을 가져온다. EPSP의 형성은 EPSP 합성효소(AroA)에 의해 매개된다. EPSP로부터의 인산기는 코리스메이트 합성효소(AroC)에 의해 제거되어, 코리스메이트(CHA)의 형성을 가져온다.
도 2에서 보는 바와 같이, 방향족 아미노산 경로는 aroE 유전자의 돌연변이에 의해 3-디히드로쉬키메이트(DHS)에서 쉬키메이트(SHK)로의 전환 수준에서 차단될 수 있어서, DHS의 축적이 유발된다(Niu 등, 2002). 외인성 aroZ 유전자의 도입은 DHS를 프로토카테츄에이트(protocatechuate)(PCA)로 전환하기 위해 기능한다. PCA는 이후에 AroY 효소에 의해 매개된 탈카복실화 반응을 통해 카테콜로 전환된다. 카테콜은 catA 유전자 산물의 작용을 통해 시스-시스 뮤콘산(ccMuA)으로 궁극적으로 전환된다. ccMuA는 말레일 아세토아세테이트 이소머라아제(maleyl acetoacetate isomerase)에 의한 작용에 따라 트랜스-트랜스 뮤콘산(ttMuA)을 수득할 수 있다. DHS로부터 ccMuA 및 ttMuA로의 생합성 경로는 뮤콘산 경로로 지칭된다. DHS에서 ccMuA로의 전환을 책임지는 세 개의 다른 유전자는 다양한 미생물 종들로부터 얻어질 수 있고, 대장균과 같은 뮤콘산 생산을 위해 선택된 미생물 안으로 도입될 수 있다. 본 발명의 바람직한 실시예에서, 뮤콘산 경로에 수반된 단백질을 코딩하는 외인성 유전자는 숙주 염색체 DNA 안으로 통합된다.
방향족 아미노산 경로를 aroE 유전자의 시스,시스-뮤콘산 돌연변이의 생산으로 전용하는 것은 중요한 것이다. aroE 유전자는 완전히 비활성화되어 방향족 아미노산의 생합성에 완전한 차단을 가져오며, 이는 뮤콘산 생산에 대해 설명된 대장균의 WN1/pWN2.248 균주에서 이루어진 것과 같다(Niu 등, 2002). WN1/pWN2.248 대장균 균주 및 관련 균주의 중요한 단점은 aroE 유전자의 완전한 비활성화 때문에 이러한 균주가 전술한 페닐알라닌, 티로신 및 트립토판과 같은 방향족 아미노산, 및 방향족 비타민 또는 비타민 유사 화합물에 대해 영양 요구성이 된다는 것이다. 그 결과, 시스, 시스-뮤콘산의 생산을 위한 이런 균주의 성장 중에는 이러한 6개의 화합물(또는 쉬키메이트와 같은 공통 중간체)의 외인성 첨가를 필요로하며, 이에 의하여 이러한 균주를 사용하는 시스, 시스-뮤콘산의 상업적 생산 비용이 실질적으로 부가된다. 방향족 아미노산의 외인성 공급원에 대한 이런 의존성을 극복하기 위한 신규한 접근법은, aroE에서 누출 돌연변이를 갖는 균주를 사용하는 것이다. 누출 aroE 돌연변이는 탄소의 제한된 흐름을 쉬킴산에 제공하면서 DHS의 상당량을 축적하도록하여, 이후에 AroZ 효소의 작용에 의해 PCA로 전환을 용이하도록 한다. 따라서, aroE의 누출 돌연변이 형태의 사용은 외인성 방향족 아미노산에 대한 의존성을 없앨 것이며, 이와 동시에 탄소의 흐름을 여전히 시스, 시스-뮤콘산으로 돌린다.
DHS를 시스, 시스-뮤콘산으로 전환하기위해 필수적인 AroZ, AroY 및 CatA 단백질의 합성을 코딩하는 유전자는 많은 미생물 종으로부터 유래될 수 있다. 일 실시예에서, 이러한 외인성 유전자는 개발된 생촉매의 숙주 염색체 안으로 통합된다. 다른 실시예에서, 생촉매 내에서 이러한 외인성 유전자의 발현은 어떠한 유도물질의 필요 없이 구성 프로모터에 의해 유발된다.
효소 3-디히드로쉬키메이트 탈수효소(AroZ; EC 4.2.1.118)는 중간체 프로토카테츄에이트의 생합성을 위해 필요하다. 본원에서, "AroZ"는 3-디히드로쉬키메이트 탈수효소 반응을 촉진하는 임의의 효소를 지칭할 것이다. 선행기술에서, 이런 효소는 폐렴간균 균주 A170-40(ATCC25597)(Niu 등, 2002; Draths and Frost, 1995)의 aroZ 유전자로부터 발현된다. 그러나, AroZ의 특이적 활성은 0.1 내지 261 마이크로몰/분/mg으로 유기체들 간에 광범위하게 다르고(Wheeler 등, 1996; Fox 등, 2008; Pfleger 등, 2008), 그래서 현저한 개선은 폐렴간균, 예를 들어 아신테오박터 바일이(Acinteobacter baylyi), 에머리셀라 니둘란스(Emericella nidulans)로도 현재 알려져 있는 아스페르길루스 니둘란스(Aspergillus nidulans)(Wheeler 등, 1996) 또는 뉴로스포라 크라싸(Neurospora crassa)(Rutledge, 1984; Stroman 등, 1978), 또는 포도스포라 파우시세타(Podospora pauciseta)로도 알려져있는 포도스포라 안세리나(Podospora anserina)(Hansen 등, 2009)보다 특이적 활성이 더 높은 유기체로부터, asbF(Fox 등, 2008; Pfleger 등, 2008), qutC(Wheeler 등, 1996), qa-4(Rutledge, 1984), 및 quiC로도 알려진 aroZ 유전자를 발현시키는 것에 의해 이루어질 수 있다.
일 특정 예로서, 3-디히드로쉬키메이트 탈수효소를 인코딩하는 뉴로스포라 크라싸에서 qa-4 유전자에 대한 코딩 서열은 임의의 몇몇 잘 알려진 방법, 예를 들어 전 유전자 DNA 합성, cDNA 클로닝에 의해 얻어지거나, 게놈 DNA 클로닝 및 PCR 또는 합성 DNA 링커 합성의 조합에 의해 얻어질 수 있다. qa-4 유전자에 인트론이 존재하지 않기 때문에, 코딩 영역은 게놈 DNA로부터 PCR에 의해 얻어질 수 있다(Rutledge, 1984). qa-4 효소의 단백질 서열(서열번호: 4) 및 네이티브 유전자의 DNA 서열(서열번호: 5)는 알려져 있다.
대안으로, 발현 카셋은 아스페르길루스 니둘란스로부터 3-디히드로쉬키메이트 탈수효소에 대해 제작될 수 있다. 아스페르길루스 니둘라스에서 QitC 효소에 대한 코딩 서열은 임의의 몇몇 잘 알려진 방법, 예를 들어 전 유전자 DNA 합성, cDNA 클로닝에 의해 얻어지거나, 게놈 DNA 클로닝 및 PCR 또는 합성 DNA 링커 합성의 조합에 의해 얻어질 수 있다. QutC의 단백질 서열(서열번호: 6) 및 인트론을 함유하지 않은 네이티브 유전자의 DNA 서열은 알려져 있다(서열번호: 7; GenBank accession number M77665.1). 발현 카셋은 DNA 합성에 의해 얻어지거나, 게놈 클로닝 및 PCR의 조합에 의해 얻어질 수 있어서, QutC 효소는 대장균에서 정밀하게 생산될 수 있다. 대장균에서 강력한 구성 프로모터로부터 QutC에 대한 코딩 서열을 발현함으로써, 충분한 발현은 염색체에 통합된 유전자의 1회 또는 2회 복제로부터 얻어질 수 있으며, 선행기술(Niu 등, 2002)에서 개시되는 바와 같은 불안정성을 초래할 수 있는 다중복제 플라스미드 상에서 발현 카셋의 2회 초과의 복제를 유지할 필요성을 제거하였다. 전술한 방법은 희망하는 효소를 코딩하는 DNA 서열을 얻기 위해 일반적으로 사용될 수 있고, 이러한 코딩 서열은 이후에 대장균 또는 다른 적절한 미생물 숙주 유기체에서 기능하도록 설계된 발현 카셋을 제작하기 위해 사용될 수 있다.
AroZ의 특이적 활성은 또한 선행기술(Niu 등, 2002)로부터의 단백질 서열을 사용하는 것에 의해 개선될 수 있지만, 실시예 4에서 설명하는 바와 같은 강력한 프로모터 및/또는 리보솜 결합 부위(RBS)가 코딩 영역 앞에 장착된, 개선된 발현 카셋을 제작하는 것에 의해서도 개선될 수 있다.
폐렴간균 균주 A170-40에서 aroZ 유전자(3-디히드로쉬키메이트 탈수효소)를 인코딩하는 aroZ 유전자는 선행기술에서 설명한 바와 같이 얻어질 수 있다. 유전자의 DNA 서열 및 주변 DNA(surrounding DNA)는 당해 분야에 잘 알려진 방법에 의해 확인될 수 있다. aroZ와 같은 본 발명의 이종 유전자는 네이티브 DNA 서열을 사용하여 발현 카셋 안에 포함되거나, 의도된 숙주 유기체에 대한 코돈 최적화 서열로 합성될 수 있다. aroZ 유전자는 활성 aroZ 유전자, 예를 들어, 폐렴간균 균주 342, 아시네토박터 sp. ADP1(Acinetobacer Sp. ADP1)(아시네토박터 바일이 ADP1(Acinetobacter baylyi ADP1)), 바실러스 튜링겐시스(Bacillus thuringiensis), 에머리셀라 니둘란스(Emericella nidulans), 어위니아 아밀로보라(Erwinia amylovora), 슈도모나스 푸티다 W619(Pseudomonas putida W619), 등을 함유하는 임의의 다른 미생물로부터 설명된 바와 같이(Draths and Frost, 1995) 클로닝될 수 있다.
효소 프로토카테츄에이트 디카복실라아제(AroY; EC 4.1.1.63)는 중간체 카테콜의 생합성을 위해 필요하다. 본원에서, "AroY"는 프로토카테츄에이트 디카복실라아제 반응을 촉진하는 임의의 효소를 지칭할 것이다. 선행기술에서, 이런 효소는 다중복제 플라스미드 상에서 폐렴간균 균주 A170-40(ATCC25597)의 aroY 유전자로부터 발현된다(Niu 등, 2002). 그러나, 공정에서의 개선은 숙주 유기체의 염색체 내에 통합된 발현 카셋의 1회 또는 2회의 복제로부터 충분한 효소를 생산하는 것에 의해 얻을 수 있다. 이는 선행 기술의 폐렴간균 AroY 효소의 특이적 활성에 비해 더 높은 특이적 활성을 갖는 AroY 효소를 자연적으로 생산하는 유기체로부터 aroY 유전자를 얻는 것에 의해 달성될 수 있거나, 강력한 구성 프로모터 및/또는 실시예 4 하에서 설명되는 강력한 RBS를 사용하는 것과 같은 발현 카셋을 제작하여 폐렴간균 AroY의 발현 수준을 증가시키는 것에 의해 달성될 수 있다. 폐렴간균 균주 A170-40에서 AroY에 대한 단백질 서열은 서열번호: 8로 주어진다. 해당 유전자, aroY는 전술한 바와 같이 클로닝되거나(Draths and Frost, 1995), 단백질 서열에 기초하여, 의도된 숙주 유기체에 대한 최적화 코돈을 갖도록 합성될 수 있다.
aroY 유전자는, 예를 들어, 폐렴간균 NCTC418(ATCC15380), 폐렴간균 342, 및 아륵술라 아데니니보란스(Arxula adeninivorans)(Sietmann 등, 2010)와 같은 동족체 또는 유사체를 함유하는 임의의 다른 미생물로부터 얻어질 수 있다. 폐렴간균 342에서 aroY 유전자의 DNA 서열 및 주변 DNA는 서열번호: 9로 주어진다.
효수 카테콜 1,2-디옥시게나아제(CatA; EC 1.13.11.1)는 시스, 시스-뮤콘산 생합성의 마지막 단계에서 필요하다. 본원에서, "CatA"는 카테콜 1,2-디옥시게나아제 반응을 촉진하는 임의의 효소를 지칭할 것이다. 선행기술에서, 이런 효소는 다중복제 플라스미드 상에서 아시네토박터 칼코아세티쿠스 균주 ADP1(Acinetobacter calcoaceticus strain ADP1)의 catA 유전자로부터 발현된다(Niu 등, 2002). 공급원 균주인 아시네토박터 칼코아세티쿠스 균주 ADP1은 분명히 아시네토박터 sp. ADP1 및 아시네토박터 바일이 ADP1으로 재명명되었다(Neidle 및 Ornston, 1986; Barbe 등, 2004; de Berardinis 등, 2008). 이런 선행기술의 예에서, catA 유전자는 유도물질로서 락토오스 또는 IPTG(이소프로필티오갈락토시드) 중 어느 하나가 필요한 Ptac 프로모터로부터 발현되었다. 이러한 화합물은 상업적 발효에서 사용하기에 너무 비싸기 때문에, 값비싼 유도물질에 대한 필요를 없애고 염색체에 발현 카셋을 통합하는 것에 의해 더 안정한 균주를 제작하기 위하여 역시나 공정의 상당한 개선이 필요하다. 이는 다른 예들에서 전술한 바와 같은 강력한 구성 프로모터, 강력한 RBS, 및/또는 더 안정한 mRNA를 사용하는 catA 유전자에 대한 발현 카셋을 제작하는 것에 의해 달성될 수 있다.
아시네토박터 바일이 ADP1에서 catA 유전자의 DNA 서열 및 주변 서열은 서열번호: 10으로 주어진다. 동일한 균주에서 CatA에 대한 단백질 서열은 서열번호: 11로 주어진다. 바람직한 실시예에서, catA에 대한 발현 카셋은, catA 유전자의 발현 수준을 증가시키기 위하여 catA로부터 하류에 자연적으로 존재하는 하나 또는 두 개의 추가적인 오픈리딩프레임을 함유한다(Schirmer 및 Hillen, 1998). 많은 다른 유기체들, 예를 들어 슈도모나스 아빌라(Pseudomonas arvilla), 슈도모나스 플루오레센스(Pseudomonas fluorescens)(Nakazawa 등, 1967; Kojima 등, 1967), 스트렙토미세스 Sp. 균주 2065(Streptomyces Sp. Strain 2065)(Iwagami 등, 2000), 큐프리아비두스 네카터 335T(Cupriavidus necator 335T) 및 많은 다른 것들(Perez-Pantoja 등, 2008)은 catA 유전자에 대한 공급원일 수 있다.
시스, 시스-뮤콘산으로의 탄소의 흐름을 개선하기 위하여, 누출 aroE 돌연변이를 사용하는 것에 의해 DHS로부터 쉬키메이트(SHK)로의 탄소 흐름을 감소시키는 것 외에, 방향족 아미노산 경로로부터 분지되어 나가는 특정 다른 경로들을 차단할 필요가 있다. 일부 박테리아, 예를 들어 아시네토박터 및 슈도모나스 속에 있는 일부 박테리아는 DHS를 갈산으로 전환하는 효소, p-히드록시벤조에이트 히드록실라아제를 인코딩하는 pobA 유전자를 함유한다. PobA 동족체 또는 유사체가 대장균에서 발견되지 않음에도 불구하고, DHS를 생산하도록 유전자 조작된 대장균의 균주는 상당량의 갈산을 분비하여서(Li 및 Frost, 1999), 이러한 효소는 대장균에 존재할 것 같다. 그 밖에도, DHS로부터 유래된 PCA는 pobA 유전자에 의해 코딩된 p-히드록시벤조에이트 히드록살라아제(PobA) 효소의 작용에 의해 갈산으로 전환될 수 있다. 따라서, 생산된 갈산은 이후에 피로갈롤(pyrogallol)로 전환될 수 있다. 개선된 시스, 시스-뮤콘산을 위해 선택된 생촉매에서 갈산 및 피로갈롤로의 탄소 흐름을 차단하기 위한 한 방법은 유전자 조작을 통해 p-히드로벤조에이트 히드록살라아지(PobA) 단백질의 활성을 차단하거나 약화시키는 것이다. 유사하게, DHS에 대한 전구체인 DHQ는 aroE에 의해 코딩된 쉬키메이트 디히드로게나아제에 의해 작동되어서, 퀸산이 생산될 수 있다. 본 발명의 실시예에서, 누출 aroE 돌연변이 효소는 추가적으로 선택되거나 DHQ를 퀸산으로 전환하는 것에 대한 무능력 또는 감소된 능력에 대해 검사된다.
시스, 시스-뮤콘산 대신에 트랜스, 트랜스-뮤콘산을 생산하는데에 몇몇 장점이 있다. 트랜스, 트랜스-뮤콘산은 테레프탈산의 생산을 위해 에틸렌과 시스, 시스 뮤콘산을 디일스-알더 반응 시키는 것이 바람직하다. 유전적으로 조작된 방향족 경로와 함께 생촉매는 시스, 시스-뮤콘산을 생산하고, 이러한 시스, 시스-뮤콘산은 화학적 전환 공정을 사용하여 세포 외부에서 트랜스, 트랜스-뮤콘산으로 전환될 수 있다. 다른 한편으로는, 생촉매 안으로 말레일아세토아세테이트 이소머라아제(maleylacetoacetate isomerase) 또는 유사한 이소머라아제 효소를 도입함으로써, 박테리아 생촉매 내에서 시스, 시스-뮤콘산을 트랜스, 트랜스-뮤콘산으로 전환하는 것도 가능하다.
본 출원의 명세서는 뮤콘산의 효율적 생산을 위한 미생물 균주의 제작에 관하여 본 발명의 다양한 양태를 제공한다. 통상의 기술자는 본 발명의 다양한 양태를 편집하여 뮤콘산의 생산 효율이 매우 높은 생촉매를 제작할 수 있을 것이다.
실험 부분
총설
균주 및 접종물 제조: 본 발명에서 사용된 박테리아 균주 및 플라스미드의 리스트는 표 1에 제공된다. 본원에 개시된 균주 구조체체의 모든 특정 예들은 야생형 대장균 C 균주(ATCC8739), 또는 대장균 K-12 균주(YMC9 또는 MM294)로부터 유래되지만, 본원에 개시된 유전적 요소는 임의의 다른 적절한 대장균 균주에 결합될 수 있고, 본원에 개시된 유전적 요소의 발현 카셋 또는 적절한 유사체 및 동족체는 임의의 다른 적합한 미생물, 예를 들어 박테리아, 고세균, 효모, 조류 및 사상균의 다른 종들에 결합될 수 있고, 상기 미생물들은 발효 공정을 통해 시스, 시스-뮤콘산의 상업적 생산에 사용될 수 있다.
대장균 C는 AM1 미네랄 배지 중에 10% 글루코오스를 발효할 수 있다. AM1 배지는 2.63 g/L (NH4)2HP04, 0.87 g/L NH4H2P04, 1.5 mM MgS04, 1.0 mM 베타인, 및 1.5 ml/L 미량원소를 함유한다. 미량원소는 1000X 스톡(stock)으로서 제조되고 하기 성분들을 함유한다: 1.6 g/L FeCl3, 0.2 g/L CoCl2·6H20, 0.1 g/L CuCl2, 0.2 g/L ZnCl2·4H20, 0.2 g/L NaMo04, 0.05 g/L H3B03, 및 0.33 g/L MnCl2·4H20. 발효 브로스(broth)의 pH는 1.0 - 10.0 M KOH 또는 1.0 - 9.0 M 수산화암모늄을 사용하여 7.0으로 유지된다.
발효: 유전적으로 조작되고 -80℃ 냉동고에 저장된 대장균 균주의 40% 글리세롤 스톡으로부터 신선한 NBS-2% 글루코오스(Jantama 등, 2008a) 플레이트 상에 선조접종하여 발효를 시작했다. 플라스미드가 존재한다면, 한천 평판 및 액체 배지에 적절한 항생제(들)를 포함시키는 것에 의해 플라스미드를 유지시켰다. 암피실린(나트륨 염)를 150 mg/L로, 스펙티노마이신 HCL(spectinomycin HCL)을 100 mg/L로, 테트라시클린 HCl(tetracycline HCl) 15 mg/l로, 및 카나마이신 술페이트(kanamycin sulfate)를 50 mg/l로 사용했다. 24 내지 48시간 후에(37℃), 단일 콜로니(colony)를 셰이크 플라스크(shake flask) 내의 25 ml 동일 배지 안으로 선택해서 옮겼다. 세포들이 약 0.1의 OD600 값을 갖도록 성장할 때까지 37℃ 200 rpm에서 교반한 후, 배양균을 얼음으로 냉각하고 동일 부피의 멸균 80% 글리세롤을 첨가했다. 발효를 위한 접종물로서 사용하기 위하여, 2 ml 앨리쿼트(aliquots)를 -80℃에서 동결하였다.
세포 성장: 열전자 스펙트로닉 20 분광 광도계를 사용하여 550 nm(OD550) 또는 600 nm(OD600)에서의 광학적 밀도를 측정하여 세포량을 추산했다.
쉬킴산 경로 및 뮤콘산 경로에서의 중간체들의 분석: 시스, 시스-뮤콘산 및 시스, 트랜스-뮤콘산, 및 다른 생화학적 중간체들을 포함하는 발효 브로스에서 생산된 총 뮤콘산을, 시그마-알드리치로부터 구매한 210 nm의 모니터링 흡광도 또는 45°의 굴절률 표준규격을 사용하는 Waters Alliance 계측기를 구비하는 HPLC를 사용하여 분석했다. 컬럼은 BioRad Aminex HPX-87H이며, 이는 40분 동안 0.6 ml/분의 유속으로 이동상으로서 8 mM 황산을 사용하여 50 ℃에서 수행된다. 구입한 표준(시그마-알드리치)의 크로마토그래프는 도 3에 보여진다. HPLC를 위한 준비를 위해, 발효 샘플을 0.05 M 인산칼륨 완충액으로 pH 7.0에서 10 또는 100배 희석하였으며, 이는 시스, 시스-형태의 뮤콘산이 시스, 트랜스-형태로 이성질화되는 것을 방지하기 위함이다.
뮤콘산의 이성질체를 분리하기 위하여, 전술한 바와 같이 제조된 샘플들을 제2 HPLC 시스템에서 진행시켰다. 기구는 Agilent 1200 HPLC이었고, 컬럼은 인산을 사용하여 pH 3.0으로 조정된 30% 메탄올 중에 50 mM KH2P04을 이동상으로 30℃에서 진행하는 4.6 x 150 mm의 Agilent Eclipse XDB-C18이다. 유속은 278 nm의 흡광도를 측정하면서 4분 동안 1 ml/분이었다. 물 중에 시스, 시스-뮤콘산을 용해시킨 뒤, HPLC 피크가 완전히 새로운 위치로 이동될 때까지 실온에서 약 2시간 동안 자발적 산 촉매 이성질화를 겪도록 하는 것에 의해 시스, 트랜스-뮤콘산 표준을 만들었다. 다른 표준들은 시그마-알드리치로부터 구입했다. 표준들이 보여주는 크로마토그래프는 도 4에 보여진다.
발효 공정에 대한 뮤콘산 생산 배지의 조성물: 발효 배지 각각의 리터는 50 ml/L의 1M KH2PO4, 10 ml의 200g/L 시트르산 + 25 g/L 구연산철, 1.2 ml의 98% 황산, 및 소포제 204(Antifoam 204) 한 방울을 함유한다. 추가적인 하기 다른 성분들의 첨가를 위한 공간을 허용하기에 충분한 물과 상기 성분들을 혼합했다. 오토클레이브 후에, 하기 성분들을 첨가했다: 10, 20, 30 또는 40 ml의 50% 글로코오스(최종 농도: 5, 10, 15, 또는 20 g/l), 2 ml의 1M MgS04, 1 ml의 0.1M CaC12, 10 ml의 1000X 미량원소(Jantama 등, 2008a), 1, 2, 4, 또는 8 ml의 50 g/L 페닐알라닌 + 50 g/L 티로신 + 50 g/L 트립토판 (최종 농도: 0.5, 0.1, 0.2, 또는 0.4 g/l), 10 ml의 1 g/L p-히드록시벤조산 + 1 g/l p-아미노벤조산 + 1 g/L 2,3-디히드록시벤조산, 및, 필요에 따라, 1 ml의 150 mg/ml 암피실린(나트륨 염) 및/또는 1 ml의 100 mg/ml 스펙티노마이신 HCl.
페드배치 발효를 위하여, 공급병은 600 g/L of 무수 글루코오스 및 32 ml/L의 50 g/L 페닐알라닌 + 50 g/L 티로신 + 50 g/L 트립토판을 함유했다. 9M NH4OH를 염기로 사용하여 발효 배지의 pH를 유지했다.
셰이크 플라스크에 대하여, NBS 염(Jantama 등, 2008a) + 0.2 M MOPS 완충액, pH 7.4은 전술한 사전-오토클레이브 혼합을 대신하였지만, 글루코오스 및 다른 첨가물은 동일했다.
DCU 제어장치 또는 Biocommand Software에 의해 제어된 pH, DO, 온도, 글루코오스 및 공급율을 이용한 7L New Brunswick 과학적 발효기에서 페드-배치 발효를 수행했다. 온도를 37℃로 유지했고, 9N 암모늄수를 이용하여 pH를 7.0으로 유지했고, 임펠러 속도를 750 rpm으로부터 1200 rpm으로 증가시키면서 용존 산소(DO)를 30% 공기 포화로 유지했다. 소정의 배지에서 초기 글루코오스 농도는 약 5 내지 25 g/L였다. 글루코오스 농도가 5 g/L 미만으로 떨어지는 경우에 글루코오스 용액을 발효기에 첨가했고, 용존산소량에 의해 글루코오스의 공급율을 조절했다. 총 발효시간은 48시간이었고, 최종 역가는 16 g/L의 뮤콘산이었다.
뮤콘산 경로 유전자를 발현하는 플라스미드의 제작: DHS를 뮤콘산으로 전환하기위해 필요한 세 개의 이종 유전자들을 개별적으로 클로닝하거나 저-모사 플라스미드, pCL1921와 함께 클로닝하였다(Lerner 및 Inouye, 1990). pCL1921의 DNA 서열은 표 3에서 서열번호: 20으로 주어진다. 간략하게, catAX, aroY 및 aroZ 유사체 또는 동족체의 코딩서열을 대장균에서의 발현을 위해 코돈-최적화하였고 상업적으로 합성하였다(Gene Art, Invitrogen). 이후, 각각의 유전자에 대한 독특한 리보솜-결합 부위를 보유하는 정방향 프라이머 및 독특한 종결자 서열을 보유하는 역방향 프라이머를 사용하여, 이러한 서열들을 PCR 증폭했다. 결과로 얻은 PCR 단편을 제한 효소로 절단시켰고, 표준 분자 클로닝 과정에 의해 독특한 구성 프로모터 서열의 하류를 클로닝했다. 전술한 공급원 DNA(source DNA)로부터 프로모터 서열을 PCR 증폭하여 클로닝한 후(미국특허출원 20090191610; 미국특허 7244593), 제한효소 절단 및 표준 분자 클로닝을 이어갔다. 프로모터-RBS-코딩서열-종결자서열 모두는 발현 카셋을 구성했다. 다음으로, 개별적인 발현 카셋을 혼합하여 하나, 둘 또는 모든 세개의 뮤콘산 경로 유전자를 발현하는 플라스미드를 생성했다.
실시예 1
aroG 및 aroF의 발현의 증가
대장균의 tyrR 유전자는 많은 잘 알려진 방법들, 예를 들어 화학적 또는 방사선 돌연변이유발(예를 들어 PCR 및 DNA 서열화에 의함) 또는 유사 내성(analog resistance)에 대한 선택(예를 들어, 4-플루오로티로신에 대한 내성), 트랜스포슨 돌연변이유발(transposon mutagenesis), 박테리아파지 Mu 돌연변이유발(bacteriophage Mu mutagenesis), 또는 형질전환 중 어느 하나에 의해 돌연변이될 수 있다. 바람직한 실시예에서, tyrR 유전자의 돌연변이는 삭제 돌연변이(검출가능한 활성을 남기지 않은 돌연변이)이고, 더 바람직한 실시예에서는, tyrR 유전자의 적어도 일부는 결실된다. 이는, 예를 들어 선형 DNA 분자를 사용하는 2단계의 형질전환 방법을 사용하여 달성될 수 있다(Jantama 등, 2008a; Jantama 등, 2008b). 제1 단계에서, cam R , sacB 카셋은, 이중 재조합 및 클로람페니콜 내성에 대하여 선택하여 tyrR 자리에 통합되어 tyrR 오픈리딩프레임의 대부분 또는 전부를 교체한다. 제2 단계에서, tyrR 유전자가 결실된 유형을 포함하는 선형 DNA는 이중 재조합 및 LB와 같은 풍부한 배지에서 5% 수크로오스에 대한 내성에 대해 선택하는 것에 의해 통합된다. 정확한 결실은 식별되고 진단 중합효소연쇄반응(PCR)에 의해 확인된다. tyrR 결실의 목적은 aroG 및 aroF의 발현을 증가시키기 위함이다. 유사한 결과를 달성하는 다른 접근법은 aroG 및/또는 aroF 앞의 네이티브 프로모터를 강력한 구성 프로모터로 치환하고, 필요하다면, 전사 종결자를 첨가하는 것이다. 이것이 일반적으로 어떻게 달성되는지에 대한 구체적인 내용은 하기 실시예 4에서 주어진다.
TyrR 단백질에 의해 AroG 및 AroF 활성의 억제를 극복하기 위한 전술한 두 개의 접근법 중 후자가 바람직한데, 그 이유는 tyrR 결실이 aroLM과 같은 유전자의 원치않는 과다발현을 유발할 수 있기 때문이다(Neidhardt 및 Curtiss, 1996). 이것이 일반적으로 어떻게 달성되는지에 대한 구체적인 내용은 하기 실시예 4에서 주어진다.
실시예 2
피드백 내성 AroG 및 AroF
피드백 내성 AroG 효소(3-디옥시-D-아라비노헵툴로소네이트-7포스페이트 합성효소 또는 DAHPS)를 초래하는 aroG 유전자에서의 돌연변이는 당해 분야에 잘 알려져 있다(Shumilin 등, 1999; Kikuchi 등, 1997; Shumilin 등, 2002). 또한, 잘 알려진 것은 이러한 돌연변이를 만들고, 식별하고 특징화하는 방법이다(Ger 등, 1994, Hu 등, 2003). 바람직한 돌연변이는 페닐알라닌에 의한 억제에 대한 완전한 내성을 초래하는 것이다. 임의의 알려진 피드백 내성 돌연변이들은 수 많은 잘 알려진 방법에 의해 염색체에 함유된 aroG 유전자 안으로 도입되거나 플라스미드 상에 도입될 수 있으며, 이러한 방법들 중 하나는 원하는 돌연변이가 PCR 프라이밍 올리고뉴클레오티드(priming oligonucleotide)의 일부로서 합성되는 돌연변이유발 PCR(mutagenic PCR)이다(Hu 등, 2003). 돌연변이의 올바른 도입은 DNA 서열화에 의해 확인된다. 대장균 C에서 야생형 aroG 유전자의 서열은 서열번호: 18로 주어진다. 바람직한 돌연변이는 AroG의 150번째 아미노산을 프롤린으로부터 류신으로, 예를 들어 150번 코돈을 CCA에서 CTA로 변화시키는 점 돌연변이이다(Hu 등, 2003). 더 바람직한 실시예에서, 150번 코돈은, CCA에서 대장균에서 바람직한 코돈인 CTG로 변화된다. aroG의 이런 특정 대립유전자가 바람직한데, 그 이유는 인코딩된 DAHP 합성효소가 페닐알라닌에 의한 억제에 대해 최대 3 mM 까지 완전히 내성을 갖기 때문이고, 이것은 야생형 효소와 유사한 특이적 활성을 가진다(Hu 등, 2003).
추가적인 피드백 내성 aroG 대립유전자는 돌연변이유발 및 하나 이상의 페닐알라닌 유사체, 예를 들어 베타-2-티에닐알라닌, p-플루오로페닐알라닌, p-클로로페닐알라닌, o-플루오로페닐알라닌, 및 o-클로로페닐알라닌에 대한 내성에 대해 선택한 후, 내성을 유발하는 돌연변이가 aroG 유전자에 연결되는 것을 확인하는 것에 의해 얻어질 수 있다(Ger 등, 1994; 미국특허 4,681,852). aroG에 대한 연결은 DNA 서열화 또는 페닐알라닌의 존재/부재 하에서 효소 검정에 의해 직접적으로 확인되거나(Ger 등, 1994), 파지 매개 형질 도입 및 aroG 자리에서 또는 근방에서 선택되거나 반대하여 선택될 수 있는 유전자 표지에 대한 선택에 의해 간접적으로 확인될 수 있다(미국특허 4,681,852). 이러한 유전자 표지는 aroG 유전자 그 자체의 결실 또는 점 돌연변이일 수 있거나, 대장균의 경우에서는 nadA와 같은 임의의 적당하게 근접하게 연결된 유전자에서의 돌연변이일 수 있다. 대장균에서의 예로서, 돌연변이유발 및 페닐알라닌 유사체 내성에 대해 선택한 후에, 개별적인 돌연변이들 또는 돌연변이들의 풀은 나이브(naive) 수용주 안으로의 P1 매개 형질도입을 위한 도너(donors)로서 사용될 수 있으며, 상기 수용주는 모든 세개의 DAHP 합성효소 유전자, aroG, aroF, 및 aroH가 결실되고, 적절한 최소 배지 상에서 성장을 위해 선택된다. 형질 도입주는 소정의 유전자(들)의 돌연변이로서 가득찰 것이다. 대안으로, 돌연변이유발 및 유사 내성에 대해 선택한 후에, 개별적인 돌연변이들 또는 돌연변이들의 풀은 나이브 수용주 균주 안으로의 P1 매개 형질도입을 위한 도너로서 사용될 수 있으며, 상기 균주는 nadA 유전자에서 삭제 돌연변이를 함유하고, 다시 니코틴아미드가 결여된 적절한 최소 배지 상에서의 성장을 위해 선택된다. 또 다른 접근법은 nadA 유전자에서와 같은 aroG 유전자 근처에서 Tn10과 같은 트랜스포손 삽입을 함유하는 배경 균주에서 내성 돌연변이를 선택하는 것이다. 유사 내성 돌연변이로부터 상기 트랜스포손을 함유하지 않는 배경 균주 안으로 P1 형질도입하고, 테트라시클린 또는 다른 적절한 항생제 내성에 대하여 선택하는 것은 소정의 aroG 돌연변이에 대하여 풍부해질 것이다. 모든 이런 접근법에서, 피드백 내성은 유전자의 효소 검정 및 DNA 서열화에 의해 궁극적으로 확인된다. 우리는 피드백 억제에 대한 내성을 갖는 aroG의 대립유전자를 aroG*로 지칭할 것이다.
균주 WM191(△tyrR, △aroF)는 YMC9(ATCC 33927)로부터 유래되었다. 2단계의 유전자 치환 방법(Jantama 등, 2008a)이 tyrR 및 aroF 모두의 완벽한 결실을 위해 사용되었으며, 이를 통해 균주 WM191을 얻었다. 다음으로, nadA::Tn10 대립유전자는 CAG12147(CGSC 7351, Coli Genetic Stock Center, Yale University)로부터의 균주 WM189(△tyrR, △aroF, nadAr::TnlO)로 형질 도입되었다. 선택은 LB + 테트라시클린 HCl(15 mg/l) 상에서 이루어졌다. 균주 RY890(△tyrR::kan, aroF363)은 MM294(ATCC 33625)로부터 P1 형질도입에 의해 3단계로서 유래되었다. 도너 균주는 순서대로 JW1316-1 (CGSC 9179, Coli Genetic Stock Center, Yale University), NK6024 (CGSC 6178, Coli Genetic Stock Center, Yale University), 및 AB3257 (CGSC 3257, Coli Genetic Stock Center, Yale University)이고, 세 개의 선택은 순서대로 LB + 카나마이신 술페이트(50 mg/l), LB + 테트라시클린 히드로클로라이드(15 mg/l), 및 티아민 HCl(5 mg/l)와 함께 NBS 최소 글루코오스(Jantama 등, 2008a)였다.
약 20%의 생존률로 UV 광을 이용하여 WM189를 돌연변이화시켰고, o-플루오로페닐알라닌(1 mM), 티아민(5 mg/l) 및 니코티아미드(1 mM)를 함유하는 NBS 최소 글루코오스 배지(Jantama 등, 2008a) 상에 플레이팅했다. 플레이트들 각각으로부터의 콜로니들을 개별적인 풀들로 수집하였고, P1vir 용균을 각각의 풀 상에서 만들었다. LB 배지 상에서 테트라시클린 내성(15 mg/l)에 WM191 형질도입하는데에 이러한 용균들을 사용했고, o-플루오로페닐알라닌(1 mM), 티아민(5 mg/l) 및 니코티아미드(1 mM)를 함유하는 NBS 최소 글루코오스 배지에서 수득한 콜로니들을 복제 플레이팅했다(replica plated). 테트라시클린 및 유사체 모두에 대해 생존한 콜로니 복제를 aroG 내에 피드백 내성 돌연변이를 함유하는 것으로 추정했다. DNA 서열화를 위하여, 5개의 독립 풀들로부터 8개의 개별적인 콜로니들을 선택했다. 중합효소연쇄반응 및 서열화에 의해 aroG 코딩 영역을 증폭했다. 결과는 표 4에 보여지며, 이러한 결과는 8개의 균주 각각이 그들의 aroG 유전자에 점 돌연변이를 함유하고 있다는 것을 보여준다. 대립유전자들 중 일부는 공개된 대립유전자들과 동일하지만, 일부는 신규하다.
전술한 복제 플레이팅에 의해 RY890(aroG 야생형 대립유전자를 가짐)을 테트라시클린 내성 및 o-플루오로페닐알라닌(0.3 mM)에 대한 내성으로 형질도입하기 위해, 전술한 풀들 중 하나로부터의 P1vir 용균을 사용했다. 4개의 콜로니들, 즉 RY893, RY897, RY899, 및 RY901을 DNA 서열화를 위해 선택했고(표 4), 다시, 대립유전자들 중 두개는 공개된 대립유전자와 동일했지만, 두 개는 신규했다. 균주 RY902는 후자 4개의 균주에 대해 동질 유전자형이지만, 야생형 aroG 유전자를 함유하고, CAG12147로부터 형질도입되어 대조군으로서 제작되었다. 이러한 5개의 균주를 셰이크 플라스크 내의 25 ml NBS 최소 글루코오스(15 g/l) + 티아민 HCl(5 mg/l) 및 니코티아미드(1 mM)에서 밤새도록 성장시켰다. 이를 원심분리하고, 10 ml 물로 씻어내기 위해 재현탁시키고, 재-원심분리하고, 0.5 ml의 50 mM 인산칼륨, pH 7.0에서 재현탁시켜서 결과 세포들을 수확했다. 세 방울의 클로로포름과 함께 와류교반하여 현탁된 세포들을 용해하였고, 이어지는 변형과 함께 문헌(Hu 등, 2003)에서 설명된 방법과 유사한 방법을 사용하여 DAHP 합성 효소 활성에 대하여 조질 용균을 분석했다. 인산 완충액은 50 mM(최종 농도), pH 7.0이고, 최종 에리트로오스-4-포스페이트 농도는 2 mM이고, 최종 포스포에놀 피루베이트 농도는 5 mM이고, 배양 온도는 30℃이고, 반응은 10분에서 멈췄다. 우리는 1 밀리그램 단백질 당 1 분 당 1 nMole의 DAHP을 생산하는 활성을 1 mU로 정의한다. 피드백 내성에 대해 시험하기 위하여, 각각의 조질 용균은 최종 농도 18 mM에서 페닐알라닌과 함께 또는 페닐알라닌 없이 분석했다. 분석 결과는 표 5에 제시된다. 효소는 페닐알라닌에 대한 특이적 활성 및 내성이 변화하는 것을 보여줬지만, 시험된 모든 선택된 돌연변이 형태는 야생형 대조군에 비해 현저히 더 내성을 가졌다.
전술한 RY893, RY899, RY901, 및 RY902로부터의 aroG 대립유전자는 하기와 같이 배경 균주를 생산하는 뮤콘산 안으로 도입되었다. aroG* 및 aroGwt 도너 균주로부터의 P1vir 용균은 MYR219(대장균 C, △aroE, △ack::P 15 -aroB, pMG37)를 테트라시클린 HCl 내성(15 mg/l)에 형질도입하여 각각 새로운 균주 RY903, RY909, RY911, 및 RY912를 얻기 위해 사용되었다. 다음으로, 이러한 균주들 각각은 JW1316-1의 P1vir 용균을 사용하여 카나마이신 술페이트 내성(50 mg/l)에 형질도하여, △tyR::kan 대립 유전자를 도입하고, 이에 의해 각각 균주 RY913, RY919, RY921, 및 RY922를 얻는다. 스펙티노마이신 선택은 뮤코닉 플라스미드를 유지하기 위하여 계속하여 유지되었다. 결과로 얻은 4개의 균주는 셰이크 플라스크 내에서 20 g/l 글루코오스의 보충물, 0.2 M MOPS 완충액, pH 7.4, 니코티아미드 (1 mM), 페닐알라닌 (100 mg/l), 티로신 (100 mg/l), 트립토판 (100 mg/l), p-히드록시벤조산 (1 mg/l), p-아미노벤조산 (1 mg/l), 2,3-디히드록시벤조산 (1 mg/l), 페놀레드 (10 mg/l), 및 황산암모늄 (1 g/l)를 함유하는 25 ml NBS 최소 배지(Jantama 등, 2008a)에서 37℃ 48시간 동안 성장시켰다. pH는 7에 근접하게 유지시켰고, 이는 pH 7.0 기준에 대항하는 페놀레드의 색을 눈으로 관찰하여 측정했으며, pH는 셰이크 플라스크에 1 ml 앨리쿼트의 1.0 M KOH의 수동적 첨가에 의해 유지되었다. 생산된 뮤콘산은 전술한 HPLC에 의해 분석되었고, 그 결과는 표 6에 제시된다. 피드백 내성 aroG* 대립유전자를 함유하는 모든 세 개의 균주들은 야생형 aroG 대립유전자를 함유하는 동질유전자의 균주에 비해 더 많은 뮤콘산을 생산했다. 본원에 개시된 별도의 실험에서, 다중복제 플라스미드 pCP32AMP 상에 aroG를 함유하는 균주 MYR205는 셰이크 플라스크에서 1.5 g/l 뮤콘산을 생산했다. 따라서, 발명자는, 셰이크 플라스크에서 뮤콘산을 생산함에 있어서 △tyrR 및 단일 복제 염색체의 aroG*의 조합이 동질유전자의 aroG 플라스미드 함유 균주에 비해 더 잘 수행할 수 있다는 것을 보여줬다. 플라스미드 대립유전자에 비해 염색체 대립유전자의 내재하는 우수한 유전적 안정성에 더하여, 플라스미드 내에 보유하기 위한 선택적 배지에 대한 필요성의 경감은, 본원에 설명된 신규한 균주가 대규모의 상업적 발효에 더 적합하도록 만든다. 게다가, 화학적 유도물질이 뮤콘산 경로 유전자의 발현을 위해 필요하지 않다. 따라서, 본원에 설명된 본 발명의 균주는 선행 기술(Niu 등, 2002)에 비해 개선된 것이며, 선행기술의 균주 모두는 원치않는 다중복제 플라스미드 상에서 DAHP 합성효소의 과다발현을 위한 유전자를 함유한다.
AroG에 대하여 전술한 바와 유사한 방식으로, 티로신에 의한 피드백 억제에 대해 내성을 갖는 AroF 또는 AroH 동종효소를 초래하는 돌연변이는 플라스미드 상에 또는 염색체 안에 도입될 수 있다. 바람직한 돌연변이는 AroF의 148번 아미노산을 프롤린으로부터 류신으로, 예를 들어 148번 코돈을 CCG로부터 CTG로 변화시켜서(Weaver 등, 1990) aroF* 유전자를 만드는 점 돌연변이이다. aroF*의 다른 대립유전자는 aroG* 대립유전자에 대해 전술한 바와 유사한 방식으로 티로신 유사체(예를들어, o-플루오로티로신, m-플루오로티로신, p-플루오로페닐알라닌 등)에 대한 내성에 의해 단리될 수 있다. aroF* 대립유전자는, 예를 들어, JW2584(CGSC 10051, Coli Genetic Stock Center, Yale University)와 같은 균주에서와 같이 근접하게 연결된 △yfiR::kan에서 트랜스포손에 대한 연결 또는 카나마이신 내성 삽입에 의해 선택되고, 풍부해지고, 형질도입될 수 있다.
실시예 3
염색체 DNA로부터 aroE의 결실 및 뮤콘산 생산
이 실시예에서, 다중복제 플라스미드 상에서 aroB 및 aroG의 과다발현 뿐만 아니라 뮤콘산 경로에서 기능하는 단백질을 코딩하는 유전자의 발현의 효과가 조사되었다. 쉬키메이트 디히드로게나아제를 코딩하는 aroE 유전자에서의 결실을 함유하는 균주 MYR34는 이 연구에서 부모 균주로서 사용되었다. aroE의 염색체 복제의 결실은 실시예 1에서 설명한 바와 유사한 방식으로 달성되었다. MYR34가 쉬킴산 경로에서 기능하는 DAHP 합성효소 단백질을 코딩하는 aroG 유전자를 과다발현하는 플라스미드 pCP32AMP로 형질전환되는 경우에, DHS의 축적에 있어서 상당한 증가가 있다. MYR34가 구성 프로모터로부터 aroB를 발현하는 플라스미드로 형질전환되는 경우에, DHS의 축적에 현저한 증가가 관찰되지 않았다. 그러나, 대장균 균주 MYR34가 aroB 및 aroG 유전자 모두를 발현하는 플라스미드로 형질전환되는 경우에, aroG만으로도 형질전환된 MYR34에서 보다 DHS의 축적이 더 증가하여서, DHS 생산에서 aroB를 2차 병목(bottleneck)으로서 시사한다(도 5).
도 6에서 제시된 실험에서, 숙주 염색체 DNA 안으로 통합된 aroB 유전자의 추가적인 복제의 효과는 시험되었다. MYR34로부터 유래된 대장균 균주 MYR170에서, P15 프로모터의 제어하에서 aroB 유전자의 추가적인 복제는 ack 자리에서 숙주 염색체 안으로 통합되었다. MYR170 균주가 pCP32AMP 플라스미드로 형질전환되는 경우에, 동일한 플라스미드로 형질전환된 MYR34 균주에서 검출된 DHS 축적에 대해 비교하는 경우 DHS 축적에 약간의 증가가 있었다. MYR170에서 DHS의 축적에 약간의 증가는 숙주 염색체 DNA 안으로 통합된 aroB 유전자의 추가적인 복제 때문일 수도 있다. MYR170이 aroB 및 aroG를 모두 발현하는 pCP54로 형질전환되는 경우에, DHS 축적에서 더 많은 증가가 있었고, 이는 DHS 생산에서 aroB가 2차 병목이라는 것을 시사한다.
도 7은 대장균 균주 MYR34 및 MYR170을 이용한 뮤콘산 생산의 결과를 제공한다. aroE 결실 균주 MYR34 및 MYR170에서 aroB 및 aroG 유전자의 과다발현이 DHS의 축적을 가져온다는 것을 확실히 하기 위하여, 뮤콘산 생산 경로에서 기능하는 단백질을 코딩하는 "뮤코닉 경로" 유전자의 발현이 DHS를 시스, 시스-뮤콘산으로 전환하는지를 보이기 위한 노력이 이루어졌다. 이러한 실험에서, 대장균 균주 MYR34 및 MYR170은 플라스미드 pM37만으로 형질전환되거나, 또는 플라스미드 pMG37 및 pCP32AMP 모두로 형질전환되었다. 플라스미드 pMG37은 뮤콘산 경로에서 기능하는 단백질을 코딩하는 aroZ, aroY 및 catAX 유전자를 발현한다. 이러한 박테리아 균주들 MYR34 및 MYR170이 플라스미드 pCP32AMP 및 pMG37 모두로 형질전환되는 경우에, MYR34 및 MYR170 모두에서 뮤콘산 생산은 두 개의 균주들이 pMG37 플라스미드로만 형질전환되는 경우에서의 뮤콘산 생산과 비교할 때 증가했으며, 이는 이러한 균주에서 aroB 발현이 시스, 시스-뮤콘산 생산에 대해 병목이라는 것을 시사한다.
실시예 4
tktA의 과다발현
tktA에 의해 인코딩된 트랜스케토라아제는 펜토오스 포스페이트 경로에서 중요 효소이고, 에리트로오스-4-포스페이트의 생산을 위해 제한되는 것으로 생각되며, 뮤콘산의 생산에서 중요한 중간체 중 하나 이다. 다중복제 플라스미드 상에 네이티브 프로모터와 함께 유전자를 도입하는 것에 의해(Sprenger 등, 1995, 1995a), 트랜스케토라아제를 인코딩하는 tktA의 과다발현은 방향족 경로 안으로의 플럭스를 향상시키는 것으로 알려져 있다(Draths 등, 1992). 그러나, 이러한 플라스미드는 불안정하고, 종종 유지(maintenance)를 위해 항생제 선택을 필요로 한다. 선행기술에서 또 다른 접근법은 tktA 유전자의 하나의 추가 복제를 숙주 균주의 염색체에 첨가하는 것이다(Niu 등, 2002). 그러나, tktA와 그의 네이티브 프로모터의 하나의 추가 복제는 에리트로오스-4-포스페이트로 방향족 경로를 포화시키기에 충분하지 않은데, 그 이유는 그것의 네이티브 프로모터가 이상과 매우 근접하지 않기 때문이다. 따라서, 공정은 실질적인 개선이 필요하다.
tktA의 개선된 과다발현은, 예를 들어 염색체에서 네이티브 tktA 프로모터를 강력한 구성 프로모터인 예를 들어 고초균 파지 SPO1로부터의 P15 또는 P26 프로모터(각각, 서열번호: 1 및 서열번호: 2), 또는 박테리아파지 람다로부터의 PR 프로모터(서열번호: 3)로 교체하는 것에 의해 얻어질 수 있다. 이는, 제1 단계에서 네이티브 염색체의 tktA 프로모터를 교체하기 위하여 cam R , sacB 카셋이 사용되는 것을 제외하고는 실시예 1에서 설명된 2단계에 의해 달성된다. 제2 단계에서, 강력한 구성 프로모터는 상기 강력한 구성 프로모터 옆으로 하류측에서 tktA 코딩 영역의 5' 단부의 50 염기 이상 및 상류측에서 네이티브 tktA 프로모터의 바로 상류에 50 염기쌍 이상의 상동체가 늘어서있는 강력한 구성 프로모터를 포함하는 선형 DNA로 형질전환하고, 수크로오스 내성에 대해 선택하는 것에 의해 도입된다. 이러한 발현 카셋으로부터 개선된 발현은 발현 카셋으로부터 전사되는 mRNA의 안정성을 증가시키는 것에 의해 달성될 수도 있다. mRNA 안정성의 개선은 mRNA의 5' 말단 또는 mRNA의 3' 말단, 또는 둘 모두에 스템-루프 구조를 추가하는 것에 의해 달성된다. 스템-루프 구조는 로-독립 전사 종결자에 의해 자연적으로 종결되는 mRNA의 말단에서 종종 존재하지만, 만일 존재하지 않는다면, 로-독립 전사 종결자는 잘 알려진 유전자 조작 방법에 의해 DNA 서열에 추가될 수 있다(결찰, PCR 등). 이러한 종결자는 각각의 반복에서 4 내지 20개의 염기의 역위 반복으로 구성될 수 있는데, 이때 상기 염기들은 3개 이상의 염기의 "루프"에 의해 분리되고, 이후에 T들이 풍부한 하나 이상의 염기의 영역(디옥시티미딘)이 이어진다. 역위 반복은 G 및 C로 풍부하다(디옥시구아닌 및 디옥시시티딘). 유사하게, 스템-루프는 전사의 시작점 바로 하류이지만 리보솜 결합 부위 이전에서 전술한 스템-루프를 함유하지만 T-풍부 영역은 포함하지 않는 DNA 서열을 삽입하는 것에 의해 mRNA의 5' 말단 안으로 제작된다. 이러한 예는 P15 프로모터와 결합하여 주어진다(서열번호: 1).
쉬킴산 경로를 통한 탄소의 흐름 상에 tktA 유전자의 과다발현이 미치는 효과의 분석에 있어서, 대장균 균주 MYR170은 부모 균주로서 사용되었다. MYR170은 쉬키메이트 디히드로게나아제 효소를 코딩하는 aroE 유전자에 대한 결실, 및 ack 자리에서 aroB 유전자의 추가 복제를 가진다.
도 8, 9 및 10에서 설명된 실험에서, 두 개의 다른 플라스미드 pCP32AMP 및 pCP50이 사용되었다. 플라스미드 pCP32AMP는 그의 네이티브 프로모터로부터 DAHP 합성 효소 aroG 유전자만을 발현하고, 플라스미드 pCP50은 aroG 유전자와 함께 네이티브 프로모터로부터 트랜스케톨라아제 유전자 tktA를 발현한다. aroE 결실 및 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어 하에서 aroB 유전자의 추가 복제를 갖는, MYR170은 pCP32AMP 및 pCP50 플라스미드로 개별적으로 형질전환되었다. 도 8에서 보는 바와 같이, DHS 축적은, aroG 유전자 만을 발현하는 대장균 세포와 비교할 때, tktA 유전자와 함께 aroG 유전자의 발현을 통해 더 증가되었다.
도 9는 플라스미드 pCP32AMP 또는 pCP50으로 형질전환된 두 개의 다른 균주 MYR34, MYR170에서 DHS 수율에 대한 데이터를 제공한다. aroE 유전자 결실을 갖는 MYR34 균주는 소비된 글루코오스의 1 그램 당 DHS의 0.1g이 수득되었다. MYR34에서 DHS 수율은, 이 균주가 aroG 유전자 과다발현을 갖는 pCP32AMP 플라스미드로 형질전환되는 경우에, 소비된 글루코오스의 1 그램 당 DHS 0.15 g으로 증가했다. MYR170은 ack 자리에서 삽입된 aroB 유전자의 추가 복제를 가진다. aroB 유전자의 추가 복제의 존재의 결과로서, pCP32AMP로 형질전환된 MYR34 균주에서 DHS 생산에 대한 수율은 pCP32AMP로 형질전환된 MYR34 균주에서의 DHS 수율에 비해 약간 더 높았다. 따라서, MYR170에서 aroB의 추가 복제의 존재는 쉬킴산 경로를 통한 탄소 흐름의 증가를 유발했다. 나아가, DHS 수율의 증가는, MYR170 균주가 aroG 및 tktA 유전자 모두를 발현하는 플라스미드 pCP50으로 형질전환되는 경우에 관찰되었다. 따라서, tktA의 추가 복제의 존재는 쉬킴산 경로를 통한 탄소 흐름의 증가를 설명했다. 더 구체적으로, 추가적인 aroB 및 tktA 유전자의 존재의 결과는 DHS 수율에 부가적 효과를 유발했다.
도 10에서 설명된 실험에서 사용된 MYR261은 poxB 자리에서 MYR170의 염색체 DNA 안으로 tktA 유전자의 추가 복제를 통합하도록 유전자 조작되었다. MYR261 균주에서 소정의 유전자 교체(poxB::tktA)는 PCR을 통해 확인되었다. MYR261은 pCP32AMP(aroG 과다발현) 플라스미드 또는 pCP50(aroG 및 tktA 과다발현) 플라스미드 중 어느 하나로 형질전환되었다. 대조군으로서, MYR170은 pCP32AMP 플라스미드로 형질전화되었다. 도 10에 제시된 결과에서 지시하는 바와 같이, MYR261의 염색체 DNA에서 tktA 유전자의 추가 복제의 존재는, pCP32AMP 플라스미드로 형질전환된 MYR170 균주에서 관찰된 DHS 생산에 대한 역가와 비교할 때, pCP32AMP 플라스미드를 이용하는 DHS 생산에 대한 역가를 증가시켰다. 트랜스케토라아제를 과다발현하는 플라스미드 pCP50으로 형질전환되는 경우에 MYR261 균주에서 트랜스케토라아제 수준의 추가적인 증가는 DHS 생산에 대한 역가에 추가적인 증가를 가져왔다. poxB에 의해 인코딩된 효소, PoxB, 또는 피루베이트 옥시다아제는 반응 생성물로서 아세테이트를 생산한다. 따라서, 본원에서 설명된 바와 같이 tktA의 삽입으로부터 기인하는 poxB의 결실은 아세테이트 생산에 대한 잠재적인 활성 경로를 제거한다. 유사하게, 동시적인 P 15 aroB의 삽입 및 AckA를 인코딩하는 ackA의 결실, 또는 하기 실시예 12에서 설명되는 바와 같은 아세테이트 키나아제는 아세테이트로의 또 다른 잠재적인 활성 경로를 제거한다. 아세테이트의 생산은 발효에서 일반적으로 바람직하지 않다(Jantama 등, 2008b). 따라서, 이러한 결실은 아세테이트 생산을 감소시키는데에 유용할 수 있다.
도 11은 플라스미드 pCP32AMP 및 pMG37로 형질전환한 후에 대장균의 MYR170, MYR261, 및 MYR305 균주에서 뮤콘산 및 아세트산 생산에 대한 역가를 제공한다. MYR305는 염색체 DNA로부터 poxB 유전자를 결실하는 것에 의해 MYR170으로부터 유래되는 반면, MYR261은 poxB 유전자가 tktA 유전자의 추가 복제를 삽입하는 것에 의해 비활성화된 MYR170 유도체이다. 전술한 바와 같이, 플라스미드 pCP32AMP는, DHS의 축적으로 이어지는 쉬킴산 생합성 경로에서 기능하는 DAHP 합성효소 단백질을 코딩하는 aroG 유전자를 발현하며, DHS의 축적은 대장균 균주 MYR170, MYR261 및 MYR305에서 aroE 유전자의 결실 때문이다. 뮤코닉 경로 유전자인 플라스미드 pMG37 상에서 aroZ, aroY 및 catAX의 발현에 의해, DHS는 도 2에서 예시되는 바와 같이, 시스, 시스-뮤콘산으로 전환된다. MYR261 균주에 aroB 유전자 및 tktA 유전자의 추가 복제의 존재에 의해, 아세트산의 축적의 감소에 따라서 뮤코산의 생산이 약간 증가되었다.
실시예 5
talA 또는 talB의 과다발현
talB 유전자는 대장균에서 두드러진 트랜스알돌라아제를 인코딩하지만, talA 유전자는 소수의 트랜스알돌라아제도 인코딩한다. 트랜스알돌라아제의 과다생산은 방향족 경로 안으로의 플럭스를 개선하는 것으로 알려져있다(Lu 및 Liao, 1997; Sprenger, 1995; Sprenger 등, 1995b). 선행기술에서, 이는 다중복제 플라스미드 상에서 그의 네이티브 프로모터로부터 tal 유전자(현재 talB 유전자로 알려짐)의 과다발현에 의해 달성되었다(Lu 등, 1997, Sprenger 등, 1995b). 그러나, 이러한 플라스미드는 불안정하고, 유지를 위해 항생제 선택을 필요로한다. 따라서, 개선된 공정에 대한 필요가 존재한다. talB의 개선된 발현은, 예를 들어 염색체에서 네이티브 tktB 프로모터를 강력한 구성 프로모터인 예를 들어 고초균 파지 SPO1로부터의 P15 또는 P26 프로모터(각각, 서열번호: 1 및 서열번호: 2), 또는 박테리아파지 람다로부터의 PR 프로모터(서열번호: 3)로 교체하는 것에 의해 얻어질 수 있다. 이는, 제1 단계에서 네이티브 염색체의 tktB 프로모터를 교체하기 위하여 cam R , sacB 카셋이 사용되는 것을 제외하고는 실시예 1에서 설명된 2단계에 의해 달성된다. 제2 단계에서, 강력한 구성 프로모터는 상기 강력한 구성 프로모터 옆으로 하류측으로 tktB 코딩 영역의 5' 단부의 50 염기 이상 및 상류측으로 네이티브 tktB 프로모터의 바로 상류에 50 염기쌍 이상의 상동체가 늘어서있는 강력한 구성 프로모터를 포함하는 선형 DNA로 형질전환하고, 수크로오스 내성에 대해 선택하는 것에 의해 도입된다. talA 유전자도 유사한 방법에 의해 과다발현될 수 있지만, talB 유전자가 지배적인 활성을 인코딩하고 있기 때문에, talB 유전자를 과다발현하는 것이 바람직하다(Sprenger, 1995; Sprenger 등, 1995b). 과다발현용으로 설계된 발현 카셋의 구조체에 대한 더 구체적인 내용은 실시예 4를 참조하라.
실시예 6
aroZ, aroY 및 catAX 유전자의 발현
대장균에 의해 생산된 내인성 DHS의 뮤콘산으로의 전환을 확인하기 위하여, 아시네토박터 sp. ADP1으로부터의 이종 유전자 catAX, 폐렴간균으로부터의 aroY, 및 아시네토박터 sp. ADP1으로부터의 quiC는 저-모사 플라스미드, pCL1921(Lerner 및 Inouye, 1990) 내의 강력한 구성 프로모터(각각, P15, PR 및 P26) 하에서 클로닝되어, '뮤코닉 플라스미드' pMG37을 생성했다. 비어있는 벡터(pCL1921) 또는 pMG37을 함유하는 MYR34 균주 유도체는 2% 글루코오스를 함유하는 셰이크 플라스크 배지(방향족 아미노산 및 비타민이 보충된 NBS 최소 배지)에서 17시간 동안 37℃에서 성장되었다. 상청액을 수집하고 HPLC에 의해 분석했다. DHS의 축적을 보여주는 MYR34/pCL1921과 대비하여, MYR34/pMG37은 뮤콘산의 생산을 보여준다(도 12). DHS, 또는 PCA 및 카테콜과 같은 중간체 산물의 상당량은 후자 균주로부터 검출되지 않았으며, 이는 pMG37로부터 발현된 이종 유전자가 기능적이고 충분하다는 것을 시사한다.
실시예 7
aroZ 동족체의 비교
세 개의 상이한 aroZ 동족체들 및 유사체들은 DHS를 뮤콘산 생산 경로 안으로 흐름을 바꾸는 능력이 비교되었다(도 13). 아시네토박터 sp. ADP1으로부터의 quiC, 바실러스 튜링겐시스로부터의 asbF, 및 뉴로스포라 크라싸로부터의 qa-4는 AroZ-유사 활성을 갖는 단백질을 인코딩하는 것으로 보고된다(Elsemore and Ornston, 1995; Fox et al, 1995; Rutledge, 1984). 이러한 유전자들 각각은 대장균에서의 발현에 대해 코돈-최적화되었고, GeneArt(Invitrogen)에 의해 합성되었고, P15 및 PR 프로모터 각각으로부터 catAX 및 aroY 유전자를 발현하는 저-모사 '뮤코닉 플라스미드' 내의 강력한 구성 P26 프로모터 하에서 클로닝되었다. MYR34/pCL1921, MYR34/pMG37(aroZ로서 quiC를 갖는 뮤코닉 플라스미드), MYR34/pMG47(aroZ로서 asbF를 갖는 뮤코닉 플라스미드), 및 MYR34/pMG70(aroZ로서 asbF를 갖는 뮤코닉 플라스미드)은 2% 글루코오스, 방향족 아미노산 및 방향족 비타민을 함유하는 최소 배지를 포함하는 셰이크 플라스크에서 48시간 동안 37℃에서 성장되었다. 상청액은 수집되고 HPLC로 분석되었다. 예상한 바와 같이, 비어있는 벡터로 형질전환된 MYR34는 DHS를 축적했고 뮤콘산을 생산하지 않았다. 시험된 두 개의 aroZ 동족체 및 하나의 유사체는 DHS를 뮤콘산 생산의 흐름으로의 전환에 기능적이고, 그 정도를 변화시키는데에 기능적이다. quiC 유전자를 발현하는 MYR34 유도체는 매우 강력하고, 미미한 양의 DHS 잔류물을 갖도록 뮤콘산으로 DHS의 거의 100% 전환율을 보였다. 균류 aroZ 동족체, qa-4를 발현하는 MYR34 유도체는 DHS의 뮤콘산으로의 약 80%에 육박하는 전환율 및 20% DHS 잔류물을 보였다. 마직막으로, asbF 유전자를 발현하는 MYR34 유도체는 DHS의 뮤콘산으로의 50% 전환율과 50% DHS 잔류물을 보였다. 종합하면, 우리의 셰이크 플라스크 분석 조건 하에서, quiC 유전자의 발현 및/또는 활성은 다른 aroZ 동족체의 경우에 비해 가장 높은 것으로 보여졌다.
실시예 8
catAX, aroY 및 quiC의 염색체의 통합
뮤콘산은 adhE 자리에서 구성 포르모터로부터 발현된 catA-X, aroY 및 quiC의 염색체가 통합된 단일 복제만을 함유하는 균주에 의해 생산될 수 있다.
MYR170(△aroE, △ack::P 15 -aroB), 고 DHS 생산자는 염색체에서 adhE 자리에서 뮤콘산 경로 유전자들을 통합하기 위해 사용된 숙주 균주였다(서열번호: 41). 결과의 균주 MYR352는 플라스미드 YEp24(중-복제, 비어있는 벡터), pCP32AMP(중-복제, 네이티브 프로모터로부터 발현된 aroG), 또는 pCP50 (중-복제, 그들의 개별적인 네이티브 프로모터로부터 발현된 aroG 및 tktA)로 형질전환되어, 유도체 균주를 형성했다. 후자 두 개의 플라스미드는 DHS 생산을 증가시키기 위해 사용되었다. 균주들은 전술한 바와 같이 2% 글루코오스를 함유하는 셰이크 플라스크 배지에서 72시간 동안 37℃에서 성장시켰다. 상청액은 72시간에 수집되었고, HPLC에 의해 분석되었다. 예상한 바와 같이, aroG 및 aroG/tktA로 형질전환된 MYR352 유도체들은 비어있는 벡터 대조군과 비교할 때 총 생성물 형성에서 전반적인 증가를 보였다(도 14). 모든 MYR352 형질전환체들은 주목할 만한 역가의 뮤콘산을 생산했으며, 이는 뮤콘산이 통합된 "뮤코닉 경로" 유전자만을 함유하고 유전자 발현의 화학적 유도물질을 공급함 없이 균주에 의해 생산될 수 있다는 것을 최초로 증명한 것이다.
이러한 임의의 MYR352 유도체 균주들에서 생성된 DHS 모두가 최종 산물인 뮤콘산으로 전환된 것은 아니다. 대신에, 상당량의 카테콜 축적이 존재했으며(도 14), 이는 catAX의 발현 또는 활성이 염색체 상의 단일 복제로부터 발현되는 경우에 제한된다는 것을 시사한다. 주요 축적 중간체가 카테콜이기 때문에, 뮤콘산 합성에 있어서 quiC 및 aroY 유전자 발현 및/또는 활성은 MYR352 배경 균주에서 충분할 것으로 보인다.
MYR352 균주 유도체는 유사체 MYR219 균주 유도체와 나란히 비교되었다. MYR219 균주는 MYR170 균주와 동일하지만, 뮤콘산 경로 유전자를 발현하는 저-모사 플라스미드 pMG37을 함유한다. 따라서, MYR352 및 MYR219 균주간의 주된 차이점은 뮤콘산 경로 유전자의 용량에 관한 것이다(각각, 1 복제 vs 약 5 복제). MYR352 유도체 균주에 비하여, MYR219 유도체 균주는 카테콜 또는 다른 중간체들의 매우 적은 축적을 보였고, 최종 산물인 뮤콘산을 성공적으로 생산했다. 종합해보면, 이러한 결과들은 MYR352와 같은 균주에서 catAX 활성을 증가시키기 위한 필요성을 보여준다.
실시예 9
catAX의 발현
MYR352 균주에서 카테콜의 축적 및 뮤콘산의 비효율적인 생산은 catAX 유전자 산물(들)의 용량 및/또는 활성을 제한하는 것 때문이다. 전술한 바와 같이, MYR352는 강력한 구성 프로모터 하에서 △aroE, △ack::P 15 -aroB, 및 catAX, aroY 및 quiC의 염색체 통합된 단일 복제를 함유한다. 이 균주는 중-복제 비어있는 벡터 대조군(YEp24) 또는 aroG/tktA 발현 플라스미드(pCP50)으로 형질전환되어, 방향족 아미노산 합성 경로 안으로의 탄소 흐름을 증가시키고 많은 양의 DHS를 생산한다. 전술한 바와 같은 2% 글루코오스가 보충된 셰이크 플라스크 배지에서 72시간 동안 37℃에서 형질전환된 균주를 성장시키는 것은 카테콜 중간체의 축적을 가져왔다. 이런 결과는 catAX 활성이 MYR352에 불충분할 수 있다는 것을 시사했다. 이런 가설을 확인하기 위하여, MYR352/pCP50에서 카테콜 축적을 경감시키기 위한 저-모사 플라스미드로부터 발현된 하나 이상의 뮤콘산 경로 유전자의 능력이 시험되었다(도 15). 구체적으로, MYR352/pCP50은 저-모사 비어있는 벡터 대조군(pCL1921) 또는 뮤콘산 생산 경로의 모든 세 개의 유전자, 두 개의 유전자, 또는 하나 의 유전자를 발현하는 플라스미드로 더 형질전환되었다. 유도체 균주는 전술한 바와 같은 셰이크 플라스크 실험에서 분석되었다. (pMG27로부터의) aroY의 용량만을 증가시키거나 (pMG39로부터의) quiC의 용량만을 증가시키는 것은 카테콜 축적을 경감시키지 못했지만, (pMG37로부터의) 모든 뮤콘산 경로 유전자 또는 (pMG33으로부터의) catAX와 aroY 모두의 발현은 카테콜의 뮤콘산으로의 성공적인 전환을 가져왔다. 나아가, (pMG31로부터의) catAX만의 발현은 뮤콘산의 생산 및 카테콜의 축적을 방지하기에 충분했다.
실시예 10
누출 aroE 돌연변이의 제작
시스, 시스-뮤콘산을 생산하기 위한 선행기술 공정에서, 숙주 균주는 삭제 돌연변이인 aroE353, 즉 aroE 유전자에서 돌연변이를 함유한다. 그 결과, 균주는 쉬키메이트 경로로부터 만들어진 방향족 아미노산(페닐알라닌, 티로신, 및 트립토판) 및 방향족 비타민(p-히드록시벤조산, p-아미노벤조산, 및 2,3-디히드록시벤조산)의 공급을 필요로한다. 방향족 아미노산은 상업적으로 매력적인 공정에서 공급되기에 너무 비싸다. 따라서, 선행기술 공정은 실질적인 개선이 필요하다. 이는은 aroE 유전자의 누출 유형인 aroE*를 도입하는 것에 의해 달성될 수 있다. 누출 돌연변이는 삭제 표현형(null phenotype)을 초래하는 aroE 코딩 서열에서 하나의 아미노산을 바꾸는 미스센스 돌연변이를 최초 생성하는 것에 의해 얻어진다. 이는 상기 나열된 여섯개의 방향족 화합물에 대한 임의의 형태의 돌연변이유발 및 동시의 영양요구성에 대해 선별함으로써 달성될 수 있다. 바람직한 방법은, Taq DNA 중합효소를 사용하고, 템플레이트로서 야생형 대장균 게놈 DNA를 사용하고, aroE 코딩 영역의 상류에서 약 1000개의 염기쌍 및 하류에서 1000개의 염기쌍을 혼성화하는 PCR 올리고뉴클레오티드 프라이머를 사용하는 오류-유발 PCR 돌연변이유발(error-prone PCR mutagenesis)에 의해 돌연변이 aroE 유전자의 풀을 만드는 것이다. 결과로 얻은 선형 DNA 분자의 풀은 시스, 시스-뮤콘산을 생산하고 aorE 코딩 영역을 대체하는 통합된 cam R , sacB 카셋을 함유하는 대장균 C 유도체를 형질전환하기 위해 사용되고, 수크로오스 저항에 대해 선택된다. 이후에, 형질전환체는 클로르암페니콜 내성을 잃고 상기 나열된 여섯개의 방향족 화합물을 요구하는 영양 요구체들에 대하여 선택된다. 몇몇 독립적인 영양요구체들은 선택되고, 여섯개의 방향족 화합물이 없는 최소 글루코오스 플레이트 상에 (최소 글루코오스 배지에서 세척된) 약 107, 108, 또는 109 세포를 플레이팅하는 것에 의해 복귀능력(revertability)에 대해 시험된다. 플레이트 상에서 콜로니가 생기게 하는 복귀돌연변이체는 선택되고, 방향족 아미노산의 실질적 수준의 생산 없이 시스, 시스-뮤콘산의 생산에 대하여 시험된다. 이러한 복귀돌연변이체들 중에는 aroE 유전자에 하나 이상의 돌연변이를 가지고 있어서 AroE 효소가 성장에 충분한 방향족 아미노산 및 비타민을 제공하지만 이러한 방향족 아미노산의 잉여물은 제공하지 않는 균주가 있을 것이다. 누출 aroE 돌연변이체를 얻는 또 다른 방법은 aroE353 및 aroE24(둘 모두 the Coli Genetic Stock Center at Yale University, New Haven, CT, USA로부터 얻을 수 있음)와 같은 종래의 복귀성 aroE 돌연변이들 중 하나를 시스, 시스-뮤콘산 생산 균주에 도입하고, 전술한 바와 같은 복귀돌연변이체에 대해 선택하는 것이다.
실시예 11
촉진 확산에 의한 글루코오스의 이입
방향족 경로의 제1 개입단계에서 기질들 중 하나는 포스포에놀피루베이트(PEP)이다. PEP는 또한 포스페이트의 공급원이고, 글루코오스 및 일부 다른 당들을 박테리아 포스포트랜스퍼라아제 시스템(PTS)에 의해 이입하기 위한 에너지이다. 따라서, 박테리아가 PTS-의존성 당 상에서 성장하는 경우에, PTS 및 PEP에 대한 방향족 경로 사이의 경쟁이 존재한다. 따라서, 방향족 경로에 대한 플럭스를 증가하도록 현저히 개선하는 것은 PTS를 제거하고 당 활용에 대한 다른 경로를 제공하는 것에 의해 달성될 수 있다. 이런 문제점에 대한 하나의 해결책은 PTS를 대장균 GalP 투과효소인 글루코오스 활용에 대해 상당히 잘 일하는 양성자 공수송체(proton symporter)로 교체하는 것이다(미국특허 6,692,794). 그러나, 양성자 공수송체는 투과효소를 작동시키기 위해 필요한 양성자 구배를 유지하기 위하여 여전히 에너지를 사용한다. 따라서, 공정에 대한 추가적인 개선이 여전히 필요하다.
자일로오스와 같은 일부 당들은 에너지를 ATP(아데노신 트리포스페이트)의 가수분해로부터 유도하는 수송 단백질에 의해 이입될 수 있다. 다시, 만일 에너지-의존성 수송체가 적은 에너지를 필요로 하는 수송체에 의해 교체될 수 있다면, ATP에 내재하는 에너지가 다른 유익한 사용을 위해 보존될 수 있기 때문에 개선이 이루어질 수 있다.
현저한 개선은 촉진 확산 수송체를 사용하는 것에 의해 얻어질 수 있는데, 이러한 촉진 확산 수송체는 당의 이입을 위해 에너지를 소모하지 않는다(Parter 등, 1995; Snoep 등, 1994). 예를 들어, glf 유전자에 의해 인코딩된 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 글루코오스 촉진자는 3-디히드로쉬키메이트(DHS) 생산 균주 대신에 또는 그에 더하여 사용될 수 있다(Yi 등, 2003). 그러나, 이러한 균주는 글루코오스 이입을 위해 GalP에 여전히 적어도 일부 의존한다. GalP는 글루코오스의 이입을 위한 양성자 구배의 형태에서 에너지를 필요로 하기 때문에, 뮤코닉 생산 균주에 대한 글루코오스 이입의 효율에 개선이 필요하다.
glf 플러스 글루코키나아제 유전자, glk, 또한 자이모모나스 모빌리스로부터의 유전자의 발현을 위한 카셋은 P26과 같은 강력한 구성 프로모터와 함께 결합될 수 있다. 이런 카셋은 소정의 화합물의 생산을 방해하지 않을 위치에서 숙주 균주의 게놈 안으로 통합될 수 있으며, 여기서 소정의 화합물은 시스, 시스-뮤콘산이다. 대장균 염색체에서 이러한 위치의 예는 트레오닌 퇴행성 오페론인 tdcABCDEFG이다. 만일, 성장 배지가 트레오닌을 함유하고 있지 않으면, 이런 오페론은 필요하거나 발현되지 않고, 따라서, 이런 오페론에서 발현 카셋의 삽입은 대사를 방해하지 않는다.
전술한 개선을 달성하기 위하여, PTS 기능을 인코딩하는 하나 이상의 유전자들은 실시예 1에 개시된 방법과 유사한 방법을 이용하여 결실된다. 예를 들어, 하나 이상의 ptsH, ptsI, crr, 또는 ptsG는 결실될 수 있다. 다음으로 galP가 결실된다. 이후에, P 26 -glf, glk 카셋은 실시예 1에서 설명된 바와 유사하게 2단계에 걸쳐서 도입될 수 있다. 제1 단계에서, cam R , sacB 카셋은 pAC21로부터 유래된 선형 DNA(서열번호: 15)를 사용하는 tdc 오페론에서 통합되고, 클로르알페니콜(30 mg/l) 내성에 대하여 선택된다. 제2 단계에서, P 26 -glf, glk 카셋은 pAC19로부터 유래된 선형 DNA(서열번호: 15)를 사용하는 tdc 오페론에서 통합되고, 수크로오스 내성에 대해 선택되고, 클로르암페니콜 민감성에 대해 선별되고, 이 경우에 최소 글루코오스 배지 상에서 성장이 개선된다.
글루코오스의 촉진 확산이 대장균에서 종래의 글루코오스 이입 시스템을 대체할 수 있는지를 시험하기 위하여, ptsHI 유전자 및 galP 유전자는 MYR34(△aroE)로부터 결실되었고, 이후에 P 26 -glf, glk 카셋은 pAC19로부터 유래된 선형 DNA(서열번호: 14)를 사용하는 tdc 오페론에서 통합되어서, 균주 MYR217을 얻었다. MYR217은 소정의 세 개의 방향족 아미노산 및 세 개의 방향족 비타민-유사 화합물로 보충된 최소 글루코오스 배지에서 상당히 잘 성장한다(도 16). 그러나, ptsHI 및 galP의 결실을 함유하지만 glf, glk 카셋을 함유하지 않는 균주 MYR31는 어떤 상당한 성장도 보이지 않았다(도 16). 따라서, 촉진 확산은 우리의 배경 균주에서 두 개의 종래의 글루코오스 이입 시스템을 대체하기에 충분하다.
촉진 확산이 방향족 경로로부터 유래된 화합물들의 생산에 유용한지를 시험하기 위하여, MYR34 및 MYR217이 pCP54(aroG, aroB) 및 pCP55(aroG, aroB, tktA)로 형질전환되었다. 셰이크 플라스크에서 방향족 중간체 3-디히드로쉬키메이트(DHS)의 생산은 이런 두 개의 균주에 대하여 비교되었다(도 17). pCP54 또는 pCP55 중 어느 하나에서, 촉진 확산을 사용하는 균주는 종래의 글루코오스 이입 시스템을 사용하는 균주만큼 또는 그 이상의 DHS를 생산했다. DHS의 생산은 유전자 조작된 대장균 균주에서 뮤콘산 생산에 대한 좋은 대용물이며, 따라서, 우리는 글루코오스의 촉진 확산이 뮤콘산 생성물에 대한 유용한 개선이라는 것이라고 결론내릴 수 있었다.
실시예 12
aroB 유전자의 과다발현
aroB 유전자의 발현은 시스, 시스-뮤콘산 생산에 대한 율속(rate limiting)으로 보고된다(Niu 등, 2002). 선행기술에서, 이는 aroB 유전자의 제2 복제와 그의 네이티브 프로모터를 통합하는 것에 의해 이른바 해결되었다. 그러나, 이는 aroB 제한을 경감하기에 충분하지 못한데, 이는 aroB 유전자의 네이티브 프로모터 및 리보솜 결합 부위가 전혀 이상적이지 않기 때문이다. 따라서, 공정은 실질적으로 개선이 필요하다.
aroB의 개선된 과다발현은, 예를 들어 염색체에서 네이티브 aroB 프로모터를 강력한 구성 프로모터, 예를 들어 고초균 파지 SPO1로부터의 P15 또는 P26 프로모터(각각, 서열번호: 1 및 서열번호: 2) 또는 박테리아파지 람다로부터의 PR 프로모터로 교체하는 것에 의해 얻어질 수 있다. 이는, cam R , sacB 카셋이 네이티브 염색체 aroB 프로모터 및/또는 제1 단계에서 리보솜 결합 부위를 대체하기 위해 사용되는 것을 제외하고는 실시예 4에서 설명된 2단계를 통해 달성된다. 제2 단계에서, 강력한 구성 프로모터는 선형 DNA로 형질전환하고 수크로오스 내성에 대해 선택하는 것에 의해 도입되는데, 여기서 선형 DNA는 강력한 구성 프로모터를 포함하고, 이어서 리보솜 결합 부위 및 하류측에 ATG 시작 코돈을 포함하는 aroB 코딩 서열의 5' 말단으로부터 적어도 50개의 염기들 및 강력한 구성 프로모터의 상류측에 네이티브 aroB 프로모터의 바로 상류에 동족체의 적어도 50개의 염기쌍들을 포함한다. 유사한 방법을 사용하여 강력한 프로모터를 도입하는 것외에 또는 그 대신에, 강력한 리보솜 결합 부위, 예를 들어 AGGAGG는 aroB의 ATG 번역 시작 코돈으로부터 약 4 내지 10 염기쌍 상류에 도입될 수 있다. 이러한 합성 카셋, 예를 들어 P 15 -aroB 카셋의 복제는 네이티브 aroB 자리로부터 구별되는 자리, 예를 들어 ack 자리에서 염색체에 통합될 수 있다. ack 유전자의 동시적 결실 뿐만 아니라, 실시예 4에서와 같은 poxB 유전자의 결실은, 발효과정에서 원치 않은 아세테이트의 형성을 감소시키는 것을 도와줄 수 있다.
실시예 13
펜토오스 포스페이트 경로의 산화적 분지(oxidative branch)를 통한 플럭스의 감소
방향족 경로에서 제1 개입단계를 위해 필요되는 에리트로오스-4-포스페이트는 펜토오스 포스페이트 경로(PPP)의 비-산화적 부분으로부터 유래된다. 탄소가 PPP 안으로 도입되는 두 가지 다른 경로들이 존재한다. 제1 경로는, 효소 글루코오스-6-포스페이트 탈수효소(zwf 유전자에 의해 인코딩됨), 6-포스포글루코노락토나아제(6-phosphogluconolactonase)(pgl 유전자로부터 인코딩됨) 및 6-포스포글루코네이트 탈수효소(gnd 유전자에 의해 인코딩됨)에 의해 글루코오스-6-포스페이트로부터 리불로오스-5-포스페이트를 얻는 것이다. 이러한 세 단계 중 마지막에서,하나의 탄소는 CO2로서 소실된다. PPP로의 이러한 경로는 PPP의 산화적 분지로 불린다. 이후에, 리불로오스-5-포스페이트는 이소머라아제, 에피머라아제, 트랜스케토라아제 및 트랜스알돌라아제의 작용에 의해 다양한 다른 당 포스페이트로 전환된다. 리불로오스-5-포스페이트로 시작되는 이러한 가역반응의 그룹은 PPP의 비-산화적 분지로 불린다. 탄소가 PPP로 진입하는 제2 경로는 프룩토오스-6-포스페이트 및 글리세르알데히드-3-포스페이트(해당작용으로도 알려져 있는 엠덴-마이어호프 경로(Embden-Meyerhof pathway)로부터 둘 다 유래됨)를 통해 이루어지며, 이들은 트랜스알돌라아제 및 트랜스케토라아제에 의해 혼합되고 재배열되어서 다양한 다른 당 포스페이트를 형성하고, 이러한 당 포스페이트 중 하나는 에리트로오스-4-포스페이트이다. 만일 탄소가 제2 경로를 통해 PPP 안으로 진입하면, CO2는 소실되지 않는다. 글루코오스로부터 시스, 시스-뮤콘산의 수율을 개선하기 위하여, CO2의 소실은 PPP의 산화적 분지를 차단하는 것에 의해 방지될 수 있어서, PPP에 진입하는 모든 탄소는 프룩토오스-6-포스페이트 및 글리세르알데히드-3-포스페이트로부터 비-산화적 경로를 통과하게 된다. PPP의 산화적 분지의 차단은, tyrR 유전자를 결실시키기 위하여 실시예 1에서 개시된 것과 유사한 2단계의 방법을 사용하여 zwf 유전자를 결실시키는 것에 의해 달성된다.
실시예 14
방향족 경로로의 플럭스 및 PEP를 통한 플럭스의 증가
PEP가 시스, 시스-뮤콘산으로의 경로에 대한 율속 중간체가 아니게 하는 것이 바람직하다. 이는, 예를 들어 효소 PEP 합성효소에 의한 PEP로 피루베이트의 재생을 증가시키는 것에 의해 달성되며, 이는 다른 실시예들에서 설명한 바와 같이 pps 유전자의 과다발현 카셋을 통합하는 것에 의해 달성된다. 다른 접근법은 대장균에서 pykA 및 pykF 유전자에 의해 인코딩되는 피루베이트 키나아제에 의해 PEP의 소비를 제한하는 것이다. 이 경우에, 상기 접근법은 효소(들)의 활성을 감소시키기 위함이다. 이는 피루베이트 키나아제를 인코딩하는 하나 이상의 유전자들을 결실시키거나(실시예 1에서 tyrR로 설명됨), 또는 프로모터, 리보솜 결합 부위 또는 코딩 서열을 돌연변이화하는 것에 의해 이러한 하나 이상의 유전자들의 발현 강도를 감소시키는 것에 의해 달성되어서, 피루베이트 키나아제 활성의 수준은 감소된다. 예를 들어, 대장균 pykA 유전자의 앞에 위치한 RBS는 5'CGGAGYAYYACATG이다. ATG 번역 시작 코돈은 밑줄그었다. 이 서열은 CaGAGTATTACATG, CaaAGTATTACATG, CaatGTATTACATG, CaataTATTACATG 등으로 돌연변이될 수 있어서, RBS 서열은 한번에 하나의 염기를 변화시키는 것에 의해 AGGAGG의 덜 유사한 공통 RBS(consensus RBS)를 만든다. 각각의 돌연변이 유형은 pykA 자리에서 염색체 안으로 통합되어, 야생형을 대체하고, 시스, 시스-뮤콘산 생산 수준은 개선 여부에 대해 측정된다.
실시예 15
수크로오스 상에서 성장을 부여
대장균 C로부터 유래된 균주들은 유일한 탄소원으로서 수크로오스 상에서 성장하지 않는다. 그러나, 그들은 본원에 전체가 참조로서 포함되는 PCT 특허출원서 PCT/US11/064598에서 개시된 바와 같이 유전적으로 조작될 수 있다. 따라서, 시스, 시스-뮤콘산 생산 균주는 전술한 명세서에서 개시한 바와 같이 수크로오스 상에서 성장하도록 유전자 조작될 수 있다.
실시예 16
시스, 시스-뮤콘산의 개선된 생산자
실시예 1 내지 15에서 설명된 모든 특징들은 차례로 특징들을 도입하는 것에 의해 대장균의 한 균주에 결합될 수 있다. 결과로 얻은 균주는 개선된 시스, 시스-뮤콘산 생산자를 포함한다. 이후에, 결과로 얻은 균주는 제1 복제의 위치로부터 분리된 위치에서 차례로 전술한 과다발현 카셋 각각의 제2 복제를 통합하는 것에 의해 더 개선될 수도 있다. 편리하고 안전한 위치의 예는 리보솜 RNA를 인코딩하는 rrfF의 종결자로부터 바로 하류에 있는 BsrB1 제한부위이다. 소정의 카셋은 블런트 선형 DNA로서 플라스미드 pMH17F(서열번호: 17)의 특유의 BsrB1 부위 안으로 결찰된다. 한 예는 catAX 발현 카셋의 결찰에 의해 pcatAX 플라스미드를 얻는 것이다. 이와 동시에, cam R , sacB 카셋은 블런트 단편으로서 pMH17F 안으로 결찰되어 pMH28F(서열번호: 19)를 얻는다. PCR에 의해 또는 제한 효소 절단에 의해 pMH28로부터 유래된 선형 DNA는 rrfF 부위에서 cam R , sacB 카셋을 두기 위하여 사용된다. 다음으로, PCR에 의해 또는 제한효소 절단에 의해 pcatAX로부터 선형 DNA 유래된 선형 DNA는 수크로오스 상에서의 선택을 사용하는 rrfF 자리에서 catAX 카셋의 제2 복제를 도입하는데에 사용된다. 이후에, 결과로 얻은 균주는 시스, 시스-뮤콘산 생산에 대해 그의 조부모 균주와 비교하여, catAX가 제한 단계인 것을 확인했다. 유사한 방법에 의해, 실시예 2 내지 15로 부터의 카셋 각각은 율속 단계에 대해 시험된다. 만일 단계가 율속이라고 판명되면, 관련 카셋의 하나 이상의 추가 복제는 염색체에서 또 다른 적절한 위치에서 통합되어, 플라스미드 또는 유도 프로모터의 필요 없이 시스, 시스-뮤콘산 생산에 추가적인 개선을 가져왔다.
실시예 17
발효에 의한 시스, 시스-뮤콘산의 생산
시스, 시스-뮤콘산은 상기 실시예 1 내지 15에서 개시된 유전적으로 조작된 미생물에 의해 생산될 수 있다. 성장 배지는 광범위하게 변화될 수 있고, 미생물의 충분한 성장을 지원하는 임의의 배지일 수 있다. 바람직한 배지는 미네랄 염 및 글루코오스, 자일로오스, 락토오스, 글리세롤, 아세테이트, 아라비노오스, 갈락토오스, 만노오스, 또는 수크로오스와 같은 비-방향족 탄소원을 함유하는 최소 배지이다(바람직한 최소 성장 배지의 예에 대해 전술한 내용을 참조). 유전자 조작된 미생물 및 성장 배지의 각각의 조합에 대하여, 시스, 시스-뮤콘산을 생산하기 위한 적절한 조건은, 온도, pH, 용존 산소량, 및 화합물 또는 pH를 유지하기 위한 화합물과 같은 발효 파라미터들이 조직적으로 변화되는 정례적인 실험에 의해 결정된다. 시스, 시스-뮤콘산이 생산됨에 따라, 하나 이상의 화합물들은 pH가 낮아지는 것을 방지하기 위하여 발효기 안으로 공급되어야만 한다. 산을 중화하기에 적합한 화합물은 산화물, 수산화물, 카보네이트, 및 암모늄, 소듐, 포타슘, 칼슘, 마그네슘의 바이카보네이트와 같은 알칼리성 염, 또는 이러한 알칼리성 염의 두개 이상의 조합을 포함한다.
7 리터 발효기에서 대장균의 MYR428 균주에 의한 뮤콘산 생산은 도 18에 보여진다. △aroE △ackA::P 15 -aroB △poxB::tktA의 유전자형을 갖는 대장균의 MYR261 균주는 플라스미드 pCP32AMP 및 pMG37로 형질전환되어, MYR428을 생성한다. MYR428은 글루코오스 공급과 함께 48시간 동안 전술한 7리터 발효기에서 성장되었다. 최종 뮤콘산 역가는 16 g/l였다(도 18 참조).
발효가 종료된 후에, 세포들은 응집, 원심분리, 및/또는 여과에 의해 제거되고, 시스, 시스-뮤콘산은 이후에 하기 하나 이상의 단계들의 조합에 의해 정화된 브로스로부터 정제된다. 예를 들어, 침전법, 재결정법, 전기투석법, 크로마토그래피법(이온 교환, 소수성 친화, 및/또는 크기 기초), 미세여과법, 나노여과법, 역삼투법, 및 증발법.
SEQUENCE LISTING
<110> MYRIANT CORPORATION
Yocum, R. Rogers
Gong, Wei
Dole, Sudhanshu
Sillers, Ryan
Gandhi, Meghal
Pero, Janice G.
<120> PRODUCTION OF MUCONIC ACID FROM GENETICALLY ENGINEERED
MICROORGANISMS
<130> MC2013-01PCT
<150> US 61/632,777
<151> 2012-01-30
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 195
<212> DNA
<213> P15 promoter;
<400> 1
gctattgacg acagctatgg ttcactgtcc accaaccaaa actgtgctca gtaccgccaa 60
tatttctccc ttgaggggta caaagaggtg tccctagaag agatccacgc tgtgtaaaaa 120
ttttacaaaa aggtattgac tttccctaca gggtgtgtaa taatttaatt acaggcgggg 180
gcaaccccgc ctgtt 195
<210> 2
<211> 164
<212> DNA
<213> P26 promoter;
<400> 2
gcctacctag cttccaagaa agatatccta acagcacaag agcggaaaga tgttttgttc 60
tacatccaga acaacctctg ctaaaattcc tgaaaaattt tgcaaaaagt tgttgacttt 120
atctacaagg tgtggtataa taatcttaac aacagcagga cgct 164
<210> 3
<211> 91
<212> DNA
<213> PR promoter;
<400> 3
acgttaaatc tatcaccgca agggataaat atctaacacc gtgcgtgttg actattttac 60
ctctggcggt gataatggtt gcatgtacaa g 91
<210> 4
<211> 359
<212> PRT
<213> 3-dehydroshikimate dehydratase encoded by the qa-4 gene;
<400> 4
Met Pro Ser Lys Leu Ala Ile Ser Ser Met Ser Leu Gly Arg Cys Phe
1 5 10 15
Ala Gly His Ser Leu Asp Ser Lys Leu Asp Ala Ala Gln Arg Tyr Gly
20 25 30
Tyr Leu Gly Ile Glu Leu Phe Tyr Glu Asp Leu Val Asp Val Ala Glu
35 40 45
His Leu Ser Asn Glu Arg Pro Ser Pro Glu Gly Pro Phe Val Glu Ala
50 55 60
Gln Ile Ala Ala Ala Arg His Ile Leu Gln Met Cys Gln Ala Arg Gly
65 70 75 80
Leu Glu Val Val Cys Leu Gln Pro Phe Met His Tyr Asp Gly Leu Asn
85 90 95
Asp Arg Ala Glu His Glu Arg Arg Leu Glu Lys Leu Ala Leu Trp Ile
100 105 110
Glu Leu Ala His Glu Leu His Thr Asp Ile Ile Gln Ile Pro Ala Asn
115 120 125
Phe Leu Pro Ala Asn Gln Val Ser Asp Asn Leu Asp Leu Ile Val Ser
130 135 140
Asp Leu Cys Lys Val Ala Asp Ile Gly Ala Gln Ala Leu Pro Pro Ile
145 150 155 160
Arg Phe Ala Tyr Glu Ser Leu Cys Trp Ser Thr Arg Val Asp Leu Trp
165 170 175
Glu Arg Cys Trp Asp Ile Val Gln Arg Val Asp Arg Pro Asn Phe Gly
180 185 190
Ile Cys Leu Asp Thr Phe Asn Ile Leu Gly Arg Ile Tyr Ala Asp Pro
195 200 205
Thr Ser Pro Ser Gly Arg Thr Pro Asn Ala Lys Glu Ala Val Arg Lys
210 215 220
Ser Ile Ala Asn Leu Val Ser Arg Val Asp Val Ser Lys Val Phe Tyr
225 230 235 240
Val Gln Val Val Asp Ala Glu Arg Leu Ser Lys Pro Leu Leu Pro Gly
245 250 255
His Pro Tyr Tyr Asn Pro Glu Gln Pro Ala Arg Met Ser Trp Ser Arg
260 265 270
Asn Cys Arg Leu Phe Tyr Gly Glu Thr Glu Tyr Gly Ala Tyr Leu Pro
275 280 285
Val Lys Glu Val Ala Arg Ala Leu Phe His Gly Ile Gly Phe Glu Gly
290 295 300
Trp Val Ser Leu Glu Leu Phe Asn Arg Arg Met Ser Glu Glu Gly Pro
305 310 315 320
Glu Val Pro Glu Glu Leu Ala Met Arg Gly Ala Ile Ser Trp Ala Lys
325 330 335
Leu Val Gln Asp Leu Arg Ile Pro Val Glu Gly Pro Leu Val Thr Met
340 345 350
Pro Arg Val Ser Ala Ser Leu
355
<210> 5
<211> 2160
<212> DNA
<213> qa-4 gene from Neurospora crassa plus surrounding sequences;
<400> 5
gaattcggga aatggaatct tacctgggaa ccgaaatcac agtccgggta ggttatagag 60
catatagtga actgtcaaag ttctagacct ggaccagcca cttggagtcg ttgttttagt 120
tatacctaca ttcactcact gttgactttc aatcatactt acttagacgg agcaacgcgc 180
cagaatccaa attgttgcat agttgcggta tcaccaagtg gcttcccata atagtttgcc 240
attcgatgag acagctaact ggaagaccgg tactcgcagg ttgcacgatt acacggaagg 300
attcggtatt ccgtgtttca tctgtcaaag tccctttcca tatgaatccg aggtactatg 360
actggatctc gatacaagct ggccagcgag gtgcctgcct tgacaggctg tcaactgcgg 420
gacggccggc taagtgttta acacgcaagg gtggaagatg tctcgtcccg tcatccaaga 480
ccgtcaacat tcgaggccat ctgatcgttg aagagatgct aaatcttgtg aaacgctcat 540
aggtcgctta ccttcggccc acccgttaat gctttattcc gctgagcaaa cttcggcttc 600
catcccgcgg ttcaccgttt acatcactta tcgttgcggt tattggccga ttcttcgcaa 660
accgaaacga tgacatcccg aatatctgca atacaccgcc acggccggcg tctttatcac 720
acctcctatg ggagacgaaa gtgccttgat acccctagtc atttgaagat tcaggatggg 780
agacggctgg ccgcttgcgg agttacgttc gagtcttggt cgcaggaacg cttgccgtat 840
tgaatgagac cccgagaagg tcaaatcaaa tcttggaaga ccccaactgc ttcctcattg 900
ccttcactcc ccatatcaat ggggcacatc ctgtgactac cttggtgctt tatttcctca 960
ccatttggcg atacaagctc aaggacaccg aggtgatata cagttcttca aggacactat 1020
ctcacctcaa tatcaagaac cagtctcatc atctcttatt tctccaggat ccccccacca 1080
acaacatcgg cttttttttt tcccctattc tcaagaccca tcaagacgct cacttcgctg 1140
agcctttcgc catgccgtca aagctagcca ttagttccat gtccctaggg cgctgctttg 1200
ccggccactc tctggacagc aagcttgatg ccgctcaacg atacggctat cttggtatcg 1260
agctttttta tgaggatctg gtcgacgttg cagagcattt gtcgaacgag cgtccctctc 1320
ccgaaggccc ttttgtcgaa gctcagatag ccgccgctcg tcatattctc cagatgtgtc 1380
aagccagggg gcttgaggtc gtctgcctcc agcctttcat gcactacgac ggccttaacg 1440
acagggcaga acatgagcgt cgtctggaga agctagcact atggattgag ctcgctcatg 1500
agcttcacac cgacatcatt cagatcccag ccaacttcct ccctgccaac caagtcagtg 1560
acaacctcga cctgattgtc tcagatcttt gcaaggtggc cgatattgga gctcaagctt 1620
tgccccctat ccgctttgcc tacgagagtc tttgctggag cacccgtgtc gacctctggg 1680
agcgctgctg ggacatcgta caacgcgttg accgccccaa ctttggcatt tgccttgaca 1740
ccttcaacat cctcggccgc atctatgccg accctacatc tcctagcggt aggacaccca 1800
acgcaaaaga ggcagtcagg aagtccatcg ccaacttggt ctcgcgcgtg gatgtctcca 1860
aagtcttcta cgtccaggtg gttgacgccg agaggctgag caagccacta ctgcccggtc 1920
acccgtatta caatccagag cagccggcga ggatgagctg gtcgcgcaat tgtagactgt 1980
tctacggcga aacagaatat ggtgcgtatc ttcccgtgaa ggaggttgct cgagcccttt 2040
tccacggcat tggtttcgag ggctgggtca gtttggagct tttcaaccgc agaatgtctg 2100
aggagggacc tgaagtgccg gaggaacttg ccatgagagg cgctatctcg tgggccaagt 2160
<210> 6
<211> 348
<212> PRT
<213> QutC from Aspergillus nidulans encoded by the qutC gene;
<400> 6
Met Pro Ala Asn Leu Lys Ile Gly Ile Pro Thr Val Ser Leu Ser Lys
1 5 10 15
Pro Gly Leu His Ser Leu Asp His Lys Leu Arg Ser Ala Ala His Gly
20 25 30
Phe Ala Gly Ile Glu Leu Phe Ile Asp Asp Leu Ser His Phe Ala Ser
35 40 45
Ser Ser Phe Asn Gly Ser Leu Thr Gln Ala Ala Lys Tyr Ile Ser Ser
50 55 60
Leu Ala Lys Gln Leu Asn Leu Thr Phe Ile Cys Leu Gln Pro Phe Gly
65 70 75 80
Phe Tyr Glu Gly Leu Val Asp Thr Asn Gln Ser Thr Tyr Leu Leu Thr
85 90 95
Glu Lys Leu Pro Leu Trp Phe Ala Ile Ala Arg Ile Ile Gly Thr Asp
100 105 110
Leu Ile Gln Ile Pro Ala Asn Phe Leu Gln Asn Asp Pro Val Thr Gly
115 120 125
Ala Ala Arg Thr Ser Gly Asp Ile Arg Leu Ile Val Ser Asp Leu Gln
130 135 140
Thr Ile Ala Asp Ile Gly Val Lys Gln Gly Phe Arg Phe Val Tyr Glu
145 150 155 160
Ala Leu Cys Trp Ser Thr His Val Asp Thr Trp Glu Ala Ala Trp Asn
165 170 175
Val Val Lys Leu Val Asp Arg Glu Asn Phe Gly Ile Cys Leu Asp Ser
180 185 190
Phe Asn Thr Arg Thr Pro Leu Pro Ser Leu Gly Arg Arg Arg Met Leu
195 200 205
Ser Lys Pro Trp Pro Ser Pro Trp Arg Arg Ser Val Leu Ser Ser Pro
210 215 220
Val Glu Asn Trp Thr Ser Gly Lys Ser Ser Thr Ser Ser Leu Ser Met
225 230 235 240
Ala Ser Gly Cys Arg Arg Arg Trp Thr Arg Ser Thr Pro Phe Met Trp
245 250 255
Arg Ala Asn Pro Arg Arg Met Ser Trp Ser Arg Asn Ala Arg Leu Phe
260 265 270
Pro Cys Glu Glu Glu Arg Gly Gly Tyr Leu Pro Val Leu Glu Ile Ala
275 280 285
Arg Ala Phe Phe Glu Ile Gly Phe Glu Gly Trp Val Ser Leu Glu Leu
290 295 300
Phe Ser Arg Thr Cys Asn Asp Pro Asp Val Asn Thr Val Gly Glu His
305 310 315 320
Ala Arg Arg Gly Met Asp Arg Arg Arg Arg Val Val Ala Ala Leu Gly
325 330 335
Leu Asp Val Glu Val Pro Ala Arg Asn Cys Glu Cys
340 345
<210> 7
<211> 3298
<212> DNA
<213> qutC gene from Aspergillus nidulans plus surrounding sequences;
<400> 7
aagcttggtt tcaagtgatg atatatagtt atgaggatat aatatgaacc gaaagacgat 60
gtttcttgtg aatatttacg tgatagttgt ctgtctaata tggtacagca gtagaacaac 120
tacatacggt cactacttac agccctagtc attccctccc tcgattgcct accatttata 180
cactttgaac atccacaggc ttgcctccct ccatactctc cctaacagct tgaacaactc 240
tgagcgccct caccccatct tcaacgccac agccaactcc tcgctcgcca tcctcaccct 300
ttccactaac aacatcaaca aaatatcccc actgcgcatc aaacggcctc acatcagcat 360
ccttcactga aatctgctgc atcgccaact ccgtattcca gcctttctct ttcccctgtc 420
cacaagaaac atggtcatag ctccagcgcg tcatatcagg cacactgaga ctcgctctgg 480
ttccaagaat tcgataacag tcgcttgcac tcttggaagg agcgggcgga atcgtaggat 540
tctcgcccgt tcctgtttca aagttcaacg gcgaaggcgt cgcgtcgcag atgagaaatg 600
tgcctactat cccagacgca aagcgcagcg tcacagcaca gccttcctcg gcggtatgtt 660
ccgggttctg gcgcatgcgc tgcaggagtg taccctccgc gtagacccta ctgacgggcc 720
caaacagaaa ctgcagcacg tcgatatcgt ggataagatt aatccccagc acgccgccct 780
tcttcttatc tgcgcgccaa gaaccgagcg gcggcgcgaa gtaagaggcc ggcttcagaa 840
gtgtccagag gccgttcact gcaacgacgg tgccgagtga gtctgtctct aacaaagact 900
ttgtggtttg gatgtacgga ttgaagcggc ggtggtggcc gatctggatg ttgatcttcg 960
catccttgcc tctcttctca tctttacatt tctgttcctt gacggtagcg aggaggtgct 1020
cggccgactc cagatcgtca ctgatcggtt tctcaaggag gatattgcgg attccgttct 1080
ccagcagctg gagcgtgacg tccacgtgcg tgtgattggg cgtgctcacg atcgccgcgt 1140
ctggtttccc ggttgtctta ccgacaacgt ctaacataga cgtaatagaa tcatagcaag 1200
gaacgccaaa tgattctgcg accgggattg cagagggtga agggtcaaca aaagcgatca 1260
gctgggttcg tgggtgtcgt tgcacggatt gtgcgtgacg gggcccaata agtccggcac 1320
cgacgatgac aatgaggata ttcttgtcct tttccttgct gcagggcacc attgtgcatg 1380
tcggtggctg gaaataaaca gaacagggat atggtcaagt cggagaatcg gtgcaggata 1440
gaccggctac ttgatgtagg acgacagtcg cgatctaccg agagcgtgag attcactgtg 1500
ggactgattt atgtaatttg aggcgcagca gacttaggga cttgaaatgt ggctgtctgt 1560
ggatgcattt gcggggtatg gagtacagag tgcatacagc tgtgtatatg gagttcctta 1620
cggagagggt gacctggtat ggggagaacg ggcaaaatgc tcacccggca acctctcaaa 1680
gcgtttaccc ggtatactcc tctgatatca atatttccaa tcagcaccta tatcatcacg 1740
acgctctcct gaggattccg tagctaaccg ccctggatcc tacattaata aataagccat 1800
ttgctttttc tgctgcgagt gtgattctca atacgattac gtatcacatg cagattgcct 1860
ttacttcagc tgcatttgat cagccacagc tctaagagca aacataccct acctacctac 1920
ctacttcgcc tagggtacat aatcaccgcc atctcctcct cgatcagtct tcaactcaat 1980
cagctcattc attctattct taatataata tataccttta gatctccagc agagacccga 2040
agagtcggca attcaaaatg cccgcaaacc tcaaaatcgg tatcccaacc gtgtccctgt 2100
caaaaccggg cctgcactct cttgaccata agctccgctc ggccgctcat ggcttcgcgg 2160
ggatcgagct gtttattgat gacctctccc atttcgcctc atcgtcattc aatggctccc 2220
tcactcaagc ggcaaagtat atctcctcgc tcgccaagca acttaacctc acatttatct 2280
gcctgcaacc attcggtttc tacgagggtc tggtggacac aaatcagtcg acgtacctgc 2340
tcactgagaa actcccgctc tggtttgcga tcgcccgcat tataggcaca gatctcatcc 2400
aaatccccgc aaatttcctc cagaatgacc ctgtcaccgg ggctgcacga acaagcggcg 2460
acataaggct tatcgtctca gatctgcaga cgatcgcaga tatcggtgta aagcagggct 2520
tccgctttgt gtacgaggcg ctctgctggt cgacgcatgt cgatacatgg gaagcagcgt 2580
ggaatgtcgt caagctggtt gatagagaga atttcgggat ctgcctggat agcttcaaca 2640
cgcggacccc gcttccgtca ctgggaagac gccggatgct gagcaagccg tggccaagtc 2700
catggagacg ctccgttctc tcgtctccag tggagaactg gacatcagga aaatcttcta 2760
catccagctt gtcgatggcg agcggttgtc ggcgccgctg gacgagaagc acccctttca 2820
tgtggagggc caacccccga agaatgagct ggagtcgcaa tgcgcggtta ttcccctgtg 2880
aagaggagag gggtgggtat cttcctgtgt tggagatcgc gagggcgttc tttgaaatcg 2940
ggttcgaggg gtgggtgagt ctagagctgt tttcaaggac gtgtaatgat cccgatgtga 3000
acacggtggg ggagcatgcg agacgtggga tggatagaag gaggagggtt gttgcggcgc 3060
taggactcga tgttgaggtg ccagcacgta actgtgaatg ttagcatgaa cggcaaggag 3120
agggtggagg tgcaggtgca ggaggagctg gctgttcagc atcggctgta ggtagtggta 3180
tcttgaaagg acgatagggt ttgatctaga gatttttatt ttgtctaatt actggtaatg 3240
atggcctcat gcacgctgtt gaacacgctg tacaacatca ctgttgaaga tgatacct 3298
<210> 8
<211> 502
<212> PRT
<213> AroY from Klebsiella pnemoniae ATCC25597;
<400> 8
Met Thr Ala Pro Ile Gln Asp Leu Arg Asp Ala Ile Ala Leu Leu Gln
1 5 10 15
Gln His Asp Asn Gln Tyr Leu Glu Thr Asp His Pro Val Asp Pro Asn
20 25 30
Ala Glu Leu Ala Gly Val Tyr Arg His Ile Gly Ala Gly Gly Thr Val
35 40 45
Lys Arg Pro Thr Arg Ile Gly Pro Ala Met Met Phe Asn Asn Ile Lys
50 55 60
Gly Tyr Pro His Ser Arg Ile Leu Val Gly Met His Ala Ser Arg Gln
65 70 75 80
Arg Ala Ala Leu Leu Leu Gly Cys Glu Ala Ser Gln Leu Ala Leu Glu
85 90 95
Val Gly Lys Ala Val Lys Lys Pro Val Ala Pro Val Val Val Pro Ala
100 105 110
Ser Ser Ala Pro Cys Gln Glu Gln Ile Phe Leu Ala Asp Asp Pro Asp
115 120 125
Phe Asp Leu Arg Thr Leu Leu Pro Ala His Thr Asn Thr Pro Ile Asp
130 135 140
Ala Gly Pro Phe Phe Cys Leu Gly Leu Ala Leu Ala Ser Asp Pro Val
145 150 155 160
Asp Ala Ser Leu Thr Asp Val Thr Ile His Arg Leu Cys Val Gln Gly
165 170 175
Arg Asp Glu Leu Ser Met Phe Leu Ala Ala Gly Arg His Ile Glu Val
180 185 190
Phe Arg Gln Lys Ala Glu Ala Ala Gly Lys Pro Leu Pro Ile Thr Ile
195 200 205
Asn Met Gly Leu Asp Pro Ala Ile Tyr Ile Gly Ala Cys Phe Glu Ala
210 215 220
Pro Thr Thr Pro Phe Gly Tyr Asn Glu Leu Gly Val Ala Gly Ala Leu
225 230 235 240
Arg Gln Arg Pro Val Glu Leu Val Gln Gly Val Ser Val Pro Glu Lys
245 250 255
Ala Ile Ala Arg Ala Glu Ile Val Ile Glu Gly Glu Leu Leu Pro Gly
260 265 270
Val Arg Val Arg Glu Asp Gln His Thr Asn Ser Gly His Ala Met Pro
275 280 285
Glu Phe Pro Gly Tyr Cys Gly Gly Ala Asn Pro Ser Leu Pro Val Ile
290 295 300
Lys Val Lys Ala Val Thr Met Arg Asn Asn Ala Ile Leu Gln Thr Leu
305 310 315 320
Val Gly Pro Gly Glu Glu His Thr Thr Leu Ala Gly Leu Pro Thr Glu
325 330 335
Ala Ser Ile Trp Asn Ala Val Glu Ala Ala Ile Pro Gly Phe Leu Gln
340 345 350
Asn Val Tyr Ala His Thr Ala Gly Gly Gly Lys Phe Leu Gly Ile Leu
355 360 365
Gln Val Lys Lys Arg Gln Pro Ala Asp Glu Gly Arg Gln Gly Gln Ala
370 375 380
Ala Leu Leu Ala Leu Ala Thr Tyr Ser Glu Leu Lys Asn Ile Ile Leu
385 390 395 400
Val Asp Glu Asp Val Asp Ile Phe Asp Ser Asp Asp Ile Leu Trp Ala
405 410 415
Met Thr Thr Arg Met Gln Gly Asp Val Ser Ile Thr Thr Ile Pro Gly
420 425 430
Ile Arg Gly His Gln Leu Asp Pro Ser Gln Thr Pro Glu Tyr Ser Pro
435 440 445
Ser Ile Arg Gly Asn Gly Ile Ser Cys Lys Thr Ile Phe Asp Cys Thr
450 455 460
Val Pro Trp Ala Leu Lys Ser His Phe Glu Arg Ala Pro Phe Ala Asp
465 470 475 480
Val Asp Pro Arg Pro Phe Ala Pro Glu Tyr Phe Ala Arg Leu Glu Lys
485 490 495
Asn Gln Gly Ser Ala Lys
500
<210> 9
<211> 5502
<212> DNA
<213> aroY gene of Klebsiella pneumoniae 342 plus 2 kilobases of surrounding DNA sequences;
<400> 9
gcgacgccga ctgggcgatc cgtgaactgc tggcgcgtat gacccagcgt ctgcagggct 60
gtgaaaccat agaggatgtg attaaggtgg cggagctgtt cgcgccgaac atcgccccga 120
cgatccccgg taaactgtat attctggata ccgatccatg gcagatgcgc tgcgtggcgc 180
agtggctgtc gcccgccggg gagacgacgt cctttgctcc cgacgactgc tgggcgatac 240
ggcggggact cagccatccg ccggtgcagg gtgagcccga tatcacctgc tatcatctgc 300
cggaggcgca cgccggccag tcgctctgcg taccgctcat cgcccagggc gaagcgatcg 360
gtctgctgag ctttcagaac gtcaccgcca gtgacgcccc ttcccgggct tacctggagc 420
tgatggccga agcgctgggg ctggcgctcg ccaatcagcg tttacgcagc gccctgctgg 480
aaaaagcgtt gttcgattcg ctgaccggcc tgcgtaaccg ccatcatctt gatgaagcgc 540
tgcactcgca gatggcgctg gcggtccata cccacacccc gctgagctgc ctgatgatcg 600
acatcgatca cttcaaagcc atcaatgacc gctacggcca tgaagccggg gatctggtga 660
ttaagagcgt cgcgaccatt gtgcagcgcg cggtgcgcga tatcggcatg gctttccgct 720
acggcggcga ggagttttta gtgctgctcc ccgggattga cgaagccggg gcgcaccagt 780
gcgccagcga gatctacacc caggtgcaca atatgacgct gcgcgatggc ctgacggaga 840
taggccaggt ggatgtgtcg attggcatcg ccagctaccc gcagcacacc caaagcgaca 900
gcctgctgcg cgcagcggac gccgcgctgt accgggcgaa agagctgggc cgttcaagga 960
ttgtcagctt tggccgcctg aagacccgct aagcgggatt attgctcagc ggcattaagc 1020
agcgagataa ctttccgcac caccgccgaa cggaaatggc ggtggtaaac catgctcagc 1080
tcactctccg ccagccgatc ctgaagatcg atatacacca cgttatcaag gcgtaaggcc 1140
ctcgccgaga ccggcaccag cgccaccccc accccggcgg agaccaggct aatcatcgag 1200
gtgacatcgt taattcgctg caccacctgc ggcgtaaaac ccgcgacgcg acaggcgtca 1260
ataaatacct gctccagtcc ggtgccctgc ggatcgtcaa gcgagatcca gttgtcagtg 1320
cgcaacgagg ccagattgag cgcccccacg cctgccagcg gatgctgttg ataaagcgcc 1380
aggcaaagtt tttcccgcac aaatggcctg accaccagcg cgtccggcgg tgacgccagc 1440
ggcgcgcgga tgatggcgat atccagacgc agatccagca gcgcttcgta gagcatttgc 1500
acatccccct gcaccagcga cagctcaatc cccggccagt cagcgcgcag ctcgcgcagg 1560
agccccggca gtttgctgtc atacatcgca ctggagacat agcccagatg caatcgcccc 1620
tgctcgcctc gtgcggtgcg ctgggcgtcc aggaccgcct gatcggccat ctccagcgcc 1680
agccgcgtct tctgcaagaa ggcctcgccc gcggcggtga gggtcaggcg ccggttagcg 1740
cgggagaaga gcaccacgcc caggcgctgc tcgagttgtt taatctgctg gctgagggcg 1800
ggctgggcga tatgtaaccg ctctgccgcc cgatgcatat gtagttcttc agcaacgacc 1860
acaaaatggc gtaacgctcg caaggacatg gccggactcc gcggagtaaa ttgataataa 1920
aaatgttatc aataaagcat gaatgatgca attgataacc attagcctgc gagcatactg 1980
tgcgcatcga cacgctaagg agaacatcat gaccgcaccg attcaggatc tgcgcgacgc 2040
tatcgcgctg ctgcaacagc atgacaatca gtacctcgaa accgatcatc cggttgaccc 2100
taacgctgag ctggccggcg tctatcgcca catcggcgcg ggcggcaccg tgaagcgccc 2160
cacgcgcatc ggcccggcga tgatgtttaa caatattaag ggctatccgc actcgcgcat 2220
tctggtgggc atgcacgcca gccgccagcg ggccgcgctg ctgctgggct gcgaagcctc 2280
acagctggcg ctggaggtag gcaaagcggt gaaaaaaccg gtcgcgccgg tggtcgttcc 2340
ggccagcagc gccccctgtc aggaacaggt ctttctggcc gacgatccgg attttgattt 2400
gcgcaccctg ctcccggcgc ccaccaacac cccgatcgac gccggtccct tcttctgcct 2460
gggcctggcg ctggccagcg atcccgacga cgcctcgctc accgacgtca ccatccaccg 2520
cttgtgcgtc cagggccggg atgagctgtc gatgtttctc gccgctggcc gccatatcga 2580
agtgtttcgt cagaaagccg aggccgctgg caaaccgctg ccgataacca tcaatatggg 2640
actcgatccg gctatctata tcggcgcctg ctttgaagcg ccgaccacac gtttggctat 2700
aacgaactgg gcgtcgccgg tgcgctgcgt cagcgtccgg tagagctggt acagggcgtc 2760
agcgtcccgg agaaagccat cgctcgcgcc gagatcgtta tcgaagggga actgctgccg 2820
ggggtacgcg tcagagaaga tcagcacaca acagcggcca tgcgatgccg gaatttcctg 2880
gttactgcgg cggcgccaat ccgtcgctgc cggtcattaa agtcaaagcg gtgaccatgc 2940
gaaacaatgc gattctgcag acgctggtag ggccgggcga agagcatacc accctcgccg 3000
gattgccaac ggaagccagt atctggaatg ctgtcgaggc tgctatcccg ggctttttac 3060
aaaatgtcta cgcccacacc gcgggcggcg gtaaattcct cgggatcctg caggtgaaaa 3120
aacgccagcc cgccgacgaa gggcgtcagg ggcaggccgc gttgctggcg ctggcgacct 3180
attccgagct gaaaaatatc attctggtcg atgaagatgt cgatatcttt gacagcgacg 3240
atatcctgtg ggccatgacc acccgcatgc agggggatgt cagcatcacg acgatcccag 3300
gcattcgtgg tcaccagctg gatccttccc agaccccggc ctacagcccg tcgatccgcg 3360
gagagggtat cagttgcaag acgattttcg attgcacggt gccgtgggcg ctaaaatcac 3420
acttcgagcg cgcaccgttt gccgatgtcg atccgcgtcc gtttgcgccg gagtattttg 3480
cccggctgga aaaaaaccac ggtcagtaaa atcaggtgat agccgccgga gcacggcggc 3540
atcttccggg ccagcatcac ctgcagcggg tggctgacgc agggttagtt gatcgcggcg 3600
gagaggtctt ttttcacctg ctcacgctgc tcgggggtca acacctggct cacgtcgaag 3660
tagtatttca cacgataata ccgcacctgc tggtccagct ggccaaaggc ggccagctgc 3720
tgtttgacct tagcgtcatc ccatttcccg gagtgaataa cgtctgccag ggcaccatcc 3780
tgatagccgc tgatttaatc tggcttacat tgttttcgaa tccctgacgc agcgcctgga 3840
ttttggcgac ctgctcttca ctcagcttca ggtgctggac gaccggatcc tgcgagacag 3900
acggtatatc ggcggaggtc gacgcctggc tggctgccgt aaagcaggtg gtcagcgcaa 3960
tggcgagcag ggtgttacgc aagcgagtat tcacagtgaa tgatccttca aaaaagaaaa 4020
tgagaggcga ttatcactgc gctaataaag actatctgta acaaagggtt aatttaaaac 4080
tggataaaaa aaggatggta agaaacagaa atcagatccc gggtcagcag cacagaaaga 4140
tatattcatc cttccagtaa cggccctgtc caatgatatc cccggcggcg ctgattaact 4200
gtttttgctt ttggtttcaa tcccctcaac gatcacatgg ctggtcaggg tatgaataga 4260
ttgcaacagc ccgggaaaag cggggtcgtt ttctttatcc cagaagtaat ctttatccac 4320
tttgacgcaa tcgaagcgga agcgctccag cagcgggaag gacgtcgtcc gcggccaaaa 4380
tcatccagcc agaccgggca aagcgccgcc agcgtgctca gcgccgtcag ctcacgtccg 4440
gcgataaact cgtgaaagtt ctcatttatt tccagagcaa tgtgtttaca ggagcgcagg 4500
aaatcacaga gatagcgatc cgtcagaata aagtggctta ataaatcatc aatattcagc 4560
gatatcggtt tattatcgac ccgggcgaaa tcaaatacag aaagtaactc gatttgccga 4620
ataaatagag caagcttatc gcgttcggta agcgtggaga aagaaaacgt cgacgcagag 4680
gtggtatttt gtgcgggtgc tataatatct ttagtaagca actcccacga gtggtagctg 4740
ccgtcatcgc taatagcggg ctccagaacg aagcgataag aggtattttt cacgttttct 4800
tcaaccattt aaaaaatacc aaaaataaga aagggttaag catgtcatat attttccgcc 4860
aacaaaaata gtttaaagtg atcgataata atcattcgat agttaaaaac tatcaagata 4920
taatttattg atcggtaaat tgaattaata taaattagcc actgccgtaa ctccctctga 4980
aaagtcaatt aaaatattgt ttcaaaccag ccagttacca gagtattctg cgtaaagcct 5040
ggtcgtctca cgctttgtgc tgccaggtaa aaaaagagag gggtaataaa aatgaaaaat 5100
acaagccgcc agttttagtc atatcattat gccgaatatg aataacgctg cgctgaggcg 5160
ccgcttcgcc tggcatgcca tgagtcctca acaaaaaagt gtgactcagt cgacaaaacg 5220
tcatattttc ccgctatcct gcagcgaaga agagtgaagt ggatgacagg cagtgaaaaa 5280
aataaacgtg attccgctgg ggctgatgct attcatgctc atcgccagcg catggctggg 5340
ccctgcgccg cggcacaccg gcagcatgca gtgcgtttgg tttgacgggg caatggtgag 5400
ctgcctgccg aagcaacgac tgggcgaagg ctcgccgcat catttactgg tcagacgata 5460
aaccggtact cgccgggtgg tgttgaacag attatcgctg gc 5502
<210> 10
<211> 4629
<212> DNA
<213> catA gene from Acinetobacter baylyi ADP1, including 410 bases of upstream sequence and two open reading frames downstream;
<400> 10
atctgctcga ccatagtaat gatcacatta tgagctaaat ttacttttta aaatttaaat 60
atattatata tatttgaatt ttattgtttt attttaattt ttagcttaga agtttttatt 120
aagatttatt tttaaattag atgtcgaaaa aattagtata ccaaaaaagc atgaaaacat 180
actctcttag gaattggagt cgccatgagt ttcagataca gttgatcagt atggaaggta 240
tagaaacgac tatcgaaata aataagtttg tggtgtgtga agcaaggtaa agctcaaggc 300
tgaggcaaac caagcaaagg ttaattgaac cgatatgcac aacacattca acgatagcgt 360
cgacagataa gtttatcaaa tgatgttttg gcgatttcaa ggagaaagcc atggaagtta 420
aaatattcaa tactcaggat gtgcaagatt ttttacgtgt tgcaagcgga cttgagcaag 480
aaggtggcaa tccgcgtgta aagcagatca tccatcgtgt gctttcagat ttatataaag 540
ccattgaaga tttgaatatc acttcagatg aatactgggc aggtgtggca tatttaaatc 600
agctaggtgc caatcaagaa gctggtttac tctcgccagg cttgggtttt gaccattacc 660
tcgatatgcg tatggatgcc gaagatgccg cactaggtat tgaaaatgcg acaccacgta 720
ccattgaagg cccgctatac gtggcaggtg cgcctgaatc ggtaggttat gcgcgcatgg 780
atgacggaag tgatccaaat ggtcataccc tgattctaca tggcacgatc tttgatgcag 840
atggaaaacc tttacccaat gccaaagttg aaatctggca tgccaatacc aaaggctttt 900
attcacactt cgacccaaca ggcgagcagc aggcgttcaa tatgcgccgt agtattatta 960
ccgatgaaaa cggtcagtat cgcgttcgta ccattttgcc tgcgggttat ggttgcccac 1020
cagaaggtcc aacgcaacag ttgctgaatc agttgggccg tcatggtaac cgccctgcgc 1080
acattcacta ttttgtttct gccgatggac accgcaaact aactacgcaa attaatgtgg 1140
ctggcgatcc gtacacctat gacgactttg cttatgcaac ccgtgaaggc ttggtggttg 1200
atgcagtgga acacaccgat cctgaagcca ttaaggccaa tgatgttgaa ggcccattcg 1260
ctgaaatggt tttcgatcta aaattgacgc gtttggttga tggtgtagat aaccaagttg 1320
ttgatcgtcc acgtctagcg gtgtaataca ccaaaatggt tcaaaattat caggcgagtg 1380
atcatgatca ctggcctgtt tttatttcag ggaagggtgg agacaattac gtggacaatc 1440
aaatcattca ggaaaccgta gataaaattt taagcgtatt gccgaatcag gctgggcaat 1500
tggcacgctt ggttcgtctg atgcagtttg cttgtgaccc caccattacc gtcattggta 1560
aatataatca tggtaaaagc cgactactca atgagctgat cgggacagat attttttctg 1620
ttgccgataa acgagagacg attcaactgg ccgaacataa acaagatcag gtgcgttggt 1680
tggatgcacc cggactcgat gcagatgttg cggcagtgga tgatcgtcat gcttttgaag 1740
cagtctggac acaggcagat attcgccttt ttgtgcattc agtccgagaa ggcgaactcg 1800
atgcaactga gcatcatctt ttacaacaac ttattgaaga tgcagaccat agccggcgcc 1860
aaaccatact ggtcttgacc cagatagatc agataccgga tcagacaatt ttaacccaga 1920
ttaaaacctc aattgcacag caggtaccca aactcgatat ttgggctgtt tcggccactc 1980
gccaccgtca gggtattgaa aatggaaaaa ccttgctgat cgaaaaaagt ggaatcggcg 2040
cgttacgaca tacacttgag caggcacttg ctcaggttcc atctgcacga acgtatgaaa 2100
agaatagatt gctgtctgac ttgcatcatc aacttaagca gttattactc gatcaaaaac 2160
atgtacttca gcaactacaa cagacacagc agcagcaatt gcatgacttt gatacaggac 2220
tcatcaacat actcgataag attcgagtag atcttgagcc cattgtaaat atagatggtc 2280
aagaccaagc actcaatcca gattcatttg ccacgatgtt taaaaataca gcagccaagc 2340
agcaacgtgc caaagtgcag attgcttact cacgtgcctg tatcgagatc aatagccatc 2400
tcatacgtca cggtgtggtg ggtttacccg cagagcaaca aaccacgata aaaagtattg 2460
atacggtcat tgttgcggtt tttggaattt cagtgaaatt tcgcgatcag ctacgtgcat 2520
tgttttatac cgataccgaa cgacaacgct tgcaaagaga gtttcgattt tattttgaaa 2580
agtcagcagg ccgaatgatt ttagctgcca agattgagca gacaatgcgg cagcaagggt 2640
gtattcaaaa tgcaatgatg gcgttgcaac agatggagag tgcagcatga ccagcggcgg 2700
acacattcaa ttgtttatcg aacacacccg gcagattgcg actgcccaag gggatataca 2760
gttggcattg caatcgatgc agcaatggcg cgaagcattt gctacagcat taaaacaaaa 2820
tacctttgat ttaacgggct ggtcaccgca gacaaagatc gccaatcaac tcaagcaatt 2880
taaccataag cttacaacgc atgtatcgaa ttgggatacc gaatggcata cttttagtgc 2940
tgctcaatcg gttgcagaag tatttcatga tcgggtgatg ttgcttgtat tcggtaagtt 3000
taatgccgga aagagttcat tgtgtaactt actggccgaa tgctttcgtt ctcacgaaca 3060
aaccgtgcaa tattttcatg ttcaaaatga acagatattt tataccgaat ctcacttacg 3120
cgaaggtgca accgagacga cagcgcaact acagggcgta tgtctgggtg aaaaacttat 3180
tttgctagat acaccaggtt tgcattctgg tactcagaaa aatgcagcgc tcacacaaaa 3240
atttatcgac agtgcagatg gtgtgctgtg gctcagtagc gcaacttcac cgggtcaggt 3300
gcaagagcta gatgcactgg ggcgcgagtt aaagcgtcat aaacctttat ttcctgttat 3360
tacccgaagc gattttgtcg aagaagatga aattgatggt gagctatgta cagtgctttg 3420
caataaaaat tcagaacaac gtgcgttgca agagtctgat gtattgatgc gtgcgaaaga 3480
aaaactgcac atatgcaagt ggatgtgagt ttattaaagc cgcccgtgtc cgtttcaact 3540
caaatggcgc gtgaagcaga tatgaaccca caagccatga acgaggctgg ttttgagcga 3600
ttatttgcag cacttttggc tcttattgag cctgctttgc gctataagca gcgtaaacct 3660
gccgaagtat tgttgcattt tttgcaagaa catatcattg aaggtttaag gttttacctg 3720
caacccgatc tagagcaaat acaacaggac ctcaaacagg ctcaagatga tttacgacag 3780
ctacacaccg atttagccga ggcagtctgg cgtagcgtat tgcctgagct accacaactt 3840
cttgagcaac atgcaagtac acaaaatatt gatgccgtag tgaacagttt gaacgagtgg 3900
ataaacgtcg cattcgaaca acagcttgca attcagcttg atgcttatgg tttaaatttg 3960
gattcgctta gcaagatcga aaaaaccgaa aaaatgcagt atgaacgcat tgcgggaatg 4020
gtggtgcatg atggcttgta cacgactctc acgcagcaga ttcaacaagc tgtcaaagct 4080
tctacgagtg aattgattga tcagtgtcag gctcaacttg agcagtcaat caaacatgtt 4140
caaacactcg atgaaacctt catcgattac agcgcagcac tcgatcaact cagccaagcg 4200
ctacgcattg aataaagagc agtaaatttt tcagacatat tttattcgat gagtggcctg 4260
atatggtgcg ttgcaaacac ctcctgtaca caggcgagaa ttttaggaat gtaattactg 4320
tggtccatat ttcgcaccgc gagtgaaatt gggctatagg catcatcatc taaaattgga 4380
atataaagta gattcttcac cccaatatcc atggcagacg ccggtacgat gcagacgcct 4440
tcacctgctg ccaccaagcc gagtgccagt tgaatttctc gaatttcggt gagtttggat 4500
ggtactaggc ctagttcggt aaagagtgac tgaataaagg tcgcaaaatt gggcttttga 4560
gagactgggt acagcagcat cggttcatca ataatttgag agagatgaac ccctgttgct 4620
gcaaactga 4629
<210> 11
<211> 311
<212> PRT
<213> CatA from Acinetobacter baylyi ADP1;
<400> 11
Met Glu Val Lys Ile Phe Asn Thr Gln Asp Val Gln Asp Phe Leu Arg
1 5 10 15
Val Ala Ser Gly Leu Glu Gln Glu Gly Gly Asn Pro Arg Val Lys Gln
20 25 30
Ile Ile His Arg Val Leu Ser Asp Leu Tyr Lys Ala Ile Glu Asp Leu
35 40 45
Asn Ile Thr Ser Asp Glu Tyr Trp Ala Gly Val Ala Tyr Leu Asn Gln
50 55 60
Leu Gly Ala Asn Gln Glu Ala Gly Leu Leu Ser Pro Gly Leu Gly Phe
65 70 75 80
Asp His Tyr Leu Asp Met Arg Met Asp Ala Glu Asp Ala Ala Leu Gly
85 90 95
Ile Glu Asn Ala Thr Pro Arg Thr Ile Glu Gly Pro Leu Tyr Val Ala
100 105 110
Gly Ala Pro Glu Ser Val Gly Tyr Ala Arg Met Asp Asp Gly Ser Asp
115 120 125
Pro Asn Gly His Thr Leu Ile Leu His Gly Thr Ile Phe Asp Ala Asp
130 135 140
Gly Lys Pro Leu Pro Asn Ala Lys Val Glu Ile Trp His Ala Asn Thr
145 150 155 160
Lys Gly Phe Tyr Ser His Phe Asp Pro Thr Gly Glu Gln Gln Ala Phe
165 170 175
Asn Met Arg Arg Ser Ile Ile Thr Asp Glu Asn Gly Gln Tyr Arg Val
180 185 190
Arg Thr Ile Leu Pro Ala Gly Tyr Gly Cys Pro Pro Glu Gly Pro Thr
195 200 205
Gln Gln Leu Leu Asn Gln Leu Gly Arg His Gly Asn Arg Pro Ala His
210 215 220
Ile His Tyr Phe Val Ser Ala Asp Gly His Arg Lys Leu Thr Thr Gln
225 230 235 240
Ile Asn Val Ala Gly Asp Pro Tyr Thr Tyr Asp Asp Phe Ala Tyr Ala
245 250 255
Thr Arg Glu Gly Leu Val Val Asp Ala Val Glu His Thr Asp Pro Glu
260 265 270
Ala Ile Lys Ala Asn Asp Val Glu Gly Pro Phe Ala Glu Met Val Phe
275 280 285
Asp Leu Lys Leu Thr Arg Leu Val Asp Gly Val Asp Asn Gln Val Val
290 295 300
Asp Arg Pro Arg Leu Ala Val
305 310
<210> 12
<211> 1461
<212> DNA
<213> quiC from Acinetobacter sp. ADP1;
<400> 12
atgaaattaa cttctttacg cgtatcttta ttggcgctgg gcttggtaac atcaggtttt 60
gctgcggcag aaacttatac tgtagatcgt tatcaggatg atagtgaaaa aggctctttg 120
cgttgggcaa ttgaacaatc taatgcaaat agcgcacaag agaatcagat tctgattcag 180
gctgttggta aggcacctta tgtgatcaag gtggataaac cgttaccacc gattaaatca 240
tctgtaaaaa ttattggtac agaatgggat aaaacgggcg aatttattgc gattgatggt 300
tcaaactata tcaagggcga aggcgaaaaa gcatgtccag gtgcaaatcc aggacaatat 360
ggtaccaatg ttcgtaccat gactttacca ggtttggttc tacaagatgt caatggtgtg 420
accctgaaag gtcttgatgt tcatcgcttc tgtattggtg tactggtaaa tcgttcaagc 480
aataatttga ttcagcataa ccgtatttca aataattacg gtggcgctgg tgtcatgatc 540
acgggtgatg atggtaaagg taacccaacg tctaccacca ccaataacaa caaagtattg 600
gataatgtgt ttattgacaa tggcgatggt cttgaactga cgcgtggagc agcattcaac 660
ctgattgcta acaatctgtt tacatcgacc aaagccaatc cagagccgtc tcaaggcatt 720
gaaattcttt gggggaatga caatgcagtg gtgggtaaca aatttgaaaa ctattcagat 780
ggtctacaaa tcaactgggg taaacgtaat tacatcgctt ataacgaatt gaccaataac 840
tctttgggtt tcaatcttac aggtgatgga aacatcttcg atagtaacaa agtgcatggc 900
aatcgtattg gtatcgcaat tcgttctgaa aaagatgcaa atgcacgtat cacacttacc 960
aaaaatcaga tttgggataa tggtaaagat atcaaacgct gtgaggctgg tggttcatgt 1020
gttccaaacc aacgtttagg tgcaattgta tttggtgttc ctgcgcttga gcatgaaggt 1080
tttgtaggct ctcgtggtgg cggtgtagtc attgaacctg caaaattaca aaaaacatgt 1140
acacagccaa atcaacaaaa ctgtaatgcc attccgaacc aaggtattca ggcacctaaa 1200
ctgactgtca gtaaaaaaca acttacagtt gaagttaaag gaacaccaaa ccagcgttac 1260
aacgtagaat tttttggaaa tcgtaatgca tcttcttccg aagctgagca atatttaggt 1320
tcaattgttg tagtgacaga tcatcaaggt cttgcaaaag caaactgggc accaaaagtc 1380
agcatgccat ctgttactgc gaatgtaact gatcacttgg gcgccacttc agagttaagt 1440
tctgcagtga aaatgagata a 1461
<210> 13
<211> 1461
<212> DNA
<213> Codon-optimized quiC gene from Acinetobacter sp. ADP1;
<400> 13
atgaaactga ccagcctgcg tgttagcctg ctggcactgg gtctggttac cagcggtttt 60
gcagcagcag aaacctatac cgttgatcgt tatcaggatg atagcgaaaa aggtagcctg 120
cgttgggcaa ttgaacagag caatgcaaat agcgcacaag aaaaccagat tctgattcag 180
gcagttggta aagcaccgta tgttatcaaa gttgataaac cgctgcctcc gattaaaagc 240
agcgttaaaa tcattggcac cgagtgggat aaaaccggtg aatttattgc aattgatggc 300
agcaactata tcaaaggcga aggtgaaaaa gcatgtccgg gtgcaaatcc gggtcagtat 360
ggcaccaatg ttcgtaccat gaccctgcct ggtctggttc tgcaagatgt taatggtgtt 420
accctgaaag gtctggatgt tcatcgtttt tgtattggtg ttctggttaa tcgcagcagc 480
aataacctga ttcagcataa tcgtatcagc aacaattatg gtggtgccgg tgttatgatt 540
accggtgatg atggtaaagg taatccgacc agcaccacca ccaataataa caaagttctg 600
gataacgtgt tcatcgataa tggtgatggt ctggaactga cccgtggtgc agcatttaat 660
ctgattgcaa ataacctgtt taccagcaca aaagccaatc cggaaccgag ccagggtatt 720
gaaattctgt ggggtaatga taatgccgtg gtgggtaaca aattcgaaaa ctattcagat 780
ggcctgcaaa tcaattgggg taaacgtaac tatatcgcct ataacgaact gaccaataac 840
agcctgggtt tcaatctgac aggtgatggt aacattttcg acagcaataa agtgcatggt 900
aaccgtattg gtattgccat tcgtagtgaa aaagatgcca atgcacgtat taccctgacc 960
aaaaatcaga tttgggataa cggcaaagat atcaaacgtt gtgaagccgg tggtagctgt 1020
gttccgaatc agcgtctggg tgcaattgtt tttggtgttc cggcactgga acatgaaggt 1080
tttgttggta gccgtggcgg tggtgttgtt attgaaccgg caaaactgca aaaaacctgc 1140
acccagccga accagcagaa ttgtaatgca attcctaatc agggtattca ggcaccgaaa 1200
ctgacagtta gcaaaaaaca gctgaccgtt gaagttaaag gcacccctaa tcagcgttat 1260
aatgtggaat tttttggcaa tcgtaatgcc agcagcagcg aagcagaaca gtatctgggt 1320
agcattgttg ttgttaccga tcatcagggt ctggcaaaag caaattgggc tccgaaagtt 1380
agcatgccga gcgttaccgc aaatgtgaca gatcatctgg gtgcgaccag cgaactgagc 1440
agcgcagtta aaatgcgtta a 1461
<210> 14
<211> 486
<212> PRT
<213> QuiC from Acinetobacter sp. ADP1;
<400> 14
Met Lys Leu Thr Ser Leu Arg Val Ser Leu Leu Ala Leu Gly Leu Val
1 5 10 15
Thr Ser Gly Phe Ala Ala Ala Glu Thr Tyr Thr Val Asp Arg Tyr Gln
20 25 30
Asp Asp Ser Glu Lys Gly Ser Leu Arg Trp Ala Ile Glu Gln Ser Asn
35 40 45
Ala Asn Ser Ala Gln Glu Asn Gln Ile Leu Ile Gln Ala Val Gly Lys
50 55 60
Ala Pro Tyr Val Ile Lys Val Asp Lys Pro Leu Pro Pro Ile Lys Ser
65 70 75 80
Ser Val Lys Ile Ile Gly Thr Glu Trp Asp Lys Thr Gly Glu Phe Ile
85 90 95
Ala Ile Asp Gly Ser Asn Tyr Ile Lys Gly Glu Gly Glu Lys Ala Cys
100 105 110
Pro Gly Ala Asn Pro Gly Gln Tyr Gly Thr Asn Val Arg Thr Met Thr
115 120 125
Leu Pro Gly Leu Val Leu Gln Asp Val Asn Gly Val Thr Leu Lys Gly
130 135 140
Leu Asp Val His Arg Phe Cys Ile Gly Val Leu Val Asn Arg Ser Ser
145 150 155 160
Asn Asn Leu Ile Gln His Asn Arg Ile Ser Asn Asn Tyr Gly Gly Ala
165 170 175
Gly Val Met Ile Thr Gly Asp Asp Gly Lys Gly Asn Pro Thr Ser Thr
180 185 190
Thr Thr Asn Asn Asn Lys Val Leu Asp Asn Val Phe Ile Asp Asn Gly
195 200 205
Asp Gly Leu Glu Leu Thr Arg Gly Ala Ala Phe Asn Leu Ile Ala Asn
210 215 220
Asn Leu Phe Thr Ser Thr Lys Ala Asn Pro Glu Pro Ser Gln Gly Ile
225 230 235 240
Glu Ile Leu Trp Gly Asn Asp Asn Ala Val Val Gly Asn Lys Phe Glu
245 250 255
Asn Tyr Ser Asp Gly Leu Gln Ile Asn Trp Gly Lys Arg Asn Tyr Ile
260 265 270
Ala Tyr Asn Glu Leu Thr Asn Asn Ser Leu Gly Phe Asn Leu Thr Gly
275 280 285
Asp Gly Asn Ile Phe Asp Ser Asn Lys Val His Gly Asn Arg Ile Gly
290 295 300
Ile Ala Ile Arg Ser Glu Lys Asp Ala Asn Ala Arg Ile Thr Leu Thr
305 310 315 320
Lys Asn Gln Ile Trp Asp Asn Gly Lys Asp Ile Lys Arg Cys Glu Ala
325 330 335
Gly Gly Ser Cys Val Pro Asn Gln Arg Leu Gly Ala Ile Val Phe Gly
340 345 350
Val Pro Ala Leu Glu His Glu Gly Phe Val Gly Ser Arg Gly Gly Gly
355 360 365
Val Val Ile Glu Pro Ala Lys Leu Gln Lys Thr Cys Thr Gln Pro Asn
370 375 380
Gln Gln Asn Cys Asn Ala Ile Pro Asn Gln Gly Ile Gln Ala Pro Lys
385 390 395 400
Leu Thr Val Ser Lys Lys Gln Leu Thr Val Glu Val Lys Gly Thr Pro
405 410 415
Asn Gln Arg Tyr Asn Val Glu Phe Phe Gly Asn Arg Asn Ala Ser Ser
420 425 430
Ser Glu Ala Glu Gln Tyr Leu Gly Ser Ile Val Val Val Thr Asp His
435 440 445
Gln Gly Leu Ala Lys Ala Asn Trp Ala Pro Lys Val Ser Met Pro Ser
450 455 460
Val Thr Ala Asn Val Thr Asp His Leu Gly Ala Thr Ser Glu Leu Ser
465 470 475 480
Ser Ala Val Lys Met Arg
485
<210> 15
<211> 9462
<212> DNA
<213> Plasmid pAC21;
<220>
<221> misc_feature
<222> (5924)..(5924)
<223> n is a, c, g, or t
<400> 15
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440
caggtcgact ctagaggatc ccccccgccg ccgacagagt aataggtttt acttaatagc 4500
tcttcctgtc ccttccaggc agtgatccgc attccgttct catggcgagg caacatttcg 4560
ggatggaaga taatgttctt tgctacagga aaatcaacaa tatgcgcacc agatgccact 4620
ggcagccgcc cgctgcgcgt tactaactct ataaatgcag ggatctcatc aatgacaaca 4680
tcctgcggac tgtttcctgc cagtcccatg atgatggcga catccgtggc atggcctttg 4740
cccgtcagtg acaacgaccc gtacagatcg accacaatat ggctcgtcgc ggttaataag 4800
ccgctacttt ccagccgatc aataaaactt tttccggcat tcattggccc cacggtatgc 4860
gaactggagg gaccaatccc aattttgaaa atatcgaatg cactaatcat gtgacggaag 4920
atcacttcgc agaataaata aatcctggtg tccctgttga taccgggaag ccctgggcca 4980
acttttggcg aaaatgagac gttgatcggc acgtaagagg ttccaacttt caccataatg 5040
aaataagatc actaccgggc gtattttttg agttatcgag attttcagga gctaaggaag 5100
ctaaaatgga gaaaaaaatc actggatata ccaccgttga tatatcccaa tggcatcgta 5160
aagaacattt tgaggcattt cagtcagttg ctcaatgtac ctataaccag accgttcagc 5220
tggatattac ggccttttta aagaccgtaa agaaaaataa gcacaagttt tatccggcct 5280
ttattcacat tcttgcccgc ctgatgaatg ctcatccgga attccgtatg gcaatgaaag 5340
acggtgagct ggtgatatgg gatagtgttc acccttgtta caccgttttc catgagcaaa 5400
ctgaaacgtt ttcatcgctc tggagtgaat accacgacga tttccggcag tttctacaca 5460
tatattcgca agatgtggcg tgttacggtg aaaacctggc ctatttccct aaagggttta 5520
ttgagaatat gtttttcgtc tcagccaatc cctgggtgag tttcaccagt tttgatttaa 5580
acgtggccaa tatggacaac ttcttcgccc ccgttttcac catgggcaaa tattatacgc 5640
aaggcgacaa ggtgctgatg ccgctggcga ttcaggttca tcatgccgtt tgtgatggct 5700
tccatgtcgg cagaatgctt aatgaattac aacagtactg cgatgagtgg cagggcgggg 5760
cgtaattttt ttaaggcagt tattggtgcc cttaaacgcc tggtgctacg cctgaataag 5820
tgataataag cggatgaatg gcagaaattc gaaagcaaat tcgacccggt cgtcggttca 5880
gggcagggtc gttaaatagc cgcttatgtc tattgctggt ttantcggta cccggggatc 5940
gcggccgcgg accggatccc atcacatata cctgccgttc actattattt agtgaaatga 6000
gatattatga tattttctga attgtgatta aaaaggcaac tttatgccca tgcaacagaa 6060
actataaaaa atacagagaa tgaaaagaaa cagatagatt ttttagttct ttaggcccgt 6120
agtctgcaaa tccttttatg attttctatc aaacaaaaga ggaaaataga ccagttgcaa 6180
tccaaacgag agtctaatag aatgaggtcg aaaagtaaat cgcgcgggtt tgttactgat 6240
aaagcaggca agacctaaaa tgtgtaaagg gcaaagtgta tactttggcg tcacccctta 6300
catattttag gtcttttttt attgtgcgta actaacttgc catcttcaaa caggagggct 6360
ggaagaagca gaccgctaac acagtacata aaaaaggaga catgaacgat gaacatcaaa 6420
aagtttgcaa aacaagcaac agtattaacc tttactaccg cactgctggc aggaggcgca 6480
actcaagcgt ttgcgaaaga aacgaaccaa aagccatata aggaaacata cggcatttcc 6540
catattacac gccatgatat gctgcaaatc cctgaacagc aaaaaaatga aaaatatcaa 6600
gttcctgaat tcgattcgtc cacaattaaa aatatctctt ctgcaaaagg cctggacgtt 6660
tgggacagct ggccattaca aaacgctgac ggcactgtcg caaactatca cggctaccac 6720
atcgtctttg cattagccgg agatcctaaa aatgcggatg acacatcgat ttacatgttc 6780
tatcaaaaag tcggcgaaac ttctattgac agctggaaaa acgctggccg cgtctttaaa 6840
gacagcgaca aattcgatgc aaatgattct atcctaaaag accaaacaca agaatggtca 6900
ggttcagcca catttacatc tgacggaaaa atccgtttat tctacactga tttctccggt 6960
aaacattacg gcaaacaaac actgacaact gcacaagtta acgtatcagc atcagacagc 7020
tctttgaaca tcaacggtgt agaggattat aaatcaatct ttgacggtga cggaaaaacg 7080
tatcaaaatg tacagcagtt catcgatgaa ggcaactaca gctcaggcga caaccatacg 7140
ctgagagatc ctcactacgt agaagataaa ggccacaaat acttagtatt tgaagcaaac 7200
actggaactg aagatggcta ccaaggcgaa gaatctttat ttaacaaagc atactatggc 7260
aaaagcacat cattcttccg tcaagaaagt caaaaacttc tgcaaagcga taaaaaacgc 7320
acggctgagt tagcaaacgg cgctctcggt atgattgagc taaacgatga ttacacactg 7380
aaaaaagtga tgaaaccgct gattgcatct aacacagtaa cagatgaaat tgaacgcgcg 7440
aacgtcttta aaatgaacgg caaatggtac ctgttcactg actcccgcgg atcaaaaatg 7500
acgattgacg gcattacgtc taacgatatt tacatgcttg gttatgtttc taattcttta 7560
actggcccat acaagccgct gaacaaaact ggccttgtgt taaaaatgga tcttgatcct 7620
aacgatgtaa cctttactta ctcacacttc gctgtacctc aagcgaaagg aaacaatgtc 7680
gtgattacaa gctatatgac aaacagagga ttctacgcag acaaacaatc aacgtttgcg 7740
ccgagcttcc tgctgaacat caaaggcaag aaaacatctg ttgtcaaaga cagcatcctt 7800
gaacaaggac aattaacagt taacaaataa aaacgcaaaa gaaaatgcca atatcctatt 7860
ggcattttct tttatttctt ccatttaaat ggatgcatgc gctagcggag tgtatactgg 7920
cttactatgt tggcactgat gagggtgtca gtgaagtgct tcagcctcgt gagcgggacg 7980
gtcgtaaggt cgttccgctc cacttcactg aacggcaatc cgagggtgtg gatccaatta 8040
aggccacgct gtcatttaaa ttccgttttt ccagttcaaa tgcaattgcc ttcaatgcac 8100
cttcgtagct gtggtgagcc agcggtgctg gctctccccc atttacggat aagaatgcat 8160
tttccgagtt aataccgtcg gcaatacctg acattaatac ttcacagtcg ctggcatcga 8220
gtacggaaaa cttaatcgaa gacgaaccac agttaataac caaaacaacc ggaaattcat 8280
tcatctcttt tctcatcctg agttacggat taaaacagtt tgtatacgat gttcaggatg 8340
gtcagcagac caatcacggt aacaaacacg ttatccagac gaccacggta tttcgccaga 8400
gacggcgctt tacggatggc atacatcggc aacaggcaca gcagggatgc gataatcggt 8460
gcgcccatgg cttcaatcag gtcgaggatg ttcgggttgg cgtaggcaac aacccaggtg 8520
gagcccatga tgaagatcat gctgagagta ttcagtttac ccagcgacac tttggttttg 8580
tcacctttat aaccgaactt cagaatcaga ccattcaagc cttccagcgt ccccagatag 8640
tgaccgaaga aagatttgaa gatagccacg agtgcgatga tggaagccgc atattccagt 8700
gtaatcgcga acgttgtttt ggtaccggtc atggacgcaa agtggttagc cagataagaa 8760
agcactggaa tattctgcgc tttggcttcc gccatgttgg ccggagacag agtaaacagg 8820
cagctaaagg caaagaacat caccactgca accatcagca tgctggcacg agaaatgatt 8880
tgggaacatt tacgttcggt gaagtcgcga ccgaagtctt tctcatactc ttcacgttta 8940
gaaaccacga aggaagagac gattggcgag aagttaaagg agaaaaccat gatggaaatc 9000
cccagccaga cagtgatcag gataccgtca tgaccggtta acgacagcga accgaggtca 9060
acctggtcga taactgcaga gttccagtaa gggatcagcg acaaagaaat cagcaccagg 9120
ctggcgataa acggccatac caggtagctc agggtaccga gctcgaattc actggccgtc 9180
gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 9240
catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 9300
cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct tacgcatctg 9360
tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag 9420
ttaagccagc cccgacaccc gccaacaccc gctgacgaat tc 9462
<210> 16
<211> 9430
<212> DNA
<213> Plasmid pAC19;
<400> 16
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440
caggtcgact ctagaggatc ccccccgccg ccgacagagt aataggtttt acttaatagc 4500
tcttcctgtc ccttccaggc agtgatccgc attccgttct catggcgagg caacatttcg 4560
ggatggaaga taatgttctt tgctacagga aaatcaacaa tatgcgcacc agatgccact 4620
ggcagccgcc cgctgcgcgt tactaactct ataaatgcag ggatctcatc aatgacaaca 4680
tcctgcggac tgtttcctgc cagtcccatg atgatggcga catccgtggc atggcctttg 4740
cccgtcagtg acaacgaccc gtacagatcg accacaatat ggctcgtcgc ggttaataag 4800
ccgctacttt ccagccgatc aataaaactt tttccggcat tcattggccc cacggtatgc 4860
gaactggagg gaccaatccc aattttgaaa atatcgaatg cactaatcat atccacaccc 4920
tcggattgcc gttcagtgaa gtggagcgga acgaccttac gaccgtcccg ctcacgaggc 4980
tttacgcact acgtactgcg atggcttcaa tttccagcgg gagggcggat ccactaatac 5040
aaaatatatc aaaagttaat aataatatta ttcttactta agactttttt gtcttcattt 5100
tttagtaaaa aatataaaaa aggccacctc ccgattttat cggaaggcag cctcttaaat 5160
tcagttcata atattaaaaa atattattca acttcagaat atttgttggc ataggcagct 5220
gccgcaccca acagtccagg ctgcggataa gtaatcaact taaccggaat cttggacatg 5280
acgcgttcaa agcgtccttt tgaaacaaag cgctgacgga aaccagattc tggcaaatgg 5340
gaagcgatac gaagaccgac accaccgcca ataacaacac tggttgcacc ctgtgccaaa 5400
gcaagatcac cagcgatagc gccaaggctc aagcagaagc gatccaaagc ggcttcagca 5460
aggttgtctt taccttccaa agccatctgc cataatttaa tatcatccag caagctgaac 5520
ggaacgcctt caatggcagc cagtgcttcg tagatattac caagacccgg gccagaaata 5580
atgcgttcga tagaaacgcg gcggaaacgt tcacgtaaac gtgccagaat tttgtcttca 5640
agtctgtcaa gcggagcaaa gtcgatatga ccgccttcag tttcgatgac gaaataacgg 5700
ccttcagtcc gcaacagatg ggcaacaccc aagcccgttc ccggaccaag aatagtgata 5760
acaccatcgc taggaagcgc ttcatcagga ccacaaatat gatccagata agaagaatcc 5820
atatgcgcaa ccgcgtgggc aaccgcgccg aagtcattga tcagaacatg cgtatcgatg 5880
tccagctttt cattcagagt agctggtctt aatacccaag ggttattggt aagttttaaa 5940
acttcaccat gaaccgggcc agcccatgca atagctgcgg cacgtggcag aggacgaccc 6000
agtttttcac cgaaacgttc ccaagctaac tgcaagctag catgttctgc cgttttaaaa 6060
gttgtttctt ctccaagaga aagaacccga ccattgctta cttccgcaat agagaaacgc 6120
gcatgcgttc caccgatgtc aatcgcaaca atttccataa taattccttt ctgaaatcag 6180
aaggctaccc aacaggtaaa ataagtccgc ccgctttata ccatcgttgt aaacaaaaag 6240
tataattggt taagacttat ctaaaaaaga caaaaggatt cagccaaagc aagtttaact 6300
acttctggga gcgccacatc tcctcgattt catccaggct ccgacctttg gtttccggca 6360
cgaagcgagc aacaatcaag ccacctaaga tacttaatgc tgcgaaaacg agataggaga 6420
aaccgtggtt gaaagtctga ttcaatgctg gagaaccatc ggcaacctta aacaggaagt 6480
taaccaagat attagctaac cattgtccgg taacagcgat aggcatagct gcgcccttga 6540
tggaactcgg gaacatttct gacagaacaa cccagcagac agggccccat gacataccaa 6600
agactgcaat ataaagaagc acagaagcca aaggcaaaac accaccgact ttgaaccaga 6660
aacagcagcc taaaacagcc atcattgcag ccataccgag agcaccccaa ataagcagag 6720
gtttacggcc gaagcggtca acaacacggg aagcaatcat ggtgaagatg aagttcacaa 6780
caccgataga gatggtctgc aataatgccg tatcagctcc aaaacctaaa ttctggaaca 6840
tctgcggtgc ataatacagc acggcgttaa taccgactaa ctgctggaag gcagcaacgg 6900
atacaccggc aaaaacaacg gtgataccaa aagcaaacaa acctgcgctg cttttgtcca 6960
tggctttatc aaagccagct ttaatctttt gaatcgtcag attaggatcg gcttgcggtt 7020
ccagacgagc aaggattttg ctagcctcgg aatgacgtcc cttcatcacc aaccaatgcg 7080
gcgtatccgg tgcggttaac agcagcaata agaaggcaat accgatcagg ccttctgaag 7140
ccggagacca gcaccaacca ctggcattaa cccaatcgat agaaccgaaa tgagccagta 7200
accaggtaaa gatataaccg gttaaagcac ccgtcacaat ggccatctgc tgaccagaaa 7260
ccatctgacc acgtttgtct ggcggagcaa tttcagcaat ataggttggg gtcaaggttg 7320
aaacgacacc gatacctaaa ccggcaagaa accggaaaaa gcaaaaaatt tgtaaagccg 7380
aaccaccggt tccaaataat ttttcggtta acgcagcacc aaaaccggcg gcgacgaaac 7440
aaatggaact catcaacaat ccgccgcgac gaccgaagcg aataccaatc cagccagaca 7500
gcaaagaacc ggtaacacaa ccgaccaaaa cagcaacaac gaccatccca gaaagggaag 7560
ccgcagccgt agcagacagg tgacgagggg caataaaatg gatatcaacc ggtgtaccga 7620
ttgcagcgat aaccgctgaa tcgtaaccga aaagcaagcc gcctatagca gcgattaggg 7680
ctagtcgcgt gactagaccc tgactacttt cagaactcat ggcgattcct ctccctctag 7740
agcgtcctgc tgttgttaag attattatac cacaccttgt agataaagtc aacaactttt 7800
tgcaaaattt ttcaggaatt ttagcagagg ttgttctgga tgtagaacaa aacatctttc 7860
cgctcttgtg ctgttaggat atctttcttg gaagctaggt aggcctcgag ttatggcagt 7920
tggttaaaag gaaacaaaaa gaccgttttc acacaaaacg gtctttttcg atttcttttt 7980
acagtcacag ccacttttgc accaattaag gccacgctgt catttaaact ccgtttttcc 8040
agttcaaatg caattgcctt caatgcacct tcgtagctgt ggtgagccag cggtgctggc 8100
tctcccccat ttacggataa gaatgcattt tccgagttaa taccgtcggc aatacctgac 8160
attaatactt cacagtcgct ggcatcgagt acggaaaact taatcgaaga cgaaccacag 8220
ttaataacca aaacaaccgg aaattcattc atctcttttc tcatcctgag ttacggatta 8280
aaacagtttg tatacgatgt tcaggatggt cagcagacca atcacggtaa caaacacgtt 8340
atccagacga ccacggtatt tcgccagaga cggcgcttta cggatggcat acatcggcaa 8400
caggcacagc agggatgcga taatcggtgc gcccatggct tcaatcaggt cgaggatgtt 8460
cgggttggcg taggcaacaa cccaggtgga gcccatgatg aagatcatgc tgagagtatt 8520
cagtttaccc agcgacactt tggttttgtc acctttataa ccgaacttca gaatcagacc 8580
attcaagcct tccagcgtcc ccagatagtg accgaagaaa gatttgaaga tagccacgag 8640
tgcgatgatg gaagccgcat attccagtgt aatcgcgaac gttgttttgg taccggtcat 8700
ggacgcaaag tggttagcca gataagaaag cactggaata ttctgcgctt tggcttccgc 8760
catgttggcc ggagacagag taaacaggca gctaaaggca aagaacatca ccactgcaac 8820
catcagcatg ctggcacgag aaatgatttg ggaacattta cgttcggtga agtcgcgacc 8880
gaagtctttc tcatactctt cacgtttaga aaccacgaag gaagagacga ttggcgagaa 8940
gttaaaggag aaaaccatga tggaaatccc cagccagaca gtgatcagga taccgtcatg 9000
accggttaac gacagcgaac cgaggtcaac ctggtcgata actgcagagt tccagtaagg 9060
gatcagcgac aaagaaatca gcaccaggct ggcgataaac ggccatacca ggtagctcag 9120
ggtaccgagc tcgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 9180
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 9240
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct 9300
gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 9360
cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 9420
tgacgaattc 9430
<210> 17
<211> 5768
<212> DNA
<213> Plasmid pMH17F;
<400> 17
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagt 4380
tacctagaga gggtgagaat tgccgaacat gcgcataagt ttcccggaca gatttcaggt 4440
ggtcagcagc aacgcgttgc cattgcgcgt tcgctgtgta tgaagccgaa aattatgttg 4500
tttgatgagc caacgtcggc gctcgatcct gagatggtga aagaggtgct ggatacgatg 4560
attgggctgg cgcagtcggg tatgacaatg ttgtgtgtaa cacatgagat ggggtttgca 4620
cgaaccgtcg ctgaccgggt aatttttatg gatcgtgggg aaatagtgga gcaagctgca 4680
cctgatgaat tttttgcgca tcctaaatca gagcgtacga gggcattttt atcgcaggta 4740
atccattaat tgaatgttag ttcgaaaagc aaaaaggcca tcctttcgga tggcctttcg 4800
cttgatttga tgtctggcag tttatggcgg gcgtcctgcc cgccaccctc cgggccgttg 4860
cttcgcaacg ttcaaatccg ctcccggcgg atttgtccta ctcgggagag tgttcaccga 4920
caaacaacag ataaaacaaa aggcccagtc ttccgactga gccttttgtt ttatttgatg 4980
tctggcagtt ccctactctc gcatggggag accccacact accatcggcg ctacggcggt 5040
ttcacttctg agttcggcat ggggtcaggt gggaccaccg cgctactgcc gccagacaaa 5100
ttcttttcta atctgccgaa ctttaaccta aaaagtggtg ctgataccca gagtcgaact 5160
ggggacctca cccttaccaa gggtgcgctc taccaactga gccatatcag cacgctaaat 5220
ttgatgcctg gcagttccct actctcgcat ggggagaccc cacactacca tcggcgctac 5280
ggcgtttcac ttctgagttc ggcatggggt caggtgggac caccgcgcta cggccgccag 5340
gcaaattctg ttttatcaga ccgcttctgc gttctgattt aatctgtatc aggctgaaaa 5400
tcttctctca tccggataac aatttcacac aggaaacagc tatgaccatg attacgccaa 5460
gctcgagctc gaattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 5520
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 5580
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga 5640
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca 5700
gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 5760
acgaattc 5768
<210> 18
<211> 1053
<212> DNA
<213> Coding region of the wild type aroG gene;
<400> 18
atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact tcctcctgtc 60
gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc ccatgcccga 120
aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt gattggccca 180
tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct ggcgctgcgt 240
gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa gccgcgtacc 300
acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt ccagatcaac 360
gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg tctgccagcg 420
gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat gagctggggc 480
gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc agggctttct 540
tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat cgatgccatt 600
aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca ttcggcgatt 660
gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa agagcctaac 720
tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg cctgccagca 780
caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa gcagatggat 840
gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat tggcgtgatg 900
gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc gctggcctac 960
ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct gttacgtcaa 1020
ctggcgaatg cagtaaaagc gcgtcgcggg taa 1053
<210> 19
<211> 8820
<212> DNA
<213> Plasmid pMH28F;
<220>
<221> misc_feature
<222> (5894)..(5894)
<223> n is a, c, g, or t
<400> 19
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagt 4380
tacctagaga gggtgagaat tgccgaacat gcgcataagt ttcccggaca gatttcaggt 4440
ggtcagcagc aacgcgttgc cattgcgcgt tcgctgtgta tgaagccgaa aattatgttg 4500
tttgatgagc caacgtcggc gctcgatcct gagatggtga aagaggtgct ggatacgatg 4560
attgggctgg cgcagtcggg tatgacaatg ttgtgtgtaa cacatgagat ggggtttgca 4620
cgaaccgtcg ctgaccgggt aatttttatg gatcgtgggg aaatagtgga gcaagctgca 4680
cctgatgaat tttttgcgca tcctaaatca gagcgtacga gggcattttt atcgcaggta 4740
atccattaat tgaatgttag ttcgaaaagc aaaaaggcca tcctttcgga tggcctttcg 4800
cttgatttga tgtctggcag tttatggcgg gcgtcctgcc cgccaccctc cgggccgttg 4860
cttcgcaacg ttcaaatccg gtgacggaag atcacttcgc agaataaata aatcctggtg 4920
tccctgttga taccgggaag ccctgggcca acttttggcg aaaatgagac gttgatcggc 4980
acgtaagagg ttccaacttt caccataatg aaataagatc actaccgggc gtattttttg 5040
agttatcgag attttcagga gctaaggaag ctaaaatgga gaaaaaaatc actggatata 5100
ccaccgttga tatatcccaa tggcatcgta aagaacattt tgaggcattt cagtcagttg 5160
ctcaatgtac ctataaccag accgttcagc tggatattac ggccttttta aagaccgtaa 5220
agaaaaataa gcacaagttt tatccggcct ttattcacat tcttgcccgc ctgatgaatg 5280
ctcatccgga attccgtatg gcaatgaaag acggtgagct ggtgatatgg gatagtgttc 5340
acccttgtta caccgttttc catgagcaaa ctgaaacgtt ttcatcgctc tggagtgaat 5400
accacgacga tttccggcag tttctacaca tatattcgca agatgtggcg tgttacggtg 5460
aaaacctggc ctatttccct aaagggttta ttgagaatat gtttttcgtc tcagccaatc 5520
cctgggtgag tttcaccagt tttgatttaa acgtggccaa tatggacaac ttcttcgccc 5580
ccgttttcac catgggcaaa tattatacgc aaggcgacaa ggtgctgatg ccgctggcga 5640
ttcaggttca tcatgccgtt tgtgatggct tccatgtcgg cagaatgctt aatgaattac 5700
aacagtactg cgatgagtgg cagggcgggg cgtaattttt ttaaggcagt tattggtgcc 5760
cttaaacgcc tggtgctacg cctgaataag tgataataag cggatgaatg gcagaaattc 5820
gaaagcaaat tcgacccggt cgtcggttca gggcagggtc gttaaatagc cgcttatgtc 5880
tattgctggt ttantcggta cccggggatc gcggccgcgg accggatccc atcacatata 5940
cctgccgttc actattattt agtgaaatga gatattatga tattttctga attgtgatta 6000
aaaaggcaac tttatgccca tgcaacagaa actataaaaa atacagagaa tgaaaagaaa 6060
cagatagatt ttttagttct ttaggcccgt agtctgcaaa tccttttatg attttctatc 6120
aaacaaaaga ggaaaataga ccagttgcaa tccaaacgag agtctaatag aatgaggtcg 6180
aaaagtaaat cgcgcgggtt tgttactgat aaagcaggca agacctaaaa tgtgtaaagg 6240
gcaaagtgta tactttggcg tcacccctta catattttag gtcttttttt attgtgcgta 6300
actaacttgc catcttcaaa caggagggct ggaagaagca gaccgctaac acagtacata 6360
aaaaaggaga catgaacgat gaacatcaaa aagtttgcaa aacaagcaac agtattaacc 6420
tttactaccg cactgctggc aggaggcgca actcaagcgt ttgcgaaaga aacgaaccaa 6480
aagccatata aggaaacata cggcatttcc catattacac gccatgatat gctgcaaatc 6540
cctgaacagc aaaaaaatga aaaatatcaa gttcctgaat tcgattcgtc cacaattaaa 6600
aatatctctt ctgcaaaagg cctggacgtt tgggacagct ggccattaca aaacgctgac 6660
ggcactgtcg caaactatca cggctaccac atcgtctttg cattagccgg agatcctaaa 6720
aatgcggatg acacatcgat ttacatgttc tatcaaaaag tcggcgaaac ttctattgac 6780
agctggaaaa acgctggccg cgtctttaaa gacagcgaca aattcgatgc aaatgattct 6840
atcctaaaag accaaacaca agaatggtca ggttcagcca catttacatc tgacggaaaa 6900
atccgtttat tctacactga tttctccggt aaacattacg gcaaacaaac actgacaact 6960
gcacaagtta acgtatcagc atcagacagc tctttgaaca tcaacggtgt agaggattat 7020
aaatcaatct ttgacggtga cggaaaaacg tatcaaaatg tacagcagtt catcgatgaa 7080
ggcaactaca gctcaggcga caaccatacg ctgagagatc ctcactacgt agaagataaa 7140
ggccacaaat acttagtatt tgaagcaaac actggaactg aagatggcta ccaaggcgaa 7200
gaatctttat ttaacaaagc atactatggc aaaagcacat cattcttccg tcaagaaagt 7260
caaaaacttc tgcaaagcga taaaaaacgc acggctgagt tagcaaacgg cgctctcggt 7320
atgattgagc taaacgatga ttacacactg aaaaaagtga tgaaaccgct gattgcatct 7380
aacacagtaa cagatgaaat tgaacgcgcg aacgtcttta aaatgaacgg caaatggtac 7440
ctgttcactg actcccgcgg atcaaaaatg acgattgacg gcattacgtc taacgatatt 7500
tacatgcttg gttatgtttc taattcttta actggcccat acaagccgct gaacaaaact 7560
ggccttgtgt taaaaatgga tcttgatcct aacgatgtaa cctttactta ctcacacttc 7620
gctgtacctc aagcgaaagg aaacaatgtc gtgattacaa gctatatgac aaacagagga 7680
ttctacgcag acaaacaatc aacgtttgcg ccgagcttcc tgctgaacat caaaggcaag 7740
aaaacatctg ttgtcaaaga cagcatcctt gaacaaggac aattaacagt taacaaataa 7800
aaacgcaaaa gaaaatgcca atatcctatt ggcattttct tttatttctt ccatttaaat 7860
ggatgcatgc gctagcggag tgtatactgg cttactatgt tggcactgat gagggtgtca 7920
gtgaagtgct tcctcccggc ggatttgtcc tactcgggag agtgttcacc gacaaacaac 7980
agataaaaca aaaggcccag tcttccgact gagccttttg ttttatttga tgtctggcag 8040
ttccctactc tcgcatgggg agaccccaca ctaccatcgg cgctacggcg gtttcacttc 8100
tgagttcggc atggggtcag gtgggaccac cgcgctactg ccgccagaca aattcttttc 8160
taatctgccg aactttaacc taaaaagtgg tgctgatacc cagagtcgaa ctggggacct 8220
cacccttacc aagggtgcgc tctaccaact gagccatatc agcacgctaa atttgatgcc 8280
tggcagttcc ctactctcgc atggggagac cccacactac catcggcgct acggcgtttc 8340
acttctgagt tcggcatggg gtcaggtggg accaccgcgc tacggccgcc aggcaaattc 8400
tgttttatca gaccgcttct gcgttctgat ttaatctgta tcaggctgaa aatcttctct 8460
catccggata acaatttcac acaggaaaca gctatgacca tgattacgcc aagctcgagc 8520
tcgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 8580
cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 8640
accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat 8700
tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 8760
tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgaattc 8820
<210> 20
<211> 4774
<212> DNA
<213> Plasmid pCL1921;
<400> 20
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440
caggtcgact ctagaggatc cccgggtacc gagctcgaat tcactggccg tcgttttaca 4500
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 4560
tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 4620
cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 4680
ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 4740
gccccgacac ccgccaacac ccgctgacga attc 4774
<210> 21
<211> 6432
<212> DNA
<213> Plasmid pMG27;
<400> 21
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440
caggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 4500
tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 4560
tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 4620
agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 4680
atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 4740
ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 4800
gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 4860
ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 4920
tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 4980
ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 5040
atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 5100
gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 5160
gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 5220
gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 5280
gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 5340
ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 5400
ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 5460
tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 5520
ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 5580
atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 5640
gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 5700
agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 5760
tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 5820
tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 5880
gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 5940
ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 6000
ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 6060
caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccc 6120
cgggtaccga gctcgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 6180
ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 6240
gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 6300
ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 6360
ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 6420
gctgacgaat tc 6432
<210> 22
<211> 7294
<212> DNA
<213> Plasmid pMG31;
<400> 22
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440
gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500
cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560
aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620
cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680
caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740
caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800
agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860
ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920
gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980
gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040
cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100
aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160
gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220
gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280
ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340
gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400
gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460
gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520
ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580
taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640
atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700
aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760
caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820
ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880
cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940
gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000
cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060
caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120
attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180
gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240
ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300
gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360
caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420
acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480
cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540
agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600
gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660
ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720
ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780
cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840
gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900
ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960
ttggtcgact ctagaggatc cccgggtacc gagctcgaat tcactggccg tcgttttaca 7020
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 7080
tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 7140
cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 7200
ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 7260
gccccgacac ccgccaacac ccgctgacga attc 7294
<210> 23
<211> 8952
<212> DNA
<213> Plasmid pMG33;
<400> 23
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440
gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500
cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560
aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620
cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680
caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740
caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800
agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860
ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920
gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980
gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040
cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100
aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160
gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220
gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280
ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340
gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400
gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460
gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520
ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580
taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640
atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700
aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760
caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820
ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880
cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940
gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000
cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060
caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120
attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180
gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240
ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300
gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360
caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420
acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480
cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540
agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600
gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660
ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720
ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780
cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840
gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900
ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960
ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020
tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080
tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140
agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200
atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260
ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320
gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380
ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440
tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500
ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560
atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620
gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680
gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740
gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800
gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860
ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920
ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980
tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040
ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100
atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160
gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220
agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280
tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340
tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400
gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460
ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520
ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580
caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccc 8640
cgggtaccga gctcgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 8700
ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 8760
gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 8820
ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 8880
ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 8940
gctgacgaat tc 8952
<210> 24
<211> 10630
<212> DNA
<213> Plasmid pMG37;
<400> 24
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440
gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500
cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560
aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620
cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680
caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740
caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800
agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860
ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920
gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980
gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040
cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100
aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160
gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220
gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280
ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340
gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400
gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460
gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520
ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580
taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640
atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700
aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760
caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820
ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880
cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940
gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000
cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060
caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120
attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180
gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240
ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300
gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360
caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420
acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480
cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540
agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600
gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660
ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720
ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780
cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840
gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900
ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960
ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020
tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080
tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140
agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200
atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260
ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320
gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380
ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440
tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500
ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560
atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620
gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680
gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740
gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800
gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860
ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920
ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980
tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040
ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100
atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160
gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220
agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280
tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340
tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400
gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460
ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520
ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580
caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccg 8640
cctacctagc ttccaagaaa gatatcctaa cagcacaaga gcggaaagat gttttgttct 8700
acatccagaa caacctctgc taaaattcct gaaaaatttt gcaaaaagtt gttgacttta 8760
tctacaaggt gtggtataat aatcttaaca acagcaggac gctcccgggt tgaggaaaac 8820
ctaatgaaac tgaccagcct gcgtgttagc ctgctggcac tgggtctggt taccagcggt 8880
tttgcagcag cagaaaccta taccgttgat cgttatcagg atgatagcga aaaaggtagc 8940
ctgcgttggg caattgaaca gagcaatgca aatagcgcac aagaaaacca gattctgatt 9000
caggcagttg gtaaagcacc gtatgttatc aaagttgata aaccgctgcc tccgattaaa 9060
agcagcgtta aaatcattgg caccgagtgg gataaaaccg gtgaatttat tgcaattgat 9120
ggcagcaact atatcaaagg cgaaggtgaa aaagcatgtc cgggtgcaaa tccgggtcag 9180
tatggcacca atgttcgtac catgaccctg cctggtctgg ttctgcaaga tgttaatggt 9240
gttaccctga aaggtctgga tgttcatcgt ttttgtattg gtgttctggt taatcgcagc 9300
agcaataacc tgattcagca taatcgtatc agcaacaatt atggtggtgc cggtgttatg 9360
attaccggtg atgatggtaa aggtaatccg accagcacca ccaccaataa taacaaagtt 9420
ctggataacg tgttcatcga taatggtgat ggtctggaac tgacccgtgg tgcagcattt 9480
aatctgattg caaataacct gtttaccagc acaaaagcca atccggaacc gagccagggt 9540
attgaaattc tgtggggtaa tgataatgcc gtggtgggta acaaattcga aaactattca 9600
gatggcctgc aaatcaattg gggtaaacgt aactatatcg cctataacga actgaccaat 9660
aacagcctgg gtttcaatct gacaggtgat ggtaacattt tcgacagcaa taaagtgcat 9720
ggtaaccgta ttggtattgc cattcgtagt gaaaaagatg ccaatgcacg tattaccctg 9780
accaaaaatc agatttggga taacggcaaa gatatcaaac gttgtgaagc cggtggtagc 9840
tgtgttccga atcagcgtct gggtgcaatt gtttttggtg ttccggcact ggaacatgaa 9900
ggttttgttg gtagccgtgg cggtggtgtt gttattgaac cggcaaaact gcaaaaaacc 9960
tgcacccagc cgaaccagca gaattgtaat gcaattccta atcagggtat tcaggcaccg 10020
aaactgacag ttagcaaaaa acagctgacc gttgaagtta aaggcacccc taatcagcgt 10080
tataatgtgg aattttttgg caatcgtaat gccagcagca gcgaagcaga acagtatctg 10140
ggtagcattg ttgttgttac cgatcatcag ggtctggcaa aagcaaattg ggctccgaaa 10200
gttagcatgc cgagcgttac cgcaaatgtg acagatcatc tgggtgcgac cagcgaactg 10260
agcagcgcag ttaaaatgcg ttaaatgcat gcgcgccgcg ttcgcgcggc gctttttttt 10320
ggtaccgagc tcgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 10380
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 10440
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct 10500
gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 10560
cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 10620
tgacgaattc 10630
<210> 25
<211> 6452
<212> DNA
<213> Plasmid pMG39;
<400> 25
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440
caggtcgact ctagaggatc cgcctaccta gcttccaaga aagatatcct aacagcacaa 4500
gagcggaaag atgttttgtt ctacatccag aacaacctct gctaaaattc ctgaaaaatt 4560
ttgcaaaaag ttgttgactt tatctacaag gtgtggtata ataatcttaa caacagcagg 4620
acgctcccgg gttgaggaaa acctaatgaa actgaccagc ctgcgtgtta gcctgctggc 4680
actgggtctg gttaccagcg gttttgcagc agcagaaacc tataccgttg atcgttatca 4740
ggatgatagc gaaaaaggta gcctgcgttg ggcaattgaa cagagcaatg caaatagcgc 4800
acaagaaaac cagattctga ttcaggcagt tggtaaagca ccgtatgtta tcaaagttga 4860
taaaccgctg cctccgatta aaagcagcgt taaaatcatt ggcaccgagt gggataaaac 4920
cggtgaattt attgcaattg atggcagcaa ctatatcaaa ggcgaaggtg aaaaagcatg 4980
tccgggtgca aatccgggtc agtatggcac caatgttcgt accatgaccc tgcctggtct 5040
ggttctgcaa gatgttaatg gtgttaccct gaaaggtctg gatgttcatc gtttttgtat 5100
tggtgttctg gttaatcgca gcagcaataa cctgattcag cataatcgta tcagcaacaa 5160
ttatggtggt gccggtgtta tgattaccgg tgatgatggt aaaggtaatc cgaccagcac 5220
caccaccaat aataacaaag ttctggataa cgtgttcatc gataatggtg atggtctgga 5280
actgacccgt ggtgcagcat ttaatctgat tgcaaataac ctgtttacca gcacaaaagc 5340
caatccggaa ccgagccagg gtattgaaat tctgtggggt aatgataatg ccgtggtggg 5400
taacaaattc gaaaactatt cagatggcct gcaaatcaat tggggtaaac gtaactatat 5460
cgcctataac gaactgacca ataacagcct gggtttcaat ctgacaggtg atggtaacat 5520
tttcgacagc aataaagtgc atggtaaccg tattggtatt gccattcgta gtgaaaaaga 5580
tgccaatgca cgtattaccc tgaccaaaaa tcagatttgg gataacggca aagatatcaa 5640
acgttgtgaa gccggtggta gctgtgttcc gaatcagcgt ctgggtgcaa ttgtttttgg 5700
tgttccggca ctggaacatg aaggttttgt tggtagccgt ggcggtggtg ttgttattga 5760
accggcaaaa ctgcaaaaaa cctgcaccca gccgaaccag cagaattgta atgcaattcc 5820
taatcagggt attcaggcac cgaaactgac agttagcaaa aaacagctga ccgttgaagt 5880
taaaggcacc cctaatcagc gttataatgt ggaatttttt ggcaatcgta atgccagcag 5940
cagcgaagca gaacagtatc tgggtagcat tgttgttgtt accgatcatc agggtctggc 6000
aaaagcaaat tgggctccga aagttagcat gccgagcgtt accgcaaatg tgacagatca 6060
tctgggtgcg accagcgaac tgagcagcgc agttaaaatg cgttaaatgc atgcgcgccg 6120
cgttcgcgcg gcgctttttt ttggtaccga gctcgaattc actggccgtc gttttacaac 6180
gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 6240
tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 6300
gcctgaatgg cgaatggcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt 6360
cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420
cccgacaccc gccaacaccc gctgacgaat tc 6452
<210> 26
<211> 10012
<212> DNA
<213> Plasmid pMG47F;
<400> 26
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440
gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500
cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560
aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620
cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680
caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740
caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800
agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860
ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920
gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980
gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040
cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100
aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160
gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220
gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280
ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340
gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400
gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460
gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520
ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580
taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640
atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700
aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760
caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820
ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880
cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940
gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000
cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060
caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120
attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180
gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240
ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300
gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360
caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420
acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480
cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540
agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600
gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660
ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720
ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780
cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840
gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900
ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960
ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020
tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080
tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140
agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200
atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260
ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320
gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380
ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440
tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500
ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560
atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620
gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680
gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740
gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800
gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860
ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920
ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980
tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040
ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100
atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160
gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220
agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280
tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340
tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400
gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460
ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520
ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580
caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccg 8640
cctacctagc ttccaagaaa gatatcctaa cagcacaaga gcggaaagat gttttgttct 8700
acatccagaa caacctctgc taaaattcct gaaaaatttt gcaaaaagtt gttgacttta 8760
tctacaaggt gtggtataat aatcttaaca acagcaggac gctcccgggt tgaggaaaac 8820
ctaatgaaat atagcctgtg caccattagc tttcgtcacc agctgattag ctttaccgat 8880
attgttcagt ttgcctatga aaacggcttt gaaggtattg aactgtgggg cacccatgca 8940
cagaatctgt atatgcaaga atatgaaacc accgaacgtg aactgaattg cctgaaagat 9000
aaaaccctgg aaattaccat gatcagcgat tatctggata ttagcctgag cgcagatttt 9060
gaaaaaacca tcgaaaaatg tgaacagctg gcaattctgg ccaattggtt taaaacgaac 9120
aaaattcgta cctttgccgg tcagaaaggt agtgcagatt ttagccagca agaacgtcaa 9180
gagtatgtga atcgtattcg catgatttgt gaactgtttg cccagcataa tatgtatgtt 9240
ctgctggaaa cccatccgaa taccctgacc gataccctgc cgagcaccct ggaactgctg 9300
ggtgaagttg atcatccgaa tctgaaaatc aacctggatt ttctgcatat ctgggaaagc 9360
ggtgcagatc cggttgatag ctttcagcag ctgcgtccgt ggattcagca ttatcacttt 9420
aaaaacatta gcagcgcaga ctatctgcat gtgtttgaac cgaataatgt ttatgcagca 9480
gcaggtaatc gtaccggtat ggttccgctg tttgaaggca ttgttaacta tgatgaaatc 9540
atccaagaag tgcgcgatac cgatcatttt gcaagcctgg aatggtttgg tcataacgca 9600
aaagatattc tgaaagccga aatgaaagtg ctgaccaatc gtaatctgga agttgttacc 9660
agctaaatgc atgcgcgccg cgttcgcgcg gcgctttttt ttggtaccga gctcgaattc 9720
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9780
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9840
cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9900
tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9960
tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgaat tc 10012
<210> 27
<211> 10249
<212> DNA
<213> Plasmid pMG70;
<400> 27
gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60
agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120
gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500
ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740
agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860
ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100
tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220
cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280
attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340
cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400
ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460
gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520
cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580
gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640
tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700
gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760
gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820
gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880
gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000
tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060
tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120
tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180
gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240
aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300
gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360
gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420
gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480
aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540
aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600
ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660
gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720
atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780
cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840
tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900
actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960
tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020
aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080
aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140
agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200
ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440
gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500
cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560
aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620
cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680
caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740
caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800
agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860
ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920
gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980
gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040
cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100
aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160
gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220
gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280
ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340
gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400
gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460
gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520
ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580
taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640
atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700
aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760
caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820
ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880
cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940
gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000
cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060
caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120
attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180
gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240
ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300
gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360
caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420
acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480
cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540
agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600
gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660
ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720
ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780
cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840
gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900
ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960
ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020
tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080
tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140
agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200
atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260
ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320
gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380
ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440
tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500
ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560
atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620
gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680
gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740
gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800
gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860
ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920
ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980
tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040
ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100
atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160
gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220
agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280
tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340
tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400
gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460
ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520
ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580
caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccg 8640
cctacctagc ttccaagaaa gatatcctaa cagcacaaga gcggaaagat gttttgttct 8700
acatccagaa caacctctgc taaaattcct gaaaaatttt gcaaaaagtt gttgacttta 8760
tctacaaggt gtggtataat aatcttaaca acagcaggac gctcccgggt tgaggaaaac 8820
ctaatgccga gcaaactggc aattagcagc atgagcctgg gtcgttgttt tgcaggtcat 8880
agcctggata gtaaactgga tgcagcacag cgttatggtt atctgggtat tgaactgttt 8940
tatgaggatc tggttgatgt tgcagaacat ctgagcaatg aacgtccgag tccggaaggt 9000
ccgtttgttg aagcacagat tgcagcagca cgtcatattc tgcaaatgtg tcaggcacgt 9060
ggtctggaag ttgtttgtct gcaaccgttt atgcattatg atggtctgaa tgatcgtgcc 9120
gaacatgaac gtcgtctgga aaaactggca ctgtggattg aactggcaca tgaactgcat 9180
accgatatta ttcagattcc ggcaaatttt ctgcctgcaa atcaggttag cgataatctg 9240
gatctgattg ttagcgatct gtgtaaagtt gcagatattg gtgcacaggc actgcctccg 9300
attcgttttg catatgaaag cctgtgttgg agcacccgtg ttgatctgtg ggaacgttgt 9360
tgggatattg ttcagcgtgt ggatcgtccg aattttggta tttgtctgga tacctttaac 9420
atcctgggtc gcatttatgc agatccgacc agcccgagcg gtcgtacccc gaatgcaaaa 9480
gaagcagttc gtaaaagcat tgccaatctg gttagccgtg tggatgttag caaagttttt 9540
tatgttcagg ttgtggatgc cgaacgtctg agtaaaccgc tgctgcctgg tcatccgtat 9600
tataacccgg aacagcctgc acgtatgagc tggtcacgta attgtcgtct gttctatggt 9660
gaaaccgaat atggtgcata tctgccggtt aaagaagttg cacgcgcact gtttcatggt 9720
attggttttg aaggttgggt tagcctggaa ctgtttaatc gtcgtatgag cgaagaaggt 9780
ccggaagttc ctgaagaact ggccatgcgt ggtgcaatta gctgggcaaa actggttcag 9840
gatctgcgta ttccggttga aggtccgctg gttaccatgc ctcgtgttag cgcaagcctg 9900
taaatgcatg cgcgccgcgt tcgcgcggcg cttttttttg gtaccgagct cgaattcact 9960
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 10020
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 10080
ttcccaacag ttgcgcagcc tgaatggcga atggcgcctg atgcggtatt ttctccttac 10140
gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct gctctgatgc 10200
cgcatagtta agccagcccc gacacccgcc aacacccgct gacgaattc 10249
<210> 28
<211> 7623
<212> DNA
<213> Plasmid pCP32AMP;
<400> 28
acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 60
tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 120
acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 180
atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 240
gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 300
aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 360
cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 420
atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 480
gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 540
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 600
gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 660
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 720
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 780
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 840
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 900
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 960
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 1020
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 1080
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 1140
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 1200
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 1260
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 1320
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 1380
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 1440
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 1500
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 1560
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 1620
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 1680
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 1740
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 1800
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 1860
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 1920
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 1980
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg 2040
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 2100
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 2160
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 2220
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 2280
atagtgtatg cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc 2340
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 2400
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 2460
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 2520
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 2580
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 2640
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 2700
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 2760
tcgtcttcaa gaattctgaa ccagtcctaa aacgagtaaa taggaccggc aattcttcaa 2820
gcaataaaca ggaataccaa ttattaaaag ataacttagt cagatcgtac aataaagctt 2880
tgaagaaaaa tgcgccttat tcaatctttg ctataaaaaa tggcccaaaa tctcacattg 2940
gaagacattt gatgacctca tttctttcaa tgaagggcct aacggagttg actaatgttg 3000
tgggaaattg gagcgataag cgtgcttctg ccgtggccag gacaacgtat actcatcaga 3060
taacagcaat acctgatcac tacttcgcac tagtttctcg gtactatgca tatgatccaa 3120
tatcaaagga aatgatagca ttgaaggatg agactaatcc aattgaggag tggcagcata 3180
tagaacagct aaagggtagt gctgaaggaa gcatacgata ccccgcatgg aatgggataa 3240
tatcacagga ggtactagac tacctttcat cctacataaa tagacgcata taagtacgca 3300
tttaagcata aacacgcact atgccgttct tctcatgtat atatatatac aggcaacacg 3360
cagatatagg tgcgacgtga acagtgagct gtatgtgcgc agctcgcgtt gcattttcgg 3420
aagcgctcgt tttcggaaac gctttgaagt tcctattccg aagttcctat tctctagaaa 3480
gtataggaac ttcagagcgc ttttgaaaac caaaagcgct ctgaagacgc actttcaaaa 3540
aaccaaaaac gcaccggact gtaacgagct actaaaatat tgcgaatacc gcttccacaa 3600
acattgctca aaagtatctc tttgctatat atctctgtgc tatatcccta tataacctac 3660
ccatccacct ttcgctcctt gaacttgcat ctaaactcga cctctacatt ttttatgttt 3720
atctctagta ttactcttta gacaaaaaaa ttgtagtaag aactattcat agagtgaatc 3780
gaaaacaata cgaaaatgta aacatttcct atacgtagta tatagagaca aaatagaaga 3840
aaccgttcat aattttctga ccaatgaaga atcatcaacg ctatcacttt ctgttcacaa 3900
agtatgcgca atccacatcg gtatagaata taatcgggga tgcctttatc ttgaaaaaat 3960
gcacccgcag cttcgctagt aatcagtaaa cgcgggaagt ggagtcaggc tttttttatg 4020
gaagagaaaa tagacaccaa agtagccttc ttctaacctt aacggaccta cagtgcaaaa 4080
agttatcaag agactgcatt atagagcgca caaaggagaa aaaaagtaat ctaagatgct 4140
ttgttagaaa aatagcgctc tcgggatgca tttttgtaga acaaaaaaga agtatagatt 4200
ctttgttggt aaaatagcgc tctcgcgttg catttctgtt ctgtaaaaat gcagctcaga 4260
ttctttgttt gaaaaattag cgctctcgcg ttgcattttt gttttacaaa aatgaagcac 4320
agattcttcg ttggtaaaat agcgctttcg cgttgcattt ctgttctgta aaaatgcagc 4380
tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgttct acaaaatgaa 4440
gcacagatgc ttcgttaaca aagatatgct attgaagtgc aagatggaaa cgcagaaaat 4500
gaaccgggga tgcgacgtgc aagattacct atgcaataga tgcaatagtt tctccaggaa 4560
ccgaaataca tacattgtct tccgtaaagc gctagactat atattattat acaggttcaa 4620
atatactatc tgtttcaggg aaaactccca ggttcggatg ttcaaaattc aatgatgggt 4680
aacaagtacg atcgtaaatc tgtaaaacag tttgtcggat attaggctgt atctcctcaa 4740
agcgtattcg aatatcattg agaagctgca gcgtcacatc ggataataat gatggcagcc 4800
attgtagaag tgccttttgc atttctagtc tctttctcgg tctagctagt tttactacat 4860
cgcgaagata gaatcttaga tcacactgcc tttgctgagc tggatcaata gagtaacaaa 4920
agagtggtaa ggcctcgtta aaggacaagg acctgagcgg aagtgtatcg tacagtagac 4980
ggagtatact agtatagtct atagtccgtg gaattctcat gtttgacagc ttatcatcga 5040
taagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt 5100
tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga 5160
cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc 5220
ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct 5280
acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc 5340
atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta 5400
ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc 5460
ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac 5520
aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag 5580
tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg 5640
gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct 5700
agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat 5760
actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct 5820
caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg 5880
ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc 5940
tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct 6000
aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc 6060
cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga 6120
gcttcaattt aattatatca gttattaccc gggaatctcg gtcgtaatga cttgaaataa 6180
ttaacaaaca aaggagttac agttagaaat tgtaggagag atctcgtttt tcgcgacaat 6240
ctggcgtttt tcttgctaat tccaggatta atccgttcat agtgtaaaac cccgtttaca 6300
cattctgacg gaagatatag attggaagta ttgcattcac taagataagt atggcaacac 6360
tggaacagac atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact 6420
tcctcctgtc gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc 6480
ccatgcccga aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt 6540
gattggccca tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct 6600
ggcgctgcgt gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa 6660
gccgcgtacc acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt 6720
ccagatcaac gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg 6780
tctgccagcg gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat 6840
gagctggggc gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc 6900
agggctttct tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat 6960
cgatgccatt aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca 7020
ttcggcgatt gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa 7080
agagcctaac tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg 7140
cctgccagca caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa 7200
gcagatggat gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat 7260
tggcgtgatg gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc 7320
gctggcctac ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct 7380
gttacgtcaa ctggcgaatg cagtaaaagc gcgtcgcggg taaggtttaa ttgtcggatg 7440
cgccgtcaga gtggcgtatc cgatgaatca ccacaggcct gataagtcgc gcagcgtcgc 7500
atcaggcaat gtgctccatt gttagcaaca aaaaagccga ctcacttgca gtcggctttc 7560
tcattttaaa cgaatgacgt ttacttcgct ttaccctggt ttgcaaccgc cgctgctttc 7620
gct 7623
<210> 29
<211> 7630
<212> DNA
<213> Plasmid pCP14;
<400> 29
ctcgaggcta ttgacgacag ctatggttca ctgtccacca accaaaactg tgctcagtac 60
cgccaatatt tctcccttga ggggtacaaa gaggtgtccc tagaagagat ccacgctgtg 120
taaaaatttt acaaaaaggt attgactttc cctacagggt gtgtaataat ttaattacag 180
gcgggggcaa ccccgcctgt tctagaggag gaggaatcgc catggagagg attgtcgtta 240
ctctcgggga acgtagttac ccaattacca tcgcatctgg tttgtttaat gaaccagctt 300
cattcttacc gctgaaatcg ggcgagcagg tcatgttggt caccaacgaa accctggctc 360
ctctgtatct cgataaggtc cgcggcgtac ttgaacaggc gggtgttaac gtcgatagcg 420
ttatcctccc tgacggcgag cagtataaaa gcctggctgt actcgatacc gtctttacgg 480
cgttgttaca aaagccgcat ggtcgcgata ctacgctggt ggcgcttggc ggcggcgtag 540
tgggcgatct gaccggcttc gcggcggcga gttatcagcg cggtgttcgt ttcattcaag 600
tcccgacgac gttactgtcg caggtcgatt cctccgttgg cggcaaaact gcggtcaacc 660
atcccctcgg taaaaacatg attggcgcgt tctaccagcc tgcttcagtg gtggtggatc 720
tcgactgtct gaaaacgctt cccccgcgtg agttagcgtc ggggctggca gaagtcatca 780
aatacggcat tattcttgac ggtgcgtttt tcaactggct ggaagagaat ctggatgcgt 840
tgttgcgtct ggacggtccg gcaatggcgt actgtattcg ccgttgttgt gaactgaagg 900
cagaagttgt cgccgccgac gagcgcgaaa ccgggttacg tgctttactg aatctgggac 960
acacctttgg tcatgccatt gaagctgaaa tggggtatgg caattggtta catggtgaag 1020
cggtcgctgc gggtatggtg atggcggcgc ggacgtcgga acgtctcggg cagtttagtt 1080
ctgccgaaac gcagcgtatt ataaccctgc tcacgcgggc tgggttaccg gtcaatgggc 1140
cgcgcgaaat gtccgcgcag gcgtatttac cgcatatgct gcgtgacaag aaagtccttg 1200
cgggagagat gcgcttaatt cttccgttgg caattggtaa gagtgaagtt cgcagcggcg 1260
tttcgcacga gcttgttctt aacgccattg ccgattgtca atcagcgtaa tcatcgttca 1320
tgcctgatgc cgctatgtag gccggataag gcgttcacgc cgcatccggc aaccgatgcc 1380
tgatgcgacg cggtcgcgtc ttatcaggcc tacaggtcga tgccgatatg tacatcgtat 1440
tcggcaatta atacatagca acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg 1500
aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca ggatgctgct 1560
ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga ccctgagtga 1620
tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa cgttccagta 1680
accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt ttcatcggta 1740
tcattacccc catgaacaga aattccccct tacacggagg catcaagtga ccaaacagga 1800
aaaaaccgcc cttaacatgg cccgctttat cagaagccag acattaacgc ttctggagaa 1860
actcaacgag ctggacgcgg atgaacaggc agacatctgt gaatcgcttc acgaccacgc 1920
tgatgagctt taccgcagct gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca 1980
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 2040
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg 2100
tagcgatagc ggagtgtata ctggcttaac tatgcggcat cagagcagat tgtactgaga 2160
gtgcaccata tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 2220
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 2280
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 2340
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 2400
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 2460
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 2520
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 2580
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 2640
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 2700
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 2760
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 2820
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 2880
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 2940
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 3000
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 3060
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 3120
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 3180
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 3240
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 3300
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 3360
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 3420
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 3480
gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 3540
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 3600
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 3660
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 3720
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 3780
acacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 3840
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 3900
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 3960
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 4020
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 4080
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 4140
cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac ctataaaaat 4200
aggcgtatca cgaggccctt tcgtcttcaa gaattctgaa ccagtcctaa aacgagtaaa 4260
taggaccggc aattcttcaa gcaataaaca ggaataccaa ttattaaaag ataacttagt 4320
cagatcgtac aataaagctt tgaagaaaaa tgcgccttat tcaatctttg ctataaaaaa 4380
tggcccaaaa tctcacattg gaagacattt gatgacctca tttctttcaa tgaagggcct 4440
aacggagttg actaatgttg tgggaaattg gagcgataag cgtgcttctg ccgtggccag 4500
gacaacgtat actcatcaga taacagcaat acctgatcac tacttcgcac tagtttctcg 4560
gtactatgca tatgatccaa tatcaaagga aatgatagca ttgaaggatg agactaatcc 4620
aattgaggag tggcagcata tagaacagct aaagggtagt gctgaaggaa gcatacgata 4680
ccccgcatgg aatgggataa tatcacagga ggtactagac tacctttcat cctacataaa 4740
tagacgcata taagtacgca tttaagcata aacacgcact atgccgttct tctcatgtat 4800
atatatatac aggcaacacg cagatatagg tgcgacgtga acagtgagct gtatgtgcgc 4860
agctcgcgtt gcattttcgg aagcgctcgt tttcggaaac gctttgaagt tcctattccg 4920
aagttcctat tctctagaaa gtataggaac ttcagagcgc ttttgaaaac caaaagcgct 4980
ctgaagacgc actttcaaaa aaccaaaaac gcaccggact gtaacgagct actaaaatat 5040
tgcgaatacc gcttccacaa acattgctca aaagtatctc tttgctatat atctctgtgc 5100
tatatcccta tataacctac ccatccacct ttcgctcctt gaacttgcat ctaaactcga 5160
cctctacatt ttttatgttt atctctagta ttactcttta gacaaaaaaa ttgtagtaag 5220
aactattcat agagtgaatc gaaaacaata cgaaaatgta aacatttcct atacgtagta 5280
tatagagaca aaatagaaga aaccgttcat aattttctga ccaatgaaga atcatcaacg 5340
ctatcacttt ctgttcacaa agtatgcgca atccacatcg gtatagaata taatcgggga 5400
tgcctttatc ttgaaaaaat gcacccgcag cttcgctagt aatcagtaaa cgcgggaagt 5460
ggagtcaggc tttttttatg gaagagaaaa tagacaccaa agtagccttc ttctaacctt 5520
aacggaccta cagtgcaaaa agttatcaag agactgcatt atagagcgca caaaggagaa 5580
aaaaagtaat ctaagatgct ttgttagaaa aatagcgctc tcgggatgca tttttgtaga 5640
acaaaaaaga agtatagatt ctttgttggt aaaatagcgc tctcgcgttg catttctgtt 5700
ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg ttgcattttt 5760
gttttacaaa aatgaagcac agattcttcg ttggtaaaat agcgctttcg cgttgcattt 5820
ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca 5880
tttttgttct acaaaatgaa gcacagatgc ttcgttaaca aagatatgct attgaagtgc 5940
aagatggaaa cgcagaaaat gaaccgggga tgcgacgtgc aagattacct atgcaataga 6000
tgcaatagtt tctccaggaa ccgaaataca tacattgtct tccgtaaagc gctagactat 6060
atattattat acaggttcaa atatactatc tgtttcaggg aaaactccca ggttcggatg 6120
ttcaaaattc aatgatgggt aacaagtacg atcgtaaatc tgtaaaacag tttgtcggat 6180
attaggctgt atctcctcaa agcgtattcg aatatcattg agaagctgca gcgtcacatc 6240
ggataataat gatggcagcc attgtagaag tgccttttgc atttctagtc tctttctcgg 6300
tctagctagt tttactacat cgcgaagata gaatcttaga tcacactgcc tttgctgagc 6360
tggatcaata gagtaacaaa agagtggtaa ggcctcgtta aaggacaagg acctgagcgg 6420
aagtgtatcg tacagtagac ggagtatact agtatagtct atagtccgtg gaattctcat 6480
gtttgacagc ttatcatcga taagcttttc aattcaattc atcatttttt ttttattctt 6540
ttttttgatt tcggtttctt tgaaattttt ttgattcggt aatctccgaa cagaaggaag 6600
aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtagt gttgaagaaa 6660
catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa 6720
gataaatcat gtcgaaagct acatataagg aacgtgctgc tactcatcct agtcctgttg 6780
ctgccaagct atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg 6840
ttcgtaccac caaggaatta ctggagttag ttgaagcatt aggtcccaaa atttgtttac 6900
taaaaacaca tgtggatatc ttgactgatt tttccatgga gggcacagtt aagccgctaa 6960
aggcattatc cgccaagtac aattttttac tcttcgaaga cagaaaattt gctgacattg 7020
gtaatacagt caaattgcag tactctgcgg gtgtatacag aatagcagaa tgggcagaca 7080
ttacgaatgc acacggtgtg gtgggcccag gtattgttag cggtttgaag caggcggcag 7140
aagaagtaac aaaggaacct agaggccttt tgatgttagc agaattgtca tgcaagggct 7200
ccctatctac tggagaatat actaagggta ctgttgacat tgcgaagagc gacaaagatt 7260
ttgttatcgg ctttattgct caaagagaca tgggtggaag agatgaaggt tacgattggt 7320
tgattatgac acccggtgtg ggtttagatg acaagggaga cgcattgggt caacagtata 7380
gaaccgtgga tgatgtggtc tctacaggat ctgacattat tattgttgga agaggactat 7440
ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta cagaaaagca ggctgggaag 7500
catatttgag aagatgcggc cagcaaaact aaaaaactgt attataagta aatgcatgta 7560
tactaaactc acaaattaga gcttcaattt aattatatca gttattaccc gggaatctcg 7620
gtcgtaatga 7630
<210> 30
<211> 10015
<212> DNA
<213> Plasmid pCP50;
<400> 30
cttgaaataa ttaacaaaca aaggagttac agttagaaat tgtaggagag atctcgtttt 60
tcgcgacaat ctggcgtttt tcttgctaat tccaggatta atccgttcat agtgtaaaac 120
cccgtttaca cattctgacg gaagatatag attggaagta ttgcattcac taagataagt 180
atggcaacac tggaacagac atgaattatc agaacgacga tttacgcatc aaagaaatca 240
aagagttact tcctcctgtc gcattgctgg aaaaattccc cgctactgaa aatgccgcga 300
atacggttgc ccatgcccga aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc 360
tgttggttgt gattggccca tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca 420
ctcgcttgct ggcgctgcgt gaagagctga aagatgagct ggaaatcgta atgcgcgtct 480
attttgaaaa gccgcgtacc acggtgggct ggaaagggct gattaacgat ccgcatatgg 540
ataatagctt ccagatcaac gacggtctgc gtatagcccg taaattgctg cttgatatta 600
acgacagcgg tctgccagcg gcaggtgagt ttctcgatat gatcacccca caatatctcg 660
ctgacctgat gagctggggc gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg 720
aactggcatc agggctttct tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta 780
aagtggctat cgatgccatt aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga 840
aatgggggca ttcggcgatt gtgaatacca gcggtaacgg cgattgccat atcattctgc 900
gcggcggtaa agagcctaac tacagcgcga agcacgttgc tgaagtgaaa gaagggctga 960
acaaagcagg cctgccagca caggtgatga tcgatttcag ccatgctaac tcgtccaaac 1020
aattcaaaaa gcagatggat gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa 1080
aggccattat tggcgtgatg gtggaaagcc atctggtgga aggcaatcag agcctcgaga 1140
gcggggagcc gctggcctac ggtaagagca tcaccgatgc ctgcatcggc tgggaagata 1200
ccgatgctct gttacgtcaa ctggcgaatg cagtaaaagc gcgtcgcggg taaggtttaa 1260
ttgtcggatg cgccgtcaga gtggcgtatc cgatgaatca ccacaggcct gataagtcgc 1320
gcagcgtcgc atcaggcaat gtgctccatt gttagcaaca aaaaagccga ctcacttgca 1380
gtcggctttc tcattttaaa cgaatgacgt ttacttcgct ttaccctggt ttgcaaccgc 1440
cgctgctttc gctacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg 1500
gaagtcagcg ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc 1560
ctgtggaaca cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct 1620
ctggtcccgc cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc 1680
atgttcatca tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac 1740
ccccatgaac agaaattccc ccttacacgg aggcatcaag tgaccaaaca ggaaaaaacc 1800
gcccttaaca tggcccgctt tatcagaagc cagacattaa cgcttctgga gaaactcaac 1860
gagctggacg cggatgaaca ggcagacatc tgtgaatcgc ttcacgacca cgctgatgag 1920
ctttaccgca gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag 1980
ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag 2040
ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat 2100
agcggagtgt atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc 2160
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt 2220
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 2280
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 2340
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 2400
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 2460
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 2520
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 2580
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 2640
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 2700
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 2760
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 2820
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 2880
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 2940
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 3000
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 3060
tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 3120
caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 3180
cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 3240
agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 3300
acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 3360
gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 3420
ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca 3480
tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 3540
ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 3600
tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 3660
attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 3720
agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg 3780
ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 3840
ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 3900
cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 3960
gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 4020
tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 4080
tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 4140
tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta 4200
tcacgaggcc ctttcgtctt caagaattct gaaccagtcc taaaacgagt aaataggacc 4260
ggcaattctt caagcaataa acaggaatac caattattaa aagataactt agtcagatcg 4320
tacaataaag ctttgaagaa aaatgcgcct tattcaatct ttgctataaa aaatggccca 4380
aaatctcaca ttggaagaca tttgatgacc tcatttcttt caatgaaggg cctaacggag 4440
ttgactaatg ttgtgggaaa ttggagcgat aagcgtgctt ctgccgtggc caggacaacg 4500
tatactcatc agataacagc aatacctgat cactacttcg cactagtttc tcggtactat 4560
gcatatgatc caatatcaaa ggaaatgata gcattgaagg atgagactaa tccaattgag 4620
gagtggcagc atatagaaca gctaaagggt agtgctgaag gaagcatacg ataccccgca 4680
tggaatggga taatatcaca ggaggtacta gactaccttt catcctacat aaatagacgc 4740
atataagtac gcatttaagc ataaacacgc actatgccgt tcttctcatg tatatatata 4800
tacaggcaac acgcagatat aggtgcgacg tgaacagtga gctgtatgtg cgcagctcgc 4860
gttgcatttt cggaagcgct cgttttcgga aacgctttga agttcctatt ccgaagttcc 4920
tattctctag aaagtatagg aacttcagag cgcttttgaa aaccaaaagc gctctgaaga 4980
cgcactttca aaaaaccaaa aacgcaccgg actgtaacga gctactaaaa tattgcgaat 5040
accgcttcca caaacattgc tcaaaagtat ctctttgcta tatatctctg tgctatatcc 5100
ctatataacc tacccatcca cctttcgctc cttgaacttg catctaaact cgacctctac 5160
attttttatg tttatctcta gtattactct ttagacaaaa aaattgtagt aagaactatt 5220
catagagtga atcgaaaaca atacgaaaat gtaaacattt cctatacgta gtatatagag 5280
acaaaataga agaaaccgtt cataattttc tgaccaatga agaatcatca acgctatcac 5340
tttctgttca caaagtatgc gcaatccaca tcggtataga atataatcgg ggatgccttt 5400
atcttgaaaa aatgcacccg cagcttcgct agtaatcagt aaacgcggga agtggagtca 5460
ggcttttttt atggaagaga aaatagacac caaagtagcc ttcttctaac cttaacggac 5520
ctacagtgca aaaagttatc aagagactgc attatagagc gcacaaagga gaaaaaaagt 5580
aatctaagat gctttgttag aaaaatagcg ctctcgggat gcatttttgt agaacaaaaa 5640
agaagtatag attctttgtt ggtaaaatag cgctctcgcg ttgcatttct gttctgtaaa 5700
aatgcagctc agattctttg tttgaaaaat tagcgctctc gcgttgcatt tttgttttac 5760
aaaaatgaag cacagattct tcgttggtaa aatagcgctt tcgcgttgca tttctgttct 5820
gtaaaaatgc agctcagatt ctttgtttga aaaattagcg ctctcgcgtt gcatttttgt 5880
tctacaaaat gaagcacaga tgcttcgtta acaaagatat gctattgaag tgcaagatgg 5940
aaacgcagaa aatgaaccgg ggatgcgacg tgcaagatta cctatgcaat agatgcaata 6000
gtttctccag gaaccgaaat acatacattg tcttccgtaa agcgctagac tatatattat 6060
tatacaggtt caaatatact atctgtttca gggaaaactc ccaggttcgg atgttcaaaa 6120
ttcaatgatg ggtaacaagt acgatcgtaa atctgtaaaa cagtttgtcg gatattaggc 6180
tgtatctcct caaagcgtat tcgaatatca ttgagaagct gcagcgtcac atcggataat 6240
aatgatggca gccattgtag aagtgccttt tgcatttcta gtctctttct cggtctagct 6300
agttttacta catcgcgaag atagaatctt agatcacact gcctttgctg agctggatca 6360
atagagtaac aaaagagtgg taaggcctcg ttaaaggaca aggacctgag cggaagtgta 6420
tcgtacagta gacggagtat actagtatag tctatagtcc gtggaattct catgtttgac 6480
agcttatcat cgataagctt ttcaattcaa ttcatcattt tttttttatt cttttttttg 6540
atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag 6600
gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa 6660
ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat 6720
catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa 6780
gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac 6840
caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac 6900
acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt 6960
atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac 7020
agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa 7080
tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt 7140
aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc 7200
tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat 7260
cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat 7320
gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt 7380
ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa 7440
gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt 7500
gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa 7560
ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa 7620
tgaaaggaaa agcgcaacgg acgggcgagt agattgcgca acatgcgagc atgatccaga 7680
gatttctgaa gcagcaaaag gatgttccat gtacatgacg cgcggcttgc ggtaaattgt 7740
tggcaaattt tccggcgtag cccaaaacgc gctgtcgtca agtcgttaag ggcgtgccct 7800
tcatcatccg atctggagtc aaaatgtcct cacgtaaaga gcttgccaat gctattcgtg 7860
cgctgagcat ggacgcagta cagaaagcca aatccggtca cccgggtgcc cctatgggta 7920
tggctgacat tgccgaagtc ctgtggcgtg atttcctgaa acacaacccg cagaatccgt 7980
cctgggctga ccgtgaccgc ttcgtgctgt ccaacggcca cggctccatg ctgatctaca 8040
gcctgctgca cctcaccggt tacgatctgc cgatggaaga actgaaaaac ttccgtcagc 8100
tgcactctaa aactccgggc cacccggaag taggttatac cgctggtgtg gaaaccacca 8160
ccggtccgct gggtcagggt attgccaacg cagtcggtat ggcgattgca gaaaaaacgc 8220
tggcggcgca gtttaaccgt ccaggtcacg acattgtcga ccactacacc tacgccttca 8280
tgggcgacgg ctgcatgatg gaaggcatct cccacgaagt ttgctctctg gcgggtacgc 8340
tgaagctggg taaactgatt gcgttctacg atgacaacgg tatctcaatc gatggtcacg 8400
ttgaaggctg gttcactgac gacaccgcaa tgcgtttcga agcttacggc tggcacgtta 8460
ttcgcgacat cgacggtcat gacgcggcat ccatcaaacg cgcagtagaa gaagcgcgcg 8520
cagtgactga caaaccgtcc ctgctgatgt gcaaaaccat catcggtttc ggttccccga 8580
acaaagccgg tacccacgac tcccacggtg cgccgctggg cgacgctgaa attgccctga 8640
cccgcgaaca gctgggctgg aaatacgcgc cgttcgaaat cccgtctgaa atctatgctc 8700
agtgggatgc gaaagaagca ggccaggcga aagaatctgc atggaatgag aagtttgcgg 8760
cttacgcgaa agcttatccg caggaagcgg ctgaatttac ccgccgtatg aaaggcgaaa 8820
tgccgtctga cttcgacgcc aaagcgaaag agtttatcgc taaactgcag gctaatccgg 8880
cgaaaatcgc cagccgtaaa gcgtcgcaga atgctatcga agcgttcggc ccgctgttgc 8940
ctgaattcct cggcggctct gctgacctgg caccgtctaa cctgaccctg tggtctggtt 9000
ctaaagcaat caacgaagat gctgcaggta actacatcca ctacggtgtt cgcgagttcg 9060
gtatgaccgc gattgctaac ggtatctccc tgcacggtgg tttcctgccg tacacctcca 9120
ccttcctgat gttcgtggaa tacgcacgta acgccgtacg tatggctgcg ctgatgaaac 9180
agcgtcaggt gatggtttac acccacgact ccatcggtct gggcgaagat ggcccgactc 9240
accagccggt tgagcaggtc gcttctctgc gcgtgacccc gaacatgtct acatggcgtc 9300
cgtgtgacca ggttgaatcc gcggtcgcgt ggaaatacgg cgttgagcgt caggacggcc 9360
cgactgcgct tatcctctcc cgtcagaacc tggcgcagca ggaacgaact gaagagcaac 9420
tggcaaacat cgcgcgcggt ggttatgtgc tgaaagactg cgccggtcag ccggaactga 9480
ttttcatcgc taccggttca gaagttgaac tggctgttgc tgcctacgaa aaactgactg 9540
ccgaaggcgt gaaagcgcgc gtggtgtcca tgccgtctac cgacgcattt gacaagcagg 9600
atgctgctta ccgtgaatcc gtactgccga aagcggttac tgcacgcgtt gctgtagaag 9660
cgggtattgc tgactactgg tacaagtatg ttggcctgaa cggtgctatc gtcggtatga 9720
ccaccttcgg tgaatctgct ccggcagagc tgctgtttga agagttcggc ttcactgttg 9780
ataacgttgt tgcgaaagca aaagaactgc tgtaattagc atttcgggta aaaaggtcgc 9840
ttcggcgacc ttttttatta ccttgatatg tccgtttgcg gacaagcaat agataaagcg 9900
tgttgtagat cacaaatatt tatatgcaat aaatatcaat tatgtaatat gcatcacgat 9960
atgcgtattg acatttgttg ttataactat aactcaatgt tatataagaa attaa 10015
<210> 31
<211> 9065
<212> DNA
<213> Plasmid pCP54;
<400> 31
acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 60
tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 120
acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 180
atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 240
gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 300
aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 360
cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 420
atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 480
gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 540
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 600
gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 660
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 720
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 780
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 840
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 900
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 960
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 1020
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 1080
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 1140
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 1200
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 1260
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 1320
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 1380
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 1440
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 1500
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 1560
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 1620
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 1680
atatgagtaa acttggtctg agtggcggtt ttcatggctt gttatgactg tttttttggg 1740
gtacagtcta tgcctcgggc atccaagcag caagcgcgtt acgccgtggg tcgatgtttg 1800
atgttatgga gcagcaacga tgttacgcag cagggcagtc gccctaaaac aaagttaaac 1860
atcatgaggg aagcggtgat cgccgaagta tcgactcaac tatcagaggt agttggcgtc 1920
atcgagcgcc atctcgaacc gacgttgctg gccgtacatt tgtacggctc cgcagtggat 1980
ggcggcctga agccacacag tgatattgat ttgctggtta cggtgaccgt aaggcttgat 2040
gaaacaacgc ggcgagcttt gatcaacgac cttttggaaa cttcggcttc ccctggagag 2100
agcgagattc tccgcgctgt agaagtcacc attgttgtgc acgacgacat cattccgtgg 2160
cgttatccag ctaagcgcga actgcaattt ggagaatggc agcgcaatga cattcttgca 2220
ggtatcttcg agccagccac gatcgacatt gatctggcta tcttgctgac aaaagcaaga 2280
gaacatagcg ttgccttggt aggtccagcg gcggaggaac tctttgatcc ggttcctgaa 2340
caggatctat ttgaggcgct aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg 2400
gctggcgatg agcgaaatgt agtgcttacg ttgtcccgca tttggtacag cgcagtaacc 2460
ggcaaaatcg cgccgaagga tgtcgctgcc gactgggcaa tggagcgcct gccggcccag 2520
tatcagcccg tcatacttga agctagacag gcttatcttg gacaagaaga agatcgcttg 2580
gcctcgcgcg cagatcagtt ggaagaattt gtccactacg tgaaaggcga gatcaccaag 2640
gtagtcggca aataatgtct aacaattcgt tcaagccgac gccgcttcgc ggcgcggctt 2700
aactcaagcg ttagatgcac taagcacata attgctcaca gccaaactat cagaattctg 2760
aaccagtcct aaaacgagta aataggaccg gcaattcttc aagcaataaa caggaatacc 2820
aattattaaa agataactta gtcagatcgt acaataaagc tttgaagaaa aatgcgcctt 2880
attcaatctt tgctataaaa aatggcccaa aatctcacat tggaagacat ttgatgacct 2940
catttctttc aatgaagggc ctaacggagt tgactaatgt tgtgggaaat tggagcgata 3000
agcgtgcttc tgccgtggcc aggacaacgt atactcatca gataacagca atacctgatc 3060
actacttcgc actagtttct cggtactatg catatgatcc aatatcaaag gaaatgatag 3120
cattgaagga tgagactaat ccaattgagg agtggcagca tatagaacag ctaaagggta 3180
gtgctgaagg aagcatacga taccccgcat ggaatgggat aatatcacag gaggtactag 3240
actacctttc atcctacata aatagacgca tataagtacg catttaagca taaacacgca 3300
ctatgccgtt cttctcatgt atatatatat acaggcaaca cgcagatata ggtgcgacgt 3360
gaacagtgag ctgtatgtgc gcagctcgcg ttgcattttc ggaagcgctc gttttcggaa 3420
acgctttgaa gttcctattc cgaagttcct attctctaga aagtatagga acttcagagc 3480
gcttttgaaa accaaaagcg ctctgaagac gcactttcaa aaaaccaaaa acgcaccgga 3540
ctgtaacgag ctactaaaat attgcgaata ccgcttccac aaacattgct caaaagtatc 3600
tctttgctat atatctctgt gctatatccc tatataacct acccatccac ctttcgctcc 3660
ttgaacttgc atctaaactc gacctctaca ttttttatgt ttatctctag tattactctt 3720
tagacaaaaa aattgtagta agaactattc atagagtgaa tcgaaaacaa tacgaaaatg 3780
taaacatttc ctatacgtag tatatagaga caaaatagaa gaaaccgttc ataattttct 3840
gaccaatgaa gaatcatcaa cgctatcact ttctgttcac aaagtatgcg caatccacat 3900
cggtatagaa tataatcggg gatgccttta tcttgaaaaa atgcacccgc agcttcgcta 3960
gtaatcagta aacgcgggaa gtggagtcag gcttttttta tggaagagaa aatagacacc 4020
aaagtagcct tcttctaacc ttaacggacc tacagtgcaa aaagttatca agagactgca 4080
ttatagagcg cacaaaggag aaaaaaagta atctaagatg ctttgttaga aaaatagcgc 4140
tctcgggatg catttttgta gaacaaaaaa gaagtataga ttctttgttg gtaaaatagc 4200
gctctcgcgt tgcatttctg ttctgtaaaa atgcagctca gattctttgt ttgaaaaatt 4260
agcgctctcg cgttgcattt ttgttttaca aaaatgaagc acagattctt cgttggtaaa 4320
atagcgcttt cgcgttgcat ttctgttctg taaaaatgca gctcagattc tttgtttgaa 4380
aaattagcgc tctcgcgttg catttttgtt ctacaaaatg aagcacagat gcttcgttaa 4440
caaagatatg ctattgaagt gcaagatgga aacgcagaaa atgaaccggg gatgcgacgt 4500
gcaagattac ctatgcaata gatgcaatag tttctccagg aaccgaaata catacattgt 4560
cttccgtaaa gcgctagact atatattatt atacaggttc aaatatacta tctgtttcag 4620
ggaaaactcc caggttcgga tgttcaaaat tcaatgatgg gtaacaagta cgatcgtaaa 4680
tctgtaaaac agtttgtcgg atattaggct gtatctcctc aaagcgtatt cgaatatcat 4740
tgagaagctg cagcgtcaca tcggataata atgatggcag ccattgtaga agtgcctttt 4800
gcatttctag tctctttctc ggtctagcta gttttactac atcgcgaaga tagaatctta 4860
gatcacactg cctttgctga gctggatcaa tagagtaaca aaagagtggt aaggcctcgt 4920
taaaggacaa ggacctgagc ggaagtgtat cgtacagtag acggagtata ctagtatagt 4980
ctatagtccg tggaattctc atgtttgaca gcttatcatc gataagcttt tcaattcaat 5040
tcatcatttt ttttttattc ttttttttga tttcggtttc tttgaaattt ttttgattcg 5100
gtaatctccg aacagaagga agaacgaagg aaggagcaca gacttagatt ggtatatata 5160
cgcatatgta gtgttgaaga aacatgaaat tgcccagtat tcttaaccca actgcacaga 5220
acaaaaacct gcaggaaacg aagataaatc atgtcgaaag ctacatataa ggaacgtgct 5280
gctactcatc ctagtcctgt tgctgccaag ctatttaata tcatgcacga aaagcaaaca 5340
aacttgtgtg cttcattgga tgttcgtacc accaaggaat tactggagtt agttgaagca 5400
ttaggtccca aaatttgttt actaaaaaca catgtggata tcttgactga tttttccatg 5460
gagggcacag ttaagccgct aaaggcatta tccgccaagt acaatttttt actcttcgaa 5520
gacagaaaat ttgctgacat tggtaataca gtcaaattgc agtactctgc gggtgtatac 5580
agaatagcag aatgggcaga cattacgaat gcacacggtg tggtgggccc aggtattgtt 5640
agcggtttga agcaggcggc agaagaagta acaaaggaac ctagaggcct tttgatgtta 5700
gcagaattgt catgcaaggg ctccctatct actggagaat atactaaggg tactgttgac 5760
attgcgaaga gcgacaaaga ttttgttatc ggctttattg ctcaaagaga catgggtgga 5820
agagatgaag gttacgattg gttgattatg acacccggtg tgggtttaga tgacaaggga 5880
gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg tctctacagg atctgacatt 5940
attattgttg gaagaggact atttgcaaag ggaagggatg ctaaggtaga gggtgaacgt 6000
tacagaaaag caggctggga agcatatttg agaagatgcg gccagcaaaa ctaaaaaact 6060
gtattataag taaatgcatg tatactaaac tcacaaatta gagcttcaat ttaattatat 6120
cagttattac ccgggaatct cggtcgtaat gacttgaaat aattaacaaa caaaggagtt 6180
acagttagaa attgtaggag agatctcgtt tttcgcgaca atctggcgtt tttcttgcta 6240
attccaggat taatccgttc atagtgtaaa accccgttta cacattctga cggaagatat 6300
agattggaag tattgcattc actaagataa gtatggcaac actggaacag acatgaatta 6360
tcagaacgac gatttacgca tcaaagaaat caaagagtta cttcctcctg tcgcattgct 6420
ggaaaaattc cccgctactg aaaatgccgc gaatacggtt gcccatgccc gaaaagcgat 6480
ccataagatc ctgaaaggta atgatgatcg cctgttggtt gtgattggcc catgctcaat 6540
tcatgatcct gtcgcggcaa aagagtatgc cactcgcttg ctggcgctgc gtgaagagct 6600
gaaagatgag ctggaaatcg taatgcgcgt ctattttgaa aagccgcgta ccacggtggg 6660
ctggaaaggg ctgattaacg atccgcatat ggataatagc ttccagatca acgacggtct 6720
gcgtatagcc cgtaaattgc tgcttgatat taacgacagc ggtctgccag cggcaggtga 6780
gtttctcgat atgatcaccc cacaatatct cgctgacctg atgagctggg gcgcaattgg 6840
cgcacgtacc accgaatcgc aggtgcaccg cgaactggca tcagggcttt cttgtccggt 6900
cggcttcaaa aatggcaccg acggtacgat taaagtggct atcgatgcca ttaatgccgc 6960
cggtgcgccg cactgcttcc tgtccgtaac gaaatggggg cattcggcga ttgtgaatac 7020
cagcggtaac ggcgattgcc atatcattct gcgcggcggt aaagagccta actacagcgc 7080
gaagcacgtt gctgaagtga aagaagggct gaacaaagca ggcctgccag cacaggtgat 7140
gatcgatttc agccatgcta actcgtccaa acaattcaaa aagcagatgg atgtttgtgc 7200
tgacgtttgc cagcagattg ccggtggcga aaaggccatt attggcgtga tggtggaaag 7260
ccatctggtg gaaggcaatc agagcctcga gagcggggag ccgctggcct acggtaagag 7320
catcaccgat gcctgcatcg gctgggaaga taccgatgct ctgttacgtc aactggcgaa 7380
tgcagtaaaa gcgcgtcgcg ggtaaggttt aattgtcgga tgcgccgtca gagtggcgta 7440
tccgatgaat caccacaggc ctgataagtc gcgcagcgtc gcatcaggca atgtgctcca 7500
ttgttagcaa caaaaaagcc gactcacttg cagtcggctt tctcatttta aacgaatgac 7560
gtttacttcg ctttaccctg gtttgcaacc gccgctgctt tcgctctcga ggctattgac 7620
gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 7680
cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 7740
aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 7800
cctgttctag aggaggagga atcgccatgg agaggattgt cgttactctc ggggaacgta 7860
gttacccaat taccatcgca tctggtttgt ttaatgaacc agcttcattc ttaccgctga 7920
aatcgggcga gcaggtcatg ttggtcacca acgaaaccct ggctcctctg tatctcgata 7980
aggtccgcgg cgtacttgaa caggcgggtg ttaacgtcga tagcgttatc ctccctgacg 8040
gcgagcagta taaaagcctg gctgtactcg ataccgtctt tacggcgttg ttacaaaagc 8100
cgcatggtcg cgatactacg ctggtggcgc ttggcggcgg cgtagtgggc gatctgaccg 8160
gcttcgcggc ggcgagttat cagcgcggtg ttcgtttcat tcaagtcccg acgacgttac 8220
tgtcgcaggt cgattcctcc gttggcggca aaactgcggt caaccatccc ctcggtaaaa 8280
acatgattgg cgcgttctac cagcctgctt cagtggtggt ggatctcgac tgtctgaaaa 8340
cgcttccccc gcgtgagtta gcgtcggggc tggcagaagt catcaaatac ggcattattc 8400
ttgacggtgc gtttttcaac tggctggaag agaatctgga tgcgttgttg cgtctggacg 8460
gtccggcaat ggcgtactgt attcgccgtt gttgtgaact gaaggcagaa gttgtcgccg 8520
ccgacgagcg cgaaaccggg ttacgtgctt tactgaatct gggacacacc tttggtcatg 8580
ccattgaagc tgaaatgggg tatggcaatt ggttacatgg tgaagcggtc gctgcgggta 8640
tggtgatggc ggcgcggacg tcggaacgtc tcgggcagtt tagttctgcc gaaacgcagc 8700
gtattataac cctgctcacg cgggctgggt taccggtcaa tgggccgcgc gaaatgtccg 8760
cgcaggcgta tttaccgcat atgctgcgtg acaagaaagt ccttgcggga gagatgcgct 8820
taattcttcc gttggcaatt ggtaagagtg aagttcgcag cggcgtttcg cacgagcttg 8880
ttcttaacgc cattgccgat tgtcaatcag cgtaatcatc gttcatgcct gatgccgcta 8940
tgtaggccgg ataaggcgtt cacgccgcat ccggcaaccg atgcctgatg cgacgcggtc 9000
gcgtcttatc aggcctacag gtcgatgccg atatgtacat cgtattcggc aattaataca 9060
tagca 9065
<210> 32
<211> 11475
<212> DNA
<213> Plasmid pCP55;
<400> 32
acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 60
tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 120
acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 180
atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 240
gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 300
aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 360
cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 420
atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 480
gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 540
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 600
gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 660
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 720
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 780
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 840
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 900
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 960
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 1020
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 1080
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 1140
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 1200
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 1260
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 1320
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 1380
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 1440
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 1500
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 1560
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 1620
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 1680
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 1740
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 1800
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 1860
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 1920
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 1980
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg 2040
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 2100
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 2160
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 2220
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 2280
atagtgtatg cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc 2340
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 2400
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 2460
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 2520
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 2580
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 2640
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 2700
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 2760
tcgtcttcaa gaattctgaa ccagtcctaa aacgagtaaa taggaccggc aattcttcaa 2820
gcaataaaca ggaataccaa ttattaaaag ataacttagt cagatcgtac aataaagctt 2880
tgaagaaaaa tgcgccttat tcaatctttg ctataaaaaa tggcccaaaa tctcacattg 2940
gaagacattt gatgacctca tttctttcaa tgaagggcct aacggagttg actaatgttg 3000
tgggaaattg gagcgataag cgtgcttctg ccgtggccag gacaacgtat actcatcaga 3060
taacagcaat acctgatcac tacttcgcac tagtttctcg gtactatgca tatgatccaa 3120
tatcaaagga aatgatagca ttgaaggatg agactaatcc aattgaggag tggcagcata 3180
tagaacagct aaagggtagt gctgaaggaa gcatacgata ccccgcatgg aatgggataa 3240
tatcacagga ggtactagac tacctttcat cctacataaa tagacgcata taagtacgca 3300
tttaagcata aacacgcact atgccgttct tctcatgtat atatatatac aggcaacacg 3360
cagatatagg tgcgacgtga acagtgagct gtatgtgcgc agctcgcgtt gcattttcgg 3420
aagcgctcgt tttcggaaac gctttgaagt tcctattccg aagttcctat tctctagaaa 3480
gtataggaac ttcagagcgc ttttgaaaac caaaagcgct ctgaagacgc actttcaaaa 3540
aaccaaaaac gcaccggact gtaacgagct actaaaatat tgcgaatacc gcttccacaa 3600
acattgctca aaagtatctc tttgctatat atctctgtgc tatatcccta tataacctac 3660
ccatccacct ttcgctcctt gaacttgcat ctaaactcga cctctacatt ttttatgttt 3720
atctctagta ttactcttta gacaaaaaaa ttgtagtaag aactattcat agagtgaatc 3780
gaaaacaata cgaaaatgta aacatttcct atacgtagta tatagagaca aaatagaaga 3840
aaccgttcat aattttctga ccaatgaaga atcatcaacg ctatcacttt ctgttcacaa 3900
agtatgcgca atccacatcg gtatagaata taatcgggga tgcctttatc ttgaaaaaat 3960
gcacccgcag cttcgctagt aatcagtaaa cgcgggaagt ggagtcaggc tttttttatg 4020
gaagagaaaa tagacaccaa agtagccttc ttctaacctt aacggaccta cagtgcaaaa 4080
agttatcaag agactgcatt atagagcgca caaaggagaa aaaaagtaat ctaagatgct 4140
ttgttagaaa aatagcgctc tcgggatgca tttttgtaga acaaaaaaga agtatagatt 4200
ctttgttggt aaaatagcgc tctcgcgttg catttctgtt ctgtaaaaat gcagctcaga 4260
ttctttgttt gaaaaattag cgctctcgcg ttgcattttt gttttacaaa aatgaagcac 4320
agattcttcg ttggtaaaat agcgctttcg cgttgcattt ctgttctgta aaaatgcagc 4380
tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgttct acaaaatgaa 4440
gcacagatgc ttcgttaaca aagatatgct attgaagtgc aagatggaaa cgcagaaaat 4500
gaaccgggga tgcgacgtgc aagattacct atgcaataga tgcaatagtt tctccaggaa 4560
ccgaaataca tacattgtct tccgtaaagc gctagactat atattattat acaggttcaa 4620
atatactatc tgtttcaggg aaaactccca ggttcggatg ttcaaaattc aatgatgggt 4680
aacaagtacg atcgtaaatc tgtaaaacag tttgtcggat attaggctgt atctcctcaa 4740
agcgtattcg aatatcattg agaagctgca gcgtcacatc ggataataat gatggcagcc 4800
attgtagaag tgccttttgc atttctagtc tctttctcgg tctagctagt tttactacat 4860
cgcgaagata gaatcttaga tcacactgcc tttgctgagc tggatcaata gagtaacaaa 4920
agagtggtaa ggcctcgtta aaggacaagg acctgagcgg aagtgtatcg tacagtagac 4980
ggagtatact agtatagtct atagtccgtg gaattctcat gtttgacagc ttatcatcga 5040
taagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt 5100
tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga 5160
cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc 5220
ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct 5280
acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc 5340
atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta 5400
ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc 5460
ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac 5520
aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag 5580
tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg 5640
gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct 5700
agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat 5760
actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct 5820
caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg 5880
ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc 5940
tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct 6000
aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc 6060
cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga 6120
gcttcaattt aattatatca gttattaccc gggaatctcg gtcgtaatga aaggaaaagc 6180
gcaacggacg ggcgagtaga ttgcgcaaca tgcgagcatg atccagagat ttctgaagca 6240
gcaaaaggat gttccatgta catgacgcgc ggcttgcggt aaattgttgg caaattttcc 6300
ggcgtagccc aaaacgcgct gtcgtcaagt cgttaagggc gtgcccttca tcatccgatc 6360
tggagtcaaa atgtcctcac gtaaagagct tgccaatgct attcgtgcgc tgagcatgga 6420
cgcagtacag aaagccaaat ccggtcaccc gggtgcccct atgggtatgg ctgacattgc 6480
cgaagtcctg tggcgtgatt tcctgaaaca caacccgcag aatccgtcct gggctgaccg 6540
tgaccgcttc gtgctgtcca acggccacgg ctccatgctg atctacagcc tgctgcacct 6600
caccggttac gatctgccga tggaagaact gaaaaacttc cgtcagctgc actctaaaac 6660
tccgggccac ccggaagtag gttataccgc tggtgtggaa accaccaccg gtccgctggg 6720
tcagggtatt gccaacgcag tcggtatggc gattgcagaa aaaacgctgg cggcgcagtt 6780
taaccgtcca ggtcacgaca ttgtcgacca ctacacctac gccttcatgg gcgacggctg 6840
catgatggaa ggcatctccc acgaagtttg ctctctggcg ggtacgctga agctgggtaa 6900
actgattgcg ttctacgatg acaacggtat ctcaatcgat ggtcacgttg aaggctggtt 6960
cactgacgac accgcaatgc gtttcgaagc ttacggctgg cacgttattc gcgacatcga 7020
cggtcatgac gcggcatcca tcaaacgcgc agtagaagaa gcgcgcgcag tgactgacaa 7080
accgtccctg ctgatgtgca aaaccatcat cggtttcggt tccccgaaca aagccggtac 7140
ccacgactcc cacggtgcgc cgctgggcga cgctgaaatt gccctgaccc gcgaacagct 7200
gggctggaaa tacgcgccgt tcgaaatccc gtctgaaatc tatgctcagt gggatgcgaa 7260
agaagcaggc caggcgaaag aatctgcatg gaatgagaag tttgcggctt acgcgaaagc 7320
ttatccgcag gaagcggctg aatttacccg ccgtatgaaa ggcgaaatgc cgtctgactt 7380
cgacgccaaa gcgaaagagt ttatcgctaa actgcaggct aatccggcga aaatcgccag 7440
ccgtaaagcg tcgcagaatg ctatcgaagc gttcggcccg ctgttgcctg aattcctcgg 7500
cggctctgct gacctggcac cgtctaacct gaccctgtgg tctggttcta aagcaatcaa 7560
cgaagatgct gcaggtaact acatccacta cggtgttcgc gagttcggta tgaccgcgat 7620
tgctaacggt atctccctgc acggtggttt cctgccgtac acctccacct tcctgatgtt 7680
cgtggaatac gcacgtaacg ccgtacgtat ggctgcgctg atgaaacagc gtcaggtgat 7740
ggtttacacc cacgactcca tcggtctggg cgaagatggc ccgactcacc agccggttga 7800
gcaggtcgct tctctgcgcg tgaccccgaa catgtctaca tggcgtccgt gtgaccaggt 7860
tgaatccgcg gtcgcgtgga aatacggcgt tgagcgtcag gacggcccga ctgcgcttat 7920
cctctcccgt cagaacctgg cgcagcagga acgaactgaa gagcaactgg caaacatcgc 7980
gcgcggtggt tatgtgctga aagactgcgc cggtcagccg gaactgattt tcatcgctac 8040
cggttcagaa gttgaactgg ctgttgctgc ctacgaaaaa ctgactgccg aaggcgtgaa 8100
agcgcgcgtg gtgtccatgc cgtctaccga cgcatttgac aagcaggatg ctgcttaccg 8160
tgaatccgta ctgccgaaag cggttactgc acgcgttgct gtagaagcgg gtattgctga 8220
ctactggtac aagtatgttg gcctgaacgg tgctatcgtc ggtatgacca ccttcggtga 8280
atctgctccg gcagagctgc tgtttgaaga gttcggcttc actgttgata acgttgttgc 8340
gaaagcaaaa gaactgctgt aattagcatt tcgggtaaaa aggtcgcttc ggcgaccttt 8400
tttattacct tgatatgtcc gtttgcggac aagcaataga taaagcgtgt tgtagatcac 8460
aaatatttat atgcaataaa tatcaattat gtaatatgca tcacgatatg cgtattgaca 8520
tttgttgtta taactataac tcaatgttat ataagaaatt aacttgaaat aattaacaaa 8580
caaaggagtt acagttagaa attgtaggag agatctcgtt tttcgcgaca atctggcgtt 8640
tttcttgcta attccaggat taatccgttc atagtgtaaa accccgttta cacattctga 8700
cggaagatat agattggaag tattgcattc actaagataa gtatggcaac actggaacag 8760
acatgaatta tcagaacgac gatttacgca tcaaagaaat caaagagtta cttcctcctg 8820
tcgcattgct ggaaaaattc cccgctactg aaaatgccgc gaatacggtt gcccatgccc 8880
gaaaagcgat ccataagatc ctgaaaggta atgatgatcg cctgttggtt gtgattggcc 8940
catgctcaat tcatgatcct gtcgcggcaa aagagtatgc cactcgcttg ctggcgctgc 9000
gtgaagagct gaaagatgag ctggaaatcg taatgcgcgt ctattttgaa aagccgcgta 9060
ccacggtggg ctggaaaggg ctgattaacg atccgcatat ggataatagc ttccagatca 9120
acgacggtct gcgtatagcc cgtaaattgc tgcttgatat taacgacagc ggtctgccag 9180
cggcaggtga gtttctcgat atgatcaccc cacaatatct cgctgacctg atgagctggg 9240
gcgcaattgg cgcacgtacc accgaatcgc aggtgcaccg cgaactggca tcagggcttt 9300
cttgtccggt cggcttcaaa aatggcaccg acggtacgat taaagtggct atcgatgcca 9360
ttaatgccgc cggtgcgccg cactgcttcc tgtccgtaac gaaatggggg cattcggcga 9420
ttgtgaatac cagcggtaac ggcgattgcc atatcattct gcgcggcggt aaagagccta 9480
actacagcgc gaagcacgtt gctgaagtga aagaagggct gaacaaagca ggcctgccag 9540
cacaggtgat gatcgatttc agccatgcta actcgtccaa acaattcaaa aagcagatgg 9600
atgtttgtgc tgacgtttgc cagcagattg ccggtggcga aaaggccatt attggcgtga 9660
tggtggaaag ccatctggtg gaaggcaatc agagcctcga gagcggggag ccgctggcct 9720
acggtaagag catcaccgat gcctgcatcg gctgggaaga taccgatgct ctgttacgtc 9780
aactggcgaa tgcagtaaaa gcgcgtcgcg ggtaaggttt aattgtcgga tgcgccgtca 9840
gagtggcgta tccgatgaat caccacaggc ctgataagtc gcgcagcgtc gcatcaggca 9900
atgtgctcca ttgttagcaa caaaaaagcc gactcacttg cagtcggctt tctcatttta 9960
aacgaatgac gtttacttcg ctttaccctg gtttgcaacc gccgctgctt tcgctctcga 10020
ggctattgac gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca 10080
atatttctcc cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa 10140
attttacaaa aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg 10200
ggcaaccccg cctgttctag aggaggagga atcgccatgg agaggattgt cgttactctc 10260
ggggaacgta gttacccaat taccatcgca tctggtttgt ttaatgaacc agcttcattc 10320
ttaccgctga aatcgggcga gcaggtcatg ttggtcacca acgaaaccct ggctcctctg 10380
tatctcgata aggtccgcgg cgtacttgaa caggcgggtg ttaacgtcga tagcgttatc 10440
ctccctgacg gcgagcagta taaaagcctg gctgtactcg ataccgtctt tacggcgttg 10500
ttacaaaagc cgcatggtcg cgatactacg ctggtggcgc ttggcggcgg cgtagtgggc 10560
gatctgaccg gcttcgcggc ggcgagttat cagcgcggtg ttcgtttcat tcaagtcccg 10620
acgacgttac tgtcgcaggt cgattcctcc gttggcggca aaactgcggt caaccatccc 10680
ctcggtaaaa acatgattgg cgcgttctac cagcctgctt cagtggtggt ggatctcgac 10740
tgtctgaaaa cgcttccccc gcgtgagtta gcgtcggggc tggcagaagt catcaaatac 10800
ggcattattc ttgacggtgc gtttttcaac tggctggaag agaatctgga tgcgttgttg 10860
cgtctggacg gtccggcaat ggcgtactgt attcgccgtt gttgtgaact gaaggcagaa 10920
gttgtcgccg ccgacgagcg cgaaaccggg ttacgtgctt tactgaatct gggacacacc 10980
tttggtcatg ccattgaagc tgaaatgggg tatggcaatt ggttacatgg tgaagcggtc 11040
gctgcgggta tggtgatggc ggcgcggacg tcggaacgtc tcgggcagtt tagttctgcc 11100
gaaacgcagc gtattataac cctgctcacg cgggctgggt taccggtcaa tgggccgcgc 11160
gaaatgtccg cgcaggcgta tttaccgcat atgctgcgtg acaagaaagt ccttgcggga 11220
gagatgcgct taattcttcc gttggcaatt ggtaagagtg aagttcgcag cggcgtttcg 11280
cacgagcttg ttcttaacgc cattgccgat tgtcaatcag cgtaatcatc gttcatgcct 11340
gatgccgcta tgtaggccgg ataaggcgtt cacgccgcat ccggcaaccg atgcctgatg 11400
cgacgcggtc gcgtcttatc aggcctacag gtcgatgccg atatgtacat cgtattcggc 11460
aattaataca tagca 11475
<210> 33
<211> 7769
<212> DNA
<213> Plasmid pYEP24;
<400> 33
gaattctgaa ccagtcctaa aacgagtaaa taggaccggc aattcttcaa gcaataaaca 60
ggaataccaa ttattaaaag ataacttagt cagatcgtac aataaagctt tgaagaaaaa 120
tgcgccttat tcaatctttg ctataaaaaa tggcccaaaa tctcacattg gaagacattt 180
gatgacctca tttctttcaa tgaagggcct aacggagttg actaatgttg tgggaaattg 240
gagcgataag cgtgcttctg ccgtggccag gacaacgtat actcatcaga taacagcaat 300
acctgatcac tacttcgcac tagtttctcg gtactatgca tatgatccaa tatcaaagga 360
aatgatagca ttgaaggatg agactaatcc aattgaggag tggcagcata tagaacagct 420
aaagggtagt gctgaaggaa gcatacgata ccccgcatgg aatgggataa tatcacagga 480
ggtactagac tacctttcat cctacataaa tagacgcata taagtacgca tttaagcata 540
aacacgcact atgccgttct tctcatgtat atatatatac aggcaacacg cagatatagg 600
tgcgacgtga acagtgagct gtatgtgcgc agctcgcgtt gcattttcgg aagcgctcgt 660
tttcggaaac gctttgaagt tcctattccg aagttcctat tctctagaaa gtataggaac 720
ttcagagcgc ttttgaaaac caaaagcgct ctgaagacgc actttcaaaa aaccaaaaac 780
gcaccggact gtaacgagct actaaaatat tgcgaatacc gcttccacaa acattgctca 840
aaagtatctc tttgctatat atctctgtgc tatatcccta tataacctac ccatccacct 900
ttcgctcctt gaacttgcat ctaaactcga cctctacatt ttttatgttt atctctagta 960
ttactcttta gacaaaaaaa ttgtagtaag aactattcat agagtgaatc gaaaacaata 1020
cgaaaatgta aacatttcct atacgtagta tatagagaca aaatagaaga aaccgttcat 1080
aattttctga ccaatgaaga atcatcaacg ctatcacttt ctgttcacaa agtatgcgca 1140
atccacatcg gtatagaata taatcgggga tgcctttatc ttgaaaaaat gcacccgcag 1200
cttcgctagt aatcagtaaa cgcgggaagt ggagtcaggc tttttttatg gaagagaaaa 1260
tagacaccaa agtagccttc ttctaacctt aacggaccta cagtgcaaaa agttatcaag 1320
agactgcatt atagagcgca caaaggagaa aaaaagtaat ctaagatgct ttgttagaaa 1380
aatagcgctc tcgggatgca tttttgtaga acaaaaaaga agtatagatt ctttgttggt 1440
aaaatagcgc tctcgcgttg catttctgtt ctgtaaaaat gcagctcaga ttctttgttt 1500
gaaaaattag cgctctcgcg ttgcattttt gttttacaaa aatgaagcac agattcttcg 1560
ttggtaaaat agcgctttcg cgttgcattt ctgttctgta aaaatgcagc tcagattctt 1620
tgtttgaaaa attagcgctc tcgcgttgca tttttgttct acaaaatgaa gcacagatgc 1680
ttcgttaaca aagatatgct attgaagtgc aagatggaaa cgcagaaaat gaaccgggga 1740
tgcgacgtgc aagattacct atgcaataga tgcaatagtt tctccaggaa ccgaaataca 1800
tacattgtct tccgtaaagc gctagactat atattattat acaggttcaa atatactatc 1860
tgtttcaggg aaaactccca ggttcggatg ttcaaaattc aatgatgggt aacaagtacg 1920
atcgtaaatc tgtaaaacag tttgtcggat attaggctgt atctcctcaa agcgtattcg 1980
aatatcattg agaagctgca gcgtcacatc ggataataat gatggcagcc attgtagaag 2040
tgccttttgc atttctagtc tctttctcgg tctagctagt tttactacat cgcgaagata 2100
gaatcttaga tcacactgcc tttgctgagc tggatcaata gagtaacaaa agagtggtaa 2160
ggcctcgtta aaggacaagg acctgagcgg aagtgtatcg tacagtagac ggagtatact 2220
agtatagtct atagtccgtg gaattctcat gtttgacagc ttatcatcga taagcttttc 2280
aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt tgaaattttt 2340
ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga cttagattgg 2400
tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc ttaacccaac 2460
tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct acatataagg 2520
aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc atgcacgaaa 2580
agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta ctggagttag 2640
ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc ttgactgatt 2700
tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac 2760
tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg 2820
gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag 2880
gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct agaggccttt 2940
tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat actaagggta 3000
ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca 3060
tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg 3120
acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat 3180
ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg 3240
gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact 3300
aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt 3360
aattatatca gttattaccc gggaatctcg gtcgtaatga tttttataat gacgaaaaaa 3420
aaaaaattgg aaagaaaaag ctttaatgcg gtagtttatc acagttaaat tgctaacgca 3480
gtcaggcacc gtgtatgaaa tctaacaatg cgctcatcgt catcctcggc accgtcaccc 3540
tggatgctgt aggcataggc ttggttatgc cggtactgcc gggcctcttg cgggatatcg 3600
tccattccga cagcatcgcc agtcactatg gcgtgctgct agcgctatat gcgttgatgc 3660
aatttctatg cgcacccgtt ctcggagcac tgtccgaccg ctttggccgc cgcccagtcc 3720
tgctcgcttc gctacttgga gccactatcg actacgcgat catggcgacc acacccgtcc 3780
tgtggatcct ctacgccgga cgcatcgtgg ccggcatcac cggcgccaca ggtgcggttg 3840
ctggcgccta tatcgccgac atcaccgatg gggaagatcg ggctcgccac ttcgggctca 3900
tgagcgcttg tttcggcgtg ggtatggtgg caggccccgt ggccggggga ctgttgggcg 3960
ccatctcctt gcatgcacca ttccttgcgg cggcggtgct caacggcctc aacctactac 4020
tgggctgctt cctaatgcag gagtcgcata agggagagcg tcgaccgatg cccttgagag 4080
ccttcaaccc agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta 4140
tgactgtctt ctttatcatg caactcgtag gacaggtgcc ggcagcgctc tgggtcattt 4200
tcggcgagga ccgctttcgc tggagcgcga cgatgatcgg cctgtcgctt gcggtattcg 4260
gaatcttgca cgccctcgct caagccttcg tcactggtcc cgccaccaaa cgtttcggcg 4320
agaagcaggc cattatcgcc ggcatggcgg ccgacgcgct gggctacgtc ttgctggcgt 4380
tcgcgacgcg aggctggatg gccttcccca ttatgattct tctcgcttcc ggcggcatcg 4440
ggatgcccgc gttgcaggcc atgctgtcca ggcaggtaga tgacgaccat cagggacagc 4500
ttcaaggatc gctcgcggct cttaccagcc taacttcgat cactggaccg ctgatcgtca 4560
cggcgattta tgccgcctcg gcgagcacat ggaacgggtt ggcatggatt gtaggcgccg 4620
ccctatacct tgtctgcctc cccgcgttgc gtcgcggtgc atggagccgg gccacctcga 4680
cctgaatgga agccggcggc acctcgctaa cggattcacc actccaagaa ttggagccaa 4740
tcaattcttg cggagaactg tgaatgcgca aaccaaccct tggcagaaca tatccatcgc 4800
gtccgccatc tccagcagcc gcacgcggcg catctcgggc agcgttgggt cctggccacg 4860
ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta ggctggcggg gttgccttac 4920
tggttagcag aatgaatcac cgatacgcga gcgaacgtga agcgactgct gctgcaaaac 4980
gtctgcgacc tgagcaacaa catgaatggt cttcggtttc cgtgtttcgt aaagtctgga 5040
aacgcggaag tcagcgccct gcaccattat gttccggatc tgcatcgcag gatgctgctg 5100
gctaccctgt ggaacaccta catctgtatt aacgaagcgc tggcattgac cctgagtgat 5160
ttttctctgg tcccgccgca tccataccgc cagttgttta ccctcacaac gttccagtaa 5220
ccgggcatgt tcatcatcag taacccgtat cgtgagcatc ctctctcgtt tcatcggtat 5280
cattaccccc atgaacagaa attccccctt acacggaggc atcaagtgac caaacaggaa 5340
aaaaccgccc ttaacatggc ccgctttatc agaagccaga cattaacgct tctggagaaa 5400
ctcaacgagc tggacgcgga tgaacaggca gacatctgtg aatcgcttca cgaccacgct 5460
gatgagcttt accgcagctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac 5520
atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc 5580
cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt 5640
agcgatagcg gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag 5700
tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc 5760
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 5820
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 5880
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 5940
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 6000
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 6060
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 6120
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 6180
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 6240
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 6300
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 6360
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 6420
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 6480
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 6540
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 6600
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 6660
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 6720
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 6780
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 6840
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 6900
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 6960
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg 7020
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 7080
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 7140
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 7200
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 7260
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 7320
cacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 7380
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 7440
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 7500
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 7560
tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 7620
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 7680
gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata 7740
ggcgtatcac gaggcccttt cgtcttcaa 7769
<210> 34
<211> 2000
<212> DNA
<213> Sequence of the deleted aroE region;
<400> 34
actacgtccg tcctctgaaa tcttcagcgg atggacatat cgtcaaagtt ctggaggggc 60
aggtttgccc tgcatgtggc gcaaatctgg tattacgcca gggacgcttt ggtatgttta 120
ttggttgcat taactaccct gaatgcgaac ataccgaact tatcgataaa ccggacgaaa 180
cagcaattac atgcccccaa tgtcggacgg gccatctggt ccagcgccgc tcccgttatg 240
gcaaaacatt tcactcttgt gatcgctacc cggagtgtca atttgccatt aacttcaaac 300
ccatagctgg agaatgccct gagtgtcatt atccgctact catcgaaaag aaaaccgcgc 360
agggtgtaaa acacttttgt gccagtaaac aatgtggaaa gccggtttcg gcggaataat 420
aacgtgaata ataacctgca aagagacgct atcgcagctg cgatagatgt tctcaatgaa 480
gaacgtgtca tcgcctatcc aacggaagcc gttttcggtg ttgggtgcga tcctgatagc 540
gaaacagcag tgatgcgact gttggagtta aaacagcgtc cggttgataa ggggctgatt 600
ttaatcgcag caaattacga gcagcttaaa ccctatattg atgacaccat gttgactgac 660
gtgcagcgtg aaaccatttt ttcccgctgg ccaggtcctg tcacctttgt ctttcccgcg 720
cctgcgacaa caccgcgctg gttgacgggc cgctttgatt cgcttgctgt acgagtcacc 780
gaccatccgt tggtggttgc tttgtgccag gcttatggta aaccgctggt ttctaccagt 840
gccaacttga gtggattgcc accttgtcga acagtagacg aagttcgcgc acaatttggc 900
gcggcgttcc cggttgtgcc tggtgaaacg ggggggcgtt taaatccttc agaaatccgc 960
gatgccctga cgggtgaact gtttcgacag gggtaacata atcaggccat ccagtttccg 1020
gacagggaag agtgggacga gaataaaaaa tgtgtatgtt ttcccgctct cgtgaatggt 1080
atgcaactga catgcgcgat ctctggcgag agtctggcgt atcgctttac tggagatacg 1140
ccagaacagt ggttagcgag ttttcgtcag catcgctggg acctggaaga agaagcggaa 1200
aacttaattc aggaacaaag tgaagatgat caaggctggg tctggttacc ctgatccaga 1260
tattcgtcct tccatttcac gtaattattc gcggaatagc gtaacccagc cttctcttca 1320
tcacttaacg ggcggatctg tttgacgggg ctaccgagat acagatatcc gctctccagc 1380
cgtttatttt gtgggaccag actacccgca ccaatcatca catcatcttc tactattgcg 1440
ccatcaagta aaattgagcc catcccaacc aaaactcgat tgccaatggt gcagccgtgg 1500
agcatcacct tgtgaccaac agtgacatct tcgccaatgg ttaatgggtt gccatctggg 1560
ttgtacgagg atttatgagt gacatgcaac atactgccat cctggatatt ggtgcgtgct 1620
ccgatctgta cataatgtac atctccacga atcacaacga gcggccagat ccccacatca 1680
tcagccagac gaacgtcacc aatcacgaca ctgctatcgt cgatcattac gcgctgaccg 1740
atttgtggaa aaagatcgcg gtatgggcgt aaaacatcag acatacttac ctcagcaata 1800
aatgatttac taatgacttt gggggcatta ttggccttgt gcaagtcttt tagtatgcaa 1860
aaaagcaccg ttttgtgtgc gattgcagca aaaagggtga aaaaacaaca aacagaaaaa 1920
aagatcaaaa aaatacttgt gcaaaaaatt gggatcccta taatgcgcct ccgttgagac 1980
gacaacgtga aacacttcac 2000
<210> 35
<211> 2460
<212> DNA
<213> Sequence of the P15aroB cassette integrated at deleted ack locus;
<400> 35
gatcggcggc ataaaacgga tcgcataacg cgtcatcttg ataacgcgat tttcgacaaa 60
gaccggggca aggcgttttt ccagcggcca cgtctttgag taatgctgtc cccggcgaaa 120
caagctaaaa aaattaacag aacgattatc cggcgttgac atgcttcacc tcaacttcac 180
atataaagat tcaaaaattt gtgcaaattc acaactcagc gggacaacgt tcaaaacatt 240
ttgtcttcca tacccactat caggtatcct ttagcagcct gaaggcctaa gtagtacata 300
ttcattgagt cgtcaaattc atatacatta tgccattggc tgaaaattac gcaaaatggc 360
atagactcaa gatatttctt ccatcatgca aaaaaaaatt tgcagtgcat gatgttaatc 420
ataaatgtcg gtgtcatcat gcgctacgct ctatggctcc ctgacgtttt tttagccacg 480
tatcaattat aggtacttcc ctcgaggcta ttgacgacag ctatggttca ctgtccacca 540
accaaaactg tgctcagtac cgccaatatt tctcccttga ggggtacaaa gaggtgtccc 600
tagaagagat ccacgctgtg taaaaatttt acaaaaaggt attgactttc cctacagggt 660
gtgtaataat ttaattacag gcgggggcaa ccccgcctgt tctagaggag gaggaatcgc 720
catggagagg attgtcgtta ctctcgggga acgtagttac ccaattacca tcgcatctgg 780
tttgtttaat gaaccagctt cattcttacc gctgaaatcg ggcgagcagg tcatgttggt 840
caccaacgaa accctggctc ctctgtatct cgataaggtc cgcggcgtac ttgaacaggc 900
gggtgttaac gtcgatagcg ttatcctccc tgacggcgag cagtataaaa gcctggctgt 960
actcgatacc gtctttacgg cgttgttaca aaagccgcat ggtcgcgata ctacgctggt 1020
ggcgcttggc ggcggcgtag tgggcgatct gaccggcttc gcggcggcga gttatcagcg 1080
cggtgttcgt ttcattcaag tcccgacgac gttactgtcg caggtcgatt cctccgttgg 1140
cggcaaaact gcggtcaacc atcccctcgg taaaaacatg attggcgcgt tctaccagcc 1200
tgcttcagtg gtggtggatc tcgactgtct gaaaacgctt cccccgcgtg agttagcgtc 1260
ggggctggca gaagtcatca aatacggcat tattcttgac ggtgcgtttt tcaactggct 1320
ggaagagaat ctggatgcgt tgttgcgtct ggacggtccg gcaatggcgt actgtattcg 1380
ccgttgttgt gaactgaagg cagaagttgt cgccgccgac gagcgcgaaa ccgggttacg 1440
tgctttactg aatctgggac acacctttgg tcatgccatt gaagctgaaa tggggtatgg 1500
caattggtta catggtgaag cggtcgctgc gggtatggtg atggcggcgc ggacgtcgga 1560
acgtctcggg cagtttagtt ctgccgaaac gcagcgtatt ataaccctgc tcacgcgggc 1620
tgggttaccg gtcaatgggc cgcgcgaaat gtccgcgcag gcgtatttac cgcatatgct 1680
gcgtgacaag aaagtccttg cgggagagat gcgcttaatt cttccgttgg caattggtaa 1740
gagtgaagtt cgcagcggcg tttcgcacga gcttgttctt aacgccattg ccgattgtca 1800
atcagcgtaa tcatcgttca tgcctgatgc cgctatgtag gccggataag gcgttcacgc 1860
cgcatccggc aaccgatgcc tgatgcgacg cggtcgcgtc ttatcaggcc tacaggtcga 1920
tgccgatatg tacatcgtat tcggcaatta atacatagca tttcacaccg ccagctcagc 1980
tggcggtgct gttttgtaac ccgccaaatc ggcggtaacg aaagaggata aaccgtgtcc 2040
cgtattatta tgctgatccc taccggaacc agcgtcggtc tgaccagcgt cagccttggc 2100
gtgatccgtg caatggaacg caaaggcgtt cgtctgagcg ttttcaaacc tatcgctcag 2160
ccgcgtaccg gtggcgatgc gcccgatcag actacgacta tcgtgcgtgc gaactcttcc 2220
accacgacgg ccgctgaacc gctgaaaatg agctacgttg aaggtctgct ttccagcaat 2280
cagaaagatg tgctgatgga agagatcgtc gcaaactacc acgctaacac caaagacgct 2340
gaagtcgttc tggttgaagg tctggtcccg acacgtaagc accagtttgc ccagtctctg 2400
aactacgaaa tcgctaaaac gctgaatgcg gaaatcgtct tcgttatgtc tcagggcact 2460
<210> 36
<211> 1000
<212> DNA
<213> Sequence of the ?deleted poxB region;
<400> 36
gcggcccggc tccgtatatg gattgggtag agcaggaagt gaaagcgctc ggcgtgacgc 60
gtttctttaa agagaaattc ttcaccccag tagcggaagc agcgaccagc ggtctgaaat 120
tcaccaaact gcaaccggca cgagaatttt acgccccggt tggcaccacg ctactggagg 180
cgctggaaag caataacgtt ccggttgtcg ccgcctgccg tgcgggtgtt tgcggctgct 240
gtaagacaaa agtggtttcc ggtgaatata cggtgagcag cacaatgacg ctgaccgacg 300
ccgaaatcgc tgaaggttac gtactggcct gctcctgcca tccgcagggg gatttggttc 360
tcgcataatc gccttatgcc cgatgatatt cctttcatcg ggctatttaa ccgttagtgc 420
ctcctttctc tcccatccct tccccctccg tcagatgaac taaacttgtt accgttatca 480
cattcaggag atggagaacc aaagggtggc atttcccgtc ataataagga catgccatga 540
ttgatttacg cagtgatacc gttacccgac cgagccgcgc catgctcgaa gcaatgatgg 600
ccgccccggt tggggacgac gtttacggag acgaccctac cgttaatgct ctgcaggact 660
acgccgcaga gctttccggt aaagaagccg ccatttttct gccgaccggc actcaggcca 720
acctggtcgc tctgctcagt cactgcgaac gtggcgaaga gtatattgtc ggtcaggccg 780
cgcataacta tctgtttgaa gccggtggcg cagcggtgct gggcagtatt cagccgcaac 840
ccatcgacgc ggctgccgac ggcacgctac cgctggataa agtggcgatg aaaatcaaac 900
ccgacgatat ccatttcgcc cgcaccaaat tactcagtct ggaaaacacc cacaacggca 960
aagtgctgcc gcgtgaatac ctgaaagaag catgggaatt 1000
<210> 37
<211> 3392
<212> DNA
<213> tktA cassette at the deleted poxB locus;
<400> 37
gcggcccggc tccgtatatg gattgggtag agcaggaagt gaaagcgctc ggcgtgacgc 60
gtttctttaa agagaaattc ttcaccccag tagcggaagc agcgaccagc ggtctgaaat 120
tcaccaaact gcaaccggca cgagaatttt acgccccggt tggcaccacg ctactggagg 180
cgctggaaag caataacgtt ccggttgtcg ccgcctgccg tgcgggtgtt tgcggctgct 240
gtaagacaaa agtggtttcc ggtgaatata cggtgagcag cacaatgacg ctgaccgacg 300
ccgaaatcgc tgaaggttac gtactggcct gctcctgcca tccgcagggg gatttggttc 360
tcgcataatc gccttatgcc cgatgatatt cctttcatcg ggctatttaa ccgttagtgc 420
ctcctttctc tcccatccct tccccctccg tcagatgaac taaacttgtt accgttatca 480
cattcaggag atggagaacc aaggaaaagc gcaacggacg ggcgagtaga ttgcgcaaca 540
tgcgagcatg atccagagat ttctgaagca gcaaaaggat gttccatgta catgacgcgc 600
ggcttgcggt aaattgttgg caaattttcc ggcgtagccc aaaacgcgct gtcgtcaagt 660
cgttaagggc gtgcccttca tcatccgatc tggagtcaaa atgtcctcac gtaaagagct 720
tgccaatgct attcgtgcgc tgagcatgga cgcagtacag aaagccaaat ccggtcaccc 780
gggtgcccct atgggtatgg ctgacattgc cgaagtcctg tggcgtgatt tcctgaaaca 840
caacccgcag aatccgtcct gggctgaccg tgaccgcttc gtgctgtcca acggccacgg 900
ctccatgctg atctacagcc tgctgcacct caccggttac gatctgccga tggaagaact 960
gaaaaacttc cgtcagctgc actctaaaac tccgggccac ccggaagtag gttataccgc 1020
tggtgtggaa accaccaccg gtccgctggg tcagggtatt gccaacgcag tcggtatggc 1080
gattgcagaa aaaacgctgg cggcgcagtt taaccgtcca ggtcacgaca ttgtcgacca 1140
ctacacctac gccttcatgg gcgacggctg catgatggaa ggcatctccc acgaagtttg 1200
ctctctggcg ggtacgctga agctgggtaa actgattgcg ttctacgatg acaacggtat 1260
ctcaatcgat ggtcacgttg aaggctggtt cactgacgac accgcaatgc gtttcgaagc 1320
ttacggctgg cacgttattc gcgacatcga cggtcatgac gcggcatcca tcaaacgcgc 1380
agtagaagaa gcgcgcgcag tgactgacaa accgtccctg ctgatgtgca aaaccatcat 1440
cggtttcggt tccccgaaca aagccggtac ccacgactcc cacggtgcgc cgctgggcga 1500
cgctgaaatt gccctgaccc gcgaacagct gggctggaaa tacgcgccgt tcgaaatccc 1560
gtctgaaatc tatgctcagt gggatgcgaa agaagcaggc caggcgaaag aatctgcatg 1620
gaatgagaag tttgcggctt acgcgaaagc ttatccgcag gaagcggctg aatttacccg 1680
ccgtatgaaa ggcgaaatgc cgtctgactt cgacgccaaa gcgaaagagt ttatcgctaa 1740
actgcaggct aatccggcga aaatcgccag ccgtaaagcg tcgcagaatg ctatcgaagc 1800
gttcggcccg ctgttgcctg aattcctcgg cggctctgct gacctggcac cgtctaacct 1860
gaccctgtgg tctggttcta aagcaatcaa cgaagatgct gcaggtaact acatccacta 1920
cggtgttcgc gagttcggta tgaccgcgat tgctaacggt atctccctgc acggtggttt 1980
cctgccgtac acctccacct tcctgatgtt cgtggaatac gcacgtaacg ccgtacgtat 2040
ggctgcgctg atgaaacagc gtcaggtgat ggtttacacc cacgactcca tcggtctggg 2100
cgaagatggc ccgactcacc agccggttga gcaggtcgct tctctgcgcg tgaccccgaa 2160
catgtctaca tggcgtccgt gtgaccaggt tgaatccgcg gtcgcgtgga aatacggcgt 2220
tgagcgtcag gacggcccga ctgcgcttat cctctcccgt cagaacctgg cgcagcagga 2280
acgaactgaa gagcaactgg caaacatcgc gcgcggtggt tatgtgctga aagactgcgc 2340
cggtcagccg gaactgattt tcatcgctac cggttcagaa gttgaactgg ctgttgctgc 2400
ctacgaaaaa ctgactgccg aaggcgtgaa agcgcgcgtg gtgtccatgc cgtctaccga 2460
cgcatttgac aagcaggatg ctgcttaccg tgaatccgta ctgccgaaag cggttactgc 2520
acgcgttgct gtagaagcgg gtattgctga ctactggtac aagtatgttg gcctgaacgg 2580
tgctatcgtc ggtatgacca ccttcggtga atctgctccg gcagagctgc tgtttgaaga 2640
gttcggcttc actgttgata acgttgttgc gaaagcaaaa gaactgctgt aattagcatt 2700
tcgggtaaaa aggtcgcttc ggcgaccttt tttattacct tgatatgtcc gtttgcggac 2760
aagcaataga taaagcgtgt tgtagatcac aaatatttat atgcaataaa tatcaattat 2820
gtaatatgca tcacgatatg cgtattgaca tttgttgtta taactataac tcaatgttat 2880
ataagaaatt aaaaagggtg gcatttcccg tcataataag gacatgccat gattgattta 2940
cgcagtgata ccgttacccg accgagccgc gccatgctcg aagcaatgat ggccgccccg 3000
gttggggacg acgtttacgg agacgaccct accgttaatg ctctgcagga ctacgccgca 3060
gagctttccg gtaaagaagc cgccattttt ctgccgaccg gcactcaggc caacctggtc 3120
gctctgctca gtcactgcga acgtggcgaa gagtatattg tcggtcaggc cgcgcataac 3180
tatctgtttg aagccggtgg cgcagcggtg ctgggcagta ttcagccgca acccatcgac 3240
gcggctgccg acggcacgct accgctggat aaagtggcga tgaaaatcaa acccgacgat 3300
atccatttcg cccgcaccaa attactcagt ctggaaaaca cccacaacgg caaagtgctg 3360
ccgcgtgaat acctgaaaga agcatgggaa tt 3392
<210> 38
<211> 1045
<212> DNA
<213> ptsHI deletion sequence;
<400> 38
gaagatgaaa gctttaccaa caagaatatt gtggttattc taccatcatc gggtgagcgt 60
tatttaagca ccgcattgtt tgccgatctc ttcactgaga aagaattgca acagtaatgc 120
cagcttgtta aaaatgcgta aaaaagcacc tttttaggtg cttttttgtg gcctgcttca 180
aactttcgcc cctcctggca ttgattcagc ctgtcggaac tggtatttaa ccagactaat 240
tattttgatg cgcgaaatta atcgttacag gaaaagccaa agctgaatcg attttatgat 300
ttggttcaat tcttccttta gcggcataat gtttaatgac gtacgaaacg tcagcggtca 360
acacccgcca gcaatggact gtattgcgct cttcgtgcgt cgcgtctgtt aaaaactggc 420
gctaacaata caggctaaag tcgaaccgcc aggctagact ttagttccac aacactaaac 480
ctataagttg gggaaataca atgttccagc aagaagttac cattaccgct ccgacaatct 540
gctaatccac gagatgcggc ccaatttact gcttaggaga agatcatggg tttgttcgat 600
aaactgaaat ctctggtttc cgacgacaag aaggataccg gaactattga gatcattgct 660
ccgctctctg gcgagatcgt caatatcgaa gacgtgccgg atgtcgtttt tgcggaaaaa 720
atcgttggtg atggtattgc tatcaaacca acgggtaaca aaatggtcgc gccagtagac 780
ggcaccattg gtaaaatctt tgaaaccaac cacgcattct ctatcgaatc tgatagcggc 840
gttgaactgt tcgtccactt cggtatcgac accgttgaac tgaaaggcga aggcttcaag 900
cgtattgctg aagaaggtca gcgcgtgaaa gttggcgata ctgtcattga atttgatctg 960
ccgctgctgg aagagaaagc caagtctacc ctgactccgg ttgttatctc caacatggac 1020
gaaatcaaag aactgatcaa actgt 1045
<210> 39
<211> 4595
<212> DNA
<213> glf-glk cassette integrated at the deleted tdc locus;
<400> 39
ctgatttctt tgtcgctgat cccttactgg aactctgcag ttatcgacca ggttgacctc 60
ggttcgctgt cgttaaccgg tcatgacggt atcctgatca ctgtctggct ggggatttcc 120
atcatggttt tctcctttaa cttctcgcca atcgtctctt ccttcgtggt ttctaaacgt 180
gaagagtatg agaaagactt cggtcgcgac ttcaccgaac gtaaatgttc ccaaatcatt 240
tctcgtgcca gcatgctgat ggttgcagtg gtgatgttct ttgcctttag ctgcctgttt 300
actctgtctc cggccaacat ggcggaagcc aaagcgcaga atattccagt gctttcttat 360
ctggctaacc actttgcgtc catgaccggt accaaaacaa cgttcgcgat tacactggaa 420
tatgcggctt ccatcatcgc actcgtggct atcttcaaat ctttcttcgg tcactatctg 480
gggacgctgg aaggcttgaa tggtctgatt ctgaagttcg gttataaagg tgacaaaacc 540
aaagtgtcgc tgggtaaact gaatactctc agcatgatct tcatcatggg ctccacctgg 600
gttgttgcct acgccaaccc gaacatcctc gacctgattg aagccatggg cgcaccgatt 660
atcgcatccc tgctgtgcct gttgccgatg tatgccatcc gtaaagcgcc gtctctggcg 720
aaataccgtg gtcgtctgga taacgtgttt gttaccgtga ttggtctgct gaccatcctg 780
aacatcgtat acaaactgtt ttaatccgta actcaggatg agaaaagaga tgaatgaatt 840
tccggttgtt ttggttatta actgtggttc gtcttcgatt aagttttccg tactcgatgc 900
cagcgactgt gaagtattaa tgtcaggtat tgccgacggt attaactcgg aaaatgcatt 960
cttatccgta aatgggggag agccagcacc gctggctcac cacagctacg aaggtgcatt 1020
gaaggcaatt gcatttgaac tggaaaaacg gagtttaaat gacagcgtgg ccttaattgg 1080
tgcaaaagtg gctgtgactg taaaaagaaa tcgaaaaaga ccgttttgtg tgaaaacggt 1140
ctttttgttt ccttttaacc aactgccata actcgaggcc tacctagctt ccaagaaaga 1200
tatcctaaca gcacaagagc ggaaagatgt tttgttctac atccagaaca acctctgcta 1260
aaattcctga aaaattttgc aaaaagttgt tgactttatc tacaaggtgt ggtataataa 1320
tcttaacaac agcaggacgc tctagaggga gaggaatcgc catgagttct gaaagtagtc 1380
agggtctagt cacgcgacta gccctaatcg ctgctatagg cggcttgctt ttcggttacg 1440
attcagcggt tatcgctgca atcggtacac cggttgatat ccattttatt gcccctcgtc 1500
acctgtctgc tacggctgcg gcttcccttt ctgggatggt cgttgttgct gttttggtcg 1560
gttgtgttac cggttctttg ctgtctggct ggattggtat tcgcttcggt cgtcgcggcg 1620
gattgttgat gagttccatt tgtttcgtcg ccgccggttt tggtgctgcg ttaaccgaaa 1680
aattatttgg aaccggtggt tcggctttac aaattttttg ctttttccgg tttcttgccg 1740
gtttaggtat cggtgtcgtt tcaaccttga ccccaaccta tattgctgaa attgctccgc 1800
cagacaaacg tggtcagatg gtttctggtc agcagatggc cattgtgacg ggtgctttaa 1860
ccggttatat ctttacctgg ttactggctc atttcggttc tatcgattgg gttaatgcca 1920
gtggttggtg ctggtctccg gcttcagaag gcctgatcgg tattgccttc ttattgctgc 1980
tgttaaccgc accggatacg ccgcattggt tggtgatgaa gggacgtcat tccgaggcta 2040
gcaaaatcct tgctcgtctg gaaccgcaag ccgatcctaa tctgacgatt caaaagatta 2100
aagctggctt tgataaagcc atggacaaaa gcagcgcagg tttgtttgct tttggtatca 2160
ccgttgtttt tgccggtgta tccgttgctg ccttccagca gttagtcggt attaacgccg 2220
tgctgtatta tgcaccgcag atgttccaga atttaggttt tggagctgat acggcattat 2280
tgcagaccat ctctatcggt gttgtgaact tcatcttcac catgattgct tcccgtgttg 2340
ttgaccgctt cggccgtaaa cctctgctta tttggggtgc tctcggtatg gctgcaatga 2400
tggctgtttt aggctgctgt ttctggttca aagtcggtgg tgttttgcct ttggcttctg 2460
tgcttcttta tattgcagtc tttggtatgt catggggccc tgtctgctgg gttgttctgt 2520
cagaaatgtt cccgagttcc atcaagggcg cagctatgcc tatcgctgtt accggacaat 2580
ggttagctaa tatcttggtt aacttcctgt ttaaggttgc cgatggttct ccagcattga 2640
atcagacttt caaccacggt ttctcctatc tcgttttcgc agcattaagt atcttaggtg 2700
gcttgattgt tgctcgcttc gtgccggaaa ccaaaggtcg gagcctggat gaaatcgagg 2760
agatgtggcg ctcccagaag tagttaaact tgctttggct gaatcctttt gtctttttta 2820
gataagtctt aaccaattat actttttgtt tacaacgatg gtataaagcg ggcggactta 2880
ttttacctgt tgggtagcct tctgatttca gaaaggaatt attatggaaa ttgttgcgat 2940
tgacatcggt ggaacgcatg cgcgtttctc tattgcggaa gtaagcaatg gtcgggttct 3000
ttctcttgga gaagaaacaa cttttaaaac ggcagaacat gctagcttgc agttagcttg 3060
ggaacgtttc ggtgaaaaac tgggtcgtcc tctgccacgt gccgcagcta ttgcatgggc 3120
tggcccggtt catggtgaag ttttaaaact taccaataac ccttgggtat taagaccagc 3180
tactctgaat gaaaagctgg acatcgatac gcatgttctg atcaatgact tcggcgcggt 3240
tgcccacgcg gttgcgcata tggattcttc ttatctggat catatttgtg gtcctgatga 3300
agcgcttcct agcgatggtg ttatcactat tcttggtccg ggaacgggct tgggtgttgc 3360
ccatctgttg cggactgaag gccgttattt cgtcatcgaa actgaaggcg gtcatatcga 3420
ctttgctccg cttgacagac ttgaagacaa aattctggca cgtttacgtg aacgtttccg 3480
ccgcgtttct atcgaacgca ttatttctgg cccgggtctt ggtaatatct acgaagcact 3540
ggctgccatt gaaggcgttc cgttcagctt gctggatgat attaaattat ggcagatggc 3600
tttggaaggt aaagacaacc ttgctgaagc cgctttggat cgcttctgct tgagccttgg 3660
cgctatcgct ggtgatcttg ctttggcaca gggtcgaacc agtgttgtta ttggcggtgg 3720
tgtcggtctt cgtatcgctt cccatttgcc agaatctggt ttccgtcagc gctttgtttc 3780
aaaaggacgc tttgaacgcg tcatgtccaa gattccggtt aagttgatta cttatccgca 3840
gcctggactg ttgggtgcgc agctgcctat gccaacaaat attctgaagt tgaataatat 3900
tttttaatat tatgaactga atttaagagg ctgccttccg ataaaatcgg gaggtggcct 3960
tttttatatt ttttactaaa aaatgaagac aaaaaagtct taagtaagaa taatattatt 4020
attaactttt gatatatttt gtattagtgg atccgccctc ccgctggaaa ttgaagccat 4080
cgcagtacgt agtgcgtaaa gcctcgtgag cgggacggtc gtaaggtcgt tccgctccac 4140
ttcactgaac ggcaatccga gggtgtggat atgattagtg cattcgatat tttcaaaatt 4200
gggattggtc cctccagttc gcataccgtg gggccaatga atgccggaaa aagttttatt 4260
gatcggctgg aaagtagcgg cttattaacc gcgacgagcc atattgtggt cgatctgtac 4320
gggtcgttgt cactgacggg caaaggccat gccacggatg tcgccatcat catgggactg 4380
gcaggaaaca gtccgcagga tgttgtcatt gatgagatcc ctgcatttat agagttagta 4440
acgcgcagcg ggcggctgcc agtggcatct ggtgcgcata ttgttgattt tcctgtagca 4500
aagaacatta tcttccatcc cgaaatgttg cctcgccatg agaacggaat gcggatcact 4560
gcctggaagg gacaggaaga gctattaagt aaaac 4595
<210> 40
<211> 1069
<212> DNA
<213> galP deletion region;
<400> 40
actttggtcg tgaacatttc ccgtgggaaa aaaccgacaa agcgcagctg ctgcgcgatg 60
ctgccggtct gaagtaatct ttcttcacct gcgttcaaag gccagcctcg cgctggcctt 120
tttcttttgg ataggcgttc acgccgcatc cggcaaaaaa accgcccgca caataacatc 180
attcttcctg atcacgtttc accgcagatt atcatcacaa ctgaaaccga ttacaccaac 240
cacaacagac aaagatttgt aatattttca tattattatt cggttttcac agttgttaca 300
tttcttttca gtaaagtctt aattgcagat aacagcgttt aatctatgat gatataactc 360
aattattttc atgcacttaa atcataacta agataaatgt tagtgtaagc gattacactg 420
atgtgatttg cttcacatct ttttacgtcg tactcaccta tcttaattca caataaaaaa 480
taaccatatt ggagggcatc atgcctgacg ctaaaaaaca ggggcggtca aacaaggcaa 540
tgacgtttga aataggcgct cacgattaat ctccccaagc ttcctcccat cgcggaggaa 600
gccacctctt gcagtcatct tttcttcgct ctatcctctg ccgctatgaa aacatcccgt 660
ctccctatcg ccatccaaca ggccgttatg cgtcgcctgc gggaaaaact cgcccaggcc 720
aacctgaagc tagggcgtaa ctacccggag ccaaaactct cttacaccca gcgcggaacc 780
tccgccggaa cggcctggct ggaaagctat gaaattcgcc tcaatcccgt tttgctgttg 840
gaaaacagtg aagcttttat tgaagaagtg gtaccgcacg aactggcaca tttgctggta 900
tggaaacatt tcggccgcgt agcgccacat ggcaaagagt ggaagtggat gatggaaaac 960
gtgctgggtg ttcccgcccg tcgtacgcat cagttcgaac tgcaatccgt gcgtcgcaac 1020
accttcccct accgctgcaa gtgccaggag catcagctta ccgtacgcc 1069
<210> 41
<211> 6100
<212> DNA
<213> P15-catAX +PR-aroY+P26-quiC cassette at adhE locus;
<400> 41
ttgattttca taggttaagc aaatcatcac cgcactgact atactctcgt attcgagcag 60
atgatttact aaaaaagttt aacattatca ggagagcatt agcttgctat tgacgacagc 120
tatggttcac tgtccaccaa ccaaaactgt gctcagtacc gccaatattt ctcccttgag 180
gggtacaaag aggtgtccct agaagagatc cacgctgtgt aaaaatttta caaaaaggta 240
ttgactttcc ctacagggtg tgtaataatt taattacagg cgggggcaac cccgcctgtt 300
ctgcagagga ggaatatagc catggaagtg aaaatcttca acacccagga tgttcaggat 360
tttctgcgtg ttgcaagcgg tctggaacaa gagggtggta atccgcgtgt taaacaaatt 420
attcatcgtg ttctgagcga cctgtataaa gcaattgaag atctgaatat caccagcgac 480
gaatattggg caggcgttgc atatctgaat cagctgggtg caaatcaaga agcaggtctg 540
ctgagtccgg gtctgggttt tgatcattat ctggatatgc gtatggatgc agaagatgca 600
gcactgggta ttgaaaatgc aacaccgcgt accattgaag gtccgctgta tgttgcgggt 660
gcaccggaaa gcgttggtta tgcacgcatg gatgatggta gcgatccgaa tggtcatacc 720
ctgattctgc atggcaccat ttttgatgca gatggtaaac cgctgccgaa tgcaaaagtt 780
gaaatttggc atgcaaacac caaaggcttt tatagccatt ttgatccgac cggtgaacag 840
caggccttta atatgcgtcg tagcattatt accgatgaga atggtcagta tcgtgttcgt 900
accattctgc ctgccggtta tggttgtcct ccggaaggtc cgacccagca actgctgaac 960
caactgggtc gtcatggtaa tcgtccggca catattcatt attttgttag cgcagatggt 1020
caccgtaaac tgaccaccca gattaatgtt gccggtgatc cgtataccta tgatgatttt 1080
gcatatgcca cccgtgaagg tctggttgtt gatgcagttg aacataccga tccggaagca 1140
attaaagcca atgatgtgga aggtcctttt gccgaaatgg tgtttgatct gaaactgacc 1200
cgtctggttg atggtgttga taatcaggtt gtggatcgtc cgcgtctggc agtttaatac 1260
accaaaatgg ttcaaaatta tcaggcgagt gatcatgatc actggcctgt ttttatttca 1320
gggaagggtg gagacaatta cgtggataat cagatcatcc aagaaaccgt ggataaaatt 1380
ctgagcgttc tgccgaatca ggcaggtcag ctggcacgtc tggtgcgtct gatgcaattt 1440
gcatgcgatc cgaccattac cgttattggc aaatataacc atggtaaaag ccgtctgctg 1500
aatgaactga ttggcaccga tatctttagc gttgcagata aacgtgaaac cattcagctg 1560
gccgaacata aacaggatca ggttcgttgg ctggatgcac ctggtctgga tgccgatgtt 1620
gcagcagttg atgatcgtca tgcatttgaa gcagtttgga cccaggcaga tattcgtctg 1680
tttgttcata gcgttcgtga aggtgaactg gatgcaaccg aacaccatct gctgcaacag 1740
ctgattgaag atgccgatca tagccgtcgt cagaccattc tggttctgac ccagattgat 1800
cagattccgg atcagaccat cctgacacag attaaaacca gcattgcaca gcaggttccg 1860
aaactggata tttgggcagt tagcgcaacc cgtcatcgtc agggcattga aaacggtaaa 1920
accctgctga tcgaaaaaag cggtattggt gcactgcgcc ataccctgga acaggcactg 1980
gcacaggtgc cgagcgcacg tacctatgaa aaaaatcgtc tgctgtcaga tctgcaccat 2040
cagctgaaac aactgctgct ggatcagaaa catgttctgc aacaactgca acagacacag 2100
caacagcagc tgcatgattt tgataccggt ctgattaaca ttctggacaa aattcgtgtt 2160
gatctggaac cgattgtgaa tattgatggt caggatcaag cactgaatcc ggatagcttt 2220
gcaaccatgt ttaaaaacac cgcagcaaaa cagcagcgtg ccaaagttca gattgcatat 2280
agccgtgcat gcattgaaat caacagccat ctgattcgcc atggtgttgt tggtctgcct 2340
gcggaacagc agaccaccat taaaagcatt gataccgtga ttgttgccgt gtttggtatc 2400
agcgttaaat ttcgtgatca gctgcgtgcc ctgttttata ccgataccga acgtcagcgt 2460
ctgcaacgtg aatttcgttt ctattttgaa aaaagtgccg gtcgcatgat tctggcagca 2520
aaaattgaac agaccatgcg tcagcagggc tgtattcaga atgccatgat ggcactgcaa 2580
caaatggaaa gcgcagcata aaaacacgga cgccgcaaac ggcgtccgaa tttcttggtc 2640
gaccgttaaa tctatcaccg caagggataa atatctaaca ccgtgcgtgt tgactatttt 2700
acctctggcg gtgataatgg ttgcatgtac taatctagat aaggaatata gccatgaccg 2760
caccgattca ggatctgcgt gatgcaattg ccctgctgca acagcatgat aatcagtatc 2820
tggaaaccga tcatccggtt gatccgaatg cagaactggc aggcgtttat cgtcatattg 2880
gtgccggtgg caccgttaaa cgtccgaccc gtattggtcc ggcaatgatg tttaataaca 2940
ttaaaggtta tccgcacagc cgtattctgg ttggtatgca tgcaagccgt cagcgtgcag 3000
cactgctgct gggttgtgaa gcaagtcagc tggcactgga agttggtaaa gcagttaaaa 3060
aaccggttgc accggtggtt gttccggcaa gcagcgcacc gtgtcaagag cagatttttc 3120
tggcagatga tccggatttt gatctgcgta ccctgctgcc tgcacatacc aataccccga 3180
ttgatgcagg tccgtttttt tgtctgggtc tggccctggc aagcgatccg gtggatgcaa 3240
gcctgaccga tgttaccatt catcgtctgt gtgttcaggg tcgtgatgaa ctgagcatgt 3300
tcctggcagc aggtcgccat attgaagttt ttcgtcagaa agcagaagca gcaggtaaac 3360
cgctgccgat taccattaat atgggtctgg acccagcaat ctatattggc gcatgttttg 3420
aagcaccgac caccccgttt ggttataatg aactgggtgt tgccggtgca ctgcgtcagc 3480
gtccggttga actggttcag ggtgttagcg ttccggaaaa agcaattgca cgtgccgaaa 3540
ttgttattga aggtgaactg ctgcctggtg ttcgtgttcg tgaagatcag cataccaatt 3600
caggtcatgc aatgccggaa tttccgggtt attgtggtgg tgcaaatccg agcctgccgg 3660
ttattaaagt taaagccgtt accatgcgca ataacgcaat tctgcaaacc ctggttggtc 3720
cgggtgaaga acataccacc ctggcaggtc tgccgaccga agcaagcatt tggaatgcag 3780
ttgaagcagc aattccgggt tttctgcaaa atgtttatgc ccataccgca ggcggtggta 3840
aatttctggg tattctgcaa gtgaaaaaac gtcagcctgc cgatgaaggt cgtcagggtc 3900
aggcagccct gctggcgctg gcaacctata gcgaactgaa aaatatcatt ctggtggatg 3960
aggatgtgga catttttgat agtgatgata ttctgtgggc aatgaccacc cgtatgcagg 4020
gtgatgttag cattaccacc attccgggta ttcgcggtca tcagctggac ccgagccaga 4080
caccggaata ttcaccgagc attcgtggta atggtattag ctgcaaaacc atctttgatt 4140
gtaccgttcc gtgggcactg aaaagccatt ttgaacgtgc accgtttgca gatgttgatc 4200
cgcgtccgtt tgcacctgaa tattttgcac gtctggaaaa aaatcagggc agcgcaaaat 4260
aagctaataa caggcctgct ggtaatcgca ggaattttta tttggatgga tccgcctacc 4320
tagcttccaa gaaagatatc ctaacagcac aagagcggaa agatgttttg ttctacatcc 4380
agaacaacct ctgctaaaat tcctgaaaaa ttttgcaaaa agttgttgac tttatctaca 4440
aggtgtggta taataatctt aacaacagca ggacgctccc gggttgagga aaacctaatg 4500
aaactgacca gcctgcgtgt tagcctgctg gcactgggtc tggttaccag cggttttgca 4560
gcagcagaaa cctataccgt tgatcgttat caggatgata gcgaaaaagg tagcctgcgt 4620
tgggcaattg aacagagcaa tgcaaatagc gcacaagaaa accagattct gattcaggca 4680
gttggtaaag caccgtatgt tatcaaagtt gataaaccgc tgcctccgat taaaagcagc 4740
gttaaaatca ttggcaccga gtgggataaa accggtgaat ttattgcaat tgatggcagc 4800
aactatatca aaggcgaagg tgaaaaagca tgtccgggtg caaatccggg tcagtatggc 4860
accaatgttc gtaccatgac cctgcctggt ctggttctgc aagatgttaa tggtgttacc 4920
ctgaaaggtc tggatgttca tcgtttttgt attggtgttc tggttaatcg cagcagcaat 4980
aacctgattc agcataatcg tatcagcaac aattatggtg gtgccggtgt tatgattacc 5040
ggtgatgatg gtaaaggtaa tccgaccagc accaccacca ataataacaa agttctggat 5100
aacgtgttca tcgataatgg tgatggtctg gaactgaccc gtggtgcagc atttaatctg 5160
attgcaaata acctgtttac cagcacaaaa gccaatccgg aaccgagcca gggtattgaa 5220
attctgtggg gtaatgataa tgccgtggtg ggtaacaaat tcgaaaacta ttcagatggc 5280
ctgcaaatca attggggtaa acgtaactat atcgcctata acgaactgac caataacagc 5340
ctgggtttca atctgacagg tgatggtaac attttcgaca gcaataaagt gcatggtaac 5400
cgtattggta ttgccattcg tagtgaaaaa gatgccaatg cacgtattac cctgaccaaa 5460
aatcagattt gggataacgg caaagatatc aaacgttgtg aagccggtgg tagctgtgtt 5520
ccgaatcagc gtctgggtgc aattgttttt ggtgttccgg cactggaaca tgaaggtttt 5580
gttggtagcc gtggcggtgg tgttgttatt gaaccggcaa aactgcaaaa aacctgcacc 5640
cagccgaacc agcagaattg taatgcaatt cctaatcagg gtattcaggc accgaaactg 5700
acagttagca aaaaacagct gaccgttgaa gttaaaggca cccctaatca gcgttataat 5760
gtggaatttt ttggcaatcg taatgccagc agcagcgaag cagaacagta tctgggtagc 5820
attgttgttg ttaccgatca tcagggtctg gcaaaagcaa attgggctcc gaaagttagc 5880
atgccgagcg ttaccgcaaa tgtgacagat catctgggtg cgaccagcga actgagcagc 5940
gcagttaaaa tgcgttaaat gcatgcgcgc cgcgttcgcg cggcgctttt ttttggtact 6000
cagtagcgct gtctggcaac ataaacggcc ccttctgggc aatgccgatc agttaaggat 6060
tagttgaccg atccttaaac tgaggcacta taacggcttc 6100
Claims (34)
- PEP-의존성 포스포트랜스퍼라아제 시스템(PEP-dependent phosphotransferase system)이 결여되고, 글루코오스 이입(import)을 위한 GalP 단백질계 시스템(GalP protein based system)이 결여되고, 기능성 글루코오스-촉진 확산 단백질을 인코딩하는 외인성 유전자 및 비-방향족 탄소원으로부터 시작하여 시스, 시스-뮤콘산을 생산하는 뮤콘산 경로에서 기능하는 단백질을 인코딩하는 하나 이상의 외인성 유전자들을 포함하는, 유전자 조작된 대장균 박테리아로서,
상기 뮤콘산 경로에서 기능하는 단백질을 인코딩하는 유전자는 qa-4, asbF 및 quiC로 구성된 군으로부터 선택되는 것을 특징으로 하는, 유전자 조작된 대장균 박테리아. - 제 1항에 있어서, 기능성 글루코오스-촉진 확산 단백질은 glf 유전자에 의해 코딩된 Glf 단백질인 것을 특징으로 하는, 유전자 조작된 대장균 박테리아.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제 1항에 있어서, 상기 quiC 유전자는 QuiC 효소를 인코딩하며, 아시네토박터 (acinetobacter), 아스페르질루스 (Aspergillus), 에머리셀라 (Emericella), 뉴로스포라 (Neurospora) 및 포도스포라 (Podospora)로 구성된 군으로부터 유래되는 것을 특징으로 하는, 유전자 조작된 대장균 박테리아.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261632777P | 2012-01-30 | 2012-01-30 | |
US61/632,777 | 2012-01-30 | ||
PCT/US2013/023690 WO2013116244A1 (en) | 2012-01-30 | 2013-01-29 | Production of muconic acid from genetically engineered microorganisms |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140131939A KR20140131939A (ko) | 2014-11-14 |
KR102092422B1 true KR102092422B1 (ko) | 2020-03-24 |
Family
ID=48905760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147024229A KR102092422B1 (ko) | 2012-01-30 | 2013-01-29 | 유전자 조작된 미생물로부터 뮤콘산의 생산 |
Country Status (11)
Country | Link |
---|---|
US (2) | US20150044755A1 (ko) |
EP (2) | EP2809771B1 (ko) |
JP (3) | JP2015504688A (ko) |
KR (1) | KR102092422B1 (ko) |
CN (2) | CN107177540A (ko) |
BR (1) | BR112014017686A2 (ko) |
CA (1) | CA2862051A1 (ko) |
ES (1) | ES2663445T3 (ko) |
HK (1) | HK1243459A1 (ko) |
MY (1) | MY172307A (ko) |
WO (1) | WO2013116244A1 (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8647642B2 (en) | 2008-09-18 | 2014-02-11 | Aviex Technologies, Llc | Live bacterial vaccines resistant to carbon dioxide (CO2), acidic PH and/or osmolarity for viral infection prophylaxis or treatment |
KR102064475B1 (ko) * | 2014-04-17 | 2020-01-10 | (주)에스티알바이오텍 | 뮤코닉산 생산용 미생물 및 그 제조방법 |
WO2016036748A1 (en) * | 2014-09-03 | 2016-03-10 | Coffa Gianguido | Production of cis, cis-muconic acid from carbonaceous material |
WO2016207403A1 (en) | 2015-06-24 | 2016-12-29 | Deinove | Method of producing muconic acid |
SG11201807544WA (en) * | 2016-03-02 | 2018-09-27 | Myriant Corp | Improved muconic acid production from genetically engineered microorganisms |
US11180535B1 (en) | 2016-12-07 | 2021-11-23 | David Gordon Bermudes | Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria |
US11129906B1 (en) | 2016-12-07 | 2021-09-28 | David Gordon Bermudes | Chimeric protein toxins for expression by therapeutic bacteria |
CN108314713A (zh) * | 2017-01-16 | 2018-07-24 | 中国科学院微生物研究所 | L-苏氨酸转运蛋白ThrG及其编码基因与应用 |
CN108314712A (zh) * | 2017-01-16 | 2018-07-24 | 中国科学院微生物研究所 | L-苏氨酸转运蛋白ThrF及其编码基因与应用 |
CA3052635A1 (en) | 2017-02-06 | 2018-11-08 | Zymergen Inc. | Engineered biosynthetic pathways for production of tyramine by fermentation |
CN106947727B (zh) * | 2017-02-20 | 2019-08-16 | 波顿(上海)生物技术有限公司 | 一种基因工程菌及其构建方法与生产香兰素的方法 |
US11708590B2 (en) | 2017-07-18 | 2023-07-25 | Arizona Board Of Regents On Behalf Of Arizona State University | Synthetic metabolic funneling for biochemical production |
KR102003911B1 (ko) * | 2018-02-23 | 2019-07-25 | 씨제이제일제당 주식회사 | 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법 |
EP3967762A4 (en) * | 2019-05-10 | 2023-07-19 | Toray Industries, Inc. | GENETICALLY MODIFIED MICROORGANISM FOR THE PRODUCTION OF 3-HYDROXYHEXIC ACID, (E)-HEX-2-ENDONIC ACID AND/OR HEXANDOONIC ACID AND MANUFACTURING PROCESSES FOR THESE CHEMICALS |
BR112021021601A2 (pt) | 2019-05-10 | 2021-12-21 | Toray Industries | Microrganismo geneticamente modificado e método de produção de ácido 3-hidroxiadípico, ácido a-hidromucônico e/ou ácido adípico |
CN110184288A (zh) * | 2019-05-28 | 2019-08-30 | 南京趣酶生物科技有限公司 | 没食子酸和原儿茶酸的制备方法及其反应催化剂的制备方法 |
CN111662892B (zh) * | 2020-07-29 | 2022-07-01 | 上海市农业科学院 | β-酮己二酸代谢相关三个基因的结构优化与应用 |
CN112266892B (zh) * | 2020-10-21 | 2021-10-08 | 中国科学院天津工业生物技术研究所 | AroG的突变体及其在产氨基酸基因工程菌中的应用 |
JPWO2022102635A1 (ko) | 2020-11-11 | 2022-05-19 | ||
CN117004547B (zh) * | 2023-09-27 | 2023-12-22 | 北京化工大学 | 一种以葡萄糖为底物从头合成顺,顺-粘康酸的基因工程菌及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011123154A2 (en) * | 2009-11-18 | 2011-10-06 | Myriant Technologies Llc | Metabolic evolution of escherchia coli strains that produce organic acids |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3128411A1 (de) | 1980-07-18 | 1983-09-15 | Unisearch Ltd., 2033 Kensington, New South Wales | Kulturstamm-mutante von esccherichia coli sowie verfahren zur herstellung von phenylalanin |
US4588688A (en) | 1981-07-27 | 1986-05-13 | Celanese Corporation | Process for the production of muconic acid |
US4480034A (en) | 1982-06-10 | 1984-10-30 | Celanese Corporation | Continuous fermentation process and bioconversion-product recovery |
US4608338A (en) | 1982-06-10 | 1986-08-26 | Celanese Corporation | Process for bioconversion-product recovery |
US4535059A (en) | 1983-01-13 | 1985-08-13 | Celanese Corporation | Muconic acid productivity by a stabilized mutant microorganism population |
US4833078A (en) | 1984-06-22 | 1989-05-23 | Celgene Corporation | Semi-continuous fermentation process for aromatic hydrocarbon bioconversion |
US4968612A (en) | 1984-07-27 | 1990-11-06 | Celgene Corporation | Continuous fermentation process for aromatic hydrocarbon bioconversion |
US4753883A (en) | 1986-05-07 | 1988-06-28 | Biotechnica International, Inc. | Enzyme deregulation |
DE69133587D1 (de) * | 1990-11-30 | 2008-01-03 | Ajinomoto Kk | Rekombinante DNS-Sequenzen kodierend für Enzyme frei von Feedback-Inhibition, Plasmide, die diese Sequenzen enthalten, transformierte Mikroorganismen, nützlich für Produktion aromatischer Aminosäuren, und deren Verfahren zur Herstellung durch Fermentation |
US5168056A (en) | 1991-02-08 | 1992-12-01 | Purdue Research Foundation | Enhanced production of common aromatic pathway compounds |
JP3225597B2 (ja) * | 1992-06-15 | 2001-11-05 | 味の素株式会社 | 発酵法によるl−フェニルアラニンの製造法 |
US5272073A (en) | 1992-06-30 | 1993-12-21 | Purdue Research Foundation | Biocatalytic synthesis of catechol from glucose |
DE4232468A1 (de) | 1992-09-28 | 1994-03-31 | Consortium Elektrochem Ind | Mikroorganismen für die Produktion von Tryptophan und Verfahren zu ihrer Herstellung |
US5487987A (en) | 1993-09-16 | 1996-01-30 | Purdue Research Foundation | Synthesis of adipic acid from biomass-derived carbon sources |
WO1996034961A1 (en) | 1995-05-05 | 1996-11-07 | Genencor International, Inc. | Application of glucose transport mutants for production of aromatic pathway compounds |
DE19644566A1 (de) * | 1996-10-26 | 1998-04-30 | Forschungszentrum Juelich Gmbh | Mikrobielle Herstellung von Substanzen aus dem aromatischen Stoffwechsel / I |
US6210937B1 (en) | 1997-04-22 | 2001-04-03 | Bechtel Bwxt Idaho, Llc | Development of genetically engineered bacteria for production of selected aromatic compounds |
US6613552B1 (en) | 1999-01-29 | 2003-09-02 | Board Of Trustees Operating Michigan State University | Biocatalytic synthesis of shikimic acid |
US6600077B1 (en) | 1999-01-29 | 2003-07-29 | Board Of Trustees Operating Michigan State University | Biocatalytic synthesis of quinic acid and conversion to hydroquinone |
JP2002105641A (ja) | 2000-10-03 | 2002-04-10 | Murakami Corp | 複合材およびその製造方法 |
WO2002061108A2 (en) | 2001-01-19 | 2002-08-08 | Basf Aktiengesellschaft | Microorganisms and processes for enhanced production of pantothenate |
DK1546312T3 (da) * | 2002-10-04 | 2014-11-03 | Danisco Us Inc | Glucosetransportmutanter til fremstilling af biomateriale |
WO2005030949A1 (en) | 2003-09-24 | 2005-04-07 | Board Of Trustees Operating Michigan State University | Methods and materials for the production of shikimic acid |
KR101142885B1 (ko) | 2003-12-15 | 2012-05-10 | 씨제이제일제당 (주) | 트립토판 생합성 관련 변이유전자를 함유한 대장균 변이주및 이를 이용한 트립토판 제조방법 |
EP1931784A2 (en) | 2005-08-18 | 2008-06-18 | Basf Se | Microorganisms with increased efficiency for methionine synthesis |
WO2009115114A1 (en) * | 2008-03-18 | 2009-09-24 | Metabolic Explorer | Polypeptide having glyoxylase iii activity, polynucleotide encoding the same and uses thereof |
DE102008040352A1 (de) * | 2008-07-11 | 2010-01-14 | Evonik Degussa Gmbh | Verfahren zur Herstellung von L-Tryptophan unter Verwendung von verbesserten Stämmen der Familie Enterobacteriaceae |
US8426639B2 (en) | 2009-06-16 | 2013-04-23 | Amyris, Inc. | Preparation of trans, trans muconic acid and trans, trans muconates |
BR112012002643A2 (pt) | 2009-08-05 | 2018-08-28 | Genomatica Inc | ácido tereftalático semissintético por meio de micro-organismos que produzem ácido mucônico |
EP2501797A4 (en) * | 2009-11-18 | 2013-04-17 | Myriant Corp | TECHNIQUES OF MICROBES FOR THE EFFECTIVE MANUFACTURE OF CHEMICALS |
CA2786405C (en) * | 2010-01-08 | 2019-04-02 | Amyris, Inc. | Methods for producing isomers of muconic acid and muconate salts |
US9909135B2 (en) * | 2010-07-06 | 2018-03-06 | Yeda Research And Development Co. Ltd. | Transgenic plants having altered DAHP synthase activity |
-
2013
- 2013-01-29 CA CA2862051A patent/CA2862051A1/en not_active Abandoned
- 2013-01-29 US US14/375,071 patent/US20150044755A1/en not_active Abandoned
- 2013-01-29 EP EP13743123.5A patent/EP2809771B1/en active Active
- 2013-01-29 JP JP2014554943A patent/JP2015504688A/ja active Pending
- 2013-01-29 ES ES13743123.5T patent/ES2663445T3/es active Active
- 2013-01-29 CN CN201710442475.XA patent/CN107177540A/zh active Pending
- 2013-01-29 EP EP17001811.3A patent/EP3312267B1/en active Active
- 2013-01-29 CN CN201380017560.1A patent/CN104220587A/zh active Pending
- 2013-01-29 KR KR1020147024229A patent/KR102092422B1/ko active IP Right Grant
- 2013-01-29 WO PCT/US2013/023690 patent/WO2013116244A1/en active Application Filing
- 2013-01-29 MY MYPI2014002156A patent/MY172307A/en unknown
- 2013-01-29 BR BR112014017686A patent/BR112014017686A2/pt not_active Application Discontinuation
-
2017
- 2017-05-17 JP JP2017097925A patent/JP2017184746A/ja active Pending
-
2018
- 2018-03-01 HK HK18102984.4A patent/HK1243459A1/zh unknown
-
2019
- 2019-06-04 JP JP2019104585A patent/JP2019195330A/ja active Pending
- 2019-07-10 US US16/508,048 patent/US20190345437A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011123154A2 (en) * | 2009-11-18 | 2011-10-06 | Myriant Technologies Llc | Metabolic evolution of escherchia coli strains that produce organic acids |
Non-Patent Citations (1)
Title |
---|
Biotechnol. Prog., vol.18, pp.201~211( 2002)* |
Also Published As
Publication number | Publication date |
---|---|
CN104220587A (zh) | 2014-12-17 |
EP2809771B1 (en) | 2017-12-27 |
US20150044755A1 (en) | 2015-02-12 |
MY172307A (en) | 2019-11-21 |
EP3312267B1 (en) | 2020-03-11 |
KR20140131939A (ko) | 2014-11-14 |
CA2862051A1 (en) | 2013-08-08 |
EP2809771A1 (en) | 2014-12-10 |
JP2017184746A (ja) | 2017-10-12 |
US20190345437A1 (en) | 2019-11-14 |
WO2013116244A1 (en) | 2013-08-08 |
BR112014017686A2 (pt) | 2017-06-27 |
EP2809771A4 (en) | 2016-01-27 |
HK1243459A1 (zh) | 2018-07-13 |
JP2015504688A (ja) | 2015-02-16 |
CN107177540A (zh) | 2017-09-19 |
ES2663445T3 (es) | 2018-04-12 |
EP3312267A1 (en) | 2018-04-25 |
JP2019195330A (ja) | 2019-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102092422B1 (ko) | 유전자 조작된 미생물로부터 뮤콘산의 생산 | |
KR20240005196A (ko) | 유전자 조작된 미생물로부터 개선된 뮤콘산 생산 | |
AU2019206054B2 (en) | Production of heterologous polypeptides in microalgae, microalgal extracellular bodies, compositions, and methods of making and uses thereof | |
DK2664670T3 (da) | Perhydrolase | |
AU2023270322A1 (en) | Compositions and methods for modifying genomes | |
KR101823695B1 (ko) | 신규 미생물 숙신산 생산자 및 숙신산의 정제 | |
AU2016203445B2 (en) | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion | |
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
KR101659101B1 (ko) | 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도 | |
CN109563505A (zh) | 用于真核细胞的组装系统 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
DK2324120T3 (en) | Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS | |
BRPI0719748A2 (pt) | Microrganismo modificados por engenharia para produzir n-butanol e métodos relacionados | |
DK2576605T3 (en) | PREPARATION OF METABOLITES | |
KR102593668B1 (ko) | 유도 기질 부재 하의 사상 진균 세포에서의 단백질 생산 | |
WO2009056423A2 (de) | Fermentative gewinnung von aceton aus erneuerbaren rohstoffen mittels neuen stoffwechselweges | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
KR20100118973A (ko) | 이소프렌을 생성하기 위한 조성물 및 방법 | |
KR20110038087A (ko) | 재생가능 자원으로부터의 이소프렌 중합체 | |
KR20120034652A (ko) | 유전적으로 변형된 미생물을 발생시키는 방법 | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
CN108949825A (zh) | 一种靶向her2的car-t细胞的制备方法及应用 | |
CN115698297A (zh) | 多模块生物合成酶基因组合文库的制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
N231 | Notification of change of applicant | ||
GRNT | Written decision to grant |