[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

BR112021008098A2 - métodos e composições para o sequenciamento de proteínas - Google Patents

métodos e composições para o sequenciamento de proteínas Download PDF

Info

Publication number
BR112021008098A2
BR112021008098A2 BR112021008098-8A BR112021008098A BR112021008098A2 BR 112021008098 A2 BR112021008098 A2 BR 112021008098A2 BR 112021008098 A BR112021008098 A BR 112021008098A BR 112021008098 A2 BR112021008098 A2 BR 112021008098A2
Authority
BR
Brazil
Prior art keywords
amino acid
protein
terminal
molecule
polypeptide
Prior art date
Application number
BR112021008098-8A
Other languages
English (en)
Inventor
Brian Reed
Jeremy Lackey
Thomas Christian
Roger Nani
David Dodd
Kathren Croce
Alexander Goryaynov
Jonathan M. Rothberg
Original Assignee
Quantum-Si Incorporated
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quantum-Si Incorporated filed Critical Quantum-Si Incorporated
Publication of BR112021008098A2 publication Critical patent/BR112021008098A2/pt

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/581Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with enzyme label (including co-enzymes, co-factors, enzyme inhibitors or substrates)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • G01N33/6824Sequencing of polypeptides involving N-terminal degradation, e.g. Edman degradation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • G01N33/6821Sequencing of polypeptides involving C-terminal degradation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Zoology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

MÉTODOS E COMPOSIÇÕES PARA O SEQUNCIAMENTO DE PROTEÍNAS. A presente invenção refere-se a métodos para identificar e sequenciar proteínas, polipeptídeos e aminoácidos e a composições úteis para o mesmo. Em alguns aspectos, o pedido de patente provê métodos para obter dados durante um processo de degradação de um polipeptídeo e produzir, a partir dos dados obtidos, uma sequência representativa do polipeptídeo. Em alguns aspectos, o pedido de patente provê moléculas de reconhecimento de aminoácidos que compreendem um elemento de proteção que melhora a fotoestabilidade em reações de sequenciamento de polipeptídeos.

Description

Relatório Descritivo da Patente de Invenção para "MÉTO- DOS E COMPOSIÇÕES PARA O SEQUENCIAMENTO DE PROTEÍ- NAS". Referência Cruzada A Pedidos Relacionados
[0001] Este pedido de patente reivindica o benefício de prioridade deste, segundo 35 U.S.C. 8 119(e), ao Pedido de Patente U.S. Provi- sório Nº 62/907 507, depositado em 27 de setembro de 2019, e ao Pe- dido de Patente U.S. Provisório Nº 62/768 076, depositado em 15 de novembro de 2018, cujos conteúdos são aqui incorporados, em sua totalidade, por referência. Antecedentes
[0002] A proteômica surgiu como um complemento importante e necessário da genômica e transcriptômica no estudo de sistemas bio- lógicos. A análise proteômica de um organismo individual pode forne- cer percepções sobre processos celulares e padrões de resposta, que levam a estratégias diagnósticas e terapêuticas melhoradas. A com- plexidade envolvendo a estrutura, composição e modificação de prote- íÍnas apresenta desafios na determinação de informações sobre o se- quenciamento de proteínas em grande escala de uma amostra biológi- ca. Sumário
[0003] Em alguns aspectos, o pedido de patente provê métodos e composições para determinar informações sobre a sequência de ami- noácidos de polipeptídeos (por exemplo, para sequenciar um ou mais polipeptídeos). Em algumas modalidades, as informações sobre a se- quência de aminoácidos podem ser determinadas para moléculas de um único polipeptídeo. Em algumas modalidades, a posição relativa de dois ou mais aminoácidos em um polipeptídeo é determinada, por exemplo, para uma molécula de um único polipeptídeo. Em algumas modalidades, um ou mais aminoácidos de um polipeptídeo são marca-
dos (por exemplo, direta ou indiretamente) e as posições relativas dos aminoácidos marcados no polipeptídeo são determinadas.
[0004] Em alguns aspectos, o pedido de patente provê métodos que compreendem obter dados durante um processo de degradação de um polipeptídeo. Em algumas modalidades, os métodos compreen- dem ainda analisar os dados para determinar porções dos dados que correspondem a aminoácidos expostos sequencialmente em um ter- minal do polipeptídeo durante o processo de degradação. Em algumas modalidades, os métodos compreendem ainda produzir a partir dos dados (outputting) uma sequência de aminoácidos representativa do polipeptídeo. Em algumas modalidades, os dados são indicativos da identidade do aminoácido no terminal do polipeptídeo durante o pro- cesso de degradação. Em algumas modalidades, os dados são indica- tivos de um sinal produzido por uma ou mais moléculas de reconheci- mento de aminoácidos ligando-se a tipos diferentes de aminoácidos terminais no terminal durante o processo de degradação. Em algumas modalidades, os dados são indicativos de um sinal luminescente gera- do durante o processo de degradação. Em algumas modalidades, os dados são indicativos de um sinal elétrico gerado durante o processo de degradação.
[0005] Em algumas modalidades, analisar os dados compreendem ainda detectar uma série de eventos de clivagem e determinar as por- ções dos dados entre eventos de clivagem sucessivos. Em algumas modalidades, analisar os dados compreendem ainda determinar um tipo de aminoácido para cada uma das porções individuais. Em algu- mas modalidades, cada uma das porções individuais compreende um padrão de pulso (por exemplo, um padrão característico), e analisar os dados compreendem ainda determinar um tipo de aminoácido para uma ou mais das porções tendo por base o seu respectivo padrão de pulso. Em algumas modalidades, determinar o tipo de aminoácido compreende ainda identificar a quantidade de tempo em uma porção durante a qual os dados excedem um valor limiar e comparar a quanti- dade de tempo com uma duração de tempo para a porção. Em algu- mas modalidades, determinar o tipo de aminoácido compreende ainda identificar pelo menos a duração de um pulso para cada uma de uma ou mais porções. Em algumas modalidades, determinar o tipo de ami- noácido compreende ainda identificar pelo menos a duração entre pul- sos para cada uma de uma ou mais porções. Em algumas modalida- des, a sequência de aminoácidos inclui uma série de aminoácidos que corresponde às porções.
[0006] Em alguns aspectos, o pedido de patente provê sistemas que compreendem pelo menos um processador de hardware e pelo menos um meio de armazenamento legível por computador não transi- tório com instruções armazenadas executáveis por computador que, quando executadas pelo ao menos um processador de hardware, faz com que o ao menos um processador de hardware execute um méto- do de acordo com o pedido de patente. Em alguns aspectos, o pedido de patente provê pelo menos um meio de armazenamento legível por computador não transitório com instruções armazenadas executáveis por computador que, quando executadas por pelo menos um proces- sador de hardware, faz com que o ao menos um processador de hardware execute um método de acordo com o pedido de patente.
[0007] Em alguns aspectos, o pedido de patente provê métodos para o sequenciamento de polipeptídeos. Em algumas modalidades, os métodos compreendem colocar uma molécula de um único polipep- tídeo em contato com uma ou mais moléculas de reconhecimento de aminoácidos terminais. Em algumas modalidades, os métodos com- preendem ainda detectar uma série de pulsos de sinal indicativos da associação de uma ou mais moléculas de reconhecimento de aminoá- cidos terminais com aminoácidos sucessivos expostos em um terminal da única molécula polipeptídica enquanto está sendo degradada, ob- tendo, assim, informações de sequência sobre a única molécula poli- peptídica. Em algumas modalidades, a sequência de aminoácidos da maior parte ou de toda a única molécula polipeptídica é determinada. Em algumas modalidades, a série de pulsos de sinal é uma série de pulsos de sinal em tempo real.
[0008] Em algumas modalidades, a associação de uma ou mais moléculas de reconhecimento de aminoácidos terminais com cada tipo de aminoácido exposto no terminal produz um padrão característico na série de pulsos de sinal que é diferente do padrão de outros tipos de aminoácidos expostos no terminal. Em algumas modalidades, um pul- so de sinal do padrão característico corresponde um evento de asso- ciação individual entre uma molécula de reconhecimento de aminoáci- do terminal e um aminoácido exposto no terminal. Em algumas moda- lidades, o padrão característico corresponde a uma série de interações de ligação reversível da molécula de reconhecimento de aminoácido terminal com o aminoácido exposto no terminal da única molécula po- lipeptídica. Em algumas modalidades, o padrão característico é indica- tivo do aminoácido exposto no terminal da única molécula polipeptídica e um aminoácido em uma posição contígua (por exemplo, aminoáci- dos do mesmo tipo ou de tipos diferentes).
[0009] Em algumas modalidades, a única molécula polipeptídica é degradada por um reagente de clivagem que remove um ou mais ami- noácidos do terminal da única molécula polipeptídica. Em algumas modalidades, os métodos compreendem ainda detectar um sinal indi- cativo da associação do reagente de clivagem com o terminal. Em al- gumas modalidades, o reagente de clivagem compreende um marca- dor detectável (por exemplo, um marcador luminescente, um marcador de condutividade). Em algumas modalidades, a única molécula poli- peptídica é imobilizada em uma superfície. Em algumas modalidades,
a única molécula polipeptídica é imobilizada na superfície através de uma extremidade terminal distal ao terminal ao qual uma ou mais mo- léculas de reconhecimento de aminoácidos terminais se associam. Em algumas modalidades, a única molécula polipeptídica é imobilizada na superfície através de um ligante (linker) (por exemplo, um ligante solu- bilizante compreendendo uma biomolécula).
[0010] Em alguns aspectos, o pedido de patente provê métodos de sequenciamento de polipeptídeos que compreendem colocar a única molécula polipeptídica em contato em uma mistura de reação com uma composição compreendendo uma ou mais moléculas de reco- nhecimento de aminoácidos terminais e um reagente de clivagem. Em algumas modalidades, os métodos compreendem ainda detectar uma série de pulsos de sinal indicativos da associação de uma ou mais mo- léculas de reconhecimento de aminoácidos terminais com um terminal da única molécula polipeptídica na presença do reagente de clivagem. Em algumas modalidades, a série de pulsos de sinal é indicativa de uma série de aminoácidos expostos no terminal ao longo do tempo como resultado da clivagem do aminoácido terminal pelo reagente de clivagem.
[0011] Em alguns aspectos, o pedido de patente provê métodos de sequenciamento de polipeptídeos que compreendem (a) identificar um primeiro aminoácido em um terminal de uma molécula de um único polipeptídeo, (b) remover o primeiro aminoácido para expor um segun- do aminoácido no terminal da única molécula polipeptídica, e (c) identi- ficar o segundo aminoácido no terminal da única molécula polipeptídi- ca. Em algumas modalidades, (a)-(c) são realizados em uma única mistura de reação. Em algumas modalidades, (a)-(c) ocorrem sequen- cialmente. Em algumas modalidades, (c) ocorre antes de (a) e (b). Em algumas modalidades, a única mistura de reação compreende uma ou mais moléculas de reconhecimento de aminoácidos terminais. Em al-
gumas modalidades, a única mistura de reação compreende um rea- gente de clivagem. Em algumas modalidades, o primeiro aminoácido é removido pelo reagente de clivagem. Em algumas modalidades, os métodos compreendem ainda repetir as etapas de remoção e identifi- cação de um ou mais aminoácidos no terminal da única molécula poli- peptídica, determinando, assim, uma sequência (por exemplo, uma sequência parcial ou uma sequência completa) da única molécula po- lipeptídica.
[0012] Em alguns aspectos, o pedido de patente provê métodos de identificação de um aminoácido de um polipeptídeo que compreendem colocar uma molécula de um único polipeptídeo em contato com uma ou mais moléculas de reconhecimento de aminoácidos que se ligam à única molécula polipeptídica. Em algumas modalidades, os métodos compreendem ainda detectar uma série de pulsos de sinal indicativos da associação de uma ou mais moléculas de reconhecimento de ami- noácidos com a única molécula polipeptídica sob condições de degra- dação de polipeptídeos. Em algumas modalidades, os métodos com- preendem ainda identificar um primeiro tipo de aminoácido na única molécula polipeptídica com base em um primeiro padrão característico na série de pulsos de sinal.
[0013] Em alguns aspectos, o pedido de patente provê métodos de identificação de um aminoácido terminal (por exemplo, o aminoácido N-terminal ou o C-terminal) de um polipeptídeo. Em algumas modali- dades, os métodos compreendem colocar um polipeptídeo em contato com um ou mais reagentes de afinidade marcados (por exemplo, uma ou mais moléculas de reconhecimento de aminoácidos) que se ligam seletivamente um ou mais tipos de aminoácidos terminais em um ter- minal do polipeptídeo. Em algumas modalidades, os métodos compre- endem ainda identificar um aminoácido terminal no terminal do poli- peptídeo pela detecção de uma interação do polipeptídeo com um ou mais reagentes de afinidade marcados.
[0014] Em ainda outros aspectos, o pedido de patente provê mé- todos de sequenciamento de polipeptídeos por reações de degradação do tipo de Edman. Em algumas modalidades, as reações de degrada- ção do tipo de Edman podem ser realizadas colocando um polipeptí- deo em contato com diferentes misturas de reação para fins de detec- ção ou clivagem (por exemplo, em comparação a uma reação de se- quenciamento dinâmico, que pode envolver detecção e clivagem usando uma única mistura de reação).
[0015] Deste modo, em alguns aspectos, o pedido de patente pro- vê métodos de determinação de uma sequência de aminoácidos de um polipeptídeo que compreendem (i) colocar um polipeptídeo em contato com um ou mais reagentes de afinidade marcados que se |i- gam seletivamente um ou mais tipos de aminoácidos terminais em um terminal do polipeptídeo. Em algumas modalidades, os métodos com- preendem ainda (ii) identificar um aminoácido terminal (por exemplo, o aminoácido N-terminal ou o C-terminal) no terminal do polipeptídeo pela detecção de uma interação do polipeptídeo com um ou mais rea- gentes de afinidade marcados. Em algumas modalidades, os métodos compreendem ainda (ili) remover o aminoácido terminal. Em algumas modalidades, os métodos compreendem ainda (iv) repetir (i)-(ili) uma ou mais vezes no terminal do polipeptídeo para determinar uma se- quência de aminoácidos do polipeptídeo.
[0016] Em algumas modalidades, os métodos compreendem ain- da, depois de (i) e antes de (ii), remover qualquer um de um ou mais reagentes de afinidade marcados que não ligam seletivamente o ami- noácido terminal. Em algumas modalidades, os métodos compreen- dem ainda, depois de (ii) e antes de (ili), remover qualquer um de um ou mais reagentes de afinidade marcados que se ligam seletivamente o aminoácido terminal.
[0017] Em algumas modalidades, a remoção de um aminoácido terminal (por exemplo, (ili)) compreende modificar o aminoácido termi- nal pelo contato do aminoácido terminal com um isotiocianato (por exemplo, isotiocianato de fenila), e colocar o aminoácido terminal mo- dificado em contato com uma protease que se liga especificamente e remove o aminoácido terminal modificado. Em algumas modalidades, a clivagem de um aminoácido terminal (por exemplo, (ili)) compreende modificar o aminoácido terminal pelo contato do aminoácido terminal com um isotiocianato, e submeter o aminoácido terminal modificado a condições ácidas ou básicas suficientes para remover o aminoácido terminal modificado.
[0018] Em algumas modalidades, a identificação de um aminoáci- do terminal compreende identificar o aminoácido terminal como sendo de um tipo de um ou mais tipos de aminoácidos terminais aos quais se ligam um ou mais reagentes de afinidade marcados. Em algumas mo- dalidades, a identificação de um aminoácido terminal compreende identificar o aminoácido terminal como sendo um tipo diferente de um ou mais tipos de aminoácidos terminais aos quais se ligam um ou mais reagentes de afinidade marcados.
[0019] Em alguns aspectos, o pedido de patente provê moléculas de reconhecimento de aminoácidos que compreendem um elemento de proteção (shielding), por exemplo, para melhorar a fotoestabilidade em reações de sequenciamento de polipeptídeos. Em alguns aspec- tos, o pedido de patente provê uma molécula de reconhecimento de aminoácido de Fórmula (1): A-(Y))-D (1), em que: A é um componente de ligação a um aminoácido compreen- dendo pelo menos um molécula de reconhecimento de aminoácido; em cada caso, Y é um polímero que forma um grupo de ligação cova-
lente ou não covalente; n é um número inteiro de 1 a 10, inclusive; e D é um componente de marcação compreendendo pelo menos um mar- cador detectável. Em algumas modalidades, D tem menos que 200 À de diâmetro. Em algumas modalidades, -(Y)n- tem pelo menos 2 nm de comprimento (por exemplo, pelo menos 5 nm, pelo menos 10 nm, pelo menos 20 nm, pelo menos 30 nm, pelo menos 50 nm ou mais de com- primento). Em algumas modalidades, -(Y)n- tem entre aproximadamen- te 2 nm e 200 nm de comprimento (por exemplo, entre aproximada- mente 2 nm e 100 nm, entre aproximadamente 5 nm e 50 nm ou entre aproximadamente 10 nm e 100 nm de comprimento). Em algumas modalidades, em cada caso, Y é independentemente uma biomolécula ou um polímero dendrítico (por exemplo, um poliol, um dendrímero). Em algumas modalidades, o pedido de patente provê uma composição que compreende a molécula de reconhecimento de aminoácido de Fórmula (1). Em algumas modalidades, a molécula de reconhecimento de aminoácido é solúvel na composição.
[0020] Em alguns aspectos, o pedido de patente provê uma molé- cula de reconhecimento de aminoácido de Fórmula (Il): A-Y'-D (11), em que: A é um componente de ligação a um aminoácido compreen- dendo pelo menos um molécula de reconhecimento de aminoácido; Y' é um ácido nucleico ou um polipeptídeo; D é um componente de mar- cação compreendendo pelo menos um marcador detectável. Em al- gumas modalidades, quando Y' é um ácido nucleico, o ácido nucleico forma um grupo de ligação covalente ou não covalente. Em algumas modalidades, desde que, quando Y' é um polipeptídeo, o polipeptídeo forma um grupo de ligação não covalente caracterizado por uma cons- tante de dissociação (Kp) inferior a 50 x 10º M. Em algumas modali- dades, a Kp é inferior a 1 x 10º M, inferior a 1 x 10º M, inferior a 1 x
10! M ou inferior a 1 x 10º? M.
[0021] Em alguns aspectos, o pedido de patente provê uma molé- cula de reconhecimento de aminoácido que compreende: um ácido nucleico; pelo menos uma molécula de reconhecimento de aminoácido anexada a um primeiro sítio de ligação no ácido nucleico; e pelo me- nos um marcador detectável anexado a um segundo sítio de ligação no ácido nucleico, onde o ácido nucleico forma um grupo de ligação covalente ou não covalente entre pelo menos uma molécula de reco- nhecimento de aminoácido e pelo menos um marcador detectável. Em algumas modalidades, o ácido nucleico compreende uma primeira fita de oligonucleotídeo. Em algumas modalidades, o ácido nucleico com- preende ainda uma segunda fita de oligonucleotídeo hibridizada com a primeira fita de oligonucleotídeo.
[0022] Em alguns aspectos, o pedido de patente provê uma molé- cula de reconhecimento de aminoácido que compreende: uma proteí- na multivalente compreendendo pelo menos dois sítios de ligação ao ligando; pelo menos uma molécula de reconhecimento de aminoácido anexada à proteína através de uma primeira porção de ligando ligado a um primeiro sítio de ligação ao ligando na proteína; e pelo menos um marcador detectável anexado à proteína através de uma segunda por- ção de ligando ligado a um segundo sítio de ligação ao ligando na pro- teína. Em algumas modalidades, a proteína multivalente é uma proteí- na avidina.
[0023] Em algumas modalidades, uma molécula de reconhecimen- to de aminoácido protegida (shielded) pode ser utilizada nos métodos de sequenciamento de polipeptídeos de acordo com o pedido de pa- tente, ou qualquer método conhecido na técnica. Deste modo, em al- guns aspectos, o pedido de patente provê métodos de sequenciamen- to de polipeptídeos (por exemplo, em uma reação de degradação do tipo Edman, em uma reação de sequenciamento dinâmico ou outro método conhecido na técnica) que compreendem colocar a molécula de um polipeptídeo em contato com uma ou mais moléculas de reco- nhecimento de aminoácidos protegidas do pedido de patente. Por exemplo, em algumas modalidades, os métodos compreendem colo- car a molécula de um polipeptídeo em contato com pelo menos uma molécula de reconhecimento de aminoácido que compreende uma proteção ou elemento de proteção de acordo com o pedido de patente, e detectar a associação de pelo menos uma molécula de reconheci- mento de aminoácido com a molécula do polipeptídeo.
[0024] Em alguns aspectos, o pedido de patente provê métodos de identificação de uma proteína de interesse em uma amostra mista. Em algumas modalidades, os métodos compreendem clivar uma amostra mista de proteínas para produzir uma pluralidade de fragmentos poli- peptídicos. Em algumas modalidades, os métodos compreendem ain- da determinar uma sequência de aminoácidos de pelo menos um fra- gmento polipeptídico da pluralidade em um método de acordo com os métodos do pedido de patente. Em algumas modalidades, os métodos compreendem ainda identificar uma proteína de interesse na amostra mista se a sequência de aminoácidos for exclusivamente identificável com a proteína de interesse.
[0025] Em algumas modalidades, os métodos de identificação de uma proteína de interesse em uma amostra mista compreendem clivar uma amostra mista de proteínas para produzir uma pluralidade de fra- gmentos polipeptídicos. Em algumas modalidades, os métodos com- preendem ainda marcar um ou mais tipos de aminoácidos na plurali- dade de fragmentos polipeptídicos com um ou mais marcadores lumi- nescentes diferentes. Em algumas modalidades, os métodos compre- endem ainda medir a luminescência ao longo do tempo de pelo menos um polipeptídeo marcado da pluralidade. Em algumas modalidades, os métodos compreendem ainda determinar uma sequência de aminoáci-
dos de pelo menos um polipeptídeo marcado com base na lumines- cência detectada. Em algumas modalidades, os métodos compreen- dem ainda identificar uma proteína de interesse na amostra mista se a sequência de aminoácidos for exclusivamente identificável com a pro- teína de interesse.
[0026] Deste modo, em algumas modalidades, uma molécula de polipeptídeo ou proteína de interesse a ser analisada de acordo com o pedido de patente pode ser de uma amostra mista ou purificada. Em algumas modalidades, a molécula de polipeptídeo ou proteína de inte- resse é obtida de uma amostra biológica (por exemplo, sangue, tecido, saliva, urina ou outra fonte biológica). Em algumas modalidades, a mo- lécula de polipeptídeo ou proteína de interesse é obtida da amostra de um paciente (por exemplo, uma amostra humana).
[0027] Os detalhes de certas modalidades da invenção são apre- sentados na Descrição detalhada de certas modalidades, como descri- tas abaixo. Outras características, objetos e vantagens da invenção ficarão evidentes a partir das Definições, Exemplo, Figuras e Reivindi- cações. Breve descrição dos desenhos
[0028] O técnico no assunto entenderá que as figuras, aqui descri- tas, são para fins de ilustração somente. Deverá ser entendido que, em certos casos, vários aspectos da invenção podem ser mostrados exagerados ou aumentados para facilitar o entendimento da invenção. Nos desenhos, caracteres semelhantes de referência geralmente refe- rem-se a características semelhantes, elementos funcionalmente se- melhantes e/ou estruturalmente semelhantes por todas as várias figu- ras. Os desenhos não estão necessariamente em escala, em vez dis- so, é colocada a ênfase na ilustração dos princípios dos ensinamen- tos. Os desenhos não se destinam a limitar de maneira alguma os pre- sentes ensinamentos.
[0029] As características e vantagens da presente invenção fica- rão mais evidentes a partir da descrição detalhada apresentada abaixo quando considerada em conjunto com os desenhos.
[0030] Na descrição das modalidades com referência aos dese- nhos, referências de direção ("acima", "abaixo", "em cima", "embaixo", "esquerda", "direita", "horizontal", "vertical" etc.) podem ser utilizadas. Tais referências destinam-se simplesmente a servir de ajuda ao leitor para visualizar os desenhos em uma orientação normal. Essas refe- rências de direção não se destinam a descrever uma orientação prefe- rida ou somente uma orientação de um dispositivo concretizado. Um dispositivo pode ser concretizado em outras orientações.
[0031] Como é evidente a partir da descrição detalhada, os exem- plos representados nas figuras e descritos mais detalhadamente para fins de ilustração por todo o pedido de patente descrevem modalida- des não limitantes e, em alguns casos, podem simplificar certos pro- cessos ou omitir características ou etapas com a finalidade de uma ilustração mais clara.
[0032] As Figuras 1A-1B mostram um exemplo de sequenciamen- to de polipeptídeos por detecção (Figura 1A) e análise (Figura 1B) das interações de ligação de moléculas isoladas.
[0033] As Figuras 10-1E mostram vários exemplos de reagentes de afinidade marcados e métodos de uso de acordo com o pedido de patente. A Figura 1C representa exemplos de configurações de rea- gentes de afinidade marcados, incluindo enzimas marcadas e aptâme- ros marcados que se ligam seletivamente a um ou mais tipos de ami- noácidos terminais. A Figura 1D representa genericamente um pro- cesso de sequenciamento de polipeptídeos à base de degradação, usando reagentes de afinidade marcados. A Figura 1É mostra um exemplo de sequenciamento de polipeptídeos, usando aptâmeros marcados, por ciclos repetidos de detecção, modificação e clivagem de aminoácidos terminais.
[0034] A Figura 2 mostra um exemplo de sequenciamento de poli- peptídeos em tempo real, usando exopeptidases marcadas que se li- gam seletivamente cada uma e clivam um tipo diferente de aminoácido terminal.
[0035] As Figuras 3A-3B mostram exemplos de sequenciamento de polipeptídeos em tempo real, avaliando interações de ligação de aminoácidos terminais e/ou internos com reagentes de afinidade mar- cados e um reagente de clivagem marcado (por exemplo, uma exopeptidase inespecífica marcada). A Figura 3A mostra um exemplo de sequenciamento em tempo real detectando uma série de pulsos em uma saída de sinal. A Figura 3B representa esquematicamente um processo de sequenciamento dependente de temperatura.
[0036] A Figura 4 mostra um exemplo de sequenciamento de poli- peptídeos em tempo real avaliando interações de ligação de aminoáci- dos terminais e internos com reagentes de afinidade marcados e uma exopeptidase inespecífica marcada.
[0037] As Figuras 5A-5SE mostram exemplos não limitantes de rea- gentes de afinidade marcados por intermédio de um elemento de pro- teção. A Figura 5A ilustra o sequenciamento de uma única molécula peptídica com um reagente de afinidade marcado por intermédio de uma ligação covalente convencional. A Figura 5B ilustra um sequenci- amento de uma única molécula peptídica com um reagente de afinida- de compreendendo um elemento de proteção. As Figuras 5C-5E ilus- tram vários exemplos de elementos de proteção de acordo com o pe- dido de patente.
[0038] A Figura 6 mostra um exemplo de identificação de polipep- tídeos com base em uma combinação única de aminoácidos detecta- dos em um polipeptídeo marcado.
[0039] A Figura 7 mostra um exemplo de sequenciamento de poli-
peptídeos detectando a luminescência de um polipeptídeo marcado que é submetido a ciclos repetidos de modificação e clivagem de ami- noácidos terminais.
[0040] As Figuras 8A-8C mostram um exemplo de sequenciamen- to de polipeptídeos por clivagem enzimática processiva de um polipep- tídeo marcado. A Figura 8A mostra um exemplo de sequenciamento por clivagem enzimática processiva de um polipeptídeo marcado por uma peptidase terminal imobilizada. A Figura 8B mostra um exemplo de sequenciamento por clivagem enzimática processiva de um poli- peptídeo marcado imobilizado por uma peptidase terminal. A Figura 8C ilustra esquematicamente um exemplo de um processo de sequen- ciamento em tempo real realizado de acordo com a Figura 8B.
[0041] A Figura 9 ilustra esquematicamente um exemplo de se- quenciamento por FRET baseado em cofator, usando uma protease dependente de ATP imobilizada, ATP marcado doador e aminoácidos marcados aceitadores de um substrato polipeptídico.
[0042] As Figuras 10A-10C mostram vários exemplos da prepara- ção de amostras e superfícies de poços de amostras para análise de polipeptídeos e proteínas de acordo com o pedido de patente. A Figura 10A representa genericamente um processo exemplar para preparar polipeptídeos modificados terminação de uma amostra de proteínas. À Figura 10B representa genericamente um processo exemplar para conjugar um ligante solubilizante a um polipeptídeo. A Figura 10C mostra um exemplo esquemático de um poço de amostra com as su- perfícies modificadas que podem ser utilizadas para promover a imobi- lização de uma única molécula em uma superfície de baixo.
[0043] A Figura 11 é um diagrama de uma linha ilustrativa do pro- cessamento de dados da sequência para analisar dados obtidos du- rante um processo de degradação de polipeptídeos, de acordo com algumas modalidades da tecnologia aqui descrita.
[0044] A Figura 12 é um fluxograma de um processo ilustrativo pa- ra determinar uma sequência de aminoácidos de uma molécula de po- lipeptídeo, de acordo com algumas modalidades da tecnologia aqui descrita.
[0045] A Figura 13 é um fluxograma de um processo ilustrativo pa- ra determinar uma sequência de aminoácidos representativa de um polipeptídeo, de acordo com algumas modalidades da tecnologia aqui descrita.
[0046] A Figura 14 é um diagrama em blocos de um sistema de computador ilustrativo que pode ser utilizado na implementação de al- gumas modalidades da tecnologia aqui descrita.
[0047] As Figuras 15A-15C mostram dados experimentais para conjugados peptídeo-ligante selecionados preparados e avaliados pa- ra melhorar a solubilidade proporcionada por diferentes ligantes solubi- lizantes. A Figura 15A mostra estruturas exemplares de conjugados peptídeo-ligante que foram sintetizados e avaliados. A Figura 15B mostra os resultados de LCMS que demonstram a clivagem do peptí- deo no N-terminal. A Figura 15C mostra os resultados de um experi- mento de carregamento.
[0048] A Figura 16 mostra um resumo das atividades de clivagem de aminoácidos de exopeptidases selecionadas com base em resulta- dos experimentais.
[0049] As Figuras 17A-17C mostra dados experimentais de um ensaio de conjugado corante/peptídeo para detectar e clivar aminoáci- dos terminais. A Figura 17A mostra exemplos de esquemas e estrutu- ras usados para realizar um ensaio de conjugado corante/peptídeo. À Figura 17B mostra os resultados de imagem do carregamento de pep- tídeo-ligante em poços de amostra em um ensaio on-chip. A Figura 17C mostra exemplos de traços de sinal que detectam o carregamento de peptídeos conjugados e a clivagem do aminoácido terminal.
[0050] As Figuras 18A-18F mostram dados experimentais de um ensaio de FRET com conjugado corante/peptídeo para detectar e cli- var aminoácidos terminais. A Figura 18A mostra exemplos de esque- mas e estruturas usados para realizar um ensaio de FRET com conju- gado corante/peptídeo. A Figura 18B mostra os resultados de imagem da FRET em diferentes momentos. A Figura 18C mostra a eficiência de corte nos diferentes momentos. A Figura 18D mostra o corte exibi- do em cada um dos diferentes momentos. A Figura 18E mostra resul- tados adicionais de imagem da FRET em diferentes momentos com uma prolina iminopeptidase de Yersinia pestis (yPIP). A Figura 18F mostra resultados de imagem da FRET em diferentes momentos com uma aminopeptidase de Vibrio proteolyticus (VPr).
[0051] As Figuras 19A-19H mostram dados experimentais para discriminação de aminoácidos terminais por um reagente de afinidade marcado. A Figura 19A mostra uma estrutura cristalina de uma proteí- na CIpS2 que foi marcada para esses experimentos. A Figura 19B mostra traços de intensidade de uma única molécula que ilustram a discriminação de aminoácidos N-terminais pela proteína CIpS2 marca- da. A Figura 19C é um gráfico mostrando a duração média do pulso de diferentes aminoácidos terminais. A Figura 19D é um gráfico mostran- do a duração média entre pulsos de diferentes aminoácidos terminais. A Figura 19E mostra gráficos ilustrando mais durações de pulsos dis- criminantes entre os diferentes aminoácidos terminais. As Figuras 19F, 19G e 19H mostram exemplos de resultados da análise de tempo de permanência demonstrando o reconhecimento de leucina por uma pro- teína CIpS de Thermosynochoccus elongatus (teCIpS). A Figura 19I mostra exemplos de resultados da análise de tempo de permanência demonstrando o reconhecimento diferenciável de fenilalanina, leucina, triptofano e tirosina por CIpS1 de A. tumefaciens. A Figura 19J mostra exemplos de resultados da análise de tempo de permanência demons-
trando o reconhecimento de leucina por CIpS2 de S. elongatus. As Fi- guras 19K-19L mostram exemplos de resultados da análise de tempo de permanência demonstrando o reconhecimento de prolina por GIDA4.
[0052] As Figuras 20A-20D mostram exemplos de resultados de reações de sequenciamento de polipeptídeos conduzidas em tempo real usando uma proteína de reconhecimento CIpS2 marcada e um reagente de clivagem aminopeptidase na mesma mistura de reação. À Figura 20A mostra dados do traço de sinal de uma primeira reação de sequenciamento. A Figura 20B mostra a estatística de duração do pul- so para os dados do traço de sinal mostrado na Figura 20A. A Figura 20C mostra dados do traço de sinais de uma segunda reação de se- quenciamento. A Figura 20D mostra a estatística de duração do pulso para os dados do traço de sinal mostrado na Figura 20C.
[0053] As Figuras 21A-21F mostram dados experimentais para identificação e clivagem de aminoácidos terminais por uma exopepti- dase marcada. A Figura 21A mostra uma estrutura cristalina de uma prolina iminopeptidase (yPIP) que foi marcada sítio-especificamente para esses experimentos. A Figura 21B mostra o grau de marcação para o produto proteico purificado. A Figura 21C é uma imagem de SDS-Page confirmando a marcação sítio-específica de yPIP. A Figura 21D é uma imagem superexposta do gel de SDS-Page confirmando a marcação sítio-específica. A Figura 21E é uma imagem de um gel co- rado com Coomassie confirmando a pureza do produto proteico mar- cado. A Figura 21F é um traço de HPLC demonstrando atividade de clivagem da exopeptidase marcado. A sequência YPYPYPK corres- ponde a SEQ ID NO: 82. A sequência PYPYPK corresponde a SEQ ID NO: 83.
[0054] As Figuras 22A-22F mostram dados de experimentos avali- ando o reconhecimento de aminoácidos contendo modificações pós- traducionais específicas. A Figura 22A mostra traços representativos que demonstraram reconhecimento de fosfo-tirosina por uma proteína contendo o domínio SH2; a Figura 22B mostra dados da duração dos pulsos correspondentes aos traços da Figura. 22A; e a Figura 22C mostra a estatística determinada para os traços. As Figuras 22D-22F mostram traços representativos dos experimentos de controle negati- vo.
[0055] A Figura 23 é um gráfico mostrando a duração mediana de pulsos de experimentos avaliando os efeitos dos penúltimos aminoáci- dos sobre a duração do pulso.
[0056] As Figuras 24A-24C mostram dados de experimentos ava- liando o reconhecimento simultâneo de aminoácidos por moléculas de reconhecimento diferencialmente marcadas. A Figura 24A mostra um traço representativo. A Figura 24B é um gráfico comparando dados obtidos sobre a duração do pulso durante esses experimentos para cada molécula de reconhecimento. A Figura 24C mostra a estatística de duração do pulso para esses experimentos.
[0057] As Figuras 25A-25C mostram dados de experimentos ava- liando a fotoestabilidade de peptídeos durante o reconhecimento da única molécula. A Figura 25A mostra um traço representativo do reco- nhecimento usando atClpS2-marcada com um corante —-2 nm do sítio de ligação ao aminoácido. A Figura 25B mostra uma visualização da estrutura da proteína CIpS2 usada nesses experimentos. A Figura 25C mostra um traço representativo do reconhecimento usando CIpS2 marcada com um corante >10 nm do sítio de ligação ao aminoácido através de um ligante DNA/proteína.
[0058] As Figuras 26A-26D mostram traços representativos de re- ações de sequenciamento de polipeptídeos conduzidas em tempo real em um chip de semicondutor de óxido de metal complementar (CMOS) usando uma proteína de reconhecimento CIpS2 marcada através de um ligante DNA/estreptavidina na presença de um reagente de cliva-
gem aminopeptidase.
[0059] A Figura 27 mostra traços representativos de reações de sequenciamento de polipeptídeos conduzidas em tempo real usando a proteína de reconhecimento atCIpS2-V1 marcada através de um ligan- te DNA/estreptavidina na presença do reagente de clivagem TET ami- nopeptidase de Pyrococcus horikoshii.
[0060] As Figuras 28A-28J mostram dados de traços representati- vos de reações de sequenciamento de polipeptídeos conduzidas em tempo real usando múltiplos tipos de exopeptidases com especificida- des de clivagem diferenciais. A Figura 28A mostra um traço represen- tativo de uma reação realizada com hTET exopeptidase, com as regi- ões expandidas do padrão de pulso mostradas na Figura 28B. A se- quência YAAWAAFADDDWK na Figura 28A corresponde a SEQ ID NO: 78. A Figura 28C mostra um traço representativo de uma reação realizada com hTET e com yPIP exopeptidases, com regiões expandi- das de padrão do pulso mostradas na Figura 28D, e traços representa- tivos adicionais mostrados na Figura 28E. A sequência FYPLPWP- DDDYK na Figura 28C corresponde a SEQ ID NO: 80. A Figura 28F mostra um traço representativo de uma reação adicional realizada com hTET e com yPIP exopeptidases, com regiões expandidas de padrão do pulso mostradas na Figura 28G, e traços representativos adicionais mostrados na Figura 28H. A Figura 28|l mostra um traço representativo de uma reação realizada com PfuTET e com yPIP exopeptidases, com regiões expandidas de padrão do pulso mostradas na Figura 28J. À sequência YPLPWPDDDYK nas Figuras 28F e 281 corresponde a SEQ ID NO: 81. Descrição detalhada da invenção
[0061] Aspectos do pedido de patente referem-se a métodos de sequenciamento e identificação de proteínas, métodos de sequencia- mento e identificação de polipeptídeos e métodos de identificação de aminoácidos e a composições para realizar tais métodos.
[0062] Em alguns aspectos, o pedido de patente refere-se à des- coberta de técnicas de sequenciamento de polipeptídeos que podem ser implementadas utilizando os instrumentos analíticos existentes com poucas ou sem modificações do dispositivo. Por exemplo, as es- tratégias anteriores para o sequenciamento de polipeptídeos envolvi- am o reciclo de diferentes misturas de reagentes de modo iterativo através de um vaso de reação contendo um polipeptídeo sendo anali- sado. Tais estratégias podem requerer a modificação de um instru- mento analítico existente, tal como um instrumento para o sequencia- mento de ácido nucleico, o qual pode não ser equipado com uma célu- la de fluxo ou aparelho existente capaz de reciclar reagentes. Os in- ventores reconheceram e apreciaram que certas técnicas de sequên- cia de polipeptídeos do pedido de patente do não requerem reciclo ite- rativo de reagentes, permitindo, assim, o uso de instrumentos existen- tes sem modificações significativas que poderiam aumentar o tamanho do instrumento. Deste modo, em alguns aspectos, o pedido de patente provê métodos de sequenciamento de polipeptídeos que permitem o uso de instrumentos menores de sequenciamento. Em alguns aspec- tos, o pedido de patente refere-se à descoberta de técnicas de se- quenciamento de polipeptídeos que permitem que análises genômicas e proteômicas sejam realizadas usando o mesmo instrumento de se- quenciamento.
[0063] Os inventores reconheceram ainda e apreciaram que inte- rações de ligação diferencial podem proporcionar uma abordagem adi- cional ou alternativa a estratégias convencionais de marcação no se- quenciamento de polipeptídeos. O sequenciamento convencional de polipeptídeos pode envolver a marcação de cada tipo de aminoácido com um marcador exclusivamente identificável. Esse processo pode ser trabalhoso e propenso a erro, pois existem pelo menos vinte tipos diferentes de aminoácidos naturais além de inúmeras variações pós- traducionais dos mesmos. Em alguns aspectos, o pedido de patente refere-se à descoberta de técnicas envolvendo o uso de moléculas de reconhecimento de aminoácidos que se associam com tipos diferentes de aminoácidos de modo diferencial e produzem assinaturas caracte- rísticas detectáveis indicativas de uma sequência de aminoácidos de um polipeptídeo. Deste modo, aspectos do pedido de patente provêm técnicas que não requerem a marcação dos polipeptídeos e/ou rea- gentes químicos agressivos usados em certas abordagens convencio- nais para o sequenciamento de polipeptídeos, aumentando, desse modo, o rendimento e/ou a exatidão das informações de sequências obtidas de uma amostra.
[0064] Em alguns aspectos, o pedido de patente refere-se à des- coberta de que uma reação de sequenciamento de polipeptídeos pode ser monitorada em tempo real usando somente uma única mistura de reação (por exemplo, sem requerer o reciclo iterativo de reagentes através um vaso de reação). Como detalhado acima, as reações con- vencionais de sequenciamento de polipeptídeos pode envolver expor um polipeptídeo a diferentes misturas de reagentes para reciclo entre etapas de detecção de aminoácidos e clivagem dos aminoácidos. Des- te modo, em alguns aspectos, o pedido de patente refere-se a um avanço no sequenciamento de nova geração que permite a análise de polipeptídeos pela detecção em tempo real dos aminoácidos do início ao fim de uma reação de degradação contínua. As abordagens para tal análise de polipeptídeos pelo sequenciamento dinâmico são descri- tas abaixo.
[0065] Como aqui descrito, em alguns aspectos, o pedido de pa- tente provê métodos de sequenciamento de polipeptídeos obtendo-se dados durante um processo de degradação do polipeptídeo e anali- sando os dados para determinar porções dos dados que correspon-
dem a aminoácidos que são expostos sequencialmente em um termi- nal do polipeptídeo durante o processo de degradação. Em algumas modalidades, as porções dos dados compreendem uma série de pul- sos de sinal indicativos da associação de uma ou mais moléculas de reconhecimento de aminoácidos com aminoácidos sucessivos expos- tos no terminal do polipeptídeo (por exemplo, durante uma degrada- ção). Em algumas modalidades, a série de pulsos de sinal correspon- de a uma série de interações de ligação reversível da única molécula no terminal do polipeptídeo durante o processo de degradação.
[0066] Um exemplo não limitante de sequenciamento de polipeptí- deos detectando-se interações de ligação de uma única molécula du- rante um processo de degradação do polipeptídeo é ilustrada esque- maticamente na Figura 1A. Um exemplo de traço de sinal (1) é mostra- do com uma série de painéis (Il) que representam diferentes eventos de associação em momentos que correspondem a mudanças no sinal. Como mostrado, um evento de associação entre uma molécula de re- conhecimento de aminoácido (forma pontilhada) e um aminoácido no terminal de um polipeptídeo (mostrado como contas em um fio) produz uma mudança na magnitude do sinal que persiste por uma duração de tempo.
[0067] Os painéis (A) e (B) representam diferentes eventos de as- sociação entre uma molécula de reconhecimento de aminoácido e um primeiro aminoácido exposto no terminal do polipeptídeo (por exemplo, um primeiro aminoácido terminal). Cada evento de associação produz uma mudança no traço de sinal (1) caracterizado por uma mudança na magnitude do sinal que persiste pela duração do evento de associa- ção. Deste modo, a duração do tempo entre os eventos de associação dos painéis (A) e (B) pode corresponder a uma duração de tempo du- rante a qual o polipeptídeo não está associado de modo detectável com uma molécula de reconhecimento de aminoácido.
[0068] Os painéis (C) e (D) representam diferentes eventos de as- sociação entre uma molécula de reconhecimento de aminoácido e um segundo aminoácido exposto no terminal do polipeptídeo (por exem- plo, um segundo aminoácido terminal). Como aqui descrito, um ami- noácido que é "exposto" no terminal de um polipeptídeo é um aminoá- cido que ainda está anexado ao polipeptídeo e que se torna o aminoá- cido terminal quando da remoção do aminoácido terminal anterior du- rante a degradação (por exemplo, quer isoladamente ou junto com um ou mais aminoácidos adicionais). Deste modo, o primeiro e o segundo aminoácido da série de painéis (Il) fornecem um exemplo ilustrativo de aminoácidos sucessivos expostos no terminal do polipeptídeo, em que o segundo aminoácido se tornou o aminoácido terminal quando da re- moção do primeiro aminoácido.
[0069] Como retratados genericamente, os eventos de associação dos painéis (C) e (D) produzem mudanças no traço de sinal (|) caracte- rizado por mudanças na magnitude que persistem por durações do tempo que são relativamente mais curtas do que aquela dos painéis (A) e (B), e a duração do tempo entre os eventos de associação dos painéis (C) e (D) é relativamente mais curta do que aquela dos painéis (A) e (B). Como aqui descrito, em algumas modalidades, quer uma ou ambas essas mudanças distintivas no sinal podem ser utilizadas para determinar padrões característicos no traço de sinal (1) que podem dis- criminar entre tipos diferentes de aminoácidos. Em algumas modalida- des, uma transição de um padrão característico para outro é indicativa de clivagem do aminoácido. Neste relatório descritivo, em algumas modalidades, clivagem de aminoácido refere-se à remoção de pelo menos um aminoácido de um terminal de um polipeptídeo (por exem- plo, a remoção de pelo menos um aminoácido terminal do polipeptí- deo). Em algumas modalidades, a clivagem de aminoácido é determi- nada por inferência com base em uma duração do tempo entre pa-
drões característicos. Em algumas modalidades, a clivagem de amino- ácido é determinada detectando-se uma mudança no sinal produzido pela associação de um reagente de clivagem marcado com um ami- noácido no terminal do polipeptídeo. À medida que os aminoácidos são clivados em sequência do terminal do polipeptídeo durante a de- gradação, é detectada uma série de mudanças na magnitude ou uma série de pulsos de sinal. Em algumas modalidades, os dados dos pul- sos de sinal podem ser analisados como ilustrado na Figura 1B.
[0070] Em algumas modalidades, os dados do sinal podem ser analisados para extrair informações sobre o pulso de sinal aplicando níveis limiares a um ou mais parâmetros dos dados do sinal. Por exemplo, o painel (Ill) representa um nível limiar de magnitude ("M.") aplicado aos dados do sinal do exemplo de traço de sinal (1). Em al- gumas modalidades, M. é uma diferença mínima entre um sinal detec- tado em um ponto no tempo e um basal determinado para um dado conjunto de dados. Em algumas modalidades, um pulso de sinal ("sp") é atribuído a cada porção dos dados que é indicativa de uma mudança na magnitude excedendo M. e persiste por uma duração de tempo. Em algumas modalidades, uma duração limite de tempo pode ser apli- cada a uma porção dos dados que satisfaz M. para determinar se um pulso de sinal é atribuído àquela porção. Por exemplo, artefatos expe- rimentais podem dar origem a uma mudança na magnitude excedendo M. que não persistem por uma duração de tempo suficiente para atri- buir um pulso de sinal com uma confiança desejada (por exemplo, eventos transitórios de que podem não ser discriminatórios para o tipo de aminoácido, eventos de detecção inespecíficos como difusão para uma região de observação ou colando o reagente em uma região de observação). Deste modo, em algumas modalidades, um pulso de si- nal é extraído dos dados do sinal com base em um nível limiar de magnitude e uma duração limite de tempo.
[0071] As informações sobre o pulso de sinal extraído são mostra- das no painel (Ill) com o exemplo de traço de sinal (1) sobreposto para fins ilustrativos. Em algumas modalidades, um pico na magnitude de um pulso de sinal é determinado calculando a média da magnitude de- tectada ao longo de uma duração de tempo que persiste acima de M.. Deve-se reconhecer que, em algumas modalidades, um "pulso de si- nal" neste relatório descritivo pode referir-se a uma mudança nos da- dos do sinal que persiste por uma duração de tempo acima um basal (por exemplo, dados brutos do sinal, como ilustrado pelo exemplo de traço de sinal (I)), ou a informações sobre o pulso de sinal extraídas da mesma (por exemplo, dados do sinal processados, como ilustrado no painel (IV)).
[0072] O painel (IV) mostra as informações sobre o pulso de sinal extraídas do exemplo de traço de sinal (1). Em algumas modalidades, as informações sobre o pulso de sinal podem ser analisadas para identificar tipos diferentes de aminoácidos em uma sequência com ba- se nos padrões característicos diferentes em uma série de pulsos de sinal. Por exemplo, como mostrado no painel (IV), as informações so- bre o pulso de sinal são indicativas de um primeiro tipo de aminoácido com base em um primeiro padrão característico ("CP1") e um segundo tipo de aminoácido com base em um segundo padrão característico ("CP2"). A título de exemplo, os dois pulsos de sinal detectados em momentos anteriores fornecem informações indicativos do primeiro aminoácido no terminal do polipeptídeo com base em CP, e os dois pulsos de sinal detectados em momentos posteriores fornecem infor- mações indicativas do segundo aminoácido no terminal do polipeptí- deo com base em CP».
[0073] Além disso, como mostrado no painel (IV), cada pulso de sinal compreende uma duração do pulso ("pd") que corresponde a um evento de associação entre a molécula de reconhecimento de aminoá-
cido e o aminoácido do padrão característico. Em algumas modalida- des, a duração do pulso é característica de uma taxa de dissociação da ligação. Além disso, como mostrado, cada pulso de sinal de um pa- drão característico é separado de outro pulso de sinal do padrão ca- racterístico por uma duração entre pulsos ("ipd"). Em algumas modali- dades, a duração entre pulsos é característica de uma taxa de associ- ação da ligação. Em algumas modalidades, uma mudança na magni- tude ("AM") pode ser determinada para um pulso de sinal com base em uma diferença entre o basal e o pico de um pulso de sinal. Em al- gumas modalidades, um padrão característico é determinado com ba- se na duração do pulso. Em algumas modalidades, um padrão carac- terístico é determinado com base na duração do pulso e duração entre pulsos. Em algumas modalidades, um padrão característico é determi- nado com base em qualquer um ou mais dentre duração do pulso, du- ração entre pulsos e mudança na magnitude.
[0074] Deste modo, como ilustrado pelas Figuras 1A-1B, em al- gumas modalidades, o sequenciamento de polipeptídeos é realizado detectando-se uma série de pulsos de sinal indicativos da associação de uma ou mais moléculas de reconhecimento de aminoácidos com aminoácidos sucessivos expostos no terminal de um polipeptídeo em uma reação de degradação contínua. A série de pulsos de sinal pode ser analisada para determinar padrões característicos na série de pul- sos de sinal, e a evolução temporal dos padrões característicos pode ser usada para determinar uma sequência de aminoácidos do polipep- tídeo.
[0075] Em algumas modalidades, a série de pulsos de sinal com- preende uma série de mudanças na magnitude de um sinal óptico ao longo do tempo. Em algumas modalidades, a série de mudanças no sinal óptico compreende uma série de mudanças na luminescência produzidas durante eventos de associação. Em algumas modalidades,
a luminescência é produzida por um marcador detectável associado com um ou mais reagentes de uma reação de sequenciamento. Por exemplo, em algumas modalidades, cada uma de uma ou mais molé- culas de reconhecimento de aminoácidos compreende um marcador luminescente. Em algumas modalidades, um reagente de clivagem compreende um marcador luminescente. Exemplos de marcadores luminescentes e o uso deles de acordo com o pedido de patente são fornecidos em outro lugar no presente.
[0076] Em algumas modalidades, a série de pulsos de sinal com- preende uma série de mudanças na magnitude de um sinal elétrico ao longo do tempo. Em algumas modalidades, a série de mudanças no sinal elétrico compreende uma série de mudanças na condutância produzida durante eventos de associação. Em algumas modalidades, a condutividade é produzida por um marcador detectável associado com um ou mais reagentes de uma reação de sequenciamento. Por exemplo, em algumas modalidades, cada uma de uma ou mais molé- culas de reconhecimento de aminoácidos compreende um marcador de condutividade. Exemplos de marcadores de condutividade e o uso deles de acordo com o pedido de patente são fornecidos em outro lu- gar no presente. Métodos para identificar moléculas únicas usando marcadores de condutividade foram descritos (ver, por exemplo, Publi- cação de Patente U.S. Nº 2017/0037462).
[0077] Em algumas modalidades, a série de mudanças na condu- tância compreende uma série de mudanças na condutância através de um nanoporo. Por exemplo, foram descritos métodos para avaliar inte- rações receptor-ligando usando nanoporos (ver, por exemplo, Thakur, A.K. & Movileanu, L. (2019) Nature Biotechnology 37(1)). Os invento- res reconheceram e apreciaram que tais nanoporos podem ser utiliza- dos para monitorar reações de sequenciamento de polipeptídeos de acordo com o pedido de patente. Deste modo, em algumas modalida-
des, o pedido de patente provê métodos de sequenciamento de poli- peptídeos compreendendo colocar uma única molécula polipeptídica em contato com uma ou mais moléculas de reconhecimento de ami- noácidos, em que a única molécula polipeptídica é imobilizada em um nanoporo. Em algumas modalidades, os métodos compreendem ainda detectar uma série de mudanças na condutância através do nanoporo indicativa da associação de uma ou mais moléculas de reconhecimen- to de aminoácidos terminais com aminoácidos sucessivos expostos em um terminal do único polipeptídeo enquanto o único polipeptídeo está sendo degradado, sequenciando, assim, a única molécula poli- peptídica.
[0078] Em alguns aspectos, o pedido de patente provê métodos de sequenciamento e/ou identificação de uma proteína individual em uma mistura complexa de proteínas ao identificar um ou mais tipos de ami- noácidos de um polipeptídeo da mistura. Em algumas modalidades, um ou mais aminoácidos (por exemplo, aminoácidos terminais e/ou aminoácidos internos) do polipeptídeo são marcados (por exemplo, direta ou indiretamente, por exemplo, usando um agente de ligação como uma molécula de reconhecimento de aminoácido) e as posições relativas dos aminoácidos marcados no polipeptídeo são determina- das. Em algumas modalidades, as posições relativas dos aminoácidos em um polipeptídeo são determinadas utilizando uma série de etapas de marcação e clivagem de aminoácidos. No entanto, em algumas modalidades, a posição relativa dos aminoácidos marcados em um polipeptídeo pode ser determinada sem remover aminoácidos do poli- peptídeo, mas pela translocação de um polipeptídeo marcado através de um poro (por exemplo, um canal proteico) e detectando um sinal (por exemplo, um sinal de FRET) vindo do(s) aminoácido(s) marca- do(s) durante a translocação através do poro a fim de determinar a po- sição relativa dos aminoácidos marcados na molécula do polipeptídeo.
[0079] Em algumas modalidades, a identidade de um aminoácido terminal (por exemplo, um aminoácido N-terminal ou um C-terminal) é avaliada e depois o aminoácido terminal é removido e a identidade do aminoácido seguinte no terminal é avaliada, e esse processo é repeti- do até que uma pluralidade de aminoácidos sucessivos no polipeptí- deo é avaliada. Em algumas modalidades, avaliar a identidade de um aminoácido compreende determinar o tipo de aminoácido que está presente. Em algumas modalidades, determinar o tipo de aminoácido compreende determinar a real identidade do aminoácido, por exemplo, determinando-se qual dos 20 aminoácidos naturais é o aminoácido terminal (por exemplo, usando um agente de ligação que é específico para um aminoácido terminal individual). Em algumas modalidades, o tipo de aminoácido é selecionado dentre alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, selenocisteí- na, serina, treonina, triptofano, tirosina e valina.
[0080] No entanto, em algumas modalidades, avaliar a identidade de um tipo de aminoácido terminal pode compreender determinar um subconjunto de aminoácidos potenciais que podem estar presentes no terminal do polipeptídeo. Em algumas modalidades, isso pode ser feito determinado que um aminoácido não é um ou mais aminoácidos es- pecíficos (e, portanto, poderia ser qualquer um dos outros aminoáci- dos). Em algumas modalidades, isso pode ser feito determinando qual de um subconjunto especificado de aminoácidos (por exemplo, com base em tamanho, carga, hidrofobicidade, modificação pós-traducio- nal, propriedades de ligação) poderia estar no terminal do polipeptídeo (por exemplo, usando um agente de ligação que se liga a um subcon- junto especificado de dois ou mais aminoácidos terminais).
[0081] Em algumas modalidades, avaliar a identidade de um tipo de aminoácido terminal compreende determinar que um aminoácido com-
preende uma modificação pós-traducional. Exemplos não limitantes de modificações pós-traducionais incluem acetilação, ADP-ribosilação, cli- vagem por caspases, citrulinação, formilação, glicosilação N-ligada, gli- cosilação O-ligada, hidroxilação, metilação, miristoilação, nedilação, nitração, oxidação, palmitoilação, fosforilação, prenilação, S-nitrosila- ção, sulfatação, sumoilação e ubiquitinação.
[0082] Em algumas modalidades, avaliar a identidade de um tipo de aminoácido terminal compreende determinar que um aminoácido compreende uma cadeia lateral caracterizada por uma ou mais propri- edades bioquímicas. Por exemplo, um aminoácido pode compreender uma cadeia lateral alifática não polar, uma cadeia lateral de carga po- sitiva, uma cadeia lateral de carga negativa, uma cadeia lateral aromá- tica não polar ou uma cadeia lateral polar sem carga. Exemplos não limitantes de um aminoácido compreendendo uma cadeia lateral alifá- tica não polar incluem alanina, glicina, valina, leucina, metionina e iso- leucina. Exemplos não limitantes de um aminoácido compreendendo uma cadeia lateral de carga positiva incluem lisina, arginina e histidina. Exemplos não limitantes de um aminoácido compreendendo uma ca- deia lateral de carga negativa incluem aspartato e glutamato. Exem- plos não limitantes de um aminoácido compreendendo uma cadeia la- teral aromática não polar incluem fenilalanina, tirosina e triptofano. Exemplos não limitantes de um aminoácido compreendendo uma ca- deia lateral polar sem carga include serina, treonina, cisteína, prolina, asparagina e glutamina.
[0083] Em algumas modalidades, uma proteína ou polipeptídeo pode ser digerido em uma pluralidade de polipeptídeos menores e as informações sobre a sequência podem ser obtidas a partir de um ou mais desses polipeptídeos menores (por exemplo, usando um método que envolve avaliar sequencialmente um aminoácido terminal de um polipeptídeo e remover aquele aminoácido para expor o aminoácido seguinte no terminal).
[0084] Em algumas modalidades, um polipeptídeo é sequenciado desde seu terminal amino (N). Em algumas modalidades, um polipep- tídeo é sequenciado desde seu terminal carbóxi (C). Em algumas mo- dalidades, um primeiro terminal (por exemplo, N ou C terminal) é se- quenciado como aqui descrito.
[0085] Neste relatório descritivo, sequenciar um polipeptídeo refe- re-se a determinar informações sobre a sequência para um polipeptí- deo. Em algumas modalidades, isso pode envolver determinar a iden- tidade de cada aminoácido na sequência para uma parte de (ou todo) o polipeptídeo. No entanto, em algumas modalidades, isso pode en- volver avaliar a identidade de um subconjunto de aminoácidos dentro do polipeptídeo (por exemplo, e determinar a posição relativa de um ou mais tipos de aminoácido sem determinar a identidade de cada aminoácido no polipeptídeo). No entanto, em algumas modalidades, as informações sobre o teor de aminoácidos pode ser obtida de um poli- peptídeo sem determinar diretamente a posição relativa de tipos dife- rentes de aminoácidos no polipeptídeo. O teor do aminoácido sozinho pode ser utilizado para inferir a identidade do polipeptídeo que está presente (por exemplo, comparando o teor do aminoácido a um banco de dados de informações de polipeptídeos e determinar qual/quais po- lipeptídeo(s) tem/têm o mesmo teor de aminoácido).
[0086] Em algumas modalidades, as informações sobre a sequên- cia para uma pluralidade de produtos polipeptídicos obtidos de um po- lipeptídeo mais longo ou proteína (por exemplo, através clivagem en- zimática e/ou química) podem ser analisadas para reconstruir ou inferir a sequência do polipeptídeo mais longo ou da proteína.
[0087] Deste modo, em algumas modalidades, um ou mais tipos de aminoácidos são identificados detectando-se a luminescência de um ou mais reagentes de afinidade marcados que se ligam seletiva-
mente a um ou mais tipos de aminoácidos. Em algumas modalidades, um ou mais tipos de aminoácidos são identificados detectando-se a luminescência de um polipeptídeo marcado.
[0088] Os inventores reconheceram ainda e apreciaram que as técnicas de sequenciamento de polipeptídeos aqui descritas podem envolver gerar novos dados do sequenciamento de polipeptídeos, es- pecialmente em contraste com as técnicas convencionais de sequen- ciamento de polipeptídeos. Assim, as técnicas convencionais para analisar os dados de sequenciamento de polipeptídeos podem não ser suficientes quando aplicadas aos dados gerados utilizando as técnicas de sequenciamento de polipeptídeos aqui descritas.
[0089] Por exemplo, as técnicas convencionais de sequenciamen- to de polipeptídeos que envolvem o reciclo iterativo de reagentes po- dem gerar dados associados com aminoácidos individuais de um poli- peptídeo sendo sequenciado. Em tais casos, a análise dos dados ge- rados pode simplesmente envolver determinar qual aminoácido está sendo detectado em um dado momento porque os dados sendo detec- tados correspondem a somente um aminoácido. Em contraste, as téc- nicas de sequenciamento de polipeptídeo aqui descritas podem gerar dados durante o processo de degradação de um polipeptídeo enquan- to múltiplos aminoácidos da molécula do polipeptídeo estão sendo de- tectados, resultando em dados em que pode ser difícil discernir as se- ções dos dados que correspondem a diferentes aminoácidos do poli- peptídeo. Deste modo, os inventores desenvolveram novas técnicas computacionais para analisar esses dados gerados pelas técnicas de sequenciamento de polipeptídeo aqui descritas que envolvem determi- nar seções dos dados que correspondem a aminoácidos individuais, tais como por segmentação dos dados em porções que correspondem a eventos de associação dos respectivos aminoácidos. Essas seções podem ser então analisadas para identificar o aminoácido que é detec-
tado durante aquelas seções individuais.
[0090] Como outro exemplo, as técnicas convencionais de se- quenciamento que envolvem usar marcadores exclusivamente identifi- cáveis para cada tipo de aminoácido podem envolver simplesmente analisar qual marcador está sendo detectado em um determinado momento sem levar em consideração qualquer dinâmica de como os aminoácidos individuais interagem com outras moléculas. Em contras- te, as técnicas de sequenciamento de polipeptídeo aqui descritas ge- ram dados indicando como os aminoácidos interagem com moléculas de reconhecimento. Como discutido acima, os dados podem incluir uma série de padrões característicos que correspondem a eventos de associação entre aminoácidos e suas respectivas moléculas de reco- nhecimento. Deste modo, os inventores desenvolveram novas técnicas computacionais para analisar o padrão característico e determinar um tipo de aminoácido que corresponde àquela porção dos dados, permi- tindo que uma sequência de aminoácidos de um polipeptídeo seja de- terminada pela análise de uma série de diferentes padrões caracterís- ticos. Reagentes de afinidade marcados e métodos de uso
[0091] Em algumas modalidades, são providos métodos que com- preendem colocar um polipeptídeo em contato com um reagente de afinidade marcado (também aqui referido como molécula de reconhe- cimento de aminoácido, que pode ou não compreender um marcador) que se liga seletivamente a um tipo de aminoácido terminal. Neste re- latório descritivo, em algumas modalidades, um aminoácido terminal pode referir-se a um aminoácido amino-terminal de um polipeptídeo ou um aminoácido carbóxi-terminal de um polipeptídeo. Em algumas mo- dalidades, um reagente de afinidade marcado liga-se seletivamente a um tipo de aminoácido terminal em relação a outros tipos de aminoá- cidos terminais. Em algumas modalidades, um reagente de afinidade marcado liga-se seletivamente a um tipo de aminoácido terminal em relação a um aminoácido interno do mesmo tipo. Em ainda outras mo- dalidades, um reagente de afinidade marcado liga-se seletivamente a um tipo de aminoácido em qualquer posição de um polipeptídeo, por exemplo, o mesmo tipo de aminoácido que um aminoácido terminal e um aminoácido interno.
[0092] Neste relatório descritivo, em algumas modalidades, um tipo de aminoácido refere-se a um dos vinte aminoácidos naturais ou um subconjunto de tipos dos mesmos. Em algumas modalidades, um tipo de aminoácido refere-se a uma variante modificada de um dos vin- te aminoácidos naturais ou um subconjunto de variantes não modifica- das e/ou modificadas dos mesmos. Exemplos de variantes modifica- das de aminoácidos incluem, entre outros, variantes modificadas pós- traducionalmente (por exemplo, acetilação, ADP-ribosilação, clivagem por caspases, citrulinação, formilação, glicosilação N-ligada, glicosila- ção O-ligada, hidroxilação, metilação, miristoilação, nedilação, nitra- ção, oxidação, palmitoilação, fosforilação, prenilação, S-nitrosilação, sulfatação, sumoilação e ubiquitinação), variantes modificadas quimi- camente, aminoácidos não naturais e aminoácidos proteinogênicos como selenocisteína e pirrolisina. Em algumas modalidades, um sub- conjunto de tipos de aminoácidos inclui mais de um e menos de vinte aminoácidos com uma ou mais propriedades bioquímicas semelhan- tes. Por exemplo, em algumas modalidades, um tipo de aminoácido refere-se a um tipo selecionado dentre aminoácidos com cadeias late- rais com cargas (por exemplo, cadeia lateral de carga positiva e/ou negativa), aminoácidos com cadeias laterais polares (por exemplo, ca- deia lateral polar sem cargas), aminoácidos com cadeias laterais não polares (por exemplo, cadeias laterais alifáticas e/ou aromáticas não polares) e aminoácidos com cadeias laterais hidrofóbicas.
[0093] Em algumas modalidades, os métodos aqui providos com-
preendem colocar um polipeptídeo em contato com um ou mais rea- gentes de afinidade marcados que se ligam seletivamente a um ou mais tipos de aminoácidos terminais. Como exemplo ilustrativo e não limitante, quando quatro reagentes de afinidade marcados são usados em um método do pedido de patente, qualquer um dos reagentes liga- se seletivamente a um tipo de aminoácido terminal que é diferente de outro tipo de aminoácido ao qual qualquer um dos outros três se liga seletivamente (por exemplo, um primeiro reagente liga-se a um primei- ro tipo, um segundo reagente liga-se a um segundo tipo, um terceiro reagente liga-se a um terceiro tipo e um quarto reagente liga-se a um quarto tipo de aminoácido terminal). Para fins dessa discussão, um ou mais reagentes de afinidade marcados no contexto de um método aqui descrito pode ser alternativamente referido como um conjunto de rea- gentes de afinidade marcados.
[0094] Em algumas modalidades, um conjunto de reagentes de afinidade marcados compreende pelo menos um e até seis reagentes de afinidade marcados. Por exemplo, em algumas modalidades, um conjunto de reagentes de afinidade marcados compreende um, dois, três, quatro, cinco ou seis reagentes de afinidade marcados. Em algu- mas modalidades, um conjunto de reagentes de afinidade marcados compreende dez ou menos reagentes de afinidade marcados. Em al- gumas modalidades, um conjunto de reagentes de afinidade marcados compreende oito ou menos reagentes de afinidade marcados. Em al- gumas modalidades, um conjunto de reagentes de afinidade marcados compreende seis ou menos reagentes de afinidade marcados. Em al- gumas modalidades, um conjunto de reagentes de afinidade marcados compreende quatro ou menos reagentes de afinidade marcados. Em algumas modalidades, um conjunto de reagentes de afinidade marca- dos compreende três ou menos reagentes de afinidade marcados. Em algumas modalidades, um conjunto de reagentes de afinidade marca-
dos compreende dois ou menos reagentes de afinidade marcados. Em algumas modalidades, um conjunto de reagentes de afinidade marca- dos compreende quatro reagentes de afinidade marcados. Em algu- mas modalidades, um conjunto de reagentes de afinidade marcados compreende pelo menos dois e até vinte (por exemplo, pelo menos dois e até dez, pelo menos dois e até oito, pelo menos quatro e até vinte, pelo menos quatro e até dez) reagentes de afinidade marcados. Em algumas modalidades, um conjunto de reagentes de afinidade marcados compreende mais de vinte (por exemplo, 20 a 25, 20 a 30) reagentes de afinidade. Deve ser reconhecido, no entanto, qualquer número de reagentes de afinidade pode ser utilizada de acordo com um método do pedido de patente para acomodar um uso desejado.
[0095] De acordo com o pedido de patente, em algumas modali- dades, um ou mais tipos de aminoácidos são identificados detectando- se a luminescência de um reagente de afinidade marcado (por exem- plo, uma molécula de reconhecimento de aminoácido compreendendo um marcador luminescente). Em algumas modalidades, um reagente de afinidade marcado compreende um reagente de afinidade que se liga seletivamente a um tipo de aminoácido e um marcador lumines- cente tendo uma luminescência que está associada com o reagente de afinidade. Dessa maneira, a luminescência (por exemplo, tempo de vida da luminescência, intensidade da luminescência e outras proprie- dades da luminescência descritas em outro lugar no presente) pode ser associado com a ligação seletiva do reagente de afinidade para identificar um aminoácido de um polipeptídeo. Em algumas modalida- des, uma pluralidade de tipos de reagentes de afinidade marcados po- de ser utilizada em um método de acordo com o pedido de patente, em que cada tipo compreende um marcador luminescente tendo uma luminescência que é exclusivamente identificável dentre a pluralidade. Os marcadores luminescentes adequados podem incluir moléculas luminescentes, como corantes fluoróforos, e são descritos em outro lugar no presente.
[0096] Em algumas modalidades, um ou mais tipos de aminoáci- dos são identificados detectando-se uma ou mais características elé- tricas de um reagente de afinidade marcado. Em algumas modalida- des, um reagente de afinidade marcado compreende um reagente de afinidade que se liga seletivamente a um tipo de aminoácido e um marcador de condutividade que se associa com o reagente de afinida- de. Dessa maneira, uma ou mais características elétricas (por exem- plo, carga, cor de oscilação da corrente e outras características elétri- cas) podem ser associadas com a ligação seletiva do reagente de afi- nidade para identificar um aminoácido de um polipeptídeo. Em algu- mas modalidades, uma pluralidade de tipos de reagentes de afinidade marcados pode ser utilizada em um método de acordo com o pedido de patente, em que cada tipo compreende um marcador de condutivi- dade que produz uma mudança em um sinal elétrico (por exemplo, uma mudança na condutância, como uma mudança na amplitude da condutividade e transições da condutividade de um padrão caracterís- tico) que é exclusivamente identificável dentre a pluralidade. Em algu- mas modalidades, a pluralidade de tipos de reagentes de afinidade marcados compreende cada um marcador de condutividade tendo um número diferente de grupos com carga (por exemplo, um número dife- rente de grupos com carga negativa e/ou positiva). Deste modo, em algumas modalidades, um marcador de condutividade é um marcador com carga. Os exemplos de marcadores com carga incluem dendríme- ros, nanopartículas, ácidos nucleicos e outros polímeros com múltiplos grupos com carga. Em algumas modalidades, um marcador de condu- tividade é exclusivamente identificável por sua carga final (por exem- plo, uma carga final positiva ou uma carga final negativa), por sua densidade de carga e/ou por seu número de grupos com carga.
[0097] Em algumas modalidades, um reagente de afinidade (por exemplo, uma molécula de reconhecimento de aminoácido) pode ser modificado pelo técnico no assunto empregando técnicas convencio- nalmente conhecidas. Em algumas modalidades, as propriedades de- sejáveis podem incluir uma capacidade para ligar-se seletivamente e com alta afinidade a um tipo de aminoácido somente quando este esti- ver localizado em um terminal (por exemplo, N-terminal ou C-terminal) de um polipeptídeo. Em ainda outras modalidades, as propriedades desejáveis podem incluir uma capacidade para ligar-se seletivamente e com alta afinidade a um tipo de aminoácido quando este estiver loca- lizado em um terminal (por exemplo, N-terminal ou C-terminal) de um polipeptídeo e quando este estiver localizado em uma posição interna do polipeptídeo. Em algumas modalidades, as propriedades desejá- veis incluem uma capacidade para ligar-se seletivamente e com baixa afinidade (por exemplo, com Kp próxima ou superior a 50 nM, por exemplo, entre aproximadamente 50 nM e 50 uM, entre aproximada- mente 100 nM e 10 UM, entre aproximadamente 500 nM e 50 UM) a mais de um tipo de aminoácido. Por exemplo, em alguns aspectos, o pedido de patente provê métodos de sequenciamento detectando-se interações de ligação reversível durante o processo de degradação de um polipeptídeo. Vantajosamente, tais métodos podem ser realizados utilizando um reagente de afinidade que se liga reversivelmente com baixa afinidade a mais de um tipo de aminoácido (por exemplo, um subconjunto tipos de aminoácidos).
[0098] Neste relatório descritivo, em algumas modalidades, os termos "seletivo" e "específico" (e variações dos mesmos, por exem- plo, seletivamente, especificamente, seletividade, especificidade) refe- rem-se a uma interação de ligação preferencial. Por exemplo, em al- gumas modalidades, um reagente de afinidade marcado que se liga seletivamente a um tipo de aminoácido liga-se preferencialmente a um tipo em relação a outro tipo de aminoácido. Uma interação de ligação seletiva discriminará um tipo de aminoácido (por exemplo, um tipo de aminoácido terminal) e de outro tipos de aminoácidos (por exemplo, outro tipos de aminoácidos terminais), tipicamente mais de aproxima- damente 10- a 100 vezes ou mais (por exemplo, mais de aproximada- mente 1.000 ou 10.000 vezes). Deste modo, deve-se reconhecer que uma interação de ligação seletiva pode referir-se a qualquer interação de ligação que seja exclusivamente identificável para um tipo de ami- noácido em relação a outros tipos de aminoácidos. Por exemplo, em alguns aspectos, o pedido de patente provê métodos de sequencia- mento de polipeptídeos obtendo-se dados indicativos da associação de uma ou mais moléculas de reconhecimento de aminoácidos com uma molécula de polipeptídeo. Em algumas modalidades, os dados compreendem uma série de pulsos de sinal que correspondem a uma série de interações de ligação reversível da molécula de reconheci- mento de aminoácido com um aminoácido da molécula do polipeptí- deo, e os dados podem ser utilizados para determinar a identidade do aminoácido. Assim, em algumas modalidades, uma interação de liga- ção "seletiva" ou "específica" refere-se a uma interação de ligação de- tectada que discrimina um tipo de aminoácido de outros tipos de ami- noácidos.
[0099] Em algumas modalidades, um reagente de afinidade mar- cado (por exemplo, uma molécula de reconhecimento de aminoácido) liga-se seletivamente a um tipo de aminoácido com uma constante de dissociação (Kp) inferior a aproximadamente 106 M (por exemplo, infe- rior a aproximadamente 107 M, inferior a aproximadamente 10º M, inferior a aproximadamente 10º M, inferior a aproximadamente 10º M, inferior a aproximadamente 10 M, inferior a aproximadamente 10 1? M até mesmo inferior a 10 M) sem significativamente ligação a ou- tro tipos de aminoácidos. Em algumas modalidades, um reagente de afinidade marcado liga-se seletivamente a um tipo de aminoácido (por exemplo, um tipo de aminoácido terminal) com uma Kp inferior a apro- ximadamente 100 nM, inferior a aproximadamente 50 nM, inferior a aproximadamente 25 nM, inferior a aproximadamente 10 nM ou inferior a aproximadamente 1 nM. Em algumas modalidades, um reagente de afinidade marcado liga-se seletivamente a um tipo de aminoácido com uma Kp entre aproximadamente 50 nM e 50 UM (por exemplo, entre aproximadamente 50 nM e 500 nM, entre aproximadamente 50 nM e 5 UM, entre aproximadamente 500 nM e 50 uM, entre aproximadamente uM e 50 UM ou entre aproximadamente 10 uM e 50 UM). Em algu- mas modalidades, um reagente de afinidade marcado liga-se seleti- vamente a um tipo de aminoácido com uma Kp de aproximadamente 50 nM.
[00100] Em algumas modalidades, um reagente de afinidade mar- cado (por exemplo, uma molécula de reconhecimento de aminoácido) liga-se seletivamente a dois ou mais tipos de aminoácidos com uma constante de dissociação (Kp) inferior a aproximadamente 106 M (por exemplo, inferior a aproximadamente 107 M, inferior a aproximada- mente 10º M, inferior a aproximadamente 10º M, inferior a aproxima- damente 10º M, inferior a aproximadamente 10** M, inferior a apro- ximadamente 10? M até mesmo inferior a 10º M). Em algumas mo- dalidades, um reagente de afinidade marcado liga-se seletivamente a dois ou mais tipos de aminoácidos com uma Kp inferior a aproximada- mente 100 nM, inferior a aproximadamente 50 nM, inferior a aproxima- damente 25 nM, inferior a aproximadamente 10 nM ou inferior a apro- ximadamente 1 nM. Em algumas modalidades, um reagente de afini- dade marcado liga-se seletivamente a dois ou mais tipos de aminoáci- dos com uma Kp entre aproximadamente 50 nM e 50 uM (por exemplo, entre aproximadamente 50 nM e 500 nM, entre aproximadamente 50 nM e 5 UM, entre aproximadamente 500 nM e 50 uM, entre aproxima-
damente 5 uM e 50 UM ou entre aproximadamente 10 uM e 50 UM). Em algumas modalidades, um reagente de afinidade marcado liga-se seletivamente a dois ou mais tipos de aminoácidos com uma Kp de aproximadamente 50 nM.
[00101] “De acordo com os métodos e composições aqui providos, a Figura 1C mostra vários exemplos de configurações e usos de reagen- tes de afinidade marcados. Em algumas modalidades, um reagente de afinidade marcado 100 compreende um marcador luminescente 110 (por exemplo, um marcador) e um reagente de afinidade (mostrado como formas pontilhadas) que se liga seletivamente a um ou mais ti- pos de aminoácidos terminais de um polipeptídeo 120. Em algumas modalidades, um reagente de afinidade é seletivo para um tipo de aminoácido ou um subconjunto (por exemplo, menos do que os vinte tipos comuns de aminoácidos) de tipos de aminoácidos em uma posi- ção terminal ou em ambos as posições terminal e interna.
[00102] Como aqui descrito, um reagente de afinidade (também co- nhecido como "molécula de reconhecimento") pode ser qualquer bio- molécula capaz de ligar-se seletiva ou especificamente a uma molécu- la em relação a outra molécula (por exemplo, um tipo de aminoácido em relação a outro tipo de aminoácido, tal qual uma "molécula de re- conhecimento de aminoácido" aqui citada). Em algumas modalidades, um reagente de afinidade não é uma peptidase ou não tem atividade de peptidase. Por exemplo, em algumas modalidades, os métodos de sequenciamento de polipeptídeos do pedido de patente envolve colo- car uma molécula de um polipeptídeo em contato com um ou mais re- agentes de afinidade e um reagente de clivagem. Em tais modalida- des, um ou mais reagentes de afinidade não têm atividade de peptida- se, e a remoção de um ou mais aminoácidos da molécula de polipeptí- deo (por exemplo, a remoção do aminoácido de um terminal da molé- cula de polipeptídeo) é realizada pelo reagente de clivagem.
[00103] Os reagentes de afinidade (por exemplo, moléculas de re- conhecimento) incluem, por exemplo, proteínas e ácidos nucleicos, que podem ser sintéticos ou recombinantes. Em algumas modalida- des, um reagente de afinidade ou molécula de reconhecimento pode ser um anticorpo ou uma porção de ligação ao antígeno de um anti- corpo, uma proteína contendo o domínio SH2 ou fragmento da mesma ou uma biomolécula enzimática, como uma peptidase, uma amino- transferase, uma ribozima, uma aptazima ou uma tRNA sintetase, in- cluindo aminoacil-!RNA sintetases e moléculas correlatas descritas no Pedido de Patente U.S. Nº 15/255 433, depositado em 02 de setembro de 2016, intitulado "Molecules and Methods for Iterative Polypeptide Analysis and Processing" (Moléculas e métodos para análise e pro- cessamento iterativo de polipeptídeos).
[00104] Em algumas modalidades, um reagente de afinidade ou molécula de reconhecimento do pedido de patente É uma proteína da via de degradação. Os exemplos e proteínas da via de degradação adequadas para uso como moléculas de reconhecimento incluem, en- tre outros, proteínas da via denominada regra N-terminal (N-end rule), como proteínas da via da regra Arg/N-terminal, proteínas da via da re- gra Ac/N-terminal e proteínas da via da regra Pro/N-terminal. Em al- gumas modalidades, uma molécula de reconhecimento é uma proteína da via da regra N-terminal selecionada dentre uma proteína Gid (por exemplo, proteína Gid4 ou Gid10), uma proteína UBR box (por exem- plo, UBR1, UBR2) ou fragmento proteico contendo o domínio UBR box da mesma, uma proteína p62 ou fragmento contendo o domínio ZZ da mesma e uma proteína CIpS (por exemplo, CIpS1, CIpS2).
[00105] Em algumas modalidades, um reagente de afinidade ou molécula de reconhecimento do pedido de patente é uma proteína CIpS, como CIpS1 de Agrobacterium tumifaciens, CIpS2 de Agrobacte- rium tumifaciens, CIDS1 de Synechococcus elongatus, CIpS2 de Syne-
chococcus elongatus, CIpS de Thermosynechococcus elongatus, CIpS de Escherichia coli ou CIpS de Plasmodium falciparum.
Em algumas modalidades, a molécula de reconhecimento é uma L/F transferase, como leucil/fenilalanil--|RNA-proteína transferase de Escherichia coli.
Em algumas modalidades, a molécula de reconhecimento é uma D/E leuciltransferase, como aspartato/glutamato leuciltransferase Bpt de Vibrio vulnificus.
Em algumas modalidades, a molécula de reconheci- mento é uma proteína UBR ou domínio UBR-box, como a proteína UBR ou o domínio UBR-box de UBR1 e UBR2 humanas ou UBR1 de Saccharomyces cerevisiae.
Em algumas modalidades, a molécula de reconhecimento é uma proteína p62, como proteína p62 de H. sapiens ou proteína p62 de Rattus norvegicus, ou variantes por truncamento das mesmas que incluem, no mínimo, um domínio ZZ.
Em algumas modalidades, a molécula de reconhecimento é uma proteína Gid4, como GIDA4 de H. sapiens ou GID4 de Saccharomyces cerevisiae.
Em algumas modalidades, a molécula de reconhecimento é uma proteína Gid10, como GID10 de Saccharomyces cerevisiae.
Em algumas mo- dalidades, a molécula de reconhecimento é uma N-meristoiltransfe- rase, como N-meristoiltransferase de Leishmania major ou N-meristoil- transferase NMT1 de H. sapiens.
Em algumas modalidades, a molécu- la de reconhecimento é uma proteína BIR2, como BIR2 de Drosophila melanogaster.
Em algumas modalidades, a molécula de reconheci- mento é uma tirosina quinase ou domínio SH2 de uma tirosina qui- nase, como domínio Fyn SH2 de H. sapiens, domínio SH2 de Src tiro- sina quinase de H. sapiens ou variantes dos mesmos, como superbin- der mutante triplo do domínio Fyn SH2 de H. sapiens.
Em algumas modalidades, a molécula de reconhecimento é um anticorpo ou frag- mento de anticorpo, como o fragmento variável de cadeia única (scFv) de anticorpo contra fosfotirosina ou outra variante de aminoácido modi- ficado pós-traducionalmente aqui descrita.
[00106] A Tabela 1 fornece uma lista de exemplos de sequências de moléculas de reconhecimento de aminoácidos.
Além disso, são mostradas as preferências de ligação a aminoácidos de cada molécula no que diz respeito à identidade do aminoácido em uma posição ter- minal de um polipeptídeo a menos que especificado o contrário na Ta- bela 1. Deve-se reconhecer que essas sequências e outros exemplos aqui descritos pretendem ser não limitantes, e moléculas de reconhe- cimento de acordo com o pedido de patente podem incluir quaisquer homólogos, variantes das mesmas, ou seus fragmentos que conte- nham, no mínimo, domínios ou subdomínios responsáveis pelo reco- nhecimento de peptídeos.
E | X |x x é | | < a a õ |< õ õ | E XT Zz «x = E E E E E E E E |& Es & |& s sz sz uu Ss uu uu sz sz â à Tr & É É 2 E 2 2 2 | 2 |à%X & |& E EX Ev E ylE |& = É S já |ó IZÉS ZÉ =X E | 23 o o o E Zo E Se g Z ER E | | =sm =s=s8 |4 à |EG o o o a o & & & o o t&ao |O E Z E E EE |FEoóçtóZ 3 S 58 E É E jozgk hbfbzoz8 £ 4 ES 3 |> || lp&> (RE BEE E a <a | E>3 |> & |E €$ |E | 308 IZo 20 E |€ E ZE - - - 332 332335 x R &< CHE uenTecsei cid, 3 28 Wu wu a gEraegassgeNssZ3ssa cs 2 ô& 6 Em Shu z2 26H27 2/29 o ig p = LX FE s=zt Es Csurls FE à sb LoL EZSXa3%X =L|)= o ã E XZE SCI EO EZX 5 É = EE 3X 3 ESET ES ER ES ES u 5 AaLjagzaz Keglâun ke Xe tIka Za o 9O/9LE/ou|& oo an SSIS Loss = gas 3 SN 33 EFE C22S 28 ÉXEs = aNs2oss ES CSS ES ESÍDAOS SBES S Cagi cias cases ESES 23120 o = =2/0 Ooo 7 IT É EXrmaraktreX>EEC EÉcC>2a>9 32/62 g< DEZ Os 2 < os oS 2H 2H 20/%É%O E ZCuX<Ek < Ca XE< 3X õ E vE SE ZESEUES SOTO ES EE XX vm OX QE BlE CX > | > & o & Sm uu E um SE Sh uu E 3 3 EEN Snsoo5 Zoo oonSs|5 ao Sd e! ENESESRSEERSSSEIES SER = < 2 < <C Ú = SssZ=2Bassea passes dra É Eu eceosEnos Ss Eee u|)2Z = vox uu vu OZ ec oo 0>3 vala fo o à > & oa Âo| 4 FT jo SD IDWI RO ho dE o v Se >> Oss 032/02 | >| 8 > EH 3653 & E Cc 3 S|3 3s SI 23 SE /OZ30 30 Faz Ss |g [SB SBS EPI ZE ZEBZ/DZ Se HAZE o | a Sa > SE gg Sl 2/5 E > 2rHIDOA = o E & 5 só sas a $a 5 S/S FS cLoÊ o 18 QRO OHIO 6 | DO mm o o Ww 2/0 Oo ST Z Be os GAR Br <P ER GS HDS [2º 2 62 21 2 I =X 2X 260 2 zo 2 o 2x 2X 20 25X eg jo ow o (= = O. 2 mo
TTENSSNSSNNNSAS o - o *. > ES - 2 2 Zn & Seg pp Db pop pr pe De > > | 2 5 ST B B B B B B B B B : Se = E BE E 3 3 3 2 |Z = |)Z = be À À || é || || || || nu WwW—
E E Y o = ld o. $ é |E 8 |8 |E jo à |8E€ |8 |8 o & É E E = & |& E FS < o Ss 3 SS 3 o Ss õ oO LIS Ss Ss = & e 8 e 8 8 Sis= | |S S Rol 2 o 8 E 8 |E [ôs/i8 Ss Ss Ss 3 |8 a ge |& | |3 |88/lS |é [BE 83 |8 | o VS = : & Sl E 2 $ E E S=Z/$88 |8 |8 o Ss 8 Ss 3/o 3 E/S Ss < x e 2) |O |o SE) Eslêziês $ |8 “o S/S | |S |O TESES | |É : ESSE Sat Eee ss ET & |& = FCP Nel SI5 CS n/P o css 82 ego 388 28/28 |8 |8 e e jà 2 5 e Ee js S5 ESSES ES 2h | 4S||5 Ss ds ES 5SSsE SCE TES And. Pg E O E/0 6 0 23/06 > <€ |O SS I< 0 /> 0/> 06 0 2/0 2
> = r g jo E rXZx 3 2 2 ZE 6273 88 | E 2 o Ss IT IT Esaf O E |É |EZ O jgE so > U CÊêXEZO Eos || j5S |3Z & É é XEX542 É9r 5 ÉS HEZSÉ IT 1 uu cs o E Oo = WC S5TLO 3 | > |[ EX E220 | FÉ] o do [TOY õ  O Urosogor ro” KR À o 22Eá Z >= = ETC og DEZ O EX FESS É |O jo EXSZEEÉES ESP 2 EX |FZuwÊ = o | IES EOuU ESTE EX ao zu E LL Dan E 3/% >" I Ss EHr2 = |& |& ZAUsZ>nEZa 2 kE2Z 1333 o EsgEeRosIO SE |2 |& É E | ESSA MENTES: AC 2 ES ÃÉO9 Z = € geo = L o m z22HZ Ss | à ESP osçõ Sa à sn na 2 7/9 PIGXEEGNSES E [HS EO = SER ÉH o |BE É 3 ESTE Ec 2 Eca dÉ>cúne & = <U XSóSEoâS ZH O ÉEmE GOTT = Ec =2oO=32/GO029o0ZYE Xu 3 & ESEGsGsISEZI RISO 336532 = ox as ZH ZeZEE SS >= oR2SSGZÉ 3 ot oz Er <ag=SE=ssSB CASES TOS ESTES Tan On Li =0OÉ|K 20 LUSO É BZ 3H 2 8 EEE ZE O5Sro gFos<x>siL 2H 22 /€H ado a B2émesoz 2 ESSrSZoOCSCOO 4 Z<T 6 ZEÉgesea Z je esBbrs oaOSIZARS BSS < O Tr ERES ZrEO Go = duXFX< Zug oO=5Z 574 E XXusSOo Ú = Fr O o nan lESsSvEovzErZ<2Z2em LI SÉ SU CFhoZoS SS SzgoossEÍi Tr FIN GHXEA ENRSRZ ECN Z3ESZZSIZ|S SOEISBaE SE SS sz 2X SL O SEX Tx as E SE5% ZE ZCIo o 0Z2g 9 SZ 2 é£nBZEgIra> UÊ>O zZ2Z23z no SEO Gxso|Z SO Ee BLEED ESH ss ssSBENES SIS 2 = z à Zz T e << oOwo & OX noa|lE 855 o < Fi CE OoÇXia x > o 4 SS Gobs iscas st SHI SSIS 285 Casca siss san Eazo ES ORS EH EIDZ OL SsrESUVSORZI OG CS XF HEHE S> O 03232 CE EX O 55 Z 22 Cas E3ro XsbkbobooErFEIrzab>zzCEZE2S REo><C Do sSóoTíTsIRPAÁSDO DONS Cs Suç|SÃOo3z Z<|3 S/S 24 FonEs EE S ES oO22/089026 3o=s=S EIS HFHNDE XII road o<ão o o o Z ON LOEX XX << w/X o oo Ss 3 US ao Ss Ig z LEG ISOS D = õ ScLS32ZZoOXCXLu£o CEWA E É Oz Z 3 SzZ o ZE OG IT CEL FOZ Ss wa ÉX ESTAS O SST S GRE SO 6So XE 2 SO EESC Taz co as aES Aço 8 E So oO>3kpOo EX O 00 Cm OR 0O0No ÉOCOML à =S == <=> >>=odoóo2 o T4 20 =228/=032Yv o nz | |E |2 e = 2 2 R $$) = = -. Er pp > > Tr FS r - E3E E EE | u É o au uu uu uu x o x o À, 2 2 $ O F F 3 = E : o g p o = = 8 8 |ã Es E, 8 8 8 se js 25 Ss 8 o S&S e [E |S o E 88 8 8 2 | |8 |E Es 2 s S 3 lg 8 E E 83 |8 lp |5 8 S - S 2 8 Ss É 3 = 2 E [Ss É |3 É 4 Es E ls FE Ss 8 o E =) ss 8 ç 8 Ê < ” s & > ? 3 83 à E | e olá |é | E 8 3 o o | o Sãeg = |8 | 585 EX || 8 | o Ss E 8 É = 5 |85S/8 | 8 |3 8% Egg à; Zz O SO oO |O 2: << E > 6/0 os nu é LE Zr< EZX< O TOO 8 8 ZX Z OCELISO OELI>37 o oBTE C <C o o OIZOÇ OIZOÇG > O = [A [5 3 223 à à 3 5 52993 [52993 à ESSES 2 É É Efpss FÉnsd 8 loESES 8 18 5 Seo22Z Sao22 O O % x o o wW 3O WwW 3O E 20685 6 > |> fgneo fgunso 3 ESSsg prev 2524 ESTSS Ez Fo fa a . Z - É O>r> 2 OP Se SL ODGOS FEEDS FICASSE AAA SS gw 3 gu EXIDa SE RS RENO ZE Soo ZE SOS >OL CF ES És É X> w ERA w ER Ds 3 E EZB3EE E osçgrosS joQguos En 6 E =>|E 252 E) CEREÃO RE EGO BSSSBRMANC DZ DZ DA228 03248 o 2 o D Dn & & E & > WA Wo mx mx oUEYUL oUEHuL 28 ESG BE dro| o SIS SIL CiEX BO RSRS 207oO EESHS SST Ze =SBoES ES ZE CESSA <ÉESA Belas euens co árdró EsdTà ESIESS oO horse ES WeCZTw WEST SskarfzzrZ> oO gGESWE GESGE
SE FEB OO PG ASAS SSB ESSA Zi kxms< 353 SS 6 HES2SZA WEST usos eHg o 2/32/2>3/23 |& Em |S É mM o3/P2O1U3oO 30/42/43 RE RETA Eglrrosgoooossaçno 0O370&%85 05 OT cessa rKo Ko 2oó320 Q23X2 o23rSs Scot oguhuçEsZEs SESPSE SEZPSE uv 23 2N au <guvbo Ao DQDEX2DHK jEXL2HK JuSBSDOoOSOSOZOZ rFrsSZ rcêssç Oq xe=> E ZE X&rHseke5 EFS05S6 CE7086 Eos so E ETES FO ES EmSOR gFmSSE Xo<c<<rjo oO | [o UmwgTE vdvmwÇeE HE OrSOo SE ZE SS ES rECa8Ba Caro S>çcoSGR EE XE XOx o 20o 20 EE E RSS T OZ Z/OE SBÉSO 3820 ao ds rorosõ co GEE Dm GQeEÊ o 5 20 28 x > x > õ o o > > SEAScHsEsbsHS 333288 33388 o ROX USOU US S93Iaã 39S5s CEA So Ss aSoaAo 296833 2963 ESlssdógoseçãs seóós Sd5508 ss bg SS o 6 SS 6 Élo XE 6 É Sn2%õ SH2E 2 3 9 o 2 7ZR A O AsIQOS CER OZ ACESO Z Ss GE Est assis] GE7SS5 4885 à ES exsz os = sds 23OE2Zg25o: & ESIESSaST 7/98 SE dsceailisoia o Oo. ww O = = Ss à Rg IR 8 ES Ss so z z 28 r r 8 > mx dr E > ; x 22) | $ é ls | |é> É > a 8 8g | |ê |ê vu Cu 3 tt |8%|1ã |8& | E SS Ss E ao o o GG Oo o” à | 88 x < < 8 3 |IES8 |g s s 85 : “E lg |8 e 8 T gr 5, / 2? o o Ea 8 [ESB E | bs Za? o s FEb:) o o É o T e S gRes | E 2, 5 Sa sES |? = =t 2 8 ex à BE$STZ ES |e 2 S28 |o Fe cg 28 |õo FR 2 Eçs € E ES/IES, IES ES ES |86 [SEIS 52LIES dé Zz x 58 já lo8/O E ão se 3 & 8 sos E $É$o
SE EILEZ CACOS: ESSZhHoOe SE uh Zz 200) 532 2 3É 8 a 31 DEPURoS SESSS83 ELOS & Às ESHO 2 Ir 3 o E oIZO SEuogxoo |O 23202 é $ Esesokr S2$SSS SEsúogS DES 21pel EEnSSÃS 3 50mms IES 2285328 ESESDO ER$Z30%ES CÃES É os O x 2-3 > + ô EsEcS> 2onsó=C DESSES 25d x OZ 0 Og s 83 E +10 a 38d SAE ÇOS DOE Zz à E IRS ESTÉCal 382 dS dé. & é dE 28 ESTES GE DSHAE ERG 288 JESÉ 225358 JESSE Ego
BERIL EFOGBE TESES E 3Sgçows EsSSROZ EEPGÃBS é503 ZÉ SO SELSSHO SESTÇÕ5ÃS 1233 O x (7) XX m EEEL OS a ERZ SE 330 S z 3 S a E Ó GB 2o CELS TELS É ESZ 8 Sos: STE ILB SEEÚSSO SIZSSA 2 So . SETE 6UZ SE ES TEU C E BHO SBE5XS BESE SETAS Ega dHo SS 85 28d Sh EITOVÍTZ Curas dE ê wX o Ea A | SEU Ç2ã3s 3 É EIÇO <= Xu = $ZX3SQ 2 ZE WZ35o SESTUESZ dX35DES + GT OXá SESUNZO AE OX 3 2 É ES EanoÇSão soX008S ES GEOUr a 21 887 SBHAÇHASR 315º ESRmOS E20200& SERGHAS * ESSO SE Zoo uu CEO A Ou = 883 ESSE GE BESOZ 5 2803 SÃs a 2 o Õ SE Cn São 88% EI BES CE sEZÕA 208 gBE FRSS- 14 225253 Esse Õ2a ZroS LEAL Z o Ex 568 ESsSRÃS 8% 35 22525 CER SRAN E=2&5Lô coz o = a uq EEX 38 ê FERZZ EnSSGUA DRE É ES: ES EnSO& Tr |Xz = 44 E4720%8 EXRASOT ES3335 SE ny > Eno FEL sSô à z : Zumo S$oH> 7 EE + EAoSO SBÉ2Ou UGOAS EE ao Ed GEEREERAZSZ SESX2OS Eroz Ó X CSrFZSoS o & 293 z : SL ETOXL > OAuY 33 E >ÇÃo EE $ SDS S2SÇâME FAZ O) O SS 06 3az2 OH IOIHTRIA,. 3a z>%a 20o a ET SISEGSOg|E 2 22853 506 Zhao ã FalzZ 2é 2OZX ã ZEGSSE sGsaerala + ZASTOA SE dgssdtda É ZE Edo ónIS ds ataçe: o 82 = FR 2% G Fo FE 3 E É3o 228239: 3 ÉsSse 6 |< | o : 8
[2] 2 à $5| |s ; oz : : | - : * = : : : 13 E 3 : n e Xu ss 7 x & E Cu : : Ss > v aa, er ; E : :
E 8 e : ! 2 2 E $ ê ê : ke) 3 : | o 2 3 : : o 8 : t E E 2; : : É os £ 2. W Ê & Ê & Ss s 2 uu os á o 021, pág. 154/53! Petição 870210038366, de 28/04/20 pé etiçã
ZE rm Ho q 8 8 |;g ESSSSE Espresso op É o jo = u ão . E | SÉLRa c>= 2 N39$0U |o jo E So SOZSSIHaAs ú | o jo ILESZ SZEOSCGTITO 8 o |O ESS3Z à lo8ZX To 8 E o CZHTZE sá 8 5 | GE ÉRO /GúpH AROS AT |: E E BFz835%0 dárzghoashs | € é Higass AidsIize dos |: > H=ÇZÇXrF> dEÍSSEGLTO|X o & |& E3É£533 DESTES Ea E z 53 oEZIHA ÉdRAOZZE 55 |6 É | Ez2233 ESscoEssãs |g <> 3 E£EFrDS BFT SUFISÁSZO S dê 8 ESsSscasâscssterEs |: [ = uu o a mwOZX 2 IT > SIS |E jaz n2Fu%4S ZESZZ Ê | =ZruZrÍZzouso a 94 o u o o HZ ÓOgLt EC 8 a LOL ILCILO OFsZ|L 8 = Zz O oZz ra = à cCroNSSSO CEL Z 2020 S z/6 | KERO FeoooogrEá=ZAaÇS é o Po axe SS & FoZXZS |e
2.3 5 JESSE oSs E roSasaço Ea | SÊ |; E=2ESziESco SEE ES | O = Wu E = 7 ES e sEississ ssa: |: 316 od SW >32€40QO3CaIEGS dO |S 3/8 Õ Ira ostagrZzo8Ls3ozEmER"o Ss uu gor >= ZÉ E > ; E |Z à OÉZE>3RO 2 | Fo |o CONES ZI ESSE OS OZ a 8 SB à SossomESSTENHO ES E É S Ee é GESSO TZ SS HSGS CS E EF rES Suba SE SUS 23/86 2 o asd SF aponosiccdzds | Ss PECESE XL a <o3ZgÉL $ S o ES ScakHECEE SS CSI go é E Ef EIsESSS SS ES PESCAR: |; = 203 av EE v = O 0 0/0 0 OZ Eu ns = Oo OO o « BecodegisssRcSSARE COS sp É & BEBES FES SS ASSES TOS RH À 3 Eabiees sia dEsIa taças & > Z > = a E SI ONANCcoaAajçnworrao <CVLZ TX oOZ3O d |J|i=z0 = 0 ==<r232729>2>006I0=s2/>20é0|s 2 E o o É = = o o 3 3 Oo. v wo o E BEER | bh É Ss g Ss Ss "- 5 58) x | SS = sn = 2 E | S a 8) E é |o o < 2 8 = o L o " o e & jó | S$ $ mom 2 o 5 O > gg |8 E Ss o ô o = O ES 8 |5 lg z ã & 33 x o 22 8 |º |8 8 E € SS Y x 8 S Z vRgo o o o = o 5 $|% 2)? É à l8eszs Ss õ 8 RS SE s : $ |&8;s 8 3/8 3S Ze & E 28/23 BE ET 8 38 o Esse o o a SE E EXE E 2 28 q 2 õ 6 QoS ES To: x 2º Zz Aos oXrizkEe ZzZzI mo rr EX
[00107] Deste modo, em algumas modalidades, o pedido de paten- te provê uma molécula de reconhecimento de aminoácido tendo uma sequência de aminoácidos selecionada na Tabela 1 (ou tendo uma sequência de aminoácidos com pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, 80-90%, 90-95%, 95-99% ou mais identidade de sequência de aminoácidos com uma sequência de ami- noácidos selecionada na Tabela 1). Em algumas modalidades, uma molécula de reconhecimento de aminoácido tem 25-50%, 50-60%, 60- 70%, 70-80%, 80-90%, 90-95% ou 95-99% ou mais identidade de se- quência de aminoácidos com uma molécula de reconhecimento de aminoácido listada na Tabela 1. Em algumas modalidades, uma molé- cula de reconhecimento de aminoácido é uma molécula modificada de reconhecimento de aminoácido e inclui uma ou mais mutações de aminoácidos em relação a uma sequência apresentada na Tabela 1.
[00108] Em algumas modalidades, uma molécula de reconhecimen- to de aminoácido compreende sequência tag (etiqueta) que provê uma ou mais funções além de ligação ao aminoácido. Por exemplo, em al- gumas modalidades, uma sequência tag compreende uma sequência de reconhecimento por biotina ligase que permite a biotinilação da mo- lécula de reconhecimento (por exemplo, incorporação de uma ou mais moléculas de biotina, incluindo biotina e porções bis-biotina). Exem- plos adicionais de sequências funcionais em uma sequência tag inclu- em tags de purificação, sítios de clivagem e outras porções úteis para purificação e/ou modificação de moléculas de reconhecimento. A Ta- bela 2 fornece uma lista de sequências não limitantes de sequências tag terminais, em que qualquer uma ou mais dessas podem ser utili- zadas em combinação com qualquer uma das moléculas de reconhe- cimento de aminoácidos do pedido de patente (por exemplo, em com- binação com uma sequência apresentada na Tabela 1). Deve-se reco- nhecer que as sequências mostradas na Tabela 2 pretendem não ser limitantes, e moléculas de reconhecimento de acordo com o pedido de patente podem incluir qualquer uma ou mais das sequências tag (por exemplo, tags His e/ou tags de biotinilação) no N- ou C-terminal de um polipeptídeo da molécula de reconhecimento, divididas entre o N- e C- terminal ou de outra forma rearranjadas como praticada na técnica.
uu u Zz o FE I o - Zz O yu = Zz O - À ZE 5 8 8 E Es 8 jp SS E <€ |< 8 o < o Mm 8 8 BE jô < LL oO O D < wu DP O oO uu u o O O O uu uu jZ O o oO u SE 8 E E E 38) 8 à 8 E 88 8 E 6
O O IX À O |O |u 1 = I e O |O |E E nm = oO BEE e E 8 O já é 4 o x O O lp E |X << o O 9 0/88 S o N lo << X 4 ÕÓ O É e | | uu o ul |uL uu O | kh Zz oO O O |E à o — Zz O w À E Z|Z oO = À ES 8 BB E aESNBRO E 8 E SEK RB | BE | GS o mw 2/9 D O õ < << LL |O |O O o < : ui mm & Ojo O O uj 2 uu & O j0 O O O uu = u un ZOO o O u = 9 0 4 Oo jo O PD 9 E Zz ZOO O oO Zz = = => O 10 O O O — 3) BEÊRB6 E E BE - 2 0 jo I IX Ss O |O |O [É |X IE |U |X O " 8 18 BE | I XE wo 8 XI E UU E 2 E 0 |O o 6 6/8 E|E EE ud E Z|8 E |m O |E À = E À GO SC S O |O |o |E E DU E SE O 28 O |O |O [E E Tv E 2 E 5/0 z|s DR | O E E GE 5 E 20 o Bs O O |O E E £ | O nn E 5 O o 8 O |O o É IX 5/0 o 2 o x o |) O 10 JO JO JO 4 JO 2 O 42 |O E (2) 2a. SS 5mBEBERF BE E | 6 : SkBR lg E RR o o | & EE) S S S 2 E /E/E|E|E E E E E Se ssSB 6 E |s x és Ss 2/2 T T T Wu o lh lá a | D D D sã) EEESE E 8 É So O o o E |E E E E 8115 ES EIFIS|S Z E js é Z E Ee de e | Wr r r
[00109] Em algumas modalidades, uma molécula de reconhecimen- to ou reagente de afinidade do pedido de patente é uma peptidase. Uma peptidase, também referida como protease ou proteinase, é uma enzima que catalisa a hidrólise de uma ligação peptídica. As peptida- ses digerem polipeptídeos em fragmentos menores e pode, ser em geral classificadas em endopeptidases e exopeptidases, que clivam uma cadeia polipeptídica na região interna ou terminal, respectivamen- te. Em algumas modalidades, o reagente de afinidade marcado 100 compreende uma peptidase que foi modificada para inativar a ativida- de de exopeptidase ou endopeptidase. Dessa maneira, o reagente de afinidade marcado 100 liga-se seletivamente, mas sem também clivar o aminoácido de um polipeptídeo. Em ainda outras modalidades, pode ser utilizada uma peptidase que não foi modificada para inativar a ati- vidade de exopeptidase ou endopeptidase. Por exemplo, em algumas modalidades, um reagente de afinidade marcado compreende uma exopeptidase marcada 102.
[00110] De acordo com certas modalidades do pedido de patente, os métodos de sequenciamento de proteínas podem compreender de- tecção iterativa e clivagem em uma extremidade terminal de um poli- peptídeo. Em algumas modalidades, pode-se utilizar exopeptidase marcada 102 como um reagente único que realizada ambas as etapas de detecção e clivagem de um aminoácido. Como representado gene- ricamente, em algumas modalidades, a exopeptidase marcada 102 possui atividade aminopeptidase ou carboxipeptidase, de tal modo que se liga seletivamente e cliva um aminoácido N-terminal ou C-terminal, respectivamente, de um polipeptídeo. Deve-se reconhecer que, em certas modalidades, a exopeptidase marcada 102 pode ser inativada cataliticamente pelo técnico no assunto de tal modo que a exopeptida- se marcada 102 retenha as propriedades de ligação seletiva para uso como um reagente de afinidade marcado 100 que não cliva, como aqui descrito.
[00111] Uma exopeptidase em geral requer que um substrato poli- peptídico compreenda pelo menos um grupo com amino livre em seu amino-terminal ou um grupo carboxila livre em seu carbóxi-terminal. Em algumas modalidades, uma exopeptidase de acordo com o pedido de patente hidrolisa uma liga perto ou em um terminal de um polipeptí- deo. Em algumas modalidades, uma exopeptidase hidrolisa uma liga- ção não mais de três resíduos desde o terminal de um polipeptídeo. Por exemplo, em algumas modalidades, uma única reação de hidrólise catalisada por uma exopeptidase cliva um único aminoácido, um di- peptídeo ou um tripeptídeo desde uma extremidade terminal do poli- peptídeo.
[00112] Em algumas modalidades, uma exopeptidase de acordo com o pedido de patente é uma aminopeptidase ou uma carboxipepti- dase, que cliva um único aminoácido de um amino- ou um carbóxi- terminal, respectivamente. Em algumas modalidades, uma exopepti- dase de acordo com o pedido de patente é uma dipeptidil-peptidase ou uma peptidil-dipeptidase, que cliva um dipeptídeo de um amino- ou um carbóxi-terminal, respectivamente. Em ainda outras modalidades, uma exopeptidase de acordo com o pedido de patente é uma tripeptidil- peptidase, que cliva um tripeptídeo de um amino-terminal. A classifica- ção das peptidases e das atividades de cada classe ou subclasse das mesmas é bem conhecida e descrita na literatura (ver, por exemplo, Gurupriya, V. S. & Roy, S. C. Proteases and Protease Inhibitors in Ma- le Reproduction. Proteases in Physiology and Pathology 195-216 (2017); e Brix, K. & Stócker, W. Proteases: Structure and Function. Capítulo 1). Em algumas modalidades, uma peptidase de acordo com o pedido de patente remove mais de três aminoácidos de um terminal do polipeptídeo. Deste modo, em algumas modalidades, a peptidase é uma endopeptidase, por exemplo, que cliva preferencialmente em po-
sições específicas (por exemplo, antes ou depois de um aminoácido em particular). Em algumas modalidades, o tamanho de um produto da clivagem de um polipeptídeo por atividade de endopeptidase depende- rá da distribuição de sítios de clivagem (por exemplo, aminoácidos) no polipeptídeo que está sendo analisado.
[00113] Uma exopeptidase de acordo com o pedido de patente po- de ser selecionada ou modificada com base na direcionalidade de uma reação de sequenciamento. Por exemplo, em modalidades de sequen- ciamento de um amino-terminal para um carbóxi-terminal de um poli- peptídeo, uma exopeptidase compreende atividade aminopeptidase. Por outro lado, em modalidades de sequenciamento de um carbóxi- terminal para um amino-terminal de um polipeptídeo, uma exopeptida- se compreende atividade carboxipeptidase. Os exemplos de carboxi- peptidases que reconhecem aminoácidos carbóxi-terminais específi- COS, as quais podem ser utilizadas como exopeptidases marcadas ou inativadas a serem usadas como reagentes de afinidade marcados que não clivam aqui descritos, foram descritos na literatura (ver, por exemplo, Garcia-Guerrero, M.C., et al. (2018) PNAS 115(17)).
[00114] As peptidases adequadas para uso como reagentes de cli- vagem e/ou reagentes de afinidade (por exemplo, moléculas de reco- nhecimento) incluem aminopeptidases que se ligam seletivamente a um ou mais tipos de aminoácidos. Em algumas modalidades, uma mo- lécula de reconhecimento aminopeptidase é modificada para inativar a atividade aminopeptidase. Em algumas modalidades, um reagente de clivagem aminopeptidase é não específico de tal modo que cliva a maioria ou todos os tipos de aminoácidos de uma extremidade termi- nal de um polipeptídeo. Em algumas modalidades, um reagente de clivagem aminopeptidase é mais eficiente na clivagem de um ou mais tipos de aminoácidos de uma extremidade terminal de um polipeptídeo em comparação a outros tipos de aminoácidos na extremidade termi-
nal do polipeptídeo. Por exemplo, uma aminopeptidase de acordo com o pedido de patente cliva especificamente alanina, arginina, asparagi- na, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histi- dina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, seleno- cisteína, serina, treonina, triptofano, tirosina e/ou valina. Em algumas modalidades, uma aminopeptidase é uma prolina aminopeptidase. Em algumas modalidades, uma aminopeptidase é uma prolina iminopepti- dase. Em algumas modalidades, uma aminopeptidase é uma amino- peptidase específica para glutamato/aspartato. Em algumas modalida- des, uma aminopeptidase é uma aminopeptidase específica para me- tionina. Em algumas modalidades, uma aminopeptidase é uma amino- peptidase apresentada na Tabela 3. Em algumas modalidades, um reagente de clivagem aminopeptidase cliva um substrato peptídico como apresentado na Tabela 3.
[00115] Em algumas modalidades, uma aminopeptidase é uma aminopeptidase inespecífica. Em algumas modalidades, uma amino- peptidase inespecífica é uma zinco metaloprotease. Em algumas mo- dalidades, uma aminopeptidase inespecífica é uma aminopeptidase apresentada na Tabela 4. Em algumas modalidades, uma aminopepti- dase inespecífica cliva um substrato peptídico como apresentado na Tabela 4.
[00116] Deste modo, em algumas modalidades, o pedido de paten- te provê uma aminopeptidase (por exemplo, molécula de reconheci- mento aminopeptidase, reagente de clivagem aminopeptidase) tendo uma sequência de aminoácidos selecionada na Tabela 3 ou Tabela 4 (ou tendo uma sequência de aminoácidos com pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, 80-90%, 90-95%, 95- 99% ou mais identicidade de sequência de aminoácidos com uma se- quência de aminoácidos selecionada na Tabela 3 ou Tabela 4). Em algumas modalidades, uma aminopeptidase tem 25-50%, 50-60%, 60-
70%, 70-80%, 80-90%, 90-95% ou 95-99% ou mais identidade de se- quência de aminoácidos com uma aminopeptidase listada na Tabela 3 ou Tabela 4. Em algumas modalidades, uma aminopeptidase é uma aminopeptidase modificada e inclui uma ou mais mutações de amino- ácidos em relação a uma sequência apresentada na Tabela 3 ou Ta- bela 4.
sí 2 uu < 2Écsatiso piso ctdsE: ANE 3XE Gisis0tada 275 co 2d cddes IH 833 SRS eEçedS sz ot 2238 FINAS SEX 4% > O SESGTSOS = SESC SsES & LL Zz aZ72É o o 2EZZ sas Hs ZESTAZ CY > | so F39 < ze TESUSDATÕS 320 pD2tos SI LGsESAÇSOS ES GTra: FND So Bsçãe zão0s ÁS ES308a8 SOSEBTIÃS ES = OS" a 3 255 52so x o 6312: 2o I4$3 FIZ diÁSEEE mHESOZO 20 nom EEEZaÇÃOS CET DIE X di I sAsddeL > EE Z2225O Drusugêsddds: e ussg sãos EROIgRESUS: sózARgSSo: CasSEcDS do 2 bs ÉcdGs ES E EXGOra SENHAS FEZ Qu ZS Zz2< SER x eus gT oO ato? CEO á DÊÉÊSB EStrOo ZE Rá L nu = XL IO Sesálioz É e RiRSBS nas: EIA: A s0DtdadandsS EodsEsiãat id dd i2des 5Z2 ETIEZ I 2338 dn > O CE SÊ Es & SRhasSd ic: SOL ESez SEESCGAdEARcL SO EGEZEE c233EdGSSdE Ss SSEESÃAS Ensinos ELSFr Eos E5aÃão THA s ão Z2or? TUDO & s 252825? dE sEsRisccdds uy o CESSET| é du Gis 2dsdos: ses B<dse ço dA ciRdsdáRE:s HZro&s ur Eoiiiddedinstio: aISZ : ei do 8 io O S ndo = SzZ%2 4 o] 63 Z| O x oo = AA AAA Fo ES LDSDSoS As39 3l5286gs o up O o |s TA o <£ lo AAA = PD 2 An oo o E NO jo sous ma ceia Eed ido: n od o 2 edited tda! = o td ssdoo Sigo HINO 2 9923 FILTER E mM Z2|Y areas = jo FISS=aU o sui o > 3 e Õ o E N o v< + o 3 se z Õ EE =P co 28 & So S 28 ê SE &| | E EE E = z3—= Ss < E E q as ag iz = es 5 à j o no E Ez Petição s o & OU 'etição 870210038366, de É 4 z & 5 É 6, de 28/04/2021, pá; 20932 Es . pág. 164/530 o E 8 2 &
on<vouº? lou> sur Z GENCAÉ esoio PESSES COoOs> FF S/ UU Fr E > uu oo a x OuUZuE CESSE SAS ras D=O 322 ose ES? OSSTES >$IT<O0Z Eras OQOrErag<or <> <S 3 Sóiso CP2>360Huy wWESZTUECE |< S s2oruto na >3Xs2>O uaçX= >úgsto HOogaIasgL 20x QOX,s2IX> ZI4Aaos< Z<$S<OoO 2$Z2Yoã & Wu > nx =x 53282; 22 Baddos HMFaoaççoê < | mO >| 2385 ro > Ora 2S < « & o L oHSS2> ES B3dszã EO Zzz <L<p 3) con <ZmsS FÍ6S EISTOXE IZUuGrZ SST Qoxrsor Sacasdosãs EZX OSisz « DICXCLLHSÃHMO 240 500 >LVCTZwXXUL<UH 2DÍCICL F3SSLTZZ22SS CHESTER wu Fere SAlEaZa Po SGuZ AQuuCE<,LUOoOZzZ 2uo52S$ C>rovuoIdowoio EX<roSÉ II OPpAZ WWE Z2 H$SDZ resoNójigqsL2 uz TÍu SrEZES É DOXF lALISS9S o XÊêr >= o a ú ESsnSsdgogsak pD2DPXE<Z a FIT ZEoxyoEdLiuçoooosE SHP&SgH zen geros=ss < Fr < O DIE HFLZ0%]+3 ESrpErsPaozaoro /fozáraik <Q So çrrH<$OCio 1132203 XxX o 286 Aor>Z SO =>XÉXu x g <> <CILERAT>STão SZOZas dA Ea tiçãado xD FEV RIZ$O &LZ2TrS2 SIX LZOXE o A x Lu >3 4 um uu Sms orAMeDSCEESSZRO Sri oAsIE=Xto>sLoOrZ3S9 SEO IroZzgoorsLANOSçEXrTZ 3I4L03TZ E) = 2 = O ww XX x < VII — 2 ESSES co SN sdztso CER Scr Da>=SzoE)3 29054 E CZEISALLE ZZTLCLEESZOzZz23LZY" ZEZTruECS CON II ZCO2SS3A Hd > oOoOo>7-íu o IIRGTIZESSE rosto S PESE SAÇSEEadaRSTITrO NE Ss OGCz>3o0oAauu NICE ílbogarnsos 3 PESOS Euasa rio, & ETSSFoosszZSZ É Cofisos o o 2/8 = s (7 o & o FE 2 é = v o Bs so à as & o os FE fo es 8 2L ES os o E E e E ES E ge E 6 E wo EL wo 2 2 E y oo co 6 STE 7? $7 z2 1838 = 38 x 8
Jmu30O0uwu AX rX 2Q37n Z07Se Boss Bose MSOrTÉ |-E25 3329 mM X<Xfo ECT = 38 = xE 024233 3o%> Zuasra 0>22% ESZ& — SYUG<Z 2087 Fogo WÉELOU wWXZUu Los2 ZESAE rq3hã3 Z3ER WEÇGITS LZvZ FA Err WHOSvT EOOL ZTE SoSXX CWCáoxr SosI<o Oz06ô EX 2x Ear Bi32 BS55 SarRH EXZS Fio>3- oº20v? uu U>=> <FXTS$3 Eos n2Z<Z cG>SX zE<x 5ãSto Sosa >UEH>E Qojs= ELES 5So O ES sos713 o Oxo! OoZEt o ECz2F pozgz SGEIE MSrEzZESEZ2O SEU rIZ2&t<z2 23825 ESUTETENT EOoOnmus|E 263 PrSsS= lEszrógsedos — =
FETO AEXEDZORES Ú> >=" Zz ZA E o = ECmxr JGECA 2>7>Qq IT x 2º si 2 2ã= E[Sssscopsa& Zg 2432 x u< 34 UXSUu > SOZE3SO Lr>zio eES<IMESTS CCZ Es UU 8253 ESDZS Adao ES é CEFrE<aS=>2>353 > I2º x asoto>r2 Erçso ofmecranás ouUGÉZ LSUoQo2SnDESZXE oNwxçu CoQeo oO HA Z2ESCEr KXASSASEORE HSSs4 EronsOz$oú =7[7r29g SESC EÇÁÓRZO Exmáé>S EKoldo<oriImDZ 385 Srss78dssS <zZzr < cs EESS5 DISSE TORO & EsZD EXISTA NIOSE Ss O É COÇFpX< 2 ESSIESEOTZÓNSADA 3 ESP ru Eae Irmog uUo NO Z2E<>Or>23O<>>2ÓOL3>3 a. og 25 s 8 o 33 FR : 2 8 BE = ao = o FR os co FE 8 E ço ES 3 £>2 ESSE sê = o o 28 o RS à E 2 822 £EZo os ez su Ss z EX x 8êE E n= 2aXrL<todz< IrFSSEESSSADÉS SELIC SEaLsOo So) SFror"ty Soco AmXLoOÇóLCOg2DITOZ ED2S28SEITOLNZES
CS RR TIENSO Som >sASsçuojSãs DOGS ao ZROLçgoa DZ as aQuCfLea Sao umELCÁZ IS SOM
ERESEIT IADE o - sNTUS$SIL LL < uA= Zz POTES SIOSEoSs risZzuL>7S32SO 2 TB5SHEtoTEISÉ wu XY = - x OE dIGSSE=SANTZOSTAT CEZHESPREFÍCAaSuo zur ux o Wu <> < = SC uUo orã SSma232ISHZIZOZEA CSSsBDRS da TTOSS o a E cogroEogEsESda CUSCO rFIEOLUZSZ <ECErEugFE£<OoS 8 = < uu [OB]
IESIEZEDCOSOXIÃO APrz7ZzO GH AIS OoOuLXY cru goHiêgÀgrITS%<sS Ex 2º Creio saIsSÃSOo0O SC <ZE OL o3u 2! laEgSssopTaiiad S cost SSGaoaSSÉ O Z>> o SI3ZZ7S 2 ESCHSCHEZETDSS S ISTC200Z0ZTGHSZ=Z o =>3 <aZ2SIuU5Ç>3Ç900oYL 2 aOZEZ7ELEnUrZGSZ2ZU 8 góscsatsonEomatdo 8 CHuESOLTZZZ7 CEE >uwrFOoOxvuwuk> oE< o OVLCzZoInNkK<CEFrROG o IECYCrãoszoadazaçmsÁúÉ n rIE<r e çreou=ÉlsTIZ 38 TCêsEXTLES PP IRZ2230% 2, EsscópasoÉsiiz & E PERFIS Zdórzç ita o E o W > HR LL az 2 22 SEGAZeoE]
E EITFISRADAZGEVUIE Sh E>Fo<xiFrosSáa>>0 o BS jo ne. õ sx É gê)s Go =
E = & 8)
DA o 3 8 3 2 z2 E o 2 o no x Wo Wu És v o 2 So o PT E £E Oo 2 j EE fz j<Ss vu 20 RH = n2
SEBQUSSGEZIPE ZS2QZSL=ZO0ZOZECZ ZECISSFIGEGZHFÍSbL ESA Sez0oEsszá uSszZ0rávosssoe OrIErZOÇG=ZEBE ELSZ => <>2&tçxOÉ
SSERITIIIA IES oocognoTuÁZ ES ZEZÃO >OYVX>rs E EZN< OIE ZOSIapodasy PITags Nossos: 3e€OLónCCeAzsãos E EcEaXEZOTZESO ESXoZssSNSLasO] ox<ofrd sao uÇax zo ErTSSZ02STY Sasaps Htínctz < IX uu s sS>oCosEoAnLhTEZS cEESIÁGSNTNAÇãio ZzhHOoOÇCQUAÇSGAOOZE CohruISOgEAZo hu 2ruczcz2zzHSos >= õ >EzZ<Cg<XvU EIXO PsosZWE<SLEIIT<UOSS ECuSSZOSOCRLIDDSE >o0202Ç0ZErZoOoA EsosESOSSoEaDÉ uLZHo9O37zZ20ÇLUVE= oc<GoG>oAacEXNSZhNoU cCISGIGÉEFGOZE=2ZZ AQvNÇa& EQ XNX>>36f 32 In>MSHÇNZgLáSZzZ>= zS tnusiIoOSCahzOS3 zZLECÇOoOSETÍSaoDSÃO EENSSESCRZZSÍSA 2H asss caos ndus Z2EENSESSERORES SreSísussooDol Om CZHOLECSC>XDOÇZ
ZA ISO SEDEC LárronHhzENçáSo CoOTEEZNarHAUZ==2X
BESERZEEQUEESO o 2=> ui OAo> EU” x = % oOouzZ Oo ER wu =F — > <oçÇo Ss Euáéáx<r=z29KX>TSGYo o > qo SoOrNE>=S$YX => XogÃoR ns o > Emnmpio>3FES7NZ3OSOE x SE) 2rH2o & É3osftoóosroasaeSs a. Ooo 2 =| o a o "o o on o = a 2: 2
E o 2 Ss E | -S Zz = e n>3O so oyr2>UWs SESEHSRHIIddrs coroada rzevros
SE SGOSLIASSARE XZ2 o< = Sok 26 Su ZSSLCZoO8m grs da> od E<aaorOu cCZ<ELoasoroegaçesa HE S< zz = 0/Or7ÍS<o ESLISTOESAdTOS E<u>sScCEZS9292308E
EFEISDOZSASSÓDEDSA
ECHO SCEDISADÃOS HAS ANDOSZOZ02L costa çõãoL =u > Er SCogGSAÇS SLFELICOON>TCZLS < TE3z2Z NOLL UOGOMYX ML Draco SihrCdi>O SOS EFLIZ22i3dno8X
PEQUAZENÇAÁUVÍSRZ Taca conosoroisxr Eorzaas EstasaSs rortoSOsSoPRTEZ
ECSSCAIBÁZSSTIOSO ESTIENNE: CEXTSSAagançEdOSs> Ss o CSoONTINSBZ228ada 3zZzÉ8oS CS ígw<an*X 2º 2 o Ii wUsS230 isszistoçázico: LCoZoraer AESA RNOdaçãÃOo COSTA RSZOLArZOs aAS>ZSCosSLAlorago ESTISHESSO <uUço € >= TUSSZELsdrçosto SeSscra=0OozZ2Esu ZOoOFLFass ças unra
ESSO TIVE ZLCONHO s3>uihrs yu AS uu EPs; 32 gu Sreo1z RoRESadz=Y DLREOSZELX >2 4 z=s CocosuoRASTeRaÃE s SarESFZZuaHÃSoS: SÊ COSSESASESZRtLZ SS CFEFLEGISOILMYÇASÉE) => u- - >) > e) Z EDITE LossOZ>T3z?Z 8 ETPENESOEICMOZ2Ah a. Ooo 2 =| o o Pa 㣠To o um
FA CE
E o 235 o E |êS o z <a
N3O so rd>WR SST OSGsGODES cotpadinZsêvr os oUCagHsoOooZ20OtXLoÇDO EITA: < ox oÕ gr ÇXsfa>o ÇFOLGU cCZ<Lo2soÉo IAvof< IJEGILCIXEEL = 0/Or7ÍS<o x O $2 = >
E LIST EADROS L<m>SrETITZ3z722002 LaILcutFosu=xy LFSX air os O Cos uy O 2 ><X no Hubs ooS OZ > CORRA ção: ZufrrsSrEYSoosAçé SE EAZZSGOTHdcEa DIFE ZODÍÇNYCÃIA>O 22o0>XEZSEovOonL 2CEQUOZUNTIAVÍAÕZ Taca conosoroisxr x 2º ZZrIIFUSYXCXU<O rXCorugSezsEoratrzZ rC<aCassássaraho SSI HAaçTonaSdisSÇeso OZECLESOoavuEsI Ren Cercas nçro>s> = S 3 2n%ão SIGCHTIHZOZIraça 3z2É028 3 7 issctstsatzica: o LO O < o TZ E « ESG Ra Ea açao COSTA RSZOLArZOs aAS>ZSCosSLAlorago & E z x < uy OO 220322085 o iDER Ss scErSOOGHZAIASZmh ZOoOFLFass ças unra ao SOErtEzZXOUHO EP ZoAXSEsSSusIogdg LA EZUOZEZ> uZ LP ogíowEÉES>S]Z235ÍS Cocoasu5ssrAaASótoRcãz so SdsEBEZISNadiosi 38“ & ESpsStóns ssa tds SS qELÉv3SOLWYÇos<Éo — é Estr forsóssaTSsz 8 ETPENESOEICMOZ2Ah a. Ow 2 =| o 3 o o wu o oa e É o a z |Z d<fs=EeFavZB0L0O WE>Ox ZostEaCcErNSCNoSS CEx4S> & « HSS02<& o=2"75&%
SAC RGSZEZESSAS OX EXE >OSPLrzLro<sZI3IZ bqpoa>385E8S IL CX>23S3SIUWU3Z33S6ZÇ vo< o Eggs Ssgoss2 ÉÚzx2] GSSPONHEmEÃDZ ESSES us o“ = uu o rcúzrEzizrolzi3>2X 3>3><to Za<Hr Susastátaçããdo 8725; ZursçrIReÇES SOS tios ísocLuso=O<>nu SSESK >=OzZEIZÍSZAHIZ QFEL<o sz7ágorZS Zanon? ÍASEE 2OnsGásEcassE lozzão core eê = CZRsSSRSaERARA EXSZÃ zudoscessec iza lorSOh5 s > cINSESTADAdES 22258 SCLOXOGACZ<3S E 9 HoZZFXECogue=Son =DEEX3 o2Z0AsS DHT < o = o oo no >Yx DE strada DEN E cota LIL >GQ<47] 7 SO = 2 sol NogEr>C Zoo SsançousS=Or>CO0OSHNHAXS ESC SESNCoa SE OS DOS XT WSCILASEODZCEDO2ZWoAZOITE OE SZZSDWAGrEAMALDOXNYV?Z 3S3a<7T SDS R<TIvZRu O>wW5SCÉ za ucEorozas SS oE<ao0X" 22 Eri Sposa ads CUCA uzZIHoos Hu u HH < <ZWZ O 23= L>axr omwoXt oO gG<IL o = <LIiruonsdZEZP Sd er=290htoS<S<2POZ2STEO<S SEsEsdiáriaçEs ESSE CIFSHOEXSSCOSON Tt ózrEboÃs sc IXE=EISSEÁSIATZSOSS> a EIS SRrOSSZ7 sz ros2?o 2ezZzrmw con CoOgGZSau gs ESFS das tas Essa é EssassofrazumeZsEIStERZ 2 HOrcesssogcízráosssosr 3 ESoSTISOCAS=<ZCLi ru, o EZFI3IS>SO0OSCO<ErFEAI2360<rPO6 oO o Sis 3 mM 2º o Y" Ss Ss E 8. 8 233 Zz 2 : + zº ze gs a 8 2 2 Ss ES e |O <s
É ES E
S ETF WS z |<38 Fe
CU >ZCI >IUXZze<4 br >y<onVãZ S6suss F2325 GH0H3RS2 Z r OS O3ÇoUm, & O < oD O<Sommh OoZGXQ ECrI<szo og sZn>zZ prQuS <23TXTAHGEAEL >CoZgroó fLarxrogo EFESoCSO2O 2suSoo oEZ35 SEéoGrEro SEI2 FHFGO0O jug2És> ESSÓ E vozZzenh IRS 0RSE aERZSE E3$5E EZs305* 2HEOosm SO0O20< KEFEHEoros oOLS<ÉSUM PESO SEORZIDS zZ%oOFKruOQO dosa2o4S dgzZztwBXà wOoLnOÇX IS02>3O <E “ [E YWFharHvo ovir ar Sou ísi2 22323 SÉzao ESSTzHiSo oa < ES30089 Ecz5£o so ESSO Jo96=8Z drrosdioóssEóõos ZE >322 QGELESLCOLCSZIFPÉSL >O<rSS SINO CHESZSZÇENDAZ ES USOS Z ESrsISEZSCOSR S<uv2Z00 <E=ZAGITYG6SO0LR 25 <rasvOo prFz32$ 20 /&S<EZíGa SD EEI COS CaSodBZAnts E <TITE =>29%ED< PZrFOoDO <oLHRESTZ SS oO<HSKSRÁrol | ox CL OX<I 5 Croaçto EZRA 3265 078 Q<zZo0“ DE 3 SESSRSSEOsaSACdTEIZE a > uu > >| o =“ v ES ds ESSO AFRO S u=27o5sLzZzZZECSENçÇawmLEOAUSEÇO UOFrForFrZoOZCS IL OSELCÇSAaãoo IJUZ3I2o0oEFEgÇ rogo gt ZztBe<o zZ>ifz<arh Soube fo2PÍCERosLS SOIL TILO Or SM OOCtHZ oOzLErIrL>DAOQÍSEEIDZZZ4osOo>51ÃZ > 2€XY2U LCoOoSuÇó=aD<áíázZN>zEL EITETvOOS AOL YT2X> tCoktrÊéo E Psogeaessno= Cos o8 <sZusCoroocessizasadso <E<Z =É uoísçssSo =ozSEó5S5D2: o EIFZLSII E ESTEÉSTIICS SEO x rt gozOscsISsS SI So2S9AzZ ZEN RmeSS SIS Zózaa5o? — = s zestfHSorascADeZadedao e Barcas slazegde sos rdt Ss ELSTEIS=Z OE ON ECIZÉÁOZAS 3 SEFIROA dir asi casados d ErXzLISE=EaSoLAIESPOSTOS a. 98 & e o 3 e E 3 Ss o õ > P 1 o Fr o S Ee fo VE o on O SS on o a & o 8 = E 8 28 3 E FE o | 33 se é |E Ss Es o E oo E z2 |£<& 7 <<
Su2€<ou IEI>>O0 O z2029FH[ZEx3 SESAGEO BEsESERARNOSOS Zz SESXSO suo EÍoSÇoms EFoNZFoOLroOgduWHr E IG20HZ=O aszrSSóíZzH<oSE =P 200$S p<óogo0oErL]QUuSÇQO?Z EsZz%ÚCrXZX UnC >cópn>fL2A4 rFoOonNsOSÍIA O Oorvíãh SSZEZ<LA É DO A < 3 DEBSHIA SoEOSSSSIANSd <oOxuPES Hmoeoogrrezgas3doS antas tolFEnirIEONSZHRRST pIOÓXÇ3O0 ROSA IZHrazão >OE<€R<<Sro IIXGLESOÇoS aZzr=9TFSÇIZEtCadassiãoS >3ILiIvOosZ ore EõZzrasdSSTIOZ costa doSticar=araoCcCiozEsos oITRRAOAFZOXEÇSoosSas2adsaÉ ez Crasoecza>dozajlsESy SOGRA FodsoSsAadíuESArTOZfL az ohNZza 0 SE Ao u<ASGHOuNTOr> crosZ INT EítossooNrIDZSA SoEsAsaacissçssddasESão o EM IOZOSO gEIZZ << o CONS EE Cv rI<< > = SO03S0>fSEsçcçaoaszo = ForguozZz DAGSOoFISoZESPSELNCITIons Hmuggrr>2O<XSZEr gre UuSÓ=a<o rCosELcaeosráãdos EFEXQÇSOULXE os = z=S rr FZr2h3X”*C3S<€ÊLCOYX 200W>2L O0OoO|U TOS ZUZ7/O03><€369SÍS ouScoszodgegrFSoOsSsaEoDPIÍZOSO CCLZIÂWESLERENLIAIÇZÇÍÇes>sL<4 TAL Am <> LOST <<OozZAS<EGETADÍON Z737$6 Cora SS E<as Los GLRSSEOL QN TZTEZTZOrLgO ake CIT OLCAL PDICoCALZs go >“ = 2” <> 2 KH EO SSoo0S a & = zZ7no ZorEuXr cZI nsL > o) Zu" <LZO0OO zZzão Zz>Z zZ abr S>EF>SSOIRLE 2S$ nNZO a LU AZa wuEomN<O scan dspo sado LITOIIGOIOZFSEAÁros os oOLT<AÃRLO oc<ÍLoOXOO|X noLEZXrFSi3Pe<dá Go S<IoSZ > rgvçuzroososas <auUuZz> Sr] CoOld LhrZzozZzouUZXSL> oa POOZX-EFXECrirwuAasrdáa EK 2 PHP >SSLEXZ SG eE=EEelç<e2iSx CESPE lada sais r-2oÇz o õ x a Aco us IXM<E 2=2z<rYro=zo28SZ TST = o o 22 oÓ = > S ENTÃO caAL — << >= o a > E z sou aorta 200Çg2300 O ã RBS tNaNsaADA oz são: & BSscasserssta assa ads 8 EFFAZOEESSAREA CAS hSARES a.
gs 3 Co) ".
2 õ 2 o - Xx<s o e E 3 oo Zz 33 8 3 = o E os 2 2 e 88 sa S&S |ES ES Zz <CÇ Oo << E
2X QOOvVAVOZ toa SGLISEEOS |O EXBaSs |SZ22 SEGÉRGO É SIRSN5 28 SLÁSSZAO EXxÍZ2$28 DTL SEZSHOS aETESÃê FSC = UZOR ZXo0noLuk IíoaAHreZ 2oÊL Fo cgrzo =r29S3$o $S Sos osdoss ósôgçê Bs PESOS BsE5dds H$dê, TESS Sz$S233 5934 E E OI s Íáca 2802043 doada SESZEÉS TE: E x U ZOUid É Soguu3LS aENETEO DOS? BIBI EOD msSocusS SUSSr Foros ama droNGEDdE o= O wu 3 => = PS <a r ESTE) > >rH = o ZECOOCCLI OS O DO ZoO22 620 E UE oOS São FasLPOs>EÇZGa<N5h”vXOo OÉBE oOosITS<rra23/ 20 2 8>32 Fes cESHBHZS Ta Coado 5228 3 DEZ non T2$0tTigo SIX EZ08/25GS SGEELZÍCZ 2 SEZOd>EIscIaE EÇDAari SESTZIuZEZSZZRÓtis Sons o ZaRosSsosfaGIo çó odE> LS Canfarso SE SRE5NSOOS Ze E mFECROGEAIZADE=Z 028 zZzErEHEU Seres SerzsãmadÃOo HG P Goi Kg<3GSEIÍS|R 32 FEST esfia<osE 2 239; rFowo3IHX22Z 2] ESZZT Loo >ER FogESZEpENEANTSZE SI RSDS DOCZ=2 >qgroszozZzúsb 2 GLONOSSZTEFOoCDmDÉZO 0 NX I<á U$UGIS cE<OGSE5OZHSÉ SST ZE OE zzZEHgoref 2d cnDESeS ISOLA Srs DEV LOHZO 22 03OEoOáA áEazãgo X >< CS <EOSSRo O5SZOO a EC SCI LIS BH E Ea S O o2I9 2a EF<NLZUÇL Sasso 2 o0EZEZ35 COoLoaEcrzOcC2e8a 2230809 cazoaz=2$So<i$ as aos SXrá SCZRIsENSETRA UAI osoSgassU SESSÃO ?Z FLoRr oO<qzoo CSBI EZX ZÓ PS ESÃo OR ELSCzZ DS EZOS O o308 & & o & = gs Sagres adsssatadiasdsE o DOS zo CÓÁDIALO SEP = 2L2<u> Zz> x 2 SC= rES>ZET 3 MSG ASEOCADIdZosSFOoLÇEST z Wu><FCEIEQXODZ Ze BEFÍZSZS E | x OoOnNnFow><NX <o à É Ô ESCFRQAhHASDSSSSÍSNE SGA [7 - os DP g =| o
E a 2 e E ã 8 8 = 72 "o o & "o -— o oO oO â 88 8. o So 3 2 2O 23 2 os a O e oO DE às as as EE é [eo] S 2 co 2 2 Ss se E E? ES 2 2 E << s as o T Foo Wu oO > = “< a o 8 2522 28398 E & 3SSE om |S E DES z2O<22 2 ss < Oh EC<X<>O s 3 Do >X >= <wWiúo 2 [) náZzZH CUusoL o o SSÊES LÇ€ZYZ u 8 Saz23 j<Kr<co> |E 2252 G3HXS&% E 8 <IX Orsguçg o 8 OOSCTFUXL2L=22x = o <a +Z UEL Ar >O o 8 =<<2Irsoss E asoszZiEZAdE |; SE oBSfoOzZZIZXE E < ms > 4 S o SeSariSIcAS à É IrwIGÇÕELZOX õ " CHLDOZOHIXZ |E É SEGH ASHES | Fo<oHNuoL= Pv o TAas>ólEgrtzAas> |s D<os<r 2 B A % 235 ZLW3 Ce o ZrAQuio€LY<asS |5 E EL2QSOAG<XXEor | E n2erPrr=20<>o = Ss wu >O0LG Pu Ur = 2—> astro gsHSo 8 E Sao 23h5229Tr 2 2 CASO ara Sus Fever E3oróZge O LTS 0OLS FE EXUSvVoZ2rY<á<ur C TSC 2 oN>>34Li2 E o o << EFOOÇoais D POXresrugE<€ID2 o . SaESSOXIUWOEL S02S SEZ30/0ZUXHZSBTA BELLE OEA DZ mo Esso EesSHoOSu doe DZ OAo>ugZrY4|- Â =Oorgoçcçorvashan 85 wu O = EXrXErzeloandasess gar íwvUZáar eo Fscarssadá cs oECGeEISÁT E, SE o <ZS Lo =rzázorição õ GT EERS>=Cz EN; ce Ooo ti=sE6EGgsS6ó/l ET 2 o ESSE IZ2$Z0 % >| 2 gc3>rraocogLA DES o Mô = Zz vOçoÇ o ESEZSIESIDÉLAE O O >> 2 ESSUZ<IS5So so a es og Oo soe umuZ $ã35 o Sã
SEE Ô E=3 o E CA É 3 22E = f- EE o o xs ovuL o & OE To = 26º É 8 6 oo o o O. 28 Z 38 no a ww Do. E ç vags8 ss & SEE é |E2 É eh S E Ss ES n& > Zz <s 4 Sa:
[00117] Parafinsde comparação entre duas ou mais sequências de aminoácidos, a porcentagem de "identidade de sequência" entre uma primeira sequência de aminoácidos e uma segunda sequência de ami- noácidos (também aqui referida como "identidade de aminoácido") po- de ser calculada dividindo [0 número de resíduos de aminoácidos na primeira sequência de aminoácidos que são idênticos aos resíduos de aminoácidos nas posições correspondentes na segunda sequência de aminoácidos] por [o número total de resíduos de aminoácidos na pri- meira sequência de aminoácidos] e multiplicando por [100], em que cada deleção, inserção, substituição ou adição de um resíduo de ami- noácido na segunda sequência de aminoácidos, quando comparada à primeira sequência de aminoácidos, é considerada como uma diferen- ça em um único resíduo de aminoácido (posição). Alternativamente, o grau de identidade de sequência entre duas sequências de aminoáci- dos pode ser calculado utilizando um algoritmo de computador conhe- cido (por exemplo, pelo algoritmo de homologia local de Smith e Wa- terman (1970) Adv. Appl. Math. 2:482c, pelo algoritmo de homologia no alinhamento de Needleman e Wunsch, J. Mol. Biol. (1970) 48:443, pela busca pelo método de similaridade de Pearson e Lipman. Proc. Natl. Acad. Sci. USA (1998) 85:2444, ou por implementações compu- torizadas de algoritmos disponíveis como Blast, Clustal Omega, ou ou- tros algoritmos de alinhamento de sequências) e, por exemplo, usando configurações padrão. Normalmente, para fins de determinar a porcen- tagem de "identidade de sequência" entre duas sequências de amino- ácidos de acordo com o método de cálculo delineado acima, a se- quência de aminoácidos com o maior número de resíduos de aminoá- cidos será considerada como a "primeira" sequência de aminoácidos, e a outra sequência de aminoácidos será considerada como a "segun- da" sequência de aminoácidos.
[00118] Além de ou alternativamente, duas ou mais sequências po-
dem ser avaliadas pela identidade entre as sequências. Os termos "idênticos" ou "identidade" percentual, no contexto de duas ou mais sequências de ácidos nucleicos ou de aminoácidos, referem-se a duas ou mais sequências ou subsequências que são iguais. Duas sequên- cias são "substancialmente idênticas" se as duas sequências tiverem uma porcentagem especificada de resíduos de aminoácidos ou nu- cleotídeos que são iguais (por exemplo, pelo menos 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8% ou 99,9% idênticas) ao longo de uma região especificada ou ao longo da se- quência inteira, quando comparas e alinhadas para correspondência máxima ao longo de uma janela de comparação, ou região designada conforme medida usando um dos algoritmos de comparação de se- quências acima ou por alinhamento manual e inspeção visual. Opcio- nalmente, a identidade existe ao longo de uma região com pelo menos aproximadamente 25, 50, 75 ou 100 aminoácidos de comprimento, ou ao longo de uma região com 100 a 150, 150 a 200, 100 a 200 ou 200 ou mais aminoácidos de comprimento.
[00119] Além de ou alternativamente, duas ou mais sequências po- dem ser avaliadas pelo alinhamento entre as sequências. Os termos "alinhamento" ou "alinhamento" percentual, no contexto de duas ou mais sequências de ácidos nucleicos ou de aminoácidos, referem-se a duas ou mais sequências ou subsequências que são iguais. Duas se- quências estão "substancialmente alinhadas" se as duas sequências tiverem uma porcentagem especificada de resíduos de aminoácidos ou nucleotídeos que são iguais (por exemplo, pelo menos 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8% ou 99,9% idênticos) ao longo de uma região especificada ou ao longo da sequência inteira, quando comparadas e alinhadas para correspon- dência máxima em uma janela de comparação, ou região designada, conforme medida utilizando um dos algoritmos de comparação de se-
quência acima ou por alinhamento manual e inspeção visual. Opcio- nalmente, o alinhamento existe ao longo de uma região com pelo me- nos aproximadamente 25, 50, 75 ou 100 aminoácidos de comprimento, ou ao longo de uma região com 100 a 150, 150 a 200, 100 a 200 ou 200 ou mais aminoácidos de comprimento.
[00120] Além das moléculas de proteína, as moléculas de ácido nu- cleico possuem várias propriedades vantajosas para uso como rea- gentes de afinidade (por exemplo, moléculas de reconhecimento de aminoácidos) de acordo com o pedido de patente.
[00121] — Aptâmeros de ácido nucleico são moléculas de ácido nu- cleico que foram modificadas para se ligar a alvos desejados com alta afinidade e seletividade. Deste modo, aptâmeros de ácido nucleico podem ser modificados para se ligarem seletivamente a um tipo dese- jado de aminoácido usando técnicas de seleção e/ou enriquecimento conhecidas na área. Assim, em algumas modalidades, um reagente de afinidade compreende um aptâmero de ácido nucleico (por exemplo, um aptâmero de DNA, um aptâmero de RNA). Como mostrado na Fi- gura 1C, em algumas modalidades, um reagente de afinidade marcado é um aptâmero marcado 104 que se liga seletivamente a um tipo de aminoácido terminal. Por exemplo, em algumas modalidades, o aptâ- mero marcado 104 liga-se seletivamente a um tipo de aminoácido (por exemplo, um único tipo de aminoácido ou um subconjunto de tipos de aminoácidos) em um terminal de um polipeptídeo, como aqui descrito. Embora não mostrado, deve-se reconhecer que o aptâmero marcado 104 pode ser modificado para ligar-se seletivamente a um tipo de ami- noácido em qualquer posição de um polipeptídeo (por exemplo, em uma posição terminal ou em posições terminal e interna de um poli- peptídeo) de acordo com um método do pedido de patente.
[00122] Em algumas modalidades, um reagente de afinidade mar- cado compreende um marcador com luminescência induzida pela liga-
ção. Por exemplo, em algumas modalidades, um aptâmero marcado 106 compreende um marcador doador 112 e marcador aceitador 114 e funções como ilustradas nos painéis (1) e (Il) da Figura 1C. Como re- presentado no painel (1), o aptâmero marcado 106 como molécula livre adota uma conformação na qual o marcador doador 112 e o marcador aceitador 114 estão separados por uma distância que limita FRET de- tectável entre os marcadores (por exemplo, cerca de 10 nm ou mais). Como representado no painel (Il), o aptâmero marcado 106 como uma molécula ligada seletivamente adota uma conformação na qual o mar- cador doador 112 e o marcador aceitador 114 estão dentro de uma distância que promove FRET detectável entre os marcadores (por exemplo, cerca de 10 nm ou menos). Em ainda outras modalidades, o aptâmero marcado 106 compreende uma porção de supressão (quen- ching) e funções análogas às de um farol molecular (molecular bea- con), em que a luminescência do aptâmero marcado 106 é suprimida internamente como uma molécula livre e restaurada como uma molé- cula ligada seletivamente (ver, por exemplo, Hamaguchi, et al. (2001) Analytical Biochemistry 294, 126-131). Sem a intenção de ficar preso à teoria, acredita-se que esses e outros tipos de mecanismos para lumi- nescência induzida por ligação possam vantajosamente reduzir ou eliminar a luminescência de fundo para aumentar a sensibilidade glo- bal e exatidão dos métodos aqui descritos.
[00123] Além de métodos para identificação de um aminoácido ter- minal de um polipeptídeo, o pedido de patente provê métodos de se- quenciamento de polipeptídeos com o uso de reagentes de afinidade marcados. Em algumas modalidades, os métodos de sequenciamento podem envolver submeter um terminal do polipeptídeo a ciclos repeti- dos de detecção do aminoácido terminal e clivagem do aminoácido terminal. Por exemplo, em algumas modalidades, o pedido de patente provê um método para determinar uma sequência de aminoácidos de um polipeptídeo que compreende colocar um polipeptídeo em contato com um ou mais reagentes de afinidade marcados aqui descritos e submeter o polipeptídeo à degradação de Edman.
[00124] A degradação de Edman convencional envolve ciclos repe- tidos de modificação e clivagem do aminoácido terminal de um poli- peptídeo, em que cada aminoácido sucessivamente clivado é identifi- cado para determinar uma sequência de aminoácidos do polipeptídeo. Como exemplo ilustrativo de uma degradação de Edman convencio- nal, o aminoácido N-terminal de um polipeptídeo é modificado usando isotiocianato de fenila (PITC) para formar um aminoácido N-terminal derivado com PITC. O aminoácido N-terminal derivado com PITC é então clivado com condições ácidas, condições básicas e/ou tempera- turas elevadas. Foi também mostrado que a etapa de clivagem do aminoácido N-terminal derivado com PITC pode ser realizada enzimá- tica com uma cisteína protease modificada do protozoário Trypanoso- ma cruzi, a qual envolve condições de clivagem relativamente mais leves em pH neutro ou próximo do neutro. Exemplos não limitantes de enzimas úteis são descritos no Pedido de Patente U.S. Nº 15/255 433, depositado em 02 de setembro de 2016, intitulada "Molecules and Me- thods for Iterative Polypeptide Analysis and Processing".
[00125] Um exemplo de sequenciamento por degradação de Ed- man usando reagentes de afinidade marcados de acordo com o pedi- do de patente é representado na Figura 1D. Em algumas modalidades, o sequenciamento por degradação de Edman compreende prover um polipeptídeo 122 que é imobilizado em uma superfície 130 de um su- porte sólido (por exemplo, imobilizado em uma superfície inferior ou da parede lateral de um poço de amostra) através de um ligante 124. Em algumas modalidades, como aqui descrito, o polipeptídeo 122 é imobi- lizado em um terminal (por exemplo, um aminoácido amino-terminal ou um aminoácido carbóxi-terminal) de tal modo que o outro terminal está livre para detecção e clivagem de um aminoácido terminal. Deste mo- do, em algumas modalidades, os reagentes usados nos métodos de degradação de Edman aqui descritos interagem preferencialmente com aminoácidos terminais no terminal não imobilizado (por exemplo, livre) do polipeptídeo 122. Dessa maneira, o polipeptídeo 122 perma- nece imobilizado ao longo de ciclos repetidos de detecção e clivagem. Para isso, em algumas modalidades, o ligante 124 pode ser projetado de acordo com um conjunto desejado de condições usadas para de- tectar e clivar, por exemplo, limitar o descolamento do polipeptídeo 122 da superfície 130 sob condições de clivagem química. As compo- sições adequadas de ligantes e técnicas para imobilizar um polipeptí- deo em uma superfície são descritas detalhadamente em algum lugar no presente.
[00126] De acordo com o pedido de patente, em algumas modali- dades, um método de sequenciamento por degradação de Edman compreende uma etapa (1) de colocar o polipeptídeo 122 em contato com um ou mais reagentes de afinidade marcados que se ligam seleti- vamente a um ou mais tipos de aminoácidos terminais. Como mostra- do, em algumas modalidades, um reagente de afinidade marcado 108 interage com o polipeptídeo 122 ligando-se seletivamente ao aminoá- cido terminal. Em algumas modalidades, a etapa (1) compreende ain- da remover qualquer um ou mais reagentes de afinidade marcados que não se ligam seletivamente ao aminoácido terminal (por exemplo, o aminoácido terminal livre) do polipeptídeo 122.
[00127] Em algumas modalidades, o método compreende ainda identificar o aminoácido terminal do polipeptídeo 122 detectando-se o reagente de afinidade marcado 108. Em algumas modalidades, a de- tecção compreende detectar a luminescência do reagente de afinidade marcado 108. Como aqui descrito, em algumas modalidades, a lumi- nescência é associada exclusivamente com o reagente de afinidade marcado 108, e a luminescência é, assim, associada com o tipo de aminoácido ao qual o reagente de afinidade marcado 108 se liga sele- tivamente. Assim, em algumas modalidades, o tipo de aminoácido é identificado determinando-se uma ou mais propriedades da lumines- cência do reagente de afinidade marcado 108.
[00128] Em algumas modalidades, um método de sequenciamento por degradação de Edman compreende uma etapa (2) de remover o aminoácido terminal do polipeptídeo 122. Em algumas modalidades, a etapa (2) compreende remover o reagente de afinidade marcado 108 (por exemplo, qualquer de um ou mais reagentes de afinidade marca- dos que se ligam seletivamente ao aminoácido terminal) do polipeptí- deo 122. Em algumas modalidades, a etapa (2) compreende modificar o aminoácido terminal (por exemplo, o aminoácido terminal livre) do polipeptídeo 122, colocando o aminoácido terminal em contato com um isotiocianato (por exemplo, PITC) para formar um aminoácido ter- minal modificado com isotiocianato. Em algumas modalidades, um aminoácido terminal modificado com isotiocianato é mais suscetível à remoção por um reagente de clivagem (por exemplo, um reagente en- zimático ou químico de clivagem) do que um aminoácido terminal não modificado.
[00129] Em algumas modalidades, a etapa (2) compreende remover o aminoácido terminal colocando o polipeptídeo 122 em contato com uma protease 140 que se liga especificamente e cliva o aminoácido terminal modificado com isotiocianato. Em algumas modalidades, a protease 140 compreende uma cisteína protease modificada. Em al- gumas modalidades, a protease 140 compreende uma cisteína pro- tease modificada, como uma cisteína protease de Trypanosoma cruzi (ver, por exemplo, Borgo, et al. (2015) Protein Science 24:571-579). Em ainda outras modalidades, a etapa (2) compreende remover o aminoácido terminal submetendo o polipeptídeo 122 a condições quíi-
micas (por exemplo, ácidas, básicas) suficientes para clivar o aminoá- cido terminal modificado com isotiocianato.
[00130] Em algumas modalidades, um método de sequenciamento por degradação de Edman compreende uma etapa (3) de lavar o poli- peptídeo 122 após a clivagem do aminoácido terminal. Em algumas modalidades, a lavagem compreende remover a protease 140. Em al- gumas modalidades, a lavagem compreende restaurar o polipeptídeo 122 às condições de pH neutro (por exemplo, após a clivagem química por condições ácidas ou básicas). Em algumas modalidades, um mé- todo de sequenciamento por degradação de Edman compreende repe- tir as etapas (1) a (3) por uma pluralidade de ciclos.
[00131] Um exemplo de método de sequenciamento por degrada- ção de Edman é mostrado na Figura 1E. Em algumas modalidades, uma amostra contendo uma mistura complexa de polipeptídeos (por exemplo, uma mistura de proteínas) pode ser degradada, usando en- zimas comuns, em fragmentos polipeptídicos curtos com aproximada- mente 6 a 40 aminoácidos. Em algumas modalidades, o sequencia- mento dessa biblioteca de polipeptídeos de acordo com os métodos do pedido de patente revelariam a identidade e abundância de cada um dos polipeptídeos presentes na mistura complexa original. Como aqui descrito e na literatura, a maioria dos polipeptídeos na faixa de tama- nho de 6 a 40 aminoácidos pode ser identificada exclusivamente de- terminando-se o número e a localização de apenas quatro aminoáci- dos dentro de uma cadeia polipeptídica.
[00132] “Deste modo, em algumas modalidades, um método de se- quenciamento por degradação de Edman pode ser realizado usando um conjunto de aptâmeros marcados 150 que compreendem quatro tipos de aptâmero de DNA, cada tipo reconhecendo um aminoácido N- terminal diferente. Cada tipo de aptâmero pode ser marcado com um marcador luminescente diferente, de tal modo que os diferentes tipos de aptâmero podem ser distinguidos com base em uma ou mais pro- priedades da luminescência. Para fins ilustrativos, o conjunto de exemplo de aptâmeros marcados 150 inclui: um aptâmero específico para cisteína marcado com um primeiro marcador luminescente ("co- rante 1"); um aptâmero específico para lisina marcado com um segun- do marcador luminescente ("corante 2"); um aptâmero específico para triptofano marcado com um terceiro marcador luminescente ("corante 3"); e um aptâmero específico para glutamato marcado com um quarto marcador luminescente ("corante 4").
[00133] Em algumas modalidades, um método de sequenciamento por degradação de Edman de acordo com o pedido de patente pros- segue de acordo com um processo 152 mostrado na Figura 1E. Em algumas modalidades, antes da etapa (1), moléculas de um único poli- peptídeo de uma biblioteca de polipeptídeos são imobilizados em uma superfície de um suporte sólido, por exemplo, em uma superfície infe- rior ou da parede lateral de um poço de amostra de um arranjo de po- ços de amostras. Em algumas modalidades, como descrito em outro lugar no presente, porções que permitem a imobilização na superfície (por exemplo, biotina) ou melhoram a solubilidade (por exemplo, oligo- nucleotídeos) podem ser anexadas química ou enzimaticamente ao C- terminal dos polipeptídeos. Para determinar a sequência de cada poli- peptídeo, em algumas modalidades, os polipeptídeos imobilizados são submetidos a ciclos repetidos de detecção do aminoácido N-terminal e clivagem do aminoácido N-terminal, como ilustrado pelo processo 152. Em algumas modalidades, o processo 152 compreende etapas de adi- ção do reagente e de lavagem que são realizadas por injeção em uma célula de fluxo acima da superfície de detecção usando um sistema fluídico automático. Em algumas modalidades, as etapas (1) a (4) ilus- tram um ciclo de detecção e clivagem usando aptâmeros marcados
150.
[00134] Em algumas modalidades, um método de sequenciamento por degradação de Edman de acordo com o processo 152 compreen- de uma etapa (1) de fluir uma mistura de quatro aptâmeros de DNA marcados ortogonalmente e incubar para permitir que os aptâmeros se liguem a quaisquer polipeptídeos imobilizados (por exemplo, polipeptí- deos imobilizados em um poço de amostra de um arranjo) que conte- nham um dos quatro aminoácidos corretos no N-terminal. Em algumas modalidades, o método compreende ainda lavar os polipeptídeos imo- bilizados para remover aptâmeros não ligados. Em algumas modalida- des, o método compreende ainda visualizar os polipeptídeos imobili- zados ("Etapa de imagem 1"). Em algumas modalidades, as imagens adquiridas contêm informações suficientes para determinar a localiza- ção de polipeptídeos ligados a aptâmeros (por exemplo, a localização dentro de um arranjo de poços de amostra) e qual dos quatro aptâme- ros está ligado em cada localização. Em algumas modalidades, o mé- todo compreende ainda lavar os polipeptídeos imobilizados usando um tampão adequado para remover os aptâmeros dos polipeptídeos imo- bilizados.
[00135] Em algumas modalidades, um método de sequenciamento de acordo com o processo 152 compreende uma etapa (2) de fluir uma solução contendo uma molécula reativa (por exemplo, PITC, como mostrado) que modifica especificamente o grupo amina N-terminal. Uma molécula de isotiocianato como PITC, em algumas modalidades, modifica o aminoácido N-terminal tornando-o um substrato para cliva- gem por uma protease modificada, como a cisteína protease cruzaína do Trypanosoma Cruzi.
[00136] Em algumas modalidades, um método de sequenciamento de acordo com o processo 152 compreende uma etapa (3) de lavagem dos polipeptídeos imobilizados antes do fluxo de uma protease modifi- cada adequada que reconhece e cliva o aminoácido N-terminal modifi-
cado do polipeptídeo imobilizado. Em algumas modalidades, o método compreende uma etapa (4) de lavagem dos polipeptídeos imobilizados após a clivagem enzimática. Em algumas modalidades, as etapas (1) a (4) representam um ciclo da degradação de Edman. Deste modo, a etapa (1º), como mostrada, é o início do ciclo seguinte de reações, o qual prossegue com as etapas (1') a (4') realizadas como descrito acima para as etapas (1) a (4). Em algumas modalidades, as etapas (1) a (4) são repetidas por aproximadamente 20-40 ciclos.
[00137] Em algumas modalidades, um isotiocianato marcado (por exemplo, um PITC marcado com corante) pode ser utilizado para mo- nitorar o carregamento da amostra. Por exemplo, em algumas modali- dades, antes de submeter uma amostra de polipeptídeo a um método de sequenciamento como mostrado no processo 152, a amostra do polipeptídeo é pré-conjugada com um marcador luminescente em uma extremidade terminal pela modificação da extremidade terminal com um PITC marcado com corante. Dessa maneira, o carregamento da amostra do polipeptídeo em um arranjo de poços de amostra pode ser monitorado detectando-se a luminescência dos marcadores antes de iniciar o processo 152. Em algumas modalidades, a luminescência é usada para determinar a ocupação única de poços de amostra no ar- ranjo (por exemplo, uma fração de poços de amostra contendo uma única molécula polipeptídica), que pode vantajosamente aumentar a quantidade informações obtidas com confiança para uma dada amos- tra. Uma vez determinado um status desejado de carregamento da amostra por luminescência, o processo 152 pode ser iniciado por cli- vagem química ou enzimática, como descrito, antes de prosseguir com a etapa (1).
[00138] Em algumas modalidades, um isotiocianato marcado (por exemplo, um PITC marcado com corante) pode ser utilizado para mo- nitorar o progresso da reação de uma amostra de polipeptídeo em um arranjo. Por exemplo, em algumas modalidades, a etapa (2) compre- ende fluir uma solução contendo um PITC marcado com corante que modifica especificamente e marca grupos amina N-terminais de poli- peptídeos na amostra. Em algumas modalidades, a luminescência dos marcadores pode ser detectada durante ou depois da etapa (2) para avaliar a modificação por PITC no N-terminal de polipeptídeos na amostra. Deste modo, em algumas modalidades, a luminescência é usada para determinar se ou quando prosseguir da etapa (2) para a etapa (3). Em algumas modalidades, a luminescência dos marcadores pode ser detectada durante ou depois da etapa (3) para avaliar a cli- vagem do aminoácido N-terminal dos polipeptídeos na amostra, por exemplo, para determinar se ou quando prosseguir da etapa (3) para a etapa (4).
[00139] Um método de sequenciamento de acordo com o processo 152 utiliza reagentes separados para detectar e clivar um aminoácido terminal de um polipeptídeo. Não obstante, em alguns aspectos, o pe- dido de patente provê um método de sequenciamento no qual um úni- co reagente compreendendo uma peptidase pode ser utilizado para detectar e clivar um aminoácido terminal de um polipeptídeo. A Figura 2 mostra um exemplo de sequenciamento de polipeptídeos usando um conjunto de exopeptidases marcadas 200, em que ada exopeptidase marcada liga-se seletivamente e cliva um tipo diferente de aminoácido terminal.
[00140] Conforme ilustrado genericamente no exemplo da Figura 2, as exopeptidases marcadas 200 incluem uma exopeptidase específica para lisina que compreende um primeiro marcador luminescente, uma exopeptidase específica para glicina que compreende um segundo marcador luminescente, uma exopeptidase específica para aspartato que compreende um terceiro marcador luminescente e uma exopepti- dase específica para leucina que compreende um quarto marcador luminescente. De acordo com certas modalidades aqui descritas, cada uma das exopeptidases marcadas 200 liga-se seletivamente e cliva seu respectivo aminoácido somente quando aquele aminoácido está em um amino- ou carbóxi-terminal de um polipeptídeo. Deste modo, à medida que o sequenciamento por essa abordagem prossegue de um terminal de um peptídeo para o outro, as exopeptidases marcadas 200 são projetadas ou selecionadas de tal modo que o conjunto possuirá quer atividade aminopeptidase ou carboxipeptidase.
[00141] Conforme mostrado adicionalmente na Figura 2, o processo 202 ilustra esquematicamente uma reação de sequenciamento em tempo real usando exopeptidases marcadas 200. Os painéis (1) a (IX) ilustram uma progressão de eventos envolvendo detecção e clivagem iterativa em uma extremidade terminal de um polipeptídeo em relação à saída de sinal mostrada abaixo, e correspondente ao evento repre- sentado em cada painel. Para fins ilustrativos, é mostrado um polipep- tídeo com uma sequência de aminoácidos arbitrariamente selecionada de "KLDG..." (prosseguindo de um terminal para o outro).
[00142] O painel (I) representa o início de um a reação de sequen- ciamento, em que um polipeptídeo é imobilizado em uma superfície de um suporte sólido, tal como uma superfície inferior ou da parede lateral de um poço de amostra. Em algumas modalidades, os métodos de se- quenciamento de acordo com o pedido de patente compreendem o sequenciamento de uma única molécula em tempo real. Em algumas modalidades, uma pluralidade de reações de sequenciamento de úni- ca molécula é realizada simultaneamente em um arranjo de poços de amostra. Em tais modalidades, a imobilização dos polipeptídeos impe- dem a difusão de um polipeptídeo para fora de um poço de amostra por ancoragem do polipeptídeo dentro do poço de amostra para análi- se da única molécula.
[00143] O painel (Il) representa um evento de detecção, em que a exopeptidase específica para lisina do conjunto de reagentes de afini- dade marcados 200 liga-se seletivamente ao resíduo de lisina terminal do polipeptídeo. Como mostrado nos painéis (1) e (Il) do traço de sinal abaixo, a saída de sinal informa sobre esse evento de ligação pela in- tensidade aumentada do sinal, que pode ser utilizada para identificar o marcador luminescente da exopeptidase lisina-específica para identifi- car, assim, o aminoácido terminal. O painel (III) ilustra que, após ligar- se seletivamente a um aminoácido terminal, uma peptidase marcada cliva o aminoácido terminal. Como resultado, esses componentes es- tão livres para se difundirem desde uma região de observação para detecção da luminescência, o que é relatado na saída de sinal por uma queda na intensidade do sinal, como mostrado painel (III) do traço abaixo. Os painéis (IV) a (IX) prosseguem de modo análogo ao pro- cesso descrito para os painéis (1) a (Ill). Ou seja, uma exopeptidase marcada liga-se e cliva um aminoácido terminal correspondente pro- duzindo um aumento e uma diminuição correspondente, respectiva- mente, na saída de sinal.
[00144] Em alguns aspectos, o pedido de patente provê métodos de sequenciamento de polipeptídeos em tempo real avaliando-se as interações de ligação de aminoácidos terminais com moléculas mar- cadas de reconhecimento de aminoácidos (por exemplo, reagentes de afinidade marcados) e um reagente de clivagem marcado (por exem- plo, uma exopeptidase inespecífica marcada). A Figura 3A mostra um exemplo de um método de sequenciamento no qual eventos distintos de ligação dão origem a pulsos de sinal de uma saída de sinal 300. O painel de encaixe (inset) da Figura 3A ilustra um esquema geral de sequenciamento em tempo real por essa abordagem. Como mostrado, um reagente de afinidade marcado 310 associa-se seletivamente com (por exemplo, liga-se a) e dissocia-se de um aminoácido terminal (mostrado aqui como lisina), o que dá origem a uma série de pulsos na saída de sinal 300 que pode ser utilizada para identificar o aminoácido terminal. Em algumas modalidades, a série de pulsos fornecem um padrão pulsante (por exemplo, um padrão característico) que pode ser diagnóstico da identidade do aminoácido terminal correspondente.
[00145] Sema intenção de ficar preso à teoria, o reagente de afini- dade marcado 310 liga-se seletivamente de acordo com uma afinidade de ligação (Kp) definida por uma taxa de associação ou uma taxa "on" da ligação (Kon) e uma taxa de dissociação ou uma taxa "off' da ligação (Kore). As constantes das taxas Korx e Kon são os determinantes críticos da duração do pulso (por exemplo, o tempo correspondente a um evento de ligação detectável) e da duração entre pulsos (por exemplo, o tempo entre eventos de ligação detectáveis), respectivamente. Em algumas modalidades, essas taxas podem ser projetadas para alcan- çar durações de pulso e taxas de pulso (por exemplo, a frequência de pulsos de sinal) que fornecem a melhor exatidão do sequenciamento.
[00146] Como mostrado no painel de encaixe, uma mistura de rea- ção de sequenciamento compreende ainda uma exopeptidase inespe- cífica marcada 320 que compreende um marcador luminescente que é diferente daquele do reagente de afinidade marcado 310. Em algumas modalidades, a exopeptidase marcada inespecífica 320 está presente na mistura a uma concentração que é inferior àquela do reagente de afinidade marcado 310. Em algumas modalidades, a exopeptidase marcada inespecífica 320 exibe ampla especificidade tal que ela cliva a maioria ou todos os tipos de aminoácidos terminais. Deste modo, uma abordagem de sequenciamento dinâmico pode envolver monito- rar a ligação do reagente de afinidade em um terminal de um polipep- tídeo no decorrer de uma reação de degradação catalisada pela ativi- dade de clivagem da exopeptidase.
[00147] Como ilustrado pelo progresso da saída de sinal 300, em algumas modalidades, a clivagem do aminoácido terminal pela exopeptidase marcada inespecífica 320 dá origem a um pulso de sinal, e esses eventos ocorrem com menor frequência do que os pulsos de ligação de um reagente de afinidade marcado 310. Dessa maneira, os aminoácidos de um polipeptídeo pode ser contados e/ou identificados em um processo de sequenciamento em tempo real. Conforme ilustra- do mais detalhadamente na saída de sinal 300, em algumas modali- dades, uma pluralidade de reagentes de afinidade marcados pode ser utilizada, cada qual com um padrão pulsante diagnóstico (por exemplo, padrão característico) que pode ser utilizado para identificar um ami- noácido terminal correspondente. Por exemplo, em algumas modali- dades, padrões característicos diferentes (como ilustrados por cada uma dentre lisina, fenilalanina e glutamina na saída de sinal 300) cor- respondem à associação de mais de um reagente de afinidade marca- do com tipos diferentes de aminoácidos terminais. Como aqui descrito, deve-se reconhecer que um reagente de afinidade único que se asso- cia com mais de um tipo de aminoácido pode ser utilizado de acordo com o pedido de patente. Deste modo, em algumas modalidades, pa- drões característicos diferentes correspondem à associação de um reagente de afinidade marcado com tipos diferentes de aminoácidos terminais.
[00148] Como aqui descrito, as informações sobre o pulso de sinal podem ser utilizadas para identificar um aminoácido com base em um padrão característico em uma série de pulsos de sinal. Em algumas modalidades, um padrão característico compreende uma pluralidade de pulsos de sinal, cada pulso de sinal compreendendo uma duração do pulso. Em algumas modalidades, a pluralidade de pulsos de sinal pode ser caracterizada por um resumo estatístico (por exemplo, mé- dia, mediana, constante do tempo de decaimento) da distribuição de durações de pulso em um padrão característico. Em algumas modali- dades, a duração média do pulso e um padrão característico está en-
tre aproximadamente 1 milissegundo e 10 segundos (por exemplo, en- tre aproximadamente 1 ms e 1 s, entre aproximadamente 1 ms e 100 ms, entre aproximadamente 1 ms e 10 ms, entre aproximadamente 10 ms e 10 s, entre aproximadamente 100 ms e 10 s, entre aproximada- mente 1 s e 10 s, entre aproximadamente 10 ms e 100 ms ou entre aproximadamente 100 ms e 500 ms). Em algumas modalidades, pa- drões característicos diferentes, correspondentes a tipos diferentes de aminoácidos em um polipeptídeo único, pode ser distingui dos um do outro com base em uma diferença estatisticamente significante na es- tatística resumida. Por exemplo, em algumas modalidades, um padrão característico pode distinguir-se de outro padrão característico com base em uma diferença na duração média do pulso de pelo menos 10 milissegundos (por exemplo, entre aproximadamente 10 ms e 10 s, entre aproximadamente 10 ms e 1 s, entre aproximadamente 10 ms e 100 ms, entre aproximadamente 100 ms e 10 s, entre aproximadamen- te 1s e 10 s ou entre aproximadamente 100 ms e 1 s). Deve-se reco- nhecer que, em algumas modalidades, diferenças menores na duração média do pulso entre padrões característicos diferentes podem reque- rer um número maior de durações de pulsos em cada padrão caracte- rístico para distinguir um do outro com confiança estatística.
[00149] “Como detalhado acima, um processo de sequenciamento em tempo real como ilustrado pela Figura 3A pode em geral envolver ciclos de reconhecimento do aminoácido terminal e clivagem do ami- noácido terminal, onde a ocorrência relativa do reconhecimento e cli- vagem pode ser controlada por uma concentração diferencial entre um reagente de afinidade marcado 310 e uma exopeptidase inespecífica marcada 320. Em algumas modalidades, a concentração diferencial pode ser otimizada de tal modo que o número de pulsos de sinal de- tectados durante o reconhecimento de um aminoácido individual for- nece um intervalo de confiança desejado para identificação. Por exemplo, se uma reação de sequenciamento inicial fornece os dados do sinal com poucos pulsos de sinal entres eventos de clivagem para permitir a determinação de padrões característicos com um intervalo de confiança desejado, a reação de sequenciamento pode ser repetida usando uma concentração diminuída de exopeptidase inespecífica em relação ao reagente de afinidade.
[00150] Em algumas modalidades, o sequenciamento de polipeptí- deos de acordo com o pedido de patente pode ser realizado colocan- do-se um polipeptídeo em contato com uma mistura de reação de se- quenciamento que compreende uma ou mais moléculas de reconhe- cimento de aminoácidos (por exemplo, reagentes de afinidade) e/ou um ou mais reagentes de clivagem (por exemplo, exopeptidases). Em algumas modalidades, uma mistura de reação de sequenciamento compreende uma molécula de reconhecimento de aminoácido a uma concentração entre aproximadamente 10 nM e 10 UM. Em algumas modalidades, uma mistura de reação de sequenciamento compreende um reagente de clivagem a uma concentração entre aproximadamente 500 nM e 500 UM.
[00151] Em algumas modalidades, uma mistura de reação de se- quenciamento compreende uma molécula de reconhecimento de ami- noácido a uma concentração entre aproximadamente 100 nM e 10 UM, entre aproximadamente 250 nM e 10 uM, entre aproximadamente 100 nM e 1 UM, entre aproximadamente 250 nM e 1 uM, entre aproxima- damente 250 nM e 750 nM ou entre aproximadamente 500 nM e 1 uM. Em algumas modalidades, uma mistura de reação de sequenciamento compreende uma molécula de reconhecimento de aminoácido a uma concentração próxima de 100 nM, próxima de 250 nM, próxima de 500 NM, próxima de 750 nM ou próxima de 1 uM.
[00152] Em algumas modalidades, uma mistura de reação de se- quenciamento compreende um reagente de clivagem a uma concen-
tração entre aproximadamente 500 nM e 250 UM, entre aproximada- mente 500 nM e 100 uM, entre aproximadamente 1 uM e 100 UM, en- tre aproximadamente 500 nM e 50 uM, entre aproximadamente 1 uM e 100 UM, entre aproximadamente 10 uM e 200 uM ou entre aproxima- damente 10 uM e 100 uM. Em algumas modalidades, uma mistura de reação de sequenciamento compreende um reagente de clivagem a uma concentração próxima de 1 uM, próxima de 5 uM, próxima de 10 UM, próxima de 30 uM, próxima de 50 uM, próxima de 70 uM ou pró- xima de 100 uM.
[00153] Em algumas modalidades, uma mistura de reação de se- quenciamento compreende uma molécula de reconhecimento de ami- noácido a uma concentração entre aproximadamente 10 nM e 10 UM, e um reagente de clivagem a uma concentração entre aproximada- mente 500 nM e 500 UM. Em algumas modalidades, uma mistura de reação de sequenciamento compreende uma molécula de reconheci- mento de aminoácido a uma concentração entre aproximadamente 100 nM e 1 UM, e um reagente de clivagem a uma concentração entre aproximadamente 1 uM e 100 UM. Em algumas modalidades, uma mistura de reação de sequenciamento compreende uma molécula de reconhecimento de aminoácido a uma concentração entre aproxima- damente 250 nM e 1 UM, e um reagente de clivagem a uma concen- tração entre aproximadamente 10 uM e 100 uM. Em algumas modali- dades, uma mistura de reação de sequenciamento compreende uma molécula de reconhecimento de aminoácido a uma concentração pró- xima de 500 nM, e um reagente de clivagem a uma concentração en- tre aproximadamente 25 uM e 75 uM.
[00154] Em algumas modalidades, uma mistura de reação de se- quenciamento compreende uma molécula de reconhecimento de ami- noácido e um reagente de clivagem em uma razão de aproximada- mente 500:1, aproximadamente 400:1, aproximadamente 300:1, apro-
ximadamente 200:1, aproximadamente 100:1, aproximadamente 75:1, aproximadamente 50:1, aproximadamente 25:1, aproximadamente 10:1, aproximadamente 5:1, aproximadamente 2:1 ou aproximadamen- te 1:1. Em algumas modalidades, uma mistura de reação de sequenci- amento compreende uma molécula de reconhecimento de aminoácido e um reagente de clivagem em uma razão entre aproximadamente 10:1 e 200:1. Em algumas modalidades, uma mistura de reação de sequenciamento compreende uma molécula de reconhecimento de aminoácido e um reagente de clivagem em uma razão entre aproxi- madamente 50:1 e 150:1.
[00155] “Enquanto o exemplo ilustrado pela Figura 3A refere-se a um processo de sequenciamento usando um reagente de clivagem marcado, o processo de sequenciamento não se destina a ser limitado nesse respeito. Como descrito em outro lugar no presente, os invento- res demonstraram o sequenciamento de única molécula usando um reagente de clivagem não marcado. Em algumas modalidades, a fre- quência aproximada com que um reagente de clivagem remove ami- noácidos terminais sucessivos é conhecida, por exemplo, tendo por base uma atividade e/ou concentração conhecida da enzima em uso. Em algumas modalidades, a clivagem do aminoácido terminal pelo re- agente é inferida, por exemplo, com base no sinal detectado para o reconhecimento de aminoácidos ou na falta de sinal detectado. Os in- ventores reconheceram técnicas adicionais para controlar as reações de sequenciamento em tempo real, as quais podem ser utilizadas em combinação com ou alternativamente à abordagem da concentração diferencial como descrita.
[00156] Um exemplo de processo de sequenciamento em tempo real dependente da temperatura é mostrado na Figura 3B. Os painéis (1) a (III) ilustram uma reação de sequenciamento envolvendo ciclos de reconhecimento do aminoácido terminal e clivagem do aminoácido terminal dependente da temperatura. Cada ciclo da reação de sequen- ciamento é conduzido ao longo de duas faixas de temperatura: uma primeira faixa de temperatura ("T;") que é ótima para a atividade do reagente de afinidade em relação à atividade da exopeptidase (por exemplo, para promover o reconhecimento do aminoácido terminal), e uma segunda faixa de temperatura ("T2") que é ótima para a atividade da exopeptidase em relação à atividade do reagente de afinidade (por exemplo, para promover a clivagem do aminoácido terminal). A reação de sequenciamento progride alternando a temperatura da mistura de reação entre a primeira faixa de temperatura T, (para iniciar o reco- nhecimento do aminoácido) e a segunda faixa de temperatura T2 (para iniciar a clivagem de aminoácido). Deste modo, a progressão de um processo de sequenciamento dependente de temperatura é controlá- vel pela temperatura, e a alternância entre as diferentes faixa de tem- peratura (por exemplo, entre T; e T2) pode ser conduzida através de processos manuais ou automáticos. Em algumas modalidades, a ativi- dade do reagente de afinidade (por exemplo, afinidade de ligação (Ko) por um aminoácido) na primeira faixa de temperatura T1, quando com- parada à segunda faixa de temperatura T2, é aumentada em pelo me- nos 10 vezes, pelo menos 100 vezes, pelo menos 1.000 vezes, pelo menos 10.000 vezes, pelo menos 100.000 vezes ou mais. Em algu- mas modalidades, a atividade da exopeptidase (por exemplo, taxa de conversão do substrato no produto da clivagem) na segunda faixa de temperatura T2, quando comparada à primeira faixa de temperatura Ti, é aumentada em pelo menos 2 vezes, 10 vezes, pelo menos 25 vezes, pelo menos 50 vezes, pelo menos 100 vezes, pelo menos 1.000 vezes ou mais.
[00157] Em algumas modalidades, a primeira faixa de temperatura T: é mais baixa do que a segunda faixa de temperatura T2. Em algu- mas modalidades, a primeira faixa de temperatura T, está entre apro-
ximadamente 15 ºC e 40 ºC (por exemplo, entre aproximadamente 25 ºC e 35 ºC, entre aproximadamente 15 ºC e 30 ºC, entre aproximada- mente 20 ºC e 30 ºC). Em algumas modalidades, a segunda faixa de temperatura T> está entre aproximadamente 40 ºC e 100 “C (por exemplo, entre aproximadamente 50 ºC e 90 ºC, entre aproximada- mente 60 ºC e 90 ºC, entre aproximadamente 70 ºC e 90 ºC). Em al- gumas modalidades, a primeira faixa de temperatura T, está entre aproximadamente 20 ºC e 40 ºC (por exemplo, aproximadamente 30 ºC), e a segunda faixa de temperatura T> está entre aproximadamente 60 ºC e 100 ºC (por exemplo, aproximadamente 80 ºC).
[00158] Em algumas modalidades, a primeira faixa de temperatura T1 é mais alta do que a segunda faixa de temperatura T2. Em algumas modalidades, a primeira faixa de temperatura T, está entre aproxima- damente 40 ºC e 100 ºC (por exemplo, entre aproximadamente 50 ºC e 90 ºC, entre aproximadamente 60 ºC e 90 ºC, entre aproximadamente 70 ºC e 90 ºC). Em algumas modalidades, a segunda faixa de tempe- ratura T2 está entre aproximadamente 15 ºC e 40 ºC (por exemplo, en- tre aproximadamente 25 ºC e 35 ºC, entre aproximadamente 15 ºC e ºC, entre aproximadamente 20 ºC e 30 ºC). Em algumas modalida- des, a primeira faixa de temperatura T, está entre aproximadamente 60 ºC e 100 ºC (por exemplo, aproximadamente 80 ºC), e a segunda faixa de temperatura T> está entre aproximadamente 20 ºC e 40 ºC (por exemplo, aproximadamente 30 ºC).
[00159] O painel (Il) representa uma mistura de reação de sequen- ciamento a uma temperatura que se situa em uma primeira faixa de temperatura T, que é ótima para a atividade do reagente de afinidade em relação à atividade da exopeptidase. Para fins ilustrativos, um poli- peptídeo com a sequência de aminoácidos "KFVAG..." é mostrado. Quando a temperatura da mistura de reação está na primeira faixa de temperatura T1, os reagentes de afinidade marcados na mistura são ativados (por exemplo, renaturados) para iniciar o reconhecimento do aminoácido associando com o terminal do polipeptídeo. Além disso, na primeira faixa de temperatura T1, as exopeptidases marcadas na mis- tura são inativadas (por exemplo, desnaturadas) para impedir a cliva- gem do aminoácido durante o reconhecimento. No painel (1), um pri- meiro reagente de afinidade é mostrado associando-se reversivelmen- te com lisina no terminal do polipeptídeo, enquanto uma exopeptidase marcada (por exemplo, Pfu aminopeptidase | (Pfu API)) é mostrada desnaturada. Em algumas modalidades, o reconhecimento do aminoá- cido ocorre por uma duração de tempo predeterminada antes de iniciar a clivagem do aminoácido. Em algumas modalidades, o reconheci- mento do aminoácido ocorre por uma duração de tempo necessária para atingir um intervalo de confiança desejado para identificação an- tes de iniciar a clivagem do aminoácido. Após o reconhecimento do aminoácido, a reação prossegue, mudando a temperatura da mistura para dentro de uma segunda faixa de temperatura T2.
[00160] O painel (Il) representa a mistura de reação de sequencia- mento a uma temperatura que está dentro de uma segunda faixa de temperatura T2 que é ótima para a atividade da exopeptidase em rela- ção à atividade do reagente de afinidade. Para fins ilustrativos desse exemplo, a segunda faixa de temperatura T2 é mais alta do que a pri- meira faixa de temperatura T1, embora, deva-se reconhecer que, a ati- vidade do reagente pode ser otimizada por qualquer faixa de tempera- tura desejada. Deste modo, a progressão do painel (1) para o painel (Il) é realizada elevando a temperatura da mistura de reação com qual- quer fonte de calor adequada. Quando a mistura de reação atinge uma temperatura que está dentro da segunda faixa de temperatura T2, as exopeptidases marcadas na mistura são ativadas (por exemplo, rena- turadas) para iniciar a clivagem do aminoácido terminal pela atividade da exopeptidase. Além disso, dentro da segunda faixa de temperatura
T2, os reagentes de afinidade marcados na mistura são inativados (por exemplo, desnaturados) para impedir o reconhecimento do aminoácido durante a clivagem. No painel (Il), a exopeptidase marcada é mostrada clivando o resíduo de lisina terminal e, enquanto os reagentes de afini- dade marcados são desnaturados. Em algumas modalidades, a cliva- gem de aminoácido ocorre por uma duração de tempo predeterminada antes de iniciar o reconhecimento de um aminoácido sucessivo no terminal do polipeptídeo. Em algumas modalidades, a clivagem de aminoácido ocorre por uma duração de tempo necessária para detec- tar a clivagem antes de iniciar o reconhecimento de um aminoácido sucessivo. Após a clivagem de aminoácido, a reação prossegue, mu- dando a temperatura da mistura para dentro da primeira faixa de tem- peratura Ti.
[00161] O painel (Ill) representa o início do ciclo seguinte na reação de sequenciamento, em que a temperatura da mistura de reação foi reduzida de volta para dentro da primeira faixa de temperatura T;1. Deste modo, nesse exemplo, a progressão do painel (Il) para o painel (111) pode ser realizada removendo a mistura de reação da fonte de ca- lor ou, de outra forma, resfriando a mistura de reação (por exemplo, ativa ou passivamente) para dentro da primeira faixa de temperatura T1. Como mostrado, os reagentes de afinidade marcados são renatu- rados, incluindo um segundo reagente de afinidade que se associa re- versivelmente com fenilalanina no terminal do polipeptídeo, enquanto a exopeptidase marcada é mostrada desnaturada. A reação de sequen- ciamento continua pela realização alternada de ciclos adicionais de reconhecimento do aminoácido e clivagem de aminoácido de maneira dependente da temperatura como ilustrado por esse exemplo.
[00162] Deste modo, uma abordagem de sequenciamento dinâmico pode envolver a realização de ciclos de reação que é controlada em nível da atividade ou função proteica de uma ou mais proteínas em uma mistura de reação. Deve-se reconhecer que o processo de se- quenciamento de polipeptídeos dependente da temperatura, represen- tado na Figura 3B e descrito acima, pode ser ilustrativo de uma abor- dagem geral para o sequenciamento de polipeptídeos pela realização controlável de ciclos de reconhecimento e clivagem dependente da condição. Por exemplo, em algumas modalidades, o pedido de patente provê um processo de sequenciamento dependente de luminescência, usando reagentes ativados por luminescência-. Em algumas modali- dades, um processo de sequenciamento dependente de luminescência envolve ciclos de reconhecimento do aminoácido e clivagem do ami- noácido dependentes da luminescência. Cada ciclo da reação de se- quenciamento pode ser realizado expondo uma mistura de reação de sequenciamento a duas condições luminescentes diferentes: uma pri- meira condição luminescente que é ótima para a atividade do reagente de afinidade em relação à atividade da exopeptidase (por exemplo, para promover o reconhecimento do aminoácido), e uma segunda condição luminescente que é ótima para a atividade da exopeptidase em relação à atividade do reagente de afinidade (por exemplo, para promover a clivagem de aminoácido). A reação de sequenciamento progride alternando entre expor a mistura de reação à primeira condi- ção luminescente (para iniciar o reconhecimento do aminoácido) e ex- por a mistura de reação à segunda condição luminescente (para iniciar a clivagem de aminoácido). A título de exemplo e sem limitação, em algumas modalidades, as duas condições luminescentes diferentes compreendem um primeiro comprimento de onda e um segundo com- primento de onda.
[00163] Em alguns aspectos, o pedido de patente provê métodos de sequenciamento de polipeptídeos em tempo real avaliando-se as inte- rações de ligação de um ou mais reagentes de afinidade marcados com aminoácidos terminais e internos e as interações de ligação de uma exopeptidase inespecífica marcada com aminoácidos terminais. À Figura 4 mostra um exemplo de um método de sequenciamento no qual o método descrito e ilustrado para a abordagem nas Figuras 3A- 3B é modificado usando um reagente de afinidade marcado 410 que se liga seletivamente e se dissocia de um tipo de aminoácido (mostra- do aqui como lisina) tanto nas posições terminais como internas (Figu- ra 4, painel de encaixe). Como descrito na abordagem anterior, a liga- ção seletiva dá origem a uma série de pulsos na saída de sinal 400. Nessa abordagem, no entanto, a série de pulsos ocorre em uma taxa que é determinada pelo número do tipo de aminoácido por todo o poli- peptídeo. Deste modo, em algumas modalidades, a taxa de pulsos correspondentes a eventos de ligação seria diagnóstica do número de aminoácidos cognatos atualmente presentes no polipeptídeo.
[00164] Como na abordagem anterior, uma peptidase inespecífica marcada 420 estaria presente em uma concentração relativamente menor que o reagente de afinidade marcado 410, por exemplo, para fornecer janelas de tempo ótimas entre os eventos de clivagem (Figura 4, painel de encaixe). Além disso, em certas modalidades, o marcador luminescente exclusivamente identificável 420 indicaria quando even- tos de clivagem ocorreram. Como o polipeptídeo sofre clivagem iterati- va, a taxa de pulsos correspondentes à ligação pelo reagente de afini- dade marcado 410 cairia de etapa em etapa sempre que um aminoá- cido terminal fosse clivado pela peptidase inespecífica marcada 420. Esse conceito é ilustrado pelo gráfico 402, que representa em geral a taxa de pulsos em função do tempo, com eventos de clivagem no tem- po indicados por setas. Assim, em algumas modalidades, os aminoá- cidos podem ser identificados - e os polipeptídeos assim sequenciados - nessa abordagem tendo por base um padrão de pulsos e/ou on a ta- xa de pulsos que ocorre dentro de um padrão detectado entre eventos de clivagem.
[00165] Em algumas modalidades, as informações sobre a sequên- cia terminal do polipeptídeo (por exemplo, determinadas como aqui descrito) podem ser combinadas com informações sobre a sequência do polipeptídeo obtidas de uma ou mais outras fontes. Por exemplo, as informações sobre a sequência terminal do polipeptídeo poderiam ser combinadas com as informações sobre a sequência interna do poli- peptídeo. Em algumas modalidades, as informações sobre a sequên- cia interna do polipeptídeo podem ser obtidas usando uma ou mais moléculas de reconhecimento de aminoácidos que se associam com aminoácidos internos, como aqui descrito. As informações sobre a se- quência interna ou outras do polipeptídeo podem ser obtidas antes ou durante o processo de degradação de um polipeptídeo. Em algumas modalidades, as informações sobre a sequência obtidas por esses mé- todos podem ser combinadas com informações sobre a sequência do polipeptídeo usando outras técnicas, por exemplo, informações sobre a sequência obtidas usando uma ou mais moléculas de reconhecimen- to de aminoácidos internos. Moléculas de reconhecimento protegidas
[00166] De acordo com modalidades aqui descritas, os métodos de sequência de polipeptídeos de única molécula podem ser realizados iluminando um polipeptídeo imobilizado em uma superfície com luz de excitação, e detectando a luminescência produzida por um marcador anexado a uma molécula de reconhecimento de aminoácido (por exemplo, um reagente de afinidade marcado). Em alguns casos, o de- caimento radioativo e/ou não radioativo produzido pelo marcador pode resultar em fotodanos ao polipeptídeo. Por exemplo, a Figura 5A ilus- tra um exemplo de reação de sequenciamento no qual é mostrada uma molécula de reconhecimento associada com um polipeptídeo imobilizado em uma superfície.
[00167] Na presença de iluminação de excitação, o marcador pode produzir fluorescência através de decaimento radioativo que resulta em um evento de associação detectável. No entanto, em alguns ca- sos, o marcador produz decaimento não radioativo que pode resultar na formação de espécies reativas de oxigênio 500. As espécies reati- vas de oxigênio 500 podem no final danificar o peptídeo imobilizado, tal que a reação finaliza antes de serem obtidas as informações com- pletas da sequência para o polipeptídeo. Esses fotodanos podem ocorrer, por exemplo, no terminal exposto do polipeptídeo (seta clara em cima), em uma posição interna (seta clara no meio) ou no ligante da superfície anexando o polipeptídeo à superfície (seta aberta embai- xo).
[00168] Os inventores verificaram que os fotodanos podem ser ate- nuados e os tempos de reconhecimento ampliados pela incorporação de um elemento de proteção em uma molécula de reconhecimento de aminoácido. A Figura 5B ilustra um exemplo de reação de sequencia- mento usando uma molécula de reconhecimento protegida que inclui um protetor (shield) 502. O protetor 502 forma um grupo de ligação covalente ou não covalente que aumenta a distância entre o marcador e o polipeptídeo, de tal modo que os efeitos nocivos das espécies rea- tivas de oxigênio 500 pode ser reduzidos devido ao decaimento de ra- dicais livres ao longo da distância de separação marcador- polipeptídeo. O protetor 502 pode também proporcionar uma barreira estérica que protege o polipeptídeo contra o marcador ao absorver da- nos por espécies reativas de oxigênio 500 e o decaimento radioativo e/ou não reativo.
[00169] Sema intenção de ficar preso à teoria, acredita-se que um protetor, posicionado entre um componente de reconhecimento e um componente do marcador, pode absorver, desviar ou de outra forma bloquear o decaimento radioativo e/ou não radioativo emitido pelo componente do marcador. Em algumas modalidades, o protetor impe-
de ou limite a extensão com que um ou mais marcadores (por exem- plo, marcadores luminescentes) interagem com uma ou mais molécu- las de reconhecimento de aminoácidos. Em algumas modalidades, o protetor impede ou limita a extensão com que um ou mais marcadores interagem com uma ou mais moléculas associadas com uma molécula de reconhecimento de aminoácido (por exemplo, um polipeptídeo as- sociado com a molécula de reconhecimento). Deste modo, em algu- mas modalidades, o termo protetor (shield) pode referir-se em geral a um efeito protetor ou de proteção que é fornecido por alguma porção de um grupo de ligação formado entre um componente de reconheci- mento e um componente do marcador.
[00170] Em algumas modalidades, um protetor é anexado a uma ou mais moléculas de reconhecimento de aminoácidos (por exemplo, um componente de reconhecimento) e a um ou mais marcadores (por exemplo, um componente do marcador). Em algumas modalidades, os componentes de reconhecimento e do marcador são anexados em sí- tios não adjacentes no protetor. Por exemplo, uma ou mais moléculas de reconhecimento de aminoácidos podem ser anexadas a um primei- ro lado do protetor, e um ou mais marcadores podem ser anexados a um segundo lado do protetor, em que o primeiro e segundo lado do protetor são distantes um do outro. Em algumas modalidades, os sítios de ligação estão em lados aproximadamente opostos do protetor.
[00171] A distância entre o sítio ao qual um protetor é anexado a uma molécula de reconhecimento e o sítio ao qual o protetor é anexa- do a um marcador pode ser uma medição linear através do espaço ou uma medição não linear através da superfície do protetor. A distância entre os sítios de ligação da molécula de reconhecimento e do marca- dor em um protetor pode ser medida por modelagem da estrutura tri- dimensional do protetor. Em algumas modalidades, essa distância po- de ser de pelo menos 2 nm, pelo menos 4 nm, pelo menos 6 nm, pelo menos 8 nm, pelo menos 10 nm, pelo menos 12 nm, pelo menos 15 nm, pelo menos 20 nm, pelo menos 30 nm, pelo menos 40 nm ou mais. Alternativamente, as posições relativas da molécula de reconhe- cimento e do marcador em um protetor podem ser descritas tratando a estrutura do protetor como uma superfície quadrática (por exemplo, cilindro elipsoide, elíptico). Em algumas modalidades, os sítios de liga- ção da molécula de reconhecimento e do marcador estão separados por uma distância que é pelo menos um oitavo da distância em volta de uma forma elipsoide representando o protetor. Em algumas modali- dades, a molécula de reconhecimento e o marcador estão separados por uma distância que é pelo menos um quarto da distância em volta de uma forma elipsoide representando o protetor. Em algumas modali- dades, a molécula de reconhecimento e o marcador estão separados por uma distância que é pelo menos um terço da distância em volta de uma forma elipsoide representando o protetor. Em algumas modalida- des, a molécula de reconhecimento e o marcador estão separados por uma distância que é a metade da distância em volta de uma forma elipsoide representando o protetor.
[00172] O tamanho de um protetor deve ser tal que seja impossível ou improvável que um marcador entre em contato diretamente com o polipeptídeo quando a molécula de reconhecimento de aminoácido está associada com o polipeptídeo. O tamanho de um protetor deve também ser tal que um marcador anexado seja detectável quando a molécula de reconhecimento de aminoácido está associada com o po- lipeptídeo. Por exemplo, o tamanho deve ser tal que um marcador lu- minescente anexado esteja ao alcance de um volume de excitação a ser excitado.
[00173] Deve-se reconhecer que existe uma variedade de parâme- tros por quais um médico possa avaliar os efeitos de proteção. Em ge- ral, os efeitos de um elemento de proteção podem ser averiguados conduzindo uma avaliação comparativa entre uma composição con- tendo o elemento de proteção e uma composição desprovida do ele- mento de proteção. Por exemplo, um elemento de proteção pode au- mentar tempo de reconhecimento de uma molécula de reconhecimen- to de aminoácido. Em algumas modalidades, o tempo de reconheci- mento refere-se à extensão de tempo em que eventos de associação entre a molécula de reconhecimento e um polipeptídeo podem ser ob- servados na reação de sequenciamento de polipeptídeos como aqui descrita. Em algumas modalidades, o tempo de reconhecimento é au- mentado em cerca de 10-25%, 25-50%, 50-75%, 75-100% ou mais de 100%, por exemplo, em aproximadamente 2 vezes, 3 vezes, 4 vezes, vezes ou mais em relação a uma reação de sequenciamento do po- lipeptídeo realizada sob as mesmas condições, com a exceção de que a molécula de reconhecimento de aminoácido é desprovida do ele- mento de proteção, mas que é do contrário semelhante ou idêntica. Em algumas modalidades, um elemento de proteção pode aumentar a exatidão do sequenciamento e/ou o comprimento de leitura da se- quência (por exemplo, em pelo menos 5%, pelo menos 10%, pelo me- nos 15%, pelo menos 25% ou mais, em relação a uma reação de se- quenciamento realizada sob condições comparativas como descrito acima).
[00174] Deste modo, em alguns aspectos, o pedido de patente pro- vê moléculas de reconhecimento protegidas que compreendem pelo menos uma molécula de reconhecimento de aminoácido, pelo menos um marcador detectável e um elemento de proteção (por exemplo, um "protetor") que forma um grupo de ligação covalente ou não covalente entre a molécula de reconhecimento e o marcador. Em algumas moda- lidades, um elemento de proteção tem pelo menos 2 nm, pelo menos 5 nm, pelo menos 10 nm, pelo menos 12 nm, pelo menos 15 nm, pelo menos 20 nm ou mais de comprimento (por exemplo, em uma solução aquosa). Em algumas modalidades, um elemento de proteção tem en- tre aproximadamente 2 nm e 100 nm de comprimento (por exemplo, entre aproximadamente 2 nm e 50 nm, entre aproximadamente 10 nm e 50 nm, entre aproximadamente 20 nm e 100 nm).
[00175] Em algumas modalidades, um protetor (por exemplo, ele- mento de proteção) forma um grupo de ligação covalente ou não cova- lente entre uma ou mais moléculas de reconhecimento de aminoácidos (por exemplo, um componente de reconhecimento) e um ou mais mar- cadores (por exemplo, um componente do marcador). Neste relatório descritivo, em algumas modalidades, ligações ou grupos de ligação covalente e covalente referem-se à natureza das ligações dos compo- nentes de reconhecimento e marcador ao protetor.
[00176] Em algumas modalidades, uma ligação covalente ou um grupo de ligação covalente refere-se a um protetor que é anexado a cada dos componentes de reconhecimento e marcador através de uma ligação covalente ou uma série de ligações covalentes contíguas. A ligação covalente a um ou ambos os componentes pode ser realiza- da por métodos de conjugação covalente conhecidos na técnica. Por exemplo, em algumas modalidades, podem ser usadas técnicas de química click (por exemplo, química click catalisada por cobre, promo- vida por cepa ou sem cobre etc.) para anexar um ou ambos os com- ponentes ao protetor. Tais métodos em geral envolvem conjugar uma porção reativa à outra porção reativa para formar uma ou mais liga- ções covalentes entre as porções reativas. Deste modo, em algumas modalidades, uma primeira porção reativa de um protetor pode ser co- locada em contato com uma segunda porção reativa de um compo- nente de reconhecimento ou marcador para formar uma ligação cova- lente. Os exemplos de porções reativas incluem, entre outros, aminas, azidas, alcinos, nitronas, alcenos (por exemplo, cicloalcenos), tetrazi- nas, tetrazóis reativos e outras porções reativas adequadas para rea-
ções do tipo click e técnicas semelhantes de acoplamento.
[00177] Em algumas modalidades, uma ligação não covalente ou um grupo de ligação não covalente refere-se a um protetor que é ane- xado a um ou a ambos os componentes de reconhecimento e marca- dor através de um ou mais meios de acoplamento não covalente, in- cluindo, entre outros, interações receptor-ligando e hibridização de fi- tas de oligonucleotídeos. Os exemplos de interações receptor-ligando são are aqui fornecidos e incluem, entre outros, complexos proteína- proteína, complexos proteína-ligando, complexos proteína-aptâmero e complexos aptâmero-ácido nucleico. Várias configurações e estraté- gias para hibridização de fitas de oligonucleotídeos são aqui descritas e são conhecidas na técnica (ver, por exemplo, Publicação de Patente U.S. Nº 2019/0024168).
[00178] Em algumas modalidades, o protetor 502 compreende um polímero, como uma biomolécula ou um polímero dendrítico. A Figura 5C representa exemplos de protetores poliméricos e configurações de moléculas de reconhecimento protegidas do pedido de patente. Uma primeira construção protegida 504 mostra um exemplo de uma proteí- na como protetor 530. Em algumas modalidades, o protetor proteico 530 forma um grupo de ligação covalente entre uma molécula de re- conhecimento e um marcador. Por exemplo, em algumas modalida- des, o protetor proteico 530 é anexado à molécula de reconhecimento e ao marcador através de uma ou mais ligações covalentes, por exemplo, por ligação covalente através de uma cadeia lateral de um aminoácido natural ou não natural do protetor proteico 530. Em algu- mas modalidades, o protetor proteico 530 forma um grupo de ligação não covalente entre uma molécula de reconhecimento e um marcador. Por exemplo, em algumas modalidades, o protetor proteico 530 é uma proteína monomérica ou multimérica que compreende um ou mais sí- tios de ligação ao ligando. Em algumas modalidades, um grupo de |i-
gação não covalente é formado através de uma ou mais porções do ligando ligadas a um ou mais sítios de ligação ao ligando. Exemplos adicionais de ligação não covalentes formadas por protetores proteicos são descritos em outro lugar no presente.
[00179] Uma segunda construção protegida 506 mostra um exem- plo de um ácido nucleico de fita dupla como protetor que compreende uma primeira fita de oligonucleotídeo 532 hibridizada com uma segun- da fita de oligonucleotídeo 534. Como mostrado, em algumas modali- dades, o ácido nucleico de fita dupla protetor pode compreender uma molécula de reconhecimento anexada a uma primeira fita de oligonu- cleotídeo 532, e um marcador anexado a uma segunda fita de oligonu- cleotídeo 534. Dessa maneira, o ácido nucleico de dupla fita protetor forma um grupo de ligação não covalente entre a molécula de reco- nhecimento e o marcador pela hibridização das fitas de oligonucleotí- deo. Em algumas modalidades, uma molécula de reconhecimento e um marcador podem ser anexada à mesma fita de oligonucleotídeo, o que pode fornecer um ácido nucleico de fita simples como protetor ou um ácido nucleico de dupla fita protetor pela hibridização com outra fita de oligonucleotídeo. Em algumas modalidades, a hibridização das fitas pode proporcionar rigidez aumentada dentro de um grupo de ligação para reforçar ainda mais a separação entre a molécula de reconheci- mento e o marcador.
[00180] “Quando o elemento de proteção 502 compreende um ácido nucleico, a distância de separação entre um marcador e uma molécula de reconhecimento pode ser medida pela distância entre os sítios de ligação no ácido nucleico (por exemplo, ligação direta ou ligação indi- reta, como através de um ou mais polímeros protetores adicionais). Em algumas modalidades, a distância entre os sítios de ligação em um ácido nucleico pode ser medida pelo número de nucleotídeos no ácido nucleico que ocorrem entre o marcador e a molécula de reconheci-
mento. Deve ser entendido que o número de nucleotídeos pode referir- se ao número de bases nucleotídicas em um ácido nucleico de fita simples ou o número de pares de bases nucleotídicas em um ácido nucleico de fita dupla.
[00181] Deste modo, em algumas modalidades, o sítio de ligação de uma molécula de reconhecimento e o sítio de ligação de um mar- cador podem ser separados por entre 5 e 200 nucleotídeos (por exemplo, entre 5 e 150 nucleotídeos, entre 5 e 100 nucleotídeos, entre e 50 nucleotídeos, entre 10 e 100 nucleotídeos). Deve ser reconhe- cido que qualquer posição em um ácido nucleico pode servir como um sítio de ligação para uma molécula de reconhecimento, um marcador ou para um ou mais protetores poliméricos adicionais. Em algumas modalidades, um sítio de ligação pode ser próximo ou na extremidade 5' ou 3', ou em uma posição interna ao longo de uma fita do ácido nu- cleico.
[00182] A configuração não limitante da segunda construção prote- gida 506 ilustra um exemplo de um protetor que forma uma ligação não covalente pela hibridização das fitas. Un exemplo adicional de ligação não covalente é ilustrado por uma terceira construção protegi- da 508 que compreende um oligonucleotídeo como protetor 536. Em algumas modalidades, o oligonucleotídeo protetor 536 é um aptâmero de ácido nucleico que se liga a uma molécula de reconhecimento e forma uma ligação não covalente. Em algumas modalidades, a molé- cula de reconhecimento é um aptâmero de ácido nucleico, e o oligonu- cleotídeo protetor 536 compreende uma fita de oligonucleotídeo que hibridiza com o aptâmero e forma uma ligação não covalente.
[00183] Uma quarta construção protegida 510 mostra um exemplo de um polímero dendrítico como protetor 538. Neste relatório descriti- vo, em algumas modalidades, um polímero dendrítico refere-se em geral a um poliol ou um dendrímero. Polióis e dendrímeros foram des-
critos na técnica, e podem incluir estruturas dendríticas ramificadas otimizadas para uma configuração em particular. Em algumas modali- dades, o polímero dendrítico protetor 538 compreende polietilenoglicol, tetraetilenoglicol, polilamidoamina), poli(propilenoimina), poli(propile- noamina), carbosilano, poli(L-lisina) ou uma combinação de um ou mais dos mesmos.
[00184] Um dendrímero, ou dendron, é uma molécula repetidamen- te ramificada que é tipicamente simétrica em volta do núcleo e que po- de adotar uma morfologia esférica tridimensional. Ver, por exemplo, Astruc et al. (2010) Chem. Rev. 110:1857. A incorporação de tais es- truturas em um protetor do pedido de patente pode fornecer um efeito protetor pela inibição estérica de contatos entre um marcador e uma ou mais biomoléculas associadas com o mesmo (por exemplo, uma molécula de reconhecimento e/ou um polipeptídeo associado com a molécula de reconhecimento). O refinamento das propriedades quími- cas e físicas do dendrímero por variação na estrutura primária da mo- lécula, incluindo funcionalização potencial da superfície do dendríme- ro, permite ajustar os efeitos de proteção conforme desejado. Os den- drímeros podem ser sintetizados por uma variedade de técnicas usan- do uma ampla gama de materiais e reações de ramificação, como é sabido na técnica. Tal variação sintética permite personalizar as pro- priedades do dendrímero quando necessário. Exemplos de compostos poliol e dendrímero que podem ser usados de acordo com os proteto- res do pedido de patente incluem, entre outros, compostos descritos na Publicação de Patente U.S. Nº 20180346507.
[00185] A Figura 5D representa outros exemplos de configurações de moléculas de reconhecimento protegidas do pedido de patente. Uma construção proteína-ácido nucleico 512 mostra um exemplo de um protetor que compreende mais de um polímero na forma de uma proteína e um ácido nucleico de fita dupla. Em algumas modalidades,
a porção de proteína do protetor é anexada à porção de ácido nucleico do protetor através de uma ligação covalente. Em algumas modalida- des, a ligação é por uma ligação não covalente. Por exemplo, em al- gumas modalidades, a porção de proteína do protetor uma proteína monovalente ou multivalente que forma pelo menos uma ligação não covalente através de uma porção de ligando anexada a um sítio de ligação ao ligando da proteína monovalente ou multivalente. Em algu- mas modalidades, a porção de proteína do protetor compreende uma proteína avidina.
[00186] Em algumas modalidades, uma molécula de reconhecimen- to protegida do pedido de patente é uma construção avidina-ácido nu- cleico 514. Em algumas modalidades, a construção avidina-ácido nu- cleico 514 inclui um protetor que compreende uma proteína avidina 540 e um ácido nucleico de fita dupla. Como aqui descrito, a proteína avidina 540 pode ser utilizada para formar uma ligação não covalente entre uma ou mais moléculas de reconhecimento de aminoácidos e um ou mais marcadores, quer direta ou indiretamente, como através de um ou mais polímeros protetores adicionais aqui descrita.
[00187] Proteínas avidina são proteínas que se ligam à biotina, em geral, contendo um sítio de ligação à biotina em cada uma de quatro subunidades da proteína avidina. As proteínas avidina incluem, por exemplo, avidina, estreptavidina, traptavidina, tamavidina, bradavidina, xenavidina e homólogos e variantes das mesmas. Em alguns casos, pode-se usar a forma monomérica, dimérica ou tetramérica da proteí- na avidina. Em algumas modalidades, a proteína avidina de um com- plexo de proteína avidina é estreptavidina em uma forma tetramérica (por exemplo, um homotetrâmero). Em algumas modalidades, os sítios de ligação à biotina de uma proteína avidina fornecem sítios de ligação para uma ou mais moléculas de reconhecimento de aminoácidos, um ou mais marcadores e/ou um ou mais polímeros protetores adicionais aqui descritos.
[00188] Um diagrama ilustrativo de um complexo de proteína avidi- na é mostrado no painel de encaixe da Figura 5D. Como mostrado no painel de encaixe, a proteína avidina 540 pode incluir um sítio de liga- ção 542 em cada uma de quatro subunidades da proteína que podem ser ligada a uma porção biotina (mostrada como círculos claros). À multivalência da proteína avidina 540 pode permitir várias configura- ções de ligação, as quais são mostradas em geral para fins de ilustra- ção. Por exemplo, em algumas modalidades, uma porção de ligação à biotina 544 pode ser usada para fornecer um único ponto de ligação à proteína avidina 540. Em algumas modalidades, uma porção de liga- ção à bis-biotina 546 pode ser usada para fornecer dois pontos de li- gação à proteína avidina 540. Como ilustrado pela construção avidina- ácido nucleico 514, um complexo de proteína avidina pode ser forma- do por duas porções de ligação à bis-biotina, as quais formam uma trans-configuração permitindo aumentar a distância de separação en- tre uma molécula de reconhecimento e um marcador.
[00189] Vários exemplos adicionais de configurações de proteína avidina como protetor são mostradas. Uma primeira construção de avidina 516 mostra um exemplo de protetor de avidina anexado a uma molécula de reconhecimento através de uma porção de ligação à bis- biotina e a dois marcadores através de porções separadas de ligação à biotina. Uma segunda construção de avidina 518 mostra um exemplo de um protetor de avidina anexado a duas moléculas de reconheci- mento através de porções separadas de ligação à biotina e a um mar- cador através de uma porção de ligação à bis-biotina. Uma terceira construção de avidina 520 mostra um exemplo de um protetor de avi- dina anexado a duas moléculas de reconhecimento através de por- ções separadas de ligação à biotina e a um ácido nucleico marcado através uma porção de ligação à biotina de cada fita do ácido nucleico.
Uma quarta construção de avidina 522 mostra um exemplo de um pro- tetor de avidina anexado a uma molécula de reconhecimento e a um ácido nucleico marcado através de porções separadas de ligação à bis-biotina. Como mostrado, o marcador é protegido adicionalmente da molécula de reconhecimento por um polímero dendrítico entre o mar- cador e o ácido nucleico.
[00190] Deve-se reconhecer que os exemplos de configurações de moléculas de reconhecimento protegidas mostrados nas Figuras 5A- 5D são fornecidos para fins ilustrativos. Os inventores conceberam vá- rias outras configurações de protetor usando um ou mais polímeros diferentes que formam uma ligação covalente ou não covalente entre os componentes de reconhecimento e marcador de uma molécula de reconhecimento protegida. A título de exemplo, a Figura 5E ilustra a modularidade da configuração do protetor de acordo com o pedido de patente.
[00191] “Como mostrado na parte superior da Figura 5E, uma molé- cula de reconhecimento protegida, em geral, compreende um compo- nente de reconhecimento 550, um elemento de proteção 552 e um componente marcador 554. Para facilidade de ilustração, o componen- te de reconhecimento 550 é representado como uma molécula de re- conhecimento de aminoácido, e o componente marcador 554 é repre- sentado como um marcador. Deve-se reconhecer que as moléculas de reconhecimento protegidas do pedido de patente podem compreender um elemento de proteção 552 anexado a uma ou mais moléculas de reconhecimento de aminoácidos e um ou mais marcadores. Quando o componente de reconhecimento 550 compreende mais de uma molé- cula de reconhecimento, cada molécula de reconhecimento pode ser anexada ao elemento de proteção 552 em um ou mais sítios de liga- ção no elemento de proteção 552. Quando o componente marcador 554 compreende mais de um marcador, cada marcador pode ser ane-
xado a um elemento de proteção 552 em um ou mais sítios de ligação no elemento de proteção 552.
[00192] Em algumas modalidades, o elemento de proteção 552 compreende uma proteína 560. Em algumas modalidades, a proteína 560 é uma proteína monovalente ou multivalente. Em algumas modali- dades, a proteína 560 é uma proteína monomérica ou multimérica, como um homodímero proteico, heterodímero proteico, oligômero pro- teico ou outra molécula proteinácea. Em algumas modalidades, o ele- mento de proteção 552 compreende um complexo proteico formado por uma proteína ligada não covalentemente a pelo menos uma outra molécula. Por exemplo, em algumas modalidades, o elemento de pro- teção 552 compreende um complexo proteína-proteína 562. Em algu- mas modalidades, o complexo proteína-proteína 562 compreende uma molécula proteinácea ligada especificamente à outra molécula protei- nácea. Em algumas modalidades, o complexo proteína-proteína 562 compreende um anticorpo ou fragmento de anticorpo (por exemplo, scFv) ligado a um antígeno. Em algumas modalidades, o complexo proteína-proteína 562 compreende um receptor ligado a um ligando de proteína. Exemplos adicionais de complexos proteína-proteína inclu- em, entre outros, tripsina-aprotinina, barnase-barstar e a proteína de imunidade colicina E9-Im9.
[00193] Em algumas modalidades, o elemento de proteção 552 compreende um complexo proteína-ligando 564. Em algumas modali- dades, o complexo proteína-ligando 564 compreende uma proteína monovalente e uma porção de ligando não proteinácea. Por exemplo, em algumas modalidades, o complexo proteína-ligando 564 compre- ende uma enzima ligada a uma porção de inibidor de pequena molécu- la. Em algumas modalidades, o complexo proteína-ligando 564 com- preende um receptor ligado a uma porção de ligando não proteinácea.
[00194] Em algumas modalidades, o elemento de proteção 552 compreende um complexo proteico multivalente formado por uma pro- teína multivalente ligada não covalentemente a uma ou mais porções de ligando. Em algumas modalidades, o elemento de proteção 552 compreende um complexo de proteína avidina formado por uma prote- ína avidina ligada não covalentemente a uma ou mais porções de liga- ção à biotina. As construções 566, 568, 570 e 572 fornecem exemplos ilustrativos de complexos de proteína avidina, em que qualquer uma ou mais dessas podem ser incorporadas no elemento de proteção 552.
[00195] Em algumas modalidades, o elemento de proteção 552 compreende um complexo de avidina de duas formas 566 que com- preende uma proteína avidina ligada a duas porções de ligação bis- biotina. Em algumas modalidades, o elemento de proteção 552 com- preende um complexo de avidina de três formas 568 que compreende uma proteína avidina ligada a duas porções de ligação à biotina e uma porção de ligação bis-biotina. Em algumas modalidades, o elemento de proteção 552 compreende um complexo de avidina de quatro for- mas 570 que compreende uma proteína avidina ligada a quatro por- ções de ligação à biotina.
[00196] Em algumas modalidades, o elemento de proteção 552 compreende uma proteína avidina compreendendo um ou dois sítios de ligação não funcionais projetados na proteína avidina. Por exemplo, em algumas modalidades, o elemento de proteção 552 compreende um complexo de avidina bivalente 572 compreendendo uma proteína avidina ligada a uma porção de ligação à biotina em cada uma de duas subunidades, em que a proteína avidina compreende um sítio de liga- ção ao ligando não funcional 548 em cada uma das duas outras subu- nidades. Como mostrado, em algumas modalidades, o complexo de avidina bivalente 572 compreende uma proteína avidina trans- bivalente, embora uma proteína avidina cis-bivalente possa ser utiliza- da dependendo da implementação desejada. Em algumas modalida-
des, a proteína avidina é uma proteína avidina trivalente. Em algumas modalidades, a proteína avidina trivalente compreende um sítio de li- gação ao ligando não funcional 548 em uma subunidade e é ligada a três porções de ligação à biotina, ou uma porção de ligação à biotina e uma porção de ligação bis-biotina nas outras subunidades.
[00197] Em algumas modalidades, o elemento de proteção 552 compreende um polímero dendrítico 574. Em algumas modalidades, o polímero dendrítico 574 é um poliol ou um dendrímero, como descritos em outro lugar no presente. Em algumas modalidades, o polímero dendrítico 574 é um poliol ramificado ou um dendrímero ramificado. Em algumas modalidades, o polímero dendrítico 574 compreende um monossacarídeo-TEG, um dissacarídeo, um N-acetil monossacarídeo, um TEMPO-TEG, um trolox-TEG ou um dendrímero de glicerol. Os exemplos de polióis úteis de acordo com as moléculas de reconheci- mento protegidas do pedido de patente incluem poliéter polióis e poli- éster polióis, por exemplo, polietilenoglicol, polipropilenoglicol e polí- meros semelhantes bem conhecidos na técnica. Em algumas modali- dades, o polímero dendrítico 574 compreende um composto da fórmu- la seguinte: -(CH2CH20O)n-, onde n é um número inteiro de 1 a 500, inclusive. Em algumas modalidades, o polímero dendrítico 574 com- preende um composto da fórmula seguinte: -(CH2CH2O)n-, em que n é um número inteiro de 1 a 100, inclusive.
[00198] Em algumas modalidades, o elemento de proteção 552 compreende um ácido nucleico. Em algumas modalidades, o ácido nu- cleico é de fita simples. Em algumas modalidades, o componente mar- cador 554 é anexado direta ou indiretamente a uma extremidade do ácido nucleico de fita simples (por exemplo, a extremidade 5' ou a ex- tremidade 3') e o componente de reconhecimento 550 é anexado dire- ta ou indiretamente à outra extremidade do ácido nucleico de fita sim- ples (por exemplo, a extremidade 3' ou a extremidade 5'). Por exem-
plo, o ácido nucleico de fita simples pode compreender um marcador anexado à extremidade 5' do ácido nucleico e uma molécula de reco- nhecimento de aminoácido anexada à extremidade 3' do ácido nuclei- co.
[00199] Em algumas modalidades, o elemento de proteção 552 compreende um ácido nucleico de fita dupla 576. Como mostrado, em algumas modalidades, o ácido nucleico de fita dupla 576 pode formar uma ligação não covalente entre o componente de reconhecimento 550 e o componente marcador 554 pela hibridização das fitas. No en- tanto, em algumas modalidades, o ácido nucleico de fita dupla 576 po- de formar uma ligação covalente entre o componente de reconheci- mento 550 e o componente marcador 554 pela ligação à mesma fita de oligonucleotídeo. Em algumas modalidades, o componente marca- dor 554 é anexado direta ou indiretamente a uma extremidade do áci- do nucleico de fita dupla e o componente de reconhecimento 550 é anexado direta ou indiretamente à outra extremidade do ácido nucleico de fita dupla. Por exemplo, o ácido nucleico de fita dupla pode com- preender um marcador anexado à extremidade 5' de uma fita e uma molécula de reconhecimento de aminoácido anexada à extremidade 5' da outra fita.
[00200] Em algumas modalidades, o elemento de proteção 552 compreende um ácido nucleico que forma um ou mais motivos estrutu- rais que podem ser úteis para aumentar o volume estérico do protetor. Os exemplos de motivos estruturais de ácidos nucleicos incluem, entre outros, haste-alças, junções de três formas (por exemplo, formadas por dois ou mais motivos haste-alça), junções de quatro formas (por exemplo, junções de Holliday) e alças salientes.
[00201] Em algumas modalidades, o elemento de proteção 552 compreende um ácido nucleico que forma uma haste-alça 578. Uma haste-alça, ou alça em grampo de cabelo (hairpin), é uma alça não pa-
reada de nucleotídeos em uma fita de oligonucleotídeo que é formada quando a fita de oligonucleotídeo se dobra e forma pares de base com outra seção da mesma fita. Em algumas modalidades, a alça não pa- reada da haste-alça 578 compreende três a dez nucleotídeos. Deste modo, a haste-alça 578 pode ser formada por duas regiões de uma fita de oligonucleotídeo com sequências complementares invertidas que se hibridizam para formar uma haste, em que as duas regiões são se- paradas pelos três a dez nucleotídeos que formam a alça não parea- da. Em algumas modalidades, a haste da haste-alça 578 pode ser cri- ada para ter um ou mais nucleotídeos G/C, os quais podem proporcio- nar mais estabilidade com a adição da interação de ligações de hidro- gênio que formam quando comparados aos nucleotídeos A/T. Em al- gumas modalidades, a haste da haste-alça 578 compreende nucleotí- deos G/C imediatamente adjacentes a uma sequência de alça não pa- reada. Em algumas modalidades, a haste da haste-alça 578 compre- ende nucleotídeos G/C nucleotídeos dentro dos primeiros 2, 3, 46 ou 5 nucleotídeos adjacentes a uma sequência de alça não pareada. Em algumas modalidades, uma alça não pareada da haste-alça 578 com- preende um ou mais sítios de ligação. Em algumas modalidades, um sítio de ligação ocorre em um sítio abásico na alça não pareada. Em algumas modalidades, um sítio de ligação ocorre em uma base da alça não pareada.
[00202] Em algumas modalidades, a haste-alça 578 é formada por um ácido nucleico de fita dupla. Como aqui descrito, em algumas mo- dalidades, o ácido nucleico de fita dupla pode formar um grupo de |i- gação não covalente pela hibridização das fitas da primeira e da se- gunda fita de oligonucleotídeos. No entanto, em algumas modalidades, o elemento de proteção 552 compreende um ácido nucleico de fita simples que forma um motivo haste-alça, por exemplo, para prover um grupo de ligação covalente. Em algumas modalidades, o elemento de proteção 552 compreende um ácido nucleico que forma dois ou mais motivos haste-alça. Por exemplo, em algumas modalidades, o ácido nucleico compreende dois motivos haste-alça. Em algumas modalida- des, uma haste de um motivo haste-alça é adjacente à haste do outro de tal modo que os motivos formam juntos uma junção de três formas. Em algumas modalidades, o elemento de proteção 552 compreende um ácido nucleico que forma uma junção de quatro formas 578. Em algumas modalidades, a junção de quatro formas 578 é formada pela hibridização de duas ou mais fitas de oligonucleotídeos (por exemplo, 2, 3 ou 4 fitas de oligonucleotídeos).
[00203] Em algumas modalidades, o elemento de proteção 552 compreende um ou mais polímeros selecionados dentre 560, 562, 564, 566, 568, 570, 572, 574, 576, 578 e 580 da Figura SE. Deve-se reco- nhecer que as porções de ligação e os sítios de ligação mostrados em cada um de 560, 562, 564, 566, 568, 570, 572, 574, 576, 578 e 580 são para fins ilustrativos e não pretendem representar uma configura- ção preferida para a ligação ou sítio de ligação.
[00204] Em alguns aspectos, o pedido de patente provê uma molé- cula de reconhecimento de aminoácido de Fórmula (1): A-(Y))-D (0), em que: A é um componente de ligação a um aminoácido compreen- dendo pelo menos uma molécula de reconhecimento de aminoácido; em cada caso, Y é um polímero que forma um grupo de ligação cova- lente ou não covalente; n é um número inteiro de 1 a 10, inclusive; e D é um componente marcador compreendendo pelo menos um marca- dor detectável. Em algumas modalidades, o pedido de patente provê uma composição que compreendendo molécula de reconhecimento de aminoácido solúvel de Fórmula (1).
[00205] Em algumas modalidades, A compreende uma pluralidade de moléculas de reconhecimento de aminoácidos. Em algumas moda- lidades, cada molécula de reconhecimento de aminoácido da plurali- dade é anexada a um sítio de ligação diferente em Y. Em algumas modalidades, pelo menos duas moléculas de reconhecimento de ami- noácidos da pluralidade são anexadas a um único sítio de ligação em Y. Em algumas modalidades, a molécula de reconhecimento de ami- noácido é uma proteína de reconhecimento ou um aptâmero de ácido nucleico, por exemplo, como descritos em outro lugar no presente.
[00206] Em algumas modalidades, o marcador detectável é um marcador luminescente ou um marcador de condutividade. Em algu- mas modalidades, o marcador luminescente compreende pelo menos uma molécula de corante fluoróforo. Em algumas modalidades, D compreende 20 ou menos moléculas de corante fluoróforo. Em algu- mas modalidades, a razão número de moléculas de corante fluorófo- ro/número de moléculas de reconhecimento de aminoácidos é entre 1:1 e 20:1. Em algumas modalidades, o marcador luminescente com- preende pelo menos um par de FRET compreendendo um marcador doador e um marcador aceitador. Em algumas modalidades, a razão marcador doador/marcador aceitador é 1:1, 2:1, 3:1, 4:1 ou 5:1. Em algumas modalidades, a razão marcador aceitador/marcador doador é 1:1, 2:1, 3:1, 4:1 ou 5:1.
[00207] Em algumas modalidades, D tem menos que 200 À de diã- metro. Em algumas modalidades, -(Y)n- tem pelo menos 2 nm de com- primento. Em algumas modalidades, -(Y)n- tem pelo menos 5 nm de comprimento. Em algumas modalidades, -(Y)n- tem pelo menos 10 nm de comprimento. Em algumas modalidades, em cada caso, Y é inde- pendentemente uma biomolécula, um poliol ou um dendrímero. Em algumas modalidades, a biomolécula é um ácido nucleico, um polipep- tídeo ou um polissacarídeo.
[00208] Em algumas modalidades, a molécula de reconhecimento de aminoácido é uma das seguintes fórmulas: A-Y'-(Y)m-D ou A-(Y)m-Y*-D, em que: Y' é um ácido nucleico ou um polipeptídeo; e m é um número inteiro de O a 10, inclusive.
[00209] Em algumas modalidades, o ácido nucleico compreende uma primeira fita de oligonucleotídeo. Em algumas modalidades, o ácido nucleico compreende uma segunda fita de oligonucleotídeo hi- bridizada com o primeira fita de oligonucleotídeo. Em algumas modali- dades, o ácido nucleico forma uma ligação covalente através da pri- meira fita de oligonucleotídeo. Em algumas modalidades, o ácido nu- cleico forma uma ligação não covalente através da primeira e da se- gunda fita hibridizadas de oligonucleotídeos.
[00210] Em algumas modalidades, o polipeptídeo é uma proteína monovalente ou multivalente. Em algumas modalidades, a proteína monovalente ou multivalente forma pelo menos uma ligação não cova- lente através de uma porção de ligando anexada ao sítio de ligação ao ligando da proteína monovalente ou multivalente. Em algumas modali- dades, A, Y ou D compreende a porção de ligando.
[00211] Em algumas modalidades, a molécula de reconhecimento de aminoácido é de uma das fórmulas seguintes: A-(Y)m-Y?-D ou A-Y?-(Y)m-D, em que: Y? é um poliol ou dendrímero; e m é um número in- teiro de O a 10, inclusive. Em algumas modalidades, o poliol ou den- drímero — compreende — polietilenoglicol, — tetraetilenoglicol, — po- li(amidoamina), poli(propilenoimina), poli(propilenoamina), carbosilano, poli(L-lisina) ou uma combinação de um ou mais dos mesmos.
[00212] Em alguns aspectos, o pedido de patente provê uma molé- cula de reconhecimento de aminoácido de Fórmula (Il): A-Y'-D (1),
em que: A é um componente de ligação a um aminoácido compreen- dendo pelo menos uma molécula de reconhecimento de aminoácido; Y'! é um ácido nucleico ou um polipeptídeo; D é um componente mar- cador compreendendo pelo menos um marcador detectável. Em algu- mas modalidades, quando Y'* é um ácido nucleico, o ácido nucleico forma um grupo de ligação covalente ou não covalente. Em algumas modalidades, quando Y' é um polipeptídeo, o polipeptídeo forma um grupo de ligação não covalente caracterizado por uma constante de dissociação (Kp) inferior a 50 x 10º M.
[00213] Em algumas modalidades, Y' é um ácido nucleico que compreende uma primeira fita de oligonucleotídeo. Em algumas moda- lidades, o ácido nucleico compreende uma segunda fita de oligonucle- otídeo hibridizada com a primeira fita de oligonucleotídeo. Em algumas modalidades, A é anexado à primeira fita de oligonucleotídeo, e em que D é anexado à segunda fita de oligonucleotídeo. Em algumas mo- dalidades, A é anexado a um primeiro sítio de ligação na primeira fita de oligonucleotídeo, e em que D é anexado a um segundo sítio de li- gação na primeira fita de oligonucleotídeo. Em algumas modalidades, cada fita de oligonucleotídeo do ácido nucleico compreende menos de 150, menos de 100 ou menos de 50 nucleotídeos.
[00214] Em algumas modalidades, Y' é uma proteína monovalente ou multivalente. Em algumas modalidades, a proteína monovalente ou multivalente forma pelo menos uma ligação não covalente através de uma porção de ligando anexada a um sítio de ligação ao ligando da proteína monovalente ou multivalente. Em algumas modalidades, pelo menos um dentre A e D compreende a porção de ligando. Em algumas modalidades, o polipeptídeo é uma proteína avidina (por exemplo, avi- dina, estreptavidina, traptavidina, tamavidina, bradavidina, xenavidina ou um homólogo ou variante das mesmas). Em algumas modalidades, a porção de ligando é uma porção de biotina.
[00215] Em algumas modalidades, a molécula de reconhecimento de aminoácido é de uma das fórmulas seguintes: A-YI-(Y)-D ou A-(Y)-Y*-D, em que: em cada caso, Y é um polímero que forma um grupo de liga- ção covalente ou não covalente; e n é um número inteiro de 1 a 10, inclusive. Em algumas modalidades, em cada caso, Y é independen- temente uma biomolécula, um poliol ou um dendrímero.
[00216] Em outros aspectos, o pedido de patente provê uma molé- cula de reconhecimento de aminoácido compreendendo: um ácido nu- cleico; pelo menos uma molécula de reconhecimento de aminoácido anexada a um primeiro sítio de ligação no ácido nucleico; e pelo me- nos um marcador detectável anexado a um segundo sítio de ligação no ácido nucleico. Em algumas modalidades, o ácido nucleico forma um grupo de ligação covalente ou não covalente entre pelo menos uma molécula de reconhecimento de aminoácido e pelo menos um marcador detectável.
[00217] Em algumas modalidades, o ácido nucleico é um ácido nu- cleico de fita dupla que compreende uma primeira fita de oligonucleo- tídeo hibridizada com uma segunda fita de oligonucleotídeo. Em algu- mas modalidades, o primeiro sítio de ligação está na primeira fita de oligonucleotídeo, e em que o segundo sítio de ligação está na segunda fita de oligonucleotídeo. Em algumas modalidades, pelo menos uma molécula de reconhecimento de aminoácido é anexada ao primeiro sítio de ligação através de uma proteína que forma um grupo de liga- ção covalente ou não covalente entre pelo menos uma molécula de reconhecimento de aminoácido e o ácido nucleico. Em algumas moda- lidades, pelo menos um marcador detectável é anexado ao segundo sítio de ligação através de uma proteína que forma um grupo de liga- ção covalente ou não covalente entre pelo menos um marcador detec- tável e o ácido nucleico. Em algumas modalidades, o primeiro e o se-
gundo sítio de ligação são separados por entre 5 e 100 bases nucleo- tídicas ou pares de bases de nucleotídeos no ácido nucleico.
[00218] Em ainda outros aspectos, o pedido de patente provê uma molécula de reconhecimento de aminoácido que compreende: uma proteína multivalente compreendendo pelo menos dois sítios de liga- ção ao ligando; pelo menos uma molécula de reconhecimento de ami- noácido anexada à proteína através de uma primeira porção de ligan- do ligada a um primeiro sítio de ligação ao ligando na proteína; e pelo menos um marcador detectável anexado à proteína através de uma segunda porção de ligando ligada a um segundo sítio de ligação ao ligando na proteína.
[00219] Em algumas modalidades, a proteína multivalente é uma proteína avidina compreendendo quatro sítios de ligação ao ligando. Em algumas modalidades, os sítios de ligação ao ligando são sítios de ligação à biotina, e em que as porções do ligando são porções de bio- tina. Em algumas modalidades, pelo menos uma das porções de bioti- na é uma porção bis-biotina, e em que a porção bis-biotina é ligada a dois sítios de ligação à biotina na proteína avidina. Em algumas moda- lidades, pelo menos uma molécula de reconhecimento de aminoácido é anexada à proteína através de um ácido nucleico que compreende a primeira porção de ligando. Em algumas modalidades, pelo menos um marcador detectável é anexado à proteína através de um ácido nuclei- co que compreende a segunda porção de ligando.
[00220] Como descrito em outro lugar no presente, as moléculas de reconhecimento protegidas do pedido de patente podem ser utilizadas em um método de sequenciamento de polipeptídeo de acordo com o pedido de patente, ou qualquer método conhecido na técnica. Por exemplo, em algumas modalidades, uma molécula de reconhecimento protegida aqui provida pode ser utilizada em uma reação de degrada- ção do tipo Edman aqui provida, ou convencionalmente conhecida na técnica, a qual pode envolver a realização de ciclos iterativos de múlti- plas misturas de reação em uma reação de sequenciamento de poli- peptídeo. Em algumas modalidades, uma molécula de reconhecimento protegida aqui provida pode ser utilizada em uma reação de sequenci- amento dinâmico do pedido de patente, a qual envolve o reconheci- mento do aminoácido e degradação em uma única mistura de reação.
Sequenciamento por degradação de polipeptídeos marca- dos
[00221] Em alguns aspectos, o pedido de patente provê um método de sequenciamento de polipeptídeos identificando-se uma combinação única de aminoácidos que correspondem a uma sequência polipeptídi- ca conhecida. Por exemplo, a Figura 6 mostra um método de sequen- ciamento detectando-se seletivamente aminoácidos marcados de um polipeptídeo marcado 600. Em algumas modalidades, o polipeptídeo marcado 600 compreende aminoácidos modificados seletivamente de tal modo que os diferentes tipos de aminoácido compreendem marca- dores luminescentes diferentes. Neste relatório descritivo, a menos que indicado o contrário, um polipeptídeo marcado refere-se a um po- lipeptídeo que compreende uma ou mais cadeias laterais de aminoáci- dos marcadas seletivamente. Métodos para marcação seletiva e deta- lhes relativos à preparação e análise de polipeptídeos marcados são conhecidos na técnica (ver, por exemplo, Swaminathan, et al. PLoS Comput Biol. 2015, 11(2):e1004080).
[00222] “Como mostrado, em algumas modalidades, o polipeptídeo marcado 600 é imobilizado e exposto a uma fonte de excitação. Uma luminescência agregada do polipeptídeo marcado 600 é detectada e, em algumas modalidades, a exposição à luminescência ao longo do tempo resulta em uma perda no sinal detectado devido à degradação do marcador luminescente (por exemplo, degradação decorrente de fotobranqueamento). Em algumas modalidades, o polipeptídeo marca-
do 600 compreende uma que dão origem a um sinal inicial detectado. Como genericamente ilustrado, a degradação de marcadores lumines- centes ao longo do tempo resulta em uma diminuição correspondente em um sinal detectado do polipeptídeo marcado fotobranqueado 602. Em algumas modalidades, o sinal pode ser deconvoludo pela análise de uma ou mais propriedades da luminescência (por exemplo, análise de deconvolução do sinal pelo tempo de vida da luminescência). Em algumas modalidades, a combinação única de aminoácidos seletiva- mente marcados do polipeptídeo marcado 600 foi pré-computada por computação e verificada empiricamente - por exemplo, com base em sequências polipeptídicas conhecidas de um proteoma. Em algumas modalidades, a combinação de marcadores detectados de aminoáci- dos é comparada contra um banco de dados de sequências conheci- das de um proteoma de um organismo para identificar um polipeptídeo em particular do banco de dados, correspondente ao polipeptídeo marcado 600.
[00223] Em algumas modalidades, a abordagem ilustrada na Figura 6 pode ser modificada determinando uma concentração ótima da amostra para realizar uma reação de sequenciamento que maximiza a amostragem em análise massivamente paralela. Em algumas modali- dades, a concentração é selecionado para que uma fração desejada dos poços de amostra de um arranjo (por exemplo, 30%) esteja ocu- pada em qualquer dado tempo. Sem a intenção de ficar preso à teoria, acredita-se que embora um polipeptídeo seja branqueado ao longo de um período de tempo, o mesmo poço continua a estar disponível para análise futura. Através de difusão, aproximadamente 30% dos poços de amostra de um arranjo podem ser usados para análise a cada 3 minutos. Como exemplo ilustrativo, em um chip com um milhão de po- ços de amostra, 6.000.000 polipeptídeos por hora podem ser amostra- dos, ou 24.000.000 ao longo de um período de 4 horas.
[00224] Em alguns aspectos, o pedido de patente provê um método de sequenciamento de polipeptídeos detectando-se a luminescência de um polipeptídeo marcado que é submetido a ciclos repetidos de modificação e clivagem do aminoácido terminal. Por exemplo, a Figura 7 mostra um método de sequenciamento de um polipeptídeo marcado por degradação de Edman de acordo com o pedido de patente. Em algumas modalidades, o método em geral prossegue como aqui des- crito para outros métodos de sequenciamento por degradação de Ed- man. Por exemplo, em algumas modalidades, as etapas (1) e (2) mos- tradas na Figura 7 podem ser realizadas como descrito em outro lugar no presente para modificação do aminoácido terminal e clivagem do aminoácido terminal, respectivamente, uma reação de degradação de Edman.
[00225] “Como mostrado no exemplo retratado na Figura 7, em al- gumas modalidades, o método compreende uma etapa de (1) modifi- car o aminoácido terminal de um polipeptídeo marcado. Como descrito em outro lugar no presente, em algumas modalidades, a modificação compreende colocar o aminoácido terminal em contato com um isotio- cianato (por exemplo, PITC) para formar um aminoácido terminal modi- ficado com isotiocianato. Em algumas modalidades, uma modificação com isotiocianato 710 converte o aminoácido terminal em uma forma que é mais suscetível à remoção por um reagente de clivagem (por exemplo, um reagente de clivagem químico ou enzimático, como aqui descrito). Deste modo, em algumas modalidades, o método compre- ende uma etapa de (2) remover o aminoácido terminal modificado usando meios químicos ou enzimáticos, detalhados em outro lugar no presente, para degradação de Edman.
[00226] Em algumas modalidades, o método compreende repetir as etapas (1) a (2) por uma pluralidade de ciclos, durante os quais a lumi- nescência do polipeptídeo marcado é detectada, e os eventos de cli-
vagem correspondente à remoção de um aminoácido marcado do ter- minal pode ser detectada como uma diminuição no sinal detectado. Em algumas modalidades, nenhuma mudança no sinal após a etapa (2), como mostrado na Figura 7, identifica um aminoácido de tipo des- conhecido. Deste modo, em algumas modalidades, podem ser deter- minadas informações parciais sobre a sequência avaliando um sinal detectado após a etapa (2) durante cada rodada sequencial designan- do um tipo de aminoácido a uma identidade determinada com base em uma mudança no sinal detectado ou identificando um tipo de aminoá- cido como desconhecido com base em ausência de mudança em um sinal detectado.
[00227] Em alguns aspectos, um método de sequenciamento de polipeptídeos de acordo com o pedido de patente compreende o se- quenciamento por clivagem enzimática processiva de um polipeptídeo marcado, como em geral ilustrado nas Figuras 8A-8C. Como mostra- do, em algumas modalidades, um polipeptídeo marcado é submetido à degradação usando uma exopeptidase processiva modificada que cli- va continuamente um aminoácido terminal de um terminal a outro ter- minal. Exopeptidases são descritas detalhadamente em outro lugar no presente. A Figura 8A representa um exemplo no qual um polipeptídeo marcado 800 é submetido à degradação por uma exopeptidase pro- cessiva imobilizada 810. A Figura 8B representa um exemplo no qual um polipeptídeo marcado imobilizado 820 é submetido à degradação por uma exopeptidase processiva 830.
[00228] A Figura 8C ilustra esquematicamente um exemplo de um processo de sequenciamento em tempo real realizado de acordo com o método retratado na Figura 8B. Como mostrado, os painéis (1) a (IV) mostram uma progressão da degradação do polipeptídeo marcado, com um traço de sinal correspondente ao longo do tempo mostrado abaixo de cada painel. Como mostrado, cada evento de clivagem cor-
respondente a um aminoácido marcado dá origem a uma queda con- comitante no sinal. Em algumas modalidades, a taxa de processivida- de da exopeptidase processiva 830 é conhecida, de modo que o mo- mento entre uma diminuição detectada no sinal pode ser utilizado para calcular o número de aminoácidos não marcados entre cada evento de detecção. Por exemplo, se um polipeptídeo de 40 aminoácidos foi cli- vado de tal maneira que um aminoácido foi removido a cada segundo, um polipeptídeo marcado com 3 sinais mostraria todos os 3 inicialmen- te (painel (1)), depois 2 (painel (11)), depois 1 (painel (IlI)) e, finalmente, nenhum sinal. Dessa maneira, a ordem dos aminoácidos marcados pode ser determinada. Deste modo, esses métodos podem ser utiliza- dos para determinar informações parciais sobre a sequência, por exemplo, para análise proteômica com base no sequenciamento de fragmentos polipeptídicos.
[00229] Em algumas modalidades, o sequência de proteínas de única molécula pode ser realizado usando um esquema de transferên- cia de ressonância Forster (FRET) com base em ATP (por exemplo, com um ou mais cofatores marcados), por exemplo, como ilustrado na Figura 9. Em algumas modalidades, o sequenciamento por FRET com base em cofatores pode ser realizado usando uma protease imobiliza- da dependente de ATP, ATP marcado do doador e aminoácidos mar- cados com aceitador de um substrato polipeptídico. Em algumas mo- dalidades, os aminoácidos podem ser marcados com aceitadores, e um ou mais cofatores podem ser marcados com doadores.
[00230] Por exemplo, em algumas modalidades, as proteínas extra- ídas são desnaturadas, e cisteínas e lisinas são marcadas com coran- tes fluorescentes. Em algumas modalidades, uma versão modificada de uma proteína translocase (por exemplo, CIpX bacteriana) é usada para ligar-se a proteínas de substratos individuais, desdobrá-las e translocá-las através de seu nanocanal. Em algumas modalidades, a translocase é marcada com um corante doador, e ocorre FRET entre o doador na translocase e dois ou mais corantes distintos aceitadores em um substrato que passa através do nanocanal. A ordem dos ami- noácidos marcados pode então ser determinada a partir do sinal de FRET. Em algumas modalidades, podem ser utilizados um ou mais dos seguintes análogos de ATP marcado não limitantes mostrados na Tabela 5. Tabela 5. Exemplos não limitantes de análogos marcados de ATP (ocarê mA NH2 à EO % % É NE N PARANA or Oh (y-[(6-amino)hexil--ATP) nº
NH o o o o. sn & (y-I(6-amino-hexil)imido]-ATP)
MORO - o
OH OH OH NES nó om (y-(6-amino-hexil)- ATP-Cy3)
vol Go to "1 CHÃO : no o nl nos Ah O NCMCNCIO VEN é õs e (y-[(6-amino-hexil)|mido]-ATP—Cy3)
NH o mon totofom o | Di pf CHS— Oto 2 " mnt-oms-tcoLotioçs ano - ôõ (BODIPY FLATPyS) ATP com ribose marcada: não Ido O
ELE NA 2 CH5CHANA ço
NX n HN, Se (EDA-ATP) Ah O
PTN NAS NÓ on de 4 1" o
RA í Mo é (EDA-ATP — Cy3)
o o o PAS Lda SO
E Pai du o |
RR LIT TO, ô em ore à —(EDA-ATP-Cy3) ATP com base marcada:
IN A ENNH o N/A O DEZ " o 9emenaaNh OR On (Nº-(6-amino)hexil-ATP) 11 CHHÃC- U
MOI ” o nº XxX oO OQ O » RR É Hd [ O no od oo. & 0”
OH OH OH NES ô ou (Nº-(6-amino-hexil)- ATP—Cy3) Preparação de amostras para sequenciamento
[00231] Uma amostra de polipeptídeo pode ser modificada antes do sequenciamento. Em algumas modalidades, o aminoácido N-terminal ou o aminoácido C-terminal de um polipeptídeo é modificado. A Figura 10A ilustra um exemplo não limitante da modificação da extremidade terminal para preparar polipeptídeos terminalmente modificados de uma amostra de proteína. Na etapa (1), a amostra de proteína 1000 é fragmentada para produzir fragmentos polipeptídicos 1002. Um poli- peptídeo pode ser fragmentado por clivagem (por exemplo, química) e/ou digestão (por exemplo, enzimática, por exemplo, usando uma peptidase, por exemplo, tripsina) de um polipeptídeo de interesse. À fragmentação pode ser realizada antes ou depois da marcação. Em algumas modalidades, a fragmentação é realizada após a marcação de proteínas inteiras. Um ou mais aminoácidos podem ser marcados antes ou depois da clivagem para produzir polipeptídeos marcados. Em algumas modalidades, os polipeptídeos são selecionados pelo ta- manho depois da fragmentação química ou enzimática. Em algumas modalidades, polipeptídeos menores (por exemplo, < 2 kDa) são re- movidos e polipeptídeos maiores são retidos para análise da sequên- cia. A seleção pelo tamanho pode ser alcançada usando uma técnica como filtração em gel, SEC, diálise, extração em gel de PAGE, fluxo microfluídico por tensão ou qualquer outra técnica adequada. Na etapa (2), os N-terminais ou C-terminais dos fragmentos polipeptídicos 1002 são modificados para produzir polipeptídeos terminalmente modifica- dos 1004. Em algumas modalidades, a modificação compreende adi- cionar uma porção para imobilização. Em algumas modalidades, a modificação compreende adicionar uma porção para acoplamento.
[00232] Deste modo, são providos métodos para modificar extremi- dades terminais de proteínas e polipeptídeos com porções que tornam possível a imobilização em uma superfície (por exemplo, uma superfí- cie de um poço de amostra em um chip usado para análise de proteí- nas). Em algumas modalidades, tais métodos compreendem modificar uma extremidade terminal de um polipeptídeo marcado a ser analisado de acordo com o pedido de patente. Em ainda outras modalidades, tais métodos compreendem modificar uma extremidade terminal de uma proteína ou enzima que degrada ou transloca um substrato da proteína ou polipeptídeo de acordo com o pedido de patente.
[00233] Em algumas modalidades, um carbóxi-terminal de uma pro- teína ou polipeptídeo é modificado em um método que compreende: (i) bloquear grupos carboxilato livres da proteína ou meios químicos); (iii) bloquear grupos tiol livres da proteína ou polipeptídeo; (iv) digerir a proteína ou polipeptídeo para produzir pelo menos um fragmento poli- peptídico compreendendo um grupo carboxilato livre no C-terminal; e (v) conjugar (por exemplo, quimicamente) uma porção funcional ao grupo carboxilato livre no C-terminal. Em algumas modalidades, o mé- todo compreende ainda, depois de (i) e antes de (ii), dialisar uma amostra compreendendo a proteína ou polipeptídeo.
[00234] Em algumas modalidades, um carbóxi-terminal de uma pro- teína ou polipeptídeo é modificado em um método que compreende: (i) desnaturar a proteína ou polipeptídeo (por exemplo, por calor e/ou meios químicos); (ii) bloquear grupos tiol livres da proteína ou polipep- tídeo; (ili) digerir a proteína ou polipeptídeo para produzir pelo menos um fragmento polipeptídico compreendendo um grupo carboxilato livre no C-terminal; (iv) bloquear o grupo carboxilato livre no C-terminal para produzir pelo menos um fragmento polipeptídico compreendendo um grupo carboxilato bloqueado no C-terminal; e (v) conjugar (por exem- plo, enzimaticamente) uma porção funcional ao grupo carboxilato blo- queado no C-terminal. Em algumas modalidades, o método compre- ende ainda, depois de (iv) e antes de (v), dialisar uma amostra com- preendendo a proteína ou polipeptídeo.
[00235] Em algumas modalidades, o bloqueio de grupos carboxilato livres refere-se a uma modificação química desses grupos que altera a reatividade química em relação a um carboxilato. Métodos adequados para o bloqueio de carboxilato são conhecidos na técnica e devem modificar grupos carboxilato da cadeia lateral para que fiquem quimi- camente diferentes de um grupo carboxilato carbóxi-terminal de um polipeptídeo a ser funcionalizado. Em algumas modalidades, o blo- queio de grupos carboxilato livres compreende a esterificação ou ami- dação de grupos carboxilato livres de um polipeptídeo. Em algumas modalidades, o bloqueio de grupos carboxilato livres compreende a esterificação metílica de grupos carboxilato livres de um polipeptídeo, por exemplo, reagindo o polipeptídeo com HCl metanólico. Exemplos adicionais de reagentes e técnicas úteis para bloquear grupos carboxi- lato livres incluem, entre outros, 4-sulfo-2,3,5,6-tetrafluorofenol (STP) e/ou uma carbodiimida como cloridrato de N-(3-dimetilaminopropil)-N'- etilcarbodiimida (EDAC), reagentes de urônio, diazometano, álcoois e ácido para esterificação de Fischer, o uso de N-hidroxissuccinimida (NHS) para formar ésteres de NHS (potencialmente como um interme- diário para formação subsequente de éster ou amina), ou reação com carbonildiimidazol (CDI) ou a formação de anidridos mistos ou qual- quer outro método para modificar ou bloquear ácidos carboxílicos, po- tencialmente através da formação de ésteres ou amidas.
[00236] Em algumas modalidades, o bloqueio de grupos tiol livres refere-se a uma modificação química desses grupos que altera a reati- vidade química em relação a um tiol não modificado. Em algumas mo- dalidades, o bloqueio de grupos tiol livres compreende reduzir e alqui- lar grupos tiol livres de uma proteína ou polipeptídeo. Em algumas modalidades, a redução e alquilação é realizada colocando um poli- peptídeo em contato com ditiotreitol (DTT) e um ou os dois, iodoace- tamida e ácido iodoacético. Os exemplos de reagentes adicionais e alternativos redutores de cisteína que podem ser utilizados são bem conhecidos e incluem, entre outros, 2-mercaptoetanol, cloridrato de tris-(2-carboxietil)'fosfina (TCEP), tributilfosfina, ditiobutilamina (DTBA)
ou qualquer reagente capaz de reduzir um grupo tiol. Os exemplos de reagentes adicionais e alternativos para o bloqueio de cisteína (por exemplo, alquilação de cisteína) que podem ser utilizados são bem conhecidos e incluem, entre outros, acrilamida, 4-vinilpiridina, N- etilmalemida (NEM), ácido N-e-maleimidocaproico (EMCA) ou qualquer reagente que modifique cisteínas de modo a impedir a formação de ligação dissulfeto.
[00237] Em algumas modalidades, a digestão compreende digestão enzimática. Em algumas modalidades, a digestão é realizada colocan- do uma proteína ou polipeptídeo em contato com uma endopeptidase (por exemplo, tripsina) sob condições de digestão. Em algumas moda- lidades, a digestão compreende digestão química. Os exemplos de reagentes adequados para digestão química e enzimática são conhe- cidos na técnica e incluem, entre outros, tripsina, quimiotripsina, Lys-C, Arg-C, Asp-N, Lys-N, BNPS-Skatole, CNBr, caspase, ácido fórmico, glutamil endopeptidase, hidroxilamina, ácido iodosobenzoico, elastase neutrofílica, pepsina, prolina-endopeptidase, proteinase K, peptidase | estafilocócica, termolisina e trombina.
[00238] Em algumas modalidades, a porção funcional compreende uma molécula de biotina. Em algumas modalidades, a porção funcio- nal compreende uma porção química reativa, como um alquinila. Em algumas modalidades, a conjugação de uma porção funcional com- preende a biotinilação de grupos éster carboximetílico no carbóxi- terminal por carboxipeptidase Y, como conhecido na técnica.
[00239] Em algumas modalidades, uma porção solubilizante é adi- cionada a um polipeptídeo. A Figura 10B ilustra um exemplo não limi- tante de uma porção solubilizante adicionada a um aminoácido termi- nal de um polipeptídeo, por exemplo, usando um processo de conju- gação de um ligante solubilizante ao polipeptídeo.
[00240] Em algumas modalidades, um polipeptídeo terminalmente modificado 1010 compreendendo uma porção de conjugação com |i- gante 1012 é conjugado a um ligante solubilizante 1020 compreen- dendo uma porção de conjugação com polipeptídeo 1022. Em algu- mas modalidades, o ligante solubilizante compreende um polímero so- lubilizante, como uma biomolécula (por exemplo, mostrada em forma pontilhada). Em algumas modalidades, um polipeptídeo conjugado a ligante resultante 1030, compreendendo uma ligação 1032 formada entre 1012 e 1022, compreende ainda uma porção de conjugação à superfície 1034. Deste modo, em algumas modalidades, os métodos e composições aqui providos são úteis para modificar extremidades ter- minais de polipeptídeos com porções que aumentam a solubilidade deles. Em algumas modalidades, uma porção solubilizante é útil para polipeptídeos pequenos que resultam da fragmentação (por exemplo, fragmentação enzimática, por exemplo, usando tripsina) e que são re- lativamente insolúveis. Por exemplo, em algumas modalidades, poli- peptídeos curtos em um pool de polipeptídeo podem ser solubilizados pela conjugação de um polímero (por exemplo, um oligo curto, um açúcar ou outro polímero com carga) aos polipeptídeos.
[00241] Em algumas modalidades, uma ou mais superfícies de um poço de amostra (por exemplo, paredes laterais de um poço de amos- tra) podem ser modificadas. Um exemplo não limitante de passivação e/ou uso de anti-incrustantes em uma parede lateral do poço de amos- tra é mostrado na Figura 10C, onde um exemplo esquemático de um poço de amostra é ilustrado com superfícies modificadas que podem ser utilizadas para promover a imobilização da única molécula a uma superfície inferior. Em algumas modalidades, 1040 é SiO2. Em algu- mas modalidades, 1042 é uma porção de conjugação com polipeptí- deo (por exemplo, TCO, tetrazina, N3, alcino, aldeído, NCO, NHS, tiol, alceno, DBCO, BCN, TPP, biotina ou outra porção de conjugação adequada). Em algumas modalidades, 1050 é TiO2 ou Al2O3. Em al-
gumas modalidades, 1052 é uma molécula Ca4-18 hidrofóbica, um com- posto de politetrafluoroetileno (por exemplo, (CF2)4-12), um poliol, como um polietilenoglicol (por exemplo, PEG3-100), polipropilenoglicol, poli- oxietilenoglicol! ou combinações ou variações dos mesmos, ou um zwitteríon, como sulfobetaína. Em algumas modalidades, 1060 é Si. Em algumas modalidades, 1070 é Al. Em algumas modalidades, 1080 é TiN. Marcadores luminescentes
[00242] Neste relatório descritivo, um marcador luminescente é uma molécula que absorve um ou mais fótons e pode subsequentemente emitir um ou mais fótons depois de uma ou mais durações de tempo. Em algumas modalidades, o termo é usado alternadamente com "mar- cador" ou "molécula luminescente" dependendo do contexto. Um mar- cador luminescente de acordo com certas modalidades aqui descritas pode referir-se a um marcador luminescente de um reagente de afini- dade marcado, um marcador luminescente de uma peptidase marcada (por exemplo, uma exopeptidase marcada, uma exopeptidase inespe- cífica marcada), um marcador luminescente de um peptídeo marcado, um marcador luminescente de um cofator marcado ou outra composi- ção marcada aqui descrita. Em algumas modalidades, um marcador luminescente de acordo com o pedido de patente refere-se a um ami- noácido marcado de um polipeptídeo marcado que compreende um ou mais aminoácidos marcados.
[00243] Em algumas modalidades, um marcador luminescente pode compreender um primeiro e um segundo cromóforo. Em algumas mo- dalidades, um estado excitado do primeiro cromóforo é capaz de rela- xamento via transferência de energia para o segundo cromóforo. Em algumas modalidades, a transferência de energia é uma transferência de energia de ressonância de Fôrster (FRET). Tal par de FRET pode ser útil para fornecer um marcador luminescente com propriedades que tornam mais fácil diferenciar o marcador entre uma pluralidade de marcadores luminescentes em uma mistura - por exemplo, como ilus- trado e aqui descrito para o aptâmero marcado 106 da Figura 1C. Em ainda outras modalidades, um par de FRET compreende um primeiro cromóforo de um primeiro marcador luminescente e um segundo cro- móforo de um segundo marcador luminescente - por exemplo, como ilustrado e aqui descrito para o sequenciamento de peptídeos marca- dos usando um cofator marcado (ver, por exemplo, Figura 9). Em cer- tas modalidades, o par de FRET pode absorver a energia de excitação em uma primeira faixa espectral e emitir luminescência em uma se- gunda faixa espectral.
[00244] Em algumas modalidades, um marcador luminescente refe- re-se a um fluoróforo ou um corante. Tipicamente, um marcador lumi- nescente compreende um composto aromático ou heteroaromático e pode ser pireno, antraceno, naftaleno, naftilamina, acridina, estilbeno, indol, benzindol, oxazol, carbazol, tiazol, benzotiazol, benzoxazol, fe- nantridina, fenoxazina, porfirina, quinolina, etídio, benzamida, cianina, carbocianina, salicilato, antranilato, cumarina, fluorosceína, rodamina, xanteno ou outro composto semelhante.
[00245] Em algumas modalidades, um marcador luminescente compreende um corante selecionado dentre um ou mais dos seguin- tes: 5/6-Carbóxi-rodamina 6G, 5-Carbóxi-rodamina 6G, 6-Carbóxi- rodamina 6G, 6-TAMRA, Abberior&ê STAR 440SXP, Abberior& STAR 470SXP, Abberior& STAR 488, Abberior& STAR 512, Abberior& STAR 520SXP, Abberior& STAR 580, Abberior& STAR 600, Abberior& STAR 635, Abberior& STAR 635P, Abberior& STAR RED, Alexa FluorO 350, Alexa Fluor& 405, Alexa FluorO 430, Alexa FluorO 480, Alexa FluorO 488, Alexa Fluor& 514, Alexa Fluor& 532, Alexa Fluorê&ê 546, Alexa FluorO 555, Alexa FluorO 568, Alexa FluorO& 594, Alexa FluorO 610-X, Alexa FluorO& 633, Alexa FluorO 647, Alexa FluorO& 660, Alexa FluorO
680, Alexa Fluor& 700, Alexa Fluor& 750, Alexa Fluor& 790, AMCA, ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO 542, ATTO 550, ATTO 565, ATTO 590, ATTO 610, ATTO 620, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740, ATTO Oxa12, ATTO Rho101, ATTO Rho11, ATTO Rho12, ATTO Rho13, ATTO Rho14, ATTO Rho3B, ATTO Rho6G, ATTO Thio12, BD Hori- zon'y V450, BODIPYG& 493/501, BODIPYO& 530/550, BODIPYO 558/568, BODIPYO 564/570, BODIPYO 576/589, BODIPYO 581/591, BODIPYGO 630/650, BODIPYO 650/665, BODIPYO FL, BODIPYO FL- X, BODIPY& R6G, BODIPYO TMR, BODIPYO TR, CAL Fluor& Gold 540, CAL Fluor& Green 510, CAL Fluor& Orange 560, CAL Fluor& Red 590, CAL Fluor& Red 610, CAL Fluor& Red 615, CAL Fluorê Red 635, Cascade& Blue, CFTY350, CFTY405M, CFTY405S, CFTY488A, CFTY514, CFTV532, CFTY543, CFTM546, CFTY555, CFTY568, CFTVM594, CFTY620R, CFTY633, CFTY633-V1, CFTYG40R, CFTVGB40R-V1, CFTV 640R-V2, CFTY660C, CFTY66OR, CFTY680, CFTMESOR, CFTYESOR-V1, CFTY750, CFTY770, CFTY790, ChromeoTY 642, Chromis 425N, Chro- mis 500N, Chromis 515N, Chromis 530N, Chromis 550A, Chromis 550C, Chromis 550Z, Chromis 560N, Chromis 570N, Chromis 577N, Chromis 600N, Chromis 630N, Chromis 645A, Chromis 645C, Chromis 645Z, Chromis 678A, Chromis 678C, Chromis 678Z, Chromis 770A, Chromis 770C, Chromis 800A, Chromis 800C, Chromis 830A, Chromis 830C, CyO3, CyO3.5, CyO3B, CyO5, Cy8&S5.5, Cy&7, DyLightê& 350, DyLight& 405, DyLight& 415-Co1, DyLight& 425Q, DyLight& 485-LS, DyLight& 488, DyLight& 504Q, DyLight& 510-LS, DyLight& 515-LS, DyLight& 521-LS, DyLight& 530-R2, DyLight& 543Q, DyLight& 550, DyLight& 554-R0, DyLight& 554-R1, DyLight& 590-R2, DyLight& 594, DyLight& 610-B1, DyLight& 615-B2, DyLight& 633, DyLight& 633-B1, DyLight& 633-B2, DyLight& 650, DyLight& 655-B1, DyLight& 655-B2,
DyLight& 655-B3, DyLight& 655-B4, DyLight& 662Q, DyLight& 675- B1, DyLight& 675-B2, DyLight& 675-B3, DyLight& 675-B4, DyLightO 679-C5, DyLight& 680, DyLight& 683Q, DyLight& 690-B1, DyLight& 690-B2, DyLighto 696Q, DyLightêe 700-B1, DyLightêe 700-B1, DyLight& 730-B1, DyLight& 730-B2, DyLight& 730-B3, DyLight& 730- B4, DyLight& 747, DyLight& 747-B1, DyLight&O 747-B2, DyLightO 747- B3, DyLight& 747-B4, DyLight& 755, DyLight& 766Q, DyLight& 775- B2, DyLight& 775-B3, DyLight& 775-B4, DyLight& 780-B1, DyLightO 780-B2, DyLight& 780-B3, DyLight& 800, DyLight& 830-B2, Dyomics- 350, Dyomics-350XL, Dyomics-360XL, Dyomics-370XL, Dyomics- 375XL, Dyomics-380XL, Dyomics-390XL, Dyomics-405, Dyomics-415, Dyomics-430, Dyomics-431, Dyomics-478, Dyomics-480XL, Dyomics- 481XL, Dyomics-485XL, Dyomics-490, Dyomics-495, Dyomics-505, Dyomics-510XL, Dyomics-511XL, Dyomics-520XL, Dyomics-521XL, Dyomics-530, Dyomics-547, Dyomics-547P1, Dyomics-548, Dyomics- 549, Dyomics-549P1, Dyomics-550, Dyomics-554, Dyomics-555, Dyo- mics-556, Dyomics-560, Dyomics-590, Dyomics-591, Dyomics-594, Dyomics-601XL, Dyomics-605, Dyomics-610, Dyomics-615, Dyomics- 630, Dyomics-631, Dyomics-632, Dyomics-633, Dyomics-634, Dyo- mics-635, Dyomics-636, Dyomics-647, Dyomics-647P1, Dyomics-648, Dyomics-648P1, Dyomics-649, Dyomics-649P1, Dyomics-650, Dyo- mics-651, Dyomics-652, Dyomics-654, Dyomics-675, Dyomics-676, Dyomics-677, Dyomics-678, Dyomics-679P1, Dyomics-680, Dyomics- 681, Dyomics-682, Dyomics-700, Dyomics-701, Dyomics-703, Dyo- mics-704, Dyomics-730, Dyomics-731, Dyomics-732, Dyomics-734, Dyomics-749, Dyomics-749P1, Dyomics-750, Dyomics-751, Dyomics- 752, Dyomics-754, Dyomics-776, Dyomics-777, Dyomics-778, Dyo- mics-780, Dyomics-781, Dyomics-782, Dyomics-800, Dyomics-831, eFluorO 450, Eosina, FITC, Fluoresceína, HiLyte"Y Fluor 405, HiLyteTY Fluor 488, HiLyte'Y Fluor 532, HiLyte'Y Fluor 555, HiLyte'Y Fluor 594,
HiLyte'"" Fluor 647, HiLyte'" Fluor 680, HiLyte"Y Fluor 750, IRDyeO 680LT, IRDye& 750, IRDye& 800CW, JOE, LightCiclor& 640R, LightCiclor& Red 610, LightCiclor& Red 640, LightCiclor& Red 670, LightCiclor& Red 705, Lissamina Rodamina B, Naftofluoresceína, Ore- gon Green& 488, Oregon Green& 514, Pacific Blue", Pacific Green'Y, Pacific Orange", PET, PF350, PF405, PF415, PF488, PF505, PF532, PF546, PF555P, PF568, PF594, PF610, PF633P, PF647P, QuasarO 570, Quasar 670, QuasarO 705, Rodamina 123, Rodamina 6G, Rodamina B, Rodamina Green, Rodamina Green-X, Rodamina Red, ROX, Seta'"vY 375, Seta'Y 470, Seta'Y 555, Seta'v 632, Seta'"" 633, Seta'"Y 650, Seta'Y 660, Seta'"" 670, Seta'Y 680, Seta'Y 700, Seta'" 750, Seta'Y 780, Seta'Y APC-780, Seta" PerCP- 680, Seta'yv R-PE-670, Seta'"y 646, SeTau 380, SeTau 425, SeTau 647, SeTau 405, Square 635, Square 650, Square 660, Square 672, Square 680, Sulfo-rodamina 101, TAMRA, TET, Texas Red€, TMR, TRITC, Yakima Yellow"", ZenonO, Zy3, Zy5, 2y5.5 e Zy7. Luminescência
[00246] Em alguns aspectos, o pedido de patente refere-se ao se- quenciamento e/ou identificação de polipeptídeos com base em uma ou mais propriedades de luminescência de um marcador luminescen- te. Em algumas modalidades, um marcador luminescente é identifica- do com base em tempo de vida da luminescência, intensidade da lu- minescência, brilho, espectros de absorção, espectros de emissão, rendimento quântico de luminescência ou uma combinação de dois ou mais dos mesmos. Em algumas modalidades, uma pluralidade de tipos de marcadores luminescentes pode ser distinguida um do outro com base em diferentes tempos de vida da luminescência, intensidades da luminescência, brilho, espectros de absorção, espectros de emissão, rendimento quântico de luminescências ou combinações de dois ou mais dos mesmos. Identificar pode significar designar a identidade exata e/ou quantificar um tipo de aminoácido (por exemplo, um único tipo ou um subconjunto de tipos) associado com um marcador lumi- nescente, e pode também significar designar uma localização do ami- noácido em um polipeptídeo em relação a outros tipos de aminoáci- dos.
[00247] Em algumas modalidades, a luminescência é detectada ex- pondo um marcador luminescente a uma série de pulsos de luz sepa- rados e avaliando o momento ou outras propriedades de cada fóton que é emitido pelo marcador. Em algumas modalidades, informações para uma pluralidade de fótons emitidos sequencialmente por um mar- cador é agregado e avaliado para identificar o marcador e, pelo me- nos, identificar um tipo associado de aminoácido. Em algumas modali- dades, o tempo de vida da luminescência de um marcador é determi- nado a partir de uma pluralidade de fótons que são emitidos sequenci- almente por um marcador, e o tempo de vida da luminescência pode ser usada para identificar o marcador. Em algumas modalidades, a intensidade da luminescência de um marcador é determinada a partir de uma pluralidade de fótons que são emitidos sequencialmente pelo marcador, e a intensidade da luminescência pode ser usada para iden- tificar o marcador. Em algumas modalidades, o tempo de vida da lumi- nescência e a intensidade da luminescência de um marcador são de- terminados a partir de uma pluralidade de fótons que são emitidos se- quencialmente pelo marcador, e o tempo de vida da luminescência e a intensidade da luminescência podem ser usados para identificar o marcador.
[00248] Em alguns aspectos do pedido de patente, uma única mo- lécula polipeptídica é exposta a uma pluralidade de pulsos de luz se- parados e uma série de fótons emitidos são detectados e analisados. Em algumas modalidades, a série de fótons emitidos fornece informa- ções sobre a única molécula polipeptídica que está presente e que não mudam na amostra de reação ao longo do tempo do experimento. No entanto, em algumas modalidades, a série de fótons emitidos fornece informações sobre uma série de moléculas diferentes que estão pre- sentes em tempos diferentes na amostra de reação (por exemplo, à medida que uma reação ou processo prossegue). A título de exemplo e sem limitação, tais informações podem ser utilizadas para sequenci- ar e/ou identificar um polipeptídeo submetido à degradação química ou enzimática de acordo com o pedido de patente.
[00249] Em certas modalidades, um marcador luminescente absor- ve um fóton e emite um fóton depois de uma duração de tempo. Em algumas modalidades, o tempo de vida da luminescência de um mar- cador pode ser determinado ou estimado medindo-se a duração de tempo. Em algumas modalidades, o tempo de vida da luminescência de um marcador pode ser determinado ou estimado medindo-se uma pluralidade de durações de tempo para múltiplos eventos de pulso e eventos de emissão. Em algumas modalidades, o tempo de vida da luminescência de um marcador pode ser diferenciado dentre os tem- pos de vida da luminescência de uma pluralidade de tipos de marcado- res medindo-se a duração de tempo. Em algumas modalidades, o tempo de vida da luminescência de um marcador pode ser diferencia- do dentre os tempos de vida da luminescência de uma pluralidade de tipos de marcadores medindo-se uma pluralidade de durações de tempo para múltiplos eventos de pulso e eventos de emissão. Em cer- tas modalidades, um marcador é identificado ou diferenciado dentre uma pluralidade de tipos de marcadores determinando-se ou estiman- do o tempo de vida da luminescência do marcador. Em certas modali- dades, um marcador é identificado ou diferenciado dentre uma plurali- dade de tipos de marcadores diferenciando-se o tempo de vida da lu- minescência do marcador dentre uma pluralidade de tempos de vida da luminescência de uma pluralidade de tipos de marcadores.
[00250] A determinação de um tempo de vida da luminescência de um marcador luminescente pode ser realizada por qualquer método adequado (por exemplo, medindo a durabilidade usando uma técnica adequada ou determinando características de emissão dependentes do tempo). Em algumas modalidades, determinar o tempo de vida da luminescência de um marcador compreende determinar o tempo de vida em relação a outro marcador. Em algumas modalidades, determi- nar o tempo de vida da luminescência de um marcador compreende determinar o tempo de vida em relação a uma referência. Em algumas modalidades, determinar o tempo de vida da luminescência de um marcador compreende medir o tempo de vida (por exemplo, tempo de vida da fluorescência). Em algumas modalidades, determinar o tempo de vida da luminescência de um marcador compreende determinar uma ou mais características temporais que são indicativas do tempo de vida. Em algumas modalidades, o tempo de vida da luminescência de um marcador pode ser determinado com base em uma distribuição de uma pluralidade de eventos de emissão (por exemplo, 1, 2,3,4,5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100 ou mais eventos de emissão) ocorridos em uma ou mais janelas limitadas pelo tempo em relação a um pulso de excitação. Por exemplo, o tempo de vida da luminescência de um marcador pode ser distinguido dentre uma pluralidade de marcadores com diferentes tem- pos de vida da luminescência com base na distribuição de tempos de chegada de fótons medidos em relação a um pulso de excitação.
[00251] Deve-se reconhecer que o tempo de vida da luminescência de um marcador luminescente é indicativo do momento de fótons emi- tidos depois que o marcador atinge um estado de excitado e o marca- dor pode ser distinguido por informações indicativas do momento dos fótons. Algumas modalidades podem incluir distinguir um marcador dentre uma pluralidade de marcadores com base no tempo de vida da luminescência do marcador, medindo os tempos associados com fó- tons emitidos pelo marcador. A distribuição de tempos pode fornecer uma indicação do tempo de vida da luminescência que pode ser de- terminado a partir da distribuição. Em algumas modalidades, o marca- dor é distinguível da pluralidade de marcadores com base na distribui- ção de tempos, como pela comparação da distribuição de tempos a uma distribuição de referência correspondente de um marcador co- nhecido. Em algumas modalidades, um valor para o tempo de vida da luminescência é determinado a partir da distribuição de tempos.
[00252] Neste relatório descritivo, em algumas modalidades, inten- sidade da luminescência refere-se ao número de fótons emitidos por unidade de tempo que são emitidos por um marcador luminescente que está sendo excitado pela entrega de uma energia pulsada de exci- tação. Em algumas modalidades, a intensidade da luminescência refe- re-se ao número detectado de fótons emitidos por unidade de tempo que são emitidos por um marcador que está sendo excitado pela en- trega de uma energia pulsada de excitação, e são detectados por um sensor em particular ou conjunto de sensores.
[00253] Neste relatório descritivo, em algumas modalidades, brilho refere-se a um parâmetro que informa sobre a intensidade de emissão média por marcador luminescente. Assim, em algumas modalidades, a "intensidade de emissão" pode ser utilizada para referir-se, em geral, ao brilho de uma composição que compreende um ou mais marcado- res. Em algumas modalidades, o brilho de um marcador é igual ao produto de seu rendimento quântico e coeficiente de extinção.
[00254] Neste relatório descritivo, em algumas modalidades, rendi- mento quântico da luminescência refere-se à fração de eventos de ex- citação em um dado comprimento de onda ou dentro de uma dada fai- xa espectral que levam a um evento de emissão, e é tipicamente infe- rior a 1. Em algumas modalidades, o rendimento quântico da lumines-
cência de um marcador luminescente aqui descrito é entre O e aproxi- madamente 0,001, entre aproximadamente 0,001 e 0,01, entre apro- ximadamente 0,01 e 0,1, entre aproximadamente 0.1 e 0,5, entre aproximadamente 0,5 e 0,9, ou entre aproximadamente 0,9 e 1. Em algumas modalidades, um marcador é identificado determinando-se ou estimando o rendimento quântico da luminescência.
[00255] Neste relatório descritivo, em algumas modalidades, uma energia de excitação é um pulso de luz vindo de uma fonte de luz. Em algumas modalidades, uma energia de excitação está no espectro vi- sível. Em algumas modalidades, uma energia de excitação está no es- pectro de ultravioleta. Em algumas modalidades, uma energia de exci- tação está no espectro de infravermelho. Em algumas modalidades, uma energia de excitação em ou próxima da absorção máxima de um marcador luminescente do qual uma pluralidade de fótons emitidos deverá ser detectada. Em certas modalidades, a energia de excitação está entre aproximadamente 500 nm e 700 nm (por exemplo, entre aproximadamente 500 nm e 600 nm, entre aproximadamente 600 nm e 700 nm, entre aproximadamente 500 nm e 550 nm, entre aproxima- damente 550 nm e 600 nm, entre aproximadamente 600 nm e 650 nm ou entre aproximadamente 650 nm e 700 nm). Em certas modalida- des, uma energia de excitação pode ser monocromática ou restrita a uma faixa espectral. Em algumas modalidades, uma faixa espectral varia entre aproximadamente 0,1 nm e 1 nm, entre aproximadamente 1 nm e 2 nm ou entre aproximadamente 2 nm e 5 nm. Em algumas modalidades, uma faixa espectral varia entre aproximadamente 5 nm e nm, entre aproximadamente 10 nm e 50 nm ou entre aproximada- mente 50 nm e 100 nm. Sequenciamento
[00256] Aspectos do pedido de patente referem-se ao sequencia- mento de polímeros biológicos, como polipeptídeos e proteínas Neste relatório descritivo, "sequenciamento", "determinação da sequência", "determinar uma sequência" e termos semelhantes, em referência a um polipeptídeo ou uma proteína, inclui a determinação de informa- ções parciais sobre a sequência, bem como informações completas sobre a sequência do polipeptídeo ou proteína. Ou seja, a terminologia inclui comparações de sequências, impressões digitais, impressões digitais probabilísticas e níveis de informação semelhantes sobre uma molécula alvo, bem como a identificação expressa e ordenamento de cada aminoácido da molécula alvo dentro de uma região de interesse. Em algumas modalidades, a terminologia inclui identificar um único aminoácido de um polipeptídeo. Em ainda outras modalidades, mais de um aminoácido de um polipeptídeo é identificado. Neste relatório descritivo, em algumas modalidades, "identificar", "determinar a identi- dade", e termos semelhantes, em referência a um aminoácido inclui a determinação de uma identidade expressa de um aminoácido bem como a determinação de uma probabilidade de identidade expressa de um aminoácido. Por exemplo, em algumas modalidades, um aminoá- cido é identificado determinando-se uma probabilidade (por exemplo, de 0% a 100%) de que o aminoácido seja de um tipo específico, ou determinando-se uma probabilidade para cada um de uma pluralidade de tipos específicos. Deste modo, em algumas modalidades, os ter- mos "sequência de aminoácidos", "sequência do polipeptídeo" e "se- quência da proteína", neste relatório descritivo, podem referir-se ao próprio material do polipeptídeo ou proteína e não se restringem às informações sobre a sequência específica (por exemplo, a sucessão de letras representando a ordem de aminoácidos de um terminal ao outro terminal) que caracteriza bioquimicamente um polipeptídeo ou proteína específica.
[00257] Em algumas modalidades, sequenciar uma molécula de polipeptídeo compreende identificar pelo menos dois (por exemplo,
pelo menos 3, pelo menos 4, pelo menos 5, pelo menos 6, pelo menos 7, pelo menos 8, pelo menos 9, pelo menos 10, pelo menos 11, pelo menos 12, pelo menos 13, pelo menos 14, pelo menos 15, pelo menos 16, pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 25, pelo menos 30, pelo menos 35, pelo menos 40, pelo menos 45, pelo menos 50, pelo menos 60, pelo menos 70, pelo menos 80, pelo menos 90, pelo menos 100 ou mais) aminoácidos na molécula do polipeptídeo. Em algumas modalidades, os ao menos dois aminoá- cidos são aminoácidos contíguos. Em algumas modalidades, os ao menos dois aminoácidos não são aminoácidos contíguos.
[00258] Em algumas modalidades, o sequenciamento de uma mo- lécula de polipeptídeo compreende a identificação de menos do que 100% (por exemplo, menos do que 99%, menos do que 95%, menos do que 90%, menos do que 85%, menos do que 80%, menos do que 75%, menos do que 70%, menos do que 65%, menos do que 60%, menos do que 55%, menos do que 50%, menos do que 45%, menos do que 40%, menos do que 35%, menos do que 30%, menos do que 25%, menos do que 20%, menos do que 15%, menos do que 10%, menos do que 5%, menos do que 1% ou menos) de todos os aminoá- cidos na molécula do polipeptídeo. Por exemplo, em algumas modali- dades, o sequenciamento de uma molécula de polipeptídeo compre- ende a identificação de menos do que 100% de um tipo de aminoácido na molécula do polipeptídeo (por exemplo, a identificação de uma par- te de todos os aminoácidos de um tipo na molécula do polipeptídeo). Em algumas modalidades, o sequenciamento de uma molécula de po- lipeptídeo compreende a identificação de menos do que 100% de cada tipo de aminoácido na molécula do polipeptídeo.
[00259] Em algumas modalidades, o sequenciamento de uma mo- lécula de polipeptídeo compreende a identificação de pelo menos 1, pelo menos 5, pelo menos 10, pelo menos 15, pelo menos 20, pelo menos 25, pelo menos 30, pelo menos 35, pelo menos 40, pelo menos 45, pelo menos 50, pelo menos 55, pelo menos 60, pelo menos 65, pelo menos 70, pelo menos 75, pelo menos 80, pelo menos 85, pelo menos 90, pelo menos 95, pelo menos 100 ou mais tipos de aminoáci- dos no polipeptídeo.
[00260] Em algumas modalidades, o pedido de patente provê com- posições e métodos para sequenciar um polipeptídeo pela identifica- ção de uma série de aminoácidos que estão presentes em um terminal de um polipeptídeo ao longo do tempo (por exemplo, por detecção e clivagem iterativa de aminoácidos no terminal). Em ainda outras moda- lidades, o pedido de patente provê composições e métodos para se- quenciar um polipeptídeo identificando o teor de amino marcado do polipeptídeo e comparando a um banco de dados de sequência de re- ferência.
[00261] Em algumas modalidades, o pedido de patente provê com- posições e métodos para sequenciar um polipeptídeo pelo sequencia- mento de uma pluralidade de fragmentos do polipeptídeo. Em algumas modalidades, o sequenciamento de um polipeptídeo compreende combinar informações sobre a sequência de uma pluralidade de frag- mentos polipeptídicos para identificar e/ou determinar uma sequência para o polipeptídeo. Em algumas modalidades, a combinação das in- formações sobre a sequência pode ser realizada por hardware e sof- tware de computador. Os métodos aqui descritos podem permitir que um conjunto de polipeptídeos relacionados, como um proteoma inteiro de um organismo, seja sequenciado. Em algumas modalidades, uma pluralidade de reações de sequenciamento de única molécula é reali- zada em paralelo (por exemplo, em um único chip) de acordo com as- pectos do presente pedido de patente. Por exemplo, em algumas mo- dalidades, uma pluralidade de reações de sequenciamento de única molécula é cada uma realizada em poços de amostra separados em um único chip.
[00262] Em algumas modalidades, os métodos aqui providos po- dem ser utilizados para o sequenciamento e identificação de uma pro- teína individual em uma amostra compreendendo uma mistura com- plexa de proteínas. Em algumas modalidades, o pedido de patente provê métodos para identificar de modo único uma proteína individual em uma mistura complexa de proteínas. Em algumas modalidades, uma proteína individual é detectada em uma amostra mista determi- nando-se uma sequência parcial de aminoácidos da proteína. Em al- gumas modalidades, a sequência parcial de aminoácidos da proteína está dentro de um trecho contíguo com aproximadamente 5 a 50 ami- noácidos.
[00263] Sema intenção de ficar preso a qualquer teoria em particu- lar, acredita-se que a maioria das proteínas humanas possa ser identi- ficada usando informações incompletas da sequência por referência a bancos de dados proteômicos. Por exemplo, a modelagem simples do proteoma humana mostrou que aproximadamente 98% das proteínas pode ser identificado de modo único detectando-se apenas quatro ti- pos de aminoácidos dentro de um trecho de 6 a 40 aminoácidos (ver, por exemplo, Swaminathan, et al. PLoS Comput Biol. 2015, 11(2): e 1004080; e Yao, et al. Phys. Biol. 2015, 12(5):055003). Portanto, uma mistura complexa de proteínas pode ser degradada (por exemplo, de- gradada quimicamente, degradada enzimaticamente) em fragmentos polipeptídicos curtos de aproximadamente 6 a 40 aminoácidos, e o se- quenciamento dessa biblioteca de polipeptídeos revelaria a identidade e abundância de cada uma das proteínas presentes na mistura com- plexa original. Composições e métodos para a marcação seletiva de aminoácidos e identificação de polipeptídeos pela determinação de informações parciais sobre a sequência são descritos detalhadamente no Pedido de Patente U.S. Nº 15/510 962, depositado em 15 de se-
tembro de 2015, intitulado "Single Molecule Peptide Sequencing" (Se- quenciamento de peptídeos de única molécula), que é aqui incorpora- do em sua totalidade por referência.
[00264] “Modalidades são capazes de sequenciar moléculas de um único polipeptídeo com alta precisão, como uma precisão pelo menos próxima de 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99,9%, 99,99%, 99,999% ou 99,9999%. Em algumas mo- dalidades, a molécula alvo usada no sequenciamento de única molé- cula é um polipeptídeo que é imobilizado em uma superfície de um su- porte sólido, como uma superfície inferior ou uma superfície da parede lateral de um poço de amostra. O poço de amostra também pode con- ter quaisquer outros reagentes necessários para uma reação de se- quenciamento de acordo com o pedido de patente, como um ou mais tampões adequados, cofatores, reagentes de afinidade marcados e enzimas (por exemplo, enzimas exopeptidases cataliticamente ativas ou inativas, que podem ser marcadas ou não marcadas por lumines- cência).
[00265] — Como descrito acima, em algumas modalidades, o sequen- ciamento de acordo com o pedido de patente compreende identificar um aminoácido determinando-se uma probabilidade de que o aminoá- cido seja de um tipo específico. Os sistemas convencionais de identifi- cação de proteínas requerem a identificação de cada aminoácido em um polipeptídeo para identificar o polipeptídeo. No entanto, é difícil identificar com precisão cada aminoácido em um polipeptídeo. Por exemplo, os dados coletados de uma interação na qual uma primeira molécula de reconhecimento se associa com um primeiro aminoácido podem não ser suficientemente diferentes dos dados coletados de uma interação na qual uma segunda molécula de reconhecimento se associa com um segundo aminoácido para diferenciar os dois aminoá- cidos. Em algumas modalidades, o sequenciamento de acordo com o pedido de patente evita esse problema ao usar um sistema de identifi- cação de proteínas que, diferentemente dos sistemas convencionais de identificação de proteínas, não requer (mas não impede) a identifi- cação de cada aminoácido na proteína.
[00266] Deste modo, em algumas modalidades, o sequenciamento de acordo com o pedido de patente pode ser realizado usando um sis- tema de identificação de proteínas que utiliza técnicas de aprendizado de máquina para identificar proteínas. Em algumas modalidades, o sis- tema opera: (1) coletando dados sobre um polipeptídeo de uma prote- ína usando um dispositivo de sequência de proteínas em tempo real; (2) usando um modelo de aprendizado de máquina e os dados coleta- dos para identificar probabilidades de que certos aminoácidos fazem parte do polipeptídeo em respectivas localizações; e (3) usando as probabilidades identificadas, como uma "impressão digital probabilísti- ca" para identificar a proteína. Em algumas modalidades, os dados so- bre o polipeptídeo da proteína podem ser obtidos usando reagentes que se ligam seletivamente aos aminoácidos. Como um exemplo, os reagentes e/ou aminoácidos podem ser marcados com marcadores luminescentes que emitem luz em resposta à aplicação de energia de excitação. Nesse exemplo, um dispositivo de sequenciamento de pro- teínas pode aplicar energia de excitação a uma amostra de uma prote- ína (por exemplo, um polipeptídeo) durante interações de ligação dos reagentes com aminoácidos na amostra. Em algumas modalidades, um ou mais sensores no dispositivo de sequenciamento (por exemplo, um fotodetector, um sensor elétrico e/ou qualquer outro tipo adequado de sensor) podem detectar interações de ligação. Por outro lado, os dados coletados e/ou derivados a partir das emissões de luz detecta- das podem ser fornecidos ao modelo de aprendizado de máquina. Modelos de aprendizado de máquina e sistemas e métodos associa- dos são descritos detalhadamente no Pedido de Patente U.S. Provisó-
rio Nº 62/860 750, depositado em 12 de junho de 2019, intitulado "Ma- chine Learning Enabled Protein Identification" (Aprendizado de máqui- na permitiu a identificação de proteínas), que é aqui incorporado em sua totalidade por referência.
[00267] O sequenciamento de acordo com o pedido de patente, em alguns aspectos, pode envolver imobilizar um polipeptídeo em uma superfície de um substrato (por exemplo, de um suporte sólido, por exemplo, um chip, por exemplo, um dispositivo integrado como aqui descrito). Em algumas modalidades, um polipeptídeo pode ser imobili- zado em uma superfície de um poço de amostra (por exemplo, on uma superfície inferior de um poço de amostra) em um substrato. Em algu- mas modalidades, o aminoácido N-terminal do polipeptídeo é imobili- zado (por exemplo, anexado à superfície). Em algumas modalidades, o aminoácido C-terminal do polipeptídeo é imobilizado (por exemplo, anexado à superfície). Em algumas modalidades, um ou mais aminoá- cidos não terminais são imobilizados (por exemplo, anexados à super- fície). O(s) aminoácido(s) imobilizado(s) pode(m) ser anexado(s) por meio de qualquer ligação covalente ou não covalente adequada, por exemplo, como descrito neste pedido de patente. Em algumas modali- dades, uma pluralidade de polipeptídeos é anexada a uma pluralidade de poços de amostra (por exemplo, com um polipeptídeo anexado a uma superfície, por exemplo, uma superfície inferior, de cada poço de amostra), por exemplo, em um arranjo de poços de amostra em um substrato.
[00268] O sequenciamento de acordo com o pedido de patente, em alguns aspectos, pode ser realizado usando um sistema que permite a análise de uma única molécula. O sistema pode incluir um dispositivo integrado e um instrumento configurado para servir de interface com o dispositivo integrado. O dispositivo integrado pode incluir um arranjo de pixels, onde pixels individuais incluem um poço de amostra e pelo menos um fotodetector. Os poços de amostra do dispositivo integrado podem ser formados sobre ou através de uma superfície do dispositivo integrado e ser configurados para receber uma amostra colocada so- bre a superfície do dispositivo integrado. Coletivamente, os poços de amostra podem ser considerados um arranjo de poços de amostra. À pluralidade de poços de amostra pode ter um tamanho e forma ade- quados de tal modo que pelo menos uma parte dos poços de amostra receba uma amostra única (por exemplo, uma molécula única, como um polipeptídeo). Em algumas modalidades, o número de amostras em um poço de amostra pode ser distribuído entre os poços de amos- tra do dispositivo integrado de tal modo que alguns poços de amostra contenham uma amostra enquanto outros contenham zero, dois ou mais amostras.
[00269] É fornecida luz de excitação ao dispositivo integrado desde uma ou mais fontes de luz externas ao dispositivo integrado. Os com- ponentes ópticos do dispositivo integrado podem receber a luz de exci- tação desde a fonte de luz e direcionar a luz para o arranjo de poços de amostra do dispositivo integrado e iluminar uma região de ilumina- ção no poço de amostra. Em algumas modalidades, um poço de amostra pode ter uma configuração que permita à amostra ficar retida nas proximidades de uma superfície do poço de amostra, o que pode facilitar a entrega de luz de excitação à amostra e a detecção a luz emitida pela amostra. Uma amostra posicionada na região de ilumina- ção pode emitir luz de emissão em resposta a ser iluminada pela luz de excitação. Por exemplo, a amostra pode ser marcada com um mar- cador fluorescente, que emite luz em resposta a alcançar um estado de excitado pela iluminação da luz de excitação. A luz de emissão emi- tida por uma amostra pode então ser detectada por um ou mais foto- detectores dentro de um pixel correspondente ao poço de amostra com a amostra em análise. Quando realizado em todo o arranjo de po-
ços de amostra, cujo número pode variar entre aproximadamente
10.000 pixels a 1.000.000 pixels de acordo com algumas modalidades, múltiplas amostras podem ser analisados em paralelo.
[00270] O dispositivo integrado pode incluir um sistema óptico para receber luz de excitação e direcionar a luz de excitação entre o arranjo de poços de amostra. O sistema óptico pode incluir um ou mais aco- pladores refletores configurados para acoplar luz de excitação ao dis- positivo integrado e direcionar a luz de excitação para outros compo- nentes ópticos. O sistema óptico pode incluir componentes ópticos que direcionam a luz de excitação desde um acoplador refletor para o ar- ranjo de poços de amostra. Tais componentes ópticos podem incluir divisores (splitters) ópticos, combinadores ópticos e guias de ondas. Em algumas modalidades, um ou mais divisores ópticos podem aco- plar luz de excitação desde um acoplador refletor e entregar a luz de excitação para pelo menos um dos guias de ondas. De acordo com algumas modalidades, o divisor óptico pode ter uma configuração que permite que a entrega de luz de excitação seja substancialmente uni- forme entre todos os guias de ondas de tal modo que cada um dos guias de ondas receba uma quantidade substancialmente semelhante de luz de excitação. Tais modalidades podem melhorar o desempenho do dispositivo integrado ao melhorarem a uniformidade da luz de exci- tação recebida pelos poços de amostra do dispositivo integrado. Exemplos de componentes adequados, por exemplo, para acoplar luz de excitação a um poço de amostra e/ou direcionar luz de emissão pa- ra um fotodetector, para inclusão em um dispositivo integrado são descritos no Pedido de Patente U.S. Nº 14/821 688, depositado em 07 de agosto de 2015, intitulado "Integrated Device for Probing, Detecting and Analysing Molecules" (Dispositivo integrado para sondagem, de- tecção de análise de moléculas), o e Pedido de Patente U.S. Nº 14/543 865, depositado em 17 de novembro de 2014, intitulado "/nte-
grated Device with External Light Source for Probing, Detecting and Analysing Molecules" (Dispositivo integrado com fonte de luz externa para sondagem, detecção e análise de moléculas), cujos conteúdos são incorporados, em sua totalidade, por referência. Exemplos de acopladores refletores e guias de ondas adequados que podem ser implementados no dispositivo integrado são descritos no Pedido de Patente U.S. Nº 15/844 403, depositado em 15 de dezembro de 2017, intitulado "Optical Coupler and Waveguide System" (Sistema de aco- plador óptico e guia de ondas), cujo conteúdo é incorporado, em sua totalidade, por referência.
[00271] Estruturas fotônicas adicionais podem ser posicionadas en- tre os poços de amostra e os fotodetectores e configuradas para redu- zir ou impedir que a luz de excitação chegue aos fotodetectores, o que pode, de outra forma, contribuir para ruído em sinal ao se detectar a luz de emissão. Em algumas modalidades, camadas de metal que po- dem atuar como um circuito para o dispositivo integrado, podem tam- bém ter a função de filtro espacial. Exemplos de estruturas fotônicas adequados podem incluir filtros espectrais, filtros de polarização e fil- tros espaciais e são descritos no Pedido de Patente U.S. Nº 16/042 968, depositado em 23 de julho de 2018, intitulado "Optical Rejection Photonic Structures" (Estruturas fotônicas de rejeição óptica), cujo con- teúdo é incorporado, em sua totalidade, por referência.
[00272] Componentes localizados fora do dispositivo integrado po- dem ser utilizados para posicionar e alinhar uma fonte de excitação ao dispositivo integrado. Tais componentes podem incluir componentes ópticos incluindo lentes, espelhos, prismas, janelas, aberturas, atenu- adores e/ou fibras ópticas. Componentes mecânicos adicionais podem ser incluídos no instrumento para permitir o controle de um ou mais componentes do alinhamento. Tais componentes mecânicos podem incluir acionadores, motores de passo e/ou puxadores. Exemplos de fontes de excitação e mecanismos de alinhamento adequados são descritos no Pedido de Patente U.S. Nº 15/161 088, depositado em 20 de maio de 2016, intitulado "Pulsed Laser and System" (Laser e siste- ma pulsado), cujo conteúdo é incorporado, em sua totalidade, por refe- rência. Outro exemplo de um modulo de comando de feixes é descrito no Pedido de Patente U.S. Nº 15/842 720, depositado em 14 de de- zembro de 2017, intitulado "Compact Beam Shaping and Steering As- sembly" (Conjunto para formação e comando de feixes compactos), cujo conteúdo é aqui incorporado por referência. Exemplos adicionais de fontes de excitação adequadas são descritas no Pedido de Patente U.S. Nº 14/821 688, depositado em 7 de agosto de 2015, intitulado "/n- tegrated Device for Probing, Detecting and Analysing Molecules", cujo conteúdo é incorporado, em sua totalidade, por referência.
[00273] O(s) fotodetector(es) posicionado(s) com pixels individuais do dispositivo integrado pode(m) ser configurado(s) e posicionado(s) para detectar luz de emissão gerada no poço de amostra correspon- dente do pixel. Exemplos de fotodetectores adequados são descritos no Pedido de Patente U.S. Nº 14/821,656, depositado em 7 de agosto de 2015, intitulado "Integrated Device for Temporal Binning of Photons" (Dispositivo integrado para binning temporal de fótons), cujo conteúdo é incorporado, em sua totalidade, por referência. Em algumas modali- dades, um poço de amostra e seu(s) respectivo(s) fotodetector(es) po- de(m) ser alinhado(s) ao longo de um eixo comum. Dessa maneira, o(s) fotodetector(es) pode(m) sobrepor-se com o poço de amostra no pixel.
[00274] As características da luz de emissão detectada podem for- necer uma indicação para identificar o marcador associado com a luz de emissão. Tais características podem incluir qualquer tipo adequado de característica, incluindo um tempo de chegada de fótons detecta- dos por um fotodetector, uma quantidade de fótons acumulados ao longo do tempo por um fotodetector e/ou uma distribuição de fótons entre dois ou mais fotodetectores. Em algumas modalidades, um foto- detector pode ter uma configuração que permita a detecção de um ou mais características temporais associadas com a luz de emissão de uma amostra (por exemplo, tempo de vida da luminescência). O foto- detector pode detectar uma distribuição de tempos de chegada de fó- tons após a propagação de um pulso de luz de excitação através do dispositivo integrado, e a distribuição de tempos de chegada pode for- necer uma indicação de uma característica temporal associada com a luz de emissão (por exemplo, um substituto para tempo de vida da lu- minescência). Em algumas modalidades, um ou mais fotodetectores fornecem uma indicação da probabilidade de luz de emissão emitida pelo marcador (por exemplo, intensidade da luminescência). Em algu- mas modalidades, uma pluralidade de fotodetectores pode ser dimen- sionada e disposta para captura uma distribuição espacial da luz de emissão. Os sinais de saída de um ou mais fotodetectores podem en- tão ser usados para distinguir um marcador dentre uma pluralidade de marcadores, em que a pluralidade de marcadores pode ser utilizada para identificar uma amostra dentro da amostra. Em algumas modali- dades, uma amostra pode ser excitada por múltiplas energias de exci- tação, e as características da luz de emissão e/ou temporais da luz de emissão emitida pela amostra em resposta às múltiplas energias de excitação podem distinguir um marcador de uma pluralidade de mar- cadores.
[00275] Em operação, são realizadas análises paralelas de amos- tras nos poços de amostra pela excitação de algumas ou de todas as amostras nos poços, usando luz de excitação e detectando sinais ge- rados por emissão da amostra com os fotodetectores. A luz de emis- são gerada em uma amostra pode ser detectada por um fotodetector correspondente e convertida em pelo menos um sinal elétrico. Os si-
nais elétricos podem ser transmitidos ao longo de linhas condutoras no circuito do dispositivo integrado, o qual pode ser conectado a um ins- trumento de interface com o dispositivo integrado. Os sinais elétricos podem ser subsequentemente processados e/ou analisados. O pro- cessamento ou a análise dos sinais elétricos pode ocorrer em um dis- positivo adequado de computação quer localizado dentro ou fora do instrumento.
[00276] O instrumento pode incluir uma interface do usuário para controlar a operação do instrumento e/ou do dispositivo integrado. À interface do usuário pode ser configurada para permitir que um usuário insira informações no instrumento, tal como comandos e/ou configura- ções usadas para controlar o funcionamento do instrumento. Em al- gumas modalidades, a interface do usuário pode incluir botões, inter- ruptores, mostradores e um microfone para comandos de voz. A inter- face do usuário pode permitir que um usuário receba feedback sobre o desempenho do instrumento e/ou do dispositivo integrado, tais como alinhamento correto e/ou informações obtidas pela leitura de sinais ge- rados pelos fotodetectores no dispositivo integrado. Em algumas mo- dalidades, a interface do usuário pode fornecer feedback usando um alto-falante para fornecer feedback audível. Em algumas modalidades, a interface do usuário pode incluir luzes indicadoras e/ou uma tela de exibição para fornecer feedback visual a um usuário.
[00277] Em algumas modalidades, o instrumento pode incluir uma interface para computador configurada para conectar-se com um dis- positivo de computação. A interface para computador pode ser uma interface de USB, uma interface de FireWire ou qualquer outra interfa- ce, adequada de computador. Um dispositivo de computação pode ser qualquer computador de uso geral, como um computador portátil ou de mesa. Em algumas modalidades, um dispositivo de computação pode ser um servidor (por exemplo, servidor com base na nuvem) accessí-
vel ao longo de uma rede sem fio através de uma interface para com- putador adequada. A interface para computador por facilitar a comuni- cação de informações entre o instrumento e o dispositivo de computa- ção. As informações de entrada para controlar e/ou configurar o ins- trumento podem ser fornecidas ao dispositivo de computação e trans- mitidas ao instrumento através da interface para computador. As in- formações de saída geradas pelo instrumento podem ser recebidas pelo dispositivo de computação através da interface para computador. As informações de saída podem incluir feedback sobre o desempenho do instrumento, o desempenho do dispositivo integrado e/ou dados gerados a partir dos sinais de leitura do fotodetector.
[00278] Em algumas modalidades, o instrumento pode incluir um dispositivo de processamento configurado para analisar dados recebi- dos de um ou mais fotodetectores do dispositivo integrado e/ou trans- mitir sinais de controle à(s) fonte(s) de excitação. Em algumas modalida- des, o dispositivo de processamento pode compreender um processador de uso geral, um processador especialmente adaptado (por exemplo, unidade de processamento central (CPU) como um ou mais núcleos microprocessadores ou microcentroladores, um arranjo de portas pro- gramáveis em campo (field-programmable gate array, FPGA), um cir- cuito integrado de aplicação específica (application-specific integrated circuit, ASIC), um circuito integrado personalizado, um processador digital de sinais (digital signal processador, DSP) ou uma combinação dos mesmos). Em algumas modalidades, o processamento dos dados de um ou mais fotodetectores pode ser realizado por um dispositivo de processamento do instrumento e por um dispositivo externo de compu- tação. Em outras modalidades, um dispositivo externo de computação pode ser omitido e o processamento dos dados de um ou mais fotode- tectores pode ser realizado exclusivamente por um dispositivo de pro- cessamento do dispositivo integrado.
[00279] De acordo com algumas modalidades, o instrumento que é configurado para analisar amostras com base em características da emissão de luminescência pode detectar diferenças em tempos de vi- da e/ou intensidades da luminescência entre diferentes moléculas lu- minescentes, e/ou diferenças entre tempos de vida e/ou intensidades das mesmas moléculas luminescentes em ambientes diferentes.
Os inventores reconheceram e apreciaram que as diferenças em tempos de vida de emissão da luminescência pode ser usadas para discernir a presença ou a ausência de diferentes moléculas luminescentes e/ou para discernir diferentes ambientes ou condições às quais uma molé- cula luminescente é submetida.
Em alguns casos, o discernimento de moléculas luminescentes com base no tempo de vida (em vez de comprimento de onda da emissão, por exemplo,) pode simplificar as- pectos do sistema.
Como um exemplo, os instrumentos ópticos que discriminam o comprimento de onda (como filtros de comprimento de onda, detectores dedicados a cada comprimento de onda, fontes ópti- cas pulsadas dedicadas a diferentes comprimentos de onda e/ou ins- trumentos ópticos de difração) podem ter o número reduzido ou serem eliminados quando moléculas luminescentes são discernidas com ba- se no tempo de vida.
Em alguns casos, uma única fonte óptica pulsada operando em um único comprimento de onda característico pode ser utilizada para excitar diferentes moléculas luminescentes que emitem dentro de uma região com o mesmo comprimento de onda do espectro óptico, mas que possuem tempos de vida mensuravelmente diferen- tes.
Um sistema analítico que usa uma única fonte óptica pulsada, em vez de múltiplas fontes operando em diferentes comprimentos de on- da, para excitar e discernir moléculas luminescentes diferente com emissão em uma região com o mesmo comprimento de onda pode ser menos complexo para operar e manter, mais compacto e pode ser fa- bricado com custo menor.
[00280] Embora os sistemas analíticos que se baseiam na análise do tempo de vida da luminescência possam ter certos benefícios, a quantidade de informações obtidas por um sistema analítico e/ou a precisão da detecção podem ser aumentada quando se permitem téc- nicas adicionais de detecção. Por exemplo, algumas modalidades dos sistemas podem ser, além disso, configuradas para discernir uma ou mais propriedades de uma amostra com base em comprimento de on- da da luminescência e/ou intensidade da luminescência. Em algumas implementações, a intensidade da luminescência pode ser utilizada, além de ou alternativamente, para distinguir marcadores luminescen- tes diferentes. Por exemplo, alguns marcadores luminescentes podem emitir em intensidades significativamente diferentes ou terem uma dife- rença significativa nas suas probabilidades de excitação (por exemplo, uma diferença pelo menos de aproximadamente 35%) ainda que as suas taxas de decaimento possam ser semelhantes. Ao fazer referên- cia a sinais selecionados para medir a luz de excitação, pode ser pos- sível distinguir marcadores luminescentes diferentes com base em ní- veis de intensidade.
[00281] “De acordo com algumas modalidades, diferentes tempos de vida da luminescência pode ser distinguidos com um fotodetector que é configurado para codificação temporal (time-binning) dos eventos de emissão de luminescência após a excitação de um marcador lumines- cente. A codificação temporal pode ocorrer durante um único ciclo com acúmulo de carga para o fotodetector. Um ciclo com acúmulo de carga é um intervalo entre eventos de leitura durante os quais portadores fotogerados são acumulados em bins (janelas) do fotodetector codifi- cado em tempo. Exemplos de fotodetector de codificação temporal são descritos no Pedido de Patente U.S. Nº 14/821 656, depositado em 7 de agosto de 2015, intitulado "Integraged Device for Temporal Binning of Received Photons", cujo conteúdo é aqui incorporado por referên-
cia. Em algumas modalidades, um fotodetector de codificação tempo- ral pode gerar portadores de carga em uma região de absor- ção/geração de portador e transferir diretamente portadores de carga para bin de armazenamento de portadores de carga em uma região de armazenamento de portadores de carga. Em tais modalidades, o foto- detector de codificação temporal pode não incluir uma região de per- curso/captura de portador de carga. Tal fotodetector codificado em tempo pode ser referido como um "pixel de binning direto". Exemplos fotodetectores de codificação temporal, incluindo pixels de binning di- reto, são descritos no Pedido de Patente U.S. Nº 15/852 571, deposi- tado em 22 de dezembro de 2017, intitulado "Integrated Photodetector with direct binning pixel", cujo conteúdo é aqui incorporado por refe- rência.
[00282] Em algumas modalidades, números diferentes de fluorófo- ros do mesmo tipo podem ser ligados a reagentes diferentes em uma amostra, de modo que cada reagente pode ser identificado com base na intensidade da luminescência. Por exemplo, dois fluoróforos podem ser ligados a um primeiro reagente de afinidade marcado e quando ou mais fluoróforos podem ser ligados a um segundo reagente de afinida- de marcado. Por causa dos números diferentes de fluoróforos, as pro- babilidades de excitação e emissão de fluoróforos associados com os diferentes reagentes de afinidade podem ser diferentes. Por exemplo, pode haver mais eventos de emissão para o segundo reagente de afi- nidade marcado durante um intervalo de acúmulo de sinais, de modo que a intensidade aparente dos bins é significativamente maior do que para o primeiro reagente de afinidade marcado.
[00283] Os inventores reconheceram e apreciaram que a distinção entre nucleotídeos ou quaisquer outras amostras biológicas ou quími- cas com base em taxas de decaimento dos fluoróforos e/ou intensida- des dos fluoróforos pode permitir uma simplificação dos sistemas de excitação e detecção óptica. Por exemplo, a excitação óptica pode ser realizada com uma fonte de um único comprimento de onda (por exemplo, uma fonte que produz um comprimento de onda característi- co em vez de múltiplas fontes ou uma fonte que opera em múltiplos comprimentos de onda característicos diferentes). Além disso, podem não ser necessários instrumentos ópticos e filtros que discriminam o comprimento de onda no sistema de detecção. Além disso, pode-se utilizar um único fotodetector para cada poço de amostra para detectar a emissão de fluoróforos diferentes. A expressão "comprimento de on- da característico" ou "comprimento de onda" é usada para referir-se a um comprimento de onda central ou predominante dentro de uma lar- gura de banda de radiação (por exemplo, um comprimento de onda central ou máximo dentro de uma largura de banda de 20 nm gerado por uma fonte óptica pulsada). Em alguns casos, "comprimento de on- da característico" ou "comprimento de onda" pode ser utilizado para referir-se a um comprimento de onda máximo dentro de uma largura de banda total de radiação gerado por uma fonte.
Técnicas computacionais
[00284] Aspectos do presente pedido de patente referem-se a téc- nicas computacionais para analisar os dados gerados pelas técnicas de sequenciamento de polipeptídeos aqui descritas. Como discutido acima, por exemplo, em conexão com as Figuras 1A e 1B, os dados gerados usando essas técnicas de sequenciamento podem incluir uma série de pulsos de sinal indicativos de casos em que uma molécula de reconhecimento de aminoácido está associada com um aminoácido exposto no terminal do polipeptídeo sendo sequenciado. A série de pulsos de sinal pode ter uma ou mais características variáveis (por exemplo, duração do pulso, duração entre pulsos, mudança na magni- tude), dependendo do tipo de aminoácido presentemente no terminal, ao longo do tempo à medida que o processo de degradação prosse-
gue removendo aminoácidos sucessivos. O traço de sinal resultante pode incluir padrões característicos, que surgem de uma ou mais ca- racterísticas variáveis, associadas com os respectivos aminoácidos. As técnicas computacionais aqui descritas podem ser implementadas como parte da análise desses dados obtidos usando essas técnicas de sequenciamento para identificar uma sequência de aminoácidos.
[00285] Algumas modalidades podem envolver obter dados durante um processo de degradação de um polipeptídeo, analisar os dados para determinar porções dos dados que correspondem a aminoácidos que são expostos sequencialmente em um terminal do polipeptídeo durante o processo de degradação, e produzir, a partir dos dados, uma sequência de aminoácidos representativa do polipeptídeo. A Figura 11 é um diagrama de um processo ilustrando um pipeline 1100 para iden- tificar uma sequência de aminoácidos analisando os dados obtidos usando as técnicas de sequenciamento de polipeptídeo aqui descritas. Como mostrado na Figura 11, a análise dos dados de sequenciamento 1102 pode envolver usar a técnica de identificação de eventos de as- sociação 1104 e técnica de identificação de aminoácidos 1106 para produzir, a partir dos dados, a(s) sequência(s) de aminoácidos 1108.
[00286] Como aqui discutido, dados do sequenciamento 1102 po- dem ser obtidos durante um processo de degradação de um polipeptí- deo. Em algumas modalidades, os dados do sequenciamento 1102 são indicativos da identidade do aminoácido no terminal do polipeptí- deo durante o processo de degradação. Em algumas modalidades, os dados do sequenciamento 1102 são indicativos de um sinal produzido pela ligação de uma ou mais moléculas de reconhecimento de amino- ácidos a tipos diferentes de aminoácidos terminais no terminal durante o processo de degradação. Dados do sequenciamento exemplares são mostrados nas Figuras 1A e 1B, que são discutidos acima.
[00287] “Dependendo do modo como os sinais são gerados durante o processo de degradação, os dados do sequenciamento 1102 podem ser indicativos de um ou mais tipos diferentes de sinais. Em algumas modalidades, os dados do sequenciamento 1102 são indicativos de um sinal luminescente gerado durante o processo de degradação. Por exemplo, um marcador luminescente pode ser utilizada para marcar uma molécula de reconhecimento de aminoácido, e a luminescência emitida pelo marcador luminescente pode ser detectada quando a mo- lécula de reconhecimento de aminoácido associa-se com um determi- nado aminoácido, resultando em um sinal luminescente. Em algumas modalidades, os dados do sequenciamento 1102 são indicativos de um sinal elétrico gerado durante o processo de degradação. Por exemplo, uma molécula de polipeptídeo que está sequenciada pode ser imobilizada a um nanoporo, e um sinal elétrico (por exemplo, mu- danças na condutância) pode ser detectado quando uma molécula de reconhecimento de aminoácido associa-se com um determinado ami- noácido.
[00288] Algumas modalidades envolvem analisar os dados do se- quenciamento 1102 para determinar porções dos dados de sequenci- amento 1102 que correspondem a aminoácidos que são expostos se- quencialmente em um terminal do polipeptídeo durante o processo de degradação. Como mostrado na Figura 11, uma técnica de identifica- ção de eventos de associação 1104 pode ter acesso aos dados de se- quenciamento 1102 e analisar os dados de sequenciamento para iden- tificar porções dos dados de sequenciamento 1102 que correspondem a eventos de associação. Os eventos de associação podem corres- ponder a padrões característicos, como CP; e CP2 mostrados na Figu- ra 1B, nos dados. Em algumas modalidades, a técnica de identificação de eventos de associação 1104 pode envolver detectar uma série de eventos de clivagem e determinar porções dos dados de sequencia- mento 1102 entre eventos de clivagem sucessivos. Como um exem-
plo, um evento de clivagem entre CP; e CP2 mostrados na Figura 1B pode ser detectado de tal modo que uma primeira porção dos dados correspondentes a CP, pode ser identificado como um primeiro evento de associação e uma segunda porção dos dados correspondentes a CP2 pode ser identificada como um segundo evento de associação.
[00289] Algumas modalidades envolvem identificar um tipo de ami- noácido para uma ou mais das porções determinadas dos dados de sequenciamento 1102. Como mostrado na Figura 11, a técnica de identificação de aminoácidos 1106 pode ser utilizada para determinar um tipo de aminoácido para um ou mais dos eventos de associação identificados pela técnica de identificação de eventos de associação
1104. Em algumas modalidades, as porções individuais dos dados identificadas pela técnica de identificação de evento de associação 1104 podem incluir um padrão de pulso, e a técnica de identificação de aminoácidos 1106 pode determinar um tipo de aminoácido para uma ou mais das porções tendo por base o seu respectivo padrão de pulso. Fazendo referência à Figura 1B, a técnica de identificação de aminoá- cidos 1106 pode identificar um primeiro tipo de aminoácido para CP; e um segundo tipo de aminoácido para CP. Em algumas modalidades, a determinação do tipo de aminoácido pode incluir identificar uma quantidade de tempo em uma porção dos dados, como uma porção identificada usando a técnica de identificação de eventos de associa- ção 1104, quando os dados forem acima de um valor limiar e compa- rar a quantidade de tempo a uma duração de tempo para a porção dos dados. Por exemplo, a identificação de um tipo de aminoácido para CP podem incluir determinar uma quantidade de tempo dentro de CP7 quando o sinal está acima um valor limiar, como um período de tempo, pd, onde o sinal está acima de M., e compará-lo a uma duração de tempo total para CP. Em algumas modalidades, a determinação do tipo de aminoácido pode envolver identificar uma ou mais durações de pulso para uma ou mais porção dos dados identificados pela técnica de identificação de eventos de associação 1102. Por exemplo, a identi- ficação de um tipo de aminoácido para CP; pode incluir determinar uma duração do pulso para CP1, como um período de tempo, pd. Em algumas modalidades, a determinação do tipo de aminoácido pode envolver identificar uma ou mais durações entre pulsos para uma ou mais porções dos dados identificados usando a técnica de identifica- ção de eventos de associação 1104. Por exemplo, a identificação de um tipo de aminoácido para CP; pode incluir identificar uma duração entre pulsos, como ipd.
[00290] Com a identificação de um tipo de aminoácido para porções sucessivas dos dados de sequenciamento 1102, a técnica de identifi- cação de aminoácidos 1106 pode gerar, a partir dos dados, sequên- cia(s) de aminoácidos 1108 representativa(s) do polipeptídeo. Em al- gumas modalidades, a sequência de aminoácidos inclui uma série de aminoácidos que correspondem à porção dos dados identificados usando a técnica de identificação de eventos de associação 1104.
[00291] A Figura 12 é um fluxograma de um processo ilustrativo 1200 para determinar uma sequência de aminoácidos de uma molécu- la de polipeptídeo, de acordo com algumas modalidades da tecnologia aqui descrita. O processo 1200 pode ser realizado em qualquer dispo- sitivo adequado de computação (por exemplo, um único dispositivo de computação, múltiplos dispositivos de computação localizados todos em um único local físico ou localizados em múltiplos locais físicos dis- tantes uns dos outros, um ou mais dispositivos de computação inte- grantes de um sistema de computação na nuvem etc.), uma vez que os aspectos da tecnologia aqui descrita não estão limitados em rela- ção a isso. Em algumas modalidades, a técnica de identificação de eventos de associação 1104 e a técnica de identificação de aminoáci- dos 1106 podem realizar parte ou todo o processo 1200 para determi-
nar sequência(s) de aminoácidos.
[00292] O processo 1200 começa com 1202, que envolve colocar a única molécula polipeptídica em contato com uma ou mais moléculas de reconhecimento de aminoácidos terminais. Em seguida, o processo 1200 prossegue com 1104, que envolve detectar uma série de pulsos de sinal indicativos da associação de uma ou mais moléculas de reco- nhecimento de aminoácidos terminais com aminoácidos sucessivos expostos em um terminal do único polipeptídeo enquanto o único poli- peptídeo está sendo degradado. A série de pulsos pode permitir o se- quenciamento da única molécula polipeptídica, tal como usando a téc- nica de identificação de eventos de associação 1104 e a técnica de identificação de aminoácidos 1106.
[00293] Em algumas modalidades, o processo 1200 pode incluir 1206, que envolve identificar um primeiro tipo de aminoácido na única molécula polipeptídica com base em um primeiro padrão característico na série de pulsos de sinal, tal como com a técnica de identificação de aminoácidos 1106.
[00294] A Figura 13 é um fluxograma de um processo ilustrativo 1300 para determinar uma sequência de aminoácidos representativa de um polipeptídeo, de acordo com algumas modalidades da tecnolo- gia aqui descrita. O processo 1300 pode ser realizado em qualquer em qualquer dispositivo adequado de computação (por exemplo, um único dispositivo de computação, múltiplos dispositivos de computação loca- lizados todos em um único local físico ou localizados em múltiplos lo- cais físicos distantes uns dos outros, um ou mais dispositivos de com- putação integrantes de um sistema de computação na nuvem etc.), pois aspectos da tecnologia aqui descrita não estão limitados em rela- ção a isso. Em algumas modalidades, a técnica de identificação de eventos de associação 1104 e a técnica de identificação de aminoáci- dos 1106 podem realizar parte ou todo o processo 1300 para determi-
nar sequência(s) de aminoácidos.
[00295] O processo 1300 começa com 1302, em que são obtidos os dados durante um processo de degradação de um polipeptídeo. Em algumas modalidades, os dados são indicativos da identidade do ami- noácido no terminal do polipeptídeo durante o processo de degrada- ção. Em algumas modalidades, os dados são indicativos de um sinal produzido pela ligação de uma ou mais moléculas de reconhecimento de aminoácidos a tipos diferentes de aminoácidos terminais no termi- nal durante o processo de degradação. Em algumas modalidades, os dados são indicativos de um sinal luminescente gerado durante o pro- cesso de degradação. Em algumas modalidades, os dados são indica- tivos de um sinal elétrico gerado durante o processo de degradação.
[00296] Em seguida, o processo 1300 prossegue com 1304, em que os dados são analisados para determinar porções dos dados que correspondem a aminoácidos que são expostos sequencialmente em um terminal do polipeptídeo durante o processo de degradação, tal como com a técnica de identificação de eventos de associação 1104 e técnica de identificação de aminoácidos 1106. Em algumas modalida- des, a análise dos dados compreende ainda detectar uma série de eventos de clivagem e determinar as porções dos dados entre eventos de clivagem sucessivos, tal como com a técnica de identificação de eventos de associação 1104.
[00297] Em algumas modalidades, a análise dos dados compreen- de ainda determinar um tipo de aminoácido para cada uma das por- ções individuais, tal como com a técnica de identificação de aminoáci- dos 1106. Em algumas modalidades, cada uma das porções individu- ais compreende um padrão de pulso, e a análise dos dados compre- ende ainda determinar um tipo de aminoácido para uma ou mais das porções tendo por base o seu respectivo padrão de pulso. Em algu- mas modalidades, a determinação do tipo de aminoácido compreende ainda identificar uma quantidade de tempo em uma porção quando os dados estão acima de um valor limiar e comparar a quantidade de tempo a uma duração de tempo para a porção. Em algumas modali- dades, a determinação do tipo de aminoácido compreende ainda iden- tificar pelo menos uma duração do pulso para cada uma de uma ou mais porções. Em algumas modalidades, a determinação do tipo de aminoácido compreende ainda identificar pelo menos uma duração entre pulsos para cada uma de uma ou mais porções.
[00298] Em seguida, o processo 1300 prossegue com 1306, em que é apresentada, a partir dos dados, uma sequência de aminoácidos representativa do polipeptídeo, como por uma interface do usuário. Em algumas modalidades, a sequência de aminoácidos inclui uma série de aminoácidos que correspondem às porções.
[00299] “Uma implementação ilustrativa de um sistema de computa- dor 1400 que pode ser utilizado em conexão com qualquer uma das modalidades da tecnologia aqui descrita é mostrado na Figura 14. O sistema de computador 1400 inclui um ou mais processadores 1410 e um ou mais artigos manufaturados que compreendem meio de arma- zenamento legível por computador não transitório (por exemplo, me- mória 1420 e um ou mais meios de armazenamento não voláteis 1430). O processador 1410 pode controlar a redação dos dados e a leitura dos dados a partir da memória 1420 e do dispositivo de arma- zenamento não volátil 1430 de qualquer maneira adequada, uma vez que os aspectos da tecnologia aqui descrita não estão limitados em relação a isso. Para realizar qualquer uma das funcionalidades aqui descrita, o processador 1410 pode executar uma ou mais instruções executáveis por processador, armazenadas em um ou meios de arma- zenamento legível por computador não transitório (por exemplo, a memória 1420), que pode servir como meio de armazenamento legível por computador não transitório com instruções armazenadas executá-
veis por processador para execução pelo processador 1410.
[00300] O dispositivo de computação 1400 pode também incluir uma interface para a rede de entrada/saída (1/O) interface 1440 atra- vés da qual o dispositivo de computação pode comunicar-se com ou- tros dispositivos de computação (por exemplo, em uma rede), e pode também incluir uma ou mais interfaces 1/O do usuário 1450, através da qual o dispositivo de computação pode fornecer saídas para e receber entradas de um usuário. As interfaces 1I/O do usuário podem incluir dispositivos como um teclado, um mouse, um microfone, um dispositi- vo de exibição (por exemplo, um monitor ou tela sensível ao toque), autofalantes, uma câmara e/ou vários outros tipos de dispositivos 1/O.
[00301] As modalidades descritas acima podem ser implementadas em qualquer uma de inúmeras maneiras. Por exemplo, as modalida- des podem ser implementadas com o uso de hardware, software ou uma combinação dos mesmos. Quando implementadas em software, o código do software pode ser executado em qualquer processador ade- quado (por exemplo, um microprocessador) ou coleção de processa- dores, que fornecidos em um único dispositivo de computação ou dis- tribuídos entre múltiplos dispositivo de computação. Deve-se reconhe- cer que qualquer componente ou coleção de componentes que execu- tam as funções descritas acima podem ser genericamente considera- dos como um ou mais controladores que controlam as funções discuti- das acima. Um ou mais controladores podem ser implementados de inúmeras maneiras, tal como com hardware dedicado ou com hardwa- re de uso geral (por exemplo, um ou mais processadores) que é pro- gramado com o uso de microcódigo ou software para executar as fun- ções enumeradas acima.
[00302] A esse respeito, deve-se reconhecer que uma implementa- ção das modalidades aqui descritas compreende pelo menos um meio de armazenamento legível por computador (por exemplo, RAM, ROM,
EEPROM, memória flash ou outra tecnologia de memória, CD-ROM, discos digitais versáteis (DVD) ou outro armazenamento em disco óp- tico, cassetes magnéticos, fita magnética, armazenamento em disco magnético ou outros dispositivos de armazenamento magnético, ou outro meio de armazenamento legível por computador não transitório tangível) codificado com um programa de computador (ou seja, uma pluralidade de instruções executáveis) que, quando executado em um ou mais processadores, executa as funções discutidas acima de uma ou mais modalidades. O meio legível por computador pode ser trans- portável, de modo que o programa armazenado no mesmo pode ser carregado em qualquer dispositivo de computação para implementar aspectos das técnicas aqui discutidas. Além disso, deve-se reconhecer que a referência a um programa de computador que, quando executa- do, executa qualquer uma das funções discutidas acima, não se limita a um programa de aplicativo executado em um computador hospedei- ro. Em vez disso, os termos programa de computador e software são usados aqui em sentido genérico para referir-se a qualquer tipo de có- digo de computador (por exemplo, software de aplicativo, firmware, microcódigo ou qualquer outra forma de instrução para computador) que possa ser empregado para programação de um ou mais proces- sadores na implementação de aspectos das técnicas aqui discutidas. Exemplos Exemplo 1. Degradação de Edman por clivagem química a o n sm o nos MESA EDS” MALA A o A AR Etapa 1 o a & o Oligopeptídeo anexado à superfície s Ácido ou base m h Cas” MA E n-1 oligopeptídeo Tio-hidantoina
[00303] Provê-se um oligopeptídeo anexado à superfície com entre aproximadamente 3 e 30 aminoácidos (n=3-30), em que os resíduos de aminoácidos R:-R3 podem ser qualquer um dos 20 aminoácidos comuns ou um aminoácido endogenamente modificado (por exemplo, modificado por uma modificação pós-traducional). Na reação do N- terminal com isotiocianato, Etapa 1, um isotiocianato X-NCS é adicio- nado a um recipiente contendo o oligopeptídeo anexado à superfície, onde X é fenila (Ph), 4-NO>2Ph, 4-SO;zPh, naptila, benzila, alguila ou um derivado dos mesmos. A Etapa 1 é realizada sob as Condições a se- guir para fornecer o aminoácido N-terminal derivado com X-NCS: tam- pão aquoso pH 4-10, os cossolventes alcoólicos MeOH ou EtOH ou IPA, trialquilaminas em solventes orgânicos (DCM, THF, MeCN, DMF e semelhantes), 20 ºC a 50 ºC. Na reação de clivagem de tiouréia, Etapa 2, um Ácido ou uma Base é adicionado a um recipiente conten- do o aminoácido N-terminal derivado com X-NCS, em que o Ácido é ácido acético, ácido fórmico, ácido tricloroacético, ácido trifluoroacéti- co, ácido fosfórico ou ácido clorídrico, puro ou em soluções aquosas, ou em que a Base é uma trialquilamina ou uma trialquilamina tampo- nada (por exemplo, EtdNH*AcO'). A Etapa 2 é realizada sob as Condi- ções a seguir para fornecer o n-1 oligopeptídeo e o subproduto tio- hidantoína: ácido puro ou com cossolventes aquosos/orgânicos em qualquer proporção, 20 ºC a 50 ºC.
Exemplo 2. Ligantes solubilizantes para imobilização do peptídeo na superfície
[00304] “Buscando melhorar a solubilidade do oligopeptídeo em tampão aquoso, determinou-se que fragmentos do peptídeo poderiam ser conjugados com ligantes oligonucleotídicos para melhorar a solubi- lidade aquosa e prover uma porção funcional para imobilização na su- perfície de peptídeos no nível de molécula única. Diferentes conjuga- dos peptídeo-ligante foram sintetizados, com exemplos da estrutura representados na Figura 15A para um conjugado peptídeo-DNA e um conjugado peptídeo-PEG. Foi observado que a conjugação com o |i- gante melhora em grande medida a solubilidade do peptídeo em solu- ção aquosa para cada um dos diferentes conjugados peptídeo-ligante avaliados.
[00305] Os conjugados peptídeo-ligante foram avaliados para cliva- gem do aminoácido nos N-terminais dos peptídeos por N-terminal aminopeptidases (Tabela 6, abaixo). Tabela 6. Clivagem do aminoácido terminal dos conjugados peptídeo- ligante [nen fam [ro | am uma finca sore ltem |Peptídeo NO. Classe Ligante | APN de rato | por PIP E sto | om | ne | | 2 RS | 77 postro sigo | Rs [E msn | 7 | mostro famenes| e [E fes | 7 esmo [re | sm [5 povoam | 75 | megeivo | oo | sm [o mea | 75 | soma | oe | sm | TRAS | 75 mass | ao | sm [E rena | 75 soma | am | am | | E proFoREsSa) | 76 reger | ato | sm [o femea | 7 | estro | a | as | [eso | 7 ese [rr sm)
[00306] Os conjugados peptídeo-ligante mostrados na Tabela 6 fo- ram incubados com prolina iminopeptidase ("PIP") ou aminopeptidase N de rato ("APN de rato"), e a clivagem do peptídeo foi monitorada por LCMS. Um exemplo de LCMS demonstrando a clivagem do Item 5 da Tabela 6 é mostrado na Figura 15B. Todas as outras reações de cliva- gem foram medidas de maneira semelhante. Como mostrado na Tabe- la 6, enquanto conjugados peptídeo com carga positiva-DNA (ligantes "oligo" e "oligo-PEG") não foram clivados elas aminopeptidases testa- das, todas as outras classes de conjugados (com carga negativa, aro- mático, hidrofóbico) com ligantes oligonucleotídeos de DNA foram cli-
vados. Em comparação, os conjugados peptídeo com carga positiva- PEG demonstraram ser clivados por pelo menos uma das aminopepti- dases.
[00307] Como uso de conjugados peptídeo-ligante marcados, de- monstrou-se que peptídeos de diferentes composições podiam ser imobilizados a superfícies de poços de amostra individuais para análi- se da molécula única. Para esses experimentos, o ligante de DNA foi marcado com um corante (por exemplo, como representado na Figura 15A para o conjugado peptídeo-DNA), e o carregamento de diferentes conjugados peptídeo-DNA em poços de amostra individuais foi medido pela fluorescência do corante. Um exemplo de carregamento do expe- rimento é mostrado na Figura 15C. Medindo-se a emissão de fluores- cência de um conjugado peptídeo-DNA marcado (50 pM), determinou- se que pelo menos 18% dos poços de amostra em um chip foram car- regados com ocupação única por poço de amostra com um conjugado imobilizado na superfície. Esses experimentos demonstraram que con- jugados peptídeo-ligante exibem solubilidade aquosa melhorada em comparação ao peptídeo correspondente não conjugado, que ligantes conjugados não impedem a clivagem do aminoácido terminal dos pep- tídeos por aminopeptidases diferentes e que conjugados peptídeo- ligante de composições diferentes podem ser imobilizados em superfí- cies do chip no nível de molécula única. Exemplo 3. Clivagem por exopeptidase de substratos polipeptídicos
[00308] As capacidades para clivagem de várias aminopeptidases foram testadas. As condições e os resultados para um conjunto de ex- perimentos com ensaio de clivagem são mostrados na Tabela 7, inclu- indo concentração de substrato peptídico, concentração da enzima, condições do tampão, temperatura e tempo de incubação. A clivagem de substratos dos peptídeos pelas enzimas indicadas foi avaliada por Cromatografia Líquida de Alta Eficiência (HPLC). O valor de "conv. en-
saio de HPLC" na Tabela 7 indica a porcentagem do substrato peptídi- co que foi convertido em produto de clivagem.
Para determinar o valor de "conv. ensaio de HPLC", foram preparadas duas soluções contendo a mesma concentração inicial do peptídeo.
Uma solução foi submetida à digestão enzimática, enquanto a outra solução não continha qual- quer enzima, mas foi diluída com uma quantidade equivalente de tam- pão usado para armazenar a enzima.
As reações foram interrompidas no momento indicado.
A quantidade de reagente convertido em produ- to foi determinada dividindo a área do pico obtido por HPLC do materi- al de partida restante após a digestão enzimática pela área de pico da solução controle de peptídeo não digerido e, então, multiplicando essa razão por 100. Na Tabela 7, "NH2" indica um grupo amina, "yPIP" refe- re-se à prolina iminopeptidase de Y. pestis, "NPEPPS" refere-se à aminopeptidase sensível à puromicina, "VPr" refere-se à aminopepti- dase de Vibrio proteolyticus e "EDAPN" refere-se à M1 aminopeptida- se de L. pneumophila.
a a 2 IL IL EF) ZE Zs | & E: so so e x = x = a = o =Ra"oa : Ea Es < a o à o S o o = | E - a E E ae o e P £s 3 PER e e = = e > Io Ex Ex o o so E ge Oo Oo o o o 8 2º 2? 2? o om = 2 — o = = = os alo 8 o o os os o E E E| 6 o S&S S&S & o & o & o o o o E o e o É o o o o NE Fr E o o o o o o .—- o .—- 6 .—- == == == == == =E
E E E E E E E E E E E o o N N o 8 8e [je e ne he | 8 E 9 le 9 le SE oiE o à - 8 & | essi em É gw] em eskhr = 2 FINE INE Cj jo E cor cw NA sa "Sig" Ei" | 2" | E 2 le Esos lesse sS E =sSEFZ<== S e EisHidRiscisiidii 2 Se 23 588 3BÍSE = o - - E o Palo ares cesil esa o 8. 8. 8. |. gl. é e s SgisfssEssEgsEssES a & DS 2 8 > 2/8 SS | 8 SÍ 8 SNS on à 2rÉ 0 2Fr 2 23rHr]/ 0 2HÉÂ 0 2É 0 23 N o x = = $ | >D a a DE I I Ss s [2 a > z XT I 2|/& CT CT ê É 2 = = = = = so Zz o o ôõo Sie 3 s o Ss 2 o Zz RR = w jo“ p= 27 CON 6 = = LS 1 E EO nao 3 o x Oo > O Ê 8 8 DZ a Zé =. 2 Z 22 2 3 Ee e ge soa Ea | o &g dg Eg kg Egg É "O es) o "| à à À E 2 E os jo go Ee Eo |à o o f 2 o o o O] E e a a a 2 & N No jo o o o o uu ES JS = = = = & Su Zz o O|
GS 2 a a a a 2 | I I I 3 ég lésg Fo És O |O co Oo co Oo co Oo co tt ÉS 6 &õ é õ >= = >= = >= = >= = = o = o = o = o Egg E & E 2 ER 2 ES É x 2º je Poe ae o Ss PER ES e = = ES > Io o Es o o o 8 o? 2? r çs R 2? o cs 85 e E 7 So es õ e E E | E & E & Sl 6 & Oo & o F e e e e eêBgige so 8 =/8T= 8 = s- DS 2 2 00 : Ds : Ds == 243 =23EH==Zz ES == EE |EÉQÇS= |IETXT/|EE |EX EE To — “TE rêto go Mo e ole ZE SE ET o dO a E 2 SE podas E E ow EE Enc o NE rlNo dg EQ NE rw EE IL 6 5 E 6 Raso g| 2/5" E/5 SO 6 FE SB cs Sl o SS EE LL ZY Ss Ee DE Ss É = 233] o<ç; gg ErFrIiIZ= 3X Fr ==2.2= à < N - Ne [E Sô E E S|E XNOS SIE Z|E E S| É = E ES DX bx 5 bx 5 rog=- 23 Er oS|- E o 3 o "Ymaãio 53 SS o!” or" mqio o "TN o 18 = e E 8N|8 DSO a o Y Ss çBEÉEÉS os Es FS Bs5 zo 7 7 8 / a O à O 2 Oo 2 oO & SI 8223 ER o SS 82 SÊ à 2 Hr LOSS SL NL 2H LN on 2Er 3 8 U ZE | & ER | 2 |Z Z Z S Z ês Es Es 2 s Es g ES 2" FS sr & 2 3 Do > O > O W3 oo 2 OZ 2 2 z z 22 3 E o É o É o ao “ÉEJ Es s E7 Éfsoko E ES = ES == 3 ES o 4 o 4 o o 4 Sou HH ue ue = ue x mnldlmeo a o o ie o = = o o x x s D v E T = Ejs = a E é É a 3 Z 8 T NA = z "o a Ss 8 8 8 | Z > SS 2 Ss & O O = 2 < e e ZX o a = a a QN a a 2 | TI TI Ss XI TI TI E 3 6 EcESESÉSÇESESICSS
SEE S STE SS FS 2 jo *S 2 E A 2 é PP Z SZ Té 2 ro 9 S/S 6 S/2 S/S jo 5265 x = 3 2X 2> 2/54 2/4 2/4 2/2 Z a 9º x or oroçgorerçro so uu ur — < Cú o $ oro o o É o o É Oo 2º m u wú E À É À àú É À u uu o a a a o a 2 o eL < 2> 2ôQmn Cm La je CE L o Ss PER = = = = = = = = = > II |O Ss o o o o o o & Ss 8 ee o = = = = E = o E o o so do Es o fEjo Elio Elio Elio Elio Elio Elio Elio £ E EP 9 5/9 5/9 5/9 5/9 5/9 5/2 5/9 5/9 o dj jo E o flo E o ES jo ES o ES o E o ES jo ES jo & Fr E o RE e o e RE e RE = R é é o | o — DOS pos ow or owçr-ç oswxg os os ox o 2 EslêSESE SE SE SE SE SES Moo Tr jr jr jr | O 8 2/8 2 8 eg o ao” = E Z o =| 8 Z 9 =| pp Z ZE Z o à |EÉ o w|E E E E E E E EE E E E É E É E| É E 8 & E rj eg eg ee eagle ag lN eos ag 6 Ss E 6 SN 6 Nó No NS NS NS NS SS Ss S â E 2 2 2 E ele dels E e EF Err rEereEzeresrsersEr=r S E ESSE ZE Z|E<Z| E ZE | <= É É s/ É = º S|- E|- É|- E|- El El É - É - E É ro - - - - - ” = = = og = Ros ge gn om oe o on 9 | 9 3 ss gl NE TE Ta NB N8 IB IE I8E SI E SS SS SE SS SS SE SE S|ES & > 2 8 2/8 2/8 Lig 2 8 2/8 Ci Rig 2/8 2 à 2 El NI NL NL NL NI NL NL NL N 8
O 8 |& s F F s Ss Ss s a sa F = >X >X IL IL F XT IL IL XT 2 8 E E Z Z Z Cs É, É ss SSB ZE SBEZEÉÇEÇESE = 2 RP 6 Sb Ré o 5/20 0 5 8É = ã So SMS NSESnNSXMSmXSES 8 |s = 2 22222 02 7222222 é 3 É, ejâexerFeroegegegçe o 2E |EoEkFLoXok ok cÉ co oX 0 Éo So a wu un we EE wu | Ego dm |h2ejauágaor om air e ug og 3 E 8 8 [B o a o e E E dá E é É |8 |8 8 |8g Ss >= a << a [E [E Zz Zz Zz Zz uu o 3 o o o & & & & = O = = = < < < < o o o o Fr Fr r r a a a qa 2 I I |X - ZsBESEZSEÇSE 8 8 Ê Ê Ê Z 8 2 2 2 2 $S/13 7/2 9/2 Pig 3 3 E 5 o 6 S/6 S5| 5 Se 8 $ > Z > Z3/> Z23/> Z2/o [= [= sí 2íBESEÍS RR lg a o =ig = 2X 2/2 2 2 foÉékoroko|É |É | aunX ug nu E Ds sã sã < 2e O> Cr Lie E E o Ss 2 SE de e e e e Rx x > 3 |O o o Ss o Ss Ss = 2? çs çs E = = = R o o s 25 E 5 so Elo so so so so se E EP 5/9 5/9 5/9 5/2 5/9 5/9 5/2 o 0 jo Tio ES o E o Sjo ES o ES o ES jo & E E | Jó vo — 6 — 6 — 6 — é = é — é — pos os pos os ow os o isiskskfsksdsdEs - - IT - - - - - NON OW ZgF | N QN ON ON ON O Soco FT o Zoo FT o FT o Fo Fo 3 É E |É 2 É ZÉ 2 É E É É 2 É É 8 So EolFçio Eos eo| E o o Nig Nig No YNig Nig Nig Njio N 3 E E 2 E E E E E Ee Erezerieze EE Br erizrizeriar S E Z/IEZ|E0/E Z|EZ| E ZE <= E< Sriricaciririci-z o 1 joio o mjo | o | gs ow 2 IB Ie IE Ne IE IB I8S 3 S/S 0 eESR? à NL NI NO NL NO NO NO N 2 8 B |Ss FS FS a q s s s 2 > E E E I Zz Zz Zz é é |E Ex-|2 |Z E É É e BoBSTSPSEFEqsTBT 2920/28 é 62 lb LP 6 jo PEQ T| ER E 3 Mor orororoaçsãõãsiãhs 8 Téer>Z 22 22/2222] 2 9 2 2 goeRgegeroeroejçeçgeço E oo Ko ok olÉ olé al&E o mm | WU jd WU | | WU j&g ww uu & 0/2 OE o ovo Eos oro
S É |& & & & & & & & a > > > > > > > > wu o o o Ss Ss Ss Ss =. a =. =. a =. 3 Es Z Es Es ts 3 jo E o o E o e me? 8 ue ue ue & Zz à à 2 à zÕõ sô x õ x 0/6 O zÕõ TZ = z=Z TéexXZ zZ É o zo Ke [jÉoairo Ée o ro o go o uu nn 4 uu ww uu o e o e o e o Qh e o e o s 2 PER x = x x x >= 3 |O o Ss o o o Ss ev 2 F = 2º = o ; elx E x E x x E E a: 2 2| O o oO o oO o O o/O 6 oO o E sl É & 2 & 2 s 2 8 o 2 o o o o o o S nl&k so FE OS o Ss o Ss O SP S os = 2 00 DO DO o Ds Ds 23818 EE HE |? HZ RR 2 : 2 n E TEr rã=2 rã2 s ro “eo FEZ a o E w E 7 vs E E E E O E E 8 E 8 = E 2 E o o Soo Ns Ns = NO < s< é SSIS o 8 o 8 Ss 5 e so S& s & o - à - à Pl - õB = 2 E =| =| = 2 =2 == o 4 DA E) E E O N E TI E à o/E == 8 & OS8s5 : : o = o TSPSXS -= -= o El E 2 E gls gr gr- 8888 88 3 EEE 3. Z=BS .=/$Xx/ 5 69 ol ÇÉWo = E E OO - - 2 E = o a 7 O a O E O E/S 2/2 de led” o Co TT rio o çoio O o2/6 =| x | o I à m So + OS oOS| jo il > sh 236 ' o o 8 | E, E â wu Ss a SE a a = = Es = > Es > & z Z ds é | á 8 FR é, BEBssbp ÉéE- |o o 2 Z 3 os o SR os é 2 O v = ZN oO TO ZN oO E ES3 6 Só Eros E Eó | 3 ES Zz a2Z2z E = Z|t a2Z2z & ENT e É É O EE çeº Ee lBFg$gebç ção lb. e E o 2º o é Zcoile sao 8 E Sao su ão SS &u| Ss Stu gs | = o 2 op E JTo/lE 2; Es <omne ue < 22 < nr e < m o E | [Ã [Ã [Ã à E E E Wu
Es a Es a 2 | I I I 3 éÉg ÉéÉg lÉsbs s e RS 2 2 5/12 o 2 j66õ sô 5 SI16 OS õ x = x = 22X” Z v É a º a 2º & 2x oe 2º Er o Er o o o o 2 um 2 um = E su o e o e > Cx e ae o q SEX Ss 2 e x Ss x x = IIS o Ss Es) o o o s Bor 2 E RN RR Ss 2 í o sa 85 E EE hs ES E5 E st E se se Oo o Oo o O S/0O 9/0 o Oo o Os Os E E o E ST E & El E|jo E ST E & o & o SS SO ww Ns o No = ot Wo nm E nm E r Ele 'S os Ss Ss Ss E ss o —- o —- == == = = =eºo =oºo == =oºo 3 E 3 E Cc sa 8 à 3 E a -e ne | | |BE PE |-e | SE Ss 3 3 Ss os A Aa ow S = E 2 A = 2 5a EZX |E |é |EE |5E |52 |5E $ | se |5So6 |s E [5g |5 |O |8& & 8 22 o do 2 28 se Bj ES El os E EE BE 2 |2ÉE S ES E E E = : E = E o E er E n = = - E |-E ||) |) EE BE |-E |-Ê o o o om om o o o. o. om o.
ZoocE oo asas s ES Bosco For orz xx BR |[8ST|8?R à 2 aj 2 0a S&A SN [E à 2 7 N & & 8 Z Z E Ja FS FS FS E E a a 3 E E || E | éáL)ôéLE o =X Zz PP = 8 E SÊ FREE > Ss > SE É = o ôõo o ôõo o o 2o 2o o co 2 ZN Z Nr 5 2/É Oz Trz Frigo s o 3 Ego Eóo rmMorcíEEoREEONMSO Xo 2 jaz aZz 22228 2 8 22 é FE 3 q a ES Eos x E x 2 |á 9 É ars sº 2º o 2º o o o E o E o o o EN EN à wu ug uú E wu à 2% mà do jpeo Fere go eo>-e Re o s 8 x e S Ss o F 2 õ õ | (é TZ o = ú Ss E & + | lg & NE |)s = o Ss Q 2 > S o fm d g . Ê = k= = a z < S Fr & a > x &
g o 2 -.
B e Ss r Z
Ê o o ê o & Tx = e = = = = = = = = E |ô 3 És Ss Ss 8 = Ss Ss 8 8 o? , = ÕÔ À ÕÔ o ÕÔ À o 3 o sos 2/5 Elio Elio Elio Elio Elo E o E o 8 jo E 5 E E EP 5/9 5/9? 5/9 5/2 5/9 5/9 5/9 5/9 5/25 o ON EN SEN EN SN SEN ECN EN SN cDN E E E Jô e jo e fes e des e des e de e de e do = o = o — os oww or owxg ow os og org ox o Es ESESESESESESESESES - E)- Er Er E) E) E) Er Er Er E o SOS 0 ST 0 Ss 0 Ss 0 Ss 0 Ss 0 Sl 0sS0sS E Z|E ZTE ZE TE ZTE TE ZE TE ZE o N N N N N N N N N N o Ss | 8 18 OS 18181818 b|| 98 O o NO NO NO NO NO NO NO NO NON 9 oe | o jon| o ge o jon 9 | o 2 IB IN e Ie Ne Ne Nie Sie Sie Sie SS & 2 a 2/8 ig 2/8 2/8 Ci ig 2 8 2/8 2 à NI NI NL NL NÍIOA NL NL NA NI N o 8 BD la a a a a a a a s F 2 | I I I I F F F XT XT 2 já Z Z Z Z Z Z Z TS oTES
SCE LE LCE CZE LZEAE ZE LZEAE SR co co o o o JO co co Z ÓOZoO 2 é Sé o é O é PÉ OZ 226 TST E rmorororororororonmesãms 2 | 2/3 2/22/22 22/42/42 42/2222 2 LototototolcroíroXo o o 5 SoEmSESESESESESESESES dolor ot o & ok ok o E o|& olE o uu uu uu uu WI | WWW uw uu uu 0 /É o or os E o E ek E 5 o S õ õ =| õ õ
RF RF RF ER o x & o x) & o x) & 5 E E E E Es E E | É o vv õ o DD o o DD o o fe. PRP ie) fe. PRP o fe. PRP o fe. RF rr rr a a a < < <
Ss o " E | 8 eg js ã Ss TD 6 2 | & E = S 2 E Ss E 2 2 Ss Ss
E E o Ss Ee de de e e e eo e e x = IS o Ss o o Ss o o o o o 2? E 2? 2? o 2? 2? 2? 2? o sa 85 s5 E5 Es E 5 Elo So E5 El5 E 8 E E | Ss 2| 2| 25 2i 2 Ss Li S2| & BR Êêis sw SE S|5 85 Sl5 85 Sit 8/5 Sis 8 = o o o o o o o o o os Dow or or os owrg or oswxs o Es EHsESESESFESESESES
I I I I I I I I I ra 2/2 ag Tg or or om or o 7 o sob E o SOS 0 S0sS0sS EZT|lES/E TF ET RE ET E RZTIE TZ E ZE & | Sollae Se Ne Sae lSae Ses s|S 8 6 N 6 EIS NS RS No NR 6 NR) 6 R6 No AQ <= 2 A 1 ol, A | 2, 22 çY LA ç ey eh? 8 ES ES ZAEIA IE SE SE AE AE 8 Õ Z=z |) =|Ez=|Ez=s|Ezs|tz|Ez|Ez=|/D = 5 z TT E|r Elm E jr E jr E |" E 7 E| 7 E| 7 E| 7 E 8 x 8 SP /8X/8 TETE XNIB NIE TERES 2 3 E ss 8 38 38 38 38 3/8 38 38% & 2 a S/8 2/8 2/8 2/8 8 Cig 2 8 2/8 2 à NL 2/0 NL NL NL NL NL NL NL N o 8 3 |S a QN QN FS a a = | I Ss Ss Ss E E I I I o E S|á Zz Zz Zz & & Z Z sz à ES CSECSECZSE BE BEXSBFSECZSSFSSTSE- Zoo o |O o o o o co oO o 2 já Tá 3/2 o 2 5/23 5 SS É SET o & | - ? ? 2 jo = jo & ? — ? 3 24omo o o o o or omrmrormro x 2 2/2 2/5 2/52/52 22/22/92 2/22/22 ã Zermermepreroepçaepçgeikegeçe & ot ore ore olE a É co É a lE a X oh o w | ww w|& w|& ww ur uu wu & wu uu $ O) OE OE OE O É OE 02 0É oo u - Fr Fr a E E E E E. E |& + o 5 3 8 o 8/3 a a o o E |< 3 ER & 28/88 4 4 4 4 NR & Eis & Dj Djs - - a a õú ls 7 > |O nm àim&|E >= >= >= >= r q Ss Ss Ss T oO 2 Õ Õ Õ
Õ k 2 a £s 3 TR Ex ES = = = = ES ES : 2 2 = z Tg 8 |8 2 | |g | |8 3 6 2|A A = A = = o a 85 E5 Es 8 = Es es os es E x E E E P SP sig 5 SP sil9p 5| 9 5/9 5/9 8 FA 6 SN ibn i6N io n 5 o E o E o Et & 5 res Ss SS S S SP = o jo = lo 8 ss = o = ox o = o oZ=oxgoxFzorZm =E S o |É o0|É S o |$ o É 0|É oÉ 3a º* -Er ab NEWER ERNENRZ | - r r r n n O o EZX E Z| 2 = EZ FEZ 2 Z|2Z| ES £o à RE ER EE E x ER ER ER EN" RO É IS OS oleo & 1 | S o soe pç o So O oO NO NO N oO NO NO N| O N a a 3 E eExelgE = 25 Es 25 258 = 8 ES ESSES EN ESTES SS a Sô = = = = = = z8= 8= 8 gh gSBSES RS 9 gº 2 REI EX E XI e IT EXT STE 2 = SE Ses = SE Ss SE SE = & 2 8 RC 8 & 2 8 C 8 C/8 LR 8 Do lF DO O NL N| N à NL NI NL NO 2 w|A 2x < a & I a Zz I e 2 o o = ê s é 3 à Ss SN s ss Ss o = IT I I o E E Z 2 |Z E | 2 2E- Xs 8 é Sé RI SE ZPE ZE ZE SER 2% o 3/23 e 2 3 2 8Z$ Ze he zo ic) 3 63 Se SPP 3SEPESEZEB> a = o o o o o o o o o 2 52/5232 2/522/22/)2252 02 é & Es erRcsoTegçgaçgegego zo o ol Zg OE gg o *E gogo o E gEgsógEgE SEG aES E E orogãaogoro<o Euro ko & * * * S 3 3 Ss & 3 a je << E ES o S o Se Se Sel " 26 ER E pigIRIE BB uu lc > $4 > wo = o = õ5 >- 2 Rr Zz Zz Zz no a a a < < < < a a a a a
IL IL IL IL IL Zz Zz Zz Zz Zz o o o o o Zz Zz Zz Zz Zz 2 2 e 2 2 2 3 2o602s 2865 2865 26s S ze? a a ae & aobs lhkhoó jo |ao Ee Ze Z Ré |Z2 | É = 22º 2º 29º 2º tok o & o & o & o = = = = = a vi 4 a! a! za | > L2re > e > e > e o Ss PER = = = e = = > II |O o 6 6 EX õ o 8 o? 2 6 6 o F o o ; ol E x E = = = = x E Ss S&S 65 o 5 o So S&S os os o es E E | & & 2 & Sl & o & o o 2 6 OX Ns o nm EN E n E nm E mao Fr Es SE os 6 To o —- o —- ss XI XI sol E XI XI XI 2s 56 ESES ES ES 206 TZ Nn = à EN 2 a = == T=2 ow E & E ww lo E SE SE o E Egg |Eg8 |EZTE8 |ES8 |ÉE8 |£ES8 o E o E o & E o No No E o 8 ox oo o Rio 5x 5x o TES = Emo [9 ES Bê 2 jê ú EEE = = ú 6 |g = E es == o = o = E & E | E |N É |) E |E |RE |QE o oe o oe o no E o oe o oe o oe Es [Ex ESB BS Es | Soc Sol FSB SS FSolRSo à 2 ow 2 ow Nj 2 ww 2 sw 20 2 a a a a a
IL IL IL IL IL o Zz Zz Zz Zz Zz g | E é ls & & & 2 JE > Zz Zz Zz Zz Zz 2 jo = o o o o o É Z2 3 sã sã sã sã Fo = = ST oRBPR so seo seo à >> no n NR NR Dn Dn 2 Rê mé? pshs BS BS js E Do Z O AoOoAOoOoO nao nao no 8 RZ az & Zi Z x Z x Z LZ 3 Ee lho |jPojão Io Po o ZzZ ES = = = = = &2 282 EZEZ EPZ E E ze seo & 2h e oe oe e ê ê o *- - | | = - EE k E E E Ei k E > >= E E = Ez |? " e Fz2 a a a a
IL IL Zz Zz o o ó ó 2 Z 2 Es 2 BB Xo = o & êzx kB aõ õ EZX Ré zº 2º [E to 3 o = a! a! > e > e o Ss e e e DER s É É É É
O Fr s 2 o 2 = o ss o] e x 8 = = o = o 3 e Ss S&S 65 o 5 os Ss 8 SE SE E o E SÉ & Oo S ks Ns o n E nm E 5 E 5 E Fr Es SE ss o —- o —- XI XI XI XI XI = E 26 28 26 26 2% 2: T 2 T 2 T 2 T 2 T = + o E o E o E o E SE FE o Es Es Es Es Es És & & N o 3 52 se o 2? o 2? 5 SE & | O ão) ão) ão) - : 5 2 =. =. =. == 2= S : : : : : o = = = = = o = =) PRE Ss E Ss E RN E RE RN E ge ge gº gº gº gº 8 8 8 8 28 = Ss 2 O zo zo zo zo sz os os o [=] o seo 50/88 Do 6 DoI/E > dEeSEESAECS RE EZOEES| Es a a Ss Ss s I I Z Zz Z Z Z a 8 E 2 2 32 32 Zz E Z ã ã ã 6 & ER FR = E = Rg = Rg > &s e BS BES ÀS BS BS Sê & o o ax ax BZ Es 3 ES ESQ j|2 ESQ ES ja? â úâ = = = o 3 ES ão To To To £ o ON ER = à = 3 = zo zo zo zo [NS x Oo z Fa E E = 8 = 8 = 8 3 oe oe LS LS LS ze o = ê ê % E o + 4... E É É k z dE k 3 E [| E É | BEZSE so Fr? > 5 [A [A o [A a a a a a
I I I I I Zz Zz Zz Zz Zz Fo Fo Fo Fo Fo Zz Zz Zz Zz Zz 2 2 2 2 2 2 3 ds às às ds às 3 o = o = o = o x o ê 8x BT BT BT |â< o2 2 |j2 2 |ja2 a a a a a z 2 |=9 929 29º |O 2 o 2 o 2 o 2 o 2 o E ces Es Es 24 > e > e > e > e > e & o TER x x x x x = 0 So o o o oO oO E oe = = = 8 2º o o o o o s õ 8 5 õ so dio Ss <£ Ss <£ << E E 6 SS E o E o o Pés s= E =) E =) =)
WE WE WE « « « « « DS < OX OX OX DOE DS Z&8Ç Es IE6 286 ES 32 Os CP CP CP CP 2 o co S&S & E & E & E & E so EZX Egg |Eg Egg |Eg E o BSS lo Bo Eó Bo Sô $ ExS ES 28 ES ES 52 3 28 == == =. =. == E 23 Z = = = = 3 E Ss : : : : O |8 E E 2g= 22 22 22 oo Sor QN E QN E QN E QN E 37 8nE 2/8? 8? 8? |8º? |g2 3 HO=8.. Es Es. Ex E$o 2 WOZ|S = = = EN EIS CR SA ES o RSo/8 ST à À E MIL 2316 236 2362300230 a a a a a a z I I I I I Êê z z z z z o co co co co co es BB Z Z Z Z Z E é E E E " e Es 22 E2 E- Br lS- o às as as as as as 1 ks [53 Es 63 B$5 |ês à Ea ES E Eê ES E
E o ES &º &º &º &º ae E kEZ EZ EZX E$ ER zo zo Ee Ee po e o E | & & & & & FND > > > > > wu
Es Es Es Es Es Es Es
I I I I I I I Zz Zz Zz Zz Zz Zz Zz o o o o o o o Zz Zz Zz Zz Zz Zz Zz e E E, E, É, É, É, É 3 26 2865 286 286 286 26 26 ER xo = 2? = 2? = 2? = 2? = 2? = 2? o2 h.2 h2 jp2 bp h2 ja a a a a a a a zo zo zo zo zo zo zo ão ão ão ão ão ão ão es es EX Es Es ES 2 > e > e > e > e > e > e > e Fã) TER x x x x x x > II |O o o Ss o o o E ge o o 8 o o o 8 o? ? ? ? ? ? o Ss Ss Ss Ss Ss Ss Ss :; E o o o o o o o o oc c c c c c c E E e o o o o o o Pés = = = = = = & & & & & & & x x x x x x x === E2=>Z> [= 88 88 88 88 2 E 2 E 2 E o o o o So o So o ss ss ss wo o wo o wo o wo x e e e £ 2 £ 2 £ 2 £ 2 Só 1Eô |1lSô Ez |5z |8z= | o N N N 8 j6= |62 |52 || E |]=E |EÉ | E 3 232 == == 22? 22? 22 22 6 | E 2 E 2 E Sa Sa 8 8 Oo Bo 2o 2o o o o o 8" 8" 8" Fá SP <oPá<áo| Pág A A A Oo 6 o co Oo N O & 8 2 3 2 3 2 3 SI 8 sSxIsSTI ST 2 Sn o Sn Seis >= 0 5 2 0 | 239 6 3 = o = e = ow = = |= = |= = |= - 2 Ss 2 Ss 2 Ss 2 2 2 2 o os o os o os o =| =| =| = EEFRREIEERCEZREAE TRES tERatáãesat Es Es Es Es Es Es Es
I I I I I I I Zz Zz Zz Zz Zz Zz Zz 8 |& & & & & & & 2 |Z Zz Zz Zz Zz Zz Zz 2 E E E E E E É 8 Ec Br Br Boro Bs Bor E à ER = r = r = r = r = r = o lh nº nº nº nº nº os & BZ = = = = = = 3 ES e? e? e? e 2 e? e 2 3
E E E E E E E oe oe oe oe oe oe oe o É |& & & & & & & E > > > > > > > Wu e Ss e e e e IL >X IL IL IL IL Zz Z Zz Zz Zz Zz E 8 E E E E Zz o Zz Zz Zz Zz e |? - 2 2 2 2 3 RS 2 Ss 2865 2865 2865 2&s a e |? x 2? = 2? = 2? = 2? = 2? = E Bog Bos ho Bo kEo$s |à5 õ oz oz oz oz oz oz 2 Zz zo zo zo zo zo zo FE & o & o & o & o & o & o ao a 4! a 4! a 4! a 4! a 4! a 4! AQ wu > e > e > e > e > e > e ze $ Se e e SE o eo BE E RB E z TR S 3 3 Ss E 3 6 2 = T T a o T o g g g g g g g :; E o o o o o o o o oc c c c cn c c E Ee o o o o o o Pés = = = = = =
WE WE WE WE WE WE WE x x x x x x x o o o o o o o o oo oo DS ao” ao” ao” ao” eo eo az oO 5 oO 5 oO 5 oO ou ou ou ou o É a & o o e o e o e o e o E O E O Fo E 2 E 2 E 2 E 2 n = À = E O 8= Ez |B=z Ez |/º9= |6= [5 8 õ õ õ Ss 8 |e E = E =: =: = E = E = 3 2 3a? 3a? 3a? 22 22 == Ss Ba Bá Bá Ba Ea Bá lo o o o o o o o SS 268262682 2lE 2152128? o 2 2 o Nr jo HS o QrIo Ol E $ DIES DI SS DL S DL O DI dó PDTLOj OS 4 2 = 6/5 > Ss > 60/6398 0 2 0 6 290 83 = - |E - |E - |E - |E - |E - |E o FOZ sz == 8 s=Z s=Z82s=2 ts o o o o o o o CEERFRESE/CE REAR AZ tRatesa É É - - - - 2 io Á Zz Z Zz Z se, E, E E E É FE FZ ESeBL Pe Pe Be [= n n n n NR Dn = e 2S5S|/Z2ShS ES BS BS | ã s2|/ 52E2 |j2 2 j|2 jo? ã 2 o 20/12 o Z o Z o Z o =) = gh*>xgãog Egg gg do a CP3oLóoORO ao ao ao o à o UR ouU|kkEwu su su su à o AaLLicgaAaLkioe oe oe oe Xe o É |& & & & & & & a > > > > > > > Wu o 2 k- 8 o o
2 = = = o = 3 q q q qa - q 3 T T To v | Es T É — — — Ss 7 = lo —
Oo Oo o = O 5 Oo Zz Zz Zz 8 8 Zz|R Zz Lo Lo Lo 6 ” LL ok Lo so so so c o sol. so qa qa qa = S qa = o a à a à a à Ss 3 a Bis a à n & n & n & W o un E | nn &
Fã)
Z x = = e o = e = = IS =) =) Z = =) EN =) 8 2º 2? 2? Õ o 2? | 2? o
& & & & & & 8 o
. ES S õ õ õ õ õ 8 o ale E E <c << << << 2 E E e o o o o o o q Pés = = Ss | E |e E
| | | | | | |
C C C C C C C x == == == = = = == == 3 E 3 E 3 E a | s 3 E 3 E oo oo oo co q lo co oo oo e e e o Cio o e e
>
Ee [ig Eg SE É Egg Ez a E E o E o Fe = E o E o 8 os os ES 6 go o os os & É ss Ê ss Ê ; Sl - CS eLÉús w | = = 5 = = = = <= 7 EZ EZ Hz3HiH EH Hz ó=zÊ 8 o o o 25 Zlo o o É lo s o |js e o .o e erijoçsio So Ss ezbóeçr
82 BT ESB S 8, E [BSE8S2 os os o E Nlo o o os o SO o o o 3 o = o Oo o ss Egg jE<S E o|jE | | <P PS <Í = 200oE 20 E QE LE NE FE QuE Qu 2 = 2 = 2 = Lol o 2 = 2 = o DxIlo Pxrj jo SPxYÔxrio oO O 0 Mm 0 SxI/ 0 ST à 2 0d 2 ai 2 al 2/0 X| Xl 2 030 2309 o 2 = = à o E &E ES VEN LOL SL SELOS VEN E B- an so ETIRBTIRTIRT so 3 h2 a 2 a 2 a 2/5 2h 202 a 2 2 EO Ens Eo ES )EoOlEoO EO ES
29 dg Egg Egdssado E u u u u u u u u ze ze ze 223 2zmexo ze o É |& & & & & & & &
e |)> > > > > > > > fm
2 = = = = = = = 3 z 2 2 2 = 2 N o = = = = = = - E õ õ õ õ õ õ õ Zz Zz Zz Zz Zz Zz Zz To To To To go go go so so so so ço ço ço a 4 nn 4 nn 4 nn 4 n 4 non 4 no 4 ue > e > e > e xo < eo xe Fã) Ejs = x = =x É = z3B BB E E E É o E & & & & & & .; oe fe) fe) fe) fe) õ õ so ao <c <c <c <c << << E E | o o o o o o Bê S S S S Ss Ss & & & & & & == == == 8s == == == 2 E 2 E 2 E So o E E E o o o o 2 o w ro ro ro wo wo oo" Eo o o o E O E O o a = so so so RN RN EX Sí =ilEd E a E EO E o NO 6 = ENO NO NO 8 | 3 o = Ss = - E ojos 2 õ = õ = SS ESEC LoEEFcoS . SH. 202ZLS2Z 7” EÉ2Z E 62 EX 2 E 58T]T o=2 EZZ2EZ=2E 3 gs 8 8538258 ga E ss ESSES O je o eo Po EFE LTP cçreoc|<-oeso CaískasBsasíloow|o ado aSslo aê 8 <a | 8<2Z 82 PE <a 8<ZT| E <É = O gwE Ovi = O ww |E - > O ge OcxoE Orc O SxI| 0 SxI/ 0 Sx1/ = 2 Sxr| | sSx>/ 6 Sx à 2 dj 2 ah 2 all 3 EQ 2 0 2 00 230 o 8
É = o = = = à le x = = = o co f=) 2 LS ET ET ET - = SI & B- o." o." o." — — — = 98 ao ao ao o o o 8 |pZ E o 2 o 2 o É o É o É 3 ho o o o o o o o 2 >= 2 >= 2 >= 2 ge gg = SI = fe fe fe fe ão ro EENo) uu uu uu uu mm | uu vw | zo Es jo [Es po Eó ÉKOo o É |& & & & & & & E > > > > > > > Wu
2 = = = = = = = E ç çS < & s Ss Ss | s Ss ss Ss 2 2 2 E õ õ õ õ õ õ õ Zz Zz Zz Zz Zz Zz Zz go oo ga go ga go go õ õ õ õ õ õ õ TR ES P2 ES ES ES E > e ue oe ue ze oe > Ce Fã) E x É = = = = É 2 SB 3 õ õ 2 8 3 o Ss Ss Ss Ss Ss Ss Ss : o /o o o o o o o o oc c c cn cn c c E E le o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 8 E 8 E 8 E 8 E 8 E 8 E 8 E r Oo r Oo r Oo r Oo r Oo r Oo r Oo o” o” o” o” o” o” o” ER |ER |EQR ER |ER ER |E o NO NO NO NO NO NO NO $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE
S E EF ES Ft SF E CR E SRF CRE CR ÊÉS O o o o o o o o o o o oo o o - Pol Por Por Por? Polr Polr?o o 8 Sh ES bo ES o ES o ES o Edo as 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 9 SxI/ 8 Sx1/ 0 SxI/ 8 Sx1/08SxTI 6 SxTI 6 Smx & 2 E ZELZEZEL2EEAN IEEE EE o 8 Ds ê ã 2 2 2 2 2 2 2 2 o o (e) o (e) g o à o à 9º So o o 9º So o geo o 9º E Oo E o a o ão a Oo a o & o à 2 um o "| & o > UU ou à so ko Ev Ee ÉéEo js BE o É |& & & & & & & a > > > > > > > wu
2 = = = = = = = FP) MN o ba co o N o | 2 e? = = = = = E õ õ õ õ õ õ õ Zz Zz Zz Zz Zz Zz Zz o o o o o go o o o º ge geo geo go F F Go Pa o Pao Po Ko o Lu wWw a 4 non 4 an 4 n |U AQ wu Q Ww ao = e 5 e Fe o L ze =e & 8 a ES = ES = = ES ; ID |O o & o & & o 8 se Ss ? Ss R & 2 o g g g g g g g :; E o o o o o o o o oc c c c cn c c E Ee o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 2 E 2 E 2 E 2 E 2 E 2 E 2 E r Oo r Oo r Oo r Oo r Oo r Oo r Oo e” e” e” e” e” e” e” 56 |15á ES [8 [55 155 155 an $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE õ E EF ES Ft SF E CR E SRF CRE CR ÊÉS o 2a -esresresresr-esioes cad oadoasdeaseoadoadloas
ESSES RC = O ckE OE OE OE QuE QdccoEOwx 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8
D ê rs Ss sw =) So gq Fo o 2 2 2 Z Z = Z Z ic) — — — — — — — ã 2 2 2 2 2 |? 2 2 3 a go So Io 8 o 3 o 8 o Nn Ig = o = o = o = = E = E > o o XE o xo E o à Oo 2 o 2x o E a mà Gu ou õ | zu" =" = 3 oe Fe oL ze = o É |& & & & & & & a > > > > > > > Wu
2 = = = 3 = co o 8 2 2 2 E õ õ õ Zz Zz Zz go go ga Fo fo ço a À o à a < < < < o e oe re Z Zz Zz Z Fã) a e = ER = x = = = = É o|º E) a o o o o o Ss Ss Ss Ss Ss Ss Ss :; E o o o o o o o o oc c c c cn c c E Ee o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 2 E 2 E 2 E 2 E 2 E 2 E 2 E -.o -.o -.o -.o -.o -.o -.o o” o” o” o” o” o” o” ER |ER |EQR ER |ER ER |E
NO IN O NO NO NO NO NO NO $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE õ E EF ES Ft SF E CR E SRF CRE CR ÊÉS O o o o o o o o o o o oo o o - Por”? or ol Por Por? o lr”? o o 8 Sh ES bo ES o ES o ES o Edo as 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8
É ê rs Ss q gs Fo o Ss qN 2 =? =? = = = SI SI ic) — — — — — — — 3 1,3 18 1,3 18 8 18 2 q o q go o o o à o geo So o So o o 9º o 9º o 9º ão a o a o a o ão E Oo E Oo non 4 o | IU mm | uu vw | uu & o jo EO Es [do És EO & u u u u E | & & - - - - E > > > E E E E uu x x x x = = = =
E
B 2 [A < < < < < < < Zz Zz Zz Zz Zz Zz Zz : = ER x x x x = = o s s s s s s s : o /o o o o o o o o oc c c cn cn c c E E o o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 2 E 2 E 2 E 2 E 2 E 2 E 2 E -.eo -.eo -.eo -.eo -.eo -.eo -.eo e” e” e” e” e” e” e” ER |ER |EQR ER |ER ER |E o NO NO NO NO NO NO NO $ |5 = õ = õ = õ = õ = õ = õ = S&S Lets LsrLlscELcsELsTLsE
S E EF ES Ft SF E CR E SRF CRE CR ÊÉS o 2a -esresresresr-esioes cadeado asoadhbhadeoadhas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gE OxoE OdcolE OxoE OexuoE OE Odo 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8 s ê ã 2 2 2 2 2 2 2 2 3 ga Bo jo Bo Boa lo | E F. X F. E X õ E o à o xo à o o) E Oo o E o "| m 4 z UU o | wu E to Ro [io |Éo Po EO |EO o u u u u u u = 2 2 2 2 2 2 wu jo a a a a a a = = = = = = =
Ss 3 2 a o 2 < < < < < < S Zz Zz Zz Zz Zz Zz E £s 3 DE le e e e e e = = 0 a a a a a s É o|º Oo Oo Oo Oo Oo q o 8 8 8 8 8 8 8 :; E o o o o o o o o oc c c c cn c c E Ee o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 8 E 8 E 8 E 8 E 8 E 8 E 8 E -.eo -.eo -.eo -.eo -.eo -.eo -.eo e” e” e” e” e” e” e” ER |ER |EQR ER |ER ER |E n |NO NO NO NO NO NO NO $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE õ E EF ES Ft SF E CR E SRF CRE CR ÊÉS o 2a -esresresresr-esioes cad oadoasdeaseoadoadloas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8
D ê rs sw =) So gq Fo o Ss 2 2 Z Z = Z Z =? ã 2 2 2 2 |? 2 2 2 3 ga |lB8á pá lB8á |á Bá 84 o = ia o = E = XE = É = ia É o ro ro ão 2 o a o ro [NT] Gu ou õ | zu" =" à o 3 oe Fe oL ze = o 2 o u u u u u u = 2 2 2 2 2 2 wu Ii x x x x x x = = = = = = =
Ss 3 9 [A < < Zz Zz & o DE le e e = e R = = 03 Ex Ex o Ex &s o É oo o o o o &s o o s s s s s s s : o /o o o o o o o o oc c cn cn cn c c E E o o o o o o o Pés = = = = = = & & & & & & & == > EHEZ EHZ HZ [HZ Hz 2 E 2 E 2 E 2 E 2 E 2 E 2 E r Oo r Oo r Oo r Oo r Oo r Oo r Oo e” e” e” e” e” e” e” EX EQ |ER EQ ER ER ER n |NO NO NO NO NO NO NO $ |5 = õ = õ = õ = õ = õ = õ = S&S Lets LsrLlscELcsELsTLsE s E EF ES Ft SF E CR E SRF CRE CR ÊÉS o 2a -esresresresr-esioes cadeado asoadhbhadeoadhas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gE OxoE OdcolE OxoE OexuoE OE Odo
SST STE STITA ST STE STE ST à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8 $ ê E) 3 £ & & â & S = = TZ TZ Z Z Z 3 1,2 1,8 1,2 1,8 48 1,8 18 2 3 8a Bo Bo Ro Bo o go uu uu u L uu uu uu a o a o a o ão ro ro ro o | IU mm | uu vw | uu nn 4 os Ee j|Es jo És EO |O e RR 3 E |& a nm m m m À NS jo F E E E E E ã & 2 = = = = = a a . .
Ss 3 2 a Fã) e e e = ER x x - ê ê ê ol" º S S = = = o 8 8 8 8 8 8 8 :; E o o o o o o o o oc c c c cn c c E E le o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 2 E 2 E 2 E 2 E 2 E 2 E 2 E r Oo r Oo r Oo r Oo r Oo r Oo r Oo e” e” e” e” e” e” e” ER |ER |EQR ER |ER ER |E n |NO NO NO NO NO NO No $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE
S E EF ES Ft SF E CR E SRF CRE CR ÊÉS o 2a -esresresresr-esioes cadeado asoadhbhadeoadhas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8 3 ê rs Fo o Ss q Ss Ss sw 9 SI S 2 2 2 2 2 ã 2 2 2 2 2 2 2 2 3 Be Bea Ba Ba pa 8 lo E o ro o a o ro o o E o o "| m 4 z UU o | Wu E a w ao ue jo Bo Po ES do o E | mM mM mM mM mM mM Fi E E E E E E
S E E E E E E E
Ss 3 2 a Fã) o e = e e = DS Ss E x =x =x s É oe o o + o Oo 8 o 8 8 8 8 8 8 8 :; E o o o o o o o o oc c c c cn c c E Ee o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 2 E 2 E 2 E 2 E 2 E 2 E 2 E r Oo r Oo r Oo r Oo r Oo r Oo r Oo o” o” o” o” o” o” o” ER |ER |EQR ER |ER ER |E n |NO NO NO NO NO NO NO $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE 2 = = = = = = = 6 |E Eg|E EgIE Egg E EgIE Eg|E ESIE E g o Po Po Po Po Po Po Po cadeado asoadhbhadeoadhas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 9 SxI/ 8 Sx1/ 0 SxI/ 8 Sx1/08SxTI 6 SxTI 6 Smx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8
D ê rs =) So gq Fo o Ss q 2 Z Z = Z Z =? =? ã 2 2 2 |? 2 2 2 2 32 86 ko So já BE Sá 8 na jo = o = = LE = E = o = = xo E o ho 2 o a o xo a Oo Gu ou õ | E = UU" E o | oe [2 oL zoo = o 2 oe E — — — — — — = ||) WU WU WU WU WU WU Fi E E E E E E & e E E E E E E
Ss
B 2 [A Fã) a x ES ES ES ES = = ;: E o o o o & & Es 2 2 2 2 8 3 o s s s s s s s : o /o o o o o o o o oc c c cn cn c c E Elo o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 8 E 8 E 8 E 8 E 8 E 8 E 8 E -.eo -.eo -.eo -.eo -.eo -.eo -.eo e” e” e” e” e” e” e” ER |ER |EQR ER |ER ER |E n |NO NO NO NO NO NO NO $ |5 = S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE e | = = = = = = 6 |E Eg|E EgIE Egg E EgIE Eg|E ESIE E g o Co - e ol esr esresr-esres cadeado asoadhbhadeoadhas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gE OxoE OdcolE OxoE OexuoE OE Odo 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8 3 ê e 2 2 as aa S q i Z Z Z Z < < < 3,8 |, |, 1,38 18 1 $ |, Ss jo o o o o o 3 de jo jo lo Go Ee ão E o ão ro ro ro ro & o IU mm | uu vw | uu nn 4 o UU" xT2 Es [o Es EO ES joe E h h h h bo bo sw | EK EK EK EK EK EK Ss E ? ? ? ? ? Z Wu AQ AQ AQ AQ AQ à
Ss 3 2 a Fã) a x = = e e = = : E | x É x x = 2 E ss = Se õ õ 3 8 o 8 8 8 8 8 8 8 :; E o o o o o o o o oc c c cn cn c c E E le o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 2 E 2 E 2 E 2 E 2 E 2 E 2 E r Oo r Oo r Oo r Oo r Oo r Oo r Oo o” o” o” o” o” o” o” ER |ER |EQR ER |ER ER |E n |NO NO NO NO NO NO NO $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE
S E EF ES Ft SF E CR E SRF CRE CR ÊÉS o 2a -esresresresr-esioes cadeado asoadhbhadeoadhas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 9 SxI/ 8 Sx1/ 0 SxI/ 8 Sx1/08SxTI 6 SxTI 6 Smx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8 3 ê rs o Ss q Ss Ss sw =) 9 S 2 2 2 2 2 Z ã 2 2 2 2 2 2 2 2 3 So go 8a 3 an o go 3 an ?kEZ Ez ÉE3 Ea Ba Egg Rs ro ão aà o ro do E o ro m | z UU o uu uu à a w on | às Ee bo Ee Ee de Be E |& h h h h h h x E EK EK EK EK EK EK = e 2 2 2 2 2 2 W iq AQ AQ AQ à à à
Ss
B 2 [A Fã) Es = x s = = SS áse o eo ds eso so pe'R o s s s s s s s :; E o o o o o o o o oc c c cn cn c c E Elo o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 2 E 2 E 2 E 2 E 2 E 2 E 2 E r Oo r Oo r Oo r Oo r Oo r Oo r Oo o” o” o” o” o” o” o” ER |ER |EQR ER |ER ER |E n |NO NO NO NO NO NO NO $ 6 E S = S = S = S = S = S = S&S Lets LsrLlscELcsELsTLsE
S E EF ES Ft SF E CR E SRF CRE CR ÊÉS o 2a -esresresresr-esioes cadeado asoadhbhadeoadhas 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8 3 ê o T T g g 8 s " i = = Z C < < < 3 | 2 |, E 18 1,8 12 | 3 gá Ba | Ea Só E |8 E o o 2 o a o ro E o TO ou õ | zm” =" E o | TU Fe oe = Ce = o e oe re E |& h h h h h h x E EK EK EK EK EK EK E e ? ? ? ? ? Z W iq AQ AQ AQ AQ AQ à
| 3 2 a Fã) z Ex ES = = = - z E Fo Oo Oo Oo Oo Ns & Se o 8 8 8 8 8 8 8 :; E o o o o o o o o oc c c c cn c c E Ee o o o o o o Pés = = = = = = & & & & & & & == == == == == == == = E = E = E = E = E = E = E no no no no no no no = = = = = = = e& | 2 ke | E | E jp e a EG E E E E ES ES 8 | E FS FS FS FS FS FS E CE tez t cz it c=z it cz=tlzicz SE ZE ES 2 ESZES 2 ES 2 ES 2 ES 2 E o O ES oOolIESgo| ES oOo|ESp o EN o |ESÇ o |EÇOo Po Po Po Po Po Po Po Ed o ES o ES o ES o ado ad oa 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8
É ê à Ss o Ss q q Ss < 2 = = SI SI Ss SI S ã 2 2 2 2 2 2 2 2 jo o o o o q o o joe o 9º o 9º o 9º à 9º So o o 9º a o xo E Oo E Oo E o à Oo xo mm | uu vw | uu nn 4 o UU" m | & o o Ee jo Ee je ke a a a a a a a a a a a a a a
SS SS SS SS SS SS SS e Bs 3 3 3 3 3 2 E OZ 2 zZ 2 zZ 2 zZ 2 zZ 2 zZ 2 zZ N a a a a a a a E gE< E ES pt RES RES RES < < < < < < <
O O O O O O O NT) NT) NT) NT) NT) NT) NT)
| 3 2 a Fã) Ee e e = e e e = 0 a a à a a a E go o o I o o o Ss o o 8 8 8 8 8 8 8 :; E o o o o o o o o oc c c c c c c E se o o o o o o Pés = = = = = = & & & & & & & == == == == == == == 8 E 8 E 8 E 8 E 8 E 8 E 8 E no no no no no no no Zoo Zoo Zoo Zoo Zoo Zoo Zoo ES |ES |EBS ES BEBÉ ES ES a EG E E E E E ES 8 | E FS FS FS FS FS FS E CE tez t cz it c=z it cz=tlzicz SE ZE ES 2 ESZES 2 ES 2 ES 2 ES 2 E o O ES oOolIESgo| ES oOo|ESp o EN o |ESÇ o |EÇOo Po Po o o o 2. Po Ed o ES o ES o ES o ado ad oa 2 2 2Y 2 E 2 8 2CTg2CT 2 = O gwkE O xgE OcxoE O xuE O cxuoE OdexuE Ox 3 SI 8 SI | STI/ 8 STI/ 0 SxI | 0 STI do Srx à 2 Ga 2 o 0 2 0d 23 Ga) 2 030 2 0d 0 2369 o 8
D ê à Ss q Ss Ss s Ss q 2 2 2 = 2 2 = = ã 2 2 2 2 2 2 2 2 3 Bo 8a go o 9º Io go 3 o rege E ss É o ro E C o à& o ro SI o E Oo ro ro z4 |jgU4 E EB EE bpE ES £o Bo Po Es Do Bo |O a a a a a a a 2 2 2 2 2 2 2 < < < < < < < e Bs 3 3 3 3 2x Bo E e Z 2 zZ 2 zZ 2 zZ 2 zZ 2 zZ 2 zZ N a a a a a a a à E << ge ES E ES E < < < < < < <
O O O O O O O NT) NT) NT) NT) NT) NT) NT) É É
O O 8 =| =| 3 < 8 <s 2 2.” T e E s O x õ s O E Z z=2Z2 E Z To oo To 3 o so 3 o =| E à Ego E wu xe ze xe Oo 8 8 S |. e X x É z Ts 3 2 3 3 FE) = = = 84 E E s s s s s :; E o o o o o o oc c c c c E E le o o o o Pés = = = = & & & & & == == == == == 2 E 2 E 2 E 2 E 2 E no no oo oo ao zo NT = = = o ES |ES ES ES ES a ES ES ES ES ES 8 | E FS FS FS FS 3 lzitcziczilziczÊ CS | - - - - SE 2 ESET EST ES ZE ES 2 E o O ES oOolESgoOo| ES OIE Oo | ES O Po Po Po Po Po 3 Ed o ES o ES o ado a 82 2 HI 2HICHZE = O ckE OE OdoE Odu E Quo 9 SI 6 STI 0 STI 0 SxI| 0 STxT & 2 EA 2 628 23 EL ZE o 8 3 z = = = 2 s = Z- Z- Z- o T g RB RB 28 É TZ TZ os os os 3 2 o2 |ES I|1E2QS |SS8 & je [Re 4º 4º 4º . $a (Do Eg E | O Le je ype 5ee pre a a a a < < E Bs Zoo E DZ |õZ & À & zE ZE ls E > wu | & à E 4 4
O O NT) NT)
[00309] “Um sumário das atividades de clivagem de aminoácido de exopeptidases selecionadas da Tabela 7 é mostrado na Figura 16. Ati- vidades de clivagem específica são mostradas para as seguintes en- zimas: "cVPr" (aminopeptidase de V. proteolyticus), "yPIP" (prolina iminopeptidase de Y. pestis), "D/E APN" (M1 Aminopeptidase de L. pneumophila), NTET (TET aminopeptidase de Pyrococcus horikoshii) e Pfu API ("PfuTET" na Tabela 7). A atividades específicas em relação a aminoácidos terminais são classificadas como mostrado, com abrevia- ções de uma única letra usadas para os aminoácidos ("XP-" represen- ta qualquer aminoácido terminal (X) com um resíduo de prolina (P) ad- jacente ou penúltimo). Exemplo 4. Clivagem do aminoácido terminal de peptídeos imobiliza- dos em nível de molécula única
[00310] Foram desenvolvidos ensaios para clivagem de aminoácido no chip de peptídeos imobilizados, usando conjugados de peptídeos marcados. Os ensaios foram delineados para fornecer um método pa- ra determinar o reconhecimento enzimático e a atividade de clivagem de exopeptidases para peptídeos imobilizados, o que poderia permitir a medição de parâmetros cinéticos da ligação e de afinidades de liga- ção em geral.
[00311] Para avaliar a clivagem do aminoácido N-terminal de um peptídeo, foi projetado e sintetizado um peptídeo marcado com coran- te que continha um aspartato N-terminal que foi anexado ao corante como um espaçador PEG. Esse peptídeo também continha um resí- duo de prolina adjacente ao aspartato modificado que é reconhecido especificamente pela enzima prolina iminopeptidase (de Yersinia pes- tis, conhecida em outro lugar e aqui referida como "yPIP"). A enzima yPIP deve clivar somente um aminoácido N-terminal a montante de um resíduo de prolina.
[00312] Depois de mostrar que esse e outros peptídeos marcados foram eficientemente cortados por yPIP a granel (por exemplo, como descrito no Exemplo 2), um ensaio no chip do conjugado coran- te/peptídeo foi desenvolvido para observar a clivagem do aminoácido N-terminal no nível de molécula única. A Figura 17A mostra um es- quema geral para o ensaio do conjugado corante/peptídeo (painel de encaixe). Como mostrado, um peptídeo com um marcador anexado a um aminoácido N-terminal através de um espaçador é imobilizado em uma superfície como um ligante. Depois de ser exposto à peptidase, a clivagem do aminoácido N-terminal resulta na remoção do resíduo marcado de um volume de observação detectável e é medida por uma perda concomitante no sinal gerado pelo marcador. O complexo enzi- ma-peptídeo à direita do painel de encaixe representa genericamente o sítio de clivagem N-terminal.
[00313] A Figura 17A mostra uma construção do peptídeo marcado (na parte inferior) que foi projetada e sintetizada para uso no ensaio do conjugado corante/peptídeo. Nesses experimentos, um corante de ro- damina (ATTO Rho6G) foi anexado a um resíduo de aspartato N- terminal de um peptídeo tendo um penúltimo resíduo de prolina no N- terminal. Como mostrado, o peptídeo foi conjugado ainda a um ligante de DNA solubilizante com uma porção de biotina para imobilização na superfície.
[00314] O conjugado do peptídeo marcado foi carreado em um chip de vidro contendo um arranjo de poços de amostra. Foram adquiridas imagens do chip antes e depois do carregamento para determinar o carregamento percentual de poços de amostra com ocupação única por fluorescência da rodamina. A enzima yPIP foi então introduzida no chip carregado e deixada incubar por duas horas a 37 ºC. Uma ima- gem do chip após a introdução de yPIP foi obtida e a porcentagem de corantes verdes perdidos foi calculada para avaliar a clivagem do ami- noácido N-terminal. A Figura 17B mostra resultados das imagens de um experimento que exibiram 6-7% de carregamento no estágio de carregamento e 91% de perda do sinal em poços anteriormente carre- gados após a incubação com yPIP, o que era indicativo da clivagem do aminoácido N-terminal. A Figura 17C mostra traços de sinal repre- sentativos desses experimentos, que demonstram um aumento detec- tado no sinal do corante quando do carregamento do peptídeo marca- do e uma perda detectada no sinal do corante após a exposição a yPIP.
[00315] Como confirmação adicional da clivagem do aminoácido N- terminal no nível de molécula única, ensaios de FRET no chip foram desenvolvidos para avaliar o reconhecimento por exopeptidase e a ati- vidade de clivagem. A Figura 18A representa genericamente um en- saio de FRET do conjugado do peptídeo (painel A) e um ensaio de FRET do conjugado com enzima (painel B). No ensaio de FRET do conjugado do peptídeo (painel A), uma construção do peptídeo imobili- zado inclui um marcador doador de FRET anexado ao ligante e um marcador aceitador de FRET anexado no N-terminal. A clivagem do aminoácido N-terminal é detectada por uma perda no sinal do marca- dor aceitador de FRET quando exposto à peptidase. Além disso, esse desenho permite monitorar o carregamento do conjugado do peptídeo por todo o experimento seguindo a emissão pelo marcador doador de FRET.
[00316] No ensaio de FRET do conjugado com enzima (painel B), uma construção do peptídeo imobilizado inclui um primeiro marcador de um par de FRET anexado ao ligante e uma peptidase é marcada com um segundo marcador do par de FRET. A clivagem do aminoáci- do N-terminal é detectada por um reforço na fluorescência atribuível às interações de FRET, o que ocorreria com proximidade suficiente da peptidase ao peptídeo e com tempo de permanência suficiente no N- terminal. Além disso, esse ensaio permite avaliar a clivagem processi-
va de aminoácidos por uma exopeptidase processiva detectando um sinal crescente de FRET ao longo do tempo com a clivagem processi- va.
[00317] A Figura 18A também mostra uma construção do peptídeo para FRET abaixo do painel A que foi projetada e sintetizada para uso no ensaio de FRET com o conjugado do peptídeo do painel A. Como mostrado, a construção do peptídeo de FRET incluiu um corante de rodamina (ATTO 647N) anexado a um resíduo de aspartato N-terminal de um peptídeo tendo um penúltimo resíduo de prolina no N-terminal. O peptídeo foi conjugado ainda a um ligante de DNA solubilizante que foi anexado a um corante de cianina (Cy3B) para FRET e uma porção de biotina para imobilização na superfície.
[00318] Nesse experimento, a construção do peptídeo para FRET foi carregada em um chip de vidro contendo um arranjo de poços de amostra, e a luz coletada foi filtrada primeiramente por um filtro verde e depois um filtro vermelho. O carregamento da construção do peptí- deo para FRET foi detectado medindo a passagem do sinal através do filtro verde e do vermelho. A clivagem do aminoácido terminal foi de- tectada quando o sinal era mensurável somente no filtro verde, o que indicou que o aminoácido N-terminal conjugado ao corante vermelho da construção do peptídeo para FRET foi clivado por yPIP. Esse pa- drão de detecção é ilustrado no painel C. Como mostrado, se ambos os corantes são detectáveis antes da adição de yPIP, e apenas o co- rante verde é visível após a incubação com yPIP, é possível concluir razoavelmente que essa mudança no padrão de detecção deve-se à clivagem do peptídeo e não ao fotobranqueamento ou perda do peptí- deo como um todo. Além disso, seria de se esperar um aumento na fluorescência do corante verde sozinho, uma vez que suas emissões não são mais absorvidas pelo corante vermelho.
[00319] Após o carregamento da construção do peptídeo para
FRET no chip, que havia sido modificado pela passivação da superfí- cie usando ácido fosfônico e silano, yPIP foi introduzida e imagens fo- ram obtidas em diversos momentos. Para avaliar a tendência global de clivagem, computou-se a razão (verde)/(verde + vermelho) para cada experimento. Essa razão aumenta com a extensão em que ocorre a clivagem. A Figura 18B é um gráfico da razão de emissão por FRET em todas as aberturas em momentos diferentes de incubação com yPIP. Como mostrado, a contribuição do corante verde para a razão das emissões de fluorescência aumenta ao longo do tempo durante a incubação com yPIP, indicando que mais resíduos de aspartato N- terminal foram cortados, deixando atrás o peptídeo truncado com ape- nas o corante verde.
[00320] A eficiência do corte foi então avaliada em momentos dife- rentes determinando-se em quais momentos a fluorescência do coran- te foi observada. Isso foi feito com a definição de um limiar simples - por exemplo, se o sinal médio pela emissão do corante fosse > 2,5 du- rante a excitação, determinava-se que os corantes estavam presentes (quando cada filtro correspondente fosse aplicado). Aberturas exibindo cortes exibiriam então ambos os corantes verde e vermelho durante a fase de carregamento do experimento, mas somente o corante verde nos momentos expostos a yPIP. Como mostrado na Figura 18C, ob- servou-se progressivamente mais cortes à medida que o chip foi ex- posto a tempos mais longos de incubação com yPIP. Exemplos de tra- ços de sinal mostrando corte, exibidos em cada um de três momentos tratados com yPIP, são mostrados na Figura 18D.
[00321] Experimentos adicionais foram realizados com yPIP e ou- tras peptidases usando chips que haviam sido modificados por passi- vação da superfície com dextrano, que produziram resultados seme- lhantes mostrando um aumento na clivagem do aminoácido terminal ao longo do tempo após a introdução de peptidase nos chips. A Figura
18E é um gráfico do índice de emissão por FRET nas aberturas carre- gadas em diferentes momentos da incubação com yPIP. A Figura 18F é um gráfico do índice de emissão por FRET nas aberturas carrega- das em diferentes momentos da incubação com uma aminopeptidase. No geral, os experimentos aqui demonstram que a clivagem do ami- noácido N-terminal é detectável em tempo real no nível de molécula única utilizando diferentes exopeptidases e diferentes estratégias para marcação. Exemplo 5. Discriminação do aminoácido terminal por reagente de afi- nidade marcado
[00322] “Uma proteína adaptadora envolvida em vias proteolíticas foi identificada como uma candidata potencial para uso como um rea- gente de afinidade marcado para detectar resíduos aromáticos N- terminais. A proteína adaptadora, CIpS2 de uma a-proteobactéria (A. tumefaciens), foi expressa e marcada em um resíduo exposto de ciste- ína. A Figura 19A mostra uma estrutura cristalina da proteína CIpS2, com o resíduo exposto de cisteína mostrado como gravetos. O resíduo exposto de cisteína foi marcado com um corante de rodamina (ATTO 532).
[00323] Peptídeos com resíduos aromáticos diferentes no N- terminal foram preparados para testar se a CIpS2 marcada era capaz de descriminação do aminoácido N-terminal no nível de molécula úni- ca. Exemplos de traços de intensidade da molécula única desses ex- perimentos são mostrados na Figura 19B. Como mostrado, os traços de sinal demonstram padrões de ligação liga-desliga de resíduos es- pecíficos que correspondem à ligação reversível do reagente de afini- dade marcado ao N-terminal de peptídeos contendo: um resíduo de fenilalanina N-terminal (F, traço de sinal em cima), um resíduo de tiro- sina N-terminal (Y, traço de sinal no meio) ou um resíduo de triptofano N-terminal (W, traço de sinal embaixo).
[00324] Análises adicionais das trajetórias da molécula única foram conduzidas, com os resultados mostrados nas Figuras 19C-19E. A Fi- gura 19C é um gráfico mostrando durações do pulso (a duração de tempo de picos do sinal) que permitem a discriminação entre os três resíduos N-terminais quando ligados reversivelmente por CIpS2 mar- cada. A Figura 19D é um gráfico mostrando as durações entre pulsos (duração de tempo entre pulsos de sinal) que permitem a discrimina- ção entre os resíduos N-terminais. A Figura 19E mostra gráficos que ilustram mais detalhadamente as durações do pulso que permitem a discriminação entre fenilalanina tirosina e triptofano nos N-terminais do peptídeo. A duração média do pulso para os diferentes resíduos N- terminais é visualizada por histogramas (A)-(B) e histograma em ca- mada (C).
[00325] Outra proteína adaptadora, CIpS de Thermosynochoccus elongatus (teCIpS) foi avaliada para uso como um reagente de afinida- de marcado para reconhecimento de leucina. Os dados obtidos na análise do tempo de permanência, mostrados nas Figuras 19F-19H, demonstraram que a proteína teClIpS marcada produz interações de ligação detectáveis com um resíduo de leucina terminal de polipeptí- deos com uma duração média do pulso de 0,71 segundo. A sequência de aminoácidos da proteína teCIpS usada nesses experimentos é mostrada na Tabela 1.
[00326] Experimentos semelhantes foram conduzidos para avaliar CIpS1 de A. tumefaciens e CIpS2 de S. elongatus como reagentes po- tenciais para reconhecimento de leucina, e GID4 como reagente po- tencial para reconhecimento de prolina. A Figura 191 mostra exemplos de resultados da análise de tempo de permanência que mostrou reco- nhecimento diferenciável de fenilalanina, leucina, triptofano e tirosina por CIpS1 de A. tumefaciens. A Figura 19J mostra exemplos de resul- tados da análise de tempo de permanência demonstrando reconheci-
mento de leucina por CIpS2 de S. elongatus. As Figuras 19K-19L mos- tram exemplos de resultados da análise de tempo de permanência demonstrando reconhecimento de prolina por GIDA4. Exemplo 6. Sequenciamento de polipeptídeos pelo reconhecimento durante a degradação
[00327] Foram conduzidos experimentos para avaliar o sequencia- mento de peptídeos pelo reconhecimento do aminoácido N-terminal durante uma reação de degradação contínua. Exemplos dos resulta- dos desses experimentos são mostrados nas Figuras 20A-20D, que mostram traços de intensidade da molécula única, obtidos ao longo de duas reações independentes de sequenciamento de polipeptídeos, conduzidas em tempo real, usando uma proteína CIpS2 marcada e uma aminopeptidase na mesma mistura de reação. Em cada reação, um polipeptídeo de sequência YAAWAAFADDDWK (SEQ ID NO: 78) foi imobilizado na superfície de um chip através do resíduo de lisina C- terminal, carregando a composição do peptídeo (10 pM) em chips por minutos, e o peptídeo imobilizado foi monitorado na presença de um reagente de afinidade marcado (CIpS2-V1 de A. Tumefaciens, marcada com ATTO 542, a 500 nM) e uma aminopeptidase como rea- gente de clivagem (VPr a 8 uM).
[00328] As Figuras 20A e 20C mostram dados do traço de sinal pa- ra dois ciclos diferentes de sequenciamento, com o painel superior (painel 1 na Figura 20A, painel 2 na Figura 20C) mostrando um traço completo, e os painéis inferiores (Y, W, F) mostrando regiões amplia- das correspondentes a cada uma das regiões destacadas no traço completo. As Figuras 20B e 20D mostram a estatística da duração do pulso em histogramas para os dados do traço dos painéis correspon- dentes conforme identificados nas Figuras 20A e 20C, respectivamen- te. Como mostrado no traço de sinal complete de cada ciclo de se- quenciamento (painéis 1, 2), três intervalos de tempo separados dos pulsos de sinal foram observados no decorrer da reação. Como desta- cados pelas regiões ampliadas (painéis Y, W, F), os três intervalos são distinguíveis visualmente um do outro com base em uma diferença ob- servável no padrão dos pulsos de sinal.
[00329] Para analisar mais detalhadamente os dados de pulsos de sinal, determinou-se a estatística da duração do pulso para cada inter- valo de tempo (Figuras 20B e 20D). Foi determinado que as diferenças na distribuição da duração do pulso correspondiam àquelas observa- das para esses aminoácidos individualmente no estado de equilíbrio em ensaios de ligação em chip com CIpS2, e as informações sobre o pulso de sinal foram fenotipicamente consistentes entre intervalos dos ciclos de sequenciamento e os ensaios de ligação com o aminoácido individual.
[00330] “Como confirmado pela análise de informações sobre o pul- so de sinal, os três intervalos de tempo dos pulsos de sinal observados ao longo da progressão de cada ciclo de sequenciamento correspon- dem aos padrões de reconhecimento de Y, W e F, respectivamente (painéis 1, 2). O período de tempo intermediário entre os padrões do pulso de sinal deve-se à seletividade de CIpS2-V1, que não se liga a resíduos de alanina N-terminal. Como ilustrado pelo traço de sinal completo, o primeiro intervalo corresponde ao reconhecimento de Y, o qual é seguido por uma pausa à medida que VPr peptidase corta Y e dois resíduos de alanina, seguido pelo segundo intervalo correspon- dente ao reconhecimento de W, o qual é seguido por outra pausa en- quanto VPr peptidase corta W e dois resíduos de alanina e, finalmente, o terceiro intervalo correspondente ao reconhecimento de F antes que VPr peptidase corte a F e pare no peptídeo restante ADDDWK. Esses resultados mostram que as informações da duração do pulso, que fo- ram obtidas pelo reconhecimento do aminoácido terminal durante uma reação de degradação contínua, podem ser usadas para determinar padrões característicos que discriminam tipos diferentes de aminoáci- dos terminais. Exemplo 7. Identificação do aminoácido terminal e clivagem por exopeptidase marcada
[00331] “Realizaram-se estudos para investigar o potencial para re- agente único que seja capaz de identificar um aminoácido terminal de um peptídeo e de clivar o aminoácido terminal do peptídeo. Como um reagente único, uma exopeptidase deve ser capaz de ligar-se ao pep- tídeo enquanto retendo a atividade de clivagem dirigida a um resíduo terminal. Deste modo, uma abordagem inicial empregando estratégias tradicionais de marcação foi conduzida tendo como alvo aminoácidos nativos expostos na superfície de diferentes exopeptidases. Nesses experimentos, resíduos de cisteína (-SH) ou de lisina (-NH2) exposta na superfície foram marcados com corantes fluorescentes, que de- monstrou ser uma metodologia robusta para marcação de exopeptida- se. Em certos casos, no entanto, essa abordagem produziu uma popu- lação heterogênea de proteínas que são marcadas com um ou mais corantes.
[00332] A fim de controlar com mais precisão onde a marcação ocorre em exopeptidases e assegurar que cada molécula de exopepti- dase seja marcada com um único corante fluorescente (bem como eliminar a reatividade fora do alvo do corante), uma nova estratégia para marcação foi investigada. Nesses experimentos, exopeptidase marcadas foram preparadas usando uma estratégia de marcação sítio- específica na qual um aminoácido não natural contendo um grupo fun- cional reativo é introduzido na exopeptidase (ver, por exemplo, Chin, J.W,, et al. ] Am Chem Soc. 2002 Aug 7; 124(31):9026-9027).
[00333] A prolina iminopeptidase de Yersinia pestis (yPIP) foi modi- ficada por mutação de um resíduo de lisina na posição 287 para um resíduo com uma cadeia lateral de para-azidofenilalanina (pAZF). À
Figura 21A mostra uma estrutura cristalina de yPIP, com a mutação indicada pela estrutura química de pAzF mostrada com a cadeia lateral K287 mostrada como gravetos. Esse local da mutação foi selecionado com base na estabilidade fornecida pela hélice alfa nessa posição e para assegurar que um novo grupo funcional azido fique exposto ao solvente.
[00334] Foi obtido um plasmídeo pEVOL contendo a amino tRNA sintetase mutante e o tRNA mutante necessários para incorporar pAzF na cadeia do aminoácido. O códon de parada amber (TAG), que é ne- cessário para a incorporação específica de pAzF, foi então introduzido no cDNA usando o kit para mutagênese QuickChange Il. O cDNA foi sequenciado, a seguir, e a posição do códon TAG foi confirmada. À isso, seguiu-se a cotransfecção do plasmídeo pET21b+ contendo o mutante yPIP amber e do plasmídeo pEVOL contendo o maquinário celular para carregar o tRNA do códon amber com pAzF. As células cotransfectadas foram então cultivadas até 0,8 ODU, induzidas com ara- binose 0,02% e IPTG 1 mM na presença de pAzF 2 mM em 2 L de LB, e coletadas utilizando quimiólise. A purificação foi conduzida com uma co- luna de cromatografia por afinidade de 5 mL, e a proteína foi eluída em imidazol 100 mM. A proteína resultante foi então dialisada e concen- trada em HEPES 50 mM, pH 8,0, e KCI 0,5 M, dividida em alíquotas e congelada instantaneamente antes do armazenamento a -20 ºC.
[00335] Para confirmar a presença do grupo azido na proteína puri- ficada, DBCO-Cy3 (2 mM) foi reagido com a variante pAzF-yPIP (220 UM) (Condições da reação: HEPES 50 mM, pH 8,0, KCI 0,5 mM, DMSO 20%; 10 horas a 37 ºC, 48 horas à temperatura ambiente). O produto proteico da reação foi purificado por cromatografia de exclu- são por tamanho, e foi determinado que a proteína resultante estava 100% marcada com o reagente DBCO-Cy3 com azida reativa (Figura 21B), indicando incorporação robusta do aminoácido não natural.
[00336] A marcação da proteína e pureza do produto final foram confirmados pela análise de SDS-PAGE da variante não marcada e marcada de pAzF. A Figura 21C mostra uma imagem do gel de SDS- PAGE confirmando a marcação por Cy3 de pAzF-yPIP (imagem supe- rexposta do gel mostrada na Figura 21D para mostrar a progressão). À Figura 21E mostra uma imagem do gel corando com Coomassie con- firmando que ambos, o corante e a proteína, migraram juntos e são puros.
[00337] A variante pAZF-yPIP marcada com corante foi usada em um ensaio de atividade para confirmar que a enzima estava ainda ati- va após a marcação e purificação. Como mostrado na Figura 21F, Cy3-pAzF-yPIP foi capaz de hidrolisar 100% do substrato do peptídeo em 1 hora, com 1000 vezes de excesso do substrato, como medido por HPLC. Esses experimentos demonstram uma metodologia que permite a modificação de sítio específico e marcação de uma exopep- tidase com perturbação mínima da estrutura/função da proteína nativa. Exemplo 8. Reconhecimento de aminoácidos modificados no sequen- ciamento de polipeptídeos
[00338] Realizaram-se experimentos para avaliar o reconhecimento de aminoácidos contendo modificações específicas após a tradução. Um mutante triplo (T8V, S10A, K15L) do domínio de homologia Src 2 (SH2) de Fyn, uma tirosina quinase, foi testado como uma molécula de reconhecimento potencial para resíduos fosforilados de tirosina no se- quenciamento de peptídeos. A proteína variante foi imobilizada no fun- do de poços de amostra, e traços de sinal de uma única molécula fo- ram coletados após a adição de um peptídeo marcado com fluores- cência contendo fosfo-tirosina N-terminal. A ligação do peptídeo pela proteína imobilizada foi detectada durante esses experimentos, como mostrado pelos traços representativos na Figura 22A. Os dados da duração do pulso coletados durante esses experimentos são mostra-
dos na Figura 22B (gráficos superior, do meio e inferior, correspon- dendo aos traços superior, do meio e inferior da Figura 22A, respecti- vamente). A estatística da duração do pulso e duração entre pulsos são mostradas na Figura 22C (painéis superior e inferior, respectiva- mente).
[00339] Foram realizados experimentos controle para confirmar que a proteína Fyn era específica para a tirosina fosforilada. Os experimen- tos foram repetidos para cada um de três peptídeos diferentes: um primeiro peptídeo contendo tirosina não modificada N-terminal (Y; Fi- gura 22D), um segundo peptídeo contendo tirosinas não modificadas N-terminal e penúltima (YY; Figura 22E) e um terceiro peptídeo con- tendo fosfo-tirosina (Figura 22F). Como mostrado, a ligação não foi detectada com qualquer um dos peptídeos usados nos experimentos de controle negativo. Exemplo 9. Reconhecimento de penúltimos aminoácidos no sequenci- amento de polipeptídeos
[00340] Realizaram-se experimentos para determinar os efeitos e penúltimos aminoácidos sobre a duração do pulso para CIpS2-V1 de A. Tumefaciens. Foram preparados quarenta e nove diferentes peptí- deos marcados com fluorescência que continham sequências dipeptí- dicas únicas no N-terminal, onde o aminoácido N-terminal era F, W ou Y, ea penúltima posição era de um dos 20 aminoácidos naturais. Para cada experimento, CIpS2-V1 foi imobilizada no fundo de poços de amostra, e traços de sinal de moléculas únicas foram coletados por 10-20 minutos quando da adição de um dos peptídeos marcados com fluorescência. Os dados da duração do pulso foram coletados de, no mínimo, 50 poços de amostra para cada peptídeo.
[00341] A Figura 23 mostra a duração mediana do pulso para cada um dos 50 peptídeos, com pontos de dados agrupados por penúltimo aminoácido (eixo x) e aminoácidos N-terminais representados com símbolos diferentes. Exemplo 10. Reconhecimento simultâneo de aminoácidos com múlti- plas moléculas de reconhecimento
[00342] Realizaram experimentos de reconhecimento de molécula peptídica única para demonstrar o reconhecimento do aminoácido terminal de um peptídeo imobilizado por mais de uma molécula de re- conhecimento marcada. Moléculas peptídicas únicas contendo fenila- lanina N-terminal (FYPLPWPDDDY (SEQ ID NO: 79)) foram imobiliza- das em poços de amostra de um chip. Adicionou-se tampão contendo 500 nM cada de atCIpS1 (CIpS1 de Agrobacterium tumifaciens; se- quência fornecida na Tabela 1) e atCIpS2-V1 (Variante 1 de CIpS2 de Agrobacterium tumifaciens; sequência fornecida na Tabela 1), onde atCIpS1 e atCIpS2-V1 estavam marcados com Cy3 e Cy3B, respecti- vamente. Dado que a intensidade de Cy3B é maior do que Cy3, os eventos de ligação a atCIpS2-V1 puderam ser rapidamente distingui- dos dos eventos de ligação a atCIpS1.
[00343] As Figuras 24A-24C apresentam os resultados dos experi- mentos mostrando o reconhecimento de molécula peptídica única com moléculas de reconhecimento marcadas diferencialmente. Um traço representativo é exibido na Figura 24A. As distribuições da duração do pulso foram distintas para cada ligador (Figura 24B) e correspondiam aos seus perfis cinéticos conforme observados em experimentos de um único ligador. A duração média do pulso foi 1,3 segundo para atCIpS1 e 1,0 segundo para atCIpS2-V1 (Figura 24C). A taxa de pul- sos foi também distinta: 8,1 pulsos/minuto para atCIpS1 e 14,1 pul- sos/minuto para atClp2-V1 (Figura 24C). Assim, quando mais de uma molécula de reconhecimento está incluída para o reconhecimento di- nâmico de peptídeos imobilizados, as características da ligação de ca- da molécula de reconhecimento (incluindo duração do pulso, duração entre pulsos e taxa de pulsos) podem fornecer simultaneamente infor-
mações sobre a sequência do peptídeo. Exemplo 11. Melhorando a fotoestabilidade com ligantes da molécula de reconhecimento
[00344] Realizaram-se experimentos para avaliar a fotoestabilidade de peptídeos imobilizados durante o sequenciamento de molécula úni- ca. A atCIpS2-V1 marcada com corante descrita no Exemplo 5 foi adi- cionada a poços de amostra contendo substratos peptídicos imobiliza- dos na presença de luz de excitação a 532 nm para monitorar o reco- nhecimento pela emissão de ATTO 532. Um traço representativo é mostrado na Figura 25A. Como mostrado no painel superior, foi obser- vado que o reconhecimento cessa em aproximadamente 600 segun- dos no experimento. O painel inferior é uma vista ampliada mostrando pulsos de sinal em aproximadamente 180-430 segundos na reação.
[00345] A Figura 25B mostra uma visualização da estrutura cristali- na da proteína CIpS2 usada nesses experimentos. Como mostrado, o resíduo de cisteína que serve como o sítio de conjugação com o co- rante está aproximadamente 2 nm distante do sítio de ligação ao ami- noácido terminal. Foi levantada a hipótese de que os fotodanos ao peptídeo foram causados pela proximidade do corante com o N- terminal do peptídeo durante a ligação. Para atenuar os potenciais efeitos de fotodanificação pela proximidade do corante, a proteína CIpS2 foi marcada com corante por meio de um ligante que aumentou a distância entre o corante e o N-terminal do peptídeo em mais de 10 nm. O ligante incluiu estreptavidina e um ácido nucleico de fita dupla; o ácido nucleico de fita dupla foi marcado com duas moléculas do coran- te Cy3B e anexado à estreptavidina através de uma porção bis-biotina, e uma proteína CIpS2 foi anexada a cada um dos dois sítios de ligação restantes na estreptavidina através de uma porção de biotina. Um tra- ço representativo, usando essa molécula de CIpS2 protegida do coran- te, é mostrado na Figura 25C. Como mostrado no painel superior, o tempo de reconhecimento foi ampliado para aproximadamente 6.000 segundos no experimento. O painel inferior é uma vista ampliada mos- trando pulsos de sinal em aproximadamente 750-930 segundos na re- ação.
[00346] Uma molécula de reconhecimento DNA-estreptavidina foi gerada com um ligante contendo um ácido nucleico de fita dupla mar- cado com duas moléculas do corante Cy3B e anexado à estreptavidina através de uma porção bis-biotina, e uma única proteína CIpS2 anexa- da aos restantes dois sítios de ligação restantes na estreptavidina através de uma porção bis-biotina. Essa construção foi usada em uma reação de sequenciamento de uma única molécula peptídica, e traços representativos desses experimentos são mostrados nas Figuras 26A- 26D.
[00347] Os experimentos de sequenciamento descritos no Exemplo 6 foram repetidos, com as condições de reação mudadas como segue: a molécula de reconhecimento de CIpS2 com DNA-estreptavidina foi usada em combinação como reagente de clivagem de aminoácido hTET. Um traço de sinal representativo é mostrado na Figura 27. Exemplo 12. Sequenciamento por reconhecimento durante a degrada- ção por múltiplas exopeptidases
[00348] “ Realizaram-se experimentos para avaliar o uso de múltiplos tipos de exopeptidases com especificidades de clivagem diferenciais em uma mistura de reação de sequenciamento de uma única molécula peptídica. Molécula peptídicas únicas (YAAWAAFADDDWK (SEQ ID NO: 78)) foram imobilizadas através de um resíduo de lisina C-terminal em poços de amostra de um chip. Adicionou-se tampão contendo atCIpS2-V1 para o reconhecimento de aminoácidos e hTET para cliva- gem do aminoácido. Um traço representativo é exibido na Figura 28A, com vistas expandidas de regiões do padrão de pulsos mostradas na Figura 28B.
[00349] “Conduziu-se um experimento para avaliar as reações de sequenciamento na presença de dois tipos de exopeptidases com es- pecificidades diferenciais. Molécula peptídicas únicas (FYPLPWP- DDDYK (SEQ ID NO: 80)) foram imobilizadas através de um resíduo de lisina C-terminal em poços de amostra de um chip. Adicionou-se tampão contendo atCIpS2-V1 para o reconhecimento de aminoácidos e, ambas, hTET e yPIP para clivagem de aminoácidos. Um traço re- presentativo é exibido na Figura 28C, com vistas expandidas de regi- ões do padrão de pulsos mostradas na Figura 28D. Traços representa- tivos adicionais dessas condições de reação são mostrados na Figura 28E.
[00350] —Conduziram-se experimentos adicionais par avaliar reações de sequenciamento na presença de dois tipos de exopeptidases com especificidades diferenciais. Molécula peptídicas únicas (YPLPWP- DDDYK (SEQ ID NO: 81)) foram imobilizadas através de um resíduo de lisina C-terminal em poços de amostra de um chip. Em um experi- mento, adicionou-se tampão contendo atCIpS2-V1 para o reconheci- mento de aminoácido e, ambas, hTET e yPIP para clivagem do ami- noácido. Um traço representativo é exibido na Figura 28F, com vistas expandidas de regiões do padrão de pulsos mostradas na Figura 28G. Traços representativos adicionais dessas condições de reação são mostrados na Figura 28H. Em um experimento adicional, adicionou-se tampão (MOPS 50 mM, KOAc 60 mM, Co(OAc)> 200 UM) contendo atCIpS2-V1 para o reconhecimento de aminoácido e, ambas, PfuTET e yPIP para clivagem do aminoácido. Um traço representativo é exibi- do na Figura 281, com vistas expandidas de regiões do padrão de pul- sos mostradas na Figura 28J. Equivalentes e âmbito
[00351] Nas reivindicações, artigos como "um", "uma", "o" e "a" po- dem significar um ou mais de um a menos que indicado o contrário ou de outra forma evidente pelo contexto. Reivindicações ou descrições que incluem "ou" entre um ou mais membros de um grupo são consi- deradas satisfeitas se um, mais de um ou todos os membros do grupo estiverem presentes, forem empregados em ou forem de outra forma relevantes para um dado produto ou processo, a menos que indicado o contrário ou de outra forma evidente pelo contexto. A invenção inclui modalidades nas quais exatamente um membro do grupo está presen- te, é empregado em ou é de outra forma relevante para um dado pro- duto ou processo. A invenção inclui modalidades nas quais mais de um ou todos os membros do grupo estão presentes em, são emprega- dos em ou são de outra forma relevantes para um dado produto ou processo.
[00352] Além disso, a invenção abrange todas as variações, combi- nações e permutações nas quais uma ou mais limitações, elementos, cláusulas e termos descritivos de uma ou mais das reivindicações lis- tadas sejam introduzidos em outra reivindicação. Por exemplo, qual- quer reivindicação que é dependente de outra reivindicação pode ser modificada para incluir uma ou mais limitações encontradas em qual- quer outra reivindicação que seja dependente da mesma reivindicação base. Quando elementos são apresentados como listas, por exemplo, no formato de grupo de Markush, cada subgrupo dos elementos é igualmente descrito, e qualquer/quaisquer elemento(s) pode(m) ser removido(s) do grupo. Deve-se entender que, em geral, onde se men- ciona que a invenção, ou aspectos da invenção, compreende(m) ele- mentos e/ou características em particular, certas modalidades da in- venção ou aspectos da invenção consistem ou consistem essencial- mente em tais elementos e/ou características. Por uma questão de simplicidade, essas modalidades não foram especificamente apresen- tadas in haec verba no presente.
[00353] Deve-se entender que a expressão "e/ou", neste relatório descritivo nas reivindicações, significa "qualquer um ou ambos" os elementos assim reunidos, ou seja, elementos que estão presentes conjuntamente, em alguns casos, e não conjuntamente em outros ca- sos. Múltiplos elementos listados com "e/ou" devem ser interpretados da mesma maneira, ou seja, "um ou mais" dos elementos assim reuni- dos. Outros elementos podem opcionalmente estar presentes além dos elementos especificamente identificados pela cláusula "e/ou", quer relacionados ou não relacionados àqueles elementos especificamente identificados. Assim, como um exemplo não limitante, uma referência a "A e/ou B", quando usada em conjunção com linguagem aberta como "compreende" pode referir-se, em uma modalidade, a A somente (op- cionalmente incluindo outros elementos além de B); em outra modali- dade, a B somente (opcionalmente incluindo outros elementos além de A); em ainda outra modalidade, a ambos, A e B (opcionalmente inclu- indo outro elementos); etc.
[00354] Neste relatório descritivo nas reivindicações, deve-se en- tender que "ou" tenha o mesmo significado que "e/ou" como definido acima. Por exemplo, quando separar itens em uma lista, deve-se in- terpretar "ou" ou "e/ou" como inclusivos, ou seja, a inclusão de pelo menos um, mas incluindo também mais de um, de um número ou de uma lista de elementos e, opcionalmente, itens adicionais não listados. Somente termos claramente indicados ao contrário, como "somente um de" ou "exatamente um de", ou, quando usado nas reivindicações, "consiste em", se referirá à inclusão de exatamente um elemento de um número ou lista de elementos. Em geral, o termo "ou" neste relató- rio descritivo será interpretado somente como indicando alternativas exclusivas (ou seja, "um ou o outro, mas não ambos") quando prece- dido por termos de exclusividade, como "qualquer um de", "um dentre", "somente um de" ou "exatamente um de". "Consiste essencialmente em", quando usado nas reivindicações, terá seu significado comum como usado no campo da lei de patentes.
[00355] Neste relatório descritivo e nas reivindicações, deve-se en- tender que a expressão "pelo menos um", em referência a uma lista de um ou mais elementos, significa pelo menos um elemento selecionado dentre qualquer um ou mais dos elementos na lista de elementos, mas não necessariamente incluindo pelo menos um de todo e cada ele- mento especificamente listado dentro da lista de elementos e não ex- cluindo quaisquer combinações de elementos na lista de elementos. Essa definição também permite que outros elementos possam opcio- nalmente estar presentes além dos elementos especificamente identi- ficados dentro da lista de elementos aos quais se refere a expressão "pelo menos um", quer relacionados ou não relacionados àqueles ele- mentos especificamente identificados. Assim, como um exemplo não limitante, "pelo menos um dentre A e B" (ou, equivalentemente, "pelo menos um de A ou B", ou, equivalentemente "pelo menos um dentre À e/ou B") pode referir-se, em uma modalidade, a pelo menos um, opci- onalmente incluindo mais de um, A, sem B presente (e opcionalmente incluindo outros elementos além de B); em outra modalidade, a pelo menos um, opcionalmente incluindo mais de um, B, sem A presente (e opcionalmente incluindo outros elementos além de A); em ainda outra modalidade, a pelo menos um, opcionalmente incluindo mais de um, À e pelo menos um, opcionalmente incluindo mais de um, B (e opcio- nalmente incluindo outro elementos); etc.
[00356] Deve-se igualmente entender que, a menos que claramente indicado ao contrário, em quaisquer métodos ora reivindicados que incluam mais de uma etapa ou ato, a ordem das etapas ou atos do método não está necessariamente limitada à ordem na qual as etapas ou atos do método são enumerados.
[00357] Nas reivindicações, bem como no relatório descritivo acima, todas as expressões de transição como "compreende", "inclui", "carre-
ga", "tem", "contém", "envolvendo", "mantém", "composto por" e seme- lhantes deverão ser entendidas como abertas, ou seja, significam in- cluindo, entre outros. Apenas as expressões de transição "consiste em" e "consiste essencialmente em" serão expressões fechadas ou semifechadas de transição, respectivamente, conforme estipulado no Manual de Procedimentos para o Exame de Patentes, Seção 2111.03, do Escritório de Patentes dos Estados Unidos. Deve-se reconhecer que modalidades descritas neste documento que usam uma expres- são de transição aberta (por exemplo, "compreende") são igualmente contempladas, em modalidades alternativas, como "consiste em" e "consiste essencialmente em" a característica descrita pela expressão de transição aberta. Por exemplo, se o pedido de patente descreve "uma composição que compreende A e B", o pedido de patente con- templa igualmente as modalidades alternativas "uma composição que consiste em A e B" e "uma composição que consiste essencialmente emÃeB".
[00358] “Quando fornecidas faixas, os limites estão incluídos. Além disso, a menos que indicado o contrário ou de outra forma evidente pelo contexto e o entendimento de qualquer técnico no assunto, valo- res que são expressos como faixas podem pressupor qualquer valor específico ou subfaixa dentro das faixas declaradas em diferentes mo- dalidades da invenção, até o décimo da unidade do limite inferior da faixa, a menos que o contexto claramente indique o contrário.
[00359] Este pedido de patente refere-se a várias patentes emiti- das, publicações de pedidos de patente, artigos de periódicos e outras publicações, todos os quais aqui incorporados por referência. Em caso de conflito entre qualquer uma das referências incorporadas e o pre- sente relatório descritivo, o relatório descritivo prevalecerá. Além disso, qualquer modalidade em particular da presente invenção que se en- quadre na técnica anterior pode ser explicitamente excluída de qual-
quer uma ou mais das reivindicações. Por poderem ser consideradas conhecidas por qualquer técnico no assunto, essas modalidades po- dem ser excluídas mesmo que a exclusão não seja explicitamente apresentada no presente. Qualquer modalidade em particular da in- venção pode ser excluída de qualquer reivindicação, por qualquer mo- tivo, quer esteja relacionada ou não à existência da técnica anterior.
[00360] Os técnicos no assunto reconhecerão ou serão capazes de determinar, com o uso de não mais do que a experimentação rotineira, muitos equivalentes às modalidades específicas aqui descrita. O âmbi- to das presentes modalidades aqui descritas não se destina a ser limi- tado pela Descrição acima, mas sim conforme apresentado nas reivin- dicações anexadas. Qualquer técnico no assunto reconhecerá que vá- rias mudanças e modificações a essa descrição podem ser efetuadas sem que se desviem do espírito ou âmbito da presente invenção, co- mo definida nas reivindicações a seguir.
[00361] A enumeração de uma listagem de grupos químicos em qualquer definição de uma variável no presente inclui definições da- quela variável como qualquer grupo único ou combinação de grupos listados. A enumeração de uma modalidade para uma variável no pre- sente inclui aquela modalidade como qualquer modalidade única ou em combinação com quaisquer outras modalidades ou partes das mesmas. A enumeração de uma modalidade no presente inclui aquela modalidade como qualquer modalidade única ou em combinação com quaisquer outras modalidades ou partes das mesmas.

Claims (283)

REIVINDICAÇÕES
1. Método, caracterizado pelo fato de que compreende: obter dados durante um processo de degradação de um po- lipeptídeo; analisar os dados para determinar porções dos dados cor- respondentes a aminoácidos que são expostos sequencialmente em um terminal do polipeptídeo durante o processo de degradação; e produzir a partir dos dados uma sequência de aminoácidos representativa do polipeptídeo.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que os dados são indicativos da identidade do aminoácido no terminal do polipeptídeo durante o processo de degradação.
3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que os dados são indicativos de um sinal produzido pela ligação de uma ou mais moléculas de reconhecimento de aminoácidos a tipos diferentes de aminoácidos terminais no terminal durante o pro- cesso de degradação.
4. Método de acordo com a reivindicação 1, caracterizado pelo fato de que os dados são indicativos de um sinal luminescente gerado durante o processo de degradação.
5. Método de acordo com a reivindicação 1, caracterizado pelo fato de que os dados são indicativos de um sinal elétrico gerado durante o processo de degradação.
6. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a análise dos dados compreende ainda detectar uma série de eventos de clivagem e determinar as porções dos dados entre eventos de clivagem sucessivos.
7. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a análise dos dados compreende ainda determinar um tipo de aminoácido para cada uma das porções individuais.
8. Método de acordo com a reivindicação 1, caracterizado pelo fato de que cada uma das porções individuais compreende um padrão de pulso, e de que a análise dos dados compreende ainda de- terminar um tipo de aminoácido para uma ou mais das porções tendo por base o seu respectivo padrão de pulso.
9. Método de acordo com a reivindicação 8, caracterizado pelo fato de que a determinação do tipo de aminoácido compreende ainda identificar uma quantidade de tempo em uma porção quando os dados estão acima de um valor limiar e comparar a quantidade de tempo a uma duração de tempo para a porção.
10. Método de acordo com a reivindicação 8, caracterizado pelo fato de que a determinação do tipo de aminoácido compreende ainda identificar pelo menos uma duração do pulso para cada uma de uma ou mais porções.
11. Método de acordo com a reivindicação 8, caracterizado pelo fato de que a determinação do tipo de aminoácido compreende ainda identificar pelo menos uma duração entre pulsos para cada uma de uma ou mais porções.
12. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a sequência de aminoácidos inclui uma série de ami- noácidos correspondentes às porções.
13. Sistema, caracterizado pelo fato de que compreende: pelo menos um processador de hardware; e pelo menos um meio de armazenamento legível por compu- tador não transitório com instruções armazenadas executáveis por computador que, quando executadas pelo ao menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 1a12.
14. Meio de armazenamento legível por computador não transitório, caracterizado pelo fato de que armazena instruções execu- táveis por computador que, quando executadas por pelo menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 1 a 12.
15. Método de sequenciamento de polipeptídeos, caracteri- zado pelo fato de que o método compreende: colocar a única molécula polipeptídica em contato com uma ou mais moléculas de reconhecimento de aminoácidos terminais; e detectar uma série de pulsos de sinal indicativos da associ- ação da uma ou mais moléculas de reconhecimento de aminoácidos terminais com aminoácidos sucessivos expostos em um terminal do único polipeptídeo enquanto o único polipeptídeo está sendo degrada- do, pelo qual sequenciando a única molécula polipeptídica.
16. Método de acordo com a reivindicação 15, caracteriza- do pelo fato de que a associação de uma ou mais moléculas de reco- nhecimento de aminoácidos terminais com cada tipo de aminoácido exposto no terminal produz um padrão característico na série de pul- sos de sinal que é diferente de outros tipos de aminoácidos expostos no terminal.
17. Método de acordo com a reivindicação 16, caracteriza- do pelo fato de que o padrão característico compreende uma parte da série de pulsos de sinal.
18. Método de acordo com a reivindicação 17, caracteriza- do pelo fato de que um pulso de sinal do padrão característico corres- ponde um evento de associação individual entre uma molécula de re- conhecimento de aminoácido terminal e um aminoácido exposto no terminal.
19. Método de acordo com a reivindicação 18, caracteriza- do pelo fato de que o pulso de sinal do padrão característico compre-
ende uma duração do pulso que é característica de uma taxa de dis- sociação da ligação entre a molécula de reconhecimento de aminoáci- do terminal e o aminoácido exposto no terminal.
20. Método de acordo com a reivindicação 19, caracteriza- do pelo fato de que cada pulso de sinal do padrão característico é se- parado do outro por uma duração entre pulsos que é característica de uma taxa de associação da ligação da molécula de reconhecimento de aminoácido terminal.
21. Método de acordo com qualquer uma das reivindica- ções 16 a a 20, caracterizado pelo fato de que o padrão característico corresponde a uma série de interações de ligação reversível da molé- cula de reconhecimento de aminoácido terminal com o aminoácido ex- posto no terminal da única molécula polipeptídica.
22. Método de acordo com a reivindicação 21, caracteriza- do pelo fato de que a série de interações de ligação reversível da mo- lécula de reconhecimento de aminoácido terminal compreende uma formação reversível de uma espécie binária complexa no terminal da única molécula polipeptídica.
23. Método de acordo com a reivindicação 21, caracteriza- do pelo fato de que a série de interações de ligação reversível da mo- lécula de reconhecimento de aminoácido terminal compreende uma formação reversível de espécie binária complexa diferente no terminal da única molécula polipeptídica.
24. Método de acordo com qualquer uma das reivindica- ções 16 a 23, caracterizado pelo fato de que o padrão característico é indicativo do aminoácido exposto no terminal da única molécula poli- peptídica e um aminoácido em uma posição contígua.
25. Método de acordo com a reivindicação 24, caracteriza- do pelo fato de que o aminoácido exposto no terminal e o aminoácido na posição contígua são de um tipo diferente.
26. Método de acordo com qualquer uma das reivindica- ções 15 a 25, caracterizado pelo fato de que o sequenciamento com- preende identificar cada tipo de aminoácido sucessivo exposto no ter- minal do único polipeptídeo enquanto o único polipeptídeo está sendo degradado.
27. Método de acordo com qualquer uma das reivindica- ções 15 a 25, caracterizado pelo fato de que o sequenciamento com- preende identificar uma parte de todos os tipos de aminoácidos suces- sivos expostos no terminal do único polipeptídeo enquanto o único po- lipeptídeo está sendo degradado.
28. Método de acordo com qualquer uma das reivindica- ções 15 a 27, caracterizado pelo fato de que o sequenciamento com- preende determinar as posições relativas do aminoácido sucessivo exposto no terminal do único polipeptídeo enquanto o único polipeptí- deo está sendo degradado.
29. Método de acordo com qualquer uma das reivindica- ções 15 a 28, caracterizado pelo fato de que o sequenciamento com- preende identificar pelo menos dois aminoácidos contíguos na única molécula polipeptídica.
30. Método de acordo com qualquer uma das reivindica- ções 15 a 29, caracterizado pelo fato de que o sequenciamento com- preende identificar pelo menos dois aminoácidos não contíguos na única molécula polipeptídica.
31. Método de acordo com qualquer uma das reivindica- ções 15 a 30, caracterizado pelo fato de que o sequenciamento com- preende identificar um aminoácido exposto no terminal como um ami- noácido natural, um aminoácido não natural ou uma variante modifica- da dos mesmos.
32. Método de acordo com qualquer uma das reivindica- ções 15 a 31, caracterizado pelo fato de que o sequenciamento com-
preende identificar um aminoácido exposto no terminal como portador de uma cadeia lateral com carga, sem carga, polar, não polar, hidrofó- bica, aromática ou uma combinação das mesmas.
33. Método de acordo com a reivindicação 32, caracteriza- do pelo fato de que a cadeia lateral tem carga negativa ou carga posi- tiva.
34. Método de acordo com qualquer uma das reivindica- ções 15 a 33, caracterizado pelo fato de que o sequenciamento com- preende identificar um aminoácido exposto no terminal como de um tipo selecionado dentre alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leu- cina, lisina, metionina, fenilalanina, prolina, selenocisteína, serina, tre- onina, triptofano, tirosina e valina.
35. Método de acordo com qualquer uma das reivindica- ções 15 a 34, caracterizado pelo fato de que o sequenciamento com- preende identificar um aminoácido exposto no terminal como portador de uma modificação pós-traducional.
36. Método de acordo com a reivindicação 35, caracteriza- do pelo fato de que a modificação pós-traducional é selecionada den- tre acetilação, ADP-ribosilação, clivagem por caspases, citrulinação, formilação, glicosilação N-ligada, glicosilação O-ligada, hidroxilação, metilação, miristoilação, nedilação, nitração, oxidação, palmitoilação, fosforilação, prenilação, S-nitrosilação, sulfatação, sumoilação e ubi- quitinação.
37. Método de acordo com qualquer uma das reivindica- ções 15 a 36, caracterizado pelo fato de que a série de pulsos de sinal compreende uma série de mudanças na magnitude de um sinal óptico ao longo do tempo.
38. Método de acordo com a reivindicação 37, caracteriza- do pelo fato de que cada pulso de sinal da série compreende uma plu-
ralidade de eventos de emissão de fótons.
39. Método de acordo com a reivindicação 38, caracteriza- do pelo fato de que o sequenciamento compreende ainda determinar um ou mais dentre tempo de vida da luminescência, brilho da lumines- cência, intensidade da luminescência, comprimento de onda da lumi- nescência, polarização da luminescência e rendimento quântico da luminescência.
40. Método de acordo com qualquer uma das reivindica- ções 15 a 39, caracterizado pelo fato de que a série de pulsos de sinal compreende uma série de mudanças na magnitude de um sinal elétri- co ao longo do tempo.
41. Método de acordo com a reivindicação 40, caracteriza- do pelo fato de que a série de pulsos de sinal compreende transições na condutividade correspondentes a interações de ligação reversível com a única molécula.
42. Método de acordo com qualquer uma das reivindica- ções 15 a 41, caracterizado pelo fato de que cada uma de uma ou mais moléculas de reconhecimento de aminoácidos terminais compre- ende uma proteína de reconhecimento ou um ácido nucleico de reco- nhecimento.
43. Método de acordo com a reivindicação 42, caracteriza- do pelo fato de que a proteína de reconhecimento é uma proteína da via de degradação, uma peptidase, um anticorpo, uma aminotransfe- rase, uma tRNA sintetase, ou uma proteína contendo o domínio SH2 ou fragmento das mesmas.
44. Método de acordo com a reivindicação 43, caracteriza- do pelo fato de que a proteína da via de degradação é uma proteína da via da regra N-terminal ou um mutante ou variante da mesma.
45. Método de acordo com a reivindicação 44, caracteriza- do pelo fato de que a proteína da via da regra N-terminal é uma prote-
íÍna da via da regra Arg/N-terminal, uma proteína da via da regra Ac/N- terminal ou uma proteína da via da regra Pro/N-terminal.
46. Método de acordo com a reivindicação 45, caracteriza- do pelo fato de que a proteína da via da regra N-terminal é uma prote- ína Gid, uma proteína UBR box ou Fragmento contendo o domínio UBR box da mesma, uma proteína p62 ou fragmento contendo o do- mínio ZZ da mesma ou uma proteína CIpS.
47. Método de acordo com a reivindicação 46, caracteriza- do pelo fato de que a proteína Gid é Gid4 ou Gid10 de S. cerevisiae ou uma espécie homóloga da mesma.
48. Método de acordo com a reivindicação 46, caracteriza- do pelo fato de que a proteína UBR box é UBR1 ou UBR2 humana, de S. cerevisiae ou uma espécie homóloga das mesmas.
49. Método de acordo com a reivindicação 46, caracteriza- do pelo fato de que a proteína p62 é p62 humana, de rato ou uma es- pécie homóloga das mesmas.
50. Método de acordo com a reivindicação 46, caracteriza- do pelo fato de que a proteína CIpS é CIpS1 ou CIpS2 de A. tumifaci- ens, C. crescentus, E. coli, S. elongatus, P. falciparum, T. elongatus ou de uma espécie homóloga das mesmas.
51. Método de acordo com qualquer uma das reivindica- ções 42 a 50, caracterizado pelo fato de que a proteína de reconheci- mento é uma proteína sintética ou uma proteína recombinante.
52. Método de acordo com a reivindicação 42, caracteriza- do pelo fato de que o ácido nucleico de reconhecimento é um aptâme- ro de ácido nucleico.
53. Método de acordo com qualquer uma das reivindica- ções 15 a 52, caracterizado pelo fato de que cada uma de uma ou mais moléculas de reconhecimento de aminoácidos terminais compre- ende um marcador detectável.
54. Método de acordo com a reivindicação 53, caracteriza- do pelo fato de que o marcador detectável é um marcador luminescen- te ou um marcador de condutividade.
55. Método de acordo com qualquer uma das reivindica- ções 15 a 54, caracterizado pelo fato de que a única molécula polipep- tídica é imobilizada em uma superfície.
56. Método de acordo com a reivindicação 55, caracteriza- do pelo fato de que a única molécula polipeptídica é imobilizada na superfície através de uma extremidade terminal distal ao terminal com a qual uma ou mais moléculas de reconhecimento de aminoácidos terminais se associam.
57. Método de acordo com a reivindicação 55, caracteriza- do pelo fato de que a única molécula polipeptídica é imobilizada atra- vés de uma extremidade carbóxi-terminal.
58. Método de acordo com a reivindicação 55, caracteriza- do pelo fato de que a única molécula polipeptídica é imobilizada atra- vês de uma extremidade amino-terminal.
59. Método de acordo com qualquer uma das reivindica- ções 55 a 58, caracterizado pelo fato de que a única molécula polipep- tídica é imobilizada na superfície através de um ligante.
60. Método de acordo com a reivindicação 59, caracteriza- do pelo fato de que o ligante compreende uma biomolécula, opcional- mente em que a biomolécula é um oligonucleotídeo.
61. Método de acordo com qualquer uma das reivindica- ções 15 a 60, caracterizado pelo fato de que a única molécula polipep- tídica é degradada por um reagente de clivagem que remove um ou mais aminoácidos do terminal da única molécula polipeptídica.
62. Método de acordo com a reivindicação 61, caracteriza- do pelo fato de que compreende ainda detectar sinais indicativos da associação do reagente de clivagem com o terminal.
63. Método de acordo com a reivindicação 61 ou 62, carac- terizado pelo fato de que o reagente de clivagem compreende um marcador detectável.
64. Método de acordo com a reivindicação 63, caracteriza- do pelo fato de que o marcador detectável é um marcador luminescen- te ou um marcador de condutividade.
65. Método de acordo com qualquer uma das reivindica- ções 15 a 64, caracterizado pelo fato de que a série de pulsos de sinal é uma série de pulsos de sinal em tempo real.
66. Sistema, caracterizado pelo fato de que compreende: pelo menos um processador de hardware; e pelo menos um meio de armazenamento legível por compu- tador não transitório com instruções armazenadas executáveis por computador que, quando executadas pelo ao menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 15a65.
67. Meio de armazenamento legível por computador não transitório, caracterizado pelo fato de que armazena instruções execu- táveis por computador que, quando executadas por pelo menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 15 a 65.
68. Método de sequenciamento de polipeptídeos, caracteri- zado pelo fato de que o método compreende: colocar a única molécula polipeptídica em contato em uma mistura de reação com uma composição compreendendo uma ou mais moléculas de reconhecimento de aminoácidos terminais e um rea- gente de clivagem; e detectar uma série de pulsos de sinal indicativos da associ-
ação de uma ou mais moléculas de reconhecimento de aminoácidos terminais com um terminal da única molécula polipeptídica na presen- ça do reagente de clivagem, em que a série de pulsos de sinal é indi- cativa de uma série de aminoácidos expostos no terminal ao longo do tempo como resultado de clivagem do aminoácido terminal pelo rea- gente de clivagem.
69. Método de acordo com a reivindicação 68, caracteriza- do pelo fato de que associação de uma ou mais moléculas de reco- nhecimento de aminoácidos terminais com cada tipo de aminoácido exposto no terminal produz um padrão característico na série de pul- sos de sinal que é diferente de outros tipos de aminoácidos expostos no terminal.
70. Método de acordo com a reivindicação 69, caracteriza- do pelo fato de que o padrão característico compreende uma parte da série de pulsos de sinal.
71. Método de acordo com a reivindicação 70, caracteriza- do pelo fato de que um pulso de sinal do padrão característico corres- ponde um evento de associação individual entre uma molécula de re- conhecimento de aminoácido terminal e um aminoácido exposto no terminal.
72. Método de acordo com a reivindicação 71, caracteriza- do pelo fato de que o pulso de sinal do padrão característico compre- ende uma duração do pulso que é característica de uma taxa de dis- sociação da ligação entre a molécula de reconhecimento de aminoáci- do terminal e o aminoácido exposto no terminal.
73. Método de acordo com a reivindicação 72, caracteriza- do pelo fato de que cada pulso de sinal do padrão característico é se- parado do outro por uma duração entre pulsos que é característica de uma taxa de associação da ligação da molécula de reconhecimento de aminoácido terminal.
74. Método de acordo com qualquer uma das reivindica- ções 69 a 73, caracterizado pelo fato de que o padrão característico corresponde a uma série de interações de ligação reversível da molé- cula de reconhecimento de aminoácido terminal com o aminoácido ex- posto no terminal da única molécula polipeptídica.
75. Método de acordo com a reivindicação 74, caracteriza- do pelo fato de que a série de interações de ligação reversível da mo- lécula de reconhecimento de aminoácido terminal compreende uma formação reversível de uma espécie binária complexa no terminal da única molécula polipeptídica.
76. Método de acordo com a reivindicação 74, caracteriza- do pelo fato de que a série de interações de ligação reversível da mo- lécula de reconhecimento de aminoácido terminal compreende uma formação reversível de espécie binária complexa diferente no terminal da única molécula polipeptídica.
77. Método de acordo com qualquer uma das reivindica- ções 69-76, caracterizado pelo fato de que o padrão característico é indicativo do aminoácido exposto no terminal da única molécula poli- peptídica e um aminoácido em uma posição contígua.
78. Método de acordo com a reivindicação 77, caracteriza- do pelo fato de que o aminoácido exposto no terminal e o aminoácido na posição contígua são de um tipo diferente.
79. Método de acordo com qualquer uma das reivindica- ções 68 a 78, caracterizado pelo fato de que o sequenciamento com- preende identificar cada tipo de aminoácido sucessivo exposto no ter- minal do único polipeptídeo enquanto o único polipeptídeo está sendo degradado.
80. Método de acordo com qualquer uma das reivindica- ções 68 a 78, caracterizado pelo fato de que o sequenciamento com- preende identificar uma parte de todos os tipos de aminoácidos suces-
sivos expostos no terminal do único polipeptídeo enquanto o único po- lipeptídeo está sendo degradado.
81. Método de acordo com qualquer uma das reivindica- ções 68 a 80, caracterizado pelo fato de que o sequenciamento com- preende determinar as posições relativas do aminoácido sucessivo exposto no terminal do único polipeptídeo enquanto o único polipeptí- deo está sendo degradado.
82. Método de acordo com qualquer uma das reivindica- ções 68 a 81, caracterizado pelo fato de que o sequenciamento com- preende identificar pelo menos dois aminoácidos contíguos na única molécula polipeptídica.
83. Método de acordo com qualquer uma das reivindica- ções 68 a 82, caracterizado pelo fato de que o sequenciamento com- preende identificar pelo menos dois aminoácidos não contíguos na única molécula polipeptídica.
84. Método de acordo com qualquer uma das reivindica- ções 68 a 83, caracterizado pelo fato de que o sequenciamento com- preende identificar um aminoácido exposto no terminal como um ami- noácido natural, um aminoácido não natural ou uma variante modifica- da dos mesmos.
85. Método de acordo com qualquer uma das reivindica- ções 68 a 84, caracterizado pelo fato de que o sequenciamento com- preende identificar um aminoácido exposto no terminal como portador de uma cadeia lateral com carga, sem carga, polar, não polar, hidrofó- bica, aromática ou uma combinação das mesmas.
86. Método de acordo com a reivindicação 85, caracteriza- do pelo fato de que a cadeia lateral tem carga negativa ou carga posi- tiva.
87. Método de acordo com qualquer uma das reivindica- ções 68 a 86, caracterizado pelo fato de que o sequenciamento com-
preende identificar um aminoácido exposto no terminal as um tipo se- lecionado dentre alanina, arginina, asparagina, ácido aspártico, cisteí- na, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, selenocisteína, serina, treonina, triptofano, tirosina e valina.
88. Método de acordo com qualquer uma das reivindica- ções 68 a 87, caracterizado pelo fato de que o sequenciamento com- preende identificar um aminoácido exposto no terminal como portador de uma modificação pós-traducional.
89. Método de acordo com a reivindicação 88, caracteriza- do pelo fato de que a modificação pós-traducional é selecionada den- tre acetilação, ADP-ribosilação, clivagem por caspases, citrulinação, formilação, glicosilação N-ligada, glicosilação O-ligada, hidroxilação, metilação, miristoilação, nedilação, nitração, oxidação, palmitoilação, fosforilação, prenilação, S-nitrosilação, sulfatação, sumoilação, e ubi- quitinação.
90. Método de acordo com qualquer uma das reivindica- ções 68 a 89, caracterizado pelo fato de que a série de pulsos de sinal compreende uma série de mudanças na magnitude de um sinal óptico ao longo do tempo.
91. Método de acordo com a reivindicação 90, caracteriza- do pelo fato de que cada pulso de sinal da série compreende uma plu- ralidade de eventos de emissão de fótons.
92. Método de acordo com a reivindicação 91, caracteriza- do pelo fato de que o sequenciamento compreende ainda determinar um ou mais dentre tempo de vida da luminescência, brilho da lumines- cência, intensidade da luminescência, comprimento de onda da lumi- nescência, polarização da luminescência e rendimento quântico da luminescência.
93. Método de acordo com qualquer uma das reivindica-
ções 68 a 92, caracterizado pelo fato de que a série de pulsos de sinal compreende uma série de mudanças na magnitude de um sinal elétri- co ao longo do tempo.
94. Método de acordo com a reivindicação 93, caracteriza- do pelo fato de que a série de pulsos de sinal compreende transições na condutividade correspondentes a interações de ligação reversível com a única molécula.
95. Método de acordo com qualquer uma das reivindica- ções 68 a 94, caracterizado pelo fato de que cada uma de uma ou mais moléculas de reconhecimento de aminoácidos terminais compre- ende uma proteína de reconhecimento ou um ácido nucleico de reco- nhecimento.
96. Método de acordo com a reivindicação 95, caracteriza- do pelo fato de que a proteína de reconhecimento é uma proteína da via de degradação, uma peptidase, um anticorpo, uma aminotransfe- rase, uma tRNA sintetase, ou uma proteína contendo o domínio SH2 ou fragmento das mesmas.
97. Método de acordo com a reivindicação 96, caracteriza- do pelo fato de que a proteína da via de degradação é uma proteína da via da regra N-terminal ou um mutante ou variante da mesma.
98. Método de acordo com a reivindicação 97, caracteriza- do pelo fato de que a proteína da via da regra N-terminal é uma prote- íÍna da via da regra Arg/N-terminal, uma proteína da via da regra Ac/N- terminal ou uma proteína da via da regra Pro/N-terminal.
99. Método de acordo com a reivindicação 98, caracteriza- do pelo fato de que a proteína da via da regra N-terminal é uma prote- ína Gid, uma proteína UBR box ou Fragmento contendo o domínio UBR box da mesma, uma proteína p62 ou fragmento contendo o do- mínio ZZ da mesma ou uma proteína CIpS.
100. Método de acordo com a reivindicação 99, caracteri-
zado pelo fato de que a proteína Gid é Gid4 ou Gid10 de S. cerevisiae ou uma espécie homóloga da mesma.
101. Método de acordo com a reivindicação 99, caracteri- zado pelo fato de que a proteína UBR box é UBR1 ou UBR2 humana, de S. cerevisiae ou uma espécie homóloga das mesmas.
102. Método de acordo com a reivindicação 99, caracteri- zado pelo fato de que a proteína p62 é p62 humana, de rato ou uma espécie homóloga das mesmas.
103. Método de acordo com a reivindicação 99, caracteri- zado pelo fato de que a proteína CIpS é CIpS1 ou CIpS2? e A. tumifaci- ens, C. crescentus, E. coli, S. elongatus, P. falciparum, T. elongatus ou de uma espécie homóloga das mesmas.
104. Método de acordo com qualquer uma das reivindica- ções 95 a 103, caracterizado pelo fato de que a proteína de reconhe- cimento é uma proteína sintética ou uma proteína recombinante.
105. Método de acordo com a reivindicação 95, caracteri- zado pelo fato de que o ácido nucleico de reconhecimento é um aptà- mero de ácido nucleico.
106. Método de acordo com qualquer uma das reivindica- ções 68 a 105, caracterizado pelo fato de cada uma de uma ou mais moléculas de reconhecimento de aminoácidos terminais compreende um marcador detectável.
107. Método de acordo com a reivindicação 106, caracteri- zado pelo fato de que o marcador detectável é um marcador lumines- cente ou um marcador de condutividade.
108. Método de acordo com qualquer uma das reivindica- ções 68 a 107, caracterizado pelo fato de que a única molécula poli- peptídica é imobilizada em uma superfície.
109. Método de acordo com a reivindicação 108, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada na superfície através de uma extremidade terminal distal ao terminal com a qual uma ou mais moléculas de reconhecimento de aminoácidos terminais se associam.
110. Método de acordo com a reivindicação 108, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada através de uma extremidade carbóxi-terminal.
111. Método de acordo com a reivindicação 108, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada através de uma extremidade amino-terminal.
112. Método de acordo com qualquer uma das reivindica- ções 108 a 111, caracterizado pelo fato de que a única molécula poli- peptídica é imobilizada na superfície através de um ligante.
113. Método de acordo com a reivindicação 112, caracteri- zado pelo fato de que o ligante compreende uma biomolécula, opcio- nalmente em que a biomolécula é um oligonucleotídeo.
114. Método de acordo com qualquer uma das reivindica- ções 68 a 113, caracterizado pelo fato de que compreende ainda de- tectar sinais indicativos da associação do reagente de clivagem com o terminal.
115. Método de acordo com qualquer uma das reivindica- ções 68 a 114, caracterizado pelo fato de que o reagente de clivagem compreende um marcador detectável.
116. Método de acordo com a reivindicação 115, caracteri- zado pelo fato de que o marcador detectável é um marcador lumines- cente ou um marcador de condutividade.
117. Método de acordo com qualquer uma das reivindica- ções 68 a 116, caracterizado pelo fato de que a série de pulsos de si- nal é uma série de pulsos de sinal em tempo real.
118. Sistema, caracterizado pelo fato de que compreende: pelo menos um processador de hardware; e pelo menos um meio de armazenamento legível por compu- tador não transitório com instruções armazenadas executáveis por computador que, quando executadas pelo ao menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 68 a 117.
119. Meio de armazenamento legível por computador não transitório, caracterizado pelo fato de que armazena instruções execu- táveis por computador que, quando executadas por pelo menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 68 a 117.
120. Método de sequenciamento de polipeptídeos, caracte- rizado pelo fato de que o método compreende: a) identificar um primeiro aminoácido em um terminal de uma molécula de um único polipeptídeo; b) remover o primeiro aminoácido para expor um segundo aminoácido no terminal da única molécula polipeptídica; e c) identificar o segundo aminoácido no terminal da única molécula polipeptídica, em que (a)-(c) são realizados em uma única mistura de re- ação.
121. Método de acordo com a reivindicação 120, caracteri- zado pelo fato de que (a)-(c) ocorrem sequencialmente.
122. Método de acordo com a reivindicação 120, caracteri- zado pelo fato de que (c) ocorre antes de (a) e (b).
123. Método de acordo com qualquer uma das reivindica- ções 120 a 122, caracterizado pelo fato de que a única mistura de rea- ção compreende uma ou mais moléculas de reconhecimento de ami- noácidos terminais.
124. Método de acordo com a reivindicação 123, caracteri- zado pelo fato de que o primeiro e o segundo aminoácido são identifi- cados pela detecção de uma série de pulsos de sinal indicativos da associação de uma ou mais moléculas de reconhecimento de aminoá- cidos terminais com o terminal da única molécula polipeptídica.
125. Método de acordo com a reivindicação 124, caracteri- zado pelo fato de que a associação de uma ou mais moléculas de re- conhecimento de aminoácidos terminais com o primeiro aminoácido produz um padrão característico na série de pulsos de sinal que é dife- rente do segundo aminoácido.
126. Método de acordo com qualquer uma das reivindica- ções 120 a 125, caracterizado pelo fato de que cada uma de uma ou mais moléculas de reconhecimento de aminoácidos terminais compre- ende uma proteína de reconhecimento ou um ácido nucleico de reco- nhecimento.
127. Método de acordo com a reivindicação 126, caracteri- zado pelo fato de que a proteína de reconhecimento é uma proteína da via de degradação, uma peptidase, um anticorpo, uma aminotransfe- rase, uma tRNA sintetase, ou uma proteína contendo o domínio SH2 ou fragmento das mesmas.
128. Método de acordo com a reivindicação 127, caracteri- zado pelo fato de que a proteína da via de degradação é uma proteína da via da regra N-terminal ou um mutante ou variante da mesma.
129. Método de acordo com a reivindicação 128, caracteri- zado pelo fato de que a proteína da via da regra N-terminal é uma pro- teína da via da regra Arg/N-terminal, uma proteína da via da regra Ac/N-terminal ou uma proteína da via da regra Pro/N-terminal.
130. Método de acordo com a reivindicação 129, caracteri- zado pelo fato de que a proteína da via da regra N-terminal é uma pro- teína Gid, uma proteína UBR box ou Fragmento contendo o domínio
UBR box da mesma, uma proteína p62 ou fragmento contendo o do- mínio ZZ da mesma ou uma proteína CIpS.
131. Método de acordo com a reivindicação 130, caracteri- zado pelo fato de que a proteína Gid é Gid4 ou Gid10 de S. cerevisiae ou uma espécie homóloga da mesma.
132. Método de acordo com a reivindicação 130, caracteri- zado pelo fato de que a proteína UBR box é UBR1 ou UBR2 humana, de S. cerevisiae ou uma espécie homóloga das mesmas.
133. Método de acordo com a reivindicação 130, caracteri- zado pelo fato de que a proteína p62 é p62 humana ou de rato ou uma espécie homóloga das mesmas.
134. Método de acordo com a reivindicação 130, caracteri- zado pelo fato de que a proteína CIpS é CIpS1 ou CIpS2 de A. tumifa- ciens, C. crescentus, E. coli, S. elongatus, P. falciparum, T. elongatus ou de uma espécie homóloga das mesmas.
135. Método de acordo com qualquer uma das reivindica- ções 126 a 134, caracterizado pelo fato de que a proteína de reconhe- cimento é uma proteína sintética ou uma proteína recombinante.
136. Método de acordo com a reivindicação 126, caracteri- zado pelo fato de que o ácido nucleico de reconhecimento é um aptà- mero de ácido nucleico.
137. Método de acordo com qualquer uma das reivindica- ções 120 a 136, caracterizado pelo fato de que cada uma de uma ou mais moléculas de reconhecimento de aminoácidos terminais compre- ende um marcador detectável.
138. Método de acordo com a reivindicação 137, caracteri- zado pelo fato de que o marcador detectável é um marcador lumines- cente ou um marcador de condutividade.
139. Método de acordo com qualquer uma das reivindica- ções 120 a 138, caracterizado pelo fato de que a única mistura de rea-
ção compreende um reagente de clivagem que remove um ou mais aminoácidos do terminal da única molécula polipeptídica.
140. Método de acordo com a reivindicação 139, caracteri- zado pelo fato de que o primeiro aminoácido é removido pelo reagente de clivagem.
141. Método de acordo com a reivindicação 139 ou 140, ca- racterizado pelo fato de que o reagente de clivagem compreende um marcador detectável.
142. Método de acordo com a reivindicação 141, caracteri- zado pelo fato de que o marcador detectável é um marcador lumines- cente ou um marcador de condutividade.
143. Método de acordo com qualquer uma das reivindica- ções 120 a 142, caracterizado pelo fato de que a única molécula poli- peptídica é imobilizada em uma superfície.
144. Método de acordo com a reivindicação 143, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada na superfície através de uma extremidade terminal distal ao terminal do qual o primeiro aminoácido é removido.
145. Método de acordo com a reivindicação 143, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada através de uma extremidade carbóxi-terminal.
146. Método de acordo com a reivindicação 143, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada através de uma extremidade amino-terminal.
147. Método de acordo com qualquer uma das reivindica- ções 143 a 146, caracterizado pelo fato de que a única molécula poli- peptídica é imobilizada na superfície através de um ligante.
148. Método de acordo com a reivindicação 147, caracteri- zado pelo fato de que o ligante compreende uma biomolécula, opcio- nalmente em que a biomolécula é um oligonucleotídeo.
149. Método de acordo com qualquer uma das reivindica- ções 124-148, caracterizado pelo fato de que a série de pulsos de si- nal é uma série de pulsos de sinal em tempo real.
150. Sistema, caracterizado pelo fato de que compreende: pelo menos um processador de hardware; e pelo menos um meio de armazenamento legível por compu- tador não transitório com instruções armazenadas executáveis por computador que, quando executadas pelo ao menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 120 a 149.
151. Meio de armazenamento legível por computador não transitório, caracterizado pelo fato de que armazena instruções execu- táveis por computador que, quando executadas por pelo menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 120 a 149.
152. Método para identificação de um aminoácido de um polipeptídeo, caracterizado pelo fato de que o método compreende: colocar a única molécula polipeptídica em contato com uma ou mais moléculas de reconhecimento de aminoácidos que se ligam à única molécula polipeptídica; detectar uma série de pulsos de sinal indicativos da associ- ação de uma ou mais moléculas de reconhecimento de aminoácidos com a única molécula polipeptídica sob condições de degradação de polipeptídeos; e identificar um primeiro tipo de aminoácido na única molécu- la polipeptídica com base em um primeiro padrão característico na sé- rie de pulsos de sinal.
153. Método de acordo com a reivindicação 152, caracteri-
zado pelo fato de que o primeiro padrão característico compreende pelo menos uma parte da série de pulsos de sinal.
154. Método de acordo com a reivindicação 153, caracteri- zado pelo fato de que um pulso de sinal do primeiro padrão caracterís- tico corresponde a um evento de associação individual entre uma mo- lécula de reconhecimento de aminoácido e o primeiro tipo de aminoá- cido.
155. Método de acordo com a reivindicação 154, caracteri- zado pelo fato de que o pulso de sinal do primeiro padrão característi- co compreende uma duração do pulso que é característica de uma ta- xa de dissociação da ligação entre a molécula de reconhecimento de aminoácido e o primeiro tipo de aminoácido.
156. Método de acordo com a reivindicação 155, caracteri- zado pelo fato de que cada pulso de sinal do primeiro padrão caracte- rístico é separado do outro por uma duração entre pulsos que é carac- terística de uma taxa de associação da ligação da molécula de reco- nhecimento de aminoácido.
157. Método de acordo com qualquer uma das reivindica- ções 152 a 156, caracterizado pelo fato de que o primeiro padrão ca- racterístico corresponde a uma série de interações de ligação reversí- vel da molécula de reconhecimento de aminoácido com o primeiro tipo de aminoácido na única molécula polipeptídica.
158. Método de acordo com a reivindicação 157, caracteri- zado pelo fato de que a série de interações de ligação reversível da molécula de reconhecimento de aminoácido compreende uma forma- ção reversível de uma espécie binária complexa no terminal da única molécula polipeptídica.
159. Método de acordo com a reivindicação 157, caracteri- zado pelo fato de que a série de interações de ligação reversível da molécula de reconhecimento de aminoácido compreende uma forma-
ção reversível de espécie binária complexa diferente no terminal da única molécula polipeptídica.
160. Método de acordo com qualquer uma das reivindica- ções 152 a 159, caracterizado pelo fato de que a única molécula poli- peptídica compreende o primeiro tipo de aminoácido em uma posição terminal da única molécula polipeptídica.
161. Método de acordo com a reivindicação 160, caracteri- zado pelo fato de que o primeiro padrão característico é indicativo do primeiro tipo de aminoácido na posição terminal e um tipo de aminoá- cido em uma posição contígua.
162. Método de acordo com a reivindicação 161, caracteri- zado pelo fato de que o aminoácidos na posição terminal e na posição contígua são de um tipo diferente,
163. Método de acordo com qualquer uma das reivindica- ções 152 a 162, caracterizado pelo fato de que a única molécula poli- peptídica compreende o primeiro tipo de aminoácido em uma posição interna da única molécula polipeptídica.
164. Método de acordo com qualquer uma das reivindica- ções 160 a 163, caracterizado pelo fato de que a única molécula poli- peptídica compreende o primeiro tipo de aminoácido na posição termi- nal e em uma posição interna não contígua da única molécula polipep- tídica.
165. Método de acordo com a reivindicação 164, caracteri- zado pelo fato de que o primeiro padrão característico é indicativo do primeiro tipo de aminoácido na posição terminal e um tipo de aminoá- cido na posição interna não contígua.
166. Método de acordo com a reivindicação 164 ou 165, ca- racterizado pelo fato de que o primeiro padrão característico é indicati- vo de uma abundância do primeiro tipo de aminoácido na única molé- cula polipeptídica.
167. Método de acordo com qualquer uma das reivindica- ções 152 a 166, caracterizado pelo fato de que a identificação com- preende identificar o primeiro tipo de aminoácido como um aminoácido natural, um aminoácido não natural ou uma variante modificada dos mesmos.
168. Método de acordo com qualquer uma das reivindica- ções 152 a 167, caracterizado pelo fato de que a identificação com- preende identificar o primeiro tipo de aminoácido como portador de uma cadeia lateral é com carga, sem carga, polar, não polar, hidrofóbi- ca, aromática ou uma combinação das mesmas.
169. Método de acordo com a reivindicação 168, caracteri- zado pelo fato de que a cadeia lateral tem carga negativa ou carga po- sitiva.
170. Método de acordo com qualquer uma das reivindica- ções 152 a 169, caracterizado pelo fato de que a identificação com- preende identificar o primeiro tipo de aminoácido como um tipo seleci- onado dentre alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, selenocisteína, serina, treonina, tripto- fano, tirosina e valina.
171. Método de acordo com qualquer uma das reivindica- ções 152 a 170, caracterizado pelo fato de que a identificação com- preende identificar o primeiro tipo de aminoácido como portador de uma modificação pós-traducional.
172. Método de acordo com a reivindicação 171, caracteri- zado pelo fato de que a modificação pós-traducional é selecionada dentre acetilação, ADP-ribosilação, clivagem por caspases, citrulina- ção, formilação, glicosilação N-ligada, glicosilação O-ligada, hidroxila- ção, metilação, miristoilação, nedilação, nitração, oxidação, palmitoila- ção, fosforilação, prenilação, S-nitrosilação, sulfatação, sumoilação e ubiquitinação.
173. Método de acordo com qualquer uma das reivindica- ções 152 a 172, caracterizado pelo fato de que a série de pulsos de sinal compreende uma série de mudanças na magnitude de um sinal óptico ao longo do tempo.
174. Método de acordo com a reivindicação 173, caracteri- zado pelo fato de que cada pulso de sinal da série compreende uma pluralidade de eventos de emissão de fótons.
175. Método de acordo com a reivindicação 174, caracteri- zado pelo fato de que a identificação do primeiro tipo de aminoácido compreende ainda determinar um ou mais dentre tempo de vida da luminescência, brilho da luminescência, intensidade da luminescência, comprimento de onda da luminescência, polarização da luminescência e rendimento quântico da luminescência.
176. Método de acordo com qualquer uma das reivindica- ções 152 a 175, caracterizado pelo fato de que a série de pulsos de sinal compreende uma série de mudanças na magnitude de um sinal elétrico ao longo do tempo.
177. Método de acordo com a reivindicação 176, caracteri- zado pelo fato de que em que o primeiro padrão característico com- preende transições na condutividade correspondentes a interações de ligação reversível com a única molécula.
178. Método de acordo com qualquer uma das reivindica- ções 152 a 177, caracterizado pelo fato de que cada uma de uma ou mais moléculas de reconhecimento de aminoácidos compreende uma proteína de reconhecimento ou um ácido nucleico de reconhecimento.
179. Método de acordo com a reivindicação 178, caracteri- zado pelo fato de que a proteína de reconhecimento é uma proteína da via de degradação, uma peptidase, um anticorpo, uma aminotransfe- rase, uma tRNA sintetase, ou uma proteína contendo o domínio SH2 ou fragmento das mesmas.
180. Método de acordo com a reivindicação 179, caracteri- zado pelo fato de que a proteína da via de degradação é uma proteína da via da regra N-terminal ou um mutante ou variante da mesma.
181. Método de acordo com a reivindicação 180, caracteri- zado pelo fato de que a proteína da via da regra N-terminal é uma pro- teína da via da regra Arg/N-terminal, uma proteína da via da regra Ac/N-terminal ou uma proteína da via da regra Pro/N-terminal.
182. Método de acordo com a reivindicação 181, caracteri- zado pelo fato de que a proteína da via da regra N-terminal é uma pro- teína Gid, uma proteína UBR box ou Fragmento contendo o domínio UBR box da mesma, uma proteína p62 ou fragmento contendo o do- mínio ZZ da mesma ou uma proteína CIpS.
183. Método de acordo com a reivindicação 182, caracteri- zado pelo fato de que a proteína Gid é Gid4 ou Gid10 de S. cerevisiae ou uma espécie homóloga da mesma.
184. Método de acordo com a reivindicação 182, caracteri- zado pelo fato de que a proteína UBR box é UBR1 ou UBR2 humana, de S. cerevisiae ou uma espécie homóloga das mesmas.
185. Método de acordo com a reivindicação 182, caracteri- zado pelo fato de que a proteína p62 é p62 humana, de rato ou uma espécie homóloga das mesmas.
186. Método de acordo com a reivindicação 182, caracteri- zado pelo fato de que a proteína CIpS é CIpS1 ou CIpS2 de A. tumifa- ciens, C. crescentus, E. coli, S. elongatus, P. falciparum, T. elongatus ou de uma espécie homóloga das mesmas.
187. Método de acordo com qualquer uma das reivindica- ções 178 a 186, caracterizado pelo fato de que a proteína de reconhe- cimento é uma proteína sintética ou uma proteína recombinante.
188. Método de acordo com a reivindicação 178, caracteri-
zado pelo fato de que o ácido nucleico de reconhecimento é um aptà- mero de ácido nucleico.
189. Método de acordo com qualquer uma das reivindica- ções 152 a 188, caracterizado pelo fato de que cada uma de uma ou mais moléculas de reconhecimento de aminoácidos compreende um marcador detectável.
190. Método de acordo com a reivindicação 189, caracteri- zado pelo fato de que o marcador detectável é um marcador lumines- cente ou um marcador de condutividade.
191. Método de acordo com qualquer uma das reivindica- ções 152 a 190, caracterizado pelo fato de que a única molécula poli- peptídica é imobilizada em uma superfície.
192. Método de acordo com a reivindicação 191, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada na superfície através de um terminal, e de que uma ou mais moléculas de reconhecimento de aminoácidos ligam-se à única molécula polipeptídi- ca no outro terminal.
193. Método de acordo com a reivindicação 192, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada através de um carbóxi-terminal, e de que uma ou mais moléculas de reconhecimento de aminoácidos ligam-se à única molécula polipeptídi- ca no amino-terminal.
194. Método de acordo com a reivindicação 192, caracteri- zado pelo fato de que a única molécula polipeptídica é imobilizada através de um amino-terminal, e de que uma ou mais moléculas de reconhecimento de aminoácidos ligam-se à única molécula polipeptídi- ca no carbóxi-terminal.
195. Método de acordo com qualquer uma das reivindica- ções 191 a 194, caracterizado pelo fato de que a única molécula poli- peptídica é imobilizada na superfície através de um ligante.
196. Método de acordo com a reivindicação 195, caracteri- zado pelo fato de que o ligante compreende uma biomolécula, opcio- nalmente em que a biomolécula é um oligonucleotídeo.
197. Método de acordo com qualquer uma das reivindica- ções 152 a 196, caracterizado pelo fato de que compreende ainda ob- servar a degradação da única molécula polipeptídica.
198. Método de acordo com qualquer uma das reivindica- ções 152 a 197, caracterizado pelo fato de que as condições de de- gradação compreendem detectar a série de pulsos de sinal na presen- ça de um reagente de clivagem que é capaz de remover um ou mais aminoácidos terminais de um terminal da única molécula polipeptídica.
199. Método de acordo com a reivindicação 198, caracteri- zado pelo fato de que compreende ainda detectar um pulso de sinal indicativos da associação do reagente de clivagem com a única molé- cula polipeptídica.
200. Método de acordo com a reivindicação 198 ou 199, ca- racterizado pelo fato de que o reagente de clivagem compreende um marcador detectável.
201. Método de acordo com a reivindicação 200, caracteri- zado pelo fato de que o marcador detectável é um marcador lumines- cente ou um marcador de condutividade.
202. Método de acordo com qualquer uma das reivindica- ções 197 a 201, caracterizado pelo fato de que compreende ainda identificar um segundo tipo de aminoácido na única molécula polipep- tídica com base em um segundo padrão característico na série de pul- sos de sinal.
203. Método de acordo com a reivindicação 202, caracteri- zado pelo fato de que o segundo padrão característico de pulsos de sinal é indicativo da remoção do primeiro tipo de aminoácido da única molécula polipeptídica.
204. Método de acordo com qualquer uma das reivindica- ções 152 a 203, caracterizado pelo fato de que a série de pulsos de sinal é uma série de pulsos de sinal em tempo real.
205. Sistema, caracterizado pelo fato de que compreende: pelo menos um processador de hardware; e pelo menos um meio de armazenamento legível por compu- tador não transitório com instruções armazenadas executáveis por computador que, quando executadas pelo ao menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 152 a 204.
206. Meio de armazenamento legível por computador não transitório, caracterizado pelo fato de que armazena instruções execu- táveis por computador que, quando executadas por pelo menos um processador de hardware, faz com que o ao menos um processador de hardware execute o método como definido em qualquer uma das reivindicações 152 a 204.
207. Composição, caracterizada pelo fato de que compre- ende uma molécula de reconhecimento de aminoácido solúvel de Fórmula (1): A-(Y))-D (1), em que: A é um componente de ligação a um aminoácido compre- endendo pelo menos uma molécula de reconhecimento de aminoáci- do; em cada caso, Y é um polímero que forma um grupo de |i- gação covalente ou não covalente; n é um número inteiro de 1 a 10, inclusive; e D é um componente marcador compreendendo pelo menos um marcador detectável, em que D tem menos que 200 À de diâmetro.
208. Composição de acordo com a reivindicação 207, ca- racterizada pelo fato de que -(Y),- tem pelo menos 2 nm de compri- mento.
209. Composição de acordo com a reivindicação 207, ca- racterizada pelo fato de que -(Y),- tem pelo menos 5 nm de compri- mento.
210. Composição de acordo com a reivindicação 207, ca- racterizada pelo fato de que -(Y)n- tem pelo menos 10 nm de compri- mento.
211. Composição de acordo com qualquer uma das reivin- dicações 207 a 210, caracterizada pelo fato de que, em cada caso, Y é independentemente uma biomolécula, um poliol ou um dendrímero.
212. Composição de acordo com a reivindicação 211, ca- racterizada pelo fato de que a biomolécula é um ácido nucleico, um polipeptídeo ou um polissacarídeo.
213. Composição de acordo com qualquer uma das reivin- dicações 207 a 212, caracterizada pelo fato de que a molécula de re- conhecimento de aminoácido solúvel é de uma das fórmulas seguin- tes: A-Y-(Y)m-D ou A-(Y)m-Y*-D, em que: Y'? é um ácido nucleico ou um polipeptídeo; e m é um número inteiro de O a 10, inclusive.
214. Composição de acordo com a reivindicação 212 ou 213, em que o ácido nucleico compreende uma primeira fita de oligo- nucleotídeo.
215. Composição de acordo com a reivindicação 214, ca- racterizada pelo fato de que o ácido nucleico compreende uma segun- da fita de oligonucleotídeo hibridizada com o primeira fita de oligonu-
cleotídeo.
216. Composição de acordo com a reivindicação 214 ou 215, caracterizada pelo fato de que o ácido nucleico forma uma liga- ção covalente através da primeira fita de oligonucleotídeo.
217. Composição de acordo com a reivindicação 215, ca- racterizada pelo fato de que o ácido nucleico forma uma ligação não covalente através da primeira fita e da segunda fita de oligonucleotí- deo hibridizadas.
218. Composição de acordo com qualquer uma das reivin- dicações 212 a 217, caracterizada pelo fato de que o polipeptídeo é uma proteína monovalente ou multivalente.
219. Composição de acordo com a reivindicação 218, ca- racterizada pelo fato de que a proteína monovalente ou multivalente forma pelo menos uma ligação não covalente através de uma porção de ligando anexada a um sítio de ligação ao ligando da proteína mo- novalente ou multivalente.
220. Composição de acordo com a reivindicação 219, ca- racterizada pelo fato de que A, Y, ou D compreende a porção de ligan- do.
221. Composição de acordo com qualquer uma das reivin- dicações 207 a 212, caracterizada pelo fato de que a molécula de re- conhecimento de aminoácido solúvel é de uma das fórmulas seguin- tes: A-(Y)m-Y?-D ou A-Yº2-(Y)m-D, em que: Y? é um poliol ou dendrímero; e m é um número inteiro de O a 10, inclusive.
222. Composição de acordo com a reivindicação 221, ca- racterizada pelo fato de que o poliol ou dendrímero compreende polie- tilenoglicol, tetraetilenoglicol, politamidoamina), poli(propilenoimina),
poli(propilenoamina), carbosilano, poli(L-lisina) ou uma combinação de um ou mais dos mesmos.
223. Composição de acordo com qualquer uma das reivin- dicações 207 a 222, caracterizada pelo fato de que A compreende uma pluralidade de moléculas de reconhecimento de aminoácidos.
224. Composição de acordo com a reivindicação 223, ca- racterizada pelo fato de que cada molécula de reconhecimento de aminoácido da pluralidade é anexada a um sítio de ligação diferente em Y.
225. Composição de acordo com a reivindicação 223, ca- racterizada pelo fato de que pelo menos duas moléculas de reconhe- cimento de aminoácidos da pluralidade são anexada a um único sítio de ligação em Y.
226. Composição de acordo com qualquer uma das reivin- dicações 207 a 225, caracterizada pelo fato de que a molécula de re- conhecimento de aminoácido é uma proteína de reconhecimento ou um aptâmero de ácido nucleico.
227. Composição de acordo com a reivindicação 226, ca- racterizada pelo fato de que a proteína de reconhecimento é uma pro- teína da via de degradação, uma peptidase, um anticorpo, uma amino- transferase, uma tRNA sintetase ou uma proteína contendo o domínio SH2 ou fragmento das mesmas.
228. Composição de acordo com a reivindicação 227, ca- racterizada pelo fato de que a proteína da via de degradação é uma proteína da via da regra N-terminal ou um mutante ou variante da mesma.
229. Composição de acordo com a reivindicação 228, ca- racterizada pelo fato de que a proteína da via da regra N-terminal é uma proteína da via da regra Arg/N-terminal, uma proteína da via da regra Ac/N-terminal ou uma proteína da via da regra Pro/N-terminal.
230. Composição de acordo com a reivindicação 229, ca- racterizada pelo fato de que a proteína da via da regra N-terminal é uma proteína Gid, uma proteína UBR box fragmento contendo o domí- nio UBR box da mesma, uma proteína p62 ou fragmento o domínio ZZ da mesma ou uma proteína CIpS.
231. Composição de acordo com a reivindicação 230, ca- racterizada pelo fato de que a proteína Gid é Gid4 ou Gid10 de S. ce- revisiae ou de uma espécie homóloga da mesma.
232. Composição de acordo com a reivindicação 230, ca- racterizada pelo fato de que a proteína UBR box é UBR1 ou UBR2 humana, de S. cerevisiae ou de uma espécie homóloga das mesmas.
233. Composição de acordo com a reivindicação 230, ca- racterizada pelo fato de que a proteína p62 é p62 humana, de rato ou de uma espécie homóloga das mesmas.
234. Composição de acordo com a reivindicação 230, ca- racterizada pelo fato de que a proteína CIpS é CIpS1 ou CIpS2 de A. tumifaciens, C. crescentus, E. coli, S. elongatus, P falciparum, T. elon- gatus ou de uma espécie homóloga das mesmas.
235. Composição de acordo com qualquer uma das reivin- dicações 207 a 234, caracterizada pelo fato de que o marcador detec- tável é um marcador luminescente ou um marcador de condutividade.
236. Composição de acordo com a reivindicação 235, ca- racterizada pelo fato de que o marcador luminescente compreende pelo menos uma molécula de corante fluoróforo.
237. Composição de acordo com a reivindicação 236, ca- racterizada pelo fato de que D compreende 20 ou menos moléculas de corante fluoróforo.
238. Composição de acordo com a reivindicação 236 ou 237, caracterizada pelo fato de que a razão número de moléculas de corante fluoróforo/número de moléculas de reconhecimento de amino-
ácidos é entre 1:1 e 20:1.
239. Composição de acordo com qualquer uma das reivin- dicações 235 a 238, caracterizada pelo fato de que o marcador lumi- nescente compreende pelo menos um par de FRET compreendendo um marcador doador e um marcador aceitador.
240. Composição de acordo com a reivindicação 239, ca- racterizada pelo fato de que a razão marcador doador/marcador acei- tador é 1:1, 2:1, 3:1, 4:1 ou 5:1.
241. Composição de acordo com a reivindicação 239, ca- racterizada pelo fato de que a razão marcador aceitador/marcador do- ador é 1:1, 2:1, 3:1, 4:1 ou 5:1.
242. Molécula de reconhecimento de aminoácido, caracteri- zada pelo fato de que é de Fórmula (Il): AY-D (1), em que: A é um componente de ligação a um aminoácido compre- endendo pelo menos uma molécula de reconhecimento de aminoáci- do; Y'º é um ácido nucleico ou um polipeptídeo; D é um componente marcador compreendendo pelo menos um marcador detectável; desde que, quando Y' for um ácido nucleico, o ácido nu- cleico forma um grupo de ligação covalente ou não covalente; e desde que, quando Y' for um polipeptídeo, o polipeptídeo forma um grupo de ligação não covalente caracterizado por uma cons- tante de dissociação (Kp) inferior a 50 x 10º M.
243. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 242, caracterizada pelo fato de que -Y'- tem pelo menos 2 nm de comprimento.
244. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 242, caracterizada pelo fato de que -Y'*- tem pelo menos 5 nm de comprimento.
245. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 242, caracterizada pelo fato de que -Y'*- tem pelo menos 10 nm de comprimento.
246. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 242 a 245, caracterizada pelo fato de que o ácido nucleico compreende uma primeira fita de oligonu- cleotídeo.
247. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 246, caracterizada pelo fato de que o ácido nu- cleico compreende uma segunda fita de oligonucleotídeo hibridizada com a primeira fita de oligonucleotídeo.
248. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 247, caracterizada pelo fato de que A é anexada à primeira fita de oligonucleotídeo, e em que D é anexada à segunda fita de oligonucleotídeo.
249. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 246 ou 247, caracterizada pelo fato de que A é anexada a um primeiro sítio de ligação na primeira fita de oligonucleo- tídeo, e de que D é anexada a um segundo sítio de ligação na primeira fita de oligonucleotídeo.
250. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 246 a 249, caracterizada pelo fato de que cada fita de oligonucleotídeo do ácido nucleico compreen- de menos de 150, menos de 100 ou menos de 50 nucleotídeos.
251. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 242 a 250, caracterizada pelo fato de que o polipeptídeo é uma proteína monovalente ou multivalen-
te.
252. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 251, caracterizada pelo fato de que a proteína monovalente ou multivalente forma pelo menos uma ligação não cova- lente através de uma porção de ligando anexada a um sítio de ligação ao ligando da proteína monovalente ou multivalente.
253. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 252, caracterizada pelo fato de que pelo menos um dentre A e D compreende a porção de ligando.
254. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 242 a 253, caracterizada pelo fato de que o polipeptídeo é uma proteína avidina.
255. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 254, caracterizada pelo fato de que a proteína avidina é avidina, estreptavidina, traptavidina, tamavidina, bradavidina, xenavidina ou um homólogo ou variante das mesmas.
256. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 252-255, caracterizada pelo fato de que a porção de ligando é uma porção de biotina.
257. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 242 a 256, caracterizada pelo fato de que a Kp é inferior a 1 x 10º M, inferior a 1 x 10º M, inferior a 1x10! M ou inferior a 1 x 10º M.
258. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 242 a 257, caracterizada pelo fato de que a molécula de reconhecimento de aminoácido é de uma das fórmulas seguintes: A-Y-(Y)n-D ou A-(Y)n-Y*-D, em que: em cada caso, Y é um polímero que forma um grupo de |i-
gação covalente ou não covalente; e n é um número inteiro de 1 a 10, inclusive.
259. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 258, caracterizada pelo fato de que, em cada ca- so, Y é independentemente uma biomolécula, um poliol ou um den- drímero.
260. Molécula de reconhecimento de aminoácido, caracteri- zada pelo fato de que compreende: um ácido nucleico; pelo menos uma molécula de reconhecimento de aminoáci- do anexada a um primeiro sítio de ligação no ácido nucleico; e pelo menos um marcador detectável anexada a um segun- do sítio de ligação no ácido nucleico, em que o ácido nucleico forma um grupo de ligação cova- lente ou não covalente entre pelo menos uma molécula de reconheci- mento de aminoácido e pelo menos um marcador detectável.
261. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 260, caracterizada pelo fato de que o ácido nu- cleico é um ácido nucleico de fita dupla compreendendo uma primeira fita de oligonucleotídeo hibridizada com uma segunda fita de oligonu- cleotídeo.
262. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 261, caracterizada pelo fato de que o primeiro sí- tio de ligação está na primeira fita de oligonucleotídeo, e de que o se- gundo sítio de ligação está na segunda fita de oligonucleotídeo.
263. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 260 a 262, caracterizada pelo fato de que pelo menos uma molécula de reconhecimento de aminoá- cido é anexada ao primeiro sítio de ligação através de uma proteína que forma um grupo de ligação covalente ou não covalente entre pelo menos uma molécula de reconhecimento de aminoácido e o ácido nu- cleico.
264. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 260-263, caracterizada pelo fato de que pelo menos um marcador detectável é anexado ao segundo sítio de ligação através de uma proteína que forma um grupo de liga- ção covalente ou não covalente entre pelo menos um marcador detec- tável e o ácido nucleico.
265. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 260 a 264, caracterizada pelo fato de que o primeiro e o segundo sítio de ligação são separados por entre 5 e 100 bases nucleotídicas ou pares de bases de nucleotídeos no ácido nucleico.
266. Molécula de reconhecimento de aminoácido, caracteri- zada pelo fato de que compreende: uma proteína multivalente compreendendo pelo menos dois sítios de ligação ao ligando; pelo menos uma molécula de reconhecimento de aminoáci- do anexada à proteína através de uma primeira porção de ligando |i- gada a um primeiro sítio de ligação ao ligando na proteína; e pelo menos um marcador detectável anexada à proteína através de uma segunda porção de ligando ligada a um segundo sítio de ligação ao ligando na proteína.
267. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 266, caracterizada pelo fato de que a proteína multivalente é uma proteína avidina que compreende quatro sítios de ligação ao ligando.
268. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 266 ou 267, caracterizada pelo fato de que os sí- tios de ligação ao ligando são sítios de ligação à biotina, e em que as porções de ligando são porções de biotina.
269. Molécula de reconhecimento de aminoácido de acordo com a reivindicação 268, caracterizada pelo fato de que pelo menos uma das porções de biotina é uma porção bis-biotina, e em que a por- ção bis-biotina está ligada a dois sítios de ligação à biotina na proteína avidina.
270. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 266 a 269, caracterizada pelo fato de que pelo menos uma molécula de reconhecimento de aminoá- cido é anexada à proteína através de um ácido nucleico que compre- ende o primeiro porção de ligando.
271. Molécula de reconhecimento de aminoácido de acordo com qualquer uma das reivindicações 266 a 270, caracterizada pelo fato de que pelo menos um marcador detectável é anexado à proteína através de um ácido nucleico que compreende a segunda porção de ligando.
272. Método para identificação de um aminoácido terminal de um polipeptídeo, caracterizado pelo fato de que o método compre- ende: colocar um polipeptídeo em contato com um ou mais rea- gentes de afinidade marcados que se ligam seletivamente a um ou mais tipos de aminoácidos terminais em um terminal do polipeptídeo; e identificar um aminoácido terminal no terminal do polipeptí- deo pela detecção de uma interação do polipeptídeo com um ou mais reagentes de afinidade marcados.
273. Método para determinação de uma sequência de ami- noácidos de um polipeptídeo, caracterizado pelo fato de que o método compreende: i. colocar um polipeptídeo em contato com um ou mais rea- gentes de afinidade marcados que se ligam seletivamente a um ou mais tipos de aminoácidos terminais em um terminal do polipeptídeo; ii. identificar um aminoácido terminal no terminal do polipep- tídeo pela detecção de uma interação do polipeptídeo com um ou mais reagentes de afinidade marcados; iii. remover o aminoácido terminal; e iv. repetir (i)-(iv) uma ou mais vezes no terminal do polipep- tídeo para determinar uma sequência de aminoácidos do polipeptídeo.
274. Método de acordo com a reivindicação 273, caracteri- zado pelo fato de que o método compreende ainda: a. depois de (i) e antes de (ii), remover qualquer um ou mais reagentes de afinidade marcados que não se ligam seletivamente ao aminoácido terminal; e/ou b. depois de (ii) e antes de (ili), remover qualquer um ou mais reagentes de afinidade marcados que se ligam seletivamente ao aminoácido terminal.
275. Método de acordo com a reivindicação 273, caracteri- zado pelo fato de que (iii) compreende modificar o aminoácido terminal colocando o aminoácido terminal em contato com um isotiocianato e: a. colocar o aminoácido terminal modificado em contato com uma protease que se liga especificamente e remove o aminoácido terminal modificado; ou b. submeter o aminoácido terminal modificado a condições ácidas ou básicas suficientes para remover o aminoácido terminal mo- dificado.
276. Método de acordo com a reivindicação 273, caracteri- zado pelo fato de que a identificação do aminoácido terminal compre- ende: a. identificar o aminoácido terminal como de um tipo de um ou mais tipos de aminoácidos terminais aos quais se ligam um ou mais reagentes de afinidade marcados; ou b. identificar o aminoácido terminal que seja de um tipo dife- rente de um ou mais tipos de aminoácidos terminais aos quais se li- gam um ou mais reagentes de afinidade marcados.
277. Método de acordo com a reivindicação 273, caracteri- zado pelo fato de que um ou mais reagentes de afinidade marcados compreendem um ou mais aptâmeros marcados, uma ou mais pepti- dases marcadas, um ou mais anticorpos marcados ou uma combina- ção dos mesmos.
278. Método de acordo com a reivindicação 277, caracteri- zado pelo fato de que uma ou mais peptidases marcadas foram modi- ficadas para inativar a atividade de clivagem; ou de que uma ou mais peptidases marcadas retêm a atividade de clivagem para a remoção de (iii).
279. Método para identificação de uma proteína de interes- se em uma amostra mista, caracterizado pelo fato de que o método compreende: clivar uma amostra mista de proteínas para produzir uma pluralidade de fragmentos polipeptídicos; determinar uma sequência de aminoácidos de pelo menos um fragmento polipeptídico da pluralidade em um método como defini- do em qualquer uma das reivindicações 273 a 278, e identificar uma proteína de interesse na amostra mista se a sequência de aminoácidos for exclusivamente identificável com a pro- teína de interesse.
280. Método para identificação de uma proteína de interes- se em uma amostra mista, caracterizado pelo fato de que o método compreende: clivar uma amostra mista de proteínas para produzir uma pluralidade de fragmentos polipeptídicos; marcar um ou mais tipos de aminoácidos na pluralidade de fragmentos polipeptídicos com um ou mais marcadores luminescentes diferentes; medir a luminescência ao longo do tempo de pelo menos um polipeptídeo marcado da pluralidade; determinar uma sequência de aminoácidos de pelo menos um polipeptídeo marcado com base na luminescência detectada; e identificar uma proteína de interesse na amostra mista se a sequência de aminoácidos for exclusivamente identificável com a pro- teína de interesse.
281. Método para identificação de uma posição relativa de dois ou mais aminoácidos em um polipeptídeo, caracterizado pelo fato de que o método compreende: marcar dois ou mais aminoácidos de um polipeptídeo com um ou mais tipos de um primeiro marcador de FRET; detectar um sinal de FRET de uma reação de translocação do polipeptídeo marcado na presença de um cofator marcado com um segundo marcador de FRET; e determinar uma posição relativa dos dois ou mais aminoá- cidos com base no sinal de FRET.
282. Método de preparação de uma proteína para análise, caracterizado pelo fato de que o método compreende: i. bloquear grupos carboxilato livres de uma proteína; ii. desnaturar a proteína; iii. bloquear grupos tiol livres da proteína; iv. digerir a proteína para produzir pelo menos um fragmen- to polipeptídico compreendendo um grupo carboxilato livre no C- terminal; e v. conjugar quimicamente uma porção funcional ao grupo carboxilato livre no C-terminal.
283. Método de preparação de uma proteína para análise,
caracterizado pelo fato de que o método compreende:
i. desnaturar uma proteína;
ii. bloquear grupos tiol livres da proteína;
iii. digerir a proteína para produzir pelo menos um fragmen- to polipeptídico compreendendo um grupo carboxilato livre no C- terminal;
iv. bloquear o grupo carboxilato livre no C-terminal para produzir pelo menos um fragmento polipeptídico compreendendo um grupo carboxilato bloqueado no C-terminal; e v. conjugar enzimaticamente uma porção funcional ao gru- po carboxilato bloqueado no C-terminal.
BR112021008098-8A 2018-11-15 2019-11-15 métodos e composições para o sequenciamento de proteínas BR112021008098A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862768076P 2018-11-15 2018-11-15
US62/768,076 2018-11-15
US201962907507P 2019-09-27 2019-09-27
US62/907,507 2019-09-27
PCT/US2019/061831 WO2020102741A1 (en) 2018-11-15 2019-11-15 Methods and compositions for protein sequencing

Publications (1)

Publication Number Publication Date
BR112021008098A2 true BR112021008098A2 (pt) 2021-08-10

Family

ID=68841224

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021008098-8A BR112021008098A2 (pt) 2018-11-15 2019-11-15 métodos e composições para o sequenciamento de proteínas

Country Status (11)

Country Link
US (8) US20200219590A1 (pt)
EP (1) EP3881078A1 (pt)
JP (1) JP2022507516A (pt)
KR (1) KR20210091243A (pt)
CN (1) CN113287020A (pt)
AU (1) AU2019380606A1 (pt)
BR (1) BR112021008098A2 (pt)
CA (1) CA3117889A1 (pt)
MX (1) MX2021005757A (pt)
TW (1) TW202032125A (pt)
WO (1) WO2020102741A1 (pt)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11435358B2 (en) 2011-06-23 2022-09-06 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
WO2016069124A1 (en) 2014-09-15 2016-05-06 Board Of Regents, The University Of Texas System Improved single molecule peptide sequencing
CA2839702C (en) 2011-06-23 2021-04-20 Board Of Regents, The University Of Texas System Identifying peptides at the single molecule level
CA3059211A1 (en) 2017-05-05 2018-11-08 Quantum-Si Incorporated Substrates having modified surface reactivity and antifouling properties in biological reactions
GB201715684D0 (en) 2017-09-28 2017-11-15 Univ Gent Means and methods for single molecule peptide sequencing
KR20210091243A (ko) * 2018-11-15 2021-07-21 퀀텀-에스아이 인코포레이티드 단백질 시퀀싱을 위한 방법 및 조성물
CA3124957A1 (en) 2019-01-08 2020-07-16 Massachusetts Institute Of Technology Single-molecule protein and peptide sequencing
BR112021024915A2 (pt) * 2019-06-12 2022-01-18 Quantum Si Inc Técnicas para a identificação de proteína ao usar aprendizagem de máquina e sistemas e métodos relacionados
US11346842B2 (en) 2019-06-20 2022-05-31 Massachusetts Institute Of Technology Single molecule peptide sequencing methods
CN114829669B (zh) 2019-10-11 2024-10-01 宽腾矽公司 气相表面改性
TW202145595A (zh) 2020-01-14 2021-12-01 美商寬騰矽公司 用於壽命及光譜特性分析之感應器
US11719639B2 (en) 2020-03-02 2023-08-08 Quantum-Si Incorporated Integrated sensor for multi-dimensional signal analysis
JP2023527764A (ja) 2020-05-20 2023-06-30 クアンタム-エスアイ インコーポレイテッド タンパク質シーケンスのための方法及び組成物
US20210396762A1 (en) * 2020-06-19 2021-12-23 Encodia, Inc. Methods for peptide analysis employing multi-component detection agent and related kits
EP4204584A4 (en) * 2020-09-21 2024-08-28 Quantum Si Inc METHODS FOR MINIMIZING PHOTODEGRADATION DURING NUCLEIC ACID AND PEPTIDE SEQUENCING
EP4271997A1 (en) * 2020-12-31 2023-11-08 Encodia, Inc. Metalloenzymes for biomolecular recognition of n-terminal modified peptides
US20220324910A1 (en) * 2021-04-01 2022-10-13 Quantum-Si Incorporated Protein-wide modification of aspartates and glutamates
WO2022236190A1 (en) * 2021-05-07 2022-11-10 Government Of The United States Of America, As Represented By The Secretary Of Commerce Amino acid-specific binder and selectively identifying an amino acid
WO2022261607A1 (en) * 2021-06-09 2022-12-15 Quantapore, Inc. Polypeptide sequencing and fingerprinting
WO2023091961A2 (en) * 2021-11-17 2023-05-25 Erisyon Inc. Methods and systems for automated sample processing
CN114199848B (zh) * 2021-12-17 2023-01-17 无锡佰翱得生物科学有限公司 一种基于蛋白连接酶的高通量检测蛋白表达的方法
AU2022420616A1 (en) * 2021-12-22 2024-06-20 Quantum-Si Incorporated Compositions and methods for polypeptide analysis
US20230221330A1 (en) * 2022-01-12 2023-07-13 Quantum-Si Incorporated Labeled binding reagents and methods of use thereof
WO2024030919A1 (en) * 2022-08-02 2024-02-08 Glyphic Biotechnologies, Inc. Protein sequencing via coupling of polymerizable molecules
CN117423387B (zh) * 2023-12-18 2024-03-08 中国科学院水生生物研究所 基于数字驱动的水生生物群落时空差异的评估方法及系统

Family Cites Families (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4435728A1 (de) 1994-01-19 1995-07-20 Boehringer Mannheim Gmbh Biotinsilan-Verbindungen und diese Verbindungen enthaltende Bindematrix
US5654419A (en) 1994-02-01 1997-08-05 The Regents Of The University Of California Fluorescent labels and their use in separations
DE19782089T1 (de) 1996-10-29 1999-12-23 Univ Nebraska At Lincoln Linco Verfahren zum Nachweisen von Punktmutationen in DNA unter Verwendung von Fluoreszenzenergieübergang
US6153442A (en) 1998-05-20 2000-11-28 Dade Behring Inc. Reagents and methods for specific binding assays
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US6232075B1 (en) 1998-12-14 2001-05-15 Li-Cor, Inc. Heterogeneous assay for pyrophosphate detection
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
US6936702B2 (en) 2000-06-07 2005-08-30 Li-Cor, Inc. Charge-switch nucleotides
US6869764B2 (en) 2000-06-07 2005-03-22 L--Cor, Inc. Nucleic acid sequencing using charge-switch nucleotides
CA2314398A1 (en) 2000-08-10 2002-02-10 Edward Shipwash Microarrays and microsystems for amino acid analysis and protein sequencing
US20060014212A1 (en) 2002-05-10 2006-01-19 Epitome Biosystems, Inc. Proteome epitope tags and methods of use thereof in protein modification analysis
AU2003282832B2 (en) * 2002-10-15 2009-09-10 Abmetrix, Inc. Sets of digital antibodies directed against short epitopes, and methods using same
US20100035254A1 (en) 2003-04-08 2010-02-11 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US7745116B2 (en) 2003-04-08 2010-06-29 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
GB0324456D0 (en) 2003-10-20 2003-11-19 Isis Innovation Parallel DNA sequencing methods
WO2005044836A2 (de) 2003-11-05 2005-05-19 Genovoxx Gmbh Makromolekulare nukleotidverbindungen und methoden zu deren anwendung
JP4552023B2 (ja) 2003-11-07 2010-09-29 独立行政法人科学技術振興機構 多環縮環型π共役有機材料、その合成中間体、多環縮環型π共役有機材料の製造方法、および多環縮環型π共役有機材料の合成中間体の製造方法
PL1732379T3 (pl) 2004-04-09 2014-04-30 Monsanto Technology Llc Kompozycje i sposoby do zwalczania inwazji szkodników u roślin
US7462452B2 (en) 2004-04-30 2008-12-09 Pacific Biosciences Of California, Inc. Field-switch sequencing
CA2496294A1 (en) 2005-02-07 2006-08-07 The University Of British Columbia Apparatus and methods for concentrating and separating particles such as molecules
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
WO2007070572A2 (en) 2005-12-12 2007-06-21 The Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services Probe for nucleic acid sequencing and methods of use
US20100331200A1 (en) 2006-03-31 2010-12-30 Gordon Neal F Post translational modification pattern analysis
US8084734B2 (en) 2006-05-26 2011-12-27 The George Washington University Laser desorption ionization and peptide sequencing on laser induced silicon microcolumn arrays
JP5244103B2 (ja) 2006-08-09 2013-07-24 ホームステッド クリニカル コーポレイション 器官特異的蛋白質およびその使用方法
US8617811B2 (en) 2008-01-28 2013-12-31 Complete Genomics, Inc. Methods and compositions for efficient base calling in sequencing reactions
DE602008000796D1 (de) 2008-01-15 2010-04-22 Univ Utrecht Holding Bv Verfahren zur Bestimmung der Aminosäurensequenz von Peptiden
CA2718404C (en) 2008-03-13 2018-04-10 Pacific Biosciences Of California, Inc. Labeled reactants and their uses
CA2719747C (en) 2008-03-28 2018-02-20 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US8420366B2 (en) 2008-03-31 2013-04-16 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US8906831B2 (en) 2008-03-31 2014-12-09 Pacific Biosciences Of California, Inc. Single molecule loading methods and compositions
US8999676B2 (en) 2008-03-31 2015-04-07 Pacific Biosciences Of California, Inc. Recombinant polymerases for improved single molecule sequencing
CA2720046C (en) 2008-03-31 2018-07-24 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
WO2010044892A1 (en) 2008-10-17 2010-04-22 President And Fellows Of Harvard College Diagnostic method based on large scale identification of post-translational modification of proteins
WO2010059206A2 (en) 2008-11-19 2010-05-27 Pacific Biosciences Of California, Inc. Modular nucleotide compositions and uses therefor
CA2745197A1 (en) * 2008-12-01 2010-06-10 Research Triangle Institute Concurrent identification of multitudes of polypeptides
WO2010065531A1 (en) 2008-12-01 2010-06-10 Robi David Mitra Single molecule protein screening
KR101063981B1 (ko) 2009-01-12 2011-09-14 서강대학교산학협력단 자유 라디칼 개시제 및 이를 이용한 펩타이드 서열의 동정방법
DE102009013653B4 (de) 2009-03-18 2014-09-18 Bruker Daltonik Gmbh Protein-Sequenzierung mit MALDI-Massenspektrometrie
US20100255487A1 (en) 2009-03-27 2010-10-07 Life Technologies Corporation Methods and apparatus for single molecule sequencing using energy transfer detection
WO2010117420A2 (en) 2009-03-30 2010-10-14 Pacific Biosciences Of California, Inc. Fret-labeled compounds and uses therefor
EP3964586A1 (en) 2009-04-03 2022-03-09 Sequenom, Inc. Nucleic acid preparation compositions and methods
US9566335B1 (en) * 2009-09-25 2017-02-14 The Governing Council Of The University Of Toronto Protein sequencing method and reagents
US8470261B2 (en) 2010-05-06 2013-06-25 Ibis Biosciences, Inc. Integrated sample preparation systems and stabilized enzyme mixtures
WO2012129242A2 (en) 2011-03-23 2012-09-27 Pacific Biosciences Of California, Inc. Isolation of polymerase-nucleic acid complexes and loading onto substrates
WO2016069124A1 (en) * 2014-09-15 2016-05-06 Board Of Regents, The University Of Texas System Improved single molecule peptide sequencing
WO2013112745A1 (en) 2012-01-24 2013-08-01 The Regents Of The University Of Colorado, A Body Corporate Peptide identification and sequencing by single-molecule detection of peptides undergoing degradation
WO2013123258A1 (en) 2012-02-15 2013-08-22 Pacific Biosciences Of California, Inc. Polymerase enzyme substrates with protein shield
EA037979B1 (ru) * 2012-02-27 2021-06-18 Амуникс Оперейтинг Инк. Композиции конъюгата xten и способы их получения
CN110054699A (zh) 2012-07-11 2019-07-26 比奥贝拉蒂治疗公司 具有xten和血管性血友病因子蛋白的因子viii复合物、及其用途
NL2009191C2 (en) 2012-07-16 2014-01-20 Univ Delft Tech Single molecule protein sequencing.
US9435810B2 (en) 2013-03-15 2016-09-06 Washington University Molecules and methods for iterative polypeptide analysis and processing
US10544449B2 (en) 2013-06-14 2020-01-28 Pacific Biosciences Of California, Inc. Bis-biotinylation tags
US9678080B2 (en) 2013-06-14 2017-06-13 Pacific Biosciences Of California, Inc. Bis-biotinylation tags
EP3011051B1 (en) 2013-06-21 2019-01-30 Sequenom, Inc. Method for non-invasive assessment of genetic variations
EP3030683B1 (en) 2013-08-05 2022-03-02 Pacific Biosciences of California, Inc. Protected fluorescent reagent compounds
MX2016006453A (es) 2013-11-17 2016-12-09 Quantum-Si Incorporated Sistema optico y chip de ensayo para sondear, detectar y analizar moleculas.
CN106471121A (zh) * 2014-03-03 2017-03-01 诺沃吉公司 减少功能蛋白的水平基因转移
AU2015300766B2 (en) 2014-08-08 2021-02-04 Quantum-Si Incorporated Integrated device for temporal binning of received photons
MX2017001808A (es) 2014-08-08 2018-02-08 Quantum Si Inc Dispositivo integrado con fuente de luz externa para el sondeo, deteccion y analisis de moleculas.
US9287885B2 (en) * 2014-08-15 2016-03-15 Taiwan Semiconductor Manufacturing Company, Ltd. All digital phase locked loop with configurable multiplier having a selectable bit size
EP3258952A4 (en) 2015-02-04 2018-12-05 Pacific Biosciences Of California, Inc. Multimeric protected fluorescent reagents
WO2016164530A1 (en) * 2015-04-07 2016-10-13 University Of Maryland, College Park Compositions and methods for high throughput protein sequencing
US10246742B2 (en) 2015-05-20 2019-04-02 Quantum-Si Incorporated Pulsed laser and bioanalytic system
WO2016193980A1 (en) 2015-06-03 2016-12-08 Bar Ilan University Methods and kits for detection and quantification of large-scale post translational modifications of proteins
EP3332032B1 (en) * 2015-08-06 2023-12-27 Pacific Biosciences Of California, Inc. Integrated circuits for selectively addressing sparsely arranged electronic measurement devices
WO2017063093A1 (en) 2015-10-16 2017-04-20 Andrew Emili Protein sequencing methods and reagents
WO2017087702A1 (en) 2015-11-18 2017-05-26 Pacific Biosciences Of California, Inc. Loading nucleic acids onto substrates
US10676788B2 (en) 2015-11-20 2020-06-09 Pacific Biosciences Of California, Inc. Modified nucleotide reagents
WO2017192633A1 (en) 2016-05-02 2017-11-09 Procure Life Sciences Inc. Macromolecule analysis employing nucleic acid encoding
US10309968B2 (en) 2016-05-18 2019-06-04 Bioinformatics Solutions Inc. Methods and systems for assembly of protein sequences
JP7057348B2 (ja) 2016-08-31 2022-04-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 蛍光in situ配列決定を用いた単一アッセイに生体分子の検出を組み合わせる方法
CN116466494A (zh) 2016-12-16 2023-07-21 宽腾矽公司 紧密的光束整形及操纵总成
CN110088594B (zh) 2016-12-16 2022-09-20 宽腾矽公司 光学耦合器及波导系统
US10845308B2 (en) 2016-12-22 2020-11-24 Quantum-Si Incorporated Integrated photodetector with direct binning pixel
US11072816B2 (en) 2017-05-03 2021-07-27 The Broad Institute, Inc. Single-cell proteomic assay using aptamers
CA3059211A1 (en) 2017-05-05 2018-11-08 Quantum-Si Incorporated Substrates having modified surface reactivity and antifouling properties in biological reactions
WO2019023146A1 (en) 2017-07-24 2019-01-31 Quantum-Si Incorporated PHOTONIC STRUCTURES WITH OPTICAL RELEASE
EP3658682A4 (en) 2017-07-24 2021-06-02 Quantum-si Incorporated HIGH INTENSITY LABEL REAGENT COMPOSITIONS AND SEQUENCING METHODS
WO2019040825A1 (en) 2017-08-24 2019-02-28 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services CONFORMATIONAL RESTRICTION OF CYANINE FLUOROPHORES IN A FAR RED RANGE AND CLOSE INFRARED
US10684071B2 (en) * 2017-08-25 2020-06-16 Praxair Technology, Inc. Annular divided wall column for an air separation unit
EP3676561B1 (en) * 2017-08-31 2023-10-04 Case Western Reserve University Systems and methods to apply markings
US10908820B2 (en) 2017-09-14 2021-02-02 Samsung Electronics Co., Ltd. Host-based and client-based command scheduling in large bandwidth memory systems
GB201715684D0 (en) * 2017-09-28 2017-11-15 Univ Gent Means and methods for single molecule peptide sequencing
WO2019089846A1 (en) 2017-10-31 2019-05-09 Encodia, Inc. Methods and compositions for polypeptide analysis
US11513126B2 (en) 2017-10-31 2022-11-29 Encodia, Inc. Kits for analysis using nucleic acid encoding and/or label
US11841371B2 (en) 2018-03-13 2023-12-12 The Broad Institute, Inc. Proteomics and spatial patterning using antenna networks
WO2020014586A1 (en) 2018-07-12 2020-01-16 Board Of Regents, The University Of Texas System Molecular neighborhood detection by oligonucleotides
WO2020023488A1 (en) 2018-07-23 2020-01-30 Board Of Regents, The University Of Texas System Single molecule sequencing identification of post-translational modifications on proteins
CA3107963A1 (en) 2018-08-17 2020-02-20 Regeneron Pharmaceuticals, Inc. Methods for de novo protein sequencing
GB2593091B (en) 2018-10-05 2023-12-20 Univ Texas Solid-phase N-terminal peptide capture and release
US10836798B2 (en) * 2018-11-08 2020-11-17 Government Of The United States Of America, As Represented By The Secretary Of Commerce Amino acid-specific binder and selectively identifying an amino acid
KR20210091243A (ko) 2018-11-15 2021-07-21 퀀텀-에스아이 인코포레이티드 단백질 시퀀싱을 위한 방법 및 조성물
CA3124957A1 (en) 2019-01-08 2020-07-16 Massachusetts Institute Of Technology Single-molecule protein and peptide sequencing
EP3914727A4 (en) 2019-01-22 2022-11-30 Singular Genomics Systems, Inc. POLYNUCLEOTIDE BARCODES FOR MULTIPLEXED PROTEOMICS
US20200300861A1 (en) 2019-03-22 2020-09-24 Augmenta Bioworks, Inc. Isolation of Single Cells and Uses Thereof
GB201904697D0 (en) 2019-04-03 2019-05-15 Vib Vzw Means and methods for single molecule peptide sequencing
AU2020261334A1 (en) 2019-04-23 2021-11-18 Encodia, Inc. Methods for spatial analysis of proteins and related kits
US20220221467A1 (en) 2019-05-31 2022-07-14 President And Fellows Of Harvard College Systems and methods for ms1-based mass identification including super-resolution techniques
BR112021024915A2 (pt) 2019-06-12 2022-01-18 Quantum Si Inc Técnicas para a identificação de proteína ao usar aprendizagem de máquina e sistemas e métodos relacionados
US11346842B2 (en) 2019-06-20 2022-05-31 Massachusetts Institute Of Technology Single molecule peptide sequencing methods
CN114555810A (zh) 2019-09-13 2022-05-27 谷歌有限责任公司 用于蛋白质和肽测序的方法和组合物
CN114929888A (zh) 2019-10-28 2022-08-19 宽腾矽公司 制备用于多重多肽测序的样品的方法、试剂盒和装置
CN114929887A (zh) 2019-10-28 2022-08-19 宽腾矽公司 单个多肽测序和重建的方法
JP2023500485A (ja) 2019-10-28 2023-01-06 クアンタム-エスアイ インコーポレイテッド 単一細胞タンパク質及び核酸の配列決定の方法
EP4045684A1 (en) 2019-10-28 2022-08-24 Quantum-Si Incorporated Methods of preparing an enriched sample for polypeptide sequencing
GB201918108D0 (en) 2019-12-10 2020-01-22 Vib Vzw Improved aminopeptiadases for single molecule peptide sequencing
US20210354134A1 (en) 2020-04-22 2021-11-18 Quantum-Si Incorporated Sample preparation for sequencing
JP2023527764A (ja) 2020-05-20 2023-06-30 クアンタム-エスアイ インコーポレイテッド タンパク質シーケンスのための方法及び組成物
US20210396762A1 (en) 2020-06-19 2021-12-23 Encodia, Inc. Methods for peptide analysis employing multi-component detection agent and related kits

Also Published As

Publication number Publication date
US20200209255A1 (en) 2020-07-02
JP2022507516A (ja) 2022-01-18
WO2020102741A1 (en) 2020-05-22
US20200209256A1 (en) 2020-07-02
US12000835B2 (en) 2024-06-04
CA3117889A1 (en) 2020-05-22
CN113287020A (zh) 2021-08-20
AU2019380606A1 (en) 2021-05-27
US11959920B2 (en) 2024-04-16
WO2020102741A8 (en) 2020-06-18
US20200209257A1 (en) 2020-07-02
KR20210091243A (ko) 2021-07-21
US20200219590A1 (en) 2020-07-09
TW202032125A (zh) 2020-09-01
US20200209254A1 (en) 2020-07-02
US20240272169A1 (en) 2024-08-15
EP3881078A1 (en) 2021-09-22
US12055548B2 (en) 2024-08-06
US20200209253A1 (en) 2020-07-02
MX2021005757A (es) 2021-08-11
US20200209249A1 (en) 2020-07-02

Similar Documents

Publication Publication Date Title
BR112021008098A2 (pt) métodos e composições para o sequenciamento de proteínas
AU2021282471B2 (en) Method of determining the sequence of a nucleic acid using time resolved luminescence
US11970729B2 (en) Methods for nucleic acid sequencing
US12065466B2 (en) Methods and compositions for protein sequencing
CN114929887A (zh) 单个多肽测序和重建的方法
CN114929888A (zh) 制备用于多重多肽测序的样品的方法、试剂盒和装置
US9914955B2 (en) Genetically encoded FRET-based MMP-9 activity biosensor and use thereof
US20230221330A1 (en) Labeled binding reagents and methods of use thereof
Rossboth et al. Unscrambling Fluorophore Blinking for Comprehensive Cluster Detection via Photoactivated Localization Microscopy

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 5A ANUIDADE.