[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR20240152324A - 뉴클레오티드 서열분석을 위한 교정 서열 - Google Patents

뉴클레오티드 서열분석을 위한 교정 서열 Download PDF

Info

Publication number
KR20240152324A
KR20240152324A KR1020247028301A KR20247028301A KR20240152324A KR 20240152324 A KR20240152324 A KR 20240152324A KR 1020247028301 A KR1020247028301 A KR 1020247028301A KR 20247028301 A KR20247028301 A KR 20247028301A KR 20240152324 A KR20240152324 A KR 20240152324A
Authority
KR
South Korea
Prior art keywords
sequence
correction
sequence analysis
proofreading
nucleobase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
KR1020247028301A
Other languages
English (en)
Inventor
존 에스 비에셀리
보 루
제프리 에스 피셔
Original Assignee
일루미나, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드 filed Critical 일루미나, 인코포레이티드
Publication of KR20240152324A publication Critical patent/KR20240152324A/ko
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 개시내용은 서열분석 장치에 짧은 교정 서열을 도입하고 교정 사이클을 실행하여 서열분석 장치에 해당하는 서열분석 매개변수를 조정하거나 달리 결정할 수 있도록 하는 방법, 비일시적 컴퓨터 판독 가능 매체, 및 시스템을 기재한다. 예를 들어, 개시된 시스템은 샘플의 라이브러리 단편에 혼입되거나 또는 샘플-뉴클레오티드 슬라이드의 표면에 혼입된 교정 서열을 사용하여 유동 셀(또는 다른 샘플-뉴클레오티드 슬라이드)을 검출할 수 있다. 개시된 시스템은, 교정 서열에 해당하는 올리고뉴클레오티드에 핵염기를 혼입하고 교정 서열에 대한 해당 이미지를 캡처하기 위해 한 번 이상의 교정 사이클을 샘플 유전체 서열에 대한 유전체 서열분석 사이클과는 별도로 실행함으로써, 서열분석 장치에 해당하는 서열분석 매개변수를 결정할 수 있다.

Description

뉴클레오티드 서열분석을 위한 교정 서열
관련 출원의 교차 참조
본 출원은 2022년 2월 25일자로 출원된 발명의 명칭이 "뉴클레오티드 서열분석을 위한 교정 서열"인 미국 임시 출원 제63/268,547호의 이익 및 우선권을 주장한다. 전술한 출원은 그 전체가 본원에 원용되어 포함된다.
최근 몇 년 동안 생명공학 기업과 연구 기관은 유전체 샘플(또는 다른 핵산 중합체)에 대한 뉴클레오티드-단편 판독을 결정하는 서열분석 기계와 이러한 뉴클레오티드-단편 판독을 위한 핵염기 호출을 분석하는 서열분석 데이터 분석 소프트웨어 모두에 대한 하드웨어와 소프트웨어를 개선해왔다. 유전체 샘플에 대한 핵염기 호출을 생성하고 분석하기 위해, 일부 기존 서열분석 기계, 장치 내장 소프트웨어, 및 서열분석 데이터 분석 소프트웨어(통칭하여 "기존 서열분석 시스템")는 경계를 구분하는 서열분석 매개변수를 구성하거나, 기준선 신호 또는 노이즈를 설정하거나, 아니면 핵염기 호출을 결정하는 데 있어서 안내나 계산을 제공한다. 기존 서열분석 시스템은 특정 서열분석 기계 또는 파이프라인에 대해 등화기(equalizer) 계수 또는 기타 사전 결정된 서열분석 매개변수와 같은 이러한 일부 서열분석 매개변수를 오프라인으로 결정하거나, 서열분석 기계에서 서열분석을 실행하는 동안 오프셋 보정 매개변수와 같은 기타 서열분석 매개변수를 결정할 수 있다. 특정 서열분석 매개변수를 교정하기 위해, 기존 서열분석 시스템은 대개의 경우에는 Phi-X와 같은 잘 정해진 유전체 샘플에서 추출된 올리고뉴클레오티드의 유전체 서열분석 사이클을 실행하고, 잘 정해진 유전체 샘플의 알려진 서열에 기반하여 매개변수를 결정하거나 조정한다. 그러나 기존 서열분석 시스템에 의한 종래의 교정은 서열분석 실패와 부정확한 핵염기 호출을 초래할 수 있을 뿐만 아니라 유전체 서열분석 사이클 교정을 위해 컴퓨팅 및 기타 자원을 허비할 수 있다.
방금 제안한 바와 같이, 서열분석 기계 또는 서열분석 파이프라인에 대한 서열분석 매개변수를 사전 결정하는 기존 서열분석 매개변수는 오차를 초래할 수 있다. 예를 들어, 한 서열분석 기계에 대해 오프라인으로 사전 결정된 서열분석 매개변수는 다른 서열분석 기계에 유사한 하드웨어 및 유사한 소모품이 사용됨에도 불구하고 다른 서열분석 기계, 유동 셀, 또는 시약 세트의 환경에서는 잘 작동하지 않을 수 있다. 또한, 사전 결정된 서열분석 매개변수가 초기에(예를 들어, 배송 시) 서열분석 기계에 대해 잘 구성되었더라도, 서열분석 기계의 하드웨어 또는 소프트웨어는 시간이 지남에 따라 변경될 수 있으며, 강도 값을 추출하기 위한 등화기 계수와 같은 서열분석 매개변수를 사전 결정할 때에 사용된 하드웨어 또는 소프트웨어의 상태를 더 이상 반영하지 못할 수 있다.
기존 서열분석 시스템에는 사전 결정된 서열분석 매개변수로 인해 발생하는 오류 외에도, 교정을 위해 실험실에서 유전체 서열분석 사이클을 사용할 때 서열분석 기계에서의 종래의 서열분석 실행의 일부(또는 전체) 동안에 무작위 실패가 나타나는 경우가 흔하다. 예를 들어, 기존 서열분석 시스템은 서열분석 매개변수를 구성하기 위해 초기 유전체 서열분석 사이클(또는 초기 유전체 서열분석 사이클 세트) 동안 캡처된 측정 지표에 자주 의존한다. 그러나 초기 유전체 서열분석 사이클의 무작위 실패는 나머지 유전체 서열분석 사이클에 영향을 미치고 그에 오차를 초래할 수 있다. 예를 들어, 초기 유전체 서열분석 사이클에서, 서열분석 기계는 뉴클레오티드를 혼입시키고, 뉴클레오티드-샘플 슬라이드 상의 거품에 의해 영향을 받은 올리고뉴클레오티드 클러스터로부터 이미지를 캡처하거나, 초점이 맞지 않는 카메라나 클러스터에 자동으로 중앙이 맞춰지지 않은 카메라를 사용하여 이러한 클러스터의 이미지를 캡처하거나, 이후 사이클의 온도를 대표하지 못하는 초기 온도에서 이미지를 캡처할 수 있다. 시간이 지남에 따라, 서열분석 기계 및 뉴클레오티드-샘플 슬라이드의 환경이 변함에 따라 사전 유전체 서열분석 사이클에서 구성된 서열분석 매개변수는 이후 유전체 서열분석 사이클의 조건을 잘못 나타낼 수 있으며 핵염기 호출에 대한 서열분석 매개변수를 왜곡할 수 있다. 어떤 경우에서는, 초기 사전 유전체 서열분석 사이클의 무작위 실패로 인해, 예컨대 기존 서열분석 시스템이 사전 유전체 서열분석 사이클에서 초해상도 기기에 대한 왜곡 계수 또는 위상 오프셋을 잘못 추정하는 경우와 같이, 전체 서열분석 실행이 완전히 실패할 수 있다.
어떤 경우에서는, 서열분석 기계 또는 샘플-뉴클레오티드 슬라이드의 무작위 조건 외에도, 미지의 유전체 샘플 또는 잘 정해진 유전체 샘플에 대한 뉴클레오티드-단편 판독에 있어서의 핵염기 유형 분포가 서열분석 매개변수를 왜곡시키거나 편향시킬 수 있다. 예를 들어 일부 유전체 서열분석 사이클에서, 올리고뉴클레오티드 클러스터는 한 핵염기 유형을 다른 것에 비해 불균형적으로 나타내는 핵염기를 포함할 수 있다. 예를 들어 초기 유전체 서열분석 사이클에서 서열분석 매개변수를 학습하는 경우, 기존 서열분석 시스템은 핵염기 유형 다양성이 낮은 영역이 있는 유전체 샘플로부터의 부정확한 서열분석 매개변수에 집중할 수 있다. 최근 한 연구에서, 연구자들은 Phi-X에 대한 초기 사이클 동안 서열분석 기계가 단일 핵염기 유형을 100% 혼입시키는 유전체 서열분석 사이클을 발견했다. 서열분석 기계가 불균형하게 분포된 핵염기 유형의 유전체 서열분석 사이클에 기반하여 서열분석 매개변수를 구성하는 경우, 핵염기 호출에 대한 서열분석 기계의 정확도가 곤란해질 수 있다. 실제로, Phi-X 스파이크인이 없으면 단일 핵염기의 100% 사이클로 구성된 서열분석 매개변수로 인해 핵염기 호출에 대한 오류율이 2배 더 높아졌다.
정확도 문제와는 별개로, 일부 경우에서는, 기존 서열분석 시스템은 미지의 샘플의 유전체 서열을 결정하는 데 사용할 수 있었을 컴퓨팅 및 서열분석 기계 자원을 허비하는 종래의 교정 접근 방식을 사용한다. 예를 들어, 기존 서열분석 시스템은 일반적으로는 서열분석 매개변수 교정을 용이하게 하기 위해 잘 정해진 유전체 샘플에 올리고뉴클레오티드 클러스터를 전용으로 지정한다. 그런데, 기존 서열분석 시스템은 샘플-뉴클레오티드 슬라이드의 웰 또는 다른 부분을 대조 샘플 전용으로 지정함으로써, 샘플-뉴클레오티드 슬라이드의 일부를 축소하게 되고, 알려지지 않은 유전체 샘플을 결정하는 데 사용할 수 있는 유전체 서열분석 사이클을 축소하게 된다.
기존 서열분석 시스템에는 이러한 과제 및 문제가 추가적인 과제 및 문제와 함께 존재한다.
본 개시내용은 위에 설명된 과제들 중 하나 이상을 해결하거나 상기 기술에서의 다른 이점들을 제공하는 시스템, 방법, 및 비일시적 컴퓨터 판독 가능 저장 매체의 하나 이상의 실시예를 설명한다. 특히, 개시된 시스템은 짧은 교정 서열을 서열분석 장치에 도입하고 교정 사이클을 실행하여 서열분석 장치에 해당하는 서열분석 매개변수를 조정하거나 달리 결정할 수 있다. 예를 들어, 개시된 시스템은 샘플의 라이브러리 단편에 혼입되거나 또는 샘플-뉴클레오티드 슬라이드의 표면에 혼입된 교정 서열을 사용하여 유동 셀(또는 다른 샘플-뉴클레오티드 슬라이드)을 검출할 수 있다. 개시된 시스템은, 교정 서열에 해당하는 올리고뉴클레오티드에 핵염기를 혼입하고 교정 서열에 대한 해당 이미지를 캡처하기 위해 한 번 이상의 교정 사이클을 샘플 유전체 서열에 대한 유전체 서열분석 사이클과는 별도로 실행함으로써, 서열분석 장치에 해당하는 서열분석 매개변수를 결정할 수 있다. 예를 들어, 개시된 시스템은 교정 사이클 동안 또는 후에 검출되는 일부 서열분석 매개변수들을 직접 추정하고, 여러 교정 사이클 동안 검출된 초기 서열분석 매개변수들로부터 서열분석 매개변수를 결정하고, 그리고/또는 (i) 교정 서열에 대한 상보적 가닥에 대한 핵염기 호출과 (ii) 교정 서열에 대한 알려진 상보적 핵염기 사이의 염기 호출 차이에 기반하여 초기 서열분석 매개변수들을 조정할 수 있다.
본 개시내용의 하나 이상의 실시예의 추가적인 특징 및 이점은 다음의 설명에서 설명될 것이며, 부분적으로는 그 설명으로부터 명백해질 것이며, 그러한 예시적인 실시예의 실시에 의해 학습될 수 있을 것이다.
상세한 설명은 아래에서 간단하게 설명되는 도면을 참조한다.
도 1은 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 서열분석 시스템이 작동할 수 있는 환경을 예시한다.
도 2a는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하고 교정 서열에 기반하여 서열분석 장치에 해당하는 하나 이상의 서열분석 매개변수를 결정하는 교정 서열분석 시스템의 개략도를 예시한다.
도 2b는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 서열분석 장치에 해당하는 하나 이상의 서열분석 매개변수를 결정하기 위해 다양한 유형의 교정 사이클들을 수행하는 교정 서열분석 시스템의 개략도를 예시한다.
도 2c는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 유전체 서열분석 사이클 또는 인덱싱 사이클 동안 교정 사이클로부터의 서열분석 매개변수를 사용하는 교정 서열분석 시스템의 개략도를 예시한다.
도 3a 및 도 3b는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 샘플 라이브러리 단편 내에 혼입된 교정 서열을 예시한다.
도 4는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 서열분석 시스템의 예시적인 교정 사이클을 예시한다.
도 5a 내지 도 5e는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 샘플 라이브러리 단편 내에 혼입된 교정 서열과, 뉴클레오티드-샘플 슬라이드 내의 올리고뉴클레오티드 클러스터를 통해 분포된 샘플 라이브러리 단편들을 예시한다.
도 6은 본 개시내용의 하나 이상의 실시예에 따른 것으로, 무작위로 호출된 핵염기에 기반하거나 교정 서열로부터의 기지의 핵염기에 기반한 상이한 핵염기 유형들에 해당하는 상이한 채널들에 대한 강도-값 분포를 예시한다.
도 7a 및 도 7b는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 서열에 기반한 상이한 채널들에 대한 상이한 핵염기 유형들에 해당하는 강도 값에 대한 산점도를 예시한다.
도 8a 및 도 8b는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정되지 않은 서열분석 매개변수와 교정된 서열분석 매개변수를 갖는 사이클에 해당하는 강도 값에 대한 산점도를 예시한다.
도 9는 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하고 교정 서열에 기반하여 서열분석 장치에 해당하는 하나 이상의 서열분석 매개변수를 결정하기 위한 일련의 동작을 예시한다.
도 10은 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 핵염기를 포함하는 뉴클레오티드-샘플 슬라이드를 수용하고 교정 핵염기에 기반하여 서열분석 장치에 해당하는 하나 이상의 서열분석 매개변수를 결정하기 위한 일련의 동작을 예시한다.
도 11은 본 개시내용의 하나 이상의 실시예에 따른 예시적인 컴퓨팅 장치의 블록도를 예시한다.
본 개시내용은 샘플-뉴클레오티드 슬라이드에 침착된 라이브러리 단편과 연관된 짧은 교정 서열을 검출하고 교정 사이클을 실행하여 서열분석 장치에 해당하는 서열분석 매개변수를 짧은 교정 서열에 기반하여 결정할 수 있는 교정 서열분석 시스템의 하나 이상의 실시예를 기재한다. 예를 들어, 교정 서열분석 시스템은 (i) 하나 이상의 유전체 샘플에 대한 라이브러리 단편 또는 (ii) 샘플-뉴클레오티드 슬라이드의 기질에 혼입된 교정 서열을 포함하는 유동 셀(또는 다른 샘플-뉴클레오티드 슬라이드)을 검출할 수 있다. 교정 서열분석 시스템은 후속해서 한 번 이상의 교정 사이클을 실행하여 핵염기를 교정 서열에 해당하는 올리고뉴클레오티드에 혼입하고 교정 서열의 핵염기에 기반하여 하나 이상의 서열분석 매개변수(예를 들어, 강도 값, 강도-값 경계, 등화기 계수)를 결정할 수 있다. 이러한 교정 사이클은 나중에 라이브러리 단편으로부터 샘플 유전체 서열 또는 상보적 데옥시리보핵산(cDNA)을 서열분석하는 유전체 서열분석 사이클 전에 실행될 수 있다.
위에서 제안된 바와 같이, 교정 서열분석 시스템은 한 번 이상의 교정 사이클을 사용하여 서열분석 매개변수를 다양한 방식으로 결정할 수 있다. 예를 들어, 일부 경우에서, 교정 서열분석 시스템은 한 번 이상의 교정 사이클을 실행하여 예컨대 핵염기 신호의 강도 값, 강도 값의 핵염기 중심, 핵염기의 강도-값 경계, 또는 기타 서열분석 매개변수를 검출함으로써 교정 서열에 어떤 기지의 핵염기 유형에 해당하는 서열분석 매개변수를 직접 검출한다. 추가적으로 또는 대안적으로, 교정 서열분석 시스템은 다수의 교정 사이클 동안 또는 후에 검출되는 초기 서열분석 매개변수로부터 서열분석 매개변수를 결정할 수 있다. 추가로, 특정 구현예에서, 교정 서열분석 시스템은 교정 사이클을 실행하여, 교정 서열에 대한 핵염기 호출을 결정하고, 교정 서열에 대한 상보적 가닥/올리고뉴클레오티드에 대한 핵염기 호출과 교정 서열에 대한 기지의 상보적 핵염기 간의 염기 호출 차이(또는 기타 검출된 서열분석-측정 지표 차이)에 기반하여 하나 이상의 서열분석 매개변수를 조정한다.
교정 서열을 이용하여 교정 사이클을 실행함으로써, 교정 서열분석 시스템은 서열분석 장치 또는 서열분석 파이프라인에 해당하는 다양한 유형의 서열분석 매개변수를 결정할 수 있다. 예를 들어, 일부 경우에서, 교정 서열분석 시스템은 이전에 오프라인으로 결정되어 등화기 계수와 같은 사전 구성된 매개변수로서 제공된 하나 이상의 서열분석 매개변수를 결정하는 데 교정 서열을 사용한다. 또 다른 예로서, 특정 실시예에서, 교정 서열분석 시스템은 서열분석 장치에서 서열분석 실행 중에 학습된, 예컨대 비선형 광학 왜곡 매개변수, 구조화 조명 현미경(SIM) 매개변수, 클러스터별 정규화 매개변수, 또는 특정 채널에 대한 오프셋 보정 매개변수와 같은, 하나 이상의 서열분석 매개변수를 결정하는 데 교정 서열을 사용한다.
교정 서열분석 시스템은 교정 사이클을 실행할 때 교정 사이클을 다양한 방법으로 배열하거나 순서화할 수 있다. 예를 들어, 특정 구현예에서, 교정 서열분석 시스템은 유전체 서열분석 사이클 또는 인덱싱 사이클을 수행하기 전 및/또는 수행하지 않고 교정 사이클을 수행한다. 주어진 교정 사이클 동안, 교정 서열분석 시스템은 하나 이상의 핵염기 유형의 핵염기를 하나 이상의 교정 서열을 반영하는 성장하는 올리고뉴클레오티드의 교정 서열 위치에 혼입할 수 있고, 이로써 교정 서열 세트가 주어진 교정 서열 위치에 단일 핵염기 유형 또는 상이한 핵염기 유형들을 가질 수 있음이 반영된다. 이러한 일부 교정 사이클에서, 교정 서열분석 시스템은 하나 이상의 교정 서열을 반영하는 성장하는 올리고뉴클레오티드의 주어진 교정 서열 위치에 비례 분포의 2개, 3개, 또는 4개 핵염기 유형을 혼입하고, 이로써 교정 서열 세트가 주어진 교정 서열 위치에 대략적으로 동일한 분포의 2개, 3개, 또는 4개 핵염기 유형을 가질 수 있음이 반영된다.
실제로, 주어진 교정 서열 세트는 동일한 순서의 단일 핵염기 서열(예를 들어, ACGTAC), 서로 다른 순서의 핵염기 서열(예를 들어, 한 순서의 ACGTAC 및 다른 순서의 CGTACA 등), 주어진 교정 서열 위치에 비례 분포의 핵염기 유형들을 갖는 서로 다른 핵염기 서열들(예를 들어, 제1 위치에 50%/50%의 G/C 2-플렉스, 제2 위치에 50%/50%의 G/T 2-플렉스 등), 또는 아래에 제시된 다양한 다른 서열 순서 또는 배열을 포함할 수 있다.
교정 사이클의 배열이나 순서에 관계없이, 교정 서열분석 시스템은 (i) 유전체 샘플에서 준비된 샘플 라이브러리 단편 내(또는 이와 관련하여) 상이한 위치들에 배치되거나 또는 샘플-뉴클레오티드 슬라이드의 표면에 부착된 교정 서열들의 함량을 수용하거나 결정할 수 있다. 예를 들어, 교정 서열은 샘플 라이브러리 단편 내의 비유전체 서열 및/또는 비전사체 서열의 일부 또는 전부일 수 있다. 일부 그러한 경우에서, 교정 서열은 결합 어댑터 서열과 인덱싱 서열 사이, 인덱싱 서열과 판독 프라이밍 서열 사이, 또는 판독 프라이밍 서열과 샘플 유전체 서열 사이에 위치한다. 대조적으로, 교정 서열은 비무작위 고유 분자 식별자(UMI) 서열, 고유 이중 인덱스(UDI) 서열, 인덱싱 서열, 또는 결합 어댑터 서열의 일부 또는 전부일 수 있다.
교정 서열의 다양한 상이한 위치들 외에도, 교정 서열분석 시스템은 유동 셀과 같은 뉴클레오티드-샘플 슬라이드의 상이한 위치들에 교정 서열(또는 교정 서열을 포함하는 샘플 라이브러리 단편)을 수용하거나 배치할 수 있다. 예를 들어, 교정 서열분석 시스템은, (i) 각 웰 내 올리고뉴클레오티드의 각 클러스터를 시딩하기 위해 각 웰에서 또는 (ii) 서브세트의 웰 내 각 클러스터를 시딩하거나 또는 서브세트의 웰 내 올리고뉴클레오티드 클러스터의 서브세트를 시딩하기 위해 서브세트의 웰에, 교정 서열을 갖는 뉴클레오티드-샘플 슬라이드를 수용하거나 검출할 수 있다. 대안적으로, 일부 실시예에서, 교정 서열분석 시스템은 (i) 서브세트의 웰 내 교정 서열 또는 서브세트의 웰 내 서브세트의 올리고뉴클레오티드 클러스터에 교정 서열이 있고 (ii) 다른 서브세트의 웰 또는 다른 서브세트의 올리고뉴클레오티드 클러스터에 교정 서열이 없는 뉴클레오티드-샘플 슬라이드를 수용하거나 검출한다. 아래에 설명된 바와 같이, 교정 서열에 대한 이러한 다양한 웰 배치는 샘플 라이브러리 단편과 연관된 교정 서열의 상이한 위치들과 결합될 수 있다.
위에서 나타낸 바와 같이, 본 발명의 교정 서열분석 시스템은 예컨대 기존 서열분석 시스템에 비해 서열분석 매개변수 및 뉴클레오티드 서열분석의 정확도, 속도, 및 효율을 향상시킴으로써 기존 서열분석 시스템에 비해 여러 기술적 이점을 제공한다. 예를 들어, 일부 실시예에서, 본 발명의 교정 서열분석 시스템은 특정 서열분석 장치, 이미지 분석, 및 해당 핵염기 호출에 대한 하나 이상의 서열분석 매개변수의 정확도를 향상시킨다. 위에서 언급한 바와 같이, 일부 기존 서열분석 시스템은 주어진 유전체 서열분석 사이클에서 또는 유전체 서열분석 사이클들 전반에 걸쳐 특정 핵염기 유형들을 불균형적으로 나타내는 미지 또는 기지의 유전체 샘플(예를 들어, Phi-X)로부터 이러한 매개변수를 추정함으로써 서열분석 매개변수를 왜곡한다. 이와 대조적으로, 본 발명의 교정 서열분석 시스템은 주어진 교정 사이클 또는 교정 사이클들 전반에 걸쳐 핵염기 유형들의 분포를 균등화 - 이를 통해 핵염기 유형들을 더 비례적으로 표현할 수 있음 - 할 수 있는, 핵염기의 교정 서열이 있는 뉴클레오티드-샘플 슬라이드를 수용 또는 검출한다. 교정 서열 세트의 하나 이상의 핵염기를 혼입하기 위한 교정 사이클을 수행함으로써, 교정 서열분석 시스템은 서열분석 장치에 해당하는 더 정확한 서열분석 매개변수를 결정할 수 있다. 유사한 하드웨어 및 유사한 소모품의 파이프라인에 서열분석 매개변수를 사용하는 기존 시스템과 달리, 본 발명의 교정 서열분석 시스템은 특정 서열분석 장치에서 교정 사이클을 실행하여 강도 값, 강도-값 경계, 등화기 계수, 또는 서열분석 장치에 특정된 기타 서열분석 매개변수를 생성할 수 있다. 교정 서열분석 시스템은 그에 따라 교정 서열 및 교정 사이클을 사용하여 특정 서열분석 장치에 맞게 맞춤화된 정확도로 서열분석 매개변수를 결정할 수 있다. 이러한 개선된 서열분석 매개변수의 결과로, 본 발명의 교정 서열분석 시스템은 서열분석 장치가 서열분석 사이클 동안 올리고뉴클레오티드 클러스터의 이미지를 캡처하고 그 이미지를 분석하고 이러한 분석에 기반하여 핵염기 호출을 결정하는 정확도를 위와 마찬가지로 향상시킨다.
향상된 정확도 외에도, 특정 구현예에서, 교정 서열분석 시스템은 서열분석 장치에 해당하는 하나 이상의 서열분석 매개변수를 즉각적으로 조정하여 비정상 또는 오류를 실시간으로 수정하는데, 이는 기존 서열분석 시스템에 없는 일종의 즉각적 유연성을 도입하는 것이다. 위에서 언급한 바와 같이, 일부 기존 서열분석 시스템은 서열분석 매개변수를 결정하기 위해 초기 유전체 서열분석 사이클(때때로 오류가 포함됨)을 사용함으로써 서열분석 매개변수를 왜곡하거나 오래된 서열분석 매개변수를 사용하며, 소프트웨어나 하드웨어는 시간이 지남에 따라 변경될 수 있으므로 그 후로는 이러한 매개변수를 조정하지 못한다. 기존 시스템과 대조적으로, 일부 실시예에서, 본 발명의 교정 서열분석 시스템은 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하고, 교정 서열을 사용하여 교정 사이클을 실행하여 서열분석 장치의 현재 상태에 해당하는 서열분석 매개변수를 즉각적으로 결정한다. 이에 따라 본 발명의 교정 서열분석 시스템은 교정 서열을 포함하는 그리고/또는 교정 사이클들 전반에 걸친 각 뉴클레오티드-샘플 슬라이드를 사용하여 하나 이상의 서열분석 매개변수를 결정(또는 조정)할 수 있다. 서열분석 장치용 카메라의 초점이나 중심 정렬이 변경되거나, 서열분석 장치의 온도가 변하거나, 기타 하드웨어 또는 소프트웨어 구성요소가 변경됨에 따라, 교정 서열분석 시스템은 서열분석 장치 또는 해당 소프트웨어의 현재 또는 최근 상태를 반영하는 하나 이상의 서열분석 매개변수를 결정할 수 있다.
개선된 매개변수 정확도 및 시기 적절한 조정 외에도, 일부 실시예에서, 본 발명의 교정 서열분석 시스템은 서열분석 장치의 공간 및 컴퓨팅 자원과 해당하는 서열분석 사이클을 보존함으로써 뉴클레오티드 서열분석의 컴퓨팅 효율을 개선한다. 위에서 언급한 바와 같이, 일부 기존 서열분석 시스템은 서열분석 매개변수 교정을 위한 전용 클러스터가 있는 미지 또는 기지의 유전체 샘플(예를 들어, Phi-X)에 대한 유전체 서열분석 사이클을 허비한다. 실제로, 일부 기존 서열분석 시스템은 전체 서열분석 실행 또는 뉴클레오티드-샘플 슬라이드의 특정 클러스터를 교정용 유전체 서열에 전용으로 사용한다. 기존 시스템과 대조적으로, 특정 구현예에서, 본 발명의 교정 서열분석 시스템은 샘플 라이브러리 단편 내에 내장(또는 부착)될 수 있는 비교적 짧은 교정 서열과, 샘플 라이브러리 단편 내 샘플 유전체 서열을 결정하기 위한 유전체 서열분석 사이클과 동일한 서열분석 실행 중에 수행될 수 있는 교정 사이클을 사용한다. 본 발명의 교정 서열분석 시스템은 비교적 짧은 교정 서열로 교정 사이클을 실행함으로써, 유전체 서열분석 사이클도 수행하는 서열분석 실행 중에 서열분석 장치에 해당하는 서열분석 매개변수를 결정(또는 조정)할 수 있고, 이로써, 교정 전용으로 사용되었을 미지의 샘플의 유전체 서열분석을 위한 뉴클레오티드-샘플 슬라이드에 대한 컴퓨팅 자원과 공간을 보존할 수 있다.
전술한 논의로 예시된 바와 같이, 본 개시내용은 교정 서열분석 시스템의 특징 및 이점을 설명하기 위해 다양한 용어를 활용한다. 예를 들어, 본원에 사용된 용어 "교정 서열"은 서열분석 장치 또는 해당 소프트웨어의 하나 이상의 서열분석 매개변수의 교정을 용이하게 하는 핵염기 유형을 나타내는 2개 이상의 핵염기의 서열을 지칭한다. 예를 들어, 교정 서열은 서열분석 매개변수를 결정하거나 조정하는 데 사용되는 핵염기 유형들의 목표 분포를 갖는 인공적 비유전체 및/또는 비전사체 핵염기 서열을 포함한다. 따라서 이러한 비유전체 및/또는 비전사체 서열은 샘플의 gDNA 단편, cDNA 단편, 또는 RNA 단편(예를 들어, mRNA 단편)의 일부가 아니다. 핵염기 유형의 이러한 목표 분포에는 교정 서열 세트의 위치들 전반에 걸친 상이한 핵염기 유형들의 비례 분포, 주어진 교정 서열 위치에서의 상이한 핵염기 유형들의 조합의 비례 분포, 교정 서열 세트의 위치들 전반에 따른 핵염기 유형들의 대표적 분포(예를 들어, 분류 문, 강, 목, 과, 속, 또는 종의 평균적 또는 대표적 분포), 또는 핵염기 유형들의 다른 사전 결정된 분포가 포함될 수 있다. 예를 들어, 주어진 교정 서열 세트는 동일한 순서의 핵염기 유형들의 목표 분포를 갖는 단일 핵염기 서열(예를 들어, ACTGCGC), 다른 순서의 핵염기 유형들의 목표 분포를 갖는 핵염기 서열(예를 들어, 한 순서의 경우 ACGT, 다른 순서의 경우 CGTA 등), 또는 주어진 교정 서열 위치들에 있는 핵염기 유형들의 목표 분포를 갖는 상이한 핵염기 서열들(예를 들어, 제1 위치의 25%/25%/25%/25%의 A/C/G/T 4-플렉스, 제2 위치의 25%/25%/25%/25%의 A/C/G/T 4-플렉스 등)을 포함할 수 있다. 일부 경우에서, 교정 서열은 4 내지 8개의 핵염기 길이와 같이 비교적 짧다. 교정 서열은 샘플 라이브러리 단편의 하나 이상의 뉴클레오티드 서열(또는 그 일부)에 결찰되거나 뉴클레오티드-샘플 슬라이드의 표면에 결찰될 수 있다.
관련하여, 용어 "교정 핵염기"는 서열분석 장치 또는 해당하는 소프트웨어의 하나 이상의 서열분석 매개변수 교정을 용이하게 하는 핵염기를 지칭한다. 예를 들어, 한 그룹의 교정 핵염기는 서열분석 매개변수를 결정하거나 조정하는 데 사용되는 핵염기 유형들의 목표 분포를 갖는 인공적 비유전체 및/또는 비전사체 핵염기 세트를 포함한다. 따라서 이러한 비유전체 및/또는 비전사체 핵염기 세트는 gDNA 단편 또는 cDNA 단편의 일부가 아니거나 그로부터 추출되지 않는다. 이러한 핵염기 유형들의 목표 분포는 상이한 샘플 라이브러리 단편 세트들 전반에 걸친 상이한 핵염기 유형들의 비례 분포, 상이한 샘플 라이브러리 단편 세트들 전반에 걸친 핵염기 유형들의 대표적 분포(예를 들어, 분류 문, 강, 목, 과, 속, 또는 종의 평균적 또는 대표적 분포), 또는 핵염기 유형들의 다른 사전 결정된 분포를 포함할 수 있다. 교정 서열과 유사하게, 교정 핵염기는 샘플 라이브러리 단편의 하나 이상의 뉴클레오티드 서열(또는 그 일부)에 결찰되거나 뉴클레오티드-샘플 슬라이드의 표면에 결찰될 수 있다.
본원에서 추가로 사용되는 용어 "샘플 라이브러리 단편"은 샘플 유전체 서열 또는 cDNA 서열의 검출 또는 단리를 용이하게 하는 하나 이상의 어댑터 서열 또는 프라이머 서열을 포함하도록 결찰된 샘플 유전체 서열(또는 cDNA 서열)을 지칭한다. 예를 들어, 샘플 라이브러리 단편은, 샘플로부터 추출되고 결합 어댑터 서열, 인덱싱 서열, 또는 판독 프라이밍 서열 중 하나 이상과 직접 또는 간접적으로 결합하도록 결찰되는 샘플 유전체 서열(또는 cDNA 서열)을 포함할 수 있지만 이에 국한되지는 않는다.
관련하여, 용어 "샘플 유전체 서열"은 샘플의 염색체로부터 추출되거나 복사된 뉴클레오티드 서열을 지칭한다. 예를 들어, 샘플 유전체 서열은 샘플의 염색체 DNA로부터 분리되거나 복사된 뉴클레오티드 서열을 포함한다. 따라서, 샘플 유전체 서열은 미지의 특정 샘플에 대한 유전체 DNA(gDNA)를 포함한다. 본원에 기재된 바와 같이, 일부 실시예에서, 교정 서열분석 시스템은 당업자가 이해하는 바와 같이 샘플 라이브러리 단편에 gDNA를 포함하는 샘플 유전체 서열이 아닌 cDNA를 포함하는 샘플 상보적 서열을 사용할 수 있거나 적합한 cDNA가 gDNA를 대체할 수 있는 경우마다 사용할 수 있다.
대조적으로, "인덱싱 서열"은 샘플에 대한 뉴클레오티드-단편 판독을 식별하고 샘플의 뉴클레오티드 서열(예를 들어, gDNA 단편 또는 cDNA 단편)에 결찰되거나 또는 샘플 라이브러리 단편 내의 다른 서열에 결찰되는 고유한 인공적인 뉴클레오티드 서열을 지칭한다. 위에 나타낸 바와 같이, 인덱싱 서열은 샘플 라이브러리 단편의 일부일 수 있다. 마찬가지로, 인덱싱 서열은 뉴클레오티드-단편 판독을 무엇보다도 샘플별로 또는 다른 파일로 정렬하는 데 사용될 수 있다. 일부 경우에서, 샘플 라이브러리 단편은, 판독 프라이밍 서열과 다르고 인덱싱 서열의 핵염기를 결정하기 위한 시작점 또는 시작 핵염기를 나타내는 인덱싱 프라이머 서열을 포함한다.
본원에서 추가로 사용되는 용어 "결합 어댑터 서열"은, 뉴클레오티드-샘플 슬라이드의 표면(예를 들어, 웰) 상의 올리고뉴클레오티드에 결합하고 샘플의 뉴클레오티드 서열(예를 들어, gDNA 단편 또는 cDNA 단편)에 결찰되거나 또는 샘플 라이브러리 단편 내의 다른 서열에 결찰되는 뉴클레오티드 서열을 지칭한다. 일부 경우에서, 결합 어댑터 서열은 샘플 라이브러리 단편의 말단(예를 들어, 5' 말단 또는 3' 말단)에 결찰되고 샘플-뉴클레오티드 슬라이드의 올리고뉴클레오티드 론(lawn)으로부터의 올리고뉴클레오티드에 결합하는 뉴클레오티드 서열을 포함한다.
본원에서 또한 사용되는 용어 "판독 프라이밍 서열"은, 샘플의 뉴클레오티드 서열(예를 들어, gDNA 단편 또는 cDNA 단편)의 핵염기를 결정하기 위한 시작점 또는 시작 핵염기를 나타내고 샘플의 뉴클레오티드 서열에 결찰되는 뉴클레오티드 서열을 지칭한다. 서열분석 중에, 일부 경우에서, 서열분석 프라이머는 샘플 라이브러리 단편으로부터의 판독 프라이밍 서열을 결합하거나 어닐링하고, 폴리머라제 효소 또는 기타 효소는, 서열분석 프라이머에 추가되고 샘플 유전체 서열(및/또는 샘플 라이브러리 단편으로부터의 다른 뉴클레오티드 서열들)에 상보적인 핵염기들을 혼입하여 뉴클레오티드-단편 판독을 서열분석한다. 위에 나타낸 바와 같이, 판독 프라이밍 서열은 샘플 라이브러리 단편의 일부일 수 있다.
관련하여, 본원에서 사용되는 용어 "서열분석 프라이머"는 뉴클레오티드-단편 판독의 시작 부분으로서의 판독 프라이밍 서열(또는 다른 프라이머 부위)에 결합하는 뉴클레오티드-단편을 지칭한다. 특히, 서열분석 프라이머는, 서열분석 사이클(예를 들어, 유전체 서열분석 사이클, 교정 사이클) 동안 판독 프라이밍 서열(또는 다른 프라이머 부위)에 결합하고 뉴클레오티드-단편 판독에 대한 초기 서열을 형성하는 뉴클레오티드-단편을 포함한다. 위에서 제안된 바와 같이, 서열분석 사이클 동안, 효소는 핵염기 단위로 핵염기를 서열분석 프라이머에 추가하거나 혼입하여 뉴클레오티드-단편 판독을 성장시키거나 서열분석한다.
위에서 추가로 언급한 바와 같이, 교정 서열분석 시스템은 한 번 이상의 교정 사이클을 수행 또는 실행할 수 있다. 용어 "교정 사이클"은 올리고뉴클레오티드 클러스터 또는 올리고뉴클레오티드 클러스터 세트에 대한 하나 이상의 교정 서열을 나타내거나 이에 해당하는 하나 이상의 올리고뉴클레오티드에 하나 이상의 핵염기를 추가하거나 포함시키는 반복을 지칭한다. 특히, 교정 사이클은 하나 이상의 교정 서열을 나타내거나 이에 해당하는 올리고뉴클레오티드(또는 병렬로 올리고뉴클레오티드들에)에 추가되거나 혼입된 하나 이상의 핵염기를 나타내는 올리고뉴클레오티드 클러스터의 하나 이상의 이미지를 캡처하고 분석하는 반복을 포함할 수 있다. 일부 올리고뉴클레오티드 클러스터 또는 해당 웰은 교정 서열을 포함할 수 있는 반면 다른 올리고뉴클레오티드 클러스터 또는 해당 웰은 교정 서열을 포함하지 않을 수 있으므로, 교정 사이클은 일부 경우에서는 올리고뉴클레오티드 클러스터 또는 한 세트의 올리고뉴클레오티드 클러스터에 특이적이다. 교정 사이클은 교정 사이클이 하나 이상의 교정 서열로부터 적어도 하나의 핵염기(또는 대부분의 핵염기)의 서열분석을 포함한다는 점에서 인덱싱 사이클 또는 유전체 서열분석 사이클과 다르다. 교정 서열을 분배하는 데 있어서 클러스터들 간의 잠재적인 차이로 인해, 일부 실시예에서는, 교정 서열분석 시스템은 (i) 하나 이상의 교정 서열에 해당하는 하나 이상의 핵염기를 혼입함으로써 한 올리고뉴클레오티드 클러스터(또는 한 서브세트의 올리고뉴클레오티드 클러스터)에 대한 교정 사이클을 수행하는 것과, (ii) 하나 이상의 샘플 유전체 서열 또는 하나 이상의 인덱싱 서열에 각각 해당하는 하나 이상의 핵염기를 혼입함으로써 다른 올리고뉴클레오티드 클러스터(또는 다른 서브세트의 올리고뉴클레오티드 클러스터)에 대한 유전체 서열분석 사이클 또는 인덱싱 사이클을 수행하는 것을 동시에 행할 수 있다.
대조적으로, 용어 "인덱싱 사이클"은, 인덱싱 서열을 나타내거나 이에 해당하는 올리고뉴클레오티드에 핵염기를 추가하거나 혼입하는 반복, 또는 인덱싱 서열을 나타내거나 이에 해당하는 올리고뉴클레오티드에 핵염기들을 병렬로 추가하거나 혼입하는 반복을 지칭한다. 특히, 인덱싱 사이클은 하나 이상의 인덱싱 서열을 나타내거나 이에 해당하는 올리고뉴클레오티드에 또는 올리고뉴클레오티드들에 (병렬로) 추가되거나 혼입된 하나 이상의 핵염기를 나타내는 올리고뉴클레오티드 클러스터의 하나 이상의 이미지를 캡처하고 분석하는 반복을 포함할 수 있다. 인덱싱 사이클은 하나 이상의 샘플 라이브러리 단편을 식별하거나 인코딩하는 하나 이상의 인덱싱 서열에서 적어도 하나의 핵염기(또는 대부분의 핵염기)를 서열분석하는 것을 포함한다는 점에서 교정 사이클이나 유전체 서열분석 사이클과 다르다. 교정 사이클은 올리고뉴클레오티드 클러스터 또는 올리고뉴클레오티드 클러스터들에 특정할 수 있기 때문에, 한 올리고뉴클레오티드 클러스터에 대한 인덱싱 사이클은 다른 올리고뉴클레오티드 클러스터에 대한 교정 사이클과 동시에 수행될 수 있다.
본원에서 추가로 사용되는 용어 "유전체 서열분석 사이클"은 샘플 유전체 서열(또는 cDNA 서열)을 나타내거나 이에 해당하는 올리고뉴클레오티드에 핵염기를 추가하거나 혼입하는 반복, 또는 샘플 유전체 서열들(또는 cDNA 서열들)을 나타내거나 이에 해당하는 올리고뉴클레오티드들에 핵염기들을 병렬로 추가하거나 혼입하는 반복을 지칭한다. 특히, 유전체 서열분석 사이클은 하나 이상의 샘플 유전체 서열을 나타내거나 이에 해당하는 올리고뉴클레오티드 또는 올리고뉴클레오티드들에 (병렬로) 추가되거나 혼입된 개별 핵염기를 나타내는 데이터를 갖는 하나 이상의 이미지를 캡처하고 분석하는 반복을 포함할 수 있다. 예를 들어, 하나 이상의 실시예에서, 각각의 유전체 서열분석 사이클은 유전체 샘플의 일부를 나타내는 DNA(또는 RNA) 가닥의 단일 판독(또는 유전체 샘플로부터 전사된 서열)을 결정하기 위해 이미지를 캡처하고 분석하는 것을 포함한다. 그러나 위에서 제안된 바와 같이. 유전체 서열분석 사이클은 일부 경우에서는 올리고뉴클레오티드 클러스터 또는 올리고뉴클레오티드 클러스터 세트에 특정적이다. 교정 서열들을 분포시키는 데 있어서의 클러스터들 간의 잠재적인 차이로 인해, 일부 실시예에서는, 교정 서열분석 시스템은 (i) 한 올리고뉴클레오티드 클러스터(또는 한 서브세트의 올리고뉴클레오티드 클러스터)에 대한 교정 사이클을 수행하는 것과, (ii) 다른 올리고뉴클레오티드 클러스터(또는 다른 서브세트의 올리고뉴클레오티드 클러스터)에 대한 유전체 서열분석 사이클 또는 인덱싱 사이클을 수행하는 것을 동시에 행할 수 있다.
일부 경우에서, 교정 사이클, 인덱싱 사이클, 및 유전체 서열분석 사이클 각각에는 특정 올리고뉴클레오티드들 - 이들은 종종 클러스터로 그룹화됨 - 에 추가되거나 혼입된 특정 핵염기의 이미지 데이터를 생성하기 위해 뉴클레오티드-샘플 슬라이드의 이미지 또는 뉴클레오티드-샘플 슬라이드의 여러 섹션(예를 들어, 타일)의 이미지들을 카메라로 캡처하는 것이 포함된다. 이미지 캡처 단계에 이어, 교정 서열분석 시스템은 혼입된 핵염기에서 특정 형광 라벨을 제거하고, 교정 서열, 인덱싱 서열, 또는 샘플 유전체 서열이 완전히 서열분석될 때까지 다른 사이클을 수행할 수 있다.
본원에서 추가로 사용되는 용어 "서열분석 실행"은 샘플(예를 들어, 유전체 샘플)로부터 뉴클레오티드 서열의 일차 구조를 결정하기 위한 서열분석 장치에서의 반복 프로세스를 지칭한다. 특히, 서열분석 실행은, 샘플(또는 라이브러리 단편 내의 다른 서열)에서 추출되고 뉴클레오티드-샘플 슬라이드 전체에 걸쳐 시딩된 뉴클레오티드 서열로부터 뉴클레오티드-단편 판독을 결정하기 위해, 성장하는 올리고뉴클레오티드에 핵염기를 혼입하는 서열분석 장치에 의해 수행되는, 서열분석 화학 및 영상화의 사이클을 포함한다. 일부 경우에서, 서열분석 실행은 뉴클레오티드-샘플 슬라이드(예를 들어, 유동 셀) 전체에 걸쳐 클러스터에 시딩된 하나 이상의 유전체 샘플로부터 뉴클레오티드 서열을 복제하는 것을 포함한다. 서열분석 실행이 완료되면, 서열분석 장치는 파일에 염기 호출 데이터를 생성할 수 있다.
방금 제안한 바와 같이, 용어 "염기 호출 데이터"는 뉴클레오티드-단편 판독 및/또는 해당 서열분석 측정 지표에 대한 핵염기 호출을 나타내는 데이터를 지칭한다. 예를 들어, 염기 호출 데이터는 해당 염기 호출 품질 측정 지표, 깊이 측정 지표, 및/또는 기타 서열분석 측정 지표와 함께 뉴클레오티드-단편 판독에 대한 핵염기 호출을 텍스트(예를 들어, A, C, G, T)로 나타내는 텍스트 데이터를 포함한다. 일부 경우에서, 염기 호출 데이터는 BCL(binary base call) 서열 파일 또는 FASTQ(fast-all quality) 파일과 같은 텍스트 파일 형태로 포맷된다.
본원에서 추가로 사용되는 용어 "서열분석 매개변수"는, (i) 특정 핵염기 유형의 핵염기가 서열분석 장치를 사용하여 정확하게 검출되거나, 정량화되거나, 또는 분석될 수 있거나, (ii) 핵염기 유형의 특정 신호(또는 이와 관련된 노이즈 또는 화학 물질)가 서열분석 장치를 사용하여 정확하게 검출되거나, 정량화되건, 또는 분석될 수 있는, 설정, 경계, 또는 환경을 정량화하거나 나타내는 표준화되거나 크기가 조정된 인자, 측정 지표, 또는 값을 지칭한다. 예를 들어, 서열분석 매개변수는 등화기 계수, 합성곱 커널 계수, 강도 값에 대한 핵염기 중심, 핵염기 특정 배경 강도 값, 강도 정규화 계수, 가우스 공분산 행렬, 비선형 광학 왜곡 매개변수, 구조화 조명 현미경(SIM) 매개변수, 특정 채널에 대한 클러스터당 정규화 매개변수, 채널별 정규화 매개변수(예를 들어, 특정 채널에 대한 오프셋 보정 매개변수, 특정 채널에 대한 클러스터당 강도 매개변수, 특정 채널에 대한 클러스터당 명도 매개변수), 클러스터별 신호 정규화 매개변수(예를 들어, 서열분석 장치 클러스터 증폭 효율 매개변수, 서열분석 장치 클러스터 혼성화 효율 매개변수), 색상 채널 간 크로스토크 매개변수, 또는 폴리콜로날러티 매개변수 중 하나 이상을 포함하지만 이에 국한되지는 않는다.
본원에서 추가로 사용된 용어 "뉴클레오티드-샘플 슬라이드"는 유전체 샘플 또는 다른 샘플 핵산 중합체로부터의 뉴클레오티드 서열을 서열분석하기 위한 올리고뉴클레오티드를 포함하는 플레이트 또는 슬라이드를 지칭한다. 특히, 뉴클레오티드-샘플 슬라이드는 서열분석의 일부로 시약과 완충액(buffer)이 이동할 수 있는 유체 채널을 함유하는 슬라이드를 의미할 수 있다. 예를 들어, 하나 이상의 실시예에서, 뉴클레오티드-샘플 슬라이드는 작은 유체 채널들을 포함하는 유동 셀(예를 들어, 패턴화된 유동 셀 또는 비패턴화된 유동 셀)과, 어댑터 서열에 상보적인 짧은 올리고뉴클레오티드를 포함한다. 위에 나타낸 바와 같이, 뉴클레오티드-샘플 슬라이드는 올리고뉴클레오티드 클러스터들을 포함하는 웰(예를 들어, 나노웰)들을 포함할 수 있다.
본원에 사용된 바와 같이, 유동 셀 또는 다른 뉴클레오티드-샘플 슬라이드는 (i) 반응 구조의 복수의 반응 부위와 연통하는 유동 채널을 그 사이에 형성하기 위해 반응 구조 위로 연장되는 뚜껑을 갖는 장치 및 (ii) 반응 부위 또는 그 부근에서 발생하는 지정된 반응을 검출하도록 구성된 검출 장치를 포함할 수 있다. 유동 셀 또는 기타 뉴클레오티드-샘플 슬라이드는 전하 결합 소자(CCD) 또는 상보형 금속 산화물 반도체(CMOS)(광) 검출 장치와 같은 고체 상태 광 검출 또는 영상 장치를 포함할 수 있다. 하나의 구체적인 예로서, 유동 셀은 생물검정 시스템에 유체적으로 및/또는 전기적으로 결합되도록 구성될 수 있는 카트리지(혼입 펌프를 가짐)에 유체 및 전기적으로 결합되도록 구성될 수 있다. 카트리지 및/또는 생물검정 시스템은 사전 결정된 프로토콜(예를 들어, 합성에 의한 서열분석)에 따라 유동 셀의 반응 부위에 반응 용액을 전달할 수 있고 복수의 영상화 이벤트를 수행할 수 있다. 예를 들어, 카트리지 및/또는 생물검정 시스템은 하나 이상의 반응 용액을 유동 셀의 흐름 채널을 통해 반응 부위를 따라 안내할 수 있다. 반응 용액 중 적어도 하나는 동일하거나 상이한 형광 라벨을 갖는 4가지 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 유동 셀의 반응 부위, 예를 들어 반응 부위의 해당 올리고뉴클레오티드에 결합할 수 있다. 그런 다음 카트리지 및/또는 생물검정 시스템은 여기 광원(예를 들어, 발광 다이오드(LEDS)과 같은 고체 상태 광원)을 사용하여 반응 부위를 조명할 수 있다. 여기 광은 유동 셀의 광 센서에 의해 검출될 수 있는 방출 신호(예를 들어, 여기 광과 다른, 잠재적으로 서로 다른 파장 또는 파장들의 광)를 제공할 수 있다.
본원에서 추가로 사용되는 용어 "뉴클레오티드-단편 판독"(또는 간단히 "판독")은 샘플 뉴클레오티드 서열(예를 들어, 샘플 유전체 서열, cDNA)의 전부 또는 일부로부터의 하나 이상의 핵염기(또는 핵염기 쌍)의 추론된 서열을 지칭한다. 특히, 뉴클레오티드-단편 판독은 유전체 샘플에 해당하는 샘플 라이브러리 단편으로부터의 뉴클레오티드 서열(또는 단클론 뉴클레오티드 서열의 그룹)에 대한 핵염기 호출의 결정되거나 예측된 서열을 포함한다. 예를 들어, 일부 경우에서, 서열분석 장치는 뉴클레오티드-샘플 슬라이드의 나노기공(nanopore)을 통과한 핵염기에 대한 핵염기 호출을 생성함으로써, 형광 태깅을 통해 결정되거나 유동 셀 내의 클러스터로부터 결정된 뉴클레오티드-단편 판독을 결정한다.
본원에서 추가로 사용되는 용어 "핵염기 호출"(또는 간단히 "염기 호출")은 서열분석 사이클 동안의 올리고뉴클레오티드(예를 들어, 판독)에 대한 또는 샘플 유전체의 좌표에 대한 특정 핵염기(또는 핵염기 쌍)의 결정 또는 예측을 지칭한다. 특히, 핵염기 호출은 (i) 뉴클레오티드-샘플 슬라이드에서의 올리고뉴클레오티드 내에 혼입된 핵염기 유형의 결정 또는 예측(예를 들어, 판독 기반 핵염기 호출) 또는 (ii) 디지털 출력 파일에서의 변이 호출(variant call) 또는 비변이 호출(non-variant call)을 포함하여 유전체 좌표 또는 유전체 내 영역에 존재하는 핵염기 유형의 결정 또는 예측을 나타낼 수 있다. 일부 경우에서, 뉴클레오티드-단편 판독의 경우, 핵염기 호출은 (예를 들어, 유동 셀의 클러스터에서의) 뉴클레오티드-샘플 슬라이드의 올리고뉴클레오티드에 추가된 형광 태그가 지정된 뉴클레오티드로부터 발생하는 강도 값을 기반으로 하는 핵염기의 결정 또는 예측을 포함한다. 대안적으로, 핵염기 호출은 뉴클레오티드-샘플 슬라이드의 나노기공을 통과하는 뉴클레오티드로 인해 발생하는 크로마토그램 피크 또는 전류 변화로부터의 핵염기의 결정 또는 예측을 포함한다. 대조적으로, 핵염기 호출은 또한, 유전체 좌표에 해당하는 뉴클레오티드-단편 판독에 기반한, 변이 호출 파일(VCF) 또는 기타 염기 호출 출력 파일에 대한 샘플 유전체의 유전체 좌표에서의 핵염기의 최종 예측을 포함할 수 있다. 이에 따라, 핵염기 호출은 유전체 좌표에 해당하는 염기 호출 및 기준 유전체에 해당하는 특정 위치에서의 변이 또는 비변이의 표시와 같은 기준 유전체를 포함할 수 있다. 실제로, 핵염기 호출은 단일 뉴클레오티드 변이(SNV), 삽입 또는 삭제(인델), 또는 구조적 변이의 일부인 염기 호출을 포함하지만 이에 국한되지 않는 변이 호출을 지칭할 수 있다. 위에서 제안된 바와 같이, 단일 핵염기 호출은 아데닌(A) 호출, 시토신(C) 호출, 구아닌(G) 호출, 또는 티민(T) 호출일 수 있다.
관련하여, 용어 "핵염기 유형"은 특정 유형 또는 종류의 질소 염기를 지칭한다. 예를 들어, 유전체 또는 뉴클레오티드 서열은 아데닌(A), 시토신(C), 구아닌(G), 티민(T), 또는 우라실(U)을 포함한 5가지의 상이한 핵염기 유형을 포함할 수 있다.
하기 단락에서는 교정 서열분석 시스템에 대해서 예시적인 실시예 및 구현예를 묘사하는 예시적인 도면과 관련하여 기술한다. 예를 들어, 도 1은 교정 서열분석 시스템(106)이 하나 이상의 실시예에 따라 동작하는 시스템 환경(또는 "환경")(100)의 개략도를 예시한다. 예시된 바와 같이, 환경(100)은 네트워크(116)를 통해 서버 장치(들)(102), 서열분석 장치(112), 및 사용자 클라이언트 장치(108)를 포함한다. 도 1은 교정 서열분석 시스템(106)의 일 실시예를 나타내지만, 본 개시내용은 아래의 대안적인 실시예 및 구성을 기술한다. 도 1에 도시된 바와 같이, 서열분석 장치(112), 서버 장치(들)(102), 및 사용자 클라이언트 장치(108)는 네트워크(116)를 통해 서로 통신할 수 있다. 네트워크(116)는 컴퓨팅 장치가 통신할 수 있는 임의의 적합한 네트워크를 포함한다. 예시적인 네트워크는 도 11과 관련하여 아래에서 추가로 자세히 논의된다.
도 1에 나타낸 바와 같이, 서열분석 장치(112)는 컴퓨팅 장치, 서열분석 장치 시스템(114), 및 유전체 샘플 또는 다른 핵산 중합체의 서열분석 및 교정 사이클 실행을 위한 교정 서열분석 시스템(106)을 포함한다. 일부 실시예에서, 서열분석 장치(112)는 서열분석 장치 시스템(114) 또는 교정 서열분석 시스템(106)을 실행함으로써, 서열분석 장치(112)에서 직접적 또는 간접적으로 컴퓨터로 구현된 방법 및 시스템(본원에 설명됨)을 활용하여 유전체 샘플로부터 추출된 핵산 세그먼트 또는 올리고뉴클레오티드를 분석하여 뉴클레오티드-단편 판독 또는 기타 데이터를 생성한다. 더 구체적으로, 서열분석 장치(112)는 샘플로부터 추출된 뉴클레오티드 서열을 포함하는 뉴클레오티드-샘플 슬라이드(예를 들어, 유동 셀)를 수용한 다음, 추출된 뉴클레오티드 서열의 핵염기 서열을 복사하고 결정한다.
위에서 제안된 바와 같이, 서열분석 장치(112)는 서열분석 장치 시스템(114) 또는 교정 서열분석 시스템(106)을 실행함으로써, 한 번 이상의 교정 사이클, 인덱싱 사이클, 또는 유전체 서열분석 사이클을 실행할 수 있다. 서열분석 장치(112)는 예를 들어 교정 서열분석 시스템(106)을 실행함으로써, 샘플-뉴클레오티드 슬라이드에 침착된 라이브러리 단편과 연관된 교정 서열을 검출하고 교정 사이클을 실행하여 교정 서열에 기반하여 서열분석 장치(112)에 해당하는 서열분석 매개변수를 결정할 수 있다. 하나 이상의 실시예에서, 서열분석 장치(112)는 합성에 의한 서열분석(SBS: sequencing-by-synthesis)을 활용하여 핵산 중합체를 뉴클레오티드-단편 판독으로 서열분석한다. 네트워크(116)를 통한 통신에 추가적으로 또는 대안적으로, 일부 실시예에서, 서열분석 장치(112)는 네트워크(116)를 우회해서 서버 장치(들)(102) 또는 사용자 클라이언트 장치(108)와 직접 통신한다.
일부 경우에서, 서버 장치(들)(102)는 서열분석 장치(112)와 동일한 물리적 위치에 또는 그 근처에 위치하거나 서열분석 장치(112)로부터 원격에 위치한다. 실제로, 일부 실시예에서, 서버 장치(들)(102)와 서열분석 장치(112)는 동일한 컴퓨팅 장치에 혼입된다. 서버 장치(들)(102)는 서열분석 시스템(104) 또는 교정 서열분석 시스템(106)을 실행하여, 예컨대 염기 호출 데이터를 수신하거나 이러한 염기 호출 데이터 분석에 기반하여 변이 호출을 결정함으로써, 디지털 데이터를 생성, 수신, 분석, 저장, 및 전송할 수 있다. 도 1에서 제안된 바와 같이, 서열분석 장치(112)는 이 서열분석 장치(112)가 서열분석을 실행하는 동안 생성된 염기 호출 데이터를 전송할 수 있다(그리고 서버 장치(들)(102)는 그 염기 호출 데이터를 수신할 수 있다). 서버 장치(들)(102)는 서열분석 시스템(104) 또는 교정 서열분석 시스템(106) 형태의 소프트웨어를 실행함으로써, 뉴클레오티드-단편 판독을 기준 유전체와 정렬하고 그 정렬된 뉴클레오티드-단편 판독에 기반하여 유전적 변이를 결정할 수 있다. 서버 장치(들)(102)는 또한, 사용자 클라이언트 장치(108)와 통신할 수 있다. 특히, 서버 장치(들)(102)는 변이 호출 파일(VCF), 또는 핵염기 호출, 서열분석 측정 지표, 오류 데이터, 또는 기타 측정 지표를 나타내는 기타 정보를 포함하여 데이터를 사용자 클라이언트 장치(108)로 전송할 수 있다.
일부 실시예에서, 서버 장치(들)(102)는 분산 서버 집합을 포함하며, 여기서 서버 장치(들)(102)는 네트워크(116)에 걸쳐 분산되고 동일하거나 상이한 물리적 위치에 위치된 다수의 서버 장치를 포함한다. 또한, 서버 장치(들)(102)는 콘텐츠 서버, 애플리케이션 서버, 통신 서버, 웹 호스팅 서버, 또는 다른 유형의 서버를 포함할 수 있다.
도 1에 추가로 예시되고 나타낸 바와 같이, 사용자 클라이언트 장치(108)는 디지털 데이터를 생성, 저장, 수신 및 전송할 수 있다. 특히, 사용자 클라이언트 장치(108)는 서버 장치(들)(102)로부터 변이 호출 및 해당 서열분석 측정 지표를 수신하거나, 서열분석 장치(112)로부터 염기 호출 데이터(예를 들어, BCL 또는 FASTQ) 및 해당 서열분석 측정 지표를 수신할 수 있다. 또한, 사용자 클라이언트 장치(108)는 서버 장치(들)(102) 또는 서버 장치(들)(102)와 통신하여 핵염기 호출 및/또는 염기 호출 품질 측정 지표 또는 통과 필터 측정 지표와 같은 기타 측정 지표를 포함하는 VCF를 수신할 수 있다. 이에 따라 사용자 클라이언트 장치(108)는 변이체 호출 또는 다른 핵염기 호출에 관한 정보를 사용자 클라이언트 장치(108)와 연관된 사용자에게 그래픽 사용자 인터페이스 내에서 제시하거나 표시할 수 있다.
도 1은 사용자 클라이언트 장치(108)를 데스크탑 또는 랩탑 컴퓨터로 도시하고 있지만, 사용자 클라이언트 장치(108)는 다양한 유형의 클라이언트 장치를 포함할 수 있다. 예를 들어, 일부 실시예에서, 사용자 클라이언트 장치(108)는 데스크톱 컴퓨터 또는 서버와 같은 비-모바일 장치, 또는 다른 유형의 클라이언트 장치를 포함한다. 또 다른 실시예에서, 사용자 클라이언트 장치(108)는 랩톱, 태블릿, 휴대폰 또는 스마트폰과 같은 모바일 장치를 포함한다. 사용자 클라이언트 장치(108)에 관한 추가 세부 사항은 도 11과 관련하여 아래에서 논의된다.
도 1에 추가로 예시된 바와 같이, 사용자 클라이언트 장치(108)는 서열분석 애플리케이션(110)을 포함한다. 서열분석 애플리케이션(110)은 사용자 클라이언트 장치(108)에 저장되고 실행되는 웹 애플리케이션 또는 네이티브(native) 애플리케이션(예를 들어, 모바일 애플리케이션, 데스크톱 애플리케이션)일 수 있다. 서열분석 애플리케이션(110)은, (실행될 때) 사용자 클라이언트 장치(108)로 하여금 교정 서열분석 시스템(106)으로부터 데이터를 수신하게 하고, 염기 호출 데이터(예를 들어, BCL로부터의 것) 또는 VCF로부터의 데이터를 클라이언트 장치(108)에 표시하기 위해 제시하게 하는 명령어를 포함할 수 있다.
도 1에 추가로 예시된 바와 같이, 소정의 버전의 교정 서열분석 시스템(106)이 서열분석 애플리케이션(110)의 일부로서 사용자 클라이언트 장치(108)에, 또는 서버 장치(들)(102)에 위치할 수 있다. 따라서 일부 실시예에서, 교정 서열분석 시스템(106)은 사용자 클라이언트 장치(108)에 의해 구현된다(예를 들어, 전체적으로 또는 부분적으로 위치된다). 또 다른 실시예에서, 교정 서열분석 시스템(106)은 서버 장치(102)와 같은 환경(100)의 하나 이상의 다른 구성요소들에 의해 구현된다. 특히, 교정 서열분석 시스템(106)은 서열분석 장치(들)(112), 사용자 클라이언트 장치(108), 및 서버 장치(들)(102) 전체에 걸쳐 다양한 다른 방식으로 구현될 수 있다. 예를 들어, 교정 서열분석 시스템(106)은 서버 장치(들)(102)로부터, 환경(100) 내의 각각의 장치에서 교정 서열분석 시스템(106)의 기능 중 전부 또는 일부가 수행되는 서열분석 장치(112) 및/또는 사용자 클라이언트 장치(108)로, 다운로드될 수 있다.
위에서 나타낸 바와 같이, 교정 서열분석 시스템(106)은 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하고 교정 사이클을 실행하여 서열분석 장치에 해당하는 서열분석 매개변수를 조정하거나 아니면 결정할 수 있다. 하나 이상의 실시예에 따르면, 도 2a는 (i) 교정 서열 및 샘플 라이브러리 단편과 연관된 샘플 라이브러리 단편을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하고, (ii) 교정 사이클을 실행하여 핵염기를 교정 서열에 해당하는 올리고뉴클레오티드에 혼입해서, 교정 사이클 및 교정 서열에 기반하여 서열분석 장치에 해당하는 서열분석 매개변수를 결정하는 교정 서열분석 시스템(106)의 예를 예시한다.
도 2a에 도시된 바와 같이, 예를 들어, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편(205a 내지 205n)과 연관된 교정 서열(204a 내지 204n)을 포함하는 뉴클레오티드-샘플 슬라이드(202)를 수용하거나 검출한다. 도시된 바와 같이, 일부 경우에서, 교정 서열(204a 내지 204n)은 예컨대 길이가 4 내지 8 핵염기와 같이 비교적 짧다. 뉴클레오티드-샘플 슬라이드(202)는 웰(206a 내지 206n)(예를 들어, 나노웰) 내에 샘플 라이브러리 단편(205a 내지 205n)을 포함하고, 교정 서열(204a 내지 204n)은 샘플 라이브러리 단편(205a 내지 205n)의 일부이다. 따라서, 교정 서열(204a 내지 204n)은, 샘플 라이브러리 단편(205a 내지 205n)으로 올리고뉴클레오티드 클러스터를 시딩하는 것의 일부로서, 웰(206a 내지 206a) 내에(또는 일부 경우에서는 웰이 없는 비패턴화 뉴클레오티드-샘플 슬라이드의 표면에) 침착되었다. 교정 서열의 추가 실시예는 도 3a 및 도 3b와 도 5a 내지 도 5e를 참조하여 아래에 설명된다.
도 2a에 추가로 도시된 바와 같이, 교정 서열분석 시스템(106)은 서열분석 장치(112)를 사용하여 한 번 이상의 교정 사이클(208)을 수행한다. 예를 들어, 교정 사이클 동안 교정 서열분석 시스템(106)은, 예컨대 교정 서열(204a 내지 204n)의 핵염기를 보완하는 핵염기 유형의 핵염기를 추가함으로써(예를 들어, T를 보완하는 A를 혼입시킴으로써) 하나 이상의 핵염기 유형의 핵염기를 교정 서열(204a 내지 204n)에 해당하는 성장하는 올리고뉴클레오티드에 혼입하기 위해 서열분석 장치(112)를 사용한다. 일부 경우에서, 교정 서열분석 시스템(106)은 단일 뉴클레오티드-단편 판독 또는 쌍을 이룬 말단 뉴클레오티드-단편 판독 내에 교정 서열(204a 내지 204n)에 상보적이거나 그에 따르는 성장하는 올리고뉴클레오티드에 핵염기를 추가함으로써, 교정 서열(204a 내지 204n) 내에서 핵염기 유형의 목표 분포를 반영하는 올리고뉴클레오티드 클러스터를 생성한다.
위에서 제안된 바와 같이, 교정 서열분석 시스템(106)은 교정 사이클(208) 동안 교정 서열(204a 내지 204n)에 대한 핵염기 호출을 결정하거나, 또는 결정하지 않는다. 따라서, 주어진 교정 사이클 동안, 교정 서열분석 시스템(106)은 교정 서열(204a 내지 204n)을 보완하거나 반영하는 태그(예를 들어, 형광 태그)를 갖는 핵염기가 혼입된 올리고뉴클레오티드 클러스터의 이미지를 캡처하고 분석할 수 있다. 그러나 교정 서열분석 시스템(106)은 주어진 교정 사이클 동안 태그를 갖는 핵염기에 대한 핵염기 호출을 반드시 결정하지는 않는다.
교정 사이클(208) 동안 또는 후에, 일부 실시예에서, 교정 서열분석 시스템(106)은 초기 서열분석 매개변수(210)를 검출하거나 아니면 결정한다. 예를 들어, 교정 서열분석 시스템(106)은 핵염기에 해당하는 신호에 대한 강도 값, 강도-값 경계, 강도 값에 대한 핵염기 중심, 노이즈 측정 지표, 또는 교정 사이클 동안 검출되거나 출력되는 기타 다양한 측정 지표 중 하나 이상을 결정함으로써 초기 서열분석 매개변수들(210) 중 하나 이상을 결정할 수 있다. 아래에서 더 설명되는 바와 같이, 초기 서열분석 매개변수(210)는 하나 이상의 서열분석 매개변수에 대한 기준을 직접적 또는 간접적으로 형성할 수 있다.
교정 서열분석 시스템(106)은 서열분석 장치(112)에 해당하는 서열분석 매개변수(212)를 초기 서열분석 매개변수(210)가 있거나 없는 상태로 결정한다. 그렇게 하기 위해, 일부 경우에서, 교정 서열분석 시스템(106)은 서열분석 장치(112)로부터 직접 서열분석 매개변수를 새로 추정 또는 검출하거나, 서열분석 장치(112)에 해당하는 디폴트 또는 사전 구성된 서열분석 매개변수(예를 들어, 등화기 계수)를 조정하거나, 또는 다수의 교정 사이클로부터의 초기 서열분석 매개변수에 기반하여 서열분석 매개변수를 (예를 들어, 초기 서열분석 매개변수들의 평균으로) 추정한다. 접근 방식에 관계없이, 일부 경우에서, 교정 서열분석 시스템(106)은 서열분석 장치(112)(또는 그의 환경)로부터 직접적 또는 간접적으로 서열분석 매개변수(212)를 결정하거나 초기 서열분석 매개변수를 조정하여, 교정 서열(204a 내지 204n)에 해당하는 염기 호출에 기반하여 서열분석 매개변수(212)를 생성할 수 있다.
위에서 제안된 바와 같이, 교정 서열분석 시스템(106)은 (i) 종래에는 오프라인에서 결정되어 사전 구성된 매개변수로서 제공되던 예컨대 등화기 계수와 같은 서열분석 매개변수를 결정함으로써, 또는 (ii) 서열분석 장치에서 서열분석을 실행하는 동안 학습한, 예컨대 비선형 광학 왜곡 매개변수, 구조화 조명 현미경(SIM) 매개변수, 클러스터당 정규화 매개변수, 또는 특정 채널에 대한 오프셋 보정 매개변수와 같은, 매개변수를 결정함으로써, 서열분석 매개변수(212)를 결정할 수 있다.
도 2a에 추가로 도시된 바와 같이, 교정 서열분석 시스템(106)은 교정 사이클(208) 외에도 선택적으로, 유전체 서열분석 사이클(214) 및 인덱싱 사이클(216)을 수행한다. 예를 들어, 교정 서열(204a 내지 204n)에 대한 교정 사이클(208)을 수행하고 서열분석 매개변수(212)를 결정한 후, 교정 서열분석 시스템(106)은, 선택적으로, (i) 샘플 라이브러리 단편(205a-205n) 내의 샘플 유전체 서열을 보완하거나 그에 따르는 핵염기를 혼입하여 유전체 서열분석 사이클(214)을 수행하고, 이러한 혼입된 핵염기에 대한 핵염기 호출을 결정하고, (ii) 샘플 라이브러리 단편(205a 내지 205n) 내의 인덱싱 서열을 보완하거나 그에 따르는 핵염기를 혼입하여 인덱싱 사이클(216)을 수행하고 이러한 혼입된 핵염기에 대한 핵염기 호출을 결정한다. 일부 경우에서, 교정 서열분석 시스템(106)은 유전체 서열분석 사이클(214) 전 또는 후에 인덱싱 사이클(216)을 실행한다. 실제로, 일부 기존 서열분석 시스템과 달리, 본 발명의 교정 서열분석 시스템(106)은 때로는 샘플 라이브러리 단편(205a 내지 205n) 내의 교정 서열(204a 내지 204n)의 위치들 각각에 따라 유전체 서열분석 사이클(214) 전에 인덱싱 사이클(216)을 실행한다. 위에서 언급한 바와 같이, 일부 실시예에서, 한 올리고뉴클레오티드 클러스터에 대한 인덱싱 사이클은 다른 올리고뉴클레오티드 클러스터에 대한 교정 사이클과 동시에 수행될 수 있는데, 왜냐하면 교정 사이클은 아래의 다양한 교정 체계에 의해 개괄된 바와 같이 올리고뉴클레오티드 클러스터 또는 올리고뉴클레오티드 클러스터들에 특정할 수 있기 때문이다.
교정 서열(204a 내지 204n)에 추가적으로 또는 대안적으로, 일부 실시예에서, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편과 연관된 교정 핵염기를 포함하는 뉴클레오티드-샘플 슬라이드(예를 들어, 뉴클레오티드-샘플 슬라이드(202))를 수용하거나 검출한다. 예를 들어, 샘플 라이브러리 단편 세트 내의 각 샘플 라이브러리 단편은 단일 교정 핵염기를 포함할 수 있다. 그러나 샘플 라이브러리 단편 세트 전반에 걸쳐 교정 핵염기 세트는, 교정 핵염기들 전반에 걸친 4가지 상이한 핵염기 유형(예를 들어, A, T, C, G)의 비례 분포와 같은, 상이한 핵염기 유형의 목표 분포를 나타낼 수 있다. 본 개시내용은 그러한 교정 핵염기의 추가 예를 도 4와 관련하여 아래에 제공한다.
교정 서열(204a 내지 204n)과 유사하게, 특정 구현예에서, 교정 서열분석 시스템(106)은 교정 핵염기를 사용하여 서열분석 장치(112)에 해당하는 서열분석 매개변수를 결정할 수 있다. 예를 들어, 일부 실시예에서, 교정 서열분석 시스템(106)은 서열분석 장치(112)를 사용하여 교정 사이클을 수행하여, 교정 핵염기에 해당하는 올리고뉴클레오티드에 상보적 핵염기를 혼입하고 교정 사이클 및 교정 핵염기에 기반하여 서열분석 매개변수를 결정한다.
위에서 언급한 바와 같이, 교정 서열분석 시스템(106)은 서열분석 장치에 해당하는 서열분석 매개변수를 다양한 방식으로 결정할 수 있다. 하나 이상의 실시예에 따르면, 도 2b는 교정 서열분석 시스템(106)을 도시하고 있는데, 이 시스템은 교정 사이클을 실행하여 (i) 서열분석 장치에서 교정 사이클 동안 또는 후에 검출된 서열분석 매개변수를 직접 결정하고, (ii) 다수의 교정 사이클 동안 검출된 초기 서열분석 매개변수에 기반하여 서열분석 매개변수를 결정하고, 그리고/또는 (iii) 교정 서열에 대한 상보적 가닥에 대한 핵염기 호출과 교정 서열에 대한 기지의 상보적 핵염기 간의 염기 호출 차이에 기반하여 초기 서열분석 매개변수를 조정한다.
위에서 언급한 바와 같이, 교정 서열분석 시스템(106)은 한 번 이상의 교정 사이클 동안 또는 후에 서열분석 장치로부터 직접 서열분석 매개변수를 검출할 수 있다. 예를 들어 도 2b에 도시된 바와 같이, 교정 서열분석 시스템(106)은 초기 교정 사이클(218)을 수행하여 하나 이상의 교정 서열의 기지의 핵염기와 상보적이거나 일치하는 핵염기를 클러스터 내의 올리고뉴클레오티드에 혼입시킨다. 초기 교정 사이클(218) 동안 또는 후에, 교정 서열분석 시스템(106)은 카메라, 센서, 또는 서열분석 장치의 다른 구성요소로부터 초기 서열분석 매개변수(222a)를 검출한다. 일부 경우에서, 교정 서열분석 시스템(106)은 초기 서열분석 매개변수(222a)를 조정하지 않지만, 초기 서열분석 매개변수(222a)를 서열분석 매개변수로 사용하여 후속 유전체 서열분석 사이클 또는 인덱싱 사이클 동안 핵염기 호출 결정을 용이하게 한다.
초기 교정 사이클(218) 동안 또는 후의 직접 검출의 예로서, 일부 경우에서, 교정 서열분석 시스템(106)은 뉴클레오티드-샘플 슬라이드 내의 특정 올리고뉴클레오티드 클러스터에 해당하는 특정 채널에 대한 명도 매개변수(예를 들어, 특정 형광 라벨에 대한 이미지)를 검출하거나 측정한다. 추가적으로 또는 대안적으로, 교정 서열분석 시스템(106)은 초기 교정 사이클(218) 동안 올리고뉴클레오티드에 혼입되지 않은 특정 핵염기의 노이즈 또는 배경 강도 값을 검출하거나 측정한다. 추가 예로서, 교정 서열분석 시스템(106)은 초기 교정 사이클(218) 동안 하나 이상의 형광 라벨을 붙인 핵염기들 사이의 스펙트럼 중첩을 나타내는 색상 채널 간 크로스토크 매개변수를 검출하거나 측정한다.
위에서 추가로 언급된 바와 같이, 교정 서열분석 시스템(106)은 다수의 교정 사이클 동안 검출된 초기 서열분석 매개변수에 기반하여 서열분석 매개변수를 결정할 수 있다. 도 2b에 도시된 바와 같이, 특정 구현예에서, 교정 서열분석 시스템(106)은 초기 교정 사이클(218)과 후속 교정 사이클(220a) 모두를 수행한다. 후속 교정 사이클(220a)은 초기 교정 사이클(218) 직후에 발생할 수도 있고, 초기 교정 사이클(218)에 이어지는 한 번 이상의 추가 교정 사이클 후에 발생할 수도 있다.
초기 교정 사이클(218) 및 후속 교정 사이클(220a)에서, 교정 서열분석 시스템(106)은 초기 서열분석 매개변수(222a)와 초기 서열분석 매개변수(222b)를 결정한다. 서열분석 매개변수의 유형에 따라 특정 구현예에서, 초기 서열분석 매개변수(222a 및 222b)는, 예컨대 두 초기 서열분석 매개변수(222a 및 222b) 모두에 대해 특정 채널에 대한 초기 클러스터당 명도 매개변수를 결정하거나, 두 초기 서열분석 매개변수(222a 및 222b) 모두에 대해 초기 색상 채널 간 크로스토크 매개변수를 결정함으로써, 동일한 유형의 서열분석 매개변수를 나타낸다. 일부 경우에서, 교정 서열분석 시스템(106)은 초기 서열분석 매개변수(222a 및 222b)에 따라, 초기 교정 사이클(218) 및 후속 교정 사이클(220a) 동안 동일한 핵염기 유형의 핵염기들을 혼입하여, 정확한 서열분석 매개변수를 결정하는 것을 용이하게 한다.
도 2b에 추가로 도시된 바와 같이, 일부 경우에서, 교정 서열분석 시스템(106)은 초기 서열분석 매개변수(222a 및 222b)에 기반하여 서열분석 매개변수(224)를 결정한다. 예를 들어, 특정 실시예에서, 교정 서열분석 시스템(106)은 서열분석 매개변수(224)를 결정하기 위해 초기 서열분석 매개변수(222a 및 222b)의 평균 또는 가중 평균을 결정한다. 이러한 일부 경우에서, 교정 서열분석 시스템(106)은 이전 또는 이후의 교정 사이클에 더 크게 가중치를 둔다. 일부 경우에서는, 평균화와 대조적으로, 교정 서열분석 시스템(106)은 초기 서열분석 매개변수(222b)에 기반하여 초기 서열분석 매개변수(222a)를 점진적으로 조정하여(예를 들어, 값을 임계치 변화까지 또는 임계치 변화 내에서 늘리거나 줄임으로써) 서열분석 매개변수(224)를 결정한다.
다수의 교정 사이클(예를 들어, 초기 교정 사이클(218) 및 후속 교정 사이클(220a))에서 초기 서열분석 매개변수들의 조합으로부터 서열분석 매개변수를 결정하는 것에 추가하여 또는 그에 대한 대안으로, 교정 서열분석 시스템(106)은 교정 서열에 대한(또는 이에 상보적인) 핵염기 호출과 교정 서열에 대한 기지의 핵염기 간의 염기 호출 차이에 기반하여 하나 이상의 초기 서열분석 매개변수를 조정할 수 있다.
예를 들어, 도 2b에 도시된 바와 같이, 교정 서열분석 시스템(106)은 후속 교정 사이클(220b)을 수행한다. 후속 교정 사이클(220b) 동안, 교정 서열분석 시스템(106)은 초기 서열분석 매개변수(222c)를 결정하고, 하나 이상의 교정 서열에 해당하는 성장하는 올리고뉴클레오티드 세트에 혼입된 핵염기에 대한 핵염기 호출(228)을 결정한다. 혼입된 핵염기는 해당 교정 서열에 따라 동일한 핵염기 유형일 수도 있거나 서로 다른 핵염기 유형들의 목표 분포를 가질 수도 있다.
교정 서열분석 시스템(106)은 관련 교정 서열에 대해 기지의 상보적 핵염기(226)를 비교한 것에 기반하여 염기 호출 차이(230)을 결정한다. 예를 들어, 도 2b에 도시된 바와 같이, 염기 호출 차이(230)는 관련 교정 서열에 대한 기지의 핵염기(또는 상보적 핵염기)가 다른 핵염기 유형(예를 들어, A)인 경우에는 한 핵염기 유형(예를 들어, G)의 핵염기 호출일 수 있다. 교정 서열분석 시스템(106)은 염기 호출 차이(230)에 기반하여 초기 서열분석 매개변수들(222a 및 222c) 중 하나 또는 둘 다를 추가로 조정하여 조정된 서열분석 매개변수(232)를 생성한다. 예를 들어, 조정된 서열분석 매개변수(232)를 생성하기 위해, 교정 서열분석 시스템(106)은 관련 교정 서열에 기반하여 호출되어야 하는 기지의 핵염기(또는 상보적 핵염기)를 반영하고 염기 호출 차이(230)를 보정하기 위해 핵염기 중심을 핵염기의 강도 값 또는 강도-값 경계에 맞게 조정할 수 있다.
교정 서열분석 시스템(106)은, 예를 들어 교정 서열 세트에 해당하는 핵염기 호출이 교정 서열 세트에 의해 나타나는 목표 분포와 다른 경우에는, 염기 호출 차이에 의존하여 서열분석 매개변수를 조정할 수 있다. 예를 들어, 일부 경우에서, 교정 서열 세트는 주어진 교정 서열 위치에 핵염기 유형들의 목표 분포를 가질 수 있다(예를 들어, 주어진 위치에 25%/25%/25%/25%의 A/C/G/T의 4-플렉스). 교정 서열분석 시스템(106)이 핵염기 유형들의 목표 분포(예를 들어, 주어진 위치에 23%/27%/25%/25%의 T/G/C/A)를 보완하지 않는 핵염기 호출을 결정하는 경우, 교정 서열분석 시스템(106)은 서열분석 매개변수(예를 들어, 핵염기 중심, 강도-값 경계, 색상 채널 간 크로스토크 매개변수)를 기지의 교정 서열이 나타내는 핵염기 유형들의 목표 분포(또는 상보적 목표 분포)를 생성했을 정도 또는 값으로 조정할 수 있다.
하나 이상의 서열분석 매개변수를 결정한 후, 교정 서열분석 시스템(106)은 인덱싱 사이클 또는 유전체 서열분석 사이클 동안의 다양한 단계에서 이러한 서열분석 매개변수를 적용할 수 있다. 하나 이상의 실시예에 따르면, 도 2c는 한 번 이상의 교정 사이클 동안 결정된 하나 이상의 서열분석 매개변수를 적용하여 (i) 올리고뉴클레오티드 클러스터 이미지에서 강도 값을 추출하거나, (ii) 추출된 강도 값을 수정하거나, (iii) 유전체 서열분석 사이클 또는 인덱싱 사이클 동안 혼입된 핵염기에 대한 핵염기 호출을 결정하는 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)을 예시한다.
도 2c에 도시된 바와 같이, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 예컨대 유전체 서열분석 사이클이나 인덱싱 사이클을 수행함으로써 서열분석 사이클(233)을 수행한다. 도 2c는 한 번 이상의 교정 사이클 후에 실행되는 서열분석 사이클(233)의 선택된 단계들을 도시한다. 예를 들어, 서열분석 사이클(233)의 일부로서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 뉴클레오티드-샘플 슬라이드(202)의 여러 섹션(예를 들어, 타일)의 이미지(234)를 캡처하여 서열분석 장치 시스템(114)과 같은 장치 내장 소프트웨어에 입력한다. 일부 경우에서, 이 이미지는 서열분석 사이클(233) 동안 올리고뉴클레오티드 클러스터에 혼입된 형광 태그가 붙은 핵염기에서 방출되는 형광을 묘사한다.
이미지(234)를 입력한 후, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 이미지(234)에 의해 포착된 올리고뉴클레오티드 클러스터의 위치를 식별하여 위치 템플릿(236)을 생성한다. 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 좌표계(예를 들어, X 위치 및 Y 위치)를 사용하여 올리고뉴클레오티드 클러스터의 식별된 위치를 이미지(234)에 등록하거나 매핑함으로써 이미지(238)에 위치를 추가로 등록한다. 도 2c가 나타내는 바와 같이, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은, 선택적으로, 기존 방법을 사용하여 서열분석 사이클(233)에서 하나 이상의 서열분석 매개변수(248)를 결정한다. 따라서, 하나 이상의 서열분석 매개변수(248)는 교정 사이클로부터의 서열분석 매개변수(250)와 상당히 다르며 위에 설명된 하나 이상의 기술적 문제의 영향을 받는다.
도 2c에 추가로 도시된 바와 같이, 클러스터 위치를 등록한 후, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)는 이미지(234)에서 강도 값(240)을 추출한다. 예를 들어, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 클러스터에 해당하는 형광을 숫자 형태의 강도 값(240)으로 변환한다. 강도 값(240)을 추출할 때, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 교정 사이클로부터의 하나 이상의 서열분석 매개변수(250)를 적용할 수 있다. 예를 들어, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은, 이미지(234)에서 강도 값(240)을 추출하는 것의 일부로서, 이전 교정 사이클 동안 결정된 등화기 계수를 픽셀에 적용할 수 있다. 이러한 일부 경우에서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 전체 내용이 본원에 참조로 포함되는 미국 특허 제11,188,778호(2021년 11월 30일 특허 허여)에 기술된 바와 같이 등화기 계수를 적용한다.
이미지에서 강도 값을 추출한 후, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 교정 사이클로부터의 서열분석 매개변수들(250) 중 하나 이상을 사용하여 강도 값(242)을 보정한다. 예를 들어, 일부 경우에서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은, 보정(예를 들어, 신호 보정 기능)의 일부로서, 하나 이상의 강도 값(240)에 정규화 매개변수, 노이즈 레벨, 또는 신호 대 잡음비 측정 지표를 적용하거나 계산에 넣는다. 또 다른 예로, 특정 실시예에서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은, 보정(예를 들어, 신호 보정 기능)의 일부로서, 하나 이상의 강도 값(240)에 위상 계수를 적용한다. 이러한 일부 경우에서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은, 발명의 명칭이 뉴클레오티드 염기 호출을 결정하기 위한 클러스터 특정 신호 보정 생성인 미국 출원 제63/285,187호(2021년 12월 2일 출원) - 이는 전체 내용이 본원에 참조로 포함됨 - 에 설명된 바와 같이, 위상 계수를 적용한다.
도 2c에 추가로 도시된 바와 같이, 강도 값을 보정한 후, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 염기 및 품질 측정 지표(244)를 호출한다. 예를 들어, 일부 경우에서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 서열분석 사이클(233) 동안 올리고뉴클레오티드의 영상화된 클러스터에 혼입된 하나 이상의 핵염기 호출을 보정된 강도 값에 기반하여 결정한다. 핵염기 호출 및 품질 측정 지표(244)를 결정하는 것의 일부로서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 교정 사이클로부터의 하나 이상의 서열분석 매개변수(250)를 적용하거나 계산에 넣을 수 있다. 예를 들어, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 혼입된 핵염기의 핵염기 호출을 특정 핵염기의 강도 값 및/또는 강도-값 경계에 대한 핵염기 중심에 따른 보정된 강도 값에 기반하여 결정할 수 있다. 또 다른 예로, 일부 경우에서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 특정 채널에 대한 클러스터당 강도 매개변수 또는 특정 채널에 대한 클러스터당 명도 매개변수를 계산에 넣는 알고리즘 또는 함수에 따라, 염기 호출 품질 측정 지표와 같은, 핵염기 호출의 품질 측정 지표를 결정할 수 있다.
도 2c에 추가로 도시된 바와 같이, 염기 및 품질 측정 지표(244)를 호출한 후, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 염기 호출 및 품질 측정 지표와 같은 출력(246)을 생성할 수 있다. 예를 들어, 일부 경우에서, 교정 서열분석 시스템(106) 또는 서열분석 장치 시스템(114)은 서열분석 실행 시 서열분석 사이클(233) 및 기타 서열분석 사이클에 대한 염기 호출 데이터를 BCL 파일 형태로 생성한다.
위에서 언급한 바와 같이, 교정 서열은 샘플 라이브러리 단편 또는 관련 y-어댑터 내의 비유전체 서열 및/또는 비전사체 서열의 일부 또는 전체일 수 있다. 하나 이상의 실시예에 따르면, 도 3a 내지 도 3b는 샘플 라이브러리 단편 내에 있거나 아니면 그와 연관된 비유전체 및 비전사체 서열 내에(또는 이의 일부로서) 교정 서열을 삽입하거나 결찰하는 교정 서열분석 시스템(106)을 도시한다. 특히, 도 3a는 결합 어댑터 서열, 인덱싱 서열, 판독 프라이밍 서열, 또는 샘플 유전체 서열 중 하나 이상 사이에 교정 서열을 추가하는(또는 그 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하는) 교정 서열분석 시스템(106)을 도시한다. 도 3b는 샘플 라이브러리 단편에 대한 y-어댑터로부터의 고유 분자 식별자(UMI) 서열 또는 고유 이중 인덱스(UDI) 서열의 일부 또는 전체로서 교정 서열을 추가하는(또는 그 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하는) 교정 서열분석 시스템(106)을 도시한다.
예를 들어, 도 3a에 도시된 바와 같이, 교정 서열(300)은 샘플 라이브러리 단편(302)에 삽입되거나 결찰된다. 도시된 바와 같이, 교정 서열(300)은 비교적 짧다(예를 들어, 4 내지 8개 핵염기 길이). 그러나 교정 서열분석 시스템(106)은 임의의 적합한 길이의 교정 서열을 사용할 수 있다. 도시된 바와 같이, 샘플 라이브러리 단편(302)은 gDNA 단편과 같은 샘플 유전체 서열(310)을 포함하거나, 대안적으로 cDNA 단편과 같은 샘플 전사체 서열을 포함한다. 그러나 교정 서열(300)은 샘플 유전체 서열(310) 또는 대안적으로 샘플 전사체 서열에 추가되거나 삽입되지 않는다.
위에서 제안된 바와 같이, 교정 서열분석 시스템(106)은 여러 비유전체 및 비전사체 서열들 사이에 교정 서열(300)을 포함하는 뉴클레오티드-샘플 슬라이드(316)를 검출하거나 수용할 수 있다. 도 3a에서 제안된 바와 같이, 일부 경우에서, 교정 서열(300)은 (i) 제1 결합 어댑터 서열(304a)과 제1 인덱싱 서열(306a) 사이, (ii) 제2 결합 어댑터 서열(304b)과 제2 인덱싱 서열(306b) 사이, (iii) 제1 인덱싱 서열(306a)과 제1 판독 프라이밍 서열(308a) 사이, (iv) 제2 인덱싱 서열(306b)과 제2 판독 프라이밍 서열(308b) 사이, (v) 제1 판독 프라이밍 서열(308a)과 샘플 유전체 서열(310)(또는 샘플 전사체 서열) 사이, 또는 (vi) 제2 판독 프라이밍 서열(308b)과 샘플 유전체 서열(310)(또는 샘플 전사체 서열) 사이에 있다.
일부 경우에서, 교정 서열이 사이에 삽입되는, 여러 어댑터, 프라이머, 및 인덱싱 서열들은 상업적으로 이용 가능한 기지의 서열의 형태를 취할 수 있다. 예를 들어, 특정 실시예에서, 제1 결합 어댑터 서열(304a)은 P7 결합 어댑터 서열을 구성하고, 제1 인덱싱 서열(306a)은 i7 인덱싱 서열을 구성하고, 제1 판독 프라이밍 서열(308a)은 제1 판독 프라이밍 서열(예를 들어, sbs12, B15ME)을 구성하고, 제2 판독 프라이밍 서열(308b)은 제2 판독 프라이밍 서열(예를 들어, sbs3', A14ME)을 구성하고, 제2 인덱싱 서열(306b)은 i5 인덱싱 서열을 구성하고, 제2 결합 어댑터 서열(304b)은 P5 결합 어댑터 서열을 구성한다. 아래에 설명된 바와 같이, 도 3b는 어댑터 결합 서열(예를 들어, UDI 서열)의 추가적인 구체적 예를 도시한다.
위에서 추가로 제안된 바와 같이, 교정 서열분석 시스템(106)은 특정 비유전체 및 비전사체 서열의 일부 또는 전체로서 교정 서열(300)을 포함하는 뉴클레오티드-샘플 슬라이드(316)를 검출하거나 수용할 수 있다. 예를 들어, 도 3a에서 제안된 바와 같이, 교정 서열(300)은 제1 결합 어댑터 서열(304a), 제1 인덱싱 서열(306a), 제2 결합 어댑터 서열(304b), 제2 인덱싱 서열(306b), 또는 표면 결합 올리고뉴클레오티드(312)를 형성하는 뉴클레오티드 서열의 일부 또는 전체일 수 있다. 표면 결합 올리고뉴클레오티드(312)는 샘플 라이브러리 단편(302)의 일부가 아니지만, 표면 결합 올리고뉴클레오티드(312)는 뉴클레오티드-샘플 슬라이드(316)의 표면(예를 들어, 웰)에 부착되어 제1 결합 어댑터 서열(304a) 또는 제2 결합 어댑터 서열(304b)에 어닐링된다.
도 3a에 추가로 도시된 바와 같이, 샘플 라이브러리 단편(302)은 뉴클레오티드-샘플 슬라이드(316) 내의 웰들(314) 중 하나에 침착된다. 위에서 제안된 바와 같이, 교정 서열을 포함하거나 이와 연관된 추가 샘플 라이브러리 단편도 마찬가지로 뉴클레오티드-샘플 슬라이드(316)의 웰(314) 내에 침착된다. 뉴클레오티드-샘플 슬라이드(316)는 후속하여 서열분석 장치(예를 들어, 서열분석 장치(112))에 삽입되고 서열분석 장치에 의해 검출될 수 있다.
이제 도 3b를 참조하면, 이 도면에서는 교정 서열(324)이 샘플 라이브러리 단편의 y-어댑터(326)에 삽입되거나 혼입되어 있다. 예를 들어, y-어댑터(326)를 사용하여 샘플 라이브러리 단편을 준비하는 과정의 일부로 또는 그 이후에, 교정 서열분석 시스템(106)은 교정 서열(324)을 고유 분자 식별자(UMI) 어댑터 서열(320a 및 320b) 근처에 각각 표시된 고유 분자 식별자(UMI) 서열(322a) 또는 UMI 서열(322b)의 일부 또는 전체에 삽입하거나 혼입할 수 있다. 일부 경우에서, UMI 서열(322a 및/또는 322b)은 비무작위 UMI 서열일 수 있다. 대안적으로, 일부 실시예에서, 교정 서열분석 시스템(106)은 교정 서열(324)을 고유 이중 인덱스(UDI) 서열(318a) 또는 UDI 서열(318b)의 일부 또는 전체에 삽입하거나 혼입한다.
위에서 나타낸 바와 같이, 교정 서열분석 시스템(106)은 유전체 서열분석 사이클과 인덱싱 사이클과 함께 교정 사이클을 수행할 수 있으며, 여기서 인덱싱 사이클과 해당 인덱싱 서열은 유전체 서열분석 사이클과 해당 샘플 유전체 서열 전 또는 후에 발생한다. 교정 서열(324)이 UDI 서열(318a) 또는 UDI 서열(318b)의 일부 또는 전부인 경우, 일부 실시예에서, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편으로부터의 샘플 유전체 서열에 대한 유전체 서열분석 사이클을 수행하기 전에 인덱싱 서열에 대한 인덱싱 사이클을 수행한다. 이와 대조적으로, 교정 서열(324)이 UMI 서열(322a) 또는 UMI 서열(322b)의 일부 또는 전부인 경우, 특정 실시예에서, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편으로부터의 인덱싱 서열에 대한 인덱싱 사이클을 수행하기 전에 샘플 유전체 서열에 대한 유전체 서열분석 사이클을 수행한다.
도 3a 또는 도 3b와 관련하여, UDI 서열과 같은 결합 어댑터 서열에 교정 서열을 삽입하거나 혼입할 때, 교정 서열분석 시스템(106)은 결합 어댑터 서열(예를 들어, gDNA의 업스트림)에 이미 존재하는 핵염기를 교정 서열로 사용하거나, 라이브러리 준비 프로세스 동안 샘플 유전체 서열의 말단에 부착되는 합성 핵염기를 결합 어댑터 서열에 교정 서열로 추가할 수 있다. 결합 어댑터 서열에 이미 존재하는 핵염기를 사용하기 위해, 교정 서열분석 시스템(106)은 판독 프라이밍 서열을 다수의 핵염기만큼 단축할 수 있다. 결과적으로, 사이클(예를 들어, 교정 사이클)의 초기에 혼입된 염기는 결합 어댑터 서열에 해당한다. 합성 핵염기를 결합 어댑터 서열에 교정 서열로 추가하기 위해, 교정 서열분석 시스템(106)은 (예를 들어, 공통 핵염기를 사용하여 결합 어댑터 서열을 길게 함으로써) 합성 핵염기를 결합 어댑터 서열에 추가(또는 임베딩)할 수 있다.
교정 서열에 대해 기존 핵염기를 사용하거나 합성 핵염기를 결합 어댑터 서열에 추가하든지 간에, 교정 서열분석 시스템(106)은 인덱싱 서열들의 순열이나 조합을 사용하지 않고도 뉴클레오티드-샘플 슬라이드의 모든 올리고뉴클레오티드 클러스터에 대한 뉴클레오티드-단편 판독의 시작 부분에 동일한 교정 서열을 혼입할 수 있다. 교정 서열에 결합 어댑터 서열을 사용함으로써, 교정 서열분석 시스템(106)은 더욱 정확한 교정을 제공할 수 있는데, 왜냐하면 이미 존재하는 결합 어댑터 서열은 각각의 다른 프라이머 어닐링 서열분석 및 템플릿 혼성화를 사용함으로써 변할 수 있는 변화 소스(프라이머에 대한 템플릿 혼성화 효율)를 생성하지 않기 때문이다.
샘플 라이브러리 단편에 대한 교정 서열의 위치와 관계없이, 교정 서열분석 시스템(106)은 교정 서열을 구성하는 핵염기와 교정 서열 동안 성장하는 올리고뉴클레오티드에 혼입되는 핵염기를 다양한 방식으로 배열하거나 순서화할 수 있다. 하나 이상의 실시예에 따르면, 도 4는 핵염기 유형들의 상이한 목표 분포를 갖는 상이한 교정 서열들 또는 교정 핵염기들의 예를 도시한다. 위에서 언급한 바와 같이, 핵염기 유형들의 목표 분포를 사용함으로써, 교정 서열분석 시스템(106)은 불규칙하게 분포된 유전체 샘플들의 비대칭 분포를 제거(및 분포를 균등화)함으로써 서열분석 매개변수 및 해당 핵염기 호출의 정확도를 개선할 수 있다.
예를 들어, 도 4에 도시된 바와 같이, 교정 서열분석 시스템(106)은 교정 사이클들 전반에 걸쳐 네 가지 핵염기 유형들의 비례 분포를 갖는 핵염기의 교정 서열(402)을 사용할 수 있다. 특히, 교정 서열(402)에는 교정 사이클들 전반에 걸쳐 A, C, G, 및 T의 비례 분포가 포함된다. 일부 경우에서, 교정 서열(402)에는 다른 핵염기 유형을 갖는 4개의 핵염기들이 4개의 교정 서열 위치에 걸쳐 있고; 다른 경우에서, 교정 서열(402)에는 4가지 다른 핵염기 유형들 중 하나를 갖는 8개의 핵염기들이 도 4에 나타낸 8개의 교정 서열 위치 중 2개 위치(및 해당 교정 사이클)에 걸쳐 있다. 교정 서열(402)은 교정 서열분석 시스템(106)이 뉴클레오티드-샘플 슬라이드의 각각의 올리고뉴클레오티드 클러스터 또는 클러스터 서브세트(예를 들어, 샘플 라이브러리 단편의 일부)에서 교정 서열로 사용할 수 있는 단일 템플릿을 나타낼 수 있다. 예를 들어, 일부 경우에서, 교정 서열분석 시스템(106)은 교정 서열(402) 또는 유사한 단일 템플릿 서열을 따르는 동일 또는 단일의 염기 서열을 각각이 포함하는 교정 서열들의 세트를 사용한다. 도 4에 도시된 바와 같이, 교정 서열분석 시스템(106)은, 단일 올리고뉴클레오티드 클러스터 또는 다수의 올리고뉴클레오티드 클러스터에 관계없이, 교정 서열(402) 내 핵염기 유형들의 분포에 기반하여 하나 이상의 서열분석 매개변수를 결정하기 위해 교정 사이클 1 내지 교정 사이클 8을 수행할 수 있다.
도 4에 추가로 도시된 바와 같이, 특정 실시예에서, 교정 서열분석 시스템(106)은 상이한 교정 서열 위치 및 해당 교정 사이클에서 두 가지 핵염기 유형들의 비례 분포(또는 두 가지 핵염기 유형들의 조합)을 갖는 교정 서열 세트(403a)를 사용한다. 교정 서열 세트(403a)는 교정 서열 위치에 약 50%의 한 핵염기 유형이 있고 동일한 교정 서열 위치에 약 50%의 다른 핵염기 유형이 있는 2-플렉스 템플릿 교정 서열 세트를 나타낸다. 따라서, 교정 서열 세트(403a) 내의 주어진 교정 서열에서는 한 교정 서열 위치에 두 가지 상이한 핵염기 유형 중 하나를 포함할 확률이 약 50%이다. 교정 서열 세트(403a)의 교정 서열들은 마찬가지로 뉴클레오티드-샘플 슬라이드의 각 올리고뉴클레오티드 클러스터 또는 클러스터 서브세트에 분배될 수 있다.
도 4에 예시된 바와 같이, 교정 서열 세트(403a)는 제1 교정 사이클에 해당하는 제1 교정 서열 위치에 두 가지 핵염기 유형(예를 들어, A 및 C)의 비례 분포와, 제2 교정 사이클에 해당하는 제2 교정 서열 위치에 두 가지 상이한 핵염기 유형(예를 들어, G 및 T)의 비례 분포를 갖는다. 교정 서열 위치와 교정 사이클이 계속됨에 따라, 교정 서열 세트(403a)는 제3 교정 사이클에 해당하는 제3 교정 서열 위치에 두 가지 핵염기 유형(예를 들어, A 및 T)의 상이한 조합의 비례 분포, 제4 교정 사이클에 해당하는 제4 교정 서열 위치에 두 가지 핵염기 유형(예를 들어, G 및 C)의 또 다른 상이한 조합의 비례 분포를 갖는다. 일부 경우에서, 교정 서열 세트(403a)가 교정 서열 위치 5 내지 교정 서열 위치 8과 해당 교정 사이클 5 내지 교정 사이클 8에 두 가지 핵염기 유형의 조합들의 비례 분포를 나타내는 교정 서열 세트(409a)로 계속된다.
도 4에 추가로 도시된 바와 같이, 특정 실시예에서, 교정 서열분석 시스템(106)은 상이한 교정 서열 위치 및 해당 교정 사이클에 네 가지 핵염기 유형들의 비례 분포(또는 네 가지 핵염기 유형들의 조합)을 갖는 교정 서열 세트(403b)를 사용한다. 교정 서열 세트(403b)는 주어진 교정 서열 위치에 약 25%의 네 가지 다른 핵염기 유형(예를 들어, A, C, G, T)을 갖는 4-플렉스 템플릿 교정 서열 세트를 나타낸다. 따라서, 교정 서열 세트(403b) 내의 주어진 교정 서열에서는 한 교정 서열 위치에 네 가지 상이한 핵염기 유형 중 하나를 포함할 확률이 약 25%이다. 교정 서열 세트(403b)의 교정 서열들은 마찬가지로 뉴클레오티드-샘플 슬라이드의 각 올리고뉴클레오티드 클러스터 또는 클러스터 서브세트에 분배될 수 있다.
도 4에서 추가로 예시된 바와 같이, 교정 서열 세트(403b)는 각 교정 서열 위치와 각 해당 교정 사이클에 네 가지 핵염기 유형(예를 들어, A, C, G, T)의 비례 분포를 갖는다. 교정 서열 세트(403b)는 마찬가지로 여러 교정 서열 위치와 교정 사이클, 예컨대 3 내지 8개의 교정 서열 위치와 3 내지 8개의 해당 교정 사이클에 걸쳐 있을 수 있다. 교정 서열 세트(406)가 보이는 바와 같이, 일부 실시예에서, 교정 서열분석 시스템(106)은 3개의 교정 서열 위치에 걸쳐 있는(예를 들어, 각 교정 서열이 3개의 염기에 걸쳐 있음) 교정 서열 세트(403b)로 세 번의 교정 사이클을 실행하고, 이를 통해 서열분석 장치를 유효하게 교정하고 하나 이상의 서열분석 매개변수를 결정할 수 있다.
위에서 제안된 바와 같이, 일부 실시예에서, 교정 서열분석 시스템(106)은 교정 핵염기를 사용하여 서열분석 장치를 교정하고 하나 이상의 서열분석 매개변수를 결정한다. 예를 들어, 도 4에 도시된 바와 같이, 교정 핵염기 세트(404)는 단일 교정 서열 위치 및 단일 교정 사이클에 네 가지 다른 핵염기 유형(예를 들어, A, C, G, T)의 비례 분포를 갖는다. 실제로, 일부 실시예에서, 교정 서열분석 시스템(106)은 단일 교정 서열 위치(예를 들어, 각 샘플 라이브러리 단편 내의 하나의 교정 핵염기)에서 교정 핵염기 세트(404)로 단일 교정 사이클을 실행하고, 이를 통해 서열분석 장치를 유효하게 교정하고 하나 이상의 서열분석 매개변수를 결정할 수 있다.
도 4에서 추가로 제안하는 바와 같이, 일부 실시예에서, 교정 서열분석 시스템(106)은 서열분석 실행을 위해 교정 서열(402)과 교정 서열 세트(403a)와 교정 서열 세트(403b)의 상이한 조합을 사용한다. 교정 사이클 1 내지 교정 사이클 8에 대한 한 가지 예시적 경로로서, 특정 실시예에서, 교정 서열분석 시스템(106)은 (i) 교정 서열(402)로부터의 단일 템플릿 뉴클레오티드 서열(408)을 따르는 교정 서열 세트를 사용하여 교정 사이클 1 내지 교정 사이클 4를 수행하고 (ii) 후속하여 2-플렉스 템플릿 교정 서열 세트와 함께 교정 서열 세트(409a)를 사용하여 교정 사이클 4 내지 교정 사이클 8을 수행한다. 교정 사이클 1 내지 교정 사이클 8에 대한 또 다른 예시 경로로서, 특정 실시예에서, 교정 서열분석 시스템(106)은 (i) 교정 서열(402)로부터의 단일 템플릿 뉴클레오티드 서열(408)을 따르는 교정 서열 세트를 사용하여 교정 사이클 1 내지 교정 사이클 4를 수행하고 (ii) 후속하여 4-플렉스 템플릿 교정 서열 세트와 함께 교정 서열 세트(409b)를 사용하여 교정 사이클 4 내지 교정 사이클 8을 수행한다. 교정 서열분석 시스템(106)은 교정 사이클 동안 여기에 설명된 다른 여러 교정 서열을 마찬가지로 결합할 수 있다.
위에서 언급한 바와 같이, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편과 관련하여 다양한 위치에 배치되고 다양한 클러스터에 침착된 교정 서열들을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하거나 수용할 수 있다. 하나 이상의 실시예에 따르면, 도 5a 내지 도 5e는 샘플 라이브러리 단편 내(또는 근처)에 교정 서열을 혼입하고 이러한 샘플 라이브러리 단편을 뉴클레오티드-샘플 슬라이드 내의 상이한 올리고뉴클레오티드 클러스터들에 분배하는 다양한 교정 체계를 도시한다. 아래에서 더 설명되는 바와 같이, 일부 경우에서, 교정 서열분석 시스템(106)은 도 5a 내지 도 5e에 도시된 다양한 교정 체계들을 결합한다.
도 5a에 나타낸 바와 같이, 제1 교정 체계 하에서, 교정 서열분석 시스템(106)은 주어진 교정 사이클 내와 교정 사이클들 전반에 걸쳐 충분히 다양화된 핵염기 유형 세트를 갖는 교정 서열 세트를 포함하는 뉴클레오티드-샘플 슬라이드를 수용한다. 예를 들어, 일부 경우에서, 교정 서열분석 시스템(106)은 (i) 제1 순서의 핵염기(예를 들어, 한 서열에서 A, C, G, T 순서)를 따르는 상이한 핵염기 유형들을 포함하는 제1 교정 서열, (ii) 제2 순서의 핵염기(예를 들어, 한 서열에서 C, G, T, A 순서)를 따르는 상이한 핵염기 유형들을 포함하는 제2 교정 서열, (iii) 제3 순서의 핵염기(예를 들어, 한 서열에서 G, T, A, C 순서)를 따르는 상이한 핵염기 유형들을 포함하는 제3 교정 서열, 및 (iv) 제4 순서의 핵염기(예를 들어, 한 서열에서 T, A, C, G 순서)를 따르는 상이한 핵염기 유형들을 포함하는 제4 교정 서열을 포함하는 교정 서열 세트를 사용한다. 제1, 제2, 제3, 및 제4 교정 서열 각각은 마찬가지로 방금 설명한 다양한 순서를 따르는 다양한 핵염기 유형들을 포함하는 교정 서열들의 제1, 제2, 제3, 및 제4 서브세트의 일부일 수도 있다.
위에서 언급한 바와 같이, 일부 기존 서열분석 시스템은 반복 모노뉴클레오티드, 반복 디뉴클레오티드, 높은 G/C 반복, 또는 기타 모티프와 같이 상대적으로 다양성이 낮은 유전체 샘플을 사용하여 서열분석 장치를 교정함으로써 서열분석 매개변수를 편향시키거나 왜곡한다. 실제로, 일부 기존 교정 방법은 기존 서열분석 시스템이 충분히 다양화된 유전체 샘플을 기반으로 교정한다는 잘못된 가정에서 작용한다. 그러나, 교정 서열분석 시스템(106)은 기지의 핵염기 유형을 갖는 충분히 다양화된 교정 서열들의 세트를 사용하여 교정 사이클을 실행함으로써, 핵염기 유형 다양성이 비교적 낮은 유전체 샘플에 의존하는 편향을 겪지 않으며 일관되게 사전에 알려져 있는, 특정 핵염기에 대한 가우스 공분산 행렬이나 강도-값 경계와 같은, 서열분석 매개변수를 결정할 수 있다.
예를 들어, 아래 표 1에 나타낸 바와 같이, 교정 서열분석 시스템(106)은 4개의 교정 사이클 각각에서 핵염기 유형들의 균일한 조성을 제공하는 4개의 상이한 교정 서열을 포함하는 충분히 다양화된 교정 서열들의 세트를 사용하여 교정 사이클을 수행할 수 있다. 일부 실시예에서, 아래 표 1에 나타낸 바와 같이, 이러한 충분히 다양화된 교정 서열들의 세트는 주어진 교정 서열 위치에 약 25%의 4가지 다른 핵염기 유형들(예를 들어, A, C, G, T)을 갖는 4-플렉스 템플릿 교정 서열 세트의 형태를 취할 수 있다.
[표 1]
Figure pct00001
도 5a에 도시된 바와 같이, 일부 경우에서, 교정 서열분석 시스템(106)은 충분히 다양화된 교정 서열들의 세트로부터, 샘플 라이브러리 단편(500a) 내 위치 510a, 510b, 또는 510c에 혼입된 주어진 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하거나 수용한다. 예를 들어, 위치 510a에 혼입되는 경우, 교정 서열은 제2 판독 프라이밍 서열(502b)과 인덱싱 서열(506) 사이에 위치하거나, 대안적으로 제2 판독 프라이밍 서열(502b) 또는 인덱싱 서열(506)의 일부 또는 전체로 혼입된다.
일부 경우에서, 인덱싱 서열은 이중 가닥이고(즉, 핵염기 쌍으로 배열되고), 8, 10, 또는 20개의 핵염기 길이에 걸쳐 있다. 이러한 인덱싱 서열을 사용함으로써, 교정 서열분석 시스템(106)은 이론적으로 각각 약 416, 420, 또는 440개의 고유한 인덱싱 조합을 갖게 된다. 해밍 편집 거리 요건을 계산에 넣으면, 인덱싱 서열에서 생물학적 샘플 라벨링에 사용할 수 있는 순열의 수가 감소하겠지만 여전히 교정 사이클을 혼입하기에는 충분할 것이다. 고유 조합의 수로 인해, 교정 서열분석 시스템(106)은 몇 개의 인덱싱 사이클을 교정 사이클이 되게 활용할 수 있다. 위에서 제안된 바와 같이, 인덱싱 서열을 사용하여 교정 사이클을 수행하기 위해, 교정 서열분석 시스템(106)은 교정 사이클을 수행한 다음 인덱싱 사이클을 수행하고 후속해서 유전체 서열분석 사이클을 수행할 수 있다.
위치 510b에 혼입되는 경우, 교정 서열은 인덱싱 서열(506)과 결합 어댑터 서열(508) 사이에 위치하거나, 대안적으로 인덱싱 서열(506) 또는 결합 어댑터 서열(508)의 일부 또는 전체로 혼입된다. 예를 들어, 교정 서열은 도 3b에 도시된 바와 같이 비무작위 UMI 서열의 일부 또는 전체일 수 있다. 이러한 일부 경우에서, 비무작위 UMI 서열을 샘플 유전체 서열 말단에 결찰한 다음 중합효소 연쇄 반응(PCR)을 통해 결합 어댑터 서열(예를 들어, P7 및 P5)과 인덱스 서열을 추가하거나 마무리한다.
위치 510c에 혼입되는 경우, 교정 서열은 제1 판독 프라이밍 서열(502a)과 샘플 유전체 서열(504a) 사이에 위치하거나, 대안적으로 제1 판독 프라이밍 서열(502a)의 일부 또는 전체로 혼입된다. 도 5a가 나타내는 바와 같이, 일부 실시예에서, 서열분석 프라이머(501a)는 제1 판독 프라이밍 서열(502a)에 결합한다. 서열분석 실행 중에, 효소가 서열분석 프라이머(501a)에 핵염기를 하나씩 추가하거나 혼입하여, 샘플 라이브러리 단편(500a)으로부터의 해당하는 뉴클레오티드 서열과 상보적인 뉴클레오티드-단편 판독을 생성한다. 따라서, 일부 경우에서, 교정 서열분석 시스템(106)은 효소(예를 들어, 중합효소)를 사용하여, 서열분석 프라이머(501a)에 추가되고 위치 510c에서 교정 서열과 상보적인 핵염기들을 혼입한다. 서열의 순서와 교정 서열의 위치는 다를 수 있지만, 교정 서열분석 시스템(106)은 마찬가지로 효소와 서열분석 프라이머를 사용하여, 본 개시내용에서 설명 또는 도시된 다른 위치에서 교정 서열에 상보적인 핵염기들을 혼입할 수 있다.
도 5a에 추가로 도시된 바와 같이, 제1 교정 체계에 따른 충분히 다양화된 교정 서열들의 세트로부터의 주어진 교정 서열은 (i) 올리고뉴클레오티드의 단클론 클러스터(512a)에 침착된 샘플 라이브러리 단편 내(예를 들어, 뉴클레오티드-샘플 슬라이드의 웰 내)에 혼입될 수 있거나, 또는 (ii) 올리고뉴클레오티드의 다클론 클러스터(512b)에 침착된 상이한 샘플 라이브러리 단편들 내(예를 들어, 뉴클레오티드-샘플 슬라이드의 웰 내)에 혼입될 수 있다. 비교를 위해, 도 5a는 또한, 교정 서열 또는 샘플 라이브러리 단편이 없는 비어 있는 웰(514)을 도시하고 있는데, 이 비어 있는 웰은 비어 있는 웰로부터의 강도 값을 샘플 라이브러리 단편 및/또는 교정 서열을 포함하는 웰로부터의 강도 값과 비교함으로써 예컨대 웰 내 배경 강도 값과 같은 특정 서열분석 매개변수를 결정하는 데 사용될 수 있다. 상기 설명과 일관되게, 교정 서열분석 시스템(106)은 제1 교정 사이클 동안 올리고뉴클레오티드(512a)의 단클론 클러스터에 제1 핵염기 유형(예를 들어, A)의 핵염기들을 혼입하고, 제2 교정 사이클 동안 올리고뉴클레오티드(512a)의 단클론 클러스터에 제2 핵염기 유형(예를 들어, C)의 핵염기들을 혼입하고, 제3 교정 사이클 동안 올리고뉴클레오티드(512a)의 단클론 클러스터에 제3 핵염기 유형(예를 들어, G)의 핵염기들을 혼입한다.
예를 들어, 제1 교정 체계에 따른 충분히 다양화된 교정 서열들의 세트로부터의 주어진 교정 서열이 올리고뉴클레오티드(512b)의 다클론 클러스터에 혼입되는 경우, 주어진 교정 서열은 웰 내의 선택된 기지의 위치들의 일부일 수 있다. 예를 들어, 올리고뉴클레오티드(512b)의 다클론 클러스터를 포함하는 교정 사이클을 실행할 때, 교정 서열분석 시스템(106)은 제1 교정 사이클 동안 올리고뉴클레오티드(512b)의 다클론 클러스터에 제2 및 제4 핵염기 유형(예를 들어, C 및 T)의 핵염기들을 혼입하고, 제2 교정 사이클 동안 올리고뉴클레오티드(512b)의 다클론 클러스터에 제1 핵염기 유형(예를 들어, A)의 핵염기들을 혼입하고, 제3 교정 사이클 동안 올리고뉴클레오티드(512b)의 다클론 클러스터에 제4 및 제2 핵염기 유형(예를 들어, T 및 C)의 핵염기들을 혼입한다.
충분히 다양화된 교정 서열들의 세트로부터의 주어진 교정 서열은 교정 사이클들 전반에 걸쳐 다양한 핵염기 유형을 가지므로, 다클론 클러스터에서 동일한 교정 서열 두 개가 함께 있는 경우가 발견될 가능성은 거의 없을 것이다. 일부 경우에서, 충분히 다양화된 교정 서열들의 세트에는 각 샘플 라이브러리 단편에 혼입된(그리고 그 단편에 특정된) 상이한 교정 서열들이 있을 수 있다. 따라서, 제1 교정 체계에 따른 충분히 다양화된 교정 서열들의 세트를 사용하게 되면, 단클론 클러스터들 각각은 교정 사이클 동안 고유하고 순수한 광 신호를 방출하는 혼입된 핵염기들을 포함한다. 그러나, 다클론 클러스터는 해당 다클론 클러스터를 시딩한 상이한 샘플 라이브러리 단편들에 특정 교정 서열이 혼입됨으로 인해 다양한 신호를 함께 방출할 가능성이 높은 혼입된 핵염기들을 포함한다.
위의 표 1에 나타내었거나 아니면 설명된 바와 같이, 제1 교정 체계에 따른 충분히 다양화된 교정 서열들의 세트를 사용하여 교정 사이클을 실행함으로써, 교정 서열분석 시스템(106)은 유전체 서열분석 사이클의 학습 과정 중에 종종 왜곡되는 서열분석 매개변수를 더 정확하게 결정할 수 있다. 예를 들어, 교정 서열분석 시스템(106)은 웰들의 이론적 위치를 뉴클레오티드-샘플 슬라이드 섹션들의 이미지에서 관찰된 실제 위치로 변환하는 비선형 매핑 기능을 실행하기 위해 초기 유전체 서열분석 사이클을 사용하는 대신에 교정 사이클 동안 더 정확한 비선형 광학 왜곡 매개변수를 결정할 수 있다.
추가적인 예로, 교정 서열분석 시스템(106)은 특정 채널에 대한 더 정확한 구조화 조명 현미경(SIM) 매개변수, 클러스터당 정규화 매개변수, 또는 오프셋 수정 매개변수를 결정하되, 초기의 예측 불가능한 유전체 서열분석 사이클 동안 이러한 매개변수를 학습하는 대신에 충분히 다양화된 교정 서열들의 세트를 사용하여 교정 사이클을 실행함으로써, 매개변수들을 결정할 수 있다. 또 다른 예로, 교정 서열분석 시스템(106)은 더 정확한 등화기 계수를 결정하되, 유전체 서열분석 데이터를 사용하여 각 서열분석 장치에 대한 컨텍스트에서 벗어나 오프라인으로 이러한 등화기 계수를 추정하는 대신에 제1 교정 체계에 따른 교정 사이클을 실행하여, 등화기 계수를 결정할 수 있다. 교정 서열분석 시스템(106)은 카메라의 광학적 결함, 유전체 샘플의 낮은 핵염기 유형 다양성, 서열분석하기 어려운 유전체 영역, 또는 유체 결함에 영향을 받는 유전체 서열분석 사이클을 허비하여 이러한 서열분석 매개변수를 학습하기보다는 이러한 기술적 장애를 피하여,제1 교정 체계에 따른 충분히 다양화된 교정 서열들의 세트를 사용하여 교정 사이클 동안 동일한 서열분석 매개변수를 결정한다.
교정 서열분석 시스템(106)은 서열분석 매개변수를 개선하는 것 외에도, 제1 교정 체계에 따른 충분히 다양화된 교정 서열 세트를 사용하여 교정 사이클을 실행함으로써, 뉴클레오티드-샘플 슬라이드의 어느 웰이, 예컨대 비어 있는 웰(514)이, 올리고뉴클레오티드 클러스터로 채워지지 않았는지를 결정하거나 핵염기가 클러스터에 해당하는 뉴클레오티드-단편 판독에 대한 염기 호출이 품질 필터를 통과하는지를 결정하는 프로세스도 개선할 수 있다. 교정 서열분석 시스템(106)은 특정 핵염기에 대한 가우스 공분산 행렬이나 강도-값 경계와 같은 핵염기 호출에 대한 표준을 제공하는 서열분석 매개변수를 개선함으로써, 염기 호출 품질 측정 지표의 정확도와 신뢰도를 개선하고, 결과적으로 어떤 핵염기 호출이 품질 필터를 통과하는지 결정하는 것을 개선한다.
이제 도 5b를 참조하면, 제2 교정 체계 하에서, 교정 서열분석 시스템(106)은 교정 사이클들 전반에 걸쳐 상이한 핵염기 유형들을 갖는 교차 사이클 다양화 교정 서열들의 세트를 포함하는 뉴클레오티드-샘플 슬라이드를 수용한다. 일부 경우에서, 교정 서열분석 시스템(106)은 각 교정 서열이 단일 템플릿 교정 서열을 따르는 교차 사이클 다양화 교정 서열들의 세트를 사용한다. 단일 템플릿 교정 서열의 예로, 일부 경우에서, 이러한 세트 내의 각 교정 서열은 동일한 순서를 따르며 단일 핵염기 서열 내에 네 가지 핵염기 유형을 갖는 단일 핵염기 서열을 포함한다. 이러한 단일 템플릿 교정 서열은 2개, 4개, 6개, 또는 8개의 핵염기에 걸쳐 있는 것과 같이 비교적 짧을 수 있다.
교차 사이클 다양화 교정 서열 세트를 사용하기 위해, 특정 경우에서, 교정 서열분석 시스템(106)은 (i) 제1 교정 서열 위치에, 제1 핵염기 유형과 제2 핵염기 유형(예를 들어, G 및 C)의 비례 분포를 집합적으로 포함하고, (ii) 제2 교정 서열 위치에, 제1 핵염기 유형과 제3 핵염기 유형(예를 들어, G 및 T)의 비례 분포를 집합적으로 포함하고, (iii) 제3 교정 서열 위치에서 제1 핵염기 유형과 제4 핵염기 유형(예를 들어, G 및 A)의 비례 분포를 집합적으로 포함하는 교정 서열 세트를 사용한다.
예를 들어, 아래 표 2에 나타낸 바와 같이, 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열을 따름으로써 교차 사이클 다양화 교정 서열 세트를 사용하여 교정 사이클을 수행할 수 있다.
[표 2]
Figure pct00002
추가적으로 또는 대안적으로, 아래 표 3에 나타낸 바와 같이, 교정 서열분석 시스템(106)은 상이한 교정 사이클들에 해당하는 상이한 교정 서열 위치들에서 상이한 핵염기 유형들 조합의 비례 분포를 갖는 교차 사이클 다양화 교정 서열 세트(set of cross-cycle-diversified calibration sequences)를 사용하여 교정 사이클을 수행할 수 있다. 예를 들어, 교차 사이클 다양화 교정 서열 세트는 표 3에 나타낸 바와 같이 2-플렉스 템플릿 교정 서열 세트를 따를 수 있다.
[표 3]
Figure pct00003
도 5b에 도시된 바와 같이, 일부 경우에서, 교정 서열분석 시스템(106)은 교차 사이클 다양화 교정 서열 세트로부터, 위치 520a, 520b, 또는 520c에 샘플 라이브러리 단편(500b) 내에 혼입되었거나 위치 520d 또는 520e에 샘플 라이브러리 단편(500c) 내에 혼입된 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하거나 수용한다. 예를 들어, 샘플 라이브러리 단편(500b)의 위치 520a에 혼입되는 경우, 교정 서열은 결합 어댑터 서열(522a)의 일부 또는 전체로 혼입된다. 샘플 라이브러리 단편(500b)의 위치 520b에 혼입되는 경우, 교정 서열은 제1 판독 프라이밍 서열(524a)의 일부 또는 전체로 혼입된다. 이와 대조적으로, 샘플 라이브러리 단편(500b)의 위치 520c에 혼입되는 경우, 교정 서열은 제2 판독 프라이밍 서열(526a)의 일부 또는 전체로 혼입된다. 위에서 제안된 바와 같이, 샘플 유전체 서열(504b)에는 교정 서열이 포함되지 않는다.
교정 서열의 위치 520a, 520b, 또는 520c에서, 교정 서열분석 시스템(106)은 교정 서열을 뉴클레오티드-샘플 슬라이드 준비 키트로부터의 샘플 라이브러리 단편에 결합 어댑터 서열, 인덱싱 서열, 또는 판독 프라이밍 서열의 일부로 포함할 수 있다. 이러한 일부 경우에서, 교정 서열은 모든 시딩된 샘플 라이브러리 단편에 공통적인데, 왜냐하면 이러한 샘플 라이브러리 단편의 서열들(예를 들어, SBS 서열들)에는 이미 공통성이 존재하기 때문이다. 일부 실시예에서, 위치 520a, 520b, 또는 520c 중 하나에 혼입되는 경우, 교정 서열분석 시스템(106)은 해당하는 서열분석 프라이머를 단축(예를 들어, 약 30개 염기 쌍의 서열분석 프라이머를 하나 이상의 염기로 단축)시켜서, 교정 서열분석 시스템(106)에 의해 그 해당하는 단축 서열분석 프라이머 다음에 혼입된 핵염기가 교정 서열에 해당하도록 한다. 이러한 일부 경우에서, 단축된 서열분석 프라이머는 효소에 의한 서열분석을 위한 교정 서열을 노출시킨다. 교정 서열분석 시스템(106)은 교정 서열을 결합 어댑터 서열, 인덱싱 서열, 또는 판독 프라이밍 서열의 일부로 혼입하고 해당하는 서열분석 프라이머를 단축함으로써, 뉴클레오티드-샘플 슬라이드 준비 키트에서 서열분석 프라이머를 변경하는 동안 교정 서열을 샘플 라이브러리 단편 준비 키트의 구성요소와 호환되게 할 수 있다.
예를 들어, 도 5b에 도시된 바와 같이, 교정 서열분석 시스템(106)은 단축된 서열분석 프라이머를 사용하여 위치 520a, 520b, 또는 520c에 혼입된 교정 서열의 서열분석을 용이하게 할 수 있다. 예를 들어, 일부 경우에서, 교정 서열은 결합 어댑터 서열(522a)의 하류 부분(위치 520a)에 혼입되어, 교정 서열분석 시스템(106)이 서열분석 프라이머(501b) 뒤에 혼입하는 핵염기가 교정 서열을 보완하도록 한다. 또 다른 예로, 일부 실시예에서, 교정 서열은 제1 판독 프라이밍 서열(524a)의 하류 부분(위치 520b)에 혼입되어, 교정 서열분석 시스템(106)이 서열분석 프라이머(501c) 뒤에 혼입하는 핵염기가 교정 서열을 보완하도록 한다. 또 다른 예로, 일부 구현예에서, 교정 서열은 제2 판독 프라이밍 서열(526a)의 하류 부분(위치 520c)에 혼입되어, 교정 서열분석 시스템(106)이 서열분석 프라이머(501d) 뒤에 혼입하는 핵염기가 교정 서열을 보완하도록 한다.
교정 서열분석 시스템(106)은 2-플렉스 템플릿 교정 서열 세트로부터의 교정 서열 또는 단일 템플릿 교정 서열을 판독 프라이밍 서열 또는 결합 어댑터 서열의 일부로 혼입함으로써, 인덱싱 서열의 조합이나 핵염기 순열을 허비하지 않고도 모든 클러스터에 대해 뉴클레오티드-단편 판독의 시작 부분에서 동일한 교정 서열을 사용할 수 있다. 교정 서열분석 시스템(106)은 이렇게 판독 프라이밍 서열의 일부 또는 결합 어댑터 서열을 교정 서열로 사용함으로써 서열분석 매개변수를 더 정확하게 결정할 수 있는데, 왜냐하면 이러한 프라이머 또는 어댑터 접근 방식은 다른 샘플 라이브러리 단편과 상이한 판독 프라이밍 서열의 각각 다른 혼성화로 인해 변할 수 있는 변동 소스(판독 프라이밍 서열에 대한 샘플 라이브러리 단편 혼성화 효율)를 제거하기 때문이다.
샘플 라이브러리 단편(500b) 내의 위치들과 대조적으로, 도 5b에 추가로 도시된 바와 같이, 샘플 라이브러리 단편(500c)의 위치 520d에 혼입되는 경우, 교정 서열은 제2 판독 프라이밍 서열(526b)과 인덱싱 서열(528b) 사이에 위치한다. 대안적으로, 교정 서열은 인덱싱 서열(528a) 또는 인덱싱 서열(528b)의 일부 또는 전체로 혼입될 수 있다. 샘플 라이브러리 단편(500c)의 위치 520e에 혼입되는 경우, 교정 서열은 제1 판독 프라이밍 서열(524b)과 샘플 유전체 서열(504c) 사이에 위치한다. 도 5b가 나타내는 바와 같이, 일부 실시예에서, 서열분석 프라이머(501e)는 교정 서열보다 상류에 위치한 위치 520e의 제1 판독 프라이밍 서열(524b)에 결합한다. 서열분석 실행 중, 효소는 서열분석 프라이머(501e)에 핵염기를 하나씩 추가하거나 혼입하여, 샘플 라이브러리 단편(500c)으로부터의 해당하는 뉴클레오티드 서열 - 위치 520e의 교정 서열과 상보적인 핵염기를 포함 - 과 상보적인 뉴클레오티드-단편 판독을 생성한다.
교정 서열이 샘플 라이브러리 단편(500c)의 위치 520d 또는 520e에 혼입되는 경우, 일부 경우에서, 교정 서열분석 시스템(106)은 판독 프라이밍 서열과 인덱싱 서열 사이 또는 판독 프라이밍 서열과 샘플 유전체 서열 사이에 배치하기 위한 교정 서열을 포함시키기 위해 샘플 라이브러리 단편 준비 키트를 변경한다. 그러나, 교정 서열이 이러한 위치에 배치되고, 수정된 샘플 라이브러리 단편 준비 키트의 일부가 된 경우, 교정 서열분석 시스템(106)은 뉴클레오티드-샘플 슬라이드 준비 키트로부터의 서열분석 프라이머를 변경할 필요가 없다.
단일 템플릿 교정 서열 또는 2-플렉스 템플릿 교정 서열 세트로부터의 교정 서열이 인덱싱 서열(528a) 또는 인덱싱 서열(528b)의 일부 또는 전체로 혼입되는 경우, 일부 실시예에서, 교정 서열분석 시스템(106)은 라벨링을 위한 샘플 유전체 서열(504c)에 사용 가능한 핵염기를 줄이는 데 인덱싱 서열을 사용할 때 일반적으로 소비되는 것과 거의 동일한 비용을 부담할 수 있다. 8, 10, 또는 20개의 핵염기를 포함하는 일부 기존 이중 가닥 인덱싱 서열은 약 416, 420, 또는 440개의 고유 조합을 갖기 때문에, 교정 서열분석 시스템(106)은 인덱싱 서열의 일부를 교정 서열로 사용하기에 충분한 핵염기 순열 공간을 갖는다. 그러나 인덱싱 프라이머 서열과 판독 프라이밍 서열은 일반적으로 별개의 생화학적 혼성화 이벤트를 사용하므로, 인덱싱 서열의 일부를 교정 서열로 사용하는 교정 서열분석 시스템(106)의 교정 사이클은 올리고뉴클레오티드 클러스터에서 이러한 교정 서열을 기반으로 하여 서열분석 매개변수를 결정할 때 추가적인(그러나 무시할 수 있는) 노이즈를 검출할 수 있다.
도 5b에 추가로 도시된 바와 같이, 상이한 핵염기 유형들을 갖는 교차 사이클 다양화 교정 서열들의 세트로부터의 주어진 교정 서열은 (i) 올리고뉴클레오티드의 단클론 클러스터(516a)에 침착된 샘플 라이브러리 단편 내(예를 들어, 뉴클레오티드-샘플 슬라이드의 웰 내)에 혼입될 수 있거나, 또는 (ii) 올리고뉴클레오티드의 다클론 클러스터(516b)에 침착된 상이한 샘플 라이브러리 단편들 내(예를 들어, 뉴클레오티드-샘플 슬라이드의 웰 내)에 혼입될 수 있다. 비교를 위해, 도 5b는 교정 서열이나 샘플 라이브러리 단편이 없고 웰 내 배경 강도 값과 같은 특정 서열분석 매개변수를 결정하는 데 사용될 수 있는 비어 있는 웰(518)도 도시하고 있다. 단일 템플릿 교정에 대한 상기 설명과 일관되게, 교정 서열분석 시스템(106)은 제1 교정 사이클 동안 올리고뉴클레오티드(516a)의 단클론 클러스터에 제1 핵염기 유형(예를 들어, A)의 핵염기들을 혼입하고, 제2 교정 사이클 동안 올리고뉴클레오티드(516a)의 단클론 클러스터에 제2 핵염기 유형(예를 들어, C)의 핵염기들을 혼입하고, 제3 교정 사이클 동안 올리고뉴클레오티드(512a)의 단클론 클러스터에 제3 핵염기 유형(예를 들어, T)의 핵염기들을 혼입한다. 표 3의 예에서의 혼입된 핵염기들은 더 많은 잠재적 핵염기 유형 다양성을 가질 것이다.
상이한 핵염기 유형들을 갖는 교차 사이클 다양화 교정 서열 세트로부터의 주어진 교정 서열이 위와 같이 올리고뉴클레오티드(516b)의 다클론 클러스터에 혼입되는 경우, 그 주어진 교정 서열은 웰 내의 선택된 기지의 위치의 일부일 수 있다. 올리고뉴클레오티드(516b)의 다클론 클러스터를 포괄하는 교정 사이클들 전반에 걸쳐, 교정 서열분석 시스템(106)은 제1 교정 사이클 동안 올리고뉴클레오티드(516b)의 다클론 클러스터에 제1 핵염기 유형(예를 들어, A)의 핵염기들을 혼입하고, 제2 교정 사이클 동안 올리고뉴클레오티드(516b)의 다클론 클러스터에 제2 핵염기 유형(예를 들어, C)의 핵염기들을 혼입하고, 제3 교정 사이클 동안 올리고뉴클레오티드(516b)의 다클론 클러스터에 제3 핵염기 유형(예를 들어, T)의 핵염기들을 혼입한다.
단일 템플릿 교정 서열을 사용하는 경우, 공통 교정 서열은 결합 어댑터 서열에 있는 기존 뉴클레오티드 서열을 (내인성 코드로서) 사용하거나 결합 어댑터 서열에 새로운 뉴클레오티드 서열을 (외인성 코드로서) 도입함으로써 판독될 수 있다. 결합 어댑터 서열로부터의 내인성 코드를 사용하기 위해, 교정 서열분석 시스템(106)은 판독 프라이밍 서열을 여러 개의 핵염기(예를 들어, 도 5b의 위치 520a, 520b, 및 520c)만큼 단축하고 네이티브 결합 어댑터 서열 내의 핵염기를 판독할 수 있다. 이러한 네이티브 결합 어댑터 서열은 모든 샘플 라이브러리 단편 준비 키트와 완전히 호환되지만, 사용자 정의 판독 프라이밍 서열이 필요하다. 대안적으로, 교정 서열분석 시스템(106)은 인덱싱 서열 내 상류(예를 들어, 도 5b의 위치 520d) 또는 하류에 또는 유전체 샘플 서열 바로 앞(예를 들어, 도 5b의 위치 520e)에 교정 서열을 외인성 코드로서 도입할 수 있다. 임의의 그러한 위치에서, 교정 서열분석 시스템(106)은 판독 프라이밍 서열을 변경함으로써 또는 혼입된 염기의 이미지를 캡처하지 않는 다크 교정 사이클을 사용함으로써 교정 사이클을 서열분석 실행에서 제외시킬 수 있다.
교정 서열분석 시스템은 제2 교정 체계에 따른 단일 템플릿 교정 서열을 사용함으로써, 사전에 알려진 뉴클레오티드 서열을 활용하여, 도 5a와 관련한 위의 예와 같이 충분히 다양화된 교정 서열 세트를 사용하여 결정된 하나 이상의 서열분석 매개변수를 보완하는 서열분석 매개변수를 결정할 수 있다. 예를 들어, 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열을 사용함으로써 더 정확한 핵염기 특정 배경 강도 값을 결정할 수 있다. 각 교정 사이클에 혼입된 핵염기가 알려져 있으므로, 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열에 해당하는 각 핵염기 유형에 대한 배경 강도 값을 추정한다. 교정 서열분석 시스템(106)은 이러한 핵염기 특정 배경 강도 값을 사용하여, 피드백을 제공하여 표면 화학이 개선 또는 최적화되도록 하거나, 완전히 기능하는 뉴클레오티드(ffN) 뉴클레오티드 위치 매개변수를 개발하여 화학 및 신호 대 잡음비 측정 지표가 개선되도록 할 수 있다.
또 다른 예로, 교정 서열분석 시스템(106)은 제2 교정 체계에 따른 교차 사이클 다양화 교정 서열들의 세트, 예컨대 단일 템플릿 교정 서열을 사용함으로써, 더 정확한 강도 정규화 계수를 결정할 수 있다. 이러한 강도 정규화 계수를 결정하기 위해, 교정 서열분석 시스템(106)은 교정 사이클에서 각 핵염기 유형의 최대 강도와 최소 강도를 추정하고 그 최대 및 최소 강도에 기반하여 강도 정규화 계수를 결정할 수 있다.
또 다른 예로, 교정 서열분석 시스템(106)은 제2 교정 체계에 따른 교차 사이클 다양화 교정 서열들의 세트, 예컨대 단일 템플릿 교정 서열을 사용함으로써, 가우스 혼합 모델(GMM)에 대한 더 정확한 가우스 공분산 행렬 및 가우스 평균 매개변수를 결정할 수 있다. 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열에 대해 단일 핵염기 유형만 혼입함으로써, GMM을 피팅하거나 기대 최대화(EM)를 수행할 필요 없이 가우스 공분산 행렬과 가우스 평균 매개변수의 추정을 단순화한다. 교정 서열분석 시스템(106)은 이러한 단순화된 계산을 낮은 핵염기 유형 다양성 서열분석 사이클을 위한 시드로 사용하거나 이후 유전체 서열분석 사이클에서 실제 GMM 매개변수에 대한 초기 추정치로 사용하여, 서열분석 매개변수를 조정하거나 핵염기 호출을 결정하는 데 있어 간건성과 정확성을 높일 수 있다.
또한, 교정 서열분석 시스템(106)은 제2 교정 체계에 따른 교차 사이클 다양화 교정 서열들의 세트, 예컨대 단일 템플릿 교정 서열을 사용함으로써, 특정 채널에 대한 더 정확한 클러스터당 강도 정규화 매개변수도 결정할 수 있다. 교정 서열분석 시스템(106)은 각 염기 위치에서 각 클러스터에 대한 매개변수를 정확히 한 번만 검출할 수 있으므로, 교정 서열분석 시스템(106)은 특정 서열분석 매개변수에 대한 추정 알고리즘을 약간 수정하여 제1 교정 체계와 동일한 클러스터별 교정을 수행할 수 있다.
일부 경우에서, 교정 서열분석 시스템(106)은 제2 교정 체계에 따른 교차 사이클 다양화 교정 서열들의 세트, 예컨대 단일 템플릿 교정 서열을 사용함으로써, 상기한 개선된 서열분석 매개변수 외에도, 서열분석 장치 화학 및 분석을 용이하게 하는 서열분석 매개변수도 추정할 수 있다. 예를 들어, 교정 서열분석 시스템(106)은 (예를 들어, 한 채널에 대한) 단일 색상 분포의 조밀도(tightness) 또는 값 차이를 결정함으로써 서열분석 장치 클러스터 증폭 효율 매개변수 및 서열분석 장치 클러스터 혼성화 효율 매개변수를 추정할 수 있다. 또 다른 예로, 교정 서열분석 시스템(106)은 서열분석 장치를 위한 센서 또는 광학 설계를 개선하는 것을 용이하게 하는 도움이 될 수 있는 색상 채널 간 크로스토크 매개변수를 결정할 수 있다.
또 다른 예로, 교정 서열분석 시스템(106)은 제2 교정 체계에 따른 교차 사이클 다양화 교정 서열들의 세트, 예컨대 단일 템플릿 교정 서열을 사용함으로써, 클러스터에 여러 샘플 라이브러리 단편이 시딩될 때 각 올리고뉴클레오티드 클러스터의 폴리콜로날러티를 결정할 수 있다. 단일 템플릿 교정 서열에 대한 교정 사이클은 상이한 샘플 라이브러리 단편들 전반에 걸쳐 동일한 핵염기들을 혼입하기 때문에, 일부 실시예에서, 교정 서열분석 시스템(106)은 교정 사이클에서 단클론 입력 세트를 식별하고 후속해서 유전체 서열분석 사이클에서 다클론 입력을 식별할 수 있고, 이에 의해, 비교했을 때 클러스터별로 폴리콜로날러티를 측정하는 결과를 낳는 입력 신호를 식별할 수 있다.
이제 도 5c를 참조하면, 제3 교정 체계 하에서, 교정 서열분석 시스템(106)은 제1 교정 체계와 제2 교정 체계를 혼성화하거나 결합한다. 교정 서열분석 시스템(106)은 이러한 교정 체계들을 혼성화하거나 결합하기 위해, 교정 서열 위치들 및 교정 사이클들 전반에 걸쳐 혼성 다양화 핵염기 유형 세트를 갖는 교정 서열 세트를 사용하여 교정 사이클을 수행한다. 교정 서열분석 시스템(106)은 제1 및 제2 교정 체계를 혼성화함으로써, 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열 또는 2-플렉스 템플릿 교정 서열 세트를 따르는 교정 서열(또는 교정 하위 서열)을 사용하여 교정 사이클을 수행하여 제1 서열분석 매개변수 세트를 결정하거나, 또는 4-플렉스 템플릿 교정 서열 세트를 따르는 다른 교정 서열(또는 교정 하위 서열)을 사용하여 제2 서열분석 매개변수 세트를 결정한다. 따라서 이러한 혼성 다양화 교정 서열 세트는, 한 세트의 교정 사이클에서, 제1 교정 체계를 사용하여 더 잘 교정된 서열분석 매개변수(예를 들어, 비선형 광학 왜곡 매개변수, SIM 매개변수)를 결정할 수 있고, 제2 교정 체계를 사용하여 더 잘 교정된 다른 서열분석 매개변수(예를 들어, 핵염기 특정 배경 강도 값, 강도 정규화 계수)를 결정할 수 있다.
예를 들어, 혼성 다양화 교정 서열 세트는 (i) 단일 템플릿 교정 서열을 따르는 제1 교정 서열(또는 하위 서열) 및 (ii) 4-플렉스 템플릿 교정 서열 세트(예를 들어, 주어진 교정 서열 위치에 약 25%의 네 가지 다른 핵염기 유형)를 따르는 제2 교정 서열(또는 하위 서열)을 포함할 수 있다. 예를 들어, 위에서 설명하고 도 4에 도시된 바와 같이, 교정 서열분석 시스템(106)은 (i) 교정 서열(402)로부터의 단일 템플릿 뉴클레오티드 서열(408)을 따르는 교정 서열 세트를 사용하여 교정 사이클 1 내지 교정 사이클 4를 수행하고 (ii) 4-플렉스 템플릿 교정 서열 세트가 있는 교정 서열 세트(409b)를 사용하여 교정 사이클 4 내지 교정 사이클 8을 수행함으로써, 혼성 다양화 교정 서열 세트를 사용하여 교정 사이클을 수행한다.
도 5c에 추가로 도시된 바와 같이, 일부 경우에서, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편(500d)내의 비유전체 서열 및/또는 비전사체 서열의 일부 또는 전체로 혼입된, 혼성 다양화 교정 서열 세트로부터의 주어진 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하거나 수용한다. 제3 교정 체계에 따라 샘플 라이브러리 단편(500d) 내에 혼입하는 경우, 일부 경우에서, 혼성 다양화 교정 서열 세트로부터의 교정 서열이 판독 프라이밍 서열(532a)(예를 들어, 제1 판독 프라이밍 서열) 또는 판독 프라이밍 서열(532b)(예를 들어, 제2 판독 프라이밍 서열)의 일부 또는 전체로 혼입된다. 특정 경우에서, 판독 프라이밍 서열(532a 또는 532b)의 일부로 혼입하는 경우, 교정 서열분석 시스템(106)은 관련 판독 프라이밍 서열을 다수의 핵염기만큼 단축하고, 효소(예를 들어, DNA 중합효소)를 위한 부위를 제공하는 기존 또는 공통 핵염기를 유지하고, 제1 교정 체계(예를 들어, 4-플렉스 템플릿 교정 서열 세트)와 일치하는 핵염기를 추가한다.
도 5c가 제3 교정 체계에 대해 추가로 나타낸 바와 같이, 상기 위치들에 대한 대안으로, 혼성 다양화 교정 서열 세트로부터의 교정 서열 중 일부 또는 전부를 판독 프라이밍 서열(532a)과 샘플 유전체 서열(504d) 사이의 위치 536a에, 판독 프라이밍 서열(532a)과 인덱싱 서열(534a) 사이의 위치 536b에, 판독 프라이밍 서열(532b)과 인덱싱 서열(534b) 사이의 위치 536c에 혼입할 수 있다.
혼성 다양화 교정 서열 세트를 사용하여 교정 사이클을 수행하는 경우, 일부 경우에서, 뉴클레오티드-샘플 슬라이드는 혼성 다양화 교정 서열들의 서브세트(예를 들어, 단일 템플릿 교정 서열들의 서브세트)에 상보적인 뉴클레오티드들을 혼입하는 올리고뉴클레오티드들의 단클론 클러스터들과, 혼성 다양화 교정 서열들의 다른 서브세트(예를 들어, 2-플렉스 또는 4-플렉스 템플릿 교정 서열 세트들의 서브세트)에 상보적인 뉴클레오티드들을 혼입하는 올리고뉴클레오티드들의 다클론 클러스터들을 포함한다.
예를 들어, 도 5c가 나타내고 있는 바와 같이, 올리고뉴클레오티드(529a)의 단클론 클러스터는 단일 템플릿 교정 서열들의 서브세트를 포함한다. 올리고뉴클레오티드(529a)의 단클론 클러스터에 대한 교정 사이클 1 내지 교정 사이클 4에서, 교정 서열분석 시스템(106)은 제1 교정 사이클 동안 올리고뉴클레오티드(529a)의 단클론 클러스터에 제1 핵염기 유형(예를 들어, A)의 핵염기들을 혼입하고, 제2 교정 사이클 동안 올리고뉴클레오티드(529a)의 단클론 클러스터에 제2 핵염기 유형(예를 들어, C)의 핵염기들을 혼입하고, 제3 교정 사이클 동안 올리고뉴클레오티드(529a)의 단클론 클러스터에 제3 핵염기 유형(예를 들어, G)의 핵염기들을 혼입하고, 제4 교정 사이클 동안 올리고뉴클레오티드(529a)의 단클론 클러스터에 제4 핵염기 유형(예를 들어, T)의 핵염기들을 혼입한다. 비교를 위해, 도 5c는 교정 서열이나 샘플 라이브러리 단편이 없고 웰 내 배경 강도 값과 같은 특정 서열분석 매개변수를 결정하는 데 사용될 수 있는 비어 있는 웰(530)도 도시하고 있다.
도 5c가 추가로 나타내고 있는 바와 같이, 올리고뉴클레오티드(529b)의 다클론 클러스터는 2-플렉스 또는 4-플렉스 템플릿 교정 서열 세트들의 서브세트를 갖는 교정 서열 세트를 포함한다. 올리고뉴클레오티드(529b)의 다클론 클러스터에 대한 교정 사이클 1 내지 교정 사이클 4에서, 교정 서열분석 시스템(106)은 제1 교정 사이클 동안 올리고뉴클레오티드(529b)의 다클론 클러스터에 제1 핵염기 유형(예를 들어, A)의 핵염기들을 혼입하고, 제2 교정 사이클 동안 올리고뉴클레오티드(529b)의 다클론 클러스터에 제2 핵염기 유형(예를 들어, C)의 핵염기들을 혼입하고, 제3 교정 사이클 동안 올리고뉴클레오티드(529b)의 다클론 클러스터에 제4 및 제1 핵염기 유형(예를 들어, A)의 핵염기들을 혼입하고, 제4 교정 사이클 동안 올리고뉴클레오티드(529b)의 다클론 클러스터에 제1 및 제3 핵염기 유형(예를 들어, A 및 C)의 핵염기들을 혼입한다.
제1 교정 체계와 제2 교정 체계를 혼성화하는 제3 교정 체계 하에서, 교정 서열분석 시스템(106)은 혼성 다양화 교정 서열 세트로 교정 사이클을 수행함으로써, 오로지 제2 교정 체계만 실행하는 데 소모했을 메모리를 낮춘다. 특히, 제3 혼성 교정 체계 하에서, 교정 서열분석 시스템(106)은 강도 값을 위한 핵염기 중심이나 가우스 공분산 행렬과 같은 관련 서열분석 매개변수를 추정하기 전에 강도 값을 평가하는 데 있어 더 이상 여러 번의 교정 사이클을 필요로 하지 않는다. 충분히 다양화된 교정 서열에 단일 템플릿 교정 서열을 결합하는 제3 교정 체계 하에서의 이러한 혼성 다양화 교정 서열 세트는 고처리량 서열 장치에서 특히 효율적일 수 있다. 충분히 다양화된 교정 서열과 교차 사이클 다양화 교정 서열을 모두 나타내는 교정 사이클을 수행함으로써, 교정 서열분석 시스템(106)은 서열분석 매개변수를 결정하는 정확도와 강건성도 마찬가지로 높인다.
제3 및 혼성화 교정 체계에 추가하여 또는 그에 대한 대안으로, 일부 실시예에서, 교정 서열분석 시스템(106)은 뉴클레오티드-샘플 슬라이드 내의 선택된 클러스터 또는 웰 서브세트를 사용하는 제4 교정 체계 하에서 동작한다. 이 제4 교정 체계에서, 교정 서열분석 시스템(106)은 뉴클레오티드-샘플 슬라이드 내의 선택된 올리고뉴클레오티드 클러스터(또는 해당 선택된 웰)에서 제1 교정 체계, 제2 교정 체계, 또는 제3 교정 체계 중 하나 이상을 구현한다. 실제로, 일부 경우에서, 교정 서열분석 시스템은 (i) 뉴클레오티드-샘플 슬라이드의 각 웰에, 각 웰 내의 각 올리고뉴클레오티드 클러스터를 시딩하기 위해, (ii) 뉴클레오티드-샘플 슬라이드의 웰 서브세트에, 웰 서브세트 내의 각 올리고뉴클레오티드 클러스터를 시딩하기 위해, 또는 (iii) 뉴클레오티드-샘플 슬라이드의 웰 서브세트에, 웰 서브세트 내의 올리고뉴클레오티드 클러스터 서브세트를 시딩하기 위해, 제1, 제2, 또는 제3 교정 체계 중 하나 이상을 따르는 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하거나 검출한다. 마찬가지로, 패턴이 없는 뉴클레오티드-샘플 슬라이드의 경우, 교정 서열분석 시스템은 올리고뉴클레오티드의 각 클러스터 또는 올리고뉴클레오티드 클러스터의 서브세트에 제1, 제2, 또는 제3 교정 체계 중 하나 이상을 따르는 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하거나 검출한다.
교정 서열분석 시스템(106)은 상이한 샘플 라이브러리 단편 세트들 내에 상이한 유형들의 교정 서열들을 혼입하기 위해 웰 서브세트 또는 클러스터 서브세트를 선택함으로써, 상이한 유형들의 교정 서열들에 해당하는 상이한 서열분석 매개변수들을 결정할 수 있다. 또한, 교정 서열들을 혼입하기 위해 제1 웰 서브세트 또는 제1 클러스터 서브세트를 선택함으로써 그리고 제1 웰 서브세트 또는 제1 클러스터 서브세트에서 교정 서열을 빠뜨림으로써, 교정 서열분석 시스템(106)은, 선택적으로, 제1 클러스터/웰 서브세트에 대해 교정 사이클을 수행하는 한편 제2 클러스터/웰 서브세트에 대해 다른 서열분석 사이클(예를 들어, 인덱싱 사이클)을 수행할 수 있다.
하나 이상의 실시예에 따르면, 도 5d는 한 웰 서브세트 또는 클러스터 서브세트에 대해 교정 사이클을 수행하는 한편, 다른 웰 서브세트 또는 클러스터 서브세트에 대해 다른 교정 사이클을 수행하는 교정 서열분석 시스템(106)의 예를 도시한다. 예를 들어, 도 5d에 도시된 바와 같이, 교정 서열분석 시스템(106)은 교정 서열이 없는 샘플 라이브러리 단편을 포함하는 뉴클레오티드-샘플 슬라이드 내의 제1 웰 서브세트(538)에 대해 인덱싱 사이클과 같은 서열분석 사이클을 수행한다. 일부 경우에서, 제1 웰 서브세트(538)는 뉴클레오티드-샘플 슬라이드 내 웰들 중 85% 이상을 구성한다. 도 5d에 추가로 도시된 바와 같이, 교정 서열분석 시스템(106)은 샘플 라이브러리 샘플 내의 교정 서열들을 포함하는 뉴클레오티드-샘플 슬라이드 내의 제2 웰 서브세트(540)에 대해 교정 사이클을 수행한다. 일부 경우에서, 제2 웰 서브세트(540)는 뉴클레오티드-샘플 슬라이드 내 웰들 중 5% 이하를 구성한다. 도 5d가 추가로 나타내는 바와 같이, 뉴클레오티드-샘플 슬라이드는 웰 내 배경 강도 값과 같은 특정 서열분석 매개변수를 결정하기 위한 샘플 라이브러리 단편이나 교정 서열이 없는 제3 웰 서브세트(542)를 포함한다.
위의 제1, 제2, 또는 제3 교정 체계와 일관되게, 제2 웰 서브세트(540)의 교정 서열들은 샘플 라이브러리 단편 내의 상이한 위치에 있을 수 있다. 제4 교정 체계 하에서, 도 5d는 제2 웰 서브세트(540)의 한 웰 내의 샘플 라이브러리 단편 내에 혼입된 교정 서열의 위치의 한 예를 예시한다. 예를 들어, 샘플 라이브러리 단편(500e)에 혼입되는 경우, 교정 서열(546)은 결합 어댑터 서열(544)의 일부 또는 전체로 혼입된다. 일부 경우에서, 결합 어댑터 서열(544)의 일부로 혼입되는 경우, 교정 서열분석 시스템(106)은 UDI 서열의 일부 또는 전체를 교정 서열(546)로 사용한다.
위에서 제안된 바와 같이, 일부 경우에서, 교정 서열분석 시스템(106)은, 각각이 제1 뉴클레오티드-단편 판독에 대해서 그리고 그에 이어 제2 뉴클레오티드-단편 판독에 대해 중합효소 서열분석을 개시하는 제1 판독 프라이밍 서열과 제2 판독 프라이밍 서열을 포함하는 샘플 라이브러리 단편과 관련된 교정 서열을 사용한다. 하나 이상의 실시예에 따르면, 도 5e는 제1 뉴클레오티드-단편 판독과 제2 뉴클레오티드-단편 판독에 대한 동시 서열분석을 위한 교정 사이클과 교정 서열의 위치를 도시한다. 일부 실시예에서, 교정 서열분석 시스템(106)은 교정 서열을 뉴클레오티드-샘플 슬라이드의 표면에 부착된 하나 이상의 표면 결합 올리고뉴클레오티드의 일부로 추가하거나 혼입함으로써, 샘플 라이브러리 단편으로부터의 동시 서열분석된 뉴클레오티드-단편 판독들로부터 크로스토크 신호를 피하는 교정 사이클을 수행할 수 있다.
예를 들어, 도 5e에 도시된 바와 같이, 교정 서열(556)은 뉴클레오티드-샘플 슬라이드의 표면(558)에 부착된 표면 결합 올리고뉴클레오티드(554)의 일부 또는 전체로 혼입된다. 예를 들어, 일부 경우에서, 교정 서열(556)은 폴리(N-(5-아지도아세트아미딜펜틸)아크릴아마이드-코-아크릴아마이드(PAZAM)와 같은 뉴클레오티드-샘플 슬라이드의 론에 대한 중합체 코팅에 부착된 표면 결합 올리고뉴클레오티드(554)의 일부 또는 전부이다. 교정 서열분석 시스템(106)은 뉴클레오티드-샘플 슬라이드를 위해 PAZAM에 부착되거나 다른 표면에 부착된 올리고뉴클레오티드의 일부로 교정 서열(556)을 혼입함으로써 그리고 샘플 라이브러리 단편(500f)이 표면 결합 올리고뉴클레오티드(554)와 결합되거나 어닐링되기 전에 교정 사이클을 수행함으로써, 일루미나 인코포레이티드(Illumina, Inc.)의 SPEAR 염기 호출과 같이 동시 서열분석된 뉴클레오티드-단편 판독으로부터의 크로스토크 신호를 피하는 교정 사이클을 수행하거나 동시 서열분석 중에 판독 프라이밍 서열을 절단하기 전에 수행할 수 있다. 일부 경우에서, 이러한 뉴클레오티드-단편 판독의 동시 서열분석 또는 판독 프라이밍 서열의 절단은 플로우 셀즈(Flow Cells)의 미국 특허 출원 제16/626,452호(2019년 6월 7일 출원) 또는 플로우 셀즈의 미국 특허 출원 제17/126,548호(2020년 12월 18일 출원)에 기술되어 있으며, 이 출원들은 전체 내용이 본원에 참조로 포함된다.
표면 결합 올리고뉴클레오티드(554)의 대안으로, 교정 서열(556)이 샘플 라이브러리 단편(500f)의 위치에 혼입될 수 있다. 도 5e에 도시되지는 않았지만, 일부 실시예에서, 교정 서열(556)은 샘플 라이브러리 단편(500f)의 샘플 유전체 서열과 제1 판독 프라이밍 서열 사이 또는 샘플 라이브러리 단편(500f)의 샘플 유전체 서열과 제2 판독 프라이밍 서열 사이에 위치한다. 또 다른 실시예에서, 교정 서열(556)은 샘플 라이브러리 단편(500f)의 제1 판독 프라이밍 서열 또는 제2 판독 프라이밍 서열의 일부 또는 전체로 혼입된다.
제1 및 제2 뉴클레오티드-단편 판독을 동시 서열분석하는 서열분석 실행에서 교정 서열로 교정 사이클을 수행하는 경우, 일부 실시예에서, 교정 서열분석 시스템(106)은 주어진 교정 사이클에서 각 웰이 동일한 유형의 교정 서열을 포함하는 도 5b의 제2 교정 체계, 예컨대 단일 템플릿 교정 서열을 사용한다. 대안적으로, 일부 실시예에서, 교정 서열분석 시스템(106)은 주어진 교정 사이클에서 웰들이 상이한 유형들의 교정 서열을 포함하는 도 5a의 제1 교정 체계, 예컨대 4-플렉스 템플릿 교정 서열 세트를 사용하는데, 이는 론-화학 패터닝(SPEAR 유사 패터닝)의 발전을 예상한 것이다.
또한, 제1 및 제2 뉴클레오티드-단편 판독을 동시에 서열분석하는 서열분석 실행에서 교정 서열로 교정 사이클을 수행하는 경우, 일부 실시예에서, 교정 서열분석 시스템(106)은 뉴클레오티드-샘플 슬라이드의 각 웰 또는 뉴클레오티드-샘플 슬라이드의 웰 서브세트에 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 검출하거나 수용한다. 배경 강도 값과 같은 서열분석 매개변수를 결정하기 위해, 뉴클레오티드-샘플 슬라이드는 교정 서열분석 시스템(106)의 교정 사이클 동안 빈 웰들(예를 들어, 시딩 불가)을 포함할 수 있다.
도 5e에 추가로 도시된 바와 같이, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편을 포함할 수도 포함하지 않을 수도 있는 뉴클레오티드-샘플 슬라이드 내의 제1 웰 서브세트(548)에 대해 인덱싱 사이클과 같은 서열분석 사이클을 수행한다. 위에서 언급한 바와 같이, 교정 서열이 표면 결합 올리고뉴클레오티드의 일부로 혼입되는 경우, 교정 서열분석 시스템(106)은 샘플 라이브러리 단편이 표면 결합 올리고뉴클레오티드나 뉴클레오티드-샘플 슬라이드의 표면과 결합되거나 어닐링되기 전에 교정 사이클을 수행할 수 있다. 도 5e에 추가로 도시된 바와 같이, 교정 서열분석 시스템(106)은 뉴클레오티드-샘플 슬라이드의 표면에 부착된 표면 결합 올리고뉴클레오티드의 일부로 혼입된 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드 내의 제2 웰 서브세트(550)에 대해 교정 사이클을 수행한다. 도 5e가 추가로 나타내는 바와 같이, 뉴클레오티드-샘플 슬라이드는 웰 내 배경 강도 값과 같은 특정 서열분석 매개변수를 결정하기 위한 샘플 라이브러리 단편이나 교정 서열이 없는 제3 웰 서브세트(552)를 포함한다.
위에서 설명한 바와 같이, 도 5a 내지 도 5e는 다양한 교정 체계를 도시한다. 도 5a 내지 도 5e와 관련하여 위에서 설명한 실시예들에 더하여 또는 그 실시예들과 관련하여, 아래의 표 4는 표 4의 교정 체계 기준 하에서 결정된 교정 사이클의 예시적 횟수와 예시적 목표 서열분석 매개변수들과 함께 각 교정 체계에 대한 몇 가지 특정 예를 제시한다. 교정 체계의 일부 특정 예는 대략적인 교정 사이클 횟수를 포함하지만, 주어진 교정 체계에 대해 임의의 적절한 횟수의 교정 사이클이 구현될 수 있다.
[표 4]
위에서 언급한 바와 같이, 일부 실시예에서, 교정 서열분석 시스템(106)은 교정 서열을 사용하여 서열분석 장치를 교정함으로써 하나 이상의 서열분석 매개변수 및 해당하는 핵염기 호출의 정확도를 향상시킨다. 하나 이상의 실시예에 따르면, 도 6은 무작위로 호출된 핵염기에 기반하거나 교정 서열로부터의 기지의 핵염기에 기반한, 상이한 핵염기 유형들에 해당하는 상이한 채널들에 대한 강도-값 분포의 박스 플롯 다이어그램(600)을 예시한다. 박스 플롯 다이어그램(600)으로 나타낸 바와 같이, 교정 서열분석 시스템(106)은 특정 채널에 대한 강도 매개변수(예를 들어, 클러스터당 강도 매개변수)를 종래의 교정에서 전형적인 미지의 또는 무작위로 호출된 핵염기보다 더 나은 교정 서열로부터의 기지의 핵염기에 기반하여 결정할 수 있다.
도 6에 도시된 바와 같이, 박스 플롯 다이어그램(600)은 강도 값 축(602)을 따라 채널 0 및 채널 1에 대한 강도 값을 보여주고, 핵염기 축(604)을 따라 사이클 1 내지 사이클 15에 호출된 핵염기를 보여준다. 강도 값을 결정하기 위해, 교정 서열분석 시스템(106)은 서열분석 사이클 1 내지 서열분석 사이클 4를 수행하여 비교정 서열로부터의 무작위 핵염기에 대한 강도 값을 혼입하고 결정하는데, 여기서 "X"는 상이한 핵염기 유형들의 무작위 핵염기들을 나타낸다. 교정 서열분석 시스템(106)은 추가로 교정 사이클 5 내지 교정 사이클 15를 수행하여 단일 템플릿 교정 서열을 따르는 교정 서열들의 세트로부터의 기지의 핵염기들에 대한 강도 값들을 혼입하고 결정하는데, 여기서 사이클 번호 옆의 문자는 특정 핵염기 유형의 기지의 핵염기를 나타낸다(예를 들어, "5-G"의 경우는 구아닌, "6-A"의 경우는 아데닌). 채널 0은 한 사이클 동안 특정 형광 염료에 대해 클러스터들이 방출하는 빛과 그 빛을 캡처한 이미지를 나타낸다. 채널 1은 한 사이클 동안 다른 형광 염료에 대해 클러스터들이 방출하는 빛과 그 빛을 캡처한 이미지를 나타낸다. 교정 서열분석 시스템(106)은 AZM 염료와 65℃ 영상을 갖춘 iSeqKepler를 사용하여 박스 플롯 다이어그램에 도시된 사이클들을 수행했다.
박스 플롯 다이어그램(600)에서 알 수 있는 바와 같이, 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열을 사용하여 상이한 채널들에서 특정 핵염기 유형들에 대해 강도 값들의 명확하고 구별되는 범위와 평균을 결정한다. 이와 대조적으로, 교정 서열분석 시스템(106)은 무작위 또는 미지의 핵염기들을 사용하여 상이한 채널들에서 강도 값들의 불분명하고 덜 유용한 범위 또는 평균을 결정한다.
교정 서열분석 시스템(106)은 클러스터당 강도 매개변수를 개선하는 것 외에도, 교정 서열을 사용하여 서열분석 장치를 교정함으로써 특정 핵염기 유형들에 대한 강도-값 경계와 같은 다른 서열분석 매개변수들의 정확도를 개선할 수 있다. 하나 이상의 실시예에 따르면, 도 7a 및 도 7b는 상이한 유형들의 교정 서열들에 기반하여 상이한 채널들에 대해 상이한 핵염기 유형들에 해당하는 강도 값들의 산점도 다이어그램 700a 및 700b를 예시한다. 특히, 도 7a는 제2 교정 체계 하에서의 단일 템플릿 교정 서열을 따르는 교정 서열들의 세트로부터의 네 가지 다른 핵염기 유형의 핵염기들에 해당하는 강도 값들의 산점도 다이어그램 700a를 예시한다. 특히, 도 7b는 제1 교정 체계 하에서의 4-플렉스 템플릿 교정 서열 세트를 따르는 교정 서열들의 세트로부터의 4가지 다른 핵염기 유형의 핵염기들에 해당하는 강도 값들의 산점도 다이어그램 700b를 예시한다.
예를 들어, 도 7a에 도시된 바와 같이, 산점도 다이어그램 700a는 강도 값 축(702a)을 따라 채널 1에 대한 강도 값들을 보여주고 강도 값 축(704a)을 따라 채널 0에 대한 강도 값들을 보여준다. 도 7a에 나타낸 강도 값을 포착하기 위해, 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열을 따르는 교정 서열들의 세트에 대해 30번의 교정 사이클을 수행했다. 위에서 언급한 바와 같이, 이러한 단일 템플릿 교정 서열은 서열분석 매개변수 결정을 용이하게 하는 데 도움이 되는 기지의 핵염기를 포함한다. 따라서, 산점도 다이어그램 700a는 30번의 교정 사이클에 걸쳐 품질 필터를 통과한 다수의 올리고뉴클레오티드 클러스터들에 대한 강도 값들을 나타낸다.
도 7b에 도시된 바와 같이, 산점도 다이어그램 700b는 강도 값 축(702b)을 따라 채널 1에 대한 강도 값들을 보여주고 강도 값 축(704b)을 따라 채널 0에 대한 강도 값들을 보여준다. 도 7b에 나타낸 강도 값을 포착하기 위해, 교정 서열분석 시스템(106)은 4-플렉스 템플릿 교정 서열 세트를 따르는 교정 서열들의 세트에 대해 단일 교정 사이클을 수행했다. 따라서, 산점도 다이어그램 700b는 단일 교정 사이클 동안 품질 필터를 통과한 다수의 올리고뉴클레오티드 클러스터들에 대한 강도 값들을 나타낸다.
도 7a와 도 7b를 비교하여 나타낸 바와 같이, 4가지 다른 핵염기 유형(예를 들어, G, A, C, T)에 해당하는 강도 값 클라우드들은 산점도 다이어그램 700a 및 700b에서 일관되고 서로 상관관계가 있다. 따라서, 일부 실시예에서, 교정 서열분석 시스템(106)은 단일 템플릿 교정 서열을 사용하거나 또는 4-플렉스 템플릿 교정 서열 세트를 사용하여 특정 핵염기 유형들에 대한 강도-값 경계를 정확하게 결정할 수 있다. 일부 경우에서, 교정 서열분석 시스템(106)은 또한, 단일 템플릿 교정 서열을 사용하여 교정 사이클에서 하나 이상의 서열분석 매개변수를 결정한 다음, 4-플렉스 템플릿 교정 서열 세트를 사용하여 교정 사이클 동안 하나 이상의 서열분석 매개변수를 조정(또는 시작점으로 사용)할 수 있다.
위에서 추가로 나타낸 바와 같이, 일부 실시예에서, 교정 서열분석 시스템(106)은 개선된 서열분석 매개변수로 핵염기 호출을 개선한다. 하나 이상의 실시예에 따르면, 도 8a 및 도 8b는 교정되지 않은 서열분석 매개변수와 교정된 서열분석 매개변수를 사용한, 상이한 핵염기 유형들의 핵염기에 대한 강도 값들의 산점도를 해당 핵염기 호출들과 함께 예시한다.
예를 들어, 도 8a에 도시된 바와 같이, 산점도 다이어그램 800a는 핵염기 호출에 대한 색상 코드 키(802a)로 표시된 바와 같이, 혼입된 핵염기에 대한 교정되지 않은 서열분석 매개변수와 해당하는 핵염기 호출을 사용한, 서열분석 사이클(예를 들어, 인덱싱 사이클) 동안 상이한 핵염기 유형들(예를 들어, G, T, C, A)의 혼입된 핵염기들이 방출하는 빛의 이미지들의 세트에서 추출된 강도 값들을 도시한다. 특히, 산점도 다이어그램 800a의 경우, 교정 서열분석 시스템(106)은 1로 설정된 정규화 매개변수와 0으로 설정된 오프셋 보정 매개변수를 사용하여 강도 값과 핵염기 호출을 결정한다. 이와 대조적으로, 산점도 다이어그램 800b는 핵염기 호출에 대한 색상 코드 키(802b)로 표시된 바와 같이, 교정된 클러스터당 강도 정규화 매개변수와, 혼입된 핵염기에 대한 해당하는 핵염기 호출을 포함하여, 교정된 서열분석 매개변수를 사용하여 동일한 이미지 세트에서 추출된 강도 값들을 도시한다. 이러한 교정된 클러스터당 강도 정규화 매개변수는 예를 들어 교정된 스케일링 계수, 교정된 오프셋 보정 매개변수, 로그 정규화 계수, 또는 시그모이드 변환을 포함할 수 있다. 산점도 다이어그램 800a와 산점도 다이어그램 800b를 비교하여 나타낸 바와 같이, 교정 서열분석 시스템(106)은 교정된 서열분석 매개변수를 사용하여 더 정확한 핵염기 호출을 결정한다.
도 8b에 도시된 바와 같이, 산점도 다이어그램 800c는 핵염기 호출에 대해 색상 코드 키(802c)로 표시된 바와 같이, 교정되지 않은 서열분석 매개변수와 혼입된 핵염기에 대한 해당 핵염기 호출을 사용한, 도 8a에 나타낸 것과 다른 서열분석 사이클(예를 들어, 인덱싱 사이클) 동안 상이한 핵염기 유형들(예를 들어, G, T, C, A)의 혼입된 핵염기가 방출하는 빛의 이미지들의 세트에서 추출된 강도 값을 도시한다. 특히, 도 8b의 산점도 다이어그램 800c의 경우, 교정 서열분석 시스템(106)은 1로 설정된 스케일링 계수와 0으로 설정된 오프셋 보정 매개변수를 사용하여 강도 값과 핵염기 호출을 결정한다. 이와 대조적으로, 산점도 다이어그램 800d는 핵염기 호출에 대한 색상 코드 키(802d)로 표시된 바와 같이, 교정된 스케일링 계수 및 교정된 오프셋 보정 매개변수와, 혼입된 핵염기에 대한 해당 핵염기 호출을 포함하여, 교정된 서열분석 매개변수를 사용하여 동일한 이미지 세트에서 추출된 강도 값들을 도시한다. 산점도 다이어그램 800c와 산점도 다이어그램 800d를 비교하여 나타낸 바와 같이, 교정 서열분석 시스템(106)은 교정된 서열분석 매개변수를 사용하여 더 정확한 핵염기 호출을 결정한다.
이제 도 9를 참조하면, 이 도면은 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하고 교정 서열에 기반하여 서열분석 장치에 해당하는 하나 이상의 서열분석 매개변수를 결정하는 일련의 동작들(900)에 대한 흐름도를 예시한다. 도 9는 일 실시예에 따른 동작들을 예시하지만, 대안적인 실시예는 도 9에 도시된 동작들 중 임의의 것을 생략, 추가, 재정렬, 및/또는 수정할 수 있다. 도 9의 동작들은 방법의 일부로서 수행될 수 있다. 대안적으로, 비일시적 컴퓨터 판독 가능 저장 매체는, 하나 이상의 프로세서에 의해 실행될 때 컴퓨팅 장치 또는 시스템으로 하여금 도 9에 도시된 동작들을 수행하게 하는 명령어를 포함할 수 있다. 또 다른 실시예에서, 시스템은 적어도 하나의 프로세서와, 하나 이상의 프로세서에 의해 실행될 때 해당 시스템으로 하여금 도 9의 동작들을 수행하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독 가능 매체를 포함한다.
도 9에 도시된 바와 같이, 동작들(900)에는 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 동작 902가 포함된다. 특히, 일부 실시예에서, 동작 902는 핵염기의 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 것을 포함한다. 추가적으로 또는 대안적으로, 동작 902는 핵염기의 교정 서열 및 교정 서열과 연관된 샘플 라이브러리 단편을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 것을 포함한다. 일부 실시예에서, 교정 서열은 뉴클레오티드-샘플 슬라이드에 침착된 샘플 라이브러리 단편의 일부이거나, 뉴클레오티드-샘플 슬라이드의 표면에 부착된 표면 결합 올리고뉴클레오티드의 일부이다.
특정 실시예에서, 교정 서열은 4가지 핵염기 유형들의 비례 분포를 갖는 상이한 핵염기 서열들을 포함한다. 관련하여, 특정 구현예에서, 상이한 핵염기 서열들은 제1 핵염기 순서에 따라 4가지 핵염기 유형들을 포함하는 제1 교정 서열과, 제2 핵염기 순서에 따라 4가지 핵염기 유형들을 포함하는 제2 교정 서열을 포함한다.
또한, 일부 경우에서, 각 교정 서열은 동일한 핵염기 순서를 따르는 단일 핵염기 서열을 포함하고 단일 핵염기 서열 내에 4가지 핵염기 유형들을 갖는다. 추가적으로 또는 대안적으로, 각 교정 서열은 4가지 핵염기 유형들의 비례 분포를 갖는 단일 핵염기 서열을 포함한다. 특정 경우에서, 교정 서열은, 주어진 교정 서열 위치에 제1 핵염기 유형과 제2 핵염기 유형의 분포를 집합적으로 포함하고 후속한 교정 서열 위치에 제1 핵염기 유형과 제3 핵염기 유형의 분포 또는 제3 핵염기 유형과 제4 핵염기 유형의 분포를 집합적으로 포함하는 상이한 핵염기 서열들을 포함한다.
위에서 언급한 바와 같이, 일부 경우에서, 뉴클레오티드-샘플 슬라이드를 수용하는 것은 다음을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 것을 포함한다: 각 웰 내에 각 올리고뉴클레오티드 클러스터를 시딩하기 위한 뉴클레오티드-샘플 슬라이드의 각 웰 내의 교정 서열; 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내에 올리고뉴클레오티드의 각 클러스터를 시딩하기 위한 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내의 교정 서열; 또는 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내에 올리고뉴클레오티드의 클러스터들의 서브세트를 시딩하기 위한 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내의 교정 서열.
위에서 추가로 나타낸 바와 같이, 일부 실시예에서, 뉴클레오티드-샘플 슬라이드를 수신하는 것은 다음을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 것을 포함한다: 제1 서열분석 매개변수를 교정하기 위한 제1 교정 서열 세트를 포함하는 제1 샘플 라이브러리 단편 세트; 및 제2 서열분석 매개변수를 교정하기 위한 제2 교정 서열 세트를 포함하는 제2 샘플 라이브러리 단편 세트. 관련하여, 특정 실시예에서, 뉴클레오티드-샘플 슬라이드를 수용하는 것은 샘플 라이브러리 단편 내의 비유전체 및/또는 비전사체 서열의 일부 또는 전체로서 교정 서열을 포함하는 샘플 라이브러리 단편을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 것을 포함한다.
추가적으로 또는 대안적으로, 뉴클레오티드-샘플 슬라이드를 수신하는 것은 결합 어댑터 서열과 인덱싱 서열 사이, 인덱싱 서열과 판독 프라이밍 서열 사이, 또는 판독 프라이밍 서열과 샘플 유전체 서열 사이에 교정 서열을 포함하는 샘플 라이브러리 단편을 포함하는 뉴클레오티드-샘플 슬라이드를 수신하는 것을 포함한다.
관련하여, 일부 경우에서, 결합 어댑터 서열과 인덱싱 서열 사이의 교정 서열은 P7 결합 어댑터 서열과 i7 인덱싱 서열 사이 또는 P5 결합 어댑터 서열과 i5 인덱싱 서열 사이의 교정 서열을 포함하고; 인덱싱 서열과 판독 프라이밍 서열 사이의 교정 서열은 i7 인덱싱 서열과 제1 판독 프라이밍 서열 사이 또는 i5 인덱싱 서열과 제2 판독 프라이밍 서열 사이의 교정 서열을 포함하고; 판독 프라이밍 서열과 샘플 유전체 서열 사이의 교정 서열은 제1 판독 프라이밍 서열과 샘플 유전체 서열 사이 또는 제2 판독 프라이밍 서열과 샘플 유전체 서열 사이의 교정 서열을 포함한다.
추가적으로 또는 대안적으로, 뉴클레오티드-샘플 슬라이드를 수용하는 것은 비무작위 고유 분자 식별자(UMI) 서열의 일부 또는 전체로서, 고유 이중 인덱스(UDI) 서열의 일부 또는 전체로서, 인덱싱 서열의 일부 또는 전체로서, 또는 결합 어댑터 서열의 일부 또는 전체로서 교정 서열을 포함하는 샘플 라이브러리 단편을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 것을 포함한다.
도 9에 추가로 도시된 바와 같이, 동작들(900)에는 서열분석 장치와 교정 서열을 사용하여 교정 사이클을 수행하는 동작 904가 포함된다. 특히, 일부 실시예에서, 동작 904는 교정 서열에 해당하는 올리고뉴클레오티드에 핵염기들을 혼입하기 위해 서열분석 장치를 사용하여 한 번 이상의 교정 사이클을 수행하는 것을 포함한다. 일부 경우에서, 한 번 이상의 교정 사이클을 수행하는 것은 적어도 4번의 교정 서열분석 사이클을 수행하는 것을 포함한다.
위에서 제안된 바와 같이, 특정 실시예에서, 한 번 이상의 교정 사이클을 수행하는 것은 한 가지 핵염기 유형 또는 두 가지 핵염기 유형의 핵염기들을 교정 서열 세트에 해당하는 성장하는 올리고뉴클레오티드 세트의 교정 서열 위치에 혼입하는 것을 포함한다. 또한, 일부 경우에서, 한 번 이상의 교정 사이클을 수행하는 것은 두 가지 핵염기 유형의 비례 분포, 세 가지 핵염기 유형의 비례 분포, 또는 네 가지 핵염기 유형의 비례 분포를 갖는 핵염기들을 교정 서열 세트에 해당하는 성장하는 올리고뉴클레오티드 세트의 교정 서열 위치에 혼입하는 것을 포함한다.
위에서 추가로 제안된 바와 같이, 하나 이상의 실시예에서, 한 번 이상의 교정 사이클을 수행하는 것은 교정 서열 세트에 대한 핵염기 호출을 결정하지 않고 교정 서열 세트에 해당하는 성장하는 올리고뉴클레오티드 세트에 핵염기들을 혼입하는 것을 포함한다. 또한, 특정 구현예에서, 한 번 이상의 교정 사이클을 수행하는 것은 샘플 라이브러리 단편 내의 샘플 유전체 서열에 대한 핵염기 호출을 결정하기 위해 서열분석 장치를 사용하여 유전체 서열분석 사이클을 수행하기 전 또는 후에 한 번 이상의 교정 사이클을 수행하는 것을 포함한다.
도 9에 도시된 바와 같이, 동작들(900)에는 서열분석 장치에 해당하는 서열분석 매개변수를 교정 사이클에 기반하여 결정하는 동작 906이 포함된다. 특히, 특정 구현예에서, 동작 906은 서열분석 장치에 해당하는 서열분석 매개변수를 한 번 이상의 교정 사이클 및 교정 서열에 기반하여 결정하는 것을 포함한다. 위에서 제안된 바와 같이, 일부 실시예에서, 서열분석 장치에 해당하는 서열분석 매개변수를 결정하는 것은 한 번 이상의 교정 사이클 동안 또는 후에 서열분석 장치로부터 서열분석 매개변수를 검출하는 것을 포함한다.
또한, 일부 경우에서, 초기 서열분석 매개변수 또는 서열분석 매개변수를 결정하는 단계는 등화기 계수, 합성곱 커널 계수, 강도 값에 대한 핵염기 중심, 특정 핵염기 유형에 대한 강도 값 경계, 핵염기별 배경 강도 값, 강도 정규화 계수, 가우스 공분산 행렬, 가우스 평균 매개변수, 가우스 시드 매개변수, 완전 기능적 뉴클레오티드(fFN) 특정 뉴클레오티드 위치 매개변수, 비선형 광학 왜곡 매개변수, 구조화 조명 현미경(SIM) 매개변수, 클러스터당 정규화 매개변수, 채널별 정규화 매개변수, 클러스터별 신호 정규화 매개변수, 색상 채널 간 크로스토크 매개변수, 또는 폴리콜로날러티 매개변수 중 하나 이상을 결정하는 것을 포함한다.
특정 구현예에서, 동작들(900)에는 동작 902 내지 동작 906 외에도, 한 번 이상의 교정 사이클을 수행하여 교정 서열에 해당하는 올리고뉴클레오티드의 혼입된 핵염기들과 연관된 초기 서열분석 매개변수들을 결정하는 것; 및 초기 서열분석 매개변수들에 기반하여 서열분석 매개변수를 추정하여 서열분석 장치에 해당하는 서열분석 매개변수를 결정하는 것이 더 포함된다.
위에서 추가로 제안된 바와 같이, 특정 경우에서, 동작들(900)에는, 서열분석 장치에 해당하는 초기 서열분석 매개변수와, 하나 이상의 교정 서열에 해당하는 성장하는 올리고뉴클레오티드 세트에 혼입된 주어진 핵염기에 대한 핵염기 호출을 결정하기 위해 교정 사이클을 수행함으로써 한 번 이상의 교정 사이클을 수행하는 것; 및 성장하는 올리고뉴클레오티드 세트에 혼입된 주어진 핵염기에 대한 핵염기 호출과 하나 이상의 교정 서열에 대한 기지의 상보적 핵염기 간의 비교에서 염기 호출 차이를 결정함으로써, 그리고 염기 호출 차이에 기반하여 서열분석 장치에 해당하는 초기 서열분석 매개변수를 조정함으로써, 서열분석 장치에 해당하는 서열분석 매개변수를 결정하는 것이 더 포함된다.
일부 실시예에서, 위에 설명된 동작들(900) 외에 또는 그에 대한 대안으로, 동작들(900)에는, 샘플 유전체 서열에 대한 핵염기 호출을 결정하기 위해 유전체 서열분석 사이클을 수행하기 전에 인덱싱 서열에 대한 핵염기 호출을 결정하기 위해 인덱싱 사이클을 수행함으로써, 또는 인덱싱 서열에 대한 핵염기 호출을 결정하기 위해 인덱싱 사이클을 수행하기 전에 샘플 유전체 서열에 대한 핵염기 호출을 결정하기 위해 유전체 서열분석 사이클을 수행함으로써, 한 번 이상의 교정 사이클을 수행하는 것이 포함된다.
이제 도 10을 참조하면, 이 도면은 본 개시내용의 하나 이상의 실시예에 따른 것으로, 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하고 교정 서열에 기반하여 서열분석 장치에 해당하는 하나 이상의 서열분석 매개변수를 결정하는 일련의 동작들(1000)의 흐름도를 예시한다. 도 10은 일 실시예에 따른 동작들을 예시하지만, 대안적인 실시예는 도 10에 도시된 동작들 중 임의의 것을 생략, 추가, 재정렬, 및/또는 수정할 수 있다. 도 10의 동작들은 방법의 일부로서 수행될 수 있다. 대안적으로, 비일시적 컴퓨터 판독 가능 저장 매체는, 하나 이상의 프로세서에 의해 실행될 때 컴퓨팅 장치 또는 시스템으로 하여금 도 10에 도시된 동작들을 수행하게 하는 명령어를 포함할 수 있다. 또 다른 실시예에서, 시스템은 적어도 하나의 프로세서와, 하나 이상의 프로세서에 의해 실행될 때 해당 시스템으로 하여금 도 10의 동작들을 수행하게 하는 명령어를 포함하는 비일시적 컴퓨터 판독 가능 매체를 포함한다.
도 10에 도시된 바와 같이, 동작들(1000)에는 교정 서열을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 동작 1002가 포함된다. 특히, 일부 실시예에서, 동작 1002에는 교정 핵염기 및 교정 핵염기와 연관된 샘플 라이브러리 단편을 포함하는 뉴클레오티드-샘플 슬라이드를 수신하는 것이 포함된다. 위에서 언급된 바와 같이, 특정 경우에서, 교정 핵염기들 중의 교정 핵염기는 샘플 라이브러리 단편들의 일부이거나, 뉴클레오티드-샘플 슬라이드의 표면에 부착된 표면 결합 올리고뉴클레오티드들의 일부이다.
일부 경우에서, 교정 핵염기는 상이한 핵염기 유형들의 비례 분포를 포함한다. 관련하여, 특정 실시예에서, 제1 샘플 라이브러리 단편 세트는 제1 핵염기 유형의 제1 교정 핵염기를 포함하고, 제2 샘플 라이브러리 단편 세트는 제2 핵염기 유형의 제2 교정 핵염기를 포함한다.
도 10에 추가로 도시된 바와 같이, 동작들(1000)에는 서열분석 장치와 교정 서열을 사용하여 교정 사이클을 수행하는 동작 1004가 포함된다. 특히, 일부 실시예에서, 동작 1004는 교정 핵염기 및 관련 샘플 라이브러리 단편에 해당하는 올리고뉴클레오티드에 핵염기들을 혼입하기 위해 서열분석 장치를 사용하여 한 번 이상의 교정 사이클을 수행하는 것을 포함한다. 추가적으로 또는 대안적으로, 한 번 이상의 교정 사이클을 수행하는 것은 혼입된 핵염기들에 대한 핵염기 호출을 결정하는 것을 포함하지 않는다.
위에서 제안된 바와 같이, 특정 실시예에서, 한 번 이상의 교정 사이클을 수행하는 단계는 샘플 라이브러리 단편 내의 샘플 유전체 서열에 대한 핵염기 호출을 결정하기 위해 서열분석 장치를 사용하여 유전체 서열분석 사이클을 수행하기 전 또는 후에 한 번 이상의 교정 사이클을 수행하는 것을 포함한다.
도 10에 도시된 바와 같이, 동작들(1000)에는 서열분석 장치에 해당하는 서열분석 매개변수를 교정 사이클에 기반하여 결정하는 동작 1006이 포함된다. 특히, 특정 구현예에서, 동작 1006은 서열분석 장치에 해당하는 서열분석 매개변수를 한 번 이상의 교정 사이클 및 교정 핵염기에 기반하여 결정하는 것을 포함한다.
또한, 일부 경우에서, 서열분석 장치에 해당하는 서열분석 매개변수를 결정하는 단계는 등화기 계수, 합성곱 커널 계수, 강도 값에 대한 핵염기 중심, 특정 핵염기 유형에 대한 강도 값 경계, 핵염기별 배경 강도 값, 강도 정규화 계수, 가우스 공분산 행렬, 가우스 평균 매개변수, 가우스 시드 매개변수, 완전 기능적 뉴클레오티드(fFN) 특정 뉴클레오티드 위치 매개변수, 비선형 광학 왜곡 매개변수, 구조화 조명 현미경(SIM) 매개변수, 특정 채널에 대한 클러스터당 정규화 매개변수, 채널별 정규화 매개변수, 클러스터별 신호 정규화 매개변수, 색상 채널 간 크로스토크 매개변수, 또는 폴리콜로날러티 매개변수 중 하나 이상을 결정하는 것을 포함한다.
본원에 기재된 방법은 다양한 핵산 서열분석 기술과 함께 사용될 수 있다. 특히 적용 가능한 기술은 상대적인 위치가 변경되지 않도록 핵산이 하나의 어레이의 고정된 위치에 부착되고, 그 어레이가 반복적으로 영상화되는 기술이다. 예를 들어, 하나의 뉴클레오티드 염기 유형을 다른 것과 식별하는 데 사용되는 상이한 라벨과 일치하는 서로 다른 색상 채널에서 이미지가 얻어지는 실시예가 특히 적용 가능하다. 일부 실시예에서, 표적 핵산(즉, 핵산 중합체)의 뉴클레오티드 서열을 결정하는 방법은 자동화 방법일 수 있다. 바람직한 실시예는 합성에 의한 서열분석("SBS") 기술을 포함한다.
SBS 기술은 일반적으로 주형 가닥에 대한 뉴클레오티드의 반복적 추가를 통한 신생 핵산 가닥의 효소적 연장을 수반한다. 전통적인 SBS 방법에서, 단일 뉴클레오티드 단량체가 각각의 전달에서 중합효소의 존재 하에 표적 뉴클레오티드에 제공될 수 있다. 그러나, 본원에 기재된 방법에 있어서는, 하나 초과의 유형의 뉴클레오티드 단량체가 전달에서 중합효소의 존재 하에 표적 핵산에 제공될 수 있다.
SBS는 종결자(terminator) 모이어티(moiety)를 갖는 뉴클레오티드 단량체 또는 임의의 종결자 모이어티가 없는 뉴클레오티드 단량체를 활용할 수 있다. 종결자가 없는 뉴클레오티드 단량체를 활용하는 방법은, 예를 들어, 하기에 더욱 상세히 설명되는 바와 같이, γ-포스페이트 라벨링된 뉴클레오티드를 사용하는 서열분석 및 파이로서열분석(pyrosequencing)을 포함한다. 종결자가 없는 뉴클레오티드 단량체를 사용하는 방법에서, 각 사이클에 추가되는 뉴클레오티드의 수는 일반적으로 가변적이며, 주형 서열 및 뉴클레오티드 전달 방식에 따라 다르다. 종결자 모이어티를 갖는 뉴클레오티드 단량체를 활용하는 SBS 기술에서, 종결자는 디데옥시뉴클레오티드를 활용하는 전통적인 Sanger 서열분석의 경우와 같이, 사용된 서열분석 조건 하에서 실제로 비가역적일 수 있거나, 종결자는 Solexa(현재, Illumina, Inc.)에 의해 개발된 서열분석 방법의 경우와 같이 가역적일 수 있다.
SBS 기술은 라벨 모이어티를 갖는 뉴클레오티드 단량체 또는 라벨 모이어티가 없는 것을 활용할 수 있다. 따라서, 혼입 이벤트는 라벨의 형광과 같은 라벨의 특성; 분자량 또는 전하와 같은 뉴클레오티드 단량체의 특성; 파이로포스페이트의 방출과 같은 뉴클레오티드 혼입의 부산물; 등에 기초하여 검출될 수 있다. 2종 이상의 상이한 뉴클레오티드가 서열분석 시약 중에 존재하는 실시예에서, 상이한 뉴클레오티드는 서로 구별 가능할 수 있거나, 이와 달리, 2개 이상의 상이한 라벨은 사용 중인 검출 기술 하에서는 구별 가능하지 않을 수 있다. 예를 들어, 서열분석 시약에 존재하는 상이한 뉴클레오티드는 상이한 라벨을 가질 수 있으며, Solexa(현재 Illumina, Inc.)에서 개발한 서열분석 방법에 의해 예시된 바와 같이 적절한 광학 장치를 사용하여 구별될 수 있다.
바람직한 실시예는 파이로서열분석 기술을 포함한다. 파이로서열분석은 특정 뉴클레오티드가 신생 가닥에 혼입될 때 무기 파이로포스페이트(PPi)의 방출을 검출한다(문헌[Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M.and Nyren, P.(1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9]; 문헌[Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11]; 문헌[Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363]; 미국 특허 제6,210,891호; 미국 특허 제6,258,568호 및 미국 특허 제6,274,320호, 이들의 개시내용 전문이 본원에 참조로 포함됨). 파이로서열분석에서, 방출된 PPi는 ATP 설퍼릴라제(sulfurylase)에 의해 즉시 아데노신 삼인산(ATP: adenosine triphosphate)으로 전환되어(converted) 검출될 수 있으며, 생성된 ATP의 수준은 루시퍼라제-생성 광자를 통해 검출된다. 서열분석될 핵산은 어레이에서의 특징부에 부착될 수 있고, 어레이의 특징에서 뉴클레오티드의 혼입으로 인해 생성되는 화학발광 신호를 캡처하기 위해 어레이가 영상화될 수 있다. 어레이를 특정 뉴클레오티드 유형(예를 들어, A, T, C 또는 G)으로 처리한 후 이미지를 얻을 수 있다. 각 뉴클레오티드 유형을 추가한 후 얻어진 이미지는 어레이의 어떤 특징부가 검출되는지에 따라 다르다. 이미지의 이러한 차이는 어레이에 있는 특징부의 상이한 서열 내용을 반영한다. 그러나, 각 특징부의 상대적 위치는 이미지에서 변경되지 않은 상태로 유지된다. 이미지는 본원에 설명된 방법을 사용하여 저장, 처리, 및 분석될 수 있다. 예를 들어, 각각의 상이한 뉴클레오티드 유형으로 어레이를 처리한 후 얻어진 이미지는 가역적 종결자 기반 서열분석 방법의 경우에는 서로 다른 검출 채널들에서 얻은 이미지에 대해 본원에 예시된 것과 동일한 방식으로 처리될 수 있다.
SBS의 다른 예시적인 유형에서, 사이클 서열분석은, 예를 들어, 개시내용이 본원에 참조로 포함되는 국제공개 WO 04/018497호 및 미국 특허 제7,057,026호에 기재된 바와 같은, 절단 가능한 또는 광표백성 염료 라벨을 포함하는 가역적 종결자 뉴클레오티드의 단계별 부가에 의해 달성된다. 이러한 접근법은 Solexa(현재 Illumina Inc.)에 의해 상업화되고 있으며, 또한 국제공개 WO 91/06678호 및 WO 07/123,744호에 기재되어 있으며, 이들 각각은 본원에 참조로 포함된다. 종결이 역전될 수 있고 형광 라벨이 절단되는 형광 라벨링된 종결자의 가용성은 효율적인 순환 가역 종결(CRT: cyclic reversible termination) 서열분석을 용이하게 한다. 중합효소도 또한 이러한 변형된 뉴클레오티드를 효율적으로 혼입시키고 신장시키도록 공동 조작될 수 있다.
바람직하게는 가역적 종결자 기반 서열분석 실시예에서, 라벨은 SBS 반응 조건 하에서 신장(extension)을 실질적으로 저해하지 않는다. 그러나, 검출 라벨은 예를 들어 절단 또는 분해에 의해 제거될 수 있다. 배열된 핵산 특징부에 라벨이 혼입된 후에 이미지가 캡처될 수 있다. 특정 실시예에서, 각각의 사이클은 어레이에 네 가지 상이한 뉴클레오티드 유형을 동시에 전달하는 것을 수반하고, 각각의 뉴클레오티드 유형은 스펙트럼적으로 구별되는 라벨을 갖는다. 그런 다음 4개의 이미지를 얻을 수 있고, 그 이미지 각각은 4개의 상이한 라벨 중 하나에 대해 선택적인 검출 채널을 사용한다. 대안적으로, 상이한 뉴클레오티드 유형이 순차적으로 추가될 수 있으며 각 추가 단계 사이에 어레이의 이미지가 얻어질 수 있다. 이러한 실시예에서, 각 이미지는 특정 유형의 뉴클레오티드가 혼입된 핵산 특징부를 나타낼 것이다. 각 특징부의 서열 내용이 상이하기 때문에 상이한 이미지에 상이한 특징부가 있거나 혹은 없다. 그러나 특징부의 상대적 위치는 이미지에서 변경되지 않은 상태로 유지된다. 이러한 가역적 종결자-SBS 방법으로부터 얻어진 이미지는 본원에 기재된 바와 같이 저장, 처리, 및 분석될 수 있다. 이미지 캡처 단계 후, 라벨은 제거될 수 있으며, 후속 뉴클레오티드 추가 및 검출 사이클을 위해 가역적 종결자 모이어티가 제거될 수 있다. 특정 사이클에서 검출된 후 후속 사이클 이전에 라벨이 제거되면 배경 신호와 사이클 사이의 크로스토크(crosstalk)를 줄이는 이점을 제공할 수 있다. 유용한 라벨 및 제거 방법의 예가 하기에 기재된다.
특정 실시예에서, 뉴클레오티드 단량체의 일부 또는 전부는 가역적 종결자를 포함할 수 있다. 이러한 실시예에서, 가역적 종결인자/절단 가능한 플루오르는 3' 에스테르 결합을 통해 리보스 모이어티에 연결된 플루오르를 포함할 수 있다(문헌[Metzker, Genome Res. 15:1767-1776 (2005)], 이는 본원에 참조로 포함됨). 다른 접근법은 형광 라벨의 절단으로부터 종결자 화학물질을 분리하였다(문헌[Ruparel 외, Proc Natl Acad Sci USA 102: 5932-7 (2005)], 이는 전체 내용이 본원에 참조로 포함됨). Ruparel 등은 연장을 차단하기 위해 작은 3' 알릴 그룹(allyl group)을 사용하지만 팔라듐 촉매로 짧은 처리로 쉽게 차단이 해제될 수 있는 가역적 종결자의 개발을 설명하였다. 형광단은 장파장 UV 광에 30초 노출되면 쉽게 절단될 수 있는 광절단 가능한 링커를 통해 염기에 부착되었다. 따라서, 디설파이드 환원 또는 광절단이 절단 가능한 링커로서 사용될 수 있다. 가역적 종결에 대한 다른 접근법은 dNTP에 부피가 큰 염료를 배치한 후 발생하는 자연 종결을 사용하는 것이다. dNTP에 하전된 부피가 큰 염료의 존재는 입체 및/또는 정전기 장애를 통해 효과적인 종결자로서 작용할 수 있다. 하나의 혼입 이벤트가 있으면 염료가 제거되지 않는 한 추가 혼입이 방지된다. 염료의 절단은 플루오르를 제거하고 효과적으로 종결을 역전시킨다. 변형된 뉴클레오티드의 예는 또한 미국 특허 제7,427,673호 및 미국 특허 제7,057,026호에 기재되어 있으며, 이의 개시내용은 그 전체가 본원에 참조로 포함된다.
본원에서 설명된 방법 및 시스템과 함께 활용될 수 있는 추가의 예시적인 SBS 시스템 및 방법은 미국 특허 출원 공개 제2007/0166705호, 미국 특허 출원 공개 제2006/0188901호, 미국 특허 제7,057,026호, 미국 특허 출원 공개 제2006/0240439호, 미국 특허 출원 공개 제2006/0281109호, PCT 국제공개 WO 05/065814호, 미국 특허 출원 공개 제2005/0100900호, PCT 국제공개 WO 06/064199호, PCT 국제공개 WO 07/010,251호, 미국 특허 출원 공개 제2012/0270305호 및 미국 특허 출원 공개 제2013/0260372호에 기술되어 있으며, 이들의 개시내용은 그 전체가 본원에 참조로 포함된다.
일부 실시예는 4개 미만의 상이한 라벨을 사용하여 4개의 상이한 뉴클레오티드의 검출을 활용할 수 있다. 예를 들어, SBS는 미국 특허 출원 공개 제2013/0079232호에 포함된 자료에 기술된 방법 및 시스템을 활용하여 수행될 수 있다. 첫 번째 예로서, 한 쌍의 뉴클레오티드 유형은 동일한 파장에서 검출될 수 있지만, 쌍의 한 구성원이 다른 구성원과 비교하여 강도 차이를 기준으로 하여 구별되거나, 쌍의 다른 구성원에 대해 검출된 신호와 비교하여 명백한 신호가 나타나거나 사라지게 하는 쌍 중 한 구성원의 변화(예컨대 화학적 변형, 광화학적 변형 또는 물리적 변형을 통해)를 기준으로 구별된다. 두 번째 예로서, 네 가지 상이한 뉴클레오티드 유형 중 세 가지가 특정 조건 하에서 검출될 수 있는 반면, 네 번째 뉴클레오티드 유형은 이러한 조건 하에서 검출가능한 라벨이 없거나, 이러한 조건 하에서 최소한으로 검출된다(예컨대, 배경 형광으로 인한 최소 검출 등). 핵산으로의 처음 세 가지 뉴클레오티드 유형의 혼입은 그들 각자의 신호의 존재에 기초하여 결정될 수 있고 핵산으로의 네 번째 뉴클레오티드 유형의 혼입은 임의의 신호의 부재 또는 최소 검출에 기초하여 결정될 수 있다. 세 번째 예로서, 하나의 뉴클레오티드 유형은 두 개의 상이한 채널에서 검출되는 라벨(들)을 포함할 수 있는 반면, 다른 뉴클레오티드 유형은 하나 이상의 채널에서 검출되지 않는다. 전술한 3개의 예시적인 구성은 상호 배타적인 것으로 간주되지 않으며, 다양한 조합으로 사용될 수 있다. 모든 3개의 예를 조합한 예시적인 실시예는 제1 채널에서 검출되는 제1 뉴클레오티드 유형(예를 들어, 제1 여기 파장에 의해 여기되는 경우 제1 채널에서 검출되는 라벨을 갖는 dATP), 제2 채널에서 검출되는 제2 뉴클레오티드 유형(예를 들어, 제2 여기 파장에 의해 여기되는 경우 제2 채널에서 검출되는 라벨을 갖는 dCTP), 제1 채널 및 제2 채널 둘 다에서 검출되는 제3 뉴클레오티드 유형(예를 들어, 제1 여기 파장 및/또는 제2 여기 파장에 의해 여기되는 경우 두 채널 모두에서 검출되는 적어도 하나의 라벨을 갖는 dTTP) 및 어느 하나의 채널에서도 검출되지 않거나 최소한으로 검출되는 라벨이 결여된 제4 뉴클레오티드 유형(예를 들어, 라벨을 갖지 않는 dGTP)을 사용하는 형광 기반 SBS 방법이다.
또한, 미국 특허 출원 공개 제2013/0079232호에 포함된 자료에 기재된 바와 같이, 단일 채널을 사용하여 서열분석 데이터가 얻어질 수 있다. 이러한 소위 1-염료(one-dye) 서열분석 접근법에서, 첫 번째 뉴클레오티드 유형에 라벨링되어 있지만 첫 번째 이미지가 생성된 후 라벨이 제거되고, 두 번째 뉴클레오티드 유형은 첫 번째 이미지가 생성된 후에만 라벨링된다. 세 번째 뉴클레오티드 유형은 첫 번째 이미지와 두 번째 이미지 모두에서 라벨을 유지하고, 네 번째 뉴클레오티드 유형은 두 이미지 모두에서 라벨링되지 않은 상태로 유지된다.
일부 실시예는 결찰 기술에 의한 서열분석을 활용할 수 있다. 이러한 기술은 DNA 리가제를 활용하여 올리고뉴클레오티드를 혼입시키고 이러한 올리고뉴클레오티드의 혼입을 식별한다. 올리고뉴클레오티드는 전형적으로 올리고뉴클레오티드가 혼성화하는 서열에서 특정 뉴클레오티드의 동일성과 상관관계가 있는 상이한 라벨을 갖는다. 다른 SBS 방법과 마찬가지로, 라벨링된 서열분석 시약으로 핵산 특징부 어레이를 처리한 후 이미지를 얻을 수 있다. 각 이미지는 특정 유형의 라벨이 혼입된 핵산 특징부를 나타낸다. 각 특징부의 서열 내용이 다르기 때문에 상이한 특징부가 상이한 이미지에 존재하거나 존재하지 않지만, 특징부의 상대적 위치는 이미지에서 변경되지 않은 채로 유지된다. 결찰 기반(ligation-based) 서열분석 방법으로부터 얻어진 이미지는 본원에 기재된 바와 같이 저장, 처리, 및 분석될 수 있다. 본원에 기재된 방법 및 시스템과 함께 활용될 수 있는 예시적인 SBS 시스템 및 방법은 미국 특허 제6,969,488호, 제6,172,218호 및 제6,306,597호에 기술되어 있으며, 이들의 개시내용은 그 전체가 본원에 참조로 포함된다.
일부 실시예는 나노기공 서열분석을 활용할 수 있다(문헌[Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer, D. 및 D. Branton, "Characterization of nucleic acids by nanopore analysis". Acc. Chem. Res. 35:817-825 (2002)]; 문헌[Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003)], 이들의 개시내용은 전체적으로 본원에 참조로 포함됨). 이러한 실시예에서, 표적 핵산은 나노기공을 통과한다. 나노기공은 α-헤몰리신과 같은 합성 기공 또는 생물학적 막 단백질일 수 있다. 표적 핵산이 나노기공을 통과할 때, 각각의 염기 쌍은 나노기공의 전기 전도도의 변동을 측정함으로써 식별될 수 있다. (미국 특허 제7,001,792호; 문헌[Soni, G.V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007)]; 문헌[Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007)]; 문헌[Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008)], 이들의 개시내용은 전체적으로 본원에 참조로 포함됨). 나노기공 서열분석으로부터 얻어진 데이터는 본원에 기재된 바와 같이 저장, 처리, 및 분석될 수 있다. 특히, 데이터는 본원에 언급된 광학 이미지 및 다른 이미지의 예시적인 처리에 따라 이미지로서 처리될 수 있다.
일부 실시예는 DNA 중합효소 활성의 실시간 모니터링을 수반하는 방법을 활용할 수 있다. 뉴클레오티드 혼입은, 예를 들어 미국 특허 제7,329,492호 및 제7,211,414호(이들 각각은 본원에 참조로 포함됨)에 기재된 바와 같이 형광단 보유 폴리머라제와 γ-포스페이트 라벨링된 뉴클레오티드 사이의 형광 공명 에너지 전달(FRET) 상호작용을 통해 검출될 수 있거나, 뉴클레오티드 혼입은, 예를 들어 미국 특허 제7,315,019호(이는 본원에 참조로 포함됨)에 기재된 바와 같은 제로-모드 도파관으로 그리고, 예를 들어 미국 특허 제7,405,281호 및 미국 특허 공개 제2008/0108082호(이들 각각은 본원에 참조로 포함됨)에 기재된 바와 같은 형광 뉴클레오티드 유사체 및 조작된 폴리머라제를 사용하여 검출될 수 있다. 조명은 형광 라벨링된 뉴클레오티드의 혼입이 저 백그라운드에서 관찰될 수 있도록 표면 테더링된(surface-tethered) 중합효소 주변의 젭토리터 스케일(zeptoliter-scale)의 부피로 제한될 수 있다(문헌[Levene, M.J. 외 "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003)]; 문헌[Lundquist, P. M. 외 "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008)]; 문헌[Korlach, J. 외 "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)], 이들의 개시내용은 전체적으로 본원에 참조로 포함됨). 이러한 방법으로부터 얻어진 이미지는 본원에 기재된 바와 같이 저장, 처리, 및 분석될 수 있다.
일부 SBS 실시예는 연장 생성물 내로 뉴클레오티드의 혼입 시에 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출에 기반한 서열분석은 Ion Torrent(코네티컷주 길포드 소재, Life Technologies 자회사)로부터 상업적으로 입수 가능한 전기 검출기 및 관련 기술, 또는 미국 특허 출원 공개 제2009/0026082호 A1; 미국 특허 출원 공개 제2009/0127589호 A1; 미국 특허 출원 공개 제2010/0137143호 A1; 또는 미국 특허 출원 공개 제2010/0282617호 A1에 설명된 서열분석 방법 및 시스템을 사용할 수 있으며, 이들 각각은 본원에 참조로 포함된다. 역학적 배제(kinetic exclusion)를 사용하여 표적 핵산을 증폭하기 위한 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 기질에 용이하게 적용될 수 있다. 보다 구체적으로, 본원에 제시된 방법은 양성자를 검출하기 위해 사용되는 앰플리콘의 클론 집단을 제작하는 데 사용될 수 있다.
SBS 방법은 멀티플렉스 포맷으로 유리하게 수행되어 다수의 상이한 표적 핵산이 동시에 조작될 수 있다. 특정 실시예에서, 상이한 표적 핵산이 일반적인 반응 용기에서 또는 특정 기질의 표면에서 처리될 수 있다. 이것은 멀티플렉스 방식으로 서열분석 시약의 전달, 미반응 시약의 제거 및 혼입 이벤트의 검출을 편리하게 해준다. 표면 결합된 표적 핵산을 사용한 실시예에서, 표적 핵산은 어레이 포맷으로 존재할 수 있다. 어레이 포맷에서, 표적 핵산은 통상 공간적으로 구별가능한 방식으로 표면에 결합될 수 있다. 표적 핵산은 직접 공유 결합, 비드 또는 다른 입자에 대한 부착 또는 표면에 부착된 중합효소 또는 다른 분자에 대한 결합에 의해 결합될 수 있다. 어레이는 각각의 부위(특징부라고도 지칭됨)에서 표적 핵산의 싱글 카피(single copy)를 포함할 수 있거나, 동일한 서열을 갖는 멀티 카피(multiple copies)가 각각의 부위(site) 또는 특징부에 존재할 수 있다. 멀티 카피는 아래에 더욱 상세하게 기술된 바와 같은 증폭 방법, 예컨대 브릿지 증폭 또는 에멀젼 PCR에 의해 생성될 수 있다.
본원에 기재된 방법은 예를 들어, 적어도 약 10개의 특징부/cm2, 100개의 특징부/cm2, 500개의 특징부/cm2, 1,000개의 특징부/cm2, 5,000개의 특징부/cm2, 10,000개의 특징부/cm2, 50,000개의 특징부/cm2, 100,000개의 특징부/cm2, 1,000,000개의 특징부/cm2, 5,000,000개의 특징부/cm2 또는 그 이상을 포함하는, 다양한 밀도 중 임의의 밀도의 특징부를 갖는 어레이를 사용할 수 있다.
본원에 제시된 방법의 한 가지 이점은 이들이 병렬로 복수의 표적 핵산의 신속하고 효율적인 검출을 제공한다는 것이다. 따라서, 본 개시내용은 상기에 예시된 것과 같은 당업계에 공지된 기술을 사용하여 핵산을 제조 및 검출할 수 있는 혼입 시스템을 제공한다. 따라서, 본 개시내용의 혼입 시스템은 증폭 시약 및/또는 서열분석 시약을 하나 이상의 고정된 DNA 단편으로 전달할 수 있는 유체 구성요소를 포함할 수 있으며, 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성요소를 포함한다. 유동 셀은 표적 핵산의 검출을 위한 혼입 시스템으로 구성되고/되거나 이에 사용될 수 있다. 예시적인 유동 셀은, 예를 들어 미국 특허 출원 공개 제2010/0111768 A1호 및 미국 특허 출원 제13/273,666호에 기재되어 있으며, 이들 각각은 본원에 참조로 포함된다. 유동 셀에 대한 예시로서, 혼입 시스템의 유체 구성요소 중 하나 이상이 증폭 방법과 검출 방법에 사용될 수 있다. 핵산 서열분석 실시예를 예로 들면, 혼입 시스템의 유체 구성요소 중 하나 이상이 본원에 제시된 증폭 방법과, 위에 예시된 것과 같은 서열분석 방법에서 서열분석 시약의 전달에 사용될 수 있다. 대안적으로, 혼입 시스템은 증폭 방법을 수행하고 검출 방법을 수행하기 위한 별개의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고 또한 핵산의 서열을 결정할 수 있는 혼입 서열분석 시스템의 예는, 제한 없이, MiSeqTM 플랫폼(미국 캘리포니아주 샌디에고 소재의 Illumina, Inc.) 및 본원에 참조로 포함된 미국 특허 출원 제13/273,666호에 기재된 장치를 포함한다.
위에 설명된 서열분석 시스템은 서열분석 장치에 의해 수용된 샘플에 존재하는 핵산 중합체를 서열분석한다. 본원에 정의된 바와 같이, "샘플" 및 이의 파생어는 가장 넓은 의미로 사용되며, 표적을 포함하는 것으로 의심스러운 임의의 시료, 배양물 등을 포함한다. 일부 실시예에서, 샘플은 DNA, RNA, PNA, LNA, 키메라 또는 혼성 형태의 핵산을 포함한다. 샘플은 하나 이상의 핵산을 함유하는 임의의 생물학적, 임상적, 외과적, 농업적, 대기 또는 수생 기반 시료를 포함할 수 있다. 용어는 또한, 유전체 DNA, 신선 동결 또는 포르말린-고정 파라핀 함몰 핵산 시료와 같은 임의의 단리된 핵산 샘플을 포함한다. 또한, 샘플은 단일 개체, 유전적으로 관련된 구성원으로부터의 핵산 샘플의 수집물, 유전적으로 관련되지 않은 구성원으로부터의 핵산 샘플, 종양 샘플 및 정상 조직 샘플과 같은 단일 개체로부터의 (매칭된) 핵산 샘플, 또는 모체 및 모체 대상으로부터 수득된(obtained) 태아 DNA와 같은 2개의 개별 형태의 유전 물질을 함유하는 단일 소스로부터의 샘플, 또는 식물 또는 동물 DNA를 함유하는 샘플 내 오염성 박테리아 DNA의 존재로부터의 것일 수 있다는 것이 구상된다. 일부 실시예에서, 핵산 물질의 소스는, 예를 들어 전형적으로 신생아 스크리닝에 사용되는 바와 같이, 신생아로부터 수득된 핵산을 포함할 수 있다.
핵산 샘플은 유전체 DNA(gDNA)와 같은 고분자량 물질을 포함할 수 있다. 샘플은 FFPE 또는 보관된 DNA 샘플로부터 수득된 핵산 분자와 같은 저분자량 물질을 포함할 수 있다. 다른 실시예에서, 저분자량 물질은 효소적으로 또는 기계적으로 단편화된 DNA를 포함한다. 샘플은 무세포 순환 DNA를 포함할 수 있다. 일부 실시예에서, 샘플은 생검, 종양, 찰과표본(scraping), 면봉, 혈액, 점액, 소변, 혈장, 정액, 모발, 레이저 캡처 마이크로 절개, 수술 절제, 및 다른 임상 또는 실험실 수득 샘플로부터 수득된 핵산 분자를 포함할 수 있다. 일부 실시예에서, 샘플은 역학, 농업, 법의학 또는 병원성 샘플일 수 있다. 일부 실시예에서, 샘플은 인간 또는 포유류 공급원과 같은 동물로부터 수득된 핵산 분자를 포함할 수 있다. 다른 실시예에서, 샘플은 식물, 박테리아, 바이러스 또는 진균과 같은 비포유류 공급원으로부터 수득된 핵산 분자를 포함할 수 있다. 일부 실시예에서, 핵산 분자의 공급원은 보관되거나 멸종된 샘플 또는 종일 수 있다.
또한, 본원에 개시된 방법 및 조성물은 법의학적 샘플로부터의 분절되고/되거나 단편화된 유전체 DNA와 같은 저품질 핵산 분자를 갖는 핵산 샘플을 증폭시키는 데 유용할 수 있다. 일 실시예에서, 법의학 샘플은 범죄 현장에서 수득한 핵산, 실종자 DNA 데이터베이스에서 수득한 핵산, 법의학 수사와 관련된 실험실에서 수득한 핵산을 포함할 수 있거나 법 집행 기관, 한 명 이상의 군 복무 또는 이러한 직원이 확보한 법의학 샘플을 포함할 수 있다. 핵산 샘플은, 예를 들어 구강용 면봉, 종이, 섬유, 또는 타액, 혈액, 또는 다른 체액으로 침지될 수 있는 다른 기질로부터 유래된, 용해물을 함유하는 조질(crude) DNA 또는 정제된 샘플일 수 있다. 이와 같이, 일부 실시예에서, 핵산 샘플은 유전체 DNA와 같은 DNA의 소량의 또는 단편화된 부분을 포함할 수 있다. 일부 실시예에서, 표적 서열은 혈액, 가래, 혈장, 정액, 소변, 및 혈청을 포함하지만 이들에 국한되지 않는 하나 이상의 체액에 존재할 수 있다. 일부 실시예에서, 표적 서열은 모발, 피부, 조직 샘플, 부검 또는 희생자의 유골로부터 수득될 수 있다. 일부 실시예에서, 하나 이상의 표적 서열을 포함하는 핵산은 사망한 동물 또는 인간으로부터 수득될 수 있다. 일부 실시예에서, 표적 서열은 미생물, 식물 또는 곤충학적 DNA와 같은 비-인간 DNA로부터 수득된 핵산을 포함할 수 있다. 일부 실시예에서, 표적 서열 또는 증폭된 표적 서열은 인간 식별 목적으로 지향된다. 일부 실시예에서, 본 개시내용은 일반적으로 법의학적 샘플의 특성을 식별하기 위한 방법에 관한 것이다. 일부 실시예에서, 본 개시내용은 일반적으로 본원에 개시된 하나 이상의 표적 특이적 프라이머 또는 본원에서 개요가 설명된 프라이머 설계 기준을 사용하여 설계된 하나 이상의 표적 특이적 프라이머를 사용하는 인간 식별 방법에 관한 것이다. 한 실시예에서, 적어도 하나의 표적 서열을 함유하는 법의학적 또는 인간 식별 샘플은 본원에 개시된 표적 특이적 프라이머 중 임의의 하나 이상을 사용하여 또는 본원에 개요가 설명된 프라이머 기준을 사용하여 증폭될 수 있다.
교정 서열분석 시스템(106)의 구성요소는 소프트웨어, 하드웨어 또는 둘 다를 포함할 수 있다. 예를 들어, 교정 서열분석 시스템(106)의 구성요소는 컴퓨터 판독 가능 저장 매체에 저장되고 하나 이상의 컴퓨팅 장치(예를 들어, 사용자 클라이언트 장치(108))의 프로세서에 의해 실행 가능한 하나 이상의 명령어를 포함할 수 있다. 하나 이상의 프로세서에 의해 실행될 때, 교정 서열분석 시스템(106)의 컴퓨터 실행 가능 명령어는 컴퓨팅 장치가 본원에 설명된 거품 검출 방법을 수행하게 할 수 있다. 대안적으로, 교정 서열분석 시스템(106)의 구성요소는 특정 기능 또는 기능들의 그룹을 수행하는 특수 목적 처리 장치와 같은 하드웨어를 포함할 수 있다. 추가적으로 또는 대안적으로, 교정 서열분석 시스템(106)의 구성요소는 컴퓨터-실행가능한 명령과 하드웨어의 조합을 포함할 수 있다.
또한, 교정 서열분석 시스템(106)과 관련하여 본원에 설명된 기능을 수행하는 교정 서열분석 시스템(106)의 구성요소는 예를 들어 독립형 애플리케이션의 일부로서, 애플리케이션의 모듈로서, 애플리케이션용 플러그-인으로서, 다른 애플리케이션에 의해 호출될 수 있는 라이브러리 기능 또는 기능들, 및/또는 클라우드 컴퓨팅 모델로서 구현될 수 있다. 따라서, 교정 서열분석 시스템(106)의 구성요소는 개인용 컴퓨팅 장치 또는 모바일 장치에서 독립형 애플리케이션의 일부로서 구현될 수 있다. 추가적으로 또는 대안적으로, 유전체-분류 시스템(106)의 구성요소는 Illumina BaseSpace, Illumina DRAGEN, 또는 Illumina TruSight 소프트웨어를 포함하지만 이들에 국한되지 않는 서열분석 서비스를 제공하는 임의의 애플리케이션에서 구현될 수 있다. "Illumina", "BaseSpace", "DRAGEN" 및 "TruSight"는 미국 및/또는 기타 국가에서 Illumina, Inc.의 등록 상표 또는 상표이다.
본 개시내용의 실시예는 아래에서 더 자세히 논의되는 바와 같이, 예를 들어 하나 이상의 프로세서 및 시스템 메모리와 같은 컴퓨터 하드웨어를 포함하는 특수 목적 또는 범용 컴퓨터를 포함하거나 활용할 수 있다. 본 개시내용의 범위 내의 실시예는 또한 컴퓨터 실행 가능 명령어 및/또는 데이터 구조를 전달하거나 저장하기 위한 물리적 및 기타 컴퓨터 판독 가능 매체를 포함한다. 특히, 본원에 설명된 방법 중 하나 이상은 비일시적 컴퓨터 판독 가능 매체에서 구현되고 하나 이상의 컴퓨팅 장치(예를 들어, 본원에 설명된 미디어 콘텐츠 액세스 장치들 중 임의의 것)에 의해 실행 가능한 명령어로서 적어도 부분적으로 구현될 수 있다. 일반적으로, 프로세서(예를 들어, 마이크로프로세서)는 비일시적 컴퓨터 판독 가능 매체(예를 들어, 메모리 등)로부터 명령어를 수신하고 이들 명령어를 실행함으로써 본원에 설명된 방법 중 하나 이상을 포함하는 하나 이상의 방법을 수행한다.
컴퓨터 판독 가능 매체는 범용 또는 특수 목적 컴퓨터 시스템에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수 있다. 컴퓨터 실행 가능 명령어를 저장하는 컴퓨터 판독 가능 매체는 비일시적 컴퓨터 판독 가능 저장 매체(장치)이다. 컴퓨터 실행 가능 명령어를 전달하는 컴퓨터 판독 가능 매체는 전송 매체이다. 따라서, 제한이 아닌 예시로서, 본 개시내용의 실시예는 적어도 두 가지의 뚜렷이 상이한 종류의 컴퓨터 판독 가능 매체, 즉 비일시적 컴퓨터 판독 가능 저장 매체(장치)와 전송 매체를 포함할 수 있다.
비일시적 컴퓨터 판독 가능 저장 매체(장치)는 RAM, ROM, EEPROM, CD-ROM, 솔리드 스테이트 드라이브(SSD)(예: RAM 기반), 플래시 메모리, 상-변화 메모리(PCM: phase-change memory), 기타 유형의 메모리, 기타 광디스크 저장장치, 자기 디스크 저장장치 또는 기타 자기 저장 장치, 또는 원하는 프로그램 코드 수단을 컴퓨터 실행 가능 명령어나 데이터 구조의 형태로 저장하는 데 사용될 수 있고 범용 또는 특수 목적 컴퓨터에 의해 액세스될 수 있는 임의의 기타 매체를 포함한다.
"네트워크"는 컴퓨터 시스템들 및/또는 모듈들 및/또는 기타 전자 장치들 간에 전자 데이터의 전송을 가능하게 하는 하나 이상의 데이터 링크로서 정의된다. 정보가 네트워크 또는 다른 통신 연결(유선, 무선 또는 유선과 무선의 조합)을 통해 컴퓨터로 전송되거나 제공될 때, 컴퓨터는 그 연결을 전송 매체로서 적절하게 간주한다. 전송 매체는 컴퓨터 실행 가능 명령어나 데이터 구조의 형태로 원하는 프로그램 코드 수단을 전달하는 데 사용될 수 있고 범용 또는 특수 목적 컴퓨터에 의해 액세스될 수 있는 네트워크 및/또는 데이터 링크를 포함할 수 있다. 상기의 조합이 또한 컴퓨터 판독 가능 매체의 범위에 포함되어야 한다.
또한, 다양한 컴퓨터 시스템 구성요소에 도달할 때, 컴퓨터 실행 가능 명령어나 데이터 구조 형태의 프로그램 코드 수단은 전송 매체로부터 비일시적 컴퓨터 판독 가능 저장 매체(장치)로(또는 그 반대로) 자동으로 전송될 수 있다. 예를 들어, 네트워크 또는 데이터 링크를 통해 수신된 컴퓨터 실행 가능 명령어 또는 데이터 구조는 네트워크 인터페이스 모듈(예를 들어, NIC) 내의 RAM에 버퍼링된 다음, 결국 컴퓨터 시스템 RAM 및/또는 컴퓨터 시스템에서 덜 휘발성의 컴퓨터 저장 매체(장치)로 전송될 수 있다. 따라서, 비일시적 컴퓨터 판독 가능 저장 매체(장치)는 전송 매체를 또한(또는 심지어 주로) 활용하는 컴퓨터 시스템 구성요소에 포함될 수 있다는 것이 이해되어야 한다.
컴퓨터 실행 가능 명령어는 예를 들어, 프로세서에서 실행될 때 범용 컴퓨터, 특수 목적 컴퓨터 또는 특수 목적 처리 장치가 특정 기능 또는 기능들의 그룹을 수행하게 하는 명령어 및 데이터를 포함한다. 일부 실시예에서, 컴퓨터 실행 가능 명령어는 범용 컴퓨터에서 실행되어 범용 컴퓨터를 본 개시내용의 요소를 구현하는 특수 목적 컴퓨터로 전환시킨다. 컴퓨터 실행 가능 명령어는 예를 들어 바이너리, 어셈블리 언어와 같은 중간 포맷 명령어, 또는 심지어 소스 코드일 수 있다. 주제가 구조적 특징 및/또는 방법론적 행위와 관련된 언어로 설명되었지만, 첨부된 청구범위에 정의된 주제는 위에서 기술된 특징이나 행위에 반드시 제한되는 것은 아니라는 것이 이해되어야 한다. 오히려, 기술된 특징들 및 동작들은 청구범위를 구현하는 예시적인 형태로 개시된다.
당업자는 본 개시내용이 개인용 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 메시지 프로세서, 휴대용 장치, 다중 프로세서 시스템, 마이크로프로세서 기반 또는 프로그래밍 가능한 가전제품, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 휴대폰, PDA, 태블릿, 호출기, 라우터, 스위치 등을 포함하는 다양한 유형의 컴퓨터 시스템 구성을 갖는 네트워크 컴퓨팅 환경에서 실시될 수 있다는 것을 이해할 것이다. 본 개시내용은 또한 네트워크를 통해 (유선 데이터 링크, 무선 데이터 링크에 의해, 또는 유선과 무선 데이터 링크의 조합에 의해) 연결된 로컬 및 원격 컴퓨터 시스템이 모두 작업을 수행하는 분산 시스템 환경에서 실시될 수 있다. 분산 시스템 환경에서 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 모두에 위치될 수 있다.
본 개시내용의 실시예는 클라우드 컴퓨팅 환경에서도 구현될 수 있다. 본 설명에서 "클라우드 컴퓨팅"은 구성가능한 컴퓨팅 자원의 공유 풀에 대한 주문형 네트워크 액세스를 가능하게 하는 모델로서 정의된다. 예를 들어, 클라우드 컴퓨팅은 구성가능한 컴퓨팅 자원의 공유 풀에 대한 유비쿼터스하고 편리한 주문형 액세스를 제공하기 위해 시장에서 사용될 수 있다. 구성가능한 컴퓨팅 자원의 공유 풀은 가상화를 통해 신속하게 프로비저닝(provisioning)되고, 작은 관리 노력이나 서비스 공급자 상호 작용으로 출시된 다음 그에 따라 확장될 수 있다.
클라우드-컴퓨팅 모델은 예를 들어 주문형 셀프 서비스, 광범위한 네트워크 액세스, 자원 풀링, 신속한 탄력성, 측정된 서비스 등과 같은 다양한 특성으로 구성될 수 있다. 클라우드-컴퓨팅 모델은 또한 예를 들어 SaaS(Software as a Service), PaaS(Platform as a Service), IaaS(Infrastructure as a Service)와 같은 다양한 서비스 모델을 노출할 수 있다. 클라우드-컴퓨팅 모델은 또한 프라이빗 클라우드, 커뮤니티 클라우드, 퍼블릭 클라우드, 하이브리드 클라우드 등과 같은 다양한 배포 모델을 사용하여 배포될 수도 있다. 본 설명과 청구범위에서 "클라우드-컴퓨팅 환경"은 클라우드 컴퓨팅이 사용되는 환경이다.
도 11은 위에서 설명된 방법 중 하나 이상을 수행하도록 구성될 수 있는 컴퓨팅 장치(1100)의 블록도를 예시하는 것이다. 컴퓨팅 장치(1100)와 같은 하나 이상의 컴퓨팅 장치가 호출 재교정 시스템(106) 및 서열분석 시스템(104)을 구현할 수 있다는 것을 이해할 수 있을 것이다. 도 11에 도시된 바와 같이, 컴퓨팅 장치(1100)는 프로세서(1102), 메모리(1104), 저장 장치(1106), I/O 인터페이스(1108) 및 통신 인터페이스(1110)를 포함할 수 있으며, 이는 통신 인프라(1112)를 통해 통신 가능하게 결합될 수 있다. 특정 실시예에서, 컴퓨팅 장치(1100)는 도 11에 도시된 것보다 더 적거나 더 많은 구성요소를 포함할 수 있다. 다음 단락에서는 도 11에 도시된 컴퓨팅 장치(1100)의 구성요소를 더 상세하게 설명한다.
하나 이상의 실시예에서, 프로세서(1102)는 컴퓨터 프로그램을 구성하는 명령어와 같은 명령어를 실행하기 위한 하드웨어를 포함한다. 제한이 아닌 예로서, 워크플로우를 동적으로 수정하기 위한 명령어를 실행하기 위해, 프로세서(1102)는 내부 레지스터, 내부 캐시, 메모리(1104) 또는 저장 장치(1106)로부터 명령어를 검색(또는 페치(fetch))하고, 이를 디코딩하고 실행할 수 있다. 메모리(1104)는 프로세서(들)에 의해 실행하기 위한 데이터, 메타데이터 및 프로그램을 저장하는 데 사용되는 휘발성 또는 비휘발성 메모리일 수 있다. 저장 장치(1106)는 본원에 설명된 방법을 수행하기 위한 데이터 또는 명령어를 저장하기 위한 하드 디스크, 플래시 디스크 드라이브 또는 기타 디지털 저장 장치와 같은 저장장치를 포함한다.
I/O 인터페이스(1108)는 사용자가 컴퓨팅 장치(1100)에 입력을 제공하고, 그로부터 출력을 수신하고, 달리 컴퓨팅 장치(1100)와 데이터를 전송하고 수신할 수 있게 해준다. I/O 인터페이스(1108)는 마우스, 키패드 또는 키보드, 터치 스크린, 카메라, 광학 스캐너, 네트워크 인터페이스, 모뎀, 기타 알려진 I/O 장치 또는 이러한 I/O 인터페이스의 조합을 포함할 수 있다. I/O 인터페이스(1108)는 그래픽 엔진, 디스플레이(예를 들어, 디스플레이 스크린), 하나 이상의 출력 드라이버(예를 들어, 디스플레이 드라이버), 하나 이상의 오디오 스피커 및 하나 이상의 오디오 드라이버를 포함하지만 이들에 국한되지 않는, 사용자에게 출력을 제공하기 위한 하나 이상의 장치를 포함할 수 있다. 특정 실시예에서, I/O 인터페이스(1108)는 사용자에게 제시하기 위해 디스플레이에 그래픽 데이터를 제공하도록 구성된다. 그래픽 데이터는 하나 이상의 그래픽 사용자 인터페이스 및/또는 특정 구현을 제공할 수 있는 임의의 다른 그래픽 콘텐츠를 대표할 수 있다.
통신 인터페이스(1110)는 하드웨어, 소프트웨어, 또는 둘 다를 포함할 수 있다. 어떤 경우에도, 통신 인터페이스(1110)는 컴퓨팅 장치(1100)와 하나 이상의 다른 컴퓨팅 장치 또는 네트워크 사이의 통신(예를 들어 패킷 기반 통신 등)을 위한 하나 이상의 인터페이스를 제공할 수 있다. 제한이 아닌 예로서, 통신 인터페이스(1110)는 이더넷 또는 다른 유선 기반 네트워크와 통신하기 위한 네트워크 인터페이스 제어기(NIC) 또는 네트워크 어댑터, 또는 무선 네트워크와 통신하기 위한 무선 NIC(WNIC) 또는 무선 어댑터, 예컨대 WI-FI를 포함할 수 있다.
추가적으로, 통신 인터페이스(1110)는 다양한 유형의 유선 또는 무선 네트워크와의 통신을 용이하게 할 수 있다. 통신 인터페이스(1110)는 또한 다양한 통신 프로토콜을 사용하여 통신을 용이하게 할 수 있다. 통신 인프라(1112)는 또한 컴퓨팅 장치(1100)의 구성요소를 서로 연결하는 하드웨어, 소프트웨어, 또는 둘 다를 포함할 수 있다. 예를 들어, 통신 인터페이스(1110)는 하나 이상의 네트워크 및/또는 프로토콜을 사용하여 특정 인프라에 의해 연결된 복수의 컴퓨팅 장치가 서로 통신하여 본원에서 설명된 방법의 하나 이상의 양태를 수행 가능하도록 할 수 있다. 예시하자면, 서열분석 방법은 복수의 장치(예를 들어, 클라이언트 장치, 서열분석 장치 및 서버 장치(들))가 서열분석 데이터 및 오류 통지와 같은 정보를 교환하도록 허용할 수 있다.
전술한 명세서에서는 본 개시내용은 그의 구체적인 예시적 실시예를 참조하여 설명되었다. 본 개시내용(들)의 다양한 실시예 및 양태는 본원에 논의된 세부사항을 참조하여 설명되며, 첨부 도면은 다양한 실시예를 나타낸다. 위의 설명과 도면은 본 개시내용을 예시하는 것이고, 본 개시내용을 제한하는 것으로 해석되어서는 안 된다. 본 개시내용의 다양한 실시예의 완전한 이해를 제공하기 위해 다수의 특정 세부사항이 기술된다.
본 개시내용은 그의 사상 또는 본질적인 특성들로부터 벗어남이 없이 다른 특정 형태로 구현될 수 있다. 기술된 실시예는 모든 점에서 단지 제한적이 아닌 예시적인 것으로 고려되어야 한다. 예를 들어, 본원에 설명된 방법은 더 적거나 더 많은 단계/행위로 수행될 수 있거나 단계/행위는 다른 순서로 수행될 수 있다. 또한, 본원에 설명된 단계/행위는 서로 병행하여 또는 동일하거나 유사한 단계/행위의 다른 경우와 병행하여 반복되거나 수행될 수 있다. 따라서, 본 출원의 범위는 전술한 설명보다는 첨부된 청구범위에 의해 표시된다. 청구범위의 등가물의 의미 및 범위 내에 있는 모든 변화는 그 범위 내에 포함되는 것으로 간주된다.

Claims (32)

  1. 시스템으로서,
    적어도 하나의 프로세서; 및
    명령어들을 포함하는 비일시적 컴퓨터 판독 가능 매체를 포함하고, 상기 명령어들은 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금,
    핵염기들의 교정 서열들을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하게 하고;
    상기 교정 서열들에 해당하는 올리고뉴클레오티드들에 핵염기들을 혼입시키기 위해 서열분석 장치를 사용하여 한 번 이상의 교정 사이클들을 수행하게 하고;
    상기 한 번 이상의 교정 사이클들 및 상기 교정 서열들에 기반하여 상기 서열분석 장치에 해당하는 서열분석 매개변수를 결정하게 하는, 시스템.
  2. 제1항에 있어서, 상기 교정 서열들은 상기 뉴클레오티드-샘플 슬라이드에 침착된 샘플 라이브러리 단편들의 일부이거나, 상기 뉴클레오티드-샘플 슬라이드의 표면에 부착된 표면 결합 올리고뉴클레오티드들의 일부인, 시스템.
  3. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 상기 한 번 이상의 교정 사이클들 동안 또는 후에 상기 서열분석 장치로부터 상기 서열분석 매개변수를 검출함으로써 상기 서열분석 장치에 해당하는 상기 서열분석 매개변수를 결정하게 하는 명령어들을 더 포함하는, 시스템.
  4. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금,
    상기 교정 서열들에 해당하는 상기 올리고뉴클레오티드들의 상기 혼입된 핵염기들과 연관된 초기 서열분석 매개변수들을 결정하기 위해 상기 한 번 이상의 교정 사이클들을 수행하게 하고;
    상기 초기 서열분석 매개변수들에 기반하여 상기 서열분석 매개변수를 추정하여 상기 서열분석 장치에 해당하는 상기 서열분석 매개변수를 결정하게 하는 명령어들을 더 포함하는, 시스템.
  5. 제4항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금, 등화기계수들, 합성곱 커널 계수들, 강도 값들에 대한 핵염기 중심들, 특정 핵염기 유형들에 대한 강도 값 경계들, 핵염기별 배경 강도 값들, 강도 정규화 계수들, 가우스 공분산 행렬들, 가우스 평균 매개변수들, 가우스 시드 매개변수들, 완전 기능적 뉴클레오티드(fFN) 특정 뉴클레오티드 위치 매개변수들, 비선형 광학 왜곡 매개변수들, 구조화 조명 현미경(SIM) 매개변수들, 특정 채널에 대한 클러스터당 정규화 매개변수들, 채널별 정규화 매개변수들, 클러스터별 신호 정규화 매개변수들, 색상 채널 간 크로스토크 매개변수들, 또는 폴리콜로날러티 매개변수들 중 하나 이상을 결정함으로써 상기 초기 서열분석 매개변수 또는 상기 서열분석 매개변수를 결정하게 하는 명령어들을 더 포함하는, 시스템.
  6. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금,
    상기 서열분석 장치에 해당하는 초기 서열분석 매개변수와, 하나 이상의 교정 서열들에 해당하는 한 세트의 성장하는 올리고뉴클레오티드들에 혼입된 주어진 핵염기들에 대한 핵염기 호출을 결정하기 위해 교정 사이클을 수행함으로써, 상기 한 번 이상의 교정 사이클들을 수행하게 하고;
    상기 서열분석 장치에 해당하는 상기 서열분석 매개변수를 결정하게 하되,
    상기 한 세트의 성장하는 올리고뉴클레오티드들에 혼입된 상기 주어진 핵염기들에 대한 상기 핵염기 호출과 상기 하나 이상의 교정 서열들에 대한 기지의 상보적 핵염기들 간의 비교에서 염기 호출 차이를 결정함으로써, 그리고
    상기 염기 호출 차이에 기반하여 상기 서열분석 장치에 해당하는 상기 초기 서열분석 매개변수를 조정함으로써, 상기 서열분석 장치에 해당하는 상기 서열분석 매개변수를 결정하게 하는 명령어들을 더 포함하는, 시스템.
  7. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 하나의 핵염기 유형 또는 두 가지 핵염기 유형들의 핵염기들을 한 세트의 교정 서열들에 해당하는 한 세트의 성장하는 올리고뉴클레오티드들의 교정 서열 위치에 혼입함으로써 상기 한 번 이상의 교정 사이클들을 수행하게 하는 명령어들을 더 포함하는, 시스템.
  8. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 두 가지 핵염기 유형들의 비례 분포, 세 가지 핵염기 유형들의 비례 분포, 또는 네 가지 핵염기 유형들의 비례 분포를 갖는 핵염기들을 한 세트의 교정 서열들에 해당하는 한 세트의 성장하는 올리고뉴클레오티드들의 교정 서열 위치에 혼입함으로써 상기 한 번 이상의 교정 사이클들을 수행하게 하는 명령어들을 더 포함하는, 시스템.
  9. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금,
    각 웰 내에 올리고뉴클레오티드들의 각 클러스터를 시딩하기 위한 상기 뉴클레오티드-샘플 슬라이드의 각 웰 내의 상기 교정 서열들;
    상기 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내에 올리고뉴클레오티드들의 각 클러스터를 시딩하기 위한 상기 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내의 상기 교정 서열들; 또는
    상기 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내에 올리고뉴클레오티드들의 클러스터들의 서브세트를 시딩하기 위한 상기 뉴클레오티드-샘플 슬라이드의 웰 서브세트 내의 상기 교정 서열들을 포함하는 상기 뉴클레오티드-샘플 슬라이드를 수용하게 하는 명령어들을 더 포함하는, 시스템.
  10. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금,
    제1 서열분석 매개변수를 교정하기 위한 제1 교정 서열 세트를 포함하는 제1 샘플 라이브러리 단편 세트; 및
    제2 서열분석 매개변수를 교정하기 위한 제2 교정 서열 세트를 포함하는 제2 샘플 라이브러리 단편 세트를 포함하는 상기 뉴클레오티드-샘플 슬라이드를 수용하게 하는 명령어들을 더 포함하는, 시스템.
  11. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 상기 교정 서열 세트에 대한 핵염기 호출들을 결정하지 않고 핵염기들을 한 세트의 교정 서열들에 해당하는 한 세트의 성장하는 올리고뉴클레오티드들에 혼입함으로써 상기 한 번 이상의 교정 사이클들을 수행하게 하는 명령어들을 더 포함하는, 시스템.
  12. 제1항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 상기 샘플 라이브러리 단편들 내 샘플 유전체 서열들에 대한 핵염기 호출들을 결정하기 위해 상기 서열분석 장치를 사용하여 유전체 서열분석 사이클들을 수행하기 전 또는 후에 상기 한 번 이상의 교정 사이클들을 수행하게 하는 명령어들을 더 포함하는, 시스템.
  13. 비일시적 컴퓨터 판독 가능 매체로서, 적어도 하나의 프로세서에 의해 실행될 때 시스템으로 하여금,
    핵염기들의 교정 서열들과, 상기 교정 서열들과 연관된 샘플 라이브러리 단편들을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하게 하고;
    상기 교정 서열들에 해당하는 올리고뉴클레오티드들에 혼입시키기 위해 서열분석 장치를 사용하여 한 번 이상의 교정 사이클들을 수행하게 하고;
    상기 한 번 이상의 교정 사이클들 및 상기 교정 서열들에 기반하여 상기 서열분석 장치에 해당하는 서열분석 매개변수를 결정하게 하는, 시스템.
  14. 제13항에 있어서, 상기 교정 서열들이 상기 샘플 라이브러리 단편들의 일부이거나, 상기 뉴클레오티드-샘플 슬라이드의 표면에 부착된 표면 결합 올리고뉴클레오티드들의 일부인, 비일시적 컴퓨터 판독 가능 매체.
  15. 제13항에 있어서, 상기 교정 서열들은 네 가지 핵염기 유형들의 비례 분포를 갖는 핵염기들의 상이한 서열들을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  16. 제15항에 있어서, 핵염기들의 상기 상이한 서열들은 제1 핵염기 순서에 따른 네 가지 핵염기 유형들을 포함하는 제1 교정 서열과, 제2 핵염기 순서에 따른 상기 네 가지 핵염기 유형들을 포함하는 제2 교정 서열을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  17. 제13항에 있어서, 상기 교정 서열들 각각은, 동일한 핵염기 순서를 따르며 단일 핵염기 서열 내에 네 가지 핵염기 유형들을 갖는 핵염기들의 단일 서열을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  18. 제13항에 있어서, 상기 교정 서열들 각각은 네 가지 핵염기 유형들의 비례 분포를 갖는 핵염기들의 단일 서열을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  19. 제13항에 있어서, 상기 교정 서열들은, 주어진 교정 서열 위치에 제1 핵염기 유형과 제2 핵염기 유형의 분포를 집합적으로 포함하고 후속한 교정 서열 위치에 상기 제1 핵염기 유형과 제3 핵염기 유형의 분포 또는 상기 제3 핵염기 유형과 제4 핵염기 유형의 분포를 집합적으로 포함하는 상이한 핵염기 서열들을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  20. 제13항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 교정 서열을 상기 샘플 라이브러리 단편 내의 비유전체 및/또는 비전사체 서열의 일부 또는 전체로서 포함하는 샘플 라이브러리 단편을 포함하는 상기 뉴클레오티드-샘플 슬라이드를 수용하게 하는 명령어들을 더 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  21. 제13항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 결합 어댑터 서열과 인덱싱 서열 사이, 상기 인덱싱 서열과 판독 프라이밍 서열 사이, 또는 상기 판독 프라이밍 서열과 샘플 유전체 서열 사이에 교정 서열을 포함하는 샘플 라이브러리 단편을 포함하는 상기 뉴클레오티드-샘플 슬라이드를 수용하게 하는 명령어들을 더 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  22. 제21항에 있어서,
    상기 결합 어댑터 서열과 상기 인덱싱 서열 사이의 상기 교정 서열은 P7 결합 어댑터 서열과 i7 인덱싱 서열 사이 또는 P5 결합 어댑터 서열과 i5 인덱싱 서열 사이의 교정 서열을 포함하고;
    상기 인덱싱 서열과 상기 판독 프라이밍 서열 사이의 상기 교정 서열은 상기 i7 인덱싱 서열과 제1 판독 프라이밍 서열 사이 또는 상기 i5 인덱싱 서열과 제2 판독 프라이밍 서열 사이의 교정 서열을 포함하고;
    상기 판독 프라이밍 서열과 상기 샘플 유전체 서열 사이의 상기 교정 서열은 상기 제1 판독 프라이밍 서열과 상기 샘플 유전체 서열 사이 또는 상기 제2 판독 프라이밍 서열과 상기 샘플 유전체 서열 사이의 교정 서열을 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  23. 제13항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 교정 서열을 비무작위 고유 분자 식별자(UMI) 서열의 일부 또는 전체, 고유 이중 인덱스(UDI) 서열의 일부 또는 전체, 인덱싱 서열의 일부 또는 전체, 또는 결합 어댑터 서열의 일부 또는 전체로서 포함하는 샘플 라이브러리 단편을 포함하는 상기 뉴클레오티드-샘플 슬라이드를 수용하게 하는 명령어들을 더 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  24. 제13항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 상기 한 번 이상의 교정 사이클들을 수행하게 하되,
    샘플 유전체 서열들에 대한 핵염기 호출들을 결정하기 위해 유전체 서열분석 사이클들을 수행하기 전에 인덱싱 서열들에 대한 핵염기 호출들을 결정하기 위해 인덱싱 사이클들을 수행함으로써; 또는
    상기 인덱싱 서열들에 대한 핵염기 호출들을 결정하기 위해 상기 인덱싱 사이클들을 수행하기 전에 상기 샘플 유전체 서열들에 대한 핵염기 호출들을 결정하기 위해 상기 유전체 서열분석 사이클들을 수행함으로써, 상기 한 번 이상의 교정 사이클들을 수행하게 하는 명령어들을 더 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  25. 제13항에 있어서, 상기 적어도 하나의 프로세서에 의해 실행될 때 상기 시스템으로 하여금 적어도 네 번의 교정 서열분석 사이클들을 수행함으로써 상기 한 번 이상의 교정 사이클들을 수행하게 하는 명령어들을 더 포함하는, 비일시적 컴퓨터 판독 가능 매체.
  26. 컴퓨터로 구현된 방법으로서,
    교정 핵염기들과, 상기 교정 핵염기들과 연관된 샘플 라이브러리 단편들을 포함하는 뉴클레오티드-샘플 슬라이드를 수용하는 단계;
    상기 교정 핵염기들과 상기 연관된 샘플 라이브러리 단편들에 해당하는 올리고뉴클레오티드들에 핵염기들을 혼입시키기 위해 서열분석 장치를 사용하여 한 번 이상의 교정 사이클들을 수행하는 단계; 및
    상기 한 번 이상의 교정 사이클들 및 상기 교정 핵염기들에 기반하여 상기 서열분석 장치에 해당하는 서열분석 매개변수를 결정하는 단계를 포함하는, 컴퓨터로 구현된 방법.
  27. 제26항에 있어서, 상기 교정 핵염기들은 상이한 핵염기 유형들의 비례 분포를 포함하는, 컴퓨터로 구현된 방법.
  28. 제26항에 있어서, 샘플 라이브러리 단편들의 제1 세트는 제1 핵염기 유형의 제1 교정 핵염기를 포함하고, 샘플 라이브러리 단편들의 제2 세트는 제2 핵염기 유형의 제2 교정 핵염기를 포함하는, 컴퓨터로 구현된 방법.
  29. 제26항에 있어서, 상기 교정 핵염기들의 교정 핵염기가, 상기 샘플 라이브러리 단편들의 일부이거나, 상기 뉴클레오티드-샘플 슬라이드의 표면에 부착된 표면 결합 올리고뉴클레오티드들의 일부인, 컴퓨터로 구현된 방법.
  30. 제26항에 있어서, 상기 한 번 이상의 교정 사이클들을 수행하는 단계는 상기 혼입된 핵염기들에 대한 핵염기 호출들을 결정하는 단계를 포함하지 않는, 컴퓨터로 구현된 방법.
  31. 제26항에 있어서, 상기 한 번 이상의 교정 사이클들을 수행하는 단계는 샘플 라이브러리 단편들 내의 샘플 유전체 서열들에 대한 핵염기 호출들을 결정하기 위해 상기 서열분석 장치를 사용하여 유전체 서열분석 사이클들을 수행하기 전 또는 후에 상기 한 번 이상의 교정 사이클들을 수행하는 단계를 포함하는, 컴퓨터로 구현된 방법.
  32. 제26항에 있어서, 상기 서열분석 장치에 해당하는 상기 서열분석 매개변수를 결정하는 단계는 등화기계수들, 합성곱 커널 계수들, 강도 값들에 대한 핵염기 중심들, 특정 핵염기 유형들에 대한 강도 값 경계들, 핵염기별 배경 강도 값들, 강도 정규화 계수들, 가우스 공분산 행렬들, 가우스 평균 매개변수들, 가우스 시드 매개변수들, 완전 기능적 뉴클레오티드(fFN) 특정 뉴클레오티드 위치 매개변수들, 비선형 광학 왜곡 매개변수들, 구조화 조명 현미경(SIM) 매개변수들, 클러스터당 정규화 매개변수들, 채널별 정규화 매개변수들, 클러스터별 신호 정규화 매개변수들, 색상 채널 간 크로스토크 매개변수들, 또는 폴리콜로날러티 매개변수들 중 하나 이상을 결정하는 단계를 포함하는, 컴퓨터로 구현된 방법.
KR1020247028301A 2022-02-25 2023-02-24 뉴클레오티드 서열분석을 위한 교정 서열 Pending KR20240152324A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202263268547P 2022-02-25 2022-02-25
US63/268,547 2022-02-25
PCT/US2023/063285 WO2023164660A1 (en) 2022-02-25 2023-02-24 Calibration sequences for nucelotide sequencing

Publications (1)

Publication Number Publication Date
KR20240152324A true KR20240152324A (ko) 2024-10-21

Family

ID=85873964

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247028301A Pending KR20240152324A (ko) 2022-02-25 2023-02-24 뉴클레오티드 서열분석을 위한 교정 서열

Country Status (6)

Country Link
US (1) US20230410944A1 (ko)
EP (1) EP4483372A1 (ko)
JP (1) JP2025507713A (ko)
KR (1) KR20240152324A (ko)
CN (1) CN118871994A (ko)
WO (1) WO2023164660A1 (ko)

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
JP2002503954A (ja) 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
WO2002004680A2 (en) 2000-07-07 2002-01-17 Visigen Biotechnologies, Inc. Real-time sequence determination
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP3363809B1 (en) 2002-08-23 2020-04-08 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
US20110059865A1 (en) 2004-01-07 2011-03-10 Mark Edward Brennan Smith Modified Molecular Arrays
US7302146B2 (en) 2004-09-17 2007-11-27 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
EP3722409A1 (en) 2006-03-31 2020-10-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
GB2457851B (en) 2006-12-14 2011-01-05 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale fet arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8407012B2 (en) * 2008-07-03 2013-03-26 Cold Spring Harbor Laboratory Methods and systems of DNA sequencing
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
EP2768972B2 (en) 2011-09-23 2020-07-22 Illumina, Inc. Methods and compositions for nucleic acid sequencing
ES2949570T3 (es) 2012-04-03 2023-09-29 Illumina Inc Cabezal integrado de lectura optoelectrónica y cartucho de fluidos útiles para la secuenciación de ácidos nucleicos
WO2017084998A1 (en) * 2015-11-16 2017-05-26 Qiagen Instruments Ag Calibration probe and method for calibrating an electronic device
US10689684B2 (en) * 2017-02-14 2020-06-23 Microsoft Technology Licensing, Llc Modifications to polynucleotides for sequencing
US11767554B2 (en) * 2018-02-14 2023-09-26 Regents Of The University Of Minnesota Size standards for next-generation sequencing
US11188778B1 (en) 2020-05-05 2021-11-30 Illumina, Inc. Equalization-based image processing and spatial crosstalk attenuator

Also Published As

Publication number Publication date
JP2025507713A (ja) 2025-03-21
WO2023164660A1 (en) 2023-08-31
CN118871994A (zh) 2024-10-29
US20230410944A1 (en) 2023-12-21
EP4483372A1 (en) 2025-01-01

Similar Documents

Publication Publication Date Title
US20240038327A1 (en) Rapid single-cell multiomics processing using an executable file
US20220415442A1 (en) Signal-to-noise-ratio metric for determining nucleotide-base calls and base-call quality
US20220319641A1 (en) Machine-learning model for detecting a bubble within a nucleotide-sample slide for sequencing
JP2024528509A (ja) ヌクレオチドベースコールを再較正するための機械学習モデル
US20230343415A1 (en) Generating cluster-specific-signal corrections for determining nucleotide-base calls
KR20240152324A (ko) 뉴클레오티드 서열분석을 위한 교정 서열
US20240266003A1 (en) Determining and removing inter-cluster light interference
US20250210137A1 (en) Directly determining signal-to-noise-ratio metrics for accelerated convergence in determining nucleotide-base calls and base-call quality
US20250111898A1 (en) Tracking and modifying cluster location on nucleotide-sample slides in real time
US20230313271A1 (en) Machine-learning models for detecting and adjusting values for nucleotide methylation levels
US20250210141A1 (en) Enhanced mapping and alignment of nucleotide reads utilizing an improved haplotype data structure with allele-variant differences
WO2024206848A1 (en) Tandem repeat genotyping
US20240127906A1 (en) Detecting and correcting methylation values from methylation sequencing assays
US20250111899A1 (en) Predicting insert lengths using primary analysis metrics
US20230420080A1 (en) Split-read alignment by intelligently identifying and scoring candidate split groups
WO2023212601A1 (en) Machine-learning models for selecting oligonucleotide probes for array technologies

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20240822

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application