KR20210047364A

KR20210047364A - 밀집 패킹된 분석물층 및 검출 방법

Info

Publication number: KR20210047364A
Application number: KR1020217011510A
Authority: KR
Inventors: 데니스 밸린저; 노르만 번즈; 마노하르 퍼타도; 린다 리우 (니안동); 윈저 오웬즈; 브라이언 스태커
Original assignee: 앱톤 바이오시스템즈, 인코포레이티드
Priority date: 2018-09-19
Filing date: 2019-09-18
Publication date: 2021-04-29
Also published as: US20240320826A1; US11995828B2; US20240005488A1; JP2022501026A; CN113677806A; WO2020061237A1; EP3853382A1; EP3853382A4; US20210334957A1

Abstract

밀집 패킹된 기판으로부터 광학 신호를 검출하고 식별하기 위한 방법 및 시스템이 여기에 개시된다. 이들은 폴리 뉴클레오티드 시퀀싱 애플리케이션의 효율성 및 정확성 향상을 포함하여 광학 시스템의 회절 한계 근처 또는 그 이하의 생체 분자 검출에 대한 광범위한 애플리케이션을 가진다.

Description

밀집 패킹된 분석물층 및 검출 방법

본 출원은 2018년 9월 19일자로 출원된 미국 가특허출원 제62/733,525호의 우선권을 주장하며, 이는 전체가 본 명세서에 참조로 포함된다.

저렴하고 빠른 시퀀싱은 전 세계적으로 의학 및 의료 분야에 혁명을 일으키고 있다. 게놈 가격은 2000년에 최초의 인간 게놈이 시퀀싱 된 이후 급격히 하락하였고, 최근 1,000달러라는 중요한 이정표가 달성되었다. 그러나 대규모 인구 시퀀싱, 질병 스크리닝 및 빠른 검출과 같은 애플리케이션을 가능하게 할 수 있는 저비용 시퀀싱에 대한 수요는 많은 상황이다.

시퀀싱 비용을 책정하기 위한 표준은 90기가베이스로 정의된, 30X 인간 게놈(genome)의 가격이다. 시퀀싱 시스템의 주요 비용 구성 요소는 주로 바이오 칩과 시약을 포함하는 소모품이며, 이차적으로 기기 비용이다.

본 명세서에서는 개선된 이미징 방법 및 개선된 기판 및 조밀한 분석물 층을 가지는 기판을 제조하는 방법에 대한 필요성이 인식된다. 예를 들어, 10달러 30X 게놈에 도달하려면, 칩 단위 면적당 데이터 양을 100배 늘리는 것과 데이터 포인트 당 시약 량을 100배 정도 감소시키는 것 중 적어도 하나가 필요할 수 있다. 따라서, 초-고분해능 이미징 시스템에 의해 이미지화 될 수 있는 고 밀도 데옥시리보핵산(DNA) 패킹이 있는 칩을 제공하는 것이 바람직할 수 있다.

제곱 센티미터 당 천만 분자의 클러스터 밀도를 갖는 1,000 게놈 플랫폼의 예에서, 각 분자는 칩 면적의 평균 10um²를 차지한다. 따라서, 평균 유효 피치는 3,160nm이다. 밀도가 100 배 증가하면 동일한 칩 영역과 시약에 대해 100 배 더 많은 정보를 얻을 수 있어 비용이 100 배 감소 할 수 있다. 100배 더 높은 밀도에서, 신규 피치는 320nm로 요구된다.

따라서, 시퀀싱 비용을 줄이기 위해서는 저-비용 바이오칩 표면에 분포된 표적 DNA 분자의 고밀도 패킹이 필수적이다. 그러나, 시퀀싱 중에 이러한 조밀하게 패킹된 분자에서 생성된 형광 신호는 빛의 회절 한계 미만의 광학 신호를 분해(resolve)할 수 있는 초-고분해능 광학 이미징 시스템으로 분해(resolve)되어야 한다.

또한, 이온 토렌트(Ion Torrent)와 옥스포드 나노포어(Oxford Nanopore)와 같은 회사에서 개발한 전기 기반 시스템과 같은, 광학 신호의 회절 한계에 의해 제한되지 않는 다른 방법이 존재하지만, 기존의 모든 기술 중 가장 낮은 시퀀싱 비용은 높은 처리량의 이미징과 저렴한 소모품의 조합을 통한 광학 기반 시스템에 의해 달성될 수 있다.

저렴하고 빠른 시퀀싱은 전 세계적으로 의학 및 의료 분야에 혁명을 일으키고 있다. 게놈 가격은 2000 년에 최초의 인간 게놈이 시퀀싱 된 이후 급격히 하락하였고, 최근 1,000 달러라는 중요한 이정표가 달성되었다. 그러나 대규모 인구 시퀀싱, 질병 스크리닝 및 빠른 검출과 같은 애플리케이션을 가능하게 할 수 있는 저비용 시퀀싱에 대한 수요는 많은 상황이다. 본 발명은 실질적으로 계약된 기간에서 10달러 게놈을 달성하는 방법 및 시스템을 제공한다. 이 가격대에서는 모든 신생아를 시퀀싱하는 것이 경제적일 수 있으며 심층 시퀀싱 및 단일 세포 분석을 위한 비용 장벽을 제거할 수 있다.

시퀀싱 비용을 책정하기 위한 표준은 90 기가베이스로 정의된, 30X 인간 게놈(genome)의 가격이다. 시퀀싱 시스템의 주요 비용 구성 요소는 주로 바이오 칩과 시약을 포함하는 소모품이며, 이차적으로 기기 비용이다. 따라서, 10달러 30X 게놈에 도달하려면, 칩 단위 면적당 데이터 양을 100배 늘리는 것과 데이터 포인트 당 시약 량을 100배 정도 감소시키는 것 중 적어도 하나가 필요할 수 있다. 따라서, 초-고분해능 이미징 시스템에 의해 이미지화 될 수 있는 고 밀도 데옥시리보핵산(DNA) 패킹이 있는 칩을 제공하는 것이 바람직할 수 있다.

따라서, 시퀀싱 비용을 줄이기 위해서는 저-비용 바이오칩 표면에 분포된 표적 DNA 분자의 고밀도 패킹이 필수적이다. 그러나, 시퀀싱 중에 이러한 조밀하게 패킹된 분자에서 생성된 형광 신호는 빛의 회절 한계 미만의 광학 신호를 분해할 수 있는 초-고분해능 광학 이미징 시스템으로 분해되어야 한다.

본 발명은 핵산 시퀀싱과 같은, 분석물 검출을 위한(예를 들어, 실질적으로 계약된 기간에서 S10게놈을 달성하기 위한) 방법 및 시스템을 제공한다. 본 발명의 방법 및 시스템은 DNA 또는 RNA 분자, 폴리펩티드 및/또는 단백질과 같은 핵산 분자를 확인하기 위해 사용될 수 있다. 본 발명의 방법 및 시스템을 사용하여 달성될 수 있는 가격대에서, 모든 신생아를 시퀀싱하는 것이 경제적일 수 있고 심층 시퀀싱 및 단일 세포 분석을 위한 비용 장벽을 제거할 수 있다.

본 발명의 실시예는 기판의 표면에 고밀도로 배치된 복수의 분석물을 시퀀싱하는 방법을 포함한다. 상기 방법은: 표면을 포함하는 기판을 제공하는 단계로서, 상기 표면은 패턴화되지 않고 복수의 분석물의 분석물 결합 위치 사이의 최소 유효 피치가

미만이 되도록 하는 밀도로 상기 표면에 배치된 복수의 분석물을 포함하고, 상기 NA는 광학 이미징 모듈의 개구 수이고, 상기 표면은 합성에 의한 시퀀싱을 위한 시약을 포함하는, 단계; 상기 복수의 분석물에 결합하는 프로브의 복수의 사이클을 수행하는 단계로서, 상기 복수의 사이클의 사이클은:(i) 상기 복수의 분석물을 복수의 프로브와 접촉시키는 단계로서, 상기 복수의 프로브의 프로브는 검출 가능한 표지를 포함하는, 단계 및(ii) 광학 시스템으로 상기 표면의 필드를 이미징하여 상기 복수의 분석물과 접촉하는 각 프로브로부터의 광학 신호를 검출함으로써 상기 사이클 동안 상기 필드에서 복수의 광학 신호를 검출하는 단계를 포함하는, 단계; 상기 복수의 사이클 중 적어도 2 회로부터의 상기 필드의 이미지로부터 상기 복수의 광학 신호 각각으로부터 피크 위치를 결정하는 단계; 각 광학 신호에 대한 상기 피크 위치를 오버레이하고 광학 신호의 각 클러스터에 광학 분포 모델을 적용하여 상기 표면에서 각각의 검출된 프로브의 상대적 위치를 결정하는 단계; 상기 결정된 상대 위치 및 분해 함수를 사용하여 각 사이클로부터 각 필드 이미지에서 상기 광학 신호를 분해하는 단계; 디콘볼루션된 광학 신호로부터 각 필드 및 각 사이클에 대한 상기 검출 가능한 표지를 식별하는 단계; 및 각 분석물 위치에서 상기 복수의 사이클에 걸쳐 식별된 검출 가능한 표지로부터 상기 기판의 표면에 배치된 분석물을 식별하는 단계를 포함한다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 복수의 분석물은 핵산 분자(DNA 및/또는 RNA), 단백질 및/또는 폴리펩티드일 수 있다. 복수의 분석물은 복수의 분석물의 개별 분석물이 분리될 수 있도록(예를 들어, 광학적으로 분해될 수 있도록) 표면에 인접하게 배치될 수 있다. 복수의 분석물은 복수의 분석물 중 인접한 분석물이 서로 접촉하거나 접촉하지 않도록 표면에 인접하게 배치될 수 있다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물은 반발성(repellant) 또는 유인성(attractive) 물질로 처리된다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함한다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함한다. 일부 실시예에서, 상기 분석물은 DNA 콘카테머(DNA concatemers)이다. 일부 실시예에서, 상기 DNA 콘카테머는 ssDNA 헤어에 혼성화된다. 일부 실시예에서, 상기 분석물은 단백질 또는 펩티드이다. 일부 실시예에서, 상기 프로브는 복수의 가역 종결인자 뉴클레오티드를 포함한다. 일부 실시예에서, 상기 복수의 가역 종결인자 뉴클레오티드는 각각 별개의 검출 가능한 표지를 갖는 적어도 4개의 별개의 뉴클레오티드를 포함한다. 일부 실시예에서, 상기 분해 단계는 상기 결정된 상대적 위치로부터 이웃 폴리뉴클레오티드 사이의 중심 간 거리를 사용하여 상기 이웃 폴리뉴클레오티드로부터 간섭 광학 신호를 제거하는 단계를 포함한다. 일부 실시예에서, 상기 분해 함수는 디콘볼루션을 포함한다. 일부 실시예에서, 상기 분해 함수는 최근접 이웃 변수 회귀를 포함한다. 일부 실시예에서, 상기 폴리 뉴클레오티드는 인접한 폴리 뉴클레오티드에 혼입된 뉴클레오티드로부터 상기 검출 가능한 표지에 의해 방출된 광학 신호 사이에 중첩이 있도록 상기 기판 상에 밀집 패킹되고, 상기 인접한 폴리 뉴클레오티드는 각각 별개의 서열을 포함한다. 일부 실시예에서, 상기 폴리 뉴클레오티드는 제곱 마이크론 당 4개 이상의 분자의 평균 밀도로 상기 표면 상에 고정된다. 일부 실시예에서, 상기 표면의 상기 이미징은 상기 이미지 필드의 축을 따라 300 nm 당 하나 이상의 픽셀의 해상도에서 수행된다. 일부 실시예에서, 광학 이미징 모듈은 250 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다. 일부 실시예에서, 광학 이미징 모듈은 200 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다. 일부 실시예에서, 광학 이미징 모듈은 150 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다. 일부 실시예에서, 광학 이미징 모듈은 100 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다. 일부 실시예에서, 상기 방법은 각각의 사이클로부터의 상기 필드 이미지들 각각으로부터 더 높은 픽셀 밀도를 갖는 오버 샘플링된 이미지를 생성하는 단계를 더 포함한다. 일부 실시예에서, 상기 피크 위치를 오버레이하는 단계는 상기 복수의 사이클로부터 각 폴리 뉴클레오티드에 대한 광학 피크 위치의 클러스터를 생성하기 위해 상기 복수의 사이클 동안 각 필드에서 검출된 상기 광학 신호 피크의 위치를 정렬하는 단계를 포함한다. 일부 실시예에서, 상기 피크 위치를 오버레이하는 단계는 상기 사이클의 서브 세트로부터 각각의 폴리 뉴클레오티드에 대한 광학 피크 위치의 클러스터를 생성하기 위해 상기 사이클의 서브 세트 동안 각 필드에서 검출 된 상기 광학 신호 피크의 위치를 정렬하는 단계를 포함한다. 일부 실시예에서, 상기 광학 분포 모델은 포인트 확산 함수를 포함한다. 일부 실시예에서, 상기 기판 표면에 고정된 상기 분석물의 상대적 위치가 10nm RMS 내에서 결정된다.

본 발명의 다른 실시예는 밀집 패킹된 기판의 표면에 고정된 분석물의 상대적 위치를 정확하게 결정하는 방법을 포함한다. 상기 방법은: 표면을 포함하는 기판을 제공하는 단계로서, 상기 표면은 패턴화되거나 패턴화되지 않고 별개의 위치에서 상기 표면 상에 고정된 복수의 분석물을 포함하는, 단계; 상기 표면상에서 프로브 결합 및 신호 검출의 복수의 사이클을 수행하는 단계로서, 각 사이클은:(i) 상기 분석물을 프로브 세트로부터의 복수의 프로브와 접촉시키는 단계로서, 상기 프로브는 검출 가능한 표지를 포함하고, 상기 프로브 각각은 표적 분석물에 특이 적으로 결합하는, 단계; 및(ii) 광학 시스템으로 상기 표면의 필드를 이미징하여 상기 표면상의 개별 위치에서 상기 분석물에 결합된 개별 프로브로부터의 복수의 광학 신호를 검출하는 단계를 포함하는, 단계; 상기 복수의 사이클 중 적어도 2 회로부터의 상기 필드의 이미지로부터 상기 복수의 광학 신호 각각으로부터 피크 위치를 결정하는 단계; 및 각 광학 신호에 대한 상기 피크 위치를 오버레이하고 광학 신호의 각 클러스터에 광학 분포 모델을 적용하여 상기 표면에서 각각의 검출된 분석물의 상대적 위치를 개선된 정확도로 결정하는 단계를 포함한다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 방법은 상기 결정된 상대 위치 및 분해 함수를 사용하여 각 사이클로부터 각 필드 이미지에서 상기 광학 신호를 분해하는 단계; 및 디콘볼루션된 광학 신호로부터 각 필드 및 각 사이클에 대해 상기 고정된 분석물에 결합된 상기 검출 가능한 표지를 식별하는 단계를 더 포함한다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물은 반발성(repellant) 또는 유인성(attractive) 물질로 처리된다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함한다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함한다. 일부 실시예에서, 상기 분석물은 DNA 콘카테머(DNA concatemers)이다. 일부 실시예에서, 상기 DNA 콘카테머는 ssDNA 헤어에 혼성화된다. 일부 실시예에서, 상기 분석물은 단백질 또는 펩티드이다. 일부 실시예에서, 상기 방법은 각 사이클에서 검출된 각각의 분석물에 대해 상기 검출 가능한 표지 동일성을 사용하여 상기 기판 상의 복수의 분석물을 식별하는 단계를 더 포함한다. 일부 실시예에서, 상기 분해 단계는 이웃하는 분석물의 결정된 상대적 위치로부터 상기 이웃 분석물 사이의 중신 간 거리를 사용하여 상기 이웃 분석물로부터 간섭 광학 신호를 제거하는 단계를 포함한다. 일부 실시예에서, 상기 분해 함수는 기계 학습을 포함한다. 일부 실시예에서, 상기 분해 함수는 최근접 이웃 변수 회귀를 포함한다. 일부 실시예에서, 상기 분석물은 단일 생체 분자이다. 일부 실시예에서, 상기 표면 상에 고정된 상기 분석물은 상기 검출 가능한 표지에 의해 방출되고 광학 시스템에 의해 이미지화되는 광의 회절 한계보다 더 작은 간격으로 평균적으로 이격된다. 일부 실시예에서, 상기 고정된 분석물은 각 분석물과 가장 가까운 인접 분석물 사이에서 500 nm 미만의 평균 중심 간 거리를 가진다. 일부 실시예에서, 상기 피크 위치를 오버레이하는 단계는 상기 복수의 사이클로부터 각 분석물에 대한 광학 피크 위치의 클러스터를 생성하기 위해 상기 복수의 사이클 동안 각 필드에서 검출된 상기 광학 신호 피크의 위치를 정렬하는 단계를 포함한다. 일부 실시예에서, 상기 상대 위치는 10 nm RMS 이내의 정확도로 결정된다. 일부 실시예에서, 상기 방법은 제곱 마이크론 당 약 4 내지 약 25 개의 분석물의 밀도로 표면으로부터의 광학 신호를 분해한다.

본 발명의 또 다른 실시예는 복수의 분석물의 식별하기 위한 시스템을 포함한다. 상기 시스템은: 기판의 표면 상에 고정된 분석물에 결합하는 프로브의 복수 사이클에 걸쳐 상기 기판의 필드로부터 복수의 광학 신호를 이미지화도록 구성된 광학 이미지 장치로서, 상기 표면은 패턴화되지 않은, 광학 이미지 장치; 및 이미지 처리 모듈로서, 상기 이미지 처리 모듈은: 상기 복수의 사이클 중 적어도 2 회로부터의 상기 필드의 이미지로부터 상기 복수의 광학 신호 각각으로부터 피크 위치를 결정하고; 각 광학 신호에 대한 상기 피크 위치를 오버레이하고 광학 신호의 각 클러스터에 광학 분포 모델을 적용하여 상기 표면에서 각각의 검출된 분석물의 상대적 위치를 개선된 정확도로 결정하며; 및 상기 결정된 상대 위치 및 분해 함수를 사용하여 각 사이클로부터 각 필드 이미지에서 상기 광학 신호를 디콘볼루션하도록 구성되는, 이미지 처리 모듈을 포함한다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 이미지 처리 모듈은 상기 디컨볼루션된 광학 신호를 사용하여 상기 표면 상에 고정된 상기 분석물을 식별하도록 더 구성된다. 일부 실시예에서, 상기 광학 이미지 장치는 스캔 가능 영역을 정의하는 이동 가능 스테이지를 포함한다. 일부 실시예에서, 상기 광학 이미지 장치는 상기 스캔 가능 영역에서 회절 한계 아래에서 기판의 표면을 샘플링하도록 구성된 광학 배율 및 센서를 포함한다. 일부 실시예에서, 상기 시스템은 상기 기판의 패턴화되지 않은 표면에 회절 한계 아래의 중심 간 간격으로 고정된 분석물을 포함하는 기판을 더 포함한다. 일부 실시예에서, 상기 분해는 상기 이웃하는 분석물 사이의 중심 간 거리를 사용하여 이웃하는 분석물로부터 간섭 광학 신호를 제거하여 상기 이웃하는 분석물의 상대적 위치를 결정하는 것을 포함한다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다.

본 발명의 또 다른 실시예는 복수의 분석물을 처리하거나 분석하는 방법을 포함한다. 상기 방법은: 최소 유효 피치가

의 측정치보다 작은 밀도로 기판의 표면에 인접하여 상기 복수의 분석물을 배치하는 (a) 단계로서, 상기 표면은 패턴화되지 않은, (a) 단계; 상기 기판에 인접하게 배치된 상기 복수의 분석물의 분석물에 결합하는 프로브의 하나 이상의 사이클에 걸쳐 상기 기판으로부터 복수의 광학 신호를 획득하는 (b) 단계로서, 적어도 상기 복수의 광학 신호의 서브 세트는 중첩되며, 복수의 광학 신호는 파장(

)을 가지는 광을 포함하는, (b) 단계; 이미징 알고리즘을 적용하여 상기 복수의 광학 신호를 처리하여 상기 복수의 분석 물의 분석물의 위치 또는 상기 복수의 분석물의 다른 분석물에 대한 상기 분석물의 상대적 위치를 식별하는 (c) 단계; 및 상기 위치 또는 상대 위치를 사용하여 상기 복수의 분석물 중 상기 분석물을 확인하는 (d) 단계를 포함한다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물은 반발성(repellant) 또는 유인성(attractive) 물질로 처리된다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함한다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함한다. 일부 실시예에서, 상기 분석물은 DNA 콘카테머(DNA concatemers)이다. 일부 실시예에서, 상기 DNA 콘카테머는 ssDNA 헤어에 혼성화된다. 일부 실시예에서, 상기 분석물은 단백질 또는 펩티드이다. 일부 실시예에서, 상기(b) 단계는 광학 처리 모듈을 구성하여 분석물에 결합하는 상기 하나 이상의 프로브 사이클로부터 상기 복수의 광학 신호를 오버레이하는 단계를 더 포함하고, 상기(c) 단계는 광학 분포 모델을 상기 복수의 광학 신호의 상기 오버레이에 적용하여 각각의 검출된 분석물의 상대 위치를 결정하는 단계를 더 포함한다. 일부 실시예에서, 상기 이미징 알고리즘은 분해 함수를 포함한다. 일부 실시예에서, 상기 분해 함수는 기계 학습을 포함한다. 일부 실시예에서, 상기 분해 함수는 최근접 이웃 변수 회귀를 포함한다. 일부 실시예에서, 상기 분해 함수는 상기 이웃하는 분석물 사이의 중심 간 거리를 사용하여 이웃하는 분석물로부터 간섭 광학 신호를 제거하는 것을 포함한다. 일부 실시예에서, 상기 복수의 분석물은 제곱 마이크론 당 약 1 내지 25 분자의 밀도로 상기 기판에 인접하게 배치된다. 일부 실시예에서, 상기 표면의 상기 이미징은 상기 이미지 필드의 축을 따라 300 nm 당 하나 이상의 픽셀의 해상도에서 수행된다. 일부 실시예에서, 광학 이미징 모듈은 250 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다. 일부 실시예에서, 광학 이미징 모듈은 200 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다. 일부 실시예에서, 광학 이미징 모듈은 150 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다. 일부 실시예에서, 광학 이미징 모듈은 100 nm 당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성된다.

본 발명의 또 다른 실시예는 표면에 고정된 복수의 분석물의 분석물 사이의 평균 최소 중심 간 거리의 분포를 제어하는 방법을 포함한다. 상기 방법은 상기 하나 이상의 분석물을 반발성(repellant) 또는 유인성(attractive) 물질로 처리하는 단계를 포함한다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함한다. 일부 실시예에서, 상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함한다. 일부 실시예에서, 상기 분석물은 DNA 콘카테머(DNA concatemers)이다. 일부 실시예에서, 상기 DNA 콘카테머는 ssDNA 헤어에 혼성화된다. 일부 실시예에서, 상기 분석물은 단백질 또는 펩티드이다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 500 nm 미만이다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 315 nm이다. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 250 nm이다. 일부 실시예에서, 상기 하나 이상의 분석물을 반발성 또는 유인성 물질로 처리하는 단계는 상기 복수의 분석물을 상기 표면에 고정하기 이전에 상기 패턴화되지 않은 표면에 상기 반발성 또는 유인성 물질을 적용하는 단계를 포함한다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다.

본 발명의 또 다른 실시예는 패턴화되지 않은 표면에 고정된 복수의 분석물의 분석물 사이의 평균 최소 중심 간 거리의 분포를 제어하는 방법을 포함한다. 상기 방법은: 상기 하나 이상의 분석물을 반발성(repellant) 또는 유인성(attractive) 물질로 처리하는 단계; 및 상기 복수의 분석물이 상기 패턴화되지 않은 표면을 가로 질러 고정된 분석물의 단층을 형성하도록 상기 복수의 분석물을 기체-액체 계면에 노출시키는 단계를 포함한다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 기체-액체 계면은 공기-물 계면이다. 일부 실시예에서, (c)의 고정은 풀링(pulling) 또는 드래깅(dragging)을 포함한다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 500 nm미만이다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 315 nm이다. 일부 실시예에서, 상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 250 nm이다.

본 발명의 또 다른 실시예는 표면에 인접한 복수의 핵산 분자를 포함하는 시스템을 포함하고, 상기 복수의 핵산 분자의 인접한 핵산 분자는 적어도 10 nm의 평균 중심 간 간격을 갖고 서로 접촉하지 않는다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 복수의 핵산 분자는 복수의 콘카테머이다. 일부 실시예에서, 상기 복수의 핵산 분자는 약 500 nm 미만의 상기 평균 중심 간 간격을 가진다.

본 발명의 또 다른 실시예는 복수의 핵산 분자가 서로 접촉하지 않는 조건에서 표면에 인접한 상기 복수의 핵산 분자를 제공하는 단계를 포함하는 방법을 포함한다. 일부 실시예에서, 콘카테머는 상기 표면에 실장되고 밀접하게 패킹되어 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 한다. 일부 실시예에서, 분자 사이의 평균 중심 대 중심 거리는 약 315 nm. 일부 실시예에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm, 50 nm, 100 nm, 110 nm, 120 nm, 130 nm, 140 nm, 150 nm, 160 nm, 170 nm, 180 nm, 190 nm, 200 nm, 210 nm, 220 nm, 230 nm, 240 nm, 250 nm, 260 nm, 270 nm, 280 nm, 290 nm, 300 nm, 310 nm, 320 nm, 330 nm, 340 nm, 350 nm, 360 nm, 370 nm, 380 nm, 390 nm, 400 nm, 410 nm, 420 nm, 430 nm, 440 nm, 450 nm, 460 nm, 470 nm, 480 nm, 490 nm, 500 nm, 또는 그 이상의 평균 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 상기 평균 간 간격은 500 nm, 490 nm, 480 nm, 470 nm, 460 nm, 450 nm, 440 nm, 430 nm, 420 nm, 410 nm, 400 nm, 390 nm, 380 nm, 370 nm, 360 nm, 350 nm, 340 nm, 330 nm, 320 nm, 310 nm, 300 nm, 290 nm, 280 nm, 270 nm, 260 nm, 250 nm, 240 nm, 230 nm, 220 nm, 210 nm, 200 nm, 190 nm, 180 nm, 170 nm, 160 nm, 150 nm, 140 nm, 130 nm, 120 nm, 110 nm, 100 nm, 50 nm, 또는 그 이하보다 작거나 같을 수 있다. 일부 실시예에서, 상기 표면은 패턴화되지 않는다. 일부 실시예에서, 상기 표면은 패턴화된다. 일부 실시예에서, 상기 복수의 핵산 분자는 복수의 콘카테머이다. 일부 실시예에서, 상기 복수의 핵산 분자의 인접한 복수의 핵산 분자들은 약 500 nm 미만의 평균 중심 간 간격을 가진다.

본 발명의 또 다른 실시예는 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 상기 또는 본원의 다른 곳에서 임의의 방법을 구현하는 기계 실행 가능 코드를 포함하는 비 일시적 컴퓨터 판독 가능 매체를 제공한다.

본 발명의 또 다른 실시예는 하나 이상의 컴퓨터 프로세서 및 그에 결합된 컴퓨터 메모리를 포함하는 시스템을 제공한다. 컴퓨터 메모리는 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 상기 또는 본 명세서의 다른 곳에서 임의의 방법을 구현하는 기계 실행 가능 코드를 포함한다.

여기서 본 발명의 예시적인 실시예만이 도시되고 설명되나, 본 발명의 추가적인 양태 및 이점은 다음의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 알 수 있는 바와 같이, 본 발명은 다른 및 상이한 실시예가 가능하고, 그 몇몇 세부 사항은 모두 본 발명으로부터 벗어나지 않고 다양하고 명백한 관점에서 수정될 수 있다. 따라서, 도면 및 설명은 제한적인 것이 아니라 본질적으로 예시적인 것으로 간주되어야 한다.

본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 표시되는 것과 동일한 정도로 본원에 참조로 포함된다. 참고로 포함된 공보 및 특허 또는 특허 출원이 명세서에 포함된 개시 내용과 모순되는 경우, 명세서는 그러한 모순되는 내용을 대체 및/또는 우선하도록 의도된다.

본 발명의 새로운 특징은 첨부된 청구 범위에서 구체적으로 설명된다. 본 발명의 원리가 사용되는 예시적인 실시예를 설명하는 다음의 상세한 설명과 첨부 도면 (또한 "도면"및 "도")을 참조하면 본 발명의 특징 및 이점에 대한 더 나은 이해를 얻을 수 있다.
도 1은 시퀀서 처리량(throughput) 대 어레이 피치를 보여주며, S10 게놈에 필요한 기준을 충족시키는 시스템 설계를 개략적으로 보여준다.
도 2a는 240nm 피치에 80nm 직경 결합 영역(스팟)의 고밀도 영역의 제안된 실시예를 도시한다.
도 2b는 1,000달러 게놈에 사용된 샘플 유효 밀도와 제안된 기판 밀도를 비교한 것이다.
도 3은 2X 필터로 처리된 600nm 피치에서 개별 분석물의 시뮬레이션된 검출에 대한 크로스토크 계산을 도시한다.
도 4는 400nm, 300nm 및 250nm의 중심 간 거리에서 기판상의 단일 분석물의 검출 이미지에 대한 오버 샘플링된 2X(왼쪽) 대 오버 샘플링된 4X 및 디콘볼루션된(오른쪽) 시뮬레이션을 도시한다. 200nm의 중심 간 거리에서 오버 샘플링된 4X 및 디콘볼루션된 단일 이미지도 표시된다.
도 5는 오버 샘플링된 2X 대 오버 샘플링된 4X 및 디콘볼루션된 시뮬레이션을 사용하여 처리된 단일 분석물(어레이 피치(nm)) 사이의 상이한 중심 간 거리에서 인접한 스팟들 사이의 크로스토크의 플롯을 도시한다.
도 6은 본 발명의 일 실시예에 따른 기판의 분석물의 상대 위치를 고정밀도로 결정하는 방법에 대한 흐름도를 도시한다.
도 7은 본 발명의 일 실시예에 따른 기판으로부터 검출된 디콘볼루션된 광학 신호로부터 개별 분석물을 식별하는 방법에 대한 흐름도를 도시한다.
도 8은 본 발명의 일 실시예에 따른 기판 상에 고정된 폴리 뉴클레오티드를 시퀀싱하는 방법에 대한 흐름도를 도시한다.
도 9는 본 발명의 일 실시예에 따른 사이클 검출로부터 광학 신호 검출 프로세스의 단계들의 개요를 도시한다.
도 10a는 본 발명의 일 실시예에 따른 로우 이미지 분석을 위한 단계들의 흐름도를 도시한다.
도 10b는 본 발명의 일 실시예에 따른 복수의 사이클로부터의 광학 신호 피크 정보로부터 위치 결정을 위한 단계들의 흐름도를 도시한다.
도 10c는 본 발명의 일 실시예에 따른 정확한 상대 위치 정보 및 이미지 디콘볼루션 알고리즘을 사용하여 중첩된 광학 신호를 이미지로부터 식별하기 위한 단계의 흐름도를 도시한다.
도 11은 본 발명의 일 실시예에 따른 밀집 패킹된 기판의 사이클 검출로부터의 이미지에 대한 광학 신호 검출 및 디콘볼루션 프로세스를 위한 단계의 상세한 흐름도를 도시한다.
도 12a는 로우 이미지로부터 검출된 광학 신호로부터 4개의 형광단 사이의 형광단 강도의 크로스토크 플롯을 도시한다.
도 12b는 4X 오버 샘플링된 이미지로부터 4개의 형광단 사이의 형광단 강도의 크로스토크 플롯을 도시한다.
도 13a는 디콘볼루션 또는 최근접 인접 보정없이 4X 오버 샘플링된 이미지로부터 4 개의 형광단 사이의 형광단 강도의 크로스토크 플롯을 도시한다.
도 13b는 본 발명의 일 실시예에 따른 정확한 분석물 위치 정보를 갖는 디콘볼루션 알고리즘을 사용하여 4X 오버 샘플링되고 디콘볼루션된 이미지로부터 4개의 형광단 사이의 형광단 강도의 크로스토크 플롯을 도시한다.
도 14a는 약 315nm의 분석물들 사이의 중심 간 간격에서 필드의 로우 이미지의 시뮬레이션된 4색 합성물을 도시한다.
도 14b는 약 315nm의 분석물 사이의 중심 간 간격에서 디콘볼루션된 이미지의 시뮬레이션된 4 색 합성물을 도시한다.
도 15a는 동일한 양의 돌연변이 및 야생형(WT) 표적을 함유하는 EGFR 유전자에서 코돈 790 주변 영역에 상응하는 합성 올리고 뉴클레오티드 주형의 1:1 혼합물의 서열 분석 결과를 도시한다.
도 15b는 교대 염기 혼입 및 절단 주기로부터의 이미지를 도시한다.
도 16은 기판 상에 고정되고 형광단을 포함하는 프로브에 의해 결합된 단일 분석물의 이미지이다.
도 17의 우측 패널은 기판(피크 클러스터) 상의 여러 분석물로부터 중첩된 각각의 사이클로부터 필드의 오버 샘플링된 이미지로부터의 피크를 도시한다. 왼쪽 패널은 오른쪽 패널의 평활화된 버전으로, 상대적 위치 정보를 나타내는 매우 정확한 피크로 복수의 사이클에 걸쳐 분석 물로부터 피크의 가우시안 분포를 요약한다.
도 18은 필드에서 발견된 복수의 분자 각각에 대한 국소화 변화를 도시한다. 중앙값 국소화 분산은 5nm이고 3 시그마 국소화 분산은 10nm 미만이다.
도 19는 본 발명 실시예에 따른, 데옥시리보 핵산(DNA) 라이브러리 구축, 원형화 및 콘카테머 형성의 흐름도를 나타낸다.
도 20은 본 발명의 일 실시예에 따라 콘카테머 층의 형성에 대한 배제를 용이하게 하기 위해 콘카테머에 ssDNA '헤어'의 합성을 포함하는 DNA 라이브러리 구축, 원형화 및 콘카테머 형성의 흐름도를 나타낸다.
도 21a 및 도 21b는 본 발명의 실시예에 따라 콘카테머 층에서 다른 콘카테머로부터의 배제를 용이하게 하기 위해 코팅된 콘카테머를 도시한다.
도 22는 본 발명의 일 실시예에 따른, 밀접-패킹되고 랜덤하게 분포된 콘카테머 층의 일 실시예를 나타낸다.
도 23a는 본 발명의 실시예에 따라 샘플로부터의 표적 서열을 포함하는 원형화 된 DNA의 라이브러리를 형성하기 위한 흐름도를 나타낸다.
도 23b는 본 발명의 일 실시예에 따라, 기판의 층 상에 콘카테머를 로드하고 콘카테머를 배열하는 흐름도를 도시한다.
도 24는 본 발명의 일 실시예에 따른, 각각의 콘카테머에 소스 정보(또는 다른 정보)를 포함하기 위한 고유 분자 식별자의 사용 실시예를 도시한다.
도 25a 내지 도 25c는 본 발명의 일 실시예에 따라 기판의 표면 상에 고밀도로 분포된 콘카테머 층의 이미지를 도시한다.
도 25d는 본 발명의 일 실시예에 따른 콘카테머 표면 밀도의 그래프를 도시한다.
도 26a 내지 도 26d는 콘카테머 표적을 시퀀싱하는 데 사용되는 기판에 결합된 콘카테머의 이미지를 도시하며, 인접한 콘카테머 사이의 시퀀스의 성공적인 분해를 나타낸다.
도 27a 내지 도 27c는 본 발명에 기술된 방법 및 시스템을 사용하여 대장균의 합성에 의한 시퀀싱 결과를 나타낸다. 도 27a 및 27b는 다양한 베이스 페어 리드를 나타낸다. 도 27c는 E. coli 시퀀싱을 위한 개별 스팟에서 베이스 콜링의 분해능을 나타낸다.
도 28은 본 명세서에서 제공된 방법을 구현하도록 프로그래밍되거나 다른 방식으로 구성된 컴퓨터 시스템을 나타낸다.

본 발명의 다양한 실시예가 여기에 도시되고 설명되었지만, 그러한 실시예는 단지 예시로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명에서 벗어나지 않고 당업자에게 다양한 변형, 변경 및 대체가 발생할 수 있다. 여기에 설명된 본 발명의 실시 예에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.

"적어도", "초과"또는 "이상"이라는 용어가 일련의 2개 이상의 숫자 값에 사용될 때, 용어 "적어도", "초과 "또는 "이상"은 일련의 숫자 값의 각각에 적용된다. 예를 들어, 1, 2 또는 3 이상은 1이상, 2이상 또는 3이상을 의미한다.

"단지", "미만"또는 "이하"라는 용어가 일련의 2개 이상의 숫자 값에 사용될 때, 용어 "단지", "미만"또는 "이하"은 일련의 숫자 값의 각각에 적용된다. 예를 들어, 1, 2 또는 3 이하는 1이하, 2이하 또는 3이하를 의미한다.

본 명세서에서, 사용된 용어 중심 간 거리(center-to-center distance)는 기판 상의 각 분자의 평균 위치의 차이에 의해 측정된 인접한 2개의 분자 사이의 거리를 의미한다. 중심 간 거리라는 용어는 또한 기판상의 분석물의 밀도에 대응하는 제한의 맥락에서 최소 중심 간 거리를 지칭하며, 용어 평균 최소 중심 간 거리는 구체적으로 기판 상에 배치된 각각의 분석물의 중심과 가장 가까운 인접 분석물의 중심 사이의 평균 거리를 지칭한다. 본 명세서에서, 용어 "피치" 또는 "평균 유효 피치"는 일반적으로 평균 최소 중심 간 거리를 지칭하기 위해 사용된다. 규칙적인 분석물의배열과 관련하여, 피치는 또한 정의된 축을 따라 인접한 분자 사이의 중심 간 거리를 결정하는데 사용될 수 있다.

본 명세서에서 사용되는 용어 "오버레이(overlaying, 예를 들어, 이미지 오버레이)"는 복수의 사이클(주기)에 걸쳐 각각의 분석 물로부터 검출된 광학 신호의 분포(예를 들어, 위치 및 강도 또는 피크의 위치)를 생성하기 위해 상이한 사이클로부터 이미지를 오버레이하는 것을 의미한다. 검출된 광학 신호의 이러한 분포는 이미지 오버레이, 인공 처리된 이미지 오버레이 또는 위치 정보를 포함하는 데이터 세트를 오버레이함으로써 생성될 수 있다. 따라서, 본 명세서에서 사용되는 용어 "오버레이 이미지(overlaying images)"는 복수의 사이클 각각에 대해 단일 분석물에 결합된 단일 프로브로부터 광학 신호에 대한 위치 정보의 분포를 생성하기 위한 이러한 메커니즘 중 임의의 것을 포함한다.

"사이클"은 하나 이상의 패스의 완료 및 검출 가능한 표지를 기판으로부터 스트라이핑함으로써 정의된다. 사이클 당 하나 이상의 패스의 후속 사이클이 수행될 수 있다. 본 명세서에 기술된 방법 및 시스템에 대해, 다중 사이클이 단일 사이클 또는 샘플상에서 수행된다. DNA 시퀀싱의 경우, 다중 사이클은 가역적인 종결인자 및 통합된 뉴클레오티드로부터의 제거 가능하고 검출 가능한 표지의 사용을 필요로 한다. 단백질의 경우, 다중 사이클은 프로브 제거(스트라이핑) 조건이 단백질을 적절한 형태로 접은 상태로 유지하거나 사용된 프로브가 펩티드 서열에 결합하도록 선택되어, 결합 효율이 단백질 폴드 구성과 무관하도록 요구한다.

검출 분석의 “패스”란 검출 가능한 표지를 포함하는 복수의 프로브가 결합된 분석물에 도입되고, 프로브와 별개의 표적 분석물 사이에 선택적 결합이 발생하고, 검출 가능한 표지로부터 복수의 신호가 검출되는 과정을 지칭한다. 패스는 표적 분석물에 특이적으로 결합하는 항체 세트의 도입을 포함한다. 패스는 또한 합성에 의한 시퀀싱 동안 성장 가닥(growing strand)에 혼입하기 위한 표지된 뉴클레오티드 세트의 도입을 포함할 수 있다. 기판이 모든 검출 가능한 표지로부터 제거되기 전에, 또는 검출 가능한 표지 또는 가역적 종결인자가 시퀀싱 동안 혼입된 뉴클레오티드로부터 제거되기 전에, 상이한 세트의 프로브의 다수의 패스가 존재할 수 있다. 일반적으로, 패스 동안 4개의 뉴클레오티드가 사용되는 경우, 사이클은 합성에 의한 표준 4개의 뉴클레오티드 시퀀싱을 위한 단일 경로로만 구성될 것이다.

본 명세서에서 사용된, "이미지"는 사이클 동안 또는 필드 내의 패스 중 촬영된 필드의 이미지를 지칭한다. 일부 실시예에서, 단일 이미지는 검출 가능한 표지의 단일 색상의 검출로 제한된다.

본 명세서에서 사용된 용어 "필드"는 이미지화되는 기판의 단일 영역을 지칭한다. 전형적인 분석 동안, 단일 필드는 적어도 사이클 당 1회 이미지화된다. 예를 들어, 4가지 색상의 20사이클 분석의 경우, 동일한 필드 모두에서 20 * 4 = 80개의 이미지가 있을 수 있다.

"표적 분석물"또는 "분석물"은 일반적으로 확인, 정량화 및 달리 특성화되어야 하는 단일 분자, 화합물, 복합체, 물질 또는 성분을 지칭한다. 표적 분석물은 예를 들어 단일 분자(임의의 분자 크기), 단일 생체 분자, 폴리펩티드, 단백질(접힘 또는 펼침), 폴리 뉴클레오티드 분자(RNA, cDNA 또는 DNA), 이의 단편, 이의 변형된 분자, 예컨대 변형된 핵산, 또는 이들의 조합을 포함할 수 있지만, 이에 제한되지는 않는다. 일 실시예에서, 표적 폴리 뉴클레오티드는 합성에 의한 시퀀싱을 용이하게 하기 위해 혼성화된 프라이머를 포함한다. 표적 분석물은 프로브에 의해 인식되며, 프로브는 본 명세서에 기술된 광학적 검출 방법을 사용하여 표적 분석물의 시퀀싱, 식별 및 정량화하는데 사용될 수 있다.

본 명세서에서 사용된 "프로브"는 일반적으로 분자, 세포 성분 또는 구조, 또는 세포의 특성을 검출 또는 평가하기 위해, 다른 분자(예를 들어, 합성, 폴리 뉴클레오티드, 폴리펩티드 또는 전장 단백질 등에 의한 시퀀싱 동안 상보적으로 표지된 뉴클레오티드), 세포 성분 또는 구조(예를 들어, 지질, 세포벽) 또는 세포에 결합할 수 있는 분자를 지칭한다. 프로브는 표적 분석물에 결합하는 구조 또는 성분을 포함한다. 일부 실시예에서, 다수의 프로브는 동일한 표적 분석물의 상이한 부분을 인식할 수 있다. 프로브의 예는 표지된 가역적 종결인자 뉴클레오티드, 앱타머, 항체, 폴리펩티드, 올리고 뉴클레오티드(DNA, RNA) 또는 이들의 임의의 조합을 포함하지만, 이에 제한되지는 않는다. 프로브로서의 항체, 앱타머, 올리고 뉴클레오티드 서열 및 이들의 조합이 또한 아래에 상세히 기재되어있다.

프로브는 표적 분석물에 대한 프로브의 결합을 검출하는데 사용되는 검출 가능한 표지를 포함할 수 있다. 프로브는 표적 분석물에 직접 또는 간접적으로 결합, 혼성화, 접합 또는 공유 결합될 수 있다.

본 명세서에 사용된 용어 "검출 가능한 표지"는 프로브가 표적 분석물에 결합되고 광학 이미징 시스템을 사용하여 이미지화 될 때 검출 가능한 광학 신호를 생성할 수 있는 프로브에 결합된 분자를 지칭한다. 검출 가능한 표지는 프로브에 직접 또는 간접적으로 결합, 혼성화, 접합 또는 공유 결합될 수 있다. 일부 실시예에서, 검출 가능한 표지는 형광 분자 또는 화학 발광 분자이다. 프로브는 감지 가능한 표지를 통해 광학적으로 감지할 수 있다.

본 명세서에서 사용되는 용어 "광학 분포 모델"은 일반적으로 포인트 소스로부터의 광 검출을 위한 통계의 분포를 지칭한다. 예를 들어, 여기에는 가우시안 분포가 포함된다. 가우시안 분포는 광학 분포 모델로 포인트 확산 함수를 생성하기 위해 검출에 예상 수차를 포함하도록 수정될 수 있다.

본 명세서에는 기판의 표면에 결합되고 타이트하게 패킹된 분석물에 결합된 프로브의 광학적 검출 및 식별을 용이하게 하는 시스템 및 방법이 제공된다. 부분적으로, 본 명세서에 기술된 방법 및 시스템은 기판 표면상의 복수의 표적 분석물의 반복 검출에 의존하여 기판상의 각 분석물의 상대적 위치의 식별 정확도를 향상시킨다. 이어서, 이러한 정보는 각각의 사이클에 대해 기판의 필드의 각 이미지에 대한 신호 분해(signal resolving)을 수행하여 표적 분석물에 결합된 프로브로부터의 신호를 안정적으로 식별하는 데 사용될 수 있다. 일부 실시예에서, 상기 분해는 디콘볼루션을 포함한다. 일부 실시예에서, 이러한 유형의 디콘볼루션 처리는 활성화 광에 의해 활성화 될 때 중첩 방출 스펙트럼을 갖는 표적 분석물에 결합된 상이한 프로브를 구별하기 위해 사용될 수 있다. 일부 실시예에서, 디콘볼루션 처리는 인접 분석물로부터 광학 신호를 분리하는데 사용될 수 있다. 이는 광학 시스템의 회절 한계로 인해 광학 검출이 어려운 밀도를 갖는 분석물을 가지는 기판에 특히 유용하다.

일부 실시예에서, 본 명세서에 기재된 방법 및 시스템은 시퀀싱(서열 분석)에 특히 유용하다. 밀집 패킹된(densely packed) 기판에서 신뢰할 수 있는 광학 검출을 용이하게 하는 방법 및 시스템을 제공함으로써, 시약, 클론 분자의 수, 처리 및 판독 시간과 같은 시퀀싱과 관련된 비용을 모두 줄일 수 있으며, 시퀀싱 기술, 특히 광학적으로 검출된 뉴클레오티드를 사용한 합성에 의한 단일 분자 시퀀싱을 크게 발전시킬 수 있다.

본 명세서에 기술된 시스템 및 방법은 시퀀싱 기술을 발전시키는 데 중요한 의미를 가지며, 본 명세서에 기술된 방법 및 시스템은, 특히 단일 분자 수준에서 기판 표면에 결합된 분석물의 광학적 검출에 일반적으로 적용 가능하다.

시퀀싱 비용 절감

시퀀싱 기술에는 일루미나(Illumina) 및 컴플리트 제노믹스(Complete Genomics)와 같은 회사에서 개발한 이미지 기반 시스템과 이온 토렌트(Ion Torrent)와 옥스포드 나노포어(Oxford Nanopore)와 같은 회사에서 개발한 전기 기반 시스템이 포함된다. 이미지 기반 시퀀싱 시스템은 현재 모든 기존 시퀀싱 기술 중에서 가장 낮은 시퀀싱 비용을 가진다. 이미지 기반 시스템은 높은 처리량의 이미징 광학 장치와 저렴한 소모품을 결합하여 저렴한 비용을 달성한다. 그러나, 종래의 광학 검출 시스템은 부분적으로 광학 시스템의 회절 한계로 인해 약 1 미크론에서 인접한 분해 가능한 분자 사이의 최소 중심 간 간격을 갖는다. 일부 실시예에서, 사이클 검출(cycled detection), 분석물의 정확한 위치 결정 및 회절 한계 아래에서 작동하는 증가된 패킹 밀도를 수용하기 위해 이미지 신호의 매우 정확한 디콘볼루션을 위한 위치 정보 사용을 사용하는 기존 생화학을 사용하여 이미지 기반 시퀀싱 시스템의 비용을 크게 낮추는 방법이 여기에 설명된다.

밀집-패킹된 분석물 층 및 검출 방법

회절 한계 미만의 중심 간 간격으로 표면에 고정된 분석물로부터의 신호의 이미징을 용이하게 하는 시스템 및 방법이 제공된다. 이러한 시스템 및 방법은 고급 이미징 시스템을 사용하여 초-고분해능 이미지를 생성하고, 사이클 검출을 사용하여 기판상의 분자 위치 결정을 높은 정확도로 용이하게 하고 이미지를 분해하여 밀집 패킹된 표면의 각 분자에 대한 신호 아이덴티티(identity)을 높은 정확도로 획득한다. 이러한 방법 및 시스템은 고밀도로 패킹된 기판상에서 합성에 의한 시퀀싱을 허용하여 매우 효율적이고 매우 높은 처리량의 폴리 뉴클레오티드 서열 결정을 높은 정확도로 제공한다.

시퀀싱 시스템의 주요 비용 구성 요소는 주로 바이오 칩과 시약을 포함하는 소모품이며 이차적으로 기기 비용이다. 100배 비용이 절감되는, S10 30X 게놈에 도달하려면, 단위 면적당 데이터 양이 100배 증가해야 하고, 데이터 포인트 당 시약 양이 100배 감소해야 한다.

도 1은 시퀀서 처리량(throughput) 대 어레이 피치를 보여주며, S10 게놈에 필요한 기준을 충족시키는 시스템 설계를 개략적으로 보여준다. 기본 아이디어는 100배의 비용 절감을 달성하는 것으로, 단위 면적당 데이터 양은 100배 증가해야 하고 데이터 포인트 당 시약 양은 100배 감소해야 한다. 이러한 비용 절감을 달성하기 위한, 회절 한계 미만의 밀도로 기판 표면에 고정된 폴리 뉴클레오티드의 신뢰성 있는 시퀀싱을 용이하게 하는 방법 및 시스템이 제공된다. 이러한 고밀도는 시약을 보다 효율적으로 사용하게 하고 단위 면적당 데이터 양을 증가시킨다. 또한, 검출 신뢰성의 증가는 시퀀싱 및 검출에서의 오류를 식별하고 정정하기 위해 합성되어야 하는 클론 복제 수를 감소시켜 시약 비용 및 데이터 처리 비용을 추가적으로 감소시킨다.

기판 표면의 분석 물질의 고밀도 분포

도 2a는 240nm 피치에 80nm 직경 결합 영역(스팟)의 고밀도 영역의 제안된 실시예를 도시한다. 이 실시예에서, 단일 가닥 DNA 분자가 칩 상의 특정 영역에 독점적으로 결합하는 정렬된 어레이가 사용될 수 있다. 일부 실시예에서, 스팟을 과도하게 채우지 않도록 40kB보다 작은 콘카테머(concatemers)(즉, 직렬로 연결된 동일한 DNA 서열의 다중 복제를 함유하는 긴 연속 DNA 분자)이 사용된다. 콘카테머의 크기는 면적과 대략적으로 비례하며, 동일한 증폭 공정이 사용되는 경우 더 작은 콘카테머의 예상 길이는 대략 4kB ~ 5kB가 되어 약 10복제가 된다. 4kB 길이의 DNA 및 서열 단일 분자를 직접 사용하는 것도 가능하다. 다른 옵션은 배제 분자(exclusionary molecule)를 생성하는 데 필요한 크기까지 총 길이를 확보하기 위해 DNA의 짧은 세그먼트를 서열이 지정되지 않은 필러 DNA와 결합시키는 것이다.

도 2b는 1,000달러 게놈에 사용된 샘플 유효 피치와 제안된 피치를 비교한 것이다. 신규 어레이의 밀도는 170배 더 높아서 100배 더 높은 밀도를 달성하는 기준을 충족한다. 단위 면적당 이미징 스팟 당 복제 수는 기존 플랫폼보다 최소 100배 낮은 기준을 충족한다. 이를 통해 시약 비용이 기준보다 100배 더 경제적이게 된다.

밀집 패킹된 단일 생체 분자 및 회절 한계 이미징

이미징 플랫폼의 증가된 분자 밀도에 대한 주요 제약은 회절 한계이다. 광학 시스템의 회절 한계는 하기 수학식 1과 같다.

[수학식 1]

여기서,

는 회절 한계,

는 광의 파장,

는 광학 시스템의 개구 수(numerical aperture)이다. 일반적인 에어 이미징 시스템(air imaging systems)

는 1.0 내지 1.2이다.

= 600nm를 사용하면, 회전 한계는 250nm 내지 300nm 이다. 수침 시스템(water immersion system)에서,

는 ~1.0이며, 회절 한계는 300nm 이다.

생체 분자를 포함하는 어레이 또는 다른 기판 표면상의 특징이 너무 가까운 경우, 두 개의 광학 신호가 겹치게 되며, 이미지만으로는 확실하게 구분할 수 없는 단일 얼룩만을 볼 수 있게 된다. 이는 움직이는 기판의 부정확한 추적으로 인한 블러(blur), 또는 센서와 기판 표면 사이의 광 경로의 광학적 변화와 같은 광학 이미징 시스템에 의해 야기된 에러에 의해 악화될 수 있다.

현미경의 표본 평면의 한 지점에서 나오는 투과 광 또는 형광 방출 파면은 대물 조리개(objective aperture)의 가장자리에서 회절되고, 파면을 효과적으로 확산시켜서, 유한한 중심 디스크를 가지나, 원래 점보다 큰 회절 패턴으로 확장되는 포인트 소스의 이미지를 생성한다. 따라서, 빛의 회절로 인해, 현미경 광학 시스템이 구조적 세부 사항을 해결할 수 없는 한계치가 있기 때문에, 표본의 이미지는 표본에 존재하는 실제 세부 사항을 완벽하게 나타내지 못한다.

현미경으로 서브 파장 구조를 관찰하는 것은 회절 한계로 인해 어렵다. 형광 단백질 또는 뉴클레오티드 단일 분자와 같은 현미경의 점 오브젝트는 간섭 작용에 의해 생성된 회절 패턴으로 구성된 중간 평면(intermediate plane)에서 이미지를 생성한다. 고배율인 경우, 포인트 대상의 회절 패턴은 일련의 회절 링으로 둘러싸인 중심점(회절 디스크)으로 구성되는 것으로 관찰된다. 결합된, 이러한 포인트 소스 회절 패턴을 에어리 디스크(Airy disk)라고 지칭한다.

에어리 패턴(Airy pattern)에서 중심점의 크기는 빛의 파장과 대물 렌즈의 조리개 각도와 관련이 있다. 현미경 대물 렌즈의 경우, 조리개 각도는 여기에는 대물 렌즈가 표본에서 빛을 모을 수 있는 반각인

라는 용어가 포함되는 개구 수(NA)로 설명된다. 분해능 측면에서, 횡방향(lateral)(x, y) 이미지 평면에서 회절 에어리 디스크의 반경은 다음 공식,

로 정의된다. 여기서,

는 투과광에서의 평균 조명 파장 또는 형광에서의 여기 파장 대역, 개구 수(

)는 이미징 매체의 굴절률(n; 일반적으로, 공기, 물, 글리세린 또는 오일)에 조리개 각도의 사인(

)을 곱한 값으로 정의된다. 이 관계의 결과로, 포인트 소스에 의해 생성된 스팟의 크기는 파장이 감소하고 개구 수가 증가함에 따라 감소하지만 항상 유한한 직경의 디스크로 남아 있다. Abbe 분해능(Abbe resolution, Abbe 한계)는 본 명세서에서 회절 한계라고도 하며 광학 시스템의 분해능 한계를 정의한다.

두 개의 에어리 디스크 또는 포인트-확산 기능 사이의 거리가 이 값보다 크면 두 포인트 소스가 해결된 것(쉽게 구별될 수 있는 것)으로 간주된다. 그렇지 않으면 에어리 디스크가 함께 병합되어 해결되지 않은 것으로 간주된다.

따라서, 파장

를 갖는 단일 분자 검출 가능한 표지 포인트 소스로부터 방출되고, 굴절률

을 갖는 매체에서 이동하고, 반각

를 갖는 스팟으로 수렴되는 광은 직경을 갖는 회절 제한 스팟:

을 만들 것이다. 약 500nm의 녹색광과 1의 NA(개구 수)를 고려하면, 회절 한계는 대략

이며, 이는 단백질, 뉴클레오티드 및 기타 시퀀싱 기판(예를 들어, 도 20에 표시된 바와 같은)과 같은 종래의 이미징 기술에 의해 이미지화될 수 있는 분석물의 밀도를 제한한다. 광학 현미경에 사용 가능한 최고 품질의 렌즈 요소가 장착되어 있고 완벽하게 정렬되어 있으며 개구 수가 가장 높은 경우에도 최상의 시나리오에서 분해능은 빛의 파장의 약 절반으로 제한된다. 분해능을 높이기 위해, UV 및 X-ray 현미경과 같은 더 짧은 파장을 사용할 수 있다. 이러한 기술은 더 나은 분해능을 제공하지만 비싸고, 생물학적 샘플의 대비(contrast) 부족으로 인해 샘플을 손상시킬 수 있다.

이미지 분해

일부 실시예에서, 본원 명세서에서 설명된 이미지 분해 방법은 디콘볼루션을 포함한다. 디콘볼루션은 기록된 데이터에 대한 컨볼루션의 영향을 되돌리는 데 사용되는 알고리즘 기반 프로세스이다. 디콘볼루션의 개념은 신호 처리 및 이미지 처리 기술에 널리 사용된다. 이러한 기술은 많은 과학 및 공학 분야에서 널리 사용되기 때문에 디콘볼루션은 많은 응용 분야를 찾는다.

광학 및 이미징에서, "디콘볼루션(deconvolution)"이라는 용어는 광학 현미경, 전자 현미경, 망원경 또는 다른 이미징 기기에서 발생하는 광학 왜곡을 역전시켜 보다 선명한 이미지를 생성하는 프로세스를 구체적으로 지칭한다. 일반적으로 현미경 이미지 처리 기술의 일부로 소프트웨어 알고리즘에 의해 디지털 영역에서 수행된다.

일반적인 방법은 기기를 통과하는 광학 경로가 광학적으로 완벽하고 포인트 확산 함수(PSF), 즉, 이론적인 빛(또는 다른 파)의 포인트 소스가 기기를 통과하는 경로에 대한 왜곡을 설명하는 수학적 함수와 관련이 있다고 가정하는 것이다. 일반적으로 이러한 점 소스는 최종 이미지에 약간의 퍼지 영역을 제공한다. 이러한 함수가 결정될 수 있다면, 그것은 역 함수 또는 상보 함수를 계산하고, 획득된 이미지를 그것과 콘볼루션하는 문제이다. 디콘볼루션은 푸리에 코-도메인(Fourier co-domain)의 디비전으로 매핑된다. 이를 통해 푸리에 변환의 대상이 되는 실험 데이터로 디콘볼루션을 쉽게 적용할 수 있다. 데이터가 시간 영역에 기록되지만 주파수 영역에서 분석되는 NMR 분광법이 그 예시이다. 지수 함수로 시간 영역 데이터를 나누면 주파수 영역에서 로렌지안 선(Lorenzian line)의 폭을 줄이는 효과가 있다. 결과는 원본으로, 왜곡되지 않은 이미지이다.

그러나, 회절 제한 이미징의 경우, 포인트 확산 함수가 완벽하게 알려져 있더라도 신호를 더 세분화하기 위해, 회절 한계를 넘어서 분해능을 향상시키기 위한 디콘볼루션(deconvolution)이 필요하다. 나이퀴스트 거리(Nyquist distance)보다 작은 거리에서 두 물체를 확실하게 분리하는 것은 매우 어려운 일이다. 그러나, 나이퀴스트 거리 보다 훨씬 작은 거리로 분리된 물체를 신뢰성 있게 검출하기 위해 사이클 검출, 분석물 위치 결정, 정렬 및 디콘볼루션을 이용하는 방법 및 시스템이 설명된다.

시퀀싱을 위한 콘카테머의 고밀도 랜덤 층의 제조

고밀도 콘카테머 층을 만들고 사용하는 방법이 제공된다. 일부 실시예에서, 콘카테머는 개별 검출 및 시퀀싱을 위해 밀집된 층의 기판 표면 상에 무작위로 분포된다. 일부 실시예에서, 높은 밀도 또는 평균 중심 간 거리를 달성하도록 기판 상에 콘카테머 층을 만들고 무작위로 분포하는 방법이 제공된다.

콘카테머(즉, CATs)는 ssCircular DNA의 RCA(rolling circle amplification)를 통해 만들어진 긴 단일 가닥 DNA 분자이다. 일부 실시예에서, 콘카테머는 각각 공지된 서열 어댑터 사이에 삽입된 표적 DNA 서열의 수 내지 수백 카피를 포함한다. 표적 DNA 서열을 포함하는 콘카테머 라이브러리가 생성될 수 있다. 일부 실시예에서, 콘카테머는 인접 콘카테머 사이의 최소 오버랩 또는 인접 콘카테머 사이의 최소 거리를 가지며 기판상의 특정 부착 지점을 필요로 하지 않고 기판 상에 밀집된 단일 층의 콘카테머의 층화(layering)를 용이하게 하기 위해 자기 배제되는 특징부를 포함한다. 이러한 배제적인 특징부는 본 명세서에 설명된 바와 같이 광학 이미징에 의해 분해되기에는 너무 가까운 콘카테머의 수를 최소화하면서 밀집 패킹된 층을 용이하게 한다.

일부 실시예에서, 표면을 포함하는 기판이 제공되며, 여기서 표면은 DNA 콘카테머와 같은 밀집 패킹되고, 무작위 분포된 증폭된 표적의 집합에 결합된다.

일부 실시예에서, 이 기판은 전체 게놈 또는 엑솜을 포함하여 뉴클레오티드 시퀀싱을 용이하게 하기 위해 사용된다. 일부 실시예에서, 많은 수의 개별 세포 표적이 시퀀싱될 수 있다. 이들은 클러스터 시퀀싱을 사용하여 선택한 대상 패널을 나타낼 수 있다. 본 명세서에 기술된 시퀀싱은 예를 들어 (i) 다중 유전적 변이를 검출하기 위해 사용(예를 들어, 유전형 분석, 약물 내성 결정, 친자 확인 또는 식별을 위해), (ii) 경로 역학의 열거를 위한 유전자 발현 분석을 위한 다중 cDNA 분자 서열화, 또는 (iii) 바이-설피트(bi-sulphite) 처리 후 표적 폴리 뉴클레오티드에서 메틸화된 잔기를 검출하기 위해 사용될 수 있다. 일부 실시예어서, 시퀀싱 방법은 상기 실시예에서 기재된 바와 같이 -200 개의 표적 카피의 작은 클러스터를 생성하기 위해 표적 증폭을 요구한다.

일 실시예에서, 방법은 라이게이스 반응(ligase reaction)을 사용하여 게놈 전체의 표적을 위한 원형화된 단일 가닥 분자를 생성하는 것, 등온 전체 게놈 증폭 방법(isothermal whole genome amplification method)을 사용하여 원형화 된 DNA를 증폭하여 수백 개의 카피가 있는 원형화된 증폭된 표적(CAT) 클러스터를 생성하는 것, 및 CATs가 적절한 시약으로 코팅되어 약 225-275 nm의 분포로 약 250 nm의 균일한 크기를 갖는 나노 구(nanospheres)를 생성하는 것을 포함한다.

일 실시예에서, 방법은 고밀도로 포장된 컬렉션의 바이오 칩에 CAT를 분포하고 코팅 재료를 제거하여 표면에 부착하는 것, 및 CAT가 여러 사이클의 시퀀싱 반응을 통해 슬라이드에 결합된 상태를 유지되도록 하는 것을 더 포함한다.

일부 실시예에서, 표적 생체 분자는 반복 혼성화(hybridization)에 기초하여 검출 및/또는 시퀀싱 및 인증된다. 이는 개선된 표적 식별 및/또는 시퀀싱을 제공하기 위한 민감도 및/또는 특이성의 감소를 포함하여 개선된 정확도를 촉진한다.

일부 실시예에서, 단일 염기 연장 분석 및 올리고뉴클레오티드 라이게이션 분석은 인증을 제공하기 위해 단일 분자 수준에서 수행된다. 이러한 수준의 인증은 매우 높은 멀티플렉싱 및 디지털 카운팅을 허용하여 이전에는 광학 이미징을 통해 사용할 수 없었던 더 높은 정확도로 상대적 및 절대적 풍부도를 정량화하게 한다.

시퀀싱

광학 검출 이미징 시스템은 회절-제한적이고, 따라서 시퀀싱에 전형적으로 사용되는 형광단(fluorophores)을 갖는 - 300nm의 이론상 최대 해상도를 갖는다. 현재까지, 최상의 시퀀싱 시스템은 어레이에서 - 600nm의 인접한 폴리 뉴클레오티드 사이의 중심 간 간격 또는 - 2 X의 회절 한계를 가졌다. 이러한 2X 계수는 위치 오차를 유발할 수 있는 강도, 배열 및 생물학 변형을 설명하는 데 필요하다. 10 게놈을 달성하기 위해서는 대략 200nm의 중심 간 간격이 필요하며, 이는 서브-회절-제한 이미징 능력이 필요하다.

시퀀싱을 위해, 본 명세서에 기술된 시스템 및 방법의 목적은 광학 시스템의 회절 한계 미만의 중심 간 간격을 갖는 기판 상에 시퀀싱된 폴리 뉴클레오티드를 분해(resolve)하는 것이다.

본 명세서에 기술된 바와 같이, 본 발명자들은 각각의 분석물의 위치를 높은 정확도(예를 들어, 10nm RMS 이하)로 식별함으로써 서브-회절-제한 이미징을 달성하기 위한 방법 및 시스템을 제공한다. 이에 비해, 최첨단 초 고해상도 시스템(Harvard/STORM)은 이 시스템보다 2배 더 나쁜, 20nm RMS의 정확도로 위치를 식별할 수 있다. 따라서, 본 명세서에 개시된 방법 및 시스템은 서브-회절 제한-이미징이 기판상의 밀집 패킹된 분자를 식별하여 효소 단위당 높은 데이터 속도, 단위 시간당 데이터 속도를 및 높은 데이터 정확도를 달성할 수 있게 한다. 이러한 서브-회절-제한 이미징 기술은 본 명세서에 기술된 바와 같은 사이클 검출(cycled detection)을 사용하는 기술에 광범위하게 적용 가능하다.

시퀀싱의 복수의 사이클

콘카테머

CATs 제조 방법

원형화된 ssDNA 표적의 생성

일부 실시예에서, 기판의 표면 상에 층으로, 예를 들어, 무작위로 분포된 밀집 패킹된 층으로서 분포하는 콘카테머의 라이브러리를 제조하는 방법이 본 명세서에 기술된다. 시퀀싱할 표적 DNA를 포함하는 콘카테머를 합성하기 위해, 먼저 표적 DNA는 증폭되고 원형 DNA 주형으로 변환될 수 있다. 일부 실시예에서, 증폭 산물은 원형 주형 라이게이션을 거치며, 이는 주형 매개 효소 라이게이션(예를 들어, T4 DNA 라이게이즈) 또는 특수 DNA 라이게이즈(즉, CircLigase)를 사용하는 주형이 없는 라이게이션을 통해 수행되어 원형 DNA 주형의 롤링 원형 증폭을 통해 형성된 콘카테머에 대한 전구체를 형성한다.

RCA / RCR 베이직 테크닉

롤링 원형 증폭은 DNA 또는 RNA의 원형 분자의 다중 카피를 신속하게 합성할 수 있는 단 방향 핵산 복제 프로세스를 의미한다.

RCA(롤링 원형 증폭)는 중합 효소가 원형 주형에 어닐링된 프라이머에 단일 뉴클레오티드를 연속적으로 추가하는 등온 핵산 증폭 기술로, 수십에서 수백 개의 직렬 반복(원형 템플릿에 상보적)을 포함하는 긴 콘카테머 ssDNA를 생성한다.

롤링 원형 증폭은 원형 DNA 주형을 1. DNA 중합 효소, 2. 중합 효소와 호환되는 적절한 완충액, 3. 짧은 DNA 또는 RNA 프라이머, 4. 데옥시뉴클레오티드 트리포스페이트(dNTP)에 노출시킴으로써 수행될 수 있다.

일부 실시예에서, 롤링 원형 증폭에 사용되는 중합 효소는 DNA 증폭을 위한 Phi29, Bst 또는 Vent exo-DNA 중합 효소 및 RNA 증폭을 위한 T7 RNA 중합 효소이다. RCA는 유리 용액과 고정된 표적(고상 증폭) 모두에서 일정한 온도(실온 ~ 37 °C)에서 수행될 수 있다. DNA RCA 반응은 일반적으로 프라이머-유도 단일 가닥 DNA 연장을 통해 진행한다.

일부 실시예에서, 유동 셀과 같은 물리적 기판 상에 로딩하기 위해 시퀀싱 기판의 콘카테머 라이브러리를 구성하는 방법이 도 19에 도시되어있다. 일부 실시예에서, 시퀀싱 기판의 콘카테머 라이브러리는 도 20에 도시 된 바와 같이 구성된다. '헤어(hair)'는 역방향 프라이머를 사용하여 생성할 수 있는 ssDNA 분자로 확장된 콘카테머 DNA와 반대 방향으로 합성된다. 이러한 '헤어'는 연결기의 크기 및/또는 제외 속성을 제어하는 데 사용할 수 있다. 일부 실시예에서, 본 명세서에 기재된 시퀀싱 반응은 ssDNA '헤어'를 주형으로 사용하여 발생한다.

RCR 반응 종료

CAT의 롤링 원형 증폭은 phi29 효소의 필수 Mg2 + 보조 인자를 킬레이트화하기 위해 EDTA의 첨가에 의해 중지될 수 있다. Phi29는 강력한 치환 중합 효소인 반면, 시퀀싱에 사용되는 표준 중합 효소(예를 들어, Therminator 9)는 약하게 치환된다. 이러한 기판을 시퀀싱하기 위한 더 많은 치환 효소는 사용되거나 조정될 수 있다.

대안적으로, 단일 가닥 결합 단백질(SSB) 또는 헬리케이즈, 또는 이들의 조합을 사용하여 치환을 도울 수 있다. 이들은 연장 반응에 추가되거나 시퀀싱을 위한 기판을 준비하기 위한 사전-인큐베이션 작업으로 사용될 수 있다.

대안적으로, 롤링 원형 반응은 표지되지 않은 가역적 종결인자를 사용하여 중지될 수 있다. 이는 솔루션 내에서 중단을 더 균일하게 만드는 방법일 수 있으며, EDTA를 사용한 중단보다 더 균일한 크기의 CAT를 생성한다. 추가적으로, 시퀀싱 반응은 차단 해제 작업으로부터 개시될 수 있고, 이어서 표지된 가역적 종결인자 뉴클레오티드로 연장될 수 있다. 이것은 합성에 의한 시퀀싱의 정상적인 반응을 위해 연장된 3 '말단이 접근 가능한 기판의 자연적 선택을 허용할 수 있다.

phi29는 CAT의 연장 단부에 매우 단단하게 결합될 수 있다. 가역적 종결인자를 사용하여 반응을 중지하면 상호 작용이 불안정해질 수 있다. 카오트로픽 염 또는 세제와 같은 다른 단백질 변성제는 시퀀싱 반응을 가능하게 하기 위해 phi29를 대체하는 데 필요할 수 있다.

콘카테머 구성

CAT(콘카테머)는 연장된 단일 가닥에 표적 DNA의 여러 동일한 카피를 가진다. CAT는 또한 위에서 설명한대로 생성된 ssDNA '헤어'에서 표적 DNA의 여러 동일한 리버스 카피(reverse copies)를 가질 수 있다.

일부 실시예에서 콘카테머는 길이가 1,000개 이상의 뉴클레오티드(400,000 개 이하)이다.

일부 실시예에서, 콘카테머는 직경이 150 nm 이상(300 nm 이하)이다. 바람직하게는, 인접한 콘카테머 사이의 배제 구역은 원하는 밀도 또는 피치를 달성하는 데 필요한 최소 중심 간 거리 이상이다.

밀집-패킹된 랜덤 어레이

어레이 제조 방법(무작위로 분포된 콘카테머의 밀집 패킹된 층)

제어된 간격

패턴화되지 않은 표면에 배열된 CAT 간의 최소 중심 간 거리의 분포를 제어하기 위한 여러 메커니즘이 제공된다. 일부 실시예에서, 이러한 방법 및 조성물은 인접한 CAT 사이의 제어 된 최소 중심 간 거리를 갖는 CAT의 균일하고 밀집된 자체 조립 랜덤 층의 형성을 용이하게 하여, 이들이 염료-표지된 시퀀싱 기판 사이의 최소 누화로 시퀀싱될 수 있도록 한다.

CAT 자체는 강한 음전하로 인해 용액에서 서로 반발하지만, 그럼에도 불구하고 표면에 흡착되면 표지된 인접 CAT의 효과적인 확산 제한 분해능을 위해 서로 너무 가까울 수 있다.

일부 실시예에서, 콘카테머는 CAT 자체의 크기 또는 포함 된 시퀀싱 기판의 카피 수를 변경하지 않으면서, 효과적인 배제 크기를 늘리기 위해 반발성(repellant) 또는 유인성(attractive) 물질의 쉘에 "내포(encased)"되거나 "포장"된다.

일부 실시예에서, CAT가 기판의 표면에 흡착하는 단백질 층은 상호 작용하는 단백질을 표면에 이격시키기 위해 변형된다. 예를 들어, CAT는 이전에 표면에 흡착된 단백질과의 상호 작용을 통해 유리, 실리콘 또는 변형된(예를 들어, 아미노-실란화) 표면과 상호 작용할 수 있다.

따라서, 결합 쌍의 단백질 파트너 또는 CAT의 변형은 CAT에 대한 특정 부착 지점 없이 표면에서 균일하고 조밀하게 패킹된 콘카테머 층을 달성하기 위한 크기 배제를 지원할 수 있다. 일부 실시예에서, 이러한 변형은 CAT 또는 그의 단백질 결합 파트너를 코팅하기 위해 PEG 또는 다당류와 같은 분자를 가교 또는 부착시키는 것을 포함한다.

도 21a에 도시된 UB는 코팅된 콘카테머를 묘사하는 실시예이다.

이 실시예에서 내부 코어는 얽힌(entwined) DNA 표적의 다중 카피일 수 있다. 외부 층, 즉 코팅은 PEG와 같은 화합물, 양극성 이온(zwitterionic) 특징을 가진 화합물, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 나노 구가 뭉치지 않도록 보증하는 내부의 핵산과 외부의 음전하와 상호 작용하는 양전하를 가진 다른 유사한 분자를 포함할 수 있다.

칩 상에 CAT의 실장

일부 실시예에서 콘카테머는 고밀도 층에서 기판의 패턴화되지 않은 표면 상에 분포된다. 이러한 밀집-패킹된 형성은 조밀하게 패킹된 시퀀싱 기판의 형성을 용이하게 하여 더 높은 처리량 및/또는 더 낮은 비용의 시퀀싱을 가능하게 한다. 일부 실시예에서, 상기 표면은 패턴화된다. 패턴화되지 않은 표면에 조밀하게 패킹된 콘카테머 층의 예시가 도 25에 도시된다.

일 실시예에서, 콘카테머는 바이오칩에 로딩되고 250 nm(+/- 25 nm의 오차)의 중심 간 거리를 가능하게 하기 위해 밀접하게 패킹된다.

일부 실시예에서, 분자 사이의 평균 중심 간 거리는 약 315 nm이다. 일부 실시 양태에서, 복수의 분석물(예를 들어, 핵산 분자)은 복수의 분석물의 인접한 분석물이 적어도 10 nm 이상, 50 nm 이상, 100 nm 이상, 110 nm 이상, 120 nm 이상, 130 nm 이상, 140 nm 이상, 150 nm 이상, 160 nm 이상, 170 nm 이상, 180 nm 이상, 190 nm 이상, 200 nm 이상, 210 nm 이상, 220 nm 이상, 230 nm 이상, 240 nm 이상, 250 nm 이상, 260 nm 이상, 270 nm 이상, 280 nm 이상, 290 nm 이상, 300 nm 이상, 310 nm 이상, 320 nm 이상, 330 nm 이상, 340 nm 이상, 350 nm 이상, 360 nm 이상, 370 nm 이상, 380 nm 이상, 390 nm 이상, 400 nm 이상, 410 nm 이상, 420 nm 이상, 430 nm 이상, 440 nm 이상, 450 nm 이상, 460 nm 이상, 470 nm 이상, 480 nm 이상, 490 nm 이상 또는 500 nm 이상의 평균 중심 간 간격을 가질 수 있도록 표면에 인접하게 고정될 수 있다. 평균 중심 간 간격은 500 nm 이하, 490 nm 이하, 480 nm 이하, 470 nm 이하, 460 nm 이하, 450 nm 이하, 440 nm 이하, 430 nm 이하, 420 nm 이하, 410 nm 이하, 400 nm 이하, 390 nm 이하, 380 nm 이하, 370 nm 이하, 360 nm 이하, 350 nm 이하, 340 nm 이하, 330 nm 이하, 320 nm 이하, 310 nm 이하, 300 nm 이하, 290 nm 이하, 280 nm 이하, 270 nm 이하, 260 nm 이하, 250 nm 이하, 240 nm 이하, 230 nm 이하, 220 nm 이하, 210 nm 이하, 200 nm 이하, 190 nm 이하, 180 nm 이하, 170 nm 이하, 160 nm 이하, 150 nm 이하, 140 nm 이하, 130 nm 이하, 120 nm 이하, 110 nm 이하, 100 nm 이하, 또는 50 nm 이하일 수 있다.

일부 실시예에서, 콘카테머는 검출 동안 누화를 최소화하기 위해 인접한 콘카테머 사이의 중심 간 거리의 더 낮은 임계 값을 달성하기 위한 코팅을 포함한다. 일부 실시예에서, 콘카테머를 표면에 결합시킨 후, 코팅이 용해되고 CAT가 표면에 부착되고 시퀀싱될 수 있다.

BSA와 같은 다른 단백질은 CAT 또는 단백질 결합 파트너에 화학적으로 가교 결합하거나, 스페이서 단백질(예를 들어, BSA)을 스트레파비딘 상호 작용(strepavidin interaction)을 통해 공통 라이브러리 어댑터 서열에 상보적인 올리고 뉴클레오티드에 부착함으로써 사용될 수 있다. BSA를 사용하여 CAT를 코팅하면 CAT의 결합된 층에서 단백질 겔을 만드는 추가 이점이 있을 수 있으며, 이는 효소 반응을 위한 국소 환경을 중합 효소가 정상적으로 작용하는 핵의 자연 환경과 더 유사하게 만들 수 있다.

공통 라이브러리 어댑터 서열에 부분적으로 상보적이고 상동성(homology)없이 그 서열을 넘어 연장되는 긴 단일 가닥 올리고 뉴클레오티드를 혼성화할 수도 있다. 일 실시예에서, 긴 단일 가닥 올리고 뉴클레오티드는 상기 언급된 헤어다. 이러한 긴 올리고 뉴클레오티드는 그것이 포함하는 서열 분석 기판의 수를 변경하지 않고 CAT의 크기를 증가시키는 작용을 할 수 있다. 표면 부착 후, 이러한 긴 올리고 뉴클레오티드는 세척될 수 있으며, 각 CAT는 부착 부위의 중심을 향해 붕괴되어 인접한 CAT 사이의 유효 중심에서 중심 거리를 증가시킬 수 있다.

DNA는 또한 예를 들어 음전하로 인해 반발성 영역(repellant areas)에 의해 분리된 유인성 단백질(attractive protein) 결합 부위를 갖는 표면을 생성하기 위해(가교 또는 스트렙-아비딘과 같은 부착에 의해) 단백질 결합 파트너를 변형시키는 데 사용될 수 있다.

조밀하게 패킹된 콘카테머 층을 패턴화되지 않은 표면에 고정

수용액에서 패턴화되지 않은 접착성 고체 표면으로의 생물학적 분석물의 최적 패킹 밀도에 대한 한계 중 하나는 표면에 대한 분석 물질의 무작위 결합이 부착된 분석 물질이 측면으로 이동하고 결합된 분자 사이의 간격을 최소화 할 수 없기 때문에 최대 밀착 포장을 제공하지 않는다는 것이다.

그러나, 단백질 및 핵산을 포함하는 많은 생물학적 분석물은 표면 활성이고 그 계면에서 표면 장력을 낮추는 공기-물 계면으로 이동하여 생체 분자의 준 안정 단일층(metastable monolayer)을 생성하는 것으로 알려져 있다. 이 경우 표면 활성 분석물은 계면에서 측면으로 자유롭게 이동하고 최대 밀착 밀도를 달성하며, 용액에서 불리한 소수성 상호 작용이 최대 패킹의 원동력이 된다.

따라서, 일부 실시예에서, 공기-물 계면에서 생체 분자의 밀집 패킹된, 자발적으로 형성된 단일층 구조물은 이미 공기와 접촉하고 있는 고체 표면을 가로 질러 생체 분자 용액의 볼루스(bolus)를 풀링(pulling) 또는 드래깅(dragging)함으로써 고체 표면으로 전달되거나 고정될 수 있다. 이에 따라 공기-물 계면에서 밀집된 생체 분자 구조는 볼루스가 고체 표면을 가로 질러 이동함에 따라 3 상(공기-물 고체) 접촉 지점에서 고체 표면에 고정된다.

일부 실시예에서, 단백질 층은 CAT가 첨가되기 전에 표면에 놓일 수 있다. 그런 다음 CAT를 이미 놓인 단백질 층에 추가할 수 있다. 이러한 순차적 첨가는 결합 단백질이 변형된 파트너인 경우 특히 효과적 일 수 있다.

시퀀싱

시퀀싱 워크 플로우

일부 실시예에서, 예를 들어 패턴화되지 않은 표면 상에 밀집 패킹된 층을 형성하고 합성에 의한 순환 시퀀싱을 수행함으로써 콘카테머로부터 폴리 뉴클레오티드 서열을 검출하는 방법이 제공된다(예를 들어, 도 23 참조). 일부 실시예에서, 상기 표면은 패턴화된다.

반복 혼성화에 기초한 표적의 검출 및 그 인증은 정량화를 위한 표적 식별 및 계수를 가능하게 하는 핵심 특징이다.

동기화 및 신호 호출(미반응 올리고뉴클레오티드의 ddNTP 캡핑)

일부 실시예에서, 합성에 의한 시퀀싱은 비확장 올리고뉴클레오티드를 캡핑하기 위해 연장 사이클 이후 비가역적 ddNTP 종결인자의 첨가를 포함한다. 예를 들어, 표지 및 저온 가역 종결인자의 혼합물로 최대 개시 및/또는 연장을 진행한 후, 연장 사이클(예를 들어, ddNTP를 더 잘 통합할 수 있는 다른 중합 효소 사용) 및 4개의 ddNTP 모두의 매우 높은 농도를 진행한다. 이 작업은 해당 사이클에서 확장하지 못한 CAT 내의 모든 시퀀싱 템플릿 확장을 비가역적으로 종료할 수 있다. 이로 인해 개시 또는 연장의 비효율성에 비례하여 신호의 점진적인 손실이 발생할 수 있다. 하지만, 중요한 것은 모든 사이클에서 확장, CAT 내의 일부 동일한 템플릿에 대한 지연 합성으로 인해 시켜 혼합 신호를 발생시키는 프로세스를 '건너 뛰는' CAT 내 템플릿의 후속 사이클에서 백그라운드를 감소시킬 수 있다는 것이다.

이 프로세스는 CAT 내의 템플릿 동기화를 증가시켜 지연 템플릿으로부터 신호를 더 적게 생성하여 시퀀스의 올바른 베이스로부터 더 순수한 신호를 생성할 수 있다. 다른 모든 것이 동일하면 더 길고 효과적인 시퀀스 읽기로 이어질 수 있다.

반응

CAT는 표적 DNA의 여러 동일한 카피를 가지고 있으나, 롤링 원형 증폭 중에 만들어진 마지막 카피는 활발하게 확장되는 3 '말단을 포함한다는 점에서 특이점이 있다. 이러한 ssCircle과 활발히 확장되는 말단은 CAT 인 DNA 볼의 중심 근처에 있을 가능성이 높으므로, 따라서, 이것은 CAT의 단층 내 배제 영역의 중심 근처에 있다. 또한, 이것은 단층이 형성되는 표면에서 멀리 떨어져 있다. 활발하게 확장되는 말단을 표면에서 멀리 들어 올리면(raising) 시퀀싱 반응에 사용되는 화학 물질 및 효소에 대한 접근성이 증가할 수 있으며 표면의 배경 형광 초점면 위로 염료 표지를 올릴 수도 있다. 이러한 특성은 단일 분자 시퀀싱에 이상적이다.

페어된 말단 시퀀싱

고유 분자 식별자(UMI) 실시예

고유 분자 식별자(UMI)는 분자에 태그를 지정하여 중복 PCR 산물의 식별을 가능하게 하고 오류를 줄이는 이중 가닥 시퀀싱 적용을 가능하게 하는 데 사용되었다.

일부 실시예에서, UMI를 포함하는 어댑터는 콘카테머를 형성하는 데 사용되는 원형화된 DNA 주형에 통합된다.

도 24에 도시된 바와 같이, 일 실시예에서 UMI A1 및 A2 어댑터는 가닥 A 및 B의 5 '및 3' 말단에 추가된다. Al 및 A2는 샘플 ID에 대한 바코드를 가질 수 있다. 또한 그들은 라이게이션/원 생성에 사용되는 영역과 두 가닥 모두를 시퀀싱 할 수 있도록 프라이머 결합 영역을 시퀀싱하는데 사용되는 영역을 가진다. 어댑터는 또한 UMI 서열을 가질 수 있다.

시퀀싱 완료 후 UMI는 동일한 DNA 단편에서 나오는 원의 위치를 파악하기 위해 사용되고, 페어된 말단 판독으로 분석될 수 있다. 페어된 말단 판독은 판독 길이가 짧은 경우 매핑에 유용하다.

비록 UMI가 사용될 수 있지만, NIPT, PCR 증폭 패널 및 게놈의 많은 부분과 같은 많은 응용은 페어된 말단 능력 없이도 안정적으로 시퀀싱될 수 있다.

이미징 및 사이클 검출

본 명세서에 기술된 바와 같이, 각각의 검출 방법 및 시스템은 서브-회절-제한 이미징을 달성하기 위해 사이클 검출(cycled detection)을 필요로 한다. 사이클 검출은 결합 및 영상화 또는 가시광 광학 신호를 방출할 수 있는 검출 가능한 표지에 결합된 항체 또는 뉴클레오티드와 같은 프로브를 포함한다. 서로 다른 사이클의 일련의 필드 이미지에서 위치 정보를 사용함으로써, 밀집 패킹된 기판으로부터의 신호를 해결하기 위한 디콘볼루션(deconvolution)은 광학 이미징의 회절 한계로 인해 가려진 신호로부터 개별적인 광학 신호를 식별하는데 효과적으로 사용될 수 있다. 분자의 정확한 위치는 다중 사이클 이후 점점 더 정확해질 것이다. 픽셀 이산화 효과(discretization effects)로 인해 발생하는 크로스토크 매트릭스에서의 알려진 비대칭에 관한 크로스토크 보정을 돕기 위해 이 정보를 사용하여, 추가 계산이 수행될 수 있다.

분석물의 광학적 검출 방법

일부 실시예에서, 광학 신호는 디지털화되고, 분석물은 각각의 분석물에 대한 디지털 신호의 코드(ID 코드)를 기반으로 식별된다.

본 명세서에 기술된 바와 같이, 분석물은 고체 기판에 고정되고 프로브는 분석물에 결합된다. 각각의 프로브는 태그를 포함하고 표적 분석물에 특이적으로 결합한다. 일부 실시예에서, 태그는 동일한 형광 색상을 방출하는 형광 분자이고, 추가 형광에 대한 신호는 각각의 후속 패스에서 검출된다. 패스 과정에서, 태그를 포함하는 프로브 세트가 기판과 접촉하여 표적에 결합할 수 있다. 기판의 이미지가 캡처되고 감지 가능한 신호가 각각의 패스 이후 획득된 이미지에서 분석된다. 검출 가능한 신호의 존재 및/또는 부재에 대한 정보는 기판에서 각 검출된 위치(예를 들어, 표적 분석물)에 대해 기록된다.

일부 실시예에서, 본 개시 내용은 태그를 포함하는 프로브로부터 방출된 광학 신호를 검출하고, 기판 상의 다양한 위치에서 다중 패스 및/또는 다중 사이클 동안 방출된 신호를 카운팅하고, 기판에서 각 표적 분석물을 식별하기 위해 K- 비트 기반 계산을 사용하여 신호를 디지털 정보로 분석하는 동작을 포함하는 방법을 포함합니다. 오류 수정은 아래에 설명된 것처럼 광학적으로-감지된 신호의 오류를 설명하는 데 사용할 수 있다.

일부 실시예에서, 기판은 N개의 표적 분석물을 포함하는 분석물과 결합된다. N 개의 표적 분석물을 검출하기 위해 M개의 사이클의 프로브 결합 및 신호 검출이 선택된다. M개의 사이클 각각은 1 회 이상의 패스를 포함하고 각 패스에는 제N 세트의 프로브가 포함되어 각 세트의 프로브가 N개의 표적 분석물 중 하나에 특이적으로 결합한다. 특정 실시예에서, N개의 표적 분석 물에 대해서 제N 세트의 프로브가 준비된다.

각 사이클에서, 각 패스에 대한 프로브 세트를 도입하기 위한 미리 결정된 순서가 있다. 일부 실시예에서, 프로브 세트에 대한 미리 결정된 순서는 랜덤 순서이다. 다른 실시예에서, 프로브 세트에 대한 미리 결정된 순서는 비 랜덤 순서이다. 일 실시예에서, 비 랜덤 순서는 컴퓨터 프로세서에 의해 선택될 수 있다. 미리 결정된 순서는 각 표적 분석물에 대한 키로 표시된다. 프로브 세트의 순서를 포함하는 키가 생성되고 프로브의 순서가 코드에서 디지털화되어 각 대상 분석물을 식별한다.

일부 실시예에서, 각각의 정렬된 프로브 세트는 표적 분석물을 검출하기 위한 별개의 태그와 연관되고, 별개의 태그의 수는 N개의 표적 분석물의 수보다 적다. 이 경우 N개의 표적 분석물 각각은 M개의 사이클에 대한 M개의 태그 시퀀스와 일치한다. 순서가 지정된 태그 시퀀스는 식별 코드로 표적 분석물과 연관된다.

광학적으로 감지된 프로브의 정량화

검출 프로세스 이후, 각 프로브 풀로부터의 신호가 계수되고, 신호의 유무 및 신호의 색상이 기판 상의 각 위치에 대해 기록될 수 있다.

검출 가능한 신호로부터, N개의 별개의 표적 분석물에 대해 M 사이클 각각에서 K 비트의 정보가 획득된다. 정보의 K 비트는 정보의 총 L 비트를 결정하는 데 사용되며, 정보의 L 비트는 KxM = L 이고

이다. L 비트의 정보는 N 개의 개별 표적 분석물의 식별(및 존재)을 결정하는 데 사용된다. 한 사이클(M = 1)만 수행하면 Kx1 = L이다. 그러나 분석물 당 더 많은 총 정보 L 비트를 생성하기 위해 여러 사이클(M > 1)을 수행할 수 있다. 이후의 각 사이클은 표적 분석물을 식별하는 데 사용되는 추가 광학 신호 정보를 제공한다.

실제로, 신호의 오류가 발생하며 이는 표적 분석물의 식별 정확도를 혼란스럽게 한다. 예를 들어, 프로브는 잘못된 표적에 바인딩하거나(예를 들어, 펄스 포지티브), 올바른 표적에 바인딩하지 못할 수 있다(예를 들어, 펄스 네거티브). 광학 및 전기 신호 감지의 오류를 설명하기 위해 아래에 설명된 방법이 제공된다.

전기적 검출 방법

다른 실시예에서, 전기적 검출 방법은 기판 상의 표적 분석물의 존재를 검출하기 위해 사용된다. 표적 분석물은 올리고 뉴클레오티드 꼬리 영역으로 태그가 지정되고 올리고 뉴클레오티드 태그는 용액의 수소 이온 농도를 측정하는 이온 민감성 전계 효과 트랜지스터(ISFET 또는 pH 센서)를 사용하여 감지된다. ISFET는 2007년 12월 14일에 출원된 미국 등록 특허 번호 7,948,015, 로스버그 등 및 2009년 5월 29일에 출원된 미국 출원 공개 번호 2010/0301398, 로스버그 등에 더욱 상세히 설명되며, 두 문헌은 전체가 참조로 본 명세서에 포함된다.

ISFET는 분석물의 식별 및 특성화를 위한 민감하고 특정한 전기적 검출 시스템을 제공한다. 일 실시예에서, 본 명세서에 개시된 전기적 검출 방법은 컴퓨터(예를 들어, 프로세서)에 의해 수행된다. 용액의 이온 농도는 ISFET의 전극에 의해 대수 전위(logarithmic electrical potential )로 변환 될 수 있으며, 전기 출력 신호가 감지되고 측정될 수 있다.

ISFET는 DNA 시퀀싱을 용이하게 하기 위해 이전에 사용되어 왔다. 단일 가닥(ss) DNA를 이중 가닥 DNA로 효소적으로 변환하는 동안, 각 뉴클레오티드가 DNA 분자에 추가될 때 수소 이온이 방출된다. ISFET는 이러한 방출된 수소 이온을 감지하고 뉴클레오티드가 DNA 분자에 추가된 시기를 결정할 수 있다. 뉴클레오시드 트리포스페이트(dATP, dCTP, dGTP 및 dTTP)의 혼입을 동기화함으로써 DNA 서열도 결정될 수 있다. 예를 들어, 단일 가닥 DNA 템플릿이 dATP에 노출되었을 때 전기적 출력 신호가 감지되지 않지만 dGTP가 있는 상태에서 전기적 출력 신호가 감지되는 경우, DNA 서열은 해당 위치에서 상보적인 시토신 염기로 구성된다.

일 실시예에서, ISFET는 프로브의 꼬리 영역을 검출한 다음 상응하는 표적 분석물을 식별하는 데 사용된다. 예를 들어, 표적 분석물은 하나 이상의 ISFET를 포함하는 집적 회로 칩과 같은 기판에 고정될 수 있다. 해당 프로브(예를 들어, 앱타머 및 꼬리 영역)가 추가되고 표적 분석물에 특이적으로 결합할 때 꼬리 영역의 전사를 위해 뉴클레오티드 및 효소(중합 효소)가 추가된다. ISFET는 방출 수소 이온을 전기 출력 신호로 감지하고 dNTP가 꼬리 영역에 통합 될 때 이온 농도의 변화를 측정한다. 방출되는 수소 이온의 양은 꼬리 부분의 길이와 정지(stops)에 해당하며, 꼬리 부분에 대한 이러한 정보를 사용하여 다양한 태그를 구별할 수 있다.

가장 단순한 유형의 꼬리 영역은 하나의 단일 중합체 염기 영역(homopolymeric base region)으로 완전히 구성되는 것이다. 이 경우 4개의 가능한 꼬리 영역이 있다: poly-A 꼬리, poly-C 꼬리, poly-G 꼬리, 및 poly-T 꼬리. 그러나 꼬리 부위에 큰 다양성을 갖는 것이 종종 바람직하다.

꼬리 영역에서 다양성을 생성하는 한 가지 방법은 꼬리 영역의 단일 중합체 염기 영역 내에 정지 염기(stop bases)를 제공하는 것이다. 정지 염기는 단일 중합체 염기 영역에 인접한 하나 이상의 뉴클레오티드를 포함하는 꼬리 영역의 일부로서, 하나 이상의 뉴클레오티드가 단일 중합체 염기 영역 내의 염기와 구별되는 염기로 구성된다. 일 실시 예에서, 정지 염기는 하나의 뉴클레오티드이다. 다른 실시예에서, 정지 염기는 복수의 뉴클레오티드를 포함한다. 일반적으로, 정지 염기는 두 개의 단일 중합체 염기 영역이 측면에 있다. 일 실시예에서, 정지 염기에 인접한 2개의 단일 중합체 염기 영역은 동일한 염기로 구성된다. 또 다른 실시예에서, 2 개의 단일 중합체 염기 영역은 2개의 상이한 염기로 구성된다. 다른 실시예에서, 꼬리 영역은 하나 이상의 정지 염기를 포함한다.

일 실시예에서, ISFET는 100개의 수소 이온의 최소 임계수를 검출할 수 있다. 표적 분석물 1은 총 201개 뉴클레오티드의 꼬리 영역 길이에 대해 100개 뉴클레오티드 폴리-A 꼬리, 1개의 시토신 염기, 다른 100개 뉴클레오티드 폴리-A 꼬리로 구성된 꼬리 영역이 있는 조성물에 결합된다. 표적 분석물 2는 200-뉴클레오티드 폴리-A 꼬리로 구성된 꼬리 영역이 있는 조성물에 결합된다. dTTP를 추가하고 폴리 뉴클레오티드 합성에 도움이 되는 조건 하에서, 표적 분석물 1과 관련된 꼬리 영역에서의 합성은 100개의 수소 이온을 방출할 수 있으며, 이는 200 개의 수소 이온을 방출할 수 있는 표적 분석물 2와 관련된 꼬리 부위의 폴리 뉴클레오티드 합성과 구별될 수 있다. ISFET는 각 꼬리 영역에 대해 다른 전기 출력 신호를 감지할 수 있다. 또한, dGTP가 추가된 후 더 많은 dTTP가 추가되면 표적 분석물 1과 관련된 꼬리 영역이 추가 폴리 뉴클레오티드 합성으로 인해 하나의 수소 이온을 방출한 다음 100 개의 더 많은 수소 이온을 방출할 수 있다. 꼬리 영역 조성을 기반으로 특정 뉴클레오시드 트리포스페이트의 추가로 생성 된 뚜렷한 전기 출력 신호를 통해 ISFET는 각 꼬리 영역에서 수소 이온을 감지할 수 있으며, 이 정보를 사용하여 꼬리 영역과 해당 표적 분석물을 식별할 수 있다.

다양한 길이의 단일 중합체 염기 영역, 정지 염기 및 이들의 조합을 사용하여 샘플에서 각 분석물에 고유하게 태그를 지정할 수 있다. 기판에서 표적 분석물을 확인하기 위한 압타머 및 꼬리 영역의 전기적 검출에 대한 추가 설명은 미국 가출원 번호 61/868,988에 설명되어 있으며, 그 전체가 참조로 본 명세서에 포함된다.

다른 실시예에서, 항체는 전술한 전기적 검출 방법에서 프로브로 사용된다. 항체는 링커 영역을 통해 태그로 작용하는 올리고 뉴클레오티드 꼬리 영역에 결합하는 1차 또는 2차 항체일 수 있다.

이러한 전기적 검출 방법은 수백(또는 심지어 수천)의 개별적인 표적 분석물의 동시 검출에 사용될 수 있다. 각 표적 분석물은 디지털 식별자와 연관될 수 있고, 고유한 디지털 식별자의 수는 샘플의 고유한 표적 분석물의 수에 비례한다. 식별자는 디지털 정보의 비트 수로 표현될 수 있으며 정렬된 꼬리 영역 세트 내에서 인코딩된다. 정렬된 꼬리 영역 세트의 각 꼬리 영역은 표적 분석물에 특이적으로 결합된 프로브 영역의 링커 영역에 특이적으로 결합하도록 순차적으로 만들어진다. 대안적으로, 꼬리 영역이 해당 프로브 영역에 공유 결합된 경우, 정렬된 꼬리 영역 세트의 각 꼬리 영역이 순차적으로 만들어져 표적 분석물에 특이적으로 결합한다.

일 실시예에서, 하나의 사이클은 폴리 뉴클레오티드 합성이 일어나고 전기적 출력 신호로 검출되는 수소 이온을 방출하는 링커 영역에 대한 꼬리 영역의 결합 및 스트리핑으로 표시된다. 따라서 표적 분석물의 식별을 위한 사이클의 수는 정렬된 꼬리 영역 세트의 꼬리 영역의 수와 같다. 정렬된 꼬리 부위 세트의 꼬리 부위 수는 식별할 대상 분석물의 수와 생성할 정보의 총 비트 수에 따라 상이하다. 또 다른 실시예에서, 하나의 사이클은 표적 분석물로부터 특이적으로 결합하고 제거되는 프로브 영역에 공유 결합된 꼬리 영역으로 표시된다.

각 사이클에서 검출된 전기적 출력 신호는 정보 비트로 디지털화되어 모든 사이클이 수행된 후, 각 꼬리 영역을 해당 링커 영역에 바인딩하고, 획득된 디지털 정보의 총 비트는 해당 표적 분석물을 식별하고 특성화하는 데 사용될 수 있다. 총 비트 수는 대상 분석 물질의 식별을 위한 식별 비트 수와 오류 수정을 위한 비트 수에 따라 다르다. 오류 수정을 위한 비트 수는 전기 출력 신호의 원하는 견고성과 정확성에 따라 선택된다. 일반적으로 오류 정정 비트의 수는 식별 비트 수의 2배 또는 3배일 수 있다.

탐지된 분석물의 순서 및 식별 디코딩

분석물을 검출하는 데 사용되는 프로브는 각 사이클에서 순서대로 기판에 도입된다. 각 표적 분석물의 프로브 순서에 대한 정보를 인코딩하는 키가 생성된다. 각 분석물에 대해 감지된 신호는 정보 비트로 디지털화될 수 있다. 신호의 순서는 정보 비트로 인코딩될 수 있는 각 분석물을 식별하는 코드를 제공한다.

오류-수정 방법

전술한 광학 및 전기적 검출 방법에서, 신호의 결합 및/또는 검출에서 오류가 발생할 수 있다. 경우에 따라 오류율은 5분의1만큼 높을 수 있다(예를 들어, 형광 신호 5개 중 1개가 올바르지 않음). 이는 5사이클 시퀀스마다 하나의 오류와 동일하다. 실제 오류율은 20 %만큼 높지는 않지만 몇 퍼센트의 오류율은 가능하다. 일반적으로 오류율은 샘플의 분석 물질 유형 및 사용된 프로브 유형을 비롯한 여러 요인에 따라 달라진다. 예를 들어, 전기적 검출 방법에서 꼬리 영역은 사이클 동안 압타머 상의 해당 프로브 영역에 적절하게 결합하지 못 할 수 있다. 광학 검출 방법에서 항체 프로브는 표적에 결합하지 않거나 잘못된 표적에 결합할 수 있다.

검출된 신호의 오류를 설명하고 패리티 비트와 같은 정보의 추가 비트를 얻기 위해 추가 사이클이 생성된다. 추가 정보 비트는 오류 수정 코드를 사용하여 오류를 수정하는 데 사용된다. 일 실시예에서, 오류 정정 코드는 시스템에서 오류를 검출하고 정정하는 데 사용되는 비-이진 순환 코드인 리드-솔로몬(Reed-Solomon) 코드이다. 다른 실시예에서, 다양한 다른 오류 정정 코드가 사용될 수 있다. 다른 오류 수정 코드는 예를 들어 블록 코드, 회선 코드, 고레이(Golay) 코드, 해밍 코드, BCH 코드, AN 코드, 리드-물러(Reed-Muller) 코드, 가파(Gappa) 코드, 하다말드(Hadamard) 코드, 월시(Walsh) 코드, 해겔바르거(Hagelbarger) 코드, 극 코드, 반복 코드, 반복 누적 코드, 삭제 코드, 온라인 코드, 그룹 코드, 확장기 코드, 고정 가중치 코드, 토네이도 코드, 저밀도 패리티 검사 코드, 최대 거리 코드, 버스트 오류 코드, 루비 변환 코드, 분수 코드 및 랩터 코드를 포함한다. 오류 제어 코딩, 2nd Ed., S. Lin 및 DJ Costello, Prentice Hall, New York, 2004 참조. 사이클을 추가하고 추가 정보 비트를 획득하여 오류 수정 방법을 보여주는 예시도 아래에 제공된다.

리드-솔로몬(Reed-Solomon) 코드의 한 예시는 4 비트 심볼을 갖는 RS(15,9) 코드를 포함하며, 여기서 n = 15, k = 9, s = 4, t = 3, n = 2s-1, k = n-2t, "n"은 기호의 수, "k"는 데이터 기호의 수, "s"는 비트 단위의 각 기호의 크기, "t"는 수정할 수 있는 오류의 수이고, "2t"는 패리티 기호의 수 이다. 9 개의 데이터 심볼(k = 9)과 6 개의 패리티 심볼(2t = 6)이 있다. base-X 숫자가 사용되고 X = 4이면 각 형광 색상은 2 비트(0 및 1)로 표시된다. 한 쌍의 색상은 2개의 상위 비트와 2개의 하위 비트를 포함하는 4비트 기호로 표시될 수 있다.

base-4가 선택되었으므로 7개의 프로브 풀 또는 7개의 색상 시퀀스를 사용하여 각 표적 분석물을 식별한다. 이 시퀀스는 3½, 4 비트 기호로 표시된다. 나머지 5½ 데이터 심볼은 0으로 설정된다. 리드-솔로몬 RS(15,9) 인코더는 12개의 추가 프로브 풀로 표시되는 6개의 패리티 기호를 생성한다. 따라서 오류 수정 fort = 3 기호를 얻으려면 총 19개의 프로브 풀(7 + 12)이 필요하다.

최대 16,384개의 개별 표적을 식별하기 위해 7개의 프로브 풀을 가정하여 오류 정정 코드 성능의 몬테카를로 시뮬레이션이 수행되었다. 이러한 시뮬레이션을 사용하여 10-5의 수정된 오류율을 달성하기 위한 최대 허용 원시 오류율(형광 표지 식별과 관련됨)이 서로 다른 패리티 비트 수에 대해 결정되었다.

일부 실시예에서, 분석물과 관련된 정보의 예상 비트(예를 들어, 프로브의 예상 순서 및 분석물에 대한 신호 유형)를 포함하는 키가 생성된다. 특정 분석물에 대한 이러한 예상 정보 비트는 대상 분석물에서 획득된 실제 L비트 정보와 비교된다. 리드-솔로몬 접근 방식을 사용하면 예상되는 정보 비트와 실제 L 비트 정보를 비교할 때 신호의 최대 오류 허용치를 허용할 수 있다.

일부 실시예에서, 리드-솔로몬 디코더는 예상 신호 시퀀스를 특정 프로브로부터 관찰된 신호 시퀀스와 비교하는 데 사용된다. 예를 들어, 7개의 프로브 풀을 사용하여 표적 분석물을 식별 할 수 있으며, 예상되는 색상 시퀀스는 14 비트로 표시되는 BGGBBYY이다. 그런 다음 오류 수정을 위해 추가 패리티 풀을 사용할 수 있다. 예를 들어, 6 개의 4 비트 패리티 기호가 사용될 수 있다.

순환 프로브 결합 및 광학 검출을 사용하는 방법 및 시스템은 미국 공개 번호 2015/0330974, 단일 분자 검출을 사용한 분자 분석 물의 디지털 분석(2015년 11월 19일 공개) 및 미국 공개 번호 2018/0252936, 가속 추적을 사용한 고속 스캐닝(2018년 9월 6일 공개)에 설명되어 있으며, 각각은 그 전체가 본원에 참고로 포함된다.

일부 실시예에서, 로우 이미지는 오버 샘플링된 이미지의 보다 정확한 결정을 용이하게 하기 위해 적어도 나이퀴스트 한계(Nyquist limit)에 있는 샘플링을 사용하여 획득된다. 나이퀴스트 한계를 초과하여 샘플링(오버 샘플링)하여 이미지를 나타내는 데 사용되는 픽셀 수를 늘리면 이미지 처리 및 표시에 사용할 수 있는 픽셀 데이터가 증가한다.

이론적으로, 대역폭 제한 신호는 나이퀴스트 속도 또는 그 이상으로 샘플링되는 경우 완벽하게 재구성 될 수 있다. 나이퀴스트 속도는 신호에서 가장 높은 주파수 성분의 두 배로 정의된다. 오버 샘플링은 해상도를 개선하고 노이즈를 줄이며 앤티 앨리어싱 필터 성능 요구 사항을 완화하여 앨리어싱 및 위상 왜곡을 방지한다. 신호가 나이퀴스트 속도의 N배로 샘플링되면 N배로 오버 샘플링된다.

따라서, 일부 실시예에서, 각 이미지는 관찰되는 광 파장의 절반 이하의 픽셀 크기로 촬영된다. 일부 실시예에서, 약 200 nm x 200 nm 미만의 픽셀 크기가 나이퀴스트 한계 이상에서 샘플링을 달성하기 위해 검출에 사용된다. 기판의 미가공 이미징 동안 적어도 나이퀴스트 한계의 주파수에서 샘플링하는 것이 여기에 설명된 시스템 또는 방법의 해상도를 최적화하는 데 바람직하다. 이것은 높은 정확도로 회절 한계 아래의 기판상의 특징을 분해하기 위해 여기에 설명된 디콘볼루션 방법 및 광학 시스템과 함께 수행될 수 있다.

상이한 사이클로부터 이미지 처리

서브-회절 제한 이미징을 달성하기 위해 본 발명에 의해 극복된 몇 가지 장벽이 있다.

픽셀화 오류(Pixelation error)는 로우 이미지에 존재하며 픽셀화로 인한 광학 신호에서 존재하는 정보의 식별을 방해한다. 본 명세서에 기술된 바와 같이 적어도 나이퀴스트 주파수에서 샘플링하고 오버 샘플링된 이미지의 생성은 각각 픽셀화 에러를 극복하는 것을 돕는다.

점-분포(PSF) 크기가 픽셀 크기(나이퀴스트 이하)보다 크고, 중앙 간 간격이 너무 작아 공간 중첩으로 인한 크로스토크가 발생하기 때문에 다양한 분자의 점-분포(PSF)는 중첩될 수 있다. 최근접 이웃 변수 회귀(중심 대 중심 크로스토크)는 여러 개의 중첩되는 광학 신호의 디콘볼루션을 돕기 위해 사용될 수 있다. 그러나 이것은 기판에서 각 분석물의 상대 위치를 알고 필드의 이미지의 정렬이 양호하면 개선될 수 있다. 일부 실시예에서, 기계 학습(예를 들어, 인공 지능 또는 "A.I.")은 다중 중첩 광 신호의 디콘볼루션을 돕는 데 사용될 수 있다. 일부 실시예에서, 기계 학습은 추가 이미지를 디콘볼루션하기 위해 프로브 결합 및 이미징의 다중 사이클에 걸쳐 입력 데이터를 처리한다.

다중 사이클 후 분자의 정확한 위치는 점점 더 정확해질 것이다. 이러한 정보를 사용하여, 픽셀 이산화 효과 및 회절 한계로 인해 발생하는 광학 신호의 공간적 중첩에서 공지된 비대칭을 보정함으로써 디콘볼루션을 돕기 위한 추가적인 계산이 수행될 수 있다. 또한 이들은 서로 다른 방출 스펙트럼으로부터 방출 스펙트럼의 중첩을 보정하는 데 사용될 수 있다.

각 분석물에 대한 고정밀 상대 위치 정보는 각 분석물에 고정된 서로 다른 프로브의 광학 신호에서 측정된 피크 분포를 생성하기 위해 서로 다른 사이클에서 동일한 필드의 이미지를 오버레이 하여 획득될 수 있다. 이 분포는 분석물의 단일 상대 위치에 해당하는 피크 신호를 생성하는 데 사용될 수 있다. 사이클의 서브 세트로부터의 이미지는 각각의 분석물에 대한 상대 위치 정보를 생성하는데 사용될 수 있다. 일부 실시예에서, 이 상대 위치 정보는 국소화 파일(localization file)에 제공된다.

각 사이클마다 필드에 대해 이미징된 특정 영역은 사이클마다 상이할 수 있다. 따라서, 각각의 이미지에 대한 분석물 위치의 식별 정확도를 향상시키기 위해, 여러 사이클에 걸쳐 필드의 이미지 사이의 정렬이 수행될 수 있다. 이 정렬로부터, 참조 파일과 비교된 오프셋 정보가 식별되고 디콘볼루션 알고리즘에 통합되어 회절 한계로 인해 가려진 광학 신호에 대한 디콘볼루션 및 신호 식별의 정확도를 더 증가시킬 수 있다. 일부 실시 예에서, 이 정보는 필드 정렬 파일(Field Alignment File)에 제공된다.

신호 검출(크로스-토크 / 최근접 이웃)

기판상의 분석물에 대한 상대 위치 정보가 정확하게 결정되고 각 사이클의 필드 이미지가 이 위치 정보와 정렬되면, 크로스토크 및 최근접 이웃 회귀를 사용하는 각 오버 샘플링된 이미지의 분석을 사용하여 각 이미지의 각 분석물로부터의 광학 신호를 정확하게 식별할 수 있다.

일부 실시예에서, 광학 시스템의 회절 한계에 의해 가려진 복수의 광학 신호는 기판 상에 고정되고 검출 가능한 표지를 포함하는 프로브에 결합된 복수의 생체 분자 각각에 대해 식별된다. 일부 실시예에서, 프로브는 뉴클레오티드가 혼입되고 일련의 사이클은 합성에 의한 단일 분자 시퀀싱을 사용하여 어레이 상에 고정된 폴리 뉴클레오티드의 서열을 결정하는데 사용된다.

이미지에 적용된 디콘볼루션 시뮬레이션

분자 밀도는 이웃 분자의 크로스토크(crosstalk)에 의해 제한된다. 도 3은 단일 분자의 시뮬레이션 이미지를 도시한다. 이러한 특정 이미지는 2X 오버 샘플링된 필터로 처리된 600nm 피치에서 단일 분자배열의 시뮬레이션이다. 8개의 인접 스팟으로의 크로스토크는 배열 피치 및 알고리즘 유형의 함수로 평균화된다.

도 4는 본 명세서에 기술된 바와 같이, 복수의 피치 및 2개의 변형된 이미지 처리 알고리즘으로 처리된 일련의 이미지이고, 첫 번째는 2X 오버 샘플링된 이미지이고, 두 번째는 디콘볼루션을 갖는 4X 오버 샘플링된 이미지이다. 도 5 는 200nm까지 피치에서 이러한 두 가지 유형의 이미지 처리에 대한 크로스토크 분석이다. 2X 오버 샘플로 25% 이하에서 허용되는 크로스토크 레벨은 275nm 이상의 피치에서 발생한다. 광학 시스템의 포인트 확산 함수를 사용하여 4X 디콘볼루션으로 25% 이하에서 허용되는 크로스토크 레벨은 210nm 이상의 피치에서 발생한다.

분자의 물리적 크기는 결합 영역의 대략 절반 크기의 스팟을 넓힐 것이다. 예를 들어, 80nm 스팟의 경우 피치가 약 40nm 증가한다. 더 작은 스팟 크기가 사용될 수 있지만, 이는 더 적은 복제가 허용되고 더 큰 조도(illumination intensity)가 필요하다는 단점이 있다. 단일 복제는 가장 간단한 시료 준비를 제공하지만 가장 큰 조도를 요구한다.

여기서 논의된 서브-회절 한계 이미징을 위한 방법은 오버 샘플링, 디콘볼루션 및 크로스토크 보정의 이미지 프로세싱 기술을 포함한다. 분석물에 대한 프로브 광학 신호 이미징의 여러 사이클로부터의 정보를 사용하여 기판상의 정확한 상대 위치 분석물의 결정을 포함하는 방법 및 시스템이 본 명세서에 설명된다. 이 정보를 사용하여, 픽셀 이산화 효과로 인해 발생하는 크로스토크 매트릭스에서의 알려진 비대칭에 관한 크로스토크 보정을 돕기 위한 추가 계산이 수행될 수 있다.

방법

일부 실시예에서, 도 6에 도시된 바와 같이, 밀집 패킹된 기판의 표면 상에 고정된 분석물의 상대 위치를 정확하게 결정하는 방법이 본 명세서에서 제공된다. 상기 방법은 먼저 표면을 포함하는 기판을 제공하는 단계를 포함하며, 상기 표면은 이산된 위치에서 표면에 고정된 복수의 분석물을 포함한다. 그 후, 상기 표면에 대한 프로브 바인딩 및 신호 검출의 복수의 사이클이 수행된다. 각 검출 사이클은 표면에 고정된 표적 분석물에 결합할 수 있는 프로브 세트와 분석물을 접촉시키는 단계; 상기 표면 상의 이산된 위치에서 상기 분석물에 결합된 개별 프로브로부터 복수의 광학 신호를 검출하기 위해 광학 시스템으로 상기 표면의 필드를 이미징하는 단계; 및 다른 검출 사이클이 수행될 경우 결합된 프로브를 제거하는 단계를 포함한다. 각각의 이미지로부터, 상기 복수의 사이클 중 적어도 2개(즉, 서브 세트)로부터 상기 필드의 이미지로부터의 상기 복수의 광학 신호 각각의 피크 위치가 검출된다. 각각의 분석물에 대한 피크의 위치는 중첩되고, 기판 상의 각 분석물의 정확한 상대 위치가 결정되는 피크 클러스터를 생성한다.

일부 실시예에서, 도 7에 도시된 바와 같이, 기판 상의 분석물에 대한 정확한 위치 정보는 이미지에 적용되는 위치 정보를 포함하는 디콘볼루션 알고리즘에 사용되어(예를 들어, 기판의 이웃 분석물 사이의 중심 간 간격을 식별하기 위해), 상기 이미지 각각으로부터 중첩되는 광학 신호를 디콘볼루션할 수 있다. 일부 실시예에서, 디콘볼루션 알고리즘은 중첩되는 광학 신호를 갖는 인접 분석물 사이의 공간 식별을 위한 최근접 이웃 변수 회귀를 포함한다.

일부 실시예에서, 도 8에 도시된 바와 같이, 분석물 검출 방법은 기판에 고정된 개별 폴리 뉴클레오티드의 시퀀싱에 적용된다.

일부 실시예에서, 광학 신호는 도 11에 도시된 바와 같이 밀집 패킹된 기판으로부터 디콘볼루션된다. 상기 단계는 도 9와 같이 4가지 섹션으로 구분될 수 있다: 1) 이미지 분석 단계, 이미지 분석 단계는 각 사이클에 대한 필드의 각 이미지로부터 오버 샘플링된 이미지를 생성, 및 이미지에서 검출된 각각의 광학 신호에 대한 피크 위치 및 강도를 포함하는 피크 파일(예를 들어, 데이터 세트)의 생성을 포함한다. 2) 국소화 파일(Localization File) 생성 단계, 국소화 파일 생성 단계는 기판상의 분석물의 정확한 상대 위치를 결정하기 위해 각각의 분석물에 대한 다수의 광학 신호 검출 사이클로부터 생성된 다수의 피크의 정렬을 포함한다. 3) 필드 정렬 파일(Field Alignment file) 생성 단계, 필드 정렬 파일 생성 단계는 상이한 검출 사이클로부터 필드의 이미지를 선택된 참조 이미지에 대해 정렬하기 위한 각 이미지에 대한 오프셋 정보를 포함한다. 4) 강도 추출(Extract Intensities) 단계, 강도 추출 단계는 디콘볼루션 모델링과 함께 오프셋 정보 및 위치 정보를 사용하여 각 오버 샘플링된 이미지에서 감지된 신호의 정확한 아이덴티티(identity)를 결정한다. “강도 추출” 단계는 또한 합성 처리 및 검출에 의한 시퀀싱의 에러를 정정하기 위해 사용된 이전 사이클 회귀와 같은 다른 에러 정정을 포함할 수 있다. 각 섹션에서 수행되는 단계는 아래에 자세히 설명되어 있다.

도 10a 및 도 11에 표시된 이미지 분석 단계에서, 각 사이클로부터의 각 필드의 이미지는 각각의 검출된 신호에 대한 픽셀 수를 증가시키고, 각 신호에 대한 피크를 선명하게 하고, 각 신호로부터 피크 강도를 식별하도록 처리된다. 이 정보는(측정된 광학 신호의 피크로부터) 각 분석 물질의 위치 측정 및 각 신호의 피크 강도로부터의 강도의 측정 값을 포함하는 각 사이클에 대한 각 필드에 대한 피크 파일을 생성하는 데 사용된다. 일부 실시예에서, 각각의 필드로부터의 이미지는 먼저배경 분리(background subtraction)을 거쳐 이미지에서 노이즈를 초기에 제거한다. 그 후, 이미지는 평활화 및 디콘볼루션을 사용하여 처리되어 오버 샘플링된 이미지를 생성하는데, 여기에는 각 이미지에서 관찰된 신호의 모델링에 기초하여 인공적으로 생성된 픽셀을 포함한다. 일부 실시예에서, 오버 샘플링된 이미지는 로우 이미지로부터 각 픽셀로부터 4픽셀, 9픽셀 또는 16픽셀을 생성할 수 있다.

각각의 로우 이미지(raw image)에서 검출되거나 오버 샘플링된 이미지에 존재하는 광학 신호로부터의 피크가 식별되고, 각각의 검출된 분석물에 대한 강도 및 위치 정보가 추가적인 처리를 위해 피크 파일에 배치된다.

일부 실시예에서, 모든 이미지에 대응하는 N개의 로우 이미지는 기판의 각 사이클 및 각 필드로부터 검출되거나 각각의 이미지화된 필드에 대해 N개의 오버 샘플링된 이미지 및 N개의 피크 파일로 출력한다. 피크 파일은 각각의 이미지에 대한 각각의 검출된 분석물의 상대 위치를 포함한다. 일부 실시예에서, 피크 파일은 또한 각각의 검출된 분석물에 대한 강도 정보를 포함한다. 일부 실시예에서, 하나의 피크 파일은 각각의 사이클에서 각 색상 및 각 필드마다 생성된다. 일부 실시 예에서, 각각의 사이클은 다중 패스를 더 포함하여, 하나의 피크 파일이 각각의 컬러에 대해 그리고 각각의 사이클에서 각각의 패스에 대한 각 필드에 대해 생성될 수 있다. 일부 실시예에서, 피크 파일은 단일 필드 내의 광학 신호로부터 피크 위치를 지정한다.

바람직한 실시예에서, 피크 파일은 각 사이클에 대해 처리된 각 오버 샘플링된 필드 이미지에서의 XY 위치 정보를 포함한다. XY 위치 정보는 오버 샘플링된 이미지로부터의 프로브(형광단과 같은)로부터 검출된 각각의 검출 가능한 표지의 위치의 추정된 좌표를 포함한다. 피크 파일은 각각의 개별 검출 가능한 표지로부터의 신호로부터의 강도 정보를 포함할 수 있다.

오버 샘플링된 이미지의 생성은 픽셀화로 인해 추출될 수 없는 정보를 식별하기 위해 픽셀화 오류를 극복하는 데 사용된다. 평활화 및 디콘볼루션으로 로우 이미지를 초기 처리하면 피크 파일에 보다 정확한 정보를 제공하여 각 분석물의 위치를 보다 정확하게 결정할 수 있으며, 그리고 이러한 정보는 이후 회절 제한 이미징에서 가려진 신호의 보다 정확한 결정을 제공하기 위해 사용될 수 있다.

일부 실시예에서, 로우 이미지는 오버 샘플링된 이미지의 보다 정확한 결정을 용이하게 하기 위해 적어도 나이퀴스트 한계에 있는 샘플링을 사용하여 획득된다. 나이퀴스트 한계를 초과하여 샘플링하여 이미지를 나타내는 데 사용되는 픽셀 수를 늘리면(오버 샘플링) 이미지 처리 및 표시에 사용할 수 있는 픽셀 데이터가 증가한다.

이론적으로 대역폭-제한 신호는 나이퀴스트 속도 또는 그 이상으로 샘플링하면 완벽하게 재구성될 수 있다. 나이퀴스트 속도는 신호에서 가장 높은 주파수 성분의 두 배로 정의된다. 오버 샘플링은 안티 앨리어싱 필터 성능 요구 사항을 완화하여 해상도를 개선하고 노이즈를 줄이며 앨리어싱 및 위상 왜곡을 방지한다. 나이퀴스트 속도의 N배로 샘플링된 신호는 N배로 오버샘플링 된다.

따라서, 일부 실시예에서, 각각의 이미지는 관찰되는 광 파장의 절반 이하의 픽셀 크기로 촬영된다. 일부 실시예에서, 나이퀴스트 한계 또는 그 이상에서 샘플링을 달성하기 위해 200 nm x 200 nm의 픽셀 크기가 검출에 사용된다.

평활화는 근사화 함수를 사용하여 데이터에서 중요한 패턴을 캡처하는 동시에 노이즈 또는 기타 미세한 구조/급속한 현상을 배제한다. 평활화에서는 신호의 데이터 점이 수정되어 개별 점이 줄어들고, 인접한 점보다 낮은 점이 증가하여 신호가 더 평활화된다. 본 명세서에서 평활화는 신호로부터 피크 및 강도를 더 잘 식별하기 위해 각 이미지에서 검출된 회절 제한 광학 신호를 평활화하기 위해 사용된다.

각각의 로우 이미지는 회절이 제한되지만, 상이한 사이클로부터 동일한 분석물로부터 다수의 신호를 수집하는 방법이 본 명세서에 기재되어있다. 이 방법의 실시예는 도 10b의 흐름도에 도시되어 있다. 각각의 분석물로부터의 이들 다중 신호는 각각의 개별 이미지로부터의 회절 제한 신호보다 훨씬 더 정확한 위치를 결정하는데 사용된다. 이들은 5nm 미만의 해상도에서 필드 내의 분자를 식별하는 데 사용될 수 있다. 이 정보는 도 11에 도시된 바와 같이 국소화 파일로 저장된다. 그런 다음 크로스토크 회귀 및 최근접 변수 회귀와 같은, 디콘볼루션 알고리즘과 함께 고도의 정확한 위치 정보를 사용하여 각 개별 필드 이미지의 신호 식별을 크게 개선할 수 있다.

도 11에 도시된 바와 같이, 국소화 파일을 생성하는 단계는 피크 파일에 제공된 위치 정보를 사용하여 기판상의 분석물 세트의 상대 위치를 결정한다. 일부 실시예에서, 각각의 국소화 파일은 기판의 단일 이미지 필드로부터의 분석물 세트로부터 상대 위치를 포함한다. 국소화 파일은 여러 사이클의 위치 정보를 결합하여 회절 한계 미만에서 검출된 분석물에 대해 매우 정확한 위치 정보를 생성한다.

일부 실시예에서, 각각의 분석물에 대한 상대 위치 정보는 평균적으로 10nm 미만의 표준 편차(즉, RMS 또는 제곱 평균 제곱)로 결정된다. 일부 실시예에서, 각각의 분석물에 대한 상대 위치 정보는 평균적으로 10nm 2X 표준 편차 미만으로 결정된다. 일부 실시예에서, 각각의 분석물에 대한 상대 위치 정보는 평균적으로 10nm 3X 표준 편차 미만으로 결정된다. 일부 실시예에서, 각각의 분석물에 대한 상대 위치 정보는 10nm 중앙 표준 편차 미만으로 결정된다. 일부 실시예에서, 각각의 분석물에 대한 상대 위치 정보는 10nm 중앙값 2X 표준 편차 미만으로 결정된다. 일부 실시예에서, 각각의 분석물에 대한 상대 위치 정보는 10nm 중앙값 3X 표준 편차 미만으로 결정된다.

상이한 사이클의 필드에 대한 피크 파일의 서브 세트에서 국소화 파일이 생성되어 어레이에서 분석물의 위치를 결정한다. 도 11에 도시된 바와 같이, 일부 실시예에서, 피크 파일은 먼저 광학 시스템에서의 수차를 설명하기 위해 포인트 확산 함수를 사용하여 정규화된다. 정규화된 피크 파일은 피크 파일에 제공된 위치 및 강도 정보에 기초하여 인공 정규화된 이미지를 생성하는데 사용될 수 있다. 그런 다음 각 이미지가 정렬된다. 일부 실시예에서, 정렬은 각각의 이미지 쌍을 상관시키고 미세 조정을 수행함으로써 수행될 수 있다. 일단 정렬되면, 각 사이클로부터 각각의 분석물에 대한 위치 정보가 오버레이되어 기판상의 위치 측정의 분포를 제공할 수 있다. 이 분포는 기판에서 분석물의 매우 정확한 상대 위치를 제공하는 단일 피크 위치를 결정하는 데 사용된다. 일부 실시예에서, 단일 피크를 결정하기 위해 포아송 분포(Poisson distribution)가 각각의 분석물에 대한 오버레이 위치에 적용된다.

사이클로부터 위치 정보의 적어도 서브 세트로부터 결정된 피크는 위치 결정 파일에 기록되며, 이는 회절 한계 미만의 정확도를 갖는 각각의 검출된 분석 물의 상대 위치의 측정치를 포함한다. 설명된 바와 같이, 이 정보를 결정하기 위해서는 서브 세트의 사이클로부터의 이미지가 필요하다.

도 11에 도시된 바와 같이, 각 사이클 및 컬러에 대한 각 필드로부터의 정규화된 피크 파일 및 정규화된 국소화 파일은 필드의 참조 이미지에 대한 필드로부터 각 이미지에 대한 오프셋 정보를 생성하는데 사용될 수 있다. 이 오프셋 정보는 밀집 패킹된 기판 및 회절 제한 이미지로부터의 신호 식별의 추가적인 개선을 위한 각각의 로우 이미지에서 분석물의 상대 위치 결정의 정확도를 향상시키기 위해 사용될 수 있다. 일부 실시예에서, 이러한 오프셋 정보는 필드 정렬 파일로서 저장된다. 일부 실시예에서, 조합된 국소화 파일 및 필드 정렬 파일로부터의 필드에서의 각각의 분석물의 위치 정보는 10nm RMS 미만, 5nm RMS 미만, 또는 2nm RMS 미만이다.

일부 실시예에서, 필드 정렬 파일은 필드로부터 마스터 파일에 대한 오프셋 정보를 결정함으로써 단일 필드로부터의 이미지들의 정렬에 의해 생성된다. 각 필드마다 하나의 필드 정렬 파일이 생성된다. 이러한 파일은 모든 사이클에서 필드의 모든 이미지에서 생성되며 필드의 참조 이미지에 대한 필드의 모든 이미지에 대한 오프셋 정보를 포함한다.

일부 실시예에서, 정렬 전에, 각각의 피크 파일은 포인트 확산 함수로 정규화되고, 이어서 정규화된 피크 파일로부터 인공 이미지가 생성되고 인공 이미지의 푸리에 변환이 이어진다. 정규화된 피크 파일의 인공 이미지의 푸리에 변환은 대응하는 필드에 대한 정규화된 국부화 파일로부터 인공 이미지의 푸리에 변환의 콤플렉스 컨쥬게이트(complex conjugate)와 관련된다. 이는 각 사이클에 대해 피크 파일마다 수행된다. 결과 파일은 이미지 파일을 재생성하기 위해 역 푸리에 변환을 거치며, 이미지 파일은 필드에서 참조 파일을 기준으로 정렬되어 각 이미지 파일에 대한 오프셋 정보를 생성한다. 일부 실시예에서, 이러한 정렬은 참조 파일에 대한 미세 조정을 포함한다.

필드 정렬 파일은 따라서 오버 샘플링된 각각의 이미지에 대한 오프셋 정보를 포함하고, 대응하는 필드에 대한 국소화 파일과 함께 사용되어 후속 "강도 추출 "단계에서 사용하기 위해 각 분석물에 대해 매우 정확한 상대 위치를 생성할 수 있다.

예를 들어, 한 필드에서 20사이클이 수행되고, 4개의 컬러 각각에 대해 하나의 이미지가 생성되어 80개의 필드 이미지가 생성되는 경우, 필드를 촬영한 모든 80개 이미지(20사이클 * 4컬러)에 대해 하나의 필드 정렬 파일이 생성된다. 일부 실시예에서, 필드 정렬 파일 내용은 필드, 각각의 이미지에 대해 관찰된 색상, 사이클 검출(예를 들어, 바인딩 또는 스트리핑)의 단계 유형, 및 참조 이미지에 대한 이미지 오프셋 좌표를 포함한다.

일부 실시예에서, 정렬 프로세스 동안, 2개의 이미지들을 정렬하는데 필요한 XY "시프트" 또는 "잔차(residual) "가 계산되고, 나머지 이미지들에 대해 프로세스는 반복되고, 모든 것에 적용하기 위해 최적 적합 잔차가 계산된다.

일부 실시예에서, 임계 값을 초과하는 잔차가 폐기되고, 최적 적합이 다시 계산된다. 이러한 과정은 모든 개별 잔차가 임계 값 내에 올 때까지 반복된다.

그런 다음 각 오버 샘플링된 이미지는 국소화 파일로부터의 정확한 위치 정보와 필드 정렬 파일로부터 오프셋 정보를 사용하여 디콘볼루션된다. 강도 추출 단계의 실시예가 도 10c 및 도 11에 도시되어있다. 중심 간 간격이 너무 작아 인접 분석물로부터의 신호의 포인트 확산 함수가 중첩되므로 다양한 분자의 포인트 확산 함수(PSF)이 중첩된다. 정확한 분석물 위치 정보 및/또는 오프셋 정보와 조합된 최근접 이웃 변수 회귀는 회절 한계로 인한 분해능을 억제하는 중심 간 거리를 갖는 인접 분석 물질로부터 신호를 분리하기 위해 사용될 수 있다. 각각의 분석물에 대한 정확한 상대 위치 정보의 사용은 회절 한계 아래의 이웃 분석물로부터의 광학 신호의 공간적 디콘볼루션을 용이하게 한다. 일부 실시예에서, 인접 분석물의 상대 위치는 인접 분석물의 정확한 중심 간 거리를 결정하는데 사용되며, 이는 각각의 개별 이미지로부터의 신호의 디콘볼루션(deconvolution)에 사용하기 위해 인접 분석물 사이의 공간적 크로스토크를 추정하기 위해 광학 시스템의 포인트 확산 함수와 조합하여 사용될 수 있다. 이는 폴리 뉴클레오티드 시퀀싱과 같은 광학적 검출 기술을 위한 회절 한계 미만의 분석물 밀도를 갖는 기판의 사용을 가능하게 한다.

특정 실시예에서, 방출 스펙트럼은 상이한 신호들 사이에서 중첩된다(즉, "크로스토크"). 예를 들어, 합성에 의한 시퀀싱 동안, 시퀀싱 공정에 사용된 4가지 염료는 전형적으로 방출 스펙트럼에서 약간 중첩된다.

특정 실시예에서, 서로 다른 컬러 채널간에 크로스토크가 발생하고 서로 다른 이미지 세트에 대해 크로스토크가 다른 경우 사이클 동안 획득한 이미지 세트에서 서로 다른 피처에 색상(예를 들어, 염기 콜, base call)을 할당하는 문제는 사용된 각각의 상이한 검출 가능한 표지로부터의 광학 신호로부터 겹치는 방출 스펙트럼을 제거하기 위해 각각의 오버 샘플링된 이미지에 대한 국소화 및 필드 정렬 파일과 함께 크로스토크 회귀에 의해 해결될 수 있다. 이는 기판상의 각각의 분석 물에 결합 된 각각의 프로브에 대한 검출 가능한 표지 아이덴티티(label identity)의 식별 정확도를 추가로 증가시킨다.

따라서, 일부 실시예에서, 본 명세서에 개시된 바와 같은 사이클로부터 필드의 단일 이미지로부터 신호의 강도 및/또는 신호의 식별은 다음 특징을 사용한다: 1) 오버 샘플링된 이미지 - 정의된 위치에서 강도와 신호를 제공함. 2) 정확한 상대 위치 - 국소화 파일(사이클의 적어도 일부 서브 세트의 정보에서 위치 정보를 제공함) 및 필드 정렬 파일(필드의 모든 이미지에 대한 오프셋/정렬 정보를 제공함). 3) 이미지 처리 - 필드에서 각 분석물에 대한 정확한 상대 위치 정보를 사용하는 최근접 이웃 변수 회귀(공간 디콘볼루션) 및 크로스토크 회귀(방출 스펙트럼 디콘볼루션). 각 분석물에 대한 프로브(예를 들어, 검출용 항체 또는 시퀀싱용 상보적 뉴클레오티드)의 정확한 식별.

이미지 처리 시뮬레이션

본 명세서에 개시된 방법 및 시스템의 효과는 도 12a, 도 12b, 도 13a 및 도 13b에 도시된 시뮬레이션된 크로스토크 플롯으로 도시되어 있다. 이들 각각의 도면에, 10um X 10um 영역에서 각각의 검출된 분석물에서 4개의 형광단 중 하나와 상관된 방출 스펙트럼의 세기를 나타내는 크로스토크 플롯이 도시되어 있다. 4개의 형광단 중 하나에 대응하는 각각의 축은 플롯의 각 코너로 연장된다. 따라서, 플롯의 중앙에 위치한 스팟은 4개의 모든 형광단에서 동일한 강도의 기여도를 가진다. 이미징 사이클 동안 개별 형광단으로부터 검출된 방출 강도는 스팟을 X, Y; X, -Y; -X, Y; 또는 -X, -Y 방향으로 이동 시키도록 할당된다. 따라서, 이들 4개의 축을 따라 스팟 집단의 분리는 분석물 위치에서 형광단으로부터 명확한 디콘볼루션된 신호를 나타낸다. 각각의 시뮬레이션은 10.075 um x 10.075 um 영역에서 1024 분자의 검출에 기초하여, 마이크론 제곱 당 10.088 분자의 밀도, 또는 약 315nm의 분자 사이의 평균 중심 간 거리를 나타낸다. 이것은 200nm x 200nm의 픽셀 크기에서 약 62 x 62 픽셀의 이미징 영역과 관련이 있다.

일부 실시예에서, 분자 사이의 평균 중심 간 거리는 약 150 nm 내지 약 500 nm이다. 일부 실시예에서, 분자 사이의 평균 중심 간 거리는 약 150nm 내지 약 175nm, 약 150nm 내지 약 200nm, 약 150nm 내지 약 225nm, 약 150nm 내지 약 250nm, 약 150nm 내지 약 275nm, 약 150 nm 내지 약 300 nm, 약 150 nm 내지 약 325 nm, 약 150 nm 내지 약 350 nm, 약 150 nm 내지 약 375 nm, 약 150 nm 내지 약 400 nm, 약 150 nm 내지 약 500nm, 약 175nm 내지 약 200nm, 약 175nm 내지 약 225nm, 약 175nm 내지 약 250nm, 약 175nm 내지 약 275nm, 약 175nm 내지 약 300nm, 약 175nm 내지 약 325nm , 약 175nm 내지 약 350nm, 약 175nm 내지 약 375nm, 약 175nm 내지 약 400nm, 약 175nm 내지 약 500nm, 약 200nm 내지 약 225nm, 약 200nm 내지 약 250nm, 약 200 nm 내지 약 275 nm, 약 200 nm 내지 약 300 nm, 약 200 nm 내지 약 325 nm, 약 200 nm 내지 약 350 nm, 약 200 nm 내지 약 375 nm, 약 200 nm 내지 약 400 nm, 약 200 nm 약 500 nm, 약 225 nm 내지 약 250 nm, 약 225 nm 내지 약 275 nm, 약 225 nm 내지 약 300 nm, 약 225 nm 내지 약 325 nm, 약 225 nm 내지 약 350 nm, 약 225 nm 내지 약 375 nm, 약 225 nm 내지 약 400 nm, 약 225 nm 내지 약 500 nm, 약 250 nm 내지 약 275 nm, 약 250 nm 내지 약 300 nm, 약 250 nm 내지 약 325 nm, 약 250 nm 내지 약 350 nm, 약 250 nm 내지 약 375 nm, 약 250nm 내지 약 400nm, 약 250nm 내지 약 500nm, 약 275nm 내지 약 300nm, 약 275nm 내지 약 325nm, 약 275nm 내지 약 350nm, 약 275nm 내지 약 375nm, 약 275 nm 내지 약 400 nm, 약 275 nm 내지 약 500 nm, 약 300 nm 내지 약 325 nm, 약 300 nm 내지 약 350 nm, 약 300 nm 내지 약 375 nm, 약 300 nm 내지 약 400 nm, 약 300 nm 내지 약 500nm, 약 325nm 내지 약 350nm, 약 325nm 내지 약 375nm, 약 325nm 내지 약 400nm, 약 325nm 내지 약 500nm, 약 350nm 내지 약 375nm, 약 350nm 내지 약 400 nm, 약 350 nm 내지 약 500 nm, 약 375 nm 내지 약 400 nm, 약 375 nm 내지 약 500 nm, 또는 약 400 nm 내지 약 500 nm이다. 일부 실시예에서, 분자 사이의 평균 중심 간 거리는 약 150nm, 약 175nm, 약 200nm, 약 225nm, 약 250nm, 약 275nm, 약 300nm, 약 325nm, 약 350nm, 약 375 nm, 약 400 nm, 또는 약 500 nm이다. 일부 실시예에서, 분자 사이의 평균 중심 간 거리는 적어도 약 150nm, 약 175nm, 약 200nm, 약 225nm, 약 250nm, 약 275nm, 약 300nm, 약 325nm, 약 350 nm, 약 375 nm 또는 약 400 nm이다. 일부 실시예에서, 분자 사이의 평균 중심 간 거리는 최대 약 175nm, 약 200nm, 약 225nm, 약 250nm, 약 275nm, 약 300nm, 약 325nm, 약 350nm, 약 375 nm, 약 400 nm 또는 약 500 nm이다.

도 12a는 로우 이미지에서 검출된 광학 신호로부터 4개의 형광단 사이의 형광단 세기의 크로스토크 플롯을 도시한다. 도 12b 및 도 13a는 각각 4X 오버 샘플링된 이미지를 생성함으로써 달성된 4개의 형광단 사이의 분리를 도시하며, 이는 각각의 분석물에서 크로스토크의 일부 제거의 달성을 나타낸다. 도 13b는 동일한 이미징 영역에 대한 디콘볼루션 및 최근접 이웃 회귀를 갖는 크로스토크 플롯을 도시하며, 도 11에 도시되고 본 명세서에 기술된 바와 같이 수행된다. 도 13a 및 도 12a를 비교하면, 검출된 각각의 분석물은 다른 형광단으로부터 광학 신호의 명확한 분리를 보여, 각각의 분석물에 대해 매우 정확한 형광단 식별을 나타낸다.

도 14a 및 도 14b는 위에서 시뮬레이션한 각 검출된 10.075 um x 10.075 um 영역의 시뮬레이션된 4색 합성(4-color composite)을 도시한다. 이는 로우 이미지(도 14a) 및 본원에 기술된 바와 같이 처리된 이미지(도 14b)로부터의 분석물 사이의 선명도를 시각적으로 나타낸다.

시퀀싱

상기 내용 및 도 11에 서술된 방법은 또한 밀집 패킹된 폴리 뉴클레오티드를 포함하는 기판상의 성장하는 상보성 가닥에 포함된 상보적 가역적 종결인자의 광학적 검출을 사용하는 합성에 의한 시퀀싱을 용이하게 한다. 따라서, 회절 한계 미만의 중심 간 거리에서 이웃하는 폴리 뉴클레오티드의 서열과 상관 관계가 있는 신호는 본 명세서에 기재된 방법 및 광학적 검출 시스템을 사용하여 신뢰성있게 검출될 수 있다. 시퀀싱 동안의 이미지 프로세싱은 또한 시퀀싱 반응 또는 검출에서의 에러를 보정하기 위해 기판상에서 반복된 클론 서열 또는 데이터 자체에 기초한 이전 사이클 회귀를 포함할 수 있다. 일부 실시예에서, 시퀀싱을 위해 기판에 고정된 폴리 뉴클레오티드는 콘카테머(concatemers)이다. 콘카테머는 서열 분석될 폴리 뉴클레오티드의 다수의 동일한 복제를 포함할 수 있다. 따라서, 본 명세서에 기술된 방법 및 시스템에 의해 식별 된 각각의 광학 신호는 혼입된 뉴클레오티드로부터 단일 검출 가능한 표지(예를 들어, 형광단)을 지칭할 수 있거나, 또는 단일 콘카테머의 다수의 위치에 결합된 다수의 검출 가능한 표지를 지칭할 수 있으며, 신호는 여러 위치의 평균이다. 발생해야 하는 분해능은 개별 감지 가능한 표지 사이가 아니라 기판에 고정된 다른 콘카테머 사이이다.

일부 실시예에서, 시퀀싱될 단일 또는 다중 복제 분자는 표면상의 올리고 뉴클레오티드를 포획하기 위해 혼성화(hybridizing)함으로써 공유 결합에 의해, 또는 다른 비공유 결합에 의해 표면에 결합될 것이다. 결합된 분자는 수백 사이클 동안 표면에 남아있을 것이며, 초기 시퀀싱 프라이머를 스트리핑한 후, 상이한 변이체의 존재를 확인하기 위해 다른 프라이머 세트로 다시 조사될 수 있다.

일 실시예에서, 형광단 및 블록킹 기는 화학 반응을 사용하여 제거될 수 있다.

다른 실시예에서, 형광단 및 블록킹 기는 UV 광을 사용하여 제거될 수 있다.

일 실시예에서, 시퀀싱 될 분자는 직경이 50-100 nm인 반응성 표면에 고정될 수 있고, 이러한 영역은 150-300 nM의 피치로 이격될 수 있다. 이들 분자는 표적 디콘볼루션을 위해 그 위에 부착된 바코드 및 시퀀싱을 개시하기 위한 시퀀싱 프라이머 결합 영역을 가질 수 있다. 버퍼는 신장 반응(extension reaction)을 가능하게 하기 위해 적절한 양의 DNA 폴리머라제를 포함할 수 있다. 이들 부위는 이용 가능한 임의의 유전자 증폭 방법(PCR, 전체 게놈 증폭 등)에 의해 생성될 시퀀싱될 표적의 10-100 카피를 포함할 수 있다.

다른 실시예에서, 바코드 및 프라이머 어닐링 부위로 태그된 단일 표적 분자는 60-150 nM의 피치로 이격된 20-50 nM 직경의 반응성 표면에 고정될 것이다. 분자는 개별적으로 서열 분석될 것이다.

일 실시예에서, 프라이머는 표적에 결합할 것이고 단일 또는 다중 형광단(들)과 함께 한 번에 하나의 dNTP를 사용하여 연장될 수 있다. 표면은 이미지화될 것이고, 형광단은 제거되고 세척될 것이며 프로세스는 반복되어 제2 연장부를 생성할 것이다. 동일한 dNTP에 다수의 형광단이 존재하면 게놈의 일부 영역(2 - 5 이상)에 존재하는 반복 뉴클레오티드의 수를 정의할 수 있다.

다른 실시예에서, 프라이머 어닐링 후, 형광단 및 차단된 3' 하이드록실기를 갖는 4개의 dNTP가 모두 폴리머라제 연장 반응에 사용될 것이며, 표면이 이미지화되고 형광단 및 블록킹 기가 제거되고, 공정이 복수 사이클 동안 반복된다.

다른 실시예에서, 서열은 주어진 위치에서 특정 뉴클레오티드의 존재에 기초하여 연결되는 특정 프로브를 어닐링하는 라이게이션 반응(ligation reactions)에 기초하여 추론될 수 있다.

전술한 기술을 사용하여 종래 기술의 랜덤 어레이에 비해 개선된 밀도를 갖는 랜덤 어레이가 사용될 수 있지만, 랜덤 어레이는 일반적으로 정렬된 어레이의 면적 밀도가 4배 내지 10배 감소된다. 랜덤 어레이의 장점은 칩을 위한 균일하고 패턴화되지 않은 표면과 더 긴 가닥의 배제 특성에 의존할 필요가 없기 때문에 더 짧은 핵산 가닥의 사용을 포함한다.

컴퓨터 시스템

본 명세서는 본 개시의 방법을 구현하도록 프로그래밍된 컴퓨터 시스템을 제공한다. 도 28은 여기에 설명된 방법을 지시하고 여기에 설명된 시스템을 활용하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템(2801)을 도시한다. 컴퓨터 시스템(2801)은 예를 들어 본 명세서에 설명된 프로브 결합의 사이클을 지시하는 것과 같이 본 개시의 다양한 측면을 조절할 수 있다. 컴퓨터 시스템(2801)은 사용자의 전자 장치 또는 전자 장치에 대해 원격으로 위치하는 컴퓨터 시스템일 수 있다. 전자 장치는 모바일 전자 장치일 수 있다.

컴퓨터 시스템(2801)은 중앙 처리 장치(CPU, 또한 여기서 "프로세서"및 "컴퓨터 프로세서")(2805)를 포함한다. 중앙 처리 장치(2805)는 단일 코어 또는 멀티 코어 프로세서, 또는 병렬 처리를 위한 복수의 프로세서일 수 있다. 컴퓨터 시스템(2801)은 또한 메모리 또는 메모리 로케이션(2810)(예 : 랜덤 액세스 메모리, 읽기 전용 메모리, 플래시 메모리), 전자 저장 유닛(2815)(예 : 하드 디스크), 하나 이상의 다른 시스템과의 통신을 위한 통신 인터페이스(2820)(예 : 네트워크 어댑터), 및 캐시, 다른 메모리, 데이터 저장 장치 및/또는 전자 디스플레이 어댑터와 같은 주변 장치(2825)를 포함한다. 메모리(2810), 저장 유닛(2815), 인터페이스(2820) 및 주변 장치(2825)는 마더 보드와 같은 통신 버스(솔리드 라인)를 통해 CPU(2805)와 통신한다. 저장 유닛(2815)은 데이터를 저장하기 위한 데이터 저장 유닛(또는 데이터 저장소)일 수 있다. 컴퓨터 시스템(2801)은 통신 인터페이스(2820)의 도움으로 컴퓨터 네트워크( "네트워크")(2830)에 작동 가능하게 결합될 수 있다. 네트워크(2830)는 인터넷, 인터넷 및/또는 엑스트라 넷, 또는 인터넷과 통신하는 인트라넷 및/또는 엑스트라 넷일 수 있다. 네트워크(2830)는 일부 경우에 통신 및/또는 데이터 네트워크이다. 네트워크(2830)는 클라우드 컴퓨팅과 같은 분산 컴퓨팅을 가능하게 할 수 있는 하나 이상의 컴퓨터 서버를 포함 할 수 있다. 네트워크(2830)는 일부 경우에 컴퓨터 시스템(2801)의 도움으로 피어-투-피어 네트워크를 구현할 수 있으며, 이는 컴퓨터 시스템(2801)에 연결된 장치가 클라이언트 또는 서버로 동작하도록 할 수 있다.

CPU(2805)는 프로그램 또는 소프트웨어로 구현될 수 있는 일련의 기계 판독 가능 명령을 실행할 수 있다. 명령은 메모리(2810)와 같은 메모리 로케이션에 저장될 수 있다. 명령은 CPU(2805)에 지시될 수 있으며, 이는 본 개시의 방법을 구현하기 위해 CPU(2805)를 후속 적으로 프로그래밍하거나 그렇지 않으면 구성할 수 있다. CPU(2805)에 의해 수행되는 동작의 예는 페치(fetch), 디코딩, 실행 및 쓰기 저장(writeback)을 포함할 수 있다.

CPU(2805)는 집적 회로와 같은 회로의 일부일 수 있다. 시스템(2801)의 하나 이상의 다른 구성 요소가 회로에 포함될 수 있다. 몇몇 케이스에서, 회로는 ASIC(application specific integrated circuit)이다.

저장 유닛(2815)은 드라이버, 라이브러리 및 저장된 프로그램과 같은 파일을 저장할 수 있다. 저장 유닛(2815)은 사용자 데이터, 예를 들어 사용자 선호도 및 사용자 프로그램을 저장할 수 있다. 일부 경우에 컴퓨터 시스템(2801)은 인트라넷 또는 인터넷을 통해 컴퓨터 시스템(2801)과 통신하는 원격 서버에 위치하는 것과 같이 컴퓨터 시스템(2801) 외부에 있는 하나 이상의 추가 데이터 저장 유닛을 포함할 수 있다.

컴퓨터 시스템(2801)은 네트워크(2830)를 통해 하나 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예를 들어, 컴퓨터 시스템(2801)은 사용자의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 예시는 개인용 컴퓨터(예를 들어, 휴대용 PC), 슬레이트 또는 태블릿 PC(예를 들어, Apple® iPad, Samsung® Galaxy Tab), 전화기, 스마트 폰(예를 들어, Apple® iPhone, Android 지원 장치, Blackberry®) 또는 개인용 디지털 비서를 포함한다. 사용자는 네트워크(2830)를 통해 컴퓨터 시스템(2801)에 액세스 할 수 있다.

여기에 설명된 방법은 예를 들어 메모리(2810) 또는 전자 저장 유닛(2815)과 같은 컴퓨터 시스템(2801)의 전자 저장 위치에 저장된 기계(예를 들어, 컴퓨터 프로세서) 실행 코드에 의해 구현 될 수 있다. 기계 실행 가능 코드 또는 기계 판독 가능 코드는 소프트웨어 형태로 제공될 수 있다. 사용 중에 코드는 프로세서(2805)에 의해 실행될 수 있다. 몇몇 케이스에서, 코드는 저장 유닛(2815)으로부터 검색될 수 있고 프로세서(2805)에 의한 준비된 액세스를 위해 메모리(2810)에 저장 될 수 있다. 몇몇 케이스에서, 전자 저장 유닛(2815)은 배제 될 수 있고, 기계 실행 가능 명령이 메모리(2810)에 저장된다.

코드는 코드를 실행하도록 적응된 프로세서를 가진 기계와 함께 사용하기 위해 미리 컴파일되고 구성될 수 있거나 런타임 동안 컴파일될 수 있다. 코드는 사전 컴파일 또는 컴파일된 방식으로 코드를 실행할 수 있도록 선택할 수 있는 프로그래밍 언어로 제공될 수 있다.

컴퓨터 시스템(2801)과 같은 여기에 제공된 시스템 및 방법의 실시예는 프로그래밍으로 구현될 수 있다. 기술의 다양한 측면은 일반적으로 기계(또는 프로세서) 실행 가능 코드 및/또는 기계 판독 가능 매체의 유형에서 수행되거나 구현되는 관련 데이터의 형태인 "제품"또는 "제조품"으로 간주될 수 있다. 기계 실행 가능 코드는 메모리(예 : 읽기 전용 메모리, 랜덤 액세스 메모리, 플래시 메모리) 또는 하드 디스크와 같은 전자 저장 장치에 저장할 수 있다. "스토리지"유형 미디어는 소프트웨어 프로그래밍을 위해 언제든지 비 일시적 스토리지를 제공할 수 있는 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 등과 같은 컴퓨터, 프로세서 등의 유형 메모리 중 일부 또는 전부를 포함할 수 있다. 소프트웨어의 전부 또는 일부는 때때로 인터넷 또는 다양한 기타 통신 네트워크를 통해 통신될 수 있다. 예를 들어, 이러한 통신은 하나의 컴퓨터 또는 프로세서에서 다른 컴퓨터로, 예를 들어 관리 서버 또는 호스트 컴퓨터에서 애플리케이션 서버의 컴퓨터 플랫폼으로 소프트웨어를 로드할 수 있도록 할 수 있다. 따라서, 소프트웨어 요소를 포함할 수 있는 또 다른 유형의 미디어에는 유선 및 광 유선 네트워크를 통해, 다양한 무선 링크를 통해 로컬 장치 간의 물리적 인터페이스를 통해 사용되는 것과 같은 광, 전기 및 전자기파가 포함된다. 유선 또는 무선 링크, 광 링크 등과 같이 이러한 파동을 전달하는 물리적 요소도 소프트웨어를 포함하는 미디어로 간주될 수 있다. 본 명세서에서 사용된 바와 같이, 비 일시적 유형의 "저장"매체로 제한되지 않는 한, 컴퓨터 또는 기계 "판독 가능 매체"와 같은 용어는 실행을 위해 프로세서에 명령을 제공하는 데 참여하는 임의의 매체를 지칭한다.

따라서, 컴퓨터 실행 코드와 같은 기계 판독 가능 매체는 유형 저장 매체, 반송파 매체 또는 물리적 전송 매체를 포함하지만 이에 제한되지 않는 많은 형태를 취할 수 있다. 비 휘발성 저장 매체는 예를 들어, 도면에 도시된 데이터베이스 등을 구현하는 데 사용될 수 있는 임의의 컴퓨터(들) 등의 임의의 저장 장치와 같은 광학 또는 자기 디스크를 포함한다. 휘발성 저장 매체는 이러한 컴퓨터 플랫폼의 주 메모리와 같은 동적 메모리를 포함한다. 유형의 전송 매체에는 동축 케이블; 컴퓨터 시스템 내의 버스를 구성하는 와이어를 포함한 구리 와이어 및 광섬유를 포함한다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 무선 주파수(RF) 및 적외선(IR) 데이터 통신 중에 생성되는 것과 같은 음향 또는 광파의 형태를 취할 수 있다. 따라서 컴퓨터 판독 가능 매체의 일반적인 형태에는 플로피 디스크, 유연한 디스크, 하드 디스크, 자기 테이프, 기타 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 기타 광학 매체, 펀치 카드 용지 테이프, 구멍 패턴이 있는 기타 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 기타 메모리 칩 또는 카트리지, 데이터 또는 명령을 전송하는 반송파, 이러한 반송파를 전송하는 케이블 또는 링크 웨이브 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 읽을 수 있는 기타 매체를 포함한다. 이러한 형태의 컴퓨터 판독 가능 매체 중 다수는 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서에 전달하는 데 관련될 수 있다.

컴퓨터 시스템(2801)은 예를 들어, 본원에 언급 된 검출 가능한 신호 서열 또는 본원에 언급된 분석물의 식별 또는 본원에 개시된 분석물의 위치 또는 본원에 개시된 임의의 다른 정보를 제공하기 위한 사용자 인터페이스(UI)(2840)을 포함하는 전자 디스플레이(2835)를 포함하거나 이와 통신할 수 있다.

본 개시 내용의 방법 및 시스템은 하나 이상의 알고리즘에 의해 구현될 수 있다. 알고리즘은 중앙 처리 장치(2805)에 의해 실행될 때 소프트웨어를 통해 구현될 수 있다. 알고리즘은 예를 들어, 이미지를 캡처하거나 직접 프로브 바인딩을 하도록 여기에 개시된 광학 모듈을 지시할 수 있다.

등가물 및 범위

당업자는 본 명세서에 기재된 본 발명에 따른 특정 실시 양태와 많은 등가물을 일상적인 실험을 사용하여 인식하거나 확인할 수 있을 것이다. 본 발명의 범위는 상기 설명으로 제한되는 것이 아니라 첨부된 청구 범위에 설명된 바와 같다.

청구 범위에서, "a", "an"및 "the"와 같은 관사는 달리 지시되거나 문맥상 명백하지 않는 한 하나 이상을 의미할 수 있다. 하나 이상의 그룹 구성원 사이에 "또는"을 포함하는 청구 또는 설명은 문맥에서 반대로 또는 명백하게 표시되지 않는 한 하나 이상의 그룹 구성원 중 하나 이상이 모든 제품 또는 공정에 존재하거나, 채용되거나, 또는 관련이 있는 경우 충족된 것으로 간주된다. 본 발명은 그룹의 정확히 하나의 구성원이 주어진 제품 또는 공정에 존재하거나, 채용되거나, 또는 이와 관련이 있는 구체 예를 포함한다. 본 발명은 하나 이상의 또는 모든 그룹 구성원이 주어진 제품 또는 공정에 존재하거나, 채용되거나, 또는 이와 관련이 있는 구체 예를 포함한다.

범위가 주어지면 끝 점이 포함된다. 또한, 당업자에게 문맥 및 이해로부터 달리 지시되거나 달리 명백하지 않는 한, 범위로 표현 된 값은 언급된 범위 내의 임의의 특정 값 또는 하위 범위를 상이한 실시 양태에서 가정할 수 있음을 이해해야 한다. 문맥 상 명백하게 다르게 지시되지 않는 한, 본 발명은 범위의 하한의 단위의 10분의 1에 해당한다.

본 명세서에 인용된 모든 인용된 출처, 예를 들어, 참고 문헌, 간행물, 데이터베이스, 데이터베이스 항목 및 기술은 인용에 명시적으로 언급되지 않더라도 본 출원에 참고로 포함된다. 인용된 출처와 본 출원의 진술이 상충하는 경우, 본 출원의 진술이 우선한다.

섹션과 테이블 제목은 제한적이지 않다.

실시예

다음은 본 발명을 수행하기 위한 특정 실시예의 예시이다. 실시예는 단지 예시의 목적으로 제공되며, 본 발명의 범위를 어떠한 방식으로도 제한하려는 것은 아니다. 사용된 수(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해 노력했지만, 물론 일부 실험 오차 및 편차가 허용되어야 한다.

달리 지시되지 않는 한, 본 발명의 실시는 당업자에게 통상적인 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학적 방법을 이용할 것이다. 이러한 기술은 문헌에 충분히 설명되어있다. 예를 들어, T.E. Creighton, Proteins: Structures and Molecular Properties(W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry(Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual(2nd Edition, 1989); Methods In Enzymology(S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition(Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3rd Ed.(Plenum Press) Vols A and B(1992).

실시예 1: 분자의 밀집 패킹

이하의 방법은 피치가 200nm에서 333nm 사이인 정사각형배열을 사용하는 방법을 설명한다. 더 작은 피치를 허용하는 추가 방법이 설명될 것이다. 이미징 시스템은 2018년 3월 2일자로 출원된 국제 출원 PCT/US2018/020737에 기재되어 있고, 본 명세서에 참고로 포함되며, 이는 서브 회절 한계 이미징을 가능하게 하는 참조 시스템으로서 사용될 것이다. 광학 시스템은 필드 크기가 332.8 um x 332.8 um인 초당 최대 100Hz 프레임(fps)으로 작동하는 복수의 2,048 x 2,048 픽셀 카메라를 포함할 수 있다. 이 시스템은 90fps 이상에서 단일 플루오르를 측정할 수 있다. 85fps에서 분자당 1-10개 카피(또는 1-10 개의 형광단)와 함께 이 시스템을 사용하면 15분 이내에 63mm x 63mm 슬라이드를 이미징하는 데 필요한 처리량이 달성된다. 생화학 사이클 및 영상화는 2개의 칩을 사용하거나 단일 칩을 2개 이상의 영역으로 나누어 연속적이고 동시에 수행된다.

실시예 2 : 합성에 의한 시퀀싱을 이용한 단일 분자 시퀀싱

합성에 의한 시퀀싱 접근법을 이용한 단일 분자 시퀀싱은 Apton 시스템에서 평가되었다. 방법론을 테스트하기 위해, 5' 포스페이트 그룹을 갖는 단일 가닥 DNA 템플릿을 먼저 EDC(1-Ethyl-3-(3-mplate dimethylaminopropyl) carbodiimide) 화학을 통해 플로우 셀의 테카보하이드라지드(tecarbohydrazide) 활성화 실리콘 표면을 갖는 칩에 부착시켰다. 시퀀싱 프라이머는 표면에 고정화된 표적에 어닐링되었다. 우리의 초기 연구에 사용된 시퀀싱 템플릿은 EGFR L858R, EGFR T790M 및 BRAF V600E 돌연변이를 포함하는 합성 올리고 뉴클레오티드 및 ERCC 00013 및 ERCC 00171 대조 RNA 전 사체로부터 역 전사된 2개의 cDNA 샘플을 포함하였다. DNA 주형 고정화 및 프라이머 어닐링 후, 플로우 셀은 시퀀싱 반응을 위해 Apton 기기에 로딩되는데, 여기에는 여러 사이클의 효소 단일 뉴클레오티드 혼입 반응, 형광 염료 검출을 검출하기 위한 이미징, 이어서 화학적 절단이 포함된다. NEB로부터의 테르미네이터 IX DNA 폴리머라제(Therminator IX DNA Polymerase)는 단일 염기 연장 반응에 사용되었고, 이는 변형된 디데옥시 뉴클레오티드를 도입하는 능력이 향상된 9° NTM DNA 폴리머라제(9°NTM DNA Polymerase) 변이체이다. 반응에 사용된 4개의 dNTP는 4개의 상이한 절단 가능한 형광 염료로 표지되고 3'-OH기에서 절단 가능한 모이어티(cleavable moiety)(dCTP-AF488, dATP-AFCy3, dTTP-TexRed 및 dGTP-Cy5)로 차단된다. 각각의 시퀀싱 반응 사이클 동안, 단일 표지된 dNTP가 혼입되고 dNTP상의 3'-블록킹 기 때문에 반응이 종결된다. dNTP 혼입 후, 혼입되지 않은 뉴클레오티드를 세척에 의해 플로우 셀로부터 제거하고 혼입된 형광 염료 표지된 뉴클레오티드를 영상화하여 염기를 확인한다. 이미지가 포착된 후, 형광 염료 및 차단 모이어티는 100mM TCEP(tris(2-carboxyethyl)phosphine), pH9.0)를 사용하여 혼입된 뉴클레오티드로부터 절단되어, 다음 사이클에서 다음 상보적 뉴클레오티드의 후속 첨가를 허용한다. 이 연장, 검출 및 절단 사이클(cleavage cycle)은 판독 길이를 증가시키기 위해 반복된다.

도 15a는 동일한 양의 돌연변이 및 야생형(WT) 표적을 함유하는 EGFR 유전자에서 코돈 790 주변 영역에 상응하는 합성 올리고 뉴클레오티드 주형의 1:1 혼합물의 서열 분석 결과를 보여준다. 프라이머 후 첫 번째 염기(WT의 C-포괄 및 돌연변이의 T-포괄)에서 돌연변이로 코돈 790 근처의 EGFR 유전자의 영역에 상응하는 합성 주형을 시퀀싱하는데 사용되는 염료 표지된 뉴클레오티드의 도입으로부터의 이미지. 도 15a의 몽타주는 교대 염기 혼입 및 절단 사이클로부터의 이미지를 도시한다. 이 데이터는 시스템이 10사이클의 기본 통합을 감지하는 능력을 보여주며, 화살표는 관찰된 기본 변화를 나타낸다.

사용된 합성 올리고 뉴클레오티드는 약 60개의 뉴클레오티드 길이였다. 코돈 790에서의 돌연변이 이전에 하나의 염기로 끝나는 서열을 갖는 프라이머를 사용하여 연장 n 반응을 가능하게 하였다. DNA 폴리머라제에 의해 뉴클레오티드의 혼입 후 및 TCEP와의 절단 반응 후 표면을 이미지화 하였다. 황색 원은 염료 혼입의 10회 연속 사이클로부터의 데이터를 사용하여 정렬된 주형 분자의 위치를 나타낸다. 실제 염기 혼입이 노동 집약적인 육안 검사에 의해 확인된 후, 공지된 색 혼입 서열로 분자를 동정하였다.

염료 표지된 뉴클레오티드를 사용하여 RNA 주형으로부터 생성 된 cDNA를 서열 분석 하였다. 사용된 RNA는 클로닝된 ERCC 대조군 플라스미드로부터의 T7 전사에 의해 생성되었다. 도 15b는 교대 염기 혼입 및 절단 사이클로부터의 이미지를 도시한다. 데이터는 시스템이 10사이클의 염기 혼입을 검출하는 능력을 나타낸다. 관찰된 서열은 정확했다. 노란색 화살표는 절단 사이클을 나타낸다.

구체적으로, T7 전사에 의해 ERCC(외부 RNA 대조군 컨소시엄) 대조군 플라스미드로부터 생성된 전사체에 상응하는 cDNA 주형을 시퀀싱하였다. 생성된 cDNA 분자는 350 뉴클레오티드를 초과하는 길이였다. DNA 폴리머라제에 의해 뉴클레오티드의 혼입 후 및 TCEP와의 절단 반응 후 표면을 이미지화하였다. 도 15b의 황색 원은 염료 혼입의 10회 연속 사이클로부터의 데이터를 사용하여 정렬된 주형 분자의 위치를 나타낸다. 데이터는 이미지를 수동으로 확인하여 10사이클의 뉴클레오티드 혼입을 수동으로 감지할 수 있음을 나타낸다.

실시예 3: 분석물 변이체에 대한 상대 위치 결정

도 16은 기판 상에 고정되고 형광단을 포함하는 프로브에 의해 결합된 단일 분자의 이미지이다. 분자는 고체 지지체에 공유 결합된 세포 용해물로부터의 ERK 단백질에 결합된 anti-ERK 항체이다. 항체는 분자 당 3-5 개의 형광단으로 표지된다. 예를 들어, 합성에 의한 시퀀싱 동안, 단일 플루오르 핵산 표적으로 유사한 이미지를 획득할 얻을 수 있다.

검출 정확도를 향상시키기 위해, 분자는 연속적인 프로브 결합 및 스트리핑의 사이클(이 경우 30 사이클)을 겪는다. 각 라운드에서 이미지는 분자의 위치를 결정하기 위해 처리된다. 이미지는 배경 분리, 2X로 오버 샘플링되며, 이후 피크가 식별된다. 여러 층의 사이클이 20nm 그리드에 겹쳐진다. 위치 분산은 표준 편차 또는 반지름을 측정 수의 제곱근으로 나눈 값이다. 도 17, 오른쪽 패널은 중첩된 각 사이클의 각 피크를 도시한다. 왼쪽 패널은 오른쪽 패널이 평활화된 버전이다. 각 밝은 점은 분자를 나타낸다. 분자 위치는 200nm 미만의 분자 대 분자 거리로 분해할 수 있다. 도 18은 필드에서 발견된 복수의 분자 각각에 대한 국소화 변화를 보여준다. 중앙값 국소화 분산은 5nm이고 3 시그마 국소화 분산은 10nm 미만이다.

실시예 4: 밀집 패킹된 시퀀싱 기판 및 단면 밀도(Single-Sided Density)

무작위로 분포된 밀집-패킹된 층에서 기판의 표면에 분포할 표적 서열을 포함하는 콘카테머의 라이브러리를 준비하기 위해, 표적 서열을 포함하는 샘플을 증폭, 정제, 라이게이션(ligation)하여 원형화 된 DNA를 도 23a에 도시된 바와 같이, 형성하고 정량화한다.

표적의 증폭

Illumina MiSeq 라이브러리는 Affymetrix(Santa Clara, CA-PN 14380)에서 구입한 E. coli DNA를 사용하여 표준 프로토콜로 만든 SegMatic(Fremont, CA)에서 구입하였다.

라이브러리는 PCR 증폭에 의해 증폭되었다. 각 PCR 반응에는 표 1에 나열된 다음 구성 요소가 포함되었다.

프라이머 믹스는 10 uM의 P5-포스페이트(/ 5Phos / AAT GAT ACG GCG ACC ACC GA) 및 P7 (CAA GCA GAA GAC GGC ATA CGA GAT) 프라이머의 50:50 혼합물이다.

PCR 증폭은 다음 조건 하에서 수행되었다: 94 °C에서 5mM에 이어94 °C, 15 초; 55 °C, 30 초; 68 °C, 30 초의 35사이클. 증폭 산물의 분취량(aliquot)을 2% 겔에서 실행하여 라이브러리 분자 크기를 확인하였다(이 경우 300-500 염기 쌍). PCR 증폭 산물은 제조업체의 프로토콜에 따라 PureLink® Spin Column(서포피셔)을 사용하여 정제되었다.

표적 DNA의 원형화

이어서 정제된 PCR 증폭 산물을 표 2에 기재된 반응 혼합물에서 라이게이션(ligation)에 의해 단일 가닥 원형화를 진행하였다.

브리지 올리고뉴클레오티드 서열은 TCG GTG GTC GCC GTA TCA TTC AAG CAG AAG ACG GCA TAC GAG AT였다.

라이게이션은 다음 조건 하에서 수행되었다: 95℃에서 30초에 이어 95℃, 15초; 55℃, 2분; 및 62°C, 3 분의 40사이클.

라이게이션 후, 엑소뉴클레이즈 I 및 엑소뉴클레이즈 III (뉴 잉글랜드 바이오랩) 각각 1μL를 첨가하고 반응을 추가로 45 분 동안 37 °C에서, 30 분 동안 85 °C에서 인큐베이션 하였다. 생성 된 물질은 제조업체의 프로토콜을 사용하여 Zymo-SpinTM 컬럼 (Oligo Clean & ConcentratorTM 키트 Zymo Research, Irvine, CA)을 사용하여 정제되었다. 정제 후, 농도는 알려진 농도의 올리고 뉴클레오티드를 사용하는 맞춤형 보정 샘플과 함께 Qubit 2.0 형광계(ThermoFisher) 및 Quant-iT OliGreen®(ThermoFisher)를 사용하여 측정되었다.

원형화된 DNA로부터 콘카테머 형성

표 3에 기재된 반응 혼합물에서 표적 서열을 포함하는 원형화된 DNA로부터 콘카테머가 형성되었다.

프라이머 용액은 3x 반응 버퍼에 있는 프라이머(ATC TCG TAT GCC GTC TTC TGC TTG)의 750 nM 현탁액이다. 10X 반응 완충액은 500mM Tris-HC1, 100mM (NH4) 2SO4, 40mM DTT, 100mM MgC12, pH 7.5 @ 25°C이다.

원형 템플릿 + 프라이머 믹스를 90°C에서 10mM 동안 배양한 다음 30°C에서 30분 동안 배양한다. 예열된 효소 믹스를 90mM 동안 표 3에서와 같이 첨가하였다. 반응 비활성화 완충액을 첨가하여 반응을 중단하고 4°C에서 보관하였다.

이어서, 콘카테머 라이브러리를 기판 위에 적층하여 기판의 표면에 결합되고 조밀하게 패킹된 랜덤 분포 층을 형성한 다음, 도 23b 및 아래에 설명과 같이, 이미징 및 이미지 처리 및 데이터 분석을 통해 결합된 콘카테머를 시퀀싱한다.

1 마이크로 리터의 시퀀싱 기판을 19 ul의 시트레이트 포스페이트 완충액과 혼합하고 10 ul를 맞춤형 바이오칩에 로딩하고 밤새 배양하였다. 이어서 칩을 시트레이트 포스페이트 완충액으로 2회, 인산 칼륨 완충액으로 2회, NA 세척 3 완충액으로 2회 세척하였다.

형광 프로브는 동일성을 결정하기 위해 칩의 표면에 결합된 콘카테머 층에 결합되었다. 밀도를 보여주는 이미지는 도 25a 내지 도 25c에 표시된다. 도 25d는 본원에 기술된 방법 (Apton-대조군 타겟) 및 더 높은 밀도에서 시뮬레이션된 분포(Apton-Sim)에 따라 단면 콘카테머 층의 측정된 밀도의 플롯을 나타낸다.

예시 5: E. Coli 판독 시퀀싱

이미징 / 시퀀싱

합성에 의한 시퀀싱은 표준 시퀀싱 화학을 사용하여 수행되었습니다. 밀집 패킹된 콘카테머 층을 포함하는 칩을 AptonBio Sequencer에 실장하고 Washl(20mM Tris-HC1, 10mM (NH4) 2SO4, 10mM KC1, 2mM MgSo4, 0.1 % 100, pH 8.8 @ 25 °C, 50mM NaCl) 으로 60°C에서 6x 5mM 세척하였다. 시퀀싱 올리고(ATC TCG TAT GCC GTC TTC TGC TTG)를 혼성화 완충액에서 100 nM으로 희석하고 1x 1mM에 이어서 60°C에서 2 x 10mM을 배양하고 혼성화 작업 사이에 Washl 세척을 사용한다. 그런 다음, 후술하는 8개 단계의 32사이클이 수행된다.

1-절단: 60 °C에서 225초 (표 4의 완충액 사용)

2-세척 : 인산염 완충액 pH 8에서 30°C에서 240초

3-이미징 : Wash2 (20mM Tris-HC1, 5mM Ascorbic Acid (pH 8.8)

4-세척 : 60°C에서 Washl

5-연장 : 60°C에서 450초 (표 5의 버퍼 사용)

6-세척 : 30 °C에서 Washl

7-세척 : 인산염 완충액 pH8에서 30°C에서 2 분.

8-이미징 : Wash2

결과:

30-40 bp의 판독 값이 도 27a에 도시된다. 20-25 bp의 판독 값은 도 27b에 도시된다.

도 27c에 표시된 교차 도표는 대장균 시퀀싱을 위한 개별 스팟에서 염기 콜링(base calling)의 분해능을 보여준다.

본 발명의 바람직한 실시예가 여기에 도시되고 설명되었지만, 그러한 실시예는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명이 명세서 내에 제공된 특정 예에 의해 제한되는 것으로 의도되지 않는다. 본 발명이 전술한 명세서를 참조하여 설명되었지만, 본 명세서의 실시예의 설명 및 예시는 제한적인 의미로 해석되는 것을 의미하지 않는다. 이제 본 발명을 벗어나지 않고 다양한 변형, 변경 및 대체가 당업자에게 발생할 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 의존하는 본 명세서에 기재된 특정 묘사, 구성 또는 상대적 비율에 제한되지 않는다는 것을 이해해야 한다. 본 명세서에 기술된 본 발명의 실시예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 또한 그러한 대안, 수정, 변형 또는 등가물을 포함할 것으로 예상된다. 다음의 청구 범위는 본 발명의 범위를 정의하고, 이러한 청구 범위 내의 방법 및 구조 및 그 균등물이 이에 의해 커버되는 것으로 의도된다.

Claims

기판의 표면에 고밀도로 배치된 복수의 분석물을 시퀀싱하는 방법으로, 상기 방법은:
(a) 표면을 포함하는 기판을 제공하는 단계로서, 상기 표면은 패턴화되지 않고 복수의 분석물의 분석물 결합 위치 사이의 최소 유효 피치가
미만이 되도록 하는 밀도로 상기 표면에 배치된 복수의 분석물을 포함하고, 상기 NA는 광학 이미징 모듈의 개구 수이고, 상기 표면은 합성에 의한 시퀀싱을 위한 시약을 포함하는, 단계;
(b) 상기 복수의 분석물에 결합하는 프로브의 복수의 사이클을 수행하는 단계로서, 상기 복수의 사이클의 사이클은: (i) 상기 복수의 분석물을 복수의 프로브와 접촉시키는 단계로서, 상기 복수의 프로브의 프로브는 검출 가능한 표지를 포함하는, 단계 및 (ii) 광학 시스템으로 상기 표면의 필드를 이미징하여 상기 복수의 분석물과 접촉하는 각 프로브로부터의 광학 신호를 검출함으로써 상기 사이클 동안 상기 필드에서 복수의 광학 신호를 검출하는 단계를 포함하는, 단계;
(c) 상기 복수의 사이클 중 적어도 2 회로부터의 상기 필드의 이미지로부터 상기 복수의 광학 신호 각각으로부터 피크 위치를 결정하는 단계;
(d) 각 광학 신호에 대한 상기 피크 위치를 오버레이하고 광학 신호의 각 클러스터에 광학 분포 모델을 적용하여 상기 표면에서 각각의 검출된 프로브의 상대적 위치를 결정하는 단계;
(e) 상기 결정된 상대 위치 및 분해 함수를 사용하여 각 사이클로부터 각 필드 이미지에서 상기 광학 신호를 분해하는 단계;
(h) 디콘볼루션된 광학 신호로부터 각 필드 및 각 사이클에 대한 상기 검출 가능한 표지를 식별하는 단계; 및
(g) 각 분석물 위치에서 상기 복수의 사이클에 걸쳐 식별된 검출 가능한 표지로부터 상기 기판의 표면에 배치된 분석물을 식별하는 단계를 포함하는, 방법.
제1 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물은 반발성(repellant) 또는 유인성(attractive) 물질로 처리되는 방법.
제2 항에 있어서,
상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함하는 방법.
제2 항에 있어서,
상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함하는 방법.
제1 항에 있어서,
상기 분석물은 DNA 콘카테머(DNA concatemers)인 방법.
제5 항에 있어서,
상기 DNA 콘카테머는 ssDNA 헤어에 혼성화되는 방법.
제1 항에 있어서,
상기 분석물은 단백질 또는 펩티드인 방법.
제1 항에 있어서,
상기 프로브는 복수의 가역 종결인자 뉴클레오티드를 포함하는 방법.
제8 항에 있어서,
상기 복수의 가역 종결인자 뉴클레오티드는 각각 별개의 검출 가능한 표지를 갖는 적어도 4개의 별개의 뉴클레오티드를 포함하는 방법.
제1 항에 있어서,
상기 분해 단계는 상기 결정된 상대적 위치로부터 이웃 폴리뉴클레오티드 사이의 중심 간 거리를 사용하여 상기 이웃 폴리뉴클레오티드로부터 간섭 광학 신호를 제거하는 단계를 포함하는 방법.
제4 항에 있어서,
상기 분해 함수는 디콘볼루션을 포함하는 방법.
제1 항에 있어서,
상기 폴리 뉴클레오티드는 인접한 폴리 뉴클레오티드에 혼입된 뉴클레오티드로부터 상기 검출 가능한 표지에 의해 방출된 광학 신호 사이에 중첩이 있도록 상기 기판 상에 밀집 패킹되고, 상기 인접한 폴리 뉴클레오티드는 각각 별개의 서열을 포함하는 방법.
제1 항에 있어서,
상기 폴리 뉴클레오티드는 제곱 마이크론 당 4개 이상의 분자의 평균 밀도로 상기 표면 상에 고정되는 방법.
제1 항에 있어서,
상기 표면의 상기 이미징은 상기 이미지 필드의 축을 따라 300 nm 당 하나 이상의 픽셀의 해상도에서 수행되는 방법.
제1 항에 있어서,
각각의 사이클로부터의 상기 필드 이미지들 각각으로부터 더 높은 픽셀 밀도를 갖는 오버 샘플링된 이미지를 생성하는 단계를 더 포함하는 방법.
제1 항에 있어서,
상기 피크 위치를 오버레이하는 단계는 상기 복수의 사이클로부터 각 폴리 뉴클레오티드에 대한 광학 피크 위치의 클러스터를 생성하기 위해 상기 복수의 사이클 동안 각 필드에서 검출된 상기 광학 신호 피크의 위치를 정렬하는 단계를 포함하는 방법.
제1 항에 있어서,
상기 피크 위치를 오버레이하는 단계는 상기 사이클의 서브 세트로부터 각각의 폴리 뉴클레오티드에 대한 광학 피크 위치의 클러스터를 생성하기 위해 상기 사이클의 서브 세트 동안 각 필드에서 검출 된 상기 광학 신호 피크의 위치를 정렬하는 단계를 포함하는 방법.
제1 항에 있어서,
상기 광학 분포 모델은 포인트 확산 함수를 포함하는 방법.
제1 항에 있어서,
상기 기판 표면에 고정된 상기 분석물의 상대적 위치가 10nm RMS 내에서 결정되는 방법.
밀집 패킹된 기판의 표면에 고정된 분석물의 상대적 위치를 정확하게 결정하는 방법으로서, 상기 방법은:
(a) 표면을 포함하는 기판을 제공하는 단계로서, 상기 표면은 패턴화되거나 패턴화되지 않고 별개의
(b) 상기 표면상에서 프로브 결합 및 신호 검출의 복수의 사이클을 수행하는 단계로서, 각 사이클은: (i) 상기 분석물을 프로브 세트로부터의 복수의 프로브와 접촉시키는 단계로서, 상기 프로브는 검출 가능한 표지를 포함하고, 상기 프로브 각각은 표적 분석물에 특이 적으로 결합하는, 단계; 및 (ii) 광학 시스템으로 상기 표면의 필드를 이미징하여 상기 표면상의 개별 위치에서 상기 분석물에 결합된 개별 프로브로부터의 복수의 광학 신호를 검출하는 단계를 포함하는, 단계;
(c) 상기 복수의 사이클 중 적어도 2 회로부터의 상기 필드의 이미지로부터 상기 복수의 광학 신호 각각으로부터 피크 위치를 결정하는 단계; 및
(d) 각 광학 신호에 대한 상기 피크 위치를 오버레이하고 광학 신호의 각 클러스터에 광학 분포 모델을 적용하여 상기 표면에서 각각의 검출된 분석물의 상대적 위치를 개선된 정확도로 결정하는 단계를 포함하는, 방법.
제20 항에 있어서,
(a) 상기 결정된 상대 위치 및 분해 함수를 사용하여 각 사이클로부터 각 필드 이미지에서 상기 광학 신호를 분해하는 단계; 및
(b) 디콘볼루션된 광학 신호로부터 각 필드 및 각 사이클에 대해 상기 고정된 분석물에 결합된 상기 검출 가능한 표지를 식별하는 단계를 더 포함하는 방법.
제20 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물은 반발성(repellant) 또는 유인성(attractive) 물질로 처리되는 방법.
제22 항에 있어서,
상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함하는 방법.
제22 항에 있어서,
상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함하는 방법.
제20 항에 있어서,
상기 분석물은 DNA 콘카테머(DNA concatemers)인 방법.
제25 항에 있어서,
상기 DNA 콘카테머는 ssDNA 헤어에 혼성화되는 방법.
제20 항에 있어서,
상기 분석물은 단백질 또는 펩티드인 방법.
제21 항에 있어서,
각 사이클에서 검출된 각각의 분석물에 대해 상기 검출 가능한 표지 동일성을 사용하여 상기 기판 상의 복수의 분석물을 식별하는 단계를 더 포함하는 방법.
제21 항에 있어서,
상기 분해 단계는 이웃하는 분석물의 결정된 상대적 위치로부터 상기 이웃 분석물 사이의 중신 간 거리를 사용하여 상기 이웃 분석물로부터 간섭 광학 신호를 제거하는 단계를 포함하는 방법.
제21 항에 있어서,
상기 분해 함수는 디콘볼루션을 포함하는 방법.
제20 항에 있어서,
상기 분석물은 단일 생체 분자인 방법.
제20 항에 있어서,
상기 표면 상에 고정된 상기 분석물은 상기 검출 가능한 표지에 의해 방출되고 광학 시스템에 의해 이미지화되는 광의 회절 한계보다 더 작은 간격으로 평균적으로 이격되어 있는 방법.
제20 항에 있어서,
상기 고정된 분석물은 각 분석물과 가장 가까운 인접 분석물 사이에서 500 nm 미만의 평균 중심 간 거리를 가지는 방법.
제20 항에 있어서,
상기 피크 위치를 오버레이하는 단계는 상기 복수의 사이클로부터 각 분석물에 대한 광학 피크 위치의 클러스터를 생성하기 위해 상기 복수의 사이클 동안 각 필드에서 검출된 상기 광학 신호 피크의 위치를 정렬하는 단계를 포함하는 방법.
제20 항에 있어서,
상기 상대 위치는 10 nm RMS 이내의 정확도로 결정되는 방법.
제20 항에 있어서,
상기 방법은 제곱 마이크론 당 약 4 내지 약 25 개의 분석물의 밀도로 표면으로부터의 광학 신호를 분해하는, 방법.
복수의 분석물의 식별하기 위한 시스템으로, 상기 시스템은:
(a) 기판의 표면 상에 고정된 분석물에 결합하는 프로브의 복수 사이클에 걸쳐 상기 기판의 필드로부터 복수의 광학 신호를 이미지화도록 구성된 광학 이미지 장치로서, 상기 표면은 패턴화되지 않은, 광학 이미지 장치; 및
(b) 이미지 처리 모듈로서, 상기 이미지 처리 모듈은:
(i) 상기 복수의 사이클 중 적어도 2 회로부터의 상기 필드의 이미지로부터 상기 복수의 광학 신호 각각으로부터 피크 위치를 결정하고;
(ii) 각 광학 신호에 대한 상기 피크 위치를 오버레이하고 광학 신호의 각 클러스터에 광학 분포 모델을 적용하여 상기 표면에서 각각의 검출된 분석물의 상대적 위치를 개선된 정확도로 결정하며; 및
(iii) 상기 결정된 상대 위치 및 분해 함수를 사용하여 각 사이클로부터 각 필드 이미지에서 상기 광학 신호를 디콘볼루션하도록 구성되는, 이미지 처리 모듈을 포함하는 시스템.
제37 항에 있어서,
상기 이미지 처리 모듈은 상기 디컨볼루션된 광학 신호를 사용하여 상기 표면 상에 고정된 상기 분석물을 식별하도록 더 구성되는 시스템.
제37 항에 있어서,
상기 광학 이미지 장치는 스캔 가능 영역을 정의하는 이동 가능 스테이지를 포함하는 시스템.
제37 항에 있어서,
상기 광학 이미지 장치는 상기 스캔 가능 영역에서 회절 한계 아래에서 기판의 표면을 샘플링하도록 구성된 광학 배율 및 센서를 포함하는 시스템.
제37 항에 있어서,
상기 기판의 패턴화되지 않은 표면에 회절 한계 아래의 중심 간 간격으로 고정된 분석물을 포함하는 기판을 더 포함하는 시스템.
제37 항에 있어서,
상기 분해는 상기 이웃하는 분석물 사이의 중심 간 거리를 사용하여 이웃하는 분석물로부터 간섭 광학 신호를 제거하여 상기 이웃하는 분석물의 상대적 위치를 결정하는 것을 포함하는 시스템.
복수의 분석물을 처리하거나 분석하는 방법으로, 상기 방법은:
최소 유효 피치가
의 측정치보다 작은 밀도로 기판의 표면에 인접하여 상기 복수의 분석물을 배치하는 (a) 단계로서, 상기 표면은 패턴화되지 않은, (a) 단계;
상기 기판에 인접하게 배치된 상기 복수의 분석물의 분석물에 결합하는 프로브의 하나 이상의 사이클에 걸쳐 상기 기판으로부터 복수의 광학 신호를 획득하는 (b) 단계로서, 적어도 상기 복수의 광학 신호의 서브 세트는 중첩되며, 복수의 광학 신호는 파장 (
)을 가지는 광을 포함하는, (b) 단계;
이미징 알고리즘을 적용하여 상기 복수의 광학 신호를 처리하여 상기 복수의 분석 물의 분석물의 위치 또는 상기 복수의 분석물의 다른 분석물에 대한 상기 분석물의 상대적 위치를 식별하는 (c) 단계; 및
상기 위치 또는 상대 위치를 사용하여 상기 복수의 분석물 중 상기 분석물을 확인하는 (d) 단계를 포함하는 방법.
제43 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물은 반발성(repellant) 또는 유인성(attractive) 물질로 처리되는 방법.
제44 항에 있어서,
상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함하는 방법.
제44 항에 있어서,
상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함하는 방법.
제43 항에 있어서,
상기 분석물은 DNA 콘카테머(DNA concatemers)인 방법.
제47 항에 있어서,
상기 DNA 콘카테머는 ssDNA 헤어에 혼성화되는 방법.
제43 항에 있어서,
상기 분석물은 단백질 또는 펩티드인 방법.
제43 항에 있어서,
상기 (b) 단계는 광학 처리 모듈을 구성하여 분석물에 결합하는 상기 하나 이상의 프로브 사이클로부터 상기 복수의 광학 신호를 오버레이하는 단계를 더 포함하고,
상기 (c) 단계는 광학 분포 모델을 상기 복수의 광학 신호의 상기 오버레이에 적용하여 각각의 검출된 분석물의 상대 위치를 결정하는 단계를 더 포함하는 방법.
제43 항에 있어서,
상기 이미징 알고리즘은 분해 함수를 포함하는 방법.
제51 항에 있어서,
상기 분해 함수는 디콘볼루션을 포함하는 방법.
제50 항에 있어서,
상기 분해 함수는 상기 이웃하는 분석물 사이의 중심 간 거리를 사용하여 이웃하는 분석물로부터 간섭 광학 신호를 제거하는 것을 포함하는 방법.
제43 항에 있어서,
상기 복수의 분석물은 제곱 마이크론 당 약 1 내지 25 분자의 밀도로 상기 기판에 인접하게 배치되는 방법.
제43 항에 있어서,
광학 이미징 모듈은 300 나노 미터당 하나 이상의 픽셀의 해상도에서 상기 복수의 광학 신호를 획득하도록 구성되는 방법.
패턴화되지 않은 표면에 고정된 복수의 분석물의 분석물 사이의 평균 최소 중심 간 거리의 분포를 제어하는 방법으로서, 상기 방법은 상기 하나 이상의 분석물을 반발성(repellant) 또는 유인성(attractive) 물질로 처리하는 단계를 포함하는 방법.
제56 항에 있어서,
상기 반발성 또는 유인성 물질은 양극성 이온(zwitterionic) 특징을 포함하는 방법.
제57 항에 있어서,
상기 반발성 또는 유인성 물질은 PEG, 아모폴린 아모폴라이트(ampholine ampholytes), 설포베타인(sulphobetaine) 및 BSA 중 적어도 하나를 포함하는 방법.
제56 항에 있어서,
상기 분석물은 DNA 콘카테머(DNA concatemers)인 방법.
제59 항에 있어서,
상기 DNA 콘카테머는 ssDNA 헤어에 혼성화되는 방법.
제56 항에 있어서,
상기 분석물은 단백질 또는 펩티드인 방법.
제56 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 500 nm 미만인 방법.
제56 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 315 nm인 방법.
제56 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 250 nm인 방법.
제56 항에 있어서,
상기 하나 이상의 분석물을 반발성 또는 유인성 물질로 처리하는 단계는 상기 복수의 분석물을 상기 표면에 고정하기 이전에 상기 패턴화되지 않은 표면에 상기 반발성 또는 유인성 물질을 적용하는 단계를 포함하는 방법.
패턴화되지 않은 표면에 고정된 복수의 분석물의 분석물 사이의 평균 최소 중심 간 거리의 분포를 제어하는 방법으로서, 상기 방법은:
(a) 상기 하나 이상의 분석물을 반발성(repellant) 또는 유인성(attractive) 물질로 처리하는 단계; 및
(b) 상기 복수의 분석물이 상기 패턴화되지 않은 표면을 가로 질러 고정된 분석물의 단층을 형성하도록 상기 복수의 분석물을 기체-액체 계면에 노출시키는 단계를 포함하는 방법.
제66 항에 있어서,
상기 기체-액체 계면은 공기-물 계면인 방법.
제66 항에 있어서,
(c)의 고정은 풀링(pulling) 또는 드래깅(dragging)을 포함하는 방법.
제66 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 500 nm 미만인 방법.
제66 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 315 nm인 방법.
제66 항에 있어서,
상기 복수의 분석물 중 하나 이상의 분석물 사이의 평균 최소 중심 간 거리는 약 250 nm인 방법.
표면에 인접한 복수의 핵산 분자를 포함하는 시스템으로, 상기 복수의 핵산 분자의 인접한 핵산 분자는 적어도 10 nm의 평균 중심 간 간격을 갖고 서로 접촉하지 않는 시스템.
제72 항에 있어서,
상기 표면은 패턴화되지 않은 시스템.
제72 항에 있어서,
상기 복수의 핵산 분자는 복수의 콘카테머인 시스템.
제72 항에 있어서,
상기 평균 중심 간 간격은 약 500 nm 미만인 시스템.
표면에 인접한 복수의 핵산 분자를 포함하는 방법으로, 상기 복수의 핵산 분자의 인접한 핵산 분자는 적어도 10 nm의 평균 중심 간 간격을 갖고 서로 접촉하지 않는 방법.
제76 항에 있어서,
상기 표면은 패턴화되지 않은 방법.
제76항에 있어서,
상기 복수의 핵산 분자는 복수의 콘카테머인 방법.
제76 항에 있어서,
상기 평균 중심 간 간격은 약 500 nm 미만인 방법.