top of page

차세대 염기서열 분석법 원리

Sanger 시퀀싱 방법은 많이 개선되어 현재는 완전히 자동화 되었다. 하지만 하나의 테스트 튜브에서는 한 조각의 DNA만 시퀀싱할 수 있다. 한 종의 게놈을 시퀀싱하기 위해서는 게놈을 마구잡이로 조각을 내어 각각을 시퀀싱하고 이들을 컴퓨터 알고리즘으로 조립하는 방식을 취하기 때문에, 박테리아 게놈을 생거방법으로 시퀀싱하기 위해서는 수만개의 조각을 각기 독립적으로 시퀀싱해야 한다. 한 대의 시퀀싱 기기에서는 한번에 수천개 정도의 조각만을 시퀀싱할 수 있다. 서열을 따라가면서 한 염기씩 차이가 나는 DNA 분자를 합성하고 이를 전기영동으로 분리한 후에 형광으로 검출하기 때문에, 많은 양의 시약이 소모되게 된다. 따라서 동시에 시퀀싱할 수 있는 DNA 조각의 갯수가 제한적이고, 각 조각을 시퀀싱하기 위해서 많은 양의 시약이 소모되는 생거 시퀀싱의 한계를 극복할 수 있는 방법이 Next Generation Sequencing (NGS)이다.

Illumina Solexa sequencing

NGS 기법 중에서 현재 가장 보편적으로 사용되는 방법은 영국 Solexa사에서 개발한 것으로서 미국 Illumina사에 흡수되어 상업화한 것이다. 그 핵심 원리를 알아보자. 우리가 시퀀싱하고자하는 서로 다른 수 십억 개의 single-strand DNA 조각들의 양쪽 끝에 double-stranded linker(adapter)를 붙여준다. Flowcell 바닥에는 이들 adaptor 서열에 상보적인 DNA를 고정하여 놓고, adaptor가 붙어있는 조각들을 flowcell에 고루 퍼지게 하면, 각 조각은 여기저기에 달라붙게 된다.

[아래 그림의 왼쪽] 보래색 DNA 조각과 녹색 DNA 조각이 우리가 시퀀싱하고자 하는 타겟이며, 각기 양끝에 붉은 색과 주황색의 adapter가 결합되어 있으며, flowcell 바닥에 펴져 있는 자기 짝을 찾아 hybridize된다. 그리고는 점선 화살표 방향으로 polymerization되어 double strand를 이루게 된다. 그림을 자세히 보면, 새로이 합성된 reverse strand는 flowcell 바닥에 고정되어 있으나, 애초에 넣어 준 forward strand 타겟 DNA는 바닥에 고정되어 있지 않고 약간 떠 있게 된다. 이 forward strand DNA는 씻어 버린다.

[위 그림 가운데] Reverse strand DNA를 근처에 있는 주황색 adapter 짝에 hybridize되게 하고 이에 상보적인 forward strand가 곡선 화살표처럼 합성되게 한 뒤에, 이중 나선을 풀어주게 된다. 이 단계를 bridge polymerase chain reaction (PCR)이라고 한다.

[위 그림 오른쪽] Bridge PCR이 반복되면서 증폭이 끝날 때는 하나의 DNA 조각에 대하여 약 1000개 정도의 동일한 PCR 결과물이 하나의 cluster를 이루게 된다. 편의 상 한 가지 색상으로 그려져 있지만, 각 클러스터에는 forward strand와 reverse strand가 섞여 있음을 알 수 있다. 다음 단계의 시퀀싱을 진행하기 위해서는, 합성된 reverse strand는 잘라서 없애고, forward strand들만 시퀀싱에 참여한다. 애초에 사용한 DNA 조각 하나로부터 하나의 클러스터가 형성되며, 이들은 다음 단계에서 사용하는 형광법으로 검출하기 충분한 양이 되는 것이다.

Adapter 부위는 모든 클러스터가 동일하며, 그곳에 있는 primer로 사용하여 한 염기씩 합성한다. 염기의 종류에 따라 각각 다른 빛을 내는 형광 물질이 결합된 dNTP가 DNA polymerase에 의해 한 염기씩 합성될 때, 염기마다 형광 물질 빛을 읽은 뒤 기록한다. 이 dNTP에는 terminator가 붙어 있어서 한 염기만 합성이 된다. 다음 사이클에서는 이 terminator를 떼어 주고 씻어 낸 다음, 새로운 dNTP와 DNA polymerase를 첨가하여 위 과정을 반복한다. 여기서 중요한 것은, 한 염기씩 붙이고 형광을 검출한 후에, 그 형광을 없애고 그 다음 염기를 붙여야 한다는 점이며, 이 과정이 착오없이 차근차근 진행되어야 한다는 점이다. 이 사이클은 약 100번 정도 반복되며, 결과적으로 수십 억 개의 DNA 조각들에 대한 약 100 염기 정도의 서열을 얻을 수 있다. 이러한 방법을 "sequencing-by-synthesis"라고 부른다 (참고: 오른쪽 동영상). 정해진 염기 수만큼 시퀀싱이 끝난 후에, 시퀀싱한 조각에 상보적인 가닥을 합성하여 시퀀싱함으로써 결과적으로 앞, 뒤 서열을 얻을 수 있는데 이를 “Paired-end sequencing”이라고 한다.

Ion Torrent semiconductor sequencing

클릭
emulsion PCR
Homopolymer signals

Illumina의 Solexa 시퀀싱은 형광으로 검출하지만, Ion Torrent사의 방법은 한 염기씩 추가될 때마다 수소 이온이 발생하는 점에 착안하여 이를 전기적으로 측정하는 방법을 사용하였다. 그런데, A/T/G/C 중 어떤 염기가 추가되던 똑 같은 수소 이온이 발생하기 때문에 이들을 전기적으로 구별할 수는 없다. 따라서, 먼저 dATP를 반응시켜보고 수소 이온이 발생하는지 측정해 본다. 시그널이 나오지 않으면 남은 dATP를 씻어내고 다른 dNTP들을 차례로 반응시켜본다. 즉 한 염기 당 4번의 반응을 시도하는 것이다. 형광법에서는 한 염기씩 반응시키기 위해서 terminator를 사용하였는데, 여기서는 terminator를 사용하지 않는다. 만약에 A 다음 염기도 A라면, dTTP 두 분자가 반응할 것이고, 수소 이온도 두 배만큼 더 많이 생성될 것이며, 전기적 시그널도 그만큼 클 것이기 때문에, 시그널의 크기로 연속적인 염기 (homopolymer)가 존재하는지 알 수 있다. 이 방법

을 구현하려면, 많은 DNA 조각을 따로 따로 반응을 시키고 각각의 조각에서 얻은 전기 시스널이 서로 간섭하지 않게 하는 기술과 전기적으로 검출할 수 있을 만큼 충분한 양이 되도록 증폭하는 기술이 필요하게 된다. 이때 emulsion PCR이라는 기술을 사용한다. 수 많은 DNA 조각을 각기 하나의 구슬 (bead)과 함께 emulsion 기름 방울 안에 들어 가도록 하고, 각 기름 방울 안에서 PCR이 일어나도록 하여, 한 구슬의 표면은 동일한 DNA 조각으로 도배되게끔 한다. 이렇게 얻어진 구슬은 작은 우물에 하나씩 넣어 시퀀싱을 진행하게 된다. 전체 과정을 동영상으로 볼 수 있다.

 

위 방법들은 하나의 DNA 분자를 template 삼아서 한 염기씩 시퀀싱해 나아가기 때문에 적은 양의 DNA를 사용하기에 시약 사용량이 적고 동시에 수많은 DNA 조각을 시퀀싱할 수 있는 장점이 있지만 여전히 시그널 검출을 위해서 증폭이 필요했다. 다음에 공부하는 소위 3세대 기술은 단일 DNA 분자를 증폭없이 직접 시퀀싱하는 획기적인 방법이라서 시약의 소모가 매우 적게 되며, 한번에 매우 긴 DNA 서열을 시퀀싱할 수 있다. 하지만 이 방법들은 매우 길게 시퀀싱할 수 있는 장점과 함께 오류율이 상대적으로 높은 단점도 가지고 있다.

 

PacBio sequencing

Pacific Bioscience사의 시퀀싱 방법은 각 염기에 서로 다른 형광물질을 매달아서 이를 검출함으로써 시퀀싱을 한다는 점은 Sanger 혹은 Solexa 방법과 유사하다고 할 수 있다. 그런데, 형광을 염기쪽이 결합시키지 않고 떨어져 나올 인산쪽에 결합시켰기 때문에, 매 염기가 결합될 때마다 새로운 형광물질이 떨어져 나오게 되며 이를 검출하여 시퀀싱하게 된다. 따라서 terminator가 필요없게 되어 매우 빠른 속도로 시퀀싱이 가능하게 되며, 실제로 초당 10 염기 정도 시퀀싱이 가능하다고 알려져 있다.

https://www.nature.com/articles/nrg2626

이 방법에서는 한 DNA 분자를 증폭하여 동시에 시퀀싱하기는 불가능하며 단일 분자를 대상으로 시퀀싱을 진행하여야만 한다. 단일 분자에서 나오는 형광은 너무 약하기에 일반적인 방법으로는 측정하기가 곤란하다. 매우 작은 공간에 단일 DNA 분자를 가두어 놓고 고도로 집중된 레이저를 이용하여 측정하는 소위 Zero Mode Waveguide라는 기술을 사용하여 형광을 검출하고 있다. 단일 DNA 분자를 가둘 수 있는 극소 공간을 매우 많이 만들어 많은 샘플을 동시에 시퀀싱할 수 있다.

Oxford Nanopore sequencing

영국의 옥스포드 나노포어사는 막에 나노미터 수준의 채널을 형성한 후에 이곳에 DNA 단일 가닥을 통과시킬 때, 염기 서열에 따라 막 간의 전위 차가 변하는 것을 착안하여 시퀀싱을 한다. 막 바깥 쪽에서 이중 나선의 DNA를 helicase 효소를 이용하여 풀어주면서 단일 가닥이 일정한 속도로 채널 속으로 이동하도록 구성되어 있으며, 채널 안에 약 4 염기 정도가 들어가기 때문에 실제로 측정한 전위 차는 한 염기에 해당하는 것이 아니라 4 염기 단위로 얻어지는 것이다. 이렇게 얻은 데이터로부터 단일 염기 서열을 복구하는 소프트웨어가 매우 중요한 역할을 한다. 이 방법의 가장 큰 장점은 다른 방법들과 달리 template DNA에 상보적인 화학 반응을 하지 않는다는 점이고 DNA를 있는 그대로 측정한다는 점이며, 한번에 수만 염기를 읽을 수 있다.

http://image.slidesharecdn.com/ngslecture-130205102941-phpapp01/95/genome-wide-methodologies-and-future-perspectives-21-638.jpg?cb=1414657559

따라서 특별한 기기를 필요로 하지 않고 작은 카트리지만 있으면 그 안에 실제 시퀀싱이 일어나는 막을 포함한 소모품인 flowcell만 있으면 된다는 것이다. 결과는 USB 포트로 나오기에 노트북이나 스마트폰에 연결하면 되기에 휴대용이다. 채널을 집적화한 형태의 제품도 출시되었다.


Featured Posts
잠시 후 다시 확인해주세요.
게시물이 게시되면 여기에 표시됩니다.
Recent Posts
Archive
Search By Tags
아직 태그가 없습니다.
Follow Us
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square
bottom of page