이번 글에선 저번 글에서 살펴봤던 single-cell RNA seq 기술 중 SMART-seq을 알아보겠습니다.
참고로, 여기서 SMART는 Switching mechanism at 5’ end of RNA template의 약자라고 합니다.
우선 100% 신뢰는 못하지만 그래도 대략적으로 알려주는 챗GPT에게 'SMART-seq'이 무엇인지 물어봤습니다.
여기 밑줄친 부분이 SMART-seq의 핵심인 것 같은데, 다시 여기 글에다가 옮겨 보겠습니다.
"In SMART-seq, The template-switching oligonucleotide (TSO) binds to these nucleotides and provides a new template for the reverse transcriptase to continue synthesizing the cDNA, thereby capturing the full length of the RNA."
핵심이라 생각한 이유는 아래 영상에서 저번 영상에 봤던 박사 분께서
SMART-seq은 library preperation 단계에서 'template switch'를 하는 것이 핵심이라고 말했기 때문입니다.
ILLUMINA에서 소개하는 SMART-seq의 이미지를 가지고 'template switches'에 대해 알아보겠습니다.
우선 다른 seqeuncing 기술처럼 mRNA fragment가 oligodT에 결합을 하는데요,
이후에 3번째에 'ccc'가 보이실건데 이것은 untemplated C nucleotides로 reverse transcriptase에 의해 추가됩니다.
그리고 전사과정 동안 c nucleotides에 'template-switching oligonucleotide (TSO)'가 결합되게 됩니다.
이렇게 cDNA가 연장되게 되면서 이제 아무리 작은 RNA라도 cDNA가 full length로 합성되게 되어
rRNA를 제거하거나 mRNA를 늘리는 RNA enrichment 단계를 거치지 않고도 PCR만 거쳐
full-length transcripts를 얻어 개별세포 수준에서 transcriptomes의 정보를 빠르고 효율적으로 분석할 수 있는 이점이 있습니다.
암튼 template이 switch되기에 'Switching mechanism at 5’ end of RNA template'라고 부릅니다.
아래 영상은 SMART-seq가 어떻게 이루어지는지 쉽고 빠르게 알려주고 있습니다.
이러한 SMART-seq은 alternative transcript isoforms와 SNPs의 detection에 적용할 수 있다고 하네요.
SMART-seq2의 protocol 논문3)을 보니까, 분석할 cell을 얻을 때
cell을 single-cell suspension로 분해할 때 그 프로세스가 신속하게 이루어져야 한다는데
그 이유는 시간이 오래걸리면 gene expression에 원치않는 alterations, 악화, 혹은 cell popultion의 많은 부분들이 죽을 수 있기 때문이라고 합니다.
따라서 세포는 가능한 30분 이내로 빠르게 선택되어, ribonuclease inhibitor가 포함된 lysis buffer에 위치되어야 하는데,
전에 글에도 말했던 것 같은데 해당 효소가 포함된 lysis buffer는 RNA degradation을 막아 RNA를 안정화시켜주기 때문에 RNA transcriptome을 얻기 위한 보존에 꼭 필요하기 때문입니다.
본 연구에서는 RT(reverse transcripton) reaction이 이루어져야 하는 만큼 역전사 반응을 억제하지 않는 lysis buffer를 사용했다고 하고,
무엇보다 조립에 재료가 되는 free dNTPs와 oligo-dT oligonucleotides (30-nt poly-dT stretch and at 25-nt universal 5' anchor sequences)를 포함하는 lysis solution을 선정했다고 하네요.
논문3)에 따르면, Smart-seq를 수행할 때 RT reaction은 보통 90분동안 42 C에 이루어지지만,
그동안 일부 RNAs가 steric hindrance(입체적인 장애)*로 인해 secondary structures(hairpins, loops 등)를 형성하도록 하여
*steric hindrance : 분자 내 서로 접근해서 존재하는 원자 또는 원자 단 사이의 교환반발력으로 정상 원자가의 방향성이 비뚤어지거나 결합 주위의 자유회전이나 공명 현상이 방해를 받는 것 4)
효소가 chain elongation을 종결하게 야기할 수 있는 문제가 발생할 수 있는데
그래서 연구팀은 'trehalose'와 'betaine (N,N,N-trimethylglycine)'를 사용하여 이런 바람직하지 못한 effect를 극복했다고 합니다.
그렇다면 두 가지 물질이 효소의 문제를 어떻게 극복하는지 챗GPT에게 물어봤습니다.
요약하자면, trehalose와 betain은 SMART-seq에 필요한 효소인 reverse transcriptase와 polymerase enzymes의 performance와 stability를 향상시키는데 사용되며
Trehalose는 효소를 안정화하여 RNA secondary structure를 줄여주고,
논문3)에 따르면, betaine은 methyl group donor로서 단백질의 thermal stability를 증가시키고,
DNA helix를 불안정하게 함으로써 DNA thermal melting transitions의 base pair composition dependence를 줄이거나 제거하는 효과가 있다고 합니다.
RT 동안 DNA Helix를 불안정하게 하면 좋은 이유는 GC-rich regions와 같은 전사되기 어려운 장소(삼중 결합이라 결합이 잘 끊어지지 않아서)에 reverse transcriptase가 멈추지 않고, 부드럽게 이동할 수 있도록 돕기 위함이라고 합니다.
이 두가지 화학 첨가제들이 어떻게 RNA secondary structures를 줄이는지도 추가로 물어봤는데, 위의 내용을 복습하는 정도의 내용입니다.
Betain : reduces secondary stuctures by lowering the melting temperature of GC base pairs.
Trehalos : reduces secondary stuctures by improving reverse transcipting efficency.
물론 이전에도 두가지 첨가제들이 역전사 반응에 활용하면 이점이 있다는게 밝혀지긴 했지만,
TSOs를 사용할 때 full-length cDNA의 생산량을 향상시켜주는 건 2014년 기준 최근에 밝혀졌다고 합니다.
자꾸 GC rich regions가 등장하길래 왜 중요한지 찾아봤습니다(글이 의식의 흐름대로라 죄송합니다).
결국 앞서 말했듯 GC-rich regions는 삼중 결합이라 thermostable하여 결합을 열려면 에너지가 더 필요해 더 높은 melting temperature를 필요로 하기에,
이 melting 온도 기준이 충족되지 않고 G-C가 whole genome에서 60%이상이 넘어가면 전사가 제대로 되지 않아 문제가 생길 수 있고,
무엇보다 G-C rich regions는 질병의 발달과정에 연관이 깊어, genetic disorders 연구에 중요하다고 합니다.
또한, 이중 결합은 하는 A-T rich regions와 G-C rich regions는 서로 다른 binding pattern을 보이기에 copy number variant studies에도 중요하다고 합니다.
암튼 넘어가서 본 연구팀이 사용한 reverse transcriptase은 template switch를 할 수 있고, TSO로부터 complementary sequence를 합성할 수 있는 Moloney murine leukemia (M-MLV)였습니다.
무엇보다 cDNA의 untemplated 3' extension이 잘 이루어질 수 있도록
binding affnitity를 높이도록 ribose sugar ring을 lock(2' oxygen과 4' carbon 사이의 methlyene bridge를 형성)하는 Locked Nucleic Acids(LNA) modification이 이루어지도록 했습니다.
다음으로 아래 이미지 중간을 보면 cDNA 합성, 그리고 PCR 후에 'Tagmentation'이라는게 있는데,
이 과정은 DNA를 파편화하여 adapters를 tag하는 걸 single step으로 해서 sequencing libraries를 빠르고 효율적으로 만들기 위해 필요한 과정이라고 합니다.
구체적으로, tagmentation은 pre-loaded adapter sequences를 운반하는 Tn5 transposase라 불리는 효소를 사용하여 이루어지며
이 Tn5 transposase는 DNA의 random locations를 cut해서 adapter sequence를 삽입합니다. 이것이 one reaction으로 일어나는 것입니다.
앞서 말했듯 adapter는 cell 혹은 분자 identification을 위한 index와 NGS 플랫폼에 결합(sequencing binding site와 sequencing primer binding site 포함)하기 위해 필요합니다.
그렇게 Gap repair, enrichment PCR, PCR purification까지 마치고 나면, Enrichment-ready fragment가 나오고,
이를 NGS 분석을 통해 개별 세포 수준에서 gene expression을 확인하여 돌연변이가 발생했는지 파악할 수 있는 것입니다.
아래는 최근에 나온 SMART-seq3를 수행하는 실험 영상입니다.
다음 글에선 Single-cell Multiomics를 위해 RNA가 아닌 이번엔 epigenomics 정보를 얻는 Single-Cell ATAC-Seq에 대해 알아보도록 하겠습니다.
참고자료
1) biosynthesis, What Is A Template Switching Oligonucleotide?, 2023, URL : https://www.biosyn.com/faq/What-Is-A-Template-Switching-Oligonucleotide.aspx
2) ILLUMNIA, Smart-Seq2, URL : https://www.illumina.com/science/sequencing-method-explorer/kits-and-arrays/smart-seq2.html
3) Picelli, S., Faridani, O., Björklund, Å. et al. Full-length RNA-seq from single cells using Smart-seq2. Nat Protoc 9, 171–181 (2014).
4) 화학대사전, 입체 장해(steric hiderance), NAVER 지식백과