들어가기 전에 우선 Eric Chow라는 분이 NGS methods에 대해 잘 설명해주시는 것 같아서
아래 설명 영상도 어제 저녁에 봤는데, NGS(next generation sequencing)란 무엇이고 어디에 적용될 수 있는지 overview가 궁금하신 분들은 보시면 큰 도움이 되실 것 같습니다.
결국 gene expression level을 확인하는 것은 tumor cell이 유전 정보를 혈액으로 보내는 만큼 tumor의 gene expression이 발견되는지
혹은 외부 병원균(SARS-CoV-2 등)이 몸에 침투했는지, gene에 mutation이 발생했는지 등을 확인하여 질병 치료 및 예방에 도움을 줄 수 있을 것입니다.
이를 IIMUNIA 보고서1)에서 한 줄로 잘 설명해주었습니다.
The analysis of RNA, DNA, and proteins from these samples can be a powerful tool for examining how tissues or cell populations respond to various stimuli or stressors. -IILUMNIA
보고서에 또 다른 흥미로운 내용이 언급되어 있었는데, cell을 dissociation을 할 때, tissue마다 서로 ECM (extracellular meterials) composition과 cellularity가 다르기 때문에
그 성질을 고려하여 tissue 맞춤화된 즉, 최적화된 dissiociation protocol을 구축해야 sequencing의 효율을 향상시킬 수 있다1)고 합니다.
확실한 건 대부분의 tissue는 서로 다른 cells들을 가지고 있기에 single-cell 분석이 분석의 정확도를 높이는데 큰 도움을 줄 수 있을 것 같습니다(물론 bulk 분석에 비해 비용이 많이든다 합니다).
오늘은 먼저 번외로 베이스를 쌓고자 작년 초에 들었던 생체분자생물학 수업에서 'gene expression'에 대해 배웠던 것 중 헷갈리는 부분을 복습해보겠습니다.
1. Transcription Process
전사과정은 DNA로부터 mRNA(messenger RNA)를 만드는 과정으로
이때 RNA-polymerases가 DNA template strand에 complementary한 RNA strand를 만듭니다.
첫번째로, RNA polymerases는 trancsription factors라 불리는 단백질의 도움으로
2개의 DNA 가닥 중 어디에서 전사를 시작할 지, 그리고 그 DNA 가닥에서 어디서 전사를 시작할지 결정하는 'promoter'를 인식하게 됩니다.
RNA polyerase은 Promoter에서 DNA 가닥의 3'에서 5'으로 움직이는데, 그러면서 RNA 상보 가닥은 5'에서 3'으로 성장합니다 (아래 영상 참조).
영상을 보니까 mRNA가 5'에서 3'으로 성장하는 건 보여주는데, polymerase가 DNA의 3'의 5'으로 이동하는건 담지 못한 것 같아서 제가 유튜브로 GIF 이미지를 만들어봤습니다.
우선 뉴클레오타이드 연결은 항상 3'에 5'이 붙으며 5' -> 3'으로 이어지게 됩니다.
와 이거 영상 하나 만드는데 시간이 너무 많이 들었습니다. 물론 고생해서 만들면 더 기억이 잘남긴 하지만 그래도 왠만한 이상 다음엔 영상을 가져오도록 하겠습니다.
암튼 그렇다면 여기서 5'와 3'이 무엇인지 궁금해지실 것 같습니다. 우선 3'은 핵산을 구성하는 5탄당 중 3번째 탄소, 5'은 5번째 탄소입니다.
아래는 nucleotide의 화학 구조를 나타낸 이미지인데, 오탄당 중 3'-OH에 5'-인산기가 인산디에스테르 결합(phosphodiester bond)를 형성하며
계속 위에는 5' 아래는 새로운 3'이 이어지기에 모든 핵산의 합성 방향은 5' -> 3'이 되는 것입니다.
아래 영상에서 인산디에스테르 결합이 어떻게 이루어지는 잘 설명해주고 있으니 참고바랍니다.
여기서 RNA polymerase는 ribonucleoside triphospate substrates(NTPs)가
인산 당 뼈대에 연결될 수 있도록 nucleoside monophosphates로 cleaved하고(RNAn + NTP -> RNAn+1 + PPi)하는 반응을 촉매(catalyze)합니다.
참고로 이 RNA polymerase는 대략 DNA의 35 base pairs를 커버하고, DNA-RNA hybrid 파편은 대략 9 base pairs라고 합니다.
이후 ' pyrophosphatase'라는 효소가 두번째 favorable reaction인 PPi -> 2Pi로 이어지는 반응을 촉매하며,
본 pyrophosphate의 Hydrosis 반응(가수분해 반응)에서는 상당한 양의 free energy가 방출되게 되고,
그렇기에 nucleotide incorporation reaction이 이루어지는 역반응은 일어나지 않아 RNA를 합성하는 전사과정을 한 방향으로 효율적으로 이루어지도록 합니다.
암튼 RNA polymerase가 DNA 가닥을 움직이면서, 합성을 마친 구역의 DNA double helix는 re-form됩니다.
DNA가 다시 re-form되는 이유는 DNA가 필요하지도 않은데 전사가 이루어진다면 몸의 설계도가 불안정해져서 설계도가 훼손되거나, 불필요한 단백질들이 만들어지기에
DNA는 필요할 때만 helicase라는 효소에 의해 가닥이 풀리면서 polymerase에 의해 전사가 이루어지게 되는 것입니다.
제가 최근에 즐겨봤던 유튜브 채널에서도 전사 과정에 대해 잘 설명해주고 있으니 참고바랍니다.
문제는 RNA polymerases가 상대적으로 강력한 모터임에도 불가하고, steady하게 움직이는게 아니라 template의 특정 지역에서 멈춰서거나 backtrack할 수도 있다는 겁니다.
그렇기에 RNA polymerase가 멈추지거나 backtracking 하지 않도록 하면서 elogtation speed가 적절하게 이루어질 수 있도록 하는 'elongation factors'가 존재합니다.
이외에도 RNA polymerase는 잘못 인식된 nucleotide를 인식하고 제거할 수 있는 'proofreading(교정)' 기능을 갖습니다. 이처럼 위기관리는 생존을 위해 어디에서나 중요한 것 같습니다.
다음으로 Bacteria에서 Transcription이 이루어지는 절차를 보다 구체적으로 살펴보도록 하겠습니다.
참고자료
1) IILUMINA, Illumina Single-Cell Sequencing Workflows: Critical Steps and Considerations, URL : https://www.illumina.com/ techniques/sequencing/rna-sequencing/ultra-low-input-single-cell-rna-seq.html