본문 바로가기

생물정보학(바이오인포매틱스)

[14일차] 브릭 웨비나 정리, 정현우 막스플랑크연구소 종신연구원, Single Cell RNA-Seq Analysis

 

이번 글에선 전 글에서 정리하긴 했지만, 생물정보학 관련 논문을 읽으면서 좀 더 알아야 할 것 같다고 느껴서 관련 자료를 찾다가 우연히 본 'Single Cell RNA-seq'와 관련된 웨비나 영상을 간단하게 정리해보도록 하겠습니다.

 

* SingleCell-RNA seq와 관련된 글

 

 

[대학원 준비 3일차] single-cell RNA sequencing (scRNA-seq)에 대하여

오늘은 single-cell multiomics analysis를 위한 기술 중 single-cell RNA sequencing (scRNA-seq) methods를 정리해보겠습니다.어제는 single cell whole genomcing sequencing methods인 MDA와 MALBAC에 대해 정리했었죠?   [대학원

tkmstudy.tistory.com

 

 

물론, 개괄적인 소개를 해주는 강연이었긴 하지만 본 기술에 대해 잘 알지 못하는 저로선 '단일 세포 분석'이 무엇이고, 왜 필요하며, 어디에 활용될 수 있는지 이해하는데에 큰 도움이 되었던 것 같습니다. 

 

강연이 진행된 날짜를 보니 2022년 1월이던데 전역 전 휴가를 나오고 며칠 안되었을 때인 것 같습니다. 그때의 기록이 새록새록 합니다.

 

 

BRIC Webinar 제목 : High-Throughput Single Cell RNA-Seq Analysis : Principles and Applications, 2022.01.19

 

 

 

 

강연은 막스플랑크연구소 종신연구원이신 정현우 박사께서 해주셨습니다. 박사님께선 최근에 한국에 오셔서 한국생명공학연구원(KRIBB)과 콘퍼런스를 함께 개최하신 것 같습니다. 

 

 

 

생명연, 막스플랑크와 혈관질환 극복 실마리 찾는다

한국과 독일이 혈관질환 극복을 위한 연구 협력에 나선다. angel_nt/게티이미지뱅크 제공.고령화로 혈관질환 발생률이 높아지면서 한국과 독일 과학자들이 혈관질환 치료 전략을 모색하는 논의의

www.dongascience.com

 

 

강연 내용으로 돌아와서 먼저 RNA 시퀀싱 방법으로는 어떤 세포인지 무시하고 그냥 샘플에서 어떤 유전자가 발현되었는지만 보는 Bulk RNA-seq, 어떤 세포에서 어떤 유전자가 발현되었는지 알 수 있는 본 강연의 주제인 single cell RNA-seq가 있다고 하는데요. 각각은 '스무디'와 '화채'에 비유된다고 합니다.

 

스무디는 어떤 맛이 나는지는 알아도 어떤 과일이 어떤 맛을 내게 했는지 알긴 어렵지만, 화채는 어떤 과일이 어떤 맛을 내게 했는지 바로 알 수 있는 것처럼 Bulk RNA도 어떤 RNA가 있는지는 나왔는데 이게 어떤 세포에서 나왔는지는 알기 어렵고, 단일 세포 분석(single-cell RNA-seq = scRNA-seq)은 어떤 세포에서 어떤 RNA 서열이 나왔는지를 알 수 있습니다.

 

이외에도 강연자께선 세포 간의 배열과 같은 positional context를 고려하는 spatial transcriptiomics*도 최근에 주목을 받고 있다고 하셨습니다. 복잡한 조직의 구조가 그 구조의 기능과 밀접하게 관련이 있기 때문입니다0).

 

* spatial transcriptomics 설명 영상 

 

 

 

 

그러면서 "유전자 발현을 분석할 때는 샘플의 상태나 종류, 연구 목적, 비용 등을 고려해서 가장 적절한 분석방법을 선택하면 된다"며 "scRNA-seq엔 IIUMINA의 ddSEQ single cell isolator, 10X Genomics Chromium, BD Rhapsody Express가 주로 사용된다"고 합니다. 2022년 초 강연이니 지금은 또 바뀌었나 궁금해지기도 합니다. 제가 읽고 있는 논문에선 10X Genomics를 사용해서 관련 프로토콜 자료들을 보고 있는 중입니다.

 

이후 영상에선 scRNA-seq 분석 절차를 소개해주셨는데, 저번에 본 기술에 대해 정리하며 알아보긴 했지만 몰랐던 내용도 새로 알게 되어 도움이 되었습니다. 예로 Beads에 있는 Barcode가 하나의 bead엔 모두 동일하게 있고 bead마다 다르게 존재하여 barcode가 RNA transcript가 유래된 세포를 매칭시켜줄 수 있다는 것까진 알았지만, unique molecular identifier(UMI)는 같은 bead에 존재하더라도 모두 다른 서열을 갖기에 oligodT 하나가 하나의 RNA transcript를 매칭하여 나중에 얼마나 많은 유전자가 검출되었는지 그 copy number를 검출할 수 있다는 점은 몰랐습니다.

 

사실 영상을 보기 전에 scRNA-seq 과정을 시뮬레이션 해보기 위해 PPT로 관련 이미지를 만들어 보았는데, 이렇게 이미지를 만들어보면서 머리 속에서 시뮬레이션을 돌려보면 기억하는데에도 도움이 되긴 하지만 무엇보다 과정 중 어떤 부분을 놓치고 있는지 이해하는데 도움을 주는 듯 합니다. 제가 놓쳤던 부분은 Beads 내에서 UMI가 각기 다르다는 점이었습니다.

 

 

 

 

위 이미지에서 처럼 cDNA가 reverse transcription을 통해 합성되고 나면, 새로 생긴 cDNA를 PCR로 증폭(amplification)시키고, 정제하고, 시퀀싱에 필요한 adapter와 index를 양쪽 말단에 추가합니다. 여기서 또 새로 알았던 게 NGS 분석에서 하나의 cDNA에 대해 두 개의 read를 구분해서 분석한다는 점이었습니다. 무슨 말이냐 하면 특정 transcript에 대해 read 1에선 cell identity(barcode)와 gene quantifiaction(UMI) 관련 정보가 들어가고, read 2에는 transcript의 정보가 들어가는, 그래서 정보가 분리되어 해독된다는 점이었습니다.

 

생각해보니 read1의 정보를 read2 전사체 정보와 함께 해독하면 단순한 표지를 전사체 정보로 해독해버리는 오류가 생길 수 있으니 분리해서 해석하는게 정확도를 높일 수 있을 것 같네요. NGS 분석에 대해 살짝 헷갈려서 관련 영상*을 다시 봤는데, NGS가 어떻게 이루어지는지 잘 설명해주는 듯 하니 참고 바랍니다. 아직 NGS의 전 과정에 대해 제대로 이해하려면 공부가 더 필요할 것 같습니다.

 

관련 영상 링크 : https://youtu.be/WKAUtJQ69n8?si=jmVY-GtEZ51mYCQa

 

 

그렇게 얻은 시퀀싱 정보로부터 각 샘플에 어떤 세포가 있고, 어떤 세포에서 어떤 유전자가 발현되었는지, 그리고  해당 유전자의 발현량이 어느정도 되는지(UMI)를 알아낼 수 있으며,

이때 "세포와 세포간의 차이를 가장 잘 설명해줄 수 있는 기준이 되는 유전자를 선별하여 그 유전자를 이용하여 주성분 분석을 하게 되면, 유전자 발현에 있어 여러 세포들이 갖는 유사성과 차별성을 파악할 수 있다"고 합니다.

이러한 단일세포분석 결과를 가시적으로 보여주는 것 중 대표적인 방법이 UMAP (uniform manifold approximation and projection)으로 알려져있습니다.

 

선행 논문1)에 따르면, 개별세포 분석은 수천 개의 개별 세포들에서 수천 개의 유전자 발현을 확인하는 만큼 너무 많은 특징을 고려해야하기에 기하학적인 방법으로 dimension을 감소시켜줄 수 있는 UMAP이 유용하게 활용될 수 있다고 합니다. 참고로, UMAP은 scRNA-seq을 위해 개발된 것은 아닌데, 써보니까 scRNA-seq에 활용하기에 적합했다고 하네요.

 

아래 UMAP 사이트(글자 클릭 시 이동)에선 UMAP을 해볼 수 있는 코드와 적용할 수 있는 예제를 제공해주고 있는데, 시간 될 때 한번 예제로 해봐야겠습니다.

 

출처 : UMAP

 

 

강연에선 "UMAP에선 점 하나가 세포 하나를 의미하며, 유사한 세포일 수록 그림 상에서 가깝게 위치하고, 서로 다른 세포일수록 멀리 표현된다고 생각하면 된다"하고 합니다. 제가 읽고 있는 논문에서는 scRNA-seq을 기반으로 한 UMAP을 통해 특정 조건을 주었을 때 분화된 세포 그룹은 줄어들고 증식하는 세포 그룹은 늘어남으로써, 분화된 세포를 재생 줄기세포로 되돌리는 리프로그래밍이 잘 되고 있음을  확인하고 있었습니다.

 

아무튼 간에 이후 기존의 생물학적 지식을 토대로 각각의 세포 그룹이 어떤 종류의 세포인지 annotation하는 작업에 들어가고, 더 나아가 다른 세포 종류 간에, 그리고 연구자가 확인하고자 하는 실험 조건(ex. 정상 vs 암) 간에 어떤 '분자적 차이'가 있는지 확일할 수 있다고 합니다.

 

또한, 각각의 세포들이 발현하고 있는 receptor나 ligand의 유전자 발현을 확인함으로써 서로 다른 세포 간의 신호전달과 같은 상호작용이나 연속된 세포의 기능 활성화 과정이 언제 어떻게 이루어지고 있는지 파악할 수 있다고 합니다.

 

마지막으로 이러한 scRNA-seq가 적용된 실제 연구 몇 가지를 소개해주셨습니다. 예로, 본 기술을 활용하면 포유류의 초기 발생 과정에 있어 각각의 세포들이 단일 세포 수준에서 어떤 분자적 특징을 가지고 있는지, 즉 착상을 전 후해서 어떤 분자적 변화들이 일어났고, 세포 간 엔 어떤 상호작용이 이루어져는지 연구를 할 수 있는 것은 물론,

생체 환경을 모방한 오가노이드 안에 어떤 세포가 어떻게 분포해 있고, 그 세포들이 어떤 활성 과정을 갖는지 유전자 발현 수준의 변화를 단일세포분석으로 관찰 및 추적함으로써 질병 치료나 생체 이식이 가능한 오가노이드 개발에 활용할 수도 있고,

왜 특정 환자에서 치료 효과가 현저하게 낮게 나타나는지 파악하기 위한 목적으로 환자 유래 오가노이드 분석을 통해 정상 환자와 달리 특정 환자에서는 어떤 세포 분포에서 어떤 특정 유전자 발현이 나타나는지 확인하여, 동일한 자극을 주는 치료에 다르게 반응하게 하는 기작을 이해하고 이를 극복하는 치료 전략을 수립하는데에도 활용할 수 있다고 합니다.

 

대략적으로 소개한 거라서 자세한 내용은 첫 부분에 첨부한 영상을 참고하시면 되겠습니다.   

 


 

결국에 정리하자면 single cell RNA-sequencing을 진행하면, 개별 세포에서 어떤 유전자가 어느 정도로 발현되는지를 이해할 수 있게 됩니다. 그렇게 특정 질병 조건이나 서로 다른 조직에서 어떤 세포 분포를 보이고, 어떤 세포와 세포 간 상호작용가 나타나는지(리간드와 수용체 유전자 발현 분석), 세포와 세포 간 분자적 차이를 이해할 수 있게 되어 질병의 발병 기작을 규명하거나 새로운 치료 전략을 세울 수 있게 됨으로써 기존 치료제의 효험을 높이거나 새로운 신약후보물질을 발굴하는데 도움이 될 수 있습니다.

 

출처 : UNSPLASH, thanks to National Cancer Institute

 

RNA 분석이 중요한 이유는 전 글에서 말씀드렸듯 몸 속 현장에서 수많은 유전자 중 어떤 유전자가 발현되어 사용되고 있는지를 알 수 있기 때문입니다. 즉, 특정 개인의 독서 패턴을 분석하기 위해서는 집에 어떤 책이 있는지를 분석하는 것을 넘어(DNA 수준), 그 사람이 어떤 책을 언제 얼마만큼 주로 꺼내 읽는지 이해하는 게 중요한 것처럼 말이죠. 공부에 있어서도 이론을 넘어 현장의 경험을 하는 것이 중요한 것도 여기에 이유가 있지 않을까 싶습니다.

 

이것으로 단일 세포 분석에 대한 브릭 웨비나 강연 정리를 마치겠습니다. 가끔씩은 이렇게 정리할거리가 있는 강연 영상을 보게 되면, 강연 하나를 가지고 이렇게 정리를 해보도록 하겠습니다. 그럼 다시 논문 분석과 졸업 논문 작성을 하다가 얘기 할거리가 있으면 돌아오도록 하겠습니다. 감사합니다.

 

 

 

참고 영상

 

0) 정현우 막스플랑크연구소 종신연구원, High-Throughput Single Cell RNA-Seq Analysis : Principles and Applications, BRICK Webinar Youtube, 2022. URL : https://youtu.be/21SI0MUmdLI?si=olQPjnpYTGwUX1M-

 

 

참고자료

 

1) Niels Tjoonk,  What is a UMAP plot?, Single Cell Discovery, 2023, URL : https://www.scdiscoveries.com/blog/knowledge/what-is-a-umap-plot/#what-it-is