본문 바로가기

생물정보학(바이오인포매틱스)

[대학원 준비 1일차] multiomics란?

 

 
안녕하세요, 전에 인체 시스템 정리에 이어 이제 논문을 읽으며 논문 내용을 정리해보려 합니다.
 
그런 차원에서 오늘 저녁을 기점으로 공부 기록할 수 있는 만큼 기록하면서 일 수를 세보려고 합니다 :)
 
우선 대학원 진학을 목표로 'single-cell multiomics'에 대해 먼저 공부를 하고자 하는데
 
multiomics에 대해 아는게 없어서 우선 리뷰 논문부터 간단히 정리해보겠습니다.
 
글을 의식의 흐름대로 모르는 부분을 자가 질문하며 이어나가려고 하니 정신 없어도 양해부탁드리겠습니다.
 

 

 
참고로 제가 아직 배경지식이 부족하여 오류가 있을 수 있기에 오류를 발견하셨다면 메일 주시면 감사합니다.
 
또한, 논문 요약에 있어 저작권 상 문제되는 부분이 있다면 알려주시면 조치하도록 하겠습니다!
 
메일 : tkm1214@naver.com
 
오늘 정리해볼 리뷰논문은 'Single-cell multiomics: technologies and data analysis methods'입니다.
 
본 논문은 2020년 9월 15일에 퍼블리시되었고, 
 
nature > Experimental & Molecular Medicine지에 개제되었습니다.

 

우선 multiomics란 무엇일까요?

 
 
구글에 검색을 해보니 시퀀싱 기술로 유명한 illumina에서 이에 대해 소개하는 영상을 만들어주었습니다.
 

 

 
결국 multiomics는 single problem을 이해하기 위해 multiple appoaches를 사용하는 기법으로

*transcriptome, *proteome, *epigenome과 같은 생물학적 정보들을 서로 연결하고 통합함으로써 

disease-causing genetic variant를 발견하기 위한 biological context를 파악하는데 활용할 수도 있고,

어떻게 하면 기존 치료법의 효험을 높일 수 있을지 이해하는데에도 활용할 수 있습니다.

 
각각의 오믹스에 대한 설명은 아래 영상을 참고하시면 되고 대략적인 용어 설명도 적어두었습니다.
 

 

* transcriptome : 세포에서 코딩과 논코딩 모두를 포함하는 모든 RNA 전사체의 집합
 
* proteome : genome에 의해 발현되거나 발현될 수 있는 모든 protein의 집합
 
*  epigenome : DNA 자체나 그에 영향을 줄 수 있는 histone proteins에서의 화학적 집합 
 

 

출처 : 위 영상 캡처, ILLUMINA

 
본 논문1)에서도 "multiomics 분석은 다양한 molecular data(data on mutations, mRNAs, proteins, metabolites)를 통합함으로써 cellular process에 대한 comprehensive understanding을 제공해준다"고 언급하고 있습니다.
 
결국 single-cell multi omics 전문가들은 몸에서 이루어지는 다양한 생물학적 과정을 이해하는 것은 물론,
 
transcriptome, proteome 등과 같은 각각의 데이터를 어떻게 통합시킬지 생각하는 수학적 스킬과
 
이를 프로그래밍을 통해 실현할 수 있는 데이터 분석 역량도 잘 갖추어야 할 듯 합니다.
 
여기서 'single-cell'을 'multiomics'로 분석을 하게되면,
 
cell subpopulations와 그들의 병리학적 과정과 연관된 기능에 대한 인사이트를 제공해줄 수 있다1)고 합니다.
 

출처 : pixabay

 
예로, 멀티오믹스 분석을 통해 gastric cancers의 signaling pathways와 연관된 
 
somatic mututations을 밝혀낸 논문2)이 있습니다.
 
해당 논문에선 proteogenomic analyses를 통해 phosphorylation/N-glycosylation data를 사용하여
 
somatic mutations와 연관된 signaling pathways를 밝혔는데요,
 
참고로 'protein data'가 어떻게 'genomic data'를 위한 'complementary information'을 제공하는지
 
proteogenomic analysis의 핵심 질문이라고 하는데, 결국 이것이 multiomics의 주요 과제가 되겠습니다.
 
 
 
본 연구에선 mutation-phosphorylation 상관관계 분석 외에도
 
mRNA level과 protein abudance 사이에서의 상관관계 분석을 통해
 
oncogen and tumor suppress candidates를 선별하였습니다.
 

어떻게 상관관계 분석했는지는 차후에 multiomics가 뭔지 어느정도 안 후에 알아보도록 하겠습니다.

 

* oncogen : 암을 유발시키는

 
 
이렇게 밝혀진 oncogenes의 mRNA/protein expression level이 증가했는지 감소했는지를 확인함으로써 
 
환자에게서 gastric cancer의 병이 악화되고 있는지 호전되고 있는지 확인할 수 있을 것입니다.
 

출처 : pixabay, thanks to PDPics

 
결론적으로 본 연구팀은 gastric cancer와 연관된 protein과 mRNA data를 통합함으로써
 
normal controls와 달리 tumors에서 관찰되는 genes, intron retentions, protein isoforms 등의 candidates를 발굴할 수 있었고,
 
그럼으로써 diffuse gastric cancer의 병리학적 기전을 이해하는데 도움을 주었는데, 이것이 multiomics를 하는 이유이지 않을까 싶습니다.
 
비유하자면 어떤 사람을 이해하고자 할 때 그 사람의 성격, 외적인 모습, 성장환경 등 다각적인 측면을 통합적으로 살펴보면 그 사람을 더 잘 이해할 수 있듯이
 
multiomics도 몸 속 특정 대상에 대한 다각적인 관점을 통합적으로 이해함으로써 생물학적 프로세스를 이해함에 있어 안보이던 걸 보이게 할 수 있지 않을까 싶습니다.
 

출처 : Pixabay

 
잠깐, 다른 논문으로 넘어갔는데 single-cell multiomics sequencing 기술의 유형으로는
 
Transcriptome을 토대로 genomic alterations와 gene expression 사이의 관계를 확인하는 DR-seq, G&T-seq, SIDR, TARGET-seq, scTrio seq가 있고(Genome 분류),
 
epigenetic changes와 gene expression 사이의 regulatory relatioship을 확인하면서 DNA methylation을 확인하는 scM&T-seq, scMT-seq, scTrio-seq, scNMT-seq(Epigenome 분류), Chromatin accessibility를 확인하는 sci-SCAR, SNARE-seq, scNMT-seq((Epigenome 분류)가 있습니다.
 
마지막으로 gene expression과 protein expression levels 사이의 상관관계를 보는 PEA/STA, PLAYR, CITE-seq, REAP-seq, RAID, ECCITE-seq(Proteom 분류)가 있다1)고합니다.
 
이때 scTrio-seq는 transcriptome-genome과 transcriptome-DNA methylation 분류 모두에 포함됩니다.
 


 
다음 글에서는 각각의 sequencing 기술이 어떤 기술인지 살펴보고자 하는데
 
그 전에 rna-seq 원리에 대해 한국말로 잘 설명해주는 유튜브 영상이 있어서 링크를 올립니다.
 

 

 
그리고 어제 아래 줌미팅 영상을 봤는데 아직은 이해하긴 이른 것 같아서 차후에 이해하는 것이 목표입니다.

 

 

 
오늘 정리는 이것으로 마치도록 하겠습니다. 감사합니다!
 
 

참고자료

 

1) Lee, J., Hyeon, D.Y. & Hwang, D. Single-cell multiomics: technologies and data analysis methods. Exp Mol Med 52, 1428–1442 (2020)
 
2) Mun DG, Bhin J, Kim S, Kim H, Jung JH, Jung Y, Jang YE, Park JM, Kim H, Jung Y, Lee H, Bae J, Back S, Kim SJ, Kim J, Park H, Li H, Hwang KB, Park YS, Yook JH, Kim BS, Kwon SY, Ryu SW, Park DY, Jeon TY, Kim DH, Lee JH, Han SU, Song KS, Park D, Park JW, Rodriguez H, Kim J, Lee H, Kim KP, Yang EG, Kim HK, Paek E, Lee S, Lee SW, Hwang D. Proteogenomic Characterization of Human Early-Onset Gastric Cancer. Cancer Cell. 2019 Jan 14;35(1):111-124.e10.