본문 바로가기

생물정보학(바이오인포매틱스)

[17일차] Signaling Entropy, Nanog, PAGA graph, 5-FU, Brdu, pHH3

 
안녕하세요, 전에 읽던 논문0)을 이어서 읽다가 정리할 부분 몇 가지가 생겨서 다시 글을 쓰게 되었습니다.
 
이제 처음 논문을 읽었을 때보단 논문 구절들을 이해하는 속도가 빨라진 것 같고, 한줄 한줄 비교적 잘 넘어가서 정리해야할 부분도 적어진 것 같습니다. 물론, 아직 익숙치 않은 부분들이 여전히 많긴 합니다.
 

 

1. Signaling Entropy

 
 
우선 Entropy란 "에너지 전환 과정에서 쓸모 없어지는 무언가를 발견하고 정의한 것1)"으로 보통 '무질서도'라고 말하곤 하죠?
 
예전에 군대 복무할 때 같이 복무하던 고려대 생명 관련 전공 형이 "자연의 모든 메커니즘은 엔트로피가 높아지는 안정적인 양상을 띌 뿐"이란 걸 꼭 기억하라며 '엔트로피'를 강조하던 기억이 납니다. 
 
 

 
 

 
이러한 의미를 갖는 'Entropy'라는 단어가 들어간 'Signaling Entropy'는 cellular plasticity(Ex. differentiaion potency)를 평가하기 위한 모델에 사용되는 개념으로, 통계학적 원리를 토대로 세포의 differentiation potential과 cancer status를 식별하는데 활용될 수 있다2)고 합니다.
 
이를 위해 Signaling Entropy는 특정 세포의 molecular pathways의 상대적인 활성 수준을 정량화하고자 세포의 transcriptomic profile을 사용한다고 하는데3), 그렇다면 Signaling Pathway가 어떤 방식으로 세포의 활성 수준을 측정하고 나타내기에 cellular plastcitiy를 파악할 수 있는 것이고, 이름에 entropy가 들어가는 걸까요?
 
결론부터 말하자면 아직 저도 제대로 이해를 하진 못했는데, 논문에 적혀있는 바로는 signaling entropy가 cellular interaction network의 context에서 세포들의 유전자 발현 수준의 uncertainty와 promiscuity 정도를 수량화하고, 이를 토대로 전반적인 differentiation potency*와 세포 집단의 transcriptomic heterogenity를 이해하는 데 도움을 준다는 점3)에서 세포의 유전자 발현 신호가 무질서해지는 정도를 엔트로피라는 개념으로 파악하는 것이기에 Signaling Entropy가 아닐까 추측이 됩니다. 
 

*differentiation potency(분화능) : "줄기세포와 같은 특정세포가 각각 생물학적으로 구별되는 세포유형으로 발생할 수 있는 성질4)"

 
 

출처 : Pixabay, thanks to geralt

 
 
읽고 있는 논문0)에서는 세포의 differentiation potency를 평가하고자 특정한 R 패키지의 특정 함수를 활용해 signaling entropy rate를 계산하였다고 하는데, 그럼으로써 Dox 주입(OSKM 발현 유도 즉, partial reprogramming 활성화) 후 대부분의 장 내 세포에서 stemness score가 증가함이 확인되었습니다. 즉, 의도한대로 partial reprogramming을 통한 cellular & molecular alterations을 유도할 수 있었던 것입니다.
 
아래 링크는 single cells의 differentiation potency를 측정하기 위해 사용되는 SCENT package인데요, 이 SCENT는 cell population에 걸쳐 특징적인 potency states의 distribution을 추론하기 위해 single-cell entropies를 측정한다고 합니다.
 
링크 : https://github.com/aet21/SCENT
 
참고로, differentiated cells일수록 signaling distribution은 low entropy이고, undifferentiaed cells일 수록 signaling distribution은 high entropy로 볼 수 있다고 합니다. 비유하자면 세포가 특정 분야에 전문가가 될 수록 행동에 질서가 생기지만 일을 할 수 있는 범위가 좁아지고, 그렇지 않은 줄기세포는 무엇이든 할 수 있지만 행동이 질서적이진 않은 것으로 볼 수 있겠습니다.
 
이때 세포의 분화 수준을 식별하고자 expression similarity를 보이는 co-expession cell clusters를 추론하고 그 density를 측정하기 위해 clustering algorithm을 사용하고, 세포의 potency states의 heterogeneity를 계산하는 등의 복잡한 절차를 거친다고 하는데 아직 저에겐 너무 어려운 내용인 것 같습니다. 이에 대해 궁금하신 분은 논문 2) - 3)을 참고하시면 되겠습니다.
 

 
 
Signaling Entropy에 대한 ChatGPT의 설명은 위와 같은데요, 높은 signaling entropy일수록 세포의 states 사이의 전환할 수 있는 potential이 더 높은 세포인 Stem cells나 Cancer cells와 관련이 있다는 설명인 것 같습니다.
 

 

2. Nanog

 
 
읽고 있는 논문0)에선 Nanog가 Full reprogramming marker로, 3일 간의 Transient OSKM expression로 Nanog를 유도하기엔 불충분했다고 설명합니다.
 
추가 설명을 하자면, Nanog는 "인간 배아줄기세포가 자가 증식(self-proliferation)과 다재다능성(multi-potency)을 갖게 하는 DNA 결합 전사 인자5)"라고 합니다.
 
선행 연구에선 생쥐 배아 줄기세포에 유도만능줄기세포(iPSC)를 만드는 야마나카 인자인 Sox2와 OCT4를 투입했을 때 이 인자들이 Nanog promoter에 결합하여 Nanog 유전자의 발현을 촉진한다6)고 밝혀지기도 한 만큼 논문에서 OSKM 발현이 Nanog를 유도할 수 있는지에 대해 논의한 듯 합니다.
 
이외에도 높은 발현의 Nanog는 advanced cancer stage와 shorter patient survival rate와 연관이 있다고도 하는데7), 이만큼만 간략히 알아보고 다음 파트로 넘어가보도록 하겠습니다.
 
Nanog에 대한 추가 설명이 궁금하신 분은 아래 영상을 참고해보셔도 좋을 것 같습니다.
 

 

 

 

3. PAGA graph

 
 
 
Partition-based graph abstraction (PAGA)는 cell clusters 사이의 connectivity를 찾는 방법으로, clusters들이 얼마나 연관되어 있는지 보여줄 수 있는 것은 물론, clusters의 그래프로 데이터셋을 줄이는 데에도 활용될 수 있다8)고 합니다.
 
 

사진 출처 : https://lazappi.github.io/phd-thesis/5-analysis.html

 
 
여기서 위의 Figure A에서 동그라미인 node가 'cluster'를 의미하고, 동그라미를 연결하는 'edge'는 cluster 사이의 connectivity를 의미하며, edge의 색깔이 파란색에 가까워질수록 connectivity가 약해지고, 노란색에 가까워질수록 connectivity가 강해진다고 볼 수 있습니다. 그리고 node에 있는 숫자는 clusters에 속한 cells의 수라고 합니다.
 
그렇게 clusters 사이 gene expression profiles가 유사한 것끼리 연결하면, 세포의 분화 혹은 발달 경로를 추적하는 trajectory analysis를 할 수 있다고 합니다.
 
참고로 이에 더해 cell velocity를 계산하는 방식을 통해 각 세포마다 transctriptional direction을 파악할 수도 있습니다. 즉, 특정 툴을 활용하면 transcriptional profile cells가 어느 방향으로 향하는지 화살표로 표현하는 것은 물론, 화살표의 길이로 변화 속도를 나타낼 수 있습니다. 아래 이미지를 참고하시면 되겠습니다. 어떻게 이런 툴을 만들었는지 이해하고 학습하는 것도 도움이 되겠지만, 요즘엔 이런 툴이 무엇인지 이해하고 어떻게 활용해볼지 고민해보는 데 시간을 투자하는 것이 더 좋은 학습 전략이 되지 않을까 싶습니다.
 
 

사진 출처 : https://lazappi.github.io/phd-thesis/5-analysis.html

 
 
 
위 사진 출처 사이트에 sc-RNA seq에 대해 자세하고 친절하게 설명해둔 것 같은데, 다음 글에선 본 사이트의 내용들을 쭉 읽고 정리하는 시간을 가져봐야겠습니다. 
 

 

Tools and techniques for single-cell RNA sequencing data

Introduction The kidney has a branching structure where incoming blood arteries are split into smaller and smaller vessels. At the end of the smallest capillaries are nephrons, the functional unit of the kidney. Blood is filtered in the glomerulus and the

lazappi.github.io

 

 
그리고 어쩌다보니 single-cell RNA seq에 대해 소개하는 해외 유튜브 채널도 찾게 되었는데, 시간 될 때 보고 이또한 정리해봐야겠습니다. 요즘 생물정보학 전문성을 쌓고자 외부로 사람들을 만나며 돌아다니기보단 의자에 앉아 공부하는 방식에 집중하고 있음에도 불구하고 읽고 들으며 배워야 할 게 아직도 정말 많다는게 느껴집니다. 역시 전문성을 기르는 대학원 과정을 만만히 보긴 힘든 것 같습니다.
 
 

Sanbomics

Bioinformatics tutorials with a focus on next-generation sequencing analysis. Topics cover RNAseq, single-cell RNAseq, linux/shell usage, python, R, phylogenetics, alignments, and more. I am a PhD student with over 12 years of programing experience and 7 y

www.youtube.com

 
 

암튼 이러한 PAGA Graph는 단순히 single cells 사이의 relations을 파악하는 연구를 넘어 noise-reduced & computationally tractable groups of cells (clusters) 사이의 relations을 파악하는 연구로 확장하는 general framework를 제시하였고, 이를 통해 생물학적 기전의 clearer picture(Ex. biological trajectory through the interphases of cell cycle while ignoring a cluster of damaged and dead cells)9)를 얻을 수 있게 해주었습니다.
 
읽고 있는 논문0)에서는 PAGA graph를 통해 Dox를 주입한 세포들(Ex. CBC, DC1, DC2 등 장 세포)과 Dox를 주입하지 않은 세포들(동일)의 clusters를 비교하고, velocity-directed arrows로 transcriptional direction을 나타내었습니다. 그리고 이러한 trajectory analyses를 통해 partial OSKM induction에 의해 생성된 DC1과 DC2 각각이 TA/CBC와 EC 각각과 가깝게 위치함을 확인했다0)고 합니다. 
 
이번 글에선 여기까지 하고, 또 논문을 읽다가 정리해야 될 부분이 생기거나 추가적으로 읽은 자료 중 정리하고 싶은 부분이 생기면 돌아도록 하겠습니다. 감사합니다!
 
 
- 추가 논문 등장 용어 정리
 
1) 5-FU(5-fluorouracil) :  항암제 등 chemotherapy에 활용 가능한 물질로, 세포가 DNA를 만들고 복구하는 기능을 막음으로써 cancer cells가 grow & multiply하는 걸 억제할 수 있다10)고 합니다.
 
아래는 5-FU에 대해 설명해주는 영상인데(5-FU란 무엇이며, 이것이 어떻게 암세포의 DNA replication과 RNA transcription을 방해하는지, 그리고 암세포가 어떻게 5-FU를 억제하거나 제거하여 생존하는지 등), 조회수에 비해 설명을 깔끔하게 잘해주시는 듯 했습니다. 필요하신 분들은 참고바랍니다.
 
 

 
 

 
2) Brdu : DNA 복제시 T(티민)과 유사한 chemical structure를 가지는 물질로 cell cycle의 S기인 DNA 합성과정 동안 T 대신 활용될 수 있으며11), 그럼으로써 Brdu를 항원으로 주입한 후 anti-Brdu를 항체로 면역염색을 하면 cell proliferation rate를 확인할 수 있다고 합니다. cell proliferation이 활발할수록 Brdu 신호가 강하게 나타날 테니까요. 논문0)에서는 IR를 조사해 tissue에 damage를 입힌 후 dox를 주입한 샘플(OSKM induction)에서 regeneration이 이루어지고 있는지 확인하기 위해 사용한 것으로 추측됩니다.
 
3) phospho-histone H3(pHH3) : mitosis(유사 분열) 과정에서 chromatin condenstation 동안 인산화(phsphorylated)되는 단백질로, 그렇기에 anti-pHH3 immunocytochemistry는 mitotic activity를 확인하는데 활용할 수 있다12)고 합니다. pHH3도 Brdu와 유사하게 IR 조사 후 OSKM-induced partial reprogramming이 잘 이루어지고 있는지 확인하기 위해 사용된 것으로 추측됩니다.
 
 
- 당연하지만 중요한 질문
 
Q. 특정 세포 A의 canonical gene markers가 다른 세포 B에서 높은 발현(발현량 & 발현 비율)으로 나타났다는 것은 어떤 의미를 갖는가?
 
: 세포 A와 세포 B 사이의 유사한 molecular features를 공유한다는 것을 암시할 수 있습니다. 특정 유전자 발현이 특정 세포의 특징을 결정할 수 있으니까요.
 
 
아래 링크는 공유하면 이벤트 참여가 된다 길래 올렸습니다. 감사합니다!
 
https://www.tistory.com/event/write-challenge-2024

작심삼주 오블완 챌린지

오늘 블로그 완료! 21일 동안 매일 블로그에 글 쓰고 글력을 키워보세요.

www.tistory.com

 
 #오블완

 
참고자료
 

0) Partial in vivo reprogramming enables injury-free intestinal regeneration via autonomous Ptgs1 induction.Sci. Adv.9, eadi8454 (2023).
 
1) NAVER 지식백과, 생화학백과, 엔트로피, URL : https://terms.naver.com/entry.naver?docId=5141308&cid=60266&categoryId =60266
 
2) Teschendorff, A. E., Sollich, P. & Kuehn, R. Signalling entropy: a novel network-theoretical framework for systems analysis and interpretation of functional omic data. Methods 67, 282–293 (2014).
 
3) Teschendorff, A., Enver, T. Single-cell entropy for accurate estimation of differentiation potency from a cell’s transcriptome. Nat Commun 8, 15599 (2017).
 
4) NAVER 지식백과, 분자 세포생물학백과, 분화능, URL : https://terms.naver.com/entry.naver?docId=5930013&cid=61233 &categoryId=61233

 

5) 김창근, Nanog 유전자의 전사조절, 한양대학교 박사학위논문, 2008

 

6) 석현정, 박정아, 이영희 and 김영은. (2010). OCT4와 SOX2에 의한 인간 Nanog 유전자의 전사 조절. 발생과 생식, 14(2), 123-129.
 
7) Erika K. Ramos et al, New Opportunities and Challenges to Defeat Cancer Stem Cells, Trends in Cancer, 2017
 
8) Luke Zappia, Chapter 5 Analysis of kidney organoid scRNA-seq data, Github, URL : https://lazappi.github.io/phd-thesis/ind ex.html
 
9) Wolf, F.A., Hamey, F.K., Plass, M. et al. PAGA: graph abstraction reconciles clustering with trajectory inference through a topology preserving map of single cells. Genome Biol 20, 59 (2019).
 
10) Fluorouracil (5FU), CANCER RESEARCH UK, URL : https://www.cancerresearchuk.org/about-cancer/treatment/drugs/fluo rouracil

 
11) What is BrdU? - chemical structure and use in cell proliferation assays, BIO-RAD, URL : https://www.bio-rad-antibodies.com/brdu-bromodeoxyuridine.html

 

12) Hightower E, Cabanillas ME, Fuller GN, McCutcheon IE, Hess KR, Shah K, Waguespack SG, Corley LJ, Devin JK. Phospho-histone H3 (pHH3) immuno-reactivity as a prognostic marker in non-functioning pituitary adenomas. Pituitary. 15(4):556-61. 2012.