이번 글에서는 최근에 관심있게 읽은 논문 한 편을 정리해보려고 합니다.
제목은 'Integrating single-cell sequencing data with GWAS summary statistics reveals CD16+monocytes and memory CD8+T cells involved in severe COVID-19'로 2022년 Genome Medicine 저널에 퍼블리쉬된 오픈 엑세스 논문입니다.
Integrating single-cell sequencing data with GWAS summary statistics reveals CD16+monocytes and memory CD8+T cells involved in s
Background Understanding the host genetic architecture and viral immunity contributes to the development of effective vaccines and therapeutics for controlling the COVID-19 pandemic. Alterations of immune responses in peripheral blood mononuclear cells pla
genomemedicine.biomedcentral.com
한줄로 소개하자면, 본 연구에서는 severe COVID-19의 면역 반응에 있어 host genetic factors의 효과를 파악함으로써 COVID-19 pandemic 제어를 위한 효과적인 백신 및 치료제 개발을 위한 전략을 발굴하고자 했습니다.
이때 severe COVID-19에서의 면역 반응에 기여하는 host genetics의 특징을 파악하기 위해서는 논문 제목에 적혀있듯, GWAS 요약 통계 데이터 (969,689 samples : control N: 961,804 / hospitalized COVID-19 : 7,885)와 4가지 조건의 scRNA-seq 데이터셋(healthy, mild, moderate, severe)를 이용하여 개별 면역세포의 immunological features를 평가했습니다.
결과적으로 본 연구에서는 severe COVID-19라는 phenotype과 연관된 8개의 risk genomic loci(기존 밝혀진 5 + 새로 밝힌 3)와 34 risk genes를 파악했다고 하는데요.
이를 위해 본 연구팀은 GWAS 데이터와 MAGMA tool을 활용한 gene-level association analysis로 유전 변이와 연관된 유전자를 파악함과 더불어, S-PrediXcan tool를 활용해 GTEx(Gene Tissue Expression) eQTL(expression quantitative trait loci) 데이터와 GWAS 데이터를 결합해 조직 특이적 유전자 발현을 유전 변이를 통해 예측했다고 합니다.
조직별 유전자 발현 패턴을 확인하는 이유는 같은 유전자라도 조직에 따라 발현 수준과 유전 변이의 영향이 다를 수 있기 때문으로, 이를 위해 조직마다 SNP의 유전자 발현 조절 효과의 차이를 가중치로 고려해 조직별 유전자 발현을 예측한다고 합니다. MAGMA로 유전변이와 연관된 유전자를 찾는 분석은 살짝 경험해봤는데, S-MultiXcan은 조직 특이적인 유전변이의 영향을 가중치를 고려해서 파악하는 건 딥러닝스럽기도 하고 한번 알아보고 싶어지네요. 정확한 설명은 'GTEx 프로젝트를 다루는 논문(클릭)'을 참고하시길 바랍니다.
본 연구에서는 MAGMA, S-PrediXcan 그리고 여러 조직에서의 유전자 발현 정보를 통합 분석하는 S-MultiXcan을 통해 34개의 genetic-relevant risk genes를 파악하였습니다. 이후 해당 유전자를 대상으로 network-based enrichment analysis, drug-gene interaction analysis, 유전자와 연관된 biological pathways 파악 등 여러 다운스트림 분석을 진행했지만 본 글에서는 개괄적인 연구 흐름을 파악하는 연습을 하는 것이기에 주요 결과만 소개하고 짧게 글을 마치도록 하겠습니다.

본 연구팀은 severe COVID-19에서의 특정 면역세포에 대한 host genetic factors의 영향을 파악하기 위해 scRNA-seq 데이터 분석도 진행했습니다. 구체적으로, R seurat 패키지를 사용해 앞서 말한 4가지 조건(healthy, mild, moderate, severe)에서의 scRNA-seq 데이터셋(PBMC, BALK)을 highly variable genes를 기준으로 UMAP에 subject하여 13 distinct clusters를 파악하였고, well-known marker genes를 활용해 cell type annotation을 진행하였습니다. 여기서 scRNA-seq 데이터를 대상으로 QC부터 normalization, batch correction, demension reduction, clustering, 그리고 cell-type annotation까지 하는 단계는 말로는 정말 간단하지만, 직접 해보는 건 굉장히 어렵고 까다로운 절차인 듯합니다.
암튼 결과적으로, CD16+monocytes, memory CD8+ T cells, megakarocytes가 severe 조건의 COVID-19와 상당히 연관이 있다고 나타났으며, 각 세포에서 severe COVID-19의 candidate causal genes인 CCR1, CXCR6, ABO가 각각 높은 수준으로 발현되었다고 합니다. 따라서, 연구팀은 본 연구 목적이었던 severe COVID-19에서 등장하는 면역세포에 영향을 미치는 genetic factors를 특징짓고자 CCR1+ CD16+ monocytes, ABO+ megakaryocytes, 그리고 CXCR6+ memory CD8+T cells라는 세가지 면역세포 집단에 초점을 두어 분석을 진행했습니다.
결과적으로, 본 연구에서는 severe patients에 등장하는 CCR1+ CD16+ monocytes와 ABO+ megakaryocytes가 severe COVID-19의 대표적인 병리학적 특징인 'cytokine storm'과 같은 dysfunctional inflammatory response의 높은 위험에 기여할 수 있음을 밝혔는데요. 이는 각각의 세포 유형이 CCR1-, ABO-에 비해, 그리고 다른 조건과 달리 severe 조건에서 특이적으로 각 세포 유형의 inflammatory scores와 inflammation 관련 pathway(cytokine cytokine receptor interaction, chemokine signaling pathway)의 activity score가 높게 나타남을 확인함으로서 입증했습니다. 자세한 건 본 논문의 연구 결과 figure를 참고하시길 바랍니다.
이외에도, 본 연구팀은 severe COVID-19 patients에서 CXCR6+ memory CD8+ T cell이 적응 면역에 관여하는 다른 T cells의 enhanced activation과 proliferation에 기여함과 더불어, cytokines와 chemokines의 높은 발현을 야기하는 등 polyfunctionality를 보임을 확인했는데요.
이는 CXCR6−와 비교했을 때 CXCR6+에서 유의하게 나타나는 158개의 highly expressed genes에 여러 proinflammatory cytokine genes와 chemokine genes이 포함됨과 더불어 본 158개의 HVGs가 cytokine-cytokine receptor interaction, inflammatory bowel의 두 경로에서 enrich하게 나타난 결과를 통해 확인할 수 있었습니다.
또한, CXCR6+ memory CD8+T cells의 세포 비율은 mild와 moderate COVID-19에서 normal보다 상당히 높게 나타났으며, CXCR6+ memory CD8+T cells에서 chemokine, T cell activation, migration 점수가 patient severity가 증가함에 따라 높아짐을 확인하면서 본 세포 유형의 polyfunctionality를 입증할 수 있었습니다.
참고로, severe COVID-19에서는 CXCR6+ memory CD8+T cells의 비율이 확연하게 낮게 나타났는데요. 그 이유는 CD8+ T cells가 severe 조건에서는 감염된 세포를 제거하기 위해 폐 조직으로 집중적으로 이동해 peripheral blood에 남아 있는 양이 줄어들었기 때문으로 추정된다고 합니다.
그렇게 본 논문은 "severe COVID-19와 연관된 세가지 세포 세부집단( CCR1+ CD16+ monocyte, ABO+ megakaryocytes, CXCR6+ memory CD8+ T cells)의 분자적 메커니즘을 분석하는 후속 연구가 COVID-19의 개시와 진행 정도에 있어 inter-individual variation의 영향을 이해하는데 있어 결정적일 것"이라며 마무리되었습니다.
개인별 특이적인 유전 변이가 바이러스에 대항하는 면역 반응에 미치는 영향을 다루는 본 논문 내용을 정리하다 보니 아까 전에 슈카 유튜브 영상에서 맞춤형 백신에 대한 영상을 봤던게 기억이 나네요! 영상 내용에서 처럼 개인 맞춤형 백신이라는게 치료효과를 극대화하는데 도움이 될 수 있긴 하지만, 한편으로는 개인에게 특이적인 치료를 진행한다는게 두려움을 야기할 수도 있을 듯 합니다.
암튼 본 글에서는 제 해석이 아직 빈약한지라 잘못될 가능성이 높아 간단하게 정리했지만 자세하고 정확한 내용은 위에 올린 논문 링크를 참고하시길 추천드립니다. 저는 이 논문이 관심있는 주제의 논문이라서 논문에 등장하는 여러 개념, 결과, figure들을 할수 있는 선에서 정밀하게 파악해보는 중인데요. 논문 뿐만 아니라 데이터들도 오픈소스인지라 논문에 나온 그대로 연구를 재현해보는 시뮬레이션 연구도 앞으로 해보려고 합니다.
역시 전문성을 쌓는 건 멀고도 험한 길인 것 같습니다.. 그럼 다음에 또 정리할 내용이 있으면 찾아오도록 하겠습니다. 감사합니다!

참고자료:
1) Ma, Y., Qiu, F., Deng, C. et al. Integrating single-cell sequencing data with GWAS summary statistics reveals CD16+monocytes and memory CD8+T cells involved in severe COVID-19. Genome Med 14, 16 (2022).