안녕하세요, 생물정보학도 TKM입니다!
오늘 다룰 책 <생물정보학 알고리듬> 4장의 주제는 '항생제 서열을 어떻게 알아낼까?'입니다.
'약학용어사전'에 따르면, '항생제'란 "미생물이 생성한 물질로, 다른 미생물의 성장을 저해하여 항균작용을 나타내며 인체에 침입한 세균의 감염을 치료한다"1)고 합니다.
그렇지만 미생물도 거대한 역사 속에서 우리와 함께 살아남은 '생명체'인 만큼, 그간 나름의 진화를 거듭해왔을 나쁜 미생물을 없애는 건 쉽지 않을 것입니다..!
이처럼 제약회사의 항생제 개발에 맞서 병원성 박테리아는 '항생제 내성'을 갖게 되었습니다.
전에 동그라미재단 인터뷰 글에서 서울대 의과대학 의과학과 염진기 교수님이
"2050년에는 항생제 내성 세균 감염에 의한 사망자가 전세계적으로 천만명으로 이를 것으로 예상되지만,
아직 뚜렷한 해결책이 없는 상황"2)이라고 하셨던 말씀이 기억이 납니다.
따라서 우리는 진화하는 병원성 박테리아에 맞서기 위해 새로운 항생제를 꾸준히 개발해나가야 할 것입니다.
그렇다면, '항생제 펩티드 아미노산'의 순서는 어떻게 알아낼 수 있을까요?
우선, 분자생물학의 중심원리는 "DNA가 RNA를 만들고(전사), RNA가 단백질을 만든다(번역)"는 것으로
RNA 가닥의 번역 과정은 '코돈'이라는 본 가닥에서의 겹치지 않는 세문자인 '3-mer'가
20개의 아미노산 중 하나로 변환되며 각각의 아미노산을 암호화하는 과정입니다.
이때 일부 코돈은 동일한 아미노산을 암호화하기도 하며, 아미노산이 되지 않고 번역을 중지하는 3가지의 '종결 코돈'도 있습니다.
아래 영상을 보시면 더욱 직관적으로 이해하기 좋습니다!
이러한 분자생물학의 원리에 대해 책에서는 다음과 같이 비유하고 있었습니다 ✍️
- 박테리아는 어떻게 항생제를 만드는가?
책에서는 '바실루스 브레비스(Bacillus Brabis)'에서 생산하는 수많은 항생제 중 하나인 '티로시딘 B1'이라는 10개의 아미노산 서열(30-mer)로 구성된 펩티드를 다루고 있었습니다.
즉, 티로시딘 B1을 암호화하는 수천 개의 서로 다른 'DNA 30-mer' 중에서 어떤 30-mer가 바실루스 유전체에 있는지 알아보고자 했습니다.
티로시딘 B1은 '고리형 펩티드'로 10개의 아미노산 서열로 이루어진 만큼 아래 이미지처럼 10개의 선형 펩티드 표현을 갖습니다.
더 특이한 것은, 일반적으로 '리보솜'이 수행하는 단백질 번역과 달리
티로시딘은 '비리보솜 메커니즘'이 펩티드를 조립합니다!
NRPs 이해 도움 영상 :
그렇게 만들어진 '티로시딘 B1'은 분자총알이자 향균제로써 역할을 합니다.
그렇다면, 이렇게 분자생물학의 중심원리를 지키지 않으면서, 고리형이라 순환구조인 NRP '티로시딘'의 서열은 어떻게 추론할 수 있을까요?
책에서는 '질량 분석기(mass spectrometer)'를 이용해 항생제 서열을 분석하는 법을 소개합니다.
즉, VKLFPWFNQY로 표시된 티로시딘 B1을 FPW와 FNQY VKL로 분해해 분석할 수도 있고(고리형이라서),
VKLFP와 WFNQY로 분해해 단편의 질량 정보를 사용해 펩티드 서열을 알아낼 수도 있습니다.
이와 같이 "질량분석기로 생성된 조각들의 질량을 모두 모은 집합"을 "실험 스펙트럼"이라고 합니다 👏
VKLFPWFNQY는 너무 길이가 기니까, 해당 고리형 펩티드에서 끊어진 VKLF로 된 선형 펩티드가 있다고 가정해봅시다.
이 펩티드를 한 1000개 정도 질량분석기로 돌려 두 부분으로 분리한다고 하면 왠만한 이상(이상적 조건에서)
"실험 스펙트럼"으로 V, K, L, F, VK, KL, LF, FV, VKL, KLF, LFV, FVK 이라는 12가지의 '하위 펩티드'가 등장하지 않을까요?
물론, 이론과 달리 실험은 다양한 변수와 조건이 작용하니 다른 경우의 수가 나올 수도 있겠죠.
'중복되는 요소'가 무엇이냐 하면, 위의 하위 펩티드 VK와 KL의 질량이 동일한 경우가 그 예시입니다.
그럼 ChatGPT에게 QRLVY로된 펩티드의 theoretical spectrum을 만들어달라고 해봅시다.
물론, 그런 펩티드가 있는지도 모르며, 아미노산 알파벳으로 임의로 정했습니다 ㅎㅎ
만약 20개의 아미노산 중 같은 질량을 갖는 I/L, K/Q가 함께 있었다면 '이론 스펙트럼'에서 같은 질량이 나왔을 수 있지만, QRLVY였던 만큼 그러지 않았습니다.
다음 글에서도 이어서 '고리형 펩티드 시퀀싱'의 방법을 정리해도록 하겠습니다.
글에 문제 되는 부분이 있다면, 아래 메일로 피드백 주시면 반영하겠습니다! 감사합니다 :)
E-mail: tkm1214@naver.com
참고자료
1) NAVER 지식백과, 약학용어사전, 항생제
2) [동그라미재단 혁신과학기술 센터 및 프로그램 선정기관 인터뷰] 서울대학교 항생제 내성 병원성 세균 제어 연구센터 염진기 교수의 '혁신 과학기술'은?