- 차세대 전염병 분자 진단을 위한 혁신적인 성능의 메타유전체 기반 병원체 탐지 소프트웨어 -
[연구필요성]
전염병은 사망의 큰 요인 중 하나이다. 진단 기술의 한계로 진단이 늦어지거나 진단이 어려운 신종 전염병의 경우 위험이 더 커질 수 있다. 새로운 진단 기술로 주목받고 있는 메타유전체 분석은 환자 샘플에서 추출한 DNA를 알려진 미생물과 바이러스의 것과 비교하여 병원체를 식별한다. 이때 두 가지 성능, 변이를 구체적으로 식별하는 성능과 신종 병원체를 탐지하는 성능이 중요하다. 하지만 이를 모두 만족하는 메타유전체 분석 방법이 없어 차세대 진단 방법 발전에 제동이 걸려있었다.
[연구성과/기대효과]
서울대학교 생명과학부 마틴 스타이네거 교수와 김재범 생물정보학 박사과정 연구원은, 메타유전체의 DNA 서열과 그것의 아미노산 서열로의 번역을 동시에 분석하여 혁신적인 성능을 갖는 메타유전체 분석 프로그램인 Metabuli를 개발하고, 이 연구를 Nature Methods에 게재하였다. 논문에서 Metabuli는 COVID-19 환자의 SARS-CoV-2의 여러 변이를 구분하는 성능과 SARS-CoV-2에 대한 정보 없이도 이것의 유전 물질을 감지해 내는 성능 모두 뛰어남을 보였다. 오픈 소스로 공개된 이 프로그램은 차세대 전염병 진단 방법 발전의 초석이 되리라 기대를 모으고 있다.
[본문]
전염병은 인간 사망의 주요 원인이지만 제때 진단을 받으면 많은 경우 치료가 가능하다. 하지만 전통적인 진단법은 특정 병원체에 대한 가정이 필요하며, 결과를 얻는 데 며칠에서 몇 주가 걸리고, 새로운 병원체를 탐지하지 못할 수 있다는 한계가 있다. 메타유전체학 기반 접근법은 감염 부위의 모든 DNA를 동시에 분석하여 이러한 문제를 해결할 수 있다. 이 방법은 한 번의 검사로 광범위한 감염원에 걸쳐 정확하고 신속한 감지를 보장할 수 있지만, 이를 위해 방대한 병원체 DNA 데이터베이스를 구체적이고 민감하게 탐색하는 것에는 어려움이 있었다.
성공적인 병원체 탐지를 위한 DNA 데이터베이스 탐색에는 두 가지 성능이 필요하다. 이미 알려진 병원체에 대해선 변이까지도 구체적으로 식별할 수 있어야 하고, 신종 병원체에 대해선 이미 알려진 병원체 정보를 토대로 민감하게 탐지하여 새로운 전염병에 대한 단서를 제공할 수 있어야 한다. 하지만 이제껏 두 성능 모두 만족하는 분석법은 없었다. 이를 해결하고자 서울대학교 생명과학부 마틴 스타이네거 교수와 생물정보학 박사과정 김재범 연구원은 새로운 분석 방법인 메타분리(Metabuli)를 개발하였고, 그 연구 결과를 학술지 Nature Methods에 게재하였다.
“기존 방법들은 DNA 서열과 아미노산 서열 중 한쪽에만 집중하고 있었지만, 메타분리의 핵심은 그 둘을 모두 활용해 분석하는 것입니다.”라고 김재범 연구원은 말했다. 논문에 따르면, DNA 서열은 빠르게 변화하기 때문에 이를 비교하여 알려진 병원체의 변이를 서로 구분할 수 있다. 반면 아미노산 서열은 더 느리게 변화하기 때문에, 신종 병원체와 알려진 병원체 사이의 유사성을 탐지하여 신종에 대한 단서를 얻는 데 적합하다.
마틴 스타이네거 교수는 “DNA와 아미노산, 두 가지 서열을 동시에 분석하면 변이를 식별하고 신종 전염병을 탐지하는 것 모두 할 수 있습니다.”라고 설명했다. 실제로 연구진은 논문을 통해 메타분리를 사용해서 코로나19 환자를 감염시킨 SARS-CoV-2의 변이를 식별할 수 있음을 보였다. 또한 SARS-CoV-2에 대한 정보 없이도, 2003년에 유행했던 SARS의 정보를 활용하여 SARS-CoV-2를 탐지할 수 있다는 것을 입증했다.
한편 해당 연구진은 메타분리를 오픈 소스로 공개했다. 이는 전 세계 미생물 및 바이러스학 분야의 연구에 기여하기 위해서라고 밝혔다. 이에 대해 “우리 연구실은 다른 연구자들의 연구를 돕기 위해 연구하고 있습니다. 메타분리는 분석 성능이 뛰어난 것은 물론이고, 수천만 원의 서버 장비라는 장벽을 허물 수 있도록 설계되었습니다. 이제 일반 노트북이면 충분합니다.”라고 김재범 연구원은 덧붙였다. 이런 노력의 결과로 메타분리는 논문 출판 전부터 2,000회 넘게 다운로드되었으며, 메타분리의 향상된 메타유전체 분석 성능은 차세대 전염병 진단 기술 발전을 가속하리라 기대를 모으고 있다. 연구 결과에 대한 자세한 설명은 출판물[Nature Methods, 2024, 10.1038/s41592-024-02273-y]을 참조.
[연구결과]
Metabuli: sensitive and specific metagenomic classification via joint analysis of amino acid and DNA
Jaebeom Kim and Martin Steinegger
(Nature Methods, https://doi.org/10.1038/s41592-024-02273-y)
전염병은 인간 사망의 큰 요인 중 하나이다. 진단 기술의 한계로 진단이 늦어지거나 진단이 어려운 신종 전염병의 경우 그 위험이 더 커질 수 있다. 새로운 진단 기술로 주목 받고 있는 메타유전체 분석은 환자 샘플에서 추출한 DNA를 알려진 미생물과 바이러스의 것과 비교하여 병원체를 식별한다. 이때 두 가지 성능, 변이를 구체적으로 식별하는 성능과 신종 병원체를 탐지하는 성능이 중요하지만, 이를 모두 만족하는 메타유전체 분석 방법은 없었다. 이를 해결하기위해 메타유전체의 DNA 서열과 그것의 아미노산 번역을 동시에 분석하여 두 가지 성능을 모두 갖춘 메타유전체 분석 프로그램인 Metabuli를 개발하였다. Metabuli는 COVID-19 환자의 SARS-CoV-2의 여러 변이를 구분하는 성능과 SARS-CoV-2에 대한 정보 없이도 이것의 유전 물질을 감지해 내는 성능 모두 뛰어남을 보였다. Metabuli는 오픈 소스로 공개되었으며, 차세대 전염병 진단 방법 발전에 기여할 것으로 기대된다.
[용어설명]
- ○메타유전체: 미생물 연구의 한 분야인 메타유전체학은 환경 속 미생물 군집의 유전 물질을 추출하고 분석한다. 메타유전체라고 부르는 이 유전 물질 데이터에는 다양한 종의 DNA 서열이 섞여 있으며, 각 서열이 유래한 종을 식별하여 해당 미생물 군집을 이해할 수 있다.