본문 바로가기주요메뉴 바로가기

주메뉴

IBS Conferences
수학으로 '정밀 의료' 정확도 높여 간다 전사체 데이터 노이즈 없애는 싱글시퀀싱 렌즈 개발 게시판 상세보기
제목 수학으로 '정밀 의료' 정확도 높여 간다 전사체 데이터 노이즈 없애는 싱글시퀀싱 렌즈 개발
작성자 전체관리자 등록일 2025-01-20 조회 145
첨부 jpg 파일명 : 김현 수리 및 계산 과학 연구단 의생명 수학 그룹 선임연구원.jpg 김현 수리 및 계산 과학 연구단 의생명 수학 그룹 선임연구원.jpg

수학으로 '정밀 의료' 정확도 높여 간다
전사체 데이터 노이즈 없애는 싱글시퀀싱 렌즈 개발

김현 수리 및 계산 과학 연구단 의생명 수학 그룹 선임연구원

초고령화 사회로 빠르게 접어들고 있는 요즘, 고령화에 따라 의료비 부담이 커지면서 개인에 맞는 질병 관리, 치료법 등 정밀 의료의 중요성이 강조되고 있다. 우리나라는 2016년 바이오 정보 기반 정밀 의료 기술 개발을 국가과학기술 전략 프로젝트로 포함해 정밀의료 정책을 구체화했다. 미국과 일본, 중국 등도 정밀 의료 계획을 발표하고 예산을 투입하고 있다.

정밀 의료는 유전정보, 질병정보, 생활정보를 분석해 개인에 맞는 효과적인 치료법을 제시하는 맞춤형 의료 서비스라 할 수 있다. 인공지능 기술, 빅데이터 기술이 급격히 성장함에 따라 정밀의료 시장은 더욱 커질 것으로 전망된다. 정밀 의료 관련 연구개발도 활발하다.

지난 4월, 기초과학연구원 수리 및 계산 과학 연구단 의생명 수학 그룹(IBS BIMAG)은 단일세포 전사체 데이터의 정확도를 높일 툴(도구)인 '싱글시퀀싱 렌즈(scLENS)'를 개발해 주목받았다.

전사체는 특정 시점에 세포나 조직에서 만들어진 모든 RNA로 약물 반응 예측, 질병 진단, 유전자 발현 패턴 등을 확인할 수 있다. 단일세포 전사체 분석은 유전자 변이가 발생한 세포만 표적하는 생물학, 신약 개발, 임상 연구 등 정밀의료 여러 분야에서 관심이 크다.

그러나 단일세포 전사체 분석은 개별 세포가 가진 수만 개에 이르는 다양한 유전자 발현량을 측정해야 하므로 용량이 수십 기가바이트에 달한다. 발현된 유전자마다 노이즈도 다수 포함하고 있어 데이터 오류가 발생하기 쉽다. scLENS는 단일세포 전사체 분석 데이터에서 사용자가 주관적으로 조절하지 않아도 자동으로 신호와 노이즈를 구별할 수 있는 프로그램이다. 지난 4월 발표되면서 보다 정확한 유전정보 데이터를 확보할 수 있다는 기대감도 커지고 있다.

이번 연구에 참여한 김현 수리 및 계산 과학 연구단 의생명 수학 그룹 선임연구원은 "방대한 데이터 중 생물학적으로 유용한 신호는 3% 내외에 불과하다"면서 "데이터 전처리를 통해 잡신호(노이즈)를 제거하는데, 기존에는 생물학적 신호와 노이즈의 경계를 사용자가 직접 설정하다 보니 분석가마다 다른 결과가 나오는 한계가 있었다. 이번 기술 개발로 정확한 데이터를 확보할 수 있을 것"이라며 연구 의의를 설명했다.

2021년 10월 의생명 수학 그룹(BIMAG)에 합류해 scLENS 개발을 주도한 김 선임연구원을 만나 이번 성과의 의의, 개발 과정에서 어려웠던 점, 앞으로의 계획 등을 들어보았다.

Q. 자기소개 부탁드립니다.
안녕하세요. 김현 수리 및 계산 과학 연구단 의생명 수학 그룹 선임연구원입니다. 고려대 물리학과를 졸업하고 같은 대학에서 물리학(비선형역학 및 생물물리학)으로 박사학위를 받았습니다. 물리학과 진학은 우연히 시작됐지만 공부를 할수록 재미있었습니다. 박사과정 때 이경진 교수의 지도 아래 체외에서 암 조직의 집단적 움직임을 정량적으로 분석했습니다. 또 광유전학 매핑과 가톨릭대학교 대학원 의과학과 민철홍 박사와의 수학적 모델을 사용해 SCN에서 시냅스 연결의 구조적 특성을 조사했습니다. 의생명 수학 그룹을 이끌고 있는 김재경 CI와는 뇌의 시계와 관련된 연구 세미나를 하게 되면서 시작된 인연이 이어져 2021년 10월 박사후연구원으로 IBS에 오게 됐습니다. BIMAG에 합류해 김재경 CI와 함께 바이오메디컬 멀티스케일 역학을 연구하고 있습니다.

Q. 수리 및 계산 과학 연구단 의생명 수학 그룹을 소개해 주세요.
의생명 수학 그룹(IBS BIMAG)은 IBS 수리 및 계산 과학 연구단 내에 속한 연구 그룹 중 하나입니다. 2021년 3월에 설립된 BIMAG은 의생명 수학 분야 최고 수준의 연구를 하는 것을 목표로 복잡한 멀티스케일 시스템을 단순화하는 방법론을 개발하고 이를 응용해 효소 반응, 면역 항암 치료, 일주기 리듬의 분자 수준의 메커니즘을 연구하고 있습니다. 다이내믹한 세포 간 네트워크를 추정하는 이론을 개발하고 이를 통해 생체시계의 세포 간 네트워크를 밝히는 연구도 지속하고 있습니다. 스마트 워치와 같은 웨어러블 장치로부터 얻어진 데이터를 바탕으로 수면 질환을 치료하는 디지털 치료제도 개발하며 지속해 성과를 내고 있습니다.

Q. 이번 연구를 시작하게 된 계기와 어려웠던 점은 무엇인가요?
scLENS는 생물학적 정보를 좀 더 정확하고 신뢰성 있게 추출하는 도구를 만들어 보자는 데서 시작됐습니다. 자동화를 통해 생명정보학 쪽 연구자들이 좀 더 쉽게 사용할 수 있었으면 했습니다. 2022년부터 연구를 시작해 2년 정도 시간이 걸렸는데요. 수학적 기술을 데이터 분석에서 읽어야 했는데 그런 부분을 공부하는 과정이 조금 힘들었습니다. 또 알고리즘이 좀 더 잘되는 것은 확인이 됐는데 이를 명확하게 설명하는 데까지 시간이 걸렸습니다. 전사체 데이터는 양도 많고 노이즈도 많습니다. 특정 유전자들은 많이 발현된 반면 대부분의 유전자는 약하게 발현돼 있어요. 이걸 그냥 쓰면 대부분의 유전자가 가지고 있는 정보는 해석하지 못합니다. 그럼 특정 유전자 데이터들이 대표 특징으로 사용됩니다.
균형을 맞춰야 하는데 전처리 과정이 복잡합니다. 김재경 CI가 일단 문제를 간소화 해보라는 조언을 해주셨어요. 아이가 둘인데 둘째 우유병을 닦으면서도 생각하고 했는데 잘 떠오르지 않아 답답했어요. 가족들과 이동하기 위해 운전을 하고 있는데 아이디어가 딱 떠올랐어요. 잊지 않으려고 차를 바로 세우고 아내와 자리를 바꾼 후 메모를 시작했어요. CI께 설명을 드리니 바로 오케이 하셨죠. 지금 생각하면 간단한데 그때는 어려웠어요.

Q. 결과 발표 후 반향은 어떤가요.
scLENS는 다른 모든 프로그램보다 우수한 성능을 보인다는 점을 확인할 수 있었고요. 널리 쓰이는 프로그램인 ‘Seurat’과 비교했을 때 scLENS는 세포 그룹화 성능이 약 10% 이상 우수하며, 데이터에 내재된 국소 구조를 43% 더 효과적으로 포착하는 것으로 나타났습니다. 특히, scLENS는 기존 프로그램보다 많은 계산을 하지만 메모리 사용 최적화를 통해 10만 개의 세포와 2만 개의 유전자로 이뤄진 대규모 데이터를 3시간 만에 분석하는 경쟁력 있는 분석 속도를 보였습니다. 논문 출판 후 인용이 조금씩 되고 있고 학회 등에서 툴에 대해 발표하면 질문을 많이 받습니다. 특허도 진행하고 있습니다.

Q. 향후 계획을 말씀해 주십시오.
우리는 데이터의 신호를 뽑아내서 이를 바탕으로 여러 가지를 분석할 수 있습니다. 세포 유형별로 묶어서 분석할 수 있고 이들 간의 소통을 조사할 수도 있습니다. 세포 유형 간의 상호작용을 볼 수도 있고요. 지금까지 개발된 내용은 깃허브에 올려서 오픈소스로 누구나 사용할 수 있도록 했습니다. 사용자들이 좀 더 쉽게 사용할 수 있도록 개선도 하고 있습니다. 많은 사람이 사용하면 데이터의 정확도가 더 높아질 수 있거든요.

Q. 덧붙여 해주실 말씀 부탁드려요.
자기 한계를 두지 말자는 것입니다. 한곳에 오래 있으면 보는 시야가 제한돼 스스로 자기 한계를 설정하게 됩니다. 그런데 IBS로 오면서 예전과 다른 것을 보게 되고 새로운 기준, 새로운 방법을 실행하면서 폭넓은 시야를 갖게 됐어요. 연구의 폭도 넓어지고 공동 연구자들과 협업하면서 해외 연구자들과도 적극적으로 연락도 하며 많이 배웠습니다. 그렇기에 자기 자신을 다른 환경에 노출 시켜 보는 경험이 중요하다는 이야기를 하고 싶습니다.

만족도조사

이 페이지에서 제공하는 정보에 대하여 만족하십니까?

콘텐츠담당자
:  
최종수정일 2023-11-28 14:20