현대 과학계의 중요 화두인 ‘빅 데이터’는 생물학에서도 예외가 아니다. 자연계에서 가장 복잡한 현상 중 하나가 생명 현상인 만큼연구 방법론과 분석 기술이 발달할수록 생물학에서 다루어야 하는 데이터가 기하급수적으로 많아지기 때문이다. 자연히 생물학계에서도 많은 양의 데이터를 생산할 수 있는 대규모 실험과, 진흙에서 진주를 찾는 데이터 분석의 중요성이 커지고 있다. IBS의RNA 연구단(단장 김빛내리)의 장혜식, 임재철 연구원은 학부에서 각각 산업공학과 수의학을 전공한 생물학도들이 성공적으로 결합하여 연구한 대표적인 사례다. 서로 다른 능력을 지닌 두 사람이 만나 값진 성과를 이루어 낸 현장의 이야기를 직 접 들어본다.
올해 3월, 세계적인 생물학 학술지 <셀(Cell)>의 자매지인 <몰레큘러 셀(Molecular Cell)>에 한국인 연구자들의 논문이 하나 게재됐다. 분자생물학과 유전학의 기초에 해당하는 내용을 담은이 논문은 발표 후 연구자들의 비상한 관심을 끌었다. 이전까지는 마땅한 방법이 없어 중요성에 비해 간단히 다루고 넘어갔던 것이 이들의 발견으로 재조명받은 것이다. 일각에서는 소강상태에 빠져 있던 mRNA 연구를 활성화시킬 중요한 계기라고까지 평가하기도 한다. 바로 IBS RNA 연구단의 장혜식 박사와임재철 박사과정생이, 공동으로 연구하여 발표한 ‘꼬리서열분석법(TAIL-seq)’에 대한 논문이다.
중요하지만 부진했던 아데닌 꼬리 연구두 사람이 처음부터 함께했던 것은 아니다. 연구를 시작한 이는임재철 연구원이었다. 그는 RNA 연구단의 다른 연구자와 마찬가지로 마이크로RNA(miRNA)를 연구해 왔다.miRNA의 생성 및 소멸과 이를 조절하는 메커니즘이 주요 관심사였는데, 이 과정에서 자연스럽게RNA의 소멸을 조절하는 메커니즘과 mRNA의아데닌 꼬리에 주목하기 시작했다고 한다. 아데닌꼬리는 mRNA를 보호하는 한편으로 RNA 결합단백질과 결합하여 유전정보의 발현 속도를 조절하는 역할을 하기 때문이다.
사실 mRNA의 아데닌 꼬리와 관련된 내용은 대학교의 교양생물학 정도 수준에서도 접할 수 있는기초 이론이다. 아데닌 꼬리의 생성이나 역할처럼조금 깊은 내용이라도 전공 수업을 들은 학부생이라도 이해할 수 있을 만한 내용이다. 특별할 것도없고 평범해 보이기까지 한 아데닌 꼬리가 어쩌다그의 관심을 끌었을까?
임재철 : “아데닌 꼬리는 mRNA의 주요 구성요소 중 하나입니다. RNA분해효소가 작용하는 것을 막아 세포질에서 mRNA의 수명을 늘려주기도하고 리보솜과 작용하여 유전정보를 단백질로 번역하는 속도를 조절하기도 하지요. 이처럼 중요한역할을 하는데도 아데닌 꼬리 연구는 부진한 편이었습니다. 기존의 연구 방법들은 RNA의 전체를대략적으로 보는 것이 목적이었지만, 아데닌 꼬리를 제대로 연구하려면 ‘꼬리’ 부분만 매우 자세히관찰해야 했거든요.”
보통의 RNA 연구에서는 전체를 2번에서 5번 정도만 읽어도 연구의 결론을 내릴 수 있었지만, 아데닌 꼬리의 복잡한 상관관계를 연구하려면 각 유전자의 꼬리를 적어도 각각 100번 이상씩 읽을필요가 있었다. 그래서 임재철 연구원은 기존의실험 방법을 대폭 수정하여 꼬리만을 집중적으로읽어내는 방법을 개발했다.
임재철 : “처음부터 생각처럼 잘된 건 아니었어요.기존 방법에서는 mRNA를 적당히 자르는 것으로시작하는데, 저희는 꼬리만을 읽기 위해서 자르지않기로 했어요. 그러면서도 맨 끝을 유지시키는게 핵심이었죠. 하지만 염기서열 분석 결과는 안좋게 나왔어요. mRNA보다 상대적으로 양이 많은 짧은 RNA들로 엄청나게 오염되더라고요. 그런 것들을 제거하면서도 꼬리를 선택적으로 분리하기 위해 평소엔 잘 보지 않을 오래된 연구 논문들과 인터넷 정보를 가리지 않고 다양하게 적용시켜 보았어요. 여러 실험방법을 시도하던 중에 가장 간단하면서도 효율이 좋은 방법을 선택해 새로운 실험법을 완성했습니다.”
하지만, 그들의 첫 실험에서는 기대했던 긴 아데닌 꼬리들을 찾을 수 없었다. 많은 사람들을 괴롭혀 왔던 ‘긴 RNA 반복 문제’ 때문이었다.유전정보는 DNA와 RNA의 구성요소 중 염기가배열된 순서로 표현된다. 염기서열분석은 바로 이들 염기가 배치된 순서를 확인하여 해당 RNA, 또는 DNA 사슬이 어떤 생명현상에 대한 정보를 담고 있는지 확인하는 과정이다. 염기서열분석법도주로 단백질을 만들어내는 데 사용되는 복잡한‘유전자’의 염기서열을 확인하는 데 최적화되어있다.
장혜식 : “아데닌 꼬리의 길이를 재는 것은 ‘아’만수백 개 써놓은 글에서 ‘아’가 대체 몇 개인지 세어보는 일과 비슷해요. 똑같은 정보만 반복되니까딱 잘못하면 엉뚱한 자리에서 세기 시작하거나중간에 숫자를 놓쳐서 정확한 개수를 알아내기 어렵지요. 그래서 기존의 분석방법으로 아데닌 꼬리를 분석하면 결과 값이 엉망이었어요. 시료는 같은데 어떤 때는 수십 개라고 했다가, 어떤 때는 수백 개라고 하고. 당연히 정량적인 분석이 곤란했습니다. 뭔가 새로운 방법이 필요했죠.”
두 사람은 정량적인 분석방법을 찾아내는 데 골몰했다. RNA 연구단에는 비교적 최근에 구비한 분석장비를 보유하고 있었지만 분석 결과는 만족스럽지 않았다. 아무리 최신기술이 적용된 분석장비라 하더라도 복잡한 유전정보가 담긴 RNA의 염기서열을 읽어 들이는 것이 목적인 이상, 똑같은염기가 몇 개나 있는지 세는 데 사용하기는 어려웠기 때문이다. 아데닌 꼬리를 분석하는 데는 기존에 알려진 방법과 전혀 다른 방법이 필요했다.
재능의 조합이 결함을 기회로 바꾸다장혜식 : “생각지도 않은 수확이었어요. 염기서열분석을 시도하는 과정에서 아데닌 꼬리를 분석할때 긴 꼬리에서 나오는 신호의 잔상이 mRNA의몸통에도 영향을 줘서 모두 아데닌으로 인식해 버리는 것을 발견했어요. 기계의 오류인 셈이죠. 하지만 더 근본적인 신호를 이용하면 아데닌 꼬리를분석해볼 수 있겠다 싶었습니다.”문제는 장비의 오류를 어떻게 긍정적으로 활용할수 있을 것인가, 그 방법이었다. 아데닌 꼬리의 길이에 따라 mRNA의 분석결과에 주는 영향이 달라지므로 아데닌 꼬리의 길이를 추측해낼 수 있다는 ‘이론’은 알았지만 구체적인 방법을 찾는 것은쉽지 않았다.
두 연구자는 처음으로 돌아가서 아데닌 꼬리가 어떤 신호를 만들어내는지 볼 수 있는 인공적인 꼬리를 투입해서 자세히 관찰하여 마침내 방법을 찾아냈다.
장혜식 : “여러 길이의 아데닌 꼬리를 만들어서 시험해보면 어떨까 하는 생각을 했어요. 아데닌 꼬리 길이에 따라 분석장비가 어느 정도의 오작동을보이는지 정량적인 관계를 알아낼 수 있다면 원래의 꼬리 길이를 추측할 수 있을 것 같았죠. 염기서열분석기는 시료에 결합시킨 형광물질 신호를 읽어 들여서 이를 염기정보로 번역하는 방식으로 작동하지요. 우리는 염기정보의 내용보다는 길이에만 관심이 있었기 때문에 단순하지만 훨씬 더 잘작동하는 알고리즘을 만들 수 있겠다고 생각했습니다."
자연스러운 분업이 이루어졌다. 임 연구원은 다양한 길이의 아데닌 꼬리를 합성해내고 시료를 준비하여 분석할 데이터를 만들어냈다. 장 연구원은 모인 데이터를 이용하여 염기서열분석기의 알고리즘을 수정하고 다듬었다. 결과는 지금 확인할수 있듯, 대성공이었다.
임재철 : “6개월이었어요. 처음에 막막하던 때와비교하면 비교적 빨리 결실을 본 셈이지요.”
장혜식 : “두 사람이 같은 공간에서 일한 것이 크게 도움이 됐습니다. 문제가 생기면 즉시 상의해서 대안을 찾아낼 수 있었으니까요. 특히나 옆에서 서로 일하는 과정을 보기 때문에 서로의 작업을 자세하게 이해하고, 각자의 담당 범위와 관계없이 최적의 해결책을 쉽게 얻을 수 있었죠.”
두 사람은 배경도 다르다. 임재철 연구원은 수의학을 전공하고 기초과학을 공부하기 위해 RNA연구를 시작했고, 장혜식 연구원은 산업공학과 출신으로 생물학에 매력을 느껴 생물정보학(bioinformatics)을 시작한 케이스다. 장 연구원은생물학과 정보과학의 만남이 어느 때보다 중요하다고 강조한다.
장혜식 : “생물학, 특히 분자생물학 분야의 국제적인 흐름은 ‘대용량 분석’입니다. RNA 연구에서도정보량이 갈수록 커지면서 생물정보학이 중요해지고 있어요. 세계적으로 앞서가는 연구그룹은 생물학과 데이터 분석을 모두 잘하는 학자들을 적극적으로 육성하고 있습니다.”
임재철 : “RNA 연구단에서도 타 분야를 전공한 연구자들을 많이 뽑고 있어요. RNA 연구단 내부에서도 한 달에 한 번은 워크숍을 열어서 활발하게교류하고 있지요.”다양한 배경의 연구자들이 모인 것이 어떤 효과를 발휘했을까? 이들의 조합은 학제간 연구의 이상적인 사례였다. <몰레큘러 셀>에 논문을 발표한이후, 세계적으로 아데닌 꼬리를 연구하는 연구실여섯 군데에서나 조언을 구해 왔을 정도로 해외에서 관심을 두고 탐내는 성과로 인정받았다. 이정도의 성과가 있다면 당연히 시행착오도 있었을터, 이전에는 없던 새로운 방법론을 찾아낸 연구다 보니 시련도 적지 않았을 것이다.
장혜식 : “사실 이번 연구는 어찌 보면 굉장히 평범한 작업이에요. 기계가 신호를 분석할 수 있도록 반복하여 학습시키는 일이었으니까요. 하지만이전에는 없던 알고리즘을 만들어내야 했지요. 객관적인 알고리즘이라는 확신이 들 때까지 실험을거듭했어요. 아데닌 꼬리들을 다양하게 합성해보고 이를 일일이 바꿔가면서 시험해봐야 하니 보통손이 많이 가는 게 아니었습니다.”
임재철 : “처음 실험을 설계할 때는 오류도 많았어요. rRNA(리보솜RNA)를 제대로 제거하지 못해 시료가 다 오염되기도 하고, 너무 많이 잘라내서 원하는 꼬리 부분들을 다 잃어버리기도 했죠.그래서 30년도 넘은 오래된 실험방법들과, 논문으로 나오지 않은 인터넷 커뮤니티의 지식들까지찾아봐서 모두 시험해 보았어요. 결국 깨달은 것은 오래된 실험방법의 사소한 부분도 왜 그런 것이 필요했는지 생각해 볼 필요가 있다는 것이었습니다."
새로운 기회를 엿본전 세계 RNA 연구자들의 이목을 집중시킨 이들에게 이제 남은 일은 무엇일까? 두 사람 모두 이번 성과는 시작에 불과하다고 입을 모은다. 후속연구가 이어져야 의미 있는 성과로 연결될 수 있다는 얘기다. 실제로 이들은 논문이 발표되고 나서 바로 후속연구에 착수했다.
임재철 : “제 연구의 출발점은 질병이었어요. RNA연구를 지속하면서 연구 주제를 단백질과 질병으로까지 확장시켜보고 싶습니다. 아직 기초 분야를임상과 연결시킬 만한 고리가 약한 편인데, 이를탄탄하게 만들고 싶어요. 기초연구를 통해 질병이나 임상적 현상이 왜 일어나는지 근본 원인을 이해하고, 기초 연구에서의 성과가 임상으로까지 연결된다면 더할 나위 없이 좋겠죠.”
장혜식 : “저는 흔히들 말하는 ‘공돌이’ 기질이 있는 것 같아요. 어릴 때부터도 무언가 분해하고 만드는 것을 좋아하기도 했고, 벌써 30년 가까이 프로그래밍이 가장 큰 취미였으니까요. 그래서인지장기적으로 생명체를 프로그래밍할 수 있게 하는기술에 도전해 보고 싶습니다. 사실 그 때문에 단백질 연구에 도전하기도 했었어요. 단백질은 생명의 기계라고 할 수 있으니까요. 그렇지만 단백질은 구조 자체도 고치기가 쉽지 않을 뿐만 아니라, 넓은 범위에서 유전자 회로를 다루기에는 기능이 한정되어 있다는 점에 실망했죠. 생물을 프로그래밍하려면 그보다는 범용성이 있어야 할 것같았어요.
RNA 연구에 관심을 둔 계기도 바로 범용성이 있으면서도 생명현상을 직접 통제할 수 있는 물질이라고 생각했기 때문입니다. 앞으로는 RNA를 이용해서 새로운 생명체를 디자인하는 일반적인 방법이 있을지 생각해보고 싶어요.”RNA와 DNA의 염기들은 상보적 결합을 통해 안정함을 유지한다. 짝을 이룬 염기끼리는 서로에게 딱 들어맞는다. 말 그대로 서로 보완하는 결합인 것이다. 그 덕분에 생물은 유전물질을 바탕으로 단백질을 만들어내고, 생존에 필요한 온갖 화학 반응을 일으키고, 생각하고, 활동하고, 마침내는 오래도록 자신의 정보를 보관하여 후대에 전할수 있다.
이 두사람의 동행은 그들이 연구하는 유전물질을닮았다. 두 연구자가 서로 필요한 부분을 채우는,‘상보적 결합’으로 팀을 이루어 강한 결속과 상호작용으로 함께 연구를 이끌어 가기 때문이다. 물론 언젠가는 RNA가 본연의 역할을 하려면 DNA에서 떨어져 나오듯 두 사람도 각자 연구 분야에서 이루고자 하는 목표를 위해 자신만의 활약을펼칠 것이다. 그러나 적어도 이들이 함께 있는 동안에는 이번의 연구만큼이나 반가운 소식을 더 기다려 봐도 좋을 듯하다