[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때 by 남궁석

남궁석 · SLMS

2023/01/16

최근 몇 년 동안 생명과학계에서 일어난 사건 중 가장 혁신적인 일은 무엇일까? 딥마인드 (DeepMind) 가 개발한 인공지능인 알파폴드 (Alphafold) 에 의한 단백질 구조 예측은 생명과학에 조금이라도 관심이 있는 사람이라면 절대 빼놓을 수 없는 일대 사건이다. 실제로 인공지능에 의한 단백질 구조 예측은 네이처와 사이언스 등의 과학 잡지에서 공히 2021년의 과학 뉴스로 꼽히곤 했다. 그러나 단백질 구조 예측 이외에도 인공지능은 단백질 디자인 (Protein Design)과 같이 아직은 일반에게는 그리 생소하지 않은 분야에서도 혁신을 만들어내고 있다. 그러나 일반인들에게는 과연 인공지능이 단백질 구조를 예측한다는 것이 어떤 의미이며, 어떻게 중요한지에 대해서 잘 와닿지 않는듯 하다. 반면 몇년 전의 알파고 (AlphaGo) 때는 곧 인공지능이 모든 것을 해결해 줄 거야 식의 엄청난 반응을 이끌어 냈음에도 불구하고 말이다. 참고로 딥마인드 자신들은 알파폴드의 업적을 여...

남궁석 · SLMS

2023/02/10

라이뷰

ChatGPT 이전의 세계, 이후의 세계

[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때

산업/기술/IT

인공지능에서 최근 대중들에게 가장 화제가 된 것들은 무엇보다도 생성 AI (Generative AI) 로 불리는 기술들이다. 가령 정해진 텍스트에 따라서 학습된 이미지에 기반하여 마치 프로 아티스트가 그린 듯한 고퀄리티의 그림을 생성해 주는 DALL·E-2 나 스태블 디퓨전 (Stable Diffusion), 그리고 화자의 질문에 따라서 적절한 답을 주는 ChatGPT 등은 매우 큰 화제가 되고 있다.

그러나 이러한 AI 응용기술과 크게 다르지 않은 원리가 최근 단백질 분야에 활발히 적용되고 있다는 것은 일반인들에게 아직 잘 알려져 있지 않은 듯 싶다. 그것도 그럴 것이 생성 AI 가 만들어 낸 디지털 이미지나 텍스트는 바로 눈으로 보고 그 대단함을 바로 느낄 수 있지만, 단백질 디자인에 의해 생성된 단백질 서열이나 구조는 그것만으로는 큰 영향력을 미치기는 힘들고, 실존하는 단백질이 되어 의약품 등으로 그 효과가 검증되기까지는 앞으로도 꽤 오랜 시간이 걸릴 것이라는 차이가 있긴 하다. 그러나 이러한 기술들의 발전은 지금 이러한 인공지능 기술이 형성하는 텍스트나 이미지 이상의 파급효과를 우리에게 안겨줄 가능성이 높다.

오늘은 디퓨전 모델 (Diffusion Model) 과 거대 단백질 언어모델 (Large Protein Language Model) 이 단백질 디자인 분야를 어떻게 진보시키고 있는지를 알아보도록 하자.

디퓨전 모델이란 대체 뭔데?

일단 단백질 디자인에 적용되는 AI 테크닉을 알아보기 이전에 익숙한 화상 생성 AI 에 대해서 알아보자. DALL E-2, 스태블 디퓨전 등 요즘 인기있는 텍스트로부터 영상을 생성하는 인공지능인 디퓨전 모델 (Diffusion Moel) 은 통계열역학의 확산 (Diffusion) 현상 이론을 인공지능에 적용시킨 방법이다. 여기에 대해서 아주 주마간산으로 알아보도록 하자. (보다 수학적인 기술을 포함한 자세한 설명은 다른 곳을 참조하기 바란다)

디퓨전 모델은 초기 상태의 분자들이 시간에 따라서 확산되는 과정을 이미지 생...