김윤지
[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때
[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때
인공지능에서 최근 대중들에게 가장 화제가 된 것들은 무엇보다도 생성 AI (Generative AI) 로 불리는 기술들이다. 가령 정해진 텍스트에 따라서 학습된 이미지에 기반하여 마치 프로 아티스트가 그린 듯한 고퀄리티의 그림을 생성해 주는 DALL·E-2 나 스태블 디퓨전 (Stable Diffusion), 그리고 화자의 질문에 따라서 적절한 답을 주는 ChatGPT 등은 매우 큰 화제가 되고 있다.
그러나 이러한 AI 응용기술과 크게 다르지 않은 원리가 최근 단백질 분야에 활발히 적용되고 있다는 것은 일반인들에게 아직 잘 알려져 있지 않은 듯 싶다. 그것도 그럴 것이 생성 AI 가 만들어 낸 디지털 이미지나 텍스트는 바로 눈으로 보고 그 대단함을 바로 느낄 수 있지만, 단백질 디자인에 의해 생성된 단백질 서열이나 구조는 그것만으로는 큰 영향력을 미치기는 힘들고, 실존하는 단백질이 되어 의약품 등으로 그 효과가 검증되기까지는 앞으로도 꽤 오랜 시간이 걸릴 것이라는 차이가 ...
[알파폴드에서 단백질 디자인까지]8. 딥러닝 네트워크는 단백질의 꿈을 꾸는가?
[알파폴드에서 단백질 디자인까지]8. 딥러닝 네트워크는 단백질의 꿈을 꾸는가?
앞에서 설명했듯이 2018년 이후 단백질 구조 예측 분야가 인공지능 기술의 본격적인 도입으로 지각변동을 시작할 무렵 단백질 디자인에도 인공지능 기술의 도입이 시작되었다. 특히 알파폴드에 의해서 단백질 디자인의 역함수인 구조 예측이 거의 해결된 이후 알파폴드나 로제타폴드 등의 구조 예측 소프트웨어를 이용하여 단백질 디자인을 하는 시도도 이루어졌다. 이러한 시도 중의 하나가 할루시네이선 (hallucination) 이다.
딥러닝 네트워크는 단백질의 꿈을 꾸는가
일단 단백질 디자인에서의 할루시네이션에 대해서 이야기하기 전에 딥 러닝과 할루시네이션에 대한 이야기부터 알아보자. 2010년대 중반 딥러닝의 발전을 선도했던 영상 인식 연구자들은 여러가지 사물의 이미지를 이용하여 훈련된 네트워크는 이미지에서 유사한 특성을 가진 사물도 해당 사물로 인식할 수 있다는 것을 알게 되었다. 가령 영상 인식의 대표적인 한계로 알려진 머핀을 치와와로 착각하는 밈을 생각해 볼 수 있다.
그림 1...
[알파폴드에서 단백질 디자인까지] 7.단백질 디자인이란 무엇인가
[알파폴드에서 단백질 디자인까지] 6. 알파폴드는 과연 신약개발에 큰 도움이 될까?
[알파폴드에서 단백질 디자인까지] 6. 알파폴드는 과연 신약개발에 큰 도움이 될까?
지난 연재에서 알파폴드가 생물학, 특히 구조생물학의 발전에 단시간내에 획기적인 기여를 했다는 것을 설명했다. 그렇다면 보다 많은 사람들이 관심이 있을 분야인 신약 개발 및 생명공학 분야에서는 어떨까? 일단 오늘은 알파폴드가 신약 개발에 미칠 수 있는 잠재력에 대해서 이야기해 보도록 하자.
알파폴드가 등장한 이후 일부 대중 매체를 중심으로 알파폴드가 신약 개발의 게임체인저가 된다는 류의 기사가 많이 등장하였다. 오랫동안 세기의 난제로 남아있던 단백질 구조 예측 문제를 AI 의 힘으로 하루아침에 해결했으므로 이제 신약개발 역시 이에 비견할 속도로 빨라질 것이라는 류의 이야기이다. 그러나 과연 그럴까? 일단 단백질 구조와 신약 개발의 관계부터 알아보도록 하자.
단백질 구조와 신약 개발
흔히 신약 개발 과정에 정통하지 않은 많은 사람들 (심지어 신약 개발에 직접 관여하지 않는 많은 생물학자들을 포함하여) 은 질병 관련 단백질의 구조가 규명되면 이러한 단백질을 억제하는 약물이 ...
[알파폴드에서 단백질 디자인까지] 5. 알파폴드는 과학 연구에 어떤 영향을 미쳤나
[알파폴드에서 단백질 디자인까지] 5. 알파폴드는 과학 연구에 어떤 영향을 미쳤나
(글쓴이 주 : 이제부터는 2021년에 공개된 딥마인드의 두번째 알파폴드를 ‘알파폴드’ 로 칭하니 주의 바랍니다)
알파폴드가 놀라운 성능으로 단백질 구조를 예측가능하다는 것은 CASP 14 결과가 공개된 2020년 12월에 처음 알려졌지만, 알파폴드 의 전모가 공개된 것은 2021년 7월, 딥마인드가 알파폴드에 대한 논문을 발표하고, 알파폴드의 소스 코드를 오픈소스로 공개하여 누구나 실행시켜 볼 수 있도록 한 이후였다. 그 직후 전세계의 구조생물학자 및 계산생물학자들은 알파폴드의 세부적인 부분까지 뜯어보면서 과연 알파폴드가 어느 정도의 성능인지를 확인하였다.그림 1 : 알파폴드는 2021년 7월 오픈 소스로 누구나 수행해 볼 수 있도록 코드가 완전 공개되었다.
그 결과 알파폴드는 딥마인드가 이미 공개한 것처럼 높은 수준의 정확도로 구조를 예측할 수 있었다. 또한 구조 예측을 하는데는 처음 우려한 것처럼 엄청난 컴퓨터 리소스가 필요한 것도 아니라는 것이 밝혀졌다. 수백만...
[알파폴드에서 단백질 디자인까지] 4. 알파폴드의 충격
[알파폴드에서 단백질 디자인까지] 3.진화 정보 속에 숨어있는 단백질 구조의 실마리
[알파폴드에서 단백질 디자인까지] 3.진화 정보 속에 숨어있는 단백질 구조의 실마리
아미노산 서열로부터 단백질 구조를 예측하는 것이 쉽게 풀기 어려운 ‘세기의 난제’ 로 알려진 지 몇십 년이 된 2010년경에 의외로 엉뚱한 분야에서 단백질 구조를 예측할 수 있는 실마리가 풀리기 시작한다. 그것은 언뜻 보기에는 단백질 구조를 푸는 것과는 별 상관이 없어보이는 다른 인접 학문분야에서의 발전에서 기인한다.
DNA 시퀀싱 기술의 발전에 의한 단백질 서열 정보의 증가
과학.기술의 발전 과정을 살펴보면, 어떤 특정한 분야가 발전하게 되면 여기에 영향을 받아 직접적인 관련이 없어 보이는 분야의 발전이 촉진되는 경우가 종종 존재한다. 가령 1990년대 후반에 3D 게임의 등장에 따라서 3D 그래픽을 처리하기 위한 노력들이 GPU 라는 것을 만들었고, GPU가 3D 그래픽 처리 이외에도 행렬연산 등을 CPU에 비해서 훨씬 빠르게 처리할 수 있다는 것이 알려진 이후 과학기술분야의 계산에도 사용되기 시작하였고, 이는 2010년대 이후 딥러닝(Deep Learning)으로 대...
[알파폴드에서 단백질 디자인까지] 2. 세기의 난제, 단백질 구조 예측
[알파폴드에서 단백질 디자인까지] 1. 단백질 구조는 왜 중요한가