남궁석
남궁석 인증된 계정 · 'Mad Scientist'
2023/02/10
ChatGPT 이전의 세계, 이후의 세계

라이뷰

ChatGPT 이전의 세계, 이후의 세계

인공지능에서 최근 대중들에게 가장 화제가 된 것들은 무엇보다도 생성 AI (Generative AI) 로 불리는 기술들이다. 가령 정해진 텍스트에 따라서 학습된 이미지에 기반하여 마치 프로 아티스트가 그린 듯한 고퀄리티의 그림을 생성해 주는 DALL·E-2스태블 디퓨전 (Stable Diffusion), 그리고 화자의 질문에 따라서 적절한 답을 주는 ChatGPT 등은 매우 큰 화제가 되고 있다.

그러나 이러한 AI 응용기술과 크게 다르지 않은 원리가 최근 단백질 분야에 활발히 적용되고 있다는 것은 일반인들에게 아직 잘 알려져 있지 않은 듯 싶다. 그것도 그럴 것이 생성 AI 가 만들어 낸 디지털 이미지나 텍스트는 바로 눈으로 보고 그 대단함을 바로 느낄 수 있지만, 단백질 디자인에 의해 생성된 단백질 서열이나 구조는 그것만으로는 큰 영향력을 미치기는 힘들고, 실존하는 단백질이 되어 의약품 등으로 그 효과가 검증되기까지는 앞으로도 꽤 오랜 시간이 걸릴 것이라는 차이가 있긴 하다. 그러나 이러한 기술들의 발전은 지금 이러한 인공지능 기술이 형성하는 텍스트나 이미지 이상의 파급효과를 우리에게 안겨줄 가능성이 높다.

오늘은 디퓨전 모델 (Diffusion Model)거대 단백질 언어모델 (Large Protein Language Model) 이 단백질 디자인 분야를 어떻게 진보시키고 있는지를 알아보도록 하자.

디퓨전 모델이란 대체 뭔데?

일단 단백질 디자인에 적용되는 AI 테크닉을 알아보기 이전에 익숙한 화상 생성 AI 에 대해서 알아보자. DALL E-2, 스태블 디퓨전 등 요즘 인기있는 텍스트로부터 영상을 생성하는 인공지능인 디퓨전 모델 (Diffusion Moel) 은 통계열역학의 확산 (Diffusion) 현상 이론을 인공지능에 적용시킨 방법이다. 여기에 대해서 아주 주마간산으로 알아보도록 하자. (보다 수학적인 기술을 포함한 자세한 설명은 다른 곳을 참조하기 바란다)

디퓨전 모델은 초기 상태의 분자들이 시간에 따라서 확산되는 과정을 이미지 생...
남궁석
남궁석 님이 만드는
차별화된 콘텐츠, 지금 바로 만나보세요.
이미 회원이신가요? 로그인
구조기반 신약개발에 관심이 많은 구조생물학자 '과학자가 되는 방법' '암 정복 연대기' '세포, 생명의 마이크로 코스모스 탐사기' '바이러스, 사회를 감염하다' 등의 책을 썼습니다
49
팔로워 2.8K
팔로잉 30