박희철
[학술 연구자를 위한 ChatGPT 활용] 2. 맥락이 풍부해질수록 단단해지는 ChatGPT의 결과물
[학술 연구자를 위한 ChatGPT 활용] 2. 맥락이 풍부해질수록 단단해지는 ChatGPT의 결과물
지난번의 글에서는 ChatGPT와 같은 거대 언어 모델에 기반한 도구는 검색 엔진과는 판이하게 다르며, 학술 관련 글과 같이 디테일이 정확해야 하는 글에서는 거대 언어 모델에서 나오는 결과물은 여러가지 방법을 통해서 팩트체크를 거쳐야 한다는 이야기를 했다.
이번에는 지난번과는 다른 관점에서 ChatGPT 를 이용하여 보다 근거에 기반한 글을 생성할 수 있는 방법에 대해서 알아보도록 한다. 이를 위해서는 과연 ChatGPT 가 어떻게 사용자와 "대화" 를 하는지에 대해서 잠시 알아보기로 하자.
ChatGPT가 대화의 문맥을 기억하는 방법
ChatGPT를 어느 정도 사용해 본 사람이라면 ChatGPT와의 '대화' 를 통해서 좀 더 많은 정보를 제공하거나, ChatGPT의 출력에 대해 피드백을 주면 줄수록 보다 나은 결과를 얻을 수 있다는 것을 경험하였을 것이다. 그렇다면 어떻게 ChatGPT는 사용자와의 대화를 '기억'하고, 이를 통하여 더 나은 답을 제공할 수 있을까?
...
[학술 연구자를 위한 ChatGPT 활용] 1. ChatGPT의 출력을 어떻게 팩트 체크할 것인가?
[학술 연구자를 위한 ChatGPT 활용] 1. ChatGPT의 출력을 어떻게 팩트 체크할 것인가?
ChatGPT가 화제가 된지도 어느정도 시간이 지났고, 이제 ChatGPT 를 어떻게 생산적으로 사용할 수 있을지에 대해서 관심이 모아지고 있다. 그러나 ChatGPT 를 제대로 사용하기 위해서는, 흔히 ChatGPT에 대해서 가지는 여러가지 오해와 기능의 한계를 정확히 인식해야 한다. 가장 대표적인 오해라면 ChatGPT 를 ‘자연어 문장으로 검색 가능한 검색 엔진’ 으로 착각하는 것이다. 그러나 ChatGPT가 뱉어내는 결과들을 조금이라도 유심히 들여다 본 사람이라면 그렇지 않다는 것을 눈치챘을 것이다.
앞으로 몇 회에 걸쳐서, 연구자가 ChatGPT 를 활용하여 연구에 관련된 문서 (논문, 결과보고서, 과제계획서 등등) 를 작성할 때 주의해야 할 부분, 그리고 ChatGPT가 잘 하는 부분, 그닥 잘 하지 못하는 부분, 절대 ChatGPT를 써서는 안되는 부분에 대해서 알아볼 것이다. 그리고 이러한 한계를 극복하여 ChatGPT 등의 대규모 언어 모델 기반의 인공지능 ...
[탈리도마이드에서 단백질 표적분해까지] 5(완). 단백질 표적 분해의 기반이 된 탈리도마이드
[탈리도마이드에서 단백질 표적분해까지] 5(완). 단백질 표적 분해의 기반이 된 탈리도마이드
탈리도마이드에 대한 연재를 마무리하는 이번 연재에서는 어떻게 '탈리도마이드의 후예" 들이 단백질 표적 분해라는 기존에는 없었던 새로운 종류의 약물을 만드는지를 알아보도록 하자.
새로운 분자 접착제
레날리도마이드나 포말리도마이드와 같이 탈리도마이드에 비해서 보다 약효가 상승한 면역조절약물들이 다발성 골수종 치료제로 본격적으로 사용되기 시작하고, 이들이 작용하는 표적 단백질이 세레브론이라는 것이 알려진 이후, 이를 기반으로 새로운 ‘분자 접착제’ (Molecular Glue) 를 찾아보려는 노력이 계속되었다.
즉, 기존의 약물보다 더 효과가 좋은 면역조절약물을 만들거나, 이카로스/아이올로스 이외의 다른 단백질을 분해하여 다발성 골수종 이외의 다른 질병을 치료할 수 있을지도 모른다. 그리고 탈리도마이드 유도체들은 이카로스/아이올로스 이외에도 SALL4, p63 등 다양한 단백질의 분해를 촉진하여, 결과적으로 기형아 유도 등의 부작용들을 일으키지만, 이러한 문제를 해결하여 ...
[탈리도마이드에서 단백질 표적분해까지] 4. 탈리도마이드=분자 접착제
[탈리도마이드에서 단백질 표적분해까지] 3. 탈리도마이드의 부활
[탈리도마이드에서 단백질 표적분해까지] 2. 탈리도마이드의 비극
우리 목숨 구해준 투구게, 이젠 그들을 내버려 둘 때
[탈리도마이드에서 단백질 표적분해까지] 1. 탈리도마이드의 탄생
[알파폴드에서 단백질 디자인까지] 10(완). 단백질 디자인 기술은 세상을 어떻게 바꿀까
[알파폴드에서 단백질 디자인까지] 10(완). 단백질 디자인 기술은 세상을 어떻게 바꿀까
지금까지 9화에 걸쳐 단백질 구조 예측과 디자인 기술이 어떻게 발전해 왔는지의 과정을 다루었다. 그렇다면 이러한 기술의 발전은 궁극적으로 어떤 변화를 만들까? 생명과학이나 바이오테크놀로지에 국한된 변화뿐만 아닌 넓은 관점에서의 예상을 해보도록 하자.
일단 지금까지 다룬 ‘단백질을 마음대로 만들어 낼 수 있다는 것’이 생물학의 역사에서 어떤 전환점이 되는지부터 알아보도록 하자.
읽는 생물학에서 쓰는 생물학의 시대로의 전환
지금까지의 생물학의 발전 과정을 살펴보면 대부분 생명 현상이라는 우주에서 가장 복잡한 현상을 어떻게 관찰하고 읽어내는 과정이었다고 할 수 있다. 즉 다양한 생물을 관찰하고, 이들을 해부하여 내부 구조를 파악하고, 현미경을 통해 세포라는 생물의 기본 단위를 발견하고, 세포를 구성하고 있는 화학 물질을 분석하고, 세포와 생물의 ‘펌웨어’ 라고 할 수 있는 유전 정보가 들어있는 DNA를 발견하여 그 안에 들어 있는 정보를 해독하고, DNA에 들어있는 정보 중 ...
[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때
[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때
인공지능에서 최근 대중들에게 가장 화제가 된 것들은 무엇보다도 생성 AI (Generative AI) 로 불리는 기술들이다. 가령 정해진 텍스트에 따라서 학습된 이미지에 기반하여 마치 프로 아티스트가 그린 듯한 고퀄리티의 그림을 생성해 주는 DALL·E-2 나 스태블 디퓨전 (Stable Diffusion), 그리고 화자의 질문에 따라서 적절한 답을 주는 ChatGPT 등은 매우 큰 화제가 되고 있다.
그러나 이러한 AI 응용기술과 크게 다르지 않은 원리가 최근 단백질 분야에 활발히 적용되고 있다는 것은 일반인들에게 아직 잘 알려져 있지 않은 듯 싶다. 그것도 그럴 것이 생성 AI 가 만들어 낸 디지털 이미지나 텍스트는 바로 눈으로 보고 그 대단함을 바로 느낄 수 있지만, 단백질 디자인에 의해 생성된 단백질 서열이나 구조는 그것만으로는 큰 영향력을 미치기는 힘들고, 실존하는 단백질이 되어 의약품 등으로 그 효과가 검증되기까지는 앞으로도 꽤 오랜 시간이 걸릴 것이라는 차이가 ...
[알파폴드에서 단백질 디자인까지]8. 딥러닝 네트워크는 단백질의 꿈을 꾸는가?
[알파폴드에서 단백질 디자인까지]8. 딥러닝 네트워크는 단백질의 꿈을 꾸는가?
앞에서 설명했듯이 2018년 이후 단백질 구조 예측 분야가 인공지능 기술의 본격적인 도입으로 지각변동을 시작할 무렵 단백질 디자인에도 인공지능 기술의 도입이 시작되었다. 특히 알파폴드에 의해서 단백질 디자인의 역함수인 구조 예측이 거의 해결된 이후 알파폴드나 로제타폴드 등의 구조 예측 소프트웨어를 이용하여 단백질 디자인을 하는 시도도 이루어졌다. 이러한 시도 중의 하나가 할루시네이선 (hallucination) 이다.
딥러닝 네트워크는 단백질의 꿈을 꾸는가
일단 단백질 디자인에서의 할루시네이션에 대해서 이야기하기 전에 딥 러닝과 할루시네이션에 대한 이야기부터 알아보자. 2010년대 중반 딥러닝의 발전을 선도했던 영상 인식 연구자들은 여러가지 사물의 이미지를 이용하여 훈련된 네트워크는 이미지에서 유사한 특성을 가진 사물도 해당 사물로 인식할 수 있다는 것을 알게 되었다. 가령 영상 인식의 대표적인 한계로 알려진 머핀을 치와와로 착각하는 밈을 생각해 볼 수 있다.
그림 1...
[알파폴드에서 단백질 디자인까지] 7.단백질 디자인이란 무엇인가
[알파폴드에서 단백질 디자인까지] 6. 알파폴드는 과연 신약개발에 큰 도움이 될까?
[알파폴드에서 단백질 디자인까지] 6. 알파폴드는 과연 신약개발에 큰 도움이 될까?
지난 연재에서 알파폴드가 생물학, 특히 구조생물학의 발전에 단시간내에 획기적인 기여를 했다는 것을 설명했다. 그렇다면 보다 많은 사람들이 관심이 있을 분야인 신약 개발 및 생명공학 분야에서는 어떨까? 일단 오늘은 알파폴드가 신약 개발에 미칠 수 있는 잠재력에 대해서 이야기해 보도록 하자.
알파폴드가 등장한 이후 일부 대중 매체를 중심으로 알파폴드가 신약 개발의 게임체인저가 된다는 류의 기사가 많이 등장하였다. 오랫동안 세기의 난제로 남아있던 단백질 구조 예측 문제를 AI 의 힘으로 하루아침에 해결했으므로 이제 신약개발 역시 이에 비견할 속도로 빨라질 것이라는 류의 이야기이다. 그러나 과연 그럴까? 일단 단백질 구조와 신약 개발의 관계부터 알아보도록 하자.
단백질 구조와 신약 개발
흔히 신약 개발 과정에 정통하지 않은 많은 사람들 (심지어 신약 개발에 직접 관여하지 않는 많은 생물학자들을 포함하여) 은 질병 관련 단백질의 구조가 규명되면 이러한 단백질을 억제하는 약물이 ...
[알파폴드에서 단백질 디자인까지] 5. 알파폴드는 과학 연구에 어떤 영향을 미쳤나
[알파폴드에서 단백질 디자인까지] 5. 알파폴드는 과학 연구에 어떤 영향을 미쳤나
(글쓴이 주 : 이제부터는 2021년에 공개된 딥마인드의 두번째 알파폴드를 ‘알파폴드’ 로 칭하니 주의 바랍니다)
알파폴드가 놀라운 성능으로 단백질 구조를 예측가능하다는 것은 CASP 14 결과가 공개된 2020년 12월에 처음 알려졌지만, 알파폴드 의 전모가 공개된 것은 2021년 7월, 딥마인드가 알파폴드에 대한 논문을 발표하고, 알파폴드의 소스 코드를 오픈소스로 공개하여 누구나 실행시켜 볼 수 있도록 한 이후였다. 그 직후 전세계의 구조생물학자 및 계산생물학자들은 알파폴드의 세부적인 부분까지 뜯어보면서 과연 알파폴드가 어느 정도의 성능인지를 확인하였다.그림 1 : 알파폴드는 2021년 7월 오픈 소스로 누구나 수행해 볼 수 있도록 코드가 완전 공개되었다.
그 결과 알파폴드는 딥마인드가 이미 공개한 것처럼 높은 수준의 정확도로 구조를 예측할 수 있었다. 또한 구조 예측을 하는데는 처음 우려한 것처럼 엄청난 컴퓨터 리소스가 필요한 것도 아니라는 것이 밝혀졌다. 수백만...
[알파폴드에서 단백질 디자인까지] 4. 알파폴드의 충격