ikangkim
카탈린 카리코 : 현장 과학자의 힘
상온 초전도체 소동의 긍정적인 측면 : 프리프린트와 오픈 사이언스
[과학 학술저널 이야기] 4. 과학 저널 서열화, 임팩트 팩터, 과학의 왜곡
[과학 학술저널 이야기] 3. 프리프린트와 오픈 사이언스는 저널의 대안이 될 수 있는가
[과학 학술저널 이야기] 3. 프리프린트와 오픈 사이언스는 저널의 대안이 될 수 있는가
프리프린트
사실 논문을 작성하여 저널에 투고하기 전 논문 원고를 동료 학자들에게 보내 회람하여 코멘트를 듣는 일은 현재의 ‘프리프린트’ 라는 단어가 일반화되기 전부터 흔한 일이었다. 가령 로절린드 프랭클린은 DNA 연구를 접고 담배 모자이크 바이러스 연구를 해서 논문을 투고하기 전에 프랜시스 크릭이나 왓슨과 같은 사람들에게 초고를 보여주고 코멘트를 들었으며, 다른 과학자들도 마찬가지였다. 1960년대에는 미국 국립보건원을 중심으로 하여 출판전 원고를 회람하는 ‘정보 교환 그룹’ (Information Exchange Group, IEG) 이라는 모임이 존재하기도 하였다. (IEG는 1960년대 말, 당시 세력을 키워가던 상업 출판사 및 저널을 발행하는 학회의 반발에 의해 없어졌다. 이들은 출판 이전에 공개된 원고는 출판하지 않는다는 규칙을 세워 과학자들의 원고 공개 회람을 막았다)
그러나 지금과 같은 형식의 프리프린트는 인터넷의 탄생과 직접적으로 연관되어 있다. 1980...
[학술 연구자를 위한 ChatGPT 활용] 3. ChatGPT 로 논문 읽기와 피어 리뷰 흉내
[학술 연구자를 위한 ChatGPT 활용] 3. ChatGPT 로 논문 읽기와 피어 리뷰 흉내
지난 연재에서는 의생명과학 학술 논문의 초록을 외부 데이터베이스에서 검색하고, 이를 기반으로 논문 형식의 글을 쓰는 방법을 알아보았다. 이번에는 논문을 ChatGPT 를 이용하여 ‘읽는’ 방법에 대해서 알아보도록 하자. 여기서 학술 논문을 읽는다는 것은 논문에서 제시한 내용을 이해하는 것을 넘어서, 논문의 핵심 주장을 파악하고, 이를 비판적으로 읽는 과정을 의미한다.
대부분의 출판물과 학술논문이 가지는 큰 차이라면 오늘날 거의 대부분의 학술 논문은 출판 전에 해당 분야 연구자에 의한 ‘피어 리뷰’ (동료 평가로 번역하는 것이 제일 적절하다) 를 거치고 여기서 나온 지적이나 비판을 보완하는 과정을 거친 이후에야 출판된다. 학계에서 권위가 있는 저널인 경우에는 내가 작성한 논문이 이러한 권위에 걸맞는 존재인지, 즉 논문 연구주제의 독창성과 연구 수행 방법의 엄밀성에 대해서 피어 리뷰를 통하여 혹독히 도전받는다. 그리하여 상당수의 논문들은 이러한 피어 리뷰의 문턱을 넘지도 못하...
[학술 연구자를 위한 ChatGPT 활용] 2. 맥락이 풍부해질수록 단단해지는 ChatGPT의 결과물
[학술 연구자를 위한 ChatGPT 활용] 2. 맥락이 풍부해질수록 단단해지는 ChatGPT의 결과물
지난번의 글에서는 ChatGPT와 같은 거대 언어 모델에 기반한 도구는 검색 엔진과는 판이하게 다르며, 학술 관련 글과 같이 디테일이 정확해야 하는 글에서는 거대 언어 모델에서 나오는 결과물은 여러가지 방법을 통해서 팩트체크를 거쳐야 한다는 이야기를 했다.
이번에는 지난번과는 다른 관점에서 ChatGPT 를 이용하여 보다 근거에 기반한 글을 생성할 수 있는 방법에 대해서 알아보도록 한다. 이를 위해서는 과연 ChatGPT 가 어떻게 사용자와 "대화" 를 하는지에 대해서 잠시 알아보기로 하자.
ChatGPT가 대화의 문맥을 기억하는 방법
ChatGPT를 어느 정도 사용해 본 사람이라면 ChatGPT와의 '대화' 를 통해서 좀 더 많은 정보를 제공하거나, ChatGPT의 출력에 대해 피드백을 주면 줄수록 보다 나은 결과를 얻을 수 있다는 것을 경험하였을 것이다. 그렇다면 어떻게 ChatGPT는 사용자와의 대화를 '기억'하고, 이를 통하여 더 나은 답을 제공할 수 있을까?
...
[학술 연구자를 위한 ChatGPT 활용] 1. ChatGPT의 출력을 어떻게 팩트 체크할 것인가?
[학술 연구자를 위한 ChatGPT 활용] 1. ChatGPT의 출력을 어떻게 팩트 체크할 것인가?
ChatGPT가 화제가 된지도 어느정도 시간이 지났고, 이제 ChatGPT 를 어떻게 생산적으로 사용할 수 있을지에 대해서 관심이 모아지고 있다. 그러나 ChatGPT 를 제대로 사용하기 위해서는, 흔히 ChatGPT에 대해서 가지는 여러가지 오해와 기능의 한계를 정확히 인식해야 한다. 가장 대표적인 오해라면 ChatGPT 를 ‘자연어 문장으로 검색 가능한 검색 엔진’ 으로 착각하는 것이다. 그러나 ChatGPT가 뱉어내는 결과들을 조금이라도 유심히 들여다 본 사람이라면 그렇지 않다는 것을 눈치챘을 것이다.
앞으로 몇 회에 걸쳐서, 연구자가 ChatGPT 를 활용하여 연구에 관련된 문서 (논문, 결과보고서, 과제계획서 등등) 를 작성할 때 주의해야 할 부분, 그리고 ChatGPT가 잘 하는 부분, 그닥 잘 하지 못하는 부분, 절대 ChatGPT를 써서는 안되는 부분에 대해서 알아볼 것이다. 그리고 이러한 한계를 극복하여 ChatGPT 등의 대규모 언어 모델 기반의 인공지능 ...
[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때
[알파폴드에서 단백질 디자인까지]9. 단백질이 스테블 디퓨전과 ChatGPT 기술이 만날 때
인공지능에서 최근 대중들에게 가장 화제가 된 것들은 무엇보다도 생성 AI (Generative AI) 로 불리는 기술들이다. 가령 정해진 텍스트에 따라서 학습된 이미지에 기반하여 마치 프로 아티스트가 그린 듯한 고퀄리티의 그림을 생성해 주는 DALL·E-2 나 스태블 디퓨전 (Stable Diffusion), 그리고 화자의 질문에 따라서 적절한 답을 주는 ChatGPT 등은 매우 큰 화제가 되고 있다.
그러나 이러한 AI 응용기술과 크게 다르지 않은 원리가 최근 단백질 분야에 활발히 적용되고 있다는 것은 일반인들에게 아직 잘 알려져 있지 않은 듯 싶다. 그것도 그럴 것이 생성 AI 가 만들어 낸 디지털 이미지나 텍스트는 바로 눈으로 보고 그 대단함을 바로 느낄 수 있지만, 단백질 디자인에 의해 생성된 단백질 서열이나 구조는 그것만으로는 큰 영향력을 미치기는 힘들고, 실존하는 단백질이 되어 의약품 등으로 그 효과가 검증되기까지는 앞으로도 꽤 오랜 시간이 걸릴 것이라는 차이가 ...
미스터리한 숫자, 여론조사 표본오차 "3.1%" 에 숨겨진 비밀 (부제: 님하 그 표본오차를 그렇게 쓰지 마오)
미스터리한 숫자, 여론조사 표본오차 "3.1%" 에 숨겨진 비밀 (부제: 님하 그 표본오차를 그렇게 쓰지 마오)
뉴스와 신문지상에 등장하는 여론조사에 꼭 등장하는 항목이 있습니다. “본 설문조사에는 …명을 대상으로 …방식으로 진행되었으며 표본오차는 3.1% 입니다.” 여기서 3.1%라는 숫자에 크게 관심을 갖고 보신 분은 별로 없겠지만, 뭔가 이상하지 않습니까? 설문조사마다 표본오차가 거의 같으니 말입니다. 이상하게 3.1%에서 크게 빗나가는 법이 없죠. 여기서 통계학에 조금 더 조예가 있으신 분들이라면 표본오차가 표본 크기에 좌우된다는 것을 알고 계실 테니, 설문조사마다 1,000명 안팎을 대상으로 조사를 한다면 표본오차도 대략 비슷할 것이라는 점은 눈치채셨을 것입니다. 그런데 왜 하필 그 값이 3.1% 인지까지는 아시는 분이 많지 않으리라 생각합니다. 그래서 이 글에서는 그에 대한 설명을 좀 하고요.
사실 이 기사 (JTBC 2023년 2/8 보도, 엇갈린 국힘 당대표 후보 여론조사…김 45.3%, 안 30.4% vs 안 35.5%, 김 31.2%) 때문에 이 글을 쓰게 되었습니...
[알파폴드에서 단백질 디자인까지] 7.단백질 디자인이란 무엇인가