ChatGPT 이전의 세계, 이후의 세계
초거대 언어모델을 활용한 대화형 인공지능(AI) 챗지피티(ChatGPT)가 등장했다. 질문에 정교한 문장으로 답하는 AI 서비스로, 이전과 차별화된 이용 경험을 줘 큰 화제를 모으고 있다. 일반적인 글쓰기는 물론, 논문이나 보고서, 소설과 같은 전문 분야 창작, 심지어 프로그램 코드 작성까지 높은 수준으로 해내고 있다. 여기에 그림을 생성하는 생성 AI 미드저니의 등장까지 가세해, 현재 산업과 교육, 예술, 학계에서는 이들의 영향이 무엇일지, AI의 활용을 단순 도구 사용으로 봐야 할지 또는 기존 산업과 학계 문법을 거스르는 행위일지 논의가 한창이다. AI의 등장에 따른 지각변동이 시작된 것일까. 현상을 진단한 글부터 관련된 윤리적 고려점을 파헤치는 글까지 다양한 글을 모았다.
최종 업데이트
2023/03/07
무엇인가?
-미국의 비영리 및 영리 인공지능(AI) 연구기업 오픈AI가 개발해 2022년 11월 30일 프로토타입을 첫 공개한 대화형 AI(챗봇).
-기존 챗봇처럼 일상 대화를 재현하는 수준을 벗어나, 전문적인 영역에 대한 질문에 답하거나 창작 지시에 수준급의 결과물을 내놓는 등 본격적인 AI 비서 역할을 선보여 화제를 모으고 있음.
-기존 챗봇처럼 일상 대화를 재현하는 수준을 벗어나, 전문적인 영역에 대한 질문에 답하거나 창작 지시에 수준급의 결과물을 내놓는 등 본격적인 AI 비서 역할을 선보여 화제를 모으고 있음.
원리는?
-오픈Ai가 개발한 초거대 언어 AI모델인 GPT-3 또는 그 개량 버전인 GPT-3.5를 토대로 개발됨.
-언어모델은 단어 뭉치에 확률을 부여해 그럴 듯한 문장을 만들도록 하는 모델. 단어가 주어지면 이어지는 단어로 무엇이 자연스러울지 확률을 통해 선정. 앞 단어에서 뒤 단어로 이어지는 순방향 언어모델과, 뒤에서 앞 단어로 이어지는 역방향 언어모델이 있음.
-GPT: 순방향 언어모델의 일종. 2019년 오픈AI가 출시한 GPT-2가 효시. GPT는 ‘생성 사전학습 트랜스포머’라는 뜻. 텍스트 말뭉치를 사전학습해 확률을 생성하고 이를 바탕으로 문장을 완성함. 이 때 사용하는 머신러닝 모델이 자연어 처리에 널리 쓰이는 순차적 입력 데이터 처리 모델인 트랜스포머.
-GPT-3는 초거대 모델로 2020년 출시됨. 책과 웹, 위키백과 등에서 수천억 개의 단어(토큰) 데이터세트를 만든 뒤 1750억 개의 매개변수를 사용해 이를 분석. 매개변수는 데이터로부터 추정 또는 학습되는 변수로, 이 값이 클수록 초거대 머신러닝 모델.
-GPT-3.5는 GPT-3의 개량판이며 ChatGPT의 기반이 됨.
-ChatGPT: GPT-3.5를 기반으로 인간 트레이너가 지도학습과 강화학습을 사용해 미세조정한 챗봇.
왜 중요한가?
-기존과 차별화된 성능: 일반적인 질문에 답하는 것은 물론, 프로그램의 코드를 작성하거나 디버깅(오류를 찾는 절차)을 수행할 수 있음(위 사진). 주제를 제시하고 보고서나 논문을 요청하면 비슷한 형식의 글을 생성함. 자료 분석, 스토리 작성 등 분석적, 창의적 능력이 필요한 일도 일정 수준 이상의 결과물을 생성.
-논쟁: 이 같은 사실이 알려지자 ChatGPT로 작성한 글의 활용을 놓고 논쟁이 일어남. 사람이 ChatGPT를 통해 획득한 텍스트를 활용해도 되는가가 쟁점. 또 하나는 저자권. AI가 만든 결과물을 AI의 저작으로 인정하고 이를 인용 등의 방법으로 활용해도 될지 논쟁중. 과학계는 ChatGPT를 저자로 인정하지 않겠다는 의견이 다수. 교육계 역시 비판적 사고를 길러야 하는 학습 과정에서 과제 제출에 ChatGPT를 쓰는 것은 부당하다는 의견과, 단순 도구에 불과한 만큼 본격적으로 활용하도록 장려해야 한다는 의견이 충돌중.