몬스
몬스 · 네트워크 과학을 공부/연구합니다.
2023/02/02
좋은 글 감사합니다.

ChatGPT와 지난 2020년 화제가 되었던 GPT-3와 무엇이 달라졌는지 찾아본 적이 있습니다. 핵심은 GPT-3가 사람이 선호하는 응답을 내도록 트레이닝하고 인터페이스를 조정한 것에 있더군요.

GPT-3은 Common crawl이라고 하여, 인터넷 상의 온갖 문장을 긁어모은 데이터셋으로 부터 학습되었다고 합니다. 그러다 보니, 윤리적으로든 적절성으로든 사람이 선호하는 대답을 보장하지 않는다는 결점이 있었다고 해요.

그래서 사람이 선호하는 문장을 내도록 학습하는 과정을 추가했다고 합니다. 그 과정에 InstructGPT가 있었고, 이를 Chat에 특화시킨 ChatGPT가 탄생했다고 하네요.
OpenAi 블로그. https://openai.com/blog/chatgpt/

먼저, 사람이 선호하는 대답을 교...
얼룩패스
지금 가입하고
얼룩소의 모든 글을 만나보세요.
이미 회원이신가요? 로그인
복잡계 과학에 관심이 많고, 그 중 주로 네트워크 과학을 공부/연구/덕질 하고 있습니다.
654
팔로워 1.2K
팔로잉 604