AI : 지금 저를 테스트하는 중이군요?
2024/03/14
최근 OpenAI의 경쟁사인 앤쓰로픽(Antrhopic)에서 클로드3(Cluade3) 업데이트 소식을 발표했습니다. 이 업데이트는 성능과 크기에 따라 모델을 3가지의 버전으로 출시했으며, 그중에 가장 높은 성능을 보유한 오푸스(Opus)는 벤치마크 테스트에서 GPT-4를 뛰어넘었다고 밝히며 많은 이목을 집중시켰습니다.
GPT-4의 성능을 뛰어넘었다는 사실은 매우 흥미로웠지만, GPT-4가 이미 시장에 나온 지 상당한 시간이 지난 점을 고려할 때, 크게 놀라운 사실이라고 보기에는 어려움이 있었는데요. 정작 이보다 더 놀라운 사실은 비공식적으로 발표에 있었습니다.
앤쓰로픽의 프롬프트 엔지니어 중 한 명인 알렉스(Alex)는 클로드3 테스트 중 재밌는 사실을 발견했다며 X(구 트위터)를 통해 아래와 같은 내용을 발표했습니다. (아래 내용은 이해를 돕기 위해 약간의 각색을 진행했으며, 원본 내용은 링크를 통해 확인하시기 바랍니다.)
"(중략) 클로드3 오푸스에 대해 '건초 더미 속에 바늘 찾기' 테스트를 진행하던 중 흥미로운 결과를 발견했습니다. ...