이해했다는 착각: 앤트로픽의 LLM 해석에 열광하는 이유
2024/06/05
지난 5월 21일, AI 기업 중 하나인 앤트로픽(Anthropic)이 “Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet”이라는 논문과 “Mapping the Mind of a Large Language Model”이라는 보고서를 발표했다.
이 보고서는 한국에 “앤트로픽 "LLM 작동 방식 첫 해석 성공...모델 조작도 가능"” 같은 제목으로 기사화되기도 했다.
이 보고서는 한국에 “앤트로픽 "LLM 작동 방식 첫 해석 성공...모델 조작도 가능"” 같은 제목으로 기사화되기도 했다.