앤트로픽 "LLM 작동 방식 첫 해석 성공...모델 조작도 가능"

앤트로픽이 처음으로 대형언어모델(LLM)의 내부 작동 방식을 자세히 들여다보는 데 성공했다고 밝혔다. 또 이를 통해 LLM을 조작한 사례도 공개했다. 이를 통해 LLM의 '블랙박스' 문제를 해결한 단서를 찾았다고 전했다.앤트로픽은 21일(현지시간) 홈페이지를 통해 'LLM의 마인드 매핑(Mapping the Mind of a LLM)'이라는 연구 결과를 공개했다.LLM이 작동하면 내부 상태는 명확한 의미가 없는 긴 숫자 목록(뉴런)으로 구성된다. 단어가 문자 결합으로 만들어지고, 문장이 단어 결합으로 만들어는 것과 같다. AI 모델

AI타임스
신민기

1명이 이야기 중