alookso - 뉴스

글쓰기

주식회사얼룩소사이어티 사업자 정보

앤트로픽 "LLM 작동 방식 첫 해석 성공...모델 조작도 가능"

앤트로픽이 처음으로 대형언어모델(LLM)의 내부 작동 방식을 자세히 들여다보는 데 성공했다고 밝혔다. 또 이를 통해 LLM을 조작한 사례도 공개했다. 이를 통해 LLM의 '블랙박스' 문제를 해결한 단서를 찾았다고 전했다.앤트로픽은 21일(현지시간) 홈페이지를 통해 'LLM의 마인드 매핑(Mapping the Mind of a LLM)'이라는 연구 결과를 공개했다.LLM이 작동하면 내부 상태는 명확한 의미가 없는 긴 숫자 목록(뉴런)으로 구성된다. 단어가 문자 결합으로 만들어지고, 문장이 단어 결합으로 만들어는 것과 같다. AI 모델

AI타임스

이 뉴스로 글쓰기

1명이 이야기 중

신민기

이해했다는 착각: 앤트로픽의 LLM 해석에 열광하는 이유

지난 5월 21일, AI 기업 중 하나인 앤트로픽(Anthropic)이 “Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet”이라는 논문과 “Mapping the Mind of a Large Language Model”이라는 보고서를 발표했다. 이 보고서는 한국에 “앤트로픽 "LLM 작동 방식 첫 해석 성공...모델 조작도 가능"” 같은 제목으로 기사화되기도 했다.원래는 이 소식을 보고 ‘언젠가 나올 소식’이라고 생각했기 때문에 시큰둥했었고 읽어볼 생각도 크게 없었는데, 어떤 글을 보고 생각이 바뀌었다. 그 글은 어떤 한국인이 SF 소설가 테드 창을 강력히 비난하는 SNS 글이었다. 테드 창은 5월 26일 인터뷰에서 “나는 인공지능이 정말로 지능이 있는 것은 아니며 거대언어모델이 언어를 사용한다고도 할 수 없다고 주장할 예정이다”라고 밝혔다.그런데, 어느 한 사람이 이 주장에 불만을 표하...

산업/기술/IT