메타의 '라마(LLaMA)' 유출, 정말 실수였을까? by 이재훈

메타의 '라마(LLaMA)' 유출, 정말 실수였을까?

이재훈 · IT 커뮤니케이터

2023/05/30

메타의 라마(LLaMA) 유출

지난 2023년 3월 3일 연구용으로만 개방됐던 메타(구 페이스북)의 대규모 언어모델(LLM, Large Language Model) 라마(LLaMA)가 일반인들에게 유출되는 사고가 있었습니다.

최초 유포자는 익명 커뮤니티 포찬(4chan)에 라마 다운로드용 토렌트 링크를 공유했는데, 이 과정에서 고유 식별 코드를 남기는 실수를 범했습니다. 그러나 메타에서 이를 인지했음에도 며칠 동안 별다른 조치를 하지 않은 것으로 알려졌습니다.

더 나아가 유출된 라마의 매개 변수 개수 별(7B / 13B / 30B / 65B) 가중치 데이터를 40MB/s로 다운로드할 수 있는 링크가 GitHub에 게시되면서 퍼지는 속도가 증폭되었습니다.

라마 유출 그 이후

그로부터 2개월이 지난 지금, 유출된 '라마'를 기반으로 훈련한 '알파카', '비쿠냐'의 성능이 라마를 한참 뛰어넘은 것은 물론 'ChatGPT'와 'Bard'에 근접한 수준이라는 것이 알려졌습니다.

지금 가입하고
얼룩소의 모든 글을 만나보세요.

이미 회원이신가요? 로그인

AI 스타트업 BD, 금융사 DT 전략/기획 등의 업무를 경험하고 현재는 IT 커뮤니케이터로 활동하고 있습니다. IT 트렌드 레터 '테크잇슈'를 운영하고 있습니다. 구독 : https://page.stibee.com/subscriptions/297134

글 126

팔로워 178

팔로잉 43