메타의 '라마(LLaMA)' 유출, 정말 실수였을까?

이재훈
이재훈 인증된 계정 · IT 커뮤니케이터
2023/05/30
메타의 라마(LLaMA) 유출

지난 2023년 3월 3일 연구용으로만 개방됐던 메타(구 페이스북)의 대규모 언어모델(LLM, Large Language Model) 라마(LLaMA)가 일반인들에게 유출되는 사고가 있었습니다.
출처 : 4Chan
최초 유포자는 익명 커뮤니티 포찬(4chan)에 라마 다운로드용 토렌트 링크를 공유했는데, 이 과정에서 고유 식별 코드를 남기는 실수를 범했습니다. 그러나 메타에서 이를 인지했음에도 며칠 동안 별다른 조치를 하지 않은 것으로 알려졌습니다.

더 나아가 유출된 라마의 매개 변수 개수 별(7B / 13B / 30B / 65B) 가중치 데이터를 40MB/s로 다운로드할 수 있는 링크가 GitHub에 게시되면서 퍼지는 속도가 증폭되었습니다.


라마 유출 그 이후

그로부터 2개월이 지난 지금, 유출된 '라마'를 기반으로 훈련한 '알파카', '비쿠냐'의 성능이 라마를 한참 뛰어넘은 것은 물론 'ChatGPT'와 'Bard'에 근접한 수준이라는 것이 알려졌습니다.
https://lmsys.org/blog/2023-03-30-vicuna...
얼룩패스
지금 가입하고
얼룩소의 모든 글을 만나보세요.
이미 회원이신가요? 로그인
AI 스타트업 BD, 금융사 DT 전략/기획 등의 업무를 경험하고 현재는 IT 커뮤니케이터로 활동하고 있습니다. IT 트렌드 레터 '테크잇슈'를 운영하고 있습니다. 구독 : https://page.stibee.com/subscriptions/297134
126
팔로워 178
팔로잉 43