통계학에 대한 딥러닝의 하극상, 그리고 에너지 문제

M
Mentat · AI researcher
2023/03/24
최근 몇 년 동안 딥러닝의 이름 아래에서 수많은 기술적 진보가 있었다. 그 중 몇은 학술적, 산업적 의미를 넘어, 현대 인류문명이 새로운 phase로 진입했음을 보여주는 신호탄의 역할을 하였고, 더 나아가 인간의 존재와 역할에 대한 철학적 사유마저 불러 일으키고 있다.

그런데 딥러닝이란 무엇인가? 사전적 의미는, "은닉층을 포함한 인공신경망관측된 데이터를 이용하여 분류, 생성 등을 수행하는 통계적 모형을 완성시키는 과정" 정도로 말해볼 수 있을 것이다. 그런데 딥러닝을 접하기 전에 대학교에서 통계학을 진지하게 공부해본 사람이라면 다음과 같은 의문을 떠올릴 수도 있을 것이다. "딥러닝이라는 거창한 이름이 붙었을 지언정, 결국 그 내용을 보면, 통계적 추론(statistical inference)을 한다는 것인데, 기존에 통계학이 해오던 일과 무엇이 다른가?"

실제로 수리통계학 교과서들 중에서는, 이 글의 첫 문단에서 언급된 일련의 진보과는 무관하게, 이미 딥러닝에 대해 다루고 있었던 책들이 다수이다. 딥러닝도 결국, 통계학에서 다루는, 수많은 통계적 모형 중 하나에 불과하다. 그러면 통계학 교과서를 다시 펴보자. 교과서 중반부~후반부에 모수추정/비모수추정에 대해 논하는 챕터가 있을 것이다. 모수추정은 확률분포의 종류를 우리가 미리 확정해두고, 수집된 데이터를 가장 잘 설명하는 parameter를 찾아가는 과정이다. 일반적으로 parameter의 개수는 비교적 적으며, 그 수는 고정되어 있다. 비모수추정은 확률분포의 모양을 우리가 정해두지 않는다. 일반적으로 parameter의 수는 비교적 많고 그 수는 고정되어 있지 않다.

딥러닝은 어떨까? 모수모형과 비모수모형의 중간 정도의 포지션으로 볼 수 있다. 분포의 모양을 가정하지 않고 parameter의 수는 매우 많지만 그 수는 고정되어 있다. 정리해보면, 통계학이라는 학문의 위계로 판단컨데, 딥러닝은 통계학 교과서의 중반부에 등장하는 통계적 추론 챕터의 서브챕터에 해당하는 내용에...
얼룩패스
지금 가입하고
얼룩소의 모든 글을 만나보세요.
이미 회원이신가요? 로그인
I prefer to write short articles.
1
팔로워 2
팔로잉 4