통계학에 입문하기 위해 (정말로) 필요한 수학

박준석
박준석 인증된 계정 · 데이터 사이언티스트입니다.
2022/12/30
통계학을 배우려면 수학을 먼저 배워야 한다고들 말하는데, 사실 그 말 때문에 통계학을 더 멀리하게 되는 사례도 드물지 않을 것 같습니다. 사실 수학만 배워서 되는 것도 아니고, 코딩도 좀 알아야 한다고 하고 현업에 적용하려면 도메인 지식도 좀 있어야 한다고 하니 데이터과학을 배우고 적용한다는 게 보통 골치아픈 일이 아닌 것처럼 느껴지죠. 그런데 여기에는 함정이 있습니다. 각각의 주제가 쉬운 것은 아니지만, 제가 보기에 실제보다는 좀 과장된 측면이 있습니다. 현업에서 약간의 경력을 쌓은 입장에서는, 각각의 주제는 아주 깊이 알아야 하는 게 아니라 필요한 만큼만 알면 되기 때문입니다.

그런데 그 반대쪽에는 ‘투머치’ 공부를 하는 분들도 계신 것 같습니다. 사실 저도 좀 그런 스타일입니다. 물론 필요한 것 이상으로 준비를 해 두면 좀 더 편하긴 합니다. 문제는 결국 가성비입니다. 통계학을 공부하겠답시고 수학과 전공과목을, 그것도 꽤 어려운 것들까지 들입다 공부하면 시간과 노력이 필요한 것보다 굉장히 많이 듭니다. 물론 이런 활동에는 그 자체로서 지적인 즐거움이 따르기 때문에 완전히 헛된 활동은 아니지만, 통계학을 공부하기 위한 목적이라는 측면만 놓고 보면 사실 낭비입니다. 그리고 대학원에 진학하게 될 수도 있다는 점은 숨은 복병입니다. 그리고 어떤 분들은 미분방정식, 해석학 등 이름만 들어도 무서운 과목 이름들을 언급하시더군요.

그래서 이 글에서는 이야기만 무성하지만 정확히는 아무도 알려주지 않는, 통계학 입문 수준에서 수학 지식이 무엇이 얼마나 필요한지 좁혀 보겠습니다. 여기서는 대학 1학년 수준 통계학입문 과목을 중심으로 이야기하겠습니다.

통계학입문에서 어떤 수학적 개념들과 마주치는지부터 먼저 이야기하면 어느 정도를 공부해야 할지는 자연스럽게 그림이 떠오를 것 같으니 그렇게 진행하겠습니다. 몇 가지 예를 들어 보겠습니다. 일단 대중에도 잘 알려져 있는 정규분포라는 것의 수식은 다음과 같이 생겼습니다.
위 수식의 좌/우변을...
박준석
박준석 님이 만드는
차별화된 콘텐츠, 지금 바로 만나보세요.
이미 회원이신가요? 로그인
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
24
팔로워 2.5K
팔로잉 31