통계학에 입문하기 위해 (정말로) 필요한 수학
2022/12/30
통계학을 배우려면 수학을 먼저 배워야 한다고들 말하는데, 사실 그 말 때문에 통계학을 더 멀리하게 되는 사례도 드물지 않을 것 같습니다. 사실 수학만 배워서 되는 것도 아니고, 코딩도 좀 알아야 한다고 하고 현업에 적용하려면 도메인 지식도 좀 있어야 한다고 하니 데이터과학을 배우고 적용한다는 게 보통 골치아픈 일이 아닌 것처럼 느껴지죠. 그런데 여기에는 함정이 있습니다. 각각의 주제가 쉬운 것은 아니지만, 제가 보기에 실제보다는 좀 과장된 측면이 있습니다. 현업에서 약간의 경력을 쌓은 입장에서는, 각각의 주제는 아주 깊이 알아야 하는 게 아니라 필요한 만큼만 알면 되기 때문입니다.
그런데 그 반대쪽에는 ‘투머치’ 공부를 하는 분들도 계신 것 같습니다. 사실 저도 좀 그런 스타일입니다. 물론 필요한 것 이상으로 준비를 해 두면 좀 더 편하긴 합니다. 문제는 결국 가성비입니다. 통계학을 공부하겠답시고 수학과 전공과목을, 그것도 꽤 어려운 것들까지 들입다 공부하면 시간과 노력이 필요한 것보다 굉장히 많이 듭니다. 물론 이런 활동에는 그 자체로서 지적인 즐거움이 따르기 때문에 완전히 헛된 활동은 아니지만, 통계학을 공부하기 위한 목적이라는 측면만 놓고 보면 사실 낭비입니다.그리고 대학원에 진학하게 될 수도 있다는 점은 숨은 복병입니다. 그리고 어떤 분들은 미분방정식, 해석학 등 이름만 들어도 무서운 과목 이름들을 언급하시더군요.
그래서 이 글에서는 이야기만 무성하지만 정확히는 아무도 알려주지 않는, 통계학 입문 수준에서 수학 지식이 무엇이 얼마나 필요한지 좁혀 보겠습니다. 여기서는 대학 1학년 수준 통계학입문 과목을 중심으로 이야기하겠습니다.
통계학입문에서 어떤 수학적 개념들과 마주치는지부터 먼저 이야기하면 어느 정도를 공부해야 할지는 자연스럽게 그림이 떠오를 것 같으니 그렇게 진행하겠습니다. 몇 가지 예를 들어 보겠습니다. 일단 대중에도 잘 알려져 있는 정규분포라는 것의 수식은 다음과 같이 생겼습니다.
위 수식의 좌/우변을...
그런데 그 반대쪽에는 ‘투머치’ 공부를 하는 분들도 계신 것 같습니다. 사실 저도 좀 그런 스타일입니다. 물론 필요한 것 이상으로 준비를 해 두면 좀 더 편하긴 합니다. 문제는 결국 가성비입니다. 통계학을 공부하겠답시고 수학과 전공과목을, 그것도 꽤 어려운 것들까지 들입다 공부하면 시간과 노력이 필요한 것보다 굉장히 많이 듭니다. 물론 이런 활동에는 그 자체로서 지적인 즐거움이 따르기 때문에 완전히 헛된 활동은 아니지만, 통계학을 공부하기 위한 목적이라는 측면만 놓고 보면 사실 낭비입니다.
그래서 이 글에서는 이야기만 무성하지만 정확히는 아무도 알려주지 않는, 통계학 입문 수준에서 수학 지식이 무엇이 얼마나 필요한지 좁혀 보겠습니다. 여기서는 대학 1학년 수준 통계학입문 과목을 중심으로 이야기하겠습니다.
통계학입문에서 어떤 수학적 개념들과 마주치는지부터 먼저 이야기하면 어느 정도를 공부해야 할지는 자연스럽게 그림이 떠오를 것 같으니 그렇게 진행하겠습니다. 몇 가지 예를 들어 보겠습니다. 일단 대중에도 잘 알려져 있는 정규분포라는 것의 수식은 다음과 같이 생겼습니다.
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
참고로 덧붙이자면, 행렬은 2014학년도 이후 고등학교 입학한 학생 기준으로, 고등학교 때 안 배웠습니다. 다만, 과학고등학교/영재고등학교처럼 특목고의 경우, 고급 수학이라는 과목으로 배웠는데요.
최근 2028학년도에 개편될 예정인 교육과정에서 역행렬을 제외한 형태로 행렬이 고등학교 1학년 과정에 추가된다고 합니다. 그러니까 14년 동안의 학생들에게 "행렬이란? 을 묻는다면, 뭐지...?" 싶은 대답을 들을 수 있을 예정이네요. ㅎ
수식이 상당히 많이 나열되어 있는데, 각 수식과 수식이 의미하는 바가 연결되어있으니, 이해가 안 가는 건 아니지만, 수식 중 일부는 왜 이렇게 썼나 싶게 생긴 것도 있네요. 수식에서 오는 공포가 이런 느낌이겠다 싶은 것도 있고.
말씀해주신, [;] 표시는, 덕분에 알게 되었네요. 감사합니다. 앞으로 좋은 글 써주세요!
수학을 정말 싫어했지만(못해서 미워함) 수학에 대한 로망이 있어 재미나게 읽었습니다!
와..! 나중에 통계물리학을 연구하고싶어서 휴학중 물리학자가 쓴 통계수학책으로 공부했는데 헛공부한건 아니었군요!!
와..! 나중에 통계물리학을 연구하고싶어서 휴학중 물리학자가 쓴 통계수학책으로 공부했는데 헛공부한건 아니었군요!!
참고로 덧붙이자면, 행렬은 2014학년도 이후 고등학교 입학한 학생 기준으로, 고등학교 때 안 배웠습니다. 다만, 과학고등학교/영재고등학교처럼 특목고의 경우, 고급 수학이라는 과목으로 배웠는데요.
최근 2028학년도에 개편될 예정인 교육과정에서 역행렬을 제외한 형태로 행렬이 고등학교 1학년 과정에 추가된다고 합니다. 그러니까 14년 동안의 학생들에게 "행렬이란? 을 묻는다면, 뭐지...?" 싶은 대답을 들을 수 있을 예정이네요. ㅎ
수식이 상당히 많이 나열되어 있는데, 각 수식과 수식이 의미하는 바가 연결되어있으니, 이해가 안 가는 건 아니지만, 수식 중 일부는 왜 이렇게 썼나 싶게 생긴 것도 있네요. 수식에서 오는 공포가 이런 느낌이겠다 싶은 것도 있고.
말씀해주신, [;] 표시는, 덕분에 알게 되었네요. 감사합니다. 앞으로 좋은 글 써주세요!
수학을 정말 싫어했지만(못해서 미워함) 수학에 대한 로망이 있어 재미나게 읽었습니다!