여러분이 몰랐던 중심극한정리 (1) - 중앙값

박준석
박준석 인증된 계정 · 데이터 사이언티스트입니다.
2023/01/09
기왕에 중심극한정리 얘기가 나왔으니 이번에는 대중에 잘 알려지지 않은 내용 하나를 소개하겠습니다. 지난 글 (https://alook.so/posts/Djt6PD7) 에서는 중심극한정리가 적용되지 않는 사례를 소개했는데 (모집단), 이번에는 적용되는 사례를 하나 소개하겠습니다. 바로 중앙값 (median) 입니다. 중앙값은 자료의 분포에서 상/하위 50%에 해당되는 값입니다. 줄세우기를 했을 때 딱 중간에 위치하는 값이죠. 중앙값은 데이터분석을 공부하시는 분들께는 주로 평균 (mean) 에 대한 대안으로 많이 소개됩니다. 평균이 극단치가 있을 때 데이터를 잘 대표하지 못하기 때문에 (이를테면 연봉 분포 같은 것), 이럴 때 중앙값을 사용하면 자료를 대표하는 값으로 쓰기에 더 낫다는 것입니다. 중앙값은 맨 끝에 위치한 값이 아무리 작거나 커도 영향을 받지 않기 때...
박준석
박준석 님이 만드는
차별화된 콘텐츠, 지금 바로 만나보세요.
이미 회원이신가요? 로그인
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.
24
팔로워 2.5K
팔로잉 31