여러분이 몰랐던 중심극한정리 (1) - 중앙값
2023/01/09
기왕에 중심극한정리 얘기가 나왔으니 이번에는 대중에 잘 알려지지 않은 내용 하나를 소개하겠습니다. 지난 글 (https://alook.so/posts/Djt6PD7) 에서는 중심극한정리가 적용되지 않는 사례를 소개했는데 (모집단), 이번에는 적용되는 사례를 하나 소개하겠습니다. 바로 중앙값 (median) 입니다. 중앙값은 자료의 분포에서 상/하위 50%에 해당되는 값입니다. 줄세우기를 했을 때 딱 중간에 위치하는 값이죠. 중앙값은 데이터분석을 공부하시는 분들께는 주로 평균 (mean) 에 대한 대안으로 많이 소개됩니다. 평균이 극단치가 있을 때 데이터를 잘 대표하지 못하기 때문에 (이를테면 연봉 분포 같은 것), 이럴 때 중앙값을 사용하면 자료를 대표하는 값으로 쓰기에 더 낫다는 것입니다. 중앙값은 맨 끝에 위치한 값이 아무리 작거나 커도 영향을 받지 않기 때...
심리학을 전공했지만 졸업 후에는 미국에서 데이터과학자로 일하고 있습니다. 데이터를 가지고 가치 있는 활동을 하는 데 관심이 많습니다. [가짜뉴스의 심리학], [3일 만에 끝내는 코딩 통계], [데이터과학자의 일] 등을 썼습니다.