방태모
Data Scientist
G마켓 AI Product팀에서 데이터 분석을 하고 있습니다. 데이터 분석을 통해 G마켓 고객들의 쇼핑 경험을 더 즐겁게 만들고자 합니다.
데이터 사이언스 맥시멀리스트의 위시리스트 (1) - 엔지니어링 기초
구닥다리(?) 데이터 사이언스의 현주소
미스터리한 숫자, 여론조사 표본오차 "3.1%" 에 숨겨진 비밀 (부제: 님하 그 표본오차를 그렇게 쓰지 마오)
미스터리한 숫자, 여론조사 표본오차 "3.1%" 에 숨겨진 비밀 (부제: 님하 그 표본오차를 그렇게 쓰지 마오)
뉴스와 신문지상에 등장하는 여론조사에 꼭 등장하는 항목이 있습니다. “본 설문조사에는 …명을 대상으로 …방식으로 진행되었으며 표본오차는 3.1% 입니다.” 여기서 3.1%라는 숫자에 크게 관심을 갖고 보신 분은 별로 없겠지만, 뭔가 이상하지 않습니까? 설문조사마다 표본오차가 거의 같으니 말입니다. 이상하게 3.1%에서 크게 빗나가는 법이 없죠. 여기서 통계학에 조금 더 조예가 있으신 분들이라면 표본오차가 표본 크기에 좌우된다는 것을 알고 계실 테니, 설문조사마다 1,000명 안팎을 대상으로 조사를 한다면 표본오차도 대략 비슷할 것이라는 점은 눈치채셨을 것입니다. 그런데 왜 하필 그 값이 3.1% 인지까지는 아시는 분이 많지 않으리라 생각합니다. 그래서 이 글에서는 그에 대한 설명을 좀 하고요.
사실 이 기사 (JTBC 2023년 2/8 보도, 엇갈린 국힘 당대표 후보 여론조사…김 45.3%, 안 30.4% vs 안 35.5%, 김 31.2%) 때문에 이 글을 쓰게 되었습니...
이공계 직업은 ‘지적 운동선수’ 인가? (feat. "인문사회계-붐"은 오는가?)
이공계 직업은 ‘지적 운동선수’ 인가? (feat. "인문사회계-붐"은 오는가?)
최근 제가 아는 교수 한 분께서 인문사회계 전공이 장기적으로 이득인 이유라는 제목의 포스팅을 하셨습니다. 저도 인문사회계 출신이라 반갑지 않을 수 없었습니다. 읽다 보니 다음과 같은 솔깃한 문장이 있었습니다. "20대 후반과 30대 초반에는 공학계가 잘 나가지만 30대 후반 이후에는 인문계와 공학계의 처지가 역전된다."
위 진술은 해당 교수님이 2006년에 수행하신, 당시 유행하던 이공계열 위기론에 대한 한 연구의 결론이라고 합니다. 자세한 것은 포스팅과 그 토대가 된 논문을 참조하시기 바랍니다. 이 글을 보고, 저는 예전부터 갖고 있던 생각 하나를 떠올렸습니다. 그것은 바로 이공계 – 물론 ‘이공계’라는 말로 싸잡아 지칭된 수많은 전공들에 대한 일반화에는 많은 함정들이 따르겠지만 – 에서 일하는 것이 어쩌면 운동선수와 비슷한 것이 아닐까 하는 생각입니다. 어떤 점에서 비슷한고 하니, 운동선수들은 종목에 따라 차이는 있지만 젊은 시절, 이를테면 10대 후반에서 20대 초반에 ...
글쓰기에서 '영업 마인드'의 중요성
대 정리해고의 시대에 즈음하여 - 한 재미 기술업계 노동자의 소회
우연을 믿지 않는다는 것의 의미 - 설문조사, 표본오차, 오버피팅
비모수통계, 생각보다 어렵지 않아요 (2) - 맨-휘트니 검정
기술적 글쓰기에서 공감능력의 중요성