2023/12/16
보이지 않는 데이터에 대한 가장 유명한 예시는 앞서 서술해주신 생존 편향에 대한 이야기가 아닐까 생각합니다. 돌아온 비행기에 새겨진 총알/포탄 자국에 집중하지 않고 돌아오지 못한 비행기에 집중하며 보완에 성공하여 전쟁에서 승리하는데 큰 공을 세운 이야기가 있습니다.
이렇게 보이지 않는 데이터에 집중하는 것은 전체적으로 보았을 때는 쉬워보이지만, 그 상황에 닥치면 제일 어려운 것 중 하나이지 않을까 생각합니다. 사람들은 편하고 쉬운 것, 경험했던 것, 눈에 보이는 것에 집중하여 생각하기 쉽습니다. 그 속에서 집중과 본질에 집중하는 것은 굉장히 어렵습니다. 새로운 것에 대한 마찰력도 있고, 눈에 보이지 않는 것을 적용하기 위해서는 엄청난 지식과 지혜가 필요하다고 생각합니다. 우선 주변 사람들의 반대에 맞서 ...
이렇게 보이지 않는 데이터에 집중하는 것은 전체적으로 보았을 때는 쉬워보이지만, 그 상황에 닥치면 제일 어려운 것 중 하나이지 않을까 생각합니다. 사람들은 편하고 쉬운 것, 경험했던 것, 눈에 보이는 것에 집중하여 생각하기 쉽습니다. 그 속에서 집중과 본질에 집중하는 것은 굉장히 어렵습니다. 새로운 것에 대한 마찰력도 있고, 눈에 보이지 않는 것을 적용하기 위해서는 엄청난 지식과 지혜가 필요하다고 생각합니다. 우선 주변 사람들의 반대에 맞서 ...
좋은 글 감사합니다.
A. 전체 인구
B. 찾고자 하는 분야의 데이터에 잡히는 사람 수
C. 찾고자 하는 분야에 부적합하여 제외된 사람 수
A-B-C= D
D. 찾고자 하는 분야의 데이터에 잡히지 않는 사람 수
C가 힌트가 된다고 보여지는데요,
'애시당초 부적합하다고 판정받은 자'를 역추적하는 겁니다.
부적합 이유가 무엇인지부터요.
KOSIS 국가통계포털 사이트에는 우리나라 전체 인구를 모집단으로 보기 때문에 A는 해결됩니다.
비전문가라 설명이 이상합니다.
데이터 과학자가 조직에서 수행하는 중요한 역할 중 하나가 데이터를 통해서 주어진 문제에 대해 좀더 체계적이고, 비판적으로 접근하는 게 아닌가 싶네요. 내가 그 의사 결정의 자리에 있어서 다른 사람들이 좀더 신중하게 상황 판단을 하고 다음 행동을 취하도록 돕는 것, 그것이 목표죠.
정보와 경험이 증가한다고 꼭 편향 오류를 피할 수 있는 건 아닌데요. 말씀하신 것처럼 뭔가 당연하게 받아들이는 것(디폴트)을 의심할 수 있는 관점과 상황이 필요하겠죠. 아담 그랜트의 <오리지널스>가 잘 정리한 주제가 아닌가 싶습니다.