3차 경선 이재명 참패 아닌 선거인단의 편향

taek Hahn
taek Hahn · 정보디자인으로 문제를 해결합니다.
2021/10/16
* 확신이 없어 조심스럽지만 의견을 듣고 어떤 실수를 했는지 확인하고 싶어 어그로성 제목으로 바꿨습니다. :)

다른 경선 결과와 너무 다른 3차 국민 선거인단의 투표 결과가 정말 국민의 선택이 바뀐건지 선거인단에 편향이 생긴 건지 알아보려고 시뮬레이션 해 보고  두드러지는 경선 투표 결과. 마음이 움직였나? 집단의 편향인가? 글을 썼습니다.

결론 먼저

결과를 바꾼 주요 요인은
1.  대장동 이슈로 선거인단의 선택이 바뀌었다.
2. 중간 결과 발표로 다른 유형의 집단이 대규모 유입되어 선거인단의 성격이 바뀌었다
두 가지일 텐데 2가 훨씬 큰 영향이라고 하는게 결과 수치를 설명하는 데 훨씬 자연스럽습니다.


이번에는 근사치를 추정하는 알고리즘으로 변수들을 조금 더 자세히 특정할 수 있는지 실험해봤습니다. 지난번 가장 단순화한 3가지 변수에 추미애 후보로 표가 옮겨가거나 추가로 추미애를 지지하기 위해 유입된 표도 추가해 5가지 변수를 사용했습니다. 모든 표의 흐름을 각 후보의 노드에서 타 후보로 표가 옮겨가거나 투표를 포기하여 이탈되는 표, 추가로 외부에서 유입되는 양방향의 표 흐름으로 나타낼 수 있을 텐데요. 한쪽 흐름이 커서 상쇄되거나 영향이 작아 무시해도 될 것 같은 흐름은 제외하고 5가지를 남긴 것입니다.
후보 득표율 변화 모델


무차별 대입을 통한 근사값 추정

기존 1,2차 결과 평균으로 부터 5가지 변수를 이용해 3차 결과를 시뮬레이션해 실제 결과와 비슷한 결과가 나오는 값의 조합을 찾습니다. 경사하강법을 이용해 최적값을 찾으려고 했는데 단순한 계산이라 테스트로 돌려 본 무차별 대입으로도 금방 그럴듯한 근사값을 구할 수 있었습니다. 

60만개 정도 조합값을 넣어보고 오차가 적은 값을 추렸습니다. 우선 하나의 변수를 정하면 나머지 4 변수를 결과에 가장 근사한 값들로 추정하도록 하고, 그 매개 변수를 변화시켜가며 데이터를 얻었습니다. 그 중에서 결과에 가장 크...
얼룩패스
지금 가입하고
얼룩소의 모든 글을 만나보세요.
이미 회원이신가요? 로그인
정보디자인으로 사용 경험의 문제를 해결합니다.
24
팔로워 117
팔로잉 25