여기는 나무위키이므로 ; 몇 명이 얼마나, 어떻게 기여하는가?

김학준
김학준 인증된 계정 · 어쩌다 분석가
2024/01/09
본격적으로 ‘누가’, ‘얼마나’썼는지를 말하기 전에, 한 가지만 짚고 넘어가도록 하겠다. 모든 데이터분석은 수집한 데이터를 정제하는 과정, 즉 전처리를 거친다. 이 전처리 과정에서 이상치 혹은 결측치 등은 분석대상에서 제외하게 되는데, 우리의 분석을 위해 제거된 이상치 중 가장 주목할만한 이상치는 ‘수정 글자수’에서 나왔다. 

4306회의 수정 과정에서 평균적인 수정 글자수는 23.32자였다. 중앙값은 7로, 아주 거칠게 이야기하자면 대개의 수정은 자구수정이나 길어야 한 두 문장 정도의 추가라고 할 수 있겠다. 물론 1-2부에서 살펴본 바와 같이 마이너스 수정의 경우도 얼마든지 있기에, 이 수치에 대한 해석은 주의할 필요가 있다. 최대 수정수는 얼마일까. 최고로 많은 글자 추가가 이루어진 건은 57,238자였다. 그리고, 가장 적은(혹은 가장 많이 덜어낸) 수정 글자수 역시 같은 57,238자였다. 

이 두 케이스는 11월 28일 오전 9시 17분 경(버전 r1915) 연이어 이루어졌는데, 마이너스 수정이 선행했다. 즉, 문서 전체를 날려버리는 반달이 있었다는 의미이다. 앞선 2부의 분석결과(2)에서도 나오듯이, 2000번째 전후의 버전은 문서가 급격히 변동하던 시점인 동시에 극초반에 가까운 시점이었다는 점을 기억하자. 이 ‘반달’행위에 붙은 기여자의 코멘트는 다음과 같다. “한남개지랄사건”. 

이 ‘용자’의 반달 이후, 3천자가 넘는 마이너스 수정 사례 중 문단을 날려먹는 (낮은)수준의 반들은 일어나지 않은 것으로 보인다. 이외의 마이너스 수정 사례들은 문단분리 또는 메타통합 등의 사례였다. 다만, 상기한 바와 같이 ‘극단적’인 사례는 분석에서 제외하였으므로, 이러한 시도가 있었고 금방 진압되었다, 정도로 넘어가도록 하자.



그렇다면 여기서 한 가지 궁금한 사항이 생길 수 있다; 기여자들에 의해 추가/삭제된 글에 따른 버전별 변화는 어떠한가? 만약 여기서 우리가 애초의 가설, 즉 ‘논쟁적인 사안에 있어서 회원들이 실제로 논쟁을 하고 합의를 통하여 객관적인 ...
김학준
김학준 님이 만드는
차별화된 콘텐츠, 지금 바로 만나보세요.
이미 회원이신가요? 로그인
보통 일베들의 시대 작가, 트위터 Paledot(@GheemHakjoon)
32
팔로워 728
팔로잉 413