카타르 월드컵은 xG의 무덤이 됐나?
2022/12/17
야구는 ‘통계학자들의 천국’이다. 축구는 오랫동안 통계의 불모지였다. 긴 축구의 역사에서 비교적 최근에야 씨가 뿌려지고 있다.
이번 카타르월드컵에서는 ‘기대득점(xG)’이라는 통계가 한국 뉴스 소비자들에게 전달됐다. 선수와 팀의 플레이에서 몇 골을 기대할 수 있는지를 보여주는 수치다. 11월 20일 대회 개막 이후 포털사이트 네이버에서 이 키워드로 검색되는 기사는 75건이다. 아주 많지는 않지만 SBS, 연합뉴스, 중앙일보, 한겨레신문 등 주요 매체와 일간스포츠, OSEN와 같은 스포츠전문 매체에서 다뤘다. 2018년 러시아 대회 때는 단 8건이었고, 그중 7건은 골닷컴의 김현민 기자 혼자 작성하거나 번역한 기사였다.
하지만 기대득점은 데뷔와 동시에 추락한 유망주 신세가 됐다.
미국스포츠전문 채널 ESPN은 12월 16일 4강전까지 62경기가 치러진 이번 대회 기대득점 통계의 유용성에 대한 분석을 했다. 스포츠통계회사 스태츠퍼폼의 데이터를 바탕으로 이번 대회 기대득실점 차이(기대득점-기대실점)와 승점 사이 상관관계를 분석했다. 축구는 상대보다 한 골이라도 더 많은 골을 넣어야 이기는 경기다. 기대득실점 통계가 유용하다면(=실제 득점과 실점을 잘 설명하고 있다면) 이 차이가 큰 팀은 더 많은 승점을 얻을 것이다. 하지만 결과는 그렇지 않았다.
62경기에서 기대득실점 차이와 승점 상관계수는 0.464에 불과했다. 평범한 수준에 살짝 못 미치는 상관관계다. 이번 대회에서 기대득실점 차이는 승점 획득을 21.5%(0.464의 제곱)만큼 설명한다고도 표현할 수 있다. 즉, 별 의미가 없었다.
기대득점(xG)이란?
기대득점은 슈팅기회가 골로 이어지는 확률을 계산하는 데서 시작한다. 확률 계산에는 슈팅을 시도한 위치와 골문과의 거리, 각도, 수비수 숫자, 골키퍼 위치, 어시스트 ...
한국야구학회 이사. 주간지 <스포츠2.0>과 스포츠신문 <굿데이>, <일간스포츠> 등에서 주로 야구, 잠깐 정치 취재를 했다.
턴 게임인 야구, 실시간 시뮬레이션인 축구. 아무래도 데이터는 전자가 쉽게 쌓일 수 있을 것 같은데요. 야구가 괜히 데이터의 스포츠가 아니겠죠.
이제 축구 수준의 실시간 게임의 데이터를 쌓고, 관리할 수 있는 상황이 원활하게 만들어져서 점점 유의미한 데이터를 보면서 변화를 관찰할 수 있게 된 것도 나름 재미 요소가 되어가는 것 같습니다. 예전 같았으면 그냥 비디오 분석만 하고 말았을텐데, 이제는 선수들 몸에 센서를 붙여서 녹화하고 데이터를 별도로 쌓아가는 지경에 이르렀으니 말이죠.
아무리 난다긴다해도 기량은 결국 평균에 수렴하기 마련이고, 그 수렴하는 평균값을 추정해서 다음 번 경기를 예측하면서, 또 그 예측이 맞거나 혹은 틀렸을 때의 재미 또한 무시 못하는 것 같고요. 이게 스포츠와 데이터가 만났을 때 누리는 재미가 아니겠나 싶습니다.
좋은 글, 늘 감사합니다.
스포츠에서 확률이란 것이 사실 일상의 그것 같다는 생각이 많네요. 지표의 평균, 분석은 다 일리가 있는데 나만 비껴가는 평균 소외감이 드니까요. 평균 수렴도 모수가 무한대에 수렴해야 진리가 되는 것인데, 한번의 트랜젝션을 끼워 맞추는 것은 굿거리 기복과 다르지 않다는 느낌?
그럼에도 스포츠의 통계지표가 주는 의미는 늘 흥미롭습니다.
단 일부 방송 해설에서 혼동, 왜곡하는 경우가 거슬리지만.
오늘도 재미있게 보고 갑니다.
스포츠에서 확률이란 것이 사실 일상의 그것 같다는 생각이 많네요. 지표의 평균, 분석은 다 일리가 있는데 나만 비껴가는 평균 소외감이 드니까요. 평균 수렴도 모수가 무한대에 수렴해야 진리가 되는 것인데, 한번의 트랜젝션을 끼워 맞추는 것은 굿거리 기복과 다르지 않다는 느낌?
그럼에도 스포츠의 통계지표가 주는 의미는 늘 흥미롭습니다.
단 일부 방송 해설에서 혼동, 왜곡하는 경우가 거슬리지만.
오늘도 재미있게 보고 갑니다.
턴 게임인 야구, 실시간 시뮬레이션인 축구. 아무래도 데이터는 전자가 쉽게 쌓일 수 있을 것 같은데요. 야구가 괜히 데이터의 스포츠가 아니겠죠.
이제 축구 수준의 실시간 게임의 데이터를 쌓고, 관리할 수 있는 상황이 원활하게 만들어져서 점점 유의미한 데이터를 보면서 변화를 관찰할 수 있게 된 것도 나름 재미 요소가 되어가는 것 같습니다. 예전 같았으면 그냥 비디오 분석만 하고 말았을텐데, 이제는 선수들 몸에 센서를 붙여서 녹화하고 데이터를 별도로 쌓아가는 지경에 이르렀으니 말이죠.
아무리 난다긴다해도 기량은 결국 평균에 수렴하기 마련이고, 그 수렴하는 평균값을 추정해서 다음 번 경기를 예측하면서, 또 그 예측이 맞거나 혹은 틀렸을 때의 재미 또한 무시 못하는 것 같고요. 이게 스포츠와 데이터가 만났을 때 누리는 재미가 아니겠나 싶습니다.
좋은 글, 늘 감사합니다.