2014.6.24

잠실

삼성

7 - 6

롯데

(승) 이호성 (패) 정수근 (세) 임창용 (홈런) 김바위

잠실

삼성

7 - 6

롯데

(승) 이호성 (패) 정수근 (세) 임창용 (홈런) 김바위

잠실

삼성

7 - 6

롯데

(승) 이호성 (패) 정수근 (세) 임창용 (홈런) 김바위

잠실

삼성

7 - 6

롯데

(승) 이호성 (패) 정수근 (세) 임창용 (홈런) 김바위

STAT BUZZ
 타자 스탯

RC: 누가 더 많은 승리를 가져다 주는 타자인가?

2015-02-03 화, 17:46 By KBReport

[Baseball Stats Glossary 1] 
RC: Runs Created 누가 더 많은 승리를 가져다 주는 타자인가?

  RC:Runs Created 는 1985년 빌 제임스의 책  The Bill James Historical Baseball Abstract
에 소개되었습니다. 빌 제임스를 포함한 많은 세이버메트리션이 그 즈음에 가장 열정적으로 몰입했던 주제는 타자의 득점기여도를 객관적으로 측정하는 것입니다. 빌 제임스는 이렇게 말합니다.  

  
(The Bill James Historical Baseball Abstract, 1985)

" With regard to an offensive player, the first key question is how many runs have resulted from what he has done with the bat and on the basepaths. Willie McCovey hit .270 in his career, with 353 doubles, 46 triples, 521 home runs and 1,345 walks -- but his job was not to hit doubles, nor to hit singles, nor to hit triples, nor to draw walks or even hit home runs, but rather to put runs on the scoreboard. How many runs resulted from all of these things?" 

“그런데 그(윌리 맥코비)가 해야 하는 일은  2루타를 치는 것도 1루타를 치는 것도 3루타를 치는 것도 또는 볼넷을 고르거나 홈런을 치는 것도 아니다.스코어보드에 점수를 올려놓는 일이다. 그렇다면 그는 이런저런 플레이를 통해 대관절 몇 점을 만들어 낸건가?”
- The Bill James Historical Baseball Abstract 1985

야구에서 가장 유명한 타격지표는 [타율]입니다. 그런데 야구란 경기는 안타를 많이 자주 치는 것으로 이기는 경기가 아닙니다. 당연히 득점을 해야 합니다. 그런데 [타율]이 높은 선수는 [타율]이 낮은 선수보다 더 많은 득점을 만드는게 확실한가요? 아닐 수도 있습니다. 좀더 정확하게 말한다면 그런지 아닌지 측정해봐야 합니다. 어떻게?

RC:RunsCreated 라는 지표는 그래서 디자인됩니다. 이 지표는 안타,볼넷, 홈런 등등의 스탯을 이용해서 타자가 몇 점을 만들어낸 것인지 계산할 수 있게 해줍니다. 물론 야구라는 경기는 상황에 따라 안타 하나가 점수가 될수도 있고 아닐 수도 있습니다. 하지만 한시즌 전체 수많은 타석에서 그것이 반복될 경우 통계적으로 그것을 중립적 조건에 해당하는 가치로 조정할 수 있습니다.  

지표의 기본컨셉은 다음과 같습니다.  

                             

위 수식을 말로 바꾸면, “득점이란 [출루]와 [진루]로 만들어진다. [출루]와 [진루]를 [기회]로 나누면 그 선수의 득점생산력을 측정할 수 있다” 입니다. 

RC의 계산방법에는 몇가지 버전이 있습니다. 어떤 것은 시간이 지나고 나서 계산방법이 개선되어 업데이트된 것이지만 또 다른 이유는 처음 RC가 발표되었을 때 일반팬들이 자세하고 세밀한 야구기록을 구할 수 없었기 때문입니다. 빌 제임스는 그래서 비교적 구하기 쉬운 간단한 기록만으로 RC를 계산할 수 있는 간단한 계산모델 Basic Runs Created와 좀더 세부적인 기록이 필요하긴 하지만 대신 좀더 정확한 RC를 구할 수 있는 계산모델 Technical Runs Created을 함께 고안합니다.  

지금도 비슷한 상황은 있습니다. 불과 4-5년쯤 전에 대한민국 넘버2 포탈사이트에서 제공되는 타격기록 페이지에 [타석]수가 표시되어 않았습니다. 지금도 볼넷의 숫자와 몸맞공의 숫자를 구분해서 표시하지 않는 기록사이트가 있으며 희생번트, 희생플라이의 갯수를 표시하지 않는 기록페이지는 더 많습니다. 

물론 2015년 한국에서는 손가락을 약간 놀려 다른 기록페이지를 찾아가면 그만이지만 1985년이라면 그곳이 미국이라 해도 집에서 구독하는 지역신문이나 가까운 서점에서 구할 수 있는 야구잡지가 기록을 구할 수 있는 유일한 채널이었을 것이고 빌제임스는 그 시대의 사람입니다.물론 그 시대를 스스로 바꾸어놓은 사람이기도 하죠. 

RC_2002 이전에는 2루타,3루타,홈런을 따로 구분하여 가중치를 적용하지 않고 [루타수TB]를 사용하고 있는 것이 눈길을 끕니다. RC가 발표된 1985년은 물론 짐퍼타도가 XR을 발표한 1999년이나 톰 탱고가 wOBA를 발표한 2006년보다 휠씬 앞선 시기이기는 하지만 동시대의 또다른 대표 세이버메트리션 피트 파머가 [the Hidden Game of Baseball]을 출간한 것이 1985년이고 여기에는 타격이벤트별 가중치에 대한 분석이 포함되어 있었습니다.

RC에 개별 타격이벤트별 가중치(1루타,2루타,3루타,홈런,볼넷 등등이 각각 중립적인 조건에서 몇점에 해당하는 가치를 가지느냐에 대한 가중치)가 적용된 것은 2002년 부터입니다. 그리고 현재 사용되는 RC는 대체로 2002버전의 계산식을 사용합니다. 다만 곱하고 빼고 더하고 나누는 다소 복잡해보이는 산식의 구조는 여전히 빌제임스의 스타일입니다.  

이제는 많이 알려진 사실이지만, 세이버메트릭스의 아버지라 부르기에도 모자라, “교조” 정도로 불려야 마땅한 빌제임스는 미국의 시골 통조림회사의 창고경비원이었고 그가 고안하고 정착시킨 대부분의 통계적 지표는 연필과 종이 위에서 태어났습니다.     

빌제임스의 [요강, 1977 baseball abstract]와 함께 제2 경전 쯤 되는 [the Hidden Game of Baseball]의 저자 피트 파머Pete Palmer 는 군사용 레이더를 만다는 라에온 (Raytheon Corporation)이라는 회사의 엔지니어였습니다. 그는 당시로써는 아주 희소하게 고성능 컴퓨터를 사용할 수 있는 능력과 기회를 가지고 있었고 빌 제임스와는 약간 다르게 정교하고 방대한 시뮬레이션을 통해 야구에 대한 새로운 시각과 지식을 만들어냈습니다. (둘 다 회사에서 하라는 일은 안하고 딴짓 한건 비슷하지만.)  

엔지니어 출신인 피트 파머가 엄격한 통계적 방법과 정교한 시뮬레이션 프로그램을 이용한 것과 비교해서 빌제임스의 업적은 탁월한 통찰과 혁신적 아이디어에 기반한 것들입니다. 물론 그 역시 굉장한 수학적 통계적 능력을 가지고 있긴 했지만 그건 기술적 탁월성이라기 보다는 열정과 집요함에 가까워보입니다. 특히 그는 탁월한 필력을 가진 작가입니다. 고전이라 불릴법한 그의 저술들을 보면 어느 하나 명문이 아닌 것이 없습니다.그는 늘 스스로 통계분석가라 불리는 것을 불편하게 여겼습니다. 그는 그의 작업 -이라고 해봐야 페이지의 95%는 숫자와 표로 이루어진- 을 분석 'analysis'이 아니라 'writing' 이라 말했습니다. 그에게 통계와 숫자란 그가 논하고자 하는 야구를 표현하는 가장 아름다운 “문체style” 였을 뿐입니다.        

그가 오랫동안 그리고 여전히, 세이버메트릭스의 압도적인 구심점으로 남아있는 것은, 교조로서의 역사적 상징성 때문도 있겠지만 이후 SABR:Society of Amerian Baseball Research를 이끌고 또 기록지프로젝트 Project ScoreSheet 를 조직하며 보여준 탁월한 조직가, 운동가로서의 면모 때문이기도 합니다. 

그는 상상도 못할 열정으로 놀라운 아이디어를 실현시킨 위대한 혁신가였지만 동시에 그것을 스스로 대중화시키고 확산시킨 탁월한 저술가이며 활동가였습니다.  

TalkBack to 토아일당_야구이야기 


appendix - KBO14  RC Top30 (300타석+ 71명 대상)

다음은 KBO 2014 시즌 300타석 이상의 타자 71명 중  RC Top30 에 해당되는 선수들입니다.당연한 결과이지만 이 순위는 타율 순위와는 좀 차이가 있습니다. OPS가 높은 타자들이 대체로 RC가 놓긴 하지만 누적스탯에 가까운 RC는 비율스탯인 OPS와 달리 타석수가 많은 타자들이 좀더 높은 수치를 기록합니다. OPS 1.119의 박병호가 OPS 1.198인 강정호보다 RC에서 더 높은 순위를 기록한 이유입니다.

흥미로운 것은 단순히 (출루수*루타수) 로 계산하는 RC_basic 계산식의 놀라운 정확성입니다. 휠씬 복잡한 수식으로 계산하는 RC_2002와 비교했을 때 Top30 기준 오차는 평균 4% 에 불과합니다. [출루]와 [루타]를 곱해서 구하는 RC_basic의 계산방법과 [출루율]과 [장타율=루타율]을 더해서 구하는 OPS와 비교해보는 것도 재미있습니다. 득점의 본질을 따진다면, 원리에 좀더 가까운 것은 RC의 계산식이긴 합니다.  

(2014년 300타석 RC Top30/300타석 이상, 기록 출처:www.kbreport.com)

 by 토아일당