원 출처 :
https://batflipsandnerds.com/2018/11/12/the-compassionate-umpire-or-the-cold-automated-zone/
번역 출처 :
http://mlbpark.donga.com/mp/b.php?p=1&b=mlbtown&id=201906090032095436 엠팍 diotima님
THE COMPASSIONATE UMPIRE OR THE COLD AUTOMATED ZONE
November 12, 2018 Russell Eassom Analytics, Baseball
저번에 팬그래프의 제프 설리반이 2018 시즌 후반기 최악의 볼(판정)과 스트라이크(판정)에 대한 글을 쓴 적이 있습니다. 이 판정들은 상당히 이상한 판정이기는 했지만, 결과적으로 게임에 큰 영향을 미치지는 않았습니다. 그러나 포스트시즌에는 게임에 매우 큰 영향을 끼친 매우 좋지 않은 스트라이크 콜이 있었습니다.
브레이브스와 다저스의 NLDS 세번째 게임의 2회초, 워커 뷸러는 코디 벨린저의 에러로 2아웃 주자 2, 3루의 위기 상황을 맞게 되었습니다. 다저스는 찰리 컬버슨을 고의사구로 내보내서 만루를 만들고, 투수 숀 뉴컴과 상대하기로 합니다. 그러나 뷸러는 투수를 상대로 스트레이트 볼넷을 내주며 밀어내기 1실점을 합니다. 그 다음 타자 아쿠냐를 상대로 다시 연속 3개의 볼을 던져 3-0 카운트에 몰립니다.
그 다음 다시 네번 째 볼(ball)이 들어왔습니다. 하지만 주심 게리 셰더스트롬은 이 공을 볼이 아닌 스트라이크로 선언했습니다. 덕분에 뷸러는 아쿠냐를 상대로 공을 하나 더 던지게 되었고, 이 공은 만루홈런이 되었습니다. 심판의 투수친화적인 스트라이크 콜 하나가 2-0을 5-0으로 만든 셈입니다.
다저스는 결국 이 경기를 패했고, 시리즈를 더 길게 끌고가야 했으며, 브루어스와는 7경기만에야 시리즈를 마무리했습니다. 그리고 월드시리즈에서는 레드 삭스에게 패하고 말았습니다. 사실 브레이브스는 다저스와의 NLDS 4경기 36이닝 중 3번째 경기 2회초에만 5득점을 했고, 나머지 35이닝 동안에는 3점 밖에 뽑지 못했습니다. 이를 고려할 때 아쿠냐의 만루홈런이 아니었더라면 다저스가 3경기 만에 시리즈를 끝냈을 가능성이 상당히 높습니다.
사실 이렇게 임팩트 있는 큰 실수가 아닌 작은 실수는 매 경기 더 자주 발생합니다. MLB 사무국과 심판협회(WUA)는 심판의 판정 실수를 최소화 하기를 요구하고 있으며, 이제는 투수가 던진 공의 속도와 궤도를 추적하는 시스템을 통해 심판의 콜 하나하나를 분석할 수 있습니다.
▶ 심판의 콜 정확도
MLB는 2006년 시즌 시작과 함께 PITCHf/x 시스템을 선보입니다. PITCHf/x는 투구 속도, 릴리스 포인트, 공이 플레이트를 통과한 위치, 타자가 때린 공이 그라운드에 떨어진 위치 등을 추적 기록합니다. 또한 타자에 따라 존 상단과 하단을 설정할 수 있도록 타자의 타격 자세도 추적합니다. 이 시스템은 2008년 이후 모든 경기장에 설치되었습니다. MLB와 WUA는 이 시스템을 통해 심판이 얼마나 정확한 콜을 했는지 평가할 수 있습니다. 이 시스템은 2017년 더 우수하고 정확한 시스템인 트랙맨으로 대체되었습니다.
PITCHf/x 정보는 2008년 부터 베이스볼 서번트 사이트의 스탯캐스트를 통해 공개됩니다. 따라서 심판의 모든 콜에 대해 공이 스트존을 통과한 여부와 그것이 스트라이크 콜과 일치한 여부를 집계할 수 있고, 각 심판의 정확성도 판단할 수 있습니다.
(*주: PITCH f/x와 Trackman이 제공하는 데이터는 공의 중심부에 대한 좌표를 제공하므로, 공의 끄트머리만 스트라이크존을 통과해도 된다는 규정에 따라 공의 직경 만큼 스트라이크 존 넓이가 넓어져야 합니다. 스트라이크 존의 상하 폭은 타자에 따라 다르게 설정되지만, 아래의 각 그래픽에서는 리그 평균값을 적용했습니다.)
2008 시즌 이후의 모든 경기에 대해 분석을 실시하면 위와 같은 결과를 얻을 수 있습니다. 2008년에는 정확한 콜의 비율이 86.6% 였는데, 2018년에는 91.6%까지 올라갔습니다. MLB와 WUA가 기대한 대로 심판의 콜 정확성이 계속 올라가고 있음을 알 수 있습니다. 하지만 볼과 스트라이크 각각에 대한 콜 정확성은 어떨까요.
전반적으로 심판은 스트라이크 보다 볼을 더 정확하게 판단합니다. 반대로 말하면 스트라이크 판단이 더 부정확합니다. 하지만 이 그래프에서 볼 수 있듯, 스트라이크 콜의 정확성은 10년 사이에 10%포인트 향상되었으며 이에 따라 스트라이크가 더 많이 불리게 되었습니다.
(* 역주: 여기서의 '콜 정확도(Correct Call %)'는 PITCH f/x(Trackman)에서 '볼 존을 통과했을 때 볼로 판정한 비율', '스트라이크 존을 통과했을 때 스트라이크로 판정한 비율'을 말합니다. 예를 들어 2008년에는 스트라이크존을 통과했는 데 스트라이크로 판정한 비율이 77%밖에 안 되었습니다. 이 비율은 2018에 87%까지 올라갔습니다. 즉 그 만큼 스트라이크를 더 많이 부르게 되었다는 뜻입니다.)
오랫동안 야구를 본 사람들은 카운트에 따라 존이 바뀐다고 말합니다. 즉 투수에게 유리한 카운트에서는 스트라이크 존이 줄어들고, 타자에게 유리한 카운트에서는 스트라이크 존이 늘어납니다. 정말 그런지 카운트에 따라 조사해봅시다.
위의 통설이 확인 됩니다. 투수 카운트(0-2에서 67%, 1-2에서 73%)에서의 스트라이크 콜 정확도가 가장 낮습니다(* 역주: 0-2 상황에서 스트라이크 존을 통과한 공 3개 중 1개는 볼로 선언된다는 뜻). 반대로 타자 카운트(2-0에서 88%, 3-0에서 82%)에서는 볼(ball) 콜 정확도가 낮아집니다. 이는 심판의 판정이 카운트의 영향을 받으며, 그 결과 스트라이크 존이 어떻게 달라지는 지 잘 보여줍니다.
▶ 바이어스 모델링
카운트에 따라 존의 크기, 모양이 달라지는 정도를 측정하기 위해 투수의 피치와 그에 따른 심판의 콜을 예측하는 모델을 만듭니다. (* 분석 프로그램과 관련 자료에 대한 언급은 생략 - 원문참조)
아래의 그림에서 영역 경계선 기준은 50% 입니다. 즉 이 경계선 바깥으로 가면 스트라이크 콜 비율이 50%이하로 낮아지고, 경계선 안으로 들어오면 스트라이크 콜 비율이 50% 이상으로 높아집니다. 그리고 좌(L), 우(R)는 타자 기준입니다.
이 분석 결과에서 볼 수 있듯, 0-2 카운트의 스트라이크 존은 0-0 카운트의 스트라이크 존보다 상당히 작습니다. 3-0 카운트의 스트라이크존은 더 크긴 하지만 큰 차이는 아닙니다. 2008과 2018 사이의 차이도 잘 드러납니다.
2008년에 비해 2018년의 콜이 스트라이크 존 규정에 더 가깝게 다듬어지고 있음을 알 수 있습니다. 좌우로는 좁아지고 아래위로는 길어졌습니다. 이 모델에 따르면 지난 NLDS에서 뷸러가 3-0 상황에서 던진 공이 스트라이크로 선언될 확률은 2.2% 였습니다.
0-0과 비교했을 때 3-0과 0-2의 차이는 확연합니다. 다른 카운트들에서는 어떨까요. 우타자 기준으로 12개 카운트에 대한 스트라이크존을 모두 표시하면 다음과 같습니다.
심판이 타자든 투수든 불리한 카운트에 있는 쪽에게 더 후한 콜을 해주고 있음을 알 수 있습니다.
또한 카운트별 기대 득점과 스트라이크존의 넓이 사이에도 상관관계가 관찰됩니다. (* 역주: 기대득점이 높은 상황에서 스트라이크 존이 넓어지고, 기대득점이 낮은 상황에서 스트라이크 존이 좁아짐)
▶ 콜 편향성의 다른 측면
다행스럽게도 홈 팀과 원정 팀 사이에서는 심판 콜의 편향성이 보이지 않았습니다. 다만 타자와 투수 각각 집단 속에서는 상대적으로 차이가 있었습니다. 2018시즌의 투수와 타자를 wOBA 기준으로 3등분하여 살펴봤습니다. 0-0, 0-2, 3-0에서 어떤 차이가 있는 지 보겠습니다. 아래의 그래프는 오른손타자에 대한 것입니다.
(* 이하의 분석은 리그 하위권 선수들이 중위권, 상위권 선수들에 비해 존 판정에서 손해보고 있다는 내용인데, 편의상(?) 생략합니다. 원문에도 언급되어 있지만 하위권 선수들의 카운트별 모집단 크기가 상대적으로 작아서 오차가 발생하는 듯 합니다.)
▶ 스트라이크존 기계 판정
지금까지 심판의 판정에 부정확함과 편향성이 있음을 확인했습니다. MLB가 스트라이크존 기계 판정을 도입하면 어떻게 될까요? 한시즌 동안 32,000건의 부정확한 콜을 보지 않아도 된다는 점을 제외하면 가장 큰 이점은 경기 진행 속도 향상일 것입니다. 2018년의 경우 부정확한 콜에 의해 일찍 종료된 타석은 2,605개였습니다. 반면 부정확한 콜에 의해 연장된 타석은 4,039개 였습니다. 둘 사이의 차이는 1,434타석입니다.
부정확한 콜에 의해 연장된 4,039 타석에서 투수들은 평균적으로 5개 이상의 공을 던졌습니다. 일찍 종료된 타석과 길어진 타석 의 차이인 차이인 1,434 타석만 놓고 보더라도 투수들은 7,000개가 넘는 공을 더 던졌습니다. 이는 2018년에 투수들이 던진 모든 공의 1%에 달합니다. 단순하게 생각하면 기계 판정만으로도 경기 시간을 1% 줄일 수 있다는 이야기가 됩니다.
사실 MLB 팀들도 내부적으로 같은 분석을 하고 같은 결론을 내렸을 것입니다. 심판들이 코너로 들어간 공에 대해서는 스트라이크를 잘 불러주지 않으며, 0-2 카운트에서는 스트라이크를 더더욱 잘 안 불러준다는 사실 말입니다. 기계 판정은 타자 보다는 투수에게 더 많은 영향을 미칠 것이며, 투수들은 더 공격적으로 피칭하게 될 것입니다.
아직 이야기하지 않은 부분이 있다면 포수의 프레이밍입니다. 스트라이크 존 기계 판정은 포수의 수비력 평가에 큰 영향을 미칠 것이고, '프레이밍 이라는 기술'은 무의미하게 될 것입니다. Baseball Prospectus의 2018년 포수 스탯에 따르면 상위권 포수들은 프레이밍 능력으로 벌어들인 점수가 전체 점수의 80% 이상을 차지합니다. 예를 들어 야스마니 그랜달은 2018년에 포수 수비로 16.3점을 벌었는데, 그 중 15.7점이 프레이밍으로 번 점수 입니다.
프레이밍으로 번 점수를 제외하고 다른 부분(블로킹, 송구) 만으로 평가했을 때 최고 점수는 터커 반하트의 3.3점입니다. 반하트는 프레이밍으로 가장 큰 손해를 보는 포수 중 하나입니다. 반하트는 프레이밍에서 -11.5점을 기록하며 전체 117명의 포수 중 밑에서 아홉번째입니다. 프레이밍 최악은 윌슨 콘트라레스이고 덕분에 전체 순위에서는 최하위에서 두번째 입니다.
만약 스트라이크존 기계 판정이 도입되면 포수의 수비력 비중이 크게 감소합니다. 그 편차는 현재의
[+16.3 : -15.7]에서
[+3.3 : -4.9]로 줄어들게 됩니다. 이렇게 되면 포수들은 수비력 보다는 공격력으로 평가되게 될 것입니다. 2018년 MLB 포수들은 평균 84점의 wRC+를 기록했습니다. 스트라이크존 기계 판정을 도입하면 수비형 포수들이 퇴출되고, 더 나아가 강타자들을 포수로 전환시키는 현상도 나타날 것입니다. 이는 타선 전체의 생산력을 향상시키게 됩니다.
▶ 파이널 코멘트
스트라이크존 기계 판정을 도입하면 일차적으로는 투수들의 투구수가 줄어들고 안타와 득점이 늘어날 것입니다. 나는 메이저리그가 이런 방향으로 가야한다고 생각합니다. 하지만 MLB 선수노조에서는 기계 판정이 포수의 입지에 악영향을 미친다는 이유로 부정적 의견을 표시하고 있습니다. 선수노조에서는 스트라이크존 기계 판정도입에 대한 댓가로 사무국으로부터 일정한 양보를 얻어내려 할 것입니다.
(* 역주: 안타와 득점이 늘어날 것이라는 부분은 기계판정 자체가 타자에게 더 유리하다기보다는 포수 포지션이 공격력 위주로 재편됨으로서 전체적인 득점력이 늘어날 것이라는 추측 같습니다)
며칠전에 엠팍에서 괜찮은 칼럼을 봐서 퍼와봅니다. 확실히 스트라이크존에 대한 기계 판정이 도입된다면, 단순히 판정의 정확도가 증가하는 것을 떠나서 몇몇 패러다임 자체가 변화할 가능성이 커 보이네요.