현재 스탯티즈의 기록을 정리하는 작업을 진행하고 있습니다.

방향에 따라 각종 설계를 해야되고, 이후 그것을 바꾸는 작업은 더 큰 작업이 될 수 있기에 미리 의견들을 수렴해보고자 합니다.

FreeRedbird, 홈런강탈님 블로그와 sayuksin, nineguys 님이 기존에 남긴 의견들을 많이 참고 했습니다.


첫째, wOBA/FIP 중심의 기록 정리


지금의 기록실에는 많은 기록들이 포함되어 있으나 그 중에는 실질적으로 의미가 중첩되는 경우가 많습니다. 

같은 의미라면 굳이 나열할 필요 없다고 판단되며, 확실한 방향을 가지고 기록을 정리하고자 합니다.

그 중심으로 타자는 wOBA, 투수는 FIP가 될 것입니다. 이를 기반으로 득점 기여/방어를 나타낼 생각입니다.

RC, RC/27, RCAA, XR, BR, MLV, PMLV, VORP, OPS+ 등은 없애고

wOBA 기반의 wRC, wRC+, RAA 등으로 대체할 생각입니다.

계산 과정만 다를 뿐 충분히 기존 의미를 대체할 수 있다고 판단이 되기 때문입니다.

또한 지나치게 복잡한 과정을 거치는 EqA 등도 없앨 생각입니다.

이 역시 wOBA가 충분히 그 의미를 대체할 수 있기 때문입니다.

투수 부분도 FIP를 중심으로 Run Saved를 표시하려고 합니다.

FIP에 현재 3.20으로 고정 상수를 사용하고 있는데 연도별로 조정하는 작업을 거치려고 합니다.


둘째, WS -> WAR


선수의 승리 기여 정도를 파악하기 위해 윈 쉐어를 사용하고 있는데, 과정이 복잡할 뿐더러 직관적이지 않고

그 과정에 비해 정확도 역시 의문입니다. 팬 그래프 등에서 사용하는 WAR 방식으로 하려고 합니다.

타격 / 수비 / 투구로 나누어서 보면 다음과 같은 요소들을 넣으려고 합니다.


[ 타격 : 5개의 합]

1) RAA : wOBA 기반

2) 주루 기여 : 추가 진루 비율 등을 리그 평균과 비교해 득점 기여 추정

 - 예 : 김주찬의 경우 161번의 기회에 77추가 진루, 리그 평균 32.3%에 대입하면 52추가 진루 // 리그 평균보다 25추가 진루

 - 추가 진루의 가치 * 리그 평균 대비 추가 진루로 주루 기여 계산

 - 추가 진루를 내야 땅볼, 외야 플라이, 안타 등으로 세분화하여 계산하는 것도 고려 중

3) 도루기여 : 도루는 타격에 비해 어느 상황에서 뛰었는지가 더 중요하다고 보기에 Run Expectancy 기반으로 측정

 - 예1 : 1사 2루 도루 성공시 0.152(0.573 -> 0.725)점 기여, 실패시 -0.456(0.573->0.117)점 기여

 - 예2 : 2사 2루 도루 성공시 0.093(0.251->0.344)점 기여, 실패시 -0.251(0.251->0)점 기여

 - 이중도루시 2루 주자는 (1,2루에서 1,3루까지의 REa), 1루 주자는 (1,3루에서 2,3루 까지의 REa)

4) 팀 배팅 기여 : 주루 기여와 비슷한 방식으로 계산

5) Replacement : 팬그래프와 마찬가지로 600타수 당 20점 정도로 계산


 * Play by Play 데이터가 없는 경우

 - ROE, 주루 기여, 도루 기여, 팀 배팅 기여를 파악할 수 없음

 - ROE, 주루 기여, 도루 기여 등은 Speed Score를 이용하여 2007년 이후 데이터를 참고하여 관련성을 파악하여 추정하는 방법 고려

 - 팀 배팅 기여는 0으로 설정


[ 수비 ]

수비는 UZR, +/- 등을 고려할 수 없는 관계로 Fielding Run 기반으로 FRAA, FRAR 등을 계산

 * Play by Play가 없는 경우 FRAA를 0으로 놓고 주포지션과 타석을 고려하여 FRAR를 추정


[ 투구 ]

FIP를 바탕으로 하여 RAR -> WAR 계산

구원 투수의 경우 Effective LI = (1 + gmLI) / 2로 조정

 * Play by Play가 없는 경우 Effective LI를 구원승/세이브/홀드 등을 바탕으로 추정


WAR = (타격+수비+투구) / (승리당 득점)


승리당 득점은 10으로 고정하지 않고 (리그 평균 득점+2)*1.5로 설정


셋째, 파크 팩터 대폭 수정


파크 팩터는 홈런강탈님께서 남겨준 글을 반영하여 BRF->IPF/APF 과정을 거칠 예정입니다.

안타, 2루타, 3루타, 홈런, 실책 등은 BIP를 바탕으로,

4사구는 TBF, 득점은 (타수-안타)를 바탕으로 구할 예정입니다.


BRF는 

(홈에서 홈런+상대홈런)/(홈에서 BIP+상대BIP)

------------------------------------------

(원정에서 홈런+상대홈런)/(원정에서 BIP+상대BIP)

가 기본이 되나 연감에서(프로야구 연감에는 원년에서 87년부터(90년 제외) 구장별 성적이 나타나 있습니다.)

투수 부분의 경우 2루타, 3루타가 없기 때문에 피2루타, 피3루타를 파악할 수 없기에

2루타/3루타의 BRF는 

(홈에서 2루타)/(홈에서 BIP)

-------------------------

(원정에서 2루타)/(원정에서 BIP)

같이 피2루타/피3루타가 제외된 채로 계산을 할 생각입니다.

특정 연도의 파크 팩터는 5년 정도를 포함하고,

파크 팩터를 구할 수 없는 86년 이전/90년의 경우 비슷한 구장으로 추정할지, 중립으로 놓을지 고민 중입니다.


이 파크팩터는 조정 wOBA와 조정 FIP를 구할 때 사용될 것입니다. 때문에 RAR/WAR도 자연스럽게 반영되겠지요.

기본적으로 타석과 이닝은 변하지 않는 다고 가정하고 각 요소들에 파크팩터를 대입해서 구할 생각입니다.

다만 Play by Play가 없는 경우 실책출루와 볼넷의 경우 연감의 제약으로 인해 전체 실책과 4사구 팩터를 그대로 쓰면 어떨까 생각하고 있습니다.


==========================================================//


이상이 기록 변경 방향입니다. 모든 걸 다 반영되지 못할 수도 있지만, 의견을 주시면 참고하도록 하겠습니다.

감사합니다.