器用貧乏暇なし

器用貧乏暇なし

雑記のつもりでしたが,スポーツに傾倒しています.

セイバーメトリクス OPSの欠陥とは? ~新指標の提案~

 

こんにちは,しこしこ亭うどん(@shikoshikotei)です.

 

今回は野球に関するネタです.

 

f:id:shikoshikoteiudon:20190217225821j:plain

 

  

 

OPSは今や一般的

OPSとは?

今回は打者の指標であるOPSについて書いていく.

まずOPSとは On-base plus slugging の略で出塁率長打率を単純に足したものだ.

OPS=出塁率長打率

https://ja.wikipedia.org/wiki/OPS_(%E9%87%8E%E7%90%83)

ちなみに

出塁率=(安打+四球+死球)/(打数+四球+死球犠飛

長打率= 塁打 / 打数

このOPSだが最近はとても身近に感じるようになり,打率などとともに目にする機会が増えてきたように感じる.

 

 

OPSは有用

なぜこのOPSが普及?しているのかという理由だが,僕が考える理由としてはまずこのシンプルな計算式だ.計算が容易で感覚的にも分かりやすい.

そして,もう一つ考えられる理由は,得点との相関の高さだ.

つまり,OPSが高い選手ほど得点に結びつきやすいということになる.これは点を取り合う野球というスポーツおいてとても重要なデータになることが分かるかと思う.

つまりOPSはシンプルかつ有用なデータだということ.

 

 

OPSの欠点

しかしOPSにはある欠点がある.それは走塁が考慮されていないということだ.簡単に言うと,盗塁による進塁と盗塁失敗による憤死がOPSに反映されないということだ.

たとえばシングルヒットや四死球で出塁したとして,その後二塁へ盗塁が成功すれば実質的には二塁打を打ったのと同じでは?

同様に,シングルヒットや四死球で出塁後,二盗失敗した場合,これは出塁を無駄にしてしまった,もっと言えば出塁していないのと同じに値するのでは?

 

 

指標を考えてみよう~OPSCSの提案~

盗塁を考慮する

このようにOPSには盗塁の要素が反映されていないため,OPSに盗塁を反映させた指標を提案したいと思う.

これを仮にOPSCS(OPS Considering Stolen base)とする.

このOPSCSの計算式だが以下のようになる.

OPSCS=出塁率CS+長打率CS

 

出塁率CS=(安打+四球+死球ー盗塁失敗数)/(打数+四球+死球犠飛

長打率CS= (塁打+盗塁成功数ー盗塁失敗数) / 打数

 

OPS=出塁率長打率

出塁率=(安打+四球+死球)/(打数+四球+死球犠飛

長打率= 塁打 / 打数

 

 

 計算式の意味

まず,

出塁率CS=(安打+四球+死球ー盗塁失敗数)/(打数+四球+死球犠飛

盗塁失敗は出塁を無効にすると考えるため分子の出塁要素の合計から盗塁失敗数を引く.

 

続いて,

長打率CS= (塁打+盗塁成功数ー盗塁失敗数) / 打数 

+盗塁成功数により1盗塁につき1塁打を加える.これにより盗塁の効果(盗塁すれば実質二塁打)を考慮することができる.

ー盗塁失敗数により1盗塁失敗につき1出塁を引く.これにより盗塁失敗の損失(盗塁失敗は安打や四死球による出塁を無駄にする)を考慮することができる.

※ここで,1盗塁失敗につき1出塁を引くんだったら,二塁打→三盗失敗の場合塁打の損失は2だから合わないじゃないか!という指摘があるかもしれないが盗塁の大部分は二盗であるためこのずれはほぼ影響しないと考えた.

 

 

 OPSCSは有用か?

以上を踏まえて,NPBの5年分(2014~2018年)のチームごとのデータを使いOPSとOPSCSを計算し,それぞれ得点との相関を見ていく.

同時にOPSの派生であるNOIとGPAに関してもNOICSとGPACSを算出し,得点との相関を見ようと思う.

NOIとGPAについて

  NOI=(出塁率長打率÷3)×1000

  NOI出塁率を3倍重視したもの

https://ja.wikipedia.org/wiki/NOI_(%E9%87%8E%E7%90%83)

   GPA = (出塁率×1.8+長打率)/4

  GPAは出塁率を1.8倍重視したもの

https://ja.wikipedia.org/wiki/GPA_(%E9%87%8E%E7%90%83)

 以下は各指標(OPS,OPSCS,NOI,NOICS,GPA,GPACS)と得点との相関係数をまとめた表である.

相関係数は1に近いほど「強い正の相関がある」と評価される.

  2018 2017 2016 2015 2014 集計
得点ー指標 平均 ± 標準偏差
得点ーOPS 0.928 0.976 0.983 0.973 0.963 0.936 0.835 0.952 0.969 0.952 0.947 ± 0.043
得点ーOPSCS 0.934 0.976 0.983 0.994 0.962 0.942 0.898 0.974 0.955 0.974 0.959 ± 0.028
得点ーNOI 0.977 0.962 0.976 0.963 0.965 0.955 0.892 0.964 0.973 0.964 0.959 ± 0.024
得点ーNOICS 0.957 0.953 0.974 0.980 0.952 0.969 0.933 0.986 0.997 0.986 0.969 ± 0.020
得点ーGPA 0.978 0.978 0.984 0.968 0.970 0.947 0.887 0.960 0.979 0.960 0.961 ± 0.028
得点ーGPACS 0.970 0.967 0.983 0.989 0.962 0.958 0.943 0.981 0.990 0.981 0.972 ± 0.015

※既存の指標とCSで相関係数の高いほうを赤字にしている. 

 

5年間すべてに当てはまるわけではないが各シーズン,各リーグを見ていくとCS(盗塁を考慮)のほうが相関係数が高いケースが多いという結果になった.特にOPSではCSのほうが高いケースが多く見られた.

また,指標ごとの相関係数の平均を見ると,OPSNOI,GPAすべてでCSのほうが高いという結果になった.また標準偏差も小さく,バラつきが少ないと言えるのではないか.

 

 

結局OPSCSは使える?

以上の結果を踏まえて,OPSCSの評価をすると,多少贔屓目にはなるが使える指標だと言えるのではないだろうか.もちろんOPSという素晴らしい指標がある上に成り立つものだが.

しかし,今回改めて驚いたのはOPSと得点の相関の強さだ.これだけ信頼できる指標であれば普及していったのも納得だ.

 

 

総括

 ということで盗塁を考慮した指標OPSCSというものを提案,評価してみた訳だが,有識者の皆様いかがでしたか?

プロ野球では試合数も多く同リーグ内で何度も同じ相手と対戦するためデータの重要度が高いと思う.

今回紹介したもの以外にも攻守両方に様々な指標があるのでぜひ数字に注目してプロ野球を見てみて欲しい.

 

【お知らせ】Twitterのアカウントを作成しました.是非フォローお願いします.

 

以上です!最後まで読んでいただきありがとうございました。