セイバーメトリクス OPSの欠陥とは? ~新指標の提案~
こんにちは,しこしこ亭うどん(@shikoshikotei)です.
今回は野球に関するネタです.
OPSは今や一般的
OPSとは?
今回は打者の指標であるOPSについて書いていく.
まずOPSとは On-base plus slugging の略で出塁率と長打率を単純に足したものだ.
https://ja.wikipedia.org/wiki/OPS_(%E9%87%8E%E7%90%83)
ちなみに
長打率= 塁打 / 打数
このOPSだが最近はとても身近に感じるようになり,打率などとともに目にする機会が増えてきたように感じる.
OPSは有用
なぜこのOPSが普及?しているのかという理由だが,僕が考える理由としてはまずこのシンプルな計算式だ.計算が容易で感覚的にも分かりやすい.
そして,もう一つ考えられる理由は,得点との相関の高さだ.
つまり,OPSが高い選手ほど得点に結びつきやすいということになる.これは点を取り合う野球というスポーツおいてとても重要なデータになることが分かるかと思う.
つまりOPSはシンプルかつ有用なデータだということ.
OPSの欠点
しかしOPSにはある欠点がある.それは走塁が考慮されていないということだ.簡単に言うと,盗塁による進塁と盗塁失敗による憤死がOPSに反映されないということだ.
たとえばシングルヒットや四死球で出塁したとして,その後二塁へ盗塁が成功すれば実質的には二塁打を打ったのと同じでは?
同様に,シングルヒットや四死球で出塁後,二盗失敗した場合,これは出塁を無駄にしてしまった,もっと言えば出塁していないのと同じに値するのでは?
指標を考えてみよう~OPSCSの提案~
盗塁を考慮する
このようにOPSには盗塁の要素が反映されていないため,OPSに盗塁を反映させた指標を提案したいと思う.
これを仮にOPSCS(OPS Considering Stolen base)とする.
このOPSCSの計算式だが以下のようになる.
出塁率CS=(安打+四球+死球ー盗塁失敗数)/(打数+四球+死球+犠飛)
長打率CS= (塁打+盗塁成功数ー盗塁失敗数) / 打数
長打率= 塁打 / 打数
計算式の意味
まず,
出塁率CS=(安打+四球+死球ー盗塁失敗数)/(打数+四球+死球+犠飛)
盗塁失敗は出塁を無効にすると考えるため分子の出塁要素の合計から盗塁失敗数を引く.
続いて,
長打率CS= (塁打+盗塁成功数ー盗塁失敗数) / 打数
+盗塁成功数により1盗塁につき1塁打を加える.これにより盗塁の効果(盗塁すれば実質二塁打)を考慮することができる.
ー盗塁失敗数により1盗塁失敗につき1出塁を引く.これにより盗塁失敗の損失(盗塁失敗は安打や四死球による出塁を無駄にする)を考慮することができる.
※ここで,1盗塁失敗につき1出塁を引くんだったら,二塁打→三盗失敗の場合塁打の損失は2だから合わないじゃないか!という指摘があるかもしれないが盗塁の大部分は二盗であるためこのずれはほぼ影響しないと考えた.
OPSCSは有用か?
以上を踏まえて,NPBの5年分(2014~2018年)のチームごとのデータを使いOPSとOPSCSを計算し,それぞれ得点との相関を見ていく.
同時にOPSの派生であるNOIとGPAに関してもNOICSとGPACSを算出し,得点との相関を見ようと思う.
※NOIとGPAについて
https://ja.wikipedia.org/wiki/NOI_(%E9%87%8E%E7%90%83)
GPAは出塁率を1.8倍重視したもの
https://ja.wikipedia.org/wiki/GPA_(%E9%87%8E%E7%90%83)
以下は各指標(OPS,OPSCS,NOI,NOICS,GPA,GPACS)と得点との相関係数をまとめた表である.
相関係数は1に近いほど「強い正の相関がある」と評価される.
2018 | 2017 | 2016 | 2015 | 2014 | 集計 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
得点ー指標 | セ | パ | セ | パ | セ | パ | セ | パ | セ | パ | 平均 | ± | 標準偏差 | |
得点ーOPS | 0.928 | 0.976 | 0.983 | 0.973 | 0.963 | 0.936 | 0.835 | 0.952 | 0.969 | 0.952 | 0.947 | ± | 0.043 | |
得点ーOPSCS | 0.934 | 0.976 | 0.983 | 0.994 | 0.962 | 0.942 | 0.898 | 0.974 | 0.955 | 0.974 | 0.959 | ± | 0.028 | |
得点ーNOI | 0.977 | 0.962 | 0.976 | 0.963 | 0.965 | 0.955 | 0.892 | 0.964 | 0.973 | 0.964 | 0.959 | ± | 0.024 | |
得点ーNOICS | 0.957 | 0.953 | 0.974 | 0.980 | 0.952 | 0.969 | 0.933 | 0.986 | 0.997 | 0.986 | 0.969 | ± | 0.020 | |
得点ーGPA | 0.978 | 0.978 | 0.984 | 0.968 | 0.970 | 0.947 | 0.887 | 0.960 | 0.979 | 0.960 | 0.961 | ± | 0.028 | |
得点ーGPACS | 0.970 | 0.967 | 0.983 | 0.989 | 0.962 | 0.958 | 0.943 | 0.981 | 0.990 | 0.981 | 0.972 | ± | 0.015 |
※既存の指標とCSで相関係数の高いほうを赤字にしている.
5年間すべてに当てはまるわけではないが各シーズン,各リーグを見ていくとCS(盗塁を考慮)のほうが相関係数が高いケースが多いという結果になった.特にOPSではCSのほうが高いケースが多く見られた.
また,指標ごとの相関係数の平均を見ると,OPS,NOI,GPAすべてでCSのほうが高いという結果になった.また標準偏差も小さく,バラつきが少ないと言えるのではないか.
結局OPSCSは使える?
以上の結果を踏まえて,OPSCSの評価をすると,多少贔屓目にはなるが使える指標だと言えるのではないだろうか.もちろんOPSという素晴らしい指標がある上に成り立つものだが.
しかし,今回改めて驚いたのはOPSと得点の相関の強さだ.これだけ信頼できる指標であれば普及していったのも納得だ.
総括
ということで盗塁を考慮した指標OPSCSというものを提案,評価してみた訳だが,有識者の皆様いかがでしたか?
プロ野球では試合数も多く同リーグ内で何度も同じ相手と対戦するためデータの重要度が高いと思う.
今回紹介したもの以外にも攻守両方に様々な指標があるのでぜひ数字に注目してプロ野球を見てみて欲しい.
【お知らせ】Twitterのアカウントを作成しました.是非フォローお願いします.
以上です!最後まで読んでいただきありがとうございました。