2022年11月13日に投稿

バスケのデータ分析オンライン講座 第1~4回

こんにちは。
以前、アメリカのバスケのデータ分析オンライン講座に申込みをしましたが、全8回の受講が終わったので、内容の振り返りや感想などを書いていこうと思います。 
(今回は1~4回の内容です。5~8回は後日)

第1回

内容に入る前に、まずは講師の経歴について簡単に紹介します
全8回のコースの講師はBen Alamarという方でした(LinkedIn)。
ESPNのDirector of Sports Analyticsや、Cleveland Cavaliers・Oklahoma City ThunderといったNBAチームのデータ分析部門などで勤められており、"Sports Analytics: A Guide for Coaches, Managers, and Other Decision Makersという本も執筆されています。
現場での取り組みなど、一般論から一歩踏み込んだ内容のお話が多く、全体的にとても学びになりました。

個人的にはコース説明でDean Oliver氏も講師として紹介されていて、彼の話も聞きたかったので、その点は少し残念でした。

ここからは第1回の講座に関する内容についてです。


【スポーツアナリティクスの概要 】
最初はスポーツアナリティクスについての一般論の話でした。
大きく下記3つの観点から説明を受けたので、それぞれについて内容を書いていきます。

  • スポーツアナリティクスのメインゴール
  • スポーツアナリティクスの構成要素
  • スポーツアナリティクスの対象

1. スポーツアナリティクスのメインゴール
スポーツアナリティクスのゴールは主に下記の2つがあるとしています。

  • 時間の節約
    情報(数字だけでなくフィルムなども含む)の収集や分析にかかる時間を減らすことで、これらの仕組みを作ることでGMやコーチといった意思決定者に迅速かつ簡単に情報を提供することが一つのゴールであるとしています。
  • より良い情報の提供
    Advanced Metricsや将来の予測といった、これまででは見られなかった情報を提供するということで、具体例として大学の成績からNBAでどの程度活躍するか予測するなどを挙げています。

2,スポーツアナリティクスの構成要素
構成要素は主に下記の4つを挙げています

  • データマネジメント(Data Management)
    チームで保持している各種データを適切に集約して管理することを指しており、これによってデータへのアクセスや結びつけが容易となって良い意思決定に繋がると述べています。
    (チームの中にもトレーナーやコーチやスカウトなど、多種多様なスタッフがいて、彼らが個々でデータを持っていると他の人が参照できないのが問題になるとも述べています)
  • 予測的分析(Predictive Analysis)
    ある選手がスーパースターになるか標準的なレベルの選手になるかなどフィルムを見るだけでは気づけないような、データによる深い分析や洞察・予測を行うことを表しています。
  • 情報システム(Information System)
    各種データや分析・予測の結果に関して適切な情報共有システムを作ることを表しており、例えばGMがスマートフォンで獲得候補の選手のサラリー予測やチームへの貢献度の予測、それらを踏まえたサラリーの適正度合いなどを簡単に見られるようにすることなどが挙げられます。
    (※Basketball referenceは一つの優れた具体例であるとも述べています)
  • リーダーシップ
    こちらは少し毛色が異なり、上記の3つを推進するために必要な要素であり、分析で競争力をつけるにはリーダーのコミットやサポート・理解が不可欠であると述べています。

ここまでの話はビジネスでのデータ分析でも同様に必要なことで、どの領域でもデータ分析の基本的なところは変わらないんだなと感じました。
ちなみに、講師はOKCとCLEに勤めていましたが、OKCのGMであるサムプレスティとの仕事のほうがデータ分析での価値をより提供できたと述べていました。サムプレスティのGMとしての経歴を考えると、データも積極的に活用していそうで個人的に納得感があります笑

3.スポーツアナリティクスの対象
スポーツアナリティクスの対象としては下記の3つを挙げています

  • 自チーム
    主に自チームの選手のコンディション管理やPlayer Developmentが対象となります
  • 対戦相手
    相手に対して有利になるために、相手の長所短所やマッチアップなど色々な観点の分析を行います
  • 今後の潜在的な追加要素(Potential Additions)
    FAやドラフトや契約などの分析を指します


【2008年OKCのドラフトの話】
ここまで一般論の話が続いていたので、具体例についての話になりました。
その例は2008年のOKCのドラフトの話で、前年にKDをドラフトし、当年はウェストブルックをドラフトしたタイミングになります。
ここでは、講師が述べた当時の裏側とデータ分析の関わりを箇条書きで時系列に記載していきます

  • 前年にKDをドラフトしており、今後2~3年で戦えるチームを作るために必要な選手をピックしたい
  • スカウトはセンターのドラフトにフォーカスしており、特にブルック・ロペスを検討していた
  • プレスティはそのように考えておらず、データ分析をしてくれと依頼があった
  • 分析の結果、PGをピックするべきとの結論になった *1
  • それを踏まえてウェストブルックが良さそうとなったが、彼は大学でSGとしてプレイしており、NBAでPGとしてプレイできるかが不明瞭だった
    • ポジションごとの予測モデルはすでにあったが、SG→PGへのコンバートに関してはサンプル不足で使えなかった
    • スカウトのレポートだとハンドリングが怪しく、かつドラフト順位としては12~15位との予測で、4位指名するにはリスクがあった
  • そのため、ウェストブルックをピックするのが妥当かを判断するために、どういったデータが見るべきかを考える必要があった
  • その結果、正しいパスをできる能力を見たいということになり、その具体的な見方として、ウェストブルックからのパスを受けた選手のFG%が、他の選手の場合より高ければ正しいパスをできていると捉えることにした
    • もちろん、そのようなデータはその時点では存在しないので、映像を見て自分たちで集計を行った
    • ウェストブルックだけではなく、他のNBA選手の大学自体のデータも集めた(比較対象として)
  • その結果、ウェストブルックは上記の能力を備えているのでドラフトするという決断に至った
  • このような分析をしたことで、意思決定の際の不確実性を減らす(≠なくす)ことができた

一口にバスケのデータ分析と言っても、そこには様々な背景や制約やデータ以外の情報などがあり、それらを上手くやりくりして少しでも妥当な意思決定をしようという意思が伝わってきて、とても面白かったです。
ちなみにデータ収集はドラフトの5週間前から開始して、当時のインターンの子にも手伝ってもらったそうです。相当大変だったろうなと思います。*1 また、センターよりPGをピックするべきとした分析ですが、まずKDがどのような選手になるかの予測を行い、その選手像に対してPGとセンターのどちらをペアにするかを分析したそうです
(具体的なやり方の話は残念ながら聞けませんでした)

【不確実な状況での意思決定】
続いて、不確実な状況での意思決定ということで、ドラフトに関する実際の例でディスカッションが行われました。
具体的には、ドラフト候補の選手についてGM・アシスタントGM・Analyticsのそれぞれでスターになる確率とバスト(期待外れ)になる確率を算出して表にまとめたものを踏まえて(下記)、最終的にどの選手をピックするべきかを議論しました。
※持っているドラフト順位では、25%がスターになり、15%がバストになるとしています。
※数値は比較に影響のない範囲で改変しています


参加者からも様々な意見があり、例えばBは三者の評価を総合的に見てバストになる確率が低いから選ぶべきだったり、CはAnalyticsでバストになる確率が一番低く、その中ではスターになる確率が高い(GM陣が適切な判断できるか分からない)などなど、面白い議論になっていました。
(A~Eの選手がそれぞれ誰だったのかも公表されましたが、それは参加者特権ということで秘めさせていただければとm(_ _)m)

そして、ここでの議論で様々な意見が出ましたが、そもそもが不確実な状況での意思決定であり、そのような状況で妥当な選択肢を選ぶのは難しいからこそ、データを中心として意思決定をしていく必要があると述べています(Data Centered Approach to Decision Making)。

具体的には、まず最初にベースとなる分析や予測のモデルを作成し、その上で実際の結果とずれていたら、なぜずれていたかの仮説を立てます。
(例えば、作ったモデルが特定のタイプの選手に偏った評価をしていないかなど)
そして、その仮説の中で妥当そうなものがあればモデルに盛り込んで検証をしたり、盛り込めない要素でもそういった仮説があるとの認識を持っていく必要があるとのことでした。

個人の見解ですが、データ分析の強みとして、分析や予測を行う際のモデルが定量的かつ検証可能な状態で残されていることがあると思います。
人の判断にも優れた面がありますが、なぜそのような判断に至ったのかが不明瞭だったり、ロジックはあるけど定性的な判断になっていることが多々あり、そうすると検証が行いづらくなってしまいます。
データ分析はその意味で、どんどん改善していくことが可能なアプローチであると言えるでしょう。Data Centered Approachと似た概念としてData Drivenがありますが、講師の認識としては、後者はオンラインサービスなど多くのデータを抱えていて、しかもABテストなどで実験もできるのでData Drivenで良いが、スポーツアナリティクスではそういったことができないので、あくまでData Centeredにしてデータ以外の観点も盛り込んでいく必要があるとしています。
確かに、例えばドラフトは年で最大60人しかデータ数が確保できず、しかも彼らの評価ができるのも数年後と時間がかかる類のものなので、これを踏まえてピックする選手をデータのみで判断するのは相当難しいなと感じます


【その他】
好きな指標はあるかという質問への回答が興味深かったです。
お気に入りの指標はチームにいた時に開発した指標で、ある選手が自チームにとってどの程度価値がありそうか & リーグ全体にとってどの程度価値がありそうかを算出した指標だそうです。
これを使うことで、トレードの時にリーグ全体での価値に対して自チームでの価値が高い選手を見つけて効果的にトレードを進められるとのことでした。
必要があればチーム独自の指標を開発する点だったり、現場での課題感に紐づいた指標になっていたりという点がとても興味深かったです。


第2回

 内容としては、バスケットボールで集めるデータについてとなります。

【これまでにどのようなデータが生まれてきたか 】
1. データの種類と特徴
これまでに生まれてきたデータの種類やその特徴として下記の項目があります

  • ボックススコア
    • 基本的なデータ。これを使うことで、試合で何が起こったかをクイックに要約・把握することができる。分析の取っ掛かりとして使えるデータ。
    • しかし、ネガティブな面として文脈を失っていることが挙げられる(誰が誰にアシストしたのかなど)
  • プレイバイプレイデータ
    • ボックスコアよりも深い分析が可能になっている。細かいアクションが時系列で記載され、その時に誰がいたのかも分かるので、ボックスコアより文脈を追うことができ、さらにプラスマイナス分析もできる。しかも、これは誰が見てもどんなアクションが起きたか分かるデータとなっている。
    • しかし、ネガティブな面として、いまだに欠落している文脈がある(すべてのパスや選手の位置など)
  • トラッキングデータ
    • 空間と時間を追えるようになり、とても粒度の細かいデータが取れるので、ボックスコア・プレイバイプレイデータよりさらに深い分析ができる
    • 一方で、取得するデータはあくまでボールや選手の位置を占めす座標であり(下記イメージ画像)、これを読むだけで何が起きたかを解釈することができない。そのため、このようなデータを扱える専門家が必要となる

トラッキングデータで取得できるデータイメージ


また、トラッキングデータで行える分析や取り組みの例も紹介されました。


2. トラッキングデータの活用イメージ①
添付画像は、4Qのラストポゼッションでオフェンス側が1点負けていて、ロンゾ・ボールがドライブしてリム近くまで侵入したシチュエーションになります。
このときロンゾは自分含め誰にシュートを託すべきだったでしょうか?
ここでトラッキングデータ*1を使うことで、誰に託したらシュート成功率がどうなるかを予測することができます。
その結果として、ロンゾがそのまま打つ場合の成功率は44%、右上のイングラムにパスして打った場合は33%との予測結果になりました。
実際の場面ではイングラムにパスして勝利しましたが、データからは自分で打つべきだったと予想されています。
これらのデータを適切に共有することで、ロンゾがより良い判断をできるようになるはずで、こういったアプローチがトラッキングデータを活用する例として筆者は述べていました。


自分で打つのか、誰にパスをすればよいのか



*1 この時点での位置だけでなく、DFの進行方向なども算出できるため、そういった種類のトラッキングデータも使って算出しているようです。
(イングラムの位置と正反対に向かっているなら、イングラムに出せばオープンになりやすいと予想できますからね)

3. トラッキングデータの活用イメージ②
トラッキングを使った分析や検証の例として、ウェストブルックが加入したレイカーズに関するチームフィットの検討を行っていました。
彼らはお互いにフィットしていないという風潮になっているが、実際はどうだったのかという問いに対して、オフェンス面で下記のような情報をまとめていました

  • レイカーズはオフェンス面でリーグ23位にランクしていた *2
  • レブロンとウェストブルックがコートにいるとき、53%のプレーはPnRだった
  • ウェストブルックはオフェンスの42%で主要なボールハンドラーだった
  • ウェストブルックのPnRの89%はレブロン以外とのもので、得点効率としては0.91 pts per playだった
  • レブロンとの場合は1.1pts per playだった
  • これらを見ると、ウェストブルックとレブロンのPnRを増やせばオフェンスのランキングも上がったと考えられる
  • 実際、ウェストブルックとレブロンのPnRの映像を見ると、レブロンにレーンのスペースを与えることができていて、効果的なオフェンスということが分かる
  • この内容を伝えれば、彼らはその役割をもっと引き受けてくれたかもしれず、そう考えると彼らがフィットしていなかったとは安易に言えない

このデータを踏まえて、その上でフィットしていたかそうでないかを判断するのは個々人に委ねられると思います。
ただ、重要なことは、トラッキングデータを使うことで+ / -から更に深掘ったチームフィットの分析など、これまで出来なかった分析ができるということかなと個人的に考えています。

上記のような役割分担ができないなら結局フィットしていないという観点もあると思いますが、フィットしていないというのはどういうことなのかを解像度高く議論できる状態になるのもトラッキングデータのメリットかなと思います。

*2 どういう指標で23位かの明言はありませんでしたが、おそらくオフェンシブレーティングだと思われます

趣旨とは少しずれますが、トラッキングデータを使って本格的に分析をする際には、取得する項目の詳細定義や取得するまでの流れを把握する必要があると個人的に考えています。
例として、「レブロンとウェストブルックがコートにいるとき、53%のプレーはPnRだった」という情報に対して、53%の分母と分子は何なのか、PnRをどのように判定しているのかといった情報は、外からだとブラックボックスになっています。
例えば53%というのが、1ポゼッションの中でPnRを1回でも利用した割合なのか、最終的なフィニッシュに繋がるプレイがPnRだった割合なのかなどは不明瞭で、この内容によって結果の解釈は変わってくると考えられます。
ボックススコアやプレイバイプレイデータはそこらへんが比較的明瞭だと思うのですが、トラッキングデータは曖昧なので、必要があれば深く調べる必要はあるでしょう。


【データサプライ企業が提供するツールについて】
データサプライ企業が提供しているダッシュボードの一部も拝見させていただきました(企業名や実際の画面は非公表です)。
メインはPickに関するダッシュボードの共有で、下記の項目が詳細にまとまっていました。

  1. 全てのPickの回数やそこからの得点数
  2. 上記1をボールハンドラーとスクリナーが誰なのかで分解した場合の、それぞれでのPickの回数や得点数
    (オーバーやスイッチなどDFの守り方などでの分解も可能)
  3. 見たい組み合わせをクリックすることで、実際の映像を見ることができる機能
他にもいろいろなダッシュボードの例を見させていただきました。
ビジュアルとしてシンプルで、指標の定義を把握できていれば、選手やチームの特徴をスムーズに把握することができそうなツールとなっていて、とても面白そうなサービスでした。

実際のフィルムも交えた分析は必要ですが、とりあえず取っ掛かりとしてとても有用そうだなと感じています。対戦相手の分析をする時に回数が多くて、かつ得点効率も高い攻め方がすぐに特定できるので、そこからスムーズに深掘り分析に移行できそうです。Pickの種類は機械学習で分類していて、学習用のデータとしてチーム関係者にラベリングしてもらったらしいです(これはiceでこれはunderでなど)
ただ、個人的にこのデータが本当に正しく分類されているのかは気になっています(例えばスペインピックなど)
とりこぼすくらいなら多少異なるのが入っていても網羅されてる方がいい気もしていますが、データの精度判定など、どのように運用しているのか知りたいなと思っています。


新しいデータを見つけることについて
ここでは、新しいデータを見つけることの必要性や具体例について述べられました。

まず前提としてNBAのデータは基本的にはチームスタッフなら誰でも使えるデータが多く、それで差をつけるのは難しいと述べています。
そして、分析を担当する人の力量で差がつくこともあるが、その可能性は低く、大きく差をつけるなら新しく使えるデータを定義・収集することが必要になるとも述べていました。

個人的な見解として、これは大なり小なりデータ活用が進んでいるNBAならではの状況かなと思っています。そもそもデータ活用をしていないチームが多いなら、先陣を切って活用するだけで差をつけたり or 強みにしたりできるでしょう。新しく使えるデータを定義・収集する例として、スパーズが海外の選手の情報を集めて優れた外国人選手をリクルートしていたことも挙げていました(参考記事)。これはとても分かりやすい例ですね。

ここから具体例として、スティーブ・ナッシュのような選手を適切な順位でドラフトするにはどういうデータが必要だったかの検討や取り組みが紹介されたので、箇条書きでまとめます。

  • スティーブ・ナッシュのドラフト時に、予測モデルで彼の活躍を予測することはできなかった
  • 彼の実力を判断する時に何を見逃していたのか、どのようなデータがあれば彼の活躍を予測できただろうと考えた時に、ある論文を目にした(Action anticipation and motor resonance in elite basketball players)
  • 論文の内容は、プロ選手・プロコーチ・バスケに詳しいファンの3グループに対して、バスケのFTの映像をボールが手を離れる瞬間までを見せ、その後に決まるかどうかを予測させて、その精度とスピードを計測した。
  • 結果として、プロ選手は他の2グループよりスピードも精度も高く、コーチとファンの間に違いはなかった。
  • また、脳波も計測したところ、バスケに詳しいファンとプロコーチは理性的な判断をする箇所の活動が盛んだったが、プロ選手は反射的な判断をする箇所の活動が盛んだった。
  • ここから、彼らは判断をするのに考える必要はなく、シンプルに反応をしているだけといえる。だからこそ、彼らの判断は素早く、しかも成功した選手ということは判断も正確であると言えそうである。
  • こういったデータを集めれば、ナッシュのような選手を評価したり、great athleteであるだけの選手を見分ける(大学ではそのフィジカルで通用するけど、NBAではフィジカルの優位性が薄まってしまい、他の強みもないので消えてしまう選手)こともできるのではと考えた
  • ただ、ドラフトの時に論文と同じように脳波を測るわけにはいかないので、代わりとしてプレーを途中まで見せた上で、その後に誰がシュートを打つのかを予測させて、その速さと精度を測るなどした
  • ドラフト予定のない選手のキャンプで試してみたところ、好成績を収めた選手がいて、その選手はケント・ベイズモアだった
  • これでナッシュの活躍を本当に予測できたかは分からないが、彼のドラフト時の評価を高くすることはできただろうと考えている

川崎ブレイブサンダースが日々の運動データを収集して健康管理(記事リンク)しているというのも聞きますし、選手の発言をテキストマイニングで分析するといった論文を見たこともあるので、新しいデータを見つけるというのもなかなか面白そうですね。

【その他】
今後、どのようなデータをトラッキングできるようになると良いかという質問があり、下記のような回答がありました。

「今のトラッキングデータは点でしか追えておらず、選手の向いている向きやスタンス、腕の位置など姿勢認識ができていない
このようなデータまで取れるようになると、シュートフォームやDFの守り方を詳細に捉えられるようになる。これによって、例えばDFの守り方を踏まえた上でのシュートの質の評価ができるようになったりするだろう。」

このようなデータをトラッキングデータとして扱うのは、データ取得の観点でもデータ分析の観点でもなかなかハードルは高いものと思います。
しかし、逆に言えばこのようなデータをしっかり見れている人や組織は少ないとも言えるので、選手の姿勢とそれに付随するデータを集めて分析するのは相当な価値があるとも考えられます。
新しいデータを見つけるというアプローチとして面白そうですね。

第3回

 内容としては、Advanced Statsにまつわるものになります。
(ただ第2回までと違い、バスケのデータに詳しい方ならすでに知っていたり、日本語でも解説記事があったりする内容で新規性が低いため、その点をご了承いただければと思います)

【ポゼッションと4 factors 】
まずはポゼッションと4 factorsの話です。
最初に定義や算出するための計算式の紹介がありましたが、下記の記事でわかりやすくまとまっているので、こちらを参照していただければと思います。
(一箇所だけ計算式で異なる箇所がありますが、そちらは後述します)

異なる箇所はポゼッションの計算式です
講義:FGA + 0.44 * FTA + TO - ORB
記事:FGA + 0.44 * FTA + TO
一般的に使われるのは講義内の式ですが、記事のような式のパターンもあり、ここは解釈のしやすさだったり、扱いやすさだったりでどちらを使うかを決めるのが良いかなと考えています。

次に、4 factorsを使って次の試合の対策を練る具体例についての話になりました。
例として下記の表が示され、この後にどのような分析を行うべきかのディスカッションが行われました。


どのスタッツに着目するべきか・どのような観点を深掘りするべきか


数値の意味合いとして、チームAはオフェンスのときの4 factors、チームBはディフェンスのときの4 factorsになっています。そのため、チームBの場合は対戦相手のEFG%・FTR・TOV%及び自チームのDREB%(=相手のOREB%の逆)となります

ディスカッションで出てきた案として、誰がリバウンドを取っているのか、チームBのディフェンダーは誰が優れているのか、Bはどのシュートエリアを効率的に守っているのかなどが出てきました。

最終的なまとめとして、4 factorsを利用することで、何を詳細に分析するか、どのような映像をまず見るべきかなどを決めるのに役立ち、効率的に分析を進めることができると述べていました。
(この場合は、Bの守り方やリバウンドの取り方、それらにまつわる要素について深掘ってみる)

シーズン中の、次の試合に向けた分析は時間的余裕がないため、このように短時間で筋の良い分析を行うための取っ掛かりとして有用そうだなと実感しました。
また、少し細かいテクニックですが、Basketball Referenceでは、各種スタッツを見たいチームだけに絞って比較することができるようです。画像と説明を載せたので、興味がある方は試してみてください。推しチームの次の対戦相手のスタッツと比較するときなどに便利だと思います。
(B.LEAGUEでもこういう機能あるといいですね)

リンクはこちらで、Advanced Statsの項目を例として利用しています。


この表に対して



比較したいチームの1つ目の行を左クリックで選択し



別の比較したいチームの行も同じく選択して左上の"Show Only Selected Rows"を押すと



見たいチームだけの表になります



【シューティングメトリクス】

続いてシューティングメトリクスの話になりました。

  • 一般的なシューティングメトリクスとして下記が挙げられる
    • FG%
    • FT%
    • eFG%
    • TS% = PTS / (FGA + 0.44 * FTA)
  • しかしこれらの指標は、シューティングメトリクスというよりスコアリングの効率性を測るメトリクスと捉えるべき
  • そこでシューティングメトリクスを下記の2つに分解して考察してみる
    (詳細は次回の講義で)
    • Shot Making(シュートを決める)
    • Shot Selection(シュートを選ぶ)

第4回

 内容としては、Shot SelectionとShot Makingを踏まえたシューティングメトリクスになります。
具体的な分析手法の話になり、表計算ソフトも利用する回になっています。
概論がメインだった1~3回とは少し毛色は異なりますので、予め把握いただいた上でお読みいただければと思います。

【シューティングメトリクスについて(第3回の内容確認) 】
  • 一般的なシューティングメトリクスとして下記が挙げられる

    • FG%
    • FT%
    • eFG%
    • TS% = PTS / (FGA + 0.44 * FTA)
  • しかしこれらの指標は、シューティングメトリクスというよりスコアリングの効率性を測るメトリクスと捉えるべき
  • そこでシューティングメトリクスを下記の2つに分解して考察してみる
    • Shot Making(ショットを決める)
    • Shot Selection(ショットを選ぶ)

【シューティングメトリクスの具体的な分析手法】
まずShot SelectionとShot Makingの考え方についてお話します。
両者の意味合いはそれぞれ「良いショットを選択できているか」と「ショットを決めることができているか」を表すメトリクスになります。
FG%やeFG%、TS%などはそれらが混在していて、悪いショットを打たされているのか、単に決めきれていないのかが分からない状態になっているので、両者を分解して解像度高くショットを評価しようというのが目的になります。

では具体的な分析の流れに入っていきましょう。
今回はBasketball Referenceのショットエリアごとのスタッツを利用します(画像参照)。
% of FGA by Distanceが全ショット本数に対して、距離ごとのショット本数の構成比を意味しています。
(全ショット100本の内、3Pが39本打っていたら3Pの% of FGA by Distanceは39%になります)
そして、FG% by Distanceが距離ごとのショット成功率になります。

シューティングメトリクスに当てはめると、どのショットエリアを選んでいるかがShot Selection、エリアごとの成功率がShot Makingになります。


ショットエリアごとのスタッツ


ここから、上記のデータを使って具体的なメトリクスの計算方法を説明していきます。
計算方法の紹介に使うファイルを下記に載せておくので、ご自由にご利用ください(Google スプレッドシートを利用しています)。
https://docs.google.com/spreadsheets/d/1q8W7ya2VjYIF5uwJhM6wu7uW-JBX75a4gR0blFmuYLo/edit#gid=0

まず、良いShot Selectionができている状態を定義しましょう。
話を簡単にするために、どのチームにとってもショット成功率が60%のエリアAと40%のエリアBがあるとします。
上記のエリアに対し、チームXはエリアAで80%、エリアBで20%のショットを放ち、チームYはAで50%、Bで50%のショットを放っているとします。
この場合、Shot Selectionが良いのはチームXと言えるでしょう。
つまり、良いShot Selectionとは、成功率の高い(厳密には得点期待値の高い)エリアでより多くのショットを打てていることという意味になります。

それでは考え方が掴めたところで具体的な計算式の話に移りましょう


Shot Selection版


今回は上記画像のサンズ(一番上の行のチーム)を例に取ります。
サンズはショット距離が0-3ftのショット構成比が18.8%、3-10ftが22.2%…となっています。これは良いShot Selectionになっているのでしょうか?
参照する基準が必要になるので、今回はリーグ平均の構成比と比べましょう(最下部にあります)。
それと比較するとリーグの0-3ftの構成比は24.1%、成功率は68.8%となっており、ここに関してサンズは構成比が少ないため、(18.8% - 24.1%) * 68.8% * 2 = -0.073のマイナスになります。
(2を掛けているのは、2点のショットだからです)
一方で3-10ftの場合は(22.2% - 19.4%) * 43.7% * 2で0.024のプラスになります。
これらを各距離ごとに算出して(3Pに関しては3を掛ける)、足し合わせることで、リーグ全体の傾向を基準としたサンズのShot Selectionの良し悪しが見えてきます。
イメージがつきやすいように、上記で足し合わせた数値に100を掛けて、100回ショットを打ったときに何点分をShot Selectionで得している / 損しているかを計算した結果が画像の一番右の緑列になります。
サンズの結果は-3.70と、Shot Selectionの影響で100回ショットを打つと-3.7点分の損が出ている計算になります。
実際に構成比を見ると、期待値の低いミッドレンジでの構成比が多いので、Selection的には損をしているという形
になります。
(細かく把握されたい方はスプレッドシートをコピーしていただいて、セル内の計算式を追っていただければと思います)

それでは同じようにShot Makingも見てみましょう


Shot Making版。 構成比と成功率のデータは変わらず、右側でShot SelectionではなくShot Makingを算出しています


サンズはショット距離が0-3ftのショット成功率が70.9%、3-10ftが50.3%…となっています。これは良いShot Makingになっているのでしょうか?
ここでもリーグ平均の成功率と比べましょう(最下部にあります)。
それと比較するとリーグの0-3ftの構成比は24.1%、成功率は68.8%となっており、ここに関してサンズは成功率が高いため、(70.9% - 68.8%) * 24.1% * 2 = 0.010のプラスになります。
また3-10ftの場合は(50.3% - 43.7%) * 19.4% * 2で0.026のプラスになります。
これらを各距離ごとに算出して(3Pに関しては3を掛ける)、足し合わせることで、リーグ全体の傾向を基準としたサンズのShot Maingの良し悪しが見えてきます。
Shot Selectionと同様に、上記で足し合わせた数値に100を掛けて、100回ショットを打ったときに何点分をShot Makingで得している / 損しているかを計算した結果が画像の一番右の緑列になります。
サンズの結果は6.59と、Shot Makingの影響で100回ショットを打つと-6.59点分の得が出ている計算になります。
実際にリーグ平均と比較すると、すべてのエリアで成功率が平均を上回っており、ショットを決める能力に長けている
ことが分かります。

注意点として、Shot Selectionは構成比なので、データの性質上、同一チーム内でプラスとマイナスのデータが出てきます(すべての距離でプラスや、すべての距離でマイナスにはならない)。
なので、Shot Selectionを見る際は、Xという距離でマイナスが出ているから悪いという意味合いにはならないので注意してください。
なお、Shot Makingに関しては構成比ではないので、すべての距離でプラスになることもあります(サンズなど)。

ここまでが算出の一連の流れになります。
DF版も出すことができ、実際にスプレッドシートに"Defense"というシートも作っています。
(意味合いとしては、相手のShot SelectionやShot Makingを良化/悪化させられているのかが見えるデータになります)

今回はショットの距離をSelectionの分割軸として使いましたが、どのようなデータを使うかは分析の目的や手持ちのデータによって変わってきます。
ex)C&Sとプルアップに分ける / オープンショットとタフショットに分ける

チームで使うなら、戦術を踏まえてこのようなShot Selectionになるのが理想で、そこから外れているなら何かしら問題があると考えて要因を深掘るなどができそうですね(トム・ホーバスのスタイルなら3Pを重視するので、全体のx%は3Pになっているべきなど)

個人的には、どのチームも作りたいショットとして①リム周りのショット ②オープンの3Pショット ③FT があると思うので、これらの要素を分割軸に加えたものは汎用性が高くなるのではと思っています。

【まとめ】
個人の感覚ですが、今回のデータ自体はあまり活用方法が思い浮かばないです。なぜなら、リーグ全体としてはBad Selectionに見えるエリアでも、あえてそこを選択しているチームがいても不思議ではなく、そうするとそれはGood selectionとも言えるからです。
ただ、この分析フレームワーク自体は下記2点の面でとても有用性が高いと感じています

  • ショットの良し悪しを、Selectionの良し悪しとMakingの良し悪しに分解して見ることができる
  • Selectionに関して使えるデータが多様で、様々な面からの分析が可能
前者に関しては、普段のバスケの分析で意識することが少ない項目でかつ価値があり、しかも後者によって多様な観点の分析ができるので、この考え方を使えばこれまで見えていなかったことが見えるように感じています。
自身の信条として、良い形さえ作れれば後は時の運だと考えています(ロケッツがプレーオフで27本連続3Pを外したなど)。
そういう意味で、良い形を作るために必要なデータとなるShot Selectionという考えは自分の今後の分析にも役立ちそうと感じています。

ユーザー情報

バスケに関するデータをイジイジしています。 NBAチームのデータアナリスト目指してます! 分析テーマや、こういう仕事一緒にやってみませんかなどなど募集してます!(英語垢 : @HYAMA_1160)

コメント