{:tr}Kazanma Olasılığı{:}{:en}Win Probability{:}

{:tr}Giriş

Dün akşam NBA Final serisinin sona ermesi ile Şubat ayından bu yana kapsamaya çalıştığım ulusal ligler hakkındaki yazılarım sonlanmış oldu. Bu yazı ile sizlerle özel bir başlık olan kazanma olasılığı hakkında bilgi iletmek istedim. Ben ve diğer basketbol analitik uzmanı arkadaşlarım, istatistik başta olmak üzere bir çok sayısal işlem ve bilgisayar algoritması eşliğinde sayıların kanıtladığı konulara daha derin basketbol bilgisi ile yaklaşarak gerek takımların gerekse oyuncuların galibiyete katkıda bulundukları noktaları sayısal olarak değerlendirmeye çalışarak kazanma olasılığı hesaplamaları üzerine öncelikle hipotezler ardındanda formüllemeler ile yanıt arıyoruz.

Kazanma olasılığı tam olarak nedir?

En yalın haliyle, kazanma olasılığı bir takımın bir maç sırasındaki her an kazanma olasılığının hesaplanabilir kılan ve geçmiş verilere dayalı olarak benzeri takımların benzer durumlardaki koşullarını dikkate alarak yapılan hesaplamalar eşliğinde bir araç olarak görülmelidir.

Özünde Bill James’in beyzbol ve “moneyball” kavramı ile ortaya çıkan bir araç olarak basketbol’a uyarlanan bir kavram olarak geliştirilmeye devam ediliyor.

Mevcut araştırmalar dahilinde şu anda doğruluk hesaplaması ve kazanma olasılığı kapsamında değerlendirme konusu gündemde tutuluyor. Örnek olarak, eğer bir takımın kazanma olasılığı 20% çıktıysa bu geçmişde benzer bir takımın yakaladığı başarının benzeri olarak 20% olarak şu anda biliniyor ancak gelecekte bir takımın yanı pozisyonda 20% oranında kazanma olasılığının değerlendirmesi ve doğruluğu tartışma konusu. Gizli veya öngörülemeyecek veri olarak nitelendirilen verilerin olasılık hesaplamalarına dahil edilmesi sürecinde çapraz doğrulama metodolojisi kullanılsada sapma oranı halen yüksek çıktığından kazanma olasılık değerlerinin yanıltıcı olabilmesi mümkün görünüyor.

Şu anda analitik bilimciler yukarıdaki şartları dikkate alarak özellikle Bayesian processing ile geçmiş verilerin geleceğe olan etkisini de analiz ederek ilerlemeye çalışıyor.

Şubat ayından bu yana özellikle şahsen üzerinde çalıştığım modellerde takımların maç öncesi birbirine oranla kuvveti ve bulundukları ligleri de dikkate alarak hesaplamalarımda ayarlamalarda bulunmaya gayret ediyorum. Tabii ki kuvvet faktörü devreye girdiği zaman değerlendirmelerde değişken durumlar ve güç dengelerinin lig kapsamındaki yerleri de değişim göstermekte ve doğruluk payını da etkilemektedir.

Basketbol kazanma olasılığı ve yeni araştırma kolları

 

Sizlerle yeni gelişmelerden bahsetmeden evvel son bir kaç senedir kat edilen yol hakkında bilgi paylaşmak istedim. Özellikle 2012’de Sloan Sports Analytics Conference sırasında yayımlanan ve kazanma olasılığı hesaplamaları hakkında açıklamalar verildi. Bu araştırmanın video sunumuna şuradan erişebilirsiniz:

Ekli kazanma olasılığı (Win Probability Added)

Kazanma olasılığı alanında özellikle oyuncuların bireysel katkılarını ortaya çıkartabilmek adında ekli kazanma olasılığı kavramına başvurulur. Bir oyuncunun olası katkısını ortaya çıkartmak oldukça zor ve bu nokta antrenörler tarafından da halen hassas bir nokta olarak görülüyor. Değerlendirmeye alınması söz konusu verilerin sahada oluştukça hesaplanabilir oluyor olması ve biz basketbol analitik uzmanlarının zaten antrenörlerin oyuncular ile üzerlerinde sahada çalışmaya uğraştıkları alana girmek istemediğimizden dolayı halen kabul edilir bir çözüm ve veri serisi olarak kabul görmüyor.

Öte yandan Win Share ve Kazanma olasılığı hesaplamasının aynı anlama gelmediğine de dikkatinizi çekmek istiyorum. Her ne kadar iki veri de genelde bir oyuncunun takıma katkısını ortaya çıkartıyor olsa dahi win share kavramında genelleme yapılırken kazanma olasılığı hesaplamasında (belirli bir seri maçların) ortalaması alınarak daha net veri elde edilir.

Mevcut araştırma ve en iyi sahaya yansıtma araçları

Kendi yaptığım çalışmalara yönelik olarak tescilli içeriklerden dolayı maalesef müşterilerimin de datasını ortaya koyamadığım için doğrudan kazanma olasılığı çalışmalarımı paylaşamıyorum ancak şu anda akranlarım arasında en önde gelen ve bu konuda gelişme kayıt etmiş kişi Michael Beuoy bulunuyor. Kendisinin çalışmalarına şu linklerden erişilebilir:

http://stats.inpredictable.com/nba/wpBox_live.php

http://stats.inpredictable.com/nba/wpCalc.php

Kazanma olasılığı hakkındaki yanılgılar

Kazanma olasılığını hesaplamada birden çok etken olduğunu yazımın yukarıdaki bölümlerinde belirtmiş olsam da tekrar etmekte fayda olduğu inancındayım. Herkesin düşündüğünün aksine kazanma olasılığı henüz gelişimi tamamlanmış bir süreç değil ve sonuçlar bir belirti amacı taşıyor olsalarda kesin sounç olarak kabul edilmemeli. Kazanma olasılığı hesaplamasında özellikle dış saha, iç saha maçları; yıldız oyuncu ve karşılığında benchden gelen verimli oyuncu; bir maç esnasında kaç defa kimin öne geçtiği, top hakimiyeti ve tempo gibi faktörler önem taşır ve olasılık hesaplamasinın değerini yükseltir. Bu bahsi geçen etkenlerden herhangi birisinin çıkartılması ise veya özellikle odak noktasına dönüşmesi olasılık hesaplaması değildir ve hatalı sonuçlar doğurur.

Basketbol analitiğinde kazanma olasılık hesaplaması bizleri nereye taşıyabilir?

Şu anda devam eden ar-ge ile kazanma olasılığı hesaplamalarının amacı Amerika’da özellikle yaygın olan ana spor dallarında olduğu gibi Avrupa ve Türkiye’de de yol kat etme hedefi bulunuyor. Bu noktada geçmiş bir kaç yazımda da dile getirdiğim üzere özellikle ulusal basketbol yönetim birimlerinin (örk: TBF) maç hareketleri datasını kamuya açık hale getirilmesi gereklidir.

Yazımı sonlandırırken sizlerle NBA Final serisinin son maçı sırasında toparlanan verilerden bir paylaşımda bulunarak canlı tutulan kazanma olasılığı grafiği ve her iki takımın kazanma olasılığı verileri dikkate alınarak çıkartılan gelişmiş istatistikleri paylaşmak istedim:

Screen Shot 2016-06-20 at 13.52.00

Screen Shot 2016-06-20 at 13.52.22{:}{:en}Introduction

With the end of the NBA Finals series last night, the national leagues that I mainly cover are over. With that I wanted to post a special piece that pays homage as well as explains what I had been focusing on since February and the launch of Advance Pro Basketball. To us analytics guys, aside from the statistics, and myriad of other qualitative and quantitative evidence that allows us to delve deeper into how a team wins and how players contribute to the “W”s; win probability calculations, lead tracking and changes as well as elements that relate to how win probabilities shift from one end to the other have been a focus for me.

What is win probability?

Simply put, win probability is a tool that helps calculate a team’s chance of winning a game at any given time, based in historical performance of similar teams in the same instance or situation.

Originally developed by Bill James for baseball and the “moneyball” notion it later on spread to other sports including basketball.

The current research which I too take part in involves the accuracy measurement of win probability estimations. That is, if an independent tool say estimates a 20% win probability because 20% of teams previously won in that situation/instance, do future teams win at the same 20% ratio?

The hard part is estimating from hidden data that makes use of testing/simulation tools like cross-validation.

While most prediction models involve analyzing frequency of past events, other models use Bayesian processing.

Since February along with other anayltics experts have been looking closer at models including a measure of teams’ strength coming into the game, while others assume every team is average. Adding in the strength factor estimates increases the number of probable states, and hence decreases an estimation power while possibly increasing its accuracy.

Recent research and Basketball win probability

Before discussing in depth on how current research is going, I wanted to give a bit more insight on the scope of work that has been done in recent times.

Every year at Sloan Sports Analytics Conference, we see more and more research papers that cover a wide range of topics. In 2012 one research paper that delved into the matter gave lots of weight on win probability calculations, here is a video to the paper explanation during the conference:

Win Probability Added

Within the realm of win probability calculations we also tend to look at players contributions individually and it is at this point that attempting to measure a players probable contributions before they take place are tricky and while most coaches consider this as delivering over-use of data and making their job obsolete. However to the contrary as analytics experts in basketball we can only estimate and calculate as events take place and while live solutions currently do exist taking on the decision making process of acting as a coach is not what we aim to do.

I should be clear that win probability added calculations are not the same as win shares. While both might indicate to a players overall contribution to the team stakes in winning games the win share attribute of say 0 pointing to no contribution whereas with win probability 0 points to the average.

Current Resarch and best field application tools

With regards to the work I do while I would love to share proprietary information my client relations do not allow me to do so however several key peers that do win probability calculations have information up on their websites.

Michael Beuoy by far out of most of our peers has the best site as well as probability calculator which can be reached through:

http://stats.inpredictable.com/nba/wpBox_live.php

 

http://stats.inpredictable.com/nba/wpCalc.php

Misconceptions about win probability

With regards to this section of my post, I want to be very open and clear that there are many elements that go into calculating and graphing win probabilities and outcomes that indicate results are not definite. The countability of away games to home games, star players vs. high producing bench players, lead changes during games and possessions as well as pace are all factors that contribute to win probabilities. Taking away any or all of the above or omitting data does create probability miscalculations in my perspective.

Where will win probability and basketball analytics lead us?

Given the scope of current research and the progress that we are heading in the aim is to be able to have win probability calculations more commonly used in Europe as well as in Turkey soon enough. I should point out that at present given that with held data by local basketball government bodies across Europe might hinder the progress as play by play data as well as lead change data are crucial, furthermore the fact that historical data as mentioned earlier are also very important to take into consideration.

To close off here is a graph and table depicting the final NBA game of the season between GSW – CAVS:

Screen Shot 2016-06-20 at 13.52.22 Screen Shot 2016-06-20 at 13.52.00{:}

Advertisements

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.