Koripallo.com

NBA ja Kalman-suodin

Viestejä
9 123
Vs: NBA Playoffs 2011 ja Kalman-suodin

Edelleen hämähäkkimiehen puuhastelugeneraattori ennustaa Memphisille yllättävän hyvää menestystä San Antoniota vastaan verrattuna ammattilaisten projektioihin. Tämä ottelusarja tulee määrittämään sen, onko hämäri pelkkä matematiikkaniilo vai todellinen Nosferatu eiku Nostradamus.
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

Todellinen "ammattimaisten matematiikkaniilojen" mittelö on vuotuinen "TrueHoop's Stat Geek Smackdown", jossa alan huiput ennustavat kunkin ottelusarjan lopputuleman ennen sarjan alkua ja saavat pisteitä onnistuneista veikkauksista:

"http://sports.espn.go.com/nba/playoffs/2011/news/story?page=Smackdown-11 sanoi:
TrueHoop's Stat Geek Smackdown 2011

By Henry Abbott

In the NBA, quantitative analysis has achieved certain landmarks. The analytical-minded are close to the centers of power on an increasing number of teams. The annual stat geek conference is nearly a must-attend for powerbrokers and has even spawned imitators.

But there is only one goofy contest in which real-deal analysts publicly compete against my mom. Since its 2007 founding, the contest has featured some of the best in the business, as evidenced by the fact that they keep getting hired away by NBA teams.

The 2007 and 2008 champion, Basketball-Reference.com's Justin Kubatko, was taken out of the mix thanks to the work he does for the Trail Blazers (although his Basketball-Reference protege, Neil Paine, is now in the Smackdown mix). Basketball Prospectus' Kevin Pelton, a mainstay, works for the Pacers now, and as they're in the playoffs, he's out of the Smackdown.

The 2009 champion, author and professor David Berri, returns to try to win back the crown he lost in 2010 to Jeff Ma, who isn't participating this year. Berri will be competing against longtime Smackdown participant and newish Phoenix Suns analytical consultant Stephen Ilardi.

Right now the hot hand among stat geeks (if you get that little reference, you're a geek, too) belongs to ESPN.com's John Hollinger; we'll see whether he can carry his regular-season success into the playoffs.

This year, there's a new trend worth noting: In asking around about who was doing the very best work in this field, a lot of the names that came up had some role in gambling. It's not hard to understand why. If you have statistical models that show who's going to win, why settle for a salaried job from a team when you can put those numbers to work on the betting market?

Last year, gambler Haralabos Voulgaris became the first gambler in the Smackdown. He fared poorly but is back to avenge his loss. And two new analysts come highly recommended. Benjamin Morris of Skeptical Sports writes a very interesting blog loaded with sophisticated insight. And in the decade since he got an Ivy League degree, he has earned most of his income wagering.

Then there's Matthew Stahlhut. Throughout last year's contest, he emailed me round by round with picks before each series started and before everybody else's picks were published. In a very professional way, he even talked a little trash. And, even though he wasn't really in the contest, he "won" it. He uses sophisticated models that he created (with the help of others) as a consultant for a gambling group.

The rules are the same as ever: Based on stats, hunches and anything else, each expert predicts the outcome of every playoff series as the rounds unfold. Each correctly picked series is worth five points. Correctly predicting the number of games is worth two additional points. The winner gets something bizarre and arbitrary to be determined later.

Itse veikkauksiin voi tutustua osoitteessa: http://sports.espn.go.com/nba/playoffs/2011/news/story?page=Smackdown-11

Kisaan osallistuvat asiantuntijat:
Bios
David Berri is an associate professor of economics at Southern Utah University and lead author of "The Wages of Wins."

John Hollinger writes for ESPN.com. He created the Player Efficiency Rating (PER) and several other statistical measures.

Stephen Ilardi is a professor of clinical psychology at the University of Kansas, a former statistical consultant to the KU men's basketball team under Roy Williams and an expert on adjusted plus/minus.

Benjamin Morris publishes original research and criticism on his blog Skeptical Sports Analysis. After graduating from Yale University with a double major in philosophy and English, he spent the better part of the past decade as a professional gambler.

Neil Paine is the lead blogger for Basketball-Reference.com, where he works for two-time Smackdown champion Justin Kubatko. No pressure.

Matthew Stahlhut, who graduated from St. Louis University School of Law in 2007, has been both an attorney and a statistical analyst for a group of sports gamblers. He also contributes to DenverStiffs.com.

Haralabos Voulgaris built one of the most powerful databases in sports, which he uses to gamble on basketball.

My mom: She hasn't watched all that much NBA since "JeRomeo" Kersey retired. (huom. kyseessä on siis Henry Abbottin äiti.)

Tuossa ko. Smackdownissa kaikki asiantuntijat ennustivat Spursin voittoa joko kuudessa tai seitsemässä ottelussa. Lukuunottamatta Abbottin mutsia, joka luotti Spursin sweeppiin. En siis usko, että kukaan oikeasti osasi ennustaa Memphisin vievän heti ensimmäistä vierasottelua San Antoniossa.

[quote author=King James"]
Edelleen hämähäkkimiehen puuhastelugeneraattori ennustaa Memphisille yllättävän hyvää menestystä San Antoniota vastaan verrattuna ammattilaisten projektioihin. Tämä ottelusarja tulee määrittämään sen, onko hämäri pelkkä matematiikkaniilo vai todellinen Nosferatu eiku Nostradamus.
[/quote]

Tässä suhteessa allekirjoittaneen malli oli hyvin samanhenkinen oikeiden asiantuntija-matematiikkaniilojen kanssa: mallin alkuperäinen, ennen pleijareiden alkua tehty ennustehan oli "Spursille 4-1".

Memphisin voittama ensimmäinen ottelu keikautti sitten ennustetta Grizzliesin suuntaan, mikä on mielestäni ihan perusteltua (kuten olen jankannut jo väsymiseen saakka: ekan ottelun voittaja vie sarjan keskimäärin 79% todennäköisyydellä).

En kuitenkaan haluaisi laittaa päätäni pantiksi pelkästään tuon ottelusarjan perusteella. Ensimmäisessä ottelussa Spurs pelasi ilman Ginobiliä, joka oli aivan jäätävä toisessa osa-ottelussa. Kuten todettua Kalman-suotimeen perustuva malli ei huomioi tällaisia loukkaantumisia. Toisin sanoen se on sokea Ginobilin poissaololle ekassa matsissa ja olettaa Spursin pelanneen täysissä ruumiin ja sielun voimissa.

Tietenkin tasapuolisuuden nimissä tämä tarkoittaa myös sitä, että todellakaan aio jälkiviisastella ja helmeillä, jos Memphis tuon sarjan onnistuisi jotenkin voittamaan.
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

Sivuhuomautuksena: Käyttäjä "King James" on hieman yllättäen takertunut tuohon mallini SA-MEM -ottelusarjaa koskevaan ennusteeseen. Tai siis siihen, että malli antoi Memphisille 57% voiton todennäköisyyden Memphisin napattua voiton ekassa ottelussa, mikä kääntyi sitten San Antonion 55% voiton todennäköisyydeksi Spursin tasoitettua sarjan toisessa ottelussa. Faktahan on, että tälläkin hetkellä allekirjoittaneen malli pitää Spursia ennakkosuosikkina.

Toisaalta ko. käyttäjä on itse ennakoinut tätä sarjaa mm. seuraavasti:

King James sanoi:
Spurs - Memphis: 4-3 Spurs

...

Memphisillä tosin kaikki mahdollisuudet yllättää, harmi ettei Gay ole pelikunnossa.

King James sanoi:
Tänään mennään vihdoin!

Lopulliset veikkaukset:

...

San Antonio - Memphis 4-2

...

Ei yhtään yllätystä! :eek:

"Altavastaajista" todennäköisimmät yllättäjät järjestyksessä suurimmasta pienimpään: Portland, Atlanta, Denver, New York

Superyllättäjäpick...Memphis!!!

En näe mallini antamissa prosenteissa ja ko. kirjoituksissa juuri minkäänlaista ristiriitaa.

Vai onko tässä pointtina se, että yleisessä NBA-keskustelussa on tarkoitus provosoida Spursin kannattajia ja tässä topikissa hyökätään allekirjoittanutta, tilastotiedettä ja hyvää meininkiä vastaan?



edit. Tämä oli siis tosiaan vain sivuhuomautus. En aio ryhtyä mihinkään typerään jankkaamiseen, vaan pitäytyä asialinjalla.

1%20(6).jpg
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

Kalman-suotimen antamat ennusteet, kun viimeisimmät ottelutulokset on huomioitu:

Itä:

CHI (+6.31) - IND (-1.16), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9965, tilanne nyt: Chicago johtaa 3-0
MIA (+7.02) - PHI (+0.85), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9937, tilanne nyt: Miami johtaa 3-0
BOS (+4.09) - NYK (+0.32), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9836, tilanne nyt: Boston johtaa 3-0
ORL (+4.18) - ATL (-1.48), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6299, tilanne nyt: Atlanta johtaa 2-1

Länsi:

SA (+4.80) - MEM (+3.36), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.5524, tilanne nyt: tasan 1-1
LAL (+5.11) - NOH (+0.30), todennäköisin lopputulos 4-1, voiton todennäköisyys 0.8909, tilanne nyt: Lakers johtaa 2-1
DAL (+4.74) - POR (+2.20), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.8130, tilanne nyt: Dallas johtaa 2-1
OKC (+5.01) - DEN (+5.31), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.7771, tilanne nyt: Oklahoma City johtaa 2-0

Historia-datan perusteella NBA-pudotuspeleissä kahden ensimmäisen ottelun voittaja voittaa sarjan noin 94% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä joukkue, joka johtaa 2-1, voittaa sarjan noin 82% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä kolmen ensimmäisen ottelun voittaja voittaa sarjan 100% todennäköisyydellä.

Toisin sanoen, mallin antamat ennusteet ovat aika hyvin linjassa playoff-historian kanssa.

Vastaavia vedonlyöntikertoimia:
Koodi:
Latest Series Win Odds
Round	        Matchup	                         Status	         Series Win Odds
First Round	#1 Chicago vs. #8 Indiana	 CHI 3-0	 CHI 99.6%
First Round	#1 San Antonio vs. #8 Memphis	 Tied 1-1	 SAN 63.7%
First Round	#2 LA Lakers vs. #7 New Orleans	 LAL 2-1	 LAL 86.3%
First Round	#2 Miami vs. #7 Philadelphia	 MIA 3-0	 MIA 99.1%
First Round	#3 Boston vs. #6 New York	 BOS 3-0	 BOS 98.2%
First Round	#3 Dallas vs. #6 Portland	 DAL 2-1	 DAL 81.7%
First Round	#4 Okla City vs. #5 Denver	 OKC 2-0	 OKC 81.0%
First Round	#4 Orlando vs. #5 Atlanta	 ATL 2-1	 ORL 51.5%

Joidenkin otteluparien osalta yhtenevyys Kalman-suotimen antamien todennäköisyyksien ja vedonlyöntikertoimien välillä on jopa pelottavaa.
 
Viestejä
9 123
Vs: NBA Playoffs 2011 ja Kalman-suodin

Joo, todella pelottavaa kun molemmat lähtee ennustaa 3-0 tilanteessa olevien sarjojen päättyvän suurella todennäköisyydellä johdossa olevalle joukkueelle! :eek:

Kalman suosittelee laittamaan osakeobligaatiot lihoiksi ja rahat Orlandon voitolle prosenttivertailun perusteella. Nyt on pallit kanissa Orlandon ja Memphisin puolesta. Jos käy jotenkin muuten, niin pitää etsiä tämä Kalman käsiin ja mukiloida sairaalakuntoon.
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

King James sanoi:
Joo, todella pelottavaa kun molemmat lähtee ennustaa 3-0 tilanteessa olevien sarjojen päättyvän suurella todennäköisyydellä johdossa olevalle joukkueelle! :eek:

Lähinnä tarkoitin sitä, että muutamissa tapauksissa arviot osuvat melkein kolmen desimaalin tarkkuudella -- mikä on sikäli kummaa, ettei esimerkiksi tuon Kalman-suotimen tuottamia todennäköisyysarvioita tulisi missään nimessä tulkita tuolla tarkkuudella. (En ole siis aiemmissa poustauksissa jaksanut pyöristellä laskimen tuottamia neljän desimaalin tarkkuudella esitettyjä lukuja.)

King James sanoi:
Kalman suosittelee laittamaan osakeobligaatiot lihoiksi ja rahat Orlandon voitolle prosenttivertailun perusteella.

Itse asiassa Kalman-suodin ei suosittele mitään. Se vain arvioi, että tuo kyseinen ottelupari on suurin piirtein pokerista tutussa coin flip -tilanteessa.

King James sanoi:
Nyt on pallit kanissa Orlandon ja Memphisin puolesta. Jos käy jotenkin muuten, niin pitää etsiä tämä Kalman käsiin ja mukiloida sairaalakuntoon.

Kurjaa, että olet ajautunut tuollaiseen tilanteeseen saatanasta peräisin olevan tilastotieteen ja lukutaidottomuuden perusteella:
hamahakkimies sanoi:
edit. Toisaalta, Kalman-suotimeen pohjaavan mallin rajoitukset tuntien, en ikimaailmassa suosittele sen käyttöä minkäänlaisten oikeiden vedonlyöntien suunnittelussa!!! (Tätä tarkoitusta varten sitä pitää vielä jatkokehittää niin, että myös sen ennustamiskyky kehittyy.)
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

Mielenkiintoista lisästatistiikkaa:

[quote author="http://espn.go.com/blog/truehoop/post/_/id/27838/bryant-gasol-lead-lakers-to-crucial-win"]Bryant & Gasol lead Lakers to crucial win
April, 23, 2011

By ESPN Stats & Info

Entering this postseason, there have been 175 instances in which a best-of-seven series was tied at one after two games. When the home team won Game Three, it went on to win the series 70.1 percent of the time. When the home team lost Game Three, it went on to win the series only 16.7 percent of the time. That being said, Game Three was crucial for the Los Angeles Lakers and New Orleans Hornets.

Loppurapsa: http://espn.go.com/blog/truehoop/post/_/id/27838/bryant-gasol-lead-lakers-to-crucial-win

[/quote]

Lähinnä tämä siis liittyy ORL-ATL ja LAL-NOH -ottelusarjoihin, joissa alempi seed onnistui riistämään kotiedun ekassa ottelussa. Nyt siis ATL piti saavuttamansa edun ja on historia-datan perusteella vahvasti kiinni sarjan voitossa. N'wlins puolestaan menetti saavuttamansa edun ja selkeässä alta vastaajan roolissa (ottelusarjan kolmanne ottelun nähneenä tämä ei tod. yllätä).
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

En tiedä, miksi näitä tänne postailen, mutta tässä on todennäköisyyksiä, joita Hollingerin ESPN Playoff Predictor tarjoaa:

Current Standings:
CHI (99%) - IND (1%)
MIA (99%) - PHI (1%)
BOS (99%) - NYK (1%)
ORL (55%) - ATL (45%)

SA (75%) - MEM (25%)
LAL (92%) - NOH (8%)
DAL (76%) - POR (24%)
OKC (88%) - DEN (12%)

Orlandolle tarjotaan siis lähteestä riippuen voittotodennäköisyyttä haarukasta 51,5%, 55% ja 63,0%.

San Antoniolle vastaavat tn:t ovat 64,6%, 75% ja 55,2%.

Lakersille 86,0%, 92% ja 89,1%.

Dallasille 81,8%, 76% ja 81,3%.

Oklahoma Citylle 81,1%, 88% ja 77,7%.

Eniten hajontaa on siis ORL-ATL, SA-MEM ja OKC-DEN -ottelupareissa, mikä ainakin oman käsitykseni mukaan selittyy sillä, että Kalman-suodin pitää vähän liian kovassa huudossa Memphisiä ja Denveriä. Vastaavasti Kalman-suotimen silmissä Atlanta on vasta 20. kovin joukkue koko NBA:ssa.
 
Viestejä
9 123
Vs: NBA Playoffs 2011 ja Kalman-suodin

Harmi, että Kalman-suodatin ei ottanut huomioon OKC vs. Den sarjassa sitä, että Denverillä ei ole ketään supertähteä. Tekee varmaan höpöä eurokoriksessa ja tilastotieteessä, kun on 10 deeppi miehistö, mutta tosielämässä tarvii Kevin Duranteja ja Damon Williamseja ratkomaan niitä pelejä viimeisellä jaksolla.
 

Ylläpito

Ylläpidon jäsen
Viestejä
5 204
Vs: NBA Playoffs 2011 ja Kalman-suodin

King Jamesin olisi nyt syytä kääntää asenteensa hiukan rakentavampaan suuntaan. Pelkkä pieleen menneiden ennusteiden kaivelu on yhtä rakentavaa kuin eilisen sääennusteesta nillittäminen. "Luvattiin 21, mutta tulikin 23 astetta! Miksi heille edes maksetaan palkkaa?"

Jatkossa King James siis siirtyy topicin aiheeseen tai viestejä poistellaan tarvittavan kovalla kädellä.
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

King James sanoi:
Harmi, että Kalman-suodatin ei ottanut huomioon OKC vs. Den sarjassa sitä, että Denverillä ei ole ketään supertähteä. Tekee varmaan höpöä eurokoriksessa ja tilastotieteessä, kun on 10 deeppi miehistö, mutta tosielämässä tarvii Kevin Duranteja ja Damon Williamseja ratkomaan niitä pelejä viimeisellä jaksolla.

Sinänsä mielenkiintoista, ettet tämän palstan toiseksi suurimpana LeBron Jamesin kannustajana kuitenkaan mainitse LeBron Jamesia tässä todellisten sankareiden listassa. Lisäksi olisi varmaan myös hyvä selventää (mieluiten jossain toisessa topikissa), minkälaisia näyttöjä Damon Williamsilla on NBA:sta. Käsittääkseni ko. urpo vääntää juurikin eurokorista ja vieläpä suhteellisen matalalla sarjatasolla.

Mitä tähän Kalman-suodinta koskevaan kritiikkiisi tulee, malli ei tosiaan pyri etsimään joukkueiden kokoonpanoista supertähtiä tai ottamaan kantaa joukkueiden kokoonpanoihin. Supertähdet tunnistetaan eri menetelmillä ja kokoonpanotiedot voidaan lukea pöytäkirjoista/box scoreista ilman sen monimutkaisempia matemaattisia menetelmiä.

King James sanoi:
Kalmanin takki kääntyy taas kerran, nyt Memphisin eduksi :D

Mä en oikeasti ymmärrä, miksi kutsut takin kääntämiseksi sitä, että päivittää arvionsa saadessaan lisää informaatiota.

Oikeastihan olisi ihan silkkaa idiotismia pitää kiinni vanhoista luuloistaan, vaikka havainnot eivät läheskään vastaa ennakkoluulojen mukaisia odotuksia. Lisää aiheesta esim. tässä.

Tässä koripallokontekstissa edellä käsitelty "takin kääntäminen" vastaa tilannetta, jossa pidetään kiinni opitusta ottelusarjan ennakkoasetelmasta, vaikka havaitut tulokset kuinka vihjaisivat yllättävän joukkueen etuun.

Esimerkkinä tästä ottelusarja, johon San Antonio lähti ennakkosuosikkina ja jota Memphis nyt johtaa 2-1. Tällä lisätiedolla malli tarjoaa Memphisin voiton todennäköisyydeksi 62%. Se pitää siis Memphisiä tällä hetkellä pienoisena ennakkosuosikkina. Tähän ei kuitenkaan sisälly kaikki mallin tuottama lisäinfo; malli pitää edelleen San Antoniota parempana joukkueena (4.77>3.40) ja Memphisin tämänhetkinen etu on seurausta tulevasta otteluohjelmasta.

Memphis voittaa ottelusarjan, jos se voittaa tulevat ottelut, jotka pelataan sen kotikentällä ("se on varastanut kotiedun ottelusarjassa"). Kun huomioidaan malliin sisältyvä hieman yli kolmen pisteen suuruinen kotietu, nähdään, että kotikentällään Memphis on pienoinen ennakkosuosikki suhteessa San Antonioon (4.77 < 3.40+3.10 = 6.50). Kuitenkaan malli ei pidä Memphisiä San Antoniota parempana joukkueena. Historia-datan perusteella juuri tällaisessa tilanteessa johdossa olevan joukkueenhan on havaittu voittavan ottelusarjan n. 70% todennäköisyydellä, mikä ylittää Memphisille ehdotetun arvion.

Summa summarum: esittelemiäni mallin tuottamia tuloksia ei tulisi tiivistää yksittäisiin lukuihin, vaan paremman kuvan ottelusarjojen tilanteesta (ko. mallin silmissä) saa tutkimalla, mistä nämä luvut ovat peräisin.



Ja sitten takaisin aiheeseen. Tässä Kalman-suotimen antamat ennusteet, kun viimeisimmät ottelutulokset on huomioitu:

Itä:

CHI (+6.10) - IND (-0.95), todennäköisin lopputulos 4-1, voiton todennäköisyys 0.9882, tilanne nyt: Chicago johtaa 3-1
MIA (+7.02) - PHI (+0.85), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9937, tilanne nyt: Miami johtaa 3-0
BOS (+4.09) - NYK (+0.32), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9836, tilanne nyt: Boston johtaa 3-0
ORL (+4.18) - ATL (-1.48), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6299, tilanne nyt: Atlanta johtaa 2-1

Länsi:

SA (+4.77) - MEM (+3.40), todennäköisin lopputulos 4-2, voiton todennäköisyys 0.6189, tilanne nyt: Memphis johtaa 2-1
LAL (+5.11) - NOH (+0.30), todennäköisin lopputulos 4-1, voiton todennäköisyys 0.8907, tilanne nyt: Lakers johtaa 2-1
DAL (+4.71) - POR (+2.24), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6821, tilanne nyt: tasan 2-2
OKC (+5.16) - DEN (+5.17), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9432, tilanne nyt: Oklahoma City johtaa 3-0

Historia-datan perusteella NBA-pudotuspeleissä kahden ensimmäisen ottelun voittaja voittaa sarjan noin 94% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä joukkue, joka johtaa 2-1, voittaa sarjan noin 82% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä joukkue, joka johtaa 3-1, voittaa sarjan noin 96% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä kolmen ensimmäisen ottelun voittaja voittaa sarjan 100% todennäköisyydellä.

Vastaavia vedonlyöntikertoimia:
Koodi:
Latest Series Win Odds
Round	        Matchup	                         Status	         Series Win Odds
First Round	#1 Chicago vs. #8 Indiana	 CHI 3-1	 CHI 98.4%
First Round	#1 San Antonio vs. #8 Memphis	 MEM 2-1	 MEM 54.1%
First Round	#2 LA Lakers vs. #7 New Orleans	 LAL 2-1	 LAL 86.4%
First Round	#2 Miami vs. #7 Philadelphia	 MIA 3-0	 MIA 99.2%
First Round	#3 Boston vs. #6 New York	 BOS 3-0	 BOS 98.2%
First Round	#3 Dallas vs. #6 Portland	 Tied 2-2	 DAL 68.2%
First Round	#4 Okla City vs. #5 Denver	 OKC 3-0	 OKC 95.0%
First Round	#4 Orlando vs. #5 Atlanta	 ATL 2-1	 ORL 52.4%



edit.

Ylläpito. sanoi:
King Jamesin olisi nyt syytä kääntää asenteensa hiukan rakentavampaan suuntaan. Pelkkä pieleen menneiden ennusteiden kaivelu on yhtä rakentavaa kuin eilisen sääennusteesta nillittäminen. "Luvattiin 21, mutta tulikin 23 astetta! Miksi heille edes maksetaan palkkaa?"

Jatkossa King James siis siirtyy topicin aiheeseen tai viestejä poistellaan tarvittavan kovalla kädellä.

Tarkennuksena ylläpidon ohjeistukseen. Toistaiseksi Kalman-suotimen antamat arviot eivät ole menneet pieleen, niitä on vain korjattu sitä mukaan, kun uutta informaatiota tulee saataville. Lisäksi tämän joukkueiden tasojen seurailun rinnastaminen sääennusteisiin on loukkaus kumpaakin tieteenhaaraa kohtaan.

Sään ennustaminen on vaikeaa, koska kyseessä on dynaaminen ja stokastinen systeemi, jonka käyttäytymiseen liittyy paljon epävarmuutta ja epälineaarisuuksia. Lisäksi sään ennustaminen on sananmukaisesti ennustamista -- siinä pyritään siis etukäteen kertomaan, millainen sää on huomenna tai kolmen päivän kuluttua.

Koripallojoukkueiden voimatasojen vertailussa ei pohjimmiltaan pyritä ennustamaan joukkueiden tulevia suorituksia, vaan mittaamaan joukkueiden voimasuhteita pelattujen otteluiden perusteella. Käytännössä tämä vastaa esimerkiksi tämän hetkisen ulkolämpötilan estimointia lukuisilla kohinaisilla, harhaisilla ja keskenään ristiriitaisilla lämpömittareilla.

Tässä topikissa allekirjoittanut puolestaan seurailee NBA-pudotuspelien etenemistä ja joukkueiden voimasuhteiden kehittymistä ottelusarjojen edetessä. Tavoitteena ei ole antaa mitään lopullisia ennusteita siitä, miten yksittäisissä otteluissa tulee käymään ja millä todennäköisyydellä. Käytännössä tämä on haasteellista, koska aina löytyy erilaisia jamalcrawfordeja, jotka kolauttavat viime sekunneilla kolkin vahingossa levyn kautta koriin.

Tällaisia todennäköisyysarvioita voidaan kuitenkin laskea Kalman-ratingien avulla hyvinkin vaivattomasti ja itse asiassa kaikki esitetyt voittotodennäköisyydet ovat niiden seurannaisia. Olen kuitenkin toistaiseksi pitänyt ne omana tietonani, sillä totuushan on, ettei tällaisten ennusteiden oikeellisuutta/harhattomuutta voida arvioida yksittäisten havaintojen perusteella, vaan suurempien otosten perusteella. Valitettavasti kaikilla ei riitä ymmärrystä ja pitkäjänteisyyttä tällaisten perusteltujen näkemysten muodostamiseen. Auta armias, jos kirjoittaisin tänne, että "seuraavassa ottelussa osapuolen A voiton todennäköisyys on 51%" ja B voittaisikin ko. ottelun. Aijai, sitä huutamisen ja provosoinnin määrää, kun joku tilastosokea ja asiaa paremmin tuntematon kirjoittelija hyökkäisi tämän pieleen menneen ennusteen kimppuun hampaat irvessä.
 
Viestejä
9 123
Vs: NBA Playoffs 2011 ja Kalman-suodin

Niin no, lähinnä juuri näille päivitetyille arvioille tuleekin irvailtua. Ne alkuperäiset ja ainoat oikeasti huomioitavat arviothan on tehty topicin avausviestissä. En itse ymmärrä miksi edes erityisemmin tarvitsee päivitellä arvioita kesken sarjan, eikö hämähäkkimies seiso alkuperäisten Kalman-arvioidensa takana?
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

King James sanoi:
Niin no, lähinnä juuri näille päivitetyille arvioille tuleekin irvailtua.

Niin, mutta miksi? Eikö se nyt ole ihan mielenkiintoista tarkastella, että miten realisoituneet yksittäiset ottelut vaikuttavat ottelusarjojen kokoiskuvaan?

King James sanoi:
Ne alkuperäiset ja ainoat oikeasti huomioitavat arviothan on tehty topicin avausviestissä.

Totta, mutta samassa hengessä voisi varmaan myös kytätä esimerkiksi näitä arvioita (tietysti siis tuossa toisessa playoff-topikissa):

King James sanoi:
Tänään mennään vihdoin!

Lopulliset veikkaukset:

Chicago - Indiana 4-1

Miami - Philadelphia 4-0

Boston - New York 4-2

Orlando - Atlanta 4-2

San Antonio - Memphis 4-2

Los Angeles - New Orleans 4-1

Oklahoma - Denver 4-2

Dallas - Portland 4-3

Ei yhtään yllätystä! :eek:

"Altavastaajista" todennäköisimmät yllättäjät järjestyksessä suurimmasta pienimpään: Portland, Atlanta, Denver, New York

Superyllättäjäpick...Memphis!!!

King James sanoi:
En itse ymmärrä miksi edes erityisemmin tarvitsee päivitellä arvioita kesken sarjan, eikö hämähäkkimies seiso alkuperäisten Kalman-arvioidensa takana?

Tähän kohtaan olen jo kerran vastannut:

hamahakkimies sanoi:
Tuo Kalman-suodin -viritys on alun perin tarkoitettu juurikin joukkueiden suoritustasojen seuraamiseen (esimerkiksi runkosarjan aikana). Toisin sanoen koko homman pointti on arvioiden jatkuvassa päivittämisessä. Pudotuspelien yhteydessä homman mielenkiintoa ainakin allekirjoittaneen kannalta lisää koti- ja vieraspelien vaikutus. Ainakin aiempina vuosina malli on tarrannut aika kivasti "kotiedun riistämisiin".

Jos jotain pisteitä olisi jaossa tyyliin "veikkaa etukäteen, miten käy", pitäisi tietenkin pitäytyä alkuperäisissä arvioissa. Nyt kuitenkin olen huvikseni päivitellyt noita arvioita päivittäin, jotta näkisin, miten homma kehittyy ja konvergoi sarjojen lopullisiin tuloksiin.

Mahdolliset "takinkäännöt" ilmentävät sitä, että pelit eivät ole menneet niin kuin etukäteen oli arveltu ja joukkueiden pelaamien otteluiden lopputuloksissa on ollut jotain yllättävää. Takinkääntöjä on näissä pleijareissa toistaiseksi tullut vastaan kaksi: Memphis vie kotiedun San Antoniolta (mielenkiintoista) ja Oklahoma City otti homman näppeihin Denveriä vastaan (itse vähän ihmettelin alun perinkin tuota Denverin näennäistä ennakkosuosikkiutta Kalman-suotimen silmissä). Idässä homma näyttää toistaiseksi edenneen täsmälleen alkuperäisen käsikirjoituksen mukaan.

Mutta kaiken kaikkiaan keskustelen erittäin mielelläni rakentavassa hengessä kaikista näistä arvioista. Itse asiassa jopa toivoisin muidenkin kuin allekirjoittaneen ja "King Jamesin" ottavan kantaa tähän keskusteluun.
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

Tässä Kalman-suotimen antamat ennusteet, kun viimeisimmät ottelutulokset on huomioitu:

Itä:

CHI (+6.11) - IND (-0.95), todennäköisin lopputulos 4-1, voiton todennäköisyys 0.9882, tilanne nyt: Chicago johtaa 3-1
MIA (+6.86) - PHI (+1.01), todennäköisin lopputulos 4-1, voiton todennäköisyys 0.9820, tilanne nyt: Miami johtaa 3-1
BOS (+4.33) - NYK (+0.07), todennäköisin lopputulos 4-0, voiton todennäköisyys 1.000, tilanne nyt: Boston voitti 4-0
ORL (+4.05) - ATL (-1.36), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6483, tilanne nyt: Atlanta johtaa 3-1

Länsi:

SA (+4.75) - MEM (+3.40), todennäköisin lopputulos 4-2, voiton todennäköisyys 0.6191, tilanne nyt: Memphis johtaa 2-1
LAL (+4.96) - NOH (+0.46), todennäköisin lopputulos 4-2, voiton todennäköisyys 0.7706, tilanne nyt: tasan 2-2
DAL (+4.71) - POR (+2.23), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6821, tilanne nyt: tasan 2-2
OKC (+5.15) - DEN (+5.17), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9432, tilanne nyt: Oklahoma City johtaa 3-0

Historia-datan perusteella NBA-pudotuspeleissä kahden ensimmäisen ottelun voittaja voittaa sarjan noin 94% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä joukkue, joka johtaa 2-1, voittaa sarjan noin 82% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä joukkue, joka johtaa 3-1, voittaa sarjan noin 96% todennäköisyydellä.

Historia-datan perusteella NBA-pudotuspeleissä kolmen ensimmäisen ottelun voittaja voittaa sarjan 100% todennäköisyydellä.

(Sanomattakin lienee selvää, että neljään voittoon päässyt joukkue voittaa sarjan 100% todennäköisyydellä.)

Vastaavia vedonlyöntikertoimia:
Koodi:
Latest Series Win Odds
Round	        Matchup	                         Status	         Series Win Odds
First Round	#1 Chicago vs. #8 Indiana	 CHI 3-1	 CHI 98.6%
First Round	#1 San Antonio vs. #8 Memphis	 MEM 2-1	 MEM 54.8%
First Round	#2 LA Lakers vs. #7 New Orleans	 LAL 2-2	 LAL 72.0%
First Round	#2 Miami vs. #7 Philadelphia	 MIA 3-1	 MIA 97.4%
First Round	#3 Boston vs. #6 New York	 BOS 4-0	 BOS Wins
First Round	#3 Dallas vs. #6 Portland	 Tied 2-2	 DAL 67.9%
First Round	#4 Okla City vs. #5 Denver	 OKC 3-0	 OKC 94.9%
First Round	#4 Orlando vs. #5 Atlanta	 ATL 3-1	 ATL 74.1%

edit. Sellainen huomio, että 82 ottelun runkosarjan mittaisen "lämmittelyn" jälkeen tuo Kalman-suotimen tuottamat joukkueiden voima-arviot reagoivat hieman nihkeästi ottelutuloksiin. Toisin sanoen malli on muodostanut melko vankan käsityksen siitä, kuinka kovia joukkueet ovat, eikä yksittäisten otteluiden tuloksilla ole dramaattisia vaikutuksia näihin arvioihin. Vrt. pelaajan pistekeskiarvo, joka juuri värähdä, kun on pelattu 82 ottelua ja pelaaja tekee yhdessä pelissä hieman odotettua enemmän pisteitä.

Esimerkiksi Atlanta voima-arvio (-1.36) on oman henkilökohtaisen mielipiteeni mukaan arvioitu alakanttiin ja vastaavasti Denver (+5.17) on mallissa yliarvostettu, mutta näillä arvioilla mennään.

Tärkeimpinä ajureina ottelusarjoihin liittyvissä voitontodennäköisyyksissä ovatkin toteutuneet voitot ja jäljellä oleva otteluohjelma, eivät siis varsinaiset heilahdukset joukkueiden voimatasojen arvioissa.
 
Viestejä
453
Vs: NBA Playoffs 2011 ja Kalman-suodin

Onko nuo joukkueiden Kalman-voimaluvut jotenkin suoraviivaisesti muutettavissa piste-eron odotusarvoksi?

CHI (+6.11) - IND (-0.95)

Eli onko Kalmanin mielestä pointspread viidenteen peliin 7.06 + kotietu? (joka olisi varmaan 3 pisteen luokkaa)


ORL (+4.05) - ATL (-1.36), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6483, tilanne nyt: Atlanta johtaa 3-1

First Round #4 Orlando vs. #5 Atlanta ATL 3-1 ORL 74.1%

Varmaan ATL kuitenkin jo suosikki?
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

Skiles sanoi:
Onko nuo joukkueiden Kalman-voimaluvut jotenkin suoraviivaisesti muutettavissa piste-eron odotusarvoksi?

Eli onko Kalmanin mielestä pointspread viidenteen peliin 7.06 + kotietu? (joka olisi varmaan 3 pisteen luokkaa)

Täsmälleen.

Kalman-suotimen mukaan point spread viidenteen Chicagossa pelattavaan peliin on:

"kotijoukkueen rating" - "vierasjoukkueen rating" + "kotietu" = 6.11 - (-0.95) + 3.10 = 10.16

Tätä voi sitten verrata vaikka täältä löytyviin vedonvälittäjien point spreadeihin: 5Dimes, Skybook, SportBet, Jazz ja BetPhx -sivustot tarjoavat spreadiksi tasan kymmentä. Opener-sivustolla ko. point spread on 11 pistettä.

Ainakin tässä tapauksessa malli näyttäisi siis osuvan aika lähellä vedonlyöntimarkkinan arvioita.

(Pakko myöntää, että en ole mitenkään järjestelmällisesti verrannut mallin antamia point spreadeja noihin oikeisiin arvoihin. Ihan hauska yllätys joka tapauksessa.)

Skiles sanoi:
Varmaan ATL kuitenkin jo suosikki?

Jep. Korjasin tuon typon. Pitäisi varmaan aina kopioida koko roska lähteestään, eikä yrittää vaan muutella niitä muutamia lukuja, jotka vaihtuvat päivästä toiseen.
 
Viestejä
99
Vs: NBA Playoffs 2011 ja Kalman-suodin

Sen mitä humanisti Wikipediasta ymmärsi, Kalman-suodin on oikeastaan kohinasuodin. Onko tässä käytetty suodinta "puhtaana", vai onko mukana jotain omia lisiä? Koripallossa eivät joukkueelle tehdyt perättäiset mittaukset (matsit) ole samanlaisia ja tätä kautta "kohinan" mukana menee kai arvokastakin dataa.

Tiettyjen joukkueiden keskinäinen sopivuus on eräs juttu, jota malli ei ilmeisesti vielä huomioi. Keskinäisiä kohtaamisia on runkosarjan aikana niin vähän, että niiden pohjalta ei ihmeitä voi päätellä, mutta ehkä jonkinlainen korjauskerroin voima-arvoon olisi paikallaan? (Oikeastaan ensin pitäisi ottaa selvää, korreloiko joukkueiden välinen reg. reason -rekordi mitenkään pleijarisarjan lopputuloksen kanssa. Tai vielä parempi, jos korjauskertoimia pystyisi luomaan yleisempien, kaikkia joukkueita kuvaavien muuttujien pohjalta.)

hamahakkimies sanoi:
edit. Sellainen huomio, että 82 ottelun runkosarjan mittaisen "lämmittelyn" jälkeen tuo Kalman-suotimen tuottamat joukkueiden voima-arviot reagoivat hieman nihkeästi ottelutuloksiin. Toisin sanoen malli on muodostanut melko vankan käsityksen siitä, kuinka kovia joukkueet ovat, eikä yksittäisten otteluiden tuloksilla ole dramaattisia vaikutuksia näihin arvioihin. Vrt. pelaajan pistekeskiarvo, joka juuri värähdä, kun on pelattu 82 ottelua ja pelaaja tekee yhdessä pelissä hieman odotettua enemmän pisteitä.

Intuitiivisesti tuntuu heikolta ratkaisulta, että ennustettavan pleijarisarjan matsi on mukana voima-arvoissa samalla painolla kuin runkosarjamatsikin (vaikka se onkin mukana ennusteissa toista kautta). Jos matchup-kohtaisissa voima-arvojen korjauskertoimissa olisi järkeä, ne kannattaisi tietty ottaa siihen mukaan. No, kyse on kai pohjimmiltaan Jamal Crawfordin eksistenssin laadusta (onko mies kohinaa vai bank shottien todennäköisyyksiä). ;D

Tää on kiinnostava ketju. Varmaan suunnilleen kaikki on tälläkin alalla jo tehty (Smackdown), mutta mallien kautta voi ymmärtää ehkä pelistä jotain lisää. Kaveriporukan kesken on pieni NBA-veikkaus ollut käynnissä jo muutaman vuoden. Nytkin on turpiin tulossa niin pahasti, että jotain pitänee kehittää. Voisi sitten edes syyttää keskeneräistä mallia...
 
Viestejä
7 534
Vs: NBA Playoffs 2011 ja Kalman-suodin

Sir Karnivori sanoi:
Sen mitä humanisti Wikipediasta ymmärsi, Kalman-suodin on oikeastaan kohinasuodin. Onko tässä käytetty suodinta "puhtaana", vai onko mukana jotain omia lisiä? Koripallossa eivät joukkueelle tehdyt perättäiset mittaukset (matsit) ole samanlaisia ja tätä kautta "kohinan" mukana menee kai arvokastakin dataa.

Nyt on pikkaisen kiire, joten palaan noihin oikein hyviin kommentteihisi hieman paremmalla ajalla.



Tässä kuitenkin jotain pientä lueskeltavaa siksi aikaa: Kalman Filter Algorithm for Rating and Prediction in Basketball.pdf.

Ehkä tuosta tekstistä selviää joitain yksityiskohtia, joita tässä keskustelussa ei ole vielä aiemmin käsitelty.

HUOM! Käsikirjoitus ei ole vielä aivan täysin viimeistelty, mutta kaipa sen kehtaa jo tässä vaiheessa laittaa yleisen moitinnan kohteeksi. Joka tapauksessa otan mielelläni vastaan kaikkea rakentavaa palautetta.
 
Jotta voit kirjoittaa viestejä, sinun täytyy rekisteröityä foorumille. Rekisteröityminen on ilmaista, helppoa ja nopeaa. Rekisteröidy tästä.
Ylös