Vs: NBA Playoffs 2011 ja Kalman-suodin
King James sanoi:
Harmi, että Kalman-suodatin ei ottanut huomioon OKC vs. Den sarjassa sitä, että Denverillä ei ole ketään supertähteä. Tekee varmaan höpöä eurokoriksessa ja tilastotieteessä, kun on 10 deeppi miehistö, mutta tosielämässä tarvii Kevin Duranteja ja Damon Williamseja ratkomaan niitä pelejä viimeisellä jaksolla.
Sinänsä mielenkiintoista, ettet tämän palstan toiseksi suurimpana LeBron Jamesin kannustajana kuitenkaan mainitse LeBron Jamesia tässä todellisten sankareiden listassa. Lisäksi olisi varmaan myös hyvä selventää (mieluiten jossain toisessa topikissa), minkälaisia näyttöjä Damon Williamsilla on NBA:sta. Käsittääkseni ko. urpo vääntää juurikin eurokorista ja vieläpä suhteellisen matalalla sarjatasolla.
Mitä tähän Kalman-
suodinta koskevaan kritiikkiisi tulee, malli ei tosiaan pyri etsimään joukkueiden kokoonpanoista supertähtiä tai ottamaan kantaa joukkueiden kokoonpanoihin. Supertähdet tunnistetaan eri menetelmillä ja kokoonpanotiedot voidaan lukea pöytäkirjoista/box scoreista ilman sen monimutkaisempia matemaattisia menetelmiä.
King James sanoi:
Kalmanin takki kääntyy taas kerran, nyt Memphisin eduksi
Mä en oikeasti ymmärrä, miksi kutsut takin kääntämiseksi sitä, että päivittää arvionsa saadessaan lisää informaatiota.
Oikeastihan olisi ihan silkkaa idiotismia pitää kiinni vanhoista luuloistaan, vaikka havainnot eivät läheskään vastaa ennakkoluulojen mukaisia odotuksia. Lisää aiheesta esim.
tässä.
Tässä koripallokontekstissa edellä käsitelty "takin kääntäminen" vastaa tilannetta, jossa pidetään kiinni opitusta ottelusarjan ennakkoasetelmasta, vaikka havaitut tulokset kuinka vihjaisivat yllättävän joukkueen etuun.
Esimerkkinä tästä ottelusarja, johon San Antonio lähti ennakkosuosikkina ja jota Memphis nyt johtaa 2-1. Tällä lisätiedolla malli tarjoaa Memphisin voiton todennäköisyydeksi 62%. Se pitää siis Memphisiä tällä hetkellä pienoisena ennakkosuosikkina. Tähän ei kuitenkaan sisälly kaikki mallin tuottama lisäinfo; malli pitää edelleen San Antoniota parempana joukkueena (4.77>3.40) ja Memphisin tämänhetkinen etu on seurausta tulevasta otteluohjelmasta.
Memphis voittaa ottelusarjan, jos se voittaa tulevat ottelut, jotka pelataan sen kotikentällä ("se on varastanut kotiedun ottelusarjassa"). Kun huomioidaan malliin sisältyvä hieman yli kolmen pisteen suuruinen kotietu, nähdään, että kotikentällään Memphis on pienoinen ennakkosuosikki suhteessa San Antonioon (4.77 < 3.40+3.10 = 6.50). Kuitenkaan malli ei pidä Memphisiä San Antoniota parempana joukkueena. Historia-datan perusteella juuri tällaisessa tilanteessa johdossa olevan joukkueenhan on
havaittu voittavan ottelusarjan n. 70% todennäköisyydellä, mikä ylittää Memphisille ehdotetun arvion.
Summa summarum: esittelemiäni mallin tuottamia tuloksia ei tulisi tiivistää yksittäisiin lukuihin, vaan paremman kuvan ottelusarjojen tilanteesta (ko. mallin silmissä) saa tutkimalla, mistä nämä luvut ovat peräisin.
Ja sitten takaisin aiheeseen. Tässä Kalman-suotimen antamat ennusteet, kun viimeisimmät ottelutulokset on huomioitu:
Itä:
CHI (+6.10) - IND (-0.95), todennäköisin lopputulos 4-1, voiton todennäköisyys 0.9882, tilanne nyt: Chicago johtaa 3-1
MIA (+7.02) - PHI (+0.85), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9937, tilanne nyt: Miami johtaa 3-0
BOS (+4.09) - NYK (+0.32), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9836, tilanne nyt: Boston johtaa 3-0
ORL (+4.18) - ATL (-1.48), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6299, tilanne nyt: Atlanta johtaa 2-1
Länsi:
SA (+4.77) -
MEM (+3.40), todennäköisin lopputulos 4-2, voiton todennäköisyys 0.6189, tilanne nyt: Memphis johtaa 2-1
LAL (+5.11) - NOH (+0.30), todennäköisin lopputulos 4-1, voiton todennäköisyys 0.8907, tilanne nyt: Lakers johtaa 2-1
DAL (+4.71) - POR (+2.24), todennäköisin lopputulos 4-3, voiton todennäköisyys 0.6821, tilanne nyt: tasan 2-2
OKC (+5.16) - DEN (+5.17), todennäköisin lopputulos 4-0, voiton todennäköisyys 0.9432, tilanne nyt: Oklahoma City johtaa 3-0
Historia-datan perusteella NBA-pudotuspeleissä kahden ensimmäisen ottelun voittaja voittaa sarjan
noin 94% todennäköisyydellä.
Historia-datan perusteella NBA-pudotuspeleissä joukkue, joka johtaa 2-1, voittaa sarjan
noin 82% todennäköisyydellä.
Historia-datan perusteella NBA-pudotuspeleissä joukkue, joka johtaa 3-1, voittaa sarjan
noin 96% todennäköisyydellä.
Historia-datan perusteella NBA-pudotuspeleissä kolmen ensimmäisen ottelun voittaja voittaa sarjan
100% todennäköisyydellä.
Vastaavia vedonlyöntikertoimia:
Koodi:
Latest Series Win Odds
Round Matchup Status Series Win Odds
First Round #1 Chicago vs. #8 Indiana CHI 3-1 CHI 98.4%
First Round #1 San Antonio vs. #8 Memphis MEM 2-1 MEM 54.1%
First Round #2 LA Lakers vs. #7 New Orleans LAL 2-1 LAL 86.4%
First Round #2 Miami vs. #7 Philadelphia MIA 3-0 MIA 99.2%
First Round #3 Boston vs. #6 New York BOS 3-0 BOS 98.2%
First Round #3 Dallas vs. #6 Portland Tied 2-2 DAL 68.2%
First Round #4 Okla City vs. #5 Denver OKC 3-0 OKC 95.0%
First Round #4 Orlando vs. #5 Atlanta ATL 2-1 ORL 52.4%
edit.
Ylläpito. sanoi:
King Jamesin olisi nyt syytä kääntää asenteensa hiukan rakentavampaan suuntaan. Pelkkä pieleen menneiden ennusteiden kaivelu on yhtä rakentavaa kuin eilisen sääennusteesta nillittäminen. "Luvattiin 21, mutta tulikin 23 astetta! Miksi heille edes maksetaan palkkaa?"
Jatkossa King James siis siirtyy topicin aiheeseen tai viestejä poistellaan tarvittavan kovalla kädellä.
Tarkennuksena ylläpidon ohjeistukseen. Toistaiseksi Kalman-suotimen antamat arviot eivät ole menneet pieleen, niitä on vain korjattu sitä mukaan, kun uutta informaatiota tulee saataville. Lisäksi tämän joukkueiden tasojen seurailun rinnastaminen sääennusteisiin on loukkaus kumpaakin tieteenhaaraa kohtaan.
Sään ennustaminen on vaikeaa, koska kyseessä on dynaaminen ja stokastinen systeemi, jonka käyttäytymiseen liittyy paljon epävarmuutta ja epälineaarisuuksia. Lisäksi sään ennustaminen on sananmukaisesti ennustamista -- siinä pyritään siis etukäteen kertomaan, millainen sää on huomenna tai kolmen päivän kuluttua.
Koripallojoukkueiden voimatasojen vertailussa ei pohjimmiltaan pyritä ennustamaan joukkueiden tulevia suorituksia, vaan mittaamaan joukkueiden voimasuhteita pelattujen otteluiden perusteella. Käytännössä tämä vastaa esimerkiksi tämän hetkisen ulkolämpötilan estimointia lukuisilla kohinaisilla, harhaisilla ja keskenään ristiriitaisilla lämpömittareilla.
Tässä topikissa allekirjoittanut puolestaan seurailee NBA-pudotuspelien etenemistä ja joukkueiden voimasuhteiden kehittymistä ottelusarjojen edetessä. Tavoitteena ei ole antaa mitään lopullisia ennusteita siitä, miten yksittäisissä otteluissa tulee käymään ja millä todennäköisyydellä. Käytännössä tämä on haasteellista, koska aina löytyy erilaisia jamalcrawfordeja, jotka kolauttavat viime sekunneilla kolkin vahingossa levyn kautta koriin.
Tällaisia todennäköisyysarvioita voidaan kuitenkin laskea Kalman-ratingien avulla hyvinkin vaivattomasti ja itse asiassa kaikki esitetyt voittotodennäköisyydet ovat niiden seurannaisia. Olen kuitenkin toistaiseksi pitänyt ne omana tietonani, sillä totuushan on, ettei tällaisten ennusteiden oikeellisuutta/harhattomuutta voida arvioida yksittäisten havaintojen perusteella, vaan suurempien otosten perusteella. Valitettavasti kaikilla ei riitä ymmärrystä ja pitkäjänteisyyttä tällaisten perusteltujen näkemysten muodostamiseen. Auta armias, jos kirjoittaisin tänne, että "seuraavassa ottelussa osapuolen A voiton todennäköisyys on 51%" ja B voittaisikin ko. ottelun. Aijai, sitä huutamisen ja provosoinnin määrää, kun joku tilastosokea ja asiaa paremmin tuntematon kirjoittelija hyökkäisi tämän pieleen menneen ennusteen kimppuun hampaat irvessä.