Vs: Mielenkiintoisia NBA-tilastoja
NCAA-jukkka sanoi:
Hei, tosta tuli mieleen, onks toi kenpom rating susta mistään kotosin? Se on saanu viime vuosina jalansijaa NCAA-koriksessa melkoisesti, ja sielähän on hyvälle ratingille käyttöä koska joukkueiden peliohjelmat on niin erilaiset.
http://kenpom.com/blog/index.php/weblog/ratings_explanation/
Siinä on jotain hyvää (esim. hyökkäysten ja puolustusten arviointi "per possession"-hengessä), jonkin verran huonoa (esim. tuo linkin takaa paljastuva epätieteellinen sanallinen selostus siitä "mitä malli vähän niin kuin tekee, mutta ei tässä nyt kuitenkaan esitetä mitään kaavoja tai mallia validoivia vertailuja todellisten tulosten kanssa") ja todella paljon mielivaltaisuuksia (mallille ei ole minkäälaista teoreettista perustetta, vaan mallin rakenne on oletettavasti repäisty hatusta; "Pythagorean expected wins" on käytännössä pelkkää mielivaltaista p@$kaa; nauroin ääneen osiolle, jossa sen eksponenttia muutetaan vuodesta toiseen, koska "ehkä tämä arvo on sittenkin parempi kuin tuo viimevuotinen").
Mielelläni näkisin tilastoja ja kuvia siitä, miten hyvin Pomeroyn rating on ennustanut tulevien otteluiden lopputuloksia tai voittajia.
Ilman niitä en uskalla ampua mallia täysin alas, vaikka olenkin aiheesta hyvin skeptinen.
Yleinen ongelma erilaisissa koripallon tilastollisissa suoritusmittareissa on se, että niiden laatijat uskovat luomuksiinsa lähes uskonnollisesti eivätkä osoita minkäälaista mielenkiintoa malliensa toimivuuden julkiseen ja avoimeen testaamiseen. Tämä vaikeuttaa mallien kriittistä arviointia, koska mallien laatijat eivät sitä itse tee ja usein malleja ei tarkoituksella kuvata sellaisella tarkkuudella, että niihin liittyvät laskelmat pystyisi suorittamaan itsenäisesti omalla koneellaan.
Pahimmissa tapauksissa (vrt. WP48,
http://wagesofwins.com/ ) mallin kehittäjät suhtautuvat siihen sellaisella kirkasotsaisuudella, että ovat valmiita esimerkiksi kyseenalaistamaan
NBA-valmentajien ammattitaidon tai
mittaamaan joukkueiden sisäistä kemiaa yksittäisellä itse keksimällään mielivaltaisella numerolla.
Kaikkein räikeimmissä tapauksissa nämä "advanced stats"-analyytikot unohtavat "kehittyneempien tilastojen" pääpointin eli sen, että yritetään löytää numeroita, jotka kuvaavat pelaajien ja joukkueiden suorituksia paremmin kuin pelkät pistekeskiarvot. "Advanced stats"-spedet saattavat nauraa väitteelle "X on parempi pelaaja kuin Y, koska sillä on parempi pistekeskiarvo", mutta esittävät itse aivan yhtä räikeitä väitteitä "X on parempi pelaaja kuin Y, koska sillä on korkeampi WP48". Näiltä urpoilta siis unohtuu kokonaan se, ettei koripalloa oikeasti voi tiivistää yhteen kaikenkattavaan numeroon -- riippumatta siitä, onko tämä numero pistekeskiarvo vai joku heidän itse keksimänsä painotettu summa erilaisista keskiarvoista.
Muistinko mainita, että tuo Wages of Wins -sivuston "Ari Caroline" vaikuttaa todella ylimieliseltä tyypiltä eikä mm. suostu harkitsemaan mahdollisuutta, että WP48:ssa saattaisi olla jotain korjattavaa/kehitettävää?