- Viestejä
- 7 503
Vs: Mielenkiintoisia NBA-tilastoja
Oppikirjaesimerkki siitä, miten EI tulisi tehdä koripallon tilastollista analyysiä:
http://wagesofwins.com/2012/10/04/what-will-the-nuggets-look-like-next-season/
Koripallotilastot eivät yksinkertaisesti toimi sillä tavalla, että otetaan pelaajien viime kauden tilastot (per minuutti), jaetaan tulevan kauden minuutit pelaajille (jotenkin arvaamalla) ja kerrotaan minuuttitehot pelaajille jaetuilla minuuteilla.
Ensiksikin minuuttikohtaiset tilastot ovat erittäin kohinaisia.
Toiseksi minuuttikohtaisia tilastoja ei voi noin vain ekstrapoloida suuremmille tai pienemmille minuuttimäärille (vrt. "ensimmäisen minuutin jälkeen JaVale oli 96 pisteen vauhdissa", toisaalta pelaajat väsyvät ja yhden poustiliikkeen kaveri ei voi hieroa sitä samaa muuvia koko ottelun läpi).
Kolmanneksi edellisen kauden minuuttitehot ovat ehdollisia edellisen kauden joukkuekavereille ("ei paljoa palloa näkynyt heittohakuisen pointin sutiessa" vs. "jonkun oli pakko ottaa heittoja").
Neljänneksi pelaajien tilastot eivät ole additiivisia (ts. kaksi edellisellä kaudella 10 rpg -tahdilla levaroinutta kaveria ei yhdessä kisko riboja 20 per peli). Tämä pätee erityisesti pisteisiin!
Viidenneksi pelaajien roolituksia ei voi noin kopioida edelliseltä kaudelta seuraavalle -- ei erityisesti silloin, kun joukkueen kokoonpano on radikaalisti muuttunut!!!
Kuudenneksi tilastot pitävät sisällään myös kulloisenkin valmentajan sekä joukkueen pelityylin vaikutukset. Näin ollen esimerkiksi Iguodalan tilastojen siirtäminen suoraan Denverin tilastotauluihin (Mitä on "box score" suomeksi?) ei ole perusteltua.
Seitsemänneksi minuuttitehojen suora siirtäminen tulevalle kaudelle ei huomioi mitenkään pelaajien suoritustason myönteistä tai kielteistä kehitystä. Tällä oletuksella junnut kannattaisi aina vaihtaa veteraanipelaajiin, jotka vielä tänään tuottavat junnuja parempia tilastoja.
(Listaa voisi varmaankin jatkaa paremmalla ajalla vielä huomattavasti pidemmäksi.)
Tässä Denveriä käsittelevässä esimerkkitapauksessa silmäänpistäviä yksityiskohtia on mm. se, että esitetty tilastoennuste tarjoaa kolmelle pelaajalle "jotain viittä assistia per peli" (Lawson 6.2 apg, Miller 6.1 apg, Iguodala 4.9 apg). Jotenkin on vaikea kuvitella kolme kaveria käsittelee niin paljon palloa, että tuollaiset assistikeskiarvot olisivat mahdollisia. Vertailukohtana viime kauden Heatissä vastaavat keskiarvot olivat: James 6.2 apg, Wade 4.6 apg ja Chalmers 3.5 apg. Toisena esimerkkinä 1996 Chicago Bulls: Pippen 5.8 apg, Kukoc 4.9 apg ja Jordan 4.1 apg.
Toisaalta tuossa Denverin ennusteessa vain kahden kaverin levarikeskiarvo on hikisesti yli viiden: Faried 5.7 rpg ja McGee 5.4 rpg. (Viidelle tyypille ennustetaan yli neljää levyä per matsi.) Vertailukohtana voisi käyttää viime kauden Nuggetsia (olettaen, että joukkueen pelityyli pysyy entisellään), jossa oli viisi yli viiden levarin miestä (Faried 7.7 rpg, Harrington 6.1 rpg, McGee 5.8 rpg / Nene 7.4 rpg, Koufos 5.4 rpg, Chandler 5.1 rpg) ja kahdeksan kaveria yli neljän levarin per peli (edelliset + Gallinari 4.7 rpg, Andersen 4.6 rpg ja Mozgov 4.1 rpg). Kysymys siis kuuluu, minne nämä levarit katoavat tuossa projektiossa?
Oikea vastaus on, että eivät minnekään, koska esitetyssä ennusteessa ei ole mitään järkeä!
Tärkeimpänä pointtina tässä mouhotuksessa kuitenkin on se, että koska tilastoja ei voi venyttää, summata tai pitää vakioina, tämä pitää pitää mielessä myös tällaisiin laskutoimituksiin perustuvia pelaajien hyvyysmittareita konstruoitaessa.
Toisin sanoen "Wins of Wages"-sivuston pelaajien tilastoista ennustetut joukkueiden voittoprossat ovat täyttä kuraa. Sama pätee Hollingerin pelaajakauppa-analyyseihin, joissa povataan jollekin joukkueelle X kpl lisävoittoja, koska se sai kaupassa tilastoiltaan parhaat pelaajat.
Oppikirjaesimerkki siitä, miten EI tulisi tehdä koripallon tilastollista analyysiä:
http://wagesofwins.com/2012/10/04/what-will-the-nuggets-look-like-next-season/
Koripallotilastot eivät yksinkertaisesti toimi sillä tavalla, että otetaan pelaajien viime kauden tilastot (per minuutti), jaetaan tulevan kauden minuutit pelaajille (jotenkin arvaamalla) ja kerrotaan minuuttitehot pelaajille jaetuilla minuuteilla.
Ensiksikin minuuttikohtaiset tilastot ovat erittäin kohinaisia.
Toiseksi minuuttikohtaisia tilastoja ei voi noin vain ekstrapoloida suuremmille tai pienemmille minuuttimäärille (vrt. "ensimmäisen minuutin jälkeen JaVale oli 96 pisteen vauhdissa", toisaalta pelaajat väsyvät ja yhden poustiliikkeen kaveri ei voi hieroa sitä samaa muuvia koko ottelun läpi).
Kolmanneksi edellisen kauden minuuttitehot ovat ehdollisia edellisen kauden joukkuekavereille ("ei paljoa palloa näkynyt heittohakuisen pointin sutiessa" vs. "jonkun oli pakko ottaa heittoja").
Neljänneksi pelaajien tilastot eivät ole additiivisia (ts. kaksi edellisellä kaudella 10 rpg -tahdilla levaroinutta kaveria ei yhdessä kisko riboja 20 per peli). Tämä pätee erityisesti pisteisiin!
Viidenneksi pelaajien roolituksia ei voi noin kopioida edelliseltä kaudelta seuraavalle -- ei erityisesti silloin, kun joukkueen kokoonpano on radikaalisti muuttunut!!!
Kuudenneksi tilastot pitävät sisällään myös kulloisenkin valmentajan sekä joukkueen pelityylin vaikutukset. Näin ollen esimerkiksi Iguodalan tilastojen siirtäminen suoraan Denverin tilastotauluihin (Mitä on "box score" suomeksi?) ei ole perusteltua.
Seitsemänneksi minuuttitehojen suora siirtäminen tulevalle kaudelle ei huomioi mitenkään pelaajien suoritustason myönteistä tai kielteistä kehitystä. Tällä oletuksella junnut kannattaisi aina vaihtaa veteraanipelaajiin, jotka vielä tänään tuottavat junnuja parempia tilastoja.
(Listaa voisi varmaankin jatkaa paremmalla ajalla vielä huomattavasti pidemmäksi.)
Tässä Denveriä käsittelevässä esimerkkitapauksessa silmäänpistäviä yksityiskohtia on mm. se, että esitetty tilastoennuste tarjoaa kolmelle pelaajalle "jotain viittä assistia per peli" (Lawson 6.2 apg, Miller 6.1 apg, Iguodala 4.9 apg). Jotenkin on vaikea kuvitella kolme kaveria käsittelee niin paljon palloa, että tuollaiset assistikeskiarvot olisivat mahdollisia. Vertailukohtana viime kauden Heatissä vastaavat keskiarvot olivat: James 6.2 apg, Wade 4.6 apg ja Chalmers 3.5 apg. Toisena esimerkkinä 1996 Chicago Bulls: Pippen 5.8 apg, Kukoc 4.9 apg ja Jordan 4.1 apg.
Toisaalta tuossa Denverin ennusteessa vain kahden kaverin levarikeskiarvo on hikisesti yli viiden: Faried 5.7 rpg ja McGee 5.4 rpg. (Viidelle tyypille ennustetaan yli neljää levyä per matsi.) Vertailukohtana voisi käyttää viime kauden Nuggetsia (olettaen, että joukkueen pelityyli pysyy entisellään), jossa oli viisi yli viiden levarin miestä (Faried 7.7 rpg, Harrington 6.1 rpg, McGee 5.8 rpg / Nene 7.4 rpg, Koufos 5.4 rpg, Chandler 5.1 rpg) ja kahdeksan kaveria yli neljän levarin per peli (edelliset + Gallinari 4.7 rpg, Andersen 4.6 rpg ja Mozgov 4.1 rpg). Kysymys siis kuuluu, minne nämä levarit katoavat tuossa projektiossa?
Oikea vastaus on, että eivät minnekään, koska esitetyssä ennusteessa ei ole mitään järkeä!
Tärkeimpänä pointtina tässä mouhotuksessa kuitenkin on se, että koska tilastoja ei voi venyttää, summata tai pitää vakioina, tämä pitää pitää mielessä myös tällaisiin laskutoimituksiin perustuvia pelaajien hyvyysmittareita konstruoitaessa.
Toisin sanoen "Wins of Wages"-sivuston pelaajien tilastoista ennustetut joukkueiden voittoprossat ovat täyttä kuraa. Sama pätee Hollingerin pelaajakauppa-analyyseihin, joissa povataan jollekin joukkueelle X kpl lisävoittoja, koska se sai kaupassa tilastoiltaan parhaat pelaajat.