Koripallo.com

Eteläinen II-divari

Viestejä
7 488
Koska ei tänne kukaan muu kirjoittele, ajattelin riivata porukkaa taas kakkosdirrematematiikalla...

Päivän (yön?) aiheena sarjataulukko ja yksinkertainen lineaarinen regressioanalyysi:

Seuraavassa sirontakuviossa on esitetty viimekauden jengien tekemien ja vastustajien tekemien pisteiden hajonta joukkueittain s.e. jokaisen joukkueen x-koordinaatti vastaa joukkueen keskim. pistesaalista ja y-koordinaatti vastustajalle annettuja keskim. pisteitä. Katkoviiva kuvaa joukkueita, jotka tekevät saman verran pisteitä kuin vastustajansa.

pisteplotti.gif


Kuva puhuu karua kieltä. Sarjan kovimmat joukkueet oikealla ja alhaalla; ToPoLa vasemmalla ylhäällä. Toiseksi heikoin joukkue Amiraali on lipsahtamaisillaan keskikastia vastaavasta ryppäästä, vaikka W.C. Salminen kuinka yrittää pitää puolustusta kasassa.

Kuvasta voidaan tehdä seuraavat päätelmät:

1) Vastustajaansa enemmän pisteitä tehtailevat joukkueet menestyvät(!)

2) Joukkueiden tekemät pisteet eivät kakkosdivaritasolla vaikuta joukkueita vastaan tehtäviin pisteisiin, sillä omien ja vastustajan pisteiden välinen korrelaatiokerroin on 0.125, mikä on todella todella pieni, joskin positiivinen.

Ei siis: "meidän joukkue pelaa niin nopeatempoista peliä, että vastustajakin skooraa pakosti", vaan erot korilukemissa ovat seurausta muusta kuin pelin temmosta. Vaikuttaja tekijä voisivat olla esim. joukkueiden väliset tasoerot.

En ole tutkinut asiaa, mutta väittäisin, että kovatasoisemmassa sarjassa, kuten esim. NBAssa, joukkueiden omien ja vastustajan pisteiden välillä on erittäin paljon vahvempi riippuvuus.

3) Kärkijoukkueista Wartti panosti aineiston perusteella kovaan puolustukseen ja vittumaiseen kotisaliin. Kerava ja Playboys tekivät ja päästivät enemmän pisteitä kuin WB. Näiden kolmen suhteellisen tasavahvan jengin osalla voitaisiin puhua myös pelityylin vaikutuksesta, sillä jengejä vastaavissa pisteissä on havaittavissa voimakasta positiivista korrelaatiota (ks. kohta 2) )

Tehtyjen pisteiden vaikutusta menestykseen kakkosessa on tutkittu seuraavassa kuvassa, jossa tehdyillä pisteillä yritetään selittää joukkueiden eroja sarjapisteissä. Kuvan y-akseli on siis sarjapisteitä / peli.

sarjapisteplotti.gif


Tulos on mykistävä. Pisteet asettuvat kuta kuinkin suoralle ja mallilla voidaan selittää 86% joukkueiden välisestä sarjapisteiden vaihtelusta. Ainoina poikkeuksina suoralta ovat WB (tiukka difu) ja ToPoLa (väärä sarja).

Pistekeskiarvon ja sarjapisteiden välinen korrelaatiokerroin on 0.939, mikä on tilastollisesti erittäin erittäin merkitsevää. Pisteen lisäys pistekeskiarvoon tietää noin 0.06 sarjapisteen lisäystä per peli (odotusarvoisesti), mikä vastaa 1.3 sarjapistettä kaudessa.

Seuraavassa kuvassa tilanne on sama kuin edellä, mutta nyt selittävänä muuttujana on vastustajalle sallittujen pisteiden keskiarvo:

sarjapisteplotti_vast.gif


Tulokset ovat mielenkiintoisia. Pisteet eivät asetu suoralle läheskään niin hyvin kuin edellisessä kuvassa.
Korrelaatiokerroin on 0.445, mikä on tilastollisesti merkitsevän rajamailla ja erityisesti paljon pienempi kuin omaan pistekeskiarvoon perustuvalla mallilla.

Vastustajalta poispuristettu piste per peli vastaa n. 0.04 sarjapistettä/ottelu eli n. 0.92 sarjapistettä/kausi.

Tämä tulos näyttäisi todistavan äijäjoukkueiden jo kakkosdivarista tunteman faktan; mitä sitä turhaan puolustamaan, sillä tehdyt pisteet ovat paljon "arvokkaampia"...


(Sivuhuomautus vain aiheesta todella kiinnostuneille:

Tokassa kuvassa pisteet eivät näytä olevan aivan tarkkaan suoralla... ja toden totta: aineistoon sovitettu logaritminen regressiokäyrä istuu vielä paremmin (selitysaste 0.885>0.862).

sarjapisteplotti_log.gif


Mutta yritäpä selittää tuota logaritmista riippuvuutta valmentajalle... "Sarjapisteet ei siis riipu tehdyistä pisteistä vaan niiden 4.6-potenssista..."

Kuten sanottua tää oli vaan aiheesta kiinnostuneille.)
 

Jarkkola

Mutta yritäpä selittää tuota logaritmista riippuvuutta valmentajalle... "Sarjapisteet ei siis riipu tehdyistä pisteistä vaan niiden 4.6-potenssista..."

Kuten sanottua tää oli vaan aiheesta kiinnostuneille.)


Lupasin poistua tästä foorumista, mutta sen verran on pakko tinkiä lupauksesta, että voi julkisesti todeta olevansa SANATON.
 

Lammas

hamahakkimies sanoi:
Tokassa kuvassa pisteet eivät näytä olevan aivan tarkkaan suoralla... ja toden totta: aineistoon sovitettu logaritminen regressiokäyrä istuu vielä paremmin (selitysaste 0.885>0.862).

sarjapisteplotti_log.gif

Loistavaa työtä muuten, mutta tähän minulla olisi vain yksi englanninkielinen sana: overfitting. Lisäämällä käyrään lisää vapaita paremetrejä saat selitysasteen lähemmäksi ykköstä ja kauniin mutkittelun. Lisäksi WB:n sijainti aiheuttaa suoralle päänvaivaa. Tiputtamalla ToPolan (ei puolusta ollenkaan) ja WB:n (puolustaa hyvin) pois saat paremmin kuvaavan käyrän.

Kakkosdirressä todellakin uskotaan puolustuksen hoituvan paremmalla hyökkäämisellä. Jos seuraavana yönä ei uni tule silmään odotan näkeväni aamulla taulukon, jossa on yksittäiset ottelut huomioiden merkattu voitot / tappiot pisteidenteon jakaumana.
 
Viestejä
7 488
Lammas sanoi:
Loistavaa työtä muuten, mutta tähän minulla olisi vain yksi englanninkielinen sana: overfitting. Lisäämällä käyrään lisää vapaita paremetrejä saat selitysasteen lähemmäksi ykköstä ja kauniin mutkittelun. Lisäksi WB:n sijainti aiheuttaa suoralle päänvaivaa. Tiputtamalla ToPolan (ei puolusta ollenkaan) ja WB:n (puolustaa hyvin) pois saat paremmin kuvaavan käyrän.

Tuossa logaritmisessa käppyrässä on tasan saman verran vapaita parametreja kuin lineaarisessa mallissa; siinä on vain tehty selittävälle muuttujalle "tehdyt pisteet / peli" muunnos x -> log(x), joka taivuttaa kuvaajan nätisti aineiston mukaisemmaksi. Tarkoittamasi "ylisovittuvuus" tulisi vastaan, jos selittävään malliin lisättäisiin vaikkapa selittävän muuttujan potensseja, jolloin n. asteen polynomi saadaan kulkemaan n+1 pisteen kautta.

Joukkueiden karsiminen tarkastelusta ei ole mielestäni aiheellista, sillä malli ei parane, jos siihen sopimattomat havainnot kylmästi heivataan ulos salista... Olkoot sopimattomat havainnot mukana outliereina tuomassa analyysille uskottavuutta; varsinkin kun niille kerran löytyy järkeenkäyvät perustelut.

Kakkosdirressä todellakin uskotaan puolustuksen hoituvan paremmalla hyökkäämisellä. Jos seuraavana yönä ei uni tule silmään odotan näkeväni aamulla taulukon, jossa on yksittäiset ottelut huomioiden merkattu voitot / tappiot pisteidenteon jakaumana.

Muuten olisin ton jo tehnytkin, mutta koris.netistä ei löydy tuota dataa sillä tavalla helpossa taulukkomuodossa. Ei oikein jaksaisi ruveta silmät killissä kopsaamaan ottelutuloksia siltä "pelatut ottelut"-sivulta. Ainakaan siihen aikaan, kun TV:stä ei tule enää ohjelmia.
 
Viestejä
20
Hämis pitäiskö sun miettiä katsomovalmentajan uraa? Pääsisit todennäköisesti isommille areenoille kuin nyt... Se, että WB pelaa ensi kaudella divaria, ei ole kenellekkään yllätys. Materiaalisi tukee tätä mukavasti. Hyvä Hämis ja onnittelut WB:lle.
 

Lammas

hamahakkimies sanoi:
Tuossa logaritmisessa käppyrässä on tasan saman verran vapaita parametreja kuin lineaarisessa mallissa; siinä on vain tehty selittävälle muuttujalle "tehdyt pisteet / peli" muunnos x -> log(x), joka taivuttaa kuvaajan nätisti aineiston mukaisemmaksi. Tarkoittamasi "ylisovittuvuus" tulisi vastaan, jos selittävään malliin lisättäisiin vaikkapa selittävän muuttujan potensseja, jolloin n. asteen polynomi saadaan kulkemaan n+1 pisteen kautta.

Tarkoitan sitä, että funktioparvesi lisää vapaita parametrejä. (käytetty muunnos on yksi parametri)
 
Viestejä
7 488
Lammas sanoi:
Tarkoitan sitä, että funktioparvesi lisää vapaita parametrejä. (käytetty muunnos on yksi parametri)

Ei, ei, ei.

Dataan sovellettua muunnosta ei todellakaan lasketa parametriksi. Vai miten tulkitset esim. keskiarvojen laskemisen tai havaintoaineiston normeeraamisen...

Myös identiteettimuunnos I: x -> x on muunnos. Koeta siinä sitten pitää kirjaa muunnosten lukumäärästä, kun ei voi tietää, kuinka monasti tutkittavaa datajoukkoa on muunnettu.

Tai vertaa tarkastelemaamme tilannetta tilanteeseen, jossa allekirjoittanut keräsikin sarjataulukosta joukkueiden tekemien pisteiden sijasta näiden pisteiden logaritmit. Tällöin tuo edellä esitetty lineaarinen malli olisikin tulosta eksponenttimuunnoksesta ja logaritminen malli olisi se "yksinkertaisempi".

Mallien sovitteiden vertailussa oleellista on siis vain mallien vapaiden parametrien lukumäärä.
(Jos malleissa on erimäärä parametreja, perinteiset selitysasteet eivät ole vertailukelpoisia.)
Datan muunnoksilla _ei_ ole merkitystä.

Ootko muuten lähdössä Sjömanin landelle?
 

Jaakkola

hamahakkimies sanoi:
Ei, ei, ei.

Dataan sovellettua muunnosta ei todellakaan lasketa parametriksi. Vai miten tulkitset esim. keskiarvojen laskemisen tai havaintoaineiston normeeraamisen...

Myös identiteettimuunnos I: x -> x on muunnos. Koeta siinä sitten pitää kirjaa muunnosten lukumäärästä, kun ei voi tietää, kuinka monasti tutkittavaa datajoukkoa on muunnettu.

Tai vertaa tarkastelemaamme tilannetta tilanteeseen, jossa allekirjoittanut keräsikin sarjataulukosta joukkueiden tekemien pisteiden sijasta näiden pisteiden logaritmit. Tällöin tuo edellä esitetty lineaarinen malli olisikin tulosta eksponenttimuunnoksesta ja logaritminen malli olisi se "yksinkertaisempi".

Mallien sovitteiden vertailussa oleellista on siis vain mallien vapaiden parametrien lukumäärä.
(Jos malleissa on erimäärä parametreja, perinteiset selitysasteet eivät ole vertailukelpoisia.)
Datan muunnoksilla _ei_ ole merkitystä.

Ootko muuten lähdössä Sjömanin landelle?

Voi, perhana. Munkin verorahat menee ihan harakoille kun työaikas käytät tällaiseen. Menisit vaikka kisikseen heittelemään ja opettelisit pelaamaan. Tai sitten tekisit oikeita töitä...
 
Viestejä
7 488
Mä en jaksa ruveta millekään lama-jaakkolalle aukomaan päätäni. Ota vaikka tää analyysi vastavittuiluna.

Keräilin viimekauden otteluiden pistemäärät koris.netistä ja piirsin niistä seuraavan scatterplotin, jossa jokainen piste vastaa siis yhtä ottelua. Pisteiden x-koordinaatti on kotijoukkueen pistemäärä ottelussa ja y-koord. vastaavasti vierasjoukkueen.

Kuvaan on piirretty myös katkoviivalla tasapelisuora, jonka alapuolellaolevat matsit ovat kotivoittoja ja yläpuolellaolevat vierasvoittoja.

scatterplot.jpg


Kuvasta nähdään, miten koti- ja vierasjoukkueen pisteet eivät riipu toisistaan. Niiden välinen korrelaatiokerroin on -0.07, mikä on tilastollisesti täysin merkityksetöntä. Ts. kotijoukkue ja vierasjoukkue pelaavat 2. divarissa eri pelejä lähes täysin toisistaan välittämättä. (Siis ko. aineiston perusteella ja tahallaan kärjistäen.)

Ottelussa tehtyjen pisteiden vaihteluväli oli viime kaudella [48,144], missä vähiten pisteitä teki Petäjä Wartin vieraana (48 pistettä) ja eniten Kori-80 Petäjää vastaan Keravalla (144 pistettä). Ilmeisesti Petäjän äijäjengillä on taipumusta pienimuotoisiin romahduksiin, kun vastassa on hyvä puolustava joukkue (WB) tai lapsellinen koko matsin prässäävä porukka, joka koettaa kostaa jonkun muinaisen muroihin kusemisen...

Kotijoukkueiden pisteiden keskiarvo oli 78.93 ja keskihajonta 14.51.

Vierasjoukkueille vastaavasti keskiarvo oli 76.34 ja keskihajonta 12.63.

Kotona tehtiin siis keskimäärin enemmän pisteitä (yllätys...), mutta mielenkiintoisempaa on kotijoukkueen pisteiden suurempi hajonta, jota on tarkasteltu seuraavassa kuvassa:

jakaumat.jpg


Kuvasta nähdään selvästi kotijoukkueen pisteiden jakauman pitkä häntä, joka kurkottaa kuvassa oikealle. Vastaavasti vierasjoukkueiden pistemäärät noudattavat kauniisti normaalijakaumaa. Tämän tulkinta on luonnollinen; jopa 2. divarijoukkueet saavat joskus kotona hurmoksen päälle, jolloin tiedossa on noita suuria lukemia. Vieraissa hurmospelejä ei juurikaan tule. (Poikkeuksena Virtasen peksi, joka laittoi yhdeksän kolkkia Lauttasaaressa...)

Havaintoaineistosta voidaan muodostaa myös joukkueiden pistemäärille empiiriset kertymäfunktiot, jotka on esitetty seuraavassa kuvassa:

kertyma.jpg


Kertymäfunktion tulkinta on siis seuraava: funktion arvo f(x) vastaa kysymykseen, todennäköisyydellä joukkue tekee korkeintaan x kappaletta pisteitä ottelussa.

Eli f(x)=P(X<=x), missä X on joukkueen pistemäärää vastaava satunnaismuuttuja.

Kuvasta voidaan lukea seuraavanlaisia juttuja:

1) Jos joukkue A tekee 105 pistettä, se voittaa satunnaisen kakkosdivarin kotijoukkueen todennäköisyydellä 0.92. Eli kotijoukkue tekee yli 105 pistettä todennäköisyydellä 0.08.

Vastaavasti jos joukkue A tekee 105 pistettä, se voittaa satunnaisen vierasjoukkueen todennäköisyydellä 0.98.

Eli kotiottelut on helpompi voittaa myös tilastojen valossa. (No shit sherlock.)

Tämä nähdään myös käppyrästä, jossa kotijoukkueita kuvaava sininen kuvaaja kulkee koko ajan punaisen oikealla puolella. (Lukuunottamatta pientä koukkausta 84 pisteen tietämillä. Tämä poikkeama menee otoksen pienen koon piikkiin...)

2) Vastaava ajatusleikki voidaan käydä myös toiseen suuntaan. Esim. "Paljonko on tehtävä psiteitä, jotta voittaa 2. divariottelun todennäköisyydellä 0.60?"

Kuvaajista nähdään, että suurin piirtein 80 pinnaa riittää otteluvoittoon tn:llä 0.60 sekä kotona että vieraissa...

Oliko "jaakkolalla" kysyttävää?
 

Jaakkola

hamahakkimies sanoi:
Oliko "jaakkolalla" kysyttävää?

Jos käyttäisit kaiken sen ajan opiskeluun teemu teekkarina, jota käytät koriksen räpeltelyyn, voisit olla huomattavasti produktiivisempi, kuin olet koripallokentällä!

Ainakin suoritukset Keravalla ovat olleet selvästi huonompia kuin yllä esittämäsi matemaattinen BS, jolla ei ole mitään tekemistä urheilun kanssa. Tiedätkö miksi? Et tiedä... ;)
 
Viestejä
7 488
Jaakkola sanoi:
Jos käyttäisit kaiken koriksen räpeltelyyn käyttämäsi ajan opiskeluun teemu teekkarina, voisit olla huomattavasti produktiivisempi kuin olet koripallokentällä!

Mä olen aina pitänyt itseäni monilahjakkuutena; erityisesti sua tunnun vituttavan erittäin monella eri tasolla.
 

Ihmettelijä

Tämä tuntuu olevan näiden sinänsä ihan mielenkiintoisten keskustelupalstojen ongelma, että aina löytyy näitä "jaakkoloita", jotka purkavat omaa turhautumistaan aiheen ulkopuolelta henkilöön (nimimerkkiin) menevillä viesteillä. Jokin tässä nimimerkin suojasta roiskimisessa saa monista huonot puolet esille.

Eikös anneta Hämiksen murskata numeroita ihan rauhassa. Jotainhan analyysin tuloksista voi tarttua parketillekin.
 
Viestejä
7 488
Ihmettelijä sanoi:
Tämä tuntuu olevan näiden sinänsä ihan mielenkiintoisten keskustelupalstojen ongelma, että aina löytyy näitä "jaakkoloita", jotka purkavat omaa turhautumistaan aiheen ulkopuolelta henkilöön (nimimerkkiin) menevillä viesteillä. Jokin tässä nimimerkin suojasta roiskimisessa saa monista huonot puolet esille.

Eikös anneta Hämiksen murskata numeroita ihan rauhassa. Jotainhan analyysin tuloksista voi tarttua parketillekin.

Eipä tuossa "Jaakkolassa" mitään ongelmaa ole.

Tunnen kaverin, joten tämän pizzaa mussuttavan adam sandlerin kiukuttelu on oikeastaan ihan hilpeää ja söpöä.
 

Yläriviltä

Hämis, toihan on lähestulkoon asiatonta käytöstä. Noilla muutamilla avainsanoilla sä juuri paljastit "Jaakkolan" henkilöllisyyden koko koripalloyleisölle!!
 

Adam Sandler

hamahakkimies sanoi:
Eipä tuossa "Jaakkolassa" mitään ongelmaa ole.

Tunnen kaverin, joten tämän pizzaa mussuttavan adam sandlerin kiukuttelu on oikeastaan ihan hilpeää ja söpöä.

Sorry, wrong....
 

Jarkkola

Toivottavasti kukaan ei ole sekoittanut Jarkkolaa Jaakkolaan.

Samasta kaverista ei ole kyse, vaikka lähestyminen käsiteltäviin asioihin näyttäisi olevan samantyylistä....
 

hei hämis

Onko sulla parempaa tietoa kun kaupungilla velloo huhu, että Laiholle ei kotimaan parketit enää riitä?
 
Viestejä
7 488
Huhu pitää paikkansa.

Laiho johtaa joukkueen jokavuotiseen kevätturnaukseen Barcelonaan 14. päivä.

Tarkoitus olisi ilmeisesti näyttää eurooppalaisjoukkueille ja Pohjois-Afrikan naisille, mistä Herrat kusee...

(Itse feidaan ko. reissun tänäkin vuonna; emmä varmaan osais sikäläisillä kivilattioillakaan pelata...)
 

Ässä

Hämähäkkinaisen taulukoista ja KaHen ulkomaanleiristä huolimatta sanoisin, että vahvin voittajaehdokas ensi kaudella on ameriikan mestaruussarja-tyylistä viihdekoripalloa pelaava Sykki Seniors.
 

kysyvä

Onko Kahen ulkomaanleirin otteluista ja/tai muun harjoittelun kovuudesta kuulunut mitään? Ottaen huomion Kahen kv. pelit ja leirityksen uskon Kahen olevan ensi kaudella varteenotettava joukkue nousukarsintojen huulille.
 
Jotta voit kirjoittaa viestejä, sinun täytyy rekisteröityä foorumille. Rekisteröityminen on ilmaista, helppoa ja nopeaa. Rekisteröidy tästä.
Ylös