» Nejsem zdejší

Čajovna » Čítárna » Lakrosová analýza

Lakrosová analýza

Kdysi dávno Eva utrhla zakázané jablko a Bůh za to potrestal studenty VŠE programem SAS, který se musí naučit ovládat v rámci výuky statistiky.

Počítáme v něm všelijaké pitomosti a mě napadlo, co by se asi stalo, kdybych do něj hodil něco zajímavého – data z lakrosových statistik?

Zapnul jsem počítač a za atmosféry srovnatelné snad jen s dílnami a laboratořemi, kde se rodí osvícené zjištění ovlivňující osud lidstva na příští staletí, dal jsem se do analýzy. Otázka zněla: „Proč vítězné týmy vyhrávají?!“ Byl jsem odhodlán najít odpověď zakódovanou ve změti čísel v tabulkách na stránkách SALHu… Postup byl následující: snažil jsem se najít závislost mezi pořadím týmů (reprezentovaným počtem bodů) a nějaké další skutečnosti, konkrétně počet vstřelených a inkasovaných gólů, umístění hráčů v tabulce střelců, nahrávačů, kanadského bodování a trestných minut. Všechny údaje o týmech jsem přepočetl na 18 odehraných zápasů a zahrnul jsem tam všechny týmy z 1., 2., 3. a Moravské ligy (k analýze je třeba mít minimálně 30 pozorování).

Někdo by mohl namítnout, že porovnávám Pepsi s Colou, že třeba takový Trilobit Beta má víc bodů než třeba takový Trilobit Alfa, který je přitom samozřejmě nekonečněkrát lepší, ale to je právě naopak dobře. Týmy sbírají body ve své kategorii a jsou za své výkony odměňovány vzhledem k soupeřům jim rovným, čímž bude výsledek relevantní pro všechny týmy. Například tým Draft by ve 3. lize asi poslední nebyl, ale zřejmě by to nebylo tím, že by se najednou zlepšil. Pokračujme.

Srovnal jsem všech 34 týmů do tabulky, přepočítal k nim počet bodů, inkasovaných a vstřelených gólů a spočítal jsem hráče v čele tabulky nunavutu, sólistů, poserů a prasat (počet hodnocených míst se rovnal 10 % celkového počtu hráčů v lize, Moravskou ligu jsem nechal odhadnout podle pořadí týmů).

Roztřeseným prstem jsem odkliknul poslední proměnnou, stroj zavrněl a já cítil, jak se mi zrychluje dech; za pár sekund se mi mělo vyjevit tajemství lakrosového úspěchu! Zmocnilo se mě lačné vzrušení, trochu jsem se leknul rázně vyplivnuté tabulky s čísly. Ty nervy se nedaly vydržet, zakryl jsem si rukou oči a mezi prsty jsem pomalu a s posvátnou bázní hledal první, velice důležitý index – f-hodnota. Srdce mi málem vyskočilo z hrudi, když jsem četl: f-value < 0,0001! Závislost tedy existuje! Měl jsem chuť přiskočit k oknu a vykřičet to celému světu, ale touha znát další údaje mě udržela u obrazovky. Sjel jsem kousek níž, kde stálo: R-Square = 0,92026. Pokoušely se o mě mdloby – tímto modelem se vysvětluje 92 % veškerého lakrosového dění! Každý pohyb tenisáku se z 92 % řídí rovnicí, která byla jen o pár centimetrů níž. Kolena se mi klepala a žaludek se snažil si s nimi vyměnit místo, když jsem četl hodnoty jednotlivých f-testů: celkem přesvědčivě vysoká čísla vyřadila z modelu jednotlivce, střelci dokonce vypadli s neuvěřitelným koeficientem 0,9378. Pobavila mě představa, jak Buťákovi a Ondrovi vysvětluju, že pro tým dělají prdlajz. Jejich námitky budou tentokrát marné, mám to tady totiž černé na bílém. Ale zpět k parametrům, pro inkasované a vstřelené góly platily hodnoty −0,10103, respektive 0,09417; intercept = 19,72.

Rovnice tedy zní: (počet bodů) = 19,72 + 0,09417 × (počet vstřelených gólů) − 0,10103 × (počet inkasovaných gólů). Není to úchvatné? Tabulka pro předpovědi dokonce určila nejvíc nadhodnocené a podhodnocené týmy: mnohem hůř mělo dopadnout Rojo a Lily (o 5 bodů), naopak na střet mezi teorií a praxí nejvíc doplatila Kaora a Trilobit Alfa (SAS jim předpověděl o 6 bodů více). Skutečně kulervoucí ale byla ta rovnice. Ta euforie z poznání! K smíchu mi najednou přišli všichni ti malí neznalí lakrosáčci, kteří se potí a plivou plíce na hřišti s domněnkou, že mohou něco ovlivnit!

Přitom z této rovnice lze jasně vyčíst, že nejvíc bodů má ten tým, který nejvíc gólů dá a… nejmíň jich dostane. To zklamání přišlo jak rána kladivem, když jsem si uvědomil, že jsem vyčíslil sportovní zákonitost, kterou chápou i ženy, a ustřihlo mi křídla, na kterých jsem se vznášel vysoko nad zemí s hlavou v oblacích. Pád byl tvrdý.

Dodatek 1: Kolmogorov-Smirnoffův test vyvrátil hypotézu o normalitě rozdělení proměnné „počet bodů“, což je podmínka regresní analýzy. Kdybych tenhle test udělal předem, ušetřil bych se myšlenek na sebevraždu.
Dodatek 2: Méďa a Ivanka chápou ofsajd ve fotbale.
Dodatek 3: Podle SASu jsem nejkrásnější.

Džejtý

Diskuse k příspěvku

Čajovna 3.2 (zalito 2002 — sceděno 2017) | | Čísla účtů | Hajzlík

Odkaz
Víte, čí je farma Hnízdo? Tak to opakujte rychle za sebou.