Már az adatelemzés formálja a játékot – íme, a Starschema!

KAPOLCSI-SZABÓ BENCEKAPOLCSI-SZABÓ BENCE
Vágólapra másolva!
2024.04.16. 18:50
Balról: Sepp Ákos, a Starschema sportanalitikai csapatának vezetője, Tóth Benedek és Kovács Bálint adatelemző (Fotók: Török Attila)
Az adatelemzés nem újdonság, viszont a sporton belül nagyon dinamikusan fejlődő ágazat, többek között a mesterséges intelligenciának köszönhetően. A kis magyar startupból mára számos tengerentúli partnerrel büszkélkedő céggé váló Starschema szakemberei beszéltek lapunknak például arról, milyen izgalmas, új kutatások zajlanak, amelyek célja, hogy minél inkább előre meghatározható legyen, mi történik majd a sportpályán.

 

Magyar startupként indult, de gyorsan felkeltette a nagyobb piaci szereplők érdeklődését a Starschema, és két évvel ezelőtt egy indiai multi, a HCLTech fel is vásárolta. Ennek természetesen nagy hatása volt a cég mindennapjaira és a lehetőségeire is, hiszen elérhetővé váltak olyan potenciális partnerek, amelyekről korábban nem is álmodtak.

Hogy mi az a Starschema? Mivel foglalkoznak a munkatársai? Nos, röviden és tömören: adatokkal, adatokkal és adatokkal. Ha a téma látszólagos szárazsága eddig nem riasztotta el az olvasót, érdemes cikkünket tovább böngésznie, mert olyan kulisszatitkokat tudhat meg a jelen és a jövő sportanalitikai megoldásairól és lehetőségeiről, amilyeneket csak a leginkább szakavatottak ismernek.

„Mi nem a sportklubok analitikai stábjának munkáját váltjuk ki, inkább kiegészítjük, hozzáadunk. Még a legmagasabb szinten szereplő klubokra is jellemző, hogy csupán három-négy tagú elemző csapattal dolgoznak. Ilyen kevés embernek nincs kapacitása másra, mint hogy a mindennapos dolgokkal foglalkozzon, a következő ellenfelekkel, az átigazolási célpontok elemzésével a kötelező minimum szintjén. Tipikus projektünk például az az elemzési folyamat, amivel ehhez hozzátesszük a különböző szenzor- és fiziológiai adatokból levont következtetéseinket, amelyek segítik a bővebb háttértudást, ezzel nyújtva versenyelőnyt az egyesületnek” – mondta Sepp Ákos, a Starschema sportanalitikai csapatának vezetője.

A Formula–1-es versenysorozat óriása, a Scuderia Ferrari is partner (Fotók: Getty Images) 
Fotó: AFP

Bizonyára mindenki látott már férfi versenysportolókon melltartóhoz hasonló viseletet – a felszerelés a teljesítménymérő rendszer része, feladata pedig, hogy minden lehetséges értéket rögzítsen sportolás közben. Az összegyűjtött adathalmaz később az elemzőcégekhez kerül, amelyek kategorizálják, feldolgozzák és értelmezik, majd olyan rendszereket hoznak létre, amelyek lehetővé teszik ennek a folyamatnak az automatikussá tételét.

„Az egyik legnagyobb nehézség kiszűrni a fontos mutatókat abból az óriási »zajos« adatbázisból, amelyben minden begyűjtött érték befut. Aztán ennek a folyamatnak a fenntartható automatizálását megvalósítani, hogy ne kelljen mindig manuálisan, hatalmas táblázatokból kibogarászni” – magyarázta Sepp Ákos.

Hogy megértsük, mekkora adathalmazról van szó, nézzük meg, hogyan működik az említett mellény. Tizedmásodpercenként rögzít gyorsulást, sebességet, szívműködési jellemzőket, összesen nagyjából két-háromezer tulajdonságot, mindezt a kezdő korongbedobástól, kezdőrúgástól, sípszótól a meccs lefújásáig. Egy játékos vagy edző ezekből egyértelmű következtetéseket, könnyen átlátható diagramokat, táblázatokat szeretne, tehát a szűrés és rendszerezés elengedhetetlenül fontos ahhoz, hogy az adatból ténylegesen felhasználható, értékes alapanyag szülessen. Itt jönnek képbe az adatelemzők, más néven data scientistek, hiszen ezek a folyamatok meghaladják az egyes klubok által alkalmazott – jellemzően – kis létszámú analitikai stábok erőforrásait és legtöbb esetben képességeit is.

„Vannak algoritmusok – nevezzük ezt mesterséges intelligenciának –, amelyek adott esetben elvégzik az adathalmaz fogyaszthatóvá tételét. Ilyen lehet például, ha rengeteg, alacsonyabb ligában játszó játékost szeretnénk megfigyelni, használunk egy modellt, ami különböző kritériumok szerint összefoglalja a teljesítményüket, esetleg felhívja a figyelmünket a kiugró statisztikákra. Ilyen algoritmus létrehozása egy analitikus csapattal együttműködésben a mi feladatunk. Természetesen ezt utána nekik működtetniük kell, de az már jóval kisebb kapacitást igényel, mint létrehozni” – magyarázta Tóth Benedek, a Starschema elemzője.

Időről időre az elkészült rendszereket is felül kell vizsgálni, hiszen a sport és a technológiai háttere is folyamatosan változik, fejlődik.

„Nemrég még az is újszerű volt, hogy egy meccsen végig tudjuk, a játékosok pontosan hol helyezkednek. Ehhez képest manapság már az ízületek, az izmok, a szív, a tüdő tevékenységét is vizsgálhatjuk élesben” – fűzte hozzá Tóth Benedek.

A klubok adatalapú működésének hagyománya még mindig erőteljesebb a tengerentúlon, mint Európában, de már sokkal kisebb a különbség, mint korábban. Az amerikai előny szociológiai és gazdasági tényezők mellett a sportágak milyenségéből is adódik. A legtöbb amerikai major sportág sokkal „tördeltebb”, mint a labdarúgás. A rövidebb, egy egységként elemezhető játékhelyzetek nagyban megkönnyítik, hogy a pályán zajló eseményeket a számok nyelvére lefordítsák. A legjobb példa talán a baseball, amelyben a történések szinte mindegyike leírható egy viszonylag egyszerű számsorral. Egy kosárlabdameccsen rengeteg pont van, egy támadás viszont egy szegmensnek tekinthető, amelynek a végén 0, 2 vagy 3 pont születik. Ezekben a maximum 24 másodperces blokkokban minden pályán lévő támadójátékos célja, hogy a labda a gyűrűbe kerüljön. Míg a fociban sokkal inkább szerteágazó, különböző kritériumokra összpontosító szempontrendszer alapján kell elemezni egy középhátvéd és egy jobbszélső játékának hasznosságát, addig a kosárlabdában egységesebb kritériumok az irányadók.

Például a New York Jets amerikaifutball-együttes is a cég partnere… 

„Jó példa, hogy a statisztikai modellek kimutatták, jobban jár az a csapat, amely igyekszik hárompontos dobással befejezni az akcióit, hiába nagyobb olyankor a hibázás lehetősége, mégis jobban megéri. Azóta sokkal többször próbálkoznak ezzel a játékosok. Ebből is látszik, hogy nemcsak a játék van hatással az adatokra, hanem az adatok is a játékra” – mondta Tóth Benedek.

Noha a tehetősebb sportklubok már Magyarországon is nyitottabbak a technológiai újdonságokra, a Starschemának főleg külföldi ügyfelei vannak. Olyanok kaliberűek, mint a Formula–1-ből a Ferrari istálló, az ausztrál krikettszövetség, világszerte ismert labdarúgóklubok és NFL-csapatok – például a New York Jets és Giants… Munkájuk része a kutatás, algoritmusok megalkotása és projektek közös létrehozása az ügyfelekkel együtt, az ő igényeiknek megfelelően. Az igények pedig korántsem korlátozódnak arra, ami a pályán történik, hiszen a szervezeteknek nemcsak az a fontos, hogyan jut a korong a kapuba vagy a labda a gyűrűbe, hanem az is, hogy amíg ez megvalósul, mit csinál a néző. Mit néz a telefonján, mit vásárol a büfében, milyen szurkolói termék érdekli és még folytathatnánk… A kettő természetesen nem választható el teljesen egymástól, hiszen a pályán történő események nem csupán érzelmi hatással vannak a szurkolókra, hanem telefonos értesítéseken keresztül akkor is elérik őket, ha éppen nem ülnek a lelátón vagy a tévé előtt.

Tóth Benedek magyaráz az NFL-meccs közben nyert adatokat megjelenítő monitor előtt

Ellenfélelemzés, szurkolói elköteleződés, sérülésmegelőzés és scouting (felderítés) a négy legfontosabb területe az adatelemzőknek.

„A sérüléssel kapcsolatos adatok nyilvánosságra hozatalától tipikusan ódzkodnak a klubok. Valami természetesen látszik belőle, de nem mindig tudható pontosan, mi történt és milyen hatása van. Az NFL-ben minden évben olvashatunk azzal kapcsolatos botrányról, hogy a kötelező sérülésbejelentést elmulasztják az egyesületek. Ennek taktikai és pénzügyi okai is vannak. Ilyenkor az ellenfél nem tudja, kire készüljön, kire ne. Sokszor a szerződések kötik az edzőket, játékosokat, amelyekben az áll, kötelező bizonyos számú meccsen játszani. Az orvosi stábnál ott vannak az adatok, amelyek nem hazudnak. A sérüléseket ezért is próbálják a klubok a lehető leginkább elkerülni. Természetesen, ha valakit a pályán lerúgnak, azt nem lehet megelőzni, legfeljebb az esélyét csökkenteni. Az edzésmunkából adódó sérülésekkel szemben viszont egészen hatékonyan lehet védekezni, hiszen látszik, hogy egyes mozgásformák hogyan terhelik a játékosokat, mitől és mikor fárad el legjobban egy izomcsoport, ami sérüléshez vezethet – magyarázta Sepp Ákos. – A vérben vannak olyan részecskék, amik egészen pontosan jelzik, mikor fárad el az izom, és ezeket figyelve két-három nappal előre lehet tudni, mekkora a testrész sérülésének esélye, és azt is, milyen beavatkozásra van szükség a megelőzéshez. Mi ezt jelezzük, az edzői stáb pedig dönt arról, szükséges-e beavatkozni.”

Ahogy az élet több területén, a sportban is kiaknázatlan még a gépi tanulás, a mesterséges intelligencia világa. Ahogy a nagy nyelvi modellek dinamikusan fejlődnek, úgy válik az MI egyre jobban alkalmazhatóvá az adatelemzőknek is.

 

„Nagyon izgalmas újdonság, a digital twin, vagyis digitális iker, ami azt kutatja, hogyan lehet digitálisan egy játékos mozgását, viselkedését klónozni, és olyan »mi lenne, ha« eseményeket szimulálni, amik nem történtek meg, de adott esetben megtörténhettek volna. Például, hogy az adott sportoló a meccs egyik pillanatában máshol van, máshova fordul, gyorsabban vagy lassabban fut, satöbbi. Anélkül kipróbálni felállásokat, taktikai elképzeléseket, modellezni egész bokszmeccseket, hogy bárki felvette volna a stoplis cipőt vagy a kesztyűt. Ezekkel a technológiákkal sokan kísérleteznek, és hatalmas potenciál van bennük” – avatott be Sepp Ákos.

(A cikk a Nemzeti Sport szombati melléklete, a Képes Sport 2024. április 13-i lapszámában jelent meg.) 

 

Legfrissebb hírek
Ezek is érdekelhetik