Az adatelemzés olyan munka, mint a nyomozóké – interjú Békés Gáborral, a sikerkönyv társszerzőjével
Ritkán írnak magyar szakemberek olyan tankönyvet, amelyből az élvonalbeli egyetemek tucatjai – a McGilltől a Bocconiig – azonnal tanítani akarnak. Békés Gábor és Kézdi Gábor adatelemzést tanító könyve hamar nemzetközi siker lett, amelyet több Nobel-díjas is ajánl. Többek között azért, mert nulláról elkezdheti bárki, miközben egyből a mély vízbe, a valós és problémás adatok közé küldik az olvasót. Ki a legjobb fociedző az angol Premier League-ben vagy a magyar megyei bajnokságban? Miért nem elég a cégeknek felvenniük néhány őrült jó matekost, és mit számít az AI az adatelemzésben? A könyv első része nemrég megjelent magyar fordításban is, ennek apropóján beszélgettünk Békés Gáborral, a könyv társszerzőjével.
Miért lehet az, hogy húsz éve minden második közgázos hallgató stratégiai tanácsadó akart lenni, most pedig már inkább adattudós? Vagy ha nem is adattudós, legalábbis lényegesen magabiztosabban akarnak mozogni ezen a területen, annyira megnőtt az értéke.
Ezt nem tudnám pontosan megmondani, de az egyik része nyilván a kereslet, hogy mivel lehet pénzt keresni, és az milyen munka. Ennek a területnek már legalább húsz éve folyik a népszerűsítése. Emlékszem, hogy amikor tíz-tizenegy éve először kezdtük tanítani a most könyvben is kiadott tananyagunkat, az első diára Hal Varian híres idézetét tettük.
Hal Varian a világ egyik leghíresebb mikroökonómusa és tankönyvírója. Egyebek mellett a Google vezető közgazdásza 2002 óta, kulcsszerepe volt a Google adatelemzési módszereinek felépítésében. Az említett idézet a következő: „Ha olyan karriert keresel, ahol nagy lesz a kereslet a szolgáltatásaidra, akkor keress olyat, ahol ritka kiegészítő szolgáltatást nyújtasz valami olyanhoz képest, ami kezd mindenhol elterjedni, és egyre olcsóbb eközben. És mi lesz mindenhol jelen, ami olcsó? Az adatok. És mi egészíti ki az adatokat? Az elemzés. Ezért azt javaslom, hogy arról vegyél fel sok kurzust, hogy hogyan kell adatokat rendezni és elemezni: adatbázisok, gépi tanulás, ökonometria, statisztika, vizualizáció és így tovább.”
El tudom mondani viszont, hogy mi az érdekes egy ilyen adatmunkában. Itt Mr. Wolfe-hoz hasonlóan problémákat oldunk meg: valamit nem értünk, vagy furcsa mintázatot látunk, ami után az a kérdés, milyen magyarázatot lehet rá találni és hogyan lehet valamilyen érdekes összefüggést mennyiségi mutatókkal leírni. Legközelebb talán az újságírói vagy egy nyomozói munka van ehhez, mert bár nem eszközök nélkül, de megpróbálunk megragadni valamit, ami nem triviális. Ez egy intellektuálisan nagyon érdekes foglalkozás. Nyilván ez a része van a felszínen, és alatta pedig rengeteg aprólékos technikai kérdés. De van valami igazán vonzó ebben a nyomozásban: miközben statisztikát a legtöbben nem szeretnek tanulni, adatelemzést igen. Ezzel persze még mindig nem válaszoltam a kérdésre, csak egy kicsit.
⇒ Tovább az interjúra