Új magyar adatelemző verseny

A Budapest Data Projects Meetup egy aktív közösség, és idén már rendezett egy adatelemző versenyt. Akkor az adatdonor a Balabit volr, és egérmozgásból kellett megállapítani, hogy a felhasználó valós-e. Izgalmas verseny volt, de elég kevés nevezővel. Most, szeptember 15-én újabb adatelemző verseny indul útjára, ahol bevásárlólisták hiányzó elemeit kell kitalálni. Az adatokat a Nextent Informatika Zrt. szolgáltatja, a Cetli nevű mobilalkalmazás adatai alapján.

A verseny a szépen fejlődő datapallet.io oldalon kerül megrendezésre, és két feladat vár a versenyzőkre. Az egyik feladat egy klasszikus adatelemző verseny olyan, mint amilyeket a Kaggle-n is találni, a másik feladat pedig abszolút freestyle kategória, bárki nevezhet diplomamunkával, önálló laborral, adat vizualizációval, bármivel, lényeg, hogy valami érdekes dolgot hozzon ki az adatokból.

Jó kis tanulópálya ez az adatelemző verseny, szerintem sokkal kisebb a belépési küszöb, mint az egérmozgásos osztályozásnál. Rengeteg olyan példa van, ahol klasszikus Shopping Basket elemzés van, ha más nem a RapidMiner példaprojektjei között is van. Lehet belőle csinálni “frequent item set”-et, azaz hogy miket vesznek együtt az emberek, illetve jó kis asszociációs szabályokat. A versenyen az fog nyerni, aki a legjobban megközelíti a valós hiányzó terméket a korsárból, mégpedig úgy, hogy megadja a 260 termékre, hogy szerinte mekkora valószínséggel az a hiányzó elem.

Mivel a verseny az én ötletem volt, ezért  kiváncsian várom, hogy mi lesz az eredménye, remélem, hogy sikeresen alakul majd. Lesz Szeptember 15-n a budapest.py szervezésében egy Data Night nevezetű meetup, ott lesz a hivatalos kihírdetése a versenynek, de a többi előadás miatt is érdemes oda eljönni.

Szerintem minden wannabe data scientist-nek érdemes a versenyre nevezni.