A mesterséges intelligenciakutatás egyik kevésbé közismert, de annál izgalmasabb ága a megerősítéses tanulás, vagyis a reinforcement learning. Ezzel a technológiával működnek például azok a számítógépes programok, amik képesek legyőzni a sakkhoz vagy a kínai eredetű gohoz hasonló, összetett gondolkodást igénylő stratégiai játékok világbajnokait. Hogyan hasznosítható ez az üzleti életben?
Mi is az a megerősítéses tanulás?
A gépi tanulás, azaz a machine learning (ML) hagyományos formájával szemben, ami historikus adatok alapján fogalmaz meg jóslatokat, a megerősítéses tanulás teljesen eltérő logikára épül. Utóbbi esetében ugyanis a tanuló nem támaszkodik előzetes adatkészletekre, hanem saját maga fedezi fel próbálgatások sorozatán keresztül, hogy az adott környezetben milyen tevékenységek, műveletek bizonyulnak helyesnek. Ehhez ugyanazt a műveletsorozatot akár több milliószor is meg kell ismételni egymás után. De minden alkalommal a korábbi kimeneteleket figyelembe véve módosíthatok a műveletek, a lehető legideálisabb megoldás érdekében.
A tanuló vagy minden műveletet követően, vagy a teljes műveletsorozat végén visszacsatolást, megerősítést – vagyis jutalmat vagy büntetést – kap a teljesítményéről. Ezt megjegyzi, majd megtartja azokat a lépéseket, amik a többinél jobb eredményt produkáltak. Így kellő számú próbálkozás után megkaphatjuk egy adott feladat teljesítésének legoptimálisabb módját. Ez pedig sok esetben egy annyira új és kreatív megközelítést jelent, amire magunktól valószínűleg sosem gondoltunk volna!
Hogyan használhatjuk ezt fel az üzleti folyamatokban?
A megerősítéses tanulás kiválóan alkalmazható olyan folyamatok automatizálására vagy optimalizálására, amik során sorozatosan kell döntéseket hoznunk. Az előbbire jó példaként szolgál a szállítókonténerekbe történő berakodás automatizálása robotkarok segítségével. Az utóbbira pedig annak a folyamatnak az optimalizálása, amikor egy nem fizető ügyféllel való kapcsolatfelvétel előtt a lehető leghatékonyabb és legkisebb költséggel járó kommunikációs csatornát próbáljuk kiválasztani.
A megerősítéses tanulás rendkívül fejlett technológia, ami az üzleti folyamatokra nézve sokféle felhasználási lehetőséget rejt magában. Vállalati alkalmazása újszerűségéből adódóan még nem terjedt el széles körben, ugyanakkor ahogy a legtöbb innováció esetében, itt is vannak úttörők. Hogy eddig kik és milyen céllal döntöttek a reinforcement learning bevezetése mellett, az a következő részből derül ki!
Comments are closed.