Előző cikkünkben bemutattuk a gépi tanulás egyik kevésbé elterjedt, de annál több lehetőséget magában rejtő formáját, a megerősítéses tanulást és elméleti felhasználási területeit.
Már tudjuk, hogy a megerősítéses tanulás kiválóan alkalmas a sorozatos döntésekből és az ezeknek megfelelő műveletből álló folyamatok automatizálására, optimalizálására. Ennek ellenére a technológiát egyelőre főként szűk körben, tudományos területen, és a robotikában, videójáték-fejlesztések során használják. De néhány nagyobb vállalat már sikeresen bevezette ezt a fajta gépi tanulást az emberi agy által nehezen kezelhető problémák megoldására.
A megerősítéses tanulás legjobb példái
-
Google
A megerősítéses tanulás egyik kitűnő felhasználási lehetőségét ismerhetjük meg a Google példáján keresztül. A techóriás az adatközpontok hűtését optimalizálta a technológia segítségével. A folyamat során inputként a hőmérséklet és a légnyomás szolgál, az ágens ezekhez alkalmazkodva, önállóan gondoskodik a különböző hűtőegységek be- és kikapcsolásáról. Így nemcsak a hőmérsékletet optimalizálhatják, de az energiafelhasználást is.
-
Spotify
A Spotify esetében a megerősítéses tanulás a felhasználóknak történő, személyre szabott zeneajánlásban jelenik meg. Itt a korábban kedvelt, nem kedvelt, és le nem játszott dalok jelentik az inputot. Ezek alapján állítja össze a motor az adott felhasználó számára a legideálisabb ajánlásokat tartalmazó lejátszási listát, hogy maximalizálják, mennyi időt tölt az alkalmazásban.
-
Netflix
A Netflix az üzleti partnerek eszközein történő tesztelés ütemezésének optimalizálására használja a technológiát. A korábbi teszteredményekre és az adott eszköz teljesítményére vonatkozó információkat veszik alapul, majd a megerősítéses tanulás meghatározza, melyik tesztet kell elvégezni ahhoz, hogy az eszközök meghibásodásának lehetősége minimális legyen.
-
JPMorgan Chase
A befektetési bank és pénzintézet a pénzügyi származtatott ügyletek kockázatának számítása és árazása során alkalmazza a gépi tanulás ezen formáját. Ennek segítségével ugyanis maximalizálható egy adott befektetési portfólió jövőbeli cash-flow-ja.
-
DiDi
A kínai székhelyű közlekedési szolgáltató cég az utasfelvételi idő minimalizálása és a bevétel maximalizálása érdekében vezette be a megerősítéses tanulást. Az adott pillanatban szabad járművek száma, a megrendelések száma, a helyszínek és az úticélok szolgálnak inputként, majd a rendszer ezek alapján párosítja össze a sofőröket és az utasokat.
A fenti példák ismeretében felmerülhet a kérdés: a saját cégünkben milyen folyamatokat lenne érdemes optimalizálni vagy automatizálni?A következő részben 5 hasznos tanácsot olvashatsz arról, milyen szempontokat célszerű figyelembe venni ehhez.
Comments are closed.