Korábbi sorozatunkban kifejtettük mik az előnyei a generatív mestereséges intelligenciának a marketingen belül. De mire képesek ezek a rendszerek? Hogyan lehet a segítségünkre a DALL-E-2 és milyen korlátai vannak a ChatGPT-nek? A generatív mesterséges intelligencia nyomában sorozatunk első részében ezekre keressük a választ!
Ahhoz, hogy a lehető legjobban meg tudjuk alapozni vagy éppen fenn tudjuk tartani versenyelőnyünket és pozíciónkat, meg kell értenünk, hogy mikre képesek az AI eszközök és hogyan járulhatnak hozzá szervezetünk sikerességéhez. Bár a legnagyobb visszahangot az elmúlt nagyjából fél évben kapták, már több éve léteznek a generatív AI rendszerek GANS, VAU és Transformer alapokon, az elmúlt 2-3 évben pedig, jobb algoritmusokkal, modellekkel, nagyobb adatszettekkel egyre kompetensebb munkát végezve gombamód szaporodni kezdtek, legyen szó akár helyesírásról, szövegalkotásról, hirdetésekről vagy közösségi média posztokról. Megannyi eszköz (pl. Grammarly, Jasper.ai, Copy.ai) áll rendelkezésünkre, amiket kipróbálva jobban is elmélyedhetünk a generatív mesterséges intelligencia által nyújtott lehetőségekben.
Kezdésként nézzük a technológia két egyik legismertebb AI rendszerét, kitérve arra, hogy miben lehetnek segítségünkre és milyen korlátozásokba ütközhetünk használatuk során.
ChatGPT:
Sok mindent hallhatunk már az OpenAI közismert mesterséges intelligencia rendszeréről, a ChatGPT-ről. A ChatGPT egy olyan nyelvi modell, ami képes a szöveges tartalmak feldolgozására, értelmezésére, valamint generálására. Nyelvi sokoldalúságának köszönhetően a világ legtöbb országában már elérhető, gyorsan és hatékonyan válaszol a feltett kérdéseinkre, automatizálja a folyamatokat, illetve a folyamatos fejlesztéseknek köszönhetően (majdnem) naprakész információkkal lát el bennünket. Ugyanakkor, mint minden más technológiának ennek is megvannak a maga hátrányai.
Igaz a legtöbb kérdésünkre jól válaszol mégis akadnak olyan kifejezések – bármelyik nyelvről van szó – amikkel nem tud mit kezdeni, hibásan értelmezi a neki szánt felvetéseket vagy éppenséggel parancsokat. Mivel a ChatGPT a világhálóról (annak is a múltjából, a GTP4 esetében 2021. szeptemberével bezárólag) gyűjti össze az információkat, aktuálisabb hírekre vonatkozóan könnyen előfordulhat, hogy helytelen válaszokat ad számunkra. Arról nem is beszélve, hogy más online szolgáltatásokhoz hasonlóan érzékeny adatok birtokában van, így érdemes odafigyelnünk akár saját, akár ügyfeleink adatainak biztonságára is.
Ha saját tartalmak gyártásához használjuk a ChatGPT-t vagy más, GTP-re alapozó AI modellt, azt is érdemes fejben tartanunk, hogy a Google 2023. februárjában közzétett irányelve alapján nem bünteti a saját kereső algoritmusában kimondottan az AI generált tartalmakat, de alapvetően az eredeti, kiváló minőségű tartalmakat jutalmazza, amely az általuk E-E-A-T-nek nevezett tulajdonságokat mutatja: szakértelem, tapasztalat, hitelesség és megbízhatóság (expertise, experience, authoritativeness, and trustworthiness). Ha a mesterséges intelligenciát csak egy olcsó, egyszerű módnak látjuk a keresőoptimalizálásra, akkor nem érdemes használnunk.
DALL-E-2:
A DALLE-E-2 Explained című YouTube videója is rávilágít arra, hogy a generatív mesterséges intelligencia rendszerek bizonyos feladatokat sokkal gyorsabban elvégeznek, mint egy grafikus. Itt elsősorban olyan munkafolyamatokra gondolunk, amik időigényesek, mint például egy képen szereplő élőlény, tárgy vagy más részlet könnyed kicserélése az in-painting funkcióval. Ebből adódóan a hasonló képgeneráló AI eszközök könnyen elláthatnak egy kupac monoton, időigényes munkákat, ami egy designer is stock képek keresgélésével kezdene, így sokkal több idő jut az alkotótoknak a kreativitást igénylő feladatok elvégzésére.
De mi a helyzet a hátrányokkal? Miért kell továbbra is odafigyelnünk arra, hogy mit generálunk? Legfontosabb, hogy bár egyedi ötletekkel áll elő a generatív AI, mégis vannak olyan elemek, amiket nem képes feldolgozni vagy nem megfelelően jeleníti meg őket. Ha mondjuk egy konkrét állatfajt keresünk, ami nem volt a tanuláshoz használt adatszettben (a videó példájával élve pl. egy bőgőmajmot), akkor lehet, hogy csak egy bőgő („kiabáló”) majmot kapunk. Ha pedig valami rosszul volt címkézve az adatokban, pl. egy repülő autóként lett jellemezve, akkor a rendszer a tanulási folyamatban rossz kifejezést sajátíthat el egy adott képhez. Emellett igaz a DALL-E-2 egyik legnagyobb hátrány, hogy bár gyorsan készít el egy képet, ezek döntő többségben továbbra is finomhangolásra, szerkesztésre szorulnak, ha a lehető legjobbat szeretnénk kihozni ötleteinkből.
Mindkét Open AI megoldásra igaz, hogy bár segítik a munkánkat és átveszik a monoton feladatok nagyrészét, mégse helyettesíthetnek bennünket teljesen. Azok a vállalkozások, akik csak a technológiai rendszerekre hagyakozva hoznak létre képeket, illetve szövegeket, hamar belefuthatnak abba, hogy olyan tartalmat hoznak létre, amik közepes vagy gyenge minőségűek és nem képviselnek értéket a követők számára.
Hogyan használjuk ki a generatív mesterséges intelligencia által nyújtott lehetőségeket úgy, hogy közben megtartjuk hatékonyságunkat is? Sorozatunk második részéből kiderül!
Forrás:
Comments are closed.