Hogyan erősíti a sztereotípiákat a generatív mesterséges intelligencia?

Ahogy a mesterséges intelligencia folyamatosan szivárog be az életünk minden területére, a Bloomberg újságírói nyugtalanító helyzetre mutattak rá: az AI nem mentes az emberi előítéletektől, sőt, gyakran csak tovább erősíti azokat. Miért férfi a vállalatvezető, az orvos, a mérnök és a jogász míg nő a pénztáros, a tanár, a szociális munkás és főleg a takarító? Ki a felelős ezekért az elfogultságokért és hogyan ellensúlyozhatóak?

A különböző képgeneráló eszközök, mint a Stable Diffusion vagy a Dall-E, gyorsan alakulnak a személyes önkifejezés szórakoztató, kreatív eszközeiből azokká a platformokká, amelyekre a jövő gazdasága épül. Ha az új ruhakollekciódhoz nem akarsz stúdiót, fotóst és modelleket bérelni, már most is elérhető olyan megoldás, amivel ruhamodelleket generálhatsz a reklámaidhoz. Közben az Adobe lehetővé teszi a felhasználók számára, hogy közvetlenül a Photoshopon belül hozzanak létre és szerkesszenek mesterséges intelligenciával generált képeket, a 125 millió aktív felhasználóval rendelkező, diákok, nonprofitok és marketingesek körében is népszerű Canván pedig 114 millió képet hoztak már létre a Stable Diffusion segítségével kínált új képgenerálási funkcióval.

És ez még csak a kezdet lehet. A Gartner szerint 2025-re a nagyvállalatok a marketingtartalmak 30%-át a Stable Diffusionhoz hasonló generatív AI-eszközökkel fogják előállítani, 2030-ra pedig szövegből videóvá alakított promptok segítségével blockbuster filmek is készülhetnek a mesterséges intelligencia használatával.

A képgenerálás sötét oldala

Az AI által kínált kényelem és potenciális gazdasági előnyök tagadhatatlanok, de ahogy ezek az eszközök terjednek, az általuk tükrözött előítéletek is erősödhetnek.

A Bloomberg a Stable Diffusion segítségével 2022 decembere és 2023 februárja között több mint 5000 képet generált. A szöveg-kép (text-to-image) modellt arra kérték az újságírók, hogy készítsen portrét 14 különböző munkakörben dolgozókról, valamint három, a bűnözéssel kapcsolatos kategória (rab, drogdíler és terrorista) megtestesítőiről. Ezen belül 300-300 képet kértek 7 olyan munkakörről, amelyet jellemzően jól fizetőnek tartanak az Egyesült Államokban, és ugyanennyit 7 olyanról, amelyet rosszul fizetőnek. (A Stable Diffusiont azért választották, mert az alapjául szolgáló modell ingyenes és transzparens, ellentétben a Midjourneyvel, a Dall-E-vel és más versenytársakkal.)

Mi volt az eredmény? A képgeneráló a faji és nemi sztereotípiákat a végletekig fokozza – a valóságnál messze egyenlőtlenlenebb képet festve.

Faji és nemi előítéletek

Abszolút érdemes átkattintani az eredeti cikkre a részletes eredményekért és az átlagolt, „tipikus” portréért, de néhány adat:

a mérnök képei között a 300-ból 298 egyértelműen férfiként volt azonosítható – a maradék kettő közül az egyik kép nemét nem tudták eldönteni, és csak az utolsó kép volt nőként azonosítható (szerk: az Eurostat adatai alapján a magyar mérnökök és tudósok között a nők aránya 2022-ben 31% volt)
a bíró portrék 3%-a volt nő, miközben a statisztikák szerint az Egyesült Államokban a bírók 34%-a nő (szerk: Magyarországon 2021-ben a női bírák aránya 69% volt)
az ábrázolt orvosok 7%-a volt nő, a valóságban az Egyesült Államokban 39%-uk nő (szerk: itthon a KSH adatai alapján pedig a dolgozó orvosok 42%-a nő)
az adatállományban a legtöbb foglalkozásban a férfiak domináltak, kivéve az olyan alacsonyabb fizetésű munkaköröket, mint a házvezető és a pénztáros – összességében háromszor annyi férfi képet generált a rendszer, mint nőt
az összes jól fizető munkakörhöz generált képkészletet a világosabb bőrszínnel rendelkezők dominálták
a modell 70%-ban sötétebb bőrszínű emberek képeit generálta a rosszabbul fizetett “gyorséttermi dolgozó” kulcsszóra, annak ellenére, hogy az USA-ban a gyorséttermi dolgozók 70%-a fehér bőrű
a “rab” kulcsszóra generált képek több mint 80%-a sötétebb bőrű embereket ábrázolt, annak ellenére, hogy az amerikai fogvatartottak kevesebb mint felét teszik ki
amikor arra kérték, hogy készítsen képeket egy “terroristáról”, a modell következetesen sötét arcszőrzetű, gyakran fejkendőt viselő férfiakat ábrázolt, egyértelműen a muszlim férfiakról alkotott sztereotípiákra támaszkodva

Miért fontos ez?

Minden mesterséges intelligenciamodellnek vannak eredendő torzításai, amelyek a tanuláshoz használt adatszettből adódnak. A folyamat minden elemében, ahol az ember elfogult lehet, az AI is elfogult lehet. A különbség az, hogy a technológia legitimálja az elfogultságot azzal, hogy objektívebbnek tűnik, holott ez egyáltalán nem így van.

Az iparági kutatók már évek óta kongatják a vészharangot a fejlett mesterséges intelligenciamodellekbe beépülő elfogultság veszélye miatt, és most az uniós jogalkotók olyan védintézkedésekre vonatkozó javaslatokat fontolgatnak, amelyek segítségével kezelhetők ezek a problémák. Amíg viszont nem zárkózik fel a szakma és/vagy a jogalkotás, a generatív AI nemcsak torzítja a valóságot azáltal, hogy elavult és káros sztereotípiákat erősít, hanem állandósítja az egyenlőtlenséget.

Hatása túlmutat a vizuális megjelenítésen; befolyásolja a döntéseket, a narratívákat és a társadalmi megítélést is. Például az igazságszolgáltatási rendszer tovább torzulhat, ha a gyanúsítottakról készült, mesterséges intelligencia által generált fantomrajzok ezeken az elfogultságokon alapulnak. De a pályaválasztást is könnyen befolyásolja, hogy mennyire látja vagy nem látja magát reprezentálva egy adott szakmában egy gyerek. Amikor a közeljövőben az AI által generált tartalom akár 90%-át is kiteheti az összes online elérhető tartalomnak, ezek a torzítások alapjaiban befolyásolhatják a következő generációt is.

Végül pedig ahogy a mesterséges intelligenciamodellek fejlettebbé válnak, az általuk létrehozott képeket egyre nehezebb megkülönböztetni a valódi fényképektől. Ha ezek a faji és nemi sztereotípiákat felerősítő képek visszakerülnek az adatszettbe, amin a jövőbeli modellek tanulnak, a következő generációs képgeneráló AI modelljei még elfogultabbá válhatnak.

Ki a felelős?

A Stable Diffusion a nyers adatokat a LAION-5B-ből, a világ legnagyobb szabadon hozzáférhető online kép- és szöveghalmazából nyeri, ami több mint 5 milliárd képet és képfeliratot tartalmaz. A képek linkjeit programozottan gyűjtötték össze számtalan weboldalról, emberi kurátori munka nélkül – bár valamelyest tisztították, kiszűrték például a pornográf tartalmakat.

Az adatszettet szolgáltató fél a felelős? Aki a modellt tanítja? Aki alkot vele? Nincs egyértelmű válasz.

Van kiút?

Vannak azért törekvések a mesterséges intelligencia rendszerekben jelenlévő torzítások ellensúlyozására. A cikkben megszólaltatott képviselő állítása alapján a Canva például dolgozik az AI-modellek “elfogulatlan” változatain annak érdekében, hogy a technológia igazságos és reprezentatív legyen. A Stable Diffusiont megalkotó londoni székhelyű startup, a StabilityAI szóvivője pedig abban bízik, hogy ha a modelljeinket nyíltan hozzáférhetővé (open source) teszik, a közösség együttműködhet majd az elfogultság-értékelési technikák javításában.

Forrás: Generative AI Takes Stereotypes and Bias From Bad to Worse (bloomberg.com)

Süti	Típus	Időtartam	Leírás
bcookie	0	2 years	Ezt a sütit a LinkedIn állítja be. A süti célja, hogy engedélyezze a LinkedIn funkciókat az oldalon.
language	0		Ez a süti a felhasználó által használt nyelvet segít megjegyezni.
mid	0	9 years	A sütit az Instagram állítja be. A cookie a felhasználók megkülönböztetésére és a releváns tartalom megjelenítésére szolgál a jobb felhasználói élmény és a biztonság érdekében.
rur	1		Amikor a bővítmény gyorsítótára kiürül, és a plugin kérést indít az Instagram API-jához, hogy új bejegyzéseket tudjon betölteni (api.instagram.com), a rur cookie-t állítja be a böngészőbe az API-hoz való kapcsolódás érvényesítéséhez, ez lehetővé teszik, hogy a weboldalon keresztül AJAX kérést adjon le az Instagram API-ra. Ezek a cookie-k nem adnak át vagy tárolnak személyes adatokat. Csak az első oldal betöltésére használják a bővítmény gyorsítótárának lejártát követően. A későbbi oldalbetöltések a WordPress adatbázisában tárolt adatokat tárolják, így az Instagram API-jához nem kell kapcsolódni.
SERVERID	0

Süti	Típus	Időtartam	Leírás
__utma	0	2 years	Ezt a sütit a Google Analytics állítja be, és a felhasználók és a munkamenetek megkülönböztetésére szolgál. A süti akkor jön létre, amikor a JavaScript könyvtár végrehajtásra kerül, és nincsenek létező __utma sütik. A süti minden alkalommal frissül, amikor az adatokat elküldi a Google Analyticsnek.
__utmb	0	30 minutes	A cookie-t a Google Analytics állítja be. A cookie az új munkamenetek / látogatások meghatározására szolgál. A süti akkor jön létre, amikor a JavaScript könyvtár végrehajtásra kerül, és nincsenek létező __utma sütik. A süti minden alkalommal frissül, amikor az adatokat elküldi a Google Analyticsnek.
__utmc	0		A cookie-t a Google Analytics állítja be, és törli, amikor a felhasználó bezárja a böngészőt. A sütiket a ga.js nem használja. A sütik lehetővé teszik az együttműködést az urchin.js-vel, amely a Google elemzés egy régebbi verziója, és amelyet az __utmb sütivel együtt használ új munkamenetek, ill. látogatások meghatározására.
__utmt	0	10 minutes	A Google Analytics által létrehozott saját sütit a felhasználói kérések feldolgozására és a webhely forgalmára vonatkozó statisztika készítésére használják.
__utmz	0	6 months	Ezt a sütit a Google elemzése állítja be, és azt a forgalmi forrást vagy kampányt tárolja, amelyen keresztül a látogató eljutott a webhelyre.
_gat	0	1 minute	Ezt a sütit a Google Universal Analytics telepítette a kérelem arányának csökkentésére, hogy korlátozza az adatgyűjtést a nagy forgalmú webhelyeken.
YSC	1		Ezeket a sütiket a Youtube állítja be, és a beágyazott videók megtekintésének követésére szolgálnak.

Süti	Típus	Időtartam	Leírás
_	0		Ezt a sütit a Facebook állítja be.
__asc	0	30 minutes
__qca	0	1 year	Ez a süti a Quantcasthoz társul, és anonimizált adatok gyűjtésére szolgál a különböző webhelyek naplózási adatainak elemzésére, jelentések készítésére, amelyek lehetővé teszik a webhelyek tulajdonosai és hirdetői számára a megfelelő közönségszegmensek hirdetéseinek biztosítását.
_fbp	0	3 months	Ezt a cookie-t a Facebook hirdetési termékek kézbesítésére használja azon személyek részére, akik a Facebook vagy a Facebook Advertising valamely digitális felületét böngészve weboldalunkat felkeresték. További információ: www.facebook.com/about/privacy
cref	0	1 year
fr	1	3 months	A sütiket a Facebook állítja be, hogy a felhasználók számára releváns hirdetéseket jelenítsen meg, valamint a hirdetéseket mérje és javítsa. A süti nyomon követi a felhasználó viselkedését az interneten keresztül azokon a webhelyeken, ahol Facebook pixel vagy Facebook közösségi plugin található.
IDE	1	2 years	A Google DoubleClick használja, és információkat tárol arról, hogy a felhasználó hogyan használja a weboldalt és minden egyéb hirdetést, mielőtt meglátogatná a weboldalt. Ezt arra használják, hogy a felhasználóknak olyan felhasználói hirdetéseket jelenítsenek meg, amelyek a felhasználói profil szerint számukra relevánsak.
mc	0	1 year	Ez a süti a Quantserve-hez kapcsolódik, hogy névtelenül nyomon tudja követni, hogy a felhasználó hogyan működik együtt a weboldallal.
uid	0	1 year	Ez a süti anonim módon méri a webhely látogatói számát és viselkedését. Az adatok tartalmazzák a látogatások számát, a webhely látogatásának átlagos időtartamát, a meglátogatott oldalakat stb., a célzott hirdetések felhasználói preferenciáinak jobb megértése céljából.
VISITOR_INFO1_LIVE	1	5 months	Ezt a sütit a Youtube állította be. A webhely beágyazott YouTube-videóinak nyomon követésére szolgál.
vuid	0	2 years

Süti	Időtartam	Leírás
__auc	1 year	Az Alexa Analytics cookie a felhasználói viselkedést követi.
_ga	2 years	Ezt a sütit a Google Analytics telepítette. A süti kiszámítja a látogatók, a munkamenetek, a kampány adatait és nyomon követi a webhely használatát az oldal elemzési jelentésében. A sütik névtelenül tárolnak információkat, és véletlenszerűen generált számot rendelnek az egyedi látogatók azonosításához.
_gid	1 day	Ezt a sütit a Google Analytics telepítette. A süti arra szolgál, hogy tárolja az információkat arról, hogy a látogatók hogyan használják a weboldalt, és segít egy elemző jelentés elkészítésében arról, hogy a weboldal hogyan működik. Az összegyűjtött adatok tartalmazzák a látogatók számát, a forrást, ahonnan származnak, és az oldalak névtelen formában készültek.
_hjid	11 months	Ezt a sütit a Hotjar állította be. Ezt a sütik akkor állítják be, amikor az ügyfél először egy oldalra kerül a Hotjar szkripttel. A véletlenszerű felhasználói azonosító megmaradására szolgál, amely a böngészőben az adott webhelyre egyedi. Ez biztosítja, hogy az ugyanazon webhely későbbi látogatásainak viselkedése ugyanahhoz a felhasználói azonosítóhoz legyen hozzárendelve.
_hjIncludedInSample		Ez a süti úgy van beállítva, hogy értesítse a Hotjart arról, hogy a látogató szerepel-e a mintában, amelyet hőtérképek, tölcsérek, felvételek stb. előállítására szolgál.
GPS	30 minutes	Ezt a sütit a Youtube állítja be, és egy egyedi azonosítót regisztrál a felhasználók követésére a földrajzi helyzetük alapján.

Süti	Típus	Időtartam	Leírás
_uv_id	0	2 years	Ezt a sütit a SlideShare állította be.
ig_did	1	9 years
UIDR	0	1 year	Ez a süti a scorecardresearch.com webhelyre van beállítva. A sütik segítségével nyomon követhetők a felhasználók internetes tevékenységei a böngészőben, például a látogatási időbélyeg, az IP-cím és a legutóbb meglátogatott weboldalak. Illetve elküldheti az adatokat harmadik félnek elemzésre és jelentésre, hogy segítsék ügyfeleiket a felhasználói preferenciák jobb megértésében.