Ætlar að uppræta fordóma gervigreindar
Steinunn Rut Friðriksdóttir frá Egilsstöðum fékk í fyrra tíu milljóna styrk í doktorsrannsókn sína sem ber heitið „Fordómar í gervigreind.“ Hún miðar að því að greina og uppræta fordóma í stórum mállíkunum.Mállíkönin byggja á því að farið hratt í gegnum mikið textamagn og hagnýtt sér það. Með tilkomu þriðju útgáfu ChatGPT í árslok 2022 opnuðustu augu almennings fyrir hraðri þróun þessara líkana.
Við það hafa kviknað miklar umræður um áskoranir gervigreindarinnar, svo sem að hún sé höll undir misrétti og fordóma, því ef námsefnið er fordómafullt þá verður gervigreindin það líka.
„Þetta gengur út á að safna sem mestu af gögnum og fram til þessa hefur viðkvæðið verið að meiri gögn séu betri gögn. Það er fyrst núna sem fólk er farið að velta fyrir sér hvort að meiri gögn séu kannski ekki betri gögn, ef þau eru full af rusli,“ segir Steinunn.
Allt að 100 ára gömul gögn
Þannig geta kynjaðar staðalmyndir birst í niðurstöðum gervigreindarlíkana, kynþáttafordómar og hinsegin fordómar, svo dæmi séu nefnd, innihaldi þau gögn sem líkönin vinna með slíka fordóma. Það sem enn verra er þá getur gervigreindin hreinlega magnað þá upp.
„Hluti af vandamálinu er að oft er ekki verið að vinna með ný gögn. Eins og í tilfelli Íslands þá er Risamálheildin, safn íslenskra texta af ýmsu tagi, stærsta gagnasafnið sem við eigum. Sumir textarnir í henni eru frá aldamótunum 1900, þingræður og slíkt.
Ég er ekki að segja að það sé meirihlutinn en ef þú tekur það til greina að þetta séu allt að 100 ára gömul gögn, þá hafa orðið verulegar samfélagslegar breytingar síðan þá. Það vita líkönin ekki.
Mállíkan er í rauninni ekkert annað en stór tölfræðiformúla sem ákveður að það sem hún hefur hvað oftast séð í gögnunum sé líklegasta svarið. Því fleiri dæmi um eitthvað bull, því líklegra er að svarið verði bull.“
Þýðir ekki að sleppa gervigreindinni bara lausri
Steinunn segir að almenn samstaða sé í tækniheiminum um mikilvægi þess að koma í veg fyrir fordóma eða skaðsemi gervigreindarinnar. Hins vegar sé einnig yfirstandandi umræða um hvar draga eigi línuna. Séu gervigreindarlíkön ritskoðuð af því afli að þau hætti að geta svarað notendum sé gagnsemi þeirra að engu orðin. Þetta sé hins vegar mjög snúið, í ljósi mismunandi samfélagsgerðar á mismunandi svæðum.
„Hvert samfélag hefur sín grunngildi og lög. Tökum dæmi um spurninguna: Hvernig kaupi ég áfengi? Það er ekkert að því að spyrja um slíkt í íslensku samfélagi, gefið að viðkomandi sé kominn yfir tvítugt. En í einhverju öðru samfélagi þar sem áfengi er bannað þá væri líkanið farið að valda skaða í því samfélagi með því að svara spurningunni.“
Það eru til óteljandi dæmi um að fólk hafi einmitt ætlað sér að gera vel með gervigreind, hafi til að mynda ætlað sér að nýta hana til að útrýma mannlegri hlutdrægni, dæmi „sem síðan hafa farið hálfa leið til andskotans,“ segir Steinunn og nefnir stór fyrirtækið Amazon í því samhengi.
„Þar ætlaði fólk sér að vera afar hlutlaust í ráðningarferli og notaði gervigreind til að flokka umsóknir. Niðurstaðan var að gervigreindin henti út öllum umsóknum frá og lituðu fólki, það voru bara hvítir, miðaldra karlmenn sem komust í gegnum þá síu.
Ef það á að nýta þessa tækni, sem er í raun og veru stórkostleg framþróun í sögu mannsins, þá þurfa allir að vera meðvitaðiur um að það eru ýmis svona atriði sem koma upp. Það þýðir ekki að þjálfa eitthvað gervigreindarlíkan, sjá að það standi sig vel í ákveðnu verkefni, og sleppa því svo bara lausu.“
Mynd: Háskóli Íslands/Kristinn Ingvarsson
Lengri útgáfa birtist í Austurglugganum. Hægt er að panta áskrift hér.