Sviðsljós
Höskuldur Daði Magnússon
hdm@mbl.is
Viðskiptahættir stórfyrirtækja í tengslum við höfundarréttarvarið efni hafa verið talsvert til umfjöllunar að undanförnu. Nú standa yfir málaferli rithöfunda á borð við Söruh Silverman gegn Meta, móðurfyrirtæki Facebook, Instagram og WhatsApp. Málaferli þessi snúa að brotum á höfundarrétti þegar fyrirtækið notaði í leyfisleysi efni höfundanna til að þjálfa gervigreindartól sitt.
Fjallað er um þetta í tímaritinu The Atlantic í vikunni. Í grein blaðsins er rakið að þegar starfsmenn Meta hófu þróun á gervigreindarforritinu Llama 3 hafi þeir staðið frammi fyrir siðferðislegri spurningu. Til að geta keppt við önnur gervigreindarforrit þyrfti að þjálfa Llama 3 með miklu magni af gæðaefni og það gæti tekið tímann sinn að fá leyfi fyrir slíkri notkun. Ættu þeir kannski bara að stela efninu í staðinn?
Starfsmenn Meta funduðu með fjölda fyrirtækja um kaup á réttindum að bókum og vísindagreinum en leist ekki vel á þá kosti sem buðust. Of dýrt þótti að kaupa efnið og tímafrekt væri að koma því í notkun, jafnvel rúmlega fjórar vikur.
Sótt á ólöglegt bókasafn
Þá kemur fram í gögnum að starfsmenn gerðu sér grein fyrir því að ef þeir keyptu réttinn að svo mikið sem einni bók væri ekki hægt að beita þeim rökum í mögulegum málaferlum að þeir teldu sig hafa rétt á slíkri gagnanotkun án þess að greiða fyrir (e. fair use strategy).
Í gögnum málsins kemur fram að yfirmenn hjá Meta lögðu á það ríka áherslu að fá bækur sem fyrst til að þjálfa gervigreindina. Því beindist athygli fyrirtækisins að Library Genesis, LibGen, sem er eitt stærsta rafræna bókasafn í heimi. Þar er að finna um 7,5 milljónir bóka og 81 milljón vísindagreina og rannsókna. Öllu þessu efni hefur verið hlaðið inn á LibGen með ólögmætum hætti, án samþykkis rétthafa. Því má segja sem svo að efnið sem Meta notaði fyrir gervigreind sína hafi verið stolið í tvígang; fyrst af þeim sem hlóðu því inn á LibGen og svo af stórfyrirtæki Marks Zuckerbergs. Og talandi um hann, fram kemur í áðurnefndum gögnum að starfsmenn Meta hafi fengið leyfi frá „MZ“ til að hlaða niður og nota efnið.
Mikið af íslensku efni
Í greininni á vef The Atlantic geta lesendur kynnt sér hvaða efni er að finna í gagnagrunni LibGen. Stutt grúsk leiðir í ljós að þar er að finna mikið magn af íslensku efni, svo sem þýddar bækur eftir spennusagnahöfundana Arnald Indriðason, Yrsu Sigurðardóttur og Ragnar Jónasson, bækur eftir rithöfunda á borð við Hildi Knútsdóttur og Jón Kalman Stefánsson og vitaskuld bækur Nóbelsskáldsins Halldórs Laxness. Þá er þar einnig að finna vísindagreinar eftir þekkta Íslendinga, til að mynda Kára Stefánsson, forstjóra Íslenskrar erfðagreiningar.
Vonlaust er þó að vita nákvæmlega hvaða efni Meta notaðist við. Ár er liðið síðan fyrirtækið læsti krumlum sínum í gagnagrunninn og síðan þá hefur mikið efni bæst við hjá LibGen. Ljóst má þó vera að úr nægu efni var að velja.
BitTorrent kemur í bakið
Mál hafa verið höfðuð gegn Meta og OpenAI vegna notkunar á höfundarréttarvörðu efni án leyfis. Bæði fyrirtækin bera við „sanngjarnri notkun“ í vörnum sínum fyrir dómstólum, þ.e. að vélþýðingar á efninu hafi breytt því í „ný verk“.
Hins vegar, eins og bent er á í grein The Atlantic, er annað uppi á teningnum varðandi notkun á efni frá LibGen. Það er gjarnan sótt með BitTorrent-skráarskiptaforritum og slík iðja felur jafnan í sér að notendur deila efni með öðrum um leið og þeir sækja efni sjálfir. Því kann að vera að Meta hafi ekki aðeins gerst sekt um að stela höfundarréttarvörðu efni heldur hafi fyrirtækið einnig tekið þátt í að dreifa slíku efni. Erfitt gæti reynst að verjast slíkum ásökunum fyrir dómstólum. Fyrirtækið hefur staðhæft að gripið hafi verið til aðgerða til að koma í veg fyrir slíkt og að engar sannanir liggi fyrir um að svo hafi verið.
Formaður Rithöfundasambands Íslands
Einbeittur brotavilji hjá Meta
„Þarna er mjög einbeittur brotavilji hjá þessu stórfyrirtæki sem hlýtur að hafa einhverjar afleiðingar,“ segir Margrét Tryggvadóttir, formaður Rithöfundasambands Íslands, þegar viðskiptahættir Meta eru bornir undir hana. Margrét er ósátt eftir lestur greinarinnar í The Atlantic.
„Eitt voldugasta fyrirtæki í heimi er að stela hugverkum af útgefendum og einyrkjum. Það er algerlega ólíðandi. Þetta er bara stór stuldur.“
Aðspurð segir Margrét að mikil umræða sé um það meðal rithöfunda á alþjóðavísu hvernig bregðast eigi við þessari þróun. Ekki hafi verið mikið um að alþjóðastofnanir hafi beitt sér gegn ólögmætri notkun á hugverkum við þróun gervigreindar. Hún segir að Evrópusambandið hafi slegið einhverja varnagla og sett reglur en þær hafa til að mynda ekki enn verið innleiddar hér.
„Við Íslendingar höfum ekki enn innleitt regluverk sem við ættum að vera löngu búin að innleiða. Öll rétthafafélög og BÍL hafa kallað eftir því að svokölluð DSM-tilskipun verði innleidd. Við höfum ekki innleitt einföldustu gerð og nú þegar er endurskoðun hennar farin í gang samhliða því hvernig tæknin hefur þróast.“
Hún segir að ýmsar aðgerðir séu til skoðanir hjá Rithöfundasambandinu. „Við erum að skoða hvað hægt er að gera. Við tökum þátt í norrænu samstarfi, Evrópusamstarfi og á alþjóðavísu. Þetta er til umræðu alls staðar og það er best að vera í samfloti með stærri, erlendum rétthafasamtökum.“