Tekoäly- ja kielimalleja koulutetaan valtavalla määrällä dataa. Koulutusaineisto ei kuitenkaan tule tyhjästä, vaan se on aina jonkun tekemää. Sisällöistä suuri osa on tekijänoikeuden suojaamia, ja ne ovat luovan työn tekijöiden ja muiden oikeudenhaltijoiden elinkeino.
Tekijänoikeus tarkoittaa sitä, että teoksen tekijällä on yksinoikeus päättää teoksensa käytöstä ja saada tästä asianmukainen korvaus. Tällä hetkellä teosten käytöstä tekoälyn kouluttamisessa ei ole sovittu tekijöiden tai muiden oikeudenhaltijoiden kanssa, joitakin yksittäisiä suoria sopimuksia lukuun ottamatta.
Oikeudellisesti epävarmoissa tilanteissa lisensioinnilla voidaan luoda teosten käyttäjille varmuutta siitä, että he toimivat lain mukaisesti ja vastuullisesti. Myös EU:n tekoälyasetus velvoittaa tekoälytoimijoita noudattamaan tekijänoikeuksia.
Oikeudenhaltijoilla ei ole toistaiseksi kuitenkaan keinoja selvittää, millä tavoin heidän teoksiaan on hyödynnetty tekoälyn kehittämisessä.
Vain yhtä tekoälyn kriittistä ainesta halutaan käyttää ilmaiseksi
Tekijänoikeuden suojaamat sisällöt, kuten tekstit, kuvat, musiikki ja av-teokset, ovat keskeistä rakennusainetta tekoälyn kehittämisessä ja kouluttamisessa. Jostain syystä luovaa työtä ei kuitenkaan nähdä tekoälyn kehittämisen raaka-aineena, josta tarvitsisi maksaa.
Samanlaista kyseenalaistamista ei ole nähty muista tekoälyn kehittämisen kannalta kriittisistä raaka-aineista. Kukaan ei edellytä, että tekoälyn kehittämiseen tarvittavat mikrosirut tai sähkö tulisi luovuttaa tekoäly-yrityksille ilmaiseksi.
Teknologia-alalla ja tiedeyhteisössä on esitetty, että tekstin- ja tiedonlouhinnan rajoitussäännös kattaisi teosten hyödyntämisen myös tekoälyn kouluttamisessa ja kehittämisessä. Näin laajalla tekstin- ja tiedonlouhinnan tulkinnalla pyritään mahdollistamaan tekoälyn kouluttaminen luovan työn teoksilla ilman lupaa ja korvausta.
Toisin kuin yritetään väittää, eivät tekstin- ja tiedonlouhinta ja tekoälyn kehittäminen ole synonyymeja keskenään. Tekstin- ja tiedonlouhintaa koskevan pykälän perusteluissa ei oteta kantaa siihen, soveltuuko kyseinen pykälä tekoälyn toimintaan. Myöskään lain taustalla olevassa EU-direktiivissä ei mainita tekoälyä tai koneoppimista sanallakaan.
Kun nykyistä tekijänoikeuslakia ja sen pohjalla olevaa EU-direktiiviä laadittiin, nykyisenkaltaiset generatiiviset tekoälysovellukset eivät olleet laajamittaisessa käytössä. Tekoälyn kouluttamiseen ja kehittämiseen liittyvien säännösten tulkintaa selvitellään tällä hetkellä useissa oikeudenkäynneissä eri puolilla maailmaa, myös Euroopassa.
Tekstin- ja tiedonlouhinnan rajoitus ei sovellu generatiiviseen tekoälyyn
Tekstin- ja tiedonlouhinnalla tarkoitetaan automaattista analyysitekniikkaa, jonka tarkoituksena on analysoida digitaalisessa muodossa olevaa tekstiä ja dataa tietojen, esimerkiksi mallien, suuntausten tai korrelaatioiden, tuottamiseksi.
Generatiivisessa tekoälyssä ei ole kyse pelkästä automatisoidusta tekniikasta, jolla analysoidaan tekstiä ja dataa tietojen tuottamiseksi. Generatiivisen tekoälyn kouluttamisella pyritään myös uuden sisällön tuottamiseen.
Tekstin- ja tiedonlouhinnan rajoitus kattaa ainoastaan kappaleen valmistamisen tekstin- ja tiedonlouhintaa varten, ei esimerkiksi yleisön saataville saattamista.
Tekstin- ja tiedonlouhinnan säännös ei sovellu kaikkeen tekijänoikeudellisesti relevanttiin toimintaan, jota tapahtuu generatiivisen tekoälyn koulutus-, kehittämis- ja käyttöprosesseissa. Tämä on ilmeistä, etenkin kun otetaan huomioon myös tekstin- ja tiedonlouhinnan määritelmä ja rajoitussäännösten vakiintunut suppea tulkinta.
Tämä tarkoittaa, että tekoälyn kehittämiseen tarvitaan myös tekijänoikeuslupia.
Lisensiointi ratkaisun avaimena
Tekoälyn ja kielimallien kehittäjillä ja tarjoajilla on tarve hyödyntää valtavaa määrää teoksia, minkä vuoksi suorien lupien hankkiminen on hankalaa. Luovan alan tekijälle tai muulle oikeudenhaltijalle oikeuksien valvominen ja lupien neuvotteleminen ylikansallisten jättien kanssa taas on käytännössä mahdotonta.
Kollektiivinen lisensiointi eli tekijänoikeusjärjestöjen tarjoama kattava lupa olisi oikeusvarma ratkaisu tilanteeseen, joka on ongelmallinen niin luovan työn tekijälle kuin vastuullisille tekoälysovellusten tarjoajille.
Kopioston kaltaiset, luovaa alaa edustavat tekijänoikeusjärjestöt voivatkin toimia teosten käyttäjien ja oikeudenhaltijoiden välillä palvelevana linkkinä. Ne voivat tarjota oikeudenhaltijoiden kanssa muotoiltuja luparatkaisuja tekoälytoimijoille ja varmistaa, että tekijät saavat asianmukaisen korvauksen, kun heidän teoksiaan käytetään.
Lisensiointia voidaan tukea myös lainsäädännöllä. Tilanteissa, joissa tekstin- ja tiedonlouhinnan rajoitus ei sovellu, lisäisi lakiin säädetty sopimuslisenssi oikeusvarmuutta. Sopimuslisenssillä opetus- ja kulttuuriministeriön hyväksymä tekijänoikeusjärjestö voi myöntää kattavia lupia teosten käyttöön muidenkin kuin edustamiensa tekijöiden puolesta. Sopimuslisenssijärjestelmä helpottaa käyttölupien hankkimista keskitetysti.
Tekoälyä koskevalla sopimuslisenssillä saataisiin oikeudellista tukea innovaatioiden ja tekoälymallien kehittämiseen huomioiden luovan alan ammattilaisten oikeuden asianmukaiseen korvaukseen ja päätökseen omien teostensa hyödyntämisestä.
On tärkeää muistaa, että osa tekijöistä tai oikeudenhaltijoista ei halua, että heidän teoksillaan koulutetaan tekoälyä tai niitä hyödynnetään tekoälysovelluksissa. Tätäkin tekoälyn kehittäjän tulee kunnioittaa. Kiellot voidaan huomioida niin kollektiivisissa kuin sopimuslisenssiin nojaavissa luparatkaisuissa.
Kollektiivisia luparatkaisuja tulossa
Tekijänoikeusjärjestöjen lisensiointiratkaisuja on jo maailmalla tulossa, esimerkiksi USA:ssa ja Iso-Britanniassa.
Myös meillä Kopiostossa selvitetään keinoja valvoa teosten käyttöä ja rakentaa luparatkaisuja tekoälyn kouluttamiseen ja kehittämiseen. Lisenssiratkaisut kehitetään aina yhdessä luovan alan edustajien kanssa tekijöiden ja oikeudenhaltijoiden näkemykset huomioiden.
Tekoälymalleja on jo koulutettu ja kehitetty pitkälti luvatta, luovan alan ammattilaisten tekemällä sisällöllä. Teosten tekijät ja oikeudenhaltijat tulisi vihdoin ottaa osaksi tekoälyn aikakauden arvoketjuja. Tekoälyn kehittäminen ja hyödyntäminen on valtava mahdollisuus niin teknologiayhtiöille kuin luovalle alalle ja koko yhteiskunnallemme, kunhan perusasiat saadaan yhteistyössä kuntoon. Luovan sisällön hyödyntäminen ei voi olla ilmaista.
– Kirsi Salmela, Kopioston lakiasiainjohtaja