Lukimo and Article 50 - An Example of doing the AI Act Correctly

Mikä on Lukimo?

Lukimo on suomalainen tekoälypohjainen äänituotantoalusta, joka tarjoaa noin 35 ammattimaisesti tuotettua suomenkielistä ääntä neuroverkkojen avulla. Jokainen äänitalentti on allekirjoittanut lisensointisopimuksen Lukimon kanssa.

Lopputulos on studiolaatuinen TTS-ääni, jota voi käyttää sekä verkkosovelluksen että REST-rajapinnan kautta. Krediittejä käytetään vesileimallisiin esikatseluihin ja ei-kaupallisiin latauksiin. Kävin hauskan keskustelun perustajan ja toimitusjohtajan Marko Tähtikumpu kanssa, jossa kävimme läpi hänen loistavaa palveluaan ja liiketoimintamalliaan. Kyseessä on käytännössä Spotify äänitalenteille: artisti saa korvauksen joka kerta, kun hänen ääntään käytetään joko yhdistettynä muihin ääniin tai yksinään. Jos kolmen artistin ääniä yhdistellään tasapuolisesti, kukin saa 33,33 % tuotoista käyttökertojen perusteella. Jos käytössä on vain yksi ääni, kyseinen artisti saa 100 % jokaisen käyttökerran tuotosta.

Tämä artikkeli ei varsinaisesti käsittele Lukimoa, vaikka suosittelen tutustumaan siihen lämpimästi etenkin B2B-luovuustoimistoille ja äänitalenteille. Sen sijaan se käsittelee oikeudellisia näkökohtia ja sitä, mitä Marko ja hänen tiiminsä ovat tehneet EU AI Act Artikla 50:n velvoitteiden täyttämiseksi. Käyn myös läpi asioita, joita heidän kannattaa vielä ottaa huomioon.

Miksi tällä on merkitystä

Kaksi asiaa, jotka ovat oikeudellisesti keskeisiä:

Kyseessä on valikoitu katalogi ennalta määritellyistä äänistä, ei asiakkaan toimittaman näytteen perusteella tapahtuva mielivaltainen äänten kloonaus.
Äänitalentit ovat antaneet suostumuksensa.

Molemmat rajaavat Lukimon vastuuta huomattavasti verrattuna esimerkiksi ElevenLabsin tyyppiseen pikaiseen äänenklonaukseen.

Missä Lukimo sijoittuu tarjoajan ja käyttöönottajan välillä

Lukimo on tekoälyjärjestelmän tarjoaja, joka tuottaa synteettistä ääntä. Tekstiä alustalle syöttävä asiakas tai rajapintaa kutsuttava taho on käyttöönottaja. Artikla 50 jakaa velvoitteet tämän rajan molemmille puolille: ne eivät kaikki lankea Lukimolle.
Velvoite, joka koskee Lukimoa: Artikla 50(2)

Koska Lukimon järjestelmä tuottaa synteettistä ääntä, sen on varmistettava, että tulosteet merkitään koneluettavassa muodossa ja tunnistettavissa keinotekoisesti tuotetuiksi tai muokatuiksi. Merkinnän on oltava “tehokas, yhteensopiva, vankka ja luotettava siinä määrin kuin se on teknisesti toteutettavissa.”

Kolme huomionarvoista seikkaa:

Se koskee kaikkia tulosteita, ei vain esikatseluja. Lukimo vesileimaa tällä hetkellä esikatseluäänen, joka on integroitu ilmaistason latauksiin. Tämä on havaittavissa oleva vesileima kaupallista suojaa varten. Artikla 50(2) edellyttää koneluettavaa merkintää myös kaupalliseen, puhtaaseen lataukseen, eikä käyttöönottaja voi kieltäytyä siitä. Tarkoitukset ovat erilaiset: Lukimon nykyinen vesileima estää luvatonta kaupallista käyttöä, kun taas EU:n tekoälyasetuksen edellyttämä merkintä mahdollistaa tekoälyalkuperän tunnistamisen kolmannen osapuolen toimesta. Molempia tarvitaan todennäköisesti, ja tekoälyasetuksen mukaisen merkinnän on säilyttävä tavallisen jälkikäsittelyn läpi: pakkaus, transkoodaus, leikkaukset ja ekvalisointi.
Suositeltava tekninen lähestymistapa: havainnollinen äänivesileima (Meta AudioSeal, Resemble PerTh tai vastaava) upotettuna kaikkiin renderöityihin tulosteisiin sekä C2PA-manifesti tiedostokonttiin.
Kahden tason suoja: C2PA-manifesti tarjoaa vahvan ja todennettavan alkuperätiedon ehjille tiedostoille, vesileima puolestaan säilyy, vaikka tiedosto poistettaisiin tai koodattaisiin uudelleen.
“Avustava muokkaus / ei olennaista muutosta” -poikkeus ei auta tässä. Se kattaa asioita kuten kohinallisuuden vähentämisen tai automaattisen ekvalisoinnin. TTS-generointi tekstistä on juuri se tyypillinen tapaus “olennaisesta muuttamisesta”: kyseessä on kirjaimellisesti sellaisen äänen luominen, jota ei aiemmin ollut olemassa.
Seuraukset virheestä: enintään 15 miljoonaa euroa tai 3 % maailmanlaajuisesta vuosiliikevaihosta Artikla 99(4)(g) nojalla. Käytännössä Lukimon kokoiselle yritykselle tässä vaiheessa se ei ole toimintaa murtava summa, mutta maine suomalaisilla ja EU:n markkinoilla kärsisi sakkoakin enemmän.

Velvoite, joka koskee Lukimon asiakkaita: Artikla 50(4)

Artikla 50(4) asettaa deepfake-ilmoitusvelvollisuuden käyttöönottajalle, ei Lukimolle.

Kysymys kuuluu: onko Lukimon tuloste ylipäätään tekoälyasetuksen mukainen “deepfake”. Artikla 3(60) määrittelee deepfaken tekoälyn tuottamaksi sisällöksi, joka muistuttaa olemassa olevia henkilöitä, esineitä, paikkoja, tahoja tai tapahtumia ja jonka tavallinen ihminen voisi erehtyä pitämään aitona tai totena.

Useimmissa Lukimon käyttötapauksissa, kuten brändätyt selitysvideot, e-oppiminen tai markkinoinnin ääniraita yleisellä “Ääni 17” -äänellä, kyseessä ei ole deepfake. Kuulija ei erehdy luulemaan kuulevansa tunnistettavaa todellista henkilöä. Johdanto-osan 134 kohta tukee yleisen synteettisen sisällön erottamista henkilöiden jäljittelystä.

Siitä tulee deepfake, kun käyttöönottaja, esimerkiksi B2B-toimisto, käyttää Lukimon ääntä:

tunnetun julkisuuden henkilön jäljittelemiseen tai esiintymiseen tämän nimissä,
väärennettyjen asiakassuositusten luomiseen aitona esitettyinä ääninäytteinä,
tekaistun uutisäänen tuottamiseen näennäisen aitona,
todellisen henkilön sanojen äänittämiseen ilman hänen osallistumistaan.

Näissä tapauksissa ilmoitusvelvollisuus 50(4):n nojalla on käyttöönottajalla, ei Lukimolla. Lukimolla on kuitenkin oma intressinsä asiassa:

Syyllisyyden jakautuminen lain mukaan ei estä mainehaittojen heijastumista alustalle.
Lukimon käyttöehtojen tulisi edellyttää käyttöönottajien säädöstenmukaisuutta ja kieltää ilmeiset väärinkäytöt.
Suuntaus on jo havaittavissa, ja käytännesäännöt 50(7):ssä todennäköisesti vahvistavat sen: tarjoajat antavat käyttöönottajille tuotteen sisäisiä huomautuksia generointivaiheessa.

Taiteellinen tai satirinen poikkeus 50(4):ssä vähentää laillisten luovien töiden ilmoitusvelvollisuutta, muttei poista sitä. Se on käyttöönottajan argumentti, ei Lukimon.

Mitä ei sovelleta

Artikla 50(1) – Tekoälyvuorovaikutuksen ilmoitusvelvollisuus. Ei sovellu: Lukimon tuote tuottaa äänitiedostoja, ei reaaliaikaista vuorovaikutusta luonnollisten henkilöiden kanssa. Jos käyttöönottaja kytkee rajapinnan ääniagenttiin, joka puhuu ihmisille reaaliajassa, käyttöönottajan käyttöönotto laukaisee 50(1):n, ei Lukimo.
Artikla 50(3) – Tunteiden tunnistaminen tai biometrinen luokittelu. Lukimo ilmaisee tunteita tulosteessaan, muttei tunnista niitä. 50(3) koskee järjestelmiä, jotka päättelevät ihmisten tunnetilan, mitä Lukimo ei tee.
GPAI-velvoitteet (Artiklat 51–55). Lukimon TTS-malli on erikoistunut malli, ei asetuksen tarkoittama yleiskäyttöinen tekoälymalli. Se ei myöskään lähesty 10^25 FLOPS:n systeemiriskikynnystä.
Korkean riskin luokitus (Liite III, Artikla 6). Markkinoinnin tai koulutuksen ääniraita ei ole Liite III:n mukainen käyttötapaus.

Erillinen huomio, joka ei liity Artikla 50:een mutta on syytä mainita: äänimallin kouluttamiseen käytetyt ääninäytteet ovat GDPR:n Artikla 9:n mukaista biometristä dataa. Lukimon lisensointisopimukset äänitalenttien kanssa edellyttävät Art. 9(2)(a):n mukaisen nimenomaisen suostumuksen. Tämä on erillinen vaatimustenmukaisuuden polku, riippumaton EU:n tekoälyasetuksesta.

Hyvät uutiset

Hyvä uutinen Lukimolle: lisensoitujen äänien katalogimalli ja suomalainen dataresidenssikanta ovat kilpailijoita edellä sekä GDPR-vaatimustenmukaisuuden että deepfake-riskipinnan osalta.

He ovat jo lisänneet koneluettavat metatiedot kaikkiin tiedostoihinsa. Tässä mielessä he ovat täyttäneet EU:n tekoälyasetuksen edellyttämät velvoitteet.

Johdanto-osan 133 kohta käy läpi hyväksyttävät menetelmät ja mainitsee nimenomaisesti vesileiman, metatietomerkinnät, salakirjoitusmenetelmät alkuperän todistamiseksi, lokimenetelmät, sormenjäljet sekä “muut tekniikat”. Kaikki nämä ovat tavalliselle kuulijalle kuulumattomia tai näkymättömiä. Johdanto-osa ohjaa kohti havaitsemattomuutta, kehystäen sen “vankkuuden” ja “yhteentoimivuuden” laaduksi: merkinnän on säilyttävä pakkauksen, transkoodauksen ja muokkausten läpi ilman, että se heikentää käyttäjäkokemusta.

Missä tämä on keskeistä: raja 50(2):n ja 50(4):n välillä

50(2) – Tarjoajan merkintävelvollisuus: koneluettava. Kuulumaton on hyvä. Tämä on Lukimon tehtävä.
50(4) – Käyttöönottajan deepfake-ilmoitusvelvollisuus: ihmisluettava. Käyttöönottajan on kerrottava ihmisille, että sisältö on tekoälyn tuottamaa, “selkeällä ja erottuvalla tavalla” (50(5)). Tämä on asiakkaan tehtävä, kun hänen käyttötapauksensa siirtyy deepfake-alueelle.

Lukimon osalta kuulumaton havainnollinen äänivesileima yhdistettynä C2PA-manifestiin on täsmälleen oikean muotoinen ratkaisu. Nykyinen havaittava “esikatselu”-vesileima ilmaislatauksissa tekee eri työtä: piratismin estäminen ja kaupallinen portinvartiointi. Se ei vastaa 50(2):n vaatimukseen. Heillä on molemmat, mutta 50(2):n mukainen on tarkoituksella näkymätön.

Kuten alussa sanoin, tämä oli kiinnostava tapaus kuulla, koska se osoittaa, mitä luovan alan yrityksen on tehtävä EU:n tekoälyasetuksen oikeudellisten vaikutusten suhteen. Se on myös tuote, jonka näen menestyvän: se on erinomainen sekä äänitalenteille että luoville tiimeille.