Nem ők adják elő, mégis az ő hangjukon szólal meg 

Azariah és Szoboszlai Dominik együtt énekel és rappel a mesterséges intelligencia segítségével. A nézők imádják, a fejlesztők végtelen lehetőségeket látnak, a jogászok a fejüket csóválják. 

A Magyarország két legnépszerűbb ikonját megidéző szám letartolta az internetet. A magyar válogatott csapatkapitányáról szóló dalban hemzsegnek az utalások Szoboszlai Dominik karrierjére, a Puskás Arénára, a válogatottra, és a következő EB-re, amelyen a megerősödött magyar csapat jó eséllyel indul. A videót Tiktokon egymillóan látták és a Youtube-on is már 750 ezer megtekintés fölött van. 

Decemberben óriásit robbant a hír, miszerint Azahriah egymást követő több napon is megtölti a Puskás Arénát, a fociválogatottunk fellegvárát. Erre utal rögtön az elején napjaink “kínzó” kérdése: ki tölti meg hamarabb a Puskást, Szobó vagy Azahriah. A Szoboszlai Dominikot méltató dal tele van áthallásokkal és zeneközi utalásokkal, ilyen például Fluor Tomi Mizuja: „ezért általában úgy van, engem nem találsz a klubban, mégis hányszor berúgtam.”

Fotó: Hajógyár

A sport- és futball körökben is fennforgó poénokkal és szójátékokkal (pl. „erős a gárdánk, mint a pálinka”, „mindenki tisztel, aki velünk mind egy”) dolgozó feldolgozással könnyű azonosulni, ezért fényes jövőt jósolnak az idei Európa Bajnokság időszakára.

A dal ismeretlen szerzői követik a Liverpool sztárjának a karrierjét, hiszen végig az ő tevékenységére épül a szám, sőt, Szoboszlaitól felkapott poénokat is feldolgoz, ilyen például az „én realben nyerek, te csak Fifázz” című rész is, amely egy virálissá vált Szoboszlai beszólásra utal:

I never play Fifa, I score in real life.”

@liverpoolfc

“I score in real life! Not yet…” Presented by @Wasabi ☁️ | #LFC #Liverpoolfc

♬ original sound – Liverpool FC

A legerősebb pillanat az, amikor valós videórészletet vágnak be arról, amikor Szoboszlai felszólítja a stadion közönségét, és együtt énekel ezzel a 650 ezer emberrel, majd megköszöni a szurkolást, és megígéri a csapat nevében, hogy jövő nyáron olyat csinálnak, ami felejthetetlen lesz.

Nincs új a nap alatt

Egyre több területen alkalmazzák a mesterséges intelligenciát (MI): szövegek alkotására, képek szerkesztésére, programkódok írására és a zenében is egyre gyakrabban bevetik. Sem Szoboszlai sem pedig Azahriah nem vett részt közvetlenül a dal létrehozásában, mégis az ő hangjukon szólal meg, a Full of Stars (FOS) csapata MI segítségével hozta össze, és rakta ki a TikTokra.

A zene és a szöveg NEM mesterséges intelligencia műve, valódi személyek írták és vették fel. Az AI-al csupán a rögzített hangok lettek Azahriah és Szoboszlai Dominik hangszínére formálva.” – hívják fel a figyelmet a szerzők.

Ennek a technológiának az alkalmazása nem újdonság, az utóbbi időben rengeteg új eszközzel bombázták a piacot a különböző fejlesztők. De ha még régebbre visszatekintünk, akkor azt láthatjuk, hogy hasonlóképpen utánozták Stephen Fry hangját, egy hangoskönyvet mintaként használva, s narrációt szerkesztve készülő dokumentumfilmjükhöz. Szlovákiában a választási kampányban szintén bevetették a mesterséges intelligenciát, félrevezető telefonhívásokkal befolyásolva a voksolást. 2018-ban a The Times megszólaltatta Kennedy elnök beszédét, amelyet Dallasban kellett volna elmondania. Három esztendeje az Arab Emirátusokban 35 millió dollárt nyúltak le egy bankból úgy, hogy a fiókvezetőt a pénzintézmény ügyfelének hangján hívták fel.

Ne gondoljuk, hogy az ilyen anyagok előállítása különösebben bonyolult lenne, tudniillik például a nyílt forráskódú Prime Voice AI alkalmazás a felhasználó szövegéhez társított hangmintával élethű beszédet generál. A Microsoft kifejlesztette, majd visszavonta a VALLE-E applikációt, amely mindössze három másodperces hangminta alapján bárki beszédhangját képes reprodukálni. A cég most azon gondolkodik, miként lehetne egy detektáló rendszer segítségével kiszűrni az MI generálta beszédet.

A Full of Stars a kits.ai eszköztárát használta, amit bárki kipróbálhat ingyen, emellett minden bizonnyal egy audió sáv szétválasztó MI-t is bevetettek, hogy leválasszák az eredeti ének és rap részeket az alapról. Desh hangját teljesen kivágták és helyére került a „MI Dominik” ezen felül az eredeti dalszöveg helyett is egy, a szerzők által megírt szöveg hallható.

Hogyan dolgozik a mesterséges intelligencia?

A MI elemzésének alapját Azahriah és Szoboszlai hanganyaga adja. Az adatgyűjtés kulcsfontosságú, mivel minél több és változatosabb a hanganyag, annál pontosabb lesz a MI modell. Ezekre a hosszabb interjúk igen alkalmasak, ahol a mintázott személy egyedül beszél, többnyire jó minőségben, jó technikával felvéve.  

A hanganyagok elemzése során a MI azonosítja a hangmagasságot, a hangerőt, az artikulációt és egyéb fontos hangkarakterisztikákat. Ez a lépés kritikus a gépi tanulás folyamatában, mivel a hangok egyedi jellemzőinek megértése nélkülözhetetlen a hiteles hangátalakítás szempontjából. Az elemzett adatok alapján a MI hangmodellt készít, amely megragadja Azahriah és Szoboszlai hangjának egyedi jellemzőit, és ez lesz az alapja a hangátalakításnak.

A MI a megtanult hangmodelleket alkalmazva alakította át a Full Of Stars egyik tagjának hangját Szoboszlai hangjává. A hangátalakítás során az finomhangolásokat is végez, megváltoztatva a hangmagasságot, a tempót és más jellemzőket amitől meghökkentően jó eredmények tudnak születni.

Ez lehetővé teszi a mesterséges intelligencia számára, hogy finomabb és természetesebb módon tudja átalakítani a beszédhangot, új dimenziókat nyitva emberi hang digitális reprodukciójának területén.

Budapest, 2024. január 8. Szoboszlai Dominik, a Liverpool labdarúgója, a magyar válogatott csapatkapitánya beszél, miután átvette az Év férfi sportolója díjat az M4 Sport-Az Év Sportolója Gálán a Magyar Állami Operaházban 2024. január 8-án. MTI/Hegedüs Róbert

Nem merülnek fel szerzői jogi kérdések

A hangátalakítás nemcsak technikai, hanem etikai kérdéseket is felvet. A hangok eredetiségének megőrzése és a manipulatív használat elkerülése fontos kihívások elé állítja a technológiát. A jogrendszer ezt egyelőre nem tudja követni, hiszen annyira gyors fejlődés zajlik le előttünk. Az alapjog szerint ugyan a más művének felhasználása engedélyköteles. Az utóbbi években a digitális technikák fejlődésével, az internetes világháló teljeskörű elterjedésével és legutóbb a mesterséges intelligencia megjelenésével olyan újabb és újabb kérdések merülnek fel, melyre a szerzői jogi szabályozás nem ad egyértelmű választ, így leginkább az alapelvekhez lehet visszanyúlni, mely szerint: A szerzői jogi védelem az egyéni, eredeti alkotást illeti meg, és ez nem függ mennyiségi, minőségi, esztétikai jellemzőktől vagy a színvonalra vonatkozó értékítélettől. A szerzőt megilleti a jog, hogy a művén őt szerzőként feltüntessék, ő dönt róla, hogy a mű nyilvánosságra hozható-e, illetve megilleti a mű egységének védelme. Szerzői jogi kérdés akkor sem merülne fel, ha az anyag sértő, amely az áldozatot rossz színben tünteti fel, ugyanis jogilag ez már a személyiségi jogi kategóriába tartozna. 

Címlapkép: Facebook.com/Azahriah