REPORTAGE: Artificiell Intelligens

REPORTAGE: Artificiell Intelligens

Dags att bli rädd? 

Text: Michael Dee
Foto: Jukedeck & Vochlea Music

Publicerades ursprungligen i nr 12-17

Det har genom åren presenterats flera försöksprojekt med musik skriven med hjälp av artificiell intelligens. Det har mest handlat om experimentella projekt utförda på universitet men nu är fenomenet på väg att bli del av kommersen. Och det är stora jättar som Sony och Warner Music som ger sig in i leken. Ska musik skapad av AI ses som ett hot? Eller kan teknologin bli ett kreativt hjälpmedel? 

Drömmen att skapa maskiner som komponerar originalmusik är inte ny. Ada Lovelace (1815–1852) som idag ses som datapionjär på grund av sitt arbete på Charles Babbages The Analytical Engine insåg att den hade potential bortom att kalkylera siffror och hon ansåg att den skulle kunna lära sig att komponera och framföra musik. 

Modern datateknologi har gjort det möjligt. Jag har hört resultatet av ganska många projekt genom åren, de festa utförda av universitet. Det har då slagit mig att ambitionsnivån oftast varit för hög. Då datorer genom analys och inlärning av musik av klassiska kompositörer som Bach och Beethoven sedan skulle prestera egna stycken. ”Hör du skillnaden?” har det då frågats. Jo, för även om tempo och toner varit rätt har de här styckena aldrig riktigt gripit tag i känslorna. Det tycktes inte föreligga några risker för oväntade mästerverk och det var svårt att se någon efterfrågan. 

Men det har ändrats markant. Det har dykt upp en rad företag som arbetar med AI-musik som erbjuder sina tjänster och de har snabbt hittat marknader. Det beror på det snabbt växande medielandskapet, sociala medier och att det finns allt fler plattformar att sprida reklam och marknadsföring. Det handlar då inte om imitationer av klassiska symfonier utan om enklare genrer, rock, syntpop, folk et cetera. 

Och det är inte konstigt att dessa nya företag nu hittar marknader. Att anlita en kompositör att skriva tre minuter originalmusik kostar ungefär 1 000 dollar idag. Att köpa ett stycke musik från ett AI-företag kostar kring 20 dollar. Köparen kan sköta inköpet via webben, definiera exakt vilken sorts musik den vill ha och slipper allt det praktiska som innefattar att ha med en levande kompositör att göra. 

Och det är stora företag som ger sig in i den här svängen. Techstars Music, ett nytt företag baserade i Los Angeles, är delvis finansierat av Sony Music och Warner Music Group. Google har en experimentverkstad som heter Magenta. 

Andra nystartade företag går sin egen väg, däribland Humtap, Melodrive, Groov.AI och Jukedeck. 

Abbey Road Studios drar sitt strå till stacken genom sitt giv Abbey Road Red där man hjälper nya typer av techföretag att knyta kontakt med musikbranschen och i år deltar bland andra AI Music, ännu ett nytt företag. 

Ed Newton-Rex fick idén om ett AI-företag som skapade musik efter att han hört en föreläsning om datavetenskap. Varefter han stängde in sig i sovrummet i åtta månader för att bygga en prototyp. 

Patrick Stobbs arbetade tidigare på Google. Han grundade Jukedeck tillsammans med Ed 2012. Tre år senare lanserades köptjänsten. 

George Wright utvecklade idén till den smarta mikrofonen under sin studietid i London. På en specialutbildning inriktad på att skapa bryggor mellan konst och vetenskap. 

Kontrovers

Det är säkert mer än en läsare som vid det här laget är allvarligt uppretad, oroad eller båda. Och nog kan de här företagen te sig som ett hot men många av dem anser att deras teknologi i längden kan bli ett kreativt verktyg för musiker och kompositörer. Däribland Patrick Stobbs på Londonbaserade Jukedeck, grundat tillsammans med Ed Newton-Rex 2012 och som började erbjuda sina tjänster kommersiellt 2015. Innan dess hade Patrick jobbat på Google och under sluttampen jobbat med teamet på Youtube. Patrick berättar. 

– Det hela började med min partner Ed som är kompositör. Under sin universitetsutbildning hade han tittat lite grann på vetenskapen inom musik. Vad det är som appellerar till oss som lyssnare. Det stod klart för honom att det fanns vissa återkommande drag. Efter sina universitetsstudier hamnade han av en händelse på en föreläsning om datavetenskap och det slog honom att det inte borde finnas några hinder för ett datasystem att skapa musik. Så han beslöt sig för att lära sig programmera och applicera det på musik. Han stängde in sig i sovrummet i åtta månader och byggde en prototyp.

Patrick blev imponerad av hans system. Genom att trycka på några knappar kunde det skriva musik och leverera ett färdigt stycke på 20 sekunder. De slog ihop sig, bildade Jukedeck och teamet består idag av 19 personer. 

Jag frågar Patrick hur systemet fungerar. 

– Det är baserat på maskininlärning och neurala nätverk. Systemet har algoritmer som analyserar stora datamängder av musik. Det letar efter saker som är signifikanta i musik och utifrån det letar det sig fram till regler för hur musik skrivs. Man kan säga att det bygger upp en sorts modell av en kompositörs hjärna och utifrån det skriver originalmusik från scratch. 

Processen består av två delar. Den första är kompositionen. Den andra delen är framförandet av musiken och det sker med hjälp av olika samples och ljudeffekter, reverb, kompressor och så vidare. Detta levereras sedan till köparen i form av en mp3-fil. Alltihop tar som sagt omkring 20 sekunder. 

Apollo har visats på olika techmässor i år och intresset har varit stort. George har haft stor hjälp av Abbey Road Studios som med sitt giv Abbey Road Red vill hjälpa uppstartsföretag att knyta kontakter med musikbranschen. 

Musikstilar

Det finns idag ett begränsat antal musikstilar att välja emellan. 

– I dagsläget handlar det om tio stycken; rock, folk, syntpop, tropical house, drum'n'bass, ambient och några till. Utbudet växer ju mer systemet lär sig. Vi vill också bredda utbudet inom varje stil. I dagsläget är det som att vi har ett halvdussin band inom varje genre och vill erbjuda större variation. Det finns naturligtvis genrer som är väldigt svåra att skapa på det här sättet, framförallt klassisk musik. Det beror inte bara på att kompositionen är betydligt mer komplex utan att det är i det närmaste omöjligt att åstadkomma ett framförande med framför allt stråkar. Men teoretiskt sätt anser jag att det är möjligt att med AI skapa emotionell musik i vilken genre som helst. 

Patrick beskriver hur beställning och inköp går till. 

– Man går till vår webbsida, väljer mellan olika parametrar, stil, tempo, längd, klickar på create och om man gillar resultatet betalar man och laddar ner det. Om man inte gillar det ändrar man det tills man är nöjd. Vi säger att man till exempel vill ha ett snabbare tempo, annan instrumentering, ändra var klimax i musiken ska ske. Det är enkelt och bekvämt. I jämförelse med levande kompositörer som tar i snitt 1 000 dollar för ett stycke på tre minuter kostar detta bara 20 dollar. 

Dessutom har vi nyligen introducerat en API som gör det möjligt för andra techföretag att använda vårt system på licens. 

När Jukedeck lanserade sina tjänster 2015 vände man sig först till Youtube-användare, säger Patrick.

– Så här 18 månader senare kan vi konstatera att tjänsten använts 20 000 gånger till Youtube. Vi börjar nu att marknadsföra oss till reklambyråer och olika typer av media- och produktionsbolag. Reklam har blivit en viktig sektor för oss. Det handlar då inte om musik till tv-reklam utan den något lägre nivån, sociala medier och webb. Det har uppstått ett stort behov av musik därute och oftast finns varken tid eller budget att få musik utförd av en levande kompositör och det är där vi kommer in i bilden. 

Köparen kan välja mellan olika musikstilar och sedan skräddarsy det på olika sätt. Bestämma tempo, instrumentering, stämning et cetera och om man inte gillar resultatet skapar systemet gladeligen ett nytt stycke musik som är färdigt på 20 sekunder. 

Ett verktyg

Patrick säger att han hoppas att systemet längre fram kan bli ett verktyg för kompositörer och musiker. 

– Vi undersöker just hur en människa skulle kunna interagera med systemet. Då skulle det kunna bli verkligt spännande och kraftfullt. Som en samarbetspartner. Vi har testat att bygga in en kapacitet i systemet så att man kan förse det med en melodi skriven av en människa varefter systemet bygger ut musiken, instrumenterar den. 

Kanske något för de som jobbar på egen hand. Jag har träffat många som klagar på att de lätt hamnar i sina egna klyschor när de komponerar. Patrick lyfter tag i tråden. 

– Jag har själv träffat många proffskompositörer som varit tvungna att i snitt spotta ur sig tre–fyra timmar musik i veckan. De har då ofta nått en punkt då de fått kreativ kramp. Det här systemet skulle kunna användas till inspiration. Ge mig en annan still, annorlunda rytm och fem spännande ackord! 

Patrick ser också andra möjligheter. 

– Jag tror att det kan förändra folks sätt att skapa musik, även för de som inte är ypperliga musiker eller kompositörer. Systemet skulle kunna göra det lättare att skapa musik, kanske för första gången. I framtiden skulle systemet kunna utökas så att det reagerade på miljön. Hur många människor som finns i en lokal, vilken årstid det är, vilken tid på dagen.  

Andra aktörer

Men det finns andra sätt att använda artificiell intelligens till att skapa musik. I Abbey Road Red ingår förutom AI Music även Vochlea. Ett uppstartsföretag som i början på 2018 kommer lansera sin första produkt. Den heter Apollo och är en "smart mikrofon", berättar George Wright som uppfunnit den.  

– Genom att sjunga i mikrofonen kan man på artificiell väg förvandla sin röst till ett instrument, till exempel en saxofon eller en elgitarr. Teknologin jag har uppfunnit uppstod då jag under studietiden på The Royal College of Engineering i London utförde ett projekt kring om hur man kunde korsa konst och vetenskap. Vochlea är en fortsättning av mitt examensarbete. 

Apollo är i första hand inriktad på att förvandla den mänskliga rösten till olika instrument. Systemet skulle i princip kunna användas till att låta instrument eller andra ljudkällor imitera.

George berättar hur teknologin fungerar. 

– Kärnan i det hela är en ljudmotor, som utför analyser i realtid och ljudigenkänning. Genom att sjunga i mikrofonen triggar man ljudsamples och mjukvaruinstrument och den lär sig användarens röst. Rösten kan trigga till exempel en gitarr eller en beatbox. Det är lite grann som röstigenkänning. Den registrerar vilket instrument användaren imiterar och skapar motsvarande instrumentering. Detta sker live, till skillnad mot röstigenkänning där hela ordet måste uttalas färdigt innan analysen genomförs. Detta kan implementeras i olika produkter. Den första jag kommer att lansera är smartmikrofonen Apollo. 

Systemet lär sig känna igen användarens röst och vilket instrument som imiteras. Går det inte att på förhand välja instrument? 

– Orsaken till att det lär sig känns igen användarens röst är för att alla röster är olika. Med vanlig röstigenkänning spelar det ingen roll om man har en dialekt, den känner igen ordet. Som till exempel med Amazons Alexa. Vad jag gör är annorlunda där varje personlig frasering påverkar resultatet. Därför är det också viktigt att systemet lär sig den individuella rösten. Det finns inga förutbestämda regler för hur en imiterad elgitarr bör låta. Din skulle skilja sig från min. Systemet låter användaren bestämma hur det ska låta i den första fasen av inlärningen, genom att erbjuda olika ljudsamples, varefter användaren sjunger en version av det utvalda instrumentet så att systemet lär sig röstmönstret och skapar en profil. Så nästa gång användaren sjunger på ett specifikt sätt så vet systemet hur ljudet ska användas. Men det handlar inte bara om att systemet ska känna igen vilket ljud användaren vill åstadkomma utan också om att ge ljudet karaktär, ge användaren möjlighet att skulptera det och ge det djup.

Man måste väl vara någorlunda bra sångare för att använda systemet?  

– Jo, det hänger ju på vad som skickas in i systemet. Inte bara vad gäller sångteknik utan också komposition. Men systemet ger möjlighet att utforska olika områden. Om man ska skapa en melodi så gäller det att kunna sjunga den och göra det någorlunda rent. Det går att dock att tillföra autokorrigering. Det är som med andra instrument, att man får lära sig att använda det, och bli bättre på det. 

Apollo kommer att kosta kring 1 500 kronor, säger George. 

– Jag inriktar mig i första hand på amatörmarknaden där det är lättast att få ett fotfäste med en ny typ av produkt. Längre fram siktar jag dock på att lansera en proffsversion och att hitta andra användningsområden för teknologin, till exempel videospel. 

Det har redan varit stor nyfikenhet på Apollo från musikerhåll, säger George avslutningsvis. 

 – Det intressanta för mig är vilka riktningar folk vill ta det. Som designer och uppfinnare erbjuder jag vissa möjligheter. När musiker sedan tar tag i dem för kreativa ändamål så finns det inga begränsningar för hur de kan tänkas användas. Jag har hört många intressanta förslag och idéer den senaste tiden. Att istället sjunga i mikrofonen spela gitarr och förvandla det till blås. Eller att använda någon annans röstprofil till att skapa ljud. Musiker hittar alltid sina egna vägar när det kommer till teknologi och det är det som gör det hela så spännande. 

RETRO: Patrik Dahlbom träffar industri-ikonerna Rammstein (MM 5-2001)

RETRO: Patrik Dahlbom träffar industri-ikonerna Rammstein (MM 5-2001)

MM TIPSAR: Thrash metal-bandet Power Trip under riggluppen

MM TIPSAR: Thrash metal-bandet Power Trip under riggluppen