• Foto: Getty Images/istockphoto

Musikkmaskinene

Musikkmaskinene

Når KI lager og spiller musikken, hva gjenstår for mennesket?

Fra utgave: 3 / mars 2026

– Da jeg drev med maskinlæring for 25 år siden, var det ingen som var interessert. Det tok tre uker å trene opp lyder den gangen, nå tar det tre sekunder.

Det forteller professor i musikkteknologi ved Universitetet i Oslo, Alexander Refsum Jensenius.

– Vi har en KI-generator som studentene mine bruker til å spille synthmusikk herfra til månen. Det låter jo som synthmusikk, men er det interessant?

Svaret har konsekvenser for flere enn forskere og lyttere.

– De som lager bakgrunnsmusikk og streit popmusikk, vil i stor grad miste jobben, tror Jensenius.

– Samtidig vil kreative kunstnere kunne bruke teknologien og se muligheter. Som alle andre teknologier, lages KI av mennesker og til bruk for mennesker. At noen misbruker mulighetene det gir, ligger dessverre i menneskets natur.

 

Intet nytt under solen Maskinen har lenge kunnet lage nye ting. Spørsmålet er om det har verdi og om det er meningsfullt, mener professor Alexander Refsum Jensenius. Foto: Anlov P. Mathisen

 

Kirkeorgel og trombonister

Jensenius leder MishMash, et av seks nye forskningssentre som deler på den såkalte KI-milliarden som regjeringen delte ut i 2025. Vi møter professoren sittende foran en stappfull bokhylle på et kontor i Forskningsparken ved Blindern i Oslo.

– Vi er et nasjonalt senter med 230 forskere fra 16 universiteter og høyskoler, samt over 40 kulturinstitusjoner, som museer, biblioteker og kreative bransjer. Sammen skal vi blant annet undersøke KIs innvirkning på kreative prosesser, forklarer Jensenius.

Mange spør hva de skal produsere, men senteret har et annet fokus.

– Vi driver med forskning, og skal ikke lage nye kommersielle produkter. Vi skal forstå og reflektere, samt teste ut nye konsepter, som for eksempel disse selvspillende gitarene, som lytter til hverandre og samspiller, sier Jensenius og peker mot instrumentene som henger på veggen foran seg.

– Mange opplever KI-æraen som mer kaotisk enn samspilt. Men i musikkhistorien er man vant til store omveltninger, mener Jensenius.

 

Tester ut selvspillende gitarer Professor Alexander Refsum Jensenius mener mange nok opplever KI-æraen som mer kaotisk enn samspilt. Han minner om at musikkhistorien ikke er ukjent med store omveltninger. Foto: Anlov P. Mathiesen

 

– Det oppleves riktignok disruptivt nå, og det er mange som frykter for jobben sin. Men jeg tror grammofonen og ikke minst opptaksteknologien som sådan, var enda mer inngrip-ende. Da kirkeorgelet kom på 1600-tallet, trengte man ikke lenger trompeter og tromboner. Men trombonistene overlevde likevel.

Maskinmusikk er heller ikke nytt.

– Noe av det aller første man gjorde med gigadatamaskiner på 1950-tallet, var å lage musikk med dem. David Bowie testet generatorer allerede på 1970-tallet. I forskning har man drevet med generativ musikk i et halvt århundre, sier professoren i musikkteknologi.

 

Å sample eller spawne

Den anerkjente amerikanske komponisten Holly Herndon har doktorgrad i musikk og maskinlæring fra Stanford University og bruker KI i sine komposisjoner. Hun mener maskinen forandrer det kreative arbeidet.

– Kreativitet er et ladet ord som mangler en god definisjon. Det er en kunst å trene KI-modeller. Du trenger en stor mengde tilgjengelige data for at mennesker kan navigere og produsere interessante resultater. Jo mer data, jo mer kan du gjøre. Og hvordan du trener, har innvirkning på hvordan modellen fungerer, sier Herndon.

 

Går god for riktig bruk av KI Holly Herndon har doktorgrad i musikk og maskinlæring. Foto: Boris Camaca

 

Hun har trent opp en KI-modell til å synge med hennes egen stemme. Modellen kalles «Spawn», som også er navnet på et sentralt prinsipp i KI-kunst.

– Spawning er annerledes enn sampling ved at KI-en lærer egenskapene til millioner av låter, og skaper nye ting ut fra logikken i datasettet. Samplingkunstnere kan benytte originale lyder i nye sammenhenger, men å bruke KI til å lage generiske synth-låter, overbeviser ikke i konkurransen med andre generiske synth-låter, forklarer Herndon.

Når dette likevel skjer, er det ifølge den Berlin-baserte komponisten på grunn av hvordan kommersielle KI-produkter er skrudd sammen.

– De begrenser hva du kan lage, fordi de baserer seg på hva de antar du vil høre, og resultatet blir stort sett alt for ‘glossy’. Men potensialet til modellene er mye større, sier Herndon.

 

Demokratisering?

«Suno» er en av disse kommersielle løsningene. Det er en generator som lager popmusikk, og som eies av Warner Music. Generatoren har imponert Alexander Refsum Jensenius.

– Suno er blitt utrolig bra, og jeg benytter den i forelesninger. For et halvt år siden var reaksjonen fra studentene gjerne ‘kjempekult’ og ‘magisk’, men i det siste er det endret til ‘å nei, ikke enda en låt ...’. Folk blir lei av det blankpolerte lydbildet.

De gjennomskuer lydene?

– Ja, på samme måte som perfekte, glansede KI-bilder. Kjempefint og flott, men hva så? Et annet problem er biasen som ligger i systemene. De er trent opp på vestlig popmusikk, og da får du vestlig popmusikk ut av dem. Jeg testet å lage norsk folkemusikk, og da får du utrolig rare greier ...

Så modellene er kulturelt påvirket?

– Ja, og det er en viktig komponent i MishMash, dette med kulturvern og kulturarv. Hvordan ivaretar vi det norske eller hvilken som helst enkel minoritet i disse systemene?

Er slike skjevheter og overpolert lyd likevel et lite offer sett opp mot demokratisering av teknologien?

– At KI ‘demokratiserer’ musikkproduksjon, er jeg litt skeptisk til. Hvem som helst kan lage en kul låt til festen, og det er enn så lenge tilsynelatende gratis. Men det er kun fordi vi bidrar til å trene opp systemene. Teknologiselskapene bak skrur nok snart opp prisene, sier Jensenius.

 

Klikk og komponér Musikkgeneratoren Suno lover brukerne at «den neste låten kun er et skritt unna». Suno er ett av flere titall slike verktøy for å skape musikk ved hjelp av kunstig intelligens. Uten å betale kan du lage fem tominutters sanger hver dag, men om du vil bruke dem kommersielt, må du som et minimum betale 10 dollar i måneden.

  

All media is training data

Heller ikke Holly Herndon er overbevist om at KI demokratiserer musikken.

– Ekte demokratisering ville bety kraftige og åpne modeller som var tilgjengelige for alle. Det eneste dagens KI-modeller tillater, er en ny kategori glade amatører som lager musikk.

Herndons album fra 2021 fikk tittelen «All media is training data». Mener hun at digitale medier egentlig er et spiskammers for sultne KI-modeller?

– Slik har det vært i over et tiår. Mediene, også sosiale medier, er treningsdata for maskiner. Jeg tror ikke nødvendigvis det er dårlig, det er bare et faktum at vi nå lager medier for mennesker og maskiner, sier Herndon.

Hun mener at selve programmeringen fortjener en større kunstnerisk status.

– De mest innflytelsesrike kreative beslutningene blir tatt av ingeniører. Vi oppfatter arkitekter og regissører som kunstnere, så hvorfor ikke ingeniører? Ideen om at kunst og ingeniørfag er separate virksomheter, bør revurderes.

Men kan maskinmusikk få like mye «mening» som det menneskeskapte?

– Jeg tror det. Mening er noe vi skaper gjennom konsensus. De fleste har ingen anelse om hvor kunsten de liker kommer fra, eller hvem som faktisk skapte den, sier Herndon.

 

Kreativitet og kropp

Kreativitet er både å skape noe nytt og å tilføre noe meningsfullt, mener Jensenius.

– Maskinen kan lage nye ting og har gjort det lenge. Men vi må spørre oss om det har verdi og om det er meningsfullt. Jeg mener å se eksempler som oppleves meningsfulle for mennesker, og på den måten kan man hevde at KI er kreativ.

I MishMash-nettverket er det delte meninger om akkurat dette.

– Noen mener at KI er kreativ i dag, andre argumenterer for at den pr. definisjon ikke kan være kreativ. Så vi kommer til å ha en del interessante diskusjoner fremover, ler professoren.

Maskinlaget musikk har uansett for lengst nådd populærkulturen.

– Spotify er allerede full av KI-generert musikk som låter helt streit. Men det har også vært laget millioner av kjedelige, menneskeskapte poplåter. KI kommer til å ta over i produksjon av reklamefilm- og bakgrunnsmusikk. Men for det vi kan kalle forgrunnsmusikk mener jeg det er mennesker som er spennende. Når folk skal på konsert, vil de ikke se roboter, men mennesker, sier Jensenius.

 

Samspilleksperiment I MishMashs laboratorium i Forskningsparken i Oslo tester man ut hvordan nærværet av en robot påvirker menneskelig musikkutfoldelse. Foto: Anlov. P. Mathiesen

 

Dét er nettopp hva vi ser gjennom et lite, rundt vindu i en dør i laboratoriekjelleren hos MishMash. En kvinne står bak et keyboard. Foran henne står en robot.

– Det er et eksperiment med en robot som samspiller med et menneske. Vi ønsker å se på hvordan robotbevegelsene påvirker hvordan musikere spiller piano, forklarer Jensenius.

Eksperimentet handler ifølge professoren om noe grunnleggende.

– Pr. nå er KI basert på hvordan vi tror at hjernen fungerer. Men mennesker har en kropp også. Derfor jobber vi også med en såkalt body AI for å finne ut av den kroppslige responsen.

Det er mennesker som trener maskinene, og dermed blir det vi som også møter konsekvensene av dem, mener Jensenius.

– Teknologi kan misbrukes. Men det er et menneskeproblem, ikke et teknologiproblem.

  

Mye å velge i Det finnes dusinvis av ulike brukervennlige amatørprogrammer for å lage KI-musikk, og ofte er de gratis mot registrering.

 

Betydningen av KI-musikk-generatorer

Argumentene for 

Hastighet og prototyp-bygging: Man kan lage melodier, akkordprogresjoner eller hele beats på få minutter, og man kan fremskynde idéutviklingen.

Kostnadsreduksjon: Man trenger ikke å betale for studiomusikere eller leie dyre studioer.

Tilgang for ikke-musikere: Selv personer uten musikkutdannelse kan realisere ideene sine.

Royaltyfrie komponenter: Mange verktøy tilbyr royaltyfri lisensiering, slik at man kan bruke generert musikk i innholdet uten løpende lisensavgifter.

Fleksibilitet og inspirasjon: Det KI kommer opp med, kan gi nye retninger man ellers aldri ville ha tenkt på selv.

Argumenter mot

Uoriginalt og flatt: Resultatet blir gjerne glatt og «blankpolert», noe som bidrar til å gjøre de fleste rene KI-låter svært like.

Verktøyene har vesentlige begrensninger: De mangler gjerne de emosjonelle nyansene, følelsene, erfaringene og uforutsigbarheten som er en del av menneskelig komponering og fremføring.