25% korting: 500 credits voor slechts $15
Back to blog
Lyria4 min read

Google lanceert Lyria 3: AI-muziekgeneratie zit nu in Gemini

Google lanceert Lyria 3: AI-muziekgeneratie zit nu in Gemini

Google heeft vandaag aangekondigd dat het AI-muziekgeneratie naar de Gemini-app brengt, aangedreven door DeepMind's Lyria 3-model. De functie wordt wereldwijd uitgerold in bèta en laat iedereen een origineel nummer van 30 seconden genereren, compleet met songteksten en AI-gegenereerde coverart, vanuit een eenvoudige tekstbeschrijving of een geüpload beeld.

Wat is Lyria 3?

Lyria 3 is DeepMind's nieuwste muziekgeneratiemodel. Vergeleken met zijn voorgangers produceert het realistischere en compositorisch complexere tracks in een breed scala aan genres en stemmingen. Het model verwerkt alles in een enkele doorgang: melodie, arrangement, zang en songteksten worden allemaal samen gegenereerd in plaats van samengevoegd uit afzonderlijke systemen.

Het resultaat is muziek die samenhangend klinkt in plaats van samengesteld. Google beschrijft de output als aanzienlijk expressiever dan eerdere Lyria-iteraties, met betere verwerking van tempowisselingen, dynamiek en vocale performance.

Hoe het werkt

Gebruikers kunnen de tool aansturen met gewone taal. Een beschrijving zoals "een melancholisch jazz-instrumentaal voor een regenachtige avond" of "opgewekt popnummer over opnieuw beginnen" is genoeg om een track te genereren. Het model produceert de audio samen met bijpassende songteksten en een coverafbeelding gemaakt met Google's Nano Banana beeldgeneratiesysteem.

De interessantere invoermodus is beeld-en-video-naar-muziek. Upload een foto of korte clip en Lyria 3 analyseert de visuele sfeer, kleurenpalet en het onderwerp om een passende soundtrack te componeren. Dit maakt de tool direct bruikbaar voor contentmakers die werken met bestaand beeldmateriaal.

Beschikbaarheid

Muziekgeneratie wordt uitgerold naar alle Gemini-gebruikers van 18 jaar en ouder. Ondersteunde talen bij lancering zijn Engels, Duits, Spaans, Frans, Hindi, Japans, Koreaans en Portugees. De functie is nu live op de desktopversie van Gemini, met mobiele beschikbaarheid in de komende dagen.

Gebruikers van het gratis niveau zijn beperkt tot generaties van 30 seconden. Google heeft nog niet aangekondigd of betaalde Gemini Advanced-abonnees langere of hogere kwaliteit output zullen ontvangen, hoewel de huidige bètalimieten voor iedereen gelden.

YouTube Dream Track en SynthID-watermerken

Naast de Gemini-lancering breidt Google Dream Track uit, de Lyria-aangedreven muziekgeneratietool voor YouTube-makers, naar een wereldwijd publiek. Dream Track was eerder beperkt tot geselecteerde makers in de VS.

Elke track gegenereerd door Lyria 3, via Gemini of Dream Track, wordt automatisch voorzien van een watermerk met Google's SynthID-technologie. SynthID plaatst een onwaarneembaar signaal in de audio dat compressie, hercodering en de meeste gangbare nabewerkingshandelingen overleeft. Het watermerk stelt platformen en onderzoekers in staat om AI-oorsprong te verifiëren, zelfs nadat een track breed is gedeeld.

Waarom dit ertoe doet voor AI-gegenereerde media

Muziek is een van de moeilijkere modaliteiten geweest voor AI om op consumentenniveau te kraken. Tekst- en beeldgeneratie bereikten mainstream-adoptie in respectievelijk 2023 en 2024. Video volgde. Muziek liep achter, deels vanwege de complexiteit van licenties en deels omdat audiokwaliteit moeilijker overtuigend te simuleren is voor een getraind oor.

Lyria 3 dat in Gemini terechtkomt, een product met honderden miljoenen gebruikers, verandert de distributievergelijking volledig. Dit is geen onderzoeksdemo of nichetool voor producers. Het is een mainstreamfunctie die beschikbaar is voor iedereen met een Google-account. Die schaal versnelt de tijdlijn waarop AI-gegenereerde muziek een normaal onderdeel wordt van hoe mensen online content maken.

Wat het betekent voor videomakers

Voor makers die in video werken is de beeld-naar-muziek functie de meest direct praktische mogelijkheid. Het kunnen uploaden van een clip en een contextueel passende soundtrack ontvangen verwijdert een van de meest tijdrovende onderdelen van de nabewerkingsworkflow: het vinden of licentiëren van muziek die bij de sfeer past.

Dit wijst op een bredere verschuiving in creatieve productie. Elk element van een video, van karakterprestaties tot de soundtrack, komt steeds meer binnen bereik van AI-aangedreven tools. De barrières tussen een eerste idee en een afgewerkte, gepolijste video verdwijnen sneller dan de meeste mensen hadden verwacht.

Related Articles