Google integriert sein bislang leistungsfähigstes Musikmodell Lyria 3 in die Gemini-App und öffnet die KI-Komposition für ein Massenpublikum.

Google erweitert seine Gemini-App mit Lyria 3 um eine KI-Funktion, die aus Text- oder Bildvorgaben eigenständige Musikstücke inklusive Gesang und Songtext generiert.

Mit der Integration in YouTube stärkt Google die Verbindung zwischen KI-Entwicklung und Content-Plattform und ermöglicht Creatorn passgenaue Soundtracks für Shorts.

Zum Schutz vor Missbrauch versieht Google alle generierten Songs mit einem nicht hörbaren Wasserzeichen, betont die Einhaltung von Urheberrechten und führt die Funktion schrittweise in mehreren Sprachen ein.

Generative KI hat Bilder und Videos in den Alltag getragen. Nun folgt mit Musik der nächste Schritt. Mit dem Start von Lyria 3 in der Gemini-App erweitert Google sein System um eine Funktion, die aus Textbeschreibungen oder visuellen Vorlagen eigenständige Musikstücke erzeugt. Nutzer können etwa eine Stimmung, ein Genre oder eine persönliche Erinnerung formulieren – die KI generiert daraus einen Track inklusive Gesang und Songtext.

Laut Google DeepMind markiert Lyria 3 einen Entwicklungssprung gegenüber früheren Modellen. Texte müssen nicht mehr vorgegeben werden, sie entstehen automatisch aus dem Prompt. Gleichzeitig sollen Nutzer gezielter Einfluss auf Stil, Tempo oder Gesang nehmen können. Die erzeugten Stücke klingen laut Herstellerangaben realistischer und musikalisch komplexer.

Die Anwendung bleibt bewusst niederschwellig. Die Tracks sind kurz, versehen mit automatisch generiertem Coverbild und direkt teilbar. Der Anspruch ist nicht die Produktion charttauglicher Songs, sondern ein personalisierter Soundtrack für soziale Medien oder private Anlässe. Musik wird damit zu einem spontanen Kommunikationsmittel – ähnlich wie Memes oder Kurzvideos.

Ein ganz individueller Geburtstagssong? Mit Lyria 3 sollte das ganz einfach klappen. Google

Integration in YouTube und Shorts

Parallel öffnet Google das Modell für YouTube. Unter dem Namen «Dream Track» können Creator KI-generierte Soundtracks für ihre Shorts erstellen. Gerade im Kurzvideoformat, in dem Musik ein zentraler Reichweitentreiber ist, könnte das die Produktionslogik verändern. Statt auf lizenzierte Tracks zurückzugreifen, entstehen passgenaue Soundkulissen auf Knopfdruck.

Für Google ist das mehr als ein Feature-Update. Es stärkt die vertikale Integration zwischen KI-Entwicklung, Plattform und Content-Produktion – und bindet Kreative enger an das eigene Ökosystem.

Wasserzeichen gegen Missbrauch

Mit der Ausweitung der Musikgenerierung wächst die Frage nach Urheberrecht und Kennzeichnungspflichten. Google versieht alle in Gemini erzeugten Songs mit SynthID, einem nicht hörbaren Wasserzeichen zur Identifizierung KI-generierter Inhalte. Zudem können Nutzer Audiodateien hochladen und prüfen lassen, ob sie mit Google-KI erstellt wurden.

Das Unternehmen betont, Lyria 3 sei auf originären Ausdruck ausgelegt und nicht darauf, bestehende Künstler zu imitieren. Namentlich genannte Musiker würden lediglich als stilistische Referenz verstanden. Filter sollen verhindern, dass Ausgaben zu nah an existierenden Werken liegen.

Seit der ersten Vorstellung von Lyria im Jahr 2023 habe man eng mit der Musikindustrie zusammengearbeitet, heisst es aus dem Unternehmen. Details zu Trainingsdaten oder konkreten Lizenzvereinbarungen nennt Google nicht, betont jedoch die Einhaltung von Partnerabkommen und Urheberrechten.

Die Einführung erfolgt zunächst in mehreren grossen Sprachen, darunter Deutsch, Englisch, Spanisch und Japanisch. Volljährigen Nutzern steht die Funktion in der Webversion zur Verfügung, die mobile App folgt schrittweise. Abonnenten kostenpflichtiger KI-Tarife erhalten höhere Nutzungslimits.