25% de descuento: 500 créditos por solo $15
Back to blog
Lyria4 min read

Google lanza Lyria 3: la generación de música con IA ahora está dentro de Gemini

Google lanza Lyria 3: la generación de música con IA ahora está dentro de Gemini

Google anunció hoy que está llevando la generación de música con IA a la aplicación Gemini, impulsada por el modelo Lyria 3 de DeepMind. La función se está desplegando globalmente en beta y permite a cualquiera generar una canción original de 30 segundos, completa con letra y carátula generada por IA, a partir de una simple descripción de texto o una imagen subida.

Qué es Lyria 3?

Lyria 3 es el último modelo de generación musical de DeepMind. En comparación con sus predecesores, produce pistas más realistas y compositivamente complejas en una amplia gama de géneros y estados de ánimo. El modelo maneja todo en una sola pasada: melodía, arreglo, voces y letra se generan juntos en lugar de ensamblarse a partir de sistemas separados.

El resultado es música que suena cohesiva en lugar de ensamblada. Google describe la salida como significativamente más expresiva que las iteraciones anteriores de Lyria, con un mejor manejo de cambios de tempo, dinámicas y rendimiento vocal.

Cómo funciona

Los usuarios pueden indicar instrucciones a la herramienta en lenguaje natural. Una descripción como "un instrumental de jazz melancólico para una noche lluviosa" o "canción pop animada sobre empezar de nuevo" es suficiente para generar una pista. El modelo produce el audio junto con la letra correspondiente y una imagen de portada creada con el sistema de generación de imágenes Nano Banana de Google.

El modo de entrada más interesante es de imagen y video a música. Sube una foto o un clip corto y Lyria 3 analiza el estado de ánimo visual, la paleta de colores y el tema para componer una banda sonora apropiada. Esto hace que la herramienta sea inmediatamente útil para creadores de contenido que trabajan con material existente.

Disponibilidad

La generación musical se está desplegando para todos los usuarios de Gemini mayores de 18 años. Los idiomas soportados en el lanzamiento incluyen inglés, alemán, español, francés, hindi, japonés, coreano y portugués. La función está disponible en la versión de escritorio de Gemini ahora, con la disponibilidad móvil esperada en los próximos días.

Los usuarios del nivel gratuito están limitados a generaciones de 30 segundos. Google aún no ha anunciado si los suscriptores de pago de Gemini Advanced recibirán salidas más largas o de mayor calidad, aunque los límites actuales de la beta se aplican a todos por igual.

YouTube Dream Track y marca de agua SynthID

Junto al lanzamiento en Gemini, Google está expandiendo Dream Track, su herramienta de generación musical con Lyria para creadores de YouTube, a una audiencia global. Dream Track estaba previamente limitado a creadores seleccionados en Estados Unidos.

Cada pista generada por Lyria 3, ya sea a través de Gemini o Dream Track, se marca automáticamente con agua usando la tecnología SynthID de Google. SynthID incorpora una señal imperceptible en el audio que sobrevive a la compresión, la recodificación y la mayoría de las operaciones de postprocesamiento comunes. La marca de agua permite a las plataformas e investigadores verificar el origen de la IA incluso después de que una pista se haya compartido ampliamente.

Por qué esto importa para los medios generados por IA

La música ha sido una de las modalidades más difíciles de dominar por la IA a nivel de calidad de consumo. La generación de texto e imágenes alcanzó la adopción masiva en 2023 y 2024 respectivamente. El video le siguió. La música se ha quedado atrás, en parte por la complejidad de las licencias y en parte porque la calidad del audio es más difícil de falsificar de forma convincente para un oído entrenado.

Que Lyria 3 llegue dentro de Gemini, un producto con cientos de millones de usuarios, cambia la ecuación de distribución por completo. Esto no es una demostración de investigación ni una herramienta de nicho para productores. Es una función de uso general disponible para cualquiera con una cuenta de Google. Esa escala acelera el calendario para que la música generada por IA se convierta en una parte normal de cómo la gente crea contenido en línea.

Lo que significa para los creadores de video

Para los creadores que trabajan en video, la función de imagen a música es la capacidad más inmediatamente práctica. La posibilidad de insertar un clip y recibir una banda sonora contextualmente apropiada elimina una de las partes que más tiempo consume del flujo de trabajo de postproducción: encontrar o licenciar música que encaje con el estado de ánimo.

Esto apunta a un cambio más amplio en la producción creativa. Cada elemento de un video, desde las interpretaciones de los personajes hasta la banda sonora, está cada vez más al alcance de herramientas impulsadas por IA. Las barreras entre una idea inicial y un video terminado y pulido se están derrumbando más rápido de lo que la mayoría esperaba.

Related Articles