Gemini, son aylarda yaratıcı alanını sağlam adımlarla genişletiyor. Önce gelişmiş metin üretimi sunmaya başladı, ardından giderek daha rafine görsel yetenekler ekledi ve daha sonra video alanına adım attı. Bu evrim doğal, neredeyse kaçınılmaz görünüyordu: eğer yapay zeka yazabiliyorsa, resim yapabiliyorsa ve animasyon üretebiliyorsa, mantıksal bir sonraki alan ses olmalıydı. Ve bu adım artık atıldı.

Google Lyria 3'ün entegrasyonunu duyurdu, bu Google DeepMind tarafından geliştirilen en gelişmiş müzik üretim modeli, Gemini içinde yer alıyor. Beta aşamasında mevcut olan bu yeni özellik basit bir metin tanımından veya hatta bir resim veya video referansından 30 saniyeye kadar müzik parçaları oluşturmanıza olanak tanıyor. Kullanıcı, belirli bir fikri tanımlayabilir — kişisel bir anıdan bir iç şakaya kadar — ve birkaç saniye içinde, enstrümantasyon ve sözler dahil olmak üzere, tam bir şarkı elde eder.

Teknik açıdan bakıldığında, Lyria 3 önceki versiyonlara göre önemli iyileştirmeler sunuyor. Söz vermek artık gerekli değil: sistem, isteme göre otomatik olarak sözleri üretiyor. Ayrıca, parça üzerinde stil, tempo, ses türü ve genel atmosfer gibi daha fazla yaratıcı kontrol sağlıyor. Google, modelin daha karmaşık ve gerçekçi besteler üretebildiğini, daha tutarlı bir müzikal yapı sunduğunu belirtiyor. Üretim, basit bir ses döngüsü ile sınırlı kalmıyor, belirlenen süre kısıtlamaları içinde kendi kimliğine sahip bir parça inşa ediyor.

İlginç bir unsur, Google'ın görüntü üretim teknolojisi Nano Banana ile entegrasyonu; bu, her şarkı için otomatik olarak bir "kapak" oluşturuyor. Bu, aracın sosyal ve paylaşılabilir karakterini güçlendiriyor, çünkü kullanıcı parça indirip doğrudan göndermek için bir bağlantı oluşturabiliyor. Deneyim, sadece ses üretimi ile sınırlı kalmayıp, dağıtım için hazır kapalı bir küçük yaratıcı ekosistem öneriyor. Ayrıca, Lyria 3 YouTube'un Dream Track'inde de mevcut olacak, burada Shorts için kişiselleştirilmiş film müzikleri oluşturmayı teşvik ederek etkisini uygulamanın ötesine taşıyacak.

Erişilebilirlik açısından, bu özellik Gemini'nin web versiyonunda aktif ve önümüzdeki günlerde mobil uygulamalara da kademeli olarak ulaşacak. 18 yaş üstü kullanıcılara sınırlıdır ve bu beta aşamasında ücretsiz olarak kullanılabilirken, Google AI Plus, Pro ve Ultra aboneleri daha yüksek kullanım sınırlarına sahip olacak. Bu ilk aşamada, söz üretimi İspanyolca, İngilizce, Fransızca, Almanca, Portekizce, Japonca, Korece ve Hintçe gibi dilleri destekliyor ve gelecekte genişleme planları var.

Google ayrıca doğrulama ve sorumlu kullanım konusuna odaklanmış durumda. Tüm üretilen parçalar SynthID içeriyor; bu, yapay zeka tarafından oluşturulan içeriği tanımlamak için tasarlanmış görünmez bir su işareti. Uygulama ayrıca ses için doğrulama yeteneklerini genişleterek bir dosya yüklemeye ve bunun Google teknolojisi ile üretilip üretilmediğini kontrol etmeye olanak tanıyor. Şirket, Lyria 3'ün orijinal ifadeyi teşvik etmek için tasarlandığını ve belirli sanatçıları taklit etmek için değil olduğunu vurguluyor. Eğer istem belirli bir müzisyeni içeriyorsa, sistem bu referansı geniş bir ilham kaynağı olarak alıyor, doğrudan bir stilin yeniden üretilmesi olarak değil.

Müzik tüketimi ile müzik yaratma arasındaki sınır hızla bulanıklaşıyor. Bir şarkıyı saniyeler içinde üretmek geleneksel anlamda beste yapmakla eşdeğer değil, ancak bu yeni bir anlık ve eğlenceli ifade biçimi sunuyor. Gemini, müziği kelimelerle şekillendirilebilir bir hale getiriyor, teknik bilgi veya enstrüman olmadan erişilebilir kılıyor. Hava da kalan soru, aracın akılda kalıcı melodiler üretme yeteneği değil, tanımlamanın yorumlamanın yerini almaya başladığı bir ortamda yaratıcı eylemle olan ilişkimizin nasıl yeniden tanımlanacağıdır.